t-test
t-testt-test는 데이터집단의 평균값(기댓값)을 조사하는 통계검정 방법이다. 하나의 데이터 집단에 대해 평균값을 조사하는 단일표본(One-sample) t-test와, 두 개의 데이터 집단에 대해 평균값이 같은지 다른지를 조사하는 독립표본(Independent-two-sample) t-test, 그리고 두 데이터집단의 표본데이터가 서로 1대1 대응
3.2 다중선형회귀단순선형회귀는 하나의 설명변수로 결과값을 예측할 때 유용한 방법이다. 하지만 현실에서 설명변수가 하나인 경우는 많지 않다. 광고 매출을 예측할 때만 해도 TV광고, 지면 광고, 소셜미디어 광고 등 다양한 설명변수가 존재할 수 있다. 이럴 경우 회귀분석
3 선형회귀3.1 단순선형회귀선형회귀 중에서도 단순선형회귀란, 하나의 독립변수 X를 가지고 종속변수 Y를 예측하는 접근방법이다. X와 Y 간에 선형 관계가 있다고 가정하며, 수식으로 쓰면 다음과 같다. Y \approx \beta_0 + \beta_1 X위 식에서 ‘$
2.2.2 편향 분산 절충테스트데이터 x에 대한 기대검정 MSE는 다음과 같은 3개의 속성으로 나눌 수 있다. E(y_0 - f(x_o))^2 = Var(f(x_o)) + [Bias(f(x_0))]^2 + Var(\epsilon) 예측값의 분산 예측값의 제곱편향 오차항
2. 통계학습2.1 통계학습이란?통계학습이란, 입력변수, 독립변수 등으로 불리는 X 와 출력변수, 반응변수, 종속변수와 같은 명칭을 갖는 Y 간의 관계를 찾아내는 일이다. 이 관계를 수식으로 표현하면 다음과 같다. Y = f(X) + \epsilon여기서 $\e
t-testt-test는 데이터집단의 평균값(기댓값)을 조사하는 통계검정 방법이다. 하나의 데이터 집단에 대해 평균값을 조사하는 단일표본(One-sample) t-test와, 두 개의 데이터 집단에 대해 평균값이 같은지 다른지를 조사하는 독립표본(Independent-
모형 결합모형 결합(model combining) 방법은 앙상블 방법론(ensemble methods)라고도 한다. 단일모형으로 예측이 잘 되지 않을 때, 복수의 모형을 결합해 예측성능을 높이고자 할 때 사용한다. 장점 개별 모형의 성능이 안좋을 때는 결합모형을 하게
2. 부스팅 boosting부스트(boost) 방법은 처음부터 여러 개의 모형을 합쳐 문제를 푸는 취합(aggregation)과 달리 하나의 모형에서 시작해 하나씩 모형을 추가해나간다. 이 때 모형들의 집합을 위원회(commitee) C 라고 하고, m개의 모형을