Category: ISLR(Introduction to Statistical Learning)

ISLR-3.2

3.2 다중선형회귀단순선형회귀는 하나의 설명변수로 결과값을 예측할 때 유용한 방법이다. 하지만 현실에서 설명변수가 하나인 경우는 많지 않다. 광고 매출을 예측할 때만 해도 TV광고, 지면 광고, 소셜미디어 광고 등 다양한 설명변수가 존재할 수 있다. 이럴 경우 회귀분석을 어떻게 해야 할까? 한 가지 방법은 단순선형회귀를 설명변수 각각에 대해 진행하는 것이다

ISLR-3.1

3 선형회귀3.1 단순선형회귀선형회귀 중에서도 단순선형회귀란, 하나의 독립변수 X를 가지고 종속변수 Y를 예측하는 접근방법이다. X와 Y 간에 선형 관계가 있다고 가정하며, 수식으로 쓰면 다음과 같다. Y \approx \beta_0 + \beta_1 X위 식에서 ‘$\approx$’ 기호는 “대략적으로 모델링되었다” 라는 개념으로 보면 된다. TV 광고

ISLR-2.2

2.2.2 편향 분산 절충테스트데이터 x에 대한 기대검정 MSE는 다음과 같은 3개의 속성으로 나눌 수 있다. E(y_0 - f(x_o))^2 = Var(f(x_o)) + [Bias(f(x_0))]^2 + Var(\epsilon) 예측값의 분산 예측값의 제곱편향 오차항 $\epsilon$ 의 분산 이 항들의 합을 최대한 작게 하는 것이 모델 학습의 목적

ISLR-2.1

2. 통계학습2.1 통계학습이란?통계학습이란, 입력변수, 독립변수 등으로 불리는 $X$ 와 출력변수, 반응변수, 종속변수와 같은 명칭을 갖는 $Y$ 간의 관계를 찾아내는 일이다. 이 관계를 수식으로 표현하면 다음과 같다. Y = f(X) + \epsilon여기서 $\epsilon$ 은 X와는 독립이고 평균이 0인 랜덤 오차항이다. 오차항은 조절 불가능한