Archive: 2019

ISLR-2.2

2.2.2 편향 분산 절충테스트데이터 x에 대한 기대검정 MSE는 다음과 같은 3개의 속성으로 나눌 수 있다. E(y_0 - f(x_o))^2 = Var(f(x_o)) + [Bias(f(x_0))]^2 + Var(\epsilon) 예측값의 분산 예측값의 제곱편향 오차항 $\epsilon$ 의 분산 이 항들의 합을 최대한 작게 하는 것이 모델 학습의 목적

ISLR-2.1

2. 통계학습2.1 통계학습이란?통계학습이란, 입력변수, 독립변수 등으로 불리는 $X$ 와 출력변수, 반응변수, 종속변수와 같은 명칭을 갖는 $Y$ 간의 관계를 찾아내는 일이다. 이 관계를 수식으로 표현하면 다음과 같다. Y = f(X) + \epsilon여기서 $\epsilon$ 은 X와는 독립이고 평균이 0인 랜덤 오차항이다. 오차항은 조절 불가능한

t-test

t-testt-test는 데이터집단의 평균값(기댓값)을 조사하는 통계검정 방법이다. 하나의 데이터 집단에 대해 평균값을 조사하는 단일표본(One-sample) t-test와, 두 개의 데이터 집단에 대해 평균값이 같은지 다른지를 조사하는 독립표본(Independent-two-sample) t-test, 그리고 두 데이터집단의 표본데이터가 서로 1대1 대응

파이썬 코드를 정돈하기 위한 패턴

2장. 파이썬 코드를 정돈하기 위한 패턴2.1 assert : 단언문어떤 조건을 테스트하는 디버깅 보조도구. 단언조건이 참이면 아무 일도 일어나지 않고, 거짓이면 AssertionError를 발생시킨다 12345def apply_discount(product, discount): price = int(product['price'] * (1.0 - di

Stacks: Balanced Brackets

Stacks: Balanced BracketsA bracket is considered to be any one of the following characters: (, ), {, }, [, or ]. Two brackets are considered to be a matched pair if the an opening bracket (i.e., (, [,

Hash Tables: Ransom Note

Hash Tables: Ransom NoteA kidnapper wrote a ransom note but is worried it will be traced back to him. He found a magazine and wants to know if he can cut out whole words from it and use them to create

Strings: Making Anagrams

Strings: Making AnagramsAlice is taking a cryptography class and finding anagrams to be very useful. We consider two strings to be anagrams of each other if the first string’s letters can be rearrange

Regex - [.*] 와 [.*?] 의 차이

Regex - [.*] 와 [.*?] 의 차이문서에서 [ ] 안에 들어있는 문자열을 괄호와 함께 모두 지워버려야 하는 상황이 생겼다. Regex 를 어떻게 쓰면 이 문제를 해결할 수 있을까? 우선 예시 문장을 하나 만들어 보았다. 1sent = "Hello, this is an example sentence [for trying out regex gramm

Gradient Vanishing

gradient vanishing problem신경망에서는 SGD(Stochastic Gradient Descent) 방법을 사용해 모델을 훈련시킨다. gradient의 Back Propagation을 통해 weight 값을 업데이트하며 오차가 작아지도록 훈련하게 된다. 신경망에 층을 많이 추가할수록 더 많은 데이터셋을 다룰 수 있는 복잡한 모델을 만들 수

서포트 벡터 머신(SVM)

서포트 벡터 머신(SVM)서포트 벡터 머신(Support Vector Machine, SVM)은 선형, 비선형, 분류, 회귀 등 다목적으로 사용할 수 있는 머신러닝 모델이다. 복잡한 분류문제에 특히 잘 맞으며 작거나 중간크기의 데이터셋에 적합하다. 1. 선형 SVM 분류선형 SVM 분류기는 클래스들 사이에 결정경계선을 긋되, 그 선이 모든 클래스로부터 최대