Category: Math

Network Inference

네트워크 추론확률모형에서 일부 확률변수의 값이 주어졌을 때 다른 값들을 알아내는 것을 추론(inference)이라고 한다. 조건부 확률분포함수 $p(X_{\text{unknown}}|\{X\}_{\text{known}})$ 을 알면 일부 확률변수의 값 $\{X\}_\text{known}$이 주어졌을 때 다른 확률변수 $X_\text{unknown}$ 의 확

Graphical Probability Model

그래프 확률모형여러 확률변수의 결합확률분포를 구해야 하는 경우를 생각하자. 예를 들어 A, B, C 3개의 확률변수가 있고, 각 확률변수는 모두 0, 1, 2 세 가지의 값만 가질 수 있는 범주형 확률변수이다. 이ㅍ때 A, B, C 의 결합확률분포는 다음과 같이 나타낼 수 있다. 이 때 우리가 알아야 하는 모수는 총 $3^3 -1 = 26$ 개다.

graph

그래프그래프(graph)는 다음 그림처럼 노드(node 혹은 vertex)와 노드들을 잇는 간선(edge)으로 이루어진 구조를 말한다. 수학적으로 그래프 $G$ 는 노드집합 $V$ 와 간선집합 $E$ 로 구성된다. G = (V, E)간선은 두 개의 노드로 이루어진, 순서가 있는 쌍(ordered pair)이다. E \subseteq V \times V

Clustering Methods

클러스터링 방법1. K-Means 클러스터링앞서 언급했던 5가지 클러스터링 방법 중 첫번째로 소개할 K-Means 클러스터링 알고리즘은 가장 단순하고 빠른 클러스터링 알고리즘 중 하나다. 이 클러스터링 방법에서는 아래 목적함수 값이 최소화될 때까지 클러스터의 중심(centroid) 위치와 각 데이터가 소속될 클러스터를 반복해서 찾는다. 목적함수 값을 ine

Clustering

클러스터링주어진 데이터 집합을 유사한 데이터들의 그룹으로 나누는 것을 클러스터링(clustering)이라고 하고, 이렇게 나누어진 유사한 데이터들의 그룹을 클러스터(cluster)라고 한다. 클러스터링은 분류 문제와 달리 특정한 독립변수와 종속변수의 구분도 없고 학습을 위한 목푯값(target value)도 필요로 하지 않는 비지도학습(unsupervise

Recommender System

추천 시스템추천 시스템(recommender system)이란, 누적된 기록 등을 기반으로 사용자(user)가 선호하는 상품(item)을 예측하는 시스템이다. 파이썬의 surprise 패키지는 다양한 추천시스템 알고리즘을 제공한다. 123# 먼저 설치가 필요하다!pip install surpriseimport surprise 평점 데이터surprise 패

Hyper Parameter Tuning

모형 최적화머신러닝 예측 모형을 완성한 후에는 최적화 과정을 통해 성능을 향상시킨다. 이 과정을 하이퍼 파라미터 튜닝(hyper parameter tuning)이라고 한다. scikit-learn패키지에서 제공하는 하이퍼파라미터 튜닝 도구들은 다음과 같다. validation curve 단일 하이퍼 파라미터 최적화 GridSearchCV 그리드를 사용

Kernel SVM

커널 서포트 벡터 머신XORXOR(exclusive OR) 문제는 이진수에서의 or 연산이라고 생각하면 된다. 다음과 같이 하나만 1일 때 1이 되고, 나머지 경우는 0이 된다. x2=0 x2=1 X1=0 0 1 x1=1 1 0 이러한 경우 다음 그림처럼 클래스가 구분되는데, 퍼셉트론이나 SVM과 같은 선형판별함수 분류모형으로는

SVM(support vector machine)

서포트 벡터 머신퍼셉트론에서는 영역을 구분하는 판별경계선(decision hyperplane)이 한 문제에도 다양하게 존재할 수 있었다. 서포트 벡터머신(SVM: Support Vector machine)은 퍼셉트론 기반 모형에 가장 안정적인 하나의 판별 경계선을 찾기 위한 제한조건을 추가한 모형이다. 서포트: 판별경계선을 하나로 정해줄 수 있는 근거가

perceptron

퍼셉트론퍼셉트론(perceptron)은 가장 오래되고 단순한 형태의 판별함수 기반 이진분류모형이다. 퍼셉트론은 입력값 $x=(1,x_1,\cdots ,x_m)$ 에 대해 1 또는 -1의 값을 가지는 $y$를 출력하는 비선형 함수이다. 1을 포함하는 입력요소 $x_i$ 에 대해 가중치 $w_i$ 를 곱한 값 $a = w^Tx$ 을 활성화값(activatio