K-nearest neighbors algorithm
K 근접 이웃(k-nearest neighbors algorithm (k-NN))은 관찰치 특성을 기준으로 훈련 샘플 중에서 가장 가까운 관찰치들을 분류하는 방법이다. 기계 학습의 방법 중에 가장 간단한 방법 중 하나로 분류되고 있다.
Algorithm
Knn-image.jpeg
아래와 같은 순서로 kNN이 작동한다.
- 데이터 집합에 있는 모든 측정값을 반복한다:
- inX와 현재 측정값 사이의 거리 X를 계산한다.
- 오름차순으로 거리 X를 정렬한다.
- inX와의 거리가 가장 짧은 k개의 아이템을 추출한다.
- k개의 아이템에서 가장 많은 분류 항목 찾기.
- inX의 분류 항목을 예측하기 위해 가장 많은 분류 항목을 반환한다.