인공지능/머신러닝
머신러닝 K-Nearest Neighbor KNN
iminu
2022. 5. 9. 09:26
다음처럼 카테고리가 레이블링 되어 있는 데이터가 존재합니다.
새로운 데이터가 생겼을 때 내 주위에 몇개의 이웃을 확인해 볼 것인가를 결정한다. => K
새로운 데이터가 발생 시, Euclidean distance에 의해서, 가장 가까운 k개의 이웃을 택한다.
k 개의 이웃의 카테고리를 확인한다.
카테고리의 숫자가 많은 쪽으로, 새로운 데이터의 카테고리를 정한다.
라이브러리와 데이터를 불러오고, X와 y에 알맞게 대입한다.
데이터의 범위를 스케일러에 대입한 후 훈련 셋과 테스트 셋을 분리 후 모델링하고 검증한다.