다음처럼 카테고리가 레이블링 되어 있는 데이터가 존재합니다.

새로운 데이터가 생겼을 때 내 주위에 몇개의 이웃을 확인해 볼 것인가를 결정한다. => K

새로운 데이터가 발생 시, Euclidean distance에 의해서, 가장 가까운 k개의 이웃을 택한다.

k 개의 이웃의 카테고리를 확인한다.

카테고리의 숫자가 많은 쪽으로, 새로운 데이터의 카테고리를 정한다.

라이브러리와 데이터를 불러오고, X와 y에 알맞게 대입한다.

데이터의 범위를 스케일러에 대입한 후 훈련 셋과 테스트 셋을 분리 후 모델링하고 검증한다.

+ Recent posts