k 개의 그룹을 만든다. 즉, 비슷한 특징을 갖는 것들끼리 묶는것, 다음을 두개, 세개, 네개 그룹 등등 원하는 그룹으로 만들 수 있다.
몇개로 분류할지는 어떻게 결정하는가? K의 갯수를 정하는 방법
그룹의 중심점과 각 점간의 거리를 합한 것이 WCSS다
WCSS와 클러스터의 수를 시각화하여 꺽이는 지점을 클러스터 수로 정한다.
이것을 팔꿈치와 비슷하다 여거 Elbow Method라 이름지었다
먼저 데이터와 라이브러리를 불러온 뒤 전처리 해준다.
적절한 k 값(몇 개 그룹)을 찾기 위해서는 . WCSS값을 확인해야 한다! 따라서 K를 2부터 10까지 다 수행해 보고나서
WCSS 값을 확인해 본다. 이때, 엘보우 메소드를 이용해서, 최적의 K 값을 찾도록 한다.
이 때 최적의 k는 5라 가정하고 예측치를 데이터프레임에 대입하였다.
'인공지능 > 머신러닝' 카테고리의 다른 글
WordCloud 라이브러리 사용법과 STOPWORDS 적용하는 방법 (0) | 2022.05.09 |
---|---|
머신러닝 Hierarchical Clustering (0) | 2022.05.09 |
머신러닝 Decision Tree (0) | 2022.05.09 |
머신러닝 Support Vector Machine (0) | 2022.05.09 |
머신러닝 K-Nearest Neighbor KNN (0) | 2022.05.09 |