분류선에 가장 가까운 데이터들을, 가장 큰 마진(margin)으로 설정하는 선으로 결정하자.
분류선을 Maximum Margin Classifier라고 한다. SVM은 다른 머신러닝 알고리즘과 비교해서 무엇이 특별한가?
사과인지 오렌지인지 분석하는 문제에서 일반적인 사과와 오렌지들은, classifier에서 멀리 분포한다.
정상적이지 않은 것들, 즉 구분하기 힘든 부분에 있는 것들은 클래서파이어 근처에 있게 되며, 이 데이터들이 레이블링 되어 있으므로, Margin을 최대화 하여 분류하기 때문에, 특이한 것들까지 잘 분류하는 문제에 SVM 이 최고다.
데이터 전처리를 한뒤 모델링 후 평가한다.
'인공지능 > 머신러닝' 카테고리의 다른 글
머신러닝 K-Means WCSS 와 Elbow Method (0) | 2022.05.09 |
---|---|
머신러닝 Decision Tree (0) | 2022.05.09 |
머신러닝 K-Nearest Neighbor KNN (0) | 2022.05.09 |
머신러닝 데이터 전처리 replace함수 이상한 값을 np.nan으로 바꾸고 np.nan을 처리하는 법(Nan 제거 또는 Nan을 다른 값으로) (0) | 2022.05.06 |
머신러닝 Logistic Regression 과 Confusion Matrix (0) | 2022.05.06 |