나이대별로 이메일을 클릭해서 열지 말지를 분류해 보자.
리니어 리그레션 식을, y 값을 시그모이드에 대입해서, 일차방정식으로 만들면 다음과 같아진다.
이제 우리는, 이를 가지고 두개의 클래스로 분류할 수 있다. ( 클릭을 한다, 안한다 두개로.)
# Importing the libraries
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
나이와 연봉으로 분석해서, 물건을 구매할지 안할지를 분류하자!!
그 다음 피쳐스케일링을 하고 학습용과 테스트 용으로 데이터를 나눈다.
분류의 문제이므로 로지스틱 리그레션으로 모델링하고 성능평가 한다.
Confusion Matrix를 통해 결과 분석을 해보자.
accuracy_score(y_test, y_pred)로 정확도를 구하고 classification_report(y_test, y_pred)로 위의 표처럼 출력한다.
'인공지능 > 머신러닝' 카테고리의 다른 글
머신러닝 K-Nearest Neighbor KNN (0) | 2022.05.09 |
---|---|
머신러닝 데이터 전처리 replace함수 이상한 값을 np.nan으로 바꾸고 np.nan을 처리하는 법(Nan 제거 또는 Nan을 다른 값으로) (0) | 2022.05.06 |
머신러닝 Linear Regression fit_transform,transform 함수 , 신규데이터 예측하는 법 (0) | 2022.05.06 |
머신러닝 feature scaling 2가지 방법 StandardScaler, MinMaxScaler (0) | 2022.05.06 |
머신러닝 카테고리컬 데이터를 처리하는 방법 LabelEncoder, OneHotEncoder (0) | 2022.05.06 |