카테고리컬 데이터란 데이터가 몇가지 범주에 속해있다는 데이터다. 먼저 데이터의 개수를 DataFrame.isna().sum()이나
DataFrame.nunique()를 통해 데이터 개수를 파악하고, DataFrame.unique()를 통해 데이터의 범주를 파악한다.
예를 들면 요일은 7개의 범주로 이루어진 데이터이다.
'인공지능 > 머신러닝' 카테고리의 다른 글
머신러닝 데이터 전처리 replace함수 이상한 값을 np.nan으로 바꾸고 np.nan을 처리하는 법(Nan 제거 또는 Nan을 다른 값으로) (0) | 2022.05.06 |
---|---|
머신러닝 Logistic Regression 과 Confusion Matrix (0) | 2022.05.06 |
머신러닝 Linear Regression fit_transform,transform 함수 , 신규데이터 예측하는 법 (0) | 2022.05.06 |
머신러닝 feature scaling 2가지 방법 StandardScaler, MinMaxScaler (0) | 2022.05.06 |
머신러닝 카테고리컬 데이터를 처리하는 방법 LabelEncoder, OneHotEncoder (0) | 2022.05.06 |