문자를 숫자로 바꾸어 주는 방법은 One-Hot Encoding이 있다.
import numpy as np
import pandas as pd
fruit = pd.DataFrame({'name':['apple', 'banana', 'cherry', 'durian', np.nan],
'color':['red', 'yellow', 'red', 'green', np.nan]})
name column에는 4개의 고유한 데이터가 있다. 이것을 행으로 바꿔 있다 없다를 1과 0으로 원핫인코딩한다.
'데이터 분석 > pandas' 카테고리의 다른 글
파이썬 pandas read_csv함수의 error_bad_lines = False 파라미터 사용법 (0) | 2022.05.11 |
---|---|
파이썬 pandas groupby() 함수 사용법 (0) | 2022.05.11 |
파이썬 pandas에서 DatetimeIndex와 to_datetime, to_timedelta,date_range,timedelta_range 함수 (0) | 2022.05.04 |
파이썬 pandas Series와 DataFrame 의 데이터 억세스 방법 (0) | 2022.05.04 |
파이썬 pandas의 pivot_table() (0) | 2022.05.04 |