데이터 분석을 하기 위해 여러 곳에서 데이터를 수집해 합쳐야 한다.
pd.concat()함수는 데이터프레임을 말그대로 물리적으로 이어 붙여주는 함수다.
pd.merge()함수는 두 데이터프레임을 각 데이터에 존재하는 고유값(key)을 기준으로 병합할때 사용한다.
pd.merge(df_left, df_right, how='inner', on=None)이 default이다.
'Employee ID' 를 연결고리로 합친다.
pd.join() 함수를이용한 데이터프레임 합치기다. pd.join()은 인덱스를 기준으로 왼쪽으로 순차적으로 연결되는 방식이다. 어떤 인덱스를 기준으로 하느냐에 따라 배열이 달라진다.
'데이터 분석 > pandas' 카테고리의 다른 글
파이썬 pandas Series와 DataFrame 의 데이터 억세스 방법 (0) | 2022.05.04 |
---|---|
파이썬 pandas의 pivot_table() (0) | 2022.05.04 |
파이썬 pandas sort_values() 데이터 정렬 (0) | 2022.04.29 |
파이썬 pandas apply() 함수 적용 시키기 (0) | 2022.04.29 |
판다스 unique(), nunique(), value_counts 유일한 값 찾기 (0) | 2022.04.29 |