df = pd.DataFrame({'Animal': ['Falcon', 'Falcon',
'Parrot', 'Parrot'],
'Max Speed': [380., 370., 24., 26.]})
df
Animal Max Speed
0 Falcon 380.0
1 Falcon 370.0
2 Parrot 24.0
3 Parrot 26.0
DataFrame.groupby(by=None, axis=0, level=None, as_index=True, sort=True, group_keys=True, squeeze=NoDefault.no_default, observed=False, dropna=True) 에서 by에 원하는 column으로 묶어서 함수를 적용 시킬 수 있다.
df.groupby(['Animal']).mean()
Max Speed
Animal
Falcon 375.0
Parrot 25.0
max(), min(), sum() 등의 함수가 있다.
'데이터 분석 > pandas' 카테고리의 다른 글
파이썬 pandas 데이터프레임의 날짜문자열 컬럼을, datetime64로 변경하는 법 to_datetime함수 (0) | 2022.05.11 |
---|---|
파이썬 pandas read_csv함수의 error_bad_lines = False 파라미터 사용법 (0) | 2022.05.11 |
python pandas get_dummies함수 원핫인코딩 (0) | 2022.05.06 |
파이썬 pandas에서 DatetimeIndex와 to_datetime, to_timedelta,date_range,timedelta_range 함수 (0) | 2022.05.04 |
파이썬 pandas Series와 DataFrame 의 데이터 억세스 방법 (0) | 2022.05.04 |