Pandas 의 장점
- Allows the use of labels for rows and columns
- 기본적인 통계데이터 제공
- NaN values 를 알아서 처리함.
- 숫자 문자열을 알아서 로드함.
- 데이터셋들을 merge 할 수 있음.
- It integrates with NumPy and Matplotlib
Series
import numpy as np
import pandas as pd
index = ['eggs', 'apples', 'milk', 'bread']
data = [30, 6, 'Yes', 'No']
groceries = pd.Series(data = data, index = index)
groceries
# eggs 30
# apples 6
# milk Yes
# bread No
# dtype: object
Accessing - 레이블과 인덱스
groceries[0]
# 30
groceries[['eggs','bread']]
# eggs 30
# bread No
# dtype: object
groceries['apples':'milk']
# apples 6
# milk Yes
# dtype: object
groceries[1:3]
# apples 6
# milk Yes
# dtype: object
Arithmetic Operations on Pandas Series
index = ['apples', 'oranges', 'bananas']
data = [10, 6, 3,]
fruits = pd.Series(data = data, index = index)
fruits
# apples 10
# oranges 6
# bananas 3
# dtype: int64
fruits = fruits + 5
# fruits
# apples 15
# oranges 11
# bananas 8
# dtype: int64
'데이터 분석 > pandas' 카테고리의 다른 글
파이썬 pandas apply() 함수 적용 시키기 (0) | 2022.04.29 |
---|---|
판다스 unique(), nunique(), value_counts 유일한 값 찾기 (0) | 2022.04.29 |
파이썬 pandas csv파일, 데이터 불러오기 (0) | 2022.04.29 |
파이썬 pandas Dealing with NaN (0) | 2022.04.28 |
파이썬 pandas Accessing, loc, iloc (0) | 2022.04.28 |