Group by and Aggregating
In [1]:
import pandas as pd
df = pd.read_csv(f'/Users/grace/Desktop/Alex/Flavors.csv')
df
#group_by_frame = base flavor로 그룹짓기
group_by_frame= df.groupby('Base Flavor')
#mean 구하기
group_by_frame.mean()
#base flavor만 뽑아서 횟수 세기
group_by_frame.count()
#base flavor만 뽑아서 sum
group_by_frame.sum()
- .agg에는 dictionary가 필요함
#base flavor만 뽑아서 Flavor Rating이랑 Texture Rating의 ['mean','max','count','sum']만 뽑기
df.groupby('Base Flavor').agg({'Flavor Rating':['mean','max','count','sum'],'Texture Rating': ['mean','max','count','sum']})
- group by를 2개 인덱스로도 가능함
#base flavor랑 liked group by 해서 Flavor Rating의 ['mean','max','count','sum']만 뽑
df.groupby(['Base Flavor','Liked']).agg({'Flavor Rating': ['mean','max','count','sum']})
#describe()
df.groupby('Base Flavor').describe()
출처: alex the analyst
'Programming > python' 카테고리의 다른 글
[python] visualization pandas (0) | 2023.06.01 |
---|---|
[python] merge, join, concatenate pandas (1) | 2023.06.01 |
[python] pandas indexes (0) | 2023.06.01 |
[python] Pandas Filtering and Ordering (0) | 2023.05.31 |
[파이썬] 자동 파일 분류 프로그램 만들기 (0) | 2023.05.31 |