pandas 통계

import pandas as pd
import numpy as np
df = pd.DataFrame({
    "category1" : ["A","A","A","B","B","B"],
    "column1" : np.array([5,4,6,9,11,13])
})



통계량


df.describe()



column1은 category에서 A와 B로 헤어지고 있지만 구별 없이 통계량이 나오는 것은 불편.

groupby 함수



category A, B로 구별하여 통계량을 얻는다.
# category1でgroupを作る
group = df.groupby("category1")
# groupごとに関数処理する
print(group.mean()) # 平均

print(group.std(ddof = 1)) # 標準偏差


group.describe() # groupごとに統計量の一括表示



꾸준히 꺼내


# Aを取り出す
df_A = df[df["category1"] == "A"]
# mean関数に通す
df_A["column1"].mean()

groupby 편리.

좋은 웹페이지 즐겨찾기