pandas 통계
import pandas as pd
import numpy as np
df = pd.DataFrame({
"category1" : ["A","A","A","B","B","B"],
"column1" : np.array([5,4,6,9,11,13])
})

통계량
df.describe()

column1은 category에서 A와 B로 헤어지고 있지만 구별 없이 통계량이 나오는 것은 불편.
groupby 함수
category A, B로 구별하여 통계량을 얻는다.
# category1でgroupを作る
group = df.groupby("category1")
# groupごとに関数処理する
print(group.mean()) # 平均
print(group.std(ddof = 1)) # 標準偏差

group.describe() # groupごとに統計量の一括表示

꾸준히 꺼내
# Aを取り出す
df_A = df[df["category1"] == "A"]
# mean関数に通す
df_A["column1"].mean()
groupby 편리.
Reference
이 문제에 관하여(pandas 통계), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다
https://qiita.com/roadto93ds/items/0161c697317c06fd8ba3
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념
(Collection and Share based on the CC Protocol.)
df.describe()
category A, B로 구별하여 통계량을 얻는다.
# category1でgroupを作る
group = df.groupby("category1")
# groupごとに関数処理する
print(group.mean()) # 平均
print(group.std(ddof = 1)) # 標準偏差

group.describe() # groupごとに統計量の一括表示

꾸준히 꺼내
# Aを取り出す
df_A = df[df["category1"] == "A"]
# mean関数に通す
df_A["column1"].mean()
groupby 편리.
Reference
이 문제에 관하여(pandas 통계), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다
https://qiita.com/roadto93ds/items/0161c697317c06fd8ba3
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념
(Collection and Share based on the CC Protocol.)
# Aを取り出す
df_A = df[df["category1"] == "A"]
# mean関数に通す
df_A["column1"].mean()
Reference
이 문제에 관하여(pandas 통계), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/roadto93ds/items/0161c697317c06fd8ba3텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념
(Collection and Share based on the CC Protocol.)