pandas 통계

import pandas as pd
import numpy as np

df = pd.DataFrame({
    "category1" : ["A","A","A","B","B","B"],
    "column1" : np.array([5,4,6,9,11,13])
})

통계량

df.describe()

column1은 category에서 A와 B로 헤어지고 있지만 구별 없이 통계량이 나오는 것은 불편.

groupby 함수

category A, B로 구별하여 통계량을 얻는다.

# category1でgroupを作る
group = df.groupby("category1")
# groupごとに関数処理する
print(group.mean()) # 平均

print(group.std(ddof = 1)) # 標準偏差

group.describe() # groupごとに統計量の一括表示

# Aを取り出す
df_A = df[df["category1"] == "A"]
# mean関数に通す
df_A["column1"].mean()

groupby 편리.

이 문제에 관하여(pandas 통계), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/roadto93ds/items/0161c697317c06fd8ba3

텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.

우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)

개발자 우수 사이트 수집

개발자가 알아야 할 필수 사이트 100선 추천 우리는 당신을 위해 100개의 자주 사용하는 개발자 학습 사이트를 정리했습니다