히스토그램
양적 변수 분포
간단한 히스토그램
matplotlib
import matplotlib.pyplot as plt
plt.hist(df['column1']) # 引数はcolumから選択
plt.xlabel('column1')
plt.ylabel('freq')
plt.show()
seaborn
import seaborn as sns
sns.set()
sns.distplot(df['column1'], kde=False, bins=10, color='blue')
# kernel density estimation(カーネル密度推定)
여러 개의 히스토그램을 그리고 싶습니다.
· $ X_n $가 이진 분류 데이터 (binary에서 0,1 등)에서의 양적 변수 $ Y $에 대한 분포
import seaborn as sns
df_0 = df[df["x"] == 0] # object型を指定したいときは =="object"
df_1 = df[df["x"] == 1]
sns.distplot(df_0["Y"], kde=False, bins=20, color="r")
sns.distplot(df_1["Y"], kde=False, bins=20, color="b")
질적 변수 분포
카운트 플롯
import seaborn as sns
sns.countplot(data=df,x="column2")
# カウントプロットを別のcolumnの値ごとに色分けする。
import seaborn as sns
sns.countplot(data=df,x="column2",hue="marital")
Reference
이 문제에 관하여(히스토그램), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다
https://qiita.com/roadto93ds/items/0d717dd6043cc3821103
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념
(Collection and Share based on the CC Protocol.)
import matplotlib.pyplot as plt
plt.hist(df['column1']) # 引数はcolumから選択
plt.xlabel('column1')
plt.ylabel('freq')
plt.show()
import seaborn as sns
sns.set()
sns.distplot(df['column1'], kde=False, bins=10, color='blue')
# kernel density estimation(カーネル密度推定)
import seaborn as sns
df_0 = df[df["x"] == 0] # object型を指定したいときは =="object"
df_1 = df[df["x"] == 1]
sns.distplot(df_0["Y"], kde=False, bins=20, color="r")
sns.distplot(df_1["Y"], kde=False, bins=20, color="b")
카운트 플롯
import seaborn as sns
sns.countplot(data=df,x="column2")
# カウントプロットを別のcolumnの値ごとに色分けする。
import seaborn as sns
sns.countplot(data=df,x="column2",hue="marital")
Reference
이 문제에 관하여(히스토그램), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/roadto93ds/items/0d717dd6043cc3821103텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)