상자 수염 그림

matplotlib


import matplotlib.pyplot as plt

# yがyesとnoのときのcolumn1データを抽出
# ここでの抽出は y == yes で該当する行が全て取り出されている
y_yes = df[df["y"] == "yes"]
y_no = df[df["y"] == "no"]

# 縦軸をcolumn1で箱ひげ図を書きたい
# yesとnoのデータをまとめる
# 格納先へ = [y_yesのcolumn1の値抽出, y_noのcolumn1の値抽出]
y_column1 = [y_yes["column1"], y_no["column1"]]

# 箱ひげ図の描画
# y_column1に分けて格納したデータに対してboxplotする
plt.boxplot(y_column1)

# x軸(横軸)とy軸(縦軸)のラベルを追加
plt.xlabel("y")
plt.ylabel("column1")

# gca(get current axes)では直前まで作ったaxes部分(今回はboxplotとラベル)をaxに取得する
ax = plt.gca()

# ここまででは、x軸の2つのboxへの分類ラベルは未設定

# 取得しておいたaxにx軸の2つのboxの分類ラベルを追加
# xticklabelsで、x軸の目盛りラベルを設定
plt.setp(ax,xticklabels = ['yes','no'])
plt.show()



gca 정보



matpltlib 안에
용지로 그림
캔버스로 축
테두리에 그리는 선으로 line
라는 계층구조가 있다.

gca(get current axes)
1. figure내에 plt.boxplot(y_column1)로 boxplot가 묘화 된다.
2. 축에 boxplot이 그려져 가로축과 세로축 추가
3. axes에 행한 조작을 plt.gca() 로서 ax 에 취득해 둔다
4. x축 분류 라벨은 xticklabels로 가필

이번에는 이런 흐름이 될 것.

seaborn



양적 변수 분포


import seaborn as sns

sns.boxplot(y="column3", data=df)



카테고리별 양적 변수 분포


sns.boxplot(x="y",y="column1", data=df)

# (x,y)=(カテゴリー、量的)



박스의 배열 지정


sns.boxplot(x="y",y="column1",order=["yes","no"], data=df)



상자를 다른 질적 변수로 나누기



sns.boxplot(x="category2", y="column1", hue="y", data=df)

좋은 웹페이지 즐겨찾기