데이터 분석(데이터 시각화2)

8210 단어 Pythonplotly

개시하다


초보자를 대상으로python의 데이터 해석에 대해 해설을 진행하였다.
이것은 두 번째 보도다.
이전 글:pytohon으로 시작된 데이터 분석(데이터 시각화1)
https://qiita.com/CEML/items/d673713e25242e6b4cdb
소스 코드
https://gitlab.com/ceml/qiita/-/blob/master/src/python/notebook/first_time_data_analysis.ipynb

지난번 복습


이 시리즈에서.
무료로 공개된 데이터 집합을 이용해 데이터에서 간단한 데이터 해석까지 해설한다.
데이터 세트 정보
• 제공업체: 캘리포니아공과대학
/내용: 심장병 환자의 검사 데이터
・URL:https://archive.ics.uci.edu/ml/datasets/Heart+Disease
• 위 URL의 processedcleveland.데이터만 사용합니다.
해석 목적
데이터 집합은 환자의 병태를 다섯 가지 유형으로 나눈다.
나는 각 반의 특징을 잡는 것을 목적으로 분석하고 싶다.
※ 데이터 다운로드, 읽기 등은 과거 글을 참조하세요.

본 보도의 내용


지난번에 보기 어려웠던 직사각형을 개선하다.

개선 조치


이전 문제의 그림은 아래의 그림이다.
import pandas as pd

columns_name = ["age", "sex", "cp", "trestbps", "chol", "fbs", "restecg", "thalach", "exang", "oldpeak","slope","ca","thal","class"]
data = pd.read_csv("/Users/processed.cleveland.data", names=columns_name)

class_group = data.groupby("class")
class_group["age"].hist(alpha=0.7)
plt.legend([0,1,2,3,4])

잘 보이지 않는 이유로는 다음과 같은 두 가지가 있다.
①. 그림이 겹친다.
②.bin의 범위는 레벨별로 다릅니다.
이번에는 plotly를 사용하여 이 문제들을 개선했다.
물론 matplotlib도 해결할 수 있지만, plotly도 편리하게 사용할 수 있어 손실이 없다.
plotly의 장점은 상호작용을 할 수 있는 그림을 만들 수 있다는 것이다.
※ 이번 그림은 성공적으로 삽입되지 않았습니다. 이미지를 클릭하여 링크에서 상호작용을 체험하세요.

① 개선책

import plotly.graph_objects as go

fig = go.Figure()
for i in range(len(class_group)):
    fig.add_trace(go.Histogram(x=class_group["age"].get_group(i), nbinsx=10))

# fig.update_layout(barmode='overlay')
fig.update_traces(opacity=0.8)
fig.show()

※ 그림을 클릭하면 상호작용을 체험할 수 있습니다.

② 개선책


방금의 평론이 켜졌을 뿐인데 그림이 걸렸다.
import plotly.graph_objects as go
fig = go.Figure()
for i in range(len(class_group)):
    fig.add_trace(go.Histogram(x=class_group["age"].get_group(i), nbinsx=10))  

fig.update_layout(barmode='overlay')
fig.update_traces(opacity=0.8)
fig.show()

※ 그림을 클릭하면 상호작용을 체험할 수 있습니다.

끝맺다


상호작용을 느꼈습니까?
데이터 포인터의 값을 표시할 수 있을 뿐만 아니라 도형의 확대, 축소 등을 자유롭게 조작할 수 있어 매우 편리하다.
다음에도 plotly의 3d 그림 등을 사용하여 해석하고 싶습니다.
데이터 분석(데이터 시각화3)
https://qiita.com/CEML/items/71fbc7b8ab6a7576f514

좋은 웹페이지 즐겨찾기