데이터 분석(데이터 시각화2)
개시하다
초보자를 대상으로python의 데이터 해석에 대해 해설을 진행하였다.
이것은 두 번째 보도다.
이전 글:pytohon으로 시작된 데이터 분석(데이터 시각화1)
https://qiita.com/CEML/items/d673713e25242e6b4cdb
소스 코드
https://gitlab.com/ceml/qiita/-/blob/master/src/python/notebook/first_time_data_analysis.ipynb
지난번 복습
이 시리즈에서.
무료로 공개된 데이터 집합을 이용해 데이터에서 간단한 데이터 해석까지 해설한다.
데이터 세트 정보
• 제공업체: 캘리포니아공과대학
/내용: 심장병 환자의 검사 데이터
・URL:https://archive.ics.uci.edu/ml/datasets/Heart+Disease
• 위 URL의 processedcleveland.데이터만 사용합니다.
해석 목적
데이터 집합은 환자의 병태를 다섯 가지 유형으로 나눈다.
나는 각 반의 특징을 잡는 것을 목적으로 분석하고 싶다.
※ 데이터 다운로드, 읽기 등은 과거 글을 참조하세요.
본 보도의 내용
지난번에 보기 어려웠던 직사각형을 개선하다.
개선 조치
이전 문제의 그림은 아래의 그림이다.import pandas as pd
columns_name = ["age", "sex", "cp", "trestbps", "chol", "fbs", "restecg", "thalach", "exang", "oldpeak","slope","ca","thal","class"]
data = pd.read_csv("/Users/processed.cleveland.data", names=columns_name)
class_group = data.groupby("class")
class_group["age"].hist(alpha=0.7)
plt.legend([0,1,2,3,4])
잘 보이지 않는 이유로는 다음과 같은 두 가지가 있다.
①. 그림이 겹친다.
②.bin의 범위는 레벨별로 다릅니다.
이번에는 plotly를 사용하여 이 문제들을 개선했다.
물론 matplotlib도 해결할 수 있지만, plotly도 편리하게 사용할 수 있어 손실이 없다.
plotly의 장점은 상호작용을 할 수 있는 그림을 만들 수 있다는 것이다.
※ 이번 그림은 성공적으로 삽입되지 않았습니다. 이미지를 클릭하여 링크에서 상호작용을 체험하세요.
① 개선책
import plotly.graph_objects as go
fig = go.Figure()
for i in range(len(class_group)):
fig.add_trace(go.Histogram(x=class_group["age"].get_group(i), nbinsx=10))
# fig.update_layout(barmode='overlay')
fig.update_traces(opacity=0.8)
fig.show()
※ 그림을 클릭하면 상호작용을 체험할 수 있습니다.
② 개선책
방금의 평론이 켜졌을 뿐인데 그림이 걸렸다.import plotly.graph_objects as go
fig = go.Figure()
for i in range(len(class_group)):
fig.add_trace(go.Histogram(x=class_group["age"].get_group(i), nbinsx=10))
fig.update_layout(barmode='overlay')
fig.update_traces(opacity=0.8)
fig.show()
※ 그림을 클릭하면 상호작용을 체험할 수 있습니다.
끝맺다
상호작용을 느꼈습니까?
데이터 포인터의 값을 표시할 수 있을 뿐만 아니라 도형의 확대, 축소 등을 자유롭게 조작할 수 있어 매우 편리하다.
다음에도 plotly의 3d 그림 등을 사용하여 해석하고 싶습니다.
데이터 분석(데이터 시각화3)
https://qiita.com/CEML/items/71fbc7b8ab6a7576f514
Reference
이 문제에 관하여(데이터 분석(데이터 시각화2)), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다
https://qiita.com/CEML/items/e932684502764be09157
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념
(Collection and Share based on the CC Protocol.)
지난번에 보기 어려웠던 직사각형을 개선하다.
개선 조치
이전 문제의 그림은 아래의 그림이다.
import pandas as pd
columns_name = ["age", "sex", "cp", "trestbps", "chol", "fbs", "restecg", "thalach", "exang", "oldpeak","slope","ca","thal","class"]
data = pd.read_csv("/Users/processed.cleveland.data", names=columns_name)
class_group = data.groupby("class")
class_group["age"].hist(alpha=0.7)
plt.legend([0,1,2,3,4])
잘 보이지 않는 이유로는 다음과 같은 두 가지가 있다.
①. 그림이 겹친다.
②.bin의 범위는 레벨별로 다릅니다.
이번에는 plotly를 사용하여 이 문제들을 개선했다.
물론 matplotlib도 해결할 수 있지만, plotly도 편리하게 사용할 수 있어 손실이 없다.
plotly의 장점은 상호작용을 할 수 있는 그림을 만들 수 있다는 것이다.
※ 이번 그림은 성공적으로 삽입되지 않았습니다. 이미지를 클릭하여 링크에서 상호작용을 체험하세요.
① 개선책
import plotly.graph_objects as go
fig = go.Figure()
for i in range(len(class_group)):
fig.add_trace(go.Histogram(x=class_group["age"].get_group(i), nbinsx=10))
# fig.update_layout(barmode='overlay')
fig.update_traces(opacity=0.8)
fig.show()
※ 그림을 클릭하면 상호작용을 체험할 수 있습니다.
② 개선책
방금의 평론이 켜졌을 뿐인데 그림이 걸렸다.
import plotly.graph_objects as go
fig = go.Figure()
for i in range(len(class_group)):
fig.add_trace(go.Histogram(x=class_group["age"].get_group(i), nbinsx=10))
fig.update_layout(barmode='overlay')
fig.update_traces(opacity=0.8)
fig.show()
※ 그림을 클릭하면 상호작용을 체험할 수 있습니다.
끝맺다
상호작용을 느꼈습니까?
데이터 포인터의 값을 표시할 수 있을 뿐만 아니라 도형의 확대, 축소 등을 자유롭게 조작할 수 있어 매우 편리하다.
다음에도 plotly의 3d 그림 등을 사용하여 해석하고 싶습니다.
데이터 분석(데이터 시각화3)
https://qiita.com/CEML/items/71fbc7b8ab6a7576f514
Reference
이 문제에 관하여(데이터 분석(데이터 시각화2)), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/CEML/items/e932684502764be09157텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)