Python, Pandas 및 Seaborn을 사용하여 연령 분포 그래프를 만드는 방법
그림 1: 이 자습서에서 빌드하는 방법을 배울 그래프입니다.
설정
먼저 이 자습서의 GitHub 저장소는 다음과 같습니다. Kaggle Titanic Project
이 자습서에서는 파일
age-distribution-graph.ipynb
의 콘텐츠로 작업할 것입니다.참고: 이 자습서에서는 Jupyter 노트북으로 작업할 것이므로 설치하지 않은 경우 설치할 수 있습니다in the official Jupyter website.
개발
age-distribution-graph.ipynb
를 열면 코드가 개별적으로 실행할 수 있는 블록으로 나누어져 있음을 알 수 있습니다.각 코드 블록을 하나씩 살펴보겠습니다.
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import warnings
import os
warnings.filterwarnings("ignore")
여기서 우리는 우리가 만들려고 하는 히스토그래프를 구성하기 위해 필요한 모든 라이브러리를 가져옵니다.
Seaborn
방법을 사용하여 히스토그래프를 생성하기 위해 histplot
를 사용할 것입니다(해당 방법in their docs page에 대해 자세히 알아보기)warnings.filterwarnings("ignore")
라인은 정렬된 필터 사양 목록과 일치하는 경고를 인쇄하지 않도록 합니다(자세한 내용은 official docs page의 warnings.filter()
참조).다음으로 다음 코드 블록을 추가합니다.
def read_data():
train_data = pd.read_csv("data/train.csv")
test_data = pd.read_csv("data/test.csv")
return train_data, test_data
train_data, test_data = read_data()
여기서 우리는
read_data()
파일에 포함된 데이터를 Pandas .csv
개체로 로드하는 DataFrame
메서드를 정의하고 있습니다(their official docs의 DataFrame
참조).이제
train_data
변수에 훈련 데이터가 포함되고 test_data
변수에 테스트 데이터가 포함됩니다.다음으로 다음 코드를 추가할 수 있습니다.
def survived_age_table(feature):
sns.histplot(data=train_data, x='Age', hue='Survived', palette=['yellow', 'green']).set_title(f"{feature} Vs Survived")
plt.legend(labels=['Died', 'Survived'])
plt.show()
이 메서드는 연령 분포 그래프 생성을 담당합니다. 이에 대한 자세한 내용은 다음과 같습니다.
sns.histplot()
메서드를 호출하여 히스토그램을 만듭니다(이 메서드에 대한 자세한 내용은 their official docs 참조). data
매개변수는 입력 데이터 구조를 사용하며 이 경우에는 pandas.DataFrame
입니다. x
매개변수는 계산 대상 변수를 지정하며, 이 경우에는 Age
변수입니다. 변수를 hue
매개변수(이 경우에는 Survived
)에 할당하는 것은 조건부 부분 집합화의 인스턴스가 되며, 고유한 값과 색상을 포함하는 별도의 히스토그램이 동일한 그래프에 렌더링됩니다. palette
매개변수는 hue
변수를 매핑할 때 사용할 색상을 선택하는 방법입니다. set_title()
를 통해 히스토그램의 제목을 설정할 수 있습니다.plt.legend()
방법은 히스토그램의 오른쪽 상단에 있는 범례 상자에 표시되는 범례를 사용자 지정하는 방법입니다. plt.show()
는 히스토그램을 표시합니다. 완성된 히스토그램은 다음과 같습니다.
그림 2: 완성된 히스토그램
따라와 주셔서 감사합니다. 이 기사가 도움이 되었기를 바랍니다.
결론
그럼 이번 포스팅은 여기까지! 이 기사를 따라 주셔서 감사합니다. 질문이나 우려 사항이 있는 경우 언제든지 이 게시물에 의견을 게시해 주시면 시간이 나면 연락드리겠습니다.
이 기사가 도움이 되었다면 공유하고 GitHub에서 저를 팔로우하고 저와 연결하고 제 를 구독하십시오.
Reference
이 문제에 관하여(Python, Pandas 및 Seaborn을 사용하여 연령 분포 그래프를 만드는 방법), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://dev.to/shehanat/how-to-create-an-age-distribution-graph-using-python-pandas-and-seaborn-2o5n텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)