Python, Pandas 및 Seaborn을 사용하여 연령 분포 그래프를 만드는 방법

4154 단어
Python, Pandas 및 Seaborn을 사용하여 연령 분포 그래프를 만드는 방법에 대해 궁금한 적이 있습니까? 그렇다면 방법을 알아보기 위해 계속 읽으십시오!



그림 1: 이 자습서에서 빌드하는 방법을 배울 그래프입니다.

설정



먼저 이 자습서의 GitHub 저장소는 다음과 같습니다. Kaggle Titanic Project

이 자습서에서는 파일age-distribution-graph.ipynb의 콘텐츠로 작업할 것입니다.

참고: 이 자습서에서는 Jupyter 노트북으로 작업할 것이므로 설치하지 않은 경우 설치할 수 있습니다in the official Jupyter website.

개발


age-distribution-graph.ipynb를 열면 코드가 개별적으로 실행할 수 있는 블록으로 나누어져 있음을 알 수 있습니다.

각 코드 블록을 하나씩 살펴보겠습니다.

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import warnings
import os
warnings.filterwarnings("ignore")



여기서 우리는 우리가 만들려고 하는 히스토그래프를 구성하기 위해 필요한 모든 라이브러리를 가져옵니다. Seaborn 방법을 사용하여 히스토그래프를 생성하기 위해 histplot를 사용할 것입니다(해당 방법in their docs page에 대해 자세히 알아보기)warnings.filterwarnings("ignore") 라인은 정렬된 필터 사양 목록과 일치하는 경고를 인쇄하지 않도록 합니다(자세한 내용은 official docs pagewarnings.filter() 참조).

다음으로 다음 코드 블록을 추가합니다.

def read_data():
    train_data = pd.read_csv("data/train.csv")
    test_data = pd.read_csv("data/test.csv")
    return train_data, test_data

train_data, test_data = read_data()


여기서 우리는 read_data() 파일에 포함된 데이터를 Pandas .csv 개체로 로드하는 DataFrame 메서드를 정의하고 있습니다(their official docsDataFrame 참조).
이제 train_data 변수에 훈련 데이터가 포함되고 test_data 변수에 테스트 데이터가 포함됩니다.

다음으로 다음 코드를 추가할 수 있습니다.

def survived_age_table(feature):
    sns.histplot(data=train_data, x='Age', hue='Survived', palette=['yellow', 'green']).set_title(f"{feature} Vs Survived")
    plt.legend(labels=['Died', 'Survived'])
    plt.show()



이 메서드는 연령 분포 그래프 생성을 담당합니다. 이에 대한 자세한 내용은 다음과 같습니다.
  • 먼저 sns.histplot() 메서드를 호출하여 히스토그램을 만듭니다(이 메서드에 대한 자세한 내용은 their official docs 참조).
  • data 매개변수는 입력 데이터 구조를 사용하며 이 경우에는 pandas.DataFrame입니다.
  • x 매개변수는 계산 대상 변수를 지정하며, 이 경우에는 Age 변수입니다. 변수를 hue 매개변수(이 경우에는 Survived)에 할당하는 것은 조건부 부분 집합화의 인스턴스가 되며, 고유한 값과 색상을 포함하는 별도의 히스토그램이 동일한 그래프에 렌더링됩니다.
  • palette 매개변수는 hue 변수를 매핑할 때 사용할 색상을 선택하는 방법입니다.
  • 마지막으로 set_title()를 통해 히스토그램의 제목을 설정할 수 있습니다.
  • plt.legend() 방법은 히스토그램의 오른쪽 상단에 있는 범례 상자에 표시되는 범례를 사용자 지정하는 방법입니다.
  • 마지막으로 plt.show()는 히스토그램을 표시합니다.

  • 완성된 히스토그램은 다음과 같습니다.



    그림 2: 완성된 히스토그램

    따라와 주셔서 감사합니다. 이 기사가 도움이 되었기를 바랍니다.

    결론



    그럼 이번 포스팅은 여기까지! 이 기사를 따라 주셔서 감사합니다. 질문이나 우려 사항이 있는 경우 언제든지 이 게시물에 의견을 게시해 주시면 시간이 나면 연락드리겠습니다.

    이 기사가 도움이 되었다면 공유하고 GitHub에서 저를 팔로우하고 저와 연결하고 제 를 구독하십시오.

    좋은 웹페이지 즐겨찾기