기계 학습 여정: 4일차(Python | 기술통계 | 사례 연구)

Youtube channel 구독

Cardio Good Fitness 사례 연구



AdRight의 시장 조사 팀은 CardioGood Fitness에서 제공하는 각 트레드밀 제품에 대한 일반 고객의 프로필을 식별하는 작업을 할당받습니다. 시장 조사 팀은 고객 특성과 관련하여 제품 라인 간에 차이가 있는지 여부를 조사하기로 결정합니다. 팀은 지난 3개월 동안 CardioGoodFitness 소매점에서 러닝머신을 구입한 개인에 대한 데이터를 수집하기로 결정했습니다. 데이터는 CardioGoodFitness.csv 파일에 저장됩니다.

팀은 연구할 다음 고객 변수를 식별합니다.
  • 구매한 제품, TM195, TM498 또는 TM798;
  • 성별;
  • 연령, 년;
  • 교육, 년 단위;
  • 관계 상태, 독신 또는 동거;
  • 연간 가계 소득 ;
  • 고객이 매주 런닝머신을 사용할 계획인 평균 횟수;
  • 고객이 매주 걷기/달리기를 기대하는 평균 마일 수;
  • 1에서 5까지의 척도에 대한 자체 평가 피트니스, 여기서 1은 좋지 않은 모양이고 5는 우수한 모양입니다.

  • 설명 분석을 수행하여 각 CardioGood Fitness 트레드밀 제품 라인에 대한 고객 프로필을 생성합니다.




    # Load the necessary packages
    
    import numpy as np
    import pandas as pd
    
    # Load the Cardio Dataset
    
    mydata = pd.read_csv('CardioGoodFitness-1.csv')
    
    mydata.head()
    


    머리:





    꼬리:





    설명하다:




    mydata.describe(include="all")
    




    정보:





    히스토그램:




    import matplotlib.pyplot as plt
    %matplotlib inline
    
    mydata.hist(figsize=(20,30))
    






    상자 그림:




    import seaborn as sns
    
    sns.boxplot(x="Gender", y="Age", data=mydata)
    




    페어 플롯






    크로스탭:





    카운트플롯:





    피벗 테이블:





    히트맵과의 상관관계:





    기타 유용한 링크:

    https://numpy.org/
    https://pandas.pydata.org/
    https://seaborn.pydata.org/
    https://matplotlib.org/

    좋은 웹페이지 즐겨찾기