기계 학습 여정: 4일차(Python | 기술통계 | 사례 연구)
Cardio Good Fitness 사례 연구
AdRight의 시장 조사 팀은 CardioGood Fitness에서 제공하는 각 트레드밀 제품에 대한 일반 고객의 프로필을 식별하는 작업을 할당받습니다. 시장 조사 팀은 고객 특성과 관련하여 제품 라인 간에 차이가 있는지 여부를 조사하기로 결정합니다. 팀은 지난 3개월 동안 CardioGoodFitness 소매점에서 러닝머신을 구입한 개인에 대한 데이터를 수집하기로 결정했습니다. 데이터는 CardioGoodFitness.csv 파일에 저장됩니다.
팀은 연구할 다음 고객 변수를 식별합니다.
설명 분석을 수행하여 각 CardioGood Fitness 트레드밀 제품 라인에 대한 고객 프로필을 생성합니다.
# Load the necessary packages
import numpy as np
import pandas as pd
# Load the Cardio Dataset
mydata = pd.read_csv('CardioGoodFitness-1.csv')
mydata.head()
머리:
꼬리:
설명하다:
mydata.describe(include="all")
정보:
히스토그램:
import matplotlib.pyplot as plt
%matplotlib inline
mydata.hist(figsize=(20,30))
상자 그림:
import seaborn as sns
sns.boxplot(x="Gender", y="Age", data=mydata)
페어 플롯
크로스탭:
카운트플롯:
피벗 테이블:
히트맵과의 상관관계:
기타 유용한 링크:
https://numpy.org/
https://pandas.pydata.org/
https://seaborn.pydata.org/
https://matplotlib.org/
Reference
이 문제에 관하여(기계 학습 여정: 4일차(Python | 기술통계 | 사례 연구)), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://dev.to/iamvigneshc/machine-learning-journey-day-4-python-descriptive-statistics-case-study-1dk5텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)