Kaggle의kerner에게서 배운 가시화 비망록

스스로 분석 보고서를 쓸 때는 기계 학습과 통계 지식이 없는 사람에게도 간단하고 알기 쉬운 보고서에 주의해야 한다.

A Data Science Framework: To Achieve 99% Accuracy


항상 분석을 시작하기 전에 describe()로 데이터의 정보를 예쁘게 파악한 다음에 분석을 한다

분류된 변수와 목적 변수도 좋은 관련이 있다.따라하고 싶다!

이 내부 핵은 어쨌든 가시화가 매우 아름답다!인용된 코드를 보십시오!
변수와 목표 변수의 직사각형도와 연속값을 설명하는 상자호도를 분류합니다.상자수염도는 이것보다 Seabrn을 사용하는 것이 더 예쁠 수도 있습니다.

같은 설명 변수라도 목표 변수와의 관계를 분류하는 조형도나 접선도에 따라

변수 간의 분석도 흥미롭다는 뜻이다.중간의 카테고리 변수 VS 연속값의 변수 그래프가 예뻐요.


3가지 요소를 이렇게 넣어도 재밌어요.

연속치 VS 연속치도 예쁘네요.

이것도 알기 쉬워요.

나는 이렇게 많은 모델을 시험해 본 적이 없다. 이렇게 하는 것은 매우 재미있다.

TP/TN/FP/FN에 대한 완벽한 이해

정말 아름다운 시각화네요~ 이런 보고서를 쓰고 싶어요.

Comprehensive data exploration with Python



skewness와kurtosis를 잘 찾아서 정규 분포인지 아닌지
만약 등간격의 시간 시퀀스 데이터가 있다면 이렇게 하면 재미있을 거예요~ 나중에 간단하게 하면 예뻐요.

이 내부 핵에는 데이터를 처리할 때의 주의점이 쓰여 있다. 정규 분포를 잘 볼 때skewness를 제외하고는

이런 정규 분포와fit 시각화 옵션이 있는 것 같아요.
다른 건 Probability plot으로 잘 따라갔는지 확인합니다.

첫 번째 타이타닉 호의 가시화는 목적 변수의survived만 그림을 그리고 있다. 이렇게 non survived를 그리는 것도 재미있다.

Python Data Visualizations


설명 변수를 가로축으로 하여 분류 목표 변수를 그리다

특징량을 2차원으로 나눈 놈인 것 같은데, tSNE나 PCA와 비슷한 놈인가?

Head Start for Data Scientist


이거 진짜 멋있다.

이 나무의 가시화는 정말 아름답구나

Exploration of data step by step



대단합니다. 이 코드가 각 목적의 변수에 대한 분류를 설명하는 변수인Contribution이 소극적인지 적극적으로 작업하고 있는지 한눈에 알 수 있습니다. 절대로 사용하고 싶습니다.


이미지 데이터예요. 너무 예뻐요.
NYC Taxi Fare - Data Exploration
이걸로 할게요. 데이터 비주얼리제이션에서 Vote 400표를 찾았는데 마음에 드는 걸 들었어요.그리고 어떻게 이 가시화를 데이터 과학의 재량으로 만들 수 있는지 힘내세요.
특징량 공사도 한 편 더 보도하다

좋은 웹페이지 즐겨찾기