QQ-plot

추후에 자세히 배우면 추가로 정리할 포스트. (단순히 QQ-plot이 뭔가? 만 알고가자..)

💡QQ-plot

  • qq-plot은 두 변수간의 분포를 비교하기 위해 사용되는 그래프이다.
    보통 수집된 데이터를 표준정규분포의 분위수와 비교하여 정규화를 검토하기 위한 그래프라고 알려져 있는데, 정규분포에 뿐 아니라 두 분포의 비교에도 활용 가능하다.

간단한 해석

QQ-plot에서는 아래 같이 점과 직선을 확인할 수 있다. 직선은 정규분포를, 점들은 수집 데이터들의 값이다.
점선과 직선이 일치할수록, 데이터는 정규분포를 따른다.
아래의 그림처럼 점선과 직선이 일치하지 않게 되면, 데이터는 정규분포를 따르지 않는다.

Python 예제

import matplotlib.pyplot as plt
import statsmodels.api as sm

sm.qqplot(raw_data, fit=True, line='45')

----------------------------------------------

import scipy.stats as stats

stats.probplot(raw_data, plot=plt)

좋은 웹페이지 즐겨찾기