정규 분포의 확률 밀도 함수 이해

줄거리


f(x)=\frac{1}{\sqrt{2\piσ^2}}e^{-\frac{(x-μ)^2}{2σ^2}}

정규 분포는 대표적인 분포 중 하나이며 통계 분야에서 자주 발생하는 분포입니다.
그러나 정규분포의 확률밀도함수는 ↑식과 같이 매우 다소 많고, 많은 초학자를 장사해 왔습니다.
이렇게 말하는 저도 통계 공부를 시작하고 처음 이 식을 보았을 때는 두통과 현기증을 기억한 기억이 있습니다.

본 기사에서는 ↑식의 계수 부분($\frac{1}{\sqrt{2\piσ^2}}$)과 지수 부분($-\frac{(x-μ)^2}{2σ^2 }$)로 나누어, 왜 이런 형태가 되었는지를 기술해 갑니다.

지수 부분



세상의 많은 사건들은 평균값을 취할 확률이 가장 크고, 평균값을 벗어날수록 그 값을 취할 확률은 작아진다.

이것을 간단히 나타내는 식이,
f(x)=e^{-x^2}

입니다.
그래프로 표현하면,
import numpy as np
import matplotlib.pyplot as plt

def normal_dist(x, ave = 0, disp=1):
    return np.exp((-(x-ave)**2)/(2*disp**2))

x = np.linspace(-3, 3)
y = normal_dist(x)

plt.plot(x,y)
plt.grid(axis="both")
plt.show()


이런 식으로 산 나름의 형태가 됩니다.

이 식에서는 한 가지 그래프만 쓸 수 있으므로 범용성이 떨어집니다.
거기서
① 그래프의 좌우 이동
② 그래프 폭 변경
기능을 추가합니다.

그래프의 좌우 이동



$x$ 부분을 $x-μ$로 변경하여 극대값을 취하는 $x$의 위치를 ​​어긋나게 할 수 있습니다.
f(x)=e^{-(x-μ)^2}

이런 식이 됩니다.
$μ$의 값을 바꿔서 그래프의 변화를 살펴보자.
color = ["b", "g", "r", "c", "m"]
for i, col in enumerate(color):
    y = normal_dist(x, i)
    plt.plot(x, y, color=col)

plt.show()


$μ$가 커짐에 따라 그래프가 오른쪽으로 이동했습니다.

그래프 폭 변경



지수 부분에 $\frac{1}{2σ^2}$를 곱하면 폭을 변경할 수 있습니다.
f(x)=e^{-\frac{x^2}{2σ^2}}
x = np.linspace(-10, 10)
color = ["b", "g", "r", "c", "m"]
for i, col in enumerate(color):
    y = normal_dist(x, 0, i+1)
    plt.plot(x, y, color=col)

plt.show()



폭을 바꾸는 데 성공했습니다.
σ를 제곱으로 한 것은 음수 둘 다 취급할 수 있도록 하기 때문에, $2$를 곱하고 있는 것은 계산하기 쉽게 하기 위해서입니다.

계수 부분



확률 밀도 함수이므로 면적의 합이 $1$이어야 합니다.
그래서 편리한 값을 함수에 곱해줍니다.
편리한 계수를 $ c $로 놓고,
\int_{-\infty}^{\infty}ce^{-\frac{(x-μ)^2}{2σ^2}}dx=1

를 계산하고 $c$를 구합니다.

보기 힘든 계산으로 보이지만,
\int_{-\infty}^{\infty}e^{-ax^2}dx=\sqrt{\frac{\pi}{a}}

이 가우스 적분의 공식을 이용해 $a=\frac{1}{2σ^2}$로 하면
c=\frac{1}{\sqrt{2\piσ^2}}

되어 쉽게 계산이 가능합니다.
솔루션은 최상위 표현식의 계수가 되었습니다.

결국 이 식은 $f(x)=e^{-x^2}$에 범용성을 갖게 하고 계수를 조정하는 것으로 확률 밀도 함수를 정의한다는 식이었습니다.
죄송합니다.

참고로 한 사이트



htps : ///--케이. 네 t / st ribuchion / rma l - st ribuchion / 덴시 ty-fun c 치온 - 데리 ゔ ぁ 치온 /
정규 분포의 밀도 함수를 의미적으로 이해

htps://ま thtらん。 jp / 가 s
가우스 적분의 공식 두 가지 증거

htps : // 벨 r ゔぇ. jp / s 들 scs / 이렇게 rs / 7797. HTML
14-1. 정규 분포

좋은 웹페이지 즐겨찾기