에서 배울 확률 변수(5) - 정규 분포(연속형)

5480 단어 Julia통계학
Julia에서 배우는 확률 변수 (1) - 확률 변수 정의 - Qiita
Julia에서 배울 확률 변수 (11) - 요약 - Qiita

확률 변수를 공부중입니다만, 「확률 통계」(모리키타 출판)는 수학적으로 명확한 정의가 확실히 쓰여져 있으므로, 이것을 중심으로 공부하고 있습니다. 아울러 「통계학 입문」(도쿄대학 출판회)과 「확률론 입문」(치쿠마학예문고, 아카야야)도 병독하고 있습니다.

본 기사는, 그 교과서를 읽으면서, 실제로 예제나 문제를 Julia로 풀어나가려는 시도입니다. Julia의 연속 유형 확률 변수 라이브러리 문서입니다. ==> Distributions/Univariate/ContinuousDistributions

1. 정규 분포(가우스 분포) N(μ,σ)


\begin{align}
\\
\\
&*** 正規分布はN(\mu,\sigma)ともN(\mu,\sigma ^2)とも書かれるようですが、\\
&*** Juliaのドキュメントでは前者を採っているので従います。\\
\\
&X: \Omega \rightarrow R (実数の集合)\\
\\
&\muは実数の定数、\sigmaは正の定数として、確率密度関数f(x)が、\\
&以下のように書けるとき、確率変数Xは正規分布N(\mu,\sigma)に従うという。\\

\\
&f(x) = \frac{1}{\sqrt {2\pi \sigma^2}} \exp\Biggl(-\frac{(x-\mu)^2}{2\sigma^2}\Biggr) \qquad (-\infty<x<\infty)\\
\\
\\
\\
&ガウス積分の公式より以下の3式が導かれる。\\
&E[X] = \int_{-\infty}^{\infty} xf_X(x) dx =\mu\\
&V[X] = \int_{-\infty}^{\infty} (x - E[X])^2 f_X(x) dx =\int_{-\infty}^{\infty} (x - \mu)^2 \frac{1}{\sqrt {2\pi \sigma^2}} \exp\Biggl(-\frac{(x-\mu)^2}{2\sigma^2}\Biggr)=\sigma^2\\
&p(\Omega)=\int_{-\infty}^{\infty} f(x) dx =\int_{-\infty}^{\infty}  \frac{1}{\sqrt {2\pi \sigma^2}} \exp\Biggl(-\frac{(x-\mu)^2}{2\sigma^2}\Biggr) = 1\\

\\
\\
&とくに、\mu = 0、\sigma^2=1の場合を標準正規分布という。\\
&f(x) = \frac{1}{\sqrt {2\pi}} \exp\Biggl(-\frac{x^2}{2}\Biggr) \qquad (-\infty<x<\infty)\\
\\
&\qquad \qquad  \qquad \qquad  \qquad \qquad  \qquad \qquad \qquad  \qquad \qquad \qquad \qquad \qquad \qquad \qquad \qquad  \qquad  \\
\end{align}

이상에 정리한 것의 상세나 증명은 이하의 사이트를 참조해 주세요.
"정규 분포의 기초 지식 요약 - 고등학교 수학의 아름다운 이야기"

1-2. 시그마 구간



정규 분포의 때, 이하가 성립하는 것이 알려져 있습니다.
1σ 区間 [μ−σ, μ+σ] におさまる確率 = 約 68.27%
2σ 区間 [μ−2σ, μ+2σ] におさまる確率 = 約 95.45%
3σ 区間 [μ−3σ, μ+3σ] におさまる確率 = 約 99.73%

1-3. 드 모어블-라플라스 정리



이항 분포 B(k;n,p)의 근사식으로서의 정규 분포입니다.
\begin{align}
&nが十分大きいとして、二項分布の平均値npと分散np(1-p)に関して、\\
&実数の定数\mu=np、正の定数\sigma= \sqrt{np(1-p)}とおくとき、\\
\\
&2項分布B(n;p)は正規分布N(\mu,\sigma)に近づく、ことが言える\\
\\
&*** このド・モアブル–ラプラスの定理は中心極限定理より導かれる。\\
\\
&\qquad \qquad  \qquad \qquad  \qquad \qquad  \qquad \qquad \qquad  \qquad \qquad \qquad \qquad  \qquad \qquad  \qquad\\
\end{align}

자세한 내용은 다음 사이트를 참조하십시오.
「이항 분포의 정규 근사(라플라스의 정리) - 고교 수학의 아름다운 이야기」
「코인 던지기에서 알 수 있는 이항 분포. 정규 분포나 포아송 분포와의 관계성과 근사에 대해」

다음과 같은 예제에 응용해 보겠습니다.
사이코로를 200회 던졌을 때 1의 눈이 나오는 횟수를 확률 변수 X로 한다. X는 이항 분포 B(200; 1/6)를 따른다.
\begin{align}
&\mu = E[X]=np=200(1/6)=33.33\\
&\sigma^2 = V[X] = np(1-p) =200(1/6)(5/6)=27.78\\
&\sigma = 5.27\\  
\\
&\qquad \qquad  \qquad \qquad  \qquad \qquad  \qquad \qquad \qquad  \qquad \qquad \\
\end{align}

드 모어블-라플라스의 정리로부터, 2항 분포 B(200;1/6)는 정규 분포 N(33.33, 5.27)에 근사할 수 있습니다. 즉, 정규 분포의 시그마 구간을 이용하면 즉시 다음을 알 수 있습니다.


구간
확률
구간을 횟수로 표시



68%
28~38회


95%
23~43회


99%
13~48회


1-4. Julia에서 예제를 풀어보십시오.



Julia에서 분포를 다루는 기초 지식은 아래 페이지를 참조하십시오.
「Julia에서 배우는 확률 변수(1) - 확률 변수의 정의」의 「4.Julia에서 확률 분포를 다룬다」

Julia에서 정규 분포의 확률 밀도 정의는 Distributions.Normal을 사용합니다. μ와 σ가 주어지면 Normal(μ,σ)로 정의합니다.

사이트 정규 분포란 무엇인가? 그것의 기본적인 본질과 이해하는 팁 의 알기 쉬운 예제를 생각해 봅니다.

일본의 성인 남성의 평균 신장 μ=171cm, 표준편차 σ=6cm로 한다.
정규분포에 따른다고 가정했을 경우, 일본 중에서 랜덤하게 1명 선택된 성인 남성의 신장이 165cm 이상 171cm 이하일 확률은 몇%인가?

연속형 확률 변수의 구간 [a, b]의 확률은 분포 함수의 뺄셈 cdf(d,b)-cdf(d,a)에서 구합니다.
# まだStatPlotsをインストールしていなければ必要。
import Pkg; Pkg.add("StatPlots")

using Plots
using Distributions
# using StatPlotsを行ってからplotする。
using StatPlots

d=Normal(171,6)
plot(d,fill=(0, .5,:orange))

cdf(d,171)-cdf(d,165)
0.341344746068543

d=Normal(171,6)에서 확률 밀도 함수를 정의하여 cdf(d,171)-cdf(d,165)의 계산 결과(0.341344746068543)가 대답이 됩니다.

프로그램은 이 정규 분포의 그래프도 플롯합니다.



확률 밀도 함수와 분포의 그래프입니다.
d=Normal(171,6)
scatter(d, leg=false)         # 確率密度を散布図にする
bar!(d, func=cdf, alpha=0.3)  # 分布を棒グラフにする



분포가 평균(171)으로 0.5(50%)인 것을 알 수 있습니다. 밀도 함수와 분포의 관계는 시각적으로 파악됩니다.

이번은 이상입니다.

좋은 웹페이지 즐겨찾기