기초에서 수리 통계 확률 변수
확률 변수와 주사위
우선 처음에는 왜곡이 없는 1~6 주사위 의 예로 생각해 봅시다.
1에서 6 사이코로의 눈은 각각 마찬가지로 확실하다 (각각의 출방에 편향이 없다) 때문에, 각각의 눈의 출방은 이하와 같은 확률로 줄 수 있습니다.
$
P(1의 눈이 나올 확률) ==frac{1}{6}\qquad
P(2의 눈이 나올 확률)==frac(1}{6}\qquad
P(3 의 눈이 나올 확률)==frac{1}{6}\\
P(4 의 눈이 나올 확률) ==frac{1}{6}\qquad
P(5의 눈이 나올 확률)==frac(1}{6}\qquad
P(6의 눈이 나올 확률)==frac{1}{6}
$
여기서 확률 변수 $X$ 다음과 같이 정의하면
$
X =\left\{
\begin{array}{ll}
1 & (1의 눈이 나왔을 때)\\
2 & (2의 눈이 나왔을 때)\\
3 & (3의 눈이 나왔을 때)\\
4 & (4의 눈이 나왔을 때)\\
5 & (5의 눈이 나왔을 때)\\
6 & (6의 눈이 나왔을 때)\\
\end{array}\right.
$
됩니다. 여기서 $X$와 같이 확률적으로 변동하는 변수를 확률 변수라고 합니다. 또한 여기서 확률 변수가 실제로 취하는 값을 실현 값이라고합니다.
$
P(X = x) =\frac{1}{6},\qquad x = 1,2,3,4,5,6
$
파이썬에서 실제로 주사위를 흔들어 보겠습니다.
import numpy as np
import matplotlib as mpl
np.random.seed()
prob_dice = np.array([])
dice = np.array([1,2,3,4,5,6])
dice_data = np.random.choice(dice, dice_times)
dice_times = 10000
for i in range(1,7):
p = len(dice_data[dice_data == i]) / dice_times
print(i, "の出る確率", p)
prob_dice = np.append(prob_dice, len(dice_data[dice_data == i]) / dice_times)
plt.bar(dice, prob_dice)
plt.grid(True)
다음이 결과입니다. 이번에는 10000회 주사위를 굴려 그 확률을 내고 있습니다. 결과에서 알 수 있듯이 각 눈은 $\frac{1}{6} = 0.1666...$에 근사합니다.
확률 함수와 누적 분포 함수
확률 변수에는 여러 가지가 있으며, $X$가 이산 확률 변수라고는 $X$의 가능한 값이 유한 개 또는 가산 무한 개인 경우(1, 2, 3, 4, 5... 와 같이 혼란스럽게 되어 있는 값)을 말하고, $X$가 연속 확률 변수라고는 밀도 함수를 가지는 경우를 말합니다.
이산 확률의 경우, 방금전의 주사위와 마찬가지로 각 $x$에서 확률을 생각해, 그것을 $x$의 함수로 한 것을 확률 함수라고 하고, 이하와 같이 나타낼 수 있습니다.
$
p(x) = P(X = x)\\
$
또한 확률 함수는 다음과 같은 성질을 가지고 있습니다. 여기서 여기서 $\sum$는 확률의 합계를 나타냅니다.
$
p(x)\ge 0,\qquad\forall x\\
\sum_{x}^{} p(x) = 1
$
확률 함수의 누적 합을 취한 것을 누적 분포 함수 또는 분포 함수라고합니다. 또한 분포 함수에는 다음과 같은 성질이 있으며 단조성이나 우연속성 등의 성질을 가지고 있습니다.
$
F(x) = P(X\le x) =\sum_{y\le x} p(y)\\
(1)\quad\lim_{n\to -\infty}F(x) = 0\\
(2)\quad\forall x,y\in\mathbb{R}(실수)이면\\
\qquad F(x)\ge F(y),\quad F(x) =\lim_{\varepsilon\to 0}F(x +\varepsilon)\\
(3)\quad\lim_{n\to +\infty}F(x) = 1
$
여기서 $\forall x$에서 $F(X)$ 는 오른쪽 연속( $F(X+) = F(X)$ 로 나타낸다.)이며, $x_n$ 는 단조롭게 감소하여 수렴하는 수열이라고 하면 $\lim_{x_n\to +\infty}F(x_n) = F(x)$ 입니다. 여기서 $x+$는 양의 방향에서 단조롭게 감소하여 $x$로 수렴하는 것을 보여줍니다. 그러면 다음과 같이 $X$의 누적 분포 함수의 차이를 취하면 확률 함수를 구할 수 있습니다.
$
p(x) = F(x) -\lim_{x_n\to x-} F(x_n) = F(x) - F(x-)
$
파이썬에서 누적 분포를 구현하면 다음과 같습니다.
import numpy as np
import matplotlib as mpl
from scipy.stats import norm
import matplotlib.pyplot as plt
x = np.arange(0,3000)
y = norm.cdf(x, loc=1500, scale=500)
plt.plot(x,y)
plt.grid(True)
plt.xlabel("value")
plt.ylabel("possibility")
Reference
이 문제에 관하여(기초에서 수리 통계 확률 변수), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다
https://qiita.com/chomachoma/items/fb901083ae0356bd9710
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념
(Collection and Share based on the CC Protocol.)
import numpy as np
import matplotlib as mpl
np.random.seed()
prob_dice = np.array([])
dice = np.array([1,2,3,4,5,6])
dice_data = np.random.choice(dice, dice_times)
dice_times = 10000
for i in range(1,7):
p = len(dice_data[dice_data == i]) / dice_times
print(i, "の出る確率", p)
prob_dice = np.append(prob_dice, len(dice_data[dice_data == i]) / dice_times)
plt.bar(dice, prob_dice)
plt.grid(True)
확률 변수에는 여러 가지가 있으며, $X$가 이산 확률 변수라고는 $X$의 가능한 값이 유한 개 또는 가산 무한 개인 경우(1, 2, 3, 4, 5... 와 같이 혼란스럽게 되어 있는 값)을 말하고, $X$가 연속 확률 변수라고는 밀도 함수를 가지는 경우를 말합니다.
이산 확률의 경우, 방금전의 주사위와 마찬가지로 각 $x$에서 확률을 생각해, 그것을 $x$의 함수로 한 것을 확률 함수라고 하고, 이하와 같이 나타낼 수 있습니다.
$
p(x) = P(X = x)\\
$
또한 확률 함수는 다음과 같은 성질을 가지고 있습니다. 여기서 여기서 $\sum$는 확률의 합계를 나타냅니다.
$
p(x)\ge 0,\qquad\forall x\\
\sum_{x}^{} p(x) = 1
$
확률 함수의 누적 합을 취한 것을 누적 분포 함수 또는 분포 함수라고합니다. 또한 분포 함수에는 다음과 같은 성질이 있으며 단조성이나 우연속성 등의 성질을 가지고 있습니다.
$
F(x) = P(X\le x) =\sum_{y\le x} p(y)\\
(1)\quad\lim_{n\to -\infty}F(x) = 0\\
(2)\quad\forall x,y\in\mathbb{R}(실수)이면\\
\qquad F(x)\ge F(y),\quad F(x) =\lim_{\varepsilon\to 0}F(x +\varepsilon)\\
(3)\quad\lim_{n\to +\infty}F(x) = 1
$
여기서 $\forall x$에서 $F(X)$ 는 오른쪽 연속( $F(X+) = F(X)$ 로 나타낸다.)이며, $x_n$ 는 단조롭게 감소하여 수렴하는 수열이라고 하면 $\lim_{x_n\to +\infty}F(x_n) = F(x)$ 입니다. 여기서 $x+$는 양의 방향에서 단조롭게 감소하여 $x$로 수렴하는 것을 보여줍니다. 그러면 다음과 같이 $X$의 누적 분포 함수의 차이를 취하면 확률 함수를 구할 수 있습니다.
$
p(x) = F(x) -\lim_{x_n\to x-} F(x_n) = F(x) - F(x-)
$
파이썬에서 누적 분포를 구현하면 다음과 같습니다.
import numpy as np
import matplotlib as mpl
from scipy.stats import norm
import matplotlib.pyplot as plt
x = np.arange(0,3000)
y = norm.cdf(x, loc=1500, scale=500)
plt.plot(x,y)
plt.grid(True)
plt.xlabel("value")
plt.ylabel("possibility")
Reference
이 문제에 관하여(기초에서 수리 통계 확률 변수), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/chomachoma/items/fb901083ae0356bd9710텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)