수치 실험을 통해 t분포를 얻다

분포

형상은 거의 정적 분포와 같다.
t분포는 모분산을 모를 때 비편차 분산과 모평균 표준화된 견본의 평균 확률 분포를 말한다.
어머니 분산 $\sigma^2달러/어머니 평균 $\mu
샘플 요소 $xi$N(\mu,\sigma^2)은 $N을 정규로 배포합니다.
가령 어머니가 분산되었다는 것을 알았을 때 어머니 평균 $\sigma^2달러\mu달러 표준화된 견본 평균치$\bar{x}달러(주요소수n)의 확률로 $N(\mu,\sigma^2/n)달러로 분포했다.
그렇다면 모분산을 모르면 샘플의 편차 분산과 모평균 표준화로 샘플 평균치의 확률 분포는 어떻게 될까

보태다

어머니의 평균치를 알고 있다고 가정하는 부분에 끌릴 수도 있다.
검정 문제에서 어머니의 평균치가 가정이 없는 범위 내에 있다고 가정한다.
추정 문제에서 모평균은 변수이고 모평균을 추측하기 위해 t분포를 사용한다.
앞에서 말한 바와 같이 t분포에서 모평 균일치는 확정값으로 처리할 수 있다.

수치 시험

상술한 내용에 근거하여
샘플 평균값 $\bar{x}$(요소수 n)의 확률 분포
어머니 분산 $\sigma^2달러·어머니 평균 $\mu달러 표준화

견본의 불편차 색산과 모평 균일치로 표준화

이 두 분포는 변화가 일어날 것 같다.
해보자.

import numpy as np
import matplotlib.pyplot as plt
import math

n_a = 3
sample = 1000000
mu_a = 1
sigma = 1

a = np.random.normal(
    loc   = mu_a,      # 平均
    scale = sigma,      # 標準偏差
    size  = (sample ,n_a),# 出力配列のサイズ
)




"""
不偏分散
"""
hoge = a - np.mean(a,axis=1,keepdims=True)
hoge = np.power(hoge,2)     #要素二乗
unbiased_variance_a = np.sum(hoge,axis =1) / (n_a - 1)  #不偏分散なので n-1　で割る

"""
平均
"""
average_a  =  np.mean(a,axis=1,keepdims=False)

"""
avrage_a　の標準化
"""
normed_average = (average_a - mu_a) / (unbiased_variance_a /math.sqrt(n_a) ) 


"""
母分散で標準化
"""
normed_average_population = (average_a - mu_a) / (sigma/math.sqrt(n_a) ) 


fig, ax = plt.subplots()

ax.hist(normed_average,bins=200,range=(-20,20),alpha = 0.5,label = "unbiased_variance")
ax.hist(normed_average_population,bins=200,range=(-20,20),alpha = 0.5,label = "pupulation_variance")

ax.legend()
ax.set_xlim(-20,20)

plt.show()