수치 실험을 통해 t분포를 얻다
8751 단어 통계학
분포
형상은 거의 정적 분포와 같다.
t분포는 모분산을 모를 때 비편차 분산과 모평균 표준화된 견본의 평균 확률 분포를 말한다.
어머니 분산 $\sigma^2달러/어머니 평균 $\mu
샘플 요소 $xi$N(\mu,\sigma^2)은 $N을 정규로 배포합니다.
가령 어머니가 분산되었다는 것을 알았을 때 어머니 평균 $\sigma^2달러\mu달러 표준화된 견본 평균치$\bar{x}달러(주요소수n)의 확률로 $N(\mu,\sigma^2/n)달러로 분포했다.
그렇다면 모분산을 모르면 샘플의 편차 분산과 모평균 표준화로 샘플 평균치의 확률 분포는 어떻게 될까
보태다
어머니의 평균치를 알고 있다고 가정하는 부분에 끌릴 수도 있다.
검정 문제에서 어머니의 평균치가 가정이 없는 범위 내에 있다고 가정한다.
추정 문제에서 모평균은 변수이고 모평균을 추측하기 위해 t분포를 사용한다.
앞에서 말한 바와 같이 t분포에서 모평 균일치는 확정값으로 처리할 수 있다.
수치 시험
상술한 내용에 근거하여
샘플 평균값 $\bar{x}$(요소수 n)의 확률 분포
어머니 분산 $\sigma^2달러·어머니 평균 $\mu달러 표준화
상술한 내용에 근거하여
샘플 평균값 $\bar{x}$(요소수 n)의 확률 분포
어머니 분산 $\sigma^2달러·어머니 평균 $\mu달러 표준화
해보자.
import numpy as np
import matplotlib.pyplot as plt
import math
n_a = 3
sample = 1000000
mu_a = 1
sigma = 1
a = np.random.normal(
loc = mu_a, # 平均
scale = sigma, # 標準偏差
size = (sample ,n_a),# 出力配列のサイズ
)
"""
不偏分散
"""
hoge = a - np.mean(a,axis=1,keepdims=True)
hoge = np.power(hoge,2) #要素二乗
unbiased_variance_a = np.sum(hoge,axis =1) / (n_a - 1) #不偏分散なので n-1 で割る
"""
平均
"""
average_a = np.mean(a,axis=1,keepdims=False)
"""
avrage_a の標準化
"""
normed_average = (average_a - mu_a) / (unbiased_variance_a /math.sqrt(n_a) )
"""
母分散で標準化
"""
normed_average_population = (average_a - mu_a) / (sigma/math.sqrt(n_a) )
fig, ax = plt.subplots()
ax.hist(normed_average,bins=200,range=(-20,20),alpha = 0.5,label = "unbiased_variance")
ax.hist(normed_average_population,bins=200,range=(-20,20),alpha = 0.5,label = "pupulation_variance")
ax.legend()
ax.set_xlim(-20,20)
plt.show()
편차가 없는 분산 방법을 사용하면 가로로 확장될 수 있음을 알 수 있다.
이것은 정적 분포와 t분포를 비교할 때의 특징이다.
표본의 요소수를 늘리면 두 개의 연속이 끊임없이 가까워진다.
n = 2
n = 3
n = 5
n = 8
n = 10
n = 20
n = 100
n이 100이 되면 완전히 일치한다.
Reference
이 문제에 관하여(수치 실험을 통해 t분포를 얻다), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/hiRina/items/70699696ebfcc3121a29텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)