수치 실험을 통해 t분포를 얻다

8751 단어 통계학

분포


형상은 거의 정적 분포와 같다.
t분포는 모분산을 모를 때 비편차 분산과 모평균 표준화된 견본의 평균 확률 분포를 말한다.
어머니 분산 $\sigma^2달러/어머니 평균 $\mu
샘플 요소 $xi$N(\mu,\sigma^2)은 $N을 정규로 배포합니다.
가령 어머니가 분산되었다는 것을 알았을 때 어머니 평균 $\sigma^2달러\mu달러 표준화된 견본 평균치$\bar{x}달러(주요소수n)의 확률로 $N(\mu,\sigma^2/n)달러로 분포했다.
그렇다면 모분산을 모르면 샘플의 편차 분산과 모평균 표준화로 샘플 평균치의 확률 분포는 어떻게 될까

보태다


어머니의 평균치를 알고 있다고 가정하는 부분에 끌릴 수도 있다.
검정 문제에서 어머니의 평균치가 가정이 없는 범위 내에 있다고 가정한다.
추정 문제에서 모평균은 변수이고 모평균을 추측하기 위해 t분포를 사용한다.
앞에서 말한 바와 같이 t분포에서 모평 균일치는 확정값으로 처리할 수 있다.

수치 시험


상술한 내용에 근거하여
샘플 평균값 $\bar{x}$(요소수 n)의 확률 분포
어머니 분산 $\sigma^2달러·어머니 평균 $\mu달러 표준화
  • 견본의 불편차 색산과 모평 균일치로 표준화
  • 이 두 분포는 변화가 일어날 것 같다.
    해보자.
    import numpy as np
    import matplotlib.pyplot as plt
    import math
    
    n_a = 3
    sample = 1000000
    mu_a = 1
    sigma = 1
    
    a = np.random.normal(
        loc   = mu_a,      # 平均
        scale = sigma,      # 標準偏差
        size  = (sample ,n_a),# 出力配列のサイズ
    )
    
    
    
    
    """
    不偏分散
    """
    hoge = a - np.mean(a,axis=1,keepdims=True)
    hoge = np.power(hoge,2)     #要素二乗
    unbiased_variance_a = np.sum(hoge,axis =1) / (n_a - 1)  #不偏分散なので n-1 で割る
    
    """
    平均
    """
    average_a  =  np.mean(a,axis=1,keepdims=False)
    
    """
    avrage_a の標準化
    """
    normed_average = (average_a - mu_a) / (unbiased_variance_a /math.sqrt(n_a) ) 
    
    
    """
    母分散で標準化
    """
    normed_average_population = (average_a - mu_a) / (sigma/math.sqrt(n_a) ) 
    
    
    fig, ax = plt.subplots()
    
    ax.hist(normed_average,bins=200,range=(-20,20),alpha = 0.5,label = "unbiased_variance")
    ax.hist(normed_average_population,bins=200,range=(-20,20),alpha = 0.5,label = "pupulation_variance")
    
    ax.legend()
    ax.set_xlim(-20,20)
    
    plt.show()
    

    편차가 없는 분산 방법을 사용하면 가로로 확장될 수 있음을 알 수 있다.
    이것은 정적 분포와 t분포를 비교할 때의 특징이다.
    표본의 요소수를 늘리면 두 개의 연속이 끊임없이 가까워진다.

    n = 2



    n = 3



    n = 5



    n = 8



    n = 10



    n = 20



    n = 100



    n이 100이 되면 완전히 일치한다.

    좋은 웹페이지 즐겨찾기