베어스 통계 가설 감정

베어스 통계 가설 감정


이 글은 베이스 통계에서 가설 감정을 하는 방법을 소개하고 마지막으로python을 실제 사용하여 감정을 한다.Bays통계와python은 모두 초보자이기 때문에 내용이 완비되지 않은 부분은 댓글로 남겨주세요.

1. 가설 검정은


대략적으로 말하면, 검정이 알 수 없는 인자 $\theta$구간 $I라고 가정합니다가설i$H 세우기i$, 즉 알 수 없는 매개 변수 $\theta 구간 $I$를 가정할 수 있습니다이것은 i$i에 속하는지 분석하는 방법입니다.
베어스 통계는 주로 다음과 같은 세 가지 기법의 대표성이 있다.
  • 사후 확률에 근거한 감정
  • 후면 OZ 비율에 따른 인증
  • 바이스 인자에 의한 감정
  • 확률 변수 $X의 구축 밀도 함수는 $p(X)$이하이고 이벤트 $X의 발생 확률은 $P(X)$로 표시됩니다.또한 $\Omega를 표본 공간으로 하고 $A\cap B=\phi$A\bot B$A\bot B=\phi는 $A\cap B=\phi달러를 집합할 수 있음을 나타낸다.

    2. 사후 확률 감정


    사후 확률의 평가에 따라 감정한다는 생각은 매우 간단하다.예를 들면 다음과 같은 가설을 고려해 보세요.
    \left\{
    \begin{split}
        H_0: &q \in I_0 \\
        H_1: &q \in I_0 \\
        &\vdots         \\
        H_k: &q \in I_k
    \end{split}
    \right.
    
    $I i\subset\Omega 달러이며 $I i 달러는 공유할 수 있습니다.
    $이때, 이벤트 $X$이(가) 실행될 때 $H를 가정합니다.i(i=0,1\dotsk)$를 구성하는 사후 확률은 각각
     P(H_i|X) = P(\theta \in I_i|X) = \int_{I_i} p(\theta|X) d\theta
    
    .
    $P(H i| X) 달러가 1에 가깝다면 $H를 가정합니다.i$H 작음(0에 가까운) 가정을 통과한 경우i$i 기각 요령에 따라 검정할 수 있습니다.

    3. 사후 OZ비의 감정


    다음은 사용 후 아저씨비의 감정입니다.사후 확률로 감정하면 취향에 따라 가정할 수 있지만, 사용 후 OZ비례로 감정한다는 가설은 두 개에 불과하다.
    나는 아래의 가설을 고려할 것이다.
    \left\{
    \begin{split}
        H_0: q \in I_0 \\
        H_1: q \in I_1
    \end{split}
    \right.
    
    $여기는 $I 입니다.0달러 및 $I1달러는 $I입니다.0\bot I_1 , I_0\cup I_1=\Omega 달러로 설정합니다.이렇게 하면 $H0달러 및 $H1달러 중 하나는 가설이 없는 것이고, 다른 하나는 대립 가설이다.
    이후 OZ 비율
    \begin{split}
     事後オッズ比 &= \frac{P(H_0|X)}{P(H_1|X)} \\
                 &= \frac{P(\theta \in I_0|X)}{P(\theta \in I_1|X)} \\
                 &= \frac{\int_{I_0}p(\theta|X)d\theta}{\int_{I_1}p(\theta|X)d\theta}
    \end{split}
    
    달러로 정의하다.나중에 OZ가 1보다 크면 $H.작으면 $H1달러를 통과하다.
    $$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$만약에 사전분포가 어느 한 측의 가설에 매우 유리하다면 사후분포는 사전분포의 영향을 반영하여 정확하게 감정할 수 없을 것이다.예를 들면, 사실은 $H이다.1달러가 맞습니다.사전 분포가 압도적으로 0달러에 유리하다고 가정하면 달러P(H 0|X)는 실제보다 크고, 달러P(H 1|X)는 실제보다 작아 추후 제시가격이 클 수 있다.이런 일을 피하기 위해 베스 팩스로 검정하기도 한다.

    4. 베이즈 인자 감식 통과


    곧, Bays 팩스 $B{01} 달러는 다음 공식에 의해 정의됩니다.
    \begin{split} B_{01} &= 事後オッズ比 \div 事前オッズ比 \\
              &= \frac{P(H_0|X)}{P(H_1|X)} \div \frac{P(H_0)}{P(H_1)} \\
              &=\frac{\int_{I_0}p(\theta|X)d\theta}{\int_{I_1}p(\theta|X)d\theta} \div \frac{\int_{I_0}p(\theta)d\theta}{\int_{I_1}p(\theta)d\theta}
    \end{split}
    
    그렇다면 왜 이 베이즈 인자의 평가가 사후 OZ비의 검정 문제를 피할 수 있었을까.
    달러의 사전 배포 설정이 압도적인 $H0달러에 유리해 사전 OZ비는 100, 후 OZ비는 20이다.이때 사후 OZ 비율의 감정 결과는 $H입니다.0달러가 채택될 것이다.또한 신중을 기하기 위해 사후에 확립된 검정고시가 어떻게 변할지 고려해 $P(H0|X)\simeq0.95달러, 이 역시 $H0달러를 통과했다고 할 수 있죠.하지만 베이스 팩스 $B$B 계산{01}=0.2달러입니다.다음 제프리스의 평가 기준을 이용하여 베이스 인자의 값을 평가하다1/10\le0.2\le1/3달러이므로 $H를 기준으로 대립적 가정1달러를 충분히 지원할 것이다.

    [출처: https://www.slideshare.net/masarutokuoka/mcmc-35640699]
    이상의 예는 극단적이지만 실제로 베이스 인수를 사용한 감정을 통해 사용 후 OZ 때와 다른 결론을 얻을 수 있고, 베이스 인수를 사용한 감정은 사전 분포의 영향을 낮추기 때문에 잘못된 결론을 내리기 어렵다.

    5. 실제 python을 사용하여 샘플 데이터를 검정한다


    실제 검사 확률, 검사 OZ비, Bays 인자를 계산한 후 가설 감정을 실시했다.이번에 간단하게 보기 위해 우리는 베타 분포의 사전 분포를 가설하고 베누이 분포에 따른 모델에 대해 가설 감정을 실시했다.
    먼저 샘플링 데이터(data), 미리 분포된 초파라미터(a0, b0), 구간(I)을 매개 변수로 정의하고 백엔드 확률(post prob), 백엔드 아재비(post ods ratio), 바이스 인자(BF)의 함수를 되돌려준다.
    import scipy.stats as st
    
    def ppb(data, a0, b0, I):
        n = data.size
        y = data.sum()
        pre_p0 = st.beta.cdf(I[1], a0, b0) - st.beta.cdf(I[0], a0, b0)
        pre_p1 = 1 - pre_p0
        post_p0 = st.beta.cdf(I[1], y + a0, n - y + b0) - st.beta.cdf(I[0], y + a0, n - y + b0)
        post_p1 = 1 - post_p0
        post_prob = post_p0
        post_odds_ratio = post_p0 / post_p1
        BF = post_odds_ratio * pre_p1 / pre_p0
        return post_prob, post_odds_ratio, BF
    
    이어 파라미터 p=0.7의 필누이 분포에서 무작위로 데이터를 생성하여 샘플 사이즈 100의 표본을 생성한다.
    import numpy as np
    
    p = 0.7
    n = 100
    np.random.seed(0)
    data = st.bernoulli.rvs(q, size=n)
    
    이 데이터의 경우 하이퍼매개변수는
  • a 0=b0=1
  • i)a0=2,b0=5
  • u)a0=3,b0=2
  • 상황을 분석했다.귀무 가설로 사용되는 구간(I)은 I=[0.60.8]이다.
    a0 = [1,2,3]
    b0 = [1,5,2]
    I = [0.6,0.8]
    s = ['ア','イ','ウ']
    
    for i in range(len(a0)):
        a, b, c = ppb(data, a0[i], b0[i], I)
        print('{}) \n 事後確率: {:.5f} \n 事後オッズ比: {:.5f} \n ベイズファクター: {:.5f}'.format(s[i],a,b,c))
    
    실행 결과
    ア)
     事後確率: 0.79632
     事後オッズ比: 3.90973
     ベイズファクター: 15.63891
    イ)
     事後確率: 0.93228
     事後オッズ比: 13.76698
     ベイズファクター: 336.00387
    ウ)
     事後確率: 0.81888
     事後オッズ比: 4.52127
     ベイズファクター: 8.62195
    
    이에 앞서 제시프리즈가 Bays 인자에 대한 평가 기준을 검토한 결과 A)는 가설 귀속을 강력히 지지하고 B는 가설 귀속을 강력히 지지하며 u는 가설 귀속을 충분히 지지한다.p의 진가를 0.7로 설정했기 때문에 모두 타당한 결론을 얻었다고 할 수 있다.
    또한 아래의 베타 분포의 도표를 보면 i)가 사전 분포의 영향을 가장 많이 받는 것 같다.

    실제 사후 분포된 차트는 다음과 같습니다.확실히 i)는 a), u)에 비해 예분포의 영향을 더 받는 것 같다.

    그리고 가설이 없는 구간만 [0.65.0.75]로 바꾸면 결과는 다음과 같다.
    ア)
     事後確率: 0.34440
     事後オッズ比: 0.52532
     ベイズファクター: 4.72784
    イ)
     事後確率: 0.57232
     事後オッズ比: 1.33818
     ベイズファクター: 74.33720
    ウ)
     事後確率: 0.36755
     事後オッズ比: 0.58115
     ベイズファクター: 2.73401
    
    
    조건이 엄격해져 사후 확률과 사후 OZ비만으로는 판단하기 어렵지만, 베이즈 인자를 사용하면 어떤 경우든 가설 귀착을 지지하지 않는다.
    마지막으로 구간 내에 가설 구간이 [0.40.6]의 실제 값으로 귀속되지 않으면 어떤 결론을 얻을 수 있는지 실험해 봤다.
    ア)
     事後確率: 0.00019
     事後オッズ比: 0.00019
     ベイズファクター: 0.00078
    イ)
     事後確率: 0.00123
     事後オッズ比: 0.00123
     ベイズファクター: 0.00515
    ウ)
     事後確率: 0.00020
     事後オッズ比: 0.00020
     ベイズファクター: 0.00049
    77
    
    베이스 팩스를 사용할 필요는 없지만, 어떤 상황에서도 가설이 없는 것은 버려진다.

    6.마지막


    사전에 베타 분포에 분포했다고 가정하고 베르누이 분포에 따른 모델만 처리했으며 앞으로도 더 많은 모델을 처리하고 싶다.
    만약 어떤 불완전, 착오 등이 있으면 나에게 알려주세요.
    끝까지 읽어주셔서 감사합니다.

    참고 문헌


    중처조부파이썬 베이즈 통계학 입문, 조창서점, 2019년
    MCMC의 연구보고서(2020년 - 4-24년 참조)

    좋은 웹페이지 즐겨찾기