가설 검정 이해

가설 검정

한마디로 정리하면 "부분에서 전체 (모집단)를 추리한다"



목적 모집단 추정

케이스(이미, 모집단의 평균·분산을 알고 있는 경우)

1 가설(모집단의 추측)을 세운다

ex "N장의 동전을 던져 10회 표가 나왔다"라는 데이터(결과)가 있다.
 
Q 던진 N장의 횟수를 추정한다고 해서, 적당한 수는?

2(구간에서) 검정한다

보통으로 (확률적으로) 생각하면 20장(2분의 1)
· · 그러나 결과는 항상 확률대로가 아니라 장미

따라서 +1,2 21장, 22장 or -1,-2 19장, 18장으로 추정해도 타당하다고 할 수 있다.

그럼 · ·
Q 모수 N의 추정으로서 어디까지가 타당한 수치라고 할 수 있을까?
이것에 답을 내는 것이 「구간 추정」이라고 하는 “검정”의 기본적인 방법이다.

이를 위해 95 %의 예언적 중간 구간 (= 표준 편차 + = 1.96 범위) 내에 있는지 확인합니다.

표준 정규 분포로 변환하여 다음 수식을 풀면 알고 싶은 범위를 낼 수 있다.



이것을 풀면,
(N=16의 경우) 4.08 ≦ X ≦ 11.92
된다.

이 수치로부터 말할 수 있는 것은,
(N=16) 즉 16장 동전을 던졌을 때,   
표가 나오는 매수로서 4.08장~11.92장의 범위가 될 확률이 95%이다.

이번 데이터는 10장 표가 나왔을 때
→95%의 범위내이므로, 16장 던져 표 10장 나오는 것은, 보통으로 일어나는 일! (=타당)라고 말할 수 있다.

만약 N=36장의 경우는 계산해 보면 12.12 ≤ X ≤ 23.88
이 범위에서 벗어난다. 즉, 예상외의 일이 일어났다고 말할 수 있다.

이 결과에서 말할 수있는 두 가지

1 모집단에 대한 가설(N=36장)은 옳다. 하지만, 상정외(5%)의 드물게 일어나지 않는 것이 일어나 버렸다.

2 모집단에 대한 가설은 잘못되어 있다

여기서, 통계학에서는 2가 선택된다. (구간 추정의 수법을 사용하면 95%로 우연히 예상이 벗어날 리스크는 알고 있는데 검정하고 있기 때문)

N = 36은 실수이므로 가설을 기각합니다.

즉, N = 16 매는 합리적이지만 N = 36 매는 가정하지 않습니다. 라는 결론을 내립니다.

처음에는 "검정"의 이해에 시달렸지만 정리해 보면
의외로 로지컬한 탐정의(컴퓨터)의 논리같고, 이해해 오면 재미있다고 생각합니다!
수식적 이해를 포함하여 앞으로 깊어지고 싶습니다.

좋은 웹페이지 즐겨찾기