가설 검정 이해
한마디로 정리하면 "부분에서 전체 (모집단)를 추리한다"
목적 모집단 추정
케이스(이미, 모집단의 평균·분산을 알고 있는 경우)
1 가설(모집단의 추측)을 세운다
ex "N장의 동전을 던져 10회 표가 나왔다"라는 데이터(결과)가 있다.
Q 던진 N장의 횟수를 추정한다고 해서, 적당한 수는?
2(구간에서) 검정한다
보통으로 (확률적으로) 생각하면 20장(2분의 1)
· · 그러나 결과는 항상 확률대로가 아니라 장미
따라서 +1,2 21장, 22장 or -1,-2 19장, 18장으로 추정해도 타당하다고 할 수 있다.
그럼 · ·
Q 모수 N의 추정으로서 어디까지가 타당한 수치라고 할 수 있을까?
이것에 답을 내는 것이 「구간 추정」이라고 하는 “검정”의 기본적인 방법이다.
이를 위해 95 %의 예언적 중간 구간 (= 표준 편차 + = 1.96 범위) 내에 있는지 확인합니다.
표준 정규 분포로 변환하여 다음 수식을 풀면 알고 싶은 범위를 낼 수 있다.
이것을 풀면,
(N=16의 경우) 4.08 ≦ X ≦ 11.92
된다.
이 수치로부터 말할 수 있는 것은,
(N=16) 즉 16장 동전을 던졌을 때,
표가 나오는 매수로서 4.08장~11.92장의 범위가 될 확률이 95%이다.
이번 데이터는 10장 표가 나왔을 때
→95%의 범위내이므로, 16장 던져 표 10장 나오는 것은, 보통으로 일어나는 일! (=타당)라고 말할 수 있다.
만약 N=36장의 경우는 계산해 보면 12.12 ≤ X ≤ 23.88
이 범위에서 벗어난다. 즉, 예상외의 일이 일어났다고 말할 수 있다.
이 결과에서 말할 수있는 두 가지
1 모집단에 대한 가설(N=36장)은 옳다. 하지만, 상정외(5%)의 드물게 일어나지 않는 것이 일어나 버렸다.
2 모집단에 대한 가설은 잘못되어 있다
여기서, 통계학에서는 2가 선택된다. (구간 추정의 수법을 사용하면 95%로 우연히 예상이 벗어날 리스크는 알고 있는데 검정하고 있기 때문)
N = 36은 실수이므로 가설을 기각합니다.
즉, N = 16 매는 합리적이지만 N = 36 매는 가정하지 않습니다. 라는 결론을 내립니다.
처음에는 "검정"의 이해에 시달렸지만 정리해 보면
의외로 로지컬한 탐정의(컴퓨터)의 논리같고, 이해해 오면 재미있다고 생각합니다!
수식적 이해를 포함하여 앞으로 깊어지고 싶습니다.
Reference
이 문제에 관하여(가설 검정 이해), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/sicentistengineer01/items/0a7e3a0bf00c36f414f1텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)