두 비율의 비교: 매개 변수 방법 (Z - test) 과 비 매개 변수 방법 (chi - square test)
다음 문 제 를 고려 한 예.도박 회사 의 모든 사람들 은 사용자 가 사 기 를 치고 있 는 지 검증 하고 싶 어 한다.이 를 위해 그 는 한 게이머 의 성공 횟수 와 한 직원 의 성공 횟수 를 비교 해 사기 여 부 를 확인 하고 싶 었 다.한 달 동안 유 저 는 74 번 의 도박 을 하여 30 번 을 이 겼 다.이 직원 은 같은 기간 103 차례 도박 을 해 65 차례 나 이 겼 다.당신 의 고객 은 사기꾼 입 니까?
이러한 문 제 는 두 가지 다른 방법 으로 해결 할 수 있다. 매개 변수 방법 과 비 매개 변수 방법 을 사용 할 수 있다.
* 매개 변수 방법의 해결 방안: Z - test
만약 에 다음 과 같은 두 가지 가설 을 할 수 있다 면 Z - test 를 사용 할 수 있다. 성공 할 확률 은 0.5 에 가깝다.도박 을 하 는 횟수 가 매우 높다.이 조건 들 이 성립 된다 고 가정 하 다.R 에서 Z 의 값 을 계산 하 는 함수 가 없 기 때문에 우 리 는 수학 공식 을 기억 한 다음 에 해당 하 는 함 수 를 만 들 었 다.
$$Z=\frac{\frac{x_1}{n_1}-\frac{x_2}{n_s}}{\sqrt{\widehat{p}(1-\widehat{p})(\frac{1}{n_1}+\frac{1}{n_2})}}$$
z.prop = function(x1,x2,n1,n2){
numerator = (x1/n1) - (x2/n2)
p.common = (x1+x2) / (n1+n2)
denominator = sqrt(p.common * (1-p.common) * (1/n1 + 1/n2))
z.prop.ris = numerator / denominator
return(z.prop.ris)
}
Z. prop 함 수 는 Z 의 값 을 계산 하고 성공 수 (x1 과 x2) 와 도박 의 총 횟수 (n1 과 n2) 를 입력 합 니 다.우 리 는 문제 중의 데 이 터 를 이 함수 에 대 입 합 니 다.
z.prop(30, 65, 74, 103)
[1] -2.969695
우리 가 얻 은 z 수 치 는 조사 표 에서 얻 은 z 수치 보다 크다. 그러면 우 리 는 이사 가 주목 하 는 게이머 가 확실히 사기꾼 이 라 고 논단 한다. 왜냐하면 그 성공 확률 이 비 사기 사용자 보다 높 기 때문이다.
=====================================================
* 비 매개 변수 방법의 해결 방안: Chi - squared test
만약 지금 문제 데이터 에 대해 어떠한 가설 도 할 수 없다 면 두 가지 분 포 를 Gauss 분포 와 비슷 하 게 할 수 없다.우 리 는 chi - square test 로 이러한 문 제 를 해결 할 것 입 니 다. 여 기 는 2X2 의 열 연결 표 (contingency table) 를 사용 할 것 입 니 다.R 에 함수 prop. test 가 있 습 니 다:
prop.test(x = c(30, 65), n = c(74, 103), correct = FALSE)
2-sample test for equality of proportions without continuity correction
data: c(30, 65) out of c(74, 103)
X-squared = 8.8191, df = 1, p-value = 0.002981
alternative hypothesis: two.sided
95 percent confidence interval:
-0.37125315 -0.08007196
sample estimates:
prop 1 prop 2
0.4054054 0.6310680
prop. test 함수 계산 chi - square 값, 입력 매개 변 수 는 성공 값 (벡터 x 중) 과 총 노력 수 (벡터 n 중) 입 니 다.벡터 x 와 n 도 미리 설명 한 다음 에 함 수 를 호출 할 수 있 습 니 다: prop. test (x, n, correct = FALSE).
샘플 의 경우 (n 값 이 비교적 작 음) correct = TRUE 를 지정 하여 chi - square 를 continuity of Yates 를 기반 으로 계산 해 야 합 니 다.
prop.test(x = c(30, 65), n = c(74, 103), correct=TRUE)
2-sample test for equality of proportions with continuity correction
data: c(30, 65) out of c(74, 103)
X-squared = 7.9349, df = 1, p-value = 0.004849
alternative hypothesis: two.sided
95 percent confidence interval:
-0.38286428 -0.06846083
sample estimates:
prop 1 prop 2
0.4054054 0.6310680
상기 두 가지 상황 에서 우리 가 얻 은 p - value 는 모두 0.05 보다 작 기 때문에 우 리 는 같은 가설 을 거절 하기 때문에 이 사용 자 는 사기꾼 이다.확인 하기 위해 서 우리 가 계산 한 chi - square 값 과 검사 표 의 chi - square 값 을 비교 하여 R 에서 계산 한 것 은:
qchisq(0.950, 1)
[1] 3.841459
함수 qchisq 는 알파 와 자유 도 를 입력 한 후 얻 은 chi - square 값 을 계산 합 니 다.이전에 계 산 된 chi - square 가 여기 서 계 산 된 검사 표 chi - square 보다 크기 때문에 우 리 는 null hypothesis H0 을 거절 하 는 것 을 논단 합 니 다.
이 내용에 흥미가 있습니까?
현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:
다양한 언어의 JSONJSON은 Javascript 표기법을 사용하여 데이터 구조를 레이아웃하는 데이터 형식입니다. 그러나 Javascript가 코드에서 이러한 구조를 나타낼 수 있는 유일한 언어는 아닙니다. 저는 일반적으로 '객체'{}...
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.