두 비율의 비교: 매개 변수 방법 (Z - test) 과 비 매개 변수 방법 (chi - square test)

Source: http://www.r-bloggers.com/comparison-of-two-proportions-parametric-z-test-and-non-parametric-chi-squared-methods/
 
다음 문 제 를 고려 한 예.도박 회사 의 모든 사람들 은 사용자 가 사 기 를 치고 있 는 지 검증 하고 싶 어 한다.이 를 위해 그 는 한 게이머 의 성공 횟수 와 한 직원 의 성공 횟수 를 비교 해 사기 여 부 를 확인 하고 싶 었 다.한 달 동안 유 저 는 74 번 의 도박 을 하여 30 번 을 이 겼 다.이 직원 은 같은 기간 103 차례 도박 을 해 65 차례 나 이 겼 다.당신 의 고객 은 사기꾼 입 니까?
이러한 문 제 는 두 가지 다른 방법 으로 해결 할 수 있다. 매개 변수 방법 과 비 매개 변수 방법 을 사용 할 수 있다.
* 매개 변수 방법의 해결 방안: Z - test
만약 에 다음 과 같은 두 가지 가설 을 할 수 있다 면 Z - test 를 사용 할 수 있다. 성공 할 확률 은 0.5 에 가깝다.도박 을 하 는 횟수 가 매우 높다.이 조건 들 이 성립 된다 고 가정 하 다.R 에서 Z 의 값 을 계산 하 는 함수 가 없 기 때문에 우 리 는 수학 공식 을 기억 한 다음 에 해당 하 는 함 수 를 만 들 었 다.
$$Z=\frac{\frac{x_1}{n_1}-\frac{x_2}{n_s}}{\sqrt{\widehat{p}(1-\widehat{p})(\frac{1}{n_1}+\frac{1}{n_2})}}$$
z.prop = function(x1,x2,n1,n2){
  numerator = (x1/n1) - (x2/n2)
  p.common = (x1+x2) / (n1+n2)
  denominator = sqrt(p.common * (1-p.common) * (1/n1 + 1/n2))
  z.prop.ris = numerator / denominator
  return(z.prop.ris)
}

Z. prop 함 수 는 Z 의 값 을 계산 하고 성공 수 (x1 과 x2) 와 도박 의 총 횟수 (n1 과 n2) 를 입력 합 니 다.우 리 는 문제 중의 데 이 터 를 이 함수 에 대 입 합 니 다.
z.prop(30, 65, 74, 103)
[1] -2.969695

우리 가 얻 은 z 수 치 는 조사 표 에서 얻 은 z 수치 보다 크다. 그러면 우 리 는 이사 가 주목 하 는 게이머 가 확실히 사기꾼 이 라 고 논단 한다. 왜냐하면 그 성공 확률 이 비 사기 사용자 보다 높 기 때문이다.
=====================================================
* 비 매개 변수 방법의 해결 방안: Chi - squared test
만약 지금 문제 데이터 에 대해 어떠한 가설 도 할 수 없다 면 두 가지 분 포 를 Gauss 분포 와 비슷 하 게 할 수 없다.우 리 는 chi - square test 로 이러한 문 제 를 해결 할 것 입 니 다. 여 기 는 2X2 의 열 연결 표 (contingency table) 를 사용 할 것 입 니 다.R 에 함수 prop. test 가 있 습 니 다:
prop.test(x = c(30, 65), n = c(74, 103), correct = FALSE)

    2-sample test for equality of proportions without continuity correction

data: c(30, 65) out of c(74, 103)
X-squared = 8.8191, df = 1, p-value = 0.002981
alternative hypothesis: two.sided
95 percent confidence interval:
  -0.37125315 -0.08007196
sample estimates:
prop 1     prop 2
0.4054054  0.6310680

prop. test 함수 계산 chi - square 값, 입력 매개 변 수 는 성공 값 (벡터 x 중) 과 총 노력 수 (벡터 n 중) 입 니 다.벡터 x 와 n 도 미리 설명 한 다음 에 함 수 를 호출 할 수 있 습 니 다: prop. test (x, n, correct = FALSE).
샘플 의 경우 (n 값 이 비교적 작 음) correct = TRUE 를 지정 하여 chi - square 를 continuity of Yates 를 기반 으로 계산 해 야 합 니 다.
prop.test(x = c(30, 65), n = c(74, 103), correct=TRUE)

    2-sample test for equality of proportions with continuity correction

data: c(30, 65) out of c(74, 103)
X-squared = 7.9349, df = 1, p-value = 0.004849
alternative hypothesis: two.sided
95 percent confidence interval:
  -0.38286428 -0.06846083
sample estimates:
prop 1     prop 2
0.4054054  0.6310680

상기 두 가지 상황 에서 우리 가 얻 은 p - value 는 모두 0.05 보다 작 기 때문에 우 리 는 같은 가설 을 거절 하기 때문에 이 사용 자 는 사기꾼 이다.확인 하기 위해 서 우리 가 계산 한 chi - square 값 과 검사 표 의 chi - square 값 을 비교 하여 R 에서 계산 한 것 은:
qchisq(0.950, 1)
[1] 3.841459

함수 qchisq 는 알파 와 자유 도 를 입력 한 후 얻 은 chi - square 값 을 계산 합 니 다.이전에 계 산 된 chi - square 가 여기 서 계 산 된 검사 표 chi - square 보다 크기 때문에 우 리 는 null hypothesis H0 을 거절 하 는 것 을 논단 합 니 다.

좋은 웹페이지 즐겨찾기