표본 평균의 표준 편차의 분포 검증【통계 검정 2급·모집단의 파라미터 미지의 검정·표본 평균의 상측 확률】

통계 검정 2 급으로 표본 평균에 관한 문제가 나옵니다만, 그 하나에
"표본 평균의 편차 (표준 편차)는
\frac{population\ sd}{\sqrt{sample\ size}} 



따라

라고합니다.
이것을 확인하십시오.

먼저 결론에서 보면 표본 평균은 모집단 평균에서 양의 방향으로 어긋나거나 음의 방향으로 어긋나기도 한다.
그러나 표본은 모집단 평균 주변에서 (애매한 표현이지만) 멀리 떨어지는 것은 별로 없다.
따라서 모집단의 표준편차를 샘플 사이즈로 나눈 정도의 범위로 줄이는 것입니다.
한편, 표본 평균은 모집단 평균 근처에서 추출될 확률이 높기 때문에,
표본 평균은 모집단 평균에 가까운 값입니다.

검증


n=10000
m=100
s=30
hist(rnorm(n, m, s))



이러한 정규 분포로부터 샘플 사이즈 100의 시료를 만든다.
그 표본의 평균 분포를 확인한다.
norm_data <- rnorm(n, m, s)

bind_mean <- NULL
bind_sd <- NULL

for(i in 1:100000){

set_number <- sample(n)
group_1 <- norm_data[set_number[1:100]]

sample_mean <- mean(group_1)
sample_sd <- sd(group_1)

bind_mean <- c(bind_mean, sample_mean)
bind_sd <- c(bind_sd, sample_sd)
}

par(mfrow=c(2, 1))
hist(rnorm(n, m, s),xlim=c(0, 200), main = paste0("population sd is ", s))
hist(bind_mean, xlim=c(0, 200), main = paste0("sample mean sd is ", round(sd(bind_mean), 3)))




확실히 모집단의 평균에 가까운 값 주변에 흩어져 있다.
표본 평균의 분산을 계산으로 구해 보면, 2.975가 되었다.
\frac{population\ sd}{\sqrt{sample\ size}} 

가 성립되어 있는가.
> s / sqrt(100)
[1] 3

원래 창조한 모집단의 표준편차는 30이고, 샘플 사이즈 100의 제곱근은 10이므로,
30으로 나누는 10이므로 3으로 계산된다.
2.975는 가까운 값을 취한다고 할 수 있다.

덧붙여서 표본 평균은



히스토그램에서 확인해 이미 '모집단 평균'과 '여러 개의 표본 평균의 평균'은 가까운 값으로 되어 있는 것처럼 보이지만 만약을 위해.
> m
[1] 100
> mean(sample_mean)
[1] 101.4024

이러한 분포가 발견되었기 때문에 모집단의 파라미터가 미지의 때의 검정을 할 수 있게 된 것입니다.

어떤 시간에 사용합니까?



예로서 이런 문제를 사용한다.

전국의 테스트 데이터로부터 산출한 모수에 따르면, 점수는 정규 분포에 따라 평균 50 표준 편차 10이었다. (모 평균, 모 표준 편차가 알려져 있음)
5명의 테스트 점수의 평균이 52점 이상이 될 확률은? (샘플 평균)

여기서 주의해야 할 것은 '5명의 평균'이라는 곳.
단 1명의 시험 응시자가 52점 이상을 취할 확률은? 라고 물으면 순수하게 표준 정규 분포로 변환하여 Z 점수를 낸다.

표준 정규 분포의 상부 확률의 표를 보면서 Z 스코어의 위치를 ​​조사하여 확률 (문제의 대답)을 얻는다.
Zscore=\frac{x-\mu}{\sigma}

하지만 '5명의 평균'에 대해 말할 때에는 5명 중 높은 점을 취하는 사람, 낮은 점을 취하는 사람이 랜덤하게 섞인 그 전제로 52점이 될 확률을 듣고 있다.
즉, 5명의 표본평균을 표준정규분포로 고치기 위해서는 표본표준편차로 나눠야 한다.
본 기사에서 쓴 바와 같이, 표본 평균의 표준 편차는 샘플 크기에 영향을 받기 때문에,
Zscore=\frac{\bar{x}-\mu}{\frac{\sigma}{\sqrt{n}}}

와 계산할 필요가 있다.
여기까지 계산해 버리면, 표준 정규 분포에 따른 Z스코어가 되었으므로 상측 확률의 Z스코어표와 비교해 대답을 얻으면 된다.

이상

좋은 웹페이지 즐겨찾기