소수 샘플의 바이어스로 회귀 계수는 바뀌는가?
bias=c()
for(i in 1:500){
Nreal=i
Nnet=1000-i
d1=rnorm(Nreal,mean=190)
d2=rnorm(Nnet,mean=200)
df=data_frame(h=c(d1,d2),bias=c(rep(0,Nreal),rep(1,Nnet)))
res=lm(h~.,df) %>% summary()
bias=c(bias,as.data.frame(res$coefficients)[2,1])
}
ts.plot(bias)
summary(lm(bias~seq(1,length(bias))))
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 9.986e+00 1.015e-02 983.782 <2e-16 ***
seq(1, length(bias)) 4.130e-05 3.511e-05 1.176 0.24
라고 하는 것으로, 그다지 문제는 없다고 생각한다. n=30까지도 마찬가지.
단지, 이 케이스라면 n=30 정도 지금은 바리언스가 큰 케이스가 얼른 나온다.
Reference
이 문제에 관하여(소수 샘플의 바이어스로 회귀 계수는 바뀌는가?), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/biones/items/b1aadd659b45781d072c텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)