시간 서열 분석 6 허위 회귀와 공화분
11957 단어 statsmodelsPython
1. 개요
다섯째 을 바탕으로 계속 학습한다.
2. 거짓 귀환
정의
두 개의 무관한 단위 루트 과정 $xt$y정보t=\alpha+\beta x_t+\epsilon_t$회귀 시, $xt$y의미 있어 보이는 현상을 가귀환이라고 한다.
확인
# データ生成
sigma_x, sigma_y = 1, 2
T = 10000
xt = np.cumsum(np.random.randn(T) * sigma_x).reshape(-1, 1)
yt = np.cumsum(np.random.randn(T) * sigma_y).reshape(-1, 1)
from sklearn.linear_model import LinearRegression
reg = LinearRegression().fit(xt,yt)
print('R-squared : ',reg.score(xt,yt))
print('coef : ',reg.coef_, 'intercept', reg.intercept_)
R-squared : 0.4794854506874714coef : [[-0.62353254]] intercept [-24.27600549]
import statsmodels.api as sm
reg = sm.OLS(yt,sm.add_constant(xt,prepend=False)).fit()
reg.summary()
Dep. Variable:y
R-squared:
0.479
Model:
OLS
Adj. R-squared:
0.479
Method:
Least Squares
F-statistic:
9210.
Date:
Tue, 07 Jan 2020
Prob (F-statistic):
0.00
Time:
22:36:57
Log-Likelihood:
-51058.
No. Observations:
10000
AIC:
1.021e+05
Df Residuals:
9998
BIC:
1.021e+05
Df Model:
1
Covariance Type:
nonrobust
coef
std err
t
P>abs(t)
[0.025
0.975]
const
-24.2760
0.930
-26.113
0.000
-26.098
-22.454
x1
-0.6235
0.006
-95.968
0.000
-0.636
-0.611
회피법
모델에 라그 변수 포함
x_t, y_t, y_t_1 = xt[1:], yt[1:], yt[:-1]
X = np.column_stack((x_t, y_t_1))
reg = sm.OLS(y_t,sm.add_constant(X)).fit()
reg.summary()
Dep. Variable:y
R-squared:
0.999
Model:
OLS
Adj. R-squared:
0.999
Method:
Least Squares
F-statistic:
3.712e+06
Date:
Thu, 09 Jan 2020
Prob (F-statistic):
0.00
Time:
22:12:59
Log-Likelihood:
-21261.
No. Observations:
9999
AIC:
4.253e+04
Df Residuals:
9996
BIC:
4.255e+04
Df Model:
2
Covariance Type:
nonrobust
coef
std err
t
P>abs(t)
[0.025
0.975]
const
-0.0815
0.049
-1.668
0.095
-0.177
0.014
x1
-0.0004
0.000
-0.876
0.381
-0.001
0.000
x2
0.9989
0.001
1964.916
0.000
0.998
1.000
단위 뿌리 과정의 차이를 취하여 정상 과정 후 회귀하다
x_t, y_t = np.diff(xt.flatten()).reshape(-1,1), np.diff(yt.flatten()).reshape(-1,1)
reg = sm.OLS(y_t,sm.add_constant(x_t)).fit()
reg.summary()
Dep. Variable:y
R-squared:
0.000
Model:
OLS
Adj. R-squared:
0.000
Method:
Least Squares
F-statistic:
3.297
Date:
Thu, 09 Jan 2020
Prob (F-statistic):
0.0694
Time:
22:33:26
Log-Likelihood:
-21262.
No. Observations:
9999
AIC:
4.253e+04
Df Residuals:
9997
BIC:
4.254e+04
Df Model:
1
Covariance Type:
nonrobust
coef
std err
t
P>abs(t)
[0.025
0.975]
const
-0.0138
0.020
-0.681
0.496
-0.054
x1
-0.0374
0.021
-1.816
0.069
-0.078
3. 공화분
정의
인상.
그린 표현의 정리
Reference
이 문제에 관하여(시간 서열 분석 6 허위 회귀와 공화분), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/asys/items/ea24953d2b3fc0758acb텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)