관련 및 추세

8797 단어 기타
관련 및 동향(2019/01/05)
만약 현재 다리의 변화율과 앞다리의 변화율이 상관관계가 있다면 시간 서열 데이터는 추세적이라고 할 수 있습니까?반대로 역관련 상황은 평균 회귀성인가.
상관관계가 있는 평균 회귀 도표
결론부터 써. 사실은 그렇지 않아.반증으로 우선 정관계에서 평균 회귀성의 도표를 본다.예를 들어 y=sin(x)과 같은 데이터.
%matplotlib inline
import matplotlib.pyplot as plt
import numpy as np

x = np.arange(-360, 360, 1)
y = np.sin(x / 180 * np.pi)
plt.plot(x, y)
plt.xlabel('x')
plt.ylabel('y')
plt.xticks([-360, -270, -180, -90, 0, 90, 180, 270, 360])
plt.axvline(x=0.0, color='black')
plt.axhline(y=0.0, color='black')
plt.show()

평균 컴백하는 것 같아-1.0으로 사들여 +1.0으로 매도하는 것이 백전백승 전략이다.
이어서 이 데이터의 단계를 취하여 단계차와 전 단계의 상관수를 계산한다.
diff = y[1:] - y[:-1]
diff0 = diff[1:]
diff1 = diff[:-1]
cor = np.corrcoef(diff1, diff0)[0, 1]
print('cor = ', cor)
cor =  0.9998468422340877
상관수는 거의 1.0으로 완전히 근접한 정관계이다.생각해 보아라, 이것은 당연한 것이다.인(x)이 지속적으로 상승하느냐, 계속 하락하느냐에 따라 상승에서 하락으로, 또는 하락에서 상승으로 전환하는 것은 정점에 불과하기 때문이다.
역관련 추세도
다음은 역관련 트렌드맵을 살펴보자.예를 들어 +2 및 -1의 데이터를 반복합니다.
x = np.arange(1000)
temp = np.zeros(1000)
for i in range(1000):
    if i % 2 == 0:
        temp[i] = 2
    else:
        temp[i] = -1
y = np.cumsum(temp)
plt.plot(y)
plt.xlabel('x')
plt.ylabel('y')
plt.axhline(y=0.0, color='black')
plt.show()

유행처럼 보여요.두 팀은 백전백승을 유지했다.
이어서 이 데이터의 단계를 취하여 단계차와 전 단계의 상관수를 계산한다.
diff = y[1:] - y[:-1]
diff0 = diff[1:]
diff1 = diff[:-1]
cor = np.corrcoef(diff1, diff0)[0, 1]
print('cor = ', cor)
cor =  -1.0
상관수는 -1.0으로 완전히 상반된다.
관련성과 추세가 반드시 일치하는 것은 아니다
반증에서 알 수 있듯이 관련성과 추세가 반드시 일치하는 것은 아니다.데이터의 상관수를 조사하면 상관관계가 있기 때문에 트렌드 전략을 쓰면 오히려 지고 평균 회귀 전략이라면 이길 때도 있다.절대로 혼동해서는 안 된다.

좋은 웹페이지 즐겨찾기