시계열 분해 - 계절성 발견

그 결과는 저를 매료시켰습니다. 즉, 원시 데이터에 아무 것도 표시되지 않는 계절적 패턴이었습니다.

저는 우편번호별 주택 중간 가격의 시각화에서 추세를 살펴봤습니다:

그리고 주로 중간 가격의 상승 및 하락 추세에 주목했습니다.

그러나 statsmodels.tsa.seasonal을 사용하여 계절 분해를 수행하고 플로팅했을 때:

# Import and apply seasonal_decompose()
from statsmodels.tsa.seasonal import seasonal_decompose
decomposition = seasonal_decompose(np.log(percent1))

# Gather the trend, seasonality, and residuals 
trend = decomposition.trend
seasonal = decomposition.seasonal
residual = decomposition.resid

# Plot gathered statistics
plt.figure(figsize=(12,8))
plt.subplot(411)
plt.plot(np.log(m1), label='Original', color='blue')
plt.legend(loc='best')
plt.subplot(412)
plt.plot(trend, label='Trend', color='blue')
plt.legend(loc='best')
plt.subplot(413)
plt.plot(seasonal,label='Seasonality', color='blue')
plt.legend(loc='best')
plt.subplot(414)
plt.plot(residual, label='Residuals', color='blue')
plt.legend(loc='best')
plt.tight_layout()


계절성 출력에서 ​​놀라운 점을 발견했습니다 - 계절성!



계절의 패턴을 보는 것이 즐거웠습니다. 나는 항상 봄/여름 달에 가격이 약간 더 높다는 말을 들었지만 분해에서 그것을 보는 것이 확인되고 있습니다.

나는 지금 추세의 규모에 대해 궁금합니다. 크기가 너무 클 수 없다는 것을 알고 있지만 얼마나 큰지 잘 모르겠습니다.

나는 이것을 어떻게 알아낼 수 있을지 궁금합니다.

지금까지 원본 데이터를 분해하는 과정의 일부인 로그 변환을 되돌리려고 시도했지만 계절적 추세의 크기가 -0.001과 0.0005 사이에서 진동하므로 결과는 1로 남았습니다. 이 우편 번호에 대한 데이터에서 $120,000에서 $700,000 사이의 중간 가격이 다양한 부동산 시장에서 계절적 차이가 $1보다 클 것으로 추측합니다.

누군가 이 글을 읽고 답이 있다면 저에게 메시지를 보내거나 댓글을 달아주세요 - [email protected] .

좋은 웹페이지 즐겨찾기