시계열 분해 - 계절성 발견
2043 단어 datasciencepatternsprogramming
저는 우편번호별 주택 중간 가격의 시각화에서 추세를 살펴봤습니다:
그리고 주로 중간 가격의 상승 및 하락 추세에 주목했습니다.
그러나 statsmodels.tsa.seasonal을 사용하여 계절 분해를 수행하고 플로팅했을 때:
# Import and apply seasonal_decompose()
from statsmodels.tsa.seasonal import seasonal_decompose
decomposition = seasonal_decompose(np.log(percent1))
# Gather the trend, seasonality, and residuals
trend = decomposition.trend
seasonal = decomposition.seasonal
residual = decomposition.resid
# Plot gathered statistics
plt.figure(figsize=(12,8))
plt.subplot(411)
plt.plot(np.log(m1), label='Original', color='blue')
plt.legend(loc='best')
plt.subplot(412)
plt.plot(trend, label='Trend', color='blue')
plt.legend(loc='best')
plt.subplot(413)
plt.plot(seasonal,label='Seasonality', color='blue')
plt.legend(loc='best')
plt.subplot(414)
plt.plot(residual, label='Residuals', color='blue')
plt.legend(loc='best')
plt.tight_layout()
계절성 출력에서 놀라운 점을 발견했습니다 - 계절성!
계절의 패턴을 보는 것이 즐거웠습니다. 나는 항상 봄/여름 달에 가격이 약간 더 높다는 말을 들었지만 분해에서 그것을 보는 것이 확인되고 있습니다.
나는 지금 추세의 규모에 대해 궁금합니다. 크기가 너무 클 수 없다는 것을 알고 있지만 얼마나 큰지 잘 모르겠습니다.
나는 이것을 어떻게 알아낼 수 있을지 궁금합니다.
지금까지 원본 데이터를 분해하는 과정의 일부인 로그 변환을 되돌리려고 시도했지만 계절적 추세의 크기가 -0.001과 0.0005 사이에서 진동하므로 결과는 1로 남았습니다. 이 우편 번호에 대한 데이터에서 $120,000에서 $700,000 사이의 중간 가격이 다양한 부동산 시장에서 계절적 차이가 $1보다 클 것으로 추측합니다.
누군가 이 글을 읽고 답이 있다면 저에게 메시지를 보내거나 댓글을 달아주세요 - [email protected] .
Reference
이 문제에 관하여(시계열 분해 - 계절성 발견), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://dev.to/jpetoskey/time-series-decomposition-spotting-seasonality-4e71텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)