[Time Series ๐][Forecasting :Principles and Practice] AR, MA, ARMA, ARIMA ๊ฐ๋ ์ ๋ฆฌ
Forecasting :Principles and Practice๋ฅผ ๋ฐํ์ผ๋ก ์ ๋ฆฌํ ๋ฌธ์์ ๋๋ค.
Forecasting: Principles and Practice , Rob J Hyndman and George Athanasopoulos
Table of Content
1. Stationary and Non-Stationary
2. Autoregressive(AR) Model
3. Moving Average(MA) Model
4. Autoregressive and Moving Average Model(ARMA)
5. Autoregressive Integrated Moving Average Model(ARIMA)
6. ACF(Autocorrelated Function) and PACF(Partially ACF)
1. Stationary and Non-Stationary
1. Stationary and Non-Stationary
2. Autoregressive(AR) Model
3. Moving Average(MA) Model
4. Autoregressive and Moving Average Model(ARMA)
5. Autoregressive Integrated Moving Average Model(ARIMA)
6. ACF(Autocorrelated Function) and PACF(Partially ACF)
(1) Stationary Process(์ ์์ฑ) : ์๊ฐ๊ณผ ๊ด๊ณ์์ด ํ๊ท ๊ณผ ๋ถ์ฐ์ด ์ผ์ ํ ์๊ณ์ด ๋ฐ์ดํฐ
(2) Non-Stationary Process(๋น์ ์์ฑ) : ์๊ฐ์ ๊ด๊ณ์์ด ํ๊ท ๊ณผ ๋ถ์ฐ์ด ์ผ์ ํ์ง ์์ ์๊ณ์ด ๋ฐ์ดํฐ
์ ์์ฑ๊ณผ ๋น์ ์์ฑ์ ๋น๊ตํ ์ ์๋ ๋ฐฉ๋ฒ
X์ถ์ Lag(ํ์ฌ ๋ฐ์ดํฐ์์ ์์ ์ฐจ์ด)๋ก ์ค์ ํ๊ณ , Y์ถ์ ACF(Autocorrelation Function)์ผ๋ก ์๊ฐํํ์์ ๋ ์ฃผ๊ธฐ์ ์ผ๋ก ๋ํ๋๋ ํจํด์ด ์์ผ๋ฉด Stationary Process๋ก ๋ณผ ์ ์์ต๋๋ค.
Autocorrelation์ด๋?
Correlation์ ์ผ๋ฐ์ ์ผ๋ก ๋ ๋ณ์ ์ฌ์ด์ ๊ด๊ณ๋ฅผ -1~1์ ๊ฐ์ผ๋ก ํํํ๋ ์ฒ๋์ ๋๋ค. -1์ ๊ฐ๊น์ธ ์๋ก ์์ ์๊ด๊ด๊ณ๊ฐ, +1์ ๊ฐ๊น์ธ์๋ก ์์ ์๊ด๊ด๊ณ๊ฐ ์กด์ฌํ๋ค๊ณ ๋ณผ ์ ์์ต๋๋ค. Autocorrelation์ด๋ Correlation์ Auto ๊ฐ๋ ์ด ์ถ๊ฐ๋ ๊ฒ์ผ๋ก ์๊ณ์ด์ ์ธ ๊ด์ ์ผ๋ก ๋ณด์์ ๋ Time shifted๋ ์๊ธฐ ์์ ๊ณผ์ ์๊ด ๊ด๊ณ๋ฅผ ์๋ฏธํฉ๋๋ค.
2. Autoregressive(AR) Models
์๊ธฐ์์ ์ ์ข ์๋ณ์(Dependent Variable) ๋ก ํ๊ณ , ์ด์ ์์ ์ ์๊ณ์ด(Lagged Data)์ธ ๋ฅผ ๋ ๋ฆฝ๋ณ์(Independent Variable)๋ก ๊ฐ๋ ๋ชจ๋ธ์ ์๋ฏธํฉ๋๋ค. ์ฆ ๊ฐ๋จํ ์ด์ผ๊ธฐํ๋ฉด AR Model์ ๋ณ์์ ๊ณผ๊ฑฐ ๊ฐ๋ค์ ์ ํ ์กฐํฉ์ ์ด์ฉํ์ฌ ํ์ฌ ์์ ์ ๊ฐ์ ์์ธกํ๋ ๋ชจ๋ธ์ ์๋ฏธํฉ๋๋ค.
์ฐจ์ ์ ์๊ธฐํ๊ท๋ชจ๋ธ์ ๋ค์๊ณผ ๊ฐ์ด ํํํ ์ ์์ต๋๋ค.
์์ ์์์ ๋ White Noise ์
๋๋ค.
์์ ํ์ด๋ณด์๋ฉด ํ์ฌ ์์ ์ ๊ฐ ๋ฅผ ์์ธกํจ์ ์์ด์ ์ด์ ์์ ์ Lagged๋ Data์ ๋งค๊ฐ๋ณ์ ๊ฐ ๊ณฑํด์ง ๊ฐ๊ณผ White Noise ๊ฐ์ด ๋ํด์ง ํํ์ ๋ค์ค ํ๊ท ๋ชจ๋ธ์ด๋ผ๊ณ ๋ณผ ์ ์์ต๋๋ค. ์ด์ฒ๋ผ ์ฐจ์ ๋ฅผ ๊ฐ์ง๋ ์๊ธฐํ๊ท ๋ชจ๋ธ์ AR(p) Model์ด๋ผ๊ณ ๋ถ๋ฆ
๋๋ค.
3. Moving Average(MA) Models
์๊ธฐ์์ ์ ์ข ์๋ณ์(Dependent Variable) ๋ก ํ๊ณ , ํด๋น ์์ ๊ณผ ๊ทธ ๊ณผ๊ฑฐ์ White Noise Distribution Error๋ค์ธ ๋ฅผ ๋ ๋ฆฝ๋ณ์(Independent Variable)๋ก ๊ฐ๋ ๋ชจ๋ธ์ ์๋ฏธํฉ๋๋ค. ํ๊ท์์ ๋ชฉํ ์์ ๋ณ์์ ๊ณผ๊ฑฐ ๊ฐ์ ์ด์ฉํ๋ ๋์ ์ ์ด๋ ํ๊ท ๋ชจ๋ธ์ ํ๊ท์ฒ๋ผ ๋ณด์ด๋ ๋ชจ๋ธ์์ ๊ณผ๊ฑฐ ์์ธก ์ค์ฐจ(Forecast Error)์ ์ฌ์ฉํฉ๋๋ค.
์ฐจ์ ์ ์ด๋ํ๊ท ๋ชจ๋ธ์ ๋ค์๊ณผ ๊ฐ์ด ํํํ ์ ์์ต๋๋ค.
์ฌ๊ธฐ์ ๋ White Noise ์ ๋๋ค. ์์ ํ์ด๋ณด์๋ฉด ์ ๊ฐ ๊ฐ์ ๊ณผ๊ฑฐ ๋ช๊ฐ์ ์์ธก ์ค์ฐจ์ ๊ฐ์ค ์ด๋ ํ๊ท ์ผ๋ก ์๊ฐํ ์ ์๋ค๊ณ ํด์ํ ์ ์์ต๋๋ค. ์ด์ฒ๋ผ ์ฐจ ์ด๋ ํ๊ท ๋ชจ๋ธ์ MA(q) Model์ด๋ผ๊ณ ๋ถ๋ฆ ๋๋ค.
4. Autoregressive and Moving Average (ARMA)
์๊ธฐ์์ ์ ์ข ์๋ณ์(Dependent Variable) ๋ก ํ๊ณ , ์ด์ ์์ ์ ์๊ณ์ด ๋ฐ์ดํฐ(Lagged Data)์ธ ์ White Noise ๋ฅผ ๋ ๋ฆฝ๋ณ์(Independent Variable)๋ก ๊ฐ๋ ๋ชจ๋ธ์ ์๋ฏธํฉ๋๋ค.
p์ q ์ฐจ์์ ๊ฐ์ง๋ ARMA Model์ ์์์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
5. Autoregressive Integrated Moving Average (ARIMA)
๊ธฐ์กด AR, MA, ARMA ๋ชจ๋ธ์ ๊ฒฝ์ฐ ๋ฐ์ดํฐ๊ฐ ์ ์ (Stationary)์ด์ด์ผ ํจ์ผ๋ก ๋น์ ์ (Nonstationary)์ธ ๊ฒฝ์ฐ๋ ์ฐจ๋ถ (differencing)์ ํตํด ๋ฐ์ดํฐ๋ฅผ ์ ์์ผ๋ก ๋ณํํด์ฃผ์ด์ผ ํฉ๋๋ค. ARIMA๋ ARMA ๋ชจํ์ ์ฐจ๋ถ์ dํ ์ํํด์ค ๋ชจ๋ธ์ ๋๋ค.
๋ฐ์ดํฐ๋ฅผ ์ ์์ผ๋ก ๋ฐ๊พธ๋ ๋ฐฉ๋ฒ์ ๋ฌด์์ผ๊น? - ์ฐจ๋ถ(Differencing)
์ฐจ๋ถ์ด๋, ํ ์์ ๋ฐ์ดํฐ์์ d์์ ์ด์ ๋ฐ์ดํฐ๋ฅผ ๋บ ๊ฒ์ ์๋ฏธํฉ๋๋ค. ์ ์์ฑ์ ๋ํ๋ด์ง ์๋ ์๊ณ์ด์ ์ ์์ฑ์ ๋ํ๋ด๋๋ก ๋ง๋๋ ํ ๊ฐ์ง ๋ฐฉ๋ฒ์ผ๋ก ์ฐ์ด์ ๊ด์ธก๊ฐ์ ์ฐจ์ด๋ฅผ ๊ณ์ฐํ์ฌ ๋ฐ์ดํฐ๊ฐ ์ ์์ฑ์ ๋ํ๋ด๋๋ก ๋ณํ์ํต๋๋ค.
์ ๊ทธ๋ฆผ์ ์ฐจ๋ถ์ด ์ด๋ป๊ฒ ์ผ์ด๋๋์ง ๋ํ๋ธ ๊ทธ๋ฆผ์ ๋๋ค. ์์ฐจ 1์์ ์ฐจ๋ถ์ ๊ตฌํ๋ ๊ฒฝ์ฐ "1์ฐจ ์ฐจ๋ถ(first difference)" ์ด๋ผ๊ณ ๋ถ๋ฅด๋ฉฐ, ์์ฐจ 2์์ ์ฐจ๋ถ์ ๊ตฌํ๋ ๊ฒฝ์ฐ "2์ฐจ ์ฐจ๋ถ(second difference)" ๋ผ๊ณ ๋ถ๋ฆ ๋๋ค. 1์ฐจ ์ฐจ๋ถ์ ์งํํ์์๋ ์ ์์ฑ์ ๋ํ๋ด์ง ์๋ ๊ฒฝ์ฐ 2์ฐจ ์ฐจ๋ถ์ ์งํํ๊ฒ ๋์ง๋ง 2์ฐจ ์ฐจ๋ถ์ ์๋ฏธ์ ์๋ณธ ๋ฐ์ดํฐ์ "๋ณํ์์ ๋ํ๋๋ ๋ณํ"๋ฅผ ๋ชจ๋ธ๋งํ๊ฒ ๋๋ ์ ์ด์ด์ ์ค์ ์ํฉ์์๋ 2์ฐจ ์ฐจ๋ถ ์ด์์ผ๋ก ๊ตฌํด์ผํ๋ ๊ฒฝ์ฐ๋ ๊ฑฐ์ ์ผ์ด๋์ง ์์ต๋๋ค.
์์ ๊ทธ๋ฆผ์ ๋ก๊ทธ ๋ณํ, 1์ฐจ ์ฐจ๋ถ, 2์ฐจ ์ฐจ๋ถ ์ํ ๊ฒฐ๊ณผ๋ฅผ ์๊ฐํํ ๊ฒฐ๊ณผ์ ๋๋ค. ์ผ๋ฐ์ ์ผ๋ก ์๊ณ์ด ๊ณก์ ์ด ํน์ ํ ํธ๋ ๋๋ฅผ ๊ฐ์ง๊ณ ์๋ค๋ฉด 1์ฐจ ์ฐจ๋ถ์, ์๊ฐ์ ๋ฐ๋ผ ๋ณํํ๋ ํธ๋ ๋๊ฐ ์๋ค๋ฉด 2์ฐจ ์ฐจ๋ถ์ ์ํํฉ๋๋ค.
ARIMA๋ Autoregressive Integrated Moving Average์ ์ฝ์๋ก ์ด๋ ํ๊ท ์ ๋์ ํ ์๊ธฐ ํ๊ท ์ฆ ์๊ธฐ ํ๊ท์ ์ด๋ ํ๊ท ๋ชจ๋ธ์ ๊ฒฐํฉํ ๋ชจ๋ธ์ ๋๋ค. ์์์ ์๋์ ๊ฐ์ด ๋ํ๋ผ ์ ์์ต๋๋ค.
์์ ์์์ ๋ ์ฐจ๋ถ์ ๊ตฌํ ์๊ณ์ด์ด๋ฉฐ, ์ฐ๋ณ์ ์์ธก ๋ณ์์๋ ์ ์์ฐจ ๊ฐ๊ณผ ์์ฐจ ์ค์ฐจ(lagged error)๋ฅผ ๋ ๋ค ํฌํจํฉ๋๋ค. ์์ ๊ฐ์ ๋ชจ๋ธ์ ARIMA(p,d,q) ๋ชจ๋ธ์ด๋ผ๊ณ ๋ถ๋ฅด๋ฉฐ ๊ฐ ๋ณ์ ๋ ๋ค์๊ณผ ๊ฐ์ ์๋ฏธ๋ฅผ ๊ฐ์ง๋๋ค.
- = ์๊ธฐ ํ๊ท ๋ถ๋ถ์ ์ฐจ์
- = 1์ฐจ ์ฐจ๋ถ์ด ํฌํจ๋ ์ ๋
- = ์ด๋ ํ๊ท ๋ถ๋ถ์ ์ฐจ์
์๊ธฐ ํ๊ท(AR)๊ณผ ์ด๋ ํ๊ท ๋ชจ๋ธ(MA)์ ์ฌ์ฉ๋๋ ๊ฒ๊ณผ ๊ฐ์ ์ ์์ฑ๊ณผ ๊ฐ์ญ์ฑ ์กฐ๊ฑด์ ARIMA ๋ชจ๋ธ์๋ ์ ์ฉ๋ฉ๋๋ค. ์ง๊ธ๊น์ง ๋ค๋ฃฌ ๋ชจ๋ธ์ ARIMA ๋ชจ๋ธ๋ก ํํํ๋ ๊ฒ๋ ๊ฐ๋ฅํฉ๋๋ค.
- White Noise : ARIMA(0,0,0)
- ํ๋ฅ ๋ณดํ : ์์๊ฐ ์๋ ARIMA(0,1,0)
- ํ๋ฅ๋ฅผ ํฌํจํ๋ ํ๋ฅ ๋ณดํ : ์์๊ฐ ์๋ ARIMA(0,1,0)
- AR : ARIMA(p,0,0)
- MA : ARIMA(0,0,q)
6. ACF and PACF
ACF(AutoCorrelation Function)?
ACF(AutoCorrelation Function, ์๊ธฐ์๊ดํจ์) ๋ k์๊ฐ ๋จ์๋ก ๊ตฌ๋ถ๋ ์๊ณ์ด์ ๊ด์ธก์น ๊ฐ ์๊ด๊ณ์ ํจ์๋ฅผ ์๋ฏธํ๋ฉฐ, k๊ฐ ์ปค์ง์๋ก ACF๋ 0์ ๊ฐ๊น์์ง๋๋ค. ์๊ด๊ฐ์ด ๋ ๋ณ์ ์ฌ์ด์ ์ ํ ๊ด๊ณ์ ํฌ๊ธฐ๋ฅผ ์ธก์ ํ๋ ๊ฒ์ฒ๋ผ, ์๊ธฐ์๊ด(Autocorrelation)์ ์๊ณ์ด์ ์ฌ์ฐจ๊ฐ(lagged values) ์ฌ์ด์ ์ ํ ๊ด๊ณ๋ฅผ ์ธก์ ํฉ๋๋ค.
์์ฐจ ๊ทธ๋ํ์์ ๊ฐ ํจ๋๊ณผ ๊ด๋ จ๋ ๋ช๊ฐ์ง ์๊ธฐ์๊ด ๊ณ์๊ฐ ์์ต๋๋ค. ์ ์ ์ฌ์ด์ ๊ด๊ณ๋ฅผ ์ธก์ ํ๊ณ , ๋ ์ ์ฌ์ด์ ๊ด๊ณ๋ฅผ ์ธก์ ํ๋ ์์ ๋๋ค.
๊ฐ์ ๋ค์๊ณผ ๊ฐ์ด ์ธ ์ ์์ต๋๋ค.
์์ ์์์ T๋ ์๊ณ์ด์ ๊ธธ์ด์
๋๋ค.
PACF(Partial ACF)?
๋ถ๋ถ ์๊ด(Partial Correlation) ์ด๋ ๋ ํ๋ฅ ๋ณ์ X์ Y์ ์ํด ๋ค๋ฅธ ๋ชจ๋ ๋ณ์๋ค์ ๋ํ๋ ์๊ด ๊ด๊ณ๋ฅผ ์ค๋ช ํ๊ณ ๋ ์ดํ์๋ ์ฌ์ ํ ๋จ์์๋ ์๊ด ๊ด๊ณ๋ผ๊ณ ์ ์ํ ์ ์์ต๋๋ค.
๋ฐ๋ผ์ ๋ถ๋ถ์๊ธฐ์๊ดํจ์(PACF) ๋ ์๊ธฐ ์๊ด ํจ์์ ๋ง์ฐฌ๊ฐ์ง๋ก ์๊ณ์ด ๊ด์ธก์น ๊ฐ ์๊ด ๊ด๊ณ ํจ์์ด๊ณ , ์์ฐจ k์์์ k ๋จ๊ณ๋งํผ ๋จ์ด์ ธ ์๋ ๋ชจ๋ ๋ฐ์ดํฐ ์ ๋ค ๊ฐ์ ์์ํ ์๊ด ๊ด๊ณ๋ฅผ ์๋ฏธํฉ๋๋ค.
์ฝ๊ฒ ๋งํด, ์ ์ PACF๋ ์ ์ ์์ํ ์๊ด๊ด๊ณ๋ก์ ๋ ์์ ์ฌ์ด์ ํฌํจ๋ ๋ชจ๋ ์ ์ํฅ๋ ฅ์ ์ ๊ฑฐ๋จ์ ์๋ฏธํฉ๋๋ค. ์ ์ฌ์ด์ ํธ์๊ธฐ์๊ด์ ๊ตฌํ๋ ์์ ์๋์ ๊ฐ์ต๋๋ค.
ACF์ PACF๋ฅผ ์ด๋ป๊ฒ ์ฌ์ฉํ๋๊ฐ?
๋ณดํต์ ๋จ์ํ๊ฒ ์๊ฐ ๊ทธ๋ํ(Time Plot)๋ง ๋ณด๊ณ ๋์ ์ด๋ค p์ q ๊ฐ์ด ๋ฐ์ดํฐ์ ๋ง๋์ง ์ด์ผ๊ธฐํ ์ ์์ต๋๋ค. ํ์ง๋ง ARIMA ๋ชจ๋ธ์์ ์ ์ ํ p์ q ๊ฐ์ ๊ฒฐ์ ํ๊ธฐ ์ํด ๋๋๋ก ACF ๊ทธ๋ํ์ PACF ๊ทธ๋ํ๋ฅผ ์ด์ฉํ๋ฉด ๊ฐ๋ฅํฉ๋๋ค.
์๋ก ๋ค๋ฅธ k ๊ฐ์ ๋ํด, ์ ์ ๊ด๊ณ๋ฅผ ์ธก์ ํ๋ ACF ๊ทธ๋ํ๋ฅผ ๋ค์ ๋ ์ฌ๋ ค ๋ด ์๋ค. ์ ์ด ์๊ด ๊ด๊ณ๊ฐ ์๋ค๋ฉด ์ ์๋ ์๊ด๊ด๊ณ๊ฐ ์์ด์ผ ํฉ๋๋ค. ํ์ง๋ง ์ ๋ ๋ฅผ ์์ธกํ๋๋ฐ ์ฌ์ฉ๋ ์๋ ์์ ์ ๋ด๊ธด ์ด๋ค ์๋ก์ด ์ ๋ณด ๋๋ฌธ์ด ์๋๋ผ ๋จ์ํ ๋ ๊ฐ ๋ชจ๋ ๊ณผ ๊ด๋ จ์ด ์๊ธฐ ๋๋ฌธ์ ์๊ด๊ด๊ณ๋ฅผ ๊ฐ์ง ์๋ ์์ต๋๋ค.
์์ ๊ฐ์ ๋ฌธ์ ๋ฅผ ๊ทน๋ณตํ๊ธฐ ์ํด PACF ๊ทธ๋ํ๋ฅผ ์ฌ์ฉํ ์ ์์ต๋๋ค. ์ด ๊ฐ์ ์์ฐจ ์ ํจ๊ณผ๋ฅผ ์ ๊ฑฐํ ํ์ ์ ์ฌ์ด์ ๊ด๊ณ๋ฅผ ์ธก์ ํฉ๋๋ค. ๊ทธ๋์ ์ฒซ ๋ฒ์งธ ๋ถ๋ถ ์๊ธฐ์๊ด์ ์ ๊ฑฐํ ๋ถ๋ถ์ด ์์ด์ ์ฒซ๋ฒ์งธ ์๊ธฐ ์๊ด๊ณผ ๊ฐ์ ๊ฐ์ ๊ฐ์ง๋ฉฐ, ๊ฐ ๋ถ๋ถ์๊ธฐ์๊ด์ ์๊ธฐ ํ๊ท ๋ชจ๋ธ์ ๋ง์ง๋ง ๊ณ์์ฒ๋ผ ์ธก์ ํ ์ ์์ต๋๋ค.
ACF์ PACF์ ๋ชจ์์ ํตํด ARIMA ๋ชจ๋ธ์ ๋งค๊ฐ ๋ณ์์ธ p์ q๋ฅผ ๊ฒฐ์ ํ๋ ๋ฐฉ๋ฒ์ ์๋์ ๊ฐ์ต๋๋ค.
.
.
.
๊ฐ์ฌํฉ๋๋ค!
Author And Source
์ด ๋ฌธ์ ์ ๊ดํ์ฌ([Time Series ๐][Forecasting :Principles and Practice] AR, MA, ARMA, ARIMA ๊ฐ๋ ์ ๋ฆฌ), ์ฐ๋ฆฌ๋ ์ด๊ณณ์์ ๋ ๋ง์ ์๋ฃ๋ฅผ ๋ฐ๊ฒฌํ๊ณ ๋งํฌ๋ฅผ ํด๋ฆญํ์ฌ ๋ณด์๋ค https://velog.io/@jhbale11/์๊ณ์ดForecasting-Principles-and-Practice-AR-MA-ARMA-ARIMA-๊ฐ๋ -์ ๋ฆฌ์ ์ ๊ท์: ์์์ ์ ๋ณด๊ฐ ์์์ URL์ ํฌํจ๋์ด ์์ผ๋ฉฐ ์ ์๊ถ์ ์์์ ์์ ์ ๋๋ค.
์ฐ์ํ ๊ฐ๋ฐ์ ์ฝํ ์ธ ๋ฐ๊ฒฌ์ ์ ๋ (Collection and Share based on the CC Protocol.)
์ข์ ์นํ์ด์ง ์ฆ๊ฒจ์ฐพ๊ธฐ
๊ฐ๋ฐ์ ์ฐ์ ์ฌ์ดํธ ์์ง
๊ฐ๋ฐ์๊ฐ ์์์ผ ํ ํ์ ์ฌ์ดํธ 100์ ์ถ์ฒ ์ฐ๋ฆฌ๋ ๋น์ ์ ์ํด 100๊ฐ์ ์์ฃผ ์ฌ์ฉํ๋ ๊ฐ๋ฐ์ ํ์ต ์ฌ์ดํธ๋ฅผ ์ ๋ฆฌํ์ต๋๋ค