ARIMA

Autoregressive Integrated Moving Average

ARIMAとは

ARIMA(Autoregressive Integrated Moving Average)とは、時系列データの予測に用いられる統計モデルで、自己回帰(AR)、差分(I)、移動平均(MA)の3つの要素を組み合わせたモデルです。ボックスとジェンキンスが体系化したことから、ボックス-ジェンキンス法とも呼ばれます。

ARIMAの3要素

AR(自己回帰)成分は過去の値からの線形回帰を表し、パラメータpで次数を指定します。I(和分)成分は非定常データを定常化するための差分を取る回数dを表します。MA(移動平均)成分は過去の予測誤差からの回帰を表し、パラメータqで次数を指定します。ARIMA(p,d,q)と表記されます。

モデルの構築手順

ARIMAモデルの構築は、(1)データの定常性確認と差分変換、(2)ACF(自己相関関数)とPACF(偏自己相関関数)の分析によるp,qの暫定決定、(3)パラメータ推定、(4)残差診断、(5)予測の手順で行います。AIC(赤池情報量規準)やBICを用いた自動選択も一般的です。

SARIMAとその発展

季節性のあるデータにはSARIMA(Seasonal ARIMA)が使用されます。SARIMA(p,d,q)(P,D,Q)sの形式で、季節成分のパラメータも含みます。近年ではProphetやニューラルネットワークベースの手法も普及していますが、ARIMAは解釈性が高くベースラインモデルとして依然重要です。