1.模型介紹
ARIMA,差分自迴歸滑動平均模型,又稱求自迴歸滑動平均模型,是時間序列預測分析方法之一。
ARIMA(p,d,q)中,AR是“自迴歸”,p爲自迴歸項數;MA是“滑動平均”,q爲滑動平均項數;d是使之成爲平穩序列所做的差分次數(階數)。
2.ARIMA模型運用流程
以《應用系統負載分析與磁盤容量預測》爲案例:
- (平穩性檢驗)根據時間序列的散點圖、自相關係數和偏自相關係數、單位根檢驗(ADF),來判斷數據的平穩性;
- (平穩化處理)對非平穩的時間序列數據進行差分處理,得到差分階數d;
- (白噪聲檢測)爲了驗證序列中有用的信息是否已被提取完畢,如果爲白噪聲序列,說明序列中有用的信息已經被提取完畢,可以採用LB統計量的方法進行白噪聲檢驗;
- (模型識別和定階)根據所識別出來的特徵建立相應的時間序列模型。平穩化處理後,若偏自相關函數是截尾的,而自相關函數是拖尾的,則建立AR模型;若偏自相關函數是拖尾的,而自相關函數是截尾的,則建立MA模型;若偏自相關函數和自相關函數均是拖尾的,則序列適合ARIMA模型。可以採用BIC準則對模型進行定階,確定p,q參數,從而選擇最優模型;
- (模型檢驗)檢驗已確定的模型其殘差序列是否爲白噪聲,如果不是白噪聲,說明殘差中還存在有用的信息,需要修改模型或者進一步提取;
-(模型預測)應用已通過檢驗的模型進行預測;
3.平穩性檢驗
(1)看圖法
這裏的“圖”指的是時序圖,平穩序列的圖a是圍繞一個常數上下波動;而不平穩的圖b,則是有明顯的增長或減少的趨勢。
(2)自相關係數和偏自相關係數
這裏會涉及到兩個定義——截尾和拖尾。
平穩序列的自相關圖和偏相關圖要麼都是拖尾要麼都是截尾。截尾就是在某階之後,係數都爲 0 ,怎麼理解呢,看上面偏相關的圖,當階數爲 1 的時候,係數值還是很大, 0.914. 二階長的時候突然就變成了 0.050. 後面的值都很小,認爲是趨於 0 ,這種狀況就是截尾。再就是拖尾,拖尾就是有一個衰減的趨勢,但是不都爲 0 。自相關圖既不是拖尾也不是截尾。以上的圖的自相關是一個三角對稱的形式,這種趨勢是單調趨勢的典型圖形。
(3)單位根檢驗(ADF)
若單位根檢驗p值小於0.05則認爲是平穩的。
4.差分處理
差分即取相鄰項值差替代當前值,以此來消除一些波動,使數據趨於平穩。