時間序列分析及預測

本文是《商務與經濟統計》一書的筆記。

時間序列的模式

水平模式

數據圍繞一個不變的均值上下波動
平穩時間序列定義:數據有一個不變的均值;時間序列的變異性隨時間推移不變

趨勢模式

在一段較長的時間內,發生逐步的改變。按通常理解,就是整體上的一種趨勢(過程中依然可能存在波動)。
對於趨勢,可以去擬合它,比如線性擬合、曲線擬合

季節模式

由於“季節”影響,時間序列出現重複模式。此處“季節”指的是某種階段,可以是季度,也可以是月份等。只是地球上季節的效應比較明顯

趨勢與季節模式

一般情況下,會同時存在趨勢和季節模式,比如在出現重複模式的同時也出現趨勢上升或下降的情況

循環模式

出現持續一年以上的在趨勢線上下交替的點序列,則存在循環模式。通常與長期趨勢影響合併,成爲趨勢循環影響,本章沒有涉及到循環模式。

預測精度

這部分略,幾個概念:預測誤差、平均絕對誤差MAE、均方誤差MSE、平均絕對百分數誤差MAPE

移動平均和指數平滑法

K階移動平均

使用近K期數據的均值作爲預測值:F_{t+1}=\frac{Y_t+Y_{t-1}+...+Y_{t-k+1}}{k}

加權移動平均

即賦予數據不同權重,權重總和爲1.

指數平滑法

加權移動平均的一個特例,僅使用一個參數。F_{t+1}=\alpha Y_t+(1-\alpha)F_t
如果時間序列波動太大,通常選擇更小的平滑參數(即最近值權重低)

趨勢推測法

略。這裏就是簡單的線性、非線性擬合了。

季節性和趨勢

對於季節性數據建立方程時,需要採用虛擬變量,舉個例子,有分季度的幾年數據,設置3個虛擬變量(季度數-1):Q_1=\{\begin{aligned} 1,第一季度\\ 0,其他\\ \end{aligned} Q_2=\{\begin{aligned} 1,第二季度\\ 0,其他\\ \end{aligned} Q_3=\{\begin{aligned} 1,第三季度\\ 0,其他\\ \end{aligned}
則一般季節性方程爲:\hat Y=b_0+b_1Q_1+b_2Q_2+b_3Q_3

時間序列分解法

本章精髓。將一個時間序列分解出季節、趨勢、不規則成分

加法模型

Y_t=Trend_t+Seasonal_t+Irregular_t
如果前期季節影響的規模與後期規模相同,則加法模型適合。否則應使用乘法模型

乘法模型

Y_t=Trend_t \times Seasonal_t \times Irregular_t
其中趨勢用被預測項目的單位衡量,其他按相對量衡量(數值大於1表示影響在趨勢之上)。實踐中,通常使用的就是乘法模型。

計算季節指數

原理:我們在預測的時候,一般是需要消除季節影響的(比如冬天棉襖賣的比夏天多,如果我們非要比較夏天和冬天棉襖的銷量,則必需剔除季節影響才能比較),爲了得到季節指數,需要從乘法模型中剔除趨勢和不規則成分。得到季節指數後,我們再從原始數據中剔除季節影響,然後去做趨勢擬合(趨勢比較需要剔除季節影響),預測出的結果再乘以季節指數(預測是不需要剔除季節影響的)
講下具體的步驟:

  1. 調整數據:因爲各“季節”所含的天數可能是不一樣的,直接比較不好,比如2月28天,3月31天,這樣比較就不準確,所以通常做法是月銷量除以該月天數,再乘以一年內平均每個月的天數
  2. 觀察數據散點圖、折線圖,確定該用什麼模型(默認可選擇乘法模型)
  3. 計算季節指數:
    3.1 計算移動平均數(以季節種類數作爲窗口大小)
    3.2 計算中心化移動平均數(因爲1-4季度的平均數對應的是2.5季度,需要通過中心化消除小數點),得到趨勢值
    3.3 原始數據除以對應月份的趨勢值,得到“季節-不規則值”
    3.4 上面得到的值還含有不規則成分,所以對各季節分別求平均值,消除隨機影響,此時得到的就是季節指數
    3.5 調整季節指數:有時候季節指數總和/季節種類數不等於1,則需要縮放調整
  4. 得到季節指數後,先對原始數據除以季節指數
  5. 對消除季節影響的數據做趨勢擬合,此時可進行比較性的任務
  6. 預測:通過趨勢方程進行預測,得到的結果再乘以季節指數,還原爲真實的預測值

一些附註

爲什麼不考慮循環成分

因爲難。因爲循環成分一般是長週期的,要獲取足量的數據難,循環的週期長短不一也是難點。

計算季節指數的不同方法

在3.4中使用的是均值,也可以使用中位數等

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章