本文是《商務與經濟統計》一書的筆記。
時間序列的模式
水平模式
數據圍繞一個不變的均值上下波動
平穩時間序列定義:數據有一個不變的均值;時間序列的變異性隨時間推移不變
趨勢模式
在一段較長的時間內,發生逐步的改變。按通常理解,就是整體上的一種趨勢(過程中依然可能存在波動)。
對於趨勢,可以去擬合它,比如線性擬合、曲線擬合
季節模式
由於“季節”影響,時間序列出現重複模式。此處“季節”指的是某種階段,可以是季度,也可以是月份等。只是地球上季節的效應比較明顯
趨勢與季節模式
一般情況下,會同時存在趨勢和季節模式,比如在出現重複模式的同時也出現趨勢上升或下降的情況
循環模式
出現持續一年以上的在趨勢線上下交替的點序列,則存在循環模式。通常與長期趨勢影響合併,成爲趨勢循環影響,本章沒有涉及到循環模式。
預測精度
這部分略,幾個概念:預測誤差、平均絕對誤差MAE、均方誤差MSE、平均絕對百分數誤差MAPE
移動平均和指數平滑法
K階移動平均
使用近K期數據的均值作爲預測值:
加權移動平均
即賦予數據不同權重,權重總和爲1.
指數平滑法
加權移動平均的一個特例,僅使用一個參數。
如果時間序列波動太大,通常選擇更小的平滑參數(即最近值權重低)
趨勢推測法
略。這裏就是簡單的線性、非線性擬合了。
季節性和趨勢
對於季節性數據建立方程時,需要採用虛擬變量,舉個例子,有分季度的幾年數據,設置3個虛擬變量(季度數-1):
則一般季節性方程爲:
時間序列分解法
本章精髓。將一個時間序列分解出季節、趨勢、不規則成分
加法模型
如果前期季節影響的規模與後期規模相同,則加法模型適合。否則應使用乘法模型。
乘法模型
其中趨勢用被預測項目的單位衡量,其他按相對量衡量(數值大於1表示影響在趨勢之上)。實踐中,通常使用的就是乘法模型。
計算季節指數
原理:我們在預測的時候,一般是需要消除季節影響的(比如冬天棉襖賣的比夏天多,如果我們非要比較夏天和冬天棉襖的銷量,則必需剔除季節影響才能比較),爲了得到季節指數,需要從乘法模型中剔除趨勢和不規則成分。得到季節指數後,我們再從原始數據中剔除季節影響,然後去做趨勢擬合(趨勢比較需要剔除季節影響),預測出的結果再乘以季節指數(預測是不需要剔除季節影響的)
講下具體的步驟:
- 調整數據:因爲各“季節”所含的天數可能是不一樣的,直接比較不好,比如2月28天,3月31天,這樣比較就不準確,所以通常做法是月銷量除以該月天數,再乘以一年內平均每個月的天數
- 觀察數據散點圖、折線圖,確定該用什麼模型(默認可選擇乘法模型)
- 計算季節指數:
3.1 計算移動平均數(以季節種類數作爲窗口大小)
3.2 計算中心化移動平均數(因爲1-4季度的平均數對應的是2.5季度,需要通過中心化消除小數點),得到趨勢值
3.3 原始數據除以對應月份的趨勢值,得到“季節-不規則值”
3.4 上面得到的值還含有不規則成分,所以對各季節分別求平均值,消除隨機影響,此時得到的就是季節指數
3.5 調整季節指數:有時候季節指數總和/季節種類數不等於1,則需要縮放調整 - 得到季節指數後,先對原始數據除以季節指數
- 對消除季節影響的數據做趨勢擬合,此時可進行比較性的任務
- 預測:通過趨勢方程進行預測,得到的結果再乘以季節指數,還原爲真實的預測值
一些附註
爲什麼不考慮循環成分
因爲難。因爲循環成分一般是長週期的,要獲取足量的數據難,循環的週期長短不一也是難點。
計算季節指數的不同方法
在3.4中使用的是均值,也可以使用中位數等