統計學第十六週時間序列分析與預測

概念：

基本概念

時間序列：是同一現象在不同時間的相繼觀察值排列而成的序列。

平穩序列：基本上不存在趨勢的序列。各觀察值基本上在某個固定的水平上波動，雖然在不同的時間段波動的程度不同，單並不存在某種規律，波動可以看成是隨機的。

非平穩序列：包含趨勢、季節性或週期性的序列，它可能只包含其中一種成分，也可能包含幾種成分，非平穩序列又分爲有趨勢的序列、有趨勢和季節性的序列、幾種成分混合而成的複合型序列。

趨勢：是時間序列在長期內呈現出來的某種持續上升或持續下降的波動，也稱爲長期趨勢。時間序列可是是線性的，也可以是非線性的。

季節性也成季節變動，它是時間序列在一年內重複出現的週期性波動。

週期性：時間序列呈現出來的圍繞長期趨勢的一種波浪形或震盪式變動。

隨機性：時間序列中除去趨勢、週期性和季節性之後的偶然性波動。

時間序列的成分：趨勢T 、季節性或季節變動S、週期性或循環波動C、隨機性或不規則波動I ，分解以乘法模型。

時間序列的描述：增長率、平均增長率、

時間序列的預測：

（1）確定時間序列所包含的成分，也就是確定時間序列的類型（繪圖或擬合）

（2）找出適合此類時間序列的預測方法

（3）對可能的預測方法進行評估，已確定最佳預測方案（平均誤差、平均絕對誤差、均方誤差、平均百分比誤差和平均絕對百分比誤差、）

（4）利用最佳預測方案進行預測
平穩序列的預測

平穩時間序列通常只包含隨機成分，其預測方法主要簡單平均法、移動平均法和指數平滑法等。

簡單平均法：就是t+1期把已有的t期觀測值求和取平均，t+2期是把前面t+1前觀測值求和取平均值，依次類推。缺點是對近期與遠期數據的響應不及時

移動平均法：採用最近k期數據進行求平均值，第t期的數據預測值計算是，t-1,t-2,…,t-k+1期數據觀測值求均值，第t+1期則是t,t-1,…-t-k+2 缺點是k不容易確定

指數平滑法：通過對過去的觀察值加權平均進行預測的一種方法。即第t+1期的數值預測是通過第t期的實際值與第t期的預測值之間加權和，觀察值的時間越遠，其所佔權重就越下降，具體表現程指數下降。
$F_{t+1} = \alpha Y_t+(1-\alpha )F_t$

$F_{2} = \alpha Y_{1}+(1-\alpha F_{1})=\alpha Y_{1}+(1-\alpha)Y_1=Y_1$

$F_3=\alpha Y_2 +(1-\alpha )F_2=\alpha Y_2+(1-\alpha)Y_1$

$F_4= \alpha Y_3+(1-\alpha )F_3=\alpha Y_3+(1-\alpha)\alpha Y_2+(1-\alpha)^2 Y_1$

$因此指數平滑法，任何預測值F_{t+1}都是以前所有的實際觀察值的加權平均，F_{t+1}=\alpha Y_t+(1-\alpha) F_t=F_t+\alpha (Y_t-F_t)$

指數平滑法關鍵是確定平滑係數a，其比較接近1時，觀察值佔比越重；當其越接近0時，預測值所佔的比重就比較大。

從簡單平均法、移動平均法、指數平滑化比較而言，這三種算法的趨勢是向影響因素較大的方向傾斜，同時對近期結果所佔的作用進行強調，傾向於對a優化，其實際是對觀測值帶係數的整式係數的確認，簡單平均法是各份子係數爲1，移動平均法是中間一段爲1，其他爲0，指數平滑法系數是一個指數函數形式。因此係數方程的構造可以認爲是一種研究的方向。
趨勢型序列的預測

趨勢型序列的預測分爲線性趨勢預測、非線性趨勢預測和自迴歸模型預測等。

線性趨勢linear trend ，是指現象隨着時間的推移而呈現出穩定增長或下降的線性變化規律。

非線性迴歸趨勢預測，常用的趨勢曲線有指數曲線和多階曲線

指數曲線：

二次曲線：

此外還有修正指數曲線、Gompertz曲線、Logistic曲線等。

複合型序列的分解預測

複合型序列：是指含有含有趨勢性、季節性和週期性的序列。

對這類序列進行分析的傳統方法就是將時間序列的各個因素依次分解出來，並分別進行分析。一般分解順序是先求季節因素，再求出趨勢因素，最後求出週期性因素和隨機因素。
這類預測主要有季節性多元迴歸模型、季節自迴歸模型和時間序列分解法預測等

其中時間序列分解法預測：

（1）確定並分離季節成分。計算季節指數，以確定時間序列中的季節成分。然後將季節成分從時間序列中分離出去，即用每一個時間序列觀察值除以相應的季節指數，以消除季節性。

（2）建立預測模型並進行預測。對消除了季節成分的時間序列建立適當的預測模型並根據這一模型進行預測。

（3）計算最後的預測值。用預測值乘以相應的季節指數，得到最終的預測值。

計算季節指數的方法：移動平均趨勢剔除法

第一步：計算移動平均值，並對其結果進行中心化處理，也就是將移動平均的結果再進行一次二項移動平均，得出中心化移動平均值CMA.

第二步，計算移動平均的比值，也稱爲季節比率，即將序列的各觀察值除以相應的中心化移動均值，然後計算出各比值的季度或月份平均值。

第三步，季節指數調整，由於各季節指數的平均數應等於1或100%,若根據第二步計算的季節比率的平均值不等於1，則需要調整。具體調整辦法是：將第二步計算的每個季節比率的平均值除以他們的總平均值。

接下來就是每個季節除以對應季節指數，消除季節性：

注：這裏上面的數據計算錯誤了，需要參考下面計算。
2010前兩個季度和2015後兩個季度不變，其他分別爲當季度觀測值/季度指數=消除季節性後的數據

之後對消除了季節成分的時間序列建立適當的預測模型並根據這一模型進行預測。

最終的結果是預測消除季節成分的預測值在乘以季節指數，就得到對應的預測結果。

參考：https://blog.csdn.net/hpdlzu80100/article/details/78961452 計算中心化移動平均法（k個臨窗的滾動，接下來k個臨窗）

注：假設2000年有四個季度某商品其銷售量爲25、32、37、26。2001年分別爲30、38、42、30。則其中心化移動平均值（CMA）＝前四個季度的平均值（25＋32＋37＋26）／4加上接下來的四個季度的平均值（32＋37＋26＋30）／4最後再將以上求出的值求平均值即可，其餘季度的中心化平均值求法與之一致。對於求四季度開始的一年的前兩個季度是沒有CMA的，最後一年的後兩個季度也是沒有CMA的。

CMA=[(25+32+37+26)/4+(32+37+26+30)/4]/2=30.625 （F4）

CMA=[(32+37+26+30)/4+(37+26+30+38)/4]/2= （F5）

Y/CMA =E4/F4 = G4

季節指數=每個季節的Y/CMA的平均值除以（所有季節的Y/CMA的平均值）

統計學第十六週時間序列分析與預測