時間序列預測的基本原理
1,時間序列分類:
平穩時間序列 | 隨時間相對穩定的序列(均值、方差、自相關係數) |
---|---|
均值:使用常數均值 才能用來較好的進行預測(常數均值即在平穩時間序列下的均值,這樣才能保證使用均值預測的結果不會偏離真實結果太大) |
|
方差:每個樣本值與全體樣本值的平均數之差的平方值的平均數 | |
自相關係數:即兩個變量在形式上或者標準差上具有相似的變化 (正相關/負相關)<因爲數據有了相關性,才能使用以前的數據來預測未來的數據> |
|
非平穩時間序列 | 統計特性會隨着時間變化的序列 |
2,如何將一個序列轉換爲平穩狀態
差分法:
當一個序列在一段時間內,保存有上升或者下降的趨勢時,這個序列就是不穩定的。一般的解決方法就是對序列進行一階微分。
(腦補一階微分方程)
一階線性微分方程是一階常微分方程中基礎的一類。通常寫成如下形式:
其中I是方程的求解範圍,一般是實數集的子集。a和b是已知的連續函數。如果b是零函數,則稱此方程爲齊次的,否則稱其爲非齊次的。
一階齊次線性微分方程:
的解函數構成一個一維實線性空間:
一階非齊次線性微分方程
的解函數構成一個一維實仿射空間:
其中
是原微分方程的一個特解。
(將序列轉換爲平穩狀態的方法很多,可是我就看懂了這一個,也不是看懂,就是覺得這個比較容易實現吧,哈哈!!!<圖片大小不會改,尷尬>)
3,模型評價指標
模型評價基本上就是下面的四種評價指標:
平均預測誤差——偏差(bias)
它只是被評估序列的平均誤差,值可以是正的也可以是負的。該指標表明,模型傾向於預測實際值以上(負誤差)還是實際值以下(正誤差),因此也可以說平均預測誤差是模型的偏差。
MAE——平均絕對誤差
這個指標與上面提到的預測的平均誤差非常相似,唯一的區別是將誤差的負值轉化爲正值,然後計算平均值。
RMSE——均方根誤差
這個指標只是 MSE 的平方根,使誤差返回到模型的度量單位,因爲它對時間序列在平方過程中產生的較大誤差更爲敏感而非常有用。
MAPE——平均絕對百分誤差
這是另一個可用的有趣的指標,它通常在管理報告中使用,因爲誤差是以百分比度量的,所以產品 X 的錯誤可以與產品 Y 的誤差進行比較。
("It's what you do next that counts, not what happens but what you decide to do about it." --《 13 Reasons Whyl 》
)