時間序列處理方法

時間序列處理方法

1、ARIMA模型
ARIMA模型,是統計學中的常見對時間序列處理的模型,全稱爲自迴歸移動平均模型。
ARIMA模型主要有p,d,q三個參數。

p--代表預測模型中採用的時序數據本身的滯後數(lags) ,也叫做AR/Auto-Regressive項
d--代表時序數據需要進行幾階差分化,纔是穩定的,也叫Integrated項。
q--代表預測模型中採用的預測誤差的滯後數(lags),也叫做MA/Moving Average項

2.應用步驟

1.數據讀取

把索引轉換成時間索引;

# -*- coding:utf-8 -*-
import numpy as np
import pandas as pd
from datetime import datetime
import matplotlib.pylab as plt
# 讀取數據,pd.read_csv默認生成DataFrame對象,需將其轉換成Series對象
df = pd.read_csv('AirPassengers.csv', encoding='utf-8', index_col='date')
df.index = pd.to_datetime(df.index)  # 將字符串索引轉換成時間索引
ts = df['x']  # 生成pd.Series對象
# 查看數據格式
ts.head()
ts.head().index

2.繪製圖,觀察序列是否爲平穩序列,若否,則進行d階差分,轉化成平穩數列。
3.對平穩序列獲取,自相關係數ACF和偏相關係數PACF;從而得到最佳的階層p和階數q;
4.獲得ARIMA模型,進行預測。

————
參考:

  1. https://www.kesci.com/home/project/5a349f31da263370ab5f89c4;
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章