1. 自相關函數
自相關函數:Autocorrelation Function(ACF) ,是時間序列分析的基礎,沒有這個就不用分析了。
下面提到的幾點都是以這個概念爲基礎的。
自相關係數是從相關係數演變出來的,是用來表述時間序列中k個間隔的單元存在的相關性。
參考:金融時間序列分析:2. 數學分析模型
k階自相關函數:
自相關係數:
2. 滯後算子
依然使用AR(2)模型來解釋
其中:
由於上式ρk,ρk-2存在一個2階階差,看起來不直觀, 用滯後算子改寫以上公式
改寫後:
如此就可以對滯後算子進行求解。
滯後算子描述了ACF的週期,衰減等方面的特性,具體參考:
金融時間序列分析:4. AR自迴歸模型
3. 模型參數
3.1 ACF, PACF,EACF
PACF,EACF是ACF的變種,ACF參考前文。
爲什麼可以用ACF定階?
ACF -
上圖是GNP的ACF圖,上下虛線之間的區域是[-0.05, 0.05],即爲不顯著區間,當兩個樣本的相關性在[-0.05, 0.05]區間中,其相關性不顯著,我們可以認爲二者不相關。
在來看上面那張圖:
k = 0: ρ = 1
k = 1: ρ > 0.05
k = 2: ρ > 0.05
….
此時可以判定該模型至少是2階,因爲間隔爲2時具有明顯的相關性。
假如說,當k > 2 時,|ρ| < 0.05,那麼就可以確定模型階數爲2 。但是之後還有|ρ| > 0.05情況,這時可以根據情況考慮:
(1)階數越高模型擬合越精確
(2)階數越高模型越複雜
3.2 AIC,BIC
信息準則,akaike information criterion(AIC)和bayesian information criterion(BIC)是評價模型優良的兩個指標。
讓我們來理解AIC的含義,AIC由兩部分組成,一部分是對數極大似然函數,另一部分則是參數的個數。極大似然函數是評價模型擬合優劣性的指標,值越大說明擬合的效果越好。然而使用過多的參數可以擬合的很好卻會出現過度擬合的情況,這樣的模型泛化能力很差,因此加上參數的個數實際上是對極大似然函數進行”懲罰“。選取AIC值最小的模型作爲最優模型,實質上是平衡了欠擬合和過擬合。
對於AR(l)模型來說:
在AIC中每個參數的懲罰係數都爲2,而在BIC中爲ln(l),因此和AIC相比,樣本容量適度或者較大時,BIC傾向於選着低階模型。
實例:
AIC:
k = 9 最小,k = 3次之。
BIC:
k = 3最小
4. 擬合優度
擬合優度(goodness to fit)是用來如何衡量一個模型對數據的擬合的優劣,常用的統計量
對於AR(p)模型來說,假設有T個觀測值{x| t= 1, …., T},
當
5. 參考文獻
[1] 金融時間序列分析, Ruey S. Tray
[2] AR、MA及ARMA模型