EMD經驗模態分解——分析時間序列

EMD,(Empirical Mode Decomposition),經驗模態分解,美國工程院士黃鍔博士於1998年提出的一種信號分析方法。
是一種自適應的數據處理或挖掘方法,非常適合非線性,非平穩時間序列的處理,本質上是對數據序列或信號的平穩化處理。

1:關於時間序列平穩性的一般理解:

所謂時間序列的平穩性,一般指寬平穩,即時間序列的均值和方差爲與時間無關的常數,其協方差與時間間隔有關而也與時間無關。簡單地說,就是一個平穩的時間序列指的是:遙想未來所能獲得的樣本時間序列,我們能斷定其均值、方差、協方差必定與眼下已獲得的樣本時間序列等同。
反之,如果樣本時間序列的本質特徵只存在於所發生的當期,並不會延續到未來,亦即樣本時間序列的均值、方差、協方差非常數,則這樣一個時間序列不足以昭示未來,我們便稱這樣的樣本時間序列是非平穩的。
形象地理解,平穩性就是要求經由樣本時間序列所得到的擬合曲線在未來的一段時間內仍能順着現有的形態“慣性”地延續下去;如果數據非平穩,則說明樣本擬合曲線的形態不具有“慣性”延續的特點,也就是基於未來將要獲得的樣本時間序列所擬合出來的曲線將迥異於當前的樣本擬合曲線。
事實上,世界上幾乎不存在理想的“平穩”時間序列。歐陽首承教授曾指出:“平穩序列性消除了小概率事件”。即在歐陽教授的潰變論看來,EMD這一方法也是有問題的。但是,該方法確實擴展了平穩化這一傳統思想的應用範圍,即擴展到了對任何類型的時間序列的處理,也是了不起的新進展。

2:EMD方法:

EMD 方法在理論上可以應用於任何類型的時間序列(信號)的分解,因而在處理非平穩及非線性數據上,比之前的平穩化方法更具有明顯的優勢。所以,EMD方法一經提出就在不同的工程領域得到了迅速有效的應用,例如用在海洋、大氣、天體觀測資料與地球物理記錄分析等方面。
該方法的關鍵是它能使複雜信號分解爲有限個本徵模函數(Intrinsic Mode Function,簡稱IMF),所分解出來的各IMF分量包含了原信號的不同時間尺度的局部特徵信號。EMD分解方法是基於以下假設條件:
⑴數據至少有兩個極值,一個最大值和一個最小值;
⑵數據的局部時域特性是由極值點間的時間尺度唯一確定;
⑶如果數據沒有極值點但有拐點,則可以通過對數據微分一次或多次求得極值,然後再通過積分來獲得分解結果。

經驗模態分解的基本思想:將一個頻率不規則的波化爲多個單一頻率的波+殘波的形式。原波形 = ∑ IMFs + 餘波

這種方法的本質是通過數據的特徵時間尺度來獲得本徵波動模式,然後分解數據。這種分解過程可以形象地稱之爲“篩選(sifting)”過程。

分解過程是:
找出原數據序列X(t)所有的極大值點, 並用三次樣條插值函數擬合形成原數據的上包絡線;
找出所有的極小值點,並將所有的極小值點通過三次樣條插值函數擬合形成數據的下包絡線,
上包絡線和下包絡線的均值記作ml(其實,有學者將平均值改用中位值,可能更合理,因爲是非平穩時間序列),
將原數據序列X(t)減去該平均包絡ml,得到一個新的數據序列hl,:

X(t)ml=hl

由原數據減去包絡平均後的新數據,若還存在負的局部極大值和正的局部極小值,說明這還不是一個本徵模函數,需要繼續進行“篩選”。如下圖示意:

EMD


3:簡析:

本人接觸到這一方法,是從油田測井信號序列的經驗模態分解專業文章而獲知該法的。隨後閱讀了不少EMD法在不同領域的應用,特別是在處理金融信號數據序列方面,引發我很大的興趣和共鳴。
經驗模態分解依據數據自身的時間尺度特徵來進行信號分解,即局部平穩化,而無須預先設定任何基函數。這一點與建立在先驗性假設的諧波基函數(或基頻)和小波基函數上的傅里葉分解與小波分解方法具有本質性的差別。這與本人使用的浮動頻率法有共同之處,此爲共鳴之一。翁文波曾指出傅立葉的基頻假設在數據有限的情況下,信號序列(數據)中特性頻率與基頻的諧和頻率不一致,就會導致信號的嚴重失真,因此而提出了浮動頻率法。黃博士似乎也看到了這一點,這從他的命名爲“經驗模態分解”就可窺知,即”Empirical”這個詞與“transzendental(先驗的)”相對,等於強調了與先驗的傅立葉和小波分解法的不同。翁和黃都從此處觸發即出發而提出了各自的創新概念和方法,有異曲同工之妙。
這個IMF序列,從我讀到的包括黃博士在內諸多文獻中,雖然稱之爲函數,實際表現爲處理篩選後的數據序列,可用圖形表達,而未見歸納爲函數方程。IMF的典型圖形,例如滬指的IMF如下圖所僅僅示意的最後4個低頻IMF函數序列:

這裏寫圖片描述

上圖中的IMF1—IMF3疊合起來,就基本可以重構出滬指的走勢:基本與股指一致,類似與一根均線。

這裏寫圖片描述

從上面的分解到重構的過程看:
其實就是個減法到加法的過程,
減法求異,剝離出頻率(週期)大致相同的IMF,
而加法求同,回到原波形。
餘波其實是個趨勢線,即頻率極低(週期很長)的波,可以看成是個基底,其它IMF都建築在它之上。

有意思的是,篩選出的本徵模函數IMF(包括餘波)可以代表實在的物理意義,
即其震動模式必然地對應有物理成因。
而在股指分解出的IMF則應該對應宏觀經濟成因。
比如第一幅圖中的IMF2就與CPI或PPI走勢幾乎一致,且週期也一致;
而IMF1則與平滑後季度GDP增長率基本一致,也與發電量或工業增加值的大趨勢大體一致。

也就是說,這種新穎的技術分析也得出:股指是反映宏觀基本面的。本博曾推薦跟隨CPI走勢做股市的方法,從這個EMD分解法也得以證明是可行的。我國的CPI這10幾年來一直遵循大概42個月的循環規律,可以用一個正弦波形象之。而IMF則是幾個正弦波的複合結果。
對比浮動頻率法,則浮動頻率法僅僅是找出信號序列中的實際頻率,而本正模函數(IMF)則是既找出浮動頻率也找出包括不同振幅的複雜信號序列中的震動模態序列。IMF更接近實際的時間序列。我看到的大多數應用這一方法的作者,可能對浮動頻率法不瞭解。如果這一方法僅僅停留在提取IMF的階段,並在此基礎上分析平均週期,則仍可能使得週期信號失真。因此,嘗試把二者結合起來是個可能的路徑。
當然,宏觀基本面的分析是基礎,是可以與技術分析結合起來的。如下圖所示:

這裏寫圖片描述

上圖中的宏觀數據取不同權重後疊加複合結果看,與股指的運行方向首先是一致的,方向也是信息,甚至是比數量更重要的信息。缺點是更具體的準確的時間點不大容易確定。
所用的方法其實就是簡單的加法,加法的求同原理,使得方向凸現,而使得我們獲得直觀的方向性信息。
人類總是通過不同路徑去逼近現實,但總是存在不完備哦!!

原文鏈接:http://blog.sina.com.cn/s/blog_55954cfb0102e9y2.html

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章