簡與美(5)

當我搞明白了要把隱馬模型說清楚至少再需要3篇的時候,我覺得這是一個陷阱了。不過既然已經決定去做,也有着美好的願望,就勇往直前吧。
有同學反映寫的太難理解了,涉及太多的算法。我已經是很努力的寫清晰了,那些算法的內裏是很美妙的感覺,希望有興趣的同學能夠仔細品味,也可以找一些paper加深理解,實在看不懂,那我只能抱歉了。
 
腦中的數學是抽象的,手中的數學是簡單的。
 
關於隱馬模型,我大概需要分三篇來寫,也可能會更多或者更少,儘量以最適合的篇幅來寫吧。
 
這一篇我的目標是把隱馬模型講清楚,講透徹。
 
先從字面理解一下,隱馬爾科夫模型是隱含的馬爾科夫模型的意思,那麼什麼是馬爾科夫模型呢?爲什麼這個馬爾科夫模型要隱含起來呢?顯然,我們從馬爾科夫模型的介紹開始是合適的。
 
如果一個過程的“將來”僅僅依賴於“現在”而不依賴於“過去”,那麼這個過程具有馬爾科夫性,或者稱此過程爲馬爾科夫過程。數學表達爲:X(t+1) = f(X(t))。
 
時間和狀態都離散的馬爾科夫過程稱爲馬爾科夫鏈。鏈的狀態空間記作I={a1,a2,...}。在時間集T={0,1,2,...}上對離散狀態的過程相繼觀察的結果構成一個觀察序列{X0,X1,...}。條件概率Pij(m,m+n)=P(Xm+n=aj|Xm=ai)爲馬爾科夫鏈在時刻m處於狀態ai條件下,在時刻m+n轉移到狀態aj的轉移概率。
 
由於鏈在時刻m從任何一個狀態ai出發,到另一時刻m+n,必然轉移到a1,a2,...,的其中某一個狀態,所以有:Pi0(m,m+n)+Pi1(m,m+n)+..Pij(m,m+n)+..=1,i=1,2,...。當Pij(m,m+n)與m無關時(Pij(m,m+n)=Pij(s,s+n)),稱馬爾科夫鏈爲齊次馬爾科夫鏈,通常說的馬爾科夫鏈都是指齊次馬爾科夫鏈。
 
經過了教科書式的概念解釋之後,我們來看看馬爾科夫模型吧,馬爾科夫模型的狀態是有限的。可以記作N={0,1,2,..,n},每兩個狀態之間或者每個狀態和自身的轉移概率構成一個n*n的轉移概率矩陣A。馬爾科夫模型就是一個二元組{N,A}。例如,有三種天氣分別爲:晴天,陰天,下雨。其對應狀態爲:{1,2,3}。狀態轉移矩陣爲:
0.50  0.25  0.25
0.375 0.25  0.375
0.25  0.125 0.625
可以看到,每一行的概率之和爲1。我們還需要注意一點,假設我們有觀察序列:{晴天,晴天,陰天,陰天,下雨}。那麼很容易得到他的狀態轉移序列是:{1,1,2,2,3},因爲狀態和觀察值是一一對映的。這是要特別留意的,因爲我們下面介紹隱馬爾科夫模型的時候,我們會知道隱馬爾科夫模型的狀態和觀察值不是一一對映的,一個狀態可能有多個觀察值,這就是爲什麼叫做隱含馬爾科夫的原因了。
 
我們下面詳細討論隱馬爾科夫模型。
 
上面我們舉了天氣的例子來說明馬爾科夫模型,那麼隱馬爾科夫模型我們也舉一個例子說明,對比着理解會更清晰。這是一個經典的例子。
 
設有N個缸,每個缸中裝有很多彩球,球的顏色共有M種,做如下實驗:
房間內的人隨機選擇一個缸,然後從已經選擇的缸中再隨機取出一個小球,這個小球遞給房間外的人記錄他的顏色,重複這個過程,再隨機選擇一個缸,...
最終房間外的人會得到一個顏色序列O1,O2,...,稱爲觀察值序列O。
在上述實驗中,要注意幾點:
1、不清楚房間內的人依次選擇的是哪些缸。
2、每次從缸中取出的小球顏色不固定,也即是隨機M種的其中一種。
如果我們把缸當作狀態,把小球顏色當作觀察值,對比馬爾科夫模型來分析,我們得到一組觀察值序列:O1,O2,...,我們並不能簡單的得到狀態轉移序列,換句話說,房間外面的人只知道依次取出的球的顏色,而不知道房間內的人依次選擇了哪些缸。
 
我們可以出結論了:
隱馬爾科夫模型(HMM)的狀態是不確定或不可見的,只有通過觀察序列的隨機過程才能表現出來。觀察到的事件與狀態不是一一對映的,而是通過一組概率分佈想聯繫的。
HMM是一個雙重隨機過程,兩個隨機過程分別是:
馬爾科夫鏈,描述狀態的轉移,用轉移概率描述。
一般隨機過程,描述在某個狀態觀察值的選取,用觀察值概率描述。
即:
馬爾科夫鏈-->狀態序列q1,q2,..qT-->隨機過程-->觀察序列O1,O2,..OT-->
 
馬爾科夫模型是一個五元組HMM=(N,M,PI,A,B)。N是狀態集合,M是觀察值集合,PI是初始狀態空間的概率分佈,對應就是第一次選擇某個缸的概率,A是狀態轉移概率分佈,B是給定狀態下,觀察值概率分佈。PI和A描述了馬爾科夫鏈,B描述了一般隨機過程。
 
今天的內容就到這裏吧,我們已經對隱馬爾科夫模型有了一些感性的認識,而隱馬爾科夫模型可解決的問題纔是我們最關心的內容,下一篇就會對隱馬爾科夫模型可以解決的問題做詳細的討論。至於N元模型就要壓後了,沒辦法,時間關係,下個版本上吧。
 
待續...
發佈了30 篇原創文章 · 獲贊 1 · 訪問量 20萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章