必要的數學知識

1.聯合概率與邊緣概率

聯合概率是指多維隨機變量中同時滿足多個變量時候的概率，也就是共同發生的概率。A,B的聯合概率通常寫成 P(A∩B)或 P(AB)或 P(AB)。對於離散的變量，聯合概率可以用表格形式表示或者求和表示，連續的變量可以使用積分表示（若是二維就一個二重積分）

邊緣概率是指多維隨機變量中只滿足部分變量時的概率。圖片幫助理解：

聯合概率與邊緣概率的關係：

邊緣概率分佈公式

聯合概率的條件概率鏈式法則

舉例：P(a,b,c)=P(a|b,c)*P(b,c）=P(a|b,c)*P(b|c)*P(c)

條件概率

獨立性（XY相互獨立）

P（X,Y）=P(X) *P(Y)

條件獨立性

P（X,Y|Z）=P(X|Z)*P(Y|Z)

2.EM算法

關於EM算法利用jensen不等式近似實現極大似然估計的推導過程：https://zhuanlan.zhihu.com/p/36331115

隱馬爾可夫模型（HMM）

1.基本模型樣式

上圖中，白圈代表狀態變量，藍圈代表觀測變量。所以白圈那一行是狀態序列（隱狀態），而白圈這一行是觀測序列。

2.模型的數學表達

HMM由隱含狀態S、可觀測狀態O、初始狀態概率矩陣pi、隱含狀態概率轉移矩陣A、可觀測值轉移矩陣B（混淆矩陣）組成，可以使用一個三元組進行表述：

3.Markov兩個假設

（1）齊次假設：表示 t 時刻的狀態只與 t-1 時刻的狀態有關

（2）觀測獨立性假設：表示 t 時刻的觀測變量只與 t 時刻的狀態有關

4.解決三個問題

（1）概率計算問題(Evalution )：前向後向算法，已知模型 λ = (A, B, π)和觀測序列O={o1, o2, o3 ...}，計算模型λ下觀測O出現的概率P(O | λ)；

（2）學習問題（learning）：EM算法，已知觀測序列O={o1, o2, o3 ...}，計算估計模型λ = (A, B, π)的參數即推斷狀態的轉移情況，使得在該參數下該模型的觀測序列P(O | λ)最大；

（3）預測問題（Decoding）：Viterbi算法，已知模型λ = (A, B, π)和觀測序列O={o1, o2, o3 ...}，求給定觀測序列條件概率P(I | O，λ)最大的狀態序列 I；

4.1HMM模型的實質

HMM實際上就是建立建模 P(O,Q),對於給定的lamda 進行建模：

5.關於轉移矩陣AB及Pai的定義

5.1狀態轉移矩陣A

根據Markov齊次假設去定義狀態轉移矩陣是一個NxN的矩陣，表示一個狀態有N種可能性，前一個狀態也有N種可能性。aij表示狀態從前一個的 i 狀態轉變爲現在的 j 狀態的概率。

上述式中 q 表示狀態，所以 qt 表示 t 時刻的轉態。

5.2 觀測概率矩陣B（混淆矩陣）：

根據Markov 觀測獨立性假設定義觀測概率矩陣B是一個NxM的矩陣，表示對於N種狀態，在這N種狀態下對應的M個可觀測變量的概率（比如說在晴天狀態下，觀測到的溼度、溫度、風速等觀測量的概率）。bj(k)表示 j 狀態下的第 k 個觀測量的概率。

上式中P（ot=vk|it=qj）表示t 時刻狀態爲 qj 的情況下，t 時刻觀察量爲 vk的概率。

5.3 隱藏狀態概率分佈 pai（t=1時刻的狀態）

舉例總結：

針對上述將的幾個轉移矩陣概念和初始狀態pai，舉出一個盒子中摸球的例子幫助理解。

摸球規則：

　　開始的時候，從第一個盒子抽球的概率是0.2，從第二個盒子抽球的概率是0.4，從第三個盒子抽球的概率是0.4。以這個概率抽一次球后，將球放回。然後從當前盒子轉移到下一個盒子進行抽球。規則是：如果當前抽球的盒子是第一個盒子，則以0.5的概率仍然留在第一個盒子繼續抽球，以0.2的概率去第二個盒子抽球，以0.3的概率去第三個盒子抽球。如果當前抽球的盒子是第二個盒子，則以0.5的概率仍然留在第二個盒子繼續抽球，以0.3的概率去第一個盒子抽球，以0.2的概率去第三個盒子抽球。如果當前抽球的盒子是第三個盒子，則以0.5的概率仍然留在第三個盒子繼續抽球，以0.2的概率去第一個盒子抽球，以0.3的概率去第二個盒子抽球。

　　從紫色背景的摸球規則中，可以推斷出初始矩陣：