隱馬爾科夫模型(Hidden Markov Model, HMM)

1.生成模型，對 $p (x, y)$ 進行建模

2.符號說明

SYMBOLS	meanings
$Q {q_{1}, q_{2}, \dots, q_{n}}$	可能的狀態集合
$V {v_{1}, v_{2}, \dots, v_{n}}$	可能的觀測集合
$I {i_{1}, i_{2}, \dots, i_{n}}$	真實的狀態集合
$O {o_{1}, o_{2}, \dots, o_{n}}$	真實的觀測集合
$A = [a_{i j}]_{N * N}$	狀態轉移矩陣
$B = [b_{j} (k)]_{N * M}$	觀測概率矩陣
$π_{i} = p (i_{1} = q_{i})$	初始狀態概率向量

其中 $a_{i j} = p (i_{t + 1} = q_{j} | i_{t} = q_{i}), b_{j} (k) = p (o_{t} = v_{k} | i_{t} = q_{j})$ .

3.模型假設:

①齊次馬爾科夫假設：任意時刻，當前狀態只與上一個狀態有關。

\forall t, p (i_{t} | i t - 1, o t - 1, \dots, i_{1}, o_{1}) = p (i_{t} | i_{t - 1})

②觀測獨立性假設：任意時刻，觀測僅依賴於當前狀態。

\forall t, p (o_{t} | i_{t}, o_{t}, i_{t - 1}, o_{t - 1}, \dots, i_{1}, o_{1}) = p (o_{t} | i_{t})

4.問題

**①估計問題(Evaluation)**

    給定模型$\lambda = (A,B,\pi)$和觀測序列$O$,計算$O$出現的概率$p(O|\lambda)$.

**解法：**

直接計算(注意這裏 $λ$ 是一個固定參數，而不是一個隨機變量，正常應該寫成分號?)

p (O | λ) = \sum_{I} p (O, I | λ) = \sum_{I} p (O | I, λ) p (I | λ)

    但是由於$I$的組合數目太多，這個計算量非常大，其複雜度爲$O(N^T)$。

p (O | I, λ) = b_{i_{1}} (o_{1}) b_{i_{2}} (o_{2}) \dots b_{i_{t}} (o_{t})

p (I | λ) = π_{i_{1}} a_{i_{1}, i_{2}} a_{i_{2}, i_{3}} \dots a_{i_{t - 1}, i_{t}}

p (O, I | λ) = \sum_{i_{1}, i_{2}, \dots, i_{t}} π_{i_{1}} b_{i_{1}} (o_{1}) a_{i_{1}, i_{2}} b_{i_{2}} (o_{2}) a_{i_{2}, i_{3}} \dots b_{i_{t - 1}} (o_{t - 1}) a_{i_{t - 1}, i_{t}} b_{i_{t}} (o_{t})

前向算法

定義 $α_{t} (i) = p (o_{1}, o_{2}, \dots, o_{t}, i_{t} = q_{i} | λ)$ ,即在t時刻觀測序列爲 $o_{1}, o_{2}, \dots, o_{t}$ ,狀態爲 $q_{i}$ 的概率，稱其爲前向概率。

則有：

$α_{t + 1} (i) = \sum_{j = 1}^{N} α_{t} (j) a_{j i} b_{i} (o_{t + 1})$
$α_{1} (i) = π_{i} b_{i} (o_{1})$
最終：

$p (O | λ) = \sum_{i = 1}^{N} α_{T} (i)$
最終算法轉變爲動態規劃，算法複雜度爲 $O (T * N^{2})$ .
後向算法

定義 $β_{t} (i) = p (o_{t + 1}, o_{t + 2}, \dots, o_{T}, i_{t} = q_{i} | λ)$ ,即在t時刻，其後的觀測序列爲 $o_{t + 1}, o_{t + 2}, \dots, o_{T}$ ,狀態爲 $q_{i}$ 的概率，稱其爲後向概率。

則有：

$β_{t} (i) = \sum_{j = 1}^{N} a_{i j} b_{j} (o_{t + 1}) β_{t + 1} (j)$

$β_{T} (i) = 1$

最終：

$p (O | λ) = \sum_{i = 1}^{N} π_{i} b_{i} (o_{1}) β_{1} (i)$

最終算法轉變爲動態規劃，算法複雜度爲 .
```
**② 學習問題(Learning)**

學習模型參數，分爲兩種情況：
```
${\begin{cases} A . & 知道观测序列和对应的状态序列 \\ B . & 仅知道观测序列 \end{cases}$

解法：
Case A.

極大似然估計

$\hat{a_{i j}} = \frac{A_{i j}}{\sum_{j} A_{i j}}$
$\hat{b_{j} (k)} = \frac{B_{j k}}{\sum_{k} B_{j k}}$
$A_{i j}$ 是t時刻處於狀態 $i$ ，在t+1時刻轉移到狀態 $j$ 的頻數。

$B_{j k}$ 爲狀態j觀測到k的頻數。
Case B.

EM算法估計，狀態序列爲隱變量。

③預測算法（解碼問題，Decoding）
```
給定模型$\lambda$和觀測預測$O$，求狀態序列。

**解法：**
```
近似算法

在t時刻處於狀態i的概率是:

$γ_{t} (i) = p (i_{t} = q_{i} | O, λ) = \frac{p (i_{t} = q_{i}, O | λ)}{p (O | λ)} = \frac{α_{t} (i) β_{t} (i)}{\sum_{j} α_{t} (j) β_{t} (j)}$
$i_{t}^{*} = \arg max_{1 \leq i \leq N} [γ_{t} (i)]$
最終得到的狀態序列爲 $I^{*} = (i_{1}^{*}, i_{2}^{*}, \dots, i_{T}^{*})$ .

缺點：不能保證預測的狀態序列整體是最有可能的狀態序列，因爲預測的狀態序列可能有實際不發生的部分。
維特比算法（動態規劃算法的一種）

即記錄到當前爲止，觀測序列最有可能的狀態序列，然後回溯。稱爲最大概率路徑。

記錄的表結構爲 $T * N$ 。T爲觀測序列長度，N爲狀態可能數目。

Machine Learning Series No.9 -- HMM(Hidden Markov Model)

隱馬爾科夫模型(Hidden Markov Model, HMM)

1.生成模型，對 $p (x, y)$ 進行建模

2.符號說明

3.模型假設:

4.問題

Machine Learning Series No.8 -- CRF(Conditional Random field)

Machine Learning Series No.7 -- Max Entropy

Machine Learning Series No.9 -- HMM(Hidden Markov Model)

Deep Learning in Search & Recommendation

Machine Learning Series No.7 -- HMM(Hidden Markov Model)

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結

Machine Learning Series No.9 -- HMM(Hidden Markov Model)

隱馬爾科夫模型(Hidden Markov Model, HMM)

1.生成模型，對p(x,y)p(x,y) 進行建模

2.符號說明

3.模型假設:

4.問題

1.生成模型，對 $p (x, y)$ 進行建模