人工智能裏的數學修煉 | 隱馬爾可夫模型：基於EM的鮑姆-韋爾奇算法求解模型參數

人工智能裏的數學修煉 | 概率圖模型：隱馬爾可夫模型
 人工智能裏的數學修煉 | 隱馬爾可夫模型：前向後向算法
 人工智能裏的數學修煉 | 隱馬爾可夫模型：維特比(Viterbi)算法解碼隱藏狀態序列
 人工智能裏的數學修煉 | 隱馬爾可夫模型：基於EM的鮑姆-韋爾奇算法求解模型參數

隱馬爾可夫模型的參數爲 $\lambda=\{A,B,\pi\}$ , 對餘其參數的求解，可以分爲兩種情況。

第一種情況較爲簡單，就是我們已知長度爲 $T$ 的觀測序列和對應的隱藏狀態序列，即 $\{(O,I)\}$ 是已知的，此時我們可以很容易的用最大似然來求解模型參數。

第二種情況較爲複雜，很多時候，我們無法得到隱馬爾可夫模型觀察序列對應的隱藏序列，即只有 $\{O\}$ 是已知的，此時，我們就需要採用到鮑姆-韋爾奇算法，其實本質上也就是就是EM算法

一、鮑姆-韋爾奇算法原理

鮑姆-韋爾奇算法在每一次迭代中，都分爲E和M兩步，在E步，我們需要基於聯合分佈 $P(O,I|\lambda)$ 和條件概率 $P(I|O,\bar{\lambda})$ 的算出期望 $Q$ （其中 $\bar{\lambda}$ 爲當前迭代中模型參數），然後在M步中極大化這個期望，獲得更新的模型參數 $\lambda$ 。通過不停的EM迭代，使得模型參數收斂

E步的期望表達式爲：
$Q=\sum_{I}P(I|O,\bar{\lambda})logP(O,I|\lambda)$
在M步我們極大化上式，然後得到更新後的模型參數如下：
$\bar{\lambda}=argmax_{\bar{\lambda}}\sum_{I}P(I|O,\bar{\lambda})logP(O,I|\lambda)$ 通過，E步和M步不斷的迭代，我們可以得到收斂的參數 $\bar{\lambda}$ 。
上面的式子可能有些地方不知道該如何計算，接下來講解，具體的推導和計算方法

二、鮑姆-韋爾奇算法的推導

輸入：長度爲 $T$ 的觀測序列 $O=\{(o_{1}),(o_{2}),...,(o_{T})\}$ ，所有的可能的狀態集合 ${q_{1},q_{2},...,q_{N}}$ , 所有可能的觀測集合 ${v_{1},v_{2},...,v_{M}}$
未知：隱藏的狀態序列 $I=\{(i_{1}),(i_{2}),...,(i_{T})\}$
目標: $\lambda=\{A,B,\pi\}$

對於鮑姆-韋爾奇算法的E步，我們需要首先計算聯合分佈 $P(O,I|\lambda)$ 如下：
$P(O,I|\lambda)=\pi_{i1}b_{i1}(o_{1})a_{i1i2}b_{i2}(o_{2})a_{i2i3}...b_{i(T-1)}(o_{T-1})a_{i(T-1)i(T)}b_{iT}(o_{T})$ 因爲條件概率 $P(I|O,\bar{\lambda})=\frac{P(O,I|\lambda)}{P(O,\lambda)}$ 且 $P(O,\lambda)$ 是一個參數, 期望Q可以簡化爲
$Q=\sum_{I}P(O,I|\bar{\lambda})logP(O,I|\lambda)$ 將 $P(O,I|\lambda)$ 帶入上式，我們有
$Q=\sum_{I}P(O,I|\bar{\lambda})log\pi_{i}+\sum_{I}(\sum_{t}^{T}logb_{it}(o_{t}))P(O,I|\bar{\lambda})+\sum_{I}(\sum_{t}^{T-1}loga_{iti(t+1)})P(O,I|\bar{\lambda})$

接下來對於對於鮑姆-韋爾奇算法的M步，我們需要極大化Q，這要求對Q的三個子式子分別求導，可以得到
$\bar{\pi}_{i}=\gamma_{1}(i)$ 其中 $\gamma_{t}(i)=P(i_{t}=q_{i}|O,\lambda)=\frac{P(i_{t}=q_{i},O|\lambda)}{P(O|\lambda))}$ 表示在觀測序列 $O$ 給定的條件下，時刻 $t$ 處於狀態 $q_{i}$ 的概率。
$\bar{a}_{ij}=\frac{\sum_{t=1}^{T-1}\xi_{t}(i,j)}{\sum_{t=1}^{T}\gamma_{t}(i)}$ 這裏 $\xi_{t}{(i,j)}=P(i_{t}=q_{i},i_{t+1}=q_{j}|O,\lambda)$ 表示在觀測序列 $O$ 給定的條件下，時刻 $t$ 處於狀態 $q_{i}$ 且時刻 $t+1$ 處於 $q_{j}$ 的概率。
$\bar{b}_{j}(k)=\frac{\sum_{t-1}^{T}\gamma_{t}(j)I(o_{t}=v_{k})}{\sum_{t=1}^{T}\gamma_{t}(j)}$

三、鮑姆-韋爾奇算法的流程

初始化參數 $\bar{\lambda}=\{A,B,\pi\}$
更新迭代參數
$\bar{\pi}_{i}=\gamma_{1}(i)$
$\bar{a}_{ij}=\frac{\sum_{t=1}^{T-1}\xi_{t}(i,j)}{\sum_{t=1}^{T}\gamma_{t}(i)}$
$\bar{b}_{j}(k)=\frac{\sum_{t-1}^{T}\gamma_{t}(j)I(o_{t}=v_{k})}{\sum_{t=1}^{T}\gamma_{t}(j)}$
模型收斂，停止迭代

人工智能裏的數學修煉 | 隱馬爾可夫模型：基於EM的鮑姆-韋爾奇算法求解模型參數

一、鮑姆-韋爾奇算法原理

二、鮑姆-韋爾奇算法的推導

三、鮑姆-韋爾奇算法的流程

redis的key亂碼問題和值自增問題

CORS error 但是 status code 是200 OK

一個開源且全面的C#算法實戰教程

一款.NET開源、功能強大、跨平臺的繪圖庫 - OxyPlot

壓縮上傳的GPU數據的方案

使用skopeo同步鏡像

DeepLearning | 圖卷積網絡基於拓撲結構的分類（T-GCN）

機器學習教程之半監督學習基於圖正則項的半監督極限學習機

機器學習教程之 EM算法：高斯混合模型聚類算法 (python基於《統計學習方法》實現，附數據集和代碼)

人工智能裏的數學修煉 | 隱馬爾可夫模型：前向後向算法

DeepLearning | Zero Shot Learning 零樣本學習零樣本工業故障診斷

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結