自然語言處理之維特比(Viterbi)算法

原創

2020-07-03 11:57

維特比算法 (Viterbi algorithm) 是機器學習中應用非常廣泛的動態規劃算法，在求解隱馬爾科夫、條件隨機場的預測以及seq2seq模型概率計算等問題中均用到了該算法。實際上，維特比算法不僅是很多自然語言處理的解碼算法，也是現代數字通信中使用最頻繁的算法。在介紹維特比算法之前，先回顧一下隱馬爾科夫模型，進而介紹維特比算法的計算步驟。

以下爲一個簡單的隱馬爾科夫模型，如下圖所示：

其中x = (x1, x2, ..., xN) 爲隱狀態序列，y = (y1, y2, ..., yN) 爲觀測序列，要求的預測問題爲：

依據馬爾科夫假設，上式等價於：

在隱馬爾科夫鏈中，任意時刻t下狀態的值有多個，以拼音轉漢字爲例，輸入拼音爲“yike”可能有的值爲一棵，一刻或者是一顆等待，用符號xij表示狀態xi的第j個可能值，將狀態序列按值展開，就得到了一個籬笆網了，這也就是維特比算法求解最優路徑的圖結構：

隱馬爾科夫的預測問題就是要求圖中的一條路徑，使得該路徑對應的概率值最大。對應上圖來講，假設每個時刻x可能取的值爲3，如果直接求的話，有3^N的組合數，底數3爲籬笆網絡寬度，指數N爲籬笆網絡的長度，計算量非常大。維特比利用動態規劃的思想來求解概率最大路徑（可理解爲求圖最短路徑），使得複雜度正比於序列長度，複雜度爲O(N⋅D⋅D), N爲長度，D爲寬度，從而很好地解決了問題的求解。

維特比算法的基礎可以概括爲下面三點（來源於吳軍：數學之美）：

1、如果概率最大的路徑經過籬笆網絡的某點，則從開始點到該點的子路徑也一定是從開始到該點路徑中概率最大的。

2、假定第i時刻有k個狀態，從開始到i時刻的k個狀態有k條最短路徑，而最終的最短路徑必然經過其中的一條。

3、根據上述性質，在計算第i+1狀態的最短路徑時，只需要考慮從開始到當前的k個狀態值的最短路徑和當前狀態值到第i+1狀態值的最短路徑即可，如求t=3時的最短路徑，等於求t=2時的所有狀態結點x2i的最短路徑加上t=2到t=3的各節點的最短路徑。

爲了紀錄中間變量，引入兩個變量sigma和phi，定義t時刻狀態爲i的所有單個路徑 (i1, i2, ..., it) 中最大概率值（最短路徑）爲（前文小修已經有介紹隱馬爾科夫相關的概念，如果不清楚可以看一下前面的詳解隱馬爾可夫模型 (HMM) ）: