變量定義
1.warping function
其中
表示兩個語音特徵序列A和B之間的映射關係。
2.time-normalized distance
其中
warping function的限制條件
1.單調性
2.連續性
由以上兩個條件限制了只能向三個方向移動,向上/向右/向右上,而且每次只能移動一步
3.邊界條件
4.窗口限制
加窗爲了將對齊路徑限制在對角線附近。
5.斜率限制
避免在橫軸i方向或縱軸j方向走的太偏,當在一個方向走了m步以後,需要在對角線方向走n步。
權重係數w
有兩種典型的計算方式
1.對稱形式
2.非對稱形式
在j方向也一樣。
對稱形式的效果更好。
DP求解
假設使用對稱形式的權重係數,不使用斜率限制
- 初始條件
- DP
其中窗口限制條件
- 距離
算法流程圖如下:
Reference
Dynamic Programming Algorithm Optimization for Spoken Word Recognition