DTW(Dynamic Time Warping)算法

原創

2018-09-04 12:14

變量定義

1.warping function

F = c (1), c (2) . . . c (k) . . . c (K)

其中

c(k)=(i(k),j(k))
表示兩個語音特徵序列A和B之間的映射關係。
2.time-normalized distance

D (A, B) = M i n F [\sum K k = 1 d ( c ( k ) ) \cdot w ( k ) \sum K k = 1 w ( k )]

其中

∑w(k) 用來歸一化不同路徑的K大小不一致的問題，

d() 表示兩個特徵向量之間的距離。

warping function的限制條件

1.單調性

i (k - 1) \leq i (k) a n d j (k - 1) \leq j (k)

2.連續性

i (k) - i (k - 1) \leq 1 a n d j (k) - j (k - 1) \leq 1

由以上兩個條件限制了只能向三個方向移動，向上/向右/向右上，而且每次只能移動一步
3.邊界條件

i (1) = 1, j (1) = 1 a n d i (K) = I, j (K) = J

4.窗口限制

| i (k) - j (k) | \leq r

加窗爲了將對齊路徑限制在對角線附近。
5.斜率限制

P = n / m

避免在橫軸i方向或縱軸j方向走的太偏,當在一個方向走了m步以後，需要在對角線方向走n步。

權重係數w

有兩種典型的計算方式
1.對稱形式

w (k) = (i (k) - i (k - 1)) + (j (k) - j (k - 1))

N = \sum k = 1 K w (k) = I + J

2.非對稱形式

w (k) = (i (k) - i (k - 1))

N = \sum k = 1 K w (k) = I

在j方向也一樣。
對稱形式的效果更好。

DP求解

假設使用對稱形式的權重係數，不使用斜率限制
- 初始條件

g (1, 1) = 2 d (1, 1)

- DP

g (i, j) = m i n [g (i, j - 1) + d (i, j) ， g (i - 1, j - 1) + 2 d (i, j) ， g (i - 1, j) + d (i, j)]

其中窗口限制條件

j−r≤i≤j+r
- 距離

D (A, B) = 1 I + J g (I, J)

算法流程圖如下：

Reference

Dynamic Programming Algorithm Optimization for Spoken Word Recognition

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

DTW(Dynamic Time Warping)算法

變量定義

warping function的限制條件

權重係數w

DP求解

Reference

再談23種設計模式（3）：行爲型模式（學習筆記）

Power Automate Desktop 安裝完，登錄後老是提示one driver 錯誤

微前端學習筆記(4):從微前端到微模塊之EMP與hel-micro方案探索

微前端學習筆記（1）：微前端總體架構概述，從微服務發微

985 碩士程序員，空窗 4 個月沒有 Offer！

一文搞懂 Spring 循環依賴

賽博鬥地主——使用大語言模型扮演Agent智能體玩牌類遊戲。

VScode右鍵打開(添加到右鍵)

記一次 .NET某工控視覺自動化系統卡死分析

WindowsServer--SQL Server搭建主從同步實現讀寫分離 - 事務性分發

kaldi feature extraction

kaldi NFS/GlusterFS

kaldi 1d-CNN源碼

cuda 概況和安裝

kaldi 1d-CNN網絡結構

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結