李宏毅《Speech Recognition》學習筆記3 - Beam Search

原創

2020-06-20 04:19

最近在學習語音識別的知識，發現李宏毅老師今年也出了相應的視頻，相應的課件可以從下面的位置獲取：http://speech.ee.ntu.edu.tw/~tlkagk/courses_DLHLP20.html

Youtube視頻：
https://youtu.be/AIKu43goh-8
https://youtu.be/BdUeBa6NbXA
https://youtu.be/CGuLuBaLIeI
課件：
http://speech.ee.ntu.edu.tw/~tlkagk/courses/DLHLP20/ASR%20%28v12%29.pdf

Beam Search只是課件中的一小部分，之所以單獨提出來，是因爲前幾天纔看過，又看李宏毅老師的視頻，覺得講的通俗易懂，值得推薦。

上圖中，紅色路徑稱爲Greedy Decoding，本質是尋找當前最大概率的路徑，也就是局部最優解，而不是最優解。其中，綠色路徑是全局最優解。

爲了解決這個問題，每次搜索時，保留B個最優分支，如下圖，B=2時，就可以得到全局最優解。

Beam Seach的beam size是可以調整的參數，參數的調整會影響到最優解的結果。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

李宏毅《Speech Recognition》學習筆記1 - 語音識別概念

最近在學習語音識別的知識，發現李宏毅老師今年也出了相應的視頻，相應的課件可以從下面的位置獲取：http://speech.ee.ntu.edu.tw/~tlkagk/courses_DLHLP20.html Youtube視頻：

dupei

2020-06-20 04:19:36

李宏毅《Speech Recognition》學習筆記4 - CTC

dupei

2020-06-20 04:19:36

kaldi的編譯安裝與報錯解決方法

引入 kaldi是語音識別領域，最常用的一個工具。它自帶了很多特徵提取模塊，能提取MFCC/ivector/xvector等語音特徵；也自帶了很多語音模型代碼，可以直接使用或重新訓練GMM-HMM等模型；它還支持GPU進行訓練。

ybdesire

2020-06-16 05:23:50

語音合成技術新手區&KALDI語音識別新手區

JamesJuZhang

2020-06-02 01:23:31

語言模型

dupei

2020-03-17 03:14:50

李宏毅《Speech Recognition》學習筆記2 - LAS

dupei

2020-03-13 21:23:43

warp-transducer源碼安裝，warprnnt_pytorch生成

warp-transducer是可以在CPU和GPU上實現並行RNN-transducer的開源庫，現在支持pytroch和tensorflow的調用，主要用來計算RNNTLoss，本文是在ubuntu18.04的系統上進行的。

栋次大次

2020-06-29 00:55:18

李宏毅《Speech Recognition》學習筆記1 - 語音識別概念

dupei

2020-06-20 04:19:36

李宏毅《Speech Recognition》學習筆記4 - CTC

dupei

2020-06-20 04:19:36

kaldi的編譯安裝與報錯解決方法

ybdesire

2020-06-16 05:23:50

機器之心對俞棟的採訪

轉http://sanwen8.cn/p/5c32E5V.html 機器之心：從您和鄧力老師的那本書《Automatic Speech Recognition： A Deep Learning Approach》出版到現在，您認爲期間深度

huchad

2020-06-15 04:37:41

一個典型的語音識別系統

liqiang4113

2020-06-13 10:25:51

語音合成技術新手區&KALDI語音識別新手區

JamesJuZhang

2020-06-02 01:23:31

語言模型

dupei

2020-03-17 03:14:50

李宏毅《Speech Recognition》學習筆記2 - LAS

dupei

2020-03-13 21:23:43

24小時熱門文章

李宏毅《Speech Recognition》學習筆記3 - Beam Search

【面試準備】又一次失敗的面試經歷，題目離譜～資深軟件測試工程師

dotnet 8 版本與銀河麒麟V10和UOS系統的 glibc 兼容性

李宏毅《Speech Recognition》學習筆記3 - Beam Search

python性能分析

李宏毅《Deep Learning》學習筆記 - RNN

李宏毅《Deep Learning》學習筆記 - seq2seq

李宏毅《Speech Recognition》學習筆記1 - 語音識別概念

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結