李宏毅《Speech Recognition》学习笔记3 - Beam Search

原創

2020-06-20 04:19

最近在学习语音识别的知识，发现李宏毅老师今年也出了相应的视频，相应的课件可以从下面的位置获取：http://speech.ee.ntu.edu.tw/~tlkagk/courses_DLHLP20.html

Youtube视频：
https://youtu.be/AIKu43goh-8
https://youtu.be/BdUeBa6NbXA
https://youtu.be/CGuLuBaLIeI
课件：
http://speech.ee.ntu.edu.tw/~tlkagk/courses/DLHLP20/ASR%20%28v12%29.pdf

Beam Search只是课件中的一小部分，之所以单独提出来，是因为前几天才看过，又看李宏毅老师的视频，觉得讲的通俗易懂，值得推荐。

上图中，红色路径称为Greedy Decoding，本质是寻找当前最大概率的路径，也就是局部最优解，而不是最优解。其中，绿色路径是全局最优解。

为了解决这个问题，每次搜索时，保留B个最优分支，如下图，B=2时，就可以得到全局最优解。

Beam Seach的beam size是可以调整的参数，参数的调整会影响到最优解的结果。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

李宏毅《Speech Recognition》学习笔记1 - 语音识别概念

最近在學習語音識別的知識，發現李宏毅老師今年也出了相應的視頻，相應的課件可以從下面的位置獲取：http://speech.ee.ntu.edu.tw/~tlkagk/courses_DLHLP20.html Youtube視頻：

dupei

2020-06-20 04:19:36

李宏毅《Speech Recognition》学习笔记4 - CTC

dupei

2020-06-20 04:19:36

kaldi的编译安装与报错解决方法

引入 kaldi是語音識別領域，最常用的一個工具。它自帶了很多特徵提取模塊，能提取MFCC/ivector/xvector等語音特徵；也自帶了很多語音模型代碼，可以直接使用或重新訓練GMM-HMM等模型；它還支持GPU進行訓練。

ybdesire

2020-06-16 05:23:50

语音合成技术新手区&KALDI语音识别新手区

JamesJuZhang

2020-06-02 01:23:31

语言模型

dupei

2020-03-17 03:14:50

李宏毅《Speech Recognition》学习笔记2 - LAS

dupei

2020-03-13 21:23:43

warp-transducer源码安装，warprnnt_pytorch生成

warp-transducer是可以在CPU和GPU上實現並行RNN-transducer的開源庫，現在支持pytroch和tensorflow的調用，主要用來計算RNNTLoss，本文是在ubuntu18.04的系統上進行的。

栋次大次

2020-06-29 00:55:18

李宏毅《Speech Recognition》学习笔记1 - 语音识别概念

dupei

2020-06-20 04:19:36

李宏毅《Speech Recognition》学习笔记4 - CTC

dupei

2020-06-20 04:19:36

kaldi的编译安装与报错解决方法

ybdesire

2020-06-16 05:23:50

机器之心对俞栋的采访

轉http://sanwen8.cn/p/5c32E5V.html 機器之心：從您和鄧力老師的那本書《Automatic Speech Recognition： A Deep Learning Approach》出版到現在，您認爲期間深度

huchad

2020-06-15 04:37:41

一个典型的语音识别系统

liqiang4113

2020-06-13 10:25:51

语音合成技术新手区&KALDI语音识别新手区

JamesJuZhang

2020-06-02 01:23:31

语言模型

dupei

2020-03-17 03:14:50

李宏毅《Speech Recognition》学习笔记2 - LAS

dupei

2020-03-13 21:23:43

24小時熱門文章

李宏毅《Speech Recognition》学习笔记3 - Beam Search

诈骗（杀猪盘）网站进行渗透测试

Python 潮流周刊#50：我最喜欢的 Python 3.13 新特性！

【Python】保存gym截图

【译】使用 GitHub Copilot 作为你的编码 GPS

Linux 服务器配置-安装portainer-ce社区版

外行也能读懂的网络硬件设备功能原理速成

安装Auto-GPT

李宏毅《Speech Recognition》學習筆記3 - Beam Search

python性能分析

李宏毅《Deep Learning》學習筆記 - RNN

李宏毅《Deep Learning》學習筆記 - seq2seq

李宏毅《Speech Recognition》學習筆記1 - 語音識別概念

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結