語言模型

原創

2020-03-17 03:14

在學習自然語言處理是，發現CTC一般會配合語言模型（Language Model），用於提升最終的性能。那麼，語言模型是什麼呢？又是如何提升性能的？

看過一些關於語言模型的介紹，知乎上這一篇文章講的稍顯通俗易懂：https://zhuanlan.zhihu.com/p/52061158

語言模型的本質就是對語句概率的建模，輸入一個語句，給出對應的概率，看看哪個語句的概率更高，更像人話。

常見的語言模型有兩種：統計語言模型（n-gram），神經網絡語言模型(RNN)

統計語言模型

n-gram 語言模型如下:
（1）當n=1時，稱爲uni-gram， $P\left(w_{1}, w_{2}, \ldots, w_{n}\right)=\prod_{i=1}^{n} P\left(w_{i}\right)$
（2）當n=2時，稱爲bi-gram, $P\left(w_{1}, w_{2}, \ldots, w_{n}\right)=\prod_{i=1}^{n} P\left(w_{i} | w_{i-1}\right)$
（3）當n=3時，稱爲tri-gram, $P\left(w_{1}, w_{2}, \ldots, w_{n}\right)=\prod_{i=1}^{n} P\left(w_{i} | w_{i-2}, w_{i-1}\right)$

在這種語言模型中，會用到平滑技術，那麼，平滑技術是爲了解決什麼問題？
利用n-gram生成詞的時候，由於corpus的體量和選取高頻分詞，會導致語句中的一些詞不存在，這樣，會導致語言模型計算的結果爲0，爲了避免這個問題，引入平滑技術。
常用的方法有：Laplace Smoothing，Interpolation，Kneser-Ney，。。。

常用的N-gram訓練工具有SRILM、IRSTLM、BerkeleyLM和KenLM等。目前，用的比較多的是KenLM，有點是速度快、佔用內存少。關於其使用細節，可以參考：https://zhuanlan.zhihu.com/p/84470460

神經網絡語言模型

關於神經網絡語言模型的介紹，參看上面引用的文章。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

李宏毅《Speech Recognition》學習筆記3 - Beam Search

最近在學習語音識別的知識，發現李宏毅老師今年也出了相應的視頻，相應的課件可以從下面的位置獲取：http://speech.ee.ntu.edu.tw/~tlkagk/courses_DLHLP20.html Youtube視頻：

2020-06-20 04:19:37

李宏毅《Speech Recognition》學習筆記1 - 語音識別概念

最近在學習語音識別的知識，發現李宏毅老師今年也出了相應的視頻，相應的課件可以從下面的位置獲取：http://speech.ee.ntu.edu.tw/~tlkagk/courses_DLHLP20.html Youtube視頻：

2020-06-20 04:19:36

李宏毅《Speech Recognition》學習筆記4 - CTC

最近在學習語音識別的知識，發現李宏毅老師今年也出了相應的視頻，相應的課件可以從下面的位置獲取：http://speech.ee.ntu.edu.tw/~tlkagk/courses_DLHLP20.html Youtube視頻：

2020-06-20 04:19:36

kaldi的編譯安裝與報錯解決方法

引入 kaldi是語音識別領域，最常用的一個工具。它自帶了很多特徵提取模塊，能提取MFCC/ivector/xvector等語音特徵；也自帶了很多語音模型代碼，可以直接使用或重新訓練GMM-HMM等模型；它還支持GPU進行訓練。

2020-06-16 05:23:50

語音合成技術新手區&KALDI語音識別新手區

2020-06-02 01:23:31

李宏毅《Speech Recognition》學習筆記2 - LAS

2020-03-13 21:23:43

warp-transducer源碼安裝，warprnnt_pytorch生成

warp-transducer是可以在CPU和GPU上實現並行RNN-transducer的開源庫，現在支持pytroch和tensorflow的調用，主要用來計算RNNTLoss，本文是在ubuntu18.04的系統上進行的。

2020-06-29 00:55:18

李宏毅《Speech Recognition》學習筆記3 - Beam Search

最近在學習語音識別的知識，發現李宏毅老師今年也出了相應的視頻，相應的課件可以從下面的位置獲取：http://speech.ee.ntu.edu.tw/~tlkagk/courses_DLHLP20.html Youtube視頻：

2020-06-20 04:19:37

李宏毅《Speech Recognition》學習筆記1 - 語音識別概念

最近在學習語音識別的知識，發現李宏毅老師今年也出了相應的視頻，相應的課件可以從下面的位置獲取：http://speech.ee.ntu.edu.tw/~tlkagk/courses_DLHLP20.html Youtube視頻：

2020-06-20 04:19:36

李宏毅《Speech Recognition》學習筆記4 - CTC

最近在學習語音識別的知識，發現李宏毅老師今年也出了相應的視頻，相應的課件可以從下面的位置獲取：http://speech.ee.ntu.edu.tw/~tlkagk/courses_DLHLP20.html Youtube視頻：

2020-06-20 04:19:36

kaldi的編譯安裝與報錯解決方法

引入 kaldi是語音識別領域，最常用的一個工具。它自帶了很多特徵提取模塊，能提取MFCC/ivector/xvector等語音特徵；也自帶了很多語音模型代碼，可以直接使用或重新訓練GMM-HMM等模型；它還支持GPU進行訓練。

2020-06-16 05:23:50

機器之心對俞棟的採訪

轉http://sanwen8.cn/p/5c32E5V.html 機器之心：從您和鄧力老師的那本書《Automatic Speech Recognition： A Deep Learning Approach》出版到現在，您認爲期間深度

2020-06-15 04:37:41

一個典型的語音識別系統

一個典型的語音識別系統標籤：語音識別 2015-01-05 16:56 3966人閱讀評論(0) 收藏舉報分類：自然語言識別研究（9）版權聲明：本文爲博主原創文章，未經博主允許不得轉載。

2020-06-13 10:25:51

語音合成技術新手區&KALDI語音識別新手區

2020-06-02 01:23:31

李宏毅《Speech Recognition》學習筆記2 - LAS

2020-03-13 21:23:43

24小時熱門文章

Spring Cloud 部署時如何使用 Kubernetes 作爲註冊中心和配置中心

最新文章

最新評論文章