原创 語音識別—聲學模型訓練(Viterbi-EM)

                                                                     Viterbi-EM語音識別訓練方法   前文剛研究過語音識別特徵提取以及基於Viterbi的狀態解

原创 深度學習應用總結

一、語音識別   以字爲建模單元代碼:https://github.com/zw76859420/ASR_WORD   二、圖像識別    以安檢危險品、Mnist等數據集,採用深度學習方法進行分類,其中涉及VGG resnet  den

原创 基於GMM-HMM語音識別系統的算法推導(全)

  最近研究完CTC,轉而研究GMM-HMM;   參考文獻:《語音識別實踐》;《數學之美》;清華大學開源資料;愛丁堡大學語音識別課件;以及一些高校本碩博學位論文;   本文將會刷新你對GMM-HMM的認識,以及對EM算法加深理解;  

原创 語音識別—聲學模型解碼

                                                                    聲學模型解碼(帶狀態轉移概率)   最近一直在學習哥倫比亞大學與愛丁堡大學語音識別課程,並且修正了哥倫

原创 語音識別—聲學模型訓練(前向-後向算法)

                                                                 聲學模型訓練(前向-後向算法)   前文講述了語音識別聲學模型訓練算法,主要基於Viterbi-EM算法來估

原创 語音識別—聲學模型訓練

                                                                     Viterbi-EM語音識別訓練方法   前文剛研究過語音識別特徵提取以及基於Viterbi的狀態解

原创 語音識別—Viterbi解碼

                                                                             Viterbi解碼理論與實戰   筆者最近着手研究基於HMM的語音識別系統,之前博文

原创 語音識別特徵—MFCC(實戰篇)

                                                                        語音特徵提取—MFCC(理論篇)   本文主要針對特徵提取中核心代碼提取進行說明,如果有不懂或

原创 語音識別特徵—MFCC(理論篇)

                                                                        語音特徵提取—MFCC(理論篇)   本文爲語音特徵提取—MFCC理論部分,參考哥倫比亞大學

原创 隱馬爾可夫模型基本概念(1)

  最近抽空學習下Kaldi下語音識別系統,參考西工大謝磊老師碩士論文與其他博客對Kaldi下語音識別算法進行學習研究。   隱馬爾科夫模型(Hidden Markov Model,HMM)本質上是一種統計模型,將HMM應用與語音識別解決

原创 語音識別解碼器

最近一年忙於語音識別和聲紋識別的創新、寫作以及相關論文發表。 並且創建了語音識別解碼器微信羣,想入羣的讀者可以留言加微信羣。 微信羣裏不乏國內外著名高校學者、語音研究員、語音識別工程師以及針對端到端語音識別解碼的獨特性,本人邀請了CV、N

原创 基於樹莓派語音控制—LED開關控制

  此文是學術記錄,亦是技術交流文檔,本文使用LVCSR構建的語音控制系統。   研究接近兩年的語音識別,最近一個月開始準備將自己的研究應用於實踐中。從今年5月初開始研究語音控制,到今天才出一個簡單的demo,最後演示結果如下:   (h

原创 樹莓派連接電腦

1、串口連接     這種方式在我樹莓派的第一篇博客有講,這裏我簡單介紹。     連接樹莓派,樹莓派GPIO串口的GND,txd,rxd分別與轉接口的GND,rxd,txd相連,用的什麼轉接模塊我不管,反正最後得變成一個USB的接口接在

原创 樹莓派LED燈控制

隨着Mini型PC越來越多,與之而來的創客也豐富起來,比如說Arduino就是一個非常好裏例子。 不過,Arduino畢竟是一塊適合入門型的基礎開發板,無論是從性能上,還是處理複雜問題的實現上,其本身都是有限的。所以有些時候我們會考慮成本

原创 kaldi 中文件讀取

* 1.  ark,scp文件 ~/kaldi/src/featbin/copy-feats ark:raw_mfcc_dev.10.ark ark,t:-|head ark存的試二進制文件,scp可以直接用cat命令看。 * 2.