深度學習應用總結

原創

2020-06-08 22:39

一、語音識別

以字爲建模單元代碼：https://github.com/zw76859420/ASR_WORD

二、圖像識別

以安檢危險品、Mnist等數據集，採用深度學習方法進行分類，其中涉及VGG resnet densenet mobilenet 數據增強等技術,代碼：

https://github.com/zw76859420/image-recognition

https://github.com/zw76859420/agriculture_recognition

其中下面是雲彩識別比賽，A榜排名60/579：

https://github.com/zw76859420/cloud-recognition

https://github.com/zw76859420/kaggle-cats-and-dogs

三、視頻動作識別

採用C3D構建視頻動作識別模型，代碼：https://github.com/zw76859420/video-action-recognition

四、文本分類

下面代碼是師弟最後大作業，算是彌足自己文本處理的不足，代碼：https://github.com/zw76859420/ML-DailyWork

五、聲紋識別

採用MFCC、FBANK特徵，構建聲紋識別模型，代碼：http://101.200.87.104:8090/zhangwei/jtyd_ai/tree/master/VC_Recognition

本人專研中文語音識別，歡迎各位朋友與我交流QQ：76859420；

深度學習交流羣：737145025

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

語音識別—聲學模型訓練（Viterbi-EM）

Viterbi-EM語音識別訓練方法前文剛研究過語音識別特徵提取以及基於Viterbi的狀態解

2020-06-24 18:08:10

基於GMM-HMM語音識別系統的算法推導（全）

最近研究完CTC，轉而研究GMM-HMM；參考文獻：《語音識別實踐》；《數學之美》；清華大學開源資料；愛丁堡大學語音識別課件；以及一些高校本碩博學位論文；本文將會刷新你對GMM-HMM的認識，以及對EM算法加深理解；

2020-06-08 22:39:43

語音識別—聲學模型解碼

2020-05-20 14:10:37

語音識別—聲學模型訓練（前向-後向算法）

2020-05-16 11:14:33

語音識別—聲學模型訓練

2020-05-14 07:31:02

語音識別—Viterbi解碼

2020-05-10 21:53:13

語音識別特徵—MFCC（實戰篇）

2020-04-28 22:08:02

語音識別特徵—MFCC（理論篇）

2020-04-28 22:08:02

隱馬爾可夫模型基本概念（1）

2020-04-25 04:53:21

語音識別—聲學模型訓練（Viterbi-EM）

Viterbi-EM語音識別訓練方法前文剛研究過語音識別特徵提取以及基於Viterbi的狀態解

2020-06-24 18:08:10

基於GMM-HMM語音識別系統的算法推導（全）

最近研究完CTC，轉而研究GMM-HMM；參考文獻：《語音識別實踐》；《數學之美》；清華大學開源資料；愛丁堡大學語音識別課件；以及一些高校本碩博學位論文；本文將會刷新你對GMM-HMM的認識，以及對EM算法加深理解；

2020-06-08 22:39:43

語音識別—聲學模型解碼

2020-05-20 14:10:37

語音識別—聲學模型訓練（前向-後向算法）

2020-05-16 11:14:33

語音識別—聲學模型訓練

2020-05-14 07:31:02

語音識別—Viterbi解碼

2020-05-10 21:53:13

24小時熱門文章

最新文章

最新評論文章