深度學習應用總結

一、語音識別

  以字爲建模單元代碼:https://github.com/zw76859420/ASR_WORD

 

二、圖像識別

   以安檢危險品、Mnist等數據集,採用深度學習方法進行分類,其中涉及VGG resnet  densenet mobilenet 數據增強等技術,代碼:

    https://github.com/zw76859420/image-recognition

    https://github.com/zw76859420/agriculture_recognition

    其中下面是雲彩識別比賽,A榜排名60/579:

    https://github.com/zw76859420/cloud-recognition

    https://github.com/zw76859420/kaggle-cats-and-dogs

 

三、視頻動作識別

    採用C3D構建視頻動作識別模型,代碼:https://github.com/zw76859420/video-action-recognition

 

四、文本分類

    下面代碼是師弟最後大作業,算是彌足自己文本處理的不足,代碼:https://github.com/zw76859420/ML-DailyWork

 

五、聲紋識別

    採用MFCC、FBANK特徵,構建聲紋識別模型,代碼:http://101.200.87.104:8090/zhangwei/jtyd_ai/tree/master/VC_Recognition

 

  本人專研中文語音識別,歡迎各位朋友與我交流QQ:76859420;

  深度學習交流羣:737145025

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章