一、語音識別
以字爲建模單元代碼:https://github.com/zw76859420/ASR_WORD
二、圖像識別
以安檢危險品、Mnist等數據集,採用深度學習方法進行分類,其中涉及VGG resnet densenet mobilenet 數據增強等技術,代碼:
https://github.com/zw76859420/image-recognition
https://github.com/zw76859420/agriculture_recognition
其中下面是雲彩識別比賽,A榜排名60/579:
https://github.com/zw76859420/cloud-recognition
https://github.com/zw76859420/kaggle-cats-and-dogs
三、視頻動作識別
採用C3D構建視頻動作識別模型,代碼:https://github.com/zw76859420/video-action-recognition
四、文本分類
下面代碼是師弟最後大作業,算是彌足自己文本處理的不足,代碼:https://github.com/zw76859420/ML-DailyWork
五、聲紋識別
採用MFCC、FBANK特徵,構建聲紋識別模型,代碼:http://101.200.87.104:8090/zhangwei/jtyd_ai/tree/master/VC_Recognition
本人專研中文語音識別,歡迎各位朋友與我交流QQ:76859420;
深度學習交流羣:737145025