前言
這次的內容很短,僅僅是記錄下一些資料向的內容而已。(反正看到好的就慢慢新增內容唄~)
搜索
- 搜索相關人工智能任務:https://paperswithcode.com/sota
(包含論文、可能有的代碼和衡量指標,真的好用,大力推薦!!!!!)
數據集
-
中文文本數據集來源:http://tcci.ccf.org.cn/conference/2018/taskdata.php#td
(如果是做NLP相關內容,想要數據集都可以先看看這裏。) -
語音數據集:https://voice.mozilla.org/zh-CN/datasets
(中文部分還不是很完善,似乎還在積極收集中…) -
百度知道問答數據集:https://github.com/liuhuanyong/MiningZhiDaoQACorpus
(新星吧~~)
模型
-
tensorflow部分模型實現:https://github.com/tensorflow/models/tree/master/research
(這部分,感覺還好,因爲是基於之前版本tensorflow寫的,所以有些API不夠新,但是作參考還是足夠的。) -
騰訊開源詞向量模型:https://ai.tencent.com/ailab/nlp/embedding.html
(怎麼說呢,畢竟只能使用不能夠進行微調,還是有些遺憾的…) -
bert模型:https://github.com/ymcui/Chinese-BERT-wwm
(作爲上游embedding層,中文相關NLP任務我個人使用的多些。)
教程
- Keras入門:https://www.coursera.org/specializations/tensorflow-in-practice
(雖然我用torch多點,但是這個教程介紹的真的挺細緻的,demo又多,感覺對學習Keras很有幫助。別問爲什麼不搞原生tensorflow,實在是看的頭暈。)