【EMNLP2018乾貨】爲NLP研究寫出好代碼(254頁教程)

新智元報道

來源:專知(Quan_Zhuanzhi) 作者:{joelg,mattg,markn}@allenai.org

【新智元導讀】艾倫AI研究所在EMNLP2018發佈教程《爲NLP研究寫出好代碼》,分享了編寫NLP研究代碼的良好實踐經驗。通過本教程,你將學習如何編寫NLP研究實驗代碼,如何設計和簡單化實驗代碼,從而推進研究,產出好的研究成果。

現代的NLP研究工作都需要編寫代碼。良好的代碼可以實現快速的原型設計,簡單的代碼調試,實驗的可控性和可視化,幫助研究人員快速準確地瞭解實驗和模型的具體情況。而糟糕的代碼往往導致拖慢研究進度,研究難以擴展,研究結果難以復現,最嚴重的是出現錯誤的研究和結論。實際上,現在研究人員也逐漸認識到好的研究工具,包括高質量的實驗代碼,對研究的重要性,那麼如何爲NLP任務寫出良好的代碼呢? EMNLP2018 254 頁的《爲NLP研究寫出好代碼》(Writing Code for NLP Research)的教程會給出答案。

該教程,借鑑了最近發佈的基於PyTorch的深度學習NLP研究庫AllenNLP的代碼,旨在分享編寫NLP研究代碼的良好實踐經驗。教程中將使用AllenNLP中實現的NLP模型作爲示例,解釋具有正確抽象化和組件化的庫如何實現更好的代碼和研究。通過該教程,你將學習如何編寫NLP研究實驗代碼,如何設計和簡單化實驗代碼,從而推進研究,產出好的研究成果。

教程目錄:

1. 在原型設計時如何編寫代碼(How to write code when prototyping)

2. 構建良好的代碼流程(Developing good processes)

3. 如何爲NLP研究編寫可複用的代碼(How to write reusable codefor NLP)

4. 案例分析:詞性標註器(Case Study:A Part-of-SpeechTagger)

5. 分享你的研究(Share your research)

文末附下載地址。

254頁PPT下載地址:

https://docs.google.com/presentation/d/17NoJY2SnC2UMbVegaRCWA7Oca7UCZ3vHnMqBV4SUayc/preview?slide=id.g4482b4d82e_0_110 。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章