【EMNLP2018乾貨】254 頁《爲NLP研究寫出好代碼》教程

原創

2018-12-11 10:40

【導讀】現代的NLP研究工作都是需要編寫代碼。良好的代碼可以實現快速的原型設計，簡單的代碼調試，實驗的可控性和可視化，幫助研究人員快速準確地瞭解

實驗和模型的具體情況。而糟糕的代碼往往導致拖慢研究進度，研究難以擴展，研究結果難以復現，最嚴重的是出現錯誤的研究和結論。實際上，現在研究人員也逐漸認識到好的研究工具，包括高質量的實驗代碼，對研究的重要性，那麼如何爲NLP任務寫出良好的代碼呢? EMNLP2018 254 頁的《爲NLP研究寫出好代碼》(Writing Code for NLP Research)的教程會給出答案。

該教程，借鑑了最近發佈的基於PyTorch的深度學習NLP研究庫AllenNLP的代碼，旨在分享編寫NLP研究代碼的良好實踐經驗。教程中將使用AllenNLP中實現的NLP模型作爲示例，解釋具有正確抽象化和組件化的庫如何實現更好的代碼和研究。通過該教程，你將學習如何編寫NLP研究實驗代碼，如何設計和簡單化實驗代碼，從而推進研究，產出好的研究成果。

教程目錄：

1. 在原型設計時如何編寫代買（How to write code whenprototyping）

2. 構建良好的代碼流程（Developing good processes）

3. 如何爲NLP研究編寫可複用的代碼（How to write reusable codefor NLP）

4. 案例分析：詞性標註器（Case Study：A Part-of-SpeechTagger）

5. 分享你的研究（Share your research）

請關注專知公衆號（掃描下方二維碼，或點擊上方藍色專知）

後臺回覆“WCNR” 就可以獲取最新PDF下載鏈接~

-END-

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

24小時熱門文章

最新文章

最新評論文章