【導讀】現代的NLP研究工作都是需要編寫代碼。 良好的代碼可以實現快速的原型設計,簡單的代碼調試,實驗的可控性和可視化,幫助研究人員快速準確地瞭解
實驗和模型的具體情況。而糟糕的代碼往往導致拖慢研究進度,研究難以擴展,研究結果難以復現,最嚴重的是出現錯誤的研究和結論。實際上,現在研究人員也逐漸認識到好的研究工具,包括高質量的實驗代碼,對研究的重要性,那麼如何爲NLP任務寫出良好的代碼呢? EMNLP2018 254 頁的《爲NLP研究寫出好代碼》(Writing Code for NLP Research)的教程會給出答案。
該教程,借鑑了最近發佈的基於PyTorch的深度學習NLP研究庫AllenNLP的代碼,旨在分享編寫NLP研究代碼的良好實踐經驗。教程中將使用AllenNLP中實現的NLP模型作爲示例,解釋具有正確抽象化和組件化的庫如何實現更好的代碼和研究。通過該教程,你將學習如何編寫NLP研究實驗代碼,如何設計和簡單化實驗代碼,從而推進研究,產出好的研究成果。
教程目錄:
1. 在原型設計時如何編寫代買(How to write code whenprototyping)
2. 構建良好的代碼流程(Developing good processes)
3. 如何爲NLP研究編寫可複用的代碼(How to write reusable codefor NLP)
4. 案例分析:詞性標註器(Case Study:A Part-of-SpeechTagger)
5. 分享你的研究(Share your research)
請關注專知公衆號(掃描下方二維碼,或點擊上方藍色專知)
- 後臺回覆“WCNR” 就可以獲取 最新PDF下載鏈接~
-END-