【EMNLP2018乾貨】254 頁《爲NLP研究寫出好代碼》教程

【導讀】現代的NLP研究工作都是需要編寫代碼。 良好的代碼可以實現快速的原型設計,簡單的代碼調試,實驗的可控性和可視化,幫助研究人員快速準確地瞭解

實驗和模型的具體情況。而糟糕的代碼往往導致拖慢研究進度,研究難以擴展,研究結果難以復現,最嚴重的是出現錯誤的研究和結論。實際上,現在研究人員也逐漸認識到好的研究工具,包括高質量的實驗代碼,對研究的重要性,那麼如何爲NLP任務寫出良好的代碼呢? EMNLP2018 254 頁的《爲NLP研究寫出好代碼》(Writing Code for NLP Research)的教程會給出答案。

該教程,借鑑了最近發佈的基於PyTorch的深度學習NLP研究庫AllenNLP的代碼,旨在分享編寫NLP研究代碼的良好實踐經驗。教程中將使用AllenNLP中實現的NLP模型作爲示例,解釋具有正確抽象化和組件化的庫如何實現更好的代碼和研究。通過該教程,你將學習如何編寫NLP研究實驗代碼,如何設計和簡單化實驗代碼,從而推進研究,產出好的研究成果。

教程目錄:

1. 在原型設計時如何編寫代買(How to write code whenprototyping)

2. 構建良好的代碼流程(Developing good processes)

3. 如何爲NLP研究編寫可複用的代碼(How to write reusable codefor NLP)

4. 案例分析:詞性標註器(Case Study:A Part-of-SpeechTagger)

5. 分享你的研究(Share your research)

請關注專知公衆號(掃描下方二維碼,或點擊上方藍色專知)

  • 後臺回覆“WCNR” 就可以獲取 最新PDF下載鏈接~

-END-

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章