準備開始學習NLP,我該系統地看哪些書和課程?

導語:這份清單無論如何都不是詳盡無遺的,但是它應該提供一些選擇,對於任何有興趣開始使用NLP的人來說都是一個很好的起點。

譯者:AI研習社(聽風1996姚晗
雙語原文鏈接:My Recommendations for Getting Started with NLP

Speech and Language Processing

by Dan Jurafsky and James H. Martin

學習基礎知識對於學習任何一門學科都是至關重要的。我是非常推崇這一點的,因爲這對我來說很有效。我關注這本書已經有一段時間了,現在已經是第三版了。這本書所涉及的材料寫得特別好,爲NLP提供了一個很好的理論基礎。對於任何想要開始學習NLP的人來說,這有可能是一個很好的起點。即使我已經讀過這本書,我也會定期回顧它,因爲它定期更新該領域的最新發展。如果你真的很喜歡這本書,你也會發現這些講座很有用,因爲它們確實涵蓋了書中所涉及的很多基本主題。

Linguistic Fundamentals for Natural Language Processing: 100 Essentials from Morphology and Syntax

by Emily M. Bender

Emily Bender是我最喜歡的語言學研究者之一。她的工作對我所從事的研究產生了巨大的影響,使我能夠採用更加嚴謹的方法來進行關於NLP研究。NLP深受語言學的影響,事實上,Emily 主張用語言學的規則來指導NLP的發展。她的書爲NLP中使用的語言學概念進行了一個精彩的介紹。對於任何從事NLP的學生來說,這都是一本必讀的書。

Linguistic Structure Prediction

by Noah A. Smith

本書主要介紹自然語言處理與機器學習之間的聯繫,涵蓋了統計,基於計算方法建模語言結構。本書假定你已經對機器學習有一定的接觸。如果你對機器學習不太熟悉,可以在這裏查看我做的機器學習推薦列表。建議你至少要做一門機器學習的入門課程,才能最大限度地利用這本書。

Introduction to Natural Language Processing

by Jacob Eisenstein

這是我最喜歡的NLP書籍之一,因爲它專注於討論語言學概念和應用。它涵蓋了波束搜索、最大似然估計、矩陣因子化等方法。然後,它解釋瞭如何利用這些方法來解決廣泛的任務,如分類、詞性標註、關係提取、語言建模等。這本書假定讀者具備多元演算和線性代數等知識。這本書直接推薦的一本書是《機器學習數學》一書。與其他書相比,它是一本更高級的教科書,它確實需要對機器學習和數學概念有所瞭解。

Neural Network Methods in Natural Language Processing (Synthesis Lectures on Human Language Technologies)

by Yoav Goldberg

如果你剛剛開始學習NLP的旅程,你可能已經接觸到NLP中更現代的方法,比如RNN和其他基於深度學習的模型。如果您正在尋找關於神經網絡理論上的全面綜述以及它們如何在NLP中使用,這本書就是爲你準備的。在本書中找到的參考文獻對我自己的研究起到了重要作用。

Modern Deep Learning Techniques Applied to Natural Language Processing

by Soujanya Poria and Elvis Saravia

關於NLP的現代方法,我還想推薦我和Soujanya Poria一起整理的這個開放資源。它會引導你瞭解NLP領域的一些最新發展,從單詞嵌入到注意力機制再到強化學習。

CS224N: Natural Language Processing with Deep Learning | Winter 2019

by Christopher Manning and Abigail See

如果你最近剛開始接觸NLP,你可能已經接觸過這門流行的NLP課程。所有的講座和幻燈片都是公開的,你可以在課程網站上找到它。這門課程非常注重NLP的深度學習方法,所以你會看到第一講直接從詞向量開始,然後過渡到卷積網絡和transfomer等更高級的主題。如果你對經典的NLP方法感興趣,你可能要看看開頭提到的一本書。事實上,我強烈建議你這樣做,因爲它是對構建實際NLP系統在實踐中有用的寶貴知識。

這樣的理論知識很好,但是無論您是NLP研究人員還是工程師,都必須通過動手實踐對其進行補充。我發現這些書對於在語言建模和基於文本的分類等主題上進行練習非常有用。

Natural Language Processing with PyTorch: Build Intelligent Language Applications Using Deep Learning

by Delip Rao and Brian McMahan

儘管這本書是基於PyTorch的,但用深度學習構建語言應用的實踐還是很不錯的。此外,還有一些傳統概念和方法的內容和代碼,比如TF-IDF和語義,等等。如果你是一名PyTorch開發人員,你會發現本書很容易上手。

Natural Language Processing in Action

by Hobson Lane, Cole Howard, and Hannes Hapke

這是另一本特別的書,也是我最喜歡的一本書,可以讓你對所有的NLP進行實戰練習。這本書指導你如何從語料庫建立第一個詞彙,一直到建立一個聊天機器人。這本書中有很多代碼示例,所以如果你喜歡敲代碼,它可能很適合你。

Practical Natural Language Processing

by Sowmya Vajjala, Bodhisattwa Majumder, Anuj Gupta, and Harshit Surana

在NLP的動手實踐,我非常喜歡今年出版的這本書。它涵蓋了從NLP的各種實際應用到部署NLP系統的最佳實踐等主題。儘管我對這本書只讀了一半,但我還是不得不把它收錄進來,因爲有很多NLP工程師都想熟悉如何更有效地構建NLP系統,瞭解構建NLP系統所需的技術。

⭐️ 附錄(獎勵)
這裏有一些其他資源和項目,可以幫助你保持對NLP領域的瞭解。

關於如何開始對NLP學習,我的建議就到這裏了。重要的是,你要選擇最適合自己的內容。我已經嘗試爲每個條目提供一些解釋,希望能幫助你創建自己的學習路徑。這些都是我遇到的最好的資源,我發現它們對擴展我的知識甚至教授這些概念非常有用,更不用說將它們應用於研究思路和構建從語義搜索引擎到情感分類器的NLP系統了。


AI研習社是AI學術青年和AI開發者技術交流的在線社區。我們與高校、學術機構和產業界合作,通過提供學習、實戰和求職服務,爲AI學術青年和開發者的交流互助和職業發展打造一站式平臺,致力成爲中國最大的科技創新人才聚集地。

如果,你也是位熱愛分享的AI愛好者。歡迎與譯站一起,學習新知,分享成長。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章