零基礎入門自然語言處理的學習建議

在入門的階段最適合做的事情:

(1)閱讀和學習自然語言處理(natural language processing,nlp)綜述類文章和圖書,對nlp有一個基本的認識梳理nlp研究內容的演變,包括nlp從誕生到多次繁榮發展和多次停滯不前的原因,正確認識nlp與人工智能、機器學習、自然語言理解、計算語言學、文本挖掘等概念之間的區別與聯繫(除了我下面推薦的圖書、文章和代碼,一定要多百度和google尋找學習資料);

(2)做一些非常簡單的nlp入門小任務,通過小任務理解自然語言處理的流程(包括中英文nlp處理流程的差別);

(3)快速學習一門開發nlp技術的編程語言(基本就是python了,不需要學習網絡編程等部分,重點掌握python基本語法文件讀寫與編碼正則表達式gensimnumpypandasmatplotlib等的使用);

(4)學習機器學習的相關概念,如:模型評估與選擇、有監督學習、半監督學習、無監督學習、強化學習、遷移學習(只需要學習和認識其原理,做到心中有數即可);

(5)關注各大內容大V,如:微信公衆號(paperweekly、新智元、AI科技大本營、機器之心、人工智能頭條等),知乎(一搜自然語言處理或者nlp就能看到好多大V),博主(我愛自然語言處理等),因爲每天各大V都會發布很多的新聞和內容,初入門的小白不建議全篇深入閱讀,感興趣的可以收藏起來以後看,大部分就瞭解一下(1)“誰”(2)“幹了啥,咋乾的”(3)“啥效果”,然後讀了這個文章的報道(4)“自己有啥想法”,就可以了(有一個小細節上的建議,就是在平日裏有任何idea最好都要在手機或者任何地方的備忘錄裏記一下,也要儘快多實踐以驗證idea是否有效);

(6)瞭解國內外nlp的協會組織(如:中文信息學會、中文信息學會青年工作委員會、ACL等,主要查找和閱讀協會開闢的專欄、組織撰寫的綜述、看看最近都組織了什麼會議比賽等)、主要的大型nlp科研團隊(斯坦福、多倫多、清華、北大、哈工大、復旦、中科、deepmind、google brain、openAI等高校、院所和科研機構的自然語言處理小組,看看他們都在研究什麼);

(7)關注“中國中文信息學會”的微信公衆號,時刻關注ACL、IJCAI、ACML、SIGIR等頂會論文報告會(由中文信息學會組織,報告的人都是當年被頂會錄取的論文的國內作者和大佬,來自各大高校和院所,整個報告會和國際會議的日程都是一樣的,都有coffee break可以在茶歇的時候近距離與大佬交流,是一個近距離與國內各大NLP大組老師、同學交流的機會看看大廠們都在幹什麼,推薦有機會的話一定要去聽一下報告,但一定要保證已經看過很多論文、並且有一定基礎再去聽,完全零基礎不建議去,會議比較火爆和受歡迎,建議時刻關注儘快報名)。

nlp非常容易入門的原因是這是一門非常開放的學科,各大高校、學者都有一顆開放的心,源碼經常開源、而且有很多優秀的老師有寫博客、博文的習慣,大家都喜歡一有研究成果就立馬放到arxiv或者researchgate上,nlp的研究日新月異、變化的非常快的原因就是“開放”,所以有什麼問題儘量面向百度、google查詢,注意關鍵詞(畢竟是搞nlp的,可以先學習一下檢索的原理,然後就知道怎麼檢索能儘快找到你想要的的東西),檢索的結果重點關注reddit、medium、csdn、arxiv、researchgate、知乎、stackoverflow、github等上面的內容。

可參考學習和實踐的鏈接如下:

  1. 復旦大學邱錫鵬組實驗室新生一般完成的五個NLP練習上手實驗(NLP四大類任務:分類、序列標註、文本匹配、文本生成,都需要完整實現一遍)。
    https://www.zhihu.com/question/324189960/answer/682130580?utm_source=wechat_session&utm_medium=social&utm_oi=952466020582064128
  2. 自動化所宗成慶研究員:讀懂NLP的過去與現在(梳理的非常好,把各個概念之間的關係和NLP的發展都梳理清楚了)
    https://mp.weixin.qq.com/s/xgySwq2m-mHT7XG1zZGpzw
  3. 中文自然語言處理入門實戰
    https://mp.weixin.qq.com/s/5z7Xy4NL-buUkpBmv4iIpw
  4. 自然語言處理全家福:縱覽當前NLP中的任務、數據、模型與論文
    https://mp.weixin.qq.com/s/sQ903WNSR4v367t78_VG1Q
  5. 中文信息處理髮展報告(綜述由中文信息學會統籌,國內各大NLP專家撰寫,非常適合入門瞭解NLP)
    http://cips-upload.bj.bcebos.com/cips2016.pdf
  6. Jumping NLP Curves: A Review of Natural Language Processing Research [Review Article]
    https://ieeexplore.ieee.org/document/6786458
  7. Natural Language Processing: A Review
    https://www.researchgate.net/publication/309210149_Natural_Language_Processing_A_Review
  8. A Review of the Neural History of Natural Language Processing
    http://ruder.io/a-review-of-the-recent-history-of-nlp/
  9. 鄧力和劉洋大神合著的圖書《Deep Learning in Natural Language Processing
    (就不給鏈接了,百度或google搜索,有中文連載、英文原版的原版圖書購買、pdf分享或者課程)
  10. 宗成慶研究員所著《統計自然語言處理》(經典之作)
  11. Steven Bird所著《Python自然語言處理》(快速掌握python開發nlp技術的各種能力)
  12. 機器學習 → 推薦周志華教授所著的《機器學習
  13. 深度學習 → 推薦Ian Goodfellow等人合著的《Deep Learning
  14. 開發框架 → 首推Pytorch,推薦陳雲的《深度學習框架Pytorch入門與實踐》或者廖星宇的《深度學習入門之Pytorch
  15. Tensorflow學習 → 推薦黃文堅、唐源的《Tensorflow實戰

(注意有些情況需要“科學上網”,一定要掌握google和google scholar的使用)

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章