Python自然語言處理-自然語言工具包(NLTK)

一. 簡介

     如何理解每個單詞的具體含義。自然語言工具包(Natural Language Toolkit,NKTK)就是這樣一個python庫,用於識別和標記英語文本單詞中各個詞的詞性(parts of speech).

二. 安裝與配置

     NLTK模塊的安裝方法和其他Python模塊一樣,要麼從NLTK網站直接下載安裝包進行安裝,要門用其他幾個第三方安裝器通過關鍵詞“nltk”安裝。本文中使用的pip安裝。執行pip3 install nltk,進行安裝。安裝過程和結果如下圖所示:

    模塊安裝之後,可以下載NLTK自帶的文本庫,這樣你就可以非常輕鬆地實驗NLTK的功能。在python命令行輸入下面的命令即可:
import nltk
nltk.download()
在Linux環境下,執行後繼續輸入d,然後輸入all表示你要下載所有的包。執行結果如下:

這裏推薦你暗轉所有的包,要下載的每個文件都是非常小的文件,你永遠不知道後面會需要使用到哪一個,而且任何時候你都可以輕易地卸載它們。

   

發佈了105 篇原創文章 · 獲贊 238 · 訪問量 16萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章