nltk學習

 

先pip安裝

pip install nltk

然後下載相關語料庫:

import nltk
nltk.download()

 

檢查語料庫是否下載完成:

from nltk.book import *

 

句子 -> 從句 -> 短語 -> 單詞

詞:一門獨立語言中的最小單位。

詞素:具有獨特意義的最小語言單位,但它不是獨立的,一個單詞可以由幾個詞素組成。

淺層句法分析:用來提取句子(一組單詞)中的短語。

語法:

依存語法(基於詞的語法):在大多數情況下,將動詞視爲句子的根。依存關係樹不是描述句子中詞的順序,而是強調句子中詞之間的關係。

成分語法(短語結構文法):

 

詞元:是一組詞的基本形式。

詞位{eating,ate,eats} 包含3種詞性,他們的詞元是eat。

 

?文本:若干個句子的集合。

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章