先pip安裝
pip install nltk
然後下載相關語料庫:
import nltk
nltk.download()
檢查語料庫是否下載完成:
from nltk.book import *
句子 -> 從句 -> 短語 -> 單詞
詞:一門獨立語言中的最小單位。
詞素:具有獨特意義的最小語言單位,但它不是獨立的,一個單詞可以由幾個詞素組成。
淺層句法分析:用來提取句子(一組單詞)中的短語。
語法:
依存語法(基於詞的語法):在大多數情況下,將動詞視爲句子的根。依存關係樹不是描述句子中詞的順序,而是強調句子中詞之間的關係。
成分語法(短語結構文法):
詞元:是一組詞的基本形式。
詞位{eating,ate,eats} 包含3種詞性,他們的詞元是eat。
?文本:若干個句子的集合。