Parser
主要有以下幾個問題:
- Parser是什麼?
- 如何使用Stanford Parser
- Parser把一個句子轉變爲樹狀結構,那麼這棵樹具體的是怎麼樣,怎麼操作這棵樹?也就是說,怎麼把這棵樹用在LSTM上。這裏面又包含了許多問題。
一、Definition
我只知道Parser是句法分析。
專業一點的說:
句法分析判斷輸入的單詞序列(一般爲句子)的構成是否合乎給定的語法,並通過構造句法樹來確定句子的結構以及各層次句法成分之間的關係,即確定一個句子中的哪些詞構成一個短語,哪些詞是動詞的主語或賓語等問題。
二、Usage of Stanford Parser
1 . download
2 . 解壓之後的目錄如下:
3 . 執行
# mydata.txt是我的語料,輸出在result.txt
./lexparser.sh mydata.txt > result.txt
4.結果如圖所示:
mydata.txt
中只有一句話My dog also likes eating sausage.
下面是My dog also likes eating sausage.
的兩種Parser的結果:
三、Tree
一開始這個結果看不明白。第二種還好,先理解了;第一種是要通過入棧出棧來實現的。
第一種是Constituency Parser,第二種是Dependency Parser。
下面是我手繪的圖:
Constituency Parser:
這個我感覺應該是理解錯了,這個S
是啥意思呢???
Dependency Parser