中文句法分析、標記規範及其應用

一、 Why句法分析
句法分析是比詞高一個層級的語言單位,單個詞之間通過中文語法規則進行組織,形成一個具有連貫語義的詞語序列。爲了揭示這種組織結構和規則,揭示出詞語以及詞語的成分,往往需要對其進行句法分析。就中文而言,句子有七個成分,分別爲主語、謂語、賓語、補語、定語、狀語、同位語。 主語是一個句子的發生動作的主體,謂語是一般是動詞充當,賓語是表示動作發生的對象。基於句法分析,可以實現對句子作成分功能或作用進行分析,從而標記出基本成分(主語、謂語、賓語)和次要成分(狀語、補語)。

二、 句法分析的類型
句法分析,分成兩種,一種是句子結構分析(syntactic structure parsing)和依存句法分析(dependency parsing)。其中句法結構分析又稱爲句法分析、短語句法分析。依存句法分析分爲依存句法分析和語義依存分析兩類。
2.1句子結構分析
本質上將句子視作爲嵌套的短語組合。句法結構分析主要目的是解析整個句子的句法組織結構以及短語層級結構,屬於一種層次性的分析方式。

a, 句子成分分析,standfordparser
在這裏插入圖片描述

2.2 依存句法分析
依存句法分析則通常通過依存弧對句子中的詞語進行連接,用於標識詞語之間的依存關係,從而形成整個句子的句法關係依存樹。依存句法分析中的依存弧可以形式化成一個三元組,即<核心詞(被修飾詞),依存關係,修飾詞>,依存弧是有有向的,通常由修飾詞指向被修飾詞。同時滿足三個約束,即單核心約束,即句子中的每個詞語只有一個依存關係;弱聯通約束,無環約束。依存句法分析則更關注於句子的局部結構,通常是詞語之間,並在此基礎上得到整個句子的結構表示。
a, ltp依存句法分析
在這裏插入圖片描述
b, hannlp依存句法分析
在這裏插入圖片描述
c, standford依存句法分析
在這裏插入圖片描述

2.3 依存語義分析
語義依存分析,語義依存分析 (Semantic Dependency Parsing, SDP),分析句子各個語言單位之間的語義關聯,語義依存分析的目的在於跨越句子表層句法結構的束縛,獲取更爲深層的語義信息。

在這裏插入圖片描述

三、 句法分析各類型對比

四、 句法分析標記規範

1、句子成分標記
在這裏插入圖片描述

2、依存句法標記
在這裏插入圖片描述
3、語義依存標記
在這裏插入圖片描述

五、 句法分析的應用

六、 總結

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章