傳統關係抽取(RE):
- 目標:給定關係的名稱、標註樣本,從語料中發現給定類型的關係實例;
- 過程:不需要抽取關係指示文本;
- 特徵:常利用實體的類型作爲關係抽取的特徵;
open關係抽取(open IE):
- 目標:關係名字未知,輸入爲語料和少量的獨立於關係的經驗知識(規則或者實體pair),學習出一個通用的關係抽取模型;
- 過程:需要抽取表明關係的提示文本,之後還要準確地確定關係名稱字符串;
- 特徵:實體的類型對於抽取不是很有用;不同類型的關係的特徵不能通用;
- POS
- 形態:大小寫、標點符號
- 上下文word:虛詞,如冠詞、介詞