論文淺嘗 | AAAI2020 - 基於規則的知識圖譜組合表徵學習

論文筆記整理：康矯健，浙江大學計算機科學與技術系，碩士研究生。

論文鏈接：https://arxiv.org/pdf/1911.08935.pdf

發表會議：AAAI 2020

Motivation

現有的KG Embedding方法大部分僅關注每個三元組的結構化信息
有部分的工作把KG中的路徑信息考慮在內而不僅僅是每次只考慮單個三元組，但是這種方法在獲得路徑表示的時候缺乏可解釋性。
因此本文提出一種基於規則和路徑的知識圖譜表徵學習方法，能夠充分利用logic rules的可解釋性和準確性。

Model

1. 挖掘規則：利用現有KG中的規則挖掘工具（如AMIE）自動從KG中抽取出規則，總共兩類，包括長度爲1的規則和長度爲2的規則，每條規則有一個置信度

2. 挖掘KG中實體之間的路徑：利用PtransE自動挖掘頭實體h和尾實體t之間存在的路徑p，每條路徑p有一個置信度。

3. 利用挖掘出來的規則和實體之間的路徑做實體的組合表徵學習。

如上圖所示PtransE挖掘出實體David和USA之間的一條路徑如下

AMIE挖掘出2條長度爲2的規則

一條長度爲1的規則

之後用長度爲2的規則對路徑做composition，其中長度爲2的規則中的第一條可以將

組合成

之後長度爲2的規則中的第二條可以將

組合成

之後根據長度爲1的規則，我們需要讓

和的embedding之間的距離儘可能接近。

4. 損失函數

總共三個score function。

其中第一個score function源於TransE，不做過多解釋。

第二個score function 表示利用PtransE挖掘出來的h和t之間路徑p的置信度，中表示組合路徑p使用的所有長度爲2的規則的置信度集合，表示其中使用的第i條的置信度。中表示最終通過長度爲2的規則組合出來的路徑embeding，有兩種情況，一種是最終路徑只剩下一個關係，那麼就是這個關係的embedding，否則就是路徑剩下所有關係embedding相加。

第三個score function 中和分別是長度爲1的規則中的兩個關係。

最終的損失函數爲

其中

分別是對對應三個score function的Margin Loss損失函數，其中第一個損失函數的負樣本是隨機將h、r、t替換掉；第二個損失函數及第三個是隨機替換掉關係。

5. 模型整體框架如下

Experiment

數據集情況：總共使用4個數據集。FB15K和FB15K-237是從Freebase中抽取的，WN18從WordNet中抽取，NELL-995從NELL中抽取。其中FB15-237是不包括inverse關係的，因此FB15K和FB15K-237一般被認爲是兩個不一樣的數據集。

本文做的實驗包括relation prediction和entity prediction。
利用AMIE+挖掘出來的規則如下，每條規則會有一個0到1的閾值

評估指標

MR：the mean rank of correct entities

MRR：the mean reciprocal rank of correct entities

Hits@n ：the proportion of test triples for which correct entity is ranked in the top n predictions

一個三元組的socre如下

baseline的選擇：第一種是TransE、TransR、TransH等Embedding methods；第二種是path-based的methods，如PtransE和DPTransE等。
第一個實驗：rule置信度和路徑長度對最終模型性能的影響

我們可以看到RPJE-S2的性能優於RPJE-S3說明採用長度最多爲2的路徑要優於採用長度最多爲3的路徑，這說明路徑長度過長會使得在path composition的過程中引入過多噪音導致準確率下降。

RPJE-S2性能優於PTransE說明引入規則能夠帶來性能提升；

RPJE-S2性能優於RPJE-min說明規則的置信度需要引入到模型中，並更多關注那些置信度高的規則。

最終路徑長度選擇2，並過濾掉那些置信度小於0.7的規則

第二個實驗：FB15K上的relation prediction和entity prediction，以及FB15K-237上的entity prediction。可以發現RPJE在所有指標上都比baseline好，說明了引入規則和路徑的有效性。值得注意的是FB15-237中是沒有inverse relation的，那麼此時因此rules更能挖掘出關係之間的聯繫。