A State-transition Framework to Answer Complex Questions over Knowledge Base
ACL 2018
提出一個基於狀態轉移的方法把一個複雜的自然語言問題轉化爲一個查詢圖,通過匹配潛在的知識圖譜獲得問題的答案。爲了生成查詢圖,我們提出了四種基本操作(展開、摺疊、連接和合並)和一種基於學習的狀態轉換方法。
複雜問題的屬性和挑戰
多元或者隱式關係
多元或者零元實體
變量和共同引用
組合
語意查詢圖生成
語意查詢圖是一個連通圖,其中每一個節點對應於問題當中一個語意短語,關聯一個實體/類型/文本候選集列表,每條邊對應於一個關係候選集列表。
節點識別
通常節點識別認爲被看作序列標註任務通過BLSTM-CRF模型解決。然而當實體短語太長太複雜的時候,模型表現並不是很好。
我們首先利用現有的特定的實體鏈接算法來檢測實體和類型節點,在通過BLSTM-CRF模型。
查詢圖結構生成
我們的查詢圖結構由狀態轉移範式生成。初始時候這個狀態只包含一些由第一步識別出的孤獨節點。爲了實習狀態轉移,我們提出4個主要的操作。
爲了減少狀態轉換過程的搜索空間,我們還對每個操作提出了幾個約束條件。只有當條件滿足時,纔可以進行相應的操作被執行。實驗表明,這些條件不僅加快了質量保證過程,而且提高了質量保證的效率提高精度。
查找實體/關係候選集,查詢圖匹配
實體識別:S-MART
關係提取:提出了一種Multi-Channel Convolutional Neural Network(MCCNN)
學習反饋函數
給定SQG生成過程中的一箇中間狀態s,我們可以通過應用不同的操作轉換到多個後續狀態s。
因此,我們貪婪地選擇一個後續狀態擁有最大的γ(s),在γ()是一個獎勵函數,根據狀態特性和輸出相應的獎勵。在這部作品中,獎勵γ()函數是一個線性模型與支持向量機訓練排名的損失。
特徵
學習:
任務的獎勵功能可以看作是一個排序問題,其中有適當的SQGs應該排在前面。在這項工作中,我們使用SVM排序分類器對它們進行排序。