论文浅尝 - ICLR2020 | 通过神经逻辑归纳学习有效地解释

原創

开放知识图谱

2020-06-23 04:01

论文笔记整理：朱渝珊，浙江大学直博生。研究方向：知识图谱，快速表示学习等。

论文链接：https://arxiv.org/pdf/1910.02481.pdf

本文是ICLR 2020的一篇关于知识图谱中关于复杂（树状、组合）规则可微学习的文章。提出了神经逻辑归纳学习（NLIL），一种可微分的ILP方法，扩展了针对一般ILP问题的多跳推理框架。NLIL将搜索空间分解为一个层次结构中的3个子空间，每个子空间都可以通过注意力高效地进行搜索。作者证明通过这种方式模型可搜索的规则比使用NeuralLP等方式搜索的规则长10倍，且拥有更快的速度。

1. 相关背景

1.1 Inductive Logic Programming (ILP)

一阶逻辑系统有3个组件：实体，谓词和公式。以下图为例：

实体是对象x∈X。图像中某区域是实体x，所有可能区域集合是X。

谓词是将实体映射到0或1的函数，Person:x →{0,1}，x∈X。谓词可有多个输入，如“Inside”是接受2输入的谓词，参数的数量称为Arity。原子是应用于逻辑变量的谓词符号，如person(X)和Inside(X,X')。

一阶逻辑（FOL）公式是使用逻辑运算{∧，∨，¬}的原子的组合。给定一组谓词P ={P1...PK},谓词Pk的解释定义为一阶逻辑蕴涵，

Pk(X,X')是蕴涵的头，如它是一元谓词，则为Pk(X)。A为规则主体，如

代表着这样的知识：“如果物体在车内，身上有衣服，那就是人”。

1.2 多跳推理：

ILP问题与KG多跳推理任务相关。此处，事实存储在谓词Pk的二进制矩阵Mk中，Mk(i,j)=1表明三元组在KG中。

给定查询q=

M(t)是在第 t 跳中用的谓词的邻接矩阵。v(t)是路径特征向量，v(t)中第j个元素计算从x到xj的唯一路径的数量。经过T步推理后，查询的分数计算为

对于每个q，目标是（i）找到一个合适的T，（ii）为每个t∈[1,2，...，T]，找到一个合适的M（t），使得score最大。这两个离散的选择可以放宽,即

此为软路径选择函数，参数为

（i）路径注意向量，选择长度在1到T之间回答查询的最佳路径。

（ii）谓词注意向量，在第t步选择M(t)。

这两个注意向量是通过下述模型生成的

参数w可学习。以前的一些方法，T(x; w)是一个随机游动采样器，它会生成one-hot向量来模拟从x开始的图形上的随机游动。在NeuralLP中，T(x; w)是一个RNN控制器，目标定义为

在多跳推理中学习关系路径可以解释为使用链状FOL（一阶逻辑）规则解决ILP问题

与基于模板的ILP方法（如∂ILP）比，此类方法在规则探索和评估中非常有效。但是，存在两个问题

（P1）规则的表达性不足，仅能表达链状规则，例如等式(2)不是链状的就不能表示。

（P2）注意生成器T(x; w)取决于特定查询q的实体x，这意味着针对目标P*生成的解释可能因查询而异，很难学习KG中全局一致的FOL规则。

2. 算法模型

推理过程中所有中间实体都用首尾实体表示

如上将公式（1）转换为（7）所示，实现方法就是通过转换的函数（操作符）：将每个谓词k都视为一个操作符ϕk，如下所示，U是一元谓词，B是二元谓词

则规则（2）可以表述成规则（8），这样首尾实体在具体实现时用随机初始化的向量表示，摆脱了数据依赖

扩展到树状规则

提出Primitive Statements（基本语句）的概念，公式（8）可视为两个基本语句组成，和

每个基本语句都是从输入空间映射到一个置信度得分标量

公式（3）可表示为

如下图所示，树状规则可表示为

规则之间的组合

把基本语句用{∧，∨，¬}进行逻辑组合，如公式（8）就是两个基本语句的逻辑“and”操作。逻辑 “not” 及逻辑 “and” 运算如下表示

第l级的公式集以及最后的得分就可如下方式推得

整个流程可以如下图所示

其中都是注意力，W/sum 是加权和，Matmul 指矩阵乘积，Neg 是逻辑“not”，XEnt 是交叉熵。

具体实现上：Hierarchical Transformer Networks for Rule Generation，引入“虚拟”自变量X和X’，学习的参数有逻辑谓词向量和相应的注意力参数，公式为

其中h*是P*的嵌入，因此注意力仅相对于P*有所不同。

3. 实验

Baseline

•NeuralLP (Yang , 2017)

•∂ILP (Evans , 2018)

•TransE (Bordes , 2013)

•RotatE (Sun , 2019)

Dataset

•ES(Even-and-Successor) (Evans , 2018) ：两个一元谓词Even，Zero和一个二元谓词Successor。目标是学习一组整数上的FOL规则。本文对从0开始的10、50和1K个连续整数评估。

•FB15K-237

•WN18

•VG(Visual Genome)，视觉领域数据，以物体检测任务为基础，将图片上的物体之间的关系抽象成小的知识图谱

FB15k-237和WN18数据上链接预测

ES数据上与不同算法对比，(a)时间 (mins)，(b)规则长度

VG数据集，不同training-set大小

虽然基于丰富标签数据的监督学习方法达到了比较好的效果，但是NLIL仅仅利用稀疏的（0/1）标签就能达到匹敌的效果，甚至显著优于一种监督模型baseline的效果，进一步体现出了模型的有效性。在少样本学习（训练样本仅0.01%）也体现出更好性能。

4．总结

本文提出了神经逻辑归纳学习，这是一个可区分的ILP框架，可以从数据中学习解释性规则。

证明了NLIL可以扩展到非常大的数据集，同时能够搜索复杂的表达规则。更重要的是，本文还证明了可扩展的ILP方法在解释监督模型的决策方面是有效的，这为检查机器学习系统的决策过程提供了另一种视角。

OpenKG

开放知识图谱（简称 OpenKG）旨在促进中文知识图谱数据的开放与互联，促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文，进入 OpenKG 博客。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

Dokcer部署Kafka集群

docker網絡規劃 docker network create kafka-net --subnet 172.20.0.0/16 docker network ls zookeeper1（172.20.0.11 2184:2181

2024-05-16 14:31:24

「Pygors跨平台GUI」2：安装MinGW-w64、MSYS2还是WSL2

「Pygors系列」一句話導讀： MinGW-w64只有編譯器，MSYS2帶着更新環境，WSL2實用性比較高歷史與淵源 Windows平臺 Linux平臺二進制兼容 WSL2：運行Linux程序 Wine：運行Wi

2024-05-16 14:29:14

「Pygors跨平台GUI」1：Pygors跨平台GUI应用研究

「Pygors系列」一句話導讀： Python、Go、Rust、C程序跨平臺GUI框架研究。一、問題 Pygors是什麼？ Pygors是我自己創造的一個詞，就是Python、Go、Rust、C四種語言的合體。目的是爲了跨平臺GUI應

2024-05-16 14:29:14

【Linux命令学习】lsof查看打开的文件

lsof： list open files 作用1：可查端口號被哪個進程佔用比如我們跑自動化，經常會遇到端口號被佔用，無法啓動driver lsof -i :8081 lsof 輸出的結果含義： fd：文件描述符的數字，通常是一個

金大鑫要堅持

2024-05-16 14:27:04

MacOS添加，查看，删除用户

1. 添加用戶在macOS中，可以通過命令行使用dscl（Directory Service command line utility）工具來添加用戶。以下是使用dscl添加用戶的步驟：打開終端：可以通過在Spotlight搜索中輸

金大鑫要堅持

2024-05-16 14:27:04

Flink执行图

Flink的代碼編寫流程爲env->source->transform->sink，基本所有的代碼都是大致按照圖1的流程進行代碼編寫，當然中間也會有一些封裝之類的。 Flink代碼寫好後，它的任務調度執行圖按照生成順序分爲:邏輯流圖(

人不瘋狂枉一生

2024-05-16 14:23:03

Garnet：微软官方基于.NET开源的高性能分布式缓存存储数据库

前言前不久Redis宣佈從 Redis 7.4 開始，將原先比較寬鬆的 BSD 源碼使用協議修改爲 RSALv2 和 SSPLv1 協議，該協議變化意味着Redis不再開源。今天給大家分享一款完全開源（MIT協議）、免費的Redis替代性

2024-05-16 14:22:03

nodejs学习07——API

接口一、簡介 1.1 接口是什麼接口是前後端通信的橋樑簡單理解：一個接口就是服務中的一個路由規則，根據請求響應結果接口的英文單詞是 API (Application Program Interface)，所以有時也稱之爲 AP

2024-05-16 14:21:53

nodejs学习06——小案例

2024-05-16 14:21:53

🔥 Java Solon v2.7.6 发布

Java Solon 是什麼框架？ Java “新的”應用開發框架。開放原子開源基金會，孵化項目。從零開始構建（非 java-ee 架構），有靈活的接口規範與開放生態。追求：更快、更小、更簡單提倡：剋制、簡潔、高效、開放、生態

2024-05-16 14:21:13

Puppeteer！

什麼是Puppeteer Puppeteer 是一個由 Google 開發的 Node.js 庫，它提供了一組用於控制 Headless Chrome 的 API。 Headless Chrome 是 Chrome 瀏覽器的無界面版本，可以

2024-05-16 14:17:02

openstack虚拟机用keep alive添加的VIP，其它机器无法访问

neutron port-list |grep ipneutron port-update a7fbxxf6cc2 --allowed_address_pairs type=dict list=true ip_address=vipne

2024-05-16 14:13:52

apisix~authz-keycloak插件介绍

參考：https://apisix.apache.org/docs/apisix/plugins/authz-keycloak/ kc插件源碼梳理及原理說明如果只是進行keycloak頒發的token進行校驗（簽名校驗和有效期校驗），

2024-05-16 14:12:42

Dynamic-Datasource动态数据源

1、添加請求對應的數據源標籤 DynamicDataSourceContextHolder.push(ds); 2、添加數據源 3、動態添加數據源 private DynamicRoutingDataSource dataSo

2024-05-16 14:12:02

NETCore中实现一个轻量无负担的极简任务调度ScheduleTask

至於任務調度這個基礎功能,重要性不言而喻,大多數業務系統都會用到,世面上有很多成熟的三方庫比如Quartz,Hangfire,Coravel 這裏我們不討論三方的庫如何使用而是從0開始自己製作一個簡易的任務調度,如果只是到分鐘級別的粒度基

2024-05-16 14:04:41

24小時熱門文章

最新文章

最新評論文章