论文浅尝 - ICLR 2020 | 用于文本推理的神经模块网络

原創

开放知识图谱

2020-06-16 15:21

论文笔记整理：邓淑敏，浙江大学在读博士，研究方向为低资源条件下知识图谱自动化构建关键技术研究。

论文链接：https://openreview.net/pdf?id=SygWvAVFPr

Demo链接: https://demo.allennlp.org/reading-comprehension

代码链接: https://nitishgupta.github.io/nmn-drop/

这篇文章解决的任务是复杂问题问答，比如回答“谁在第二节比赛中得到最高分？”类似的问题。解决这个任务需要：理解问题->在蕴含答案的文本中做信息抽取à符号推理，所以问题的难点也显而易见：（1）理解问句语义，将复杂问题拆分成简单问题；（2）文本理解，理解文本中实体、关系和事件等；（3）进行推理，比如判断大小，计数等。传统的方法比如语义解析，或者pipeline的模型，要么需要基于结构化或半结构化数据去做，要么在子任务中依赖更多的监督信号，这对复杂问题问答任务来说都很难实现。因此这篇文章提出用神经模块网络去解决这个问题，先将问题解析成logicalform，然后在文本中运行可执行的模块。这里的模块可看成用于推理的可学习的函数。

模块概览

复杂问题问答包含的推理可分为两大类：自然语言推理和符号推理。自然语言推理可以看成是文本信息抽取的过程，符号推理就是基于抽取出的结构化知识进行推理判断。这两大类推理中定义的模块如上图所示。

下面看一个用神经模块网络解复杂问题问答的例子。

第一步：将问题解析成logicalform。

将问题解析成logicalform

第二步：在蕴含答案的文本中执行模块。

模块运行的最终结果

执行第一个模块：find()，找出得分这个实体

执行第二个模块：find-num()，找出得分的数值

执行第三个模块：max-num()，找出最大的得分值

执行第四个模块：extract-argument()，找出得到最大得分的人，这个模块类似于事件抽取中的argumentextraction

那接下来的问题就在于，如何组合这些模块，以及如何学习出这些模块。组合这些模块目前主要用一些seq-to-seq的模型，至于学习这些模块，下面给出学习find()模块的示例。

问题的嵌入用Q表示，蕴含答案的文本嵌入用P表示，find(Q)->P，输入问句的tokens，输出蕴含答案的文本中和输入tokens相同或相似的token分布，如下图所示

find(Q)->P示例

具体做法就是先计算一个“问题-蕴含答案文本”的相似度矩阵

然后按行标准化S，得到“问题-蕴含答案文本”的权重矩阵。

最后得到蕴含答案文本的token权重分布：

其他模块的做法这里就不赘述了，可以参见原文。

本文的实验用了DROP数据集（https://www.aclweb.org/anthology/N19-1246.pdf），实验结果如下

实体预测的实验结果比较

由于篇幅限制省略了一些细节，如果大家对这篇文章的工作感兴趣，可以阅读原文，也欢迎一起交流。

OpenKG

开放知识图谱（简称 OpenKG）旨在促进中文知识图谱数据的开放与互联，促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文，进入 OpenKG 博客。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

Dokcer部署Kafka集群

docker網絡規劃 docker network create kafka-net --subnet 172.20.0.0/16 docker network ls zookeeper1（172.20.0.11 2184:2181

2024-05-16 14:31:24

「Pygors跨平台GUI」2：安装MinGW-w64、MSYS2还是WSL2

「Pygors系列」一句話導讀： MinGW-w64只有編譯器，MSYS2帶着更新環境，WSL2實用性比較高歷史與淵源 Windows平臺 Linux平臺二進制兼容 WSL2：運行Linux程序 Wine：運行Wi

2024-05-16 14:29:14

「Pygors跨平台GUI」1：Pygors跨平台GUI应用研究

「Pygors系列」一句話導讀： Python、Go、Rust、C程序跨平臺GUI框架研究。一、問題 Pygors是什麼？ Pygors是我自己創造的一個詞，就是Python、Go、Rust、C四種語言的合體。目的是爲了跨平臺GUI應

2024-05-16 14:29:14

【Linux命令学习】lsof查看打开的文件

lsof： list open files 作用1：可查端口號被哪個進程佔用比如我們跑自動化，經常會遇到端口號被佔用，無法啓動driver lsof -i :8081 lsof 輸出的結果含義： fd：文件描述符的數字，通常是一個

金大鑫要堅持

2024-05-16 14:27:04

MacOS添加，查看，删除用户

1. 添加用戶在macOS中，可以通過命令行使用dscl（Directory Service command line utility）工具來添加用戶。以下是使用dscl添加用戶的步驟：打開終端：可以通過在Spotlight搜索中輸

金大鑫要堅持

2024-05-16 14:27:04

Flink执行图

Flink的代碼編寫流程爲env->source->transform->sink，基本所有的代碼都是大致按照圖1的流程進行代碼編寫，當然中間也會有一些封裝之類的。 Flink代碼寫好後，它的任務調度執行圖按照生成順序分爲:邏輯流圖(

人不瘋狂枉一生

2024-05-16 14:23:03

Garnet：微软官方基于.NET开源的高性能分布式缓存存储数据库

前言前不久Redis宣佈從 Redis 7.4 開始，將原先比較寬鬆的 BSD 源碼使用協議修改爲 RSALv2 和 SSPLv1 協議，該協議變化意味着Redis不再開源。今天給大家分享一款完全開源（MIT協議）、免費的Redis替代性

2024-05-16 14:22:03

nodejs学习07——API

接口一、簡介 1.1 接口是什麼接口是前後端通信的橋樑簡單理解：一個接口就是服務中的一個路由規則，根據請求響應結果接口的英文單詞是 API (Application Program Interface)，所以有時也稱之爲 AP

2024-05-16 14:21:53

nodejs学习06——小案例

2024-05-16 14:21:53

🔥 Java Solon v2.7.6 发布

Java Solon 是什麼框架？ Java “新的”應用開發框架。開放原子開源基金會，孵化項目。從零開始構建（非 java-ee 架構），有靈活的接口規範與開放生態。追求：更快、更小、更簡單提倡：剋制、簡潔、高效、開放、生態

2024-05-16 14:21:13

Puppeteer！

什麼是Puppeteer Puppeteer 是一個由 Google 開發的 Node.js 庫，它提供了一組用於控制 Headless Chrome 的 API。 Headless Chrome 是 Chrome 瀏覽器的無界面版本，可以

2024-05-16 14:17:02

openstack虚拟机用keep alive添加的VIP，其它机器无法访问

neutron port-list |grep ipneutron port-update a7fbxxf6cc2 --allowed_address_pairs type=dict list=true ip_address=vipne

2024-05-16 14:13:52

apisix~authz-keycloak插件介绍

參考：https://apisix.apache.org/docs/apisix/plugins/authz-keycloak/ kc插件源碼梳理及原理說明如果只是進行keycloak頒發的token進行校驗（簽名校驗和有效期校驗），

2024-05-16 14:12:42

Dynamic-Datasource动态数据源

1、添加請求對應的數據源標籤 DynamicDataSourceContextHolder.push(ds); 2、添加數據源 3、動態添加數據源 private DynamicRoutingDataSource dataSo

2024-05-16 14:12:02

NETCore中实现一个轻量无负担的极简任务调度ScheduleTask

至於任務調度這個基礎功能,重要性不言而喻,大多數業務系統都會用到,世面上有很多成熟的三方庫比如Quartz,Hangfire,Coravel 這裏我們不討論三方的庫如何使用而是從0開始自己製作一個簡易的任務調度,如果只是到分鐘級別的粒度基

2024-05-16 14:04:41

24小時熱門文章

最新文章

最新評論文章