论文浅尝 | 基于图卷积网络的跨语言图谱实体对齐

原創

开放知识图谱

2020-06-14 14:52

论文笔记整理：谭亦鸣，东南大学博士生，研究兴趣：知识图谱问答

本文提出了一种基于图卷积网络的跨语言实体对齐方法，通过设计一种属性 embedding 用于 GCN 的训练，发现GCN能同时学习到特征 embedding 和属性 embedding 的信息。实验表明该方法是目前性能最好的的 GCN 对齐模型。

来源：IJCAI 2019

链接：

https://www.ijcai.org/proceedings/2019/0929.pdf

动机

在近期的研究工作中， GCN被用来处理一些基于图的学习问题，也有研究者提出基于该模型的跨语言知识图谱实体对齐工作。但这些工作并没有有效的利用图谱的属性信息，且对整体模型带来了负面的影响，这主要是因为对于同一实体，在不同语言上，它的属性存在较大的差异。虽然也有研究者提出异构图注意力网络，提供了节点级与语义级的注意力机制。但这个方法依然没有考虑不同属性带来的影响。

基于上述分析，作者提出利用GCN的聚合能力将属性embedding加入跨语言知识图谱对齐中。

方法

图1 描述了本文提出模型的主要框架和流程，待对齐的知识图谱主要提供了两个角度的信息，其一是图谱本身的图结构信息，这个部分被直接输入到GCN中， GCN包含多层网络，其卷积运算过程如以下公式：

其中，P是一个n×n邻接矩阵，n表示节点的数量，，其中 I 是单位阵，是的 diagonal node degree 矩阵，H(l) 表示顶点特征矩阵，其作为第l层网络的输入。

其二，为了提高不同语言实体信息embed到统一的向量空间中的精准性，作者设计了增强的属性embedding方法，用于减少不同语言对等实体之间的差异性。

该方法包含以下几个部分：

1. 属性选择

首先对于实体属性出现的数量做降序排列（出现频率越高的属性对于实体的描述越准确），然后将排序后的不同语言的知识图谱属性进行相交。最后，取Top-k的相交属性用于embedding。

2. 属性加权

为了区分属性的重要性程度，通过以下公式对选定属性进行加权：

其中，wβ表示属性β的权重，nβ和n’β表示不同图谱中属性的数量，α表示权重系数，用于在对齐中强化属性所占的重要性。

实验

实验数据

实验使用的数据集为DBP15K，由DBpedia中生成，实验的语言对为中英双语，包含中文->英文方向，及英文->中文方向的对齐。

实验结果

评价指标使用Hits@1，Hits@10，及Hits@50进行对比，结果如下表：

可以看到从统计显著性上取得了的提升，但是从实际匹配准确性上看，距离可视作工具用于双语知识库问答等任务还存在明显不足。

OpenKG

开放知识图谱（简称 OpenKG）旨在促进中文知识图谱数据的开放与互联，促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文，进入 OpenKG 博客。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

反模式 DI anti-patterns

反模式 DI anti-patterns反模式DI anti-patterns 一、一、反模式 DI anti-patterns 1. 控制狂 Control freak 在程序設計中，"Control freak"（控制狂）通

2024-05-26 14:24:02

Win10 LTSC 2019 安装后的一些步骤

僅作爲自己記錄使用。 1.調整Windows恢復分區(Windows RE)大小[可忽略] Win10系統更新(KB5034441)在更新時會報錯 (0x80070643)，與Win10安裝時初始化的Windows恢復分區太小有關，因此建議

2024-05-26 14:20:52

Python 潮流周刊#52：Python 处理 Excel 的资源

本週刊由 Python貓出品，精心篩選國內外的 250+ 信息源，爲你挑選最值得分享的文章、教程、開源項目、軟件工具、播客和視頻、熱門話題等內容。願景：幫助所有讀者精進 Python 技術，並增長職業和副業的收入。本期週刊分享了 12

豌豆花下貓

2024-05-26 14:19:11

我对微服务架构的简单理解

在寫架構的時候，就要想着，哪些功能是要以後可能要單獨部署的，雖然一開始寫的時候可以寫在一個解決方案裏，但那些請求的dto，和返回的視圖，業務依賴，能隨時獨立出去，完全不需要做任何操作，即使是文件夾複製移動都不需要，就能夠把該功能獨立成一個解

2024-05-26 14:17:01

赛克oj The diameter of a rectangle（笛卡尔树）

賽氪OJ-專注於算法競賽的在線評測系統 (saikr.com) 這題是hduoj 1506的加強版，區別在於寬度不是固定爲1了，思路差不多，也是使用笛卡爾樹。參考hduoj 1506（笛卡爾樹） - Venux - 博客園 (cnblogs

2024-05-26 14:10:21

hduoj 1506（笛卡尔树）

Problem - 1506 (hdu.edu.cn) 題意座標軸給定一些矩形，緊密排在一起，每個矩形寬度固定爲1，問形成的圖案中最大可以組成的矩形面積。思路常規思路是可以用單調棧分別找兩邊的合法邊界，這裏使用笛卡爾樹。笛卡爾樹實現了

2024-05-26 14:10:21

C# enum枚举为0的时候不需要强制转换，很容易掉坑

重載的時候優先級很高很容易掉坑裏面了

2024-05-26 14:09:41

Qt支持heic图片显示

目錄一、背景二、Heic圖片顯示heif庫安裝圖片顯示三、參考文章原文鏈接：Qt支持heic圖片顯示一、背景小孩子兩歲了，最近在着手給娃做生活照紀念相冊，然後就是某寶上各種聊，瞭解到的相冊種類也是各異，價格更是良莠不齊，小几十到小几百

2024-05-26 14:08:50

Spring的BeanFactoryPostProcessor和BeanPostProcessor区别？

1、BeanFactoryPostProcessor是用於在容器實例化Bean之前對Bean的配置信息進行修改的接口，它允許對BeanFactory進行後處理，比如修改BeanDefinition的屬性值等。 BeanFactoryPo

2024-05-26 14:02:20

WPF一个简单的属性编辑控件

代碼： public class PropertiesControl : Grid { [TypeConverter(typeof(LengthConverter))] public d

2024-05-26 14:02:00

外企也半夜发布上线吗？

0 別把問題想得太複雜如果有灰度發佈的能力，最好白天發佈；如果沒有灰度發佈，只能在半夜發佈。即使有灰度發佈能力，也不要沾沾自喜，好好反思一下你們的灰度發佈是否真的經得起考驗，還是僅僅是裝裝樣子。回滾方案最好在上級環境中使用生產數

路人111122233

2024-05-26 14:00:39

从零手写实现 nginx-01-为什么不能有 java 版本的 nginx?

前言大家好，我是老馬。很高興遇到你。作爲一個 java 開發者，工作中一直在使用 nginx。卻發現一直停留在使用層面，無法深入理解。有一天我在想，爲什麼不能有一個 java 版本的 nginx 呢？一者是理解 nginx 的設計靈

2024-05-26 13:59:39

Nginx R31 doc-11-Compression and Decompression 压缩与解压缩

前言大家好，我是老馬。很高興遇到你。我們爲 java 開發者實現了 java 版本的 nginx https://github.com/houbb/nginx4j 如果你想知道 servlet 如何處理的，可以參考我的另一個項目：

2024-05-26 13:59:39

【转】centos7.9源码安装mysql5.7.44

原文：https://blog.csdn.net/SeeYouGoodBye/article/details/135231451 1、環境介紹 centos7.9 mysql5.7.44 boost1.59.0 注意：這裏的編譯版本my

2024-05-26 13:58:49

prompt内容

# 角色你的名字叫小二招聘管家 ## 技能### 技能1: 職位需求分析- 透徹理解企業招聘需求，明確崗位職責、必備技能和資格要求。- 分析企業文化與團隊結構，確保候選人與企業環境的契合度。 ### 技能2: 簡歷篩選與評估- 快速瀏覽並篩

2024-05-26 13:58:19

24小時熱門文章

Python 潮流周刊#52：Python 处理 Excel 的资源

最新文章

最新評論文章