论文浅尝 | ICLR 2020 - 图神经网络的预训练策略

论文笔记整理：杨帆，浙江大学计算机学院。

动机

现有的用于图结构的预训练方法要么只关注node-level，导致在图表示空间没有区分度，要么只关注graph-level，导致在节点表示空间没有区分度。一种优质的节点表示应该保证不仅在节点层面有良好的区分度，而且由这些节点表示生成的图的表示在全图层面也有良好的区分度，所以预训练过程应同时考虑到node-level和graph-level。

模型

本文提出的模型主要包括node-level预训练和graph-level预训练两部分，其中node-level预训练包括context prediction和attribute masking两种实现方法。

Node-level pre-training

Context prediction

该方法定义了Neighborhood和Context graph两个概念，利用两个GNN分别对每个节点的Neighborhood和Context graph进行编码，然后通过负采样技术，训练一个二分类器判断一个Neighborhood表示和一个Context graph表示是否对应相同的节点，以此聚合周围节点的属性信息和邻近的图结构信息。

Attribute masking

该方法首先随机选取某些节点的属性将其MASK（把原始属性用特殊的标识符替换掉），然后使用GNN对节点编码生成节点表示，最后通过线性模型预测被MASK的属性值。

2. Graph-level pre-training

首先将节点的表示聚合起来得到图的表示，然后在图上进行多个二分类任务的联合训练。

实验

数据集

数据集包括生物和化学两个领域，生物领域的任务是蛋白质功能预测，化学领域的任务是分子属性预测。

实验结果

ROC-AUC performance

Negative transfer

加入graph-level预训练后，可以很好地防止Negative transfer（使用预训练效果反而差于不使用预训练的效果）的出现。

c. 收敛性

采用本文中的预训练策略能够有效加快收敛速度。

OpenKG

开放知识图谱（简称 OpenKG）旨在促进中文知识图谱数据的开放与互联，促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文，进入 OpenKG 博客。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

论文浅尝 | ICLR 2020 - 图神经网络的预训练策略

「Pygors跨平台GUI」1：Pygors跨平台GUI应用研究

[转帖]

python列出centos7内存使用前50的进程信息

「Pygors跨平台GUI」2：安装MinGW-w64、MSYS2还是WSL2

Garnet：微软官方基于.NET开源的高性能分布式缓存存储数据库

Flink执行图

Java响应式编程

评估统计算法在银行伪造钞票检测中的价值

Dokcer部署Kafka集群

【Linux命令学习】lsof查看打开的文件

論文淺嘗 - SIAM ICDM 2020 | 基於圖時空網絡的知識引導的診斷預測

論文淺嘗 | Iterative Cross-Lingual Entity Alignment Based on TransC

論文淺嘗 - AAAI2020 | 基於知識圖譜進行對話目標規劃的開放域對話生成技術

論文淺嘗 - ACL2020 | 用於鏈接預測的開放知識圖譜嵌入

陳華鈞等 | OpenKG區塊鏈：構建可信開放的聯邦知識圖譜平臺

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結