論文淺嘗 | GEOM-GCN: Geometric Graph Convolutional Networks

論文筆記整理:畢禎,浙江大學碩士,研究方向:知識圖譜、自然語言處理


        

動機

消息傳遞神經網絡(MPNN)已成功應用於現實世界中的各種應用中。但是MPNN聚合器的兩個基本弱點限制了它們表示圖結構數據的能力:丟失了鄰域中節點的結構信息,並且缺乏捕獲散佈圖中的長期依賴關係的能力。很少有研究從不同角度注意到這些缺點。從對經典神經網絡和網絡幾何的觀察中,該文章提出了一種新穎的圖神經網絡幾何聚合方案,以克服這兩個弱點。背後的基本思想是,圖上的聚合過程可以受益於圖背後的連續空間,從而達到很好的實驗效果。

概念及模型

  • 鄰居結點概念的重新定義

Graph level和Node level是兩種層面上的鄰居結點。Graph level指的是原始拓撲圖上的空間,即圖1中的original graph。這一層面的鄰居結點指的是一個結點直接相連的結點集合。Node level指的是node embedding層面上,即先對圖做一次node embedding的預處理,那麼每個結點都會有對應的連續向量空間,在該空間找離該結點距離(如歐式距離)比較近的結點的集合當作鄰居結點。

          圖1 Graph level和node level層面上的鄰居

 

  • 定義關係運算符 以及Aggregation。

關係運算符 的作用是對基於當前結點對其鄰居結點進行幾何空間的劃分,這也是本文思想的最關鍵部分,如圖2是將二維空間劃分成了9個區域。這樣劃分的目的是對不同區域的結點的處理分而治之,如圖3設計的Low-level aggregation,根據關係區域r以及鄰居結點的種類分塊聚集信息,在High-level aggregation中再做一次整合,最終得到所有鄰居結點的信息。這樣做的目的在於對不同的鄰居結點會有區分,避免了GCN設計中的缺陷。

           圖2 經過關係運算符劃分後的向量空間

       圖3 根據不同劃分塊r,設計低層級和高層級的聚合器

 

  • 數據集準備

在實驗的初始階段,作者使用了Geom-GCN-I、Geom-GCN-P、Geom-GCN-S三種初始的node embedding方法,分別更關注於低維性、空間層次性、局部結構性三個特點。在數據集的準備方面,使用了四種類型一共九個數據集,不同數據集在圖結構上有不同的層次性,同質性也不同。

            

  • 實驗結果及分析

           表1 實驗結果

 

實驗結果中的數字表示平均分類準確性,以百分比表示。Geom-GCN實現了最先進的性能。從結果來看,僅保留圖形連接模式的Isomap嵌入(Geom-GCN-I)已經說明設計聚合器是有用的,在大部分數據集上都提升了效果。其實可以指定一種嵌入方法,以爲特定應用創建合適的潛在空間(例如分解圖或層次圖),從而顯着提高性能(比如說Geom-GCN-S、Geom-GCN-P可能適用於這兩種類型的圖)。

 

  • 實驗結果

本文解決了圖上現有的消息傳遞神經網絡的兩個主要缺點,即判別結構的丟失和長距離依賴關係無法捕捉。它通過圖形嵌入將離散圖形變換到到連續的幾何空間。即利用卷積的原理:在有意義的空間上進行空間聚合,因此該方法從圖形中提取或“恢復”了嵌入空間中丟失的信息(判別結構和遠距離依存關係)。它提出了一種通用的幾何聚合方案,並用幾種特定的Geom-GCN實現實例化了該方案,最後實驗證明了相對於現有技術的明顯優勢。

 


 

OpenKG

開放知識圖譜(簡稱 OpenKG)旨在促進中文知識圖譜數據的開放與互聯,促進知識圖譜和語義技術的普及和廣泛應用。

點擊閱讀原文,進入 OpenKG 博客。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章