圖卷積Graph Convolutional Networks

CNN已經在計算機視覺(CV)以及自然語言處理等領域取得了非常好的水平,其中的數據可以被稱作是一種Euclidean Data,CNN正好能夠高效的處理這種數據結構,探索出其中所存在的特徵表示。所謂的歐氏(歐幾里德)數據指的是類似於grids, sequences… 這樣的數據,例如圖像就可以看作是2D的grid數據,語音信號就可以看作是1D的grid數據。但是現實的處理問題當中還存在大量的 Non-Euclidean Data,如社交多媒體網絡數據,化學成分結構數據,生物基因蛋白數據以及知識圖譜數據等等,這類的數據屬於圖結構的數據(Graph-structured Data)。

圖結構數據

 如果數據看起來像這樣該怎樣利用深度學習,

一個簡單的方法:

•       求鄰接矩陣A和特徵矩陣X

•       串聯Xin=[A,X]

•       輸入全連接神經網絡

缺點:

•參數數量過大

•圖形變化需重新訓練

爲什麼研究GCN

1.CNN無法處理Non Euclidean Structure的數據,學術上的表達是傳統的離散卷積在Non Euclidean Structure的數據上無法保持平移不變性。也就是說在拓撲圖中每個頂點的相鄰頂點數目都可能不同,那麼也就無法用一個同樣的尺寸的卷積核來進行卷積運算。

2.CNN無法處理Non Euclidean Structure的數據,又希望在拓撲圖上有效的提取空間特徵來進行學習,所以GCN成爲研究重點。

3.數據不是拓撲結構的網絡時,也會用到GCN。廣義上來講任何數據在賦範空間內都可以建立拓撲關係,譜聚類就是這樣的思想。

兩種主流方式來提取拓撲圖的空間特徵:

  1. 基於空間域 :Learning Convolutional Neural Networks for Graphs  ——ICML 2016

 爲了能夠對任意結構的圖進行卷積操作,這篇文章提出了PATCHY-SAN (Select-Assemble-Normalize)的方法,通過三個步驟構建卷積分片:1.從圖中選擇一個固定長度的節點序列;2.對序列中的每個節點,收集固定大小的鄰域集合;3.對由當前節點及其對應的鄰域構成的子圖進行規範化,作爲卷積結構的輸入。通過上述三個步驟構建出所有的卷積片之後,利用卷積結構分別對每個分片進行操作。具體示意圖如下圖所示。

總體上講,就是用w個固定size=k的子圖來表示輸入的graph,再將這w個子圖正則化後,生成一個w*k維的向量,作爲傳統的CNN的輸入,進行學習。其實就是做了一個從graph到向量的映射的一個預處理過程。

具體構建卷積分片的步驟:

1.節點序列選擇:爲對圖中所有的節點進行標號排序,將圖中的節點集合根據向心性(節點的度、中心度等)映射爲有序的節點序列。從該序列中根據一定的間隔s隔段選取w個節點構成最終的節點序列。

2.鄰域節點收集:對於上一步獲得的節點序列中的每一個節點,利用廣度優化搜索擴展鄰域節點,和源節點一起構成一個k大小的鄰域集合。

3.子圖規範化:對鄰域集合中的各節點標號排序,得到接受域。那麼,對於節點的屬性,k個節點屬性值構成了一個輸入通道,對於邊的屬性,k^2個屬性值也構成了一個輸入通道。我們可以分別用一維的卷積層來處理這兩種輸入通道(對於節點屬性卷積層長度爲k,對於邊屬性卷積層長度爲k^2)。

香港中大-商湯科技聯合實驗室的最新 AAAI 會議論文“Spatial Temporal Graph Convolution Networks for Skeleton Based Action Recognition”提出了一種新的 ST-GCN,即時空圖卷積網絡模型,用於解決基於人體骨架關鍵點的人類動作識別問題。該方法除了思路新穎之外,在標準的動作識別數據集上也取得了較大的性能提升。

ST-GCN 的基礎是時空圖結構。大致步驟:

•構建時空圖(包括相鄰關鍵點的連接關係或身體部件等,如手-手肘-肩膀的連接關係)。

•圖結構上的卷積網絡

 

2. 基於頻譜域 :藉助圖譜的理論來實現拓撲圖上的卷積操作     Spectral Networks and Deep Locally Connected Networks on Graphs             ——NIPS 2014

對於圖G=(V,E),其中Laplacian矩陣的定義爲L=D-A,其中L是Laplacian矩陣,D是頂點的度矩陣(對角矩陣),對角線上的元素依次爲各頂點的的度,A是圖的鄰接矩陣。

Symmetric normalized Laplacian: ,很多GCN的論文中應用的是這樣的拉普拉斯矩陣。

對於拉普拉斯矩陣進行譜分解爲:

所以特徵分解可以寫成:

特徵分解最右邊的特徵矩陣的逆,只是拉普拉斯的性質可以寫成特徵矩陣的轉置

卷積定理:函數卷積的傅里葉變化是函數傅里葉變化的乘積,即對於函數f(t)h(t)兩者的卷積是其函數傅里葉變換乘積的逆變換:

類比到Graph上並把傅里葉變換的定義帶入,f與卷積核h在Graph上的卷積可以由下面步驟得到:

f的傅里葉變換爲

卷積核h的傅里葉變換寫成對角矩陣的形式 

兩者的傅里葉變換乘積即爲

這種參數方法缺點:

  1. 每一次前向傳播,都要計算U, diag(θl)以及UT三者的乘積,特別是對於大規模的graph,計算代價較高,也就是論文中的O(n2)的計算複雜度
  2. 卷積核需要n個參數

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章