《Diffusion-Convolutional Neural Networks》論文理解

1.DCNN框架

DCNN以節點的特徵矩陣以及節點的概率轉移矩陣(可以認爲是結構矩陣)爲輸入,然後以每個節點爲中心,將不同的跳(hop)上的節點信息進行聚合,得到前HH跳的聚合向量,構成節點的擴散表示Zt(i,:,:)RH×FZ_t(i,:,:)\in R^{H\times F},所有節點的擴散表示組成張量ZtRNt×H×FZ_t\in R^{N_t\times H\times F}。對節點(圖)的分類任務就是將擴散表示直接送入全連接網絡,通過softmax函數得到各類的分類概率。下圖是DCNN的實現節點分類和圖分類的流程圖。
在這裏插入圖片描述

2.擴散卷積表示

AtA_t表示圖的鄰接矩陣,PtP_t表示度歸一化轉移矩陣,(Pt)ij(P_t)_{ij}表示由節點ii轉移到jj的概率,可以由AtA_t計算得到,可以認爲是權重矩陣。AtA_t矩陣有一個性質:AtA_t矩陣的冪級數AtnA^n_t中的一個元素(Atn)ij(A^n_t)_{ij},表示節點ii到節點jj長度爲nn的遊走(英文爲walkwalk)的數量,當不存在這樣的遊走時,該值爲0,之後將該矩陣歸一化後,就可以表示長度爲nn時,節點ii轉移到jj的概率。這種性質對應與公式(1):
Ptijk=Ptikj(1)P^*_{tijk}=P^j_{tik}\tag1

其中,PtRNt×H×NtP^*_t\in R^{N_t\times H\times N_t}表示由PtP_t組成的冪級數;ii表示節點iijj表示跳(hop)爲jj,也就是遊走的長度爲jjkk表示節點的第kk個特徵。從公式(1)可以看出來,PtP^*_t的元素(Pt)ijk(P^*_t)_{ijk}表示:遊走長度爲jj時,節點ii轉移到節點kk的概率。

(1)節點的擴散卷積表示

擴散卷積表示爲:
Ztijm=f(Wjmcl=1NtPtijlXtlm)(2)Z_{tijm}=f(W_{jm}^c\cdot \sum_{l=1}^{N_t}{P^*_{tijl}X_{tlm}})\tag2

其中,mm表示所有節點的第mm個特徵,WjmW_{jm}表示權重,ZtijmZ_{tijm}表示:以節點ii爲中心,在第mm個特徵上,遊走長度爲jj的節點信息的聚合值;l=1NtPtijlXtlm\sum_{l=1}^{N_t}{P^*_{tijl}X_{tlm}}部分的意義是以概率方式對節點iijj跳節點的一個信息聚合,ff爲非線性激活函數。
式(2)的張量表示形式爲:
Zt=f(WcPtXt)(3)Z_t=f(W^c\bigodot P^*_tX_t)\tag{3}

其中,\bigodot表示逐元素相乘,WcRH×FW^c \in R^{H\times F},爲訓練權重;PtXtRNt×H×FP^*_tX_t\in R^{N_t\times H\times F}表示每個節點的各個跳[0,H1][0,H-1]的聚合信息;在計算WcPtXtW^c\bigodot P^*_tX_t,存在廣播機制,會將WcW^c複製NtN_t遍,然後逐元素相乘;ZtRNt×H×FZ_t \in R^{N_t\times H\times F}

(2)圖的擴散卷積表示

圖的擴散卷積表示:
Zt=f(Wc(1Nt)TPtXtNt)(4)Z_t=f(W^c\bigodot \frac{(1_{N_t})^TP^*_tX_t}{N_t})\tag{4}

其中PtXtP^*_tX_t的意義不變,1NtRNt×11_{N_t}\in R^{N_t\times 1}表示將各個節點信息RH×F\in R^{H\times F}聚合的權重;除以NtN_t得到平均值。WcW^c訓練得到的加權權值。

3.分類任務

(1)節點分類

在得到節點的擴散卷積表示ZtZ_t之後,可以直接將ZtZ_t送入全連接層;
P(YX)=softmax(f(WdZ))(5)P(Y|X)=softmax(f(W^dZ))\tag5

其中,在送入全連接層之前需要將ZtZ_t展平,變成二維矩陣ZRNt×(HF)Z\in R^{N_t\times (HF)}WdR(HF)×CW^d\in R^{(HF)\times C}CC表示分類種數。
論文中表達的公式爲P(YX)=softmax(f(WdZ))P(Y|X)=softmax(f(W^d\bigodot Z))應該和公式(5)是一致的。

(2)圖分類

圖分類與節點分類的原理一致:
在得到圖的擴散卷積表示ZtZ_t之後,可以直接將ZtZ_t送入全連接層;
P(YX)=softmax(f(WdZ))(6)P(Y|X)=softmax(f(W^dZ))\tag6

其中,在送入全連接層之前需要將ZtZ_t展平,變成一維向量ZR(HF×1)Z\in R^{(HF\times 1)}WdR(HF)×CW^d\in R^{(HF)\times C}CC表示分類種數。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章