3.《SEMI-SUPERVISED CLASSIFICATION WITH GRAPH CONVOLUTIONAL NETWORKS》論文理解

原創

2020-06-16 02:25

在《SEMI-SUPERVISED CLASSIFICATION WITH GRAPH CONVOLUTIONAL NETWORKS》中，作者對《Convolutional Neural Networks on Graphs
with Fast Localized Spectral Filtering》作出了改進，提出了以下創新：
（1）提出了一個可以直接在圖上操作的神經網絡模型的逐層傳播規則；
（2）證明了這種形式的圖卷積網絡怎樣在圖上實現半監督的節點分類；

1.神經網絡模型的逐層傳播規則
卷積公式的頻域表示：
$g*x=Ug_{\theta}U^{T}x\tag{1}$

定義 $L$ 爲對稱歸一化圖拉普拉斯矩陣， $L=I_{N}-D^{-\frac{1}{2}}AD^{-\frac{1}{2}}=U\Lambda U^{T}$ , $A$ 是無向圖的鄰接矩陣(可以是二值，也可以是權值)， $D_{ii}=\sum_{j}{A_{ij}}$ 是圖的度矩陣。 $U$ 是 $L$ 特徵向量矩陣。 $L$ 的特徵值範圍爲[0,1]。
由論文《Convolutional Neural Networks on Graphs with Fast Localized Spectral Filtering》得到，式(1)可以推導爲：
$g_{\theta^{'}}(\Lambda) \approx \sum_{k=0}^{K}{\theta_{k}^{'}}T_{k}(\tilde\Lambda)\tag{2}$

其中 $\tilde\Lambda=\frac{2}{\lambda_{max}}\Lambda-I_{N}$ , $\theta^{'}\in R^{K}$ 是切比雪夫係數。得到： $g*x \approx \sum_{k=0}^{K}{\theta_{k}^{'}}T_{k}(\tilde L)x$ ,其中 $\tilde L=\frac{2}{\lambda_{max}}L-I_{N}$ 。 $\tilde L$ 的特徵值範圍爲[-1,1]。
當使用 $K=1$ 時，式（2）在頻域變爲線性函數，即：
$g*x\approx \theta_{0}^{'}x+\theta_{1}^{'}(\frac{2}{\lambda_{max}}L-I_{N})x\tag{3}$

將 $\lambda_{max}\approx2$ ，則
$g*x\approx \theta_{0}^{'}x+\theta_{1}^{'}(L-I_{N})x=\theta_{0}^{'}x-\theta_{1}^{'}(D^{-\frac{1}{2}}AD^{-\frac{1}{2}})x\tag{4}$

由於 $\theta_{0}^{'},\theta_{1}^{'}$ 是訓練參數，是可調整的，使得 $\theta_{0}^{'}=-\theta_{1}^{'}=\theta$ ，那麼
$g*x\approx \theta(I_{N}+D^{-\frac{1}{2}}AD^{-\frac{1}{2}})x\tag{5}$

$I_{N}+D^{-\frac{1}{2}}AD^{-\frac{1}{2}}$ 的特徵值範圍爲[0,2],可能會導致梯度消失和梯度爆炸的問題，將 $I_{N}+D^{-\frac{1}{2}}AD^{-\frac{1}{2}}$ 再次歸一化爲 $\tilde D^{-\frac{1}{2}}\tilde A\tilde D^{-\frac{1}{2}}$ ,其中， $A\tilde = A+I_{N}$ , $\tilde D_{ii}=\sum_{j}\tilde A_{ij}$ ，可以有效的避免這個問題，同時由於 $\theta$ 爲一個數，可以放到等式的最後，得到：
$g*x\approx(\tilde D^{-\frac{1}{2}}\tilde A\tilde D^{-\frac{1}{2}})x \theta\tag{6}$

當信號 $x$ 爲多通道信號 $X\in R^{N×C}$ 時，並且使用 $F$ 個卷積核，使得每個輸出節點的通道數爲 $F$ ，則：
$Z=(\tilde D^{-\frac{1}{2}}\tilde A\tilde D^{-\frac{1}{2}})X\Theta\tag{7}$

$C$ 爲輸入節點的通道數， $F$ 爲輸出節點的通道數，同時也是卷積核數目； $\Theta \in R^{C×F}$ 爲這 $F$ 個卷積核的參數。

2.半監督的節點分類
令 $\tilde D^{-\frac{1}{2}}\tilde A\tilde D^{-\frac{1}{2}}=\hat A，\Theta=W$ ,則兩層的圖卷積分類網絡可以表示爲：
$Z=f(X,A)=softmax(\hat A\ ReLU(\hat AXW^{(0)})W^{(1)})\tag8$

需要說明的是，一個圖就是一個樣本，每個樣本在逐層傳播的過程中認爲 $\hat A$ 是一樣的，也就是說每層中 $\hat A$ 是共享的。 $softmax(x_{ij})=\frac{exp(x_{ij})}{\sum_{j}exp(x_{ij})}$ ， $i \in [1,N],j \in [1,F],x_{i} \in R^{1×F}$ 表示兩層卷積後輸出 $(R^{N×F})$ 的第 $i$ 行。交叉熵爲 $L=-\sum_{l\in Y_{L}}\sum_{f=1}^{F}Y_{lf}lnZ_{lf}$ ,其中 $Y_{L}$ 是有標籤節點的集合。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

3.《SEMI-SUPERVISED CLASSIFICATION WITH GRAPH CONVOLUTIONAL NETWORKS》論文理解

python gdal 安裝使用（Windows， python 3.6.8）

sklearn.preprocessing.OneHotEncoder()函數介紹

《Multi-Label Image Recognition with Graph Convolutional Networks》論文理解

1.《Spectral Networks and Deep Locally Connected Networks on Graphs》論文理解

《Adaptive Graph Convolutional Neural Networks》論文理解

Spectral-based ConvGNNs

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結