Group Equivariant Convolutional Networks

Cohen T, Welling M. Group equivariant convolutional networks[C]//International conference on machine learning. 2016: 2990-2999.
https://github.com/tscohen/gconv_experiments

傳統的卷積具有平移不變性（translation symmetry）：對輸入圖片進行平移後再輸入網絡，得到的輸出與未平移的輸出仍然滿足平移關係

提取不變性的數學表達式：

x表示輸入， $T_g$ 表示變換， $\Phi$ 表示特徵提取過程（即卷積過程），上式的含義是輸入x經過平移變換得到 $T_gx$ ，對 $T_gx$ 提取特徵，等價於：直接對x提取特徵再進行 $T_g'$ 變換。對於平移不變性而言，這邊的變換 $T_g$ 和 $T_g'$ 等價，均爲平移變換。

進一步理解不變性：
根據上圖，有兩張臉x和y，兩者經過特徵提取之後映射到同一個點 $\Phi(x)=\Phi(y)$ ，假設對這兩張臉進行變換 $T_g^1$ ，得到旋轉後的臉 $T_g^1x$ 和 $T_g^1y$ ，再進行特徵提取，得到 $\Phi(T_g^1x)$ 和 $\Phi(T_g^1y)$ ，根據變換不變性： $\Phi(T_gx)=T_g'\Phi(x)$ ，有：

$\Phi(T_g^1x)=T_g^2\Phi(x)$

$\Phi(T_g^1y)=T_g^2\Phi(y)$

又因爲 $\Phi(x)=\Phi(y)$ ，所以得到 $\Phi(T_g^1x)=\Phi(T_g^1y)$ ，即：旋轉之後再提取特徵，兩張臉還是能夠被映射到同一個點，即具有旋轉不變性

那麼，爲什麼傳統的CNN會具有平移不變性呢？ 作者對此進行了如下推導：
首先傳統CNN的卷積過程可以表示爲：

上面的式子表示卷積，下面的式子表示相關（correlation），兩者應用於CNN時從訓練結果上講是等價的。x表示座標，f表示特徵圖， $l$ 表示第 $l$ 層， $K^l$ 表示通道數， $\psi$ 表示卷積核，上式表現了一個卷積核 $\psi$ 在特徵圖上卷積的過程。

那麼，假設對輸入的特徵圖f做位移： $y\rightarrow y+t$ ，可以得到以下推導過程：

$L_t$ 表示進行位移t的變換，上式表明：先對特徵圖f進行位移t的變換再通過卷積核 $\psi$ 提取特徵，等價於：先通過卷積核 $\psi$ 提取特徵，再進行位於t的變換。由此，得到位移不變性。

那麼，爲什麼傳統的CNN沒有旋轉不變性呢？ 作者進行了對應的旋轉變換的推導證明 $[[L_rf]*\psi](x) = L_r[f*[L_{r^{-1}}\psi]](x)$ :

$[[L_rf]\star\psi](x) =\sum_{y}f(A_ry)\psi(y-x)=\sum_{y}f(y)\psi(A^{-1}_ry-x)=\sum_{y}f(y)\psi(A^{-1}_r(y-A_rx))=L_r[f\star[L_{r^{-1}}\psi]](x)$

其中， $A_r$ 表示旋轉矩陣。
直觀上理解，若對特徵圖進行旋轉之後再進行卷積，等價於：對卷積核做反向的旋轉，再對原始特徵圖進行卷積，再把卷積得到的結果旋轉回來。這與不變性的定義不符（按照不變性的定義，應該是等價於：特徵圖直接與卷積核卷積，再進行旋轉），因此，傳統的CNN沒有旋轉不變性。

以下是腦洞（存在問題）：
假設我們定義一個新的卷積操作：
$[f\diamond\psi^i](\theta)=\sum_{y\in \mathbb{Z}^2}\sum_{k=1}^{K^l}f_k(y)\psi_k^i(A_\theta^{-1} y)$
其中， $A_\theta$ 表示旋轉角度爲 $\theta$ 的旋轉矩陣。
根據這個卷積操作，推導旋轉不變性：
$[[L_rf]\diamond\psi](\theta) =\sum_{y}f(A_ry)\psi(A_\theta^{-1} y)=\sum_{y}f(y)\psi(A^{-1}_rA_\theta^{-1} y)=\sum_{y}f(y)\psi(A_{(\theta+r)}^{-1} y)=L_r[f\diamond\psi](\theta)$

作者由此提出了G-CNN，定義了一個新的卷積操作：

其中 $g\in G$ ，表示變換的集合，在第一層之後，上式各函數可以定義在離散集合 $G$ 上：

推導不變性， $h\rightarrow uh$ :

這篇文章的主要思想如上。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

Group Equivariant Convolutional Networks

Group Equivariant Convolutional Networks

去噪算法整理

Group Equivariant Convolutional Networks

Transforming Autoecoders

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結