2018 CVPR :Dual CNN
本篇文章是2018 CVPR的一篇文章,主要是提出了一種結構來解決多種low-level的視覺問題,主要是參考了超分的一些知識SRCNN、VDSR等等。
//查了一下作者簡歷,在大連理工大學讀完計算機博士學位之後就直接特聘教授去了南京理工大學,28歲正教授,tql//
Dual CNN :Dual Convolutional Neural Networks 雙卷積神經網絡
這篇文章主要是提出了一種通用的雙卷積神經網絡來解決low-level的視覺問題。諸如超分、邊緣保持濾波、去雨、去霧這些問題,通常涉及到估計目標信號的結構和細節兩部分。Dual CNN主要包括兩個並行分支,以端到端的方式來恢復結構和細節。然後將恢復得到的結構和細節根據特定的應用的形成模型來生成目標信號。
low-level通常包括低頻結構和高頻細節的估計,簡單神經網絡對於更深層次網絡性能不好。引入殘差學習來解決更深層次的網絡性能增益,利用深度網絡來估計殘差,但是ResNet無法糾正低頻錯誤。
Dual CNN使用一個淺層的子網絡來估計低頻結構,以及一個深層子網絡來估計高頻細節,將結構和細節進行組合。
存在問題:
對於圖像的去雨,主要是去除一些不需要的成分,現有的方法主要有基於簡單模型、基於殘差學習模型、基於遞歸模型。
簡單網絡不能恢復細化細節,殘差網絡不能糾正結構錯誤。
創新之處:
1、提出了一種雙卷積神經網絡的結構,包括Net-S、Net-D兩個並行的分支分別解決低頻結構和高頻細節的復原。
2、這種Dual CNN的網絡結構可以用到多種low-level視覺問題的解決。
網絡結構:
整體網絡較爲簡單,主要就是兩個並行的神經網絡(爲什麼是並行不是串行,後續有對比實驗),加上一個結合具體問題的構建模塊。
網絡參數借鑑了超分網絡SRCNN和VDSR:
結構估計子網絡Net-S: 3Conv + ReLU 。每一層的濾波尺寸分別爲9x9,1x1和5x5,深度分別爲64,32,1.
細節估計子網絡Net-D: 20Conv + ReLU。每一層的濾波尺寸爲3x3,深度爲64.
訓練參數:batch_size = 64,learning_rate = 0.0001
去雨具體工作:
1、DualCNN模型的正則化
使用單獨的損失函數分別對這兩個分支進行正則化。
網絡的損失函數:
其中,函數φ(·)和(·)是已知的,取決於每個任務的領域知識。
Dual CNN 整體損失函數:
使用SGD隨機梯度下降方法最小化損失函數訓練網絡:
其中,
2、實驗:
數據集:ID-CGAN數據集,包含1000000個數據對
損失函數權重分別設置爲1,0.01,0.
結果:
3、對比實驗:
(1)網絡結構影響
串行級聯結構:
(2)損失函數影響
更改損失函數權重來判斷加入Ls、Ld的影響
(3)分支結構影響
對於去雨工作,將兩個分支分別替換爲SRCNN、VDSR以及替換爲SDCNN-S、SDCNN-D(?沒太看懂)
SRCNN與VDSR組合,優於與SDCNN-D組合。
因爲輸入圖像的主要結構與輸出圖像相似。“net-S”中使用更深的模型會在學習階段引入錯誤。
分頁符