DHSNet重要總結
1. 主要貢獻
作者提出一個端到端的深層次顯著性網絡DHSNet,DHSNet把整個圖片當作是輸入,直接輸出顯著性圖,DHSNet分層次地從全局視角到局部內容檢測目標,從粗略的尺寸細化到細微的尺寸,探索潛在的所有顯著性線索,並有效保存目標細節。
2. 模型介紹
1.簡述
DHSNet由GV-CNN(在DHSNet中,前半部分實質是去掉了VGG16的最後一個池化層得到尺寸爲[512, 28, 28]的Feature Map)和HRCNN兩部分組成。GV-CNN網絡可學習各種全局的結構顯著性線索,HRCNN可融合局部的上下文內容,分層的漸進的調整顯著圖的細節,總體地說DHSNet是使用分層遞進的優化整合的策略來學習從全局視角到局部內容。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-J5a4tdmV-1586158146022)(https://s1.ax1x.com/2020/04/06/GsDJ3j.png)]
GV-CNN包含13層卷積層,4層池化層,一個全連接層和一個重塑層。對於大小爲224x224的輸入圖像,通過卷積層提取深度特徵,最後一個卷積層的大小爲1214512,使用sigmiod激活函數的全連接層的輸出結點爲784個,然後重塑層使其大小變爲28*28。
HRCNN由4層遞歸卷積層和4層下采樣層組成。RCL通過下采樣得到的較粗略的顯著圖與經過GV-CNN得到的較精細地顯著圖進行融合,來生成一個較精細的顯著圖,經過RCL的遞歸和逐步細化,一次一次爲下一步
由幾個遞歸卷積層(recurrent convolutional layers,RCL)和幾個下采樣層組成。其中,遞歸卷積層RCL將遞歸鏈接併入每一卷積層中,從而增強了模型如何上下文信息的能力
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-dfaH09SE-1586158146026)(https://s1.ax1x.com/2020/04/06/GsDYgs.png)]
2.細節
RCL網絡中,第k個特徵圖中座標爲(i,j)的單元,在時間t時的值爲:
f爲整流線性激活函數Relu,g爲本地響應歸一化函數LRN,LRN用於防止出現梯度爆炸,可得:
融合一個前饋連接和
和是上一層RCL的正反饋,和是前饋網絡的參數和上一層RCL的參數。
3. 性能
模型質量對比圖:
模型簡化測試圖:
- 模型質量比RC , GS , HS , GBMR,DRFI , wCtr , HDCT , CPMC-GBVS , LEGS , MDF和MCDL性能都要好。
- 證明GV-CNN的有效性,實驗使用GV-CNN+RCL的組合比使用FCN+RCL的F-measure提升0.129,原因可能是FCN的誤判被RCL放大了。
- 證明RCL的有效性,實驗使用GV-CNN+RCL和GV-CNN+傳統卷積層性能的F-measure提升0.129。