DHSNet： Deep Hierarchical Saliency Network for Salient Object Detection閱讀總結

原創

ModestYjx

2020-06-30 03:44

DHSNet重要總結

1. 主要貢獻

作者提出一個端到端的深層次顯著性網絡DHSNet，DHSNet把整個圖片當作是輸入，直接輸出顯著性圖，DHSNet分層次地從全局視角到局部內容檢測目標，從粗略的尺寸細化到細微的尺寸，探索潛在的所有顯著性線索，並有效保存目標細節。

2. 模型介紹

1.簡述

DHSNet由GV-CNN(在DHSNet中，前半部分實質是去掉了VGG16的最後一個池化層得到尺寸爲[512, 28, 28]的Feature Map)和HRCNN兩部分組成。GV-CNN網絡可學習各種全局的結構顯著性線索，HRCNN可融合局部的上下文內容，分層的漸進的調整顯著圖的細節，總體地說DHSNet是使用分層遞進的優化整合的策略來學習從全局視角到局部內容。

[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-J5a4tdmV-1586158146022)(https://s1.ax1x.com/2020/04/06/GsDJ3j.png)]
GV-CNN包含13層卷積層，4層池化層，一個全連接層和一個重塑層。對於大小爲224x224的輸入圖像，通過卷積層提取深度特徵，最後一個卷積層的大小爲1214512，使用sigmiod激活函數的全連接層的輸出結點爲784個，然後重塑層使其大小變爲28*28。
HRCNN由4層遞歸卷積層和4層下采樣層組成。RCL通過下采樣得到的較粗略的顯著圖與經過GV-CNN得到的較精細地顯著圖進行融合，來生成一個較精細的顯著圖，經過RCL的遞歸和逐步細化，一次一次爲下一步
由幾個遞歸卷積層（recurrent convolutional layers，RCL）和幾個下采樣層組成。其中，遞歸卷積層RCL將遞歸鏈接併入每一卷積層中，從而增強了模型如何上下文信息的能力
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-dfaH09SE-1586158146026)(https://s1.ax1x.com/2020/04/06/GsDYgs.png)]

2.細節

RCL網絡中，第k個特徵圖中座標爲(i，j)的單元，在時間t時的值爲：
$x_{i j k}(t)=g\left(f\left(z_{i j k}(t)\right)\right)$
f爲整流線性激活函數Relu，g爲本地響應歸一化函數LRN，LRN用於防止出現梯度爆炸，可得：
$g\left(f_{i j k}(t)\right)=\frac{f_{i j k}(t)}{\left(1+\frac{\alpha}{N} \sum_{k^{\prime}=\max (0, k-N / 2)}^{\min (K, k+N / 2)}\left(f_{i j k^{\prime}}\right)^{2}\right)^{\beta}}$
$z_{i j k}(t)$ 融合一個前饋連接和

$\mathbf{u}^{(i, j)}$ 和 $\mathbf { x } ^ { ( i , j ) } ( t - 1 )$ 是上一層RCL的正反饋， $\mathbf { w } _ { k } ^ { f }$ 和 $\mathbf { w } _ { k } ^ { r }$ 是前饋網絡的參數和上一層RCL的參數。
$z_{i j k}(t)=\left(\mathbf{w}_{k}^{f}\right)^{T} \mathbf{u}^{(i, j)}+\left(\mathbf{w}_{k}^{r}\right)^{T} \mathbf{x}^{(i, j)}(t-1)+b_{k}$

3. 性能

模型質量對比圖：

模型簡化測試圖：

模型質量比RC , GS , HS , GBMR，DRFI , wCtr , HDCT , CPMC-GBVS , LEGS , MDF和MCDL性能都要好。
證明GV-CNN的有效性，實驗使用GV-CNN+RCL的組合比使用FCN+RCL的F-measure提升0.129，原因可能是FCN的誤判被RCL放大了。
證明RCL的有效性，實驗使用GV-CNN+RCL和GV-CNN+傳統卷積層性能的F-measure提升0.129。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

DHSNet： Deep Hierarchical Saliency Network for Salient Object Detection閱讀總結

DHSNet重要總結

1. 主要貢獻

2. 模型介紹

1.簡述

2.細節

3. 性能

[轉帖]使用NMT和pmap解決JVM資源泄漏問題原創

Python實現大麥網搶票的四大關鍵技術點解析

salesforce零基礎學習（一百三十八）零碎知識點小總結（十）

一款開源的.NET程序集反編譯、編輯和調試神器

關於接口協議，你必須要知道這些！

【2024-05-21】以茶會友

2020年7月5日藍橋杯省賽心得總結

算法題解整理

數學題集合

CV文章摘要中文翻譯集（目標檢測，紋理分類）

數理統計-ML-CV知識點(正在更新中)

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結