Multi-scale Interactive Network for Salient Object Detection(閱讀記錄)

Multi-scale Interactive Network for Salient Object Detection

1.主要貢獻

•文章提出了MINet,以有效地滿足SOD任務中的多尺度要求。 聚集相互作用模塊可以通過相互學習的方式有效地利用相鄰層的特徵,而自交互模塊則使網絡可以自適應地從數據中提取多尺度信息,並更好地處理顯著物體的尺度變化。
•文章設計了增強一致性損失函數作爲輔助來推動模型一致地突出顯示整個顯着區域,並更好地處理由各種比例的物體引起的前後區域之間的像素不平衡問題,而無需任何後處理或 額外的參數。

2.模型概括

        整個模型的結構採用的是FCN的網絡結構,上面爲編碼器,下面時解碼器,可見,該結構的獨特之處在於,添加了AIM、SIM模塊來獲得多尺度信息,之前的方法獲取多尺度的方法多考慮從使用不同空洞率的卷積入手,如ASPP結構,但是這種操作不僅會使得參數量增加,而且作者認爲強行concat各種尺度的圖片可能會帶來噪音,作者強調引用相鄰尺度的圖片來擴大感受野可能更好,而且編碼器解碼器本身就有多尺度的信息,用多餘操作執行可能導致冗餘,因此,本文作者設計了AIM結構融合編碼器的相鄰尺度的特徵來解決多尺度問題。此外,作者還提出SIM結構來提取多尺度信息。

        AIM設計第一列考慮做pooling操作,第二列卷積操作並改變channel,然後就是特徵組合,最後卷積處理然後再組合,爲了強調當前層的特徵,會有一個類似殘差的操作。

 

3.損失函數

        作者認爲,單純的BCEloss是有問題的,比如說前景物體與背景的比例變化,BCE對待前景和背景是沒有區別的,這都是不太合理的,作者考慮一個更具有表達力的損失函數,應該在結果與預測值前景相差較大時得到最大損失,因此考慮從CEL入手。

 

4.實驗結果

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章