Multi-scale Interactive Network for Salient Object Detection

1.主要貢獻

•文章提出了MINet，以有效地滿足SOD任務中的多尺度要求。聚集相互作用模塊可以通過相互學習的方式有效地利用相鄰層的特徵，而自交互模塊則使網絡可以自適應地從數據中提取多尺度信息，並更好地處理顯著物體的尺度變化。
•文章設計了增強一致性損失函數作爲輔助來推動模型一致地突出顯示整個顯着區域，並更好地處理由各種比例的物體引起的前後區域之間的像素不平衡問題，而無需任何後處理或額外的參數。

2.模型概括

整個模型的結構採用的是FCN的網絡結構，上面爲編碼器，下面時解碼器，可見，該結構的獨特之處在於，添加了AIM、SIM模塊來獲得多尺度信息，之前的方法獲取多尺度的方法多考慮從使用不同空洞率的卷積入手，如ASPP結構，但是這種操作不僅會使得參數量增加，而且作者認爲強行concat各種尺度的圖片可能會帶來噪音，作者強調引用相鄰尺度的圖片來擴大感受野可能更好，而且編碼器解碼器本身就有多尺度的信息，用多餘操作執行可能導致冗餘，因此，本文作者設計了AIM結構融合編碼器的相鄰尺度的特徵來解決多尺度問題。此外，作者還提出SIM結構來提取多尺度信息。