點擊上方“AI算法與圖像處理”,選擇加"星標"或“置頂”
重磅乾貨,第一時間送達
引言
綜述一
【1】使用深度學習進行圖像分割:綜述
標題:Image Segmentation Using Deep Learning: A Survey
作者:Shervin Minaee, Demetri Terzopoulos
鏈接:https://arxiv.org/abs/2001.05566
本文梳理了172篇相關文獻。
最近,由於深度學習模型在各種視覺應用中的成功,已經有大量旨在利用深度學習模型開發圖像分割方法的工作。本文提供了對文獻的全面回顧,涵蓋了語義和實例級分割的衆多開創性作品,包括全卷積像素標記網絡,編碼器-解碼器體系結構,多尺度以及基於金字塔的方法,遞歸網絡,視覺注意模型和對抗環境中的生成模型。本文研究了這些深度學習模型的相似性,優勢和挑戰,研究了使用最廣泛的數據集,報告了性能,並討論了該領域有希望的未來研究方向。
2014年至2020年基於DL的2D圖像分割算法的時間軸。橙色,綠色和黃色塊分別表示語義,實例和全景分割算法。
DeepLabV3在樣本圖像上的分割結果。
U-net模型。藍色框表示具有其指定形狀的要素地圖塊。
DeepLabv3 +模型。
以mIoU和平均準確度(mAcc)表示,NYUD-v2和SUN-RGBD數據集上的分割模型的性能。
綜述二
【2】 A Survey on Deep Learning Methods for Semantic Image Segmentation in Real-Time
標題:深度學習實時語義圖像分割方法綜述
作者:Georgios Takos
鏈接:https://arxiv.org/abs/2009.12942
本文共梳理了9篇相關文獻。
語義圖像分割是計算機視覺中增長最快的領域之一,具有多種應用程序。在許多領域,例如機器人技術和自動駕駛汽車,語義圖像分割至關重要,因爲語義分割爲基於像素級別的場景理解提供了採取動作所需的必要上下文。此外,醫學診斷和治療的成功取決於對所考慮數據的極其準確的理解,並且語義圖像分割是許多情況下的重要工具之一。深度學習的最新發展提供了許多工具來有效地解決這一問題,並且提高了準確性。這項工作對圖像分割中的最新深度學習體系結構進行了全面分析,更重要的是,它提供了廣泛的技術列表以實現快速推理和計算效率。
完全卷積網絡架構:
DeconvNet體系結構:
比例感知語義圖像分割架構:
Cityscapes像素級語義標籤任務最佳表現模型:
綜述三
【3】Unsupervised Domain Adaptation in Semantic Segmentation: a Review
標題:語義分割中的無監督自適應研究進展
作者:Marco Toldo, Pietro Zanuttigh
鏈接:https://arxiv.org/abs/2005.10876
本文共梳理了120篇相關文獻。
本文的目的是概述用於語義分割的深度網絡的無監督域自適應(UDA)的最新進展。這項任務引起了廣泛的興趣,因爲語義分割模型需要大量的標記數據,而缺乏適合特定要求的數據是部署這些技術的主要限制。
最受歡迎的用於語義分割的UDA策略的維恩圖。每種方法都屬於代表使用的自適應技術的集合。
從分類(稀疏任務)到語義分割(密集任務)的一些樣本圖像上一些可能的視覺任務的概述。
可以在不同的空間執行域移位自適應:輸入級別,功能級別和輸出級別。
綜述四
【4】A survey of loss functions for semantic segmentation
標題:語義分割損失函數綜述
作者:Shruti Jadon
鏈接:https://arxiv.org/abs/2006.14822
本文共梳理了23篇相關文獻。
本文總結了一些衆所周知的損失函數,這些函數廣泛用於圖像分割,並列出了使用它們可以幫助快速,更好地收斂模型的情況。此外,本文還引入了新的log-cosh骰子損失函數,並將其在NBFS頭骨分割開源數據集上的性能與廣泛使用的損失函數進行了比較。 本文還展示了某些損失函數在所有數據集上都能很好地發揮作用,並且在未知的數據分發方案中可以被視爲很好的基準選擇。
語義分割損失函數的類型
二元交叉熵損失函數圖。在這裏,熵在Y軸上定義,事件的概率在X軸上。
語義分割損失函數的附表。
綜述五
【5】A Survey on Instance Segmentation: State of the art
標題:實例分割技術綜述
作者:Abdul Mueed Hafiz, Ghulam Mohiuddin Bhat
鏈接:https://arxiv.org/abs/2007.00047
本文共梳理143篇相關文章,由克什米爾大學的學者發佈。
目標檢測或定位是從粗略到精細的數字圖像推斷的增量步驟。它不僅提供圖像對象的類別,而且還提供已分類圖像對象的位置。該位置以邊界框或質心的形式給出。語義分割可通過預測輸入圖像中每個像素的標籤來進行精細推斷。每個像素根據其所在的對象類別進行標記。爲進一步發展,實例分割爲屬於同一類的對象的單獨實例提供了不同的標籤。因此,實例分割可以被定義爲同時解決對象檢測和語義分割問題的技術。在這份關於實例分割的調查論文中,討論了實例分割的背景,問題,技術,演變,流行的數據集,相關技術以及最新範圍。本文爲那些希望在實例分割領域進行研究的人提供了寶貴的信息。
對象識別的演變:從粗略推斷到細粒度推斷:(a)圖像分類,(b)對象檢測或定位,(c)實例分割,(d)語義分割。
實例分割中重要技術的時間表
下圖爲PANet框架。(a)FPN主幹。(b)自下而上的路徑擴充。(c)自適應功能池。(d)盒支。(e)全連接融合。
Microsoft COCO數據集上值得注意的實例分割工作
個人微信(如果沒有備註不拉羣!)
請註明:
地區+學校/企業+研究方向+暱稱
下載1:何愷明頂會分享
在「AI算法與圖像處理」公衆號後臺回覆:何愷明,即可下載。總共有6份PDF,涉及 ResNet、Mask RCNN等經典工作的總結分析
下載2:終身受益的編程指南:Google編程風格指南
在「AI算法與圖像處理」公衆號後臺回覆:c++,即可下載。歷經十年考驗,最權威的編程規範!
下載3 CVPR2020
在「AI算法與圖像處理」公衆號後臺回覆:
CVPR2020
,即可下載1467篇CVPR 2020論文
覺得不錯就點亮在看吧
本文分享自微信公衆號 - AI算法與圖像處理(AI_study)。
如有侵權,請聯繫 [email protected] 刪除。
本文參與“OSC源創計劃”,歡迎正在閱讀的你也加入,一起分享。