論文筆記:Mask R-CNN

論文筆記:Mask R-CNN

1.簡介

MASK RCNN是ICCV 2017 best paper。這篇文章提出了一個二階段的實例分割網絡,能以像素級精度分割出每一個不同的個體。

2.設計思路

這是一個兩階段的方法,第一階段通過RPN網絡提出一些可能的區域,第二階段在每一個區域裏面進行分類和迴歸,對於每一個區域都得到一個分類結果、一組邊框offset和K個mask(K爲總的類別數),第二階段的三個任務同時進行,最後只取與類別對應的mask作爲最終的mask。

3.具體實現方法

3.1網絡結構

網絡分爲backbone和head兩部分,分別完成region proposal和分類+邊框預測+mask預測。backbone採用resnet-50-C4或者FPN,head使用全卷積神經網絡。
在這裏插入圖片描述

3.2 RoIAlign

不同於faster rcnn使用的RoIPooling,RoIAlign通過雙線性差值的方法找RoI對應的區域,避免了量化(使用取整函數)過程中造成的邊界誤差。

3.3 損失函數

L=Lcls+Lbox+LmaskL = L{cls} + L{box} + L{mask}
其中LmaskL{mask}只計算對應類別的loss。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章