【點雲識別】3D-MPA: Multi Proposal Aggregation for 3D Semantic Instance Segmentation (CVPR 2020)

原創

orientliu96

2020-04-20 07:40

3D-MPA: Multi Proposal Aggregation for 3D Semantic Instance Segmentation

本文介紹一篇cvpr2020裏面關於點雲識別的文章。
論文
目前還沒有開源代碼

1. 問題

3D目標檢測的主要難點在於如何預測和處理 object proposal。一種思路是是自上而下的方式，先回歸大量的box，然後再進行第二階段的優化。但是如果box的偏差比較大，此類方法就很難奏效。另一種思路是自下而上的，通過metric learning學習每點的feature，然後根據這些點的特徵，進行聚類形成instance。但是聚類的參數需要人爲調整，而且pairwise的計算量太大。本文將這種兩種方法結合起來，發揮自上而下方法計算量小的優點，又利用point feature的魯棒性。通過point-level進行特徵表達，但又不對point-level進行聚類，從而完成對兩種方法的優勢互補。

2. 思想

本文包含三個模塊。proposal generation模塊逐點學習feature, 每個點都對其所屬中心點進行proposals。接下來是proposal consolidation 模塊，對之前的proposal 進行refine。最後是object generation 模塊，迴歸最終的結果。值得一提的是，作者沒有使用常見的NMS方式進行迴歸，因爲NMS可能會丟掉正確的結果。而是對 high-level的proposel進行聚類，相比於直接對point聚類，大大減少計算量。

3. 算法

3.1 Proposal Generation

採用稀疏卷積提取每個點的特徵，然後分成兩個分支，分別預測語義類別以及迴歸每個點所屬實例的中心點座標。

對於得到的中心點集，隨機採樣k個點作爲實例proposals，每個proposal中心點半徑r範圍內的點視爲屬於其對應的實例的點，然後將每個proposal點集通過簡單的pointnet提取proposal feature。

每個proposal用元組(yi; gi; si)表示，其中yi代表proposal的中心點位置，gi代表proposal feature，si代表proposal對應包含的實例點集。

3.2 Proposal Consolidation

爲了使proposal feature可以和全局特徵產生更多的交互，本文使用DGCNN的思想，建立一個GCN來 refine proposal features。

3.3 Object Generation

此處，我們得到K個proposal
通過MLP得到objectness score。和gt中心點距離小於0.3m的設爲正，大於0.6m或和兩個gt中心點距離相等的設爲負。負proposals不做處理。

對正的proposals，先預測語義類別，再aggregation features和二值實例mask。其中aggregation feature 包含兩個方面Geometric features 和 Embedding features

最終的loss爲

4 實驗結果

總結

上一篇PointGroup和這篇文章有着異曲同工之妙。但是3D-MPA應該更快一些。因爲instance segmentation文章看得不夠多，multi task loss似乎是不可避免的，總覺得太耗時難優化，令人望而卻步啊。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

【點雲識別】3D-MPA: Multi Proposal Aggregation for 3D Semantic Instance Segmentation (CVPR 2020)

3D-MPA: Multi Proposal Aggregation for 3D Semantic Instance Segmentation

1. 問題

2. 思想

3. 算法

3.1 Proposal Generation

3.2 Proposal Consolidation

3.3 Object Generation

4 實驗結果

總結

ImportError: /lib64/libm.so.6: version `GLIBC_2.27‘ not found

【點雲識別】Adaptive Hierarchical Down-Sampling for Point Cloud Classification(CVPR 2020)

【點雲識別】Unsupervised Learning of Intrinsic Structural Representation Points(CVPR 2020)

Package inputenc Error: Invalid UTF-8 byte sequence. [This electronic document is a l]

LaTex Error

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結