Global-Local Bidirectional Reasoning for Unsupervised Representation Learning of 3D Point Clouds 筆記

Global-Local Bidirectional Reasoning for Unsupervised Representation Learning of 3D Point Clouds

本文介紹一篇cvpr2020裏面關於點雲無監督識別的文章。
論文
代碼

1. 問題

以無監督的方式來學習點雲,而且在modelnet和scannetobject 數據集上達到了和有監督方式的一樣的精度。

2. 思想

這篇文章認爲,由於3D物體自身的集合特性,應該可以根據局部推斷出整體的類別,並且更好的區分類內的差別。反過來,整體的特徵應該也可以推斷出各個局部的細節。
在這裏插入圖片描述
顯而易見,本文包含兩個步驟。Local to Global Reasoning 和 Global to Local Reasoning

3. 算法

3.1 Local to Global Reasoning

思想就是,從提取到的局部特徵,映射得一個全局特徵,然後衡量由局部特徵得到的全局特徵與直接的全局特徵之間差異,進行反覆學習。

所以,首先需要一個預測網絡。

  • Prediction Networks:
    將局部特徵和全局特徵映射到一個共享的特徵空間內

接下來,就是需要衡量二者的差異

  • Self-Supervised Metric Learning:

本文沒有選取常規的二範數,而是將其看作是unsupervised metric learning task,並如此建模(我不太瞭解metric learning)還使用multi-class N-pair loss 來監督預測任務
在這裏插入圖片描述仿照人臉識別的metric learning將特徵放在一個超球上。

在這裏插入圖片描述

3.2 Global to Local Reasoning

進行Global to Local Reasoning 的原因是爲了保證直接提取的global feature質量,如果直接提取的global feature質量比較差,那麼Local to Global Reasoning 模塊提取的local feature 就會像一個錯誤的方向移動,導致模型無法學習到有用的知識。

這個模塊通過兩個子任務來保證全局特徵的有效性

  • Self-Reconstruction
  • Normal Estimation
    在這裏插入圖片描述
    在這裏插入圖片描述
    注意,因爲法向量估計是一個很難的任務,所以本文在modelnet數據集上,把此子任務變成了一個有監督的任務。這裏其實有點小疑問,個人覺得法向量ground truth含有的信息可能還要多於classification label。

得到最終的loss

在這裏插入圖片描述

4 實驗結果

分類精度很棒,大大超越了所有的無監督方法,甚至可以和有監督的分類方法相比擬。

在這裏插入圖片描述
在這裏插入圖片描述
在這裏插入圖片描述
從對比實驗中可以看出,每個部分都起到了比較大的作用。不是很瞭解metric learning的建模方式對這篇文章的貢獻有多大。也就是說爲什麼要使用metric learning 對loss進行約束呢?猜想一下,二範數約束loss的效果應該不好。

總結

文章做的很棒,以無監督方式甚至超過了一些有監督的模型。作者的知識面很廣,佩服!

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章