LPD-Net學習筆記

LPD-Net學習筆記

LPD-Net指 LPD-Net: 3D Point Cloud Learning for Large-Scale Place Recognition and Environment Analysis 文中所指LPD-Net。
本文主要依據網絡結構圖簡單解釋每個模塊的作用。
LPD-Net網絡結構圖

Adaptive Local Feature Extraction

文中提到大尺度場景點雲中每個點局部分佈是不均勻的(可以理解爲有的地方點密集、有的地方點稀疏)因此在使用KNN構建鄰域圖時需要自適應的選擇K值,這樣才能更好的提取點雲特徵。這裏文章引用了Semantic 3d scene interpretation: a framework combining optimal neighborhood size selection with relevant features中的理論。利用公式Ei = -Li ln Li - Pi ln Pi - Si ln Si 來描述局部三維結構的不可預測性,從而可以選擇使 Ei 取最小值時K的值作爲爲每個點構建鄰域圖時KNN算法的K值,所以這個模塊中K值因點而異。
在構建完鄰域圖時將三維座標和10個人工設置的特徵串聯輸入mlp,mlp輸出結果輸入Feature Transform模塊,這個模塊文中提出了3種結構最終使用了FN-Parallel結構輸出特徵向量fF 和鄰域關係向量fRT 鄰域關係向量是通過將fF 輸入T-Net後再對每個點使用KNN獲得。
Feature Transform模塊

Graph-based Neighborhood Aggregation

這個模塊主要是一個動態圖卷積像DGCNN一樣,另一個是固定圖卷積,兩者的區別就是動態圖卷積依據點在特徵空間中的距離構建鄰域圖(因此每一層鄰域圖的拓撲結構都是不同的),固定圖卷積是依據點在笛卡爾座標系中的距離(即真實空間距離)構建鄰域圖,因此圖拓撲結構保持不變。
圖卷積網絡結構

Feature Aggregation and Global Description

在網絡的最後使用論文Netvlad: Cnn architecture for weakly supervised place recognition 中提出的結構獲取描述點雲的全局特徵。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章