地圖構建兩篇頂級論文解析

一．基於聲納的密集水下場景重建

標題：Dense, Sonar-based Reconstruction of Underwater Scenes

作者：Pedro V. Teixeira, Dehann Fourie, Michael Kaess, and John J.
Leonard

來源：IEEE/RSJ International Conference on Intelligent Robots
and Systems (IROS)，2019

摘要

通常，重建問題分爲三個獨立的步驟：首先，根據前端的要求，使用傳感器處理技術來過濾和分割傳感器數據。其次，前端建立問題的因子圖，以獲得機器人完整軌跡的精確估計。最後，通過對傳感器數據的進一步處理，得到最終結果，現在從優化的軌跡重新投影。在本文中，我們提出了一種將上述問題結合在一個特定應用框架下的重建問題建模方法：基於聲納的水下結構檢測。這是通過將聲納分割和點雲重建問題與SLAM問題一起作爲因子圖來實現的。我們用船體檢驗試驗的數據提供了試驗結果。

圖1 重構問題的因子圖模型

圖2 典型單波束回波強度測量得到的歸一化經驗分佈。不同的曲線顯示了去除最低50、90和99%的效果。

圖3 數據集中有效像塊的主成分分佈-這些像塊是平面的（𝜆2/︀𝜆≪1）和近似圓形的（𝜆0≈𝜆1）

圖4 分割輸出

圖5 基於里程和SLAM的地圖估計

二．ElevateNet:一種用於估計2D水下聲吶圖像缺失維度的卷積神經網絡

標題：ElevateNet: A Convolutional Neural Network for Estimating the Missing Dimension in 2D Underwater Sonar Images

作者：Robert DeBortoli, Fuxin Li, Geoffrey A. Hollinger

來源：2019 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS)

摘要

在這項工作中，我們解決的問題是從2D水下聲納圖像預測缺失維度（仰角）。這些圖像中由於非擴散反射等現象的存在造成的的高噪聲水平經常會限制物理模型的實用性。因此，我們提出利用卷積神經網絡（CNN）作爲一種有效的方法來提取有用的信息而不會被嘈雜的數據所誤導。我們還引進了一種自監督的方法，該方法利用聲納傳感器的物理特性，在沒有地面真值仰角圖的情況下在真實數據上訓練網絡。僅給出單個圖像，我們的方法就可以給出準確的仰角估計。最後，我們證明了在模擬和實際數據上，相比其他方法，我們的方法可以產生更準確的3D重建。

圖1 ElevateNet 的輸入和輸出。向ElevateNet輸入2D聲吶圖像（左），會產生仰角的像素級別的估計結果。當地面真值信息可用時，網絡可以以監督的方式進行訓練，使用合成數據的情況也一樣。我們的方法在地面真值數據不可用時，也可以基於真實聲吶圖像在自監督方式下使用。

圖2 從歐式座標到極座標的映射關係

(a) ElevateNet的學習部分。C = 卷積/批正則化/ReLU層。DC=解卷積層。C(a,b,c)分別是卷積層的濾波器數量，輸出圖像寬度和高度。

b) ElevateNet的訓練方法。在合成數據上的訓練（左循環）可以直接通過將網絡輸出與地面真值仰角圖比較。在真實數據上的訓練（右循環）使用輸出來預測下一幀圖像，並用光度誤差應用在預測出的圖像和真實的下一幀聲吶圖像比較中。
圖3 我們的整體模型架構。(a)展示了可直接用於合成數據的ElevateNet詳細模型參數。(b)介紹所使用的兩種訓練方法(分別針對合成數據和實際數據)。注意，圖(a)和(b)中的虛線框表示的是同一個模型。

圖4 實驗中使用的Seabotix vLBV300和Gemini 720i成像聲納(右下角的白色矩形)

圖5 合成聲吶目標(a)-©、各自的合成聲吶圖像(d)-(f)，一小部分圖像的重建網格(g)-(o)。對於圖(g)-(o)，地面真值網格是藍色的，預測網格是紅色的。圖(k)中預測的網格較小，但位於圖像的右上角。在這些實驗中，只能看到部分地面真實物體，因此預測網格只能覆蓋物體的一部分。對於球體和立方體，我們的方法是唯一能夠捕獲成像對象的形狀的方法。CNN將圓柱體當成立方體，因此會預測出一個垂直平面。

圖6 真實聲吶目標(a)-©、各自的聲吶圖像(d)-(f)，使用Aykin方法得到的重建網格(g)-(i)。(j)-(l)和(m)-(o)分別是我們的模型不進行和進行真實訓練的結果。網格中，地面真值使用藍色進行標註，估計的網格用紅色標註。由於我們只能看到物體的一部分，因此估計出的重建也只包括物體地面真值的一部分。對於球體和立方體，我們的方法可以在有限的視角條件下獲得物體的形狀。

表1 合成的像素級仰角的MAE（m）

表2 合成重建RMSE結果(m)

表3 對下一幀估計結果的評估

表4 在真實數據上的3D重建準確率