本文爲《SVO Fast Semi-Direct Monocular Visual Odometry》一文的學習筆記
關鍵詞:無
一、摘要:
問題: 特徵提取和匹配技術消耗資源過多
方法: 使用“半直接法”,顯式模擬離羣值估計3D點
結果: 資源消耗變少,離羣值變少,在小,重複和高頻紋理的場景中提高魯棒性
二、結論
文章缺陷: 無
課題構思(如何一步步得到結論):
① 運動估計沒必要進行特徵提取和匹配;
② 高幀率運動估計+排除離羣值的概率建圖方法
未解問題: 無
三、粗看圖表
數據來源: 手持攝像機的序列;連接到MAC的downward-looking攝像機記錄的數據集;
重要指標: 出錯率、尺度漂移大小、相對位姿和旋轉誤差的均方根誤差(RMSE)、中位數、運行耗時
四、引言
研究原因: 某些情況下MAVs使用GPS不能精確定位;
課題階段: 基於最小化光度誤差的直接法正在興起
- 視覺運動估計方法的分類:
-
特徵法:
特點:使用顯著圖像特徵;使用不變性的特徵描述子進行幀匹配;使用對極約束恢復位姿和地圖結構;重定位誤差最小化矯正位姿和地圖;同時跟蹤和建圖。
缺點:過於依賴檢測和匹配,有錯誤匹配問題,精度差。
-
直接法:
特點:估計圖像強度值,利用圖像中所有信息;計算光度誤差多於重定位誤差。
優點:在小紋理、相機散焦、運動模糊的場景下魯棒性優於特徵法;節省時間。
-
相關工作
① PTAM 用於AR,需要多次修改才能用於大型室外環境;
② 提出估計塊表面法線減小漂移的方法;
③ 實時性能檢測有侷限性(區域少、數據集小);
④ 提出用於車載全向相機的 VO 算法;
⑤ 局部平面度假設放寬,提出從立體相機中計算任意3D結構的直接追蹤法並應用於RGB-D;
⑥ 提出計算密集深度圖法,但計算量大,可以只用強梯度像素點來優化。
-
本文工作
① 結合特徵法和直接法;
② 每幀使用亞像素特徵對應,特徵匹配僅用於初始化;
③ 使用大量小塊而不是少數大塊;
④ 使用稀疏深度信息;
⑤ 使用貝葉斯濾波器爲異常值建模估計特徵位置深度。
主要貢獻:
-
提出半直接VO流程;
-
集成概率建圖法。
理論假設: 在MAVs上使用
五、實驗過程
模型步驟,每個步驟的結論:
- 系統總覽:
使用雙線程,建圖從實時約束中分離。
-
運動估計線程:使用半直接法
位姿初始化→修正重投影點的2D座標→修正位姿和結構
① 位姿初始化:最小化相同3D點的投影位置對應的像素的光度誤差,以估計相對位姿;
② 修正重投影點的2D座標:對其相應的特徵塊;
③ 修正位姿和結構:最小化重投影誤差。
-
建圖線程:
濾波器初始化→新濾波器初始化→更新深度估計→地圖中插入3D點
① 概率深度濾波器初始化:初始化每個2D特徵的深度濾波器以估計相應3D點;
② 新濾波器初始化:在選取有較少3D-2D對應的關鍵幀時;
③ 更新深度估計:隨後的幀中使用貝葉斯更新深度估計;
④ 地圖中插入3D點:深度濾波器的不確定性足夠小時,在地圖中插入3D點並立即用於運動估計。
-
符號介紹
-
運動估計:
- 基於稀疏模型的圖像對齊;通過特徵對齊放寬;位姿和結構的修正;
- 討論:
SVO 中稀疏圖像對齊中只通過6個自由度有效初始化特徵對齊,滿足對極約束並無離羣值。
-
建圖:也可應用於稠密建圖
- 使用逆深度座標解決較大的場景深度;
- 濾波器反覆測量直至收斂,以減少離羣值;
- 爲錯誤測量建模,以使系統在高度相似環境下收斂;
-
應用細節:
- 算法自舉獲取初始2個關鍵幀位姿和初始地圖;
- 使用5級圖像金字塔方案解決較大運動的問題;
- 關鍵幀選取策略:維持固定數量關鍵幀。與其他幀距離超過12%時選爲關鍵幀,剔除與當前位置最遠的關鍵幀;
- 用深度濾波器初始化FAST角點,使特徵均勻分佈,並用於重投影地圖。在每個圖像金字塔級別提取找到比例無關的最佳角點。
-
實驗結果:通過數據集對比 SVO 與 PTAM 的精度、實時估計和魯棒性。
六、文章總結:
問題: PTAM 特徵提取和匹配技術消耗資源過多;
方法: 結合特徵法和直接法,提出SVO方法;集成概率建圖法
論證過程:
-
使用運動估計和建圖雙線程;
-
運動估計使用半直接法;
位姿初始化→修正重投影點的2D座標→修正位姿和結構
-
建圖使用集成概率建圖法
濾波器初始化→新濾波器初始化→更新深度估計→地圖中插入3D點