VINS-Mono 代碼詳細解讀——基於滑動窗口的緊耦合後端非線性優化 optimization()

原創

try_again_later

2020-03-19 08:55

本講是VINS最核心部分了，前面經歷了

1）視覺跟蹤feature_tracker、IMU預積分integrationBase類；

2）初始化中SFM純視覺估計滑動窗中所有幀的位姿和3D路標點深度、SFM與IMU預積分鬆耦合對齊求解初始化參數。

在完成前面的初始化環節後，本節將進行第3部分，基於滑動窗的緊耦合後端非線性優化：將視覺約束、IMU約束、閉環約束放到一個大的目標函數中進行非線性優化，求解出滑動窗口中所有幀的PVQ、bias等。

閱讀本文所需知識儲備：

1、最小二乘、梯度下降法、牛頓與高斯-牛頓與LM關係總結

2、《視覺SLAM十四講精品總結》4：非線性優化g2o(BA基礎)

目錄

一、VIO殘差函數的構建

1、需要優化的狀態向量：

2、目標函數爲：

二、視覺約束

1.視覺重投影誤差

2、逆深度參數化

三、IMU約束

2、優化變量：

3、IMU測量殘差公式推導

D 邊緣化 Marginalization（詳見標題2）

E 相機速率下的狀態估計--只有運動的VIO

一、VIO殘差函數的構建

1、需要優化的狀態向量：

滑動窗口內IMU狀態（PVQ、加速度bias、陀螺儀bias）、IMU到Camera的外參、m+1個3D路標點逆深度。

第一個式子是滑動窗口內所有狀態量，n是關鍵幀數量，m是滑動窗內所有觀測到的路標點總數，維度是15*n+6+m。特徵點逆深度爲了滿足高斯系統。

第二個式子xk是在第k幀圖像捕獲到的IMU狀態，包括位置，速度，旋轉（PVQ）和加速度偏置，陀螺儀偏置。

第三個式子是相機外參。

注意：xk只與IMU項和Marg有關；特徵點深度也只與camera和Marg有關；

2、目標函數爲：

視覺慣性BA：這三項分別爲邊緣化的先驗信息、IMU的測量殘差、視覺的重投影誤差

BA優化模型分爲三部分：

1、Marg邊緣化殘差部分（滑動窗口中去掉位姿和特徵點約束）代碼中使用Google開源的Ceres solver解決。

2、IMU殘差部分（滑動窗口中相鄰幀間的IMU產生）

3、視覺誤差函數部分（滑動窗口中特徵點在相機下視覺重投影殘差）

二、視覺約束

這部分要擬合的目標可以通過重投影誤差約束，求解的是對同一個路標點的觀測值和估計值之間的誤差，注意是在歸一化平面上表示。

1.視覺重投影誤差

相關自變量是：該路標點被兩幀觀察到的相機幀位姿、Cam和IMU之間相對位姿、路標點在第一幀的逆深度。

當某路標點在第i幀觀測到並進行初始化操作得到路標點逆深度，當其在第j幀也被觀測到時，估計其在第j幀中的座標爲：

此時的視覺殘差爲：（左側爲根據i幀反推估計的位置，右側爲觀測值）

2、逆深度參數化

逆深度作爲參數原因：1）觀測到的特徵點深度可能非常大，難以進行優化；2）可以減少實際優化的參數變量；3）逆深度更加服從高斯分佈。這裏特徵點的逆深度在第i幀初始化操作中得到。

論文中：

上面的公式是傳統的針孔相機模型，這裏用的是單位半球體的相機觀測殘差。是一個魚眼相機。

在相機的歸一化平面上比較殘差，再將視覺殘差投影到單位球面的正切平面上。由於視覺殘差的自由度是2，所以我們將殘差向量投影到切平面上。

在第i幀第一次觀測到第l個路標點，在第j幀中對該路標點進行觀測的殘差爲：

第一個式子就是殘差的表達式，第二個式子是魚眼相機反投影函數將觀測到的像素座標轉換成單位向量的觀測值數據，b1和b2是此單位向量的切平面上的一組基。第三個式子是重投影估計模型。其實VINS代碼中也可以使用普通的針孔相機模型。

三、IMU約束

1、殘差：

狀態量傳播預測與IMU預積分的殘差。

2、優化變量：

IMU的第i、j時刻下的p位置，v速度，Q旋轉（PVQ），兩個偏置ba,bw

之前對IMU預積分進行了詳細講解。參考：VINS-Mono 代碼詳細解讀——IMU離散中值預積分

3、IMU測量殘差公式推導

簡單來說，如果每一幀IMU都要相對於第一幀求位姿，計算量很大；考慮將PVQ積分公式改爲相對第i時刻的姿態。

原PVQ積分公式：

基於預積分的PVQ積分公式

預積分量爲：

最新的PVQ積分公式變爲：

IMU測量誤差爲：

D 邊緣化 Marginalization（詳見標題2）

爲了防止pose和特徵的個數的複雜度隨着時間不斷增長，引入邊緣化，在移除位姿時將關聯的約束轉化爲先驗放入優化問題中。

爲了限制基於優化的VIO計算複雜度，引入邊緣化。有選擇地從滑動窗口中將IMU狀態xK和特徵λ1邊緣化，同時將對應於邊緣狀態的測量值轉換爲先驗。

分爲兩種情況，

1、一種是倒數第二幀如果是關鍵幀的話，將最舊的pose移出Sliding Window，將最舊幀關聯的視覺和慣性數據邊緣化掉。把第一個老關鍵幀及其測量值被邊緣化；Margin_Old作爲先驗值。

2、如果倒數第二幀不是關鍵幀的話，那麼就只剔除倒數第二幀的視覺觀測，而不剔除它的IMU約束。原因是邊緣化保證關鍵幀之間有足夠視差而能夠三角化足夠多的地圖點。並且保證了IMU預積分的連貫性。

爲了保持系統的稀疏性，我們不會邊緣化非關鍵幀的所有測量值。

E 相機速率下的狀態估計--只有運動的VIO

採用了一種輕量級的純運動視覺慣性BA，以提升狀態估計速率到相機速率(30Hz)。

代價函數不變。

1、只對固定數量的最新IMU狀態的姿態pose和速度v進行了優化，而不是對滑動窗口中的所有狀態進行優化

2、將特徵深度、外部參數、偏置和舊的IMU狀態這些不希望優化的狀態作爲常量來處理。

與在最先進的嵌入式計算機上可能導致超過50ms的完全緊耦合單目VIO不同，這種純運動的視覺慣性BA只需大約5ms來計算。

0.4 重定位

漂移發生在全局三維位置(x,y,z)和圍繞重力方向的旋轉(yaw)。漂移發生在全局三維位置(x,y,z)和圍繞重力方向的旋轉(yaw)。

參考文章：

VINS-Mono理論學習——後端非線性優化 by Manii

VINS-mono詳細解讀 by 極品巧克力

深藍學院手寫VIO課程

https://blog.csdn.net/iwanderu/article/details/104729332

https://blog.csdn.net/moyu123456789/article/details/103582051?depth_1-utm_source=distribute.pc_relevant.none-task&utm_source=distribute.pc_relevant.none-task

https://blog.csdn.net/u012871872/article/details/78128087

https://blog.csdn.net/huanghaihui_123/article/details/87361621

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

語義 SLAM 分類

SLAM 與深度學習技術結合是SLAM的另一大方向。高博在《視覺SLAM十四講》中指出，通過語義與SLAM 相結合，兩者相互促進，相互補充。一方面，語義幫助 SLAM。通過語義，我們能得到一張帶有標籤的地圖，物體信息也可

2020-07-04 18:28:49

ORB-SLAM A Versatile and Accurate Monocular SLAM System

關鍵詞：無一、摘要：問題：現有SLAM系統魯棒性低方法：建立新SLAM系統，採用優勝劣汰策略篩選關鍵幀結果：解決了長時間運行問題，性能提升二、結論文章缺陷：無課題構思（如何一步步得到結論）： ① 提出新

2020-07-04 18:28:49

SLAM 的過去現在和未來：健壯感知的時代

本文總結《Past, Present, and Future of Simultaneous Localization and Mapping: Toward the Robust-Perception Age》核心觀點一、導言

2020-07-04 18:28:49

SD-VIS A Fast and Accurate Semi-Direct Monocular Visual-Inertial SLAM

關鍵詞：視覺慣性；半直接 SLAM；多傳感器融合一、摘要：問題：如何權衡準確率和計算效率方法：半直接法。基於特徵法的 MVG 進行初始化、後端優化和迴環檢測；滑動窗口優化結果：實現準確度和速度的均衡二、結論文章缺

2020-07-04 18:28:49

SVO Fast Semi-Direct Monocular Visual Odometry

本文爲《SVO Fast Semi-Direct Monocular Visual Odometry》一文的學習筆記關鍵詞：無一、摘要：問題：特徵提取和匹配技術消耗資源過多方法：使用“半直接法”，顯式模擬離羣值估計3D

2020-07-04 18:28:49

視覺SLAM 特徵法與直接法學習總結

論特徵法與直接法一、特徵法概述特徵法通過特徵點匹配來追蹤點，利用幾何關係得到R、t，使用BA優化R、t，流程大致如下：二、直接法概述直接法從光流法演變而來，基於灰度不變假設，計算最小光度誤差來優化R、t，流程大致如下：

2020-07-04 18:28:49

realsense 更新固件

顯示固件版本 rs-fw-update -l 固件地址 https://dev.intelrealsense.com/docs/firmware-releases 多個realsense rs-fw-update -s 72511

2020-06-24 05:11:53

三維視覺、SLAM方向全球頂尖實驗室彙總

本文作者任旭倩，公衆號：計算機視覺life，編輯成員歐洲英國倫敦大學帝國理工學院 Dyson 機器人實驗室 http://www.imperial.ac.uk/dyson-robotics-lab 簡介：倫敦帝國理工學院戴

计算机视觉life

2020-06-22 03:37:52

AI資源對接需求彙總：第3期

更好的閱讀體驗，請查看首發原文鏈接：AI資源對接需求彙總：第3期平臺介紹平臺由人工智能領域幾個知名原創公衆號發起，總讀者約25萬。主要面向人工智能領域的從業者，涵蓋圖像處理、三維計算機視覺、機器學習、深度學習、自然語言處理等

计算机视觉life

2020-06-22 03:37:52

從零開始一起學習SLAM-ICP原理及應用

點“計算機視覺life”關注，星標更快接收乾貨！小白：師兄，最近忙什麼呢，都見不到你人影，我們的課也好久沒更新了呢師兄：抱歉，抱歉，最近忙於俗事。我後面一起補上，學習勁頭得向你們年輕人學習啊！話說，你最近在研究什麼呢？小

计算机视觉life

2020-06-22 03:37:52

SLAM、三維重建，語義相關數據集大全

作者朱尊傑，公衆號：計算機視覺life，編輯成員一主要針對自動駕駛： 1.KITTI數據集： http://www.cvlibs.net/datasets/kitti/index.php（RGB+Lidar+GPS+IMU）

计算机视觉life

2020-06-22 03:37:52

代碼解讀 | VINS_Mono中的魚眼相機模型

本文作者是計算機視覺life公衆號成員蔡量力，由於格式問題部分內容顯示可能有問題，更好的閱讀體驗，請查看原文鏈接：代碼解讀 | VINS_Mono中的魚眼相機模型 VINS_Mono中的魚眼相機模型 VINS_Mono代碼支持的相

计算机视觉life

2020-06-22 03:37:52

【無人駕駛】“自主代客泊車”/自動泊車方案調研 2

目錄智行者發佈自主代客泊車（AVP）方案中電昆辰“鷹眼”定位（射頻定位、UWB）百度自主泊車解決方案縱目科技馭勢科技紐勱科技 Momenta 魔視智能吉利魔視智能戴姆勒和博世【無人駕駛】“自主代客泊車”概述 1

2020-06-21 09:08:34

（每日一讀2019.10.24）一種基於通用優化方法的多傳感器全局裏程計估計框架（VINS-Fusion）

參考博文： https://blog.csdn.net/qq_41839222/article/details/87860819 https://blog.csdn.net/weixin_41843971/article/deta

2020-06-20 19:15:13

（每日一讀2019.10.27）多狀態約束的卡爾曼濾波的視覺輔助慣性導航(MSCKF)

摘要本文提出了一種基於擴展卡爾曼濾波（ekf）的實時視覺輔助慣性導航算法。這項工作的主要貢獻是推導了一個測量模型，該模型能夠表達從多個相機姿態觀察靜態特徵時產生的幾何約束。這種測量模型不需要在ekf的狀態向量中包含3d特徵位置，

2020-06-20 19:15:13

24小時熱門文章

最新文章

最新評論文章