[論文解讀]Graph-Based Parallel Large Scale Structure from Motion

原創

2020-05-13 21:16

基於圖的並行大尺度場景重建

爲啥有了這篇論文解讀吧……是我隨便瀏覽看到的，掃了兩眼發現這論文方法我以前做比賽用過（比賽具體內容在這），然後就繼續看了下去發現比我以前做的方法好多了，雖然本質是一個思路。

我們在做三維重建時候，特別是圖片特別多，場景特別大的時候，其實現有很多SFM程序都會出現特別差的結果（OpenMVG、Colmap）。這類方法是增量式重建的（OpenMVG也有全局的），程序慢慢加圖片時候會增加誤差，雖然有BundleAdjustment，但是由於增量式的三維重建並沒有很好的初始相機位姿，圖片加着加着變多了，前面階段優化負擔積累過於沉重導致後面想改也改不過來。這都是我個人理解，很簡單例子，colmap就算用video模式重建個房間也會大概率崩掉。但是一個SLAM系統就能得到相對很高的精度。
再說個題外話：我感覺SFM這類重建算法出發點是想重建一個物體，就是相機圍繞着某個物體重建；但是SLAM這種其實是相機在物體裏面定位建圖；這也算兩種方法一大不同吧，不單單是實時性問題。
解決這種問題方法也很簡單，我直接先全局大致算下位置，作爲初始值再添加照片不就行了麼，確實如此，這就是Global SFM的出發點。
回到本文的3D reconstruction，其實就是基於Colmap開發個pipeline，把一大堆照片先分成小組，每個小組重建，重建的結果再合併。

先寫到這，剛纔看了看後面的實驗，我覺得得下載個代碼試驗下。

=====================================================
更新：這個感覺有毒……編譯起來bug很多不說，編譯成了又用不了GPU，看着是在colmap基礎上改的但是有各種問題，建議幾種主要依賴（ceres、gflag glog eigen）都源碼編譯。
結果挺垃圾的，可能是參數沒有調整好，TUM room1 只恢復了750張圖片（1300張），而且看着三維點特別少，最近剛面華爲實習也沒空做這種實驗，以後再做吧。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

[論文解讀]Graph-Based Parallel Large Scale Structure from Motion

Crowd Counting 網絡結構

pytorch 多GPU 問題記錄

MVSNet系列

Hit-Detector: Hierarchical Trinity Architecture Search for Object Detection

SLAM隨筆

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結