[論文解讀]Graph-Based Parallel Large Scale Structure from Motion

基於圖的並行大尺度場景重建

爲啥有了這篇論文解讀吧……是我隨便瀏覽看到的,掃了兩眼發現這論文方法我以前做比賽用過(比賽具體內容在這),然後就繼續看了下去發現比我以前做的方法好多了,雖然本質是一個思路。

我們在做三維重建時候,特別是圖片特別多,場景特別大的時候,其實現有很多SFM程序都會出現特別差的結果(OpenMVG、Colmap)。這類方法是增量式重建的(OpenMVG也有全局的),程序慢慢加圖片時候會增加誤差,雖然有BundleAdjustment,但是由於增量式的三維重建並沒有很好的初始相機位姿,圖片加着加着變多了,前面階段優化負擔積累過於沉重導致後面想改也改不過來。這都是我個人理解,很簡單例子,colmap就算用video模式重建個房間也會大概率崩掉。但是一個SLAM系統就能得到相對很高的精度。
再說個題外話:我感覺SFM這類重建算法出發點是想重建一個物體,就是相機圍繞着某個物體重建;但是SLAM這種其實是相機在物體裏面定位建圖;這也算兩種方法一大不同吧,不單單是實時性問題。
解決這種問題方法也很簡單,我直接先全局大致算下位置,作爲初始值再添加照片不就行了麼,確實如此,這就是Global SFM的出發點。
回到本文的3D reconstruction,其實就是基於Colmap開發個pipeline,把一大堆照片先分成小組,每個小組重建,重建的結果再合併。
在這裏插入圖片描述
先寫到這,剛纔看了看後面的實驗,我覺得得下載個代碼試驗下。

=====================================================
更新:這個感覺有毒……編譯起來bug很多不說,編譯成了又用不了GPU,看着是在colmap基礎上改的但是有各種問題,建議幾種主要依賴(ceres、gflag glog eigen)都源碼編譯。
結果挺垃圾的,可能是參數沒有調整好,TUM room1 只恢復了750張圖片(1300張),而且看着三維點特別少,最近剛面華爲實習也沒空做這種實驗,以後再做吧。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章