雙目測距系列（六）monodepth2的三種訓練方式

原創

ltshan139

2020-05-07 03:33

前言

monodepth2有三種訓練方式，其對應的命令如下：

下面分別對這三種訓練模式進行較詳細解釋：

1）單目訓練

monocular是單目的意思，而雙目的英文則是binocular。現在基於深度學習方法對單目圖像重構出三維世界非常流行。我個人覺得這裏面的基礎理論是SFM（structure From Motion）。直白講，它是依靠運動視頻的圖像幀序列來進行三維重建。其優勢很明顯，只需要一個攝像頭即可，當然前提條件則是，需要攝像頭本身動起來，拍一段視頻流。

在monodepth2的單目模型訓練中，它缺省需要一個參數--frames_ids 0 -1 1。0代表當前輸入的樣本圖片，-1則代表當前幀在這個視頻系列中的上一幀，1則代表下一幀。

2）立體訓練

stereo字面意思爲立體，這裏更準確的含意則爲雙目。有兩個重要參數：--frame_ids 0和--use_stereo。前者意味着不需要對當前輸入幀來找上下幀了；後者意味要對當前幀來找它的另外一幀，比如當前幀爲左攝像頭拍攝得到的幀，那麼其對應的另外一幀則爲右攝像頭的。

這種模型比較適合帶雙目攝像頭，且設備固定在某一個位置上。

3）單目+立體訓練

這種方法是前面兩種的組合，適用於有雙目攝像頭，且是運動的場景。由於它是前兩種的綜合體，所以訓練速度會比較慢。

結論

剛接觸這個模型的同學可能會好奇到底哪種訓練方式得到的模型更準確。其實從paper看，作者並沒有做出優劣的比較(他覺得都挺好)，反過來着重提供了針對不同場景的三種訓練方式，合適的就是最好的。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

雙目測距系列（六）monodepth2的三種訓練方式

前言

1）單目訓練

2）立體訓練

3）單目+立體訓練

結論

linux安裝cuda和cudnn

模擬手機設備：使用 Playwright 實現移動端自動化測試

Mellanox網卡開啓SR-IOV

測試人員都是畫畫大神，讓我看看誰還不會用代碼圖？

Object.values()對象遍歷

我拍了拍Redis，被移出了羣聊···

網絡現代化通向雲原生應用的高速公路

面試官：說說你對序列化的理解

我宣佈，這是我找到的史上AI最全論文體系！

《YOLOV3-Tiny模型的訓練，量化以及在海思芯片上的部署》的視頻課程介紹

結合sample代碼來分析海思DPU模塊運行原理

使用telnet來在線調試海思開發板

opencv cmake時如何正確識別pyhon庫

《基於海思NNIE引擎實現JPEG圖片識別應用》視頻課程介紹

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結