雙目測距系列(六)monodepth2的三種訓練方式

前言

monodepth2有三種訓練方式,其對應的命令如下:

下面分別對這三種訓練模式進行較詳細解釋 :

1)單目訓練

monocular是單目的意思,而雙目的英文則是binocular。現在基於深度學習方法對單目圖像重構出三維世界非常流行。我個人覺得這裏面的基礎理論是SFM(structure From Motion)。直白講,它是依靠運動視頻的圖像幀序列來進行三維重建。其優勢很明顯,只需要一個攝像頭即可,當然前提條件則是,需要攝像頭本身動起來,拍一段視頻流。

在monodepth2的單目模型訓練中,它缺省需要一個參數--frames_ids 0 -1 1。0代表當前輸入的樣本圖片,-1則代表當前幀在這個視頻系列中的上一幀,1則代表下一幀。

2)立體訓練

stereo字面意思爲立體,這裏更準確的含意則爲雙目。有兩個重要參數:--frame_ids 0和--use_stereo。前者意味着不需要對當前輸入幀來找上下幀了;後者意味要對當前幀來找它的另外一幀,比如當前幀爲左攝像頭拍攝得到的幀,那麼其對應的另外一幀則爲右攝像頭的。

這種模型比較適合帶雙目攝像頭,且設備固定在某一個位置上。

3)單目+立體訓練

這種方法是前面兩種的組合,適用於有雙目攝像頭,且是運動的場景。 由於它是前兩種的綜合體,所以訓練速度會比較慢。

結論

剛接觸這個模型的同學可能會好奇到底哪種訓練方式得到的模型更準確。其實從paper看,作者並沒有做出優劣的比較(他覺得都挺好),反過來着重提供了針對不同場景的三種訓練方式,合適的就是最好的。 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章