雙目測距系列(四)初識KITTI數據集

前言

  monodepth模型是基於KITTI數據集來訓練的。爲了能復現這個訓練過程,從而爲以後訓練自己數據集奠定較好的基礎,還是需要把這個數據集下載到本地,併成功訓練。

  你能使用下面這條命令來下載raw KITTI數據集,但這個數據集很大,大約150多GB,而且裏面提供的是外網鏈接,很難下載下來。建議看看國內有沒有人把該數據集放到百度網盤上。

wget -i splits/kitti_archives_to_download.txt -P kitti_data/

我手頭只有很少一部分該數據集(同事找的),讓我們先一起認識下它大概的內容。

數據集 

如上圖所示,2011_10_03_drive_0027_sync和2011_10_03_drive_0034_sync是兩段獨立的數據集,裏面結構完全一樣。下面僅以2011_10_03_drive_0027_sync爲例來講解其內容。

  KITTI數據集是一臺載有4個攝像頭,一臺Velodyne 3D激光雷達以及一臺GPS/IMU(導航設備),其品牌爲OXTS的車子行駛在道路所採集得到的數據集。 

  理解了這個,再回頭看上面的圖,就可以知道上面每個目錄對應一個傳感器所採集的數據。

1)4個sensor數據集

  子目錄image_00/01/02/03裏面都是對應4個sensor所拍的png照片。00和01對應的是左、右兩個灰度攝像頭,02和03對應另外兩個左、右彩色攝像頭。需要注意的是,左右兩個攝像頭的照片已經嚴格對齊了的。如下圖所示:

2)velodyne_points

這個是雷達所採集數據集,都是bin文件,方便軟件工具讀取。有多少張照片,對應就有多少個bin文件。bin裏面都是每個像素的實際座標值(x,y,z,r)。由於雷達座標系的x軸是向前的,所以其x值反映了深度。

3)oxts

它是導航設備獲取的數據集,裏面都爲txt文件。每個照片對應有一個txt文件。裏面的格式要看dataformat.txt。

標定參數值

說完了數據集,再來看看另外一部分(標定參數)。

1)calib_cam_to_cam.txt

它分別描述了4個攝像頭的內參以及0和1,2和3之間的外參。如下所示,如果做過標定的話,應該不難理解。

2)calib_imu_to_velo.txt

這個描述了導航座標系到雷達座標系的旋轉和平移矩陣。

3)calib_velo_to_cam.txt

描述了雷達座標系轉換到攝像頭座標系。其實也只有R和T有用,delta_f和delta_c很少用。

 

 

 

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章