前言
monodepth模型是基於KITTI數據集來訓練的。爲了能復現這個訓練過程,從而爲以後訓練自己數據集奠定較好的基礎,還是需要把這個數據集下載到本地,併成功訓練。
你能使用下面這條命令來下載raw KITTI數據集,但這個數據集很大,大約150多GB,而且裏面提供的是外網鏈接,很難下載下來。建議看看國內有沒有人把該數據集放到百度網盤上。
wget -i splits/kitti_archives_to_download.txt -P kitti_data/
我手頭只有很少一部分該數據集(同事找的),讓我們先一起認識下它大概的內容。
數據集
如上圖所示,2011_10_03_drive_0027_sync和2011_10_03_drive_0034_sync是兩段獨立的數據集,裏面結構完全一樣。下面僅以2011_10_03_drive_0027_sync爲例來講解其內容。
KITTI數據集是一臺載有4個攝像頭,一臺Velodyne 3D激光雷達以及一臺GPS/IMU(導航設備),其品牌爲OXTS的車子行駛在道路所採集得到的數據集。
理解了這個,再回頭看上面的圖,就可以知道上面每個目錄對應一個傳感器所採集的數據。
1)4個sensor數據集
子目錄image_00/01/02/03裏面都是對應4個sensor所拍的png照片。00和01對應的是左、右兩個灰度攝像頭,02和03對應另外兩個左、右彩色攝像頭。需要注意的是,左右兩個攝像頭的照片已經嚴格對齊了的。如下圖所示:
2)velodyne_points
這個是雷達所採集數據集,都是bin文件,方便軟件工具讀取。有多少張照片,對應就有多少個bin文件。bin裏面都是每個像素的實際座標值(x,y,z,r)。由於雷達座標系的x軸是向前的,所以其x值反映了深度。
3)oxts
它是導航設備獲取的數據集,裏面都爲txt文件。每個照片對應有一個txt文件。裏面的格式要看dataformat.txt。
標定參數值
說完了數據集,再來看看另外一部分(標定參數)。
1)calib_cam_to_cam.txt
它分別描述了4個攝像頭的內參以及0和1,2和3之間的外參。如下所示,如果做過標定的話,應該不難理解。
2)calib_imu_to_velo.txt
這個描述了導航座標系到雷達座標系的旋轉和平移矩陣。
3)calib_velo_to_cam.txt
描述了雷達座標系轉換到攝像頭座標系。其實也只有R和T有用,delta_f和delta_c很少用。