雙目測距系列（四）初識KITTI數據集

原創

ltshan139

2020-04-28 06:27

前言

monodepth模型是基於KITTI數據集來訓練的。爲了能復現這個訓練過程，從而爲以後訓練自己數據集奠定較好的基礎，還是需要把這個數據集下載到本地，併成功訓練。

你能使用下面這條命令來下載raw KITTI數據集，但這個數據集很大，大約150多GB，而且裏面提供的是外網鏈接，很難下載下來。建議看看國內有沒有人把該數據集放到百度網盤上。

wget -i splits/kitti_archives_to_download.txt -P kitti_data/

我手頭只有很少一部分該數據集（同事找的），讓我們先一起認識下它大概的內容。

數據集

如上圖所示，2011_10_03_drive_0027_sync和2011_10_03_drive_0034_sync是兩段獨立的數據集，裏面結構完全一樣。下面僅以2011_10_03_drive_0027_sync爲例來講解其內容。

KITTI數據集是一臺載有4個攝像頭，一臺Velodyne 3D激光雷達以及一臺GPS/IMU(導航設備)，其品牌爲OXTS的車子行駛在道路所採集得到的數據集。

理解了這個，再回頭看上面的圖，就可以知道上面每個目錄對應一個傳感器所採集的數據。

1）4個sensor數據集

子目錄image_00/01/02/03裏面都是對應4個sensor所拍的png照片。00和01對應的是左、右兩個灰度攝像頭，02和03對應另外兩個左、右彩色攝像頭。需要注意的是，左右兩個攝像頭的照片已經嚴格對齊了的。如下圖所示：

2）velodyne_points

這個是雷達所採集數據集，都是bin文件，方便軟件工具讀取。有多少張照片，對應就有多少個bin文件。bin裏面都是每個像素的實際座標值(x,y,z,r)。由於雷達座標系的x軸是向前的，所以其x值反映了深度。

3）oxts

它是導航設備獲取的數據集，裏面都爲txt文件。每個照片對應有一個txt文件。裏面的格式要看dataformat.txt。

標定參數值

說完了數據集，再來看看另外一部分（標定參數）。

1）calib_cam_to_cam.txt

它分別描述了4個攝像頭的內參以及0和1，2和3之間的外參。如下所示，如果做過標定的話，應該不難理解。

2）calib_imu_to_velo.txt

這個描述了導航座標系到雷達座標系的旋轉和平移矩陣。

3）calib_velo_to_cam.txt

描述了雷達座標系轉換到攝像頭座標系。其實也只有R和T有用，delta_f和delta_c很少用。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

雙目測距系列（四）初識KITTI數據集

前言

數據集

標定參數值

linux安裝cuda和cudnn

模擬手機設備：使用 Playwright 實現移動端自動化測試

Mellanox網卡開啓SR-IOV

全面系統的AI學習路徑，幫助普通人也能玩轉AI

HTML 00 Tutorial

uni-app實現上拉加載

vue3編譯優化之“靜態提升”

又是一個月-20240513

flask 如何保證返回json有序

linux服務器設置ssh免密

《YOLOV3-Tiny模型的訓練，量化以及在海思芯片上的部署》的視頻課程介紹

結合sample代碼來分析海思DPU模塊運行原理

使用telnet來在線調試海思開發板

opencv cmake時如何正確識別pyhon庫

《基於海思NNIE引擎實現JPEG圖片識別應用》視頻課程介紹

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結