激光雷達點雲bin文件讀取和顯示! |
首先聲明文章主要參考以下作者:
一. KITTI數據集簡介
KITTI數據集由德國卡爾斯魯厄理工學院和豐田美國技術研究院聯合創辦,是目前國際上最大的自動駕駛場景下的計算機視覺算法評測數據集。該數據集用於評測立體圖像(stereo),光流(optical flow),視覺測距(visual odometry),3D物體檢測(object detection) 和 3D跟蹤(tracking) 等計算機視覺技術在車載環境下的性能。KITTI包含市區、鄉村和高速公路等場景採集的真實圖像數據,每張圖像中最多達15輛車和30個行人,還有各種程度的遮擋與截斷。整個數據集由389對立體圖像和光流圖,39.2 km視覺測距序列以及超過200k 3D標註物體的圖像組成,以10Hz的頻率採樣及同步。
二. 數據採集平臺
KITTI數據採集平臺包括2個灰度攝像機,2個彩色攝像機,一個Velodyne 3D激光雷達,4個光學鏡頭,以及1個GPS導航系統。
傳感器:
1慣性導航系統(GPS / IMU):OXTS RT 3003
1臺激光雷達:Velodyne HDL-64E
2臺灰度相機,1.4百萬像素:Point Grey Flea 2(FL2-14S3M-C)
2個彩色攝像頭,1.4百萬像素:Point Grey Flea 2(FL2-14S3C-C)
4個變焦鏡頭,4-8毫米:Edmund Optics NT59-917
三. 數據集文件夾分佈
注:velodyne_reduced爲圖像在三維空間內的視椎體的數據(訓練使用)
└── KITTI_DATASET_ROOT
├── training <-- 7481 train data
| ├── image_2 <-- for visualization
| ├── calib <-- camera inner and outter parameters
| ├── label_2 <--label for trainning and evaluate
| ├── velodyne<--lidar data
| └── velodyne_reduced <-- empty directory,reduced by image size frustum
└── testing <-- 7518test data
├── image_2 <-- for visualization
├── calib
├── velodyne
└── velodyne_reduced <-- empty directory
四. 關於kitti數據label標籤(共15個數)
Truck 0.00 0 -1.57 599.41 156.40 629.75 189.25 2.85 2.63 12.34 0.47 1.49 69.44 -1.56
Car 0.00 0 1.85 387.63 181.54 423.81 203.12 1.67 1.87 3.69 -16.53 2.39 58.49 1.57
Cyclist 0.00 3 -1.65 676.60 163.95 688.98 193.93 1.86 0.60 2.02 4.59 1.32 45.84 -1.55
DontCare -1 -1 -10 503.89 169.71 590.61 190.13 -1 -1 -1 -1000 -1000 -1000 -10
DontCare -1 -1 -10 511.35 174.96 527.81 187.45 -1 -1 -1 -1000 -1000 -1000 -10
DontCare -1 -1 -10 532.37 176.35 542.68 185.27 -1 -1 -1 -1000 -1000 -1000 -10
DontCare -1 -1 -10 559.62 175.83 575.40 183.15 -1 -1 -1 -1000 -1000 -1000 -10
- 第1個字符串: 代表物體類別 ‘Car’, ‘Van’, ‘Truck’,‘Pedestrian’, ‘Person_sitting’, ‘Cyclist’,‘Tram’, ‘Misc’ or ‘DontCare’
- 注意:’DontCare’ 標籤表示該區域沒有被標註,比如由於目標物體距離激光雷達太遠。爲了防止在評估過程中(主要是計算precision),將本來是目標物體但是因爲某些原因而沒有標註的區域統計爲假陽性(false positives),評估腳本會自動忽略’DontCare’ 區域的預測結果。
- 第2個數: 代表物體是否被截斷從0(非截斷)到1(截斷)浮動,其中truncated指離開圖像邊界的對象。
- 第3個數: 代表物體是否被遮擋整數0,1,2,3表示被遮擋的程度,其中0:完全可見 1:小部分遮擋 2:大部分遮擋 3:完全遮擋(unknown)。
- 第4個數: alpha,物體的觀察角度,相機中心和物體中心的連線的垂線與物體方向的夾角,範圍:-pi~pi。是在相機座標系下,以相機原點爲中心,相機原點到物體中心的連線爲半徑,將物體繞相機y軸旋轉至相機z軸,此時物體方向與相機x軸的夾角
r_y + pi/2 -theta = alpha +pi/2
(即圖中紫色的角是相等的),所以alpha = r_y - theta
- 第5~8這4個數: 物體的2維邊界框xmin,ymin,xmax,ymax。
- 第9~11這3個數: 3維物體的尺寸高、寬、長(單位:米)。
- 第12~14這3個數: 3維物體的位置 x,y,z(在照相機座標系下,單位:米)
- 第15個數: 3維物體的空間方向:rotation_y(應該就是上面的r_y),在照相機座標系下,物體的全局方向角(物體前進方向與相機座標系x軸的夾角),範圍:-pi~pi。
- 第16個數: 檢測的置信度(對訓練之前的數據無用,only for result)。