自動駕駛--Visual-Inertial-Semantic Scene Representation for 3D object Detection （一 )

原創

2018-09-03 22:49

聲明：

1）本文爲論文閱讀記錄，主要用於分享和學術交流
2）若有錯誤，歡迎各位大牛吐槽，如有版權問題請聯繫：[email protected]

這篇文章是UCLA Vision lab, University of California, 的 jingming Dong, Xiaohan Fei, 以及 Stefano Soatto 的文章，目前還是在arXiv.org.
文章鏈接如下：
https://arxiv.org/pdf/1606.03968
該團隊有一個類似的工作”VL-SLAM: Real-Time Visual-Inertial Navigation and Semantic Mapping” 發表在CVPR 2016 的demoPoster
相對CVPR2016 的工作，該文章給原來提出的3D bounding box 位置添加了 CAD model.

主要創新點：
通過結合IMU + SLAM + CNN 識別出場景中的物體（類別，尺寸，朝向）
1. 其中VIO 用於場景的定位以及尺度的獲取，（例如避免將尺度相差很大的模型車識別成真是的車）
2. CNN （RBG 大神的YOLO）用於語義的識別，結合幾何信息進行3D object 的識別
3. 識別的物體即使被障礙物遮擋，被遮擋物體仍然存在（視頻中用虛線框出）（相當於數據關聯）

以下是兩篇文章的效果：
第一張圖爲CVPR2016 demoPoster 的效果：

第二張圖爲CVPR2016 demoPoster 的效果：

兩個效果都能區分出玩具車和真是車輛，不僅如此，還恢復出車輛在空間中的位姿。

以下是該文章都是相對 sub-CNN 的定量比較：

相對 sub-CNN 的定性比較：

文章和公式還在閱讀和推導中，後續請繼續關注！

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

自動駕駛--Visual-Inertial-Semantic Scene Representation for 3D object Detection （一 )

聲明：

EXCEL中下拉菜單中添加新選項或者刪除選項

號稱能打敗MLP的KAN到底行不行？數學核心原理全面解析

同事使用 insert into select 遷移數據，開開心心上線，上線後被公司開除！

Git使用經驗總結5-修改提交信息

Python 爬蟲：Spring Boot 反爬蟲的成功案例

京東科技數字化營銷能力的演進與最佳實踐| 京東雲技術團隊

Git使用經驗總結4-撤回上一次本地提交

Java中止線程的方式

壓榨數據庫的真實處理速度

[轉帖]Oracle Exadata 學習筆記之核心特性Part1

單目ORB_SLAM 實戰

ROS下調用USB攝像頭

kobuki(turtlebot)+rplidar 串口調試--ROS

rosbag 錄製小烏龜的軌跡

Linux基礎入門(六) --學習筆記-正則表達式

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結