Waymo共享用於機器學習的自動駕駛數據集

自動駕駛技術公司Waymo(該公司歸谷歌母公司Alphabet所有)發佈了一個數據集,其中包含自動駕駛汽車在5個多小時的駕駛過程中收集到的傳感器數據。該數據集包含了激光定位器和攝像頭在多個城市和郊區環境的多種駕駛條件下收集的高分辨率數據,其中還包含車輛、行人、騎行者和路標的標籤。

Waymo團隊在一篇博文中宣佈發佈Waymo Open Dataset,並稱其爲“有史以來發布的最大、最豐富和最多樣化的研究用自動駕駛數據集之一”。這些數據是由Waymo在美國鳳凰城、阿茲州、柯克蘭、西弗吉尼亞州、山景城、加利福尼亞州和舊金山市的車輛在不同時間、不同天氣情況下收集的。該數據集有1000個數據段,每段20秒,以10Hz的頻率收集(也就是200000幀),其中包括:

  • 從五個激光定位器和正面及側面的五個攝像頭同步的數據
  • 傳感器標定和姿態
  • 所有激光定位器畫面的3D邊界框都有對象標籤(車輛、行人、騎行者和路標)
  • 100個數據段的攝像頭數據的2D邊界框有對象標籤

Waymo還發布了一個谷歌Colab筆記本,包含教程和一個GitHub存儲庫,而後者又包含用於構建模型的TensorFlow輔助代碼。這個巨大的標記數據集可以用於檢測障礙物和交通標誌的模型的監督機器學習,這是任何自動駕駛汽車的關鍵能力。激光定位器雖然可以生成一個點雲圖來定位三維空間中的物體,但它無法檢測顏色,因此完全看不到路標上的字母。二維攝像頭圖像缺乏距離信息,但來自多個攝像頭的圖像可以通過處理重建深度。雖然Elon Musk認爲激光定位器是“不必要的”,但將激光定位器的3D數據與2D攝像頭數據相結合,可以簡化在圖像中檢測障礙物距離的過程。

Lyft上個月公佈了一個類似的數據集Lyft Level 5(以SAE駕駛自動化的最高級別命名)。Lyft的數據集包含5.5萬幀,大約是Waymo的四分之一;與Waymo的數據集相比,Lyft獲取每一幀數據所使用的攝像頭更多(7個)、激光定位器則更少(3個)。兩家公司都希望他們的數據能被研究團體用來改進算法和模型。Lyft在發佈會上特別強調了學術研究,並計劃利用他們的數據集贊助一場機器學習競賽。

毫不奇怪,這兩個數據集都只允許用於非商業用途。Lyft遵循知識共享署名-非商業性共享許可。Waymo的許可非常嚴格,甚至禁止“在車輛運行或協助車輛運行時”使用。Twitter上的一位用戶指出,雖然Waymo將數據集描述爲“開放的”,但許可協議“不符合開放的定義”。

雖然從某種意義上說,自動駕駛汽車已經成爲現實——Waymo的自動駕駛出租車已經在鳳凰城運營了兩年多——而且研究表明,在未來,機器人汽車能夠拯救生命,但目前還不清楚它們是否已經“爲進入黃金時代做好了準備”。Waymo的出租車總是有一個人在方向盤後面作爲安全備份,而且自動駕駛軟件有時會給乘客帶來痛苦的體驗。科技新聞網站The Information調查了7月和8月1萬多次Waymo旅程中乘客的評分和反饋。儘管70%的旅程獲得了完美的評分,與今年第一季度相比有所改善,但一些乘客抱怨說,自動駕駛的體驗“讓人不舒服,而且非常令人擔憂”。其他乘客抱怨說,這些車選擇了迂迴的路線,導致他們遲到。

人工智能研究人員、Roomba聯合創始人Rodney Brooks表示,他預計在2032年之前不會出現真正的機器人出租車服務:

對無人駕駛汽車可行性的真正考驗,不是在測試或演示中,而是在無人駕駛出租車、拼車服務或供終端消費者的自行駕駛汽車停車的停車場的所有者真正從中賺錢時。

原文鏈接:

Waymo Shares Autonomous Vehicle Dataset for Machine Learning

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章