滴滴自動駕駛:充滿“不確定性”環境下的決策和控制

桔妹導讀:實現自動駕駛是一個複雜的系統工程,需要精準感知環境,理解交通參與者的意圖並能夠在廣泛豐富的場景下,實現穩定安全的無人駕駛。需要面對真實路況中的大量 “不確定性”。這種不確定性是貫穿上下游的,並且感知侷限性、行爲預測偶然性、規控交互性共同交織的挑戰。在不確定性挑戰中的規控相應需要滿足穩定性和可擴展性的雙重特性,但這兩個特性存在衝突,且基於單一特性發展的系統會存在技術弊端。本文將探討規控模塊如何去攻克和突破:通過收集海量的數據信息,並使用數據驅動的方法論來驅動技術的迭代。重點從數據驅動的問題分析,算法開發迭代、系統性驗證這三個層面切入探討。



1. 
真實駕駛環境中多重“不確定性”的挑戰
自動化技術,特別是地面輪式機器人技術已經被廣泛應用在各種無人低速場景,諸如倉庫貨運(無人,低速,環境完全可控¹,月球車/火星車(無人,低速,環境不可控但以靜態爲主) ² ,快遞最後一公里送貨(無人,低速,環境不可控)。但自動駕駛技術則要應用在“有人(乘客),高速,環境不可控”等條件更加嚴苛的場景, 這種環境的駕駛行爲預測充斥着諸多“不確定性”,而這個“不確定性”是貫穿感知-預測-規控上下游的。

1.  感知侷限性


車載硬件的感知能力是有侷限的,Lidar的可靠感知範圍不過百米,貨車等大型交通參與者也會造成視角遮擋等問題;



2.  行爲預測偶然性


交通參與者的很多行爲具有很高的偶然性,比如對於突然跳出的動物、異動的行人、車輛等;



面對突然衝出來的小動物,雖然能夠識別出來是動物,但也不能明確動作其下一步動作。


3. 規控交互性


當我們和其他交通參與者遇到路權模棱兩可的情況時,彼此的決策會產生博弈,這種博弈過程有些時候是明確可判斷的,有些時候非常微妙;




2. 
不確定性中的規控響應

面對感知侷限性、預測偶然性、規劃交互性的駕駛挑戰,我們怎樣才能讓自動駕駛系統具有類似人的“直覺”呢?


最直接的就是增強對環境的感知能力,從外部硬件配置和外部數據的補充來提高。例如使用更好的感知硬件(採用分辨率更高的lidar)、輔助使用V2X數據等,能夠儘可能地獲取更全面的信息。具備更準確的感知信息後,我們還需從更深層次去理解環境信息,如交通參與者之間微妙的交互信息等,結合一些手勢、身體、頭部的朝向等進行準確的理解預測。


在現實的世界中,對於感知和理解無法達到百分百的確定, 爲此我們不能假設上游是完美的。規控團隊需要利用上游對環境“不確定性”刻畫的信息,進行響應,必要時採取適當的博弈策略,比如對於一個遠處的交通參與者的若干可能行爲都進行一定的預響應,當我們走近之後,再做出更加確定性的行爲。從更高層面上講,規控模塊需要在複雜多變的環境中,同時滿足下面兩個要求:


  • 穩定性(Stability):規控軟件需要給出安全的行爲保證. 典型是一些白盒系統,具有可解釋,可調性;

  • 可擴展性(Scalability):能夠快速適應新的場景,能夠處理複雜多變的(包括沒有見過的)實際情景,能夠快速遷移到不同的ODD進行快速擴張。


然而這兩個特性在某些時候又是存在衝突的。在目前業內規劃的解決方案中,很多模塊其實是基於規則打磨實現的白盒系統。這樣的系統提供了有理論基礎的,具有可解釋、可調性的算法框架,基本上提供了穩定性保障,性能天花板也是比較高的³,但它的擴展性並不是非常強,特別是面對複雜的場景(比如waymo 僅在鳳凰城佈署無人駕駛運營服務,目前仍然未擴展到其他城市,特別是複雜城市道路路段)。


這樣的系統在開發過程中,會逐漸形成技術棧。需要動技術地基的時候,調整不夠靈活,工作量大,且風險高。置之不理則會成爲功能發展的瓶頸,甚至會成爲一枚定時炸彈,未來需要更大心力才能完成。短期來看,關鍵是要以一種合適的節奏,調動有經驗的工程師,持續主導一些局部、整體重構,不斷化解當下矛盾,實現下一個層級表現的提升。而長期來看,完全基於工程師的經驗和人力進行不同細分場景的分類邏輯打磨的方式,無論是成本還是管理難度都是成指數倍的增長。



3. 
規控能力的新突破

我們要實現真正的無人駕駛,提供更加舒適、安全的無人駕駛服務,不僅要考慮當下業務需求,也要考慮在不遠的未來如何讓規控能力可持續地發展:如何能夠更魯棒地應對環境的不確定性?如何在保證系統穩定性的同時,在可擴展性上有所突破?如何讓開發從完全人工,進化到半自動化開發,甚至更高層級的自動化?如何能夠讓規劃控制在未來某一天,可以自我驅動開發,像人類駕駛員一樣自我迭代提升,工程師則來進行指引和輔助?客觀講,現在行業內沒有明朗路徑,但內各有各的探索,並且已經有了很多令人興奮的新突破。


我們必須要要開始着力未來,從工程架構和算法能力等方向持續投入與探索。無論是中短期的工程導向目標,還是長期的高度自動化持續進步的願景,規控領域可能也需要向上遊的感知預測模塊借鑑,更多以數據驅動。要更有效地發揮數據驅動的效用,要把握兩個關鍵問題:第一個是數據來源,第二是數據驅動的方法論。


1. 數據是彈藥


無人車路測數據


滴滴擁有大規模車隊,在蘇州、北京、上海、合肥取得測試牌照,在中美兩地進行路測。測試場景包括城市主幹道、次幹道和支路、有條件高速公路、產業園區道路、城市商圈、校區、港口碼頭、交通樞紐等多類應用場景。輔以infra團隊的配套工具,可以蒐集到大量一手資料。針對不同的ODD,根據技術迭代和驗證的需求,對交通參與者、環境因素、時間等不同維度進行感知/預測/自車行爲等的數據收集,進行幫助我們不斷的進行技術優化;


桔視數據


“桔視設備”,這個是一個安放在滴滴網約車的攝像頭,對內對外用於安全數據採集,覆蓋安裝超過100萬臺,這些設備一年會採集一千億公里的數據,覆蓋城市300個,可以預見各種千奇百怪的數據和場景,以此拓展我們對更廣泛真實駕駛場景的理解和應對能力。


2. 數據驅動需要方法論


也就是如何實現數據驅動的問題分析,算法開發迭代、系統性驗證來進行技術上的突破;


問題分析


首先,談談問題分析方法論:海量的數據提供了多維度的信息,我們運用數據的方式是被動式加主動式雙式並行的。


  • 被動式:利用工具從各個維度幫我們看清問題的分佈,比如需要看清頻率最高,最嚴重的問題,並從中理解目前算法和架構的侷限,並基於此指導我們進行工程項目的開發。

  • 主動式:通過無人車累計的大量數據和桔視積累的海量數據,Infra團隊提供的高效的索引服務,按照地點,自車功能,周邊環境的特徵,能夠過濾出很多有意思的場景; 這些場景不僅可以作爲場景庫的一部分,進一步大規模處理也能夠變成機器學習的數據集。 

算法開發


關於算法開發方法論,基於數據驅動的算法開發離不開機器學習算法的助力。現在流行的機器學習算法,特別是深度學習算法,性能突飛猛進,規控所依賴的很多上游輸入也是深度學習算法輸出的結果。但深度學習產生的模型越來越複雜,以至於他們自己也變成了一種“黑盒”系統,也變成了一種不確定性的來源。這與規控要給自車行爲提供的穩定性要求存在一些矛盾。


那如何破解呢?其實業界也在探索。我們可以優先解決那些定義完備,數據豐富,且有明確兜底方案的模塊。中期考慮以持續提升模塊性能爲主,探索類似上游Perception、Prediction能夠實現的Continuous Learning的框架。長期來講也需要投入一部分兵力做一些前沿研究,比如可解釋AI系統以期實現更高層次的算法開發、維護自動化;


算法驗證


而在算法驗證層面,我們要考慮駕駛環境的不可窮舉性也導致了它驗證的困難。無論是仿真還是路測,主要依賴於比較全面的場景庫。對典型場景具有一定覆蓋性,並能夠持續進行分類、分層的細化,關鍵維度能夠進行參數掃描的操作等等。場景庫的來源也分主動和被動。主動設計的場景比較容易實現結構化,但是很難捕捉到一些實際場景中存在的很強的偶然性。爲此,我們需要能夠同時主動、被動同時地進行持續積累和場景庫的持續打磨。


驗證流程(以開發一個功能爲例):


  • 仿真系統有低成本、更快速的優勢,它主要應用在開發初期。針對要解決的問題,設計場景,驗證功能;可以快速進行對比測試,驗證新功能是否有效,是否regression。

  • 真實路測:封閉/小範圍/車隊 路測,確保能夠捕捉仿真和真實的差距;封閉場地+真實運營區域。封閉場景需要保證系統基本功能一切正常。真實運營區域纔是終極目標,在真實的複雜交通中,才能夠最客觀的評估我們算法的性能。

定義Ground Truth


以上提到了問題分析,算法開發,以及系統性驗證的方法論,而對於規劃模塊還有一個特別具有挑戰的問題,就是如何定義它的Ground Truth?也就是什麼是正確的駕駛?監督學習算法而言就是labeled data,對於系統性驗證就是Pass/Fail 好與壞的標準。這個目前行業內也沒有統一的標準。


我們通常會對某一位技術嫺熟可靠的人類司機產生信任感,但假如就拿TA的人工駕駛數據作爲我們的Ground truth,這樣獲得的Ground Truth是不是足夠豐富?是不是對自動駕駛來說的客觀標準?是否能夠得到廣泛認可和更多決策場景的複用?如何應對不同用戶駕駛習慣的差異性?這些問題值得我們進行潛心思考,解決思路也應該放眼更長遠的維度。



4. 
總結

整個無人駕駛行業,爲了應對複雜的自動駕駛場景、環境的不確定性的挑戰,業內已經開始探索使用並部署一些基於規則和從數據中學習的混合策略. 但是面對我們未來的願景,依舊任重道遠。更先進的數據驅動的方法論,將是面對更加複雜的ODD更快速規模化落地自動駕駛載人運營的助推力。這是一個很有潛力、很令人興奮的行業,有很多高潛力的方向。期待更多有志的工程師和研究者加入到自動駕駛行業中來,一起推動技術的演進。



5. 
Reference

[1] https://www.wired.com/story/amazon-warehouse-robots/

[2] Ono, Masahiro, et al. "Risk-aware planetary rover operation: Autonomous terrain classification and path planning." 2015 IEEE aerospace conference. IEEE, 2015.

[3] https://www.theverge.com

/2020/10/8/21507814/waymo-driverless-cars-allow-more-customers-phoenix

[4] https://en.wikipedia.org/wiki/

Explainable_artificial_intelligence



本文作者



團隊招聘


滴滴致力於打造世界領先的L4級及以上自動駕駛技術,希望通過科技讓出行更安全、更高效。2019年8月,滴滴宣佈將自動駕駛部門升級爲獨立公司, 專注於自動駕駛研發、產品應用及相關業務拓展。


滴滴自動駕駛長期招聘計算機視覺、規劃與控制、行爲預測、高精地圖、仿真、基礎架構、車輛硬件、測試開發等職位,歡迎投遞至[email protected]om。


掃碼瞭解滴滴自動駕駛


延伸閱讀



內容編輯 | Mango

聯繫我們 | [email protected]


   
   
   

本文分享自微信公衆號 - 滴滴技術(didi_tech)。
如有侵權,請聯繫 [email protected] 刪除。
本文參與“OSC源創計劃”,歡迎正在閱讀的你也加入,一起分享。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章