無人駕駛車與環境的關係

本文以無人駕駛爲例,簡單的闡述《人工智能,一種現代方法》中對於Intelligent Agent的講解。

一、無人駕駛汽車的組成

無人駕駛車,即一個智能agent,跟通用的agent定義一樣,由三部分組成,感知,執行,環境。感知獲取環境信息,通過執行指令反作用於環境。無人駕駛系統主要由感知,規劃控制,地圖,定位等組成。

感知:探測行人,車輛,紅綠燈,車道線,交通標誌等信息;
地圖:一個比較火的概念是高精度地圖,包含車道數,車道線位 置,直行或轉向車道,道路限速,道路間的拓撲結構等定製信息;
定位:通過差分,激光或者視覺Slam進行cm級定位;
規劃控制:定位當前位置,通過地圖進行路徑規劃,生成油門、制動、轉向控制量避開障礙物穩定快速的達到目標點。

二、無人駕駛評價
無人駕駛系統是否合理,可以從以下四個方面衡量:
1 衡量表現是否優秀的標準;
2 系統對於環境的先驗知識;
3 無人駕駛系統能執行的動作;
4 無人駕駛系統感知到的環境序列;

簡單地,如果一個無人駕駛系統,通過感知環境序列,在已有的先驗知識的基礎上,從可執行的動作中,決策出了表現優秀的行爲,那麼這個無人駕駛系統是合理的。
這個地方要注意合理和完美的區別,合理是滿足約束的局部最優,完美是全局最優。全局最優在現實中幾乎是不可能存在的。但是一個無人駕駛系統,僅僅通過先驗知識進行決策是不夠的,先驗只是人們總結的部分case,不能夠全面的描述變化的環境。系統在與環境的交互過程,習得經驗,總結並從經驗中學習,這是系統的自主性,對於一個智能駕駛系統相當的重要。

三、環境的描述
一個合理的系統首先是深入的瞭解需要解決的問題。需要解決的問題來自於任務環境,第一步得分析任務環境。
可從以下四個方面分析任務環境,無人駕駛爲例:

1 性能表現:無人駕駛車的安全性,舒適型,經濟型等;
2 外部環境:車,路,人,交通流等;
3 執行器:轉向,加減速,轉向燈,喇叭燈;
4 傳感器:毫米波,激光雷達,攝像頭,超聲波燈;

可以從以下幾個屬性對環境進行描述:

1 可觀測性:如果每時每刻,傳感器都能獲取全部的環境信息,特別是跟決策相關的所有信息,那麼該環境是全部可觀測的。否則,因爲噪聲和傳感器的不準確(漏檢,誤檢)丟失了部分環境信息,那麼該環境是部分可觀測的。無人駕駛環境是部分可觀測的,這就需要做一些跟蹤來維持對環境的認識。

2 單agent還是多agnet
環境中是否存在多個agent,多agent間的關係包括合作和競爭。

3 確定的還是隨機的
如果可以通過當前的環境和執行的控制量來推斷環境的下一個狀態,那麼該環境是確定環境,否則,環境是隨機的。如果環境是部分可觀測和隨機的,那麼該環境是不確定的。不確定的環境通過引入概率進行描述。

4 片段的還是連續的
上一次的感知序列對下一次的感知序列沒有影響,相互獨立的,那麼環境是片段式的,否則是連續的。在無人駕駛中,做決策時,考慮多久的信息片段。

5 靜態的還是動態的
這個很好理解,環境是否隨時間變化。自動駕駛環境無時不刻不在變化。

6 連續的還是離散的
無人駕駛環境多少連續的,通過數字處理後離散化了。

7 已知的還是未知的
在已知的環境中,行動對應着結果,種瓜得瓜。

四、無人駕駛車的類型

無人駕駛車由硬件和軟件組成。硬件包括車本身,傳感器,執行器等,軟件主要是算法程序。根據算法程序對感知的信息的反應方式,可以分成以下幾類:

1 簡單的應激行動
不考慮歷史感知信息,只根據當前感知到的信息採取行動,跟人的很多條件反射類似,比如眨眼,膝跳反射等。特點是非常簡單,但是智能有限。在無人駕駛程序中,可見到明顯不夠智能的例子很多:感知誤檢到一幀障礙物,車輛則會執行剎車動作。在感知信息不夠準確,或者說是環境只部分可觀測時,表現出來的性能不是讓人特別滿意。

2 基於模型的行動
通過對環境的跟蹤可以緩解環境的部分可觀測性帶來的影響。怎麼來做外部環境的跟蹤呢,首先得知道他的變化規律,即給外部環境建立一個模型。自動駕駛車不僅要知道外部環境是怎麼變化的,也要知道自己在控制量的作用下是如何運動的,比如車輛模型。基於外在和內在兩個模型更好的做出合理的決策。

3 基於目標的行動
知道了內外部運行模型還不夠,無人駕駛系統需要知道自己的目標是什麼,比如,目的地在哪?只有知道了目標纔不會南轅北轍。有了目的地,在路口的左右轉纔會有選擇的依據。在無人駕駛系統中的路徑規劃。

4 基於效用的行動
很多導航軟件可以根據距離最短,用時最少,紅綠燈最少等指標選擇路徑。同樣的,知道了目的地,也知道了外部環境的變化,無人駕駛車可以選擇快速的達到目的地,也可以選擇舒適平穩的達到目的地。設定一個效用標準可以幫助無人駕駛車做更合理的決策。

5 基於學習的行動
有老師教肯定好,在沒有老師教的情況下,比如從學校畢業進入社會了,能教你的人寥寥無幾,這個時候自學能力就特別重要。對於機器也是這樣,能設定的先驗知識和模型都是有限的,如何能從經驗中自我學習纔是檢驗一個系統是否真正智能的標準。一個能自我學習的系統可以由四個部分組成:評判器,學習器,問題產生器,行動選擇器。學習器從評判器處獲得反饋來調整行動選擇器的決策。問題產生器的作用是建議行動選擇器選擇一些不一樣的行動。這種行動是一種嘗試,有點變異進化的味道。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章