無人駕駛車與環境的關係

本文以無人駕駛爲例，簡單的闡述《人工智能，一種現代方法》中對於Intelligent Agent的講解。

一、無人駕駛汽車的組成

無人駕駛車，即一個智能agent，跟通用的agent定義一樣，由三部分組成，感知，執行，環境。感知獲取環境信息，通過執行指令反作用於環境。無人駕駛系統主要由感知，規劃控制，地圖，定位等組成。

感知：探測行人，車輛，紅綠燈，車道線，交通標誌等信息；
地圖：一個比較火的概念是高精度地圖，包含車道數，車道線位置，直行或轉向車道，道路限速，道路間的拓撲結構等定製信息；
定位：通過差分，激光或者視覺Slam進行cm級定位；
規劃控制：定位當前位置，通過地圖進行路徑規劃，生成油門、制動、轉向控制量避開障礙物穩定快速的達到目標點。

二、無人駕駛評價
無人駕駛系統是否合理，可以從以下四個方面衡量：
1 衡量表現是否優秀的標準；
2 系統對於環境的先驗知識；
3 無人駕駛系統能執行的動作；
4 無人駕駛系統感知到的環境序列；

簡單地，如果一個無人駕駛系統，通過感知環境序列，在已有的先驗知識的基礎上，從可執行的動作中，決策出了表現優秀的行爲，那麼這個無人駕駛系統是合理的。
這個地方要注意合理和完美的區別，合理是滿足約束的局部最優，完美是全局最優。全局最優在現實中幾乎是不可能存在的。但是一個無人駕駛系統，僅僅通過先驗知識進行決策是不夠的，先驗只是人們總結的部分case，不能夠全面的描述變化的環境。系統在與環境的交互過程，習得經驗，總結並從經驗中學習，這是系統的自主性，對於一個智能駕駛系統相當的重要。

三、環境的描述
一個合理的系統首先是深入的瞭解需要解決的問題。需要解決的問題來自於任務環境，第一步得分析任務環境。
可從以下四個方面分析任務環境，無人駕駛爲例：

1 性能表現：無人駕駛車的安全性，舒適型，經濟型等；
2 外部環境：車，路，人，交通流等；
3 執行器：轉向，加減速，轉向燈，喇叭燈；
4 傳感器：毫米波，激光雷達，攝像頭，超聲波燈；

可以從以下幾個屬性對環境進行描述：

1 可觀測性：如果每時每刻，傳感器都能獲取全部的環境信息，特別是跟決策相關的所有信息，那麼該環境是全部可觀測的。否則，因爲噪聲和傳感器的不準確（漏檢，誤檢）丟失了部分環境信息，那麼該環境是部分可觀測的。無人駕駛環境是部分可觀測的，這就需要做一些跟蹤來維持對環境的認識。

2 單agent還是多agnet
環境中是否存在多個agent，多agent間的關係包括合作和競爭。

3 確定的還是隨機的
如果可以通過當前的環境和執行的控制量來推斷環境的下一個狀態，那麼該環境是確定環境，否則，環境是隨機的。如果環境是部分可觀測和隨機的，那麼該環境是不確定的。不確定的環境通過引入概率進行描述。

4 片段的還是連續的
上一次的感知序列對下一次的感知序列沒有影響，相互獨立的，那麼環境是片段式的，否則是連續的。在無人駕駛中，做決策時，考慮多久的信息片段。

5 靜態的還是動態的
這個很好理解，環境是否隨時間變化。自動駕駛環境無時不刻不在變化。

6 連續的還是離散的
無人駕駛環境多少連續的，通過數字處理後離散化了。

7 已知的還是未知的
在已知的環境中，行動對應着結果，種瓜得瓜。

四、無人駕駛車的類型

無人駕駛車由硬件和軟件組成。硬件包括車本身，傳感器，執行器等，軟件主要是算法程序。根據算法程序對感知的信息的反應方式，可以分成以下幾類：

1 簡單的應激行動
不考慮歷史感知信息，只根據當前感知到的信息採取行動，跟人的很多條件反射類似，比如眨眼，膝跳反射等。特點是非常簡單，但是智能有限。在無人駕駛程序中，可見到明顯不夠智能的例子很多：感知誤檢到一幀障礙物，車輛則會執行剎車動作。在感知信息不夠準確，或者說是環境只部分可觀測時，表現出來的性能不是讓人特別滿意。

2 基於模型的行動
通過對環境的跟蹤可以緩解環境的部分可觀測性帶來的影響。怎麼來做外部環境的跟蹤呢，首先得知道他的變化規律，即給外部環境建立一個模型。自動駕駛車不僅要知道外部環境是怎麼變化的，也要知道自己在控制量的作用下是如何運動的，比如車輛模型。基於外在和內在兩個模型更好的做出合理的決策。

3 基於目標的行動
知道了內外部運行模型還不夠，無人駕駛系統需要知道自己的目標是什麼，比如，目的地在哪？只有知道了目標纔不會南轅北轍。有了目的地，在路口的左右轉纔會有選擇的依據。在無人駕駛系統中的路徑規劃。

4 基於效用的行動
很多導航軟件可以根據距離最短，用時最少，紅綠燈最少等指標選擇路徑。同樣的，知道了目的地，也知道了外部環境的變化，無人駕駛車可以選擇快速的達到目的地，也可以選擇舒適平穩的達到目的地。設定一個效用標準可以幫助無人駕駛車做更合理的決策。

5 基於學習的行動
有老師教肯定好，在沒有老師教的情況下，比如從學校畢業進入社會了，能教你的人寥寥無幾，這個時候自學能力就特別重要。對於機器也是這樣，能設定的先驗知識和模型都是有限的，如何能從經驗中自我學習纔是檢驗一個系統是否真正智能的標準。一個能自我學習的系統可以由四個部分組成：評判器，學習器，問題產生器，行動選擇器。學習器從評判器處獲得反饋來調整行動選擇器的決策。問題產生器的作用是建議行動選擇器選擇一些不一樣的行動。這種行動是一種嘗試，有點變異進化的味道。

無人駕駛車與環境的關係

MySQL 核心模塊揭祕 | 18 期 | 鎖在內存里長什麼樣*

使用perf工具生成火焰圖

HttpSecurity 是如何組裝過濾器鏈的

數說海南——近6年海南各市縣人口簡單看

長序列中Transformers的高級注意力機制總結

響應式界面控件DevExtreme * 更強的數據分析和可視化功能

人工智能__一種現代方法緒論導讀

機器學習數據歸一化作用

無人駕駛車與環境的關係

文章標題

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結