概率機器人中概率的基本概念

從上一章,我們已經學到,概率機器人學是通過數學上概率的方式描述各種不確定性,進而處理機器人問題的科學。
第二章:遞歸狀態估計,主要介紹以下三個部分:
(1)概率的基本概念
(2)機器人的環境交互
(3)貝葉斯濾波

本篇文章只總結概率的基本概念

首先介紹狀態估計,概率機器人技術的核心是由傳感器數據來估計狀態的思路。狀態估計解決的是從不能直接觀測但可以推斷的傳感器數據中估計數量的問題。狀態估計旨在從數據中找回狀態變量。概率狀態估計算法在可能的狀態空間上計算置信度分佈。上一章機器人定位的例子就是概率狀態估計的實例。

本節主要總結的知識點如下圖所示,並且需要熟悉使用這些基本符號。
在這裏插入圖片描述
隨機變量:
在概率機器人建模時,如傳感器測量、控制、機器人的狀態以及環境這些都可以作爲隨機變量。這些隨機變量可以根據具體的概率定律取不同的值。

這裏,令X表示一個隨機變量,x表示X的某一個特定值。比如擲硬幣,x可以是正、反,X可以取正反兩種狀態。這裏首先要清楚X的狀態空間是離散的
所以用p(X=x)來表示隨機變量X具有x的概率,爲了簡化符號,通常省略隨機變量的明確表示,常用縮寫p(x)表示p(X=x)。離散概率分佈和總爲1。中學內容,大家都懂。
下面爲了方便理解,直接用圖對比說明連續和離散空間下的概率表示以及連續空間下的正態分佈。
在這裏插入圖片描述
正態分佈:
普通的密度函數都是具有均值μ和方差σ^2的一維正態分佈。正態分佈的概率密度函數可以用高斯函數求出:
在這裏插入圖片描述
正態分佈,本書用N(x, μ,σ^2)來表示,他指出隨機變量及其均值和方差。
多元正態分佈:
上面式子x是一個標量值,但是在應用中x多是一個多維矢量,矢量的正態分佈稱爲多元正態分佈,多元正態分佈的概率密度函數可以用高斯函數求出:
在這裏插入圖片描述
式子中,μ是均值矢量,Σ是半正定對稱矩陣又稱爲協方差矩陣,上標T轉置符號。
觀察上面兩個式子是嚴格泛化的。
正如離散概率分佈和總爲1,連續的一個概率密度函數的積分也總爲1,但是概率密度函數的上限不限於1。
聯合分佈:
兩個隨機變量X和Y的聯合分佈,由下式給出:
p(x,y)=p(X=x,Y=y)
p(x,y)=p(x|y)p(y)=p(y|x)p(x)
描述了隨機變量X取值爲x並且Y取值爲y這個事件的概率。若X和Y相互獨立
p(x,y)=p(x)p(y)
p(x|y)=p(x)
p(y|x)=p(y)
條件概率:
假設在知道Y的值是y的條件下,X是x的概率,由下式給出:
p(x|y)=p(X=x|Y=y)
若p(y)>0,則條件概率爲
在這裏插入圖片描述
解釋爲:在y發生的條件下,x和y都發生的概率
若X和Y相互獨立,則有
在這裏插入圖片描述
全概率定理:
想要通過p(x|y)和p(y)求出p(x)的概率
離散情況:
在這裏插入圖片描述
連續情況:
在這裏插入圖片描述
貝葉斯準則:
通過條件概率p(x|y)的“逆”概率p(y|x)來求p(x|y),且p(y)>0
離散情況:
在這裏插入圖片描述
連續情況:
在這裏插入圖片描述
先驗概率分佈:
如果x是一個希望由y推測出來的數值,則稱p(x)爲先驗概率分佈
後驗概率分佈:
概率p(x|y)稱爲在X上的後驗概率分佈,貝葉斯準則提供了通過“逆”條件概率p(y|x)和先驗概率p(x)去求後驗概率的方法。在機器人學中,概率p(y|x)經常被稱爲生成模型,在一定的抽象層面上,它表示狀態變量X如何引起了檢測數據Y。
這裏注意到,貝葉斯準則的分母p(y)不依賴x,所以p(y)^(-1)經常寫成貝葉斯準則中的歸一化變量,用η表示:
在這裏插入圖片描述
在不同的公式中,將自由的用同一個η來表示歸一化,即使它們的實際值是不同的。
加入第三個隨機變量Z:
只要 p(y|z)>0, 關於 Z=z 的貝葉斯準則有
在這裏插入圖片描述
類似的,以其他變量z爲條件的相互獨立的隨機變量條件聯合概率定律:
在這裏插入圖片描述
這種關係稱爲條件獨立(在Z發生的條件下,x和y的發生與否相互獨立)。滿足上定律的稱爲條件獨立。
若X,Y關於事件Z條件獨立,則有以下一些理解:
(1)事件 Z 的發生,使本來可能不獨立的事件X和事件Y變得獨立起來;
(2)事件Z 的出現或發生,解開了X 和 Y 的依賴關係
上面式子等價於
在這裏插入圖片描述
條件獨立不意味着絕對獨立
在這裏插入圖片描述
絕對獨立也不意味着條件獨立
在這裏插入圖片描述
特殊情況下條件獨立和絕對獨立可能是一致的。
隨機變量的期望:

離散情況:
在這裏插入圖片描述
連續情況:
在這裏插入圖片描述
本書討論的都是具有有限期望的隨機變量。
期望是隨機變量的線性函數。
在這裏插入圖片描述
隨機變量的協方差:
在這裏插入圖片描述
熵:
一個概率分佈的熵如下表示:
在這裏插入圖片描述
熵的概念起源於信息論。熵是x所攜帶的期望信息。
離散情況下,假定p(x)是觀測x的概率,則-log2p(x)就是使用最佳編碼對x進行編碼所需要的比特數。

到這裏關於概率機器人的基本概率概念就總結完成了。
在這裏插入圖片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章