概率機器人中機器人的環境交互相關描述

學完概率的基本知識,書中機器人環境交互的知識教我們如何用概率描述機器人與世界。
下面是本篇文章的知識結構圖:
在這裏插入圖片描述
環境: 擁有內部狀態的動態系統。
機器人與環境:
(1)觀測環境:機器人可以通過傳感器獲得環境的相關信息,但是傳感器有噪聲,因此,機器人保持着關於環境狀態的一個內部置信度。
(2)影響環境:機器人的控制行爲會影響環境,並且對機器人狀態的內部置信度有影響。

狀態:
(1)狀態定義
本書認爲狀態是所有會對未來機器人及其環境產生影響的所有方面的因素,廣義的概念。
本書中,時間t時刻的狀態表示爲 xt
(2)狀態分類
靜態狀態和動態狀態,瞭解即可。
(3)狀態的完整性與不完整性
假設一個狀態xt可以最好地預測未來,則稱其是完整的。完整性只包括過去狀態測量及控制的信息,不包含其他可以更加精確地預測未來的其他附加信息。
完整性的定義不是要求未來是一個關於狀態確定的函數未來是隨機的,但是沒有先於xt的狀態變量可以影響未來狀態的隨機變化。滿足這些條件的暫態過程通常稱爲馬爾科夫鏈
狀態的完整性的概念主要是理論上的重要性。任何一個實際的機器人系統都不可能指定一個完整的狀態。
現實的實現是挑選所有狀態變量的小子集,稱爲不完整狀態
(4)狀態的形式
有時狀態是連續的,有時狀態是離散的,有時狀態又是混合的

對於大多數有趣的機器人問題,狀態隨着時間變化。本書中的時間將是離散的

環境交互
在機器人及其環境之間存在兩種基本的交互類型:
(1)機器人通過執行機構影響環境的狀態
(2)通過傳感器收集有關狀態的信息
測量數據:
把在時間t的傳感器測量數據表示zt,這時假設傳感器在一瞬間就完成了測量
在本書的大部分內容中,都假設機器人在一個時間點進行一次測量
在這裏插入圖片描述
控制數據:
在這裏插入圖片描述
注意:里程計認爲是控制數據

概率描述:
如果狀態xt是完整的:
在這裏插入圖片描述
此概率稱爲狀態轉移概率
如果狀態xt是完整的,則狀態xt足以預測測量zt
在這裏插入圖片描述
此概率稱爲測量概率

狀態轉移概率和測量概率一起描述機器人及其環境的狀態隨機系統。

時刻t 的狀態隨機地依賴 t -1 時刻的狀態和控制ut, 。測量zt 隨機地依賴時刻 t 的狀態。這樣的時間生成模型稱爲隱馬爾可夫模型或者動態貝葉斯網絡

在這裏插入圖片描述
置信度:
置信度反映了機器人有關狀態的內部信息
本書已經討論過狀態不能直接測量。比如機器人的位姿,必須從數據中推測出來,從位姿內部的置信度識別出正真的狀態。
概率機器人通過條件概率分佈表示置信度
置信度分佈是以可獲得數據的條件下關於狀態變量的後驗概率
用bel(xt)表示狀態變量xt的置信度。
在這裏插入圖片描述
計算置信度:需要過去所有的測量和過去所有的控制爲條件

在剛剛執行完控制ut之後,綜合測量zt之前的數據(不包括zt)進行計算後驗,如下:
在這裏插入圖片描述
到這裏關於機器人環境交互的內容也全部總結完了,全是乾貨。
在這裏插入圖片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章