概率机器人中机器人的环境交互相关描述

学完概率的基本知识,书中机器人环境交互的知识教我们如何用概率描述机器人与世界。
下面是本篇文章的知识结构图:
在这里插入图片描述
环境: 拥有内部状态的动态系统。
机器人与环境:
(1)观测环境:机器人可以通过传感器获得环境的相关信息,但是传感器有噪声,因此,机器人保持着关于环境状态的一个内部置信度。
(2)影响环境:机器人的控制行为会影响环境,并且对机器人状态的内部置信度有影响。

状态:
(1)状态定义
本书认为状态是所有会对未来机器人及其环境产生影响的所有方面的因素,广义的概念。
本书中,时间t时刻的状态表示为 xt
(2)状态分类
静态状态和动态状态,了解即可。
(3)状态的完整性与不完整性
假设一个状态xt可以最好地预测未来,则称其是完整的。完整性只包括过去状态测量及控制的信息,不包含其他可以更加精确地预测未来的其他附加信息。
完整性的定义不是要求未来是一个关于状态确定的函数未来是随机的,但是没有先于xt的状态变量可以影响未来状态的随机变化。满足这些条件的暂态过程通常称为马尔科夫链
状态的完整性的概念主要是理论上的重要性。任何一个实际的机器人系统都不可能指定一个完整的状态。
现实的实现是挑选所有状态变量的小子集,称为不完整状态
(4)状态的形式
有时状态是连续的,有时状态是离散的,有时状态又是混合的

对于大多数有趣的机器人问题,状态随着时间变化。本书中的时间将是离散的

环境交互
在机器人及其环境之间存在两种基本的交互类型:
(1)机器人通过执行机构影响环境的状态
(2)通过传感器收集有关状态的信息
测量数据:
把在时间t的传感器测量数据表示zt,这时假设传感器在一瞬间就完成了测量
在本书的大部分内容中,都假设机器人在一个时间点进行一次测量
在这里插入图片描述
控制数据:
在这里插入图片描述
注意:里程计认为是控制数据

概率描述:
如果状态xt是完整的:
在这里插入图片描述
此概率称为状态转移概率
如果状态xt是完整的,则状态xt足以预测测量zt
在这里插入图片描述
此概率称为测量概率

状态转移概率和测量概率一起描述机器人及其环境的状态随机系统。

时刻t 的状态随机地依赖 t -1 时刻的状态和控制ut, 。测量zt 随机地依赖时刻 t 的状态。这样的时间生成模型称为隐马尔可夫模型或者动态贝叶斯网络

在这里插入图片描述
置信度:
置信度反映了机器人有关状态的内部信息
本书已经讨论过状态不能直接测量。比如机器人的位姿,必须从数据中推测出来,从位姿内部的置信度识别出正真的状态。
概率机器人通过条件概率分布表示置信度
置信度分布是以可获得数据的条件下关于状态变量的后验概率
用bel(xt)表示状态变量xt的置信度。
在这里插入图片描述
计算置信度:需要过去所有的测量和过去所有的控制为条件

在刚刚执行完控制ut之后,综合测量zt之前的数据(不包括zt)进行计算后验,如下:
在这里插入图片描述
到这里关于机器人环境交互的内容也全部总结完了,全是干货。
在这里插入图片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章