人工智能笔记之专业选修课4.1.5 - 博弈论 2.经典囚徒困境等经典博弈场景

经典囚徒困境

两个囚徒 选择合作或不合作?

  • 不合作被称为背叛(defect)

  • 如果他们合作 他们得到结果A

  • 如果都背叛 他们会得到另一个结果D 不过A比D更优

  • 然而如果他们合作失败 其中一方选择合作 一方背叛

  • 那么选择合作的人得到最差的结果,而背叛的人得到可能的最优结果在这里插入图片描述

博弈竞争模型

是一个概念非常清晰的纯粹竞争例子

  • 在这个情况中 只有两个参与者 两个参与者的收益是互补的
  • 因而 他们通常加起来是一个常量C
    我们使用的常量一般是零 称之为零和博弈

在这里插入图片描述

经典便士匹配博弈

在这里插入图片描述

经典石头剪子布(rochambo)

在这里插入图片描述

合作游戏

所有代理人得到完全一样的利益。他们采取的每一个动作矢量的得益是一样的。所以玩家“i”的效用和玩家“j”的效用(utility)是一样的

在这里插入图片描述

在这里插入图片描述

竞争与合作

在这里插入图片描述

纳什均衡场景

  • 在所有博弈当中最基本的标准解概念之一

在这里插入图片描述

在这里插入图片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章