人工智能筆記之專業選修課4.1.5 - 博弈論 2.經典囚徒困境等經典博弈場景

經典囚徒困境

兩個囚徒 選擇合作或不合作?

  • 不合作被稱爲背叛(defect)

  • 如果他們合作 他們得到結果A

  • 如果都背叛 他們會得到另一個結果D 不過A比D更優

  • 然而如果他們合作失敗 其中一方選擇合作 一方背叛

  • 那麼選擇合作的人得到最差的結果,而背叛的人得到可能的最優結果在這裏插入圖片描述

博弈競爭模型

是一個概念非常清晰的純粹競爭例子

  • 在這個情況中 只有兩個參與者 兩個參與者的收益是互補的
  • 因而 他們通常加起來是一個常量C
    我們使用的常量一般是零 稱之爲零和博弈

在這裏插入圖片描述

經典便士匹配博弈

在這裏插入圖片描述

經典石頭剪子布(rochambo)

在這裏插入圖片描述

合作遊戲

所有代理人得到完全一樣的利益。他們採取的每一個動作矢量的得益是一樣的。所以玩家“i”的效用和玩家“j”的效用(utility)是一樣的

在這裏插入圖片描述

在這裏插入圖片描述

競爭與合作

在這裏插入圖片描述

納什均衡場景

  • 在所有博弈當中最基本的標準解概念之一

在這裏插入圖片描述

在這裏插入圖片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章