人工智能筆記之專業選修課4.1.5 - 博弈論 6.嚴格劣勢策略

嚴格劣勢策略 strictly dominated strategies

在穩定性和預測上analyzing games in terms of stability, in terms of predicting. ,人們可以想到各種不同的方式來分析博弈。而人們會做什麼,遵循什麼邏輯是分析博弈的另一個重要方式, 也能給我們一些洞見。
核心思想是當我們考慮博弈論裏的理性時,基本的前提爲:人們總是希望最大化他們的收益payoffs,因此他們總是在嘗試最大化他們的收益。這並不是說他們都是貪婪的,收益可以是利他的altruistic ,或者利於大衆的。
這裏的前提是人們有某種客觀的函數, 人們會傾向於選擇讓他們得到更高收益的行爲,而不是更低收益的行爲,我們要做的是思考:
  • 如果博弈者知道其他人會最大化他們的收益?
  • 我們會知道博弈結構是怎樣的?
  • 我們能否推斷出博弈中什麼行爲應該被選擇?
如果所有博弈者都知道,所有博弈者是理性的,你可以把這個如果你知道,我知道,你知道,我知道——反覆進行下去。這聽起來挺荒謬,但這在理解上是一個重要概念。我們可以運用這一整套邏輯用來分析均衡,以及做一些其他的事情

彙總:

在這裏插入圖片描述

  • 對於嚴格劣策略:代表其他所有策略總是比這個策略更優秀,它永遠不會成爲最優迴應best reply
  • 在任何情況下總有別的策略更好,因此,我們把嚴格劣策略從博弈中剔除
  • 重複迭代的意思是:我們剔除它們,得到了一個更簡單的博弈,然後再做同樣的事情。現在可能又有了一些策略是嚴格劣勢的,在這個簡化的博弈中博弈者永遠不會採取它們,因此我們再把它們剔除,循環反覆,最後給我們了一些預測。當博弈者理性 他們也認識到其他博弈者理性時是合乎邏輯的結果 ,這些策略就會在這個子博弈中。
  • 進行這個過程的術語稱作嚴格劣策略重複剔除
  • 用規範符號來表示爲下圖

在這裏插入圖片描述

  • 博弈者I的策略aia_ i,這個博弈者的其他策略aia'_{i}嚴格佔優
  • 假如以下情況成立這個博弈者採取aia_{i}的收益小於博弈者採取aia'_{i}的收益
  • 這就是說 其他所有博弈者可能採取的行動。無論他們怎麼行動,這個 aia_{i} 獲得的收益永遠低於aia'_{i} ,因此任何情況下 aia_{i}都不是是優解。它總是要更糟。這代表採取aia'_{i}永遠都更好,這就是嚴格劣策略的概念
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章