讀書筆記: 博弈論導論 - 03 - 完整信息的靜態博弈 預備知識

讀書筆記: 博弈論導論 - 03 - 完整信息的靜態博弈 預備知識

預備知識

本文是Game Theory An Introduction (by Steven Tadelis) 的學習筆記。

知識點

  • 靜態完全信息博弈(static games of complete information)
    第一步:每個玩家同時並且獨立的選擇一個行動,(每個玩家都不知道別人的選擇情況)
    第二步:根據所有玩家選擇的行動,收益被分佈到每個玩家。

  • 完全信息博弈(Games of Complete Information)
    一個完全信息博弈要求:下面四部分是博弈中所有玩家的公共知識。
    1. 所有玩家的所有可能的行動
    2. 所有可能的結果
    3. 所有玩家的各種行動組合產生什麼樣的結果
    4. 每個玩家對結果的傾向
  • 公共知識(common knowledge)
    一個公共知識是一個事件E,並且 (1) 每個人都知道, (2) 每個人都知道每個人都知道,像這樣無限循環下去。

普通形式博弈

  • 普通形式博弈(normal-form game)有下面三個特徵:
    1. 一組玩家
    2. 每個玩家有一套行動
    3. 一套收益函數:每個玩家的行動組合都有一個收益值。
  • 策略(strategy)
    打算完成一個特定目標的行動計劃。

  • 純策略(pure strategy)
    玩家i的一個純策略是一個確定性的(意味着沒有隨機性)行動計劃。
    \(S_i\)用來表示玩家i的所有純策略。

  • 所有玩家的純策略組合(a profile of pure strategies)
    \(s = (s_i, s_2, \cdots, s_n), s_i \in S_i \text{ for all } i = 1,2,\cdots, n\)
    代表在一個博弈中所有n的玩家的一組選擇的純策略組合。

  • 普通形式博弈(normal-form game)的數學表達
    1. 一個有限的玩家集合, \(N = {1, 2, \cdots, n}\)
    2. 每個玩家的純策略集合的組合, \({S_1, S_2, \cdots, S_n}\)
    3. 一套收益函數, \({v_1, v_2, \cdots, v_n}\),對於每個玩家,每一種所有玩家選擇的策略組合,都有一個收益值。
      $v_i: S_1 \times S_2 \times \cdots \times S_n \text{ for each } i \in N $
  • 普通形式博弈(normal-form game)的數學表達例子:囚徒困境(The Prisoner's Dilemma)

    Players:\(N = {1,2}\)
    Strategy sets: \(S_i = {M, F} \ for \ i \in N\)
    Payoffs: Let \(v_i(s_1, s_2)\) be the payoff to player i if player 1 choose \(s_1\) and player 2 chooses \(s_2\)
    We can then write payoff are
    \(v_1(M, M) = v_2(M, M) = -2\)
    \(v_1(F, F) = v_2(F, F) = -4\)
    \(v_1(F, M) = v_2(F, M) = -5\)
    \(v_1(M, F) = v_2(M, F) = -1\)
    M: mum 沉默; F:fink 告密

2人有限博弈的矩陣表達

  • 例子:囚徒困境(The Prisoner's Dilemma)
Player 2
M F
Player 1 M -2, -2 -5, -1
F -1, -5 -4, -4

方案設想(solution concept)

  • 方案設想(solution concept)
    方案設想(solution concept)是一個分析博弈的方法,用於限定出所有可能的合理結果。
    一個方案設想將導致一個預言或者處方。

  • 均衡(equilibrium)
    任何一種可以產生方案設想預言的策略組合。
    也就是可以任何一種導致合理結果的策略組合。

如果用因果關係來說明,均衡是(可以導致合理結果的)因,方案設想是(可以導致合理結果的)分析方法,因果關係的公共知識。
從權衡方面來說:方案設想就是一個權衡。均衡的權衡的結果。

  • 方案設想的假設條件
    1. 玩家是理性的
    2. 玩家是智力的
    3. 公共知識:“玩家是理性的”和“玩家是智力的”是所有玩家的公共知識。
    4. 自我執行:方案設想的均衡必須是自我執行的。(每個玩家都會採用一種均衡結果)
  • 方案設想的評估
    1. 存在性(Existence: How often does it apply?)
    2. 唯一性(Uniqueness: How much does it restrict behavior?)
    3. 不變性(Invariance: How sensitive is it to small changes?)
  • 帕累託優勢(pareto dominate)
    策略組合s帕累託優勢於策略組合s',其前提條件:對於每個玩家,在策略組合s中的收益都大於等於在策略組合s‘中的收益,並且至少有一個玩家,在策略組合s中的收益大於在策略組合s‘中的收益。

\[ v_i(s) \geq v_i(s'), \forall i \in N \\ \ v_i(s) > v_i(s'), \exists i \in N \]

參照

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章