讀書筆記: 博弈論導論 - 03 - 完整信息的靜態博弈 預備知識
預備知識
本文是Game Theory An Introduction (by Steven Tadelis) 的學習筆記。
知識點
靜態完全信息博弈(static games of complete information)
第一步:每個玩家同時並且獨立的選擇一個行動,(每個玩家都不知道別人的選擇情況)
第二步:根據所有玩家選擇的行動,收益被分佈到每個玩家。- 完全信息博弈(Games of Complete Information)
一個完全信息博弈要求:下面四部分是博弈中所有玩家的公共知識。- 所有玩家的所有可能的行動
- 所有可能的結果
- 所有玩家的各種行動組合產生什麼樣的結果
- 每個玩家對結果的傾向
公共知識(common knowledge)
一個公共知識是一個事件E,並且 (1) 每個人都知道, (2) 每個人都知道每個人都知道,像這樣無限循環下去。
普通形式博弈
- 普通形式博弈(normal-form game)有下面三個特徵:
- 一組玩家
- 每個玩家有一套行動
- 一套收益函數:每個玩家的行動組合都有一個收益值。
策略(strategy)
打算完成一個特定目標的行動計劃。純策略(pure strategy)
玩家i的一個純策略是一個確定性的(意味着沒有隨機性)行動計劃。
\(S_i\)用來表示玩家i的所有純策略。所有玩家的純策略組合(a profile of pure strategies)
\(s = (s_i, s_2, \cdots, s_n), s_i \in S_i \text{ for all } i = 1,2,\cdots, n\)
代表在一個博弈中所有n的玩家的一組選擇的純策略組合。- 普通形式博弈(normal-form game)的數學表達
- 一個有限的玩家集合, \(N = {1, 2, \cdots, n}\)
- 每個玩家的純策略集合的組合, \({S_1, S_2, \cdots, S_n}\)
- 一套收益函數, \({v_1, v_2, \cdots, v_n}\),對於每個玩家,每一種所有玩家選擇的策略組合,都有一個收益值。
$v_i: S_1 \times S_2 \times \cdots \times S_n \text{ for each } i \in N $
普通形式博弈(normal-form game)的數學表達例子:囚徒困境(The Prisoner's Dilemma)
Players:\(N = {1,2}\)
Strategy sets: \(S_i = {M, F} \ for \ i \in N\)
Payoffs: Let \(v_i(s_1, s_2)\) be the payoff to player i if player 1 choose \(s_1\) and player 2 chooses \(s_2\)
We can then write payoff are
\(v_1(M, M) = v_2(M, M) = -2\)
\(v_1(F, F) = v_2(F, F) = -4\)
\(v_1(F, M) = v_2(F, M) = -5\)
\(v_1(M, F) = v_2(M, F) = -1\)
M: mum 沉默; F:fink 告密
2人有限博弈的矩陣表達
- 例子:囚徒困境(The Prisoner's Dilemma)
Player 2 | |||
---|---|---|---|
M | F | ||
Player 1 | M | -2, -2 | -5, -1 |
F | -1, -5 | -4, -4 |
方案設想(solution concept)
方案設想(solution concept)
方案設想(solution concept)是一個分析博弈的方法,用於限定出所有可能的合理結果。
一個方案設想將導致一個預言或者處方。均衡(equilibrium)
任何一種可以產生方案設想預言的策略組合。
也就是可以任何一種導致合理結果的策略組合。
如果用因果關係來說明,均衡是(可以導致合理結果的)因,方案設想是(可以導致合理結果的)分析方法,因果關係的公共知識。
從權衡方面來說:方案設想就是一個權衡。均衡的權衡的結果。
- 方案設想的假設條件
- 玩家是理性的
- 玩家是智力的
- 公共知識:“玩家是理性的”和“玩家是智力的”是所有玩家的公共知識。
- 自我執行:方案設想的均衡必須是自我執行的。(每個玩家都會採用一種均衡結果)
- 方案設想的評估
- 存在性(Existence: How often does it apply?)
- 唯一性(Uniqueness: How much does it restrict behavior?)
- 不變性(Invariance: How sensitive is it to small changes?)
- 帕累託優勢(pareto dominate)
策略組合s帕累託優勢於策略組合s',其前提條件:對於每個玩家,在策略組合s中的收益都大於等於在策略組合s‘中的收益,並且至少有一個玩家,在策略組合s中的收益大於在策略組合s‘中的收益。
\[ v_i(s) \geq v_i(s'), \forall i \in N \\ \ v_i(s) > v_i(s'), \exists i \in N \]
參照
- Game Theory An Introduction (by Steven Tadelis)
- 讀書筆記: 博弈論導論 - 01 - 單人決策問題
- 讀書筆記: 博弈論導論 - 02 - 引入不確定性和時間