讀書筆記: 博弈論導論 - 03 - 完整信息的靜態博弈預備知識

原創

SNYang

2018-12-03 13:45

讀書筆記: 博弈論導論 - 03 - 完整信息的靜態博弈預備知識

預備知識

本文是Game Theory An Introduction (by Steven Tadelis) 的學習筆記。

知識點

靜態完全信息博弈(static games of complete information)
第一步：每個玩家同時並且獨立的選擇一個行動，（每個玩家都不知道別人的選擇情況）
第二步：根據所有玩家選擇的行動，收益被分佈到每個玩家。
完全信息博弈(Games of Complete Information)
一個完全信息博弈要求：下面四部分是博弈中所有玩家的公共知識。
1. 所有玩家的所有可能的行動
2. 所有可能的結果
3. 所有玩家的各種行動組合產生什麼樣的結果
4. 每個玩家對結果的傾向
公共知識(common knowledge)
一個公共知識是一個事件E，並且 (1) 每個人都知道, (2) 每個人都知道每個人都知道，像這樣無限循環下去。

普通形式博弈

普通形式博弈(normal-form game)有下面三個特徵：
1. 一組玩家
2. 每個玩家有一套行動
3. 一套收益函數：每個玩家的行動組合都有一個收益值。
策略(strategy)
打算完成一個特定目標的行動計劃。
純策略(pure strategy)
玩家i的一個純策略是一個確定性的（意味着沒有隨機性）行動計劃。
$S_i$用來表示玩家i的所有純策略。
所有玩家的純策略組合(a profile of pure strategies)
$s = (s_i, s_2, \cdots, s_n), s_i \in S_i \text{ for all } i = 1,2,\cdots, n$
代表在一個博弈中所有n的玩家的一組選擇的純策略組合。
普通形式博弈(normal-form game)的數學表達
1. 一個有限的玩家集合, $N = {1, 2, \cdots, n}$
2. 每個玩家的純策略集合的組合, ${S_1, S_2, \cdots, S_n}$
3. 一套收益函數, ${v_1, v_2, \cdots, v_n}$，對於每個玩家，每一種所有玩家選擇的策略組合，都有一個收益值。
  $v_i: S_1 \times S_2 \times \cdots \times S_n \text{ for each } i \in N $
普通形式博弈(normal-form game)的數學表達例子：囚徒困境(The Prisoner's Dilemma)

Players:$N = {1,2}$
Strategy sets: $S_i = {M, F} \ for \ i \in N$
Payoffs: Let $v_i(s_1, s_2)$ be the payoff to player i if player 1 choose $s_1$ and player 2 chooses $s_2$
We can then write payoff are
$v_1(M, M) = v_2(M, M) = -2$
$v_1(F, F) = v_2(F, F) = -4$
$v_1(F, M) = v_2(F, M) = -5$
$v_1(M, F) = v_2(M, F) = -1$
M: mum 沉默; F:fink 告密

2人有限博弈的矩陣表達

例子：囚徒困境(The Prisoner's Dilemma)

		Player 2
		M	F
Player 1	M	-2, -2	-5, -1
	F	-1, -5	-4, -4

方案設想(solution concept)

方案設想(solution concept)
方案設想(solution concept)是一個分析博弈的方法，用於限定出所有可能的合理結果。
一個方案設想將導致一個預言或者處方。
均衡(equilibrium)
任何一種可以產生方案設想預言的策略組合。
也就是可以任何一種導致合理結果的策略組合。

如果用因果關係來說明，均衡是（可以導致合理結果的）因，方案設想是（可以導致合理結果的）分析方法，因果關係的公共知識。
從權衡方面來說：方案設想就是一個權衡。均衡的權衡的結果。

方案設想的假設條件
1. 玩家是理性的
2. 玩家是智力的
3. 公共知識：“玩家是理性的”和“玩家是智力的”是所有玩家的公共知識。
4. 自我執行：方案設想的均衡必須是自我執行的。（每個玩家都會採用一種均衡結果）
方案設想的評估
1. 存在性(Existence: How often does it apply?)
2. 唯一性(Uniqueness: How much does it restrict behavior?)
3. 不變性(Invariance: How sensitive is it to small changes?)
帕累託優勢(pareto dominate)
策略組合s帕累託優勢於策略組合s'，其前提條件：對於每個玩家，在策略組合s中的收益都大於等於在策略組合s‘中的收益，並且至少有一個玩家，在策略組合s中的收益大於在策略組合s‘中的收益。

\[ v_i(s) \geq v_i(s'), \forall i \in N \\ \ v_i(s) > v_i(s'), \exists i \in N \]

參照

Game Theory An Introduction (by Steven Tadelis)
讀書筆記: 博弈論導論 - 01 - 單人決策問題
讀書筆記: 博弈論導論 - 02 - 引入不確定性和時間

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

讀書筆記: 博弈論導論 - 03 - 完整信息的靜態博弈預備知識

讀書筆記: 博弈論導論 - 03 - 完整信息的靜態博弈預備知識

預備知識

知識點

普通形式博弈

2人有限博弈的矩陣表達

方案設想(solution concept)

參照

vue項目獲取富文本編輯器wangEditor內容導出爲word（html轉word格式並下載）

dotnet C# 創建 X11 應用時設置窗口背景顏色

Navicat安裝與激活教程

TDengine docker安裝方法

vue3組件通信與props

sapui5

Alpine Linux apk add DNS lookup error

部分JDK版本的發佈時間

工作中用到的腳本合集

合併代碼時Beyond Compare設置

在 C++ 項目中，通過源碼使用 PaddlePaddle 實現 OCR 功能

Excel Undo-Redo的編程問題

Excel DDE Commands

MySQL 數據庫死鎖排查

Java 響應式編程模式

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結

讀書筆記: 博弈論導論 - 03 - 完整信息的靜態博弈 預備知識

讀書筆記: 博弈論導論 - 03 - 完整信息的靜態博弈 預備知識

預備知識

知識點

普通形式博弈

2人有限博弈的矩陣表達

方案設想(solution concept)

參照

讀書筆記: 博弈論導論 - 03 - 完整信息的靜態博弈預備知識

讀書筆記: 博弈論導論 - 03 - 完整信息的靜態博弈預備知識