讀書筆記: 博弈論導論 - 04 - 完整信息的靜態博弈理性和公共知識

原創

SNYang

2018-12-03 13:45

讀書筆記: 博弈論導論 - 04 - 完整信息的靜態博弈理性和公共知識

理性和公共知識

本文是Game Theory An Introduction (by Steven Tadelis) 的學習筆記。

純策略中的優勢(dominance)

數學表達: 除了玩家i以外所有玩家的策略集合

\[ S \equiv S_1 \times S_2 \times \cdots S_n \\ S_{-i} \equiv S_1 \times S_2 \times \cdots \times S_{i-1} \times S_{i+1} \times \cdots S_n \\ s = (s_1, s_2, \cdots, s_n) \\ s_{-i} = (s_1, s_2, \cdots, s_{i-1}, s_{i+1}, \cdots, s_n) \\ s = (s_i, s_{-i}) \]
\(S\): 所有人的所有策略組合。
\(S_{-i}\): 除了玩家\(i\)以外，所有人的所有策略組合。
\(s\): 所有人的一種策略組合。
\(s_{-i}\): 除了玩家\(i\)以外，所有人的一種策略組合。
引進\(S_{-i}\)和\(s_{-i}\)是爲了

通過看玩家i以外的所有玩家的策略，來考慮玩家i的策略。
或者專門看玩家i策略。

劣勢（被支配）策略(Dominated Strategies)

定義 4.1：嚴格劣勢於
對於玩家i，策略\(s'_i\)嚴格劣勢於\(s_i\)，則：

\[ v_i(s'_i, s_{-i}) < v(s_i, s_{-i}), \forall s_{-i} \in S_{-i} \]

斷言 4.1

一個理性玩家不會選擇一個嚴格劣勢策略。

優勢策略(Dominant Strategies)

定義 4.2：嚴格優勢策略(strictly dominant strategy)
策略\(s_i \in S_i\)是一個嚴格優勢策略，如果玩家i的任何其它策略都嚴格劣勢於\(s_i\)。

\[ v_i(s_i, s_{-i}) > v(s'_i, s_{-i}), \forall s'_i \in S_i, s'_i \neq s_i, and \ \forall s_{-i} \in S_{-i} \]

定義 4.3：嚴格優勢策略均衡(strictly dominant strategy equilibrium)
策略組合\(s^D \in S_i\)是一個嚴格優勢策略均衡，如果其中每一個玩家i的策略都是嚴格優勢策略。

\[ s_i \equiv s_i^D, \forall i \in N \]

推論 4.1

如果博弈\(\Gamma = (N, \{ S_i \}_{i=1}^{N},\{ v_i \}_{i=1}^{N})\)有一個嚴格優勢策略均衡\(s^D\)，則\(s^D\)是唯一的嚴格優勢策略均衡。

斷言 4.2

如果有的話，玩家一定會選擇優勢策略。

策略，策略集合，策略組合和策略均衡

策略(strategy)
\(s_i\)是玩家的一個策略。
策略集合(strategy set)
\(S_i\)是玩家的所有策略集合。\(s_i \in S_i\)
\(S\)是所有玩家的所有策略的組合的集合。
策略組合(strategy profile)
\(s\)是N個玩家的一種策略組合。\(s = (s_1, s_2, \cdots, s_n), s \in S\)
策略均衡(strategy equilibrium)
\(s\)是任何一種導致合理結果的策略組合。

方法：嚴格劣勢策略的迭代消除

博弈論方法就是一個尋找均衡的過程。
方法名：IESDS(Iterated Elimination of Strictly Dominated Strategies)
基本邏輯：

一個理性玩家不會選擇一個嚴格劣勢策略。
如果有的話，玩家一定會選擇優勢策略。
過程：略

迭代消除均衡(Iterated elimination equilibrium)
嚴格劣勢策略的迭代消除(IESDS)過程中倖存下來的博弈組合\(s^{ES}\)。

推論 4.2

如果博弈\(\Gamma = (N, \{ S_i \}_{i=1}^{N},\{ v_i \}_{i=1}^{N})\)，\(s^*\)是一個嚴格優勢策略均衡，則\(S^*\)是唯一的嚴格劣勢策略的迭代消除(IESDS)均衡。

信念(Beliefs)，最佳響應(Best Response)和可合理化(Rationalizability)

在已經學習的兩個方法嚴格優勢策略和嚴格劣勢策略的迭代消除(IESDS)之外的情況下，如果玩家i的一個策略\(s_i\)不是一個嚴格劣勢策略，那就意味着在一定條件下（對手的某些策略下），策略\(s_i\)是一個合理的響應。

最佳響應(best response)
玩家i的策略\(s_i \in S_i\)是對手策略\(s_{-i} \in S_{-i}\)的最佳響應，則:
\[ v_i(s_i, s_{-i}) \geq v_i(s'_i, s_{-i}), \forall s'_i \in S_i \]
信念(belief)
一個玩家i的信念就是一個他對手們的可能策略組合\(s_{-i} \in S_{-i}\)。
最佳響應對應(best-response correspondence)
最佳響應對應\(BR_i(s_{-i})\)，是玩家i，在他的對手們的策略組合\(s_{-i}\)上的所有可能最佳響應的集合。
\(BR_i(s_{-i})\)可以認爲是一個函數，其結果是一個集合。
不是一個最佳響應(never a best response)
玩家i，對於他的對手們的策略組合\(s_{-i}\)的最佳響應集合\(BR_i(s_{-i})\)，如果\(s_{-i}\)不是在信任集合裏，則\(s_i \in BR_i(s_{-i})\)都不是最佳響應。

總結

方法

嚴格優勢策略
嚴格劣勢策略的迭代消除(IESDS)
去掉不可信的策略組合（或者保留可信的策略組合）。

推論 4.1

如果博弈\(\Gamma = (N, \{ S_i \}_{i=1}^{N},\{ v_i \}_{i=1}^{N})\)有一個嚴格優勢策略均衡\(s^D\)，則\(s^D\)是唯一的嚴格優勢策略均衡。

推論 4.2

如果博弈\(\Gamma = (N, \{ S_i \}_{i=1}^{N},\{ v_i \}_{i=1}^{N})\)，\(s^*\)是一個嚴格優勢策略博弈，則\(S^*\)是唯一的嚴格劣勢策略的迭代消除(IESDS)均衡。

推論 4.3

對於玩家i，一個嚴格劣勢策略\(s_i\)，不可能是任何\(s_{-i} \in S_{-i}\)的最佳響應。

推論 4.4

在一個有限普通形式的博弈中，\(s^*\)是一個嚴格優勢策略，或者是一個唯一的嚴格劣勢策略的迭代消除(IESDS)均衡，
則s_i^*是一個對於任何\(s_{-i} \in S_{-i}\)的最佳響應。

斷言 4.1

一個理性玩家不會選擇一個嚴格劣勢策略。

斷言

如果有的話，玩家一定會選擇優勢策略。

斷言 4.2

一個理性玩家，在認爲他的對手選擇策略\(s_{-i} \in S_{-i}\)時，總會選擇\(s_{-i}\)的最想響應。

斷言

一個理性玩家只會選擇(他對手們的策略組合的)最佳響應。

參照

Game Theory An Introduction (by Steven Tadelis)
讀書筆記: 博弈論導論 - 01 - 單人決策問題
讀書筆記: 博弈論導論 - 02 - 引入不確定性和時間
讀書筆記: 博弈論導論 - 03 - 完整信息的靜態博弈預備知識

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

讀書筆記: 博弈論導論 - 04 - 完整信息的靜態博弈理性和公共知識

讀書筆記: 博弈論導論 - 04 - 完整信息的靜態博弈理性和公共知識

理性和公共知識

純策略中的優勢(dominance)

劣勢（被支配）策略(Dominated Strategies)

優勢策略(Dominant Strategies)

策略，策略集合，策略組合和策略均衡

方法：嚴格劣勢策略的迭代消除

信念(Beliefs)，最佳響應(Best Response)和可合理化(Rationalizability)

總結

參照

再談23種設計模式（3）：行爲型模式（學習筆記）

Power Automate Desktop 安裝完，登錄後老是提示one driver 錯誤

微前端學習筆記(4):從微前端到微模塊之EMP與hel-micro方案探索

微前端學習筆記（1）：微前端總體架構概述，從微服務發微

985 碩士程序員，空窗 4 個月沒有 Offer！

一文搞懂 Spring 循環依賴

賽博鬥地主——使用大語言模型扮演Agent智能體玩牌類遊戲。

VScode右鍵打開(添加到右鍵)

記一次 .NET某工控視覺自動化系統卡死分析

WindowsServer--SQL Server搭建主從同步實現讀寫分離 - 事務性分發

在 C++ 項目中，通過源碼使用 PaddlePaddle 實現 OCR 功能

Excel Undo-Redo的編程問題

Excel DDE Commands

MySQL 數據庫死鎖排查

Java 響應式編程模式

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結

讀書筆記: 博弈論導論 - 04 - 完整信息的靜態博弈 理性和公共知識

讀書筆記: 博弈論導論 - 04 - 完整信息的靜態博弈 理性和公共知識

理性和公共知識

純策略中的優勢(dominance)

劣勢（被支配）策略(Dominated Strategies)

優勢策略(Dominant Strategies)

策略，策略集合，策略組合和策略均衡

方法：嚴格劣勢策略的迭代消除

信念(Beliefs)，最佳響應(Best Response)和可合理化(Rationalizability)

總結

參照

讀書筆記: 博弈論導論 - 04 - 完整信息的靜態博弈理性和公共知識

讀書筆記: 博弈論導論 - 04 - 完整信息的靜態博弈理性和公共知識