讀書筆記: 博弈論導論 - 04 - 完整信息的靜態博弈 理性和公共知識

讀書筆記: 博弈論導論 - 04 - 完整信息的靜態博弈 理性和公共知識

理性和公共知識

本文是Game Theory An Introduction (by Steven Tadelis) 的學習筆記。

純策略中的優勢(dominance)

  • 數學表達: 除了玩家i以外所有玩家的策略集合

\[ S \equiv S_1 \times S_2 \times \cdots S_n \\ S_{-i} \equiv S_1 \times S_2 \times \cdots \times S_{i-1} \times S_{i+1} \times \cdots S_n \\ s = (s_1, s_2, \cdots, s_n) \\ s_{-i} = (s_1, s_2, \cdots, s_{i-1}, s_{i+1}, \cdots, s_n) \\ s = (s_i, s_{-i}) \]
\(S\): 所有人的所有策略組合。
\(S_{-i}\): 除了玩家\(i\)以外,所有人的所有策略組合。
\(s\): 所有人的一種策略組合。
\(s_{-i}\): 除了玩家\(i\)以外,所有人的一種策略組合。
引進\(S_{-i}\)\(s_{-i}\)是爲了

  1. 通過看玩家i以外的所有玩家的策略,來考慮玩家i的策略。
  2. 或者專門看玩家i策略。

劣勢(被支配)策略(Dominated Strategies)

  • 定義 4.1:嚴格劣勢於
    對於玩家i,策略\(s'_i\)嚴格劣勢於\(s_i\),則:

\[ v_i(s'_i, s_{-i}) < v(s_i, s_{-i}), \forall s_{-i} \in S_{-i} \]

斷言 4.1

一個理性玩家不會選擇一個嚴格劣勢策略。

優勢策略(Dominant Strategies)

  • 定義 4.2: 嚴格優勢策略(strictly dominant strategy)
    策略\(s_i \in S_i\)是一個嚴格優勢策略,如果玩家i的任何其它策略都嚴格劣勢於\(s_i\)

\[ v_i(s_i, s_{-i}) > v(s'_i, s_{-i}), \forall s'_i \in S_i, s'_i \neq s_i, and \ \forall s_{-i} \in S_{-i} \]

  • 定義 4.3: 嚴格優勢策略均衡(strictly dominant strategy equilibrium)
    策略組合\(s^D \in S_i\)是一個嚴格優勢策略均衡,如果其中每一個玩家i的策略都是嚴格優勢策略。

\[ s_i \equiv s_i^D, \forall i \in N \]

推論 4.1

如果博弈\(\Gamma = (N, \{ S_i \}_{i=1}^{N},\{ v_i \}_{i=1}^{N})\)有一個嚴格優勢策略均衡\(s^D\),則\(s^D\)是唯一的嚴格優勢策略均衡。

斷言 4.2

如果有的話,玩家一定會選擇優勢策略。

策略,策略集合,策略組合和策略均衡

  • 策略(strategy)
    \(s_i\)是玩家的一個策略。

  • 策略集合(strategy set)
    \(S_i\)是玩家的所有策略集合。\(s_i \in S_i\)
    \(S\)是所有玩家的所有策略的組合的集合。

  • 策略組合(strategy profile)
    \(s\)是N個玩家的一種策略組合。\(s = (s_1, s_2, \cdots, s_n), s \in S\)

  • 策略均衡(strategy equilibrium)
    \(s\)是任何一種導致合理結果的策略組合。

方法:嚴格劣勢策略的迭代消除

博弈論方法就是一個尋找均衡的過程。
方法名:IESDS(Iterated Elimination of Strictly Dominated Strategies)
基本邏輯:

一個理性玩家不會選擇一個嚴格劣勢策略。
如果有的話,玩家一定會選擇優勢策略。
過程:略

  • 迭代消除均衡(Iterated elimination equilibrium)
    嚴格劣勢策略的迭代消除(IESDS)過程中倖存下來的博弈組合\(s^{ES}\)

推論 4.2

如果博弈\(\Gamma = (N, \{ S_i \}_{i=1}^{N},\{ v_i \}_{i=1}^{N})\)\(s^*\)是一個嚴格優勢策略均衡,則\(S^*\)是唯一的嚴格劣勢策略的迭代消除(IESDS)均衡。

信念(Beliefs),最佳響應(Best Response)和可合理化(Rationalizability)

在已經學習的兩個方法嚴格優勢策略和嚴格劣勢策略的迭代消除(IESDS)之外的情況下,如果玩家i的一個策略\(s_i\)不是一個嚴格劣勢策略,那就意味着在一定條件下(對手的某些策略下),策略\(s_i\)是一個合理的響應。

  • 最佳響應(best response)
    玩家i的策略\(s_i \in S_i\)是對手策略\(s_{-i} \in S_{-i}\)的最佳響應,則:
    \[ v_i(s_i, s_{-i}) \geq v_i(s'_i, s_{-i}), \forall s'_i \in S_i \]

  • 信念(belief)
    一個玩家i的信念就是一個他對手們的可能策略組合\(s_{-i} \in S_{-i}\)

  • 最佳響應對應(best-response correspondence)
    最佳響應對應\(BR_i(s_{-i})\),是玩家i,在他的對手們的策略組合\(s_{-i}\)上的所有可能最佳響應的集合。
    \(BR_i(s_{-i})\)可以認爲是一個函數,其結果是一個集合。

  • 不是一個最佳響應(never a best response)
    玩家i,對於他的對手們的策略組合\(s_{-i}\)的最佳響應集合\(BR_i(s_{-i})\),如果\(s_{-i}\)不是在信任集合裏,則\(s_i \in BR_i(s_{-i})\)都不是最佳響應。

總結

方法

  • 嚴格優勢策略
  • 嚴格劣勢策略的迭代消除(IESDS)
  • 去掉不可信的策略組合(或者保留可信的策略組合)。

推論 4.1

如果博弈\(\Gamma = (N, \{ S_i \}_{i=1}^{N},\{ v_i \}_{i=1}^{N})\)有一個嚴格優勢策略均衡\(s^D\),則\(s^D\)是唯一的嚴格優勢策略均衡。

推論 4.2

如果博弈\(\Gamma = (N, \{ S_i \}_{i=1}^{N},\{ v_i \}_{i=1}^{N})\)\(s^*\)是一個嚴格優勢策略博弈,則\(S^*\)是唯一的嚴格劣勢策略的迭代消除(IESDS)均衡。

推論 4.3

對於玩家i,一個嚴格劣勢策略\(s_i\),不可能是任何\(s_{-i} \in S_{-i}\)的最佳響應。

推論 4.4

在一個有限普通形式的博弈中,\(s^*\)是一個嚴格優勢策略,或者是一個唯一的嚴格劣勢策略的迭代消除(IESDS)均衡,
則s_i^*是一個對於任何\(s_{-i} \in S_{-i}\)的最佳響應。

斷言 4.1

一個理性玩家不會選擇一個嚴格劣勢策略。

斷言

如果有的話,玩家一定會選擇優勢策略。

斷言 4.2

一個理性玩家,在認爲他的對手選擇策略\(s_{-i} \in S_{-i}\)時,總會選擇\(s_{-i}\)的最想響應。

斷言

一個理性玩家只會選擇(他對手們的策略組合的)最佳響應。

參照

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章