讀書筆記: 博弈論導論 - 08 - 完整信息的動態博弈 可信性和序貫理性
可信性和序貫理性(Credibility and Sequential Rationality)
本文是Game Theory An Introduction (by Steven Tadelis) 的學習筆記。
序貫理性和逆向歸納法(Sequential Rationality and Backward Induction)
序貫理性(Sequential Rationality)
序貫理性是一個原則:在博弈樹的每一個信息集上,玩家總是使用最佳策略。
這意味着,無論是否在均衡路徑上,博弈次序的每個階段,玩家都是在做理智的選擇。序貫理性(Sequential Rationality)
給定玩家i對手的策略組合\(\sigma_{-i} \in \Delta S_{-i}\),玩家策略\(\sigma_i\)是序貫理性的,
當且僅當玩家i在每個信息集上,總是選擇\(\sigma_{-i}\)最佳響應。
方法 - 逆向歸納法解:
從末端節點開始,在上一層的每個節點的收益組合爲節點玩家的(子節點的)最佳收益組合。
以此類推,直到根節點。根節點上的收益組合(可能是多個)的博弈路徑爲逆向歸納法解。
推論8.1 (Zermelo's Theorem)
任何有限完美信息博弈都有一個逆向歸納法解,而且是順序合理的。
此外,如果沒有兩個末端節點有(對每個玩家)相同的收益,則逆向歸納法解是唯一的。
推論
任何有限完美信息博弈至少有一個順序合理的純策略形式的納什均衡。
此外,如果沒有兩個末端節點有(對每個玩家)相同的收益,則有唯一的順序合理的納什均衡。
適當的子博弈(proper subgame)
博弈\(\Gamma\)的一個適當子博弈\(G\)只包含一個節點和它所有子孫節點,並具有性質:
如果\(s \in G\)並且\(x' \in h(x)\),則\(x' \in G\) - 屬於子博弈\(G\)的節點,這個節點的信息集包含的所有節點都屬於這個子博弈\(G\)。子博弈精煉均衡(subgame-perfect (Nash) equilibrium)
在一個擴展形式博弈\(\Gamma\)中,如果對於每一個子博弈\(G\),\(\sigma^*\)都是\(G\)中的納什均衡,則行爲策略組合\(\sigma^* = (\sigma_1^*, \cdots, \sigma_n^*)\)是一個子博弈精煉均衡。
事實
對於任何有限完美信息博弈,子博弈精煉納什均衡的集合和逆向歸納法的納什均衡的集合是一致的。