讀書筆記: 博弈論導論 - 17 - 不完整信息的動態博弈 建立信譽

讀書筆記: 博弈論導論 - 17 - 不完整信息的動態博弈 建立信譽

建立信譽(Building a Reputation)

本文是Game Theory An Introduction (by Steven Tadelis) 的學習筆記。

爲什麼我們要建立良好的信譽?爲什麼我們更願意和有信譽的人交往?
本章從囚徒困境這個問題,證明了即使在2階段的囚徒困境中,如果一方有可能選擇合作(也就是沉默),另一個方在第一階段也有可能選擇合作。
讓我們回憶一下囚徒困境。
囚徒困境的均衡是雙方都告密。
在有限多階段的囚徒困境中的均衡仍然是雙方都告密。
在無限多階段的囚徒困境中的均衡是雙方合作沉默。

本章給出了一個囚徒困境的例子,在這個例子中,存在一個不完整信息,就是玩家1有兩種類型:
1) 標準策略類型; 2) grim-trigger 策略類型。
這個grim-trigger 策略是:在第一個階段博弈中,選擇合作(C),在一個t > 1階段中,選擇合作(C)僅僅當玩家2在上一個階段中選擇合作(c)。
\(p > 0\)爲自然選擇玩家1是grim-trigger 策略類型的可能性。

Player 2
c d
player 1 C 1, 1 -1, 2
D 2, -1 0, 0

玩家2使用標準策略,因此在第2階段會選擇叛變(defect)。
但是在第1階段中選擇合作和叛變,其收益分別爲:
\[ \text{choose c in period 1} \\ v_{2a} = p(1) + (1 - p)(-1) + p(2) = 4p - 1 \\ \text{choose d in period 1} \\ v_{2b} = p(2) + (1 - p)(0) + p(0) = 2p \]

結論 17.1

在兩階段中,當\(p > \frac{1}{2}\)時,玩家2會選擇合作。

結論 17.2

在3階段的這個囚徒困境博弈中,玩家1和玩家2在第一階段都會選擇合作。

推論 17.1

在T階段的這個囚徒困境博弈中,T是一個大的值。玩家1和玩家2選擇叛變的階段數被一個常量M限制。而M與p有關,與T無關。

參照

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章