讀書筆記: 博弈論導論 - 17 - 不完整信息的動態博弈建立信譽

建立信譽(Building a Reputation)

本文是Game Theory An Introduction (by Steven Tadelis) 的學習筆記。

爲什麼我們要建立良好的信譽？爲什麼我們更願意和有信譽的人交往？
本章從囚徒困境這個問題，證明了即使在2階段的囚徒困境中，如果一方有可能選擇合作（也就是沉默），另一個方在第一階段也有可能選擇合作。
讓我們回憶一下囚徒困境。
囚徒困境的均衡是雙方都告密。
在有限多階段的囚徒困境中的均衡仍然是雙方都告密。
在無限多階段的囚徒困境中的均衡是雙方合作沉默。

本章給出了一個囚徒困境的例子，在這個例子中，存在一個不完整信息，就是玩家1有兩種類型：
1) 標準策略類型; 2) grim-trigger 策略類型。
這個grim-trigger 策略是：在第一個階段博弈中，選擇合作(C)，在一個t > 1階段中，選擇合作(C)僅僅當玩家2在上一個階段中選擇合作(c)。
\(p > 0\)爲自然選擇玩家1是grim-trigger 策略類型的可能性。

		Player 2
		c	d
player 1	C	1, 1	-1, 2
	D	2, -1	0, 0

玩家2使用標準策略，因此在第2階段會選擇叛變(defect)。
但是在第1階段中選擇合作和叛變，其收益分別爲:
\[ \text{choose c in period 1} \\ v_{2a} = p(1) + (1 - p)(-1) + p(2) = 4p - 1 \\ \text{choose d in period 1} \\ v_{2b} = p(2) + (1 - p)(0) + p(0) = 2p \]

結論 17.1

在兩階段中，當\(p > \frac{1}{2}\)時，玩家2會選擇合作。

結論 17.2

在3階段的這個囚徒困境博弈中，玩家1和玩家2在第一階段都會選擇合作。

推論 17.1

在T階段的這個囚徒困境博弈中，T是一個大的值。玩家1和玩家2選擇叛變的階段數被一個常量M限制。而M與p有關，與T無關。

讀書筆記: 博弈論導論 - 17 - 不完整信息的動態博弈建立信譽

讀書筆記: 博弈論導論 - 17 - 不完整信息的動態博弈建立信譽

建立信譽(Building a Reputation)

參照

釘釘打卡速度慢

Nginx R31 doc 官方文檔-01-nginx 如何安裝

Qt/C++音視頻開發74-合併標籤圖形/生成yolo運算結果圖形/文字和圖形合併成一個/水印濾鏡

挑戰程序設計競賽 2.2章習題 POJ - 3617 Best Cow Line 貪心

字節面試：MySQL什麼時候鎖表？如何防止鎖表？

.NET8連接SQL SERVER 2008 R2 報：證書鏈是由不受信任的頒發機構頒發的

golang開發環境搭建(win10)

python計算機視覺學習筆記——PIL庫的用法

Golang初學：獲取程序內存使用情況，std runtime

在 C++ 項目中，通過源碼使用 PaddlePaddle 實現 OCR 功能

Excel Undo-Redo的編程問題

Excel DDE Commands

MySQL 數據庫死鎖排查

Java 響應式編程模式

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結

讀書筆記: 博弈論導論 - 17 - 不完整信息的動態博弈 建立信譽

讀書筆記: 博弈論導論 - 17 - 不完整信息的動態博弈 建立信譽

建立信譽(Building a Reputation)

參照

讀書筆記: 博弈論導論 - 17 - 不完整信息的動態博弈建立信譽

讀書筆記: 博弈論導論 - 17 - 不完整信息的動態博弈建立信譽