小豬躺着大豬跑(博弈論的詭計)

 

公元前529年,晉國在平丘召集天下諸侯,舉行會盟。

 

晉君爲了誇耀自己作爲盟主的實力,用兵車四千乘圍在會場的四周,一眼望去,車馬排布整齊。旌旗搖動,儀仗鮮明。晉君端坐會場中央,看着依次就座的各國使臣,心中禁不住暗暗得意。

 

各國使臣依次坐定以後,鄭國代表子產劈頭就向晉君提出減少會費分攤的問題。他說:“自古以來,繳納給天子的獻款都依照爵位的等級而定,只有京畿地區的諸侯必須繳納超出等級以上的獻款。我們鄭侯的等級是伯男,卻和您一樣,負擔起公侯級的義務,實在太不合理了,務必請減少獻款。近年來,諸侯息兵,致力於修睦邦交,每月都有使團往來交流,光是這些費用就不少,又要分攤這麼重的會費,像我們這般小國實在負擔不起。舉行會盟的目的,無非是爲了維持小國的生存,會費的負擔若使小國滅亡,豈不是有違會盟的宗旨嗎?務請慎重考慮。”

 

這樣的理由提得有理有據,確實也反映了當時鄭國權利與義務不相符的現實。但是晉國擔心其他小國也會提出同樣的要求,因此一口拒絕。然而,子產作爲一名出色的外交家,慣用死纏爛打的交涉手法。他與晉國大夫從中午一直爭論到傍晚,仍然僵持不下,時間都被花在這樁議案上面,而會盟的主旨卻還根本沒有接觸,最後晉君沒辦法,只好接受了子產的這項要求。

 

在上面的故事中,子產用來說明鄭國要減少獻款的理由就是:鄭侯的等級是伯男,卻按公侯的級別承擔義務,這是不合適的。其實他在這裏所運用的理論,用現代人的眼光來看,是一種可以稱爲“智豬博弈’’的博弈策略。

 

假設豬圈裏有兩頭豬同在一個食槽裏進食,一頭大豬,一頭小豬。我們假設它們都是有着認識和實現自身利益的充分理性的“智豬”,豬圈兩頭距離很遠,一頭安裝了一隻控制飼料供應的踏板,另一頭是飼料的出口和食槽。豬每踩一下踏板,另一頭就會有相當於10份的飼料進槽,但是踩踏板以及跑到食槽所需要付出的“勞動”,加起來要消耗相當於2份的飼料。

 

兩頭豬可以選擇的策略有兩個:自己去踩踏板或等待另一頭豬去踩踏板。如果某一頭豬做出自己去踩踏板的選擇,不僅要付出勞動,消耗掉2份飼料,而且由於踏板遠離飼料,它將比另一頭豬後到食槽,從而減少吃到飼料的數量。我們假定:若大豬先到(即小豬踩踏板),大豬將吃到9份的飼料,小豬隻能吃到1份的飼料,最後雙方得益爲【9,-1】;若小豬先到(即大豬踩踏板),大豬和小豬將分別吃到6份和4份的飼料。最後雙方得益爲【4,4】;若兩頭豬同時踩踏板,同時跑向食槽,大豬吃到7份的飼料,小豬吃到3份的飼料,即雙方得益爲【5,1】;若兩頭豬都選擇等待,那就都吃不到飼料,即雙方得益均爲0。

 

智豬博弈的收益矩陣可以用下表所示、表中的數字表示不同選擇下每頭豬所能吃到的飼料數量減去前去踩踏板的成本之後的淨收益水平。

                  大豬行動             大豬等待

小豬行動        5, 1                    9, -1

小豬等待        4, 4                    0, 0

智豬博弈的收益矩陣

 

那麼這個博弈的均衡解是什麼呢?這個博弈的均衡解是大豬選擇去踩踏板,小豬選擇等待,這時,大豬和小豬的淨收益水平均爲4個單位。這是一個“多勞不多得,少勞不少得”的均衡。

 

在找出上述智豬博弈的均衡解時,我們實際上是按照“重複剔除嚴格劣勢策略”的邏輯思路進行的。這一思路可以歸納如下:首先找出某參與人的嚴格劣勢策略,將它剔除,重新構造一個不包括已剔除策略的新博弈;然後,繼續剔除這個新的博弈中某一參與人的嚴格劣勢策略;重複進行這一過程,直到剩下唯一的策略組合爲止。剩下這個唯一的策略組合,就是這個博弈的均衡解,稱爲“重複剔除的佔有策略均衡”。

 

在智豬博弈收益矩陣中可以看出:小豬踩踏板其能得到l份甚至損失1份,不踩踏板反而能得到4份。對小豬而言,無論大豬是否踩動踏板,小豬採取“搭便車”策略,也就是舒舒服服地等在食槽邊,都是最好的選擇。

 

 

                  大豬行動             大豬等待

小豬行動        5, 1                    9, -1

小豬等待        4, 4                    0, 0

剔除後的智豬博弈的收益矩陣

 

 

由於小豬有“等待”這個優勢策略,大豬只剩下了兩個選擇:等待就吃不到;踩踏板得到4份。所以“等待”就變成了大豬的劣勢策略,當大豬知道小豬是不會去踩動踏板的,自己親自去踩踏板總比不踩強,只好爲自己的4份飼料不知疲倦地奔忙於踏板和食槽之間。

 

也就是說,無論大豬選擇什麼策略,選擇踩踏板對小豬都是一個嚴格劣勢策略,我們首先加以剔除。在剔除小豬踩踏板這一選擇後的新博弈中,小豬隻有等待一個選擇,而大豬則有兩個可供選擇的策略。在大豬這兩個可供選擇的策略中,選擇等待是一個嚴格劣勢策略,我們再剔除新博弈中大豬的嚴格劣勢策略等待。剩下的新博弈中只有小豬等待、大豬踩踏板這一個可供選擇的策略,這就是智豬博弈的最後均衡解,達到重複剔除的優勢策略均衡。

 

智豬博弈與囚徒困境的不同之處在於:囚徒困境中的犯罪嫌疑人都有自己的嚴格優勢策略;而智豬博弈中,只有小豬有嚴格優勢策略,而大豬沒有。

 

在一場博弈中,如果每個參與人都有嚴格優勢策略。那麼嚴格優勢策略均衡是合乎邏輯的。但是在絕大多數博弈中。這種嚴格優勢策略均衡並不存在。而只存在重複剔除的優勢策略均衡。所以,智豬博弈聽起來似乎有些滑稽,但是它卻是一個根據優勢策略的邏輯找出均衡的博弈模型。

 

智豬博弈模型可以用來解釋爲什麼佔有更多資源者,比如本章開頭的故事中的晉國,必須承擔更多的義務。這樣的現象在當代國際和國內政治生活中都十分普遍。

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章