博弈論學習總結(一)

   上個星期五,聽了一節博弈論入門講座,雖然只是簡單介紹了博弈論的一些基本概念和常見用例,不過激起了我濃厚的興趣,所以就想着找點資料學習學習。最後發現耶魯大學有博弈論公開課,24節,興奮了好久,現在在一集集學習中。今天看了第一集,因爲專業性的概念比較多,我又有經常性的健忘症,所以就想做個學習總結,以後回憶起來也方便。其實很早以前就聽說過博弈論,不過一直不知道它是什麼,應用在什麼方面,只想着是一門高深的學問,自己在這方面也沒多大興趣,也就提不起興致了。這次是個很偶然的機會,在一個好的主講人的指導下,接觸了這門絕對是經典的課程,學習的慾望也就被激發了。要知道博弈論已經成爲經濟學的標準分析工具之一。目前在生物學、經濟學、國際關係、計算機、軍事戰略和其他很多學科都有廣泛的應用。

   博弈論到底是什麼呢?專業性的解釋:博弈論是研究相互影響的決策主體的理性決策行爲,以及這些決策的均衡結果的理論。通俗一點來說,博弈論實際上是多人在平等的對局中各自利用別人的策略變換自己的對抗策略,達到取勝的目的。也就是大家一起來玩心理戰,看看誰是最後贏家。

  博弈論中,有三大基本要素:①players②strategies③payoff。首先既然是玩一場博弈遊戲,那肯定要有參加者,在遊戲中,我們需要對參加者做一定架設,才能使分析得到的博弈結果更加理性化。(1)players所在乎的都轉化爲payoff來衡量(2)players完全瞭解博弈的結構(3)players都是完全理性的。只有players滿足以上三個條件,我們的game才能夠繼續進行。其次是策略,一個局中,任意參加者的一個可行的自始至終全局籌劃的一個行動方案,稱爲這個局中參加者的一個策略。如果在一個博弈中局中參加者總共有有限個策略,則稱爲“有限博弈”,否則稱爲“無限博弈”。最後是收益,一局博弈結局時的結果稱爲得失。而整場遊戲結束,我們就是通過每個參賽者的最後收益,來判斷贏家輸家。

  介紹完博弈論的基本概念,我們還要了解一些專業名詞。(以下我們都以兩人博弈爲前提,參加者分別是player1和player2,他們都有自己相應的策略選擇,並且雙方選擇的策略不同,將導致最終兩人所獲取的payoff不同)

  ①最佳迴應:針對player2的策略T,可以使得player1得到的payoff達到最大的策略,就稱爲player1對player2策略T的最佳迴應。

  ②嚴格最佳迴應:針對player2的策略T,如果player1只有一個最佳迴應,那麼就稱爲嚴格最佳迴應。

  ③佔優策略:不管player 2採取何種策略,player 1的最佳迴應可以是同一個策略,稱這樣的策略爲player 1的佔優策略。

  ④嚴格佔優策略:如果player 1(或player 2)的佔優策略只有一個,那麼佔優策略也稱爲嚴格佔優策略。

在博弈論中,有一個很出名的例子,在課上,也有提到,就是囚徒困境。下面以這個例子作爲典型,更好理解這些概念。

警方逮捕甲、乙兩名嫌疑犯,但沒有足夠證據指控二人入罪。於是警方分開囚禁嫌疑犯,分別和二人見面,並向雙方提供以下相同的選擇:

若一人認罪並作證檢舉對方(相關術語稱“背叛”對方),而對方保持沉默,此人將即時獲釋,沉默者將判監10年。 
若二人都保持沉默(相關術語稱互相“合作”),則二人同樣判監半年。 
若二人都互相檢舉(互相“背叛”),則二人同樣判監2年。 
用表格概述如下: 

  甲不坦白 甲坦白
乙不坦白 (-1,-1) (-10,0)
乙坦白 (0,-10) (-4,-4)
囚徒困境假定每個參與者(即“囚徒”)都是利己的,即都尋求最大自身利益,而不關心另一參與者的利益。

現在我們來分析一下這個表格,當甲選擇“不坦白”的時候,乙選擇“不坦白”,被關1年,選擇“坦白”,被立即釋放,所以對於甲的“不坦白”策略,乙的最佳迴應策略是“坦白”。

同時因爲乙只有一個最佳迴應策略,所以這個策略也是嚴格最佳迴應。

而無論甲選擇什麼策略,乙的最佳迴應策略都是“坦白”,所以“坦白”就是乙的佔優策略,同時因爲只有一個策略,它也是嚴格佔優策略。

       針對上述表格,對甲可以做出相同的分析,“坦白”也是甲的嚴格佔優策略,當存在嚴格佔優策略時,又有假設參加者是理性的,自私的,只爲最大化自己的利益,這樣雙方都會絕對選取自己的嚴格佔優策略,而博弈的結果最終就會是兩人都因“坦白”而被關四年。對於有嚴格佔優策略的game,結局是很好分析的。

  介紹完了專業術語,來總結一下每節課學到的主要原理吧。

  第一課:①Do not play a strictly dominated strategy.不要選擇一個嚴格的劣勢策略。嚴格的劣勢策略是和嚴格佔優策略相對應的,指的是不論對方採取什麼策略,採取的這個策略比採取其它策略中的任意一個策略得到的payoff更差的策略。

                ②put yourself in others's shoes and try firgure out what they're going to do.把自己放在對手的位置上,考慮他們會怎麼做,也就是俗話說的換位思考。

              其實這只是博弈論的一個入門,瞭解一些簡單的概念知識。既不深奧,也不晦澀,但是要能靈活應用它們,真的是很困難的一件事哦!

             最後,說說自己特別感興趣的一個game吧。遊戲前提大致是,你身處一個大班級中,班級中的每一個人都是game的參加者。遊戲規則是每個人在1~100中選擇一個數字寫在紙條上上交,不讓其它人知道,最後會計算所有人選擇數字的平均值。誰選擇的數字最接近 平均值的2/3,誰就是最後贏家,如果假設參加者符合上述players的三個假設,請問你會選哪個數字?要是不符合那三個假設,你又會做何選擇?(ps:現實情況中,肯定是後面一種情況比較常見的,但是我覺得後面一種情況要猜對,還有點運氣成分咯! 

           


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章