## 博弈論筆記

博弈論筆記

西方倫理學把人類的道德準則分爲四金律、銀律、銅律和鐵律。
金律(Golden Rule),可以稱爲“作爲者”的行爲準則,其內容是:“你要別人怎樣對待你,你就怎樣對待別人。”也就是孔子所說的“己欲立而立人,己欲達而達 人”。 銀律(Silver Rule),可以稱爲“退讓者”的行爲準則,也就是孔子所說的“己所不欲,勿施於人”。 銅律(Bronze Rule),可以稱爲“報復者”的行爲準則,其內容是:“別人怎樣對待你,你就怎樣對待別人。” 鐵律(Iron Rule),可以稱爲“進攻者”的行爲準則,其內容是:“在別人進攻你之前,首先進攻別人。”
第5章 一報還一報 出來混遲早要還的
但是,在並不完美的現實世界,一報還一報,並不是最適合的策略,因爲現實世界存在誤差,而這個時候,一報還一報,會導致更大的傷害。爲了改變,所以有了再一再二不再三這句話。適當的寬容,帶來的是更大的信任,更大的利益,但是過度的信任,只是一個傻子。

  1. 公共資源,往往是最快損壞的,因爲是不需要珍惜的。
    2.博弈論裏面有一句話一加一未必等於二,其實很簡單的道理,每一步都是比上一步操作更優,但是並不一定會接近最初的目標,更大的可能偏離目標。
    類似於貪心算法,過橋問題
    問題如下:
      在漆黑的夜裏,甲乙丙丁共四位旅行者來到了一座狹窄而且沒有護欄的橋邊。如果不借助手電筒的話,大家是無論如何也不敢過橋的。不幸的是,四個人一共只帶了一隻手電筒,而橋窄得只夠讓兩個人同時過。如果各自單獨過橋的話,四人所需要的時間分別是1、2、5、8分鐘;而如果兩人同時過橋,所需要的時間就是走得比較慢的那個人單獨行動時所需的時間。問題:如何設計一個方案,讓這四人儘快過橋。

答案如下
  兩人過橋後,需要把手電筒送回,最容易想到的是讓最快的人擔任來回送電筒。因此,第一種辦法:先讓甲乙過去(2分鐘),甲回來(1分鐘),甲丙過去(5分鐘),甲回來(1分鐘),甲丁再過去(8分鐘),總共需要17分鐘就可以讓四個人都過去。

而正確答案是第二種辦法:先讓甲乙過去(2分鐘),甲回來(1分鐘),丙丁過去(8分鐘),乙回來(2分鐘),甲乙再過去(2分鐘),總共需要15分鐘就可以讓四個人都過去。這種方法的關鍵點,讓兩個最慢的人同時過橋

大學者錢鍾書說過這樣一句意味深長的話:要想把哪個東西搞壞,不要罵它、不要臭它,而是讓它無限制地繁殖氾濫,結果它自然就名聲掃地了。
3.在程序員的數學——概率統計中,假如在一個遊戲節目裏,主持人指出標有1、2、3的三扇門給你,而且明確告訴你,其中兩扇門背後是山羊,另一扇門後有名牌轎車。你要從三扇門裏選擇一扇,並可以獲得所選門後的獎。既然是三選一,很清楚 ,選中汽車的機會就是1/3。 在沒有任何信息幫助的情況下,你選了一扇(比如1號門)。但主持人並沒有立刻打開1號門,而是打開了3號門,門後出現的是一隻羊。這時,主持人問你是否要改變主意選2號門。 現在你就面臨一個策略問題了:改還是不改?而,這時候應該理所當然的更改,因爲就算1號門有車子,也只是二分之一的概率,改變並不會失去什麼,按照普通人的思維來說。但是,按理說,主持人並不會打開有車子的在這種可能性下,如果車子在1號門後面,他就可以隨便開2號門或3號門。如果車子沒有在1號門後面,那麼他所開的一定是沒有車子的那扇門,開3號門相當於告訴你車子在2號門的後面,因此2號門就有2/3的機會。在這種情況下,那你就應該趕快換。雖然換選未必保證你一定會獲勝,但還是使獲勝機會加倍了。
推理由因到果是很脆弱的,因爲其中的可能由性太多,每一個可能性都會導致失敗,不如試試倒推法。
但是倒推法也有本身的缺陷,比如最著名的蜈蚣博弈,就是倒推法的實例。
以下內容來自百度百科
“蜈蚣博弈”是指這樣一個博弈:兩個博弈方A、B輪流進行策略選擇,可供選擇的策略有“合作”和“不合作”兩種。他們的博弈展開式如下:
A —— B —— A ——…… A —— B —— A —— B —— (10,10)
| * * * * | * * * | * * * * * * | * * * *| * * * * | * * * |
(1,1) * (0,3) * (2,2) * * * (8,8) * (7,10) * (9,9) * (8,11)
在圖中,博弈從左到右進行,橫向連桿代表合作策略,向下的連桿代表不合作策略。每個人下面對應的括號代表相應的人採取不合作策略,博弈結束後,各自的收益,括號內左邊的數字代表A的收益,右邊代表B的收益。如果一開始A就選擇了不合作,則兩人各得1的收益,而A如果選擇合作,則輪到B選擇,B如果選擇不合作,則A收益爲0,B的收益爲3,如果B選擇合作,則博弈繼續進行下去。
可以看到每次合作後總收益在不斷增加,合作每繼續一次總收益增加1,如第一個括號中總收益爲1+1=2,第二個括號爲0+3=3,第二個括號則爲2+2=4。這樣一直下去,直到最後兩人都得到10的收益,總體效益最大。遺憾的是這個圓滿結局很難達到!
大家注意,在上圖中最後一步由B選擇時,B選擇合作的收益爲10,選擇不合作的收益爲11。根據理性人假設,B將選擇不合作,而這時A的收益僅爲8。A考慮到B在最後一步將選擇不合作,因此他在前一步將選擇不合作,因爲這樣他的收益爲9,比8高。B也考慮到了這一點,所以他也要搶先A一步採取不合作策略……如此推論下去,最後的結論是:在第一步A將選擇不合作,此時各自的收益爲1!這個結論是令人悲傷的。
不難看出,在該博弈的推理過程中,運用的是逆推法。從邏輯推理來看,逆推法是嚴密的,但結論是不合理的。因爲一開始就停止的策略A、B均只能獲取1,而採取合作性策略有可能均獲取10,當然A一開始採取合作性策略有可能獲得0,但1或者0與10相比實在是很小。直覺告訴我們採取“合作”策略是好的。而從邏輯的角度看,A一開始應選擇“不合作”的策略。人們在博弈中的真實行動“偏離”了運用逆推法關於博弈的理論預測,造成二者間的矛盾和不一致,這就是蜈蚣博弈的悖論。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章