四問博弈論——爲什麼非要跟風作死?

最近看到一些文章用博弈論的觀點解釋大家跟風作死的現象,如:孩子的作業越來越多,同學和同事之間互相攀比,工作中的痕跡主義越來越重以及國家之間的軍備競賽等等。最終,他們希望第三方加強監管,或者制訂一種各方面都不願意違背的規則,好讓大家解脫出來。

筆者打算簡單梳理一下博弈論解決問題的思路,結合生活經驗看看他們的模型有哪些偏差,然後提出另一種方案。


簡述博弈論者的思路

熟悉博弈論的讀者請跳到下一節。

博弈論的文章紛紛引用了最經典的“囚徒困境”:假設監獄裏審判同一案件的兩個嫌疑犯,如果大家都不招供就每人判1年,都招供每人判6年,1個招另1個不招就釋放招供的人另一個關10年。這樣一來,都不招供對兩個嫌犯最有利(兩個人蹲監獄的時間加起來最短)。然而嫌犯甲就想了:“如果我不招而他招了,那豈不是我蹲10年,他出去逍遙?這不能幹!”於是甲把乙供出來了。碰巧嫌犯乙也是這麼想的,於是把甲也供出來了。最後他們每個人都蹲了6年監獄,加起來是12年,這是最大的總和,也是最不利的情況。大家都從自身的利益出發做出了理性的選擇,結果反而損害了每個人的利益。

類似的情況還有上世紀七八十年代美國菸草公司的廣告大戰:誰出的廣告費少就請不起明星代言,誰的廣告打不出去他的煙就賣不出去;大家把廣告費擡得極高,搞得自己瀕臨破產(這種大家都不願意退出的局面,叫“納什均衡”)。這時候上面突然下來一條禁令:菸草公司一律禁止打廣告,然後菸草公司們都省去了廣告費的負擔,起死回生了。

這個成功的案例似乎告訴我們:應該通過第三方監管來制止這樣的惡性競爭。比如今年上面爲了打擊工作中的形式主義作風,就強制要求各部門減少30%的開會時間。


博弈論忽略了多少東西

這種理論是建立在理性經紀人的假設上的:博弈雙方知道遊戲規則,知道自己的對手是誰,知道他們會怎麼想,也知道自己如何應對……

他們知道得太多了。

1、你在猜誰的心思?

有人用博弈論來解釋“空城計”的故事:諸葛亮與司馬懿領兵交鋒,諸葛亮準備撤退,他只帶着一羣掃大街的人蹲在空城迎接司馬懿。司馬懿知道諸葛亮平生謹慎,擺下空城必有埋伏,於是領兵撤退。而諸葛亮知道司馬懿知道他平生謹慎,於是故意擺下空城順利撤退。可惜司馬懿不知道諸葛亮知道自己知道他平生謹慎,於是中了諸葛亮的空城計……

雖然這個例子有點蹩腳,但在博弈論當中,諸葛亮和司馬懿一直根據“他知道我知道他知道”來做判斷,學名叫“猜疑鏈”。這樣的判斷可以一直繼續追加,夠他們倆玩一輩子。

然而在《三國演義》當中,司馬懿表面上在跟諸葛亮玩,實際上還有別的對手:司馬懿知道魏國只有他能對付諸葛亮,也知道自己是曹家的心腹大患;唯有放走諸葛亮,自己才能繼續掌握兵權。他雖然沒有玩死諸葛亮,卻奪取了曹魏的江山。


2、遊戲規則是什麼?

塔勒布在其著作《反脆弱》中講了這麼一件事:

有一位博弈論的創始人來到黎凡特地區的市場。他突發奇想:用博弈論的方法去砍價效果怎麼樣呢?他還真這麼幹了,結果談崩了。黎凡特商人問他:“大家過去一萬年都在用我們的方式討價還價,你爲什麼要改?”那個創始人恍然大悟,以後再也不用他的理論講價錢了。

關於討價還價的遊戲規則,筆者去年的校園霸凌問題姊妹篇裏還有些例子,有興趣的讀者不妨看看。

不過在生活當中,規則與輸贏其實不像博弈論想的那麼重要。

相傳李小龍說過:“沒人能在拳臺上打倒自己,除非他提前動手;只要讓我知道,他就失敗了。”他兌現了自己說的話,卻英年早逝。他的死因有兩種最有可能的猜測:1、他訓練強度太大,過勞而死;2、他死於黑幫暗害。無論如何,他似乎敗給了規則以外的東西。換句話說,現實生活沒有那麼講遊戲規則。

可事實上沒有人認爲李小龍失敗過,他在拳臺上下都贏得了全世界的尊重。這又應了塔勒布那句話:“現實當中沒人知道誰勝誰敗,大家只知道誰厲害誰不厲害。”


3、什麼矇蔽了我們的眼睛?

博弈論的理性經紀人假設一直面臨着行爲經濟學的質疑。對此,他們迴應稱: “博弈是人們長期穩定的選擇”以及“人在熟練的事情人會做出理性的選擇”。不過從前面兩問不難看出,博弈論者似乎忘了人總是要同時面對很多選擇,而人腦的帶寬是有限的。

比如人在談戀愛的時候智商會降低,籌備婚禮的時候會顧此失彼,懷孕的時候會犯傻,撫養嬰幼兒的時候依然緩不過來——上述四種情況下,人都會在熟練的事情上犯錯;換句話說,以普通人在任何事情上的訓練程度,根本就談不上什麼“熟練”。


這裏分析一個具體的事例。文章開頭說過,博弈論者把中小學生的學業負擔看作學校與學校、家長與家長之間博弈,而多寫作業對家長來說是符合自身利益的理性選擇。這個論斷很成問題。

理性的家長至少應該站在職業生涯規劃的高度去評判中小學甚至幼兒園階段的課程與作業量——這不是我提出的過分要求,而是博弈論事先假定家長知道自己的利益和遊戲規則。在職業生涯規劃的問題上,有多少人稱得上熟練呢?換句話說,有幾個人談得上理性經紀人呢?


現在讓我們再次離開博弈論,看看現實生活中的人是如何考慮的。我承認學校之間、老師之間確實像在爲了自己的利益博弈(生意人算賬的時候還是符合理性經紀人假設的,這點連行爲經濟學都承認),但家長的情況要複雜許多。

首先假定家長一開始有這麼幾種立場:

1)我國的傳統觀念就是鼓勵讀書,許多人覺得考試成績好就等於贏在起跑線上,也就等於有更多的好機會;

2)有些家庭條件比較困難,而勒緊褲腰帶拼命讀書只有潛在的收益沒有什麼可輸的;

3)有些家長對自己的行業和人脈比較有信心,恨不得把親戚家的孩子都拉進來,而且往往不鼓勵孩子學些不相干的東西;

至於那些更依賴直覺的立場就不考慮了,因爲我們談的是理性經紀人跟風的問題(比如家長的焦慮和危機感明顯超越了理性的範圍,故不討論)。我們注意到,第1種立場和後2種有交叉。其他情況的家長大約也可以劃入上述三類,剩下的應該不會佔太大比重,歡迎補充。

這三種立場當中,第1)種雖然有它的道理(在傳統觀念上下注是符合“反脆弱”原理的)但是離着“理性選擇”還有一段距離,而後兩種正好可以用行爲經濟學中的“前景理論”來解釋:

在第2)種立場當中,家長權衡的是目前的低收入(已知)和讀書成功之後獲得的機會——孩子有一定的概率獲得比較大的收益,但更有可能繼承父輩的低收入工作而白交學費。而“前景理論”認爲:人在期望收益爲負的情況下往往不甘心接受損失,寧願冒一定的風險。

第3)種立場當中,家長權衡的是目前比較理想的收入(已知)和讀書轉行結果不理想的損失——當然也有一定概率比子承父業結果更好。這也應了“前景理論”的另一種情況:人在期望收益爲正的情況下會厭惡風險,即使做出改變的期望收益高也要抱着穩定、較低的收益。

上述3類家長或許都記得那些懸樑刺股、囊螢映雪的典故,卻忘了我們國家還有一句老話叫“三百六十行,行行出狀元”。


然後家長知道上學不是單機遊戲,他們還得評估孩子未來在人羣中的地位和發展。大家知道這是個複雜甚至無解的問題,讓家長們大傷腦筋;不過家長有太多事情需要操心,比如收入、工作、貸款、身體狀況、一家老小等等,所以他們不得不找一個簡單的辦法來做評估:他們要對比自己的孩子和別人家的孩子,然後看看自家孩子有沒有輸在起跑線上;而評估的指標往往就是學習成績和投入程度。

從行爲經濟學的角度講,這種偷換問題的做法叫“啓發法”(按中信出版社的翻譯)。這樣評估自家孩子的前途無異於用中石油的產品去評估中石油的股票走勢,如果家長在考慮問題的時候吃塊巧克力補充一點糖分或許會想得更多。但是不管怎麼說,家長們開始操心“如果我家孩子不寫作業,別人家孩子會如何”了。

我們看到,家長們在開始博弈之前有很長一段盲目的歷程,只是他們年復一年地用着一樣的前景理論和一樣的啓發法,纔給人一種長期、穩定、熟練和理性經紀人的感覺。


綜上所述,人們在所謂的“博弈”過程中,往往是拿自己掌握的事實和預估的風險做對比,然後做出了決策。博弈論可能會管這叫“信息不完全狀況下的博弈”,而行爲經濟學研究的一大課題就是“不確定狀況下的判斷”;前者看重我們知道的事情和對手的選擇,而後者承認我們不知道的或者忽略的事情往往更重要。

對比之下,博弈論一上來就給我們一種別無選擇的錯覺,好像我們的生活不是同時面對許多選項,而是隻有一個問題、一種規則和一塊戰場。雖然這種理論深入之後會有許多靈活的解釋,但是我們何必從理性經紀人的假設開始繞一大圈呢?


4、誰來負責?

博弈論讓我們忘掉了自己的選擇權。當我們別無選擇的時候,責任似乎就小了很多,而期待第三方出手解決似乎成了理所當然。

然而有些事情第三方也無能爲力,比如國家20年前就吵吵着中小學減負,然而這並沒有什麼卵用;國家三令五申禁止校外補課,然而這也沒有什麼卵用。在中小學教育方面國家貌似只有1次明顯的成功,那就是整治黑校車;當時的情況是,一些地區的黑校車出了各種事故,死了幾個學生,家長們都擔心起來,然後越來越多的人選擇自己開車接送孩子上學。

對比這些成敗,我們不難發現:關鍵在於家長自己站在哪邊。“水能載舟,亦可賽艇”,羣衆的力量是無窮的;如果大家都選擇跟風作死,那麼第三方也沒什麼好辦法。連文章開頭提到的美國禁止菸草廣告,也是菸草公司們自己商量出來的政策,然後找上面發佈。

去年微信社羣裏有個開培訓機構的朋友因爲一些政策上的問題求助,我就昧着良心告訴他:沒事,國人注重教育這個基本面是相當牢固的,兄弟只要堅持下去就有機會;但有一點,千萬別出安全事故,一校出事故,全市受牽連。

人面對困難奮鬥的時候都知道求佛不如求己,可是需要負責任的時候就不一定了。我們付出了很多,可惜光付出還不夠;大家往往都擠到了一條路上,結果越跑越偏。


自己選擇,自己負責

講到這裏大家或許要問:博弈論裏提到的那些困境不還是實實在在擺在眼前嗎?我們該怎麼辦?

別急,辦法是有。

博弈論的辦法是讓自己成爲博弈高手(也叫“player”),增長眼界,保持理性,構建一種大家都不願意違背的、有利的規則,或者玩弄陽謀(而不是陰謀,陰謀不能讓人知道)逼對手就範,等等。這個辦法……大家自己評判吧。我只想說當大家都奔着一個有限的目標努力的時候,我們的努力就容易貶值(宏偉的目標是另一回事,比如民族復興什麼的)。

而像我這種智商有限的人,就喜歡自己能理解的方法。主要分兩步:

1、獲取選擇權

上節那4個問題從頭到尾講的主要是選擇權,比如選擇對手、選擇遊戲規則等等。識別選擇權或許是一門學問,但我們首先不能落到別無選擇的地步。

具體來說,首先要避免負債(原因不解釋)。按照“長投”的理論,只有能帶來真金白銀的東西才叫資產,而需要花錢維護的財產都是負債,包括房子、車子等等。至於如何避免,我也沒什麼好講的。不過丹尼爾·卡尼曼曾經用汽車做過說明:當我們買了新車以後,聽着引擎的聲音跑在路上非常滿意,怎麼看怎麼順眼;可是過不了多長時間高興勁過去了,回過味兒來發現它和原先那輛只是外觀上有一點區別;不過時間長了,我們看到路上的新車又開始手癢想買。市場上那些“私人訂製”、花樣翻新的產品,大概也就是那麼回事。

其次,有意識地考慮自己能怎麼做,特別是發現一些事情每次都讓我們有情緒。我們不是理性經紀人,活着也不是爲了市場;如果我們的情緒反應一直都不太“合理”,那麼背後很可能有更重要的原因。斯蒂芬·平克說過:人有一種天性就是做出一些違背自身利益的決定,但是從大家生存的環境來看,這樣的決定反而是合理的。

舉例來說,筆者從聽說谷歌收集我們的上網痕跡就覺得反感,只要有精力就抵制人工智能推送,避免網購——這就是我的非理性選擇。直到最近我們發現:這樣的推送會不斷限制我們的眼界,於是我等於不小心避免了一些損失。除此以外,我還會偏愛一些當地的小產品,因爲我堅信它們能幫我規避大品牌的風險(別問我什麼風險,問就是不知道。如果知道那我們就可以跟大品牌博弈了)。

最後,做最壞的打算。我們不妨在羅列全部已知風險的基礎上,再乘以一個安全係數,看看到底能損失多少。這樣一方面能避免意外負債(比如行情不好資金鍊斷裂),另一方面讓我們爲自己的選擇負責:如果真的出了問題,我們已經做好了準備,沒什麼可輸的。

上述3點有一條共同的宗旨:無欲則剛。


2、行使選擇權

博弈的過程就像一盤棋,有時會波及我們。如果基本做到了上一步,那麼一旦覺察到這種遊戲,我們就可以選擇順應局勢爭取獲利,或者事不關己高高掛起,實在看不順眼了還可以朝棋盤上踹一腳給它來點意外驚喜。當然你們知道這裏要講的是那種選擇。


基辛格向我國解釋如何主導博弈時,總結了3個要素:1、有實力;2、有決心;3、讓人看見。不過我們既然只打算干涉博弈,就用不着做這麼多,只需要一點決心和耐心。

比如筆者一直對國內教育領域的博弈深惡痛絕(再加上中小學教育確實造成了家庭不堪重負、熟練工人奇缺和大學幼兒園化等等問題,所以才說這是跟風作死),這點在前文當中有所體現。具體到我的高中,老師們不約而同地利用晚自習時間講課,這不但減少了白天課程的比重,讓我開足馬力卻只能聽到一多半課程,還讓我在晚飯過後筋疲力盡地空轉,更擠佔了寫作業的時間,對我非常不利。

理論上說我應該積極調整適應環境,或者慘遭淘汰;但是我要爲那些像我一樣的人着想,況且從邏輯上講,“順我者昌”的對立事件也不是“逆我者亡”。於是申訴無果之後,我單方面放棄了高三一年的學習,一直混到高考,全班發揮失常。後來在家裏人的建議下,我選擇了一所晚自習不講課的學校補習,通過努力考上了比較理想的大學。

儘管筆者力量微弱(事情也不是一次計劃好的),而且不想搞什麼大新聞,但是能犧牲1年的青春,冒着全班的怨恨(這點事先沒考慮到),來延緩大家跟風作死的趨勢,也算是盡了一份公民的義務。不過對班裏那些受我影響的同學,我只能說一句:高考這樣的一錘子買賣才叫公平,沒有這種隨機性我們還不得耗死在努力的路上?

直到現在,筆者依然會找個機會對着博弈的棋盤踹上一腳,儘管不像上學時那麼禍害了,儘管買房和買車庫這兩件事沒跟家裏人堅持原則。

因爲我們力量微弱,影響有限,所以像這樣的隨機、零星調整最終往往會稀釋掉——我們本來就無意成爲大家跟風的新目標。但是這種抵制的力量據說不會憑空消散。如果我們能在局部稍微延緩那種跟風作死的趨勢,就等於釋放了一部分風險,免得它集中爆發。所以我堅持認爲,充分認識選擇權,自覺抵制跟風行爲也是我們的責任。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章