四问博弈论——为什么非要跟风作死?

最近看到一些文章用博弈论的观点解释大家跟风作死的现象,如:孩子的作业越来越多,同学和同事之间互相攀比,工作中的痕迹主义越来越重以及国家之间的军备竞赛等等。最终,他们希望第三方加强监管,或者制订一种各方面都不愿意违背的规则,好让大家解脱出来。

笔者打算简单梳理一下博弈论解决问题的思路,结合生活经验看看他们的模型有哪些偏差,然后提出另一种方案。


简述博弈论者的思路

熟悉博弈论的读者请跳到下一节。

博弈论的文章纷纷引用了最经典的“囚徒困境”:假设监狱里审判同一案件的两个嫌疑犯,如果大家都不招供就每人判1年,都招供每人判6年,1个招另1个不招就释放招供的人另一个关10年。这样一来,都不招供对两个嫌犯最有利(两个人蹲监狱的时间加起来最短)。然而嫌犯甲就想了:“如果我不招而他招了,那岂不是我蹲10年,他出去逍遥?这不能干!”于是甲把乙供出来了。碰巧嫌犯乙也是这么想的,于是把甲也供出来了。最后他们每个人都蹲了6年监狱,加起来是12年,这是最大的总和,也是最不利的情况。大家都从自身的利益出发做出了理性的选择,结果反而损害了每个人的利益。

类似的情况还有上世纪七八十年代美国烟草公司的广告大战:谁出的广告费少就请不起明星代言,谁的广告打不出去他的烟就卖不出去;大家把广告费擡得极高,搞得自己濒临破产(这种大家都不愿意退出的局面,叫“纳什均衡”)。这时候上面突然下来一条禁令:烟草公司一律禁止打广告,然后烟草公司们都省去了广告费的负担,起死回生了。

这个成功的案例似乎告诉我们:应该通过第三方监管来制止这样的恶性竞争。比如今年上面为了打击工作中的形式主义作风,就强制要求各部门减少30%的开会时间。


博弈论忽略了多少东西

这种理论是建立在理性经纪人的假设上的:博弈双方知道游戏规则,知道自己的对手是谁,知道他们会怎么想,也知道自己如何应对……

他们知道得太多了。

1、你在猜谁的心思?

有人用博弈论来解释“空城计”的故事:诸葛亮与司马懿领兵交锋,诸葛亮准备撤退,他只带着一群扫大街的人蹲在空城迎接司马懿。司马懿知道诸葛亮平生谨慎,摆下空城必有埋伏,于是领兵撤退。而诸葛亮知道司马懿知道他平生谨慎,于是故意摆下空城顺利撤退。可惜司马懿不知道诸葛亮知道自己知道他平生谨慎,于是中了诸葛亮的空城计……

虽然这个例子有点蹩脚,但在博弈论当中,诸葛亮和司马懿一直根据“他知道我知道他知道”来做判断,学名叫“猜疑链”。这样的判断可以一直继续追加,够他们俩玩一辈子。

然而在《三国演义》当中,司马懿表面上在跟诸葛亮玩,实际上还有别的对手:司马懿知道魏国只有他能对付诸葛亮,也知道自己是曹家的心腹大患;唯有放走诸葛亮,自己才能继续掌握兵权。他虽然没有玩死诸葛亮,却夺取了曹魏的江山。


2、游戏规则是什么?

塔勒布在其著作《反脆弱》中讲了这么一件事:

有一位博弈论的创始人来到黎凡特地区的市场。他突发奇想:用博弈论的方法去砍价效果怎么样呢?他还真这么干了,结果谈崩了。黎凡特商人问他:“大家过去一万年都在用我们的方式讨价还价,你为什么要改?”那个创始人恍然大悟,以后再也不用他的理论讲价钱了。

关于讨价还价的游戏规则,笔者去年的校园霸凌问题姊妹篇里还有些例子,有兴趣的读者不妨看看。

不过在生活当中,规则与输赢其实不像博弈论想的那么重要。

相传李小龙说过:“没人能在拳台上打倒自己,除非他提前动手;只要让我知道,他就失败了。”他兑现了自己说的话,却英年早逝。他的死因有两种最有可能的猜测:1、他训练强度太大,过劳而死;2、他死于黑帮暗害。无论如何,他似乎败给了规则以外的东西。换句话说,现实生活没有那么讲游戏规则。

可事实上没有人认为李小龙失败过,他在拳台上下都赢得了全世界的尊重。这又应了塔勒布那句话:“现实当中没人知道谁胜谁败,大家只知道谁厉害谁不厉害。”


3、什么蒙蔽了我们的眼睛?

博弈论的理性经纪人假设一直面临着行为经济学的质疑。对此,他们回应称: “博弈是人们长期稳定的选择”以及“人在熟练的事情人会做出理性的选择”。不过从前面两问不难看出,博弈论者似乎忘了人总是要同时面对很多选择,而人脑的带宽是有限的。

比如人在谈恋爱的时候智商会降低,筹备婚礼的时候会顾此失彼,怀孕的时候会犯傻,抚养婴幼儿的时候依然缓不过来——上述四种情况下,人都会在熟练的事情上犯错;换句话说,以普通人在任何事情上的训练程度,根本就谈不上什么“熟练”。


这里分析一个具体的事例。文章开头说过,博弈论者把中小学生的学业负担看作学校与学校、家长与家长之间博弈,而多写作业对家长来说是符合自身利益的理性选择。这个论断很成问题。

理性的家长至少应该站在职业生涯规划的高度去评判中小学甚至幼儿园阶段的课程与作业量——这不是我提出的过分要求,而是博弈论事先假定家长知道自己的利益和游戏规则。在职业生涯规划的问题上,有多少人称得上熟练呢?换句话说,有几个人谈得上理性经纪人呢?


现在让我们再次离开博弈论,看看现实生活中的人是如何考虑的。我承认学校之间、老师之间确实像在为了自己的利益博弈(生意人算账的时候还是符合理性经纪人假设的,这点连行为经济学都承认),但家长的情况要复杂许多。

首先假定家长一开始有这么几种立场:

1)我国的传统观念就是鼓励读书,许多人觉得考试成绩好就等于赢在起跑线上,也就等于有更多的好机会;

2)有些家庭条件比较困难,而勒紧裤腰带拼命读书只有潜在的收益没有什么可输的;

3)有些家长对自己的行业和人脉比较有信心,恨不得把亲戚家的孩子都拉进来,而且往往不鼓励孩子学些不相干的东西;

至于那些更依赖直觉的立场就不考虑了,因为我们谈的是理性经纪人跟风的问题(比如家长的焦虑和危机感明显超越了理性的范围,故不讨论)。我们注意到,第1种立场和后2种有交叉。其他情况的家长大约也可以划入上述三类,剩下的应该不会占太大比重,欢迎补充。

这三种立场当中,第1)种虽然有它的道理(在传统观念上下注是符合“反脆弱”原理的)但是离着“理性选择”还有一段距离,而后两种正好可以用行为经济学中的“前景理论”来解释:

在第2)种立场当中,家长权衡的是目前的低收入(已知)和读书成功之后获得的机会——孩子有一定的概率获得比较大的收益,但更有可能继承父辈的低收入工作而白交学费。而“前景理论”认为:人在期望收益为负的情况下往往不甘心接受损失,宁愿冒一定的风险。

第3)种立场当中,家长权衡的是目前比较理想的收入(已知)和读书转行结果不理想的损失——当然也有一定概率比子承父业结果更好。这也应了“前景理论”的另一种情况:人在期望收益为正的情况下会厌恶风险,即使做出改变的期望收益高也要抱着稳定、较低的收益。

上述3类家长或许都记得那些悬梁刺股、囊萤映雪的典故,却忘了我们国家还有一句老话叫“三百六十行,行行出状元”。


然后家长知道上学不是单机游戏,他们还得评估孩子未来在人群中的地位和发展。大家知道这是个复杂甚至无解的问题,让家长们大伤脑筋;不过家长有太多事情需要操心,比如收入、工作、贷款、身体状况、一家老小等等,所以他们不得不找一个简单的办法来做评估:他们要对比自己的孩子和别人家的孩子,然后看看自家孩子有没有输在起跑线上;而评估的指标往往就是学习成绩和投入程度。

从行为经济学的角度讲,这种偷换问题的做法叫“启发法”(按中信出版社的翻译)。这样评估自家孩子的前途无异于用中石油的产品去评估中石油的股票走势,如果家长在考虑问题的时候吃块巧克力补充一点糖分或许会想得更多。但是不管怎么说,家长们开始操心“如果我家孩子不写作业,别人家孩子会如何”了。

我们看到,家长们在开始博弈之前有很长一段盲目的历程,只是他们年复一年地用着一样的前景理论和一样的启发法,才给人一种长期、稳定、熟练和理性经纪人的感觉。


综上所述,人们在所谓的“博弈”过程中,往往是拿自己掌握的事实和预估的风险做对比,然后做出了决策。博弈论可能会管这叫“信息不完全状况下的博弈”,而行为经济学研究的一大课题就是“不确定状况下的判断”;前者看重我们知道的事情和对手的选择,而后者承认我们不知道的或者忽略的事情往往更重要。

对比之下,博弈论一上来就给我们一种别无选择的错觉,好像我们的生活不是同时面对许多选项,而是只有一个问题、一种规则和一块战场。虽然这种理论深入之后会有许多灵活的解释,但是我们何必从理性经纪人的假设开始绕一大圈呢?


4、谁来负责?

博弈论让我们忘掉了自己的选择权。当我们别无选择的时候,责任似乎就小了很多,而期待第三方出手解决似乎成了理所当然。

然而有些事情第三方也无能为力,比如国家20年前就吵吵着中小学减负,然而这并没有什么卵用;国家三令五申禁止校外补课,然而这也没有什么卵用。在中小学教育方面国家貌似只有1次明显的成功,那就是整治黑校车;当时的情况是,一些地区的黑校车出了各种事故,死了几个学生,家长们都担心起来,然后越来越多的人选择自己开车接送孩子上学。

对比这些成败,我们不难发现:关键在于家长自己站在哪边。“水能载舟,亦可赛艇”,群众的力量是无穷的;如果大家都选择跟风作死,那么第三方也没什么好办法。连文章开头提到的美国禁止烟草广告,也是烟草公司们自己商量出来的政策,然后找上面发布。

去年微信社群里有个开培训机构的朋友因为一些政策上的问题求助,我就昧着良心告诉他:没事,国人注重教育这个基本面是相当牢固的,兄弟只要坚持下去就有机会;但有一点,千万别出安全事故,一校出事故,全市受牵连。

人面对困难奋斗的时候都知道求佛不如求己,可是需要负责任的时候就不一定了。我们付出了很多,可惜光付出还不够;大家往往都挤到了一条路上,结果越跑越偏。


自己选择,自己负责

讲到这里大家或许要问:博弈论里提到的那些困境不还是实实在在摆在眼前吗?我们该怎么办?

别急,办法是有。

博弈论的办法是让自己成为博弈高手(也叫“player”),增长眼界,保持理性,构建一种大家都不愿意违背的、有利的规则,或者玩弄阳谋(而不是阴谋,阴谋不能让人知道)逼对手就范,等等。这个办法……大家自己评判吧。我只想说当大家都奔着一个有限的目标努力的时候,我们的努力就容易贬值(宏伟的目标是另一回事,比如民族复兴什么的)。

而像我这种智商有限的人,就喜欢自己能理解的方法。主要分两步:

1、获取选择权

上节那4个问题从头到尾讲的主要是选择权,比如选择对手、选择游戏规则等等。识别选择权或许是一门学问,但我们首先不能落到别无选择的地步。

具体来说,首先要避免负债(原因不解释)。按照“长投”的理论,只有能带来真金白银的东西才叫资产,而需要花钱维护的财产都是负债,包括房子、车子等等。至于如何避免,我也没什么好讲的。不过丹尼尔·卡尼曼曾经用汽车做过说明:当我们买了新车以后,听着引擎的声音跑在路上非常满意,怎么看怎么顺眼;可是过不了多长时间高兴劲过去了,回过味儿来发现它和原先那辆只是外观上有一点区别;不过时间长了,我们看到路上的新车又开始手痒想买。市场上那些“私人订制”、花样翻新的产品,大概也就是那么回事。

其次,有意识地考虑自己能怎么做,特别是发现一些事情每次都让我们有情绪。我们不是理性经纪人,活着也不是为了市场;如果我们的情绪反应一直都不太“合理”,那么背后很可能有更重要的原因。斯蒂芬·平克说过:人有一种天性就是做出一些违背自身利益的决定,但是从大家生存的环境来看,这样的决定反而是合理的。

举例来说,笔者从听说谷歌收集我们的上网痕迹就觉得反感,只要有精力就抵制人工智能推送,避免网购——这就是我的非理性选择。直到最近我们发现:这样的推送会不断限制我们的眼界,于是我等于不小心避免了一些损失。除此以外,我还会偏爱一些当地的小产品,因为我坚信它们能帮我规避大品牌的风险(别问我什么风险,问就是不知道。如果知道那我们就可以跟大品牌博弈了)。

最后,做最坏的打算。我们不妨在罗列全部已知风险的基础上,再乘以一个安全系数,看看到底能损失多少。这样一方面能避免意外负债(比如行情不好资金链断裂),另一方面让我们为自己的选择负责:如果真的出了问题,我们已经做好了准备,没什么可输的。

上述3点有一条共同的宗旨:无欲则刚。


2、行使选择权

博弈的过程就像一盘棋,有时会波及我们。如果基本做到了上一步,那么一旦觉察到这种游戏,我们就可以选择顺应局势争取获利,或者事不关己高高挂起,实在看不顺眼了还可以朝棋盘上踹一脚给它来点意外惊喜。当然你们知道这里要讲的是那种选择。


基辛格向我国解释如何主导博弈时,总结了3个要素:1、有实力;2、有决心;3、让人看见。不过我们既然只打算干涉博弈,就用不着做这么多,只需要一点决心和耐心。

比如笔者一直对国内教育领域的博弈深恶痛绝(再加上中小学教育确实造成了家庭不堪重负、熟练工人奇缺和大学幼儿园化等等问题,所以才说这是跟风作死),这点在前文当中有所体现。具体到我的高中,老师们不约而同地利用晚自习时间讲课,这不但减少了白天课程的比重,让我开足马力却只能听到一多半课程,还让我在晚饭过后筋疲力尽地空转,更挤占了写作业的时间,对我非常不利。

理论上说我应该积极调整适应环境,或者惨遭淘汰;但是我要为那些像我一样的人着想,况且从逻辑上讲,“顺我者昌”的对立事件也不是“逆我者亡”。于是申诉无果之后,我单方面放弃了高三一年的学习,一直混到高考,全班发挥失常。后来在家里人的建议下,我选择了一所晚自习不讲课的学校补习,通过努力考上了比较理想的大学。

尽管笔者力量微弱(事情也不是一次计划好的),而且不想搞什么大新闻,但是能牺牲1年的青春,冒着全班的怨恨(这点事先没考虑到),来延缓大家跟风作死的趋势,也算是尽了一份公民的义务。不过对班里那些受我影响的同学,我只能说一句:高考这样的一锤子买卖才叫公平,没有这种随机性我们还不得耗死在努力的路上?

直到现在,笔者依然会找个机会对着博弈的棋盘踹上一脚,尽管不像上学时那么祸害了,尽管买房和买车库这两件事没跟家里人坚持原则。

因为我们力量微弱,影响有限,所以像这样的随机、零星调整最终往往会稀释掉——我们本来就无意成为大家跟风的新目标。但是这种抵制的力量据说不会凭空消散。如果我们能在局部稍微延缓那种跟风作死的趋势,就等于释放了一部分风险,免得它集中爆发。所以我坚持认为,充分认识选择权,自觉抵制跟风行为也是我们的责任。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章