《模型思考者》(The Model Thinker: What You Need to Know to Make Data Work for You)筆記

一、把思考正規化

什麼是模型呢?如果“多樣性”說的是觀察問題的“視角”,“模型”說的就是研究問題的“鏡頭”。你可能知道投資者查理·芒格喜歡談論“思維模型”,不過在我看來那其實是一些理解和思考的套路,相當於是新時期的成語典故。佩奇說的模型要高級得多,是學者們使用的那種正規的“理論模型”。

想要理解這個武器級的概念,你的思維方式需要先升級。

0x1:什麼是模型?

要想用高級方法研究問題,你得把思考給正規化。咱們舉個例子。

一個小孩踢足球,他竭盡全力也沒踢出去多遠,他踢不動。而一個大人飛起一腳,球就會被踢得很遠。有人對這個現象總結了一個規律,說踢球的力量越大,球飛得就越遠。

這是很不錯的觀察和思考。足球運動員通過訓練能對“球性”有深刻的體察,但是如果你讓他談談力量和距離的關係,他大約就只能說到這個程度。各種成語典故,什麼脣亡齒寒、揚湯止沸,包括古代軍事將領寫的兵書戰策,什麼《孫子兵法》,也都是這個水平的思考。這些思考都是有用的……但是,這種思考方式太落後了。

首先它不精確。我把力量增大一倍,球的飛行距離能增加多少呢?你無法計算。其次它沒有適用範圍。這個道理一直都對嗎?在什麼情況下會不好使呢?你無從判斷。

複雜世界裏的現代人,可不能靠成語典故和寓言故事指導決策。那種水平的思考沒有精緻推演的能力。

現代學者都使用更高級的思考方式。

最起碼的一點就是一個數學公式能抵千言萬語。想要知道踢球的力量和球的飛行距離的關係,我們首先用牛頓第二定律公式描寫力量和加速度的關係,然後通過加速度和觸球時間計算速度,再考慮地球引力和空氣阻力……這聽起來比較麻煩,但是這一套思考允許你做精緻的推演。

這就是思考方式的正規化。請注意,你思考的其實已經不是那個具體的球和那個具體的踢球者了,你思考的是一個抽象出來的踢球模型。

模型是對真實世界的抽象。我們以前講過“邏輯思維”,我們知道,只有抽象的東西,纔是屬於邏輯世界的。建立了模型,你才能做推演。

模型必須符合兩個要求。

  • 第一,模型中包含的各種實體,人也好、組織也好、物品也好,以及這些實體之間的相互關係,必須都有非常明確的定義。
  • 第二,模型可以做邏輯推導。

其實你每次做數學應用題,都是在使用一個模型。你知道題目包含什麼假設,有什麼因果關係,就能用數學推導出一個結果。

正規化就是抽象化,抽象化才能可推導,而可推導是個非常厲害的能力。一旦思維上升到模型的高度,你就不再是老百姓水平了,一般的道理就騙不了你。

比如美國共和黨總統都喜歡減稅,一般講的故事是減了稅,老百姓的錢就多了;老百姓錢多了,就可以擴大消費,經濟就會增長;經濟增長蛋糕做大了,政府的稅收反而會增加……你聽着好像挺有道理。

可是咱們用一個最簡單的數學模型推導一下。假設稅率降低10%,那麼要想收到跟原來一樣多的稅,經濟必須增長10%以上纔行……可是近年來美國經濟最高也就增長4%左右,真要到10%那是一個奇蹟!

當然真正研究經濟問題需要更復雜的模型,但是這個道理是我們需要模型,而不是故事。下面咱們講一個真實的應用,看看模型思維的威力。

0x2:洞見本質

2008年金融危機期間,美國財政部在關鍵時刻出手,購買了AIG公司(美國國際集團,American International Group)的資產,使得 AIG 沒有倒閉,保住了它。

這個救援行動遭到了各方的猛烈批評。有人說這等於是政府直接干預經濟,違背了自由市場的理念,這還叫資本主義嗎?有人說雷曼兄弟公司你爲啥就不救援呢?結果雷曼破產了AIG沒事,這公平嗎?

美國政府行事的邏輯在哪呢?講故事不如看模型。下面這張圖是當時國際貨幣基金組織搞的一個模型,描寫了各大金融機構之間的網絡關係,

各個機構之間的連線代表他們的關聯,連線越粗越越深,關聯就越強。AIG處在這張關係網的一箇中心位置。有好幾個金融機構購買了AIG提供的資產保險,如果他們資產的價值下降,AIG會給他們兜底。

有了這個模型,我們就可做推演了。我們可以想象,如果AIG倒閉會發生什麼?使用數學推導,我們知道其他那些機構就會拿不到保險金,那麼他們也會跟着倒閉,結果就可能是災難性的連鎖反應。AIG是“大到不能倒”,這就是爲什麼要救AIG。那爲什麼不救雷曼兄弟呢?因爲模型中雷曼兄弟並不具有AIG這麼核心的位置。

事實證明雷曼兄弟的倒閉並沒有牽扯到整個金融系統,模型的預測可以說是準確的。金融危機過去之後,美國政府又賣掉了AIG的資產,一進一出從中還淨掙了230億美元……可以說當初救援AIG是一個正確的決定。

模型幫我們看清了各個金融機構之間關係的本質。如果沒有這個模型,你光說AIG很重要,就不足以做出這種精確而大膽的操作。但是問題來了,當初爲什麼要選擇這個模型呢?

爲什麼不考慮各個金融機構高官的任職情況呢?爲什麼不考慮這些機構在歷史上對美國所做的貢獻呢?爲什麼不考慮對輿論的影響呢?

簡單地說,只看關係模型,是因爲你想要的只是金融市場的穩定。不簡單地說,忽略其他因素,這是一個非常主觀的冒險選擇。

選擇模型,你需要智慧。

0x3:從數據到智慧

爲了進一步理解模型,我們考慮一個認知上的金字塔。

  • 金字塔的最底層是數據。數據代表各種事件和現象,比如你出門看見下雨了,這就是一個數據。數據本身沒有組織和結構,也沒有意義。數據只能告訴你發生了什麼,並不能讓你理解爲什麼會發生。
  • 數據的上一層是信息。信息是結構化的數據。你看見下雨只是數據,但如果有人統計哈爾濱市在2019年7月份這一個月總共下了多少雨,這就不是簡單的數據了,而是信息。信息是很有用的,可以用來做分析和解讀。
  • 信息再往上一層是知識。知識能把信息組織起來,告訴我們事件之間的邏輯聯繫。有云導致下雨,因爲下雨所以天氣變得涼快,這都是知識。成語典故和思維套路都是知識。模型,則可以說是一種高級知識,能解釋一些事情,還能做預測。
  • 認知金字塔的最上一層,是智慧。智慧是識別和選擇相關知識的能力。

你可能掌握很多模型,但是具體到這個問題到底該用哪個模型,敢不敢用這個模型,則是智慧。

佩奇舉了一個例子。一隻小貓從4000米的高空掉下來,請問它會給地面造成什麼樣的危害?你得先選一個模型。

用最簡單的重力加速度模型,你會發現小貓觸地之前的速度非常非常快,它會在地上砸出一個大坑。但是用一個更復雜的模型,考慮到空氣阻力,物體在大氣層中的掉落速度其實會趨向一個恆定的數值,並沒有那麼快,那麼這個危害就不會很大。如果掉下來的是一隻小老鼠,甚至可能都不會死。

從數據到智慧,這是真正意義上的認知升級。

  • 如果一個人渾渾噩噩地混日子,只體驗而不知道總結,他得到的就只有數據。
  • 有人偶爾看看新聞,知道現在發生的事情都是什麼意思,他就獲得了信息。
  • 有人能從經驗中總結一些規律,還從書本上學到一些說法,他就擁有了知識。
  • 那爲什麼有很多人說“學了很多知識,卻仍然過不好這一生”呢?因爲有知識不等於有智慧。有智慧,會選擇該用哪個知識,能使用模型做出決策,而且還真敢去執行,那纔是真本事。

從數據到智慧,你會發現越往上就越主觀。信息已經是個性化的總結。知識中的因果關係已經是主觀的判斷。而智慧,更可以說是一種藝術。到底該選哪個模型?沒有固定的操作流程。

經濟學家有句名言說“所有模型都是錯的,其中有一些是有用的。”模型說的不是真實世界,而是對真實事件的抽象和簡化。你必須忽略很多因素,才能讓問題可以推演。而這麼做的危險是你可能得到完全錯誤的結論。

所以你需要了解每個模型的優點和侷限性。你需要有舉一反三的能力。你需要有創造性。延續《多樣性視角》的邏輯,佩奇特別強調,你有時候需要同時使用多個模型,才能做出準確的預測和判斷。

總結來說,模型是對真實世界的一種主觀抽象描寫,代表正規化的思考。模型通過嚴謹的定義和數學邏輯關係,允許我們做精緻的推演,從而獲得精確交流、解釋、判斷、設計、預測、探索和採取行動的能力。而選擇什麼樣的模型、選擇一個還是幾個模型,則是智慧。

 

二、怎樣研究”人“

在講具體的模型之前,咱們先統一解決一個大問題,那就是如何對“人”進行建模:如何研究人。

我們即將鑽研的大多數模型中都會有人。不管你要觀察社會也好,玩轉世界也好,制定政策也好,都需要分析人、琢磨人。那人到底是什麼樣的呢?人們大約有兩種態度。

  • 一種態度認爲人是簡單的。有些領導認爲人就應該令行禁止如臂使指,有些人認爲人就是一羣烏合之衆……傳統的經濟學家有個“理性人”假設,也相當於是一種簡單化。而近年以來,很多“行爲經濟學家”認爲這是不對的,人沒有那麼理性,人有各種非理性的偏見。
  • 第二種態度認爲人是非常複雜的。正所謂“人心難測”,一切描寫人的模型都存在漏洞。但是我感覺這個態度其實是智識上的懶惰:你一句“人是複雜的”,別人說啥都不對,那你倒是說個對的啊?

到底應該怎麼研究人呢?我讀佩奇這本書得到一個洞見。

你不應該籠統地問“人是什麼樣”。你應該問的是在你研究的這個局面中,在這件具體的事情上,人是什麼樣的。人做某些事情的時候很聰明,做另一些事情則很不聰明,因爲根本不需要聰明。

是局面決定了人。抓住這一點,你就會對“人”有一個非常好的敏感度。

0x1:人可以是什麼

要想研究人,你得有個上帝視角。你得有個足夠大的心臟,敢從人羣中跳出來,把“人”當做你的研究對象。不要被“人”所嚇倒!咱們先來探討一下人這種東西的複雜度上限。

首先人具有多樣性,每個人都是不一樣的,有自己的想法、判斷和追求。這給對人的研究造成極大的困難,使得社會科學幾乎不可能是一門精確的科學。有個著名的俏皮話說,想象一下如果每個電子都有自己的想法,可以不遵守物理定律,物理學將會是什麼樣的理論……

不過別擔心。你的確很難預測”一個人“的行爲,但是你可以在大體上判斷”一羣人“的行爲。

這是爲啥呢?因爲個體的差異可以互相抵消。

  • 比如你開個餐館,具體到一個特定的人今天來不來你這喫飯,你很難判斷,但是你每天的顧客人數其實都差不多。有的人本來想來因爲臨時有事來不了,有的人本來沒想來因爲路過看到就來了,這種種的出入互相抵消了。
  • 再比如在投票選舉中,有的人觀點左得離譜,有的人觀點右得離譜,但是因爲互相抵消,最後這個人羣整體的觀點就還是比較靠譜的。當選者的政策不會太離譜。

但互相抵消的前提是每個人都獨立思考,犯錯的方向得四面八方都有才行。而如果人和人之間有強烈的互相影響、互相模仿,那麼整體就會表現出一個強烈的傾向性。比如一家銀行,本來每天被取走的錢都差不多,有一天突然傳來一個謠言說銀行要破產了,人們都來擠兌,那你就不能再使用平常的模型了。

  • 是各自獨立還是互相模仿,這是我們研究人羣的一個重要視角。
  • 另一個視角是,人們是在例行公事地按照習慣做事,還是正在根據當前局勢的變化調整自己的行爲模式。如果局面很穩定,其實大家都是按照習慣做事。只有在一些很特殊的情況下,人才會表現出一些不尋常的特點。

所以針對不同的局面,你要選擇不同的模型。

0x2:三種關於人的模型

大致來說,關於人的模型一共有三種。

第一種是“理性人模型”。

經濟學和博弈論所謂的理性,就是你明確知道自己想要什麼(行爲可預期,包含的信息熵很小),並且爲之採取行動。請注意理性不等於自私。你說你不爲名不爲利就想爲人民服務,那也行,只要你的所作所爲能用你的這個目的解釋就行。

學者們假設,如果你是理性的,你就會想去優化某一個量。

  • 比如你想掙錢,你就會把自己的金錢收入最大化
  • 你想助人爲樂,你可能會讓自己幫助的人數最大化。

經濟學一般把你想要優化的這個量叫做“效用函數(utility function)”,博弈論裏叫“報償(payoff)”。不管叫什麼,有了這個函數,我們就容易對理性人建模了。

比如咱們考慮這麼一個有關收入支配的問題。一般人都會把一部分花費用於房子,比如還房貸或者交房租,一部分用於日常消費。那這兩部分的比例是怎樣的呢?

有一個經濟學理論做了這麼一個假設,說人在決定花費的時候,會把下面這個效用函數 

給最大化,其中 C 表示日常花費,H 表示在房子上的花費。

你可能會覺得這個假設非常不合理:生活中有誰是照着這個怪異的函數花錢的啊?沒關係,這只是一個模型而已,經濟學家眼中的理性人什麼事兒都做得出來。那假設人們真的是衝着讓這個函數最大化去花錢的,他們會怎麼花錢呢?

答案是 H,也就是房子花費,應該佔你全部收入的1/3,其他花費佔2/3。而這和對真實人羣的觀測結果差不多,所以這是一個很不錯的模型。

你看這就是模型的力量。有了理性人假設和效用函數,你就能從中推導出來人的行爲。

而且你還可以推導出各種問題的答案。比如說如果房價下降,人們會不會用更多的錢去買別的東西呢?這個模型說不會的,因爲人總是把1/3的錢花費在房子上,如果房價下降,人們會選擇買更大的房子,而不是用於別的消費。

這就是爲什麼經濟學家那麼喜歡理性人模型:一切都是可推導的!當然這樣的假設是有危險的。有些學者說人是“非理性”的,有各種認知偏誤。其實很多這樣的指控,包括著名的丹·艾瑞里的《怪誕行爲學》書裏說的各種實驗,都沒有通過嚴格的重複檢驗。所謂非理性的偏誤對經濟行爲真正有影響的大概只有兩個。

  • 一個是“損失厭惡”,也就是人對失去的厭惡超過對得到的喜悅。
  • 一個大約可以叫做“棉花糖謬誤”,也就是人會過高地估計當前的價值,而不願意等一段時間拿更高的價值。

事實是人在大多數情況下是非常理性的。你可能不會計算效用函數,但是你有各種生活經驗、你可以向人學習,你的經濟決策通常比較接近於最優決策。就算被人騙一兩次,你喫一塹長一智也不會被騙第三次。特別像買房這樣的大事,你肯定會貨比三家,做非常精確的計算,總不至於糊里糊塗地多花30%的錢。

所以理性人模型有衆多的優點,還是很實用的。理性人模型決定了人在發揮智識上限的情況下會怎麼做。

第二種模型叫“固定規則模型”,代表了人的行爲下限。

它假設人沒有那麼多想法,只是根據習慣,按照一個固定的行爲模式去行動。比如你的模型可以直接假設人會把三分之一的花費用於房子……其實在某些情況下,這跟理性人假設的推論是一樣的。

還有一種叫“適應性規則模型”。

這種模型認爲人會從幾種行爲模式中選擇。具體怎麼做,他可以跟別人學習,或者根據當前局面自己決定。

那什麼問題該用哪種模型呢?取決於在這個問題中人到底有多聰明。

0x3:局面決定人

比如你對哈爾濱市的城市交通進行建模,你的模型演化出來一個穩定解,你說哈爾濱市民天天都是這麼上下班。在這個解裏,有一個叫老王的人,每天上下班都繞了遠路。明明有一條半小時就到的路線,老王卻選了一條一個半小時的路線。那麼你想想,你這個模型是不是有問題呢?

老王作爲一個正常人,不會放着更好的路線而不用的。你可以認爲老王有非理性的傾向,但是要想做一個有用的模型,你不應該看不起老王的智商。

這叫做你的模型“邏輯不自洽”。

這裏面有個大道理。如果模型有一個比較穩定的解,那麼其中就不應該有傻子。

我們多次講過一個概念叫“有效市場假設”:在一個有效市場中,每個人都做到了他行爲的上限,一切獲利空間都會被佔據。博弈論中也有個概念叫“均衡態”:在均衡態中,誰也不可能通過單方面改變自己的行爲來改變博弈的結果,經濟學家稱之爲帕累托最優。

用在模型上,就是說

  • 如果你的模型演化出來的結果是一個比較穩定的狀態,哪怕是出現一個循環的狀態也行,只要是可預期的就行,那麼其中的人就會適應這個狀態,就會通過個人經驗或者互相學習,找到最優解。這個模型的參與者,就應該是聰明人。所以你就應該用理性人或者適應性規則建模。
  • 反過來說,如果你要研究的這個局面是非常混亂的,根本沒有什麼規律可循,那這裏面的人就不用被假定是聰明人,用固定規則建模也許就是可行的。爲啥呢?因爲混亂的局面中沒什麼經驗可以總結,也沒什麼可以互相學習的,人無法改善自己的行爲。

簡單來說,

  • 在複雜沒有規律的局面中,人們普遍不會很聰明,因爲聰明也沒用
  • 而在平衡穩定的局面中,人們普遍不會很傻,因爲人會學習。

當然這裏所謂的“聰明”都是相對於局面而言,不是絕對的智商測試。智商好不好使,還得看是幹什麼用。

這個道理不僅僅適用於建模。如果你是一個政策制定者,你需要了解人羣的這個特性。

比如你管理一家醫院。你注意到醫院急診室太小了,應對不了每天來那麼多患者,所以你打算把急診室擴大一倍。你的測算是擴大一倍足夠了。

但是如果你理解人,你就得考慮患者對你這個政策的反應。急診室擴大之後,患者發現不擁擠了,他們會老老實實享受這個局面嗎?不會的。

患者會適應這個局面。既然急診變方便了,那些本來只有些小病,不需要看急診的人,就也會來看急診。你的急診室將會再次擁擠。你的模型必須能夠判斷,方便不是均衡態,擁擠纔是。

所以人再複雜,也要受到均衡態的控制……要不怎麼陳道明說“往往都是事情改變人,人改變不了事情。”

 

三、三種分佈模型

這章咱們講三個特別常用的統計模型,分別是

  • “正態分佈”
  • “對數正態分佈”
  • “冪律分佈”

佩奇的模型課完全不介意使用數學,這三個概念聽起來就有強烈的數學味道……而我保證,在我們整個的解讀中,你都不需要拿起筆來做數學計算。但是你需要從這個過程中獲得一點“數學感”。球迷自己不會踢,看別人踢球也會得到有一點“球感”,也能在一定程度上閱讀比賽、甚至做出很好的預測判斷,我說的數學感差不多也是這個意思。

這一章說的數學感能帶給你一個非常實用的判斷力:什麼時候應該擔心發生極端事件,什麼時候不應該擔心。我們講“蝴蝶效應”的時候說過,就算你是個小心謹慎的人,你也不應該一天到晚對什麼事情都提心吊膽。

有些天真的人認爲極端事件隨時都可能在任何領域發生,真正的學者不會這麼看問題的,我們的確見過很多身高超過兩米的人,但是可沒見過身高 15 米的人。而在另一些領域中,的確就是存在特別極端的例子,比如世界上有些特別有錢的人。這二者的區別是啥呢?

區別是人的身高服從正態分佈,而財富不是。

0x1:正態分佈

咱們先回到上一章說的那個開餐館的事兒。如果你的餐館事業已經比較穩定了,你不會太擔心顧客流量的波動。這種情況,就是正態分佈。

假設你的餐館平均每天有 100 個顧客,比較好的時候能到 115 人,比較差的時候也有 85 人,那麼畫出圖來,就是下面這樣的一條鐘形曲線,

曲線的橫座標代表每天來的人數,縱座標代表在比如說一個季度之中,來這麼多人的時候有多少天。圖中標記了正態分佈的兩個重要概念:平均值(μ),和標準差(σ)。對你這個餐館來說,μ = 100,σ = 15,這意味着在 68%的日子裏,你的顧客人數會在 85 和 115 之間 —— 這叫“一個標準差之內”。橫軸上距離平均值越遠的地方越是極端事件,而那些事件的縱座標大小則代表它們發生的概率。

只要你知道餐館人數符合正態分佈,平均值和標準差就都可以用平時的流量數據統計出來。有了平均值和標準差你就可以大致估算各種事件發生的概率:95%的事情都發生在兩個標準差之內,99.7% 的事情發生在三個標準差之內。有個極客說要找個美貌程度在兩個標準差之外的女朋友,那就意味着她要比 97.5%的人都漂亮。

這些概念是一名現代大學生應該具備的常識,你在課堂上可能都學過。但是也許你有個疑問:

爲什麼餐館人數滿足正態分佈?

並不是所有隨機事件都滿足正態分佈。想要學會判斷什麼樣的事件滿足正態分佈,你必須有一點數學感,你需要了解“中心極限定理”。中心極限定理說,如果一個事件滿足下面這些條件,它的分佈就是正態分佈,

  • 第一,它是由多個,至少 20 個,隨機變量”相加“的結果
  • 第二,這衆多的隨機變量是互相“獨立”的
  • 第三,每個隨機變量的方差都只有有限大
  • 第四,每個隨機變量對結果都要有一定的貢獻,否則如果只是其中幾個起到決定性的作用,那也不能算“多”

簡單地說,正態分佈的關鍵要求有兩個:“相加”和“獨立”,凡是多個獨立隨機變量相加的事件,結果就會是正態分佈。

你的餐館顧客滿足這些條件:每個顧客來不來喫飯都是他自己的決定,是獨立的,而你計算的是今天總共來了多少人,是這些人的和。

直觀地說,中心極限定理說的是每個人來不來可能波動很大,但是因爲人多,整體上來多少人,波動就不會有那麼大,所以滿足正態分佈。

生物學家認爲人的身高是由至少 180 個基因共同決定的。有的決定你的小腿有多長,有的決定你的脖子有多長,而你的身高,是所有這些因素相加之和。作爲一個很好的近似,決定身高的各個基因是比較互相獨立的。所以身高滿足正態分佈。

你看這是不是有一種“冥冥之中自有定數”的感覺。雖然你不知道明天會有哪些顧客,但是你知道他們的總人數不會太離譜:三個標準差已經覆蓋了 99.7%的可能性,來超過 145 或者低於 55 人的可能性只有千分之一。這意味着兩三年都碰不到一次,所以你真的沒有必要準備那麼多桌椅。

正態分佈能給人充分的掌控感。每個案例相差都不會很大,通常翻不了天。

好,現在回到正態分佈的兩個條件,“相加”和“獨立”:如果局面不滿足這兩個條件,結果會是怎樣的呢?那你就得做好準備迎接極端事件了。

0x2:對數正態分佈

如果一個事件的結果不是由獨立隨機事件相加、而是由相乘決定的,它的分佈將是“對數正態分佈”。這個分佈的形狀就不是對稱的鐘形了,而是像下面這樣,

它有一個比較長的尾巴。這意味着其中發生極端事件的可能性比正態分佈高很多。

比如說漲工資吧。有個公司,本來員工之間工資相差不大。有一天老闆宣佈了一個漲工資計劃,說以後每年業績突出的員工,工資會增加 10%。你猜這個政策意味着什麼?

意味着員工之間的工資差距將會變得越來越大。可能老王工資本來就比小李高,這次業績又比小李好,那麼老王漲 10%,小李沒有,所以兩人的差距將會變大。換一種情況,老王表現沒有小李好,那麼小李漲 10%,兩人差距會縮小。但是,請注意,因爲老王工資高,所以第一種情況導致的工資差距拉大,會超過第二種情況導致的工資差距縮小,所以總體看來,全體員工的收入差距必然拉大。

這就是因爲你使用了相乘的方法。換個方案,如果規定業績好的員工,不論之前的工資是多少,一律漲一萬塊錢,那麼員工之間的工資差距就不會拉大。

你喜歡讓員工的收入差距拉大還是縮小呢?不管你喜歡哪種局面,你需要這個數學感。否則是你自己設計的模型,含着淚也得接受它的結果。

請注意,對數正態分佈仍然假設每個隨機變量的作用是互相獨立的,這意味着哪個員工今年能做出更好的業績,跟他去年的工資沒關係。而如果你認爲員工工資代表了能力,那麼工資越高的人就越有可能做出好業績,那結果就不會是對數正態分佈了,而是比這還要容易出極端事件的“冪律分佈”。

0x3:冪律分佈

冪律分佈的“長尾”,比對數正態分佈更長,

這意味着冪律分佈中會有大量的極端事件,冪律分佈是”不獨立“的隨機變量作用的結果。

科學家找到了很多個能帶來冪律分佈的模型,咱們這裏說其中最常見的兩個。

第一個模型是“馬太效應”。

比如你去書店買書,那麼多本書選哪本呢?你會優先關注那些上了排行榜的“暢銷書”。這是人之常情,但是這對那些沒上榜的書是不公平的,這等於說越暢銷的書就會越容易被關注,而越容易被關注就讓它進一步更暢銷。這就成了一個富者愈富的局面。冪律分佈使得圖書市場中會出現少量特別暢銷的書,而絕大多數書的銷售成績都很差。

而這一切都是因爲你做決定的時候是在模仿別人。你看到別人都買這本書,所以你才關注它。你的買書行爲不是獨立的。

  • 明星的粉絲數量
  • 公司的大小
  • 城市的大小

都是冪律分佈。比如一個城市越大,其中人與人的互動就越多,就業機會和創新機會也會越多,就越能吸引到新人的加入。這就是爲什麼中國有那麼多的超大城市。當然每個冪律分佈中的那個冪律參數不見得是一樣的。

如果一個局面中有很多極端事件,我們基本上可以猜測它滿足某種某種冪律分佈。

另一種冪律分佈模型來自於複雜系統的“自組織”現象。

一個系統在變大、變複雜的過程中,它的各個部分互相依賴的程度將會增加。到了一個臨界點,因爲互相關聯實在太緊密了,一部分出個小問題就會導致整個系統出大問題,那就是雪崩式的災難。

核電站的安全性、地震、森林大火,這些事情中包含自組織,各個部分之間會有複雜的聯動。而我們說過,所謂蝴蝶效應,罪過不在蝴蝶,恰恰就是因爲系統中的複雜聯動。這些系統可能平時什麼事兒都沒有,但是其中蘊含着大災難的可能性。

可能一個地區每天都發生一萬次以上的小地震,影響微不足道,但是你考慮到地震是冪律分佈的事件,就必須對大地震做好防災準備。

總而言之,

  • 如果這個事件代表多個獨立隨機變量之和,它就滿足正態分佈,你不用擔心會有什麼極端的情況發生。
  • 如果一個事件是獨立隨機變量的乘積,那就是對數正態分佈,其中會有一些比較極端、但不是那麼極端的事情發生。
  • 而如果一個事件中的隨機變量不是互相獨立的,有互相模仿或者達成了緊密的關聯,那你就必須做好應對極端情況的準備。

如果你是一個管理者,這個數學感會讓你希望建立一個“原子化”的組織。其中的個體都獨立決定,不要互相模仿、不要有什麼民間組織和派系,實現正態分佈。這意味着你要打壓那些所謂一呼百應的“社會凝結核”,你要把壞消息的傳播控制在最低限度。

而作爲個體,也許冪律分佈對你有某種誘惑……你有可能利用這種規律做一些很厲害的事情。

以網絡安全爲例,計算機入侵事件符合什麼分佈?答案應該是冪律分佈。

我們假如一臺計算器遭到網絡黑客入侵這個事件,由如下幾個事件組成,

  • A、是否存在漏洞
  • B、是否安裝了防護軟件
  • C、黑客是否能否發現這個漏洞
  • D、黑客是否有攻擊意願
  • E、黑客是否實際發起了攻擊

首先,我們排除正態分佈,原因有兩點,

  • 第一,組成事件的隨機變量數量不多。
  • 第二,並不是每個隨機變量的方差都只有有限大,其中”E(黑客是否實際發起攻擊)“是一個極其不確定的因素,它受人的主觀心裏因素影響,屬於不可預測的因素。

第二,我們依然排除對數正態分佈,原因有一點,

  • A、對數正態分佈仍然假設每個隨機變量的作用是互相獨立的。但是對於網絡攻擊來說這個假設是不成立的,”C(黑客是否能否發現這個漏洞)和E(黑客是否實際發起了攻擊)“往往是存在相互依賴關係的

最後,網絡安全計算機入侵事件,滿足一個近似的冪率分佈。 

 

四、大國崛起靠什麼

這一章咱們說個特別大的話題,看看模型思維的威力:一個國家的經濟,是如何增長的。

古人的治國思路,要麼靠一個什麼經典學說,一種理念,或者什麼以德治國,本質上都是用直覺治國。直覺能告訴你什麼因素好、什麼因素壞。直覺告訴你增加投資能讓經濟增長,這個沒錯,這個效應存在。但是直覺只能告訴你效應的方向,而模型能告訴你效應曲線的形狀。

你只知道一個東西有沒有效還不行,你得知道這個東西有多麼有效纔行。模型不一定非得特別精確,只要它能告訴你效應曲線的形狀,就已經能大大增強你的判斷力,就比直覺強得多。

0x1:兩種非線性

我們前面講期權思維說過兩種非線性曲線。

  • 一種是“微笑”曲線,是上凹下凸的圖形,英文叫 convex,代表邊際效應遞增,

一種是“撇嘴”曲線,上凸下凹,叫 concave,代表邊際效應遞減,

現在我們想象這兩種曲線描寫的是一個國家的經濟產出。圖中的經濟都在增長,而且是非線性的增長:

  • 一個速度越來越快
  • 一個是越來越慢。

我們平時說的所謂指數增長,都是邊際效應遞增的曲線。咱們中國經濟曾經以每年超過 10% 的速度增長,現在下降到了 6.5%,仍然很厲害。如果中國經濟能保持哪怕每年6%的增長速度,那也是每12年就能翻一番。上凹下凸的曲線是非常厲害的,我們喜歡這樣的增長。

而我要說的是,我們希望國家經濟一直都是這麼一個上凹下凸的微笑形狀。你希望保持一個不太低的增長率。如果經濟雖然也在增長,但是增速正在變得越來越慢,你就應該採取一些行動了。因爲哪怕都是增長,人們在微笑曲線和撇嘴曲線中的經濟行爲是不一樣的。

比如你要在某個三線城市開家電影院,面臨兩個選擇。

  • 一個選擇是保守一點,開一家符合市民當前消費能力的中小型電影院
  • 一個是比消費者領先一步,開一家豪華的大型電影院。第二個選項是有風險的,現在這個城市的消費能力還不足以把這個大電影院立即填滿。但如果你預期隨着人們收入的增加,能看得起電影的人會越來越多,那麼你的投資也許就是值得的。

我們設想,如果開大電影院,你有50%的可能性一年就倒閉,也有50%的可能性電影院能堅持下來,幾年後盈利,那你會怎麼選呢?答案取決於城市消費水平的增長是微笑曲線還是撇嘴曲線。

你可以用下面這張圖來參悟一點數學,

簡單來說,

  • 在微笑曲線中,函數的平均值(圖中 D 點),要比平均值的函數(圖中 C 點)高。這意味着你擁抱不確定性,選擇開大電影院,對一半一半的運氣認命,會得到一個很好的數學期望。
  • 反過來說,如果你預期未來經濟增速會越來越慢是個撇嘴曲線,這種冒險就是不值得的,你就應該開一個規模比較小、裝修沒那麼豪華的電影院。

如果人們對國家經濟增長的預期是越來越快,投資者就會充滿信心,敢於冒險上一些比較刺激的項目。如果沒有這樣的預期,人們就會變保守,搞不好對本來想投的項目也不投了。

而數學告訴我們,這些都是理性的選擇。我們不但要求經濟增長,而且希望增長是加速運動,保證一個不太低的增長率,是個微笑曲線。

可是怎樣才能做到這一點呢?我們來看兩個經濟學模型。

0x2:投資拉動的增長

咱們先看一個最簡單的模型。經濟產出的兩個最重要要素,

  • 一個是勞動力
  • 一個是固定資本

而遺憾的是,這兩個要素的效應都是邊際效應遞減的,是撇嘴曲線。

比如你開了一家工廠,有100個工人、一間廠房和一定數量的機器。

  • 現在如果工人人數不變,你把機器數量擴大一倍,你的產量會增加一倍嗎?並不會。工人操作機器的能力是有限的,你給一個程序員發500臺電腦也不能提升相應的代碼產出量。
  • 同樣道理,在機器數量不變的情況下,把工人的數量增加一倍,產出也不會翻倍。你必須把工人和機器同時增加一倍,你的產出纔可能增加一倍。

根據這個思考,有個最簡單的、也是常用的經濟學模型叫“柯布-道格拉斯模型(Cobb–Douglas production function)”說,產量(O)跟勞動力(L)和固定資產投資(K)的關係是下面這樣的,

根據這個模型,增加勞動力也好、增加投資也好,對經濟增長的拉動都是有限的,越往後越慢,越往後越貴。

爲啥中國經濟曾經有過那麼快速的增長?因爲當時勞動力、特別是投資本身在快速增長。我們這個模型說的僅僅是經濟”相對於投資“是個撇嘴曲線,但是如果投資本身相對於時間在指數增長,經濟也會跟着相對於時間高速增長。

但是這樣的增長不會一直持續下去。投資不是從天上掉下來的,如果沒有外來或者政府驅動的刺激性投資,投資最終只能由產出決定,會越來越貴。特別過了早期的階段之後,機器設備要折舊,而折舊和固定資產是正比關係。總有一天,你的投資正好等於折舊,經濟就不再增長了。

下面這張圖是考慮了折舊之後的經濟產出曲線,

這也就是說,如果只靠勞動力和投資,一切經濟增長都會有到頭之日。

那如何纔能有可持續的經濟增長呢?這可是一個得了諾貝爾經濟學獎的問題。

0x3:索洛模型

早在上世紀五十年代,美國經濟學家羅伯特·索洛就提出一個經濟增長模型,我們稱之爲“索洛模型(Solow Growth Model)”。這個理論幫索洛拿到了1987年的諾貝爾經濟學獎。值得一提的是2018年的諾貝爾經濟學獎也給了一個增長模型,《香帥的北大金融學課》對此有所介紹。在我看來那個新模型可以說是對索洛模型基礎之上的一個發揮,索洛模型已經把該告訴我們的大道理都告訴我們了。

拋開技術細節不講,簡單來說,索洛模型認爲,長期看來,經濟的產出

其中

  • A代表技術進步
  • L代表勞動力
  • s代表儲蓄率
  • d代表折舊率

首先索洛考慮勞動力有兩個作用:

  • 他們不僅僅是去工廠上班工作,他們還要拿工資
  • 拿了工資會存錢,存的這個錢可以用來投資

經濟產出跟勞動力工作是平方根關係,跟勞動力的投資也是平方根關係,所以跟勞動力本身就成了正比關係!

這可是一個好消息。這意味着如果你這個國家藏富於民,讓老百姓不但能工作還有錢投資,勞動力這一項就能幫你突破撇嘴曲線的限制。

更關鍵的是,索洛中有個“技術進步乘數”,A。經濟產出和和技術進步的平方成正比。這是絕對的微笑曲線!

什麼是技術進步呢?簡單地說就是使用同樣的勞動力人數和同樣大小的固定資產投資,你的產出是別人的一般水平的多少倍。因爲你的技術更先進,你的產出就比別人的產出更值錢,A 代表了你的技術附加值。

爲什麼經濟產出和 A² 成正比?因爲 A 有兩個效應。

  • 一個是 A 能直接增加產出
  • 一個是因爲 A 增加了產出,會導致相對於同樣的折舊,投資也會增加

如果你能把技術附加值變成兩倍,你的總產出就會變成四倍。

使用索洛模型,我們可以分析一下中國經濟是如何增長的。

  • 在經濟非常落後的階段,只要有一點固定資產投資,馬上就能拉動經濟增長。再考慮到中國有很多的勞動力,中國人還很喜歡儲蓄,中國的 L×s 這一項很大。勞動力和固定資產投資給中國帶來了一個長時間的高速增長時期。
  • 但是這個增長是有限的。經濟相對於投資是個撇嘴曲線,會越往後越慢。中國的勞動力人數不會一直增加。想要克服經濟增長放緩的宿命,你就必須得在技術附加值,A,這一項上做文章纔行。

我們中國人一直都熱衷於先進技術,但是請注意,你的技術先進不先進不是跟昨天比,必須跟市場比。經濟學家眼中所謂的先進技術,是使用同樣的人力和物力,你做出來的東西能不能比別人賣更多的錢。

用低價去爭取訂單,本質上相當於還是用更多的勞動力和投資換增長,那樣的技術不叫先進技術。

總結來說,我們可以從經濟模型中得出這麼幾個結論,

  • 第一,讓人樂觀的經濟必須保持一個最起碼的增長率,是微笑曲線。
  • 第二,單純靠投資來拉動經濟增長,是邊際效應遞減的過程,不可持續。
  • 第三,勞動力對經濟增長的貢獻是線性的,這是因爲人同時有兩個作用:既是勞動力,又是投資者,所以要真正發揮人多力量大的優勢,必須讓人民手裏有錢纔行。
  • 第四,長遠看來,只有通過技術創新提高產品的附加值,纔是真正的增長之本。

所以必須實現產業升級,中國纔有出路。如果沒有創新,你不但不能維持高速增長,而且想維持以前那樣的樂觀情緒都不行。

不用數學的話,我們在直覺上也知道投資、勞動力和創新都是能帶來經濟增長的好東西;可是隻有用了數學,你才知道它們好的“程度”是有區別的。模型揭示了經濟增長的祕密:長期看來,只有創新能帶來真正的增長。

這個規律對國家、對公司都適用。

過去幾十年都高速增長就以爲未來也會高速增長,那叫“簡單外推謬誤”。如果不用數學模型,你可能還以爲創新是個錦上添花的事兒。殊不知創新是生死攸關的事。

 

五、傳播公式和”引爆點“

這一章我們要講幾個信息傳播的模型。

不管你感興趣的是新聞傳播、產品的銷售過程還是一首歌曲是怎麼流行的,在科學家眼中,這些事兒都可以和傳染病的傳播進行類比。傳播學在一定程度上就是傳染病學。咱們先借鑑幾個傳染病學的概念。

  • 第一個概念叫“相關人羣”,代表所有可能會感染這個病毒的人的總數。如果你要賣一本書,相關人羣就是所有可能買你這本書的人。請注意我們說的是有意義的可能性,也就是說你真把這本書擺在他面前,他一定會買,你要解決的問題僅僅是怎麼讓他知道這本書的存在。所以相關人羣不等於全中國的人口,相關人羣是你的市場上限。我們用字母 N 代表相關人羣的總數。
  • 第二個概念叫“已感染人羣”,意思是在此時此刻,已經感染了病毒的人數,我們用 It 表示,t 代表時間。
  • 第三個概念叫“未感染人羣”,是此時此刻相關人羣中剩下的、還沒有被病毒感染的人羣,用 St 表示。

現在你只要記住這三個概念就行,其中

信息的傳播,基本上有兩種方式。

  • 一種叫廣播
  • 一種叫擴散

下面咱們分別來看。

0x1:廣播

廣播式傳播,是我們都從公共渠道獲得信息。它的特點是每天的感染概率是一樣的。

比如華爲發佈了“鴻蒙”操作系統,這件事是你從電視新聞或者網上看到的。我們假設你在發佈當天有 30%的可能性被感染,也就是收到消息。那如果你第一天沒看新聞,沒關係,第二天媒體上仍然在報道和討論,你還是有 30%的可能性收到……然後第三天還可能收到……你在幾天之內,終將收到消息。

那你說爲啥每天的概率都一樣呢?這當然是爲了模型的簡化。不過這已經是個很不錯的近似。

廣播的傳播公式是

其中這個 Pb 就是感染概率。通過簡單的數學計算,廣播這種模式的傳播曲線是下面這樣的,

其中橫座標是時間,縱座標是被感染的總人數。

新聞發佈第一天收到消息的人數肯定是最多的,所以我們看到廣播曲線初期的增長速度非常快,越來越慢,最後達到 N,也就是所有人都被感染了。

我們日常通過微信公衆號發文章宣傳一個活動,很大程度上就是廣播式的。

新活動上線會有好幾天飽和式的宣傳,用戶打開得到首頁就能看到。文章打開數銷量也是第一天最高,此後逐漸遞減。

我們假設微信公衆號上發佈一個活動文章,第一天閱讀總數是1 萬人,第二天又有 8 千人閱讀,總人數達到了18000人。那你能不能僅用這兩天的數據,估算一下這個活動總共有多少人閱讀並參與了呢?

套用前面的公式,

  • I1 = PbN = 1萬
  • I2 = I1 + Pb (N - I1) = 1.8萬

簡單解方程就知道,N = 5萬,Pb = 0.2,所以這個文章大約會被閱讀 5 萬次。這就是一個典型的模型訓練過程,

  • 建立一個基本假設模型
  • 然後喂入一定的數據後,最終可以得到模型的參數
  • 基於得到了模型,可以預測未來的結果

這個估算不可能是精確的,比如 Pb 值會有波動變化,讀者的口碑會有影響,但是它不會相差太遠。兩天的數據就已經很能說明問題了。

新聞的傳播、知名品牌發佈新產品之後的銷售情況,基本都是廣播式的。

0x2:擴散

第二種傳播方式叫“擴散”。擴散是人傳人,就好像病毒一樣,我們是被自己接觸到的人給傳染。擴散的特點是已經被感染的人越多,傳染的速度就越快。

我們假定人羣是隨機地混合在一起,那麼擴散傳播的公式是

其中的 Pd 代表擴散傳播的概率,也是一個常數,但是我們看到,這時候新被感染的人數跟已經被感染的人數在人羣中所佔的比例有關。擴散的傳播曲線是我們常說的“S曲線”,

上面這張圖說的是 Google+ 這個服務推出之後,用戶的增長情況。Google 公司並沒有搞大張旗鼓的宣傳,主要靠人傳人。一開始好幾天使用的人數都很少,所以傳播速度也慢,然後終於在第五天迎來拐點。等到相關人羣都用上了,擴散就算結束。整個過程是開始慢、中間快、後來又變慢。

艾滋病的傳播、和手機作爲一個新技術被人們採納的曲線,都滿足S曲線。一開始人們並沒有使用手機的習慣,新聞媒體的說服力並不大。但是等到你發現身邊的人開始用手機之後,你才意識到手機的確有用,你纔會去買手機。對改變生活習慣來說,你的朋友比媒體更有說服力。

大部分傳播都同時具有廣播和擴散的性質,這兩個模型能告訴我們一些道理。我們看到廣播式傳播和擴散式傳播,都是由 P 值和 N 這兩個參數所決定的。這裏面有個有意思的性質:不管 P 值是多少,傳播最終都會達到整個 N 值。

這個性質對市場營銷非常有啓發。

  • 對產品來說,N 值主要由這個產品本身的質量和傳播的終極範圍決定:東西擺在一個人面前,他買還是不買。
  • 而在市場營銷方面,
    • 對廣播來說,P 值代表媒體播出的頻率和強度,N 值取決於媒體的覆蓋面積
    • 對擴散來說,P 值代表人們是否願意分享這個東西,以及人羣之間的關係緊密程度,N 值取決於社交網絡中易感人羣的總數。

爲了增加 P 值,你可能會花很多錢在媒體上搞狂轟濫炸,你可能會給那些能拉來新用戶的人提供獎勵……

可是營銷到底有多大用處呢?如果傳播終將到達整個相關人羣,早期強力營銷的作用僅僅是把這個進程給加快了而已!少花點錢做廣告,你的產品終究也能賣那麼多……嗎?並不是。我們前面的分析少考慮了一個關鍵因素。

0x3:SIR模型

這個關鍵因素是“恢復”。信息會被人忘記,傳染病會痊癒,流行會退潮。如果你感染病毒一段時間之後痊癒了,你就不再是傳染源了。

考慮到這一點,我們引入一個新的概率,叫 Pr, 代表恢復率。這時候新的擴散公式變成 

這個公式叫SIR模型。因爲恢復率的存在,有些信息就不會被傳播到整個相關人羣。

比如一首歌剛出來的時候你覺得挺好聽,就發個朋友圈分享給你的朋友。你的朋友們一聽也覺得好聽,就繼續傳播,這是一個擴散的模式……但你不會每天都爲這首歌發朋友圈。可能幾天之後你就把這首歌忘了,你不再是個分享者,你痊癒了。

一首被人快速遺忘的歌曲,哪怕擺在你面前真的挺好聽,也不會傳播很遠。

那什麼樣的病毒能被傳播開來呢?疾病防控中心的研究者關注一個參數,叫做 R0, 稱爲“基礎繁殖數(basic reproduction number)”,是擴散概率和恢復概率之間的比值:

  • R0>1,這個東西就可以傳播到整個相關人羣
  • R0<1,它就不能發揮全部的潛能,傳播上一段時間後就會自行消亡

R0,纔是真正的引爆點。以前格拉德威爾在《引爆流行》這本書中把前面Google+的傳播圖形中的那個拐點稱爲引爆點,那是不對的。只要 R0 夠高,拐點是必然的過程,根本沒有懸念。

R0,是營銷真正的懸念。

比如你在微博發了一個段子,希望能得到廣泛傳播。

  • 如果人們對這個段子的好感度稍微高那麼一點,擴散概率就會高一點,也許正好超過遺忘概率,你的段子就真能到達整個微博中對它感興趣的人。
  • 而如果你寫得稍微差了那麼一點,R0<1,它就只能小範圍傳播。

如果是擴散再結合廣播式的傳播,這就要求市場營銷的力度稍微大一點,戰勝人們的遺忘概率。

有人計算,流行歌手賈斯汀·比伯的 R0 = 24,比麻疹病毒都厲害。

總結來說,信息傳播和市場營銷的目標都是把信息傳播到整個相關人羣,並且希望相關人羣越大越好。

  • 對成熟品牌發佈的新產品和新聞廣播這種短期的傳播來說,因爲相關人羣就只有這麼大,營銷手段的主要作用是加速傳播的進程。
  • 而對新興的技術和病毒來說,因爲主要依靠人傳人,而且人還有遺忘的概率,營銷能力就變得至關重要,決定了是否達到引爆點。

而不論是哪一種情況,營銷水平都跟產品本身非常有關係。只有產品足夠好,人們的分享和感染概率纔會大。原因也是因爲R0,決定R0的正向因素和反向因素,都和你的產品本身和信息源的價值有關。

那有些公司搞一些假數據,人爲製造一個早期銷量很高的樣子,請問這種營銷手段有用嗎?從這些數學模型看來,我認爲沒用。成熟的用戶不會看見數字高就真的以爲這裏人多、更不會就買,真正起作用的是隱藏在背後的 N 值和 P 值,而假數據改變不了這兩個數字。人爲地把 I1 做大一點,那些虛假用戶不會真的幫你擴散。

 

六、股市的走法(基本上)是隨機的

這一章咱們說說數學家眼中的股市。

經濟學中有一個“有效市場”概念,如果股市是個有效市場,它就不存在什麼靠譜的賺錢機會,股價的所有波動都可以說是沒什麼意義的。看什麼“K線”、什麼“突破位”、“阻力位”之類的概念就都沒用……

那股市是個有效市場嗎?我們要用數學方法來證明這一點。

0x1:Facebook 的走勢

下面是 Facebook 的股價從2012年6月到2013年6月的走勢圖,

我們知道 Facebook 是2012年5月18號上市的,發行價是42美元,而到6月初就跌到了28美元,一年之後,價格是24美元。在這一年裏,Facebook的股價經歷了各種波動,有大波動也有小波動……那麼請問,你能不能以股票評論員的視角,說說這一年中的Facebook都發生了什麼?

我相信一個專業股評人可以從這個走勢圖中看出很多東西來。他結合當年的四份財報,再參考當時的新聞報道,同時跟市場大盤作對比,對每一次波動都能給出一個解釋。他會說這裏是阻力位,這裏是市場信心不足,這裏是觸底反彈,這裏是上升動能耗盡……

但是我想給股評人再看看下面這張圖,其中把同一時期的Facebook,和一支虛擬的股票做了對比,

如果不說,你完全看不出來圖中哪個是真哪個是假,而且請注意,這個假股票的走勢圖可不是人爲故意畫出來的,它是完全隨機生成的曲線。

簡單地說,我們弄一個正態分佈的隨機數發生器,它會每次提供一個-1到+1之間的數,正負概率各佔 50%。如果收到負數,我們就讓第二天的股價往下走一下,如果是正的就往上走一下,這是真正的“隨機行走”。請注意隨機不等於均勻:儘管向上向下的概率嚴格相等,隨機行走也不會一直在原處活動,它也會有連續幾天向上或者向下的情況,會走出很大的波動。

我們看到Facebook股價的真實曲線好像跟隨機行走沒啥根本性的區別。但它們可不只是像。我們有三個證據證明,Facebook這一年的股價波動,幾乎就是隨機的。

  • 第一,隨機行走中每天往上和往下的概率是一樣的。Facebook在這一年的249個交易日中,有127天是往下走,正好佔51%。
  • 第二,隨機行走中今天是往上還是往下,跟昨天的走法應該沒有關係。Facebook連續兩天上漲或者兩天下跌的概率是54%,非常接近於50%這個理論值。
  • 第三,在一年的時間裏,如果是隨機行走的話,我們預期最可能的最多連續上漲天數是8天。Facebook的最多連續上漲天數是10天,也是非常接近。

我們想象一位股評人,看着一張隨機行走生成的股價走勢圖,也會做出各種預測判斷,而殊不知第二天是漲是跌完全是隨機的。

那其他股票也是如此嗎?

0x2:股市是隨機的嗎?

一般的股票在比較長的一段時間裏,都會有一個上漲或者下降的總趨勢。如果經濟形勢和股票的基本面都很好,它在長期一定會上漲,這不是隨機的。但是股市中的日常行爲,用所謂的技術分析去搞微觀操作,那基本上沒有意義。

這體現在,如果我們把這長期的總漲幅拉成一條直線,然後把這條直線作爲“大勢”,從股價波動曲線中減掉,那麼剩下的那些漲落,基本上就是隨機行走。

比如我們使用剛纔說的第二個判據。美國在1950年代到1980年代這段時間,股市連續兩天的走法的確有一點點正相關,比隨機行走的情況好一點。可是1980年代以後,連續兩天走法都漲或者都跌的可能性就正好是50%了,交易員們從那時候起就已經非常、非常理性了,他們把股市變得非常隨機。

所以現在的股市是個相當有效的市場。當然這裏面有個悖論。

  • 如果股市真的是絕對有效,股價走向完全隨機,那人們就不用分析股市規律了……可是這樣的話股市就會變得無效
  • 而如果股市無效,人們就會又願意來分析它的規律,股市又會變得有效。所以任何一個股市都不可能100%有效,還會有一定的規律存在。

我打個比方,這就好比說你在森林裏打獵。如果這個森林中有很多特別好的獵手,那隻要獵物一出現就會被人抓住,所以獵物就會越來越少,也會越來越小,越來越不好抓。但你永遠都不能說森林裏沒有獵物,因爲如果真的沒有獵物,所有的獵手就都走了,走了之後,森林裏又會有獵物。

所以現實是森林裏總會有些小小的獵物,股市中總會有些小小的規律可以讓人獲利。

比如在1990年代,有人發現一個效應叫“一月上漲效應”。每年聖誕節股市封盤之前,很多交易員爲了能安安心心過個年,會把手裏持有的股票給賣了。所以12月底的時候,股價會稍微低一點。過完新年交易員們回來上班,又會再買股票,這就導致一月初的股價會相對於十二月底有一個上漲。

這個現象在1990年代確實存在,但是今天已經不存在了。爲什麼?因爲規律一旦讓人發現,就會被逆向操作。現在我知道一月份股價會上漲,那我就應該在十二月底買一些股票,等到一月賣出!等到人們利用這個規律賺錢的時候,這個規律就消失了。

我們前面說的隨機行走是用一個正態分佈的隨機數產生器決定怎麼走,但是你可能聽說過,塔勒布認爲股價並不是正態分佈的,股市中存在泡沫。那我們是否可以利用人們的非理性心態賺錢呢?其實也不能。

我們可以用一個長尾的分佈做隨機行走,去模擬一個有泡沫的股市。而能這麼做,就這說明有泡沫的股市也是隨機的,只是換了一種隨機的方式而已!你明知有泡沫,可你依然掙不到錢。

舉個例子。1997年,有一家很成功的避險基金叫“長期資本管理公司(Long-Term Capital Management,LTCM)”,發現俄羅斯的債券定價和美國的債券之間有個差距,認爲可以利用這個差距掙錢。他們下了很大的賭注,上了槓桿,想要賺一票大的……結果萬萬沒想到,俄羅斯債券宣告破產,LTCM公司倒閉。後來他們期待的那個趨勢真的來了,但是他們沒趕上。

這個道理是就算你預見了一個規律,可是因爲你無法精確判斷這個規律什麼時候發生,你還是賺不到錢。你覺得那是個泡沫,你相信它”終將“破滅,可是你不知道泡沫”什麼時候“破滅。

所以如果你不是森林裏最精明的獵人、能發現別人發現不了的規律,做長期投資是唯一理性的選擇。在趨勢的背景之上,一切波動都是幾乎是隨機的。而事實上,如果股市非常有效,你就算長期投資也賺不到大錢……

比如在1967年到2017年這50年間,美國的 GDP 擴大了4倍,同時美國股市的平均股價,考慮到通貨膨脹因素……也漲了4倍。對美國這種特別有效的市場來說,股市基本反映了國家的經濟增長狀況,它本質上並不是一個讓人實現夢想的地方。

那到底有沒有特別厲害的獵手、能捕捉到罕見的機會呢?難道巴菲特的成功也純屬運氣嗎?

0x3:巴菲特真有水平嗎?

我們知道巴菲特的伯克希爾·哈撒韋公司表現的確很好,從1965年到2014年這50年間,巴菲特有42年打敗了市場大盤。如果你當初花了1塊錢買了伯克希爾的股票,現在值1萬塊錢。而與此同時標準普爾指數只漲了 23 倍。

像這樣的業績,有沒有可能純粹是因爲運氣好呢?數學可以幫你判斷。

我們設想,如果巴菲特是每年在標準普爾的基礎上做隨機行走,他有50%的可能性打敗市場,50年下來,他平均應該打敗市場25次,而這個統計的標準差是3.5次。

可是巴菲特贏了42次,這個成績,是在四個標準差之外。如果純粹是運氣,這件事發生的可能性是一百萬分之一。當然有些彩票中大獎的概率低於一百萬分之一,也有人中獎。所以你願意相信巴菲特是真有水平呢,還是買彩票中了大獎呢?

我願意相信巴菲特是真有水平。但是從這件事中我們也可以看到,想要判斷一件事兒是真實的因果驅動的還是隨機事件,那是非常困難的。而且別忘了巴菲特並不是操盤手,他喜歡做長期投資。

  • 到底是信號,還是噪聲?
  • 到底是趨勢,還是波動?

我們的大腦非常善於在沒有規律的地方找出規律來,而這也是一種迷信。數學模型可以讓你清醒。模型思維有一個滅high的效果。

我希望你下一次發現什麼重大賺錢機會的時候,能先想一想這個機會所在的市場是不是有效市場,然後再想一想 Facebook 那一年的走勢。

操盤手認爲自己的每一個動作都有道理,也許真的有道理。但是因爲大家都有道理,湧現出來的結果跟隨機實在太像了,能看見的相關性都實在太弱了,以至於根本沒有什麼大機會,好成績很大程度上都是好運氣。有沒有道理不重要,有沒有機會纔是關鍵。

 

七、馬爾可夫宿命論

我先給你講兩個故事,你看看其中有沒有什麼規律。

  • 第一個故事叫“捐款”。

我們知道美國很多地區的公立學校系統有衰敗的趨勢,生源、政府投入和師資力量都不太行,學生的考試成績很差。有些熱衷於公益事業的富豪看到這個情況,就想採取行動。

2010年,Facebook的創始人扎克伯格,給新澤西州紐瓦克市的公立學校系統捐款一億美元。這是一筆鉅款,再加上別人匹配的捐款,相當於給這個地方每個學生六千美元。這筆錢可以用來改善教學條件、給教師提高待遇,還可以給學生髮獎學金!那這筆錢能起到怎樣的作用呢?

結果是過段時間再考察學生的成績,沒有任何提高。扎克伯格的錢,白花了。

  • 第二個故事叫“情緒”。

你有一個朋友因爲失戀而情緒失控,說自己抑鬱了。這已經不是第一次,但是你非常關心他,就專程飛到他身邊,陪他度過了幾天愉快的時光。你明顯地感覺到這幾天他確實很開心,他還表態說以後要保持陽光的心態,積極生活。你放心地回去了。

可是過了沒多久,你朋友說因爲感情受傷太深,實在不能安心上班,辭職了。

兩件事的共同點是,想要一次性地採取一個行動去改變某件事,結果徒勞無功。不管你付出了多少努力,事情總會回到老樣子,就好像冥冥之中有個無法擺脫的宿命一樣。

數學模型能告訴你其中的原理。

0x1:宿命

這個模型叫“馬爾可夫(Markov)過程”,以俄國數學家安德烈·馬爾可夫命名。

比如有一位老師,發現課堂上總有學生無法集中注意力,會溜號。所謂馬爾可夫過程,就是假設學生在“認真”和“溜號”這兩個狀態之間的切換概率,是”固定“的,

我們設定,今天認真聽講的學生,明天依舊認真的概率是90%,還有10%的可能性會溜號。而今天溜號的學生,明天繼續溜號的可能性是70%,剩下30%的可能性會變得認真。

咱們看看這個模型怎麼演化。假設總共有100 個學生,

  • 第一天認真和溜號的各佔一半。
  • 根據概率設定,第二天,50個認真的學生中會有5人變成溜號;而溜號的學生中,會有15人變成認真,所以第二天是有 50-5+15 = 60個人認真,剩下40個人溜號。
  • 繼續演算,第三天應該有66個認真的,34個溜號的……
  • 以此類推,最後有一天,你會發現有75個認真,25個溜號的。

而到了這一步,模型就進入了一個穩定的狀態,數字就不變了。因爲下一天會有7.5個學生從認真變成溜號,同時恰好有7.5個學生從溜號變成認真!

而老師對這個穩定態很不滿意,爲什麼只有75個認真的呢?他安排了一場無比精彩的公開課,還請了別的老師來幫他監督學生。這一天,100個學生都是認真的。

但這樣的干預對馬爾可夫過程是無效的。第二天認真的學生就變成了90個,第三天就變成了84個,……直到某一天,還是75個認真和25個溜號。

你看這個情形是不是很像咱們前面說的那位失戀的朋友。他的情緒有“愉快”和“失控”兩種狀態。他愉快的時候有 10% 的可能性變成失控,他失控的時候有 30% 的可能性變成愉快,那麼不管你的干預能他連續愉快多少天,只要你不再幹預了,他終將回歸到75%的比例愉快、25%的比例失控的日常狀態。

馬爾可夫過程有一個固定的宿命。這不是巧合,這是數學定理。

0x2:定理

咱們先嚴格地說說什麼叫馬爾可夫過程。馬爾可夫過程要求滿足四個條件,

  • 第一,系統中有有限多個狀態。比如“認真”和“溜號”,就是兩個狀態。
  • 第二,狀態之間切換的概率是固定的。比如從認真到溜號的概率永遠都是 10%,保持不變。
  • 第三,系統要具有遍歷性,也就是從任何一個狀態出發,都能找到一條路線,切換到任何一個其他的狀態。
  • 第四,其中沒有循環的情況,不能說幾個狀態形成閉環,把其他狀態排斥在外。

而數學定理說,只要是馬爾可夫過程,不管你的初始值如何,也不管你在這個過程中有什麼一次性的干預,它終究會演化到一個統計的”平衡態“:其中每個狀態所佔的比例是不變的。

就好像終究會有 75% 的學生認真,25% 的學生溜號。

馬爾可夫過程,都有一個宿命般的結局。

那你說生活中有哪些事兒是馬爾可夫過程呢?很多。四個條件中只有第二個條件是關鍵,也就是狀態之間切換的概率是固定的。很多事情就是這樣的。

  • 不發達地區的很多人會因爲疾病而不得不去借債,還不上債務就變成了貧困戶。現在政府要扶貧,說我乾脆一次性地給窮人發一筆錢,讓他們把債都還了,以後好好過日子,這行不行呢?馬爾可夫模型說不行。你並沒有改變他下一次得病或者欠債的概率。你改變的現狀僅僅是一個初始條件,只要概率不變,他的宿命終究不變。
  • 再比如說美國的窮人經常失業,而在很大程度上失業是自己的原因。他可能因爲不按時上班被老闆開除了,也可能因爲跟老闆有點小矛盾一怒之下辭職了。那如果你改變不了他對工作的態度,哪怕你一次性地給所有窮人都安排工作,你也改變不了窮人的命運。

馬爾可夫模型,真是“江山易改本性難移”、“授人以魚不如授人以漁”這些話的數學原理啊。

咱們再說一個真實的例子。世界上所有國家可以分成三類:

  • 自由國家
  • 半自由國家
  • 不自由國家

這三種國家狀態是可以互相轉換的,

  • 一個不自由的國家哪天想通了,就可能變成半自由或者自由的國家
  • 一個自由國家萬一選一個獨裁者上臺,也可能變成不自由國家。

歷史數據表明,不自由國家在五年之內變成自由國家的可能性大約是5%,變成半自由國家的可能性是15%,繼續保持不自由狀態的概率是80%……下面這張表格列舉了三種狀態之間切換的概率,

同時我們還知道,從1975年到2010年,這三種國家在全世界所佔的比例是下面這樣,

圖中總體來看,自由國家是越來越多,不自由國家是越來越少。一個不懂數學的人看到這張圖可能會說,哈!自由是大勢所趨,將來所有國家都會變成自由國家!殊不知這就犯了簡單外推謬誤。

事實上,既然三種國家狀態切換的概率是幾乎固定的,這就是一個典型的馬爾可夫過程,那麼最終結果必定是一個三種國家按照一個固定比例分配的穩定狀態。數學計算表明到2080年,世界上將會有62.5%的國家是自由的,25%的國家是半自由的,12.5%的國家是不自由的……

只要切換概率不變,世界上始終都會有不自由的國家。

0x3:用途

馬爾可夫模型有很多應用。比如 Google 做搜索引擎,希望按照人們訪問的熱度給網頁排序,但是Google並沒有每個用戶實際點擊哪個網頁的數據,它怎麼辦呢?它使用一個叫做 PageRank 的算法,其中就用到馬爾可夫模型。

Google 能知道的是各個網頁之間互相鏈接的情況。我們把網頁想象成狀態,那這些鏈接就相當於描寫了馬爾可夫過程中狀態之間切換的概率。那麼根據前面說的定理,網頁被點擊的比例終究是一個平衡態。Google 就可以計算出來,在統計平衡態之下,每個網頁獲得點擊率的比例是多少,按照這個比例排序。

連有些意想不到的事兒,都是馬爾可夫過程。

我們知道有一本著名的政治文獻叫《聯邦黨人文集》,是由三位美國政治家,亞歷山大·漢密爾頓、約翰·傑伊和詹姆斯·麥迪遜在1787到1788年間共同寫作的。文集中有85 篇文章,可是因爲三人使用了同一個筆名,人們並不知道到底哪篇文章是誰寫的。

後世的歷史學家經過多方考證確定了其中大部分文章的作者,但是還有那麼幾篇,歷史學家表示無能爲力。於是統計學家就出手了。

統計學家說,一個作者寫文章的用詞習慣,其實是個馬爾可夫過程。

比如英文中有個短語是“for example”,而人們也會經常說“for the……”,對某一個作者來說,for 後面接 the 的概率,是接 example 的4倍。這就是一個用詞習慣問題。比如我經常說“但是請注意”,而有的作者可能更喜歡在“但是”後面接一個逗號。

我們可以把每個常用詞都想象成馬爾可夫過程中的一個狀態。因爲每個作者的用詞組合習慣非常固定化,統計學家就可以給每個人都做一張馬爾可夫狀態切換概率表。那麼把一篇文章中相應詞彙的馬爾可夫概率表跟這個作者概率表進行對比,就可以知道這篇文章是不是他寫的。

使用這個方法,統計學家判斷,懸而未決的那幾篇文章,最符合詹姆斯·麥迪遜的寫作風格。

馬爾可夫模型這麼有用,說明“本性難移”是個常見現象。

但是請注意,生活中有些事情是“路徑依賴”的,意味着後面發生的概率會根據之前發生的事情做出改變。比如原本有兩種高清電視標準勢均力敵,而你如果能一次性地說服幾個重要廠商採納其中一個標準,那其他的廠商爲了兼容性,就會跟着選擇這個標準。

而馬爾可夫模型說的則是那些概率不隨以前的歷史發生改變的情況。那你說到底什麼情況下用路徑依賴,什麼情況下用馬爾可夫呢?你得靈活判斷。

一個酗酒的人,你看着他一週時間不讓喝酒,並不足以改變他酗酒的概率;但是如果你有辦法讓他連續一年不喝酒,也許他就真戒酒了。逢年過節找一幫志願者去養老院給老人送溫暖,不足以影響老人長期的精神狀態;可是如果養老院弄個生活方式改革,也許就會有實際效果。

馬爾可夫模型解釋了歷史的怪圈,它給我們的教訓是歷史很難改變。臨時性的措施往往沒長久的作用,本性的力量很強大。有些公司換個開明的領導人,可能幹幾年都挺好,之後又會走到老路上去。想要改變歷史,你得改變機制。

 

八、騷亂的閾值

這一章的主題是閾值模型。

0x1:騷亂的模型

像街頭騷亂、足球流氓鬧事和示威遊行這種事情,大部分參與者都有一種從衆心理。有些人真是唯恐天下不亂。有些人可能有想法但是不敢幹,得別人幹了他纔會幹。還有更多的人,是本來沒想法,是看到很多人蔘與了,他跟風參與。

據此,社會學家馬克·格蘭諾維特(Mark Granovetter),就是以發明了“弱聯繫”這個概念聞名的那個社會學家,提出了一個帶閾值的騷亂模型。這個模型說每個人都有一個參與騷亂的閾值。比如我的閾值是100,那就是說我當且僅當看到街上已經有至少100個人參與,我就參與。

那麼根據這個模型,我們設想有一千個人有可能會參與騷亂,看看是什麼樣的情形。咱們考慮三種情況。

  • 第一種情況是每個人的閾值都是10,也就是每個人都需要等到街上有至少10個人參加騷亂才參加,可因爲每個人的閾值都是10,就沒人帶頭,結果騷亂就不會發生。
  • 第二種情況,有5個人的閾值是0,有10個人的閾值是1,其餘所有人的閾值都是20。一開始就會有5個人站出來,另外10個人看到已經站出來的5個人,也會參與進來。可是這15個人之後,就沒有第16個人加入了,因爲剩下的人閾值都是20!騷亂也不會發生。
  • 第三種情況,這一千人的閾值分別是0、1、2、3……一直到999。那麼第一個人會站出來,第二個人看到第一個人站出來,也會跟着站出來……以此類推,所有人都會參與到騷亂之中。

這三種情況的推演,告訴我們幾個道理。

  • 首先,騷亂是否發生,並不僅僅是由所有人的平均閾值決定的,而是由閾值的具體分佈情況決定的。第一種情況每個人的閾值都是10,這個閾值很低,可以說大家都有相當強的騷亂意願,但就因爲缺少10 個帶頭的人,騷亂就沒有發生。而第三種情況絕大多數人的閾值都很高,可以說大部分人都是老實人,但恰恰因爲其中有帶頭的、有早期就追隨的,騷亂反而發生了。
  • 第二個道理就是你很難預測一場騷亂是否會發生。騷亂具有偶然性。
  • 最關鍵的道理,當然是領頭的人非常重要。你要想防止騷亂,最首要的就是要打擊帶頭的,看誰想出頭就趕緊把他摁住……

這個原理很有普遍意義。比如我們聽領導做個報告,其實講得也不怎麼好,爲啥時不時總有熱烈的掌聲呢?關鍵得有人帶頭鼓掌。鼓掌是一個非常社會化、非常從衆的活動,類似於騷亂。

再比如在全球發生的MeToo運動。本來讓一個女性站出來說自己被性騷擾,是非常困難的事情,但有些人率先站出來了,有些人跟進了,它就成了一場運動,進而成了一個時尚話題。再比如人們對同性戀婚姻的態度轉變、流行時尚、比特幣、金融泡沫,都有這樣的特點。

閾值模型告訴我們騷亂具有不確定性和不可控性。有時候你不想要騷亂可是騷亂髮生了,有時候你想要騷亂可是發生不了。

0x2:雙騷亂模型

比發起一場騷亂更難的,是發起兩場騷亂。

有個公司叫Airbnb,它的業務是共享住房。比如你在杭州有一套短期空閒的房子,你可以在Airbnb上發個廣告,臨時租給遊客住幾天。而這個業務能建立起來,非常困難。

想讓遊客能想起來到你這個網站上查詢有沒有空房,首先你的網站上得有大量的租房信息纔行……可是想讓出房主們願意到網站上來發布出租信息,他們得首先看到網站上有大量的遊客纔行。那到底是先有遊客,還是先有信息呢?

我們以前講過尤德考斯基的《不充分均衡》這本書,其中有個概念叫“兩因素”均衡:必須同時滿足兩個因素,這個均衡市場才能建立起來。這樣的均衡特別難建立,但是一旦建立起來也特別難以被撼動。

Airbnb 曾經失敗過兩次。最後成功的辦法是公司派人挨家挨戶去找有空房的人,幫這些人制作租房信息。有了信息,還得再做廣告,才能吸引到遊客來看信息。你得做這麼多前期的工作,業務纔有可能開展起來,第一波參加騷亂的人,比第一桶金還難得啊。

這就叫“雙騷亂模型”。

社會現象有時候是很神奇的。博弈論專家托馬斯·謝林,也貢獻了兩個有意思的閾值模型。

0x3:隔離模型

觀察現在的美國社會,一方面種族平等是絕對的政治正確,誰也不敢歧視誰;可是另一方面,黑人和白人常常是居住在不同的社區,可以說有個事實上的種族隔離。托馬斯·謝林用數學模型說明,哪怕人們本來沒有種族隔離的意願,哪怕人都是很包容的,一羣人也會形成事實上的隔離。這是爲什麼呢?

咱們考慮這麼一個局面。現在有兩個緊挨着的房間,中間有一道門,一羣人正在這兩個房間裏開party。我們假設這一羣人是20個男性和20個女性。大家都是思想開放的人,沒有什麼性別隔離的意識,都既可以和同性也可以和異性在一起聊天。我們還設定,人們可以自由地在兩個房間來回走動。

開放是開放,我們假設人們還是有一定的性別閾值。比如說我作爲一個男性,本來是和男女都能聊,但是如果我發現這個房間裏除了我之外都是女性,我也會覺得這樣的局面有點怪,我就會想要跑到另外一個房間去,我不想成爲絕對的少數派,這個要求不過分吧?

開始兩邊的房間都是有男有女,人們在兩個房間之間隨機地走來走去。既然是隨機的,只要經過足夠長的時間,某個房間裏的人數,就會達到一個臨界狀態。

比如說,一個房間中現在有 14 個男性和 2 個女性。我們可以想象,這時候如果其中一個女性離開房間,剩下的那個女性就也會離開這個房間,使得房間裏只剩下男性。然後另一個房間裏的男性作爲少數派也會很願意過來。這就出現了事實上的性別隔離。

這個故事聽起來有點怪,但是生活中就真的有這樣的事情,比如說職業選擇。可能本來男性並不排斥去做一個護士或者幼兒園老師,但是當他發現從事這兩個職業的絕大多數都是女性的時候,他大概也會選擇別的職業。這裏面沒有任何性別歧視!只是一個閾值問題。

謝林的另一個模型能解釋爲什麼總是黑人和黑人一起住、白人和白人一起住。我們設想一開始大家都是混合居住的,並沒有誰歧視誰。

但是種族畢竟是個客觀存在的現象,人們難免會對自己同種族的人有一種親近感。如果你是個白人,你可能不介意旁邊有個鄰居是黑人,但是你可能也不希望周圍全是黑人。你會有一個閾值,希望自己家四周至少有一家或者兩家是同種族的人,這個要求不過分吧?

而計算機模擬表明,如果人們因爲這麼簡單的原因而搬家,幾輪之後,就會形成黑人和黑人一起住,白人和白人一起住的局面。

騷亂也好,隔離也好,它們有一個共同的特點:參與者很可能根本就沒想要一個極端的局面,可是像騷亂和種族隔離這種極端局面居然就發生了。大多數人根本不愛出來湊熱鬧,卻參加了一場騷亂;大多數人根本沒有歧視思想,卻參與了種族隔離。

托馬斯·謝林據此提出一個學說,說每個人作爲個體的“微觀意願”,和人羣的“宏觀行動”,完全可以是非常不一樣的。溫良的意願也許會帶來糟糕的集體行動。

 

九、”市場定位“是道幾何題

我們要用數學模型研究“市場定位”這個問題。

商界的人喜歡談市場定位:

  • 你這個產品主打什麼功能?
  • 什麼價格?
  • 面向什麼樣的消費人羣?

但定位並不僅僅是個商業問題,比如政客就也要講定位,

  • 你支持什麼反對什麼?
  • 你主打什麼議題?
  • 你的基本盤是誰?
  • 你要爭取哪些選民?
  • 等等

談論市場定位我們還必須考慮競爭對手的情況。

  • 現在這個市場中有多少玩家?
  • 這是一個藍海市場、黃海市場還是紅海市場?

這些說法你可能已經很熟悉了,但是我相信,數學模型可以幫你看得清楚。而看清楚了,你就能獲得一些洞見。

我們先說一個關鍵概念,叫“屬性的維度”。

0x1:一維問題

我們想象這麼一個場景。在一條直線形的海灘上,有兩家賣冰激凌的小攤,A 和 B,像下面這張圖中這樣,

圖中每個黑點代表一個消費者。我們假設這兩家的冰激凌的價格和味道都是一樣的,那麼消費者決定去哪家買,就只和距離有關:他們會去距離自己最近的冰激凌攤。

這個場景我們以前講博弈論的時候說過,但這裏我想用它說明一個概念:“屬性”。這兩家冰激凌攤競爭的只有一個屬性,那就是距離。它們所謂的不同定位,就是距離上的差異。

表現在數學上,這就是一個一維的問題。我們畫一條線,兩家冰激凌攤的定位就在這條線上。我們把這條線叫做“屬性空間”,也就是市場上各路玩家爭奪的領地,對這個問題來說,屬性空間是一維的。

而有了空間和定位,就要劃分地盤。圖中在A、B兩點正中間的那條豎線就是兩家地盤的分界線,分界線左邊的消費者都會在A家買,右邊的消費者都會在B家買。

這個一維屬性完全可以是別的東西。

  • 換一個場景,A、B可以是在同一個位置賣不同口味的冰激凌商家,可能一個奶油多一個奶油少,這也是一維定位。
  • 我們還可以把A、B想象成兩個政客,他們的政治立場一個偏左一個偏右,那麼顯然左邊的選民會支持A政客,右邊的選民會支持B政客。

不管是什麼屬性,只要是一維的,我們就可以如圖中那樣劃分地盤。

而根據博弈論,這個一維的問題有個最優解。冰激凌攤應該擺在海灘上正中間的位置。對政客來說,他應該把所有選民從左到右排隊,然後自己選擇排在中間的那些選民的立場,這個道理叫“中間選民定理”,政治選舉演化到後期,總是中間選民的立場最容易被政客代表。

那你可能就會問了,爲什麼真實世界裏的政客並不都是採取中間立場的呢?爲什麼真實世界裏商品的口味什麼都有,並不都在中間呢?

那是因爲真實世界不是一維的。

0x2:二維維度

真實世界裏的商品常常會在多個屬性上爭奪消費者。

咱們考慮一個兩維的局面,賣巧克力。假設巧克力有兩個維度,

  • 一個是可可粉的濃度,有人喜歡重口味有人喜歡輕口味
  • 一個是糖的濃度,有人喜歡甜的有人喜歡淡的

用數學模型表現,二維的屬性空間就是一個平面的圖形,

圖中橫座標表示可可粉的濃度,縱座標表示糖的濃度。A和B是兩個品牌的巧克力,各自吸引不同的人羣。我們連接AB,對這條線做中垂線,這個中垂線就是A和B地盤的分界線。從幾何學上來說,分界線左邊的消費者的口味偏好距離A更近,他們會選擇A品牌,右邊的消費者則會選擇B品牌。

那現在假設你面對這個市場格局,也想做一個自己的巧克力品牌,我們稱之爲C品牌。那你的定位應該放在哪裏呢?

產品定位不是一個直覺問題,不是說你喜歡什麼樣的產品就做一個什麼樣的產品。你必須考察市場上已經有哪些產品,他們的定位都是什麼樣的。

你畫一張圖,看看消費者的分佈情況,看看別人的地盤中有什麼薄弱的地方,算算自己定位在哪裏能搶佔最大的地盤和最多的消費者。

你需要數學思維,更準確地說是幾何學思維。比如如果C產品定位在高可可粉低糖的右下角,三家的勢力範圍就會按照下圖劃分,

然後你還要考察這個區域中有多少消費者。所以你看,市場定位其實是一道幾何題。

  • 成熟的市場中消費者是根據你產品的定位決定是否購買
  • 成熟民主政治中的選民是根據政客的立場投票。

美國議員和大法官的政治立場在很大程度上是非常穩定的,他們都有自己的定位。要得到我這一票,你長得好不好看、甚至你是不是好人都不重要,重要的是你贊成什麼、你反對什麼。

幾何學思維馬上就能給我們一個洞見,那就是如果至少有兩個屬性維度,“中間選民定理”就是不成立的。這是因爲從二維平面中的一點向四周看,會有無數個方向,那麼除非選民是絕對均勻分佈,你不可能保證每個方向上兩邊的選民都正好一樣多。

比如我們看下面這張圖,

圖中每個“v”代表一個選民,總共有5個選民。圓圈處的那個政客採取最中間的立場,看起來離所有選民都比較近。可是另一個政客馬上就可以在方塊那個位置插入!兩人劃分勢力範圍,方塊的地盤小,但是裏面有3個選民,是個多數。

這個道理是隻要屬性達到二維以上,產品定位就只有一個往中間走的趨勢,而不是必須位於中間。這裏面沒有必勝的定位!

用數據的思維方式理解就是,在真實世界中,因爲選民的分佈並不是均勻的,所以選民代表的多位平面數據集是「線性不可分」的。

正是這個數學性質保證了市場的多樣性。我們看到真實世界裏的市場中什麼樣的產品都有,總有新品牌進入的機會。

而這本質上是個幾何學的道理……幾何學還能告訴我們更多東西。

0x3:定位與價格

我們前面講的都是對“屬性”的定位,特點是不同消費者對屬性的偏好不一樣。而產品還有一些別的特性,則是全體消費者有一致的偏好,比如說價格,全體消費者都希望價格越低越好。

這就意味着,同樣屬性的商品,如果我把價格降低一點,那我的勢力範圍就應該擴大一點。比如說,如果A家的冰激凌降價,那麼有些消費者就會寧可捨近求遠,也要選擇它家的冰激凌。當然不同消費者對價格的敏感度不一樣,但是平均而言,我們可以認爲人們在總體上,會爲了多省一塊錢,而放棄一點對屬性的要求。

那麼我們就可以設定,消費者選擇商品使用的效用函數,應該跟商品的價格成正比。而這也就意味着,一款商品降價,就相當於把它的邊界線向外平移了一段距離。

那價格戰有多大用處呢?咱們看下面這張圖,

圖中 A、B 兩個品牌本來已經分好了勢力範圍。現在B決定降價,結果就是B產品的勢力範圍會往左移動一點,B的領地變大了。

但是領地變大可不一定能彌補降價帶來的損失。我們設想A和B原本各佔50%的地盤,現在B把價格降低10%,這個舉動使得他的地盤從50%擴大到了54%。如果消費者是均勻分佈的,那這也就是說,B的地盤擴大了8%,可是價格降低了10%,這相當於總收入下降了3%。所以B根本就不應該降價!

B不應該降價的根本原因是B原本的地盤太大了,它面對的是一個沒有多少競爭對手的、稀疏的、藍海市場,一旦貿然降價,價格損失會非常大。

那我們再看看擁擠的紅海市場是什麼樣的情形,

上圖中市場上有很多家品牌,每家的地盤都很小。B同樣把價格下降10%,因爲消費者眼中的一塊錢就是一塊錢,B的邊界線會向外平移同樣的一段距離。而這次擴充邊界,對領土很小的品牌來說可就太重要了。B的地盤擴大了三分之一,即便考慮到降價,總收入也提高了20%。這個價格戰應該打。

這兩個例子給了我們一個洞見:要不要打價格戰,和市場的擁擠程度有關係。

  • 如果競爭對手很少,你面對的是一個藍海市場,那你降價只會傷害自己的收入。
  • 如果競爭對手很多,你面對一個紅海市場,價格戰就能立即擴大你的市場份額,就很有效。

那市場的擁擠程度和什麼有關呢?和屬性維度有關。

  • 比如像成品油啊、標準小麥這種商品,誰家生產出來的都是一樣的,等於說屬性維度是 0,那價格就是唯一重要的因素。
  • 而像海灘上的冰激凌,至少還有位置這麼一個因素,是個一維市場,有些商家仗着地利就可以拿個高價。
  • 屬性空間的維度越多,各個品牌就越容易找到屬於自己的市場定位,在那裏不需要面對很多競爭對手,就越沒必要打價格戰。

以前蘋果幾乎是高端手機市場唯一最好的品牌,它當然可以要一個高價。蘋果從來不打價格戰,它擁有市場上最高的利潤率。但是現在隨着華爲之類中國品牌的崛起,蘋果在屬性空間上的領土正在被人入侵。如果將來蘋果不再具有獨一無二的技術優勢,它就必須降價。

所以最好的創新應該是發明一個新的屬性,打開一個新的定位維度,在那個維度上沒人能跟你競爭,只要消費者對你認可,你就可以要一個高價。

總結來說,模型思維能把“市場定位”這個問題變成幾何學問題。產品的品質屬性決定了定位空間的維度:一維就是一條線,二維是一個平面,三維是一個立方體,還可以有四維、五維。每一個定位都是屬性空間中的一點,各個品牌根據定位劃分地盤。

  • 維度越低,屬性空間就越容易擁擠
  • 空間越擁擠,各家就越容易打價格戰……

所以只有屬性維度上的創新才能帶來真正的藍海,才能真正有可能獲得一個高的溢價空間。

那你可能會說,這些道理我都懂啊!你可能懂,但是如果不用數學,你所謂的懂就都是一些直覺:你知道這個道理重要,但是你不知道這個道理有”多麼“重要。你不會把問題量化,你就不容易做出精確的決策。

 

十、什麼是”好“的複雜

這章,我們要講一個特別重要也特別美好的數學概念,叫“李雅普諾夫函數(Lyapunov function)”,它是以俄國數學家亞歷山大·李雅普諾夫命名的。這個東西已經有超過一百年的歷史,但是並沒有在民間流行。

理解了李雅普諾夫函數,你就能領略一點數學家的思維方式,看看數學家如何從一個問題中提煉出一個好思想,然後把它推廣到其他問題中去。你還可以獲得一個對世界的洞見,然後用這個洞見去處理一些真問題。

我們想研究複雜系統的均衡態。

均衡,我們已經說過多很多次了。

  • 博弈論裏有“納什均衡”
  • 經濟學講的“有效市場”也是均衡
  • “馬爾可夫過程”最終也會走向一個均衡。

什麼是均衡呢?說白了,就是不管你這個系統有多複雜,不管一開始有多麼動盪,它最終會達到一個穩定的、井井有條的狀態。比如我們身處的現代社會很複雜,每個人都是自由的,你今天上班也行,請假不上班也行,你願意購物還是旅行都可以,可是整個社會不會亂,不會動盪不安,這就是均衡。

我們要問的是,一個複雜系統需要滿足什麼樣的條件,才能確保會達到均衡呢?這個問題聽起來很難,但是數學家找到了一個特別簡單的解,這就是李雅普諾夫函數。

0x1:李雅普諾夫函數

咱們想象一個虛擬的場景。從今年開始,美國每個州都實行一項福利政策,給最無助的窮人發放補貼金。有的州給每人發1000美元,有的州發800美元。這是一個獻愛心的事兒,各州都要表示一下,但是又都不想比別的州發得多,不然困難人羣就都搬到你這個州來領補貼了。

我們設想一個這樣的數學模型。第一年,各州都不知道別的州發多少錢,給的數額都比較隨意。從第二年開始,每個州發放的數額,都至少要比前一年所有州平均值的2/3,再少一塊錢。

那請問在這種情況下,經過若干輪的演化之後,系統會達到一個什麼樣的狀態?

答案是一個最終每個州都不給錢的均衡態。

這個道理比較容易想明白,但是咱們使用一個正規的證明方式。我們設想這麼一個函數 L:L = 每年給錢最多的州給了多少錢

咱們看看 L 的取值會怎麼變化。不管第一年 L 是多少,第二年的 L 肯定會比第一年的 L 的2/3還要至少要少一塊錢,……以此類推。L 顯然滿足下面這兩個條件,

  • 1. L 的取值,每一步都比前一步至少要減少一個固定的數值;
  • 2. L 存在一個最小值。

滿足這兩個條件的函數,就叫李雅普諾夫函數。比如對咱們這個問題來說,不管前一年的 L 是多少,這一年的 L 至少比它少 1 塊錢;而 L 的最小值是 0。

那麼數學家提出一個定理,說對於任何複雜系統,只要你能在其中找到一個李雅普諾夫函數,這個系統就終將會演化到一個穩態。

爲啥呢?因爲系統演化的每一步,L 都至少要減少不是無限小的一點點,這叫“不怕慢,就怕站”,而 L 還有個最小值,所以 L 就終歸會達到那個最小值。而到那個時候,就意味着系統進入了一個不變的狀態,這就是一個均衡態。

減少福利的例子能幫你理解這個思想。各個州減少福利的遊戲不會一直玩下去,等到減無可減,也就是大家都是 0,自然就是均衡。

現在咱們把這個思想再用一次。

0x2:自組織

社會活動爲什麼是一個均衡態呢?以前亞當·斯密提出“看不見的手”這個說法,說市場可以自動調節每個參與者的活動,更現代的學者把個現象叫做“自組織”。可是到底爲什麼看不見的手這麼有效,其實我們還需要一個數學證明。

我們考慮這麼一個社會系統模型。社會中有多個地點,比如有咖啡館、有健身房、有面包店等等,每個人可以任意選擇在某個時刻去某個地點消費。時間長了之後大家都形成了各自的消費習慣。那麼我們可以證明,這些習慣將是一個均衡態,每個地點都不會特別擁擠或者特別冷清,一切都井井有條。

想要證明這一點,你只要能找到系統的一個李雅普諾夫函數就行。

我們先定義一個概念,叫“擁擠度”。對個人來說,你的擁擠度,就是在同一時間和同一地點,跟你一起做同一件事的人數。比如我到一個咖啡館喝咖啡,如果除了我之外,現在還有20個人也在這裏喝咖啡,我的擁擠度就是20。

然後我們定義這麼一個函數 L,L = 全社會總的擁擠度,也就是把所有人的擁擠度加起來之和。

好,現在我們可以證明,如果社會上的人都比較理性,L 就是一個李雅普諾夫函數。

比如有一位王女士,本來每天早上8點鐘去健身房健身,下午4點去喝咖啡。如果她發現早上健身的人很多,喝咖啡的人很少;而下午喝咖啡的人很多,健身的人很少,她就有可能改變自己的生活習慣。

如果王女士改爲上午喝咖啡,下午去健身,我們看看社會總擁擠度 L 會發生什麼變化。首先王女士現在去的兩個地方的人都比以前少了,所以她自己的擁擠度會下降。再者,王女士在每個地點,都給那個地點所有的人都增加了一個擁擠度,而現在她改爲都在低峯時候去,那麼被她提供擁擠度的人數也會減少。所以不論是對自己還是對別人,王女士這個改變,都降低了 L 值。

如果系統中每個人都像王女士這樣自我調整,L 就是一個不斷下降的函數,而且L顯然有一個最小值(因爲再小也不會比 0 小),所以 L 是個李雅普諾夫函數。

那既然這個系統有李雅普諾夫函數,它就一定會達到一個擁擠度最低的均衡狀態。你看這就是李雅普諾夫函數的妙處,也許這系統有很多個李雅普諾夫函數,而你只需要找到一個就行,只要能找到一個,你就證明了系統的均衡性。

當然真實社會中並非每個人都像王女士這麼“理性”,有的人就喜歡湊熱鬧,而且有時候一羣人集體轉移戰場也會增加擁擠度……但是,那些情況並不常見。通常情況下人們都是避開擁擠,自我調節。這條路太堵了,我就換一條路。今天晚上電影院人太多,我就換個時間來看電影。

而因爲你有了李雅普諾夫函數這個眼光,你就能判斷,哪怕社會再複雜,它也終將會達到一個”相當“均衡的狀態。

0x3:自由貿易

爲什麼我們應該提倡自由貿易呢?因爲當商品發生交換的時候,買賣雙方都會感到有利。

如果你願意花50塊錢買一本書,肯定是你覺得這本書對你的價值超過50塊錢;而賣書的人則認爲50塊錢對他也是合算的,這樣你們才能達成交易。

那既然如此,自由的商品交換中就應該存在一個李雅普諾夫函數,L = 社會總幸福度。

首先每發生一次商品交換,買賣雙方的幸福度就會都增加一點,所以 L 增加。其次因爲商品是有限的,社會總幸福度必然有一個極大值。這和我們前面說的 L 總減少而且 L 有極小值的道理一樣,所以 L 是李雅普諾夫函數,所以社會應該會達到一個到處都是自由貿易的理想狀態。

……可問題是爲什麼現在各國都有很多反對自由貿易的聲音呢?爲什麼要搞貿易保護呢?因爲我們定義的這個 L,其實沒考慮周全。

每一次商品交換,的確是買賣雙方都滿意,但是第三方可能會有人不滿意。你倆的幸福度上升了,別人的幸福度卻可能因爲你倆這次交易而下降。

佩奇舉的例子是伊拉克想用石油換巴基斯坦的原子彈技術。這兩個國家的確是高興了,可是國際社會可不幹。鄰國不希望伊拉克有原子彈,地區關係會變得緊張,別人不得不採取軍備競賽之類的行動,於是整個系統會不穩定。

一般國際貿易也是這樣。中國的商品出口到美國,中國的商家掙到了錢很高興,美國的老百姓買到便宜東西也很高興,那誰不高興呢?特朗普不高興。美國那些因爲進口中國商品而失去就業機會的生產者不高興。

這種旁觀者的不高興,就是經濟學家說的“負的外部性”。因爲存在負外部性,前面說的那個 L 就不一定是李雅普諾夫函數。經濟學家總是呼籲自由貿易的好處,而數學家一看就知道這個系統不會達到完全自由貿易的理想狀態。

關於自由貿易的問題,還可以參閱另外這兩篇文章,

0x4:應用

李雅普諾夫函數這個思想很簡單,所以也很有用。

佩奇有個學生,他上班的公司,有一次搬到了全新的辦公室,老闆突發奇想,說我們應該隨機安排員工座位,然後允許任何兩個員工互相調換座位。老闆認爲這個思路符合自由市場的原則,相信員工們會自組織,達到一個最優的平衡態。

但是佩奇的學生學過模型思維,馬上就指出這麼做不對!學生說換座位是能讓換座位的雙方滿意,可是它有一個負的外部性啊,他倆原來的鄰座可能會不滿意!鄰座會想,你換座位是不是因爲不喜歡我呢?而且你換這個人過來也沒徵求我的意見啊,我不喜歡他!所以換座幸福度不是李雅普諾夫函數。老闆一聽有道理,就打消了這個想法。

後來老闆又有一個新想法,他買了各種不同款式的辦公座椅,隨機發給員工,然後讓員工自由交換座椅。佩奇的學生一看這個是可行的,因爲座椅隻影響到交換的雙方,第三方的人不在乎你坐什麼樣的椅子,其中沒有負的外部性,所以幸福度是個李雅普諾夫函數……

也許就算不知道李雅普諾夫函數,你也能找到其中的問題,但是有了李雅普諾夫函數這個概念,你從此就會對複雜系統的演化非常敏感。數學模型能讓你的腦子裏多一根弦。

咱們好好體會一下這個思想的妙處。不管是多複雜的系統,數學家說只要你能抓住其中一個關鍵變量,你就能證明它會是均衡的。

請注意這個道理反過來可不一定對:並不是所有均衡系統都有李雅普諾夫函數。就有一些系統,經驗表明是均衡的,可是數學家就是沒有找到它的李雅普諾夫函數,所以沒辦法證明它爲什麼一定會達到均衡……這在數學上是一類很有意思的問題。

李雅普諾夫函數,是數學家的戰略性武器。

 

十一、”喫一塹長一智“的數學模型

這一章我們來研究一個有關學習的模型,說人應該如何從經驗中學習,從而做出明智的選擇。

我們以前講計算機思維的時候引用過軟件工程專家弗瑞德里克·布魯克斯(Fred Brooks)的一句話,“好的判斷來自經驗,而經驗來自壞的判斷。”用咱們中國人的說法,這其實就是“喫一塹長一智”。

  • 看書學知識效率最高,可是有些知識是書本上所沒有的。
  • 哪個飯店的菜好喫?
  • 哪個品牌的鞋適合你?
  • 哪個教授有真學問?
  • 誰更值得合作?
  • 關鍵任務能指望誰?

這些問題的答案只存在於每個人的特定經驗之中,可能你得用一身傷痕才能換到一分體會。

一個人哪怕不會什麼專業技能,但是能知道身邊各種東西的好壞,在各個選項中能選對的,就也算是活明白了,可惜很多人明白的時候已經老了。那有什麼辦法,能讓我們加速活明白呢?

  • 以前我們講《指導生活的算法》這本書的時候,說過一個“先觀察後決策”的模型,也就是著名的“37%規則”,你應該用前面37%的時間只觀察不選擇,先知道什麼東西是好的,然後用剩下的時間遇到好的就馬上拿下。
  • 我們還講過一個“探索—收穫”模型,說人應該在年輕的時候多探索,這樣老了就可以享受探索的成果。

這兩個方法的缺點是都有一定的時間性,要求你先積累經驗,再使用經驗。但我們進入成年人的階段,往往要一邊積累經驗一邊使用經驗,而且還要快速積累經驗。那這應該怎麼辦呢?數學思維能幫你看清楚其中的關鍵。

0x1:自增強學習法

有一個詭異的故事,也許你聽說過。說從前有一位女孩,在參加親人葬禮的時候,遇見了一個很英俊的男子。女孩很喜歡這個男子。過了一段時間之後,女孩就把自己的姐姐殺死了。請問這是爲什麼?

答案是因爲女孩希望再次見到男子。她唯一遇到那個男子的場合是在家族的葬禮上,所以她想要再舉辦一次葬禮。

當然這是一個虛構的故事,女孩的做法肯定不對……但是,女孩的思路有合理性。你做一件什麼事兒如果得到了獎勵,你以後就應該多做這樣的事兒。這就是從經驗中學習的真諦。

咱們中國人說“喫一塹長一智”,強調要從錯誤中吸取教訓,可是我們看動物園裏那些馴獸師好像不是這麼幹的。馴獸師對動物從來都不是使用打罵法,而是使用獎勵法,是完成一個好動作馬上給喫的。動物也許完全不懂人爲什麼要讓他做這個動作,但是隻要他知道這麼做會得到好喫的,他就會樂意這麼做。馴獸師希望動物“記喫不記打”,你對錯誤動作沒有必要有太多深刻印象,學習學的是正確動作。這個原理,早在一百年前就已經被美國心理學家愛德華·桑代克(Edward Thorndike)用實驗證明了:獎勵比懲罰更有利於學習。

桑代克通過拿小貓做實驗,發現兩個規律,可以直接指導我們的學習模型。

  • 第一個規律是當小貓完成一個正確的動作之後,你給它的獎勵越多,它學得就越快。

這也就是說學習是個“正反饋”的過程,獎勵就是鼓勵。現在有很多學者研究從經驗中學習的數學模型,首先想到的就是獎勵。比如我們設想,你在生活中面臨A、B、C、D……各種選項,你做每個選項,都會得到一定的獎勵,或者懲罰,當然我們可以把懲罰視爲負的獎勵。

如果各個選項的獎勵值都明確地擺在你面前,那就非常簡單了,你直接選擇獎勵最大的那個選項就行。但真實世界根本就不是這樣的,是跑步好還是散步好?是“得到”好還是“抖音”好?這些事兒的“獎勵”往往是難以量化的,而且你也記不住。

所以我們真實的學習都是理性結合感性慢慢摸索,沒有那麼黑白分明。最簡單的方式,用數學模型描寫,叫做“自增強學習法”。

我們設想,對每一個選項,你心中都有一個“心理權重”。這件事的權重越高,你就越願意做這件事。但是請注意,這裏所謂的“願意”只是說你會增加做這件事的概率,而不是說你從此就”只“做這件事,因爲總做一件事會邊際效應遞減,而且做點別的也許還能收穫驚喜。

所以自增強學習法是個概率模型。概率來自權重,而權重來自獎勵:如果這個選項給你帶來了獎勵,你就相應地提高它的權重。隨着系統的演化,你就會多做獎勵高的事情。不過僅僅這樣的話這個模型的學習速度還不夠快。

  • 桑代克發現的第二個規律是,如果你給小貓一個超出它預期的獎勵,它就學得更快。

心理預期是個很有意思的現象。比如我每天讀一點網絡小說都能收穫一點快樂,相當於獎勵值是 10。如果讀一本經濟學的書帶給我的獎勵值只有 8,雖然也可以說是有收穫,但是對我來說就不夠刺激。而我讀《模型思考者》這本書,獲得了 15 的獎勵,那就非常令人欣喜了,所以在這三本書裏面,我就會更樂意選第三本。

考慮到這個原理,我們可以在學習模型中設定一個叫做“渴望水平”的值,代表我們對獎勵的心理預期。調整權重的時候,我們不是直接用獎勵計算,而是用(獎勵 - 渴望水平)計算。也就是說,一般的獎勵不會讓我增加、而且可能還會降低這個選項的權重,只有當獎勵超出我的渴望水平的時候,我纔會增加權重。

那麼接下來就是數學的威力了:數學家證明,引入“渴望水平”之後,我們能用最快的速度學到回報最高的選項。

數學模型必須使用嚴格的公式描寫這個學習過程,但這個模型的本質是假設我們都是不擅長精確量化、有點憑感覺行事的人。人很不善於記住具體的數值,但是人很善於記住一件事帶給你的”感覺“。自增強學習法是個理性結合感性的方法。

比如你剛剛升級爲父母,不知道孩子愛喫什麼水果。自增強學習法是這樣的,首先給所有水果的權重都是 50,

  • 第一天你給孩子喫香蕉,你發現他挺愛喫,於是就把香蕉心理權重提高了,比如從 50增加到55。
  • 第二天你又給孩子喫香蕉,他還是挺愛喫,但是你感覺上跟上次的獎勵差不多大小,而因爲你的心理預期已經提高了,香蕉的權重就不會增加。
  • 第三天你給孩子喫蘋果,你發現他喫得挺好但是好像不像昨天那麼愛喫,那麼雖然這個反應是正面的,你也要降低蘋果的權重。
  • 第四天你給孩子吃了橘子,他非常喜歡,超出了你的預期,於是你把橘子的權重一下子提高到60。
  • 那麼接下來,你應該以更高的概率喂橘子,但是對其他的選項也保持兼顧。

這個過程說起來挺簡單,而沒有學習意識的人就做不到,特別是做不到學這麼快。

0x2:從別人的經驗中學

自增強學習法能讓你用最快的速度從自己的經驗中學習,但是更快的方法,則是從別人的經驗中學習。

有一個模型是你觀察一大羣人,看他們在各種選項得到什麼樣的獎勵。這個模型要求你對當前經驗的平均獎勵有一定的估計,作爲你的心理預期。那麼接下來比如你看老王做 A 這件事兒得到的獎勵比你的心理預期高,你就提高 A 的權重。

這就叫“見賢思齊”,而數學上可以證明,用別人的經驗學習速度更快。這當然是因爲你的樣本量大大增加了。我們看一個什麼新鮮的好東西在大城市的流行速度會比小地方快得多,這大約就是因爲人們在人員密集、交流充分的地方更容易互相學習。

但是我們要注意一點,通過別人學到的經驗,和自己學到的經驗,不一定是一致的。

0x3:絕對進步和相對進步

佩奇說了一個有意思的例子,叫做“慷慨/惡意博弈(The Generous/Spiteful Game)”。

從前有一天,你發現了一盞神燈,你一擦這個燈,出來一個燈神,說可以滿足你的一個願望。但不管你的願望是要什麼,燈神都會雙倍地給到你身邊的人。比如你想要1萬塊錢,你身邊的人都會得到2萬塊錢。那你想要什麼呢?

有個人選的是讓燈神戳瞎自己的一隻眼睛。這樣他身邊的人都會被戳瞎兩隻眼睛,他就獲得了相對於別人的一個優勢。寧可損己,也要損人。

生活中真有這樣的人嗎?在某種意義上來說,中美貿易戰就是這個情況。不打貿易戰兩國經濟都能照常前進;打貿易戰,對中國經濟的傷害可能更大一些,但是對美國經濟也有傷害。那特朗普爲啥非得打貿易戰呢?

美國政治學家肯尼思·沃爾茲(Kenneth Waltz)有句話說,“國家首先要考慮的不是怎麼讓自己的力量最大化,而是保證自己在系統中的位置。”也就是說爲了確保自己的優勢地位,哪怕殺敵一千得自損八百,那也得幹。

當然肯定不是所有人都會這麼幹。在這個慷慨和惡意的博弈中,如果你選擇慷慨,你的自身狀態會越來越好;而如果你選擇惡意,你相對於別人的地位會越來越高。

而數學推演表明,

  • 如果你使用自增強學習法從自己的經驗中學習,你會變得越來越慷慨
  • 如果你採用第二個學習方法,向別人學習,你會變的越來越惡意。

那到底應該看自己還是看別人呢?這是一個兩難問題,答案也許取決於你的價值觀,所幸的是生活中的局面並不都是這樣的博弈。我只是想告訴你,有時候看自己和看別人是不一樣的。

簡單的數學模型告訴我們,要想從經驗中快速學習,你必須是一個敏感的人。

  • 第一,你必須對獎勵非常敏感,才能迅速調整各個選項的權重,讓自己學會多做好事,少做壞事。
  • 第二,你還需要隨時調整自己的心理期望。對所有事情都敏感就等於對所有事情都不敏感。有一個比較高的期望閾值,一般的獎勵不能讓你興奮,你才更願意去追求獎勵高的事情,你才能更快地找到最佳選項。期望值過低的人會習慣性地去做一些低迴報的事情。
  • 第三,參考別人的經驗能使你學得更快,不過你得注意自己到底想要什麼,別人和自己畢竟是兩回事,比如有的人只想比別人強,那種人未必真值得我們學習。

 

十二、路徑依賴

這一章我們用數學模型來描寫一下什麼叫“路徑依賴”。

你肯定經常聽說“路徑依賴”這個詞,它的意思是說一件事情之所以是現在這個樣子,很多情況下並不是因爲它就”應該“是這樣、不是它“註定”是這樣,而是歷史上的一些偶然的原因導致它是這樣。路徑依賴這個概念,能讓你有一個更清晰的歷史觀,而且還可能提醒你在命運轉折的關鍵時刻謹慎行事。

世界上的很多事情是有道理而且有規律的。

  • 一個聰明學生髮奮努力學習,就能取得好成績
  • 一個政府無節制地盤剝人民,人民就會不滿
  • 一個公司招攬到第一流的人才,就可能做出第一流的創新
  • 在講馬爾可夫模型的時候,也說過像宿命論一樣的規律。

而大多數事情則屬於偶然和隨意的選擇,發生沒發生都不重要。

  • 你今天穿什麼顏色的衣服
  • 上班路上遇到什麼情況遲到了
  • 小孩上學的學校好一點還是差一點
  • 甚至包括買彩票中了百萬大獎

可能你當時以爲很重要,其實沒多大影響,都會迴歸均值。

但是也有一些當時看起來很小的偶然事件,在歷史上導致了重大差別。比如你二十年前在一個很隨意的場合認識了一個叫馬雲的人,他邀請你加入一個叫做“阿里巴巴”的公司。你認爲他說的不怎麼靠譜,但是這人挺有意思,你一念之差,就答應了……這就好像有些人考大學就差一分,此後的人生境遇可能就很不一樣。

這種因爲偶然事件導致重大差別的情況,就是路徑依賴。對這種事兒你光用心體會、什麼感慨人生,那沒啥用,要想從路徑依賴現象中獲得一點洞見,我們應該使用數學方法。

0x1:模型

用數學語言來說,所謂路徑依賴,就是過去發生的事件,會改變未來事件發生的概率。

我們先說一種“良性的”偶然,也就是不會導致路徑依賴的偶然性。我們設想有一個不透明的罐子,裏面裝了很多小球。每個球的大小和質地完全相同,只是顏色可以不同,有黑球和白球。我們設想的操作是你每次從罐子裏摸出一個球,看看是什麼顏色,做好記錄,然後再把這個球扔回到罐子裏去,這個罐子,叫做“伯努利罐”,以概率論的祖師爺雅各布·伯努利的名字命名。

從伯努利罐裏摸球,概率是不變的。如果罐子裏一共有40個黑球和60個白球,那你每次摸到黑球的概率就都是 40%,白球都是 60%。這當然是因爲你每次都把球放回去,罐子的局面不會變。

像這樣偶然性翻不了天。如果你喜歡黑球,哪怕你連續十次摸到黑球,你下一次摸到黑球的概率也還是隻有 40%。偶然的好運氣對將來沒有任何影響,你暗自高興一下也就完事兒了。

我們再考慮另一種情形,叫“波利亞罐”,以匈牙利數學家波利亞·哲爾吉的名字命名。一開始波利亞罐裏只有一個白球和一個黑球,你也是隨機摸球,但是規則變了。現在你每次摸出來的球是什麼顏色,把它放回罐子裏的時候,還要再多放一個相同顏色的球進去。比如你拿出一個黑球,就要放回兩個黑球。

開始是一黑一白,摸到黑球的概率是 1/2;

如果你第一次摸到一個黑球,波利亞罐裏就變成了兩黑一白,那麼下次摸到黑球的概率就會變成 2/3;

如果第二次又摸到黑球,就變成了三黑一白,下次摸到黑球的概率就變成了 3/4……

你每次摸到什麼顏色的球,就會增加波利亞罐裏那個顏色的球的個數,就會提高下一次再摸到這種球的概率。這就叫路徑依賴。

可能純粹是出於偶然,你在前面幾次摸球摸到黑球的次數比較多,那麼罐子裏的黑球就會顯著地比白球多,那麼以後你再摸到黑球的概率就會明顯高於白球。黑球並沒有“做對”什麼事情!它只是因爲早期運氣好,就徹底改變了自己的命運。

路徑依賴,是個“不公平”的正反饋過程。

0x2:應用

提到路徑依賴,人們最先想到的一個例子就是現在都在用的QWERTY鍵盤。有個說法認爲這種鍵盤的字母排列布局其實是不合理的,當初的人之所以把鍵盤設計成這個樣子,是爲了降低人們的打字速度,防止老式打字機的鍵杆撞在一起卡殼。

那現在的鍵盤都沒有鍵杆了,打字速度再快都能承受,爲什麼還用這個不合理的QWERTY佈局呢?因爲路徑依賴。最早的打字機,不管是出於什麼原因,使用QWERTY佈局,當時的用戶就不得不學習這種佈局。用戶已經適應了,再出新的鍵盤也只好使用這個佈局。因爲誰也不願意重新練習一套打字技能,現在有人發明了有更合理鍵位佈局的鍵盤也無法流行開來。由此一代一代的新用戶適應鍵盤,新鍵盤適應用戶,我們就被鎖定在了QWERTY佈局之中。歷史上的小事件,徹底改變了後世路徑的概率。

同樣的例子還有鐵軌的寬度是由最早馬車的車輪寬度決定的。

路徑依賴給我們的教訓是一個東西能流行可能並不是因爲它的品質好,而是因爲它的運氣好,或者說,它早期的運營比較成功。以前錄像帶標準的 VHS 和 Betamax 之爭,後來高清DVD標準的藍光和 HD 之爭,都是哪方的越人多,哪方的優勢就越大。劇情都是一開始相持不下,後來有一兩家大公司臨陣倒戈,突然打破平衡,導致一方有了一個小小的優勢,而因爲每個媒體公司都想提高自己的兼容性,這個小小的優勢就足以說服其他公司加入你的陣營了。

注意路徑依賴和我們之前講的“傳播公式”和“騷亂的閾值”還不太一樣。

  • 傳播公式說一個東西能流行開來,跟這個東西自身的素質很有關係
  • 騷亂閾值說一個東西能流行跟傳播者的素質很有關係
  • 而路徑依賴則是說,這個東西能流行可以跟任何東西都沒關係,純粹是因爲早期的偶然選擇,導致了流行這個而不是那個。

一支有一百年曆史的足球俱樂部,它的主場球衣一直都是紅色。爲什麼非得是紅色呢?難道紅色最符合這個地區人民的精神嗎?並不是。歷史上最早可能只是偶然的選擇,但是俱樂部和球迷很願意傳承歷史,既然是紅色那就一直都是紅色吧。而這個道理又表現在其他俱樂部什麼顏色的球衣都有,紅色並不特殊。

像鍵盤佈局和DVD格式這種是模仿有好處,而有些時候人們單純就是爲了跟別人一樣而模仿。如果一個人看到大部分人都開黑色奧迪,他買奧迪車的時候就也會更願意選擇黑色。

路徑依賴這個不講理的特點讓人很難對市場的傾向做出預測,商家不得不採取一些手段。一個辦法是先預定再生產,你告訴我要什麼顏色,我給你塗成什麼顏色。以前不能這樣生產汽車,就只能用另一個辦法,那就是根本不給選擇權:福特公司曾經有個說法,說我們可以滿足消費者對任何顏色的需求,只要你選的是黑色就行。再比如第一代蘋果手機只有黑色這一個選項,那時候蘋果不願意爲消費者的顏色偏好冒險。

除了偶然性,路徑依賴還有一個關鍵特點,即路徑很長。

0x3:路徑很長

像鍵盤佈局這種一把定終生的路徑依賴事件其實並不常見。我們考察波利亞罐這個模型,摸球可不是摸一次就定了,路徑依賴通常還是需要若干個關鍵事件的共同作用纔會形成。

今天絕大多數個人電腦都使用微軟的 Window 操作系統,爲什麼微軟公司這麼厲害呢?考察歷史,微軟摸到的第一個黑球是在1979年。當時 IBM 公司剛剛生產出了第一代個人電腦,沒有現成的操作系統,微軟憑藉從別人那裏買來的 DOS 拿下了給 IBM 電腦做操作系統的訂單。現在說起來,這簡直是計算機歷史上最重要的一個訂單,比爾·蓋茨的手段厲害是一方面,他運氣也實在是太好了。

可是對身處歷史現場的人來說,你聽說了這件事,就會all in微軟嗎?你能斷定微軟會成爲制霸全球的電腦公司嗎?你不會的。

在那個年代,個人電腦的市場份額是微不足道的。那時候沒有互聯網也沒有什麼好用的軟件,像今天常見的辦公軟件、遊戲軟件統統不存在。沒人會覺得兩個退學生辦的小公司能有多了不起。你根本不能保證會不會有別的公司再做一種個人電腦跟微軟和 IBM 抗衡。

微軟的成功,是因爲它連續摸到了黑球。DOS 操作系統的兼容性好,能夠方便人們開發各種應用程序和遊戲。微軟還自己開發了 Office 辦公軟件,把遊戲平臺做得很好,這都刺激了個人電腦的流行。可以說個人電腦這個市場,就是微軟創造的。

所以微軟並不是一次就抓中了大獎。它是像波利亞過程那樣,一次又一次地抓到黑球,而它之所以能一次又一次地抓到黑球,是因爲它每一次都使得自己將來再抓到黑球的可能性變得更大。這纔是典型的路徑依賴。

所以路徑依賴的路徑可以很長,它可以有很多變化。儘管如此,我們仍然要強調這個過程中有很大的運氣因素,特別是決定性的幾步往往是發生在早期。有個歷史作家叫劉仲敬,現在整天鼓吹分裂中國已經走火入魔了,但是他以前寫的一本書叫《經與史》,其中有一段話說的挺有意思,

“世界的命運和人的命運雖然漫長,關鍵性的節點卻寥寥無幾。四分之三的人生劇本在三十歲以前就寫定了,以後的內容根本不值一看。文明和邦國的興廢都有其不可逆的節點,擁有無限可能性的青春期總是非常短促。”

他說的其實就是路徑依賴。路徑是偶然選擇的產物,而早期的選擇尤爲重要,所以當你有路可選的時候纔是人生最精彩的時候,這就是爲什麼電視劇總是寫年輕人的故事,別等到自己的路徑已經鎖死了再感慨人生。

不過所幸的是路徑通常不是一次就鎖死的。波利亞罐越往後改變就越難,但並不是不允許你改變:微軟公司今年已經四十五歲了,仍然在開創新路徑,而今天微軟的雲計算業務很成功。

 

十三、十八般兵器和舉一反三

普通人能從模型思維裏學到什麼呢?

  • 首先你學會了一些模型。我們講過的這十幾個模型,都是比較經典、而且可以用到的。它們就好像是思維套路,寓言故事和成語典故一樣。我認爲正態分佈、隨機行走、傳染和擴散,這些思想比什麼“亡羊補牢”、“圍魏救趙”更有用。
  • 其次你學會了比傳統思維套路先進的思考方式。哪怕稍微用一點點數學推演,你的思考馬上就能變得生動活潑起來。稍微考慮一點點量化的邊界,你就能知道應該重視什麼忽略什麼。

而想要取得更大的學習成就,你還需要掌握兩個更高層次的思維模式,

  • 一個是“一對多”
  • 一個是“多對一”

所謂一對多,就是要舉一反三,能把一個模型用於很多看似非常不一樣的場景。所謂多對一,就是十八般兵器一起上,用多個模型分析一個問題。

0x1:冪律的運用

咱們先說一個特別簡單的數學方法,看你怎麼舉一反三。普通人觀察世界,比如到國外旅遊,最容易看到的是別人跟我們的不同點;而高手則要能看出那些看似非常不同的事物之間的共同點。他有千般變化,你有火眼金睛,這就叫洞見本質,這就叫類比,這就叫舉一反三。

比如你看下面這三個問題,有什麼共同點,

  • 1、爲什麼裝石油的貨輪都是越大越好呢?
  • 2、醫療保健界總是用“身體重量指數(BMI)”衡量一個人的體重是否超標,BMI 是個合理的指標嗎?
  • 3、爲什麼各大公司的 CEO 中,女性所佔的比例這麼少呢?

表面上看這是一個工程問題、一個醫學問題和一個社會問題,但其實它們都是數學問題。你只需要一個數學知識,冪律,也即是 X^N,就能對這三個問題提出關鍵性的洞見。

先說貨輪。我們不需要知道輪船的技術細節,你可以簡單地把輪船想象成一個長方體。製造一艘輪船,造的是船的底部和四周的船幫,這個製造成本,和長方體的表面積成正比。如果貨輪的尺度是 L,那麼造價就正比於L^2。同樣地,驅動輪船在水上走,要克服的那個水面的拖曳力,主要是跟輪船的喫水面積成正比,也是正比於 L^2。兩項加起來,這也就是說,購買和使用一個貨輪的成本,正比於 L^2。

而貨輪的使用價值,是它能裝多少東西,這個是跟貨輪的體積成正比,也就是正比於 L^3。

由此我們得出,貨輪的性價比 = 使用價值/成本,是正比於 L 的。尺度越大,性價比就越高,運送單位貨物反而越便宜,這就是爲什麼貨輪越大越好。現在一個國際貨輪的長度可以有四五百米……如果不是因爲巴拿馬運河過於窄小,通行受到限制,貨輪還可以再大一點。

你看,我們對造船知識一無所知,但只要你知道什麼是面積、什麼是體積,你就能推算出來貨輪應該越大越好這個戰略着眼點。當然也許具體實施的時候會有一些技術困難,但是你這個洞見,是不可能被忽略的。

第二個問題,爲什麼 BMI 不是一個合理的指標。一般說法是如果你的 BMI 大於25,你就超重了,可是有研究發現,那些用 BMI 判斷爲稍微超重的人,壽命反而更長。那難道說我們應該把 BMI 的合格線從 25 提高到比如說 28 嗎?不是的。

BMI = 體重 / 身高的平方。我們用 H 表示身高,按比例來說,人的體積應該跟 H^3 成正比。再假設身體的密度是 M,那麼體重就應該是跟 H³M 成正比,所以 BMI 就是 H³M/H²,跟 HM 成正比。

這也就是說,哪怕全都是身材特別標準、特別正常的人,也是身高越高、身體密度越高,他的 BMI 就越高,BMI 高估了高個子的肥胖程度。而且因爲肌肉的密度要高於脂肪的密度,如果一個人經常健身,體脂率比較低肌肉比較發達,他的 BMI 也會上去。這不是調整合格線的問題,現有的 25 這個合格線可能很適合普通身高、普通體脂率的人,但是不適合那些特別高或者特別矮,以及體脂率特別低的人。事實上有人統計過 NBA 球星,每個人的 BMI 都是超標的,難道說這些人還不夠健康嗎?

然後我們再看看爲什麼女 CEO 這麼少。財富500強的公司裏,只有不到5%的 CEO 是女性;而美國大學的校長,卻有25%是女性。這個對比說明什麼呢?是不是商業界對女性領導的歧視已經到了令人髮指的程度呢?是不是商業界比學術界更歧視女性呢?是不是女性更適合在學術界發展呢?也許根本不是。

每個人初入職場的時候都是最普通的員工,而要從一個普通員工成長爲 CEO,你必須經過很多次的提拔。今年升一級明年升一級,提拔幾次才當上了組長;再過幾年是經理,再往上是主任……再過上若干年纔可能成爲 VP,就這樣距離 CEO 仍然很遠。我們假設一個人要從基層奮鬥到 CEO,必須在30年之內經歷15次提拔,咱們看看這是一個什麼遊戲。

男性對工作的投入度,可能會稍微比女性高那麼一點點。這絕不是說歧視女性,不是女性能力不行,而是女性的人生追求更全面,比較注重工作和生活的平衡。那麼我們假設,面對每一次提拔的機會,男性被提拔成功的概率 p=50%,而女性是 p=40%。如果一個公司在男女員工人數一樣多的情況下,每提拔 5 個男性就會同時提拔 4 個女性,這應該不算太過分吧?

在這個簡單模型中,一個人經歷 15 次成功提拔成爲 CEO 的概率,是 p^15。而你這麼一算,雖然 50% 只是 40% 的 1.25 倍,15 次方之後,男性變成 CEO 的概率就是女性的 28 倍!

所以女性 CEO 那麼少的最重要原因並不是因爲男性受到太多的優待,而是因爲層級太多!可能一個人的運氣只比另一個人好一點點,經過很多層級之後,兩人的差距就會很大。

那爲什麼女性當大學校長比較容易呢?因爲層級少。從教授到校長只有三步:系主任、院長、校長。如果你取勝的概率比對手低,哪怕只低一點點,你也不希望比賽進行很多輪。

在這幾個問題中我們沒有使用什麼精確的數學,我們僅僅用了 X^N 這一個算式,就推導出來這些道理。而沒有這個算式,你就只能感慨人生。

0x2:一個事件多個模型

一個模型能解釋多個事件,而生活中有些事件,需要調用多個模型才能得到很好的解釋,做出正確判斷。我們前面講過,所謂智慧,就是你知道該使用哪個模型,而這一切的前提是你得多知道幾個模型纔行。

2018年10月,冰島克朗突然開始大幅度貶值,這就給當時甲骨文公司的財務官出了一個難題。甲骨文公司在海外有數十億美元的資產,他必須考慮冰島克朗貶值的金融風險。他考慮了兩個模型。

  • 一個是金融網絡的傳染模型。國際金融網絡的聯繫很緊密,克朗貶值會不會讓其他貨幣也跟着一起相對於美元貶值呢?公司是不是應該趕緊把海外資產換成美元呢?
  • 財務官考慮的另一個模型是經濟學中的供給和需求。這個簡單模型說如果想要讓市場上的價格發生劇烈變動,供給或者需求必須得有顯著變化纔行。冰島,是一個只有30萬人口的小國,GDP 才120億美元,連麥當勞半年的營業額都不到。考慮到這一點,冰島貨幣貶值能對全球金融有大影響呢?

財務官決定不採取行動,結果他賭對了。所以有些聽風就是雨的人缺少的不是定力,而是知識和判斷力。你只知道這個因素有影響還不行,你還得知道別的因素有什麼影響,你還得能正確評估每個因素影響的大小,纔行。

特別是要做預測的時候,我們往往需要用不同視角下的多個模型分別做預測,然後對它們的預測結果取一個平均值。佩奇在《多樣性紅利》這本書中專門說過這個道理,多樣性能減少預測的標準差,這可是佩奇的招牌工作。

模型都只是對真實世界的某種假設和簡化,在本質上每個模型都是錯的。

就拿2008年金融危機來說,我那以後讀的每一本稍微沾點邊的書都要分析一下這場危機是怎麼發生的,他們的說法各不相同,那到底哪個對呢?有個經濟學家考察了21個解釋這次金融危機的模型,他的結論是其中沒有一個完全符合當時的真實情況:每一個模型都有漏洞。也許你只有等到將來,從多個角度綜合理解這場危機,也許世界上有些事兒就是實在過於複雜,以至於根本就不可能讓人理解。

總結來說,

  • 當你預測一件事的時候,你希望模型越複雜越好
  • 當你要解釋一件事的時候,你希望模型越簡單越好

你需要用很多模型一起去解釋和預測一個複雜的事情,你還需要用一個模型解釋很多很不一樣的事情。

你既需要掌握很多知識,又需要靈活運用這些知識的能力,你得會十八般兵器還得會舉一反三……要不怎麼有用的學問難做、真知灼見難得呢。

 

十四、止痛藥的棘手問題

你恐怕很難想象世界最大的兩個國家會因爲止痛藥爭吵。中美兩國一直爭端不斷,各種常規項目之外,有一個熱門話題是關於一種止痛藥,叫芬太尼。

美國說因爲中國控制不嚴,導致美國進口了太多的芬太尼,加劇了美國人的藥物濫用。這個邏輯有點不尋常,所以中國要求美國好好反思自己,說“爲什麼中國能厲行禁毒政策,切實做到對毒品問題‘零容忍’,而美國不行?爲什麼中國對芬太尼類物質的管制措施能夠做到比美國更嚴格有效?這纔是值得思考的問題。”

這個問題,其實美國人真的很想知道答案。而且也真思考了。斯科特·佩奇在《模型思考者》這本書裏專門用了一章的篇幅討論美國的止痛藥濫用現象,還使用了四個模型來研究。這是模型思維一次很好的實戰應用,咱們來看看如何分析一個棘手問題。

芬太尼,是一種“阿片類”的止痛藥。而這個“阿片(opioid)”的“阿”,按英文而論,就是“鴉片(opium)”的“鴉”,說白了,就是阿片類止痛藥會讓人上癮。現在美國每年有超過一千萬人正在濫用阿片類止痛藥,其中超過兩百萬人出現止痛藥使用失調的症狀,包括三萬人因此而死亡。

而美國醫生,每年開出的阿片類止痛藥處方,竟然超過 2 億張。美國簡直就是個止痛藥之國。

那麼你馬上就會想到四個問題,

  • 像這樣的藥怎麼就能被批准使用呢?
  • 它是怎麼失控的呢?
  • 它如何產生的致命效應?
  • 非正常渠道的藥是如何流傳的?

爲此我們需要四個數學模型。

0x1:隨機實驗

美國食品藥物監管局(FDA)要批准一個新藥上市,必須經過嚴格的臨牀隨機實驗。我們的第一個模型就是隨機實驗模型。

隨機實驗是非常普遍的操作,也許你已經很熟悉了。實驗人員招募一些真實的病人,他們可能剛剛做過髖關節置換術、牙齒手術或者正在經歷癌症治療,他們需要止痛藥。病人被隨機分成兩組,一組作爲實驗組使用某種待批准的阿片類藥物,一種作爲安慰劑組使用尋常的止痛藥,在病人本人不知情的情況下,看看新藥有什麼不一樣的效果。

結果阿片類止痛藥表現很好。實驗組的病人明顯地感覺更好。實驗人員也考慮了藥物上癮的可能性,但是實驗中只有不到 1%的病人有上癮反應。於是 FDA 就批准了。

這個操作好像沒什麼毛病。如果 1%的人上癮是 99%的人減輕痛苦的代價,這個代價也許是值得的。但是實驗人員和 FDA 可能都沒有考慮的事兒是,實驗中使用止痛藥都是短期的,而醫生在臨牀治療中,可能會開出長期使用止痛藥的處方。

長期使用阿片類止痛藥,上癮的可能性就會從 1%,提高到 2.5%。這是一個重大變化,爲了理解這一點,我們使用馬爾可夫模型。

0x2:馬爾可夫過程

我們設想所有的病人可以分爲馬爾可夫過程中的三種狀態,分別是正常使用阿片類止痛藥的“服藥者”、純粹因爲上癮而使用的“上癮者”,和不疼痛也不使用止痛藥的“無痛者”。

FDA 當初設想的局面,差不多是像下面這張圖裏說的這樣,

服藥者有 1%的可能性變成上癮者。而上癮者既然已經上癮了,要戒除就有困難,我們假設他們只有 10% 的可能性變成無痛者。無痛者也有得病需要服藥的可能性,我們假設無痛者變成服藥者的可能性是 20%,同時假設有 70%的服藥者會在下一個週期被治好,變成無痛者。

如果你認爲這些假設合理,那麼根據馬爾可夫過程的性質,我們可以計算得出,這三種人的佔比將會趨於穩定狀態,分別是無痛者佔 76%,服藥者佔 22%,上癮者佔 2%。

只有 2%的人上癮,如果是這樣的局面,那還是比較可控的。但是真實世界中因爲醫生會開出長期的處方,服藥者變成上癮者的可能性達到了 2.5%。再考慮到因爲藥物氾濫,上癮者要戒癮也困難了,只有 5%會變成無痛者。那麼真實的局面就是下面這樣,

對這個更真實的馬爾可夫過程的計算表明,雖然我們只改了兩個數字,上癮者所佔的比例,卻一下子從 2%變成了 10%。

在人羣中佔比 2%,那叫小衆;10%,那就成了氾濫了。

那喫個止痛藥上癮也就上癮了,爲啥還會致命呢?這就需要使用第三個模型:系統。

0x3:系統

我們以前講系統思維的時候說過,一個系統最基本的概念包括“庫存”、“輸入”和“輸出”。在前面的馬爾可夫模型中我們把服藥者、上癮者和無痛者描寫成三種狀態,現在我們重新把它們視爲系統的幾種庫存,而人流在庫存之間流動,像下面這張圖這樣,

圖中第一個庫存是“疼痛人羣”,他們中的一部分,進入了“服藥者”庫存。圖中的箭頭表示流動,兩個相對的三角形表示“按照某種比例”。服藥者中有一部分流入了“無痛者”庫存,有些則成爲了“上癮者”。

這樣的描述只適合定性分析,沒有辦法想馬爾可夫模型那樣做定量計算,但就是這麼簡單的系統思維,也能幫助我們理清思路。

上癮者之中,有些並不是來自正常因爲疼痛而服藥的人,他們可能從醫院以外的渠道弄到了藥,這就是圖中上方那個多出來的箭頭。

而更重要的則是圖中最下方那個庫存。上癮者之中的一部分人,可能是因爲想要尋求更高的刺激,也可能是因爲拿不到阿片類止痛藥,選擇了使用海洛因。

而海洛因是真正的毒品,他們中的某些人將爲此付出生命的代價。

這個系統中可能在存在一些正反饋的機制,比如上癮者增多之後,會刺激市場通過非正常渠道提供藥物。系統思維給這些機制提供了一個分析框架。

那麼這些非正常渠道的止痛藥,是如何在人羣中流傳的呢?爲此我們需要第四個模型,社交網絡。

0x4:社交網絡

美國對治理藥物氾濫沒有什麼特別強有力的手段,但是數據收集和相關的研究搞得很好。有研究發現,人均阿片類止痛藥氾濫最厲害的地區,是在鄉村的比較多,而不是在城市裏。那這是爲啥呢?

一個思路是我們可以使用統計模型,“大數定律”說樣本量越大數據就越正常,而樣本量越小數據就越容易出極端,但是純統計性的方差沒有那麼大:鄉村的阿片類氾濫不是偶然現象。

那麼就有人提出了社交網絡模型的解釋。非法藥物的傳播只能在地下進行,而阿片類又不像真正的毒品那樣販賣有危險,所以很可能主要在親戚朋友、鄰居之間傳播。可能一個人找醫生多開點藥,就能順便賣給自己的熟人。城市是個陌生人社會,人與人之間的關係不容易親熱到能互相流通止痛藥的程度,那麼也許彼此知根知底、充滿溫情的鄉村社會更容易流行。

經過這四個模型的分析,我們能看出來藥物氾濫的確是一個很嚴重但是又不好解決的問題。

請問這裏面誰是壞人呢?

  • 是輕易批准了阿片類止痛藥的 FDA 嗎?
  • 是給病人開出長期處方的醫生嗎?
  • 是不知節制導致自己上癮的患者嗎?
  • 是在非法渠道向親友傳播這些藥的人嗎?

我認爲他們都有責任,但是也都有自己這麼做的理由。止痛藥本身並不是毒品,它真的能減輕病人的痛苦。所有人都覺得自己這麼做都是爲了減輕痛苦,至少”主要是“爲了減輕痛苦。關鍵在於,整個這些環節中的每一步,單獨看來,都不會顯著地增加上癮者的人數。

是所有這些環節綜合起來,才導致了今天美國有這麼多的上癮者和濫用者。

所以要怪也許只能怪美國社會這個大系統。

我們還可以再加入別的思維模型。比如美國醫生爲什麼不像中國醫生那樣嚴格控制止痛藥,甚至還動不動就開出長期的處方呢?這可能是因爲美國的社會規範就是病人到了醫院就有“不疼的權利”。病人說你們現代醫學這麼發達,怎麼還讓我整天生活在疼痛之中呢?難道美國不是個發達國家嗎?這種習俗跟咱們中國可能非常不一樣。

那你說既然系統纔是壞人,這個問題應該怎麼解決呢?美國政府非常鼓勵學者調查問題和分析問題,但是本身執行力不行,做事礙手礙腳,沒有什麼雷霆手段。政府不太可能強令醫生不得多開止痛藥,也不太容易開展一場“打擊藥物濫用專項鬥爭”……那麼拿中國當替罪羊,就是最方便的行動。

而我們從這些模型分析能夠看出來,指責中國完全解決不了問題:美國人民本來就非常正當地需要芬太尼,而且需要很多,就算中國從此不供貨了,也會有別的供貨渠道。

真實世界裏但凡是棘手的事兒,都是由多種原因共同導致的,這裏面沒有簡單的答案。如果一切都是因爲一個壞人導致的,控制這個壞人就能解決,那就不是棘手問題了。你必須使用多個模型才能大致上理解一個複雜系統。

 

十五、怎樣使用智囊團

這一章咱們來一場實戰演練。

我們要使用一個真實世界裏的問題,而且還是一個特別受關注的問題:這個世界上人與人的貧富差距爲什麼正在加大。我們要討論的也都是真實的學者們正在使用的模型。 

我們考慮一個虛擬的場景。某天下午,在北京某個私密的四合院裏,一位領導,正在聽取智囊團的意見。與會者包括一位保守派經濟學家、一位自由派經濟學家、一位社交網絡專家、一位政治學家和兩位社會學家。

  • 領導的年齡已經不小了,但是精力十足,很有親和力。他的開場白是這麼說的:

“最近咱們跟美國打貿易戰,有些人認爲美國現在之所以急了,一個重要原因就是它國內的貧富差距越來越嚴重,組織上讓我瞭解一下這方面的情況。我呢,你們也知道,是個講實幹的人,不太關心理論分析,我就認準一條:當官就得給大多數老百姓謀福利!美國貧富差距到底是怎麼回事兒,對咱們中國有沒有借鑑意義,你們都是專家,今天可以暢所欲言。不用講空話套話,就說實在的!我讀書少,你們可別騙我。”

  • 自由派經濟學家老吳是個老資格的智囊成員,他首先發言:

“貧富差距加大確實是美國現今最嚴重的一個問題,而且具有普遍意義,可以說在全世界各個國家都在發生。特別是最近幾十年,差距正在越拉越大。比如說,佔美國人口總數 0.1%的富人,他們的收入水平,在上世紀八十年的時候佔到全國總量的不到 4%,而現在則已經達到了 10%!”

  • 政治學家小周是一位青年女性,她馬上補充說:

“是的是的。拿財富 500 強 CEO 們的工資來說,1966 年一個 CEO 的總薪酬水平大約相當於普通員工的 25 倍,而今天則是 300 倍。”

  • 領導聽了馬上說:

“這也太高了。不說美國人講平等嗎?這麼不公平也能忍?”

  • 保守派經濟學家老張跟老吳關係不太好,兩人經常對着幹。老張說:

“領導,咱們不能光看到貧富差距拉大了,也要看普通人的絕對收入水平提高了沒有。只要窮人的日子比過去好,他們就不會抱怨。事實上過去這幾十年間,世界上的貧困人口總量大大減少了。”

  • 老吳馬上說:

“世界貧困人口減少那是咱們中國的成績,跟美國人有啥關係?”

  • 老張說:

“我的意思是說,不能只看分蛋糕公平不公平,關鍵還是要把蛋糕做大。美國 CEO 的收入高是因爲他們做出的貢獻也大,現代富人的高收入可不是巧取豪奪來的。”

  • 小周的立場看來跟老吳差不多,她說:

“怎麼不是巧取豪奪了?CEO 的高工資是怎麼來的?是薪酬委員會決定的。我們政治學有個模型叫‘中間選民定理’……”

  • 領導馬上打斷說:

“小周你別整這些學術名詞,說白話。”

  • 小周接着說:

“……說白了就是你得看這個決策是什麼人做出來的。美國公司的薪酬委員會成員都是公司高層,很多都是以前和未來的 CEO,他們當然希望 CEO 的工資高,這樣自己就能理直氣壯地也拿高工資。別的國家,比如說德國,普通工人也能進入公司的董事會,董事會的決定就不會特別傾向於CEO,德國CEO的工資只有普通工人的 20 倍,而日本才只有 10 倍。現在美國就是不平等!”

  • 領導說:

“小周你說的挺明白。你們也要像小周這樣,別光下結論,要用模型說話!我喜歡模型。”

  • 這時候社會學家老趙發言了:

“小周說的這個現象,本質上就是富人和富人聯手。我們社會學上有個模型,也能解釋貧富差距加大,也是說富人跟富人聯手,不過不是漲工資,是結婚。”

  • 領導說:

“結婚?是不是富人專門跟富人結婚,強強聯合?”

  • 老趙說:

“沒錯!我們有證據顯示,現在隨着女性受教育水平的提高,越是高學歷高收入的人,越會跟高學歷高收入的人結婚。如果人們隨機選擇伴侶,美國的基尼係數會比現在低 25%。”

  • 另一個社會學家,小王,說道:

“其實這就是財富的家庭聚集效應,婚姻只是橫向的,還有縱向的。比如說,富裕的家長,因爲能給孩子提供更好的教育環境,他們的孩子也有大概率生活富裕;而貧困家庭的孩子,就很不容易自我奮鬥變成富人。”

  • 領導說:

“這個我聽說過,好像叫‘了不起的蓋茨比效應’?你這個研究用的什麼模型?”

  • 小王說:

“就是馬爾可夫模型。我們可以大致估算收入的代際流動性。比如說,高收入父母的孩子有 60%的可能性也會是高收入,而只有 5%的可能性進入低收入階層。再加上富人生活的社區、從小上學的學校裏也多是富人,優勢就更大了。”

  • 領導點點頭,說:

“要這麼說的話,富人天生就比窮人更有辦法增加財富,貧富差距加大簡直就是最自然的現象。”

  • 自由派經濟學家老吳說:

“領導你這句話算是說對了。其實我們在經濟學上還發現一個更深刻的機制,相比之下,結婚和上學都是次要的,那就是資本。富人能用錢生錢,這纔是他們的財富增長之道。”

  • 領導說:

“資本?你是說《資本論》嗎?”

  • 老吳說:

“不是,是法國經濟學家托馬斯·皮凱蒂的《21世紀資本論》。皮凱蒂的根本邏輯是,資本增加的速度(r),總是超過經濟增長的速度(g)。”

  • 領導說:

“這聽着好像有點怪。咱們就考慮最簡單的情況,工廠裏有工人和資本家。如果經濟增長 10%,難道不應該是工人工資和資本家的分紅都增加 10%嗎?”

  • 老吳說:

“理想情況下,資本家的分紅增長的速度的確跟工人工資增長的速度一樣。但我們不能只看增量。比如說就算今年經濟不增長,工廠利潤和工人收入和去年一樣,資本家也要分紅。工人工資低,可能會把所有收入都花光。而資本家的分紅多,就算花掉一部分還會剩下一些,所以資本家的總財富也會增加。”

  • 領導說:

“你說的其實就是資本家自己攢錢,比社會的經濟增長容易。”

  • 老吳說:

“可以這麼說吧,這就是著名的 r > g。那我們想想,資本家攢錢能力這麼強,是不是資本家的錢越來越多,貧富差距越來越大。”

  • 領導說:

“那你要這麼說的話,這個規律應該在歷朝歷代都是如此啊,爲什麼美國上世紀五六十年代的時候就比較平等,最近這幾十年貧富差距才加大呢?”

  • 這時候一直沒說話的社交網絡專家發言了:

“我覺得其中一個原因就是網絡的聚集效應。根據網絡模型,越是著名的品牌和明星,就越容易佔有更大的市場份額,收入也就越高。而現代人的通訊交流手段比過去強了很多,著名品牌和明星越來越容易開拓自己的市場,這個局面就變得更加是勝者通吃了。”

  • 老吳說:

“網絡的正反饋效應的確有,但我還是認爲資本是首要的因素。美國五六十年代的平等,其實是不正常的,是剛剛結束不久的戰爭,把人們的收入給拉平了。只要是和平年代,收入分配的趨勢就是越來越兩極分化。”

  • 領導深吸一口冷氣,陷入了沉思……可是保守派經濟學家老張再也坐不住了,他說:

“老吳你這麼說有點不顧事實了吧?二戰 1945 年就結束了,美國收入分配一直到 1970 年代都很平等,誕生了數量巨大的中產階級家庭,這你怎麼解釋?再者說了,你看看現在美國收入最高的那些人,其中絕大多數都是像比爾·蓋茨、傑夫·貝佐斯、馬克·扎克伯格他們這樣白手起家、靠科技創新獲得的財富,哪裏是靠資本呢?”

  • 社交網絡專家趕緊說:

“所以還是網絡效應嘛,1970 年代以後纔有的互聯網技術,這些新貴都是搞 IT 的。”

  • 領導說:

“老張你別激動,你也說說你的道理。你怎麼解釋美國的貧富差距先是減小,後來又加大呢?你用什麼模型?”

  • 老張說:

“我的模型主要考慮教育。我們可以簡單地把工人分成受過高等教育的高素質工人,和沒受過高等教育的低素質工人。1950 年代那個時候,美國製造業很發達,對低素質工人有很大需求,所以他們都能過上好日子,收入差距就縮小了。”

  • 領導說:

“那爲什麼這個好日子沒有持續下去呢?”

  • 老張說:

“因爲技術進步和全球化。到 1970 年代以後,美國實現產業升級,改爲需要高素質工人。而高素質工人畢竟只是少數,所以貧富差距就拉大了。”

  • 領導說:

“那美國爲什麼不多培養一些高素質工人呢?我聽說現在美國的程序員很多都是從中國和印度過去的,爲什麼不用自己人呢?”

  • 老張說:

“這可能是因爲美國的大學教育太貴了。50 年代的時候因爲政府對退伍老兵上大學有補助,短期內製造了很多大學生,可是現在這個政策沒有那麼大的作用。與此同時又有很多來自墨西哥的低素質移民進入美國……而且高科技行業其實也用不了那麼多工人,所以現在美國的貧富差距纔會這麼大。”

  • 領導說:

“老吳和老張,你們兩個的說法我感覺有點矛盾,你們都有數據支持嗎?還有,該如何減小貧富差距呢?”

  • 老吳說:

“有啊。事實上皮凱蒂的理論與其說是一個模型,不如說是一個觀察。他考察了歷史上各國經濟的演變,r > g 是個普遍規律。歷史證明只有戰亂能減小貧富差距,不過讓我建議的話,應該對富人徵收更多的資本所得稅。”

  • 老張說:

“可是你仔細考察美國這一百年的經濟數據,現在公認是我這個模型更符合事實!決定現代貧富差距的根本力量是技術進步和教育!”

  • 專家們就這樣討論了很久,領導等到大家都說的差不多了,最後總結說,

你們說的我都聽明白了。咱們沒必要爭論誰對誰錯,因爲以我之見,你們說的不是同一個層面的東西。

  • CEO 權力模型和網絡效應模型說的是那些特別高收入階層的情況,對絕大多數人意義不大。
  • 婚姻和家族傳承模型對普通人的意義更大一些,但是那個效應不一定很強,再說代際傳承有可能還會迴歸均值。
  • 皮凱蒂的理論可能具有普遍的意義,但是資本的力量,在當今時代,也許沒有那麼強。
  • 老張說的那個高素質低素質工人模型可能最符合美國的實際情況,但是有點太過具體了,通用性可能不是很好。

衆人一聽無不歎服,心想領導不是搞學問的人,可是腦子倒是挺清楚啊,見多識廣,問問題都問到了點子上,自己有判斷力,而且還會多對一的高級思維,要不怎麼這麼多專家非得是他當了領導呢……

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章