大數據時代的小數字感:數據再有價值,別人聽不懂照樣沒用

說明:原文2016-08-24 發表於阿里云云棲社區:https://yq.aliyun.com/articles/59392



目前,“大數據”概念已經深入人心。很多人都喜歡談論大數據。而我們利用數據,其中一個很重要的目的在於,用之爲決策提供支持。因此,如何有效地呈現出大數據給出的結果,並把數據以“人話”說出來的,並讓受衆(很可能是你的領導)聽得懂,就顯得非常重要的!

想做到這一點,就得迎合人性,或者,更具體點說,要迎合人類大腦的特徵。

一部經典電影引出來的數字感

如果你看過巴里·萊文森導演的經典奧斯卡電影《雨人》(Rain Man),或許你不會忘記其中一個非常有意思的橋段:在餐館裏,患有自閉症的哥哥(達斯汀·霍夫曼飾),面對散落一地的牙籤,目測就能將其分成三小堆,並能很快就給出每小一堆牙籤的數量:82,82,82,然後又瞬間心算出牙籤總數:246。

哥哥的心算能力,的確也不錯,但相比於他高超的數字感——能達到82,那隻能說,驚爲天人了。

當然,這僅僅是影視作品,我們知道,影視作品通常是基於生活,而高於生活的。那麼真實的生活場景,我們普通人又是什麼樣的呢?數字感又是什麼東東呢?

在進行解釋之前,請讀者快速瀏覽一下如圖1所示圖片,不用數出來,告訴我,你看到了多少張人臉臉譜?


圖1  數字感測試

相信絕大部分人,都能瞬間給出正確的答案:五個!而無需用從一數到五。美籍數學家託拜厄斯•丹齊克(Tobias Dantzig)指出,這就是一種“數字感(number sense,)”,亦稱數(shù)覺,它是一種不通過數(shǔ)數(shù),一眼就能看出物之多寡的感覺。

烏鴉的數字感

這種原始的數字感,在很多動物身上也有體現,例如鳥類。丹齊克在其科普名作《數:科學的語言》中,提供了一個有趣的例子:

有一隻烏鴉,在一個莊園主的望樓裏築巢,園主不勝其擾,決心打死這隻烏鴉,但他嘗試了多次,都沒有成功,因爲人一旦靠近,烏鴉就非常警惕地飛離了巢穴,遠遠地待在樹上,耐心地等人離開望樓,然後再飛回巢穴。


圖2  烏鴉的數字感

有一天,園主心生一計:決定讓2個人同時走進望樓,然後留一個潛藏裏面,另一個出來走開。但這個烏鴉並不上當,它還是等着,直到第二個人出來。

這個實驗一連做了幾天:兩個人,三個人,四個人,都沒有成功。最後,用了五個人:也像前幾天一樣,先一起進望樓,然後留一人潛藏其內,其他四個人走出來。這次奏效了,烏鴉的數字感終於“失靈”了——也就是說,但集合變大後,烏鴉已經無法辨別四與五的差別,因此它馬上飛回巢裏,然後被留在望樓的人,逮個正着。

人類的數字感

“數字感”是動物的基本心理特徵之一。丹齊克指出,“一種比鳥類高強不了多少的原始數覺,就是我們有關數字概念的核心。”

但是,我們能否將這種數字感,和人類的其它五種感覺(即視覺,聽覺,嗅覺,觸覺和味覺)相提並論嗎?

答案是:還真能!

在2013年9月6日的《科學》雜誌上,荷蘭烏得勒支大學(Utrecht University)研究小組,對這一問題實施了深入的研究[3]。這項研究表明,我們的大腦,有一個固定的區域來處理數字感,從而使得我們具備不用計數就能感知數目的能力——也就是說,事實上,我們人人都是具備第六感的(女人那項特殊的專有感覺,要排名第七了!)。這項研究打破了原有的界限:大腦的一邊負責處理來自感覺器官的刺激,另一邊負責管理抽象概念(比如數字)。

數字,在本質上,是人類是對實物的一種抽象。人類接受這種抽象的能力,歷經年代非常久遠。英國著名哲學家伯特蘭·羅素(Bertrand Russell,1872~1970)針對數的抽象性,總結道:“僅僅在文明的高級階段上,我們方能以一串數(自然數串)作爲我們發現的起點。在遠古時期,發現一對錦雞和兩天,都是數字二的實例,一定需要很多時代。其中所包含的抽象程度確實不易達到。”

作爲高智慧動物,人類相比於其它動物,這種數字感相對較強。但這個“相對性”也是非常限度的,在目標個數超過7個時,人類的這種感覺也會明顯下降。

讀者可以嘗試看圖3所示的圖片,在圖3第一列中,無論黑點的大小或形狀如何變化,你都能一眼判斷出目標的數量爲1。在第二列中,也沒有問題,你也可以秒測出目標數量爲4。而在第三列,你可能就沒有那麼容易在不數數的情況下得出答案爲7。當目標元素的個數繼續上升,人類的這種引以自豪的數字感,或者說對抽象數字“渾然天成”的理解,就會迅速衰減。


3不同數據的數字感測試(圖片來源《科學》)

從數字感得出的一點啓發

從上面的討論,我們能得出什麼啓發呢?那就是,如果你想讓你的受衆,一點也不費力地理解你的數字,你最好換個說法,儘量用10以下的數字來描述。

比如,在加多寶廣告裏,最好不要給出一個海量數字,說在中國,我們每天售出312 458罐加多寶(無法得到準確數字,此處僅爲說明問題,而虛構了一個大數字)。而是更好的說法可能是:“中國每賣10罐涼茶7罐加多寶!”這裏我們不去爭論其中的是非曲直,但後者用小數字,明顯更能打動消費者,因爲他們更容易聽懂了!

再比如說,如果你是醫生,要叮囑尿路結石的患者,每天要喝1500ml水。這樣冰冷冷的數字,患者很容易無感。但是換一種說法,對患者說,你每天喝3瓶農夫山泉的水量,患者的記憶效果就好很多。

此外,說到底,人還是一個感性居多的動物。人類用了幾百萬年的進化,纔對小於7的數字有瞬間秒懂的數字感。而理解更爲複雜的數據,必須越過更高的認知壁壘,才能對客觀數據對象建立相應的心理圖像,完成認知理解過程。

人類有個爬行腦(那個控制人慾望的那部分大腦)更喜歡視覺化的信息,而不是抽象信息。因此,只有迎合大腦的特性,才能讓我們的數字,具有衝擊力和感染力,進而更具有說服力。

萬維鋼先生最近(2016年8月12日)寫了一篇小短文《要怎麼說,別人才能聽懂你的數據》,文中就列舉了一個案例:2016年6月《紐約時報》刊登了一篇文章(Compare these gun deathrates: The U.S. is in a different world)[4],這篇文章的主旨,是用統計數據來說明美國槍支的泛濫程度,事實上,這個話題毫不新穎,但可圈可點的是,或者說值得數據科學家借鑑的是,文章作者解釋數據的方法,別具風格。

根據美國FBI統計,2014年,美國有8 124人死於槍殺。人類那點可憐的數字感,對於這個數字的感覺,只能感性地停留在控槍的情況“比較糟糕”。但具體情況有多糟糕,報紙的受衆基本上是沒有什麼概念的。

而《紐約時報》的做法是——儘量降低數字!增強數字感!

美國人口共有三億多人,死於槍殺的8124人,其實,這相當於每百萬人有31人死於槍殺,平攤到每一天,日死亡27人。

可是國家這麼大,每天死亡27人,又有什麼特別的呢?

正可謂,不比不知道,一比嚇一跳!

文章作者接着又把美國的槍殺死亡數字,跟其它發達國家做了橫向對比:假設其它國家的人口,也和美國人口一樣多,那麼他們日死亡於槍殺的數字又分別是多少呢?文章給出瞭如圖4所示的可視化圖。

圖4 美國與其它發達國家死於槍殺的人數對比圖(圖片來源:紐約時報)

由圖4輕易看出,美國就是一個孤立點,“鶴立雞羣”,其死於槍殺的人數,在發達國家中遙遙領先,給人以強烈的衝擊力——美國的控槍,勢在必行了!

結語

由此,我們可以得知,數據是理性的,而給人震感的,卻是感性,而連接感性和理性的途徑,靠的就是受衆的數字感和數字的可視化。

數據再有價值,別人聽不懂照樣沒用。抓住人性特徵,充分利用人的數字感和可視化青睞,以良好的數字呈現方式,可以讓冰冷冷的數字瞬間活過來。

在大數據時代,對於數字,數據科學家們懂,不算懂。大家懂,那才叫真的懂!

參考文獻

[1] 託拜厄斯•丹齊克 著. 蘇仲湘 譯.數:科學的語言——爲有文化而非專攻數學的人寫的評論性概述 [M].上海教育出版社.1985

[2] 伯特蘭•羅素. 數理哲學導論[M]. 商務印書館, 1982.

[3] Harvey B M, Klein B P, Petridou N, etal. Topographic Representation of Numerosity in the Human Parietal Cortex[J].Science, 2013, 341(6150):1123-6.

[4] Margot Sanger-Katz, Kevin Quealy .Compare these gun deathrates: The U.S. is in a different world [J]. The New York Times,2016-6-13

 

作者簡介:張玉宏,著有《品味大數據》、《深度學習之美》等書。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章