回答數據分析的兩個基礎問題

回答數據分析的兩個基礎問題

                    越是沮喪的時候,越要學會自我拯救。

導讀:2020年註定不平凡 ,年初新冠疫情爆發,形勢陡然緊張,武漢、中國,成爲全世界的關注點和話題。也許出於職業的原因,我對幾個數據分析話題饒有興趣。

預測感染人數的增長趨勢

評論新冠病毒致命性

預估西方的終極感染人數

彼時,對這三個話題的參與者可謂魚蝦俱下,往往煞有介事。筆者自愧學術能力差、分析技術單薄,沒敢摻和其中。其實也是“恥於”此事。爲何?這些哄洋洋的傢伙都是唯技術論者,完全忽略了兩大最核心因素的影響——①病毒的特徵、②人爲努力。在病毒特徵(尤其是潛伏期時長、傳染性)還不明確的情況下就敢預測走勢?扯淡!埃博拉、寨卡、新冠所面對的國家防疫力量完全不同,就敢簡單用死亡率來評判他們致命性大小?扯淡!彼時居然很多人煞有介事地說西方國家最終會將感染人數控制在一兩萬人內。笑話!

說來好笑,彼時得知病毒潛伏期時長後,筆者的一個判斷和擔憂卻不幸/有幸言中——“我國的疫情很快會得到控制,但國外估計懸了,如何防控海外輸入將是個難題!中國很可能成爲世界抗擊疫情的大後方。”做這個判斷除唯一數值型數據依據(病毒潛伏期時長)外,全憑“直覺”,但爲什麼判斷對了呢?

這,就是我們在數據分析工作中最常面對的基礎問題。

01 數據分析師是誰?

相信相當比例的數據分析師認爲自己屬於技術人員,更大比例的領導同事會把數據分析師看作技術人員。確實,數據分析師職責很寬泛、知識面需求更寬,確實需要必備的技術能力;但是如果我們真把自己當成“技術人員”,就難免陷入尷尬——高大上的數據分析師,成了跑數出報表的小催吧。

筆者認爲,技術乃爲達到目的之工具,而業務、解決業務問題纔是數據分析的根本、立足點、出發點。所以,瞭解業務、熟悉業務、理解業務是數據分析人員必須要做到的,且是首要的。其對業務的理解程度往往要比一線業務人員更透徹、更全面、更系統,只有這樣,我們才能知道:

我們需要收集、抓取哪些數據?

無法採集到的數據可以用什麼數據來替代使用?

各個數據所代表的意義,才能確定最恰當的數據口徑。

各分析要素的邏輯關係,因果關係?相關關係?無關係?

結論是否有價值?結論是否可以落地?

……

對業務不熟悉、理解不夠透徹,那麼所謂的數據分析就易於流於想當然、形而上,不能解決實際問題。從而得不到公司、領導層、業務層的認可,也是自然而然的情況。

這是數據分析師的自我認知問題。

02 數據分析需要面對哪些侷限?

數據是什麼?數據是客觀存在的陳述。客觀存在本就複雜,客觀存在間的關係更加複雜,全面掌握對某個客觀存在的認知,對任何一個人都是巨大的挑戰。而數據分析人員恰恰要直面這個挑戰。

1)分析對象依次受到哪些因素的影響?冥冥中,其實我們很容易忽略某些關鍵因素。比如上面所說的“病毒潛伏期時長”“人爲努力程度”、比如天氣對人行爲的影響等。即便我們通過大數據分析從諸多因素中篩選關鍵因素,卻也難保證我們羅列了全部關鍵影響因素。

2)各種影響因素的權重如何?要知道,權重是變化的,隨着時間環境的改變,各要素影響力是不同的。

3)許多關鍵因素我們難以量化、或獲取到數據。比如上面的“人爲努力程度”該如何量化?假設通過資金投入來進行簡單衡量,我們也發現很難獲取到準確數據;更遑論應對埃博拉病毒的投入。

4)技術能力是否足以對各類因素進行有機分析?自詡爲技術人員的數據分析師們更有發言權。我們所學習的基本都屬於西方思想的方法論,其具有無法窮舉、分化割裂的弊端,我們往往陷於以(侷限於環境的)先驗去證未驗,以(自以爲的)已知去證未知。譬如西醫,胳膊是胳膊退是退,似乎明明白白,卻常就此失彼。業務環境一變,一切作廢。

如果理解了上述兩個關鍵問題,我們便很自然地理解了:

數據的欺騙性

數據的時效性

數據的侷限性

理解了爲什麼優秀業務人員的判斷常常比經過複雜數據分析得出的結論更加準確,理解了爲什麼哪些個業務人員不鳥我們。優秀的業務人員如老中醫一般懂得系統性、辯證地看待、分析問題,過程有時猶如玄學,但有其邏輯,但卻有效。

爲什麼我對疫情發展有那樣得判斷,還判斷準了?我的邏輯其實很簡單——

新冠病毒由於具有很長的潛伏期,所以無症狀患者自此期間會產生大範圍的傳播。

除非對人員進行有效的隔離。

我國無論從體制、文化、民族性上,都具有人員有效隔離的可行性。

但西方“自由主義”、個人主義盛行,再加上無系統的基層組織條件,所以進行隔離幾乎是不可能的。

這裏無關乎任何其他數據,只有類似於陰陽五行的推演。這裏沒有其他數據,但我們不能說這不是數據分析,至少不能說這不是分析。“數據分析”的主體詞是“分析”,而非“數據”。

一個數據人的自留地是一個助力數據人成長的大家庭,幫助對數據感興趣的夥伴們明確學習方向、精準提升技能。關注我,帶你探索數據的神奇奧祕

1、回“數據產品”,獲取<大廠數據產品面試題>

2、回“數據中臺”,獲取<大廠數據中臺資料>

3、回“商業分析”,獲取<大廠商業分析面試題>;

4、回“交個朋友”,進交流羣,認識更多的數據小夥伴。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章