經驗分享:數據分析的五個階段

前言

       數據分析,也被稱爲營銷分析、經營分析等,就是通過一定的工具、算法,結合業務邏輯將數據背後的真正原因找出來,爲企業的發展方向提供數據支撐。在這個越來越對數據重視的時代,數據分析的價值也在迅速提升。在大部分部門,尤其是前端營銷部門中,數據分析工作的好壞可能會直接影響一線的業績。所以如何做好數據分析,是每一個數據分析師需要思考的問題。筆者在10年的數據分析工作生涯中,經歷了好幾個階段,也有一些思考和總結,供大家參考。

階段一:初入職場的菜鳥分析師

       在這個階段中,你只是初入職場的菜鳥,不會特別的技巧也不懂公司的業務,甚至公司IT部開發的前臺系統(比如IDAP、QV、自助報表等)中也有很多功能不甚瞭解。只能根據前人的經驗或者公司的培訓,知道該從哪裏取數。當清單下載下來後,能夠使用的工具也只有Excel,而且只會最簡單的數據處理,稍微複雜一點的vlookup、數據透視表、數據有效性等只能靠百度、培訓等慢慢提升。

階段二:部門同事眼中的表哥/表姐

       經過階段一的磕磕絆絆後,你對業務已經有一定的理解,知道數據背後的業務邏輯,能夠在某一個數字變高或者變低時,通過熟練的Excel操作將產生問題的原因找出來。處於這個階段的你,在部門內很多員工的眼中,就是一名錶哥/表姐,數據需求一提出來,你就能熟練地給出一份完善的報表;有什麼Excel的問題,問你比問百度更快獲得答案。另外在數據處理的經驗上,你也已經有了一定的儲備,比如數據字典、數據口徑等,出來一項新的業務口徑你不看都能猜得八九不離十。近一半的數據分析師可能將一直停留在這個階段,因爲大部分部門的數據量並不大(少於100萬),使用Excel加上業務邏輯已經能滿足80%的日常工作需求了。

階段三:開始使用數據庫和自動化

       隨着數據量的越來越大,傳統的Excel已經無法滿足你的工作需求,而DBA(數據庫管理員)因爲不懂業務邏輯也常常給不出你想要的數據,所以你只能開始自學SQL知識。所幸的是SQL並不難,對於一名數據分析師並不需要像DBA一樣對各個表格進行維護,只需要根據業務邏輯,在不同的表中找到需要的字段,通過select、join、count、sum等函數進行組合即可。除了數據庫外,也有人可能會想要使用BI工具,比如Power BI、Tableau、Finebi等,使用方法和Excel類似,但是功能強大了不是一點點,本來需要一定開發能力才能完成的自動化報表工作,通過與Excel一樣的鼠標拖曳操作即可輕鬆完成,工作效率上獲得了質的提升。在這個階段的你,可以從繁重的日報、週報中略微透一口氣,思考如何通過數據提升業務發展。

階段四:不是隻有平均數

       平均數是數據分析中用的最多的一個計量尺度,但是姚明和郭敬明的梗用了這麼多年,大家也應該理解平均數的問題所在。實際上有很多的計量尺度:中位數、方差、離散程度、偏度、峯度都在不同的場景中可以有很多的運用,而數據分析方法也有方差分析、迴歸分析、相關係數等等,而這一切的知識集中起來就是一門學科:統計學。可以說只有將業務知識、統計學知識和工具使用知識三者合一的人,纔是一名真正合格的數據分析師。

階段五:向數據科學家進階

       數據挖掘是數據分析的進階,它還有一個更爲人所知的名字:機器學習,人工智能只是機器學習裏的一個分支。在這個階段,你不僅需要從業務的角度去理解數據,還要通過算法來挖掘數據背後隱藏的關係。機器學習的算法非常非常多,平常人終其一生都可能無法學透。好在開源社區的存在將很多算法都封裝成庫,我們只需要通過程序調用即可享受算法帶來的好處。但是即使如此,建議還是要學習一下算法的原理,只有這樣才能更好地選擇、運用算法。基礎階段,需要了解、學習的機器學習算法包括:邏輯迴歸、線性迴歸、KNN、K-means、決策樹、貝葉斯、SVM等等。更關鍵的是,在這個階段務必需要掌握一門編程語言,比如Python就是一個很好的選擇。

總結

       上述的五個階段除了階段一外,剩下的四個階段並不完全是順序關係,僅僅是針對我自己而言,有統計學、編程基礎的同學只要經過一段時間的業務理解就能直接邁入階段五。但是還是要重申一點:所有的數據分析都要建立在業務本身,脫離業務的數據分析只是一種數據猜測,風險極大,慎重!

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章