數據爲什麼要可視化?如何可視化?



來源 | CrossHands(ID:SmallWorldBigIdea)

作者 | AhongPlus


01數據爲什麼要可視化?


  • 一方面是因爲數字太抽象,圖表更直觀,而且圖表可以突出數據中的關注點(比如某個月的交易大幅度波動等);

  • 另一方面,數據面向的受衆大都不具備專業的數據知識,可視化的形式有助於降低讀懂數據的門檻;

簡言之,數據可視化提高了數據溝通的效率。

舉個例子,假設現在年終彙報某KPI的達成情況,數據如下表所示:


640?wx_fmt=png


可視化後的效果如下:


640?wx_fmt=png


觀察可視化後的圖表,很容易就能發現Q3沒有達標,但年度累計是達標的。


02數據可視化的一般步驟(以數據彙報的場景爲例):


1. 準備原始數據,一般是經過統計的數據;

2. 明確展示的對象(給誰看,不同的彙報對象關注的業務角度和數據顆粒度不一樣;

3. 篩選數據中需要突出的點,確認數據背後要表達的主題或者結論;

4. 選擇合適的圖表類型

5. 選擇可視化的工具

6. 根據PPT的風格,調整圖表中的文字、線條、形狀以及對應的大小、顏色等,對圖表中的要素佈局進行調整;


03好的數據可視化所具備的特徵


  • 展示了一個完整的故事(觀點或結論等也可以說“問題導向”(因爲要說明一個問題,所以纔會統計出數據

  • 適量地展示有效信息,展示的內容並不是越多越好,抓住問題的主幹信息即可;

  • 展示信息的形式能清晰直觀地表達數據的內涵,受衆能很好地理解圖表要傳達的信息;


640?wx_fmt=jpeg

注:來源見圖片左下角


這裏以 Hans Rosling 在 TED 上的一個演講來說明“優秀的數據可視化”是什麼樣子的。



視頻源地址:https://www.ted.com/talks/hans_rosling_shows_the_best_stats_you_ve_ever_seen


04關於圖表的選擇


圖表的選擇主要基於兩方面:

  • 數據的類型和結構,比如數據是數值還是文字,是百分比還是絕對值?數據的維度如何等;

  • 圖表的功能,是要進行對比還是描述時間序列,抑或是說明成分結構等;


這個網站(https://datavizcatalogue.com/ZH/)總結了常見的可視化圖表類型,不僅按功能進行了分類,還對每種圖表的製作過程及適用場景進行了說明,非常推薦。比如關於時間序列的展示,可以選擇的圖表方案如下:


640?wx_fmt=png


另附兩張圖表選擇的 guideline 供參考。


640?wx_fmt=png

https://associationanalytics.com/2017/06/25/choose-right-visualization/


640?wx_fmt=jpeg

原作者 Andrew Abela 圖源 https://vizard.co/tableau-interview-questions/


05關於可視化工具的選擇


如果是個人使用,建議選擇現成的或者學習成本相對低的工具。按是否需要編程可以將作圖工作分爲兩類:

  • 不用編程(幾乎:比如 Excel, Power BI, Tableau, SPSS 等。

  • 需要編程的工具:比如 Python, R, SAS 等統計軟件,還有 Fine Report, Echarts, D3.JS, plot.ly 等可視化控件。


如果是工作中使用,則可能還要考慮其他方面:

  • 圖表類型的豐富度,e.g. 是否支持工作中要用到的圖表;

  • 前端交互的友好程度,e.g.是否有控件可以直接拖拉拽來生成圖表,界面是否支持交互操作,是否能導出不同格式或者分辨率的圖片,顏色風格可以自定義等;

  • 底層數據的支持,e.g.非結構化的文本數據,數據量很大,數據接口調用是不是方便等。


06關於數據可視化的補充


1. 基本的圖表是可以組合使用的,比如柱形圖和折線圖組合使用:


640?wx_fmt=png

注:筆者參考網上教程使用Excel製作的“折線柱狀圖”,還可以進一步美化的


2. 圖表中的線條或者形狀可以變得更有意思一點,比如做柱狀圖的時候可以在“柱”裏填充圖案,更多參考(http://club.excelhome.net/thread-1019338-1-1.html)。


3. 可視化不要用力過猛,比如:


640?wx_fmt=png

圖片來源:Say It with Charts Workbook, Gene Zelazny


4. 發揮創造性,增強對比性,比如:


640?wx_fmt=png

640?wx_fmt=png

圖片來源:Say It with Charts Workbook, Gene Zelazny


5. 不要在可視化中“耍花招”或者產生其他誤導信息,比如調整座標軸使並不嚴重的輕微數據波動趨勢看起來很嚴重(最好不要這麼幹)。


640?wx_fmt=png

圖片來源:https://www.huffingtonpost.com/raviparikh/lie-with-data-visualization_b_5169715.html


07數據可視化的學習資源


  • 網站

1. https://datavizcatalogue.com/ZH/

2. Python作圖可以參考 

https://python-graph-gallery.com/

3. Python 實現 50 種圖表的製作 

https://www.machinelearningplus.com/plots/top-50-matplotlib-visualizations-the-master-plots-python/

4. 如果用 R 作圖,那麼看這裏 

https://www.r-graph-gallery.com/

5.  https://datavizproject.com 給出各種圖表的說明以及每種圖表的實際使用案例(如果你知道圖表長啥樣但不知道名稱可以來這裏搜)。


  • 教材

1. 《用圖表說話:麥肯錫商務溝通完全工具箱Gene Zelazny,清華大學出版社,主要內容講商務場景下選用什麼圖表,以及優化方案;

2. 《寫給大家看的設計書Robbin Williams,人民郵電出版社

3. 《Excel圖表之道劉萬祥,電子工業出版社,工具不重要,方法更重要;學習優秀的商業圖表(經濟學人等期刊雜誌也是可視化精進的方式之一;

4. 《數據之美:一本書學會可視化設計Nathan Yau,中國人民大學出版社;

5. 《鮮活的數據:數據可視化指南Nathan Yau,人民郵電出版社;

6. 《Storytelling with Data:A Data Visualization Guide for Business ProfessionalsCole Nussbaumer Knaflic(中譯本爲:《用數據講故事


如果你要檢索數據可視化指南相關的信息,可以使用關鍵詞

  • data visualization, charts, graph

  • cheetsheet, guide, guideline, chooser, collection, cookbook, gallery


640?wx_fmt=gif數智優質活動推介640?wx_fmt=gif


由上海市經濟和信息化委員會、上海市商務委員會、上海市長寧區人民政府指導,上海市長寧區青年聯合會、億歐公司聯合主辦的“ 2019全球新經濟年會-產業互聯網峯會”將在上海長寧舉辦。


本次大會邀請了慧聰集團、甲骨文、盛景網聯、千方科技、找鋼網、金山雲等產業巨頭 ,明勢資本、遠望資本、阿爾法公社、賽意產業基金等產業互聯網一線投資人。產業互聯網從業與創業者將共同參會交流產業互聯網的未來,共話產業變革新機遇。


大會截止日期6月13日,感興趣的小夥伴可“掃描下方海報二維碼或點擊“閱讀原文進行活動報名和查看大會議程安排。


111.jpg

活動頁面鏈接:https://www.iyiou.com/a/cyhlw_shanghai_2019/

掃描海報二維碼 或 點擊閱讀原文

進行“活動報名”以及“查看大會議程安排


|| 推薦閱讀 ||


鏈接圖片1.png

https://mp.weixin.qq.com/s/tL0hNaSwp990iF6-e2UgkA


鏈接圖片3.png

https://mp.weixin.qq.com/s/Bj9VK6kNGUTolw-FaA_YOw



640?wx_fmt=png


640?wx_fmt=jpeg


星標我,每天多一點智慧

640?wx_fmt=gif


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章