關於時序數據與比例數據的圖表可視化

什麼是時序數據

時序數據,是指任何隨着時間而變化的數據。而根據數據是否連續可以分爲離散型時間數據和連續型時間數據。
離散型時間數據:是來源於具體的時間點或者時間段,而且時間數據的可能取值是有限的;
連續型時間數據:事實上連續型時間數據和離散型時間數據沒有本質區別,因爲時間是可以不斷細分的,所以連續時間更多地是一種在某種時間單位計算上不間斷地數據,但是它還是離散且有限的。

分析時序數據的基本目的

主要研究數據隨時間地變化趨勢和變化規律。

時序數據圖表選擇和注意事項

  • 離散時序數據

  • 單一柱狀圖
    適合表現單類別的離散時序數據,但需要注意數據條數一般不超過12條,需要注意柱數據太多導致圖表畫面過於密集,對使用者造成的干擾。另外該種圖表不適合展示出時間的連續變化。

  • 並列柱狀圖
    可以表現多類別的離散時序數據,但需注意類別數最好不要多於3,需要注意柱子太多和柱顏色過多對使用者讀取信息時的干擾。

  • 堆疊柱狀圖
    可以表現出各個時間點部分數據和整體數據的一種圖表,堆疊柱狀圖也分兩種:
    普通堆疊柱狀圖:展示實際值;
    百分比堆疊柱狀圖:展示相對值。
    在堆疊柱狀圖中,構成整體的種類最好不要過多,需要注意把重點突出。

  • 散點圖
    通常用來表示兩個變量間的相關關係,所以可以用來表示某一變量隨時間變化的關係當散點圖裏不止一個類別時,需要用不同顏色區分不同類別,同時也可進一步地對不同的類別使用不同的形狀作爲“點”。由於“點”比“面”佔面積更小,所以能更好地表現出“流”的感覺。

  • 連續時序數據

  • 折線圖
    適用於表示數據在一個連續地時間間隔或者時間跨度上地變化。需要注意時間間隔需要相同。折線圖可以有三種不同的表現形式,包括點線圖,折線圖,曲線圖。從點線圖中可以觀察出數據的變化趨勢和異常波動

  • 階梯圖
    可以表示相鄰的時間節點間的升降變化。相對於點線圖,階梯圖更多地變現了數值變化的突然性,表明數據不是慢慢變化,而是在一段時間中停留在某個值上,然後突然出現增長或者衰退。

  • 擬合曲線圖
    根據多個數據點擬合出一個最接近的一個連續函數關係。當數據點地分佈雜亂無章時,使用迴歸或者其他方法,可以根據數據點擬合出在一條整體趨勢變化曲線。此外,該方法也可以應用於數據預測中。

什麼是比例數據

比例數據,通常是按照類別,子類別,羣體對整體進行了劃分的數據。

分析比例數據的基本目的

對於比例型數據,我們一般是爲了尋找整體中的最大值,最小值,整體的構成分佈,以及各部分之間的相對關係。

比例數據圖表選擇和注意事項

  • 餅圖
    通過角度來映射各類別對應的數值,當組成整體的類別比較少時,可以使用。當扇區過多時,可以按照比例,把佔比排末位的幾類,歸爲“其他”。
  • 環形圖
    通過各弧形的長度來衡量數值。環形圖中心部位是空的,可以放置標籤或者指標數值。
  • 百分比堆疊柱圖
    適用於當比例數據中存在多個父系列,每個父系列又由多個子類構成,且各個系列的子類相同的數據。需要注意,在百分比堆疊柱圖裏,每個系列的柱形高度都是一樣的,頂部刻度都是100%;柱子內部條形的高度代表了該系列的佔比。
  • 百分比堆疊面積圖
    適用於比例數據中存在多個父系列,且父系列的數據類型爲時間,而需要分析父系的各構成部分佔比隨時間的變化趨勢的情況。
  • 矩形樹圖
    基於面積的可視化方法。外部矩形代表父級類別,內部矩形代表子類別。矩形樹圖更適合展示具有樹狀結構的數據。需要注意如果使用矩形樹圖來表示多個層級結構的比例數據,通常需要一些交互方式來輔助使用者查看數據,比如下鑽,跳轉等。

一些想法

  • 柱狀圖和折線圖是否需要從0開始?
    首先,我認爲,在不會誤導使用者的情況下,可以接受不從0開始,但是應該避免這種做法。
    柱狀圖是以柱子的長度作爲視覺通道的,使用者可以通過柱子的長度來大概判斷出不同類別的數據間的大小比例關係。但如果Y軸原點不爲0,如下圖,則會導致柱子間的長度比較不再能體現出不同類別間數據的大小比例關係。例如只看2月數據,以0爲原點的圖表中,A:B大概是4:3,但是在以2爲原點的圖表中,A:B就是2:1了。所以,我不建議不從0開始。在有選擇自由的情況下,應該儘量避免這種情況。(如果作圖者沒有其他選擇,必須這樣做,那我建議採取手段進行說明和標記,儘量讓使用者不會被誤導。)
    在這裏插入圖片描述
    在這裏插入圖片描述
    而如果折線圖如果不從0開始,則相當於對摺線圖的進行放大縮小操作,因爲折線圖事實上是以點的位置作爲視覺渠道的,點與點之間的相對位置是不會因爲原點的變化而發生變化的,而點與點之間的連線這會因爲原點的變化而變成或者變短,這在我看來相當於放大縮小,如下圖,在折線圖中,這種放大縮小我覺得在合理的範圍內是可以允許的,其目的應該是讓使用者看清楚數據的變化曲折。但如果放大縮小的目的是爲了誤導使用者,讓其對數據的變化緩急產生錯覺,這就是不允許的。
    在這裏插入圖片描述
    在這裏插入圖片描述
    最後,我總結一下,從數據獲取與處理到數據可視化,使用者看到的數據,其實是你想讓他看到的數據,這裏面有一定的引導性。有引導性是很好的,但是一定要客觀,要有說服力,如果你在圖表中改變了Y軸原點的起始值,一定要確保你圖表的使用者不會被誤導,你可以通過對比以0開始和不以0開始的圖表對比,來說明不以0爲開始的必要性。
  • 堆疊柱狀圖與堆疊條形圖

現在有種圖表分類是這樣的,豎着的是柱狀圖,橫着的是條形圖,我以這種分類法說一說我對堆疊柱狀圖的看法。在人們觀察圖表時,一般是按“之”字路線觀察,按此理論,如果是絕對值的堆疊柱狀圖,使用者往往會看到總體的變化或比較,然後再看整體的組成。而如果是百分比堆疊柱狀圖,則會變成使用者看了一排100%的柱子,然後再看整體的佔比。對於絕對值條形圖,使用者會先看到第一個類別的組成,然後是第一類別的總數,然後是第二個類別的組成,然後是第二類別的總數,依次類推,到最後,再回到右上角,從上往下看各類別大小對比。又或者先把第一個類別看完,然後從右上角往右下角看各類別大小對比,再回到左上角看第二類別,再看第三類別數據。而如果是百分比條形圖,使用者先看到第一個類別的組成佔比,然後是第二個類別的組成佔比,依次下去,但使用者不會看各類別大小比較,因爲都是100%。以上是我按[柱狀圖/條形圖,絕對值/百分比]維度,描述了四種圖表的觀察順序,綜上所述,對於堆疊柱狀圖/堆疊條形圖,如果是絕對值比較適合柱狀圖,百分比比較適合條形圖。

  • 其它
    在製作柱狀圖/條形圖時,需要注意柱形的寬度和柱子間的間隔寬度,如果間隔的寬度和柱形寬度相近,視覺上就會產生振動效應,給人感覺柱形和間隔的角色發生了互換。

實踐作業

問題1:展示2018年全年的銷售額整體趨勢情況,以及不同品類銷售額的發展趨勢,應該用什麼圖表展示?
答案1:並列柱形圖加折線圖
在這裏插入圖片描述
問題2:展示某隻股票的價格變動,應該使用什麼圖表?
答案2:瀑布圖
問題3:展示某日,該快遞公司的寄件單的攬收時效分佈及其佔比情況,應該使用什麼圖表?
答案3:矩形樹狀圖
問題4:既要對比同一公司內部,不同流向的包裹的承運量佔比;又想對比不同快遞公司之間,同一流向的包裹承運量的佔比差異,應該用什麼圖表?
答案4:百分比堆疊條形圖
在這裏插入圖片描述

參考資料:
1.《七天數據可視化之旅》第二天:數據圖表的選擇(上)
2.《用故事將數據》
3.《鮮活的數據:數據可視化指南》

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章