本篇文章可以讓你學到Excel基本可視化的所有圖形,以及各個圖形對應的特性和應用場景,注意事項等。讓我們愉快的開始學習吧。GoGoGo!!!
1、主題
學習此篇用到的Excel2016版本。
文章主要通過簡單的案例總結學習條形圖、柱狀圖、折線圖、散點圖、餅圖、環形圖、箱線圖等基本可視化⽅案的信息表現⽅式、使⽤場景及可視化實現⽅法。
2、學習目的:
瞭解excel各個作圖功能區域,瞭解各模塊功能和相應操作實現。
- 掌握excel作圖功能區相應操作。
- 掌握各類可視化圖形的特徵和信息展示⽅式。
- 掌握圖形制作的基本流程和⽅法。
圖表的選擇
:確定要表達的信息→確定相對關係→選擇圖表形式。- 從多個維度觀察數據,明確要表達或分析的主題。
- 明確要表達的數據之間的關係(突出重點)。
- 梳理數據關係,並根據數據特徵、數據關係選擇合適的可視化圖表。
可視化實現
:選擇數據,完成基本圖形→調整⼤⼩⽐例→潤⾊(顏⾊、⽹格線、背景⾊)→增加圖例座標軸單位和標題。
3、柱狀圖與條形圖
3.1 圖形簡介
柱狀圖是使⽤垂直的柱⼦顯示類別之間的數值⽐較,其中⼀個軸(⼀般橫軸)表示需要對⽐的分類,另⼀個軸(⼀般縱軸)表示相應分類下的數值表現。
條形圖是柱狀圖的轉置,⼯作中柱狀圖使⽤居多。
3.2 基礎用法
柱狀圖或條形圖描述的是分類數據,回答的是每⼀類中“有多少?”的問題。
此外柱狀圖也可以⽤於展示
時序數據的趨勢變化; 需要注意的是,當柱狀圖顯示的分類很多時會導致分類名稱重疊等情況,該情況可考慮⽤條形圖代替。
柱狀圖主要展示對⽐差異,如果是時間序列可以考慮柱狀圖展示趨勢,此外條形圖多⽤在排名的可視化展示中。
柱狀圖常⽤的⼏類圖形
單⼀柱狀圖
:反映單⼀類別數據對⽐,或時序數據趨勢。並列柱狀圖
:展示兩類及以上數據的對⽐,也可展示變化趨勢。堆疊柱狀圖
(不建議分類超過5類,超過時可以選擇最重要的分類,不重要歸爲"其他"處理)。普通堆積柱狀圖
:展示數據的內部結構分佈和整體的變化情況。百分⽐堆積柱狀圖
:展示整體內部的相對佔⽐和變化趨勢。
3.3 常用圖形
單一柱狀圖:
並列柱狀圖:
條形圖:
普通堆疊柱狀圖:
百分⽐堆積柱狀圖:
4、折線圖和⾯積圖
4.1 圖形簡介
折線圖
⽤於顯示指標在連續時間間隔上的變化,特點是反映變量隨時間或有序類別的變化趨勢。
4.2 基礎用法
折線圖中,數據是遞增還是遞減、增減的速率、增減的規律(趨勢性、週期性、螺旋性、隨機性等)、峯值、凹值等特徵都可以被清晰地展示。
所以,折線圖常⽤來分析數據隨有序變量(時間)的變化趨勢,也可⽤來分析多組數據隨時間變化的相互作⽤和相互影響。
例如可⽤來分析某類商品或是某⼏類相關商品隨時間變化的銷售情況,進⽽預測未來的銷售業績、分析GDP隨年份的變化趨勢等。
在折線圖中,⼀般⽔平軸(橫軸)⽤來表示時間或有序維度的推移,並且間隔相同;⽽垂直軸(縱軸)代表不同時刻和維度的數據表現。
特點:可以反映變量的週期性、趨勢性、季節性、隨機性等,通過折線可以對變量的變化規律有全⾯的認知和預判。
折線圖常⽤⼏類圖形
- 折線圖(單折線與多折線)
- 點線圖(折現與點的組合)
- 曲線圖
- 變體⾯積圖
普通堆積⾯積圖
:反映整體和整體中各部分隨時間的變化趨勢。百分⽐堆積⾯積圖
:分析整體中各部分隨着時間的佔⽐變化趨勢(類⽐堆積百分⽐柱狀圖)。
4.3 常用圖形
折線圖:
點線圖:
普通堆積⾯積圖:
百分⽐堆積⾯積圖:
5、餅圖與環形圖
5.1 圖形簡介
餅圖或環形圖⽤於展示分類數據中各分類佔整體的⽐例,⽤餅圖或環形圖的⾯積或弧⻓展示各類別佔整體的多少,更多的⽤於展示靜態分類數據(與時間序列數據區別)分佈。
注意只能⽤各分類加總等於整體的數據類型,對於去重的數據不適⽤。
5.2 基礎用法
有餅圖、環形圖、⼆維餅圖等多種類型,⽤餅圖的⾯積或圓⼼⻆度⼤⼩代表相應的分類數據的數值⼤⼩。
餅圖和環形圖的主要缺點:
餅圖不適⽤於多分類的數據,原則上⼀張餅圖不可多於 6個分類,因爲隨着分類的增多,每個切⽚就會變⼩,最後導致⼤⼩區分不明顯,每個切⽚看上去都差不多⼤⼩,這樣會失去使⽤餅圖的意義。所以餅圖不適合分類很多的情況。
相⽐於具備同樣功能的其他圖表(⽐如百分⽐柱狀圖、環圖),餅圖需要佔據更⼤的畫布空間。很難進⾏多個餅圖之間的數值⽐較。
餅圖和環形圖⼩技巧:
- 超過6種的分類將不重要的歸爲“其他”⼀類。
- 最重要的類別放在12點鐘⽅向。
- 同等重要就按照從大到小排列。
- 環形圖中間是空的,可以放置標籤、整體數據、平均數值或其他內容等,其信息表達方式與餅圖類似。
5.3 常用圖形
平面餅圖:
立體餅圖:
環形圖:
子母餅圖:
圓環圖:
6、散點圖與⽓泡圖
6.1 圖形簡介
散點圖
⽤來展示或探索變量之間的變化關係,也經常⽤來展示數據點在直⻆座標平⾯上的分佈,散點圖也可表示因變量隨⾃變量的變化情況,通常在做擬合、迴歸時會先做散點圖初步確定擬合函數。
⽓泡圖
可⽤於展示三個變量之間的關係也可⽤於展示兩個變量之間的關係。它與散點圖類似,繪製時將⼀個變量放在橫軸,另⼀個變量放在縱軸,⽽第三個變量則⽤⽓泡的⼤⼩來展示(⽓泡的⼤⼩是⽤⽓泡的⾯積進⾏映射的);兩變量時,分類變量放在橫軸,數值變量放在縱軸,⽓泡的⼤⼩和⾼度代表數值變量⼤⼩;⽓泡圖也可⽤於分析數據之間的相關性。
6.2 基礎用法
散點圖⼀般⽤於研究兩變量的關係,對應的數據形式爲(x, y),⽓泡圖除了具備散點圖的功能外,可以⽤⽓泡的⾯積映射到第三個維度數據,對應的數據形式爲(x,y,z),散點圖多⽤於研究數據的分佈規律和相關性,並不側重描述具體每個數據點的取值。
6.3 常用圖形
散點圖:
氣泡圖:
6.4 應⽤場景
- 關係數據探索(譬如通過散點圖探索年齡與平均⼿機使⽤時⻓)。
- 多變量映射,⽤於分析數據的相關性(譬如上⾯營銷費⽤與DAU的關係)。
- ⽓泡圖和地圖的結合使⽤,⽤於在地圖上展示不同地區某些變量的度量⼤⼩等情況(較多)。
7、箱線圖
7.1 圖形簡介
基礎箱線圖,⼜稱盒須圖、盒式圖或箱型圖,是⼀種⽤作顯示⼀組數據分佈情況的統計圖。
7.2 基礎⽤法
如果⼀個數據集中包含了⼀個或多個分類變量,同時分類變量對應的多個離散變量,那麼可以⽤箱線圖展示離散變量會如何隨着分類變量的變化⽽變化,也可⽤以展示不同分類變量下的數據分佈結構。
箱線圖⽤5個數字對分佈進⾏概括,即⼀組數據的最⼤值、最⼩值、中位數、下四分位數和上四分位數。對於數據集中的異常值,通常會以單獨的點繪製(異常值⼀般爲較⼤或較⼩的個別值,⼀般爲上下四分位點的1.5QR Inter-Quartile Range內距,)。
箱形圖多⽤於數值統計,雖然相⽐於直⽅圖和密度曲線較原始簡單,但它不需要佔據過多的畫布空間,空間利⽤率⾼,⾮常適⽤於多組數據分佈情況的⽐較。
我們單獨拿出來小米來看下它的箱線圖,以及對應四分位數的計算方式:
第一種方法:
第二種方法:
還有Excel自帶的公式來計算四分位數:
=QUARTILE.EXC
QUARTILE.EXC函數的功能:
在指定數據集且基於0到1百分點值的情況下,計算指定的的四分位數。
QUARTILE.EXC函數的語法結構:
QUARTILE.EXC(array,quart)
array是指定數據集,quart是(1,2,3),代表幾分位數。
第三種方法:
=QUARTILE.INC
QUARTILE.INC函數的功能:
在指定數據集的情況下,根據0到1的百分點值返回四分位數。
QUARTILE.INC函數的語法結構:
QUARTILE.INC(array,quart)
7.4 應用場景
- 對⽐各組數據的分佈情況。
- 檢測數據中的異常點或者離羣值。
8、總結
- 上市互聯⽹公司通⽤披露指標
- 交易額&訂單量(加總)
- DAU (Daily Active User) &MAU (Monthly Active User)去重
- MTU(Monthly transaction user) &ATU(Annual transaction user) 去重
- 數據類型總結
- 趨勢型:變量的變化趨勢,常⻅於時間序列數據。
- ⽐例型:總體上各內部分佈的⽐例。
- 對⽐型:多組數據之間的對⽐,多⽤於分類數據或時間序列數據的對⽐。
- 分佈型:數據之間的分佈情況,譬如單變量的分佈(離散程度、集中趨勢、偏峯度等)和多
變量的關係分佈。 - 關聯型:數據之間的互相關係,譬如分層關係、聯結關係、包含關係等。
- 地理型數據:多和地圖和圖表結合使用。
- 可視化過程中要注意的
- 可視化重要的不是圖形本身,⽽是如何通過恰當可視化⽅案傳遞出數據背後的信息。
- 選擇何種圖形依賴於數據現狀和分析者要傳達的觀點。
- 可視化過程中遵循少量原則,⼀個圖形中所表達的信息不要多於三部分。