本文是《數據蛙三個月強化課》的第二篇總結教程,如果想要了解數據蛙社羣,可以閱讀給DataFrog社羣同學的學習建議。溫馨提示:如果您已經熟悉python可視化內容,大可不必再看這篇文章,或是之挑選部分文章
對於我們數據分析師來說,不僅要自己明白數據背後的含義,而且還要給老闆更直觀的展示數據的意義。所以,對於這項不可缺少的技能,讓我們來一起學習下吧。
零:準備工作
畫圖之前,我們先導入包和生成數據集
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import matplotlib
%matplotlib inline
np.random.seed(100)
df = pd.DataFrame(np.random.randint(-10, 10, (10, 3)),
index=pd.date_range("1/1/2000", periods=10), columns=list("ABC"))
df = df.cumsum()
df.head()
我們先看下所用的數據集
一:折線圖
折線圖是我們觀察趨勢常用的圖形,可以看出數據隨着某個變量的變化趨勢,默認情況下參數 kind="line" 表示圖的類型爲折線圖。
這裏默認是把索引當作了X軸,列作爲了Y軸
二:柱狀圖
對於分類數據這種離散數據,需要查看數據是如何在各個類別之間分佈的,這時候就可以使用柱狀圖。我們爲每個類別畫出一個柱子。此時,可以將參數 kind 設置爲 bar 。
這裏還是以索引爲X軸,列爲Y軸。我們還可以改變顯示的軸
當然我們還可以變成堆積柱狀圖
三:條形圖
條形圖就是將豎直的柱狀圖翻轉90度得到的圖形。與柱狀圖一樣,條形圖也可以有一組或多種多組數據。
水平條形圖在類別名稱很長的時候非常方便,因爲文字是從左到右書寫的,與大多數用戶的閱讀順序一致,這使得我們的圖形容易閱讀。而柱狀圖在類別名稱很長的時候是沒有辦法很好的展示的。
四:直方圖
直方圖是柱形圖的特殊形式,當我們想要看數據集的分佈情況時,選擇直方圖。直方圖的變量劃分至不同的範圍,然後在不同的範圍中統計計數。在直方圖中,柱子之間的連續的,連續的柱子暗示數值上的連續。
五:箱線圖
箱線圖用來展示數據集的描述統計信息,也就是[四分位數],線的上下兩端表示某組數據的最大值和最小值。箱子的上下兩端表示這組數據中排在前25%位置和75%位置的數值。箱中間的橫線表示中位數。此時可以將參數 kind 設置爲 box。
六:散點圖
如果想要畫出散點圖,可以將參數 kind 設置爲 scatter,同時需要指定 x 和 y。通過散點圖可以探索變量之間的關係。
七:餅狀圖
餅圖是用面積表示一組數據的佔比,此時可以將參數 kind 設置爲 pie。
我們剛開始學習的同學,最基本應該明白什麼數據應該用什麼圖形來展示,同學們來一起總結吧。