Python數據分析:可視化

本文是《數據蛙三個月強化課》的第二篇總結教程,如果想要了解數據蛙社羣,可以閱讀給DataFrog社羣同學的學習建議。溫馨提示:如果您已經熟悉python可視化內容,大可不必再看這篇文章,或是之挑選部分文章


對於我們數據分析師來說,不僅要自己明白數據背後的含義,而且還要給老闆更直觀的展示數據的意義。所以,對於這項不可缺少的技能,讓我們來一起學習下吧。

零:準備工作

畫圖之前,我們先導入包和生成數據集

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import matplotlib
%matplotlib inline
np.random.seed(100)
df = pd.DataFrame(np.random.randint(-10, 10, (10, 3)), 
                  index=pd.date_range("1/1/2000", periods=10), columns=list("ABC"))
df = df.cumsum()
df.head()

我們先看下所用的數據集


一:折線圖

折線圖是我們觀察趨勢常用的圖形,可以看出數據隨着某個變量的變化趨勢,默認情況下參數 kind="line" 表示圖的類型爲折線圖。


這裏默認是把索引當作了X軸,列作爲了Y

二:柱狀圖

對於分類數據這種離散數據,需要查看數據是如何在各個類別之間分佈的,這時候就可以使用柱狀圖。我們爲每個類別畫出一個柱子。此時,可以將參數 kind 設置爲 bar 。


這裏還是以索引爲X軸,列爲Y軸。我們還可以改變顯示的軸

當然我們還可以變成堆積柱狀圖

三:條形圖

條形圖就是將豎直的柱狀圖翻轉90度得到的圖形。與柱狀圖一樣,條形圖也可以有一組或多種多組數據。


水平條形圖在類別名稱很長的時候非常方便,因爲文字是從左到右書寫的,與大多數用戶的閱讀順序一致,這使得我們的圖形容易閱讀。而柱狀圖在類別名稱很長的時候是沒有辦法很好的展示的。

四:直方圖

直方圖是柱形圖的特殊形式,當我們想要看數據集的分佈情況時,選擇直方圖。直方圖的變量劃分至不同的範圍,然後在不同的範圍中統計計數。在直方圖中,柱子之間的連續的,連續的柱子暗示數值上的連續。


五:箱線圖

箱線圖用來展示數據集的描述統計信息,也就是[四分位數],線的上下兩端表示某組數據的最大值和最小值。箱子的上下兩端表示這組數據中排在前25%位置和75%位置的數值。箱中間的橫線表示中位數。此時可以將參數 kind 設置爲 box。


六:散點圖

如果想要畫出散點圖,可以將參數 kind 設置爲 scatter,同時需要指定 x 和 y。通過散點圖可以探索變量之間的關係。


七:餅狀圖

餅圖是用面積表示一組數據的佔比,此時可以將參數 kind 設置爲 pie。



我們剛開始學習的同學,最基本應該明白什麼數據應該用什麼圖形來展示,同學們來一起總結吧。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章