最近在學習數據可視化,梳理一下其中一些諸如pandas繪圖、matplotlib繪圖、pyplot(plt)、axes等概念。
重要的事情說三遍:axes不是axis!axes不是axis!axes不是axis!
重要的事情說三遍:pyplot是接口不是對象!pyplot是接口不是對象!pyplot是接口不是對象!
很多書上一上來就直接import matplotlib.pypltot as plt
,然後就教你plt.xxx()
。這種方式固然沒錯,可問題就出在了plt
只是一個interface,只是一個接口,連對象都算不上(仔細回想,你確實沒有實例化過任何一個名叫plt
類型的對象)這給本來就對面向對象編程並不很熟悉的我帶來無窮無盡的困擾。plt
這個接口的意義在於:
- 通過接口直接畫圖(這時候我們把這個接口看成一個黑盒,根本不要去管其中有些什麼對象類型)
- 通過接口實例化別的類型的對象(如
figure
類型axes
類型等)
1.通過plt.xxx()
直接繪圖
就像各種教程和書上的常規操作一樣,我們可以用plt.plot(), plt.bar()等繪製不同類型的圖(部分總結如下表)
函數名 | 作用 |
---|---|
plt.bar() | 條形圖 |
plt.barh() | 橫排條形圖 |
plt.boxplot() | 箱線圖(plt.box()是另一個函數) |
plt.hist() | 頻率直方圖 |
plt.plot() | 折線圖 |
我們可以用plt
的其他一些函數來對圖表的標題等進行設置(部分總結如下表)
函數名 | 作用 |
---|---|
plt.title() | 設置圖表標題 |
plt.grid() | 設置圖表網格 |
plt.xlabel();plt.ylabel | 設置x;y軸標題 |
plt.xticks();plt.yticks() | 設置x;y軸刻度 |
plt.xlim();plt.ylim() | 設置x;y軸範圍 |
plt.annotate() | 設置標註 |
(具體的參數和用法詳見 https://matplotlib.org/api/pyplot_summary.html )
用plt繪圖的方便之處,同樣也是它最令人迷惑的地方,就是它沒有一個顯性的對象。
我們甚至可以調用pandas繪圖以後,用表二中的plt函數來對pandas生成的這個圖表進行設置。
例程如下:
import matplotlib.pyplot as plt
from pandas import Series
data = Series([1.47,1.62,1.78,1.94,2.38,2.60],index=['2012','2013','2014','2015','2016','2017'])
#注意下一行的對象是'data',它是一個series對象,調用的是pandas繪圖函數
data.plot(label='income', color = 'r', linestyle=':', marker = 's')#具體的pandas繪圖之後會細講
#但接下來我們甚至可以調用plt的函數對它進行設置
plt.title('Income chart')
plt.xlabel('Year')
plt.ylabel('income')
plt.annotate('Largest point',xy=(5,2.60),xytext=(3,2.5), arrowprops=dict(arrowstyle='->'))
plt.show()
上面這個例子就展示了pyplot
(plt
)的特點,不用指明對象就能進行畫圖和設置,當我們在同一個程序中的圖比較少的時候這是方便的,但當我們同一個程序中的圖很多的時候,這種沒有顯性對象的方式會導致我們沒有辦法重新調用之前的圖(因爲沒有對象名)也會給人一種很不踏實的感覺。
2.實例化figure
和axes
對象後繪圖
就像前文提到的,plt
只是一個接口而不是對象。
在matplotlib中,有兩個重要的對象類型:figure
對象可以把它想成一張空白圖紙,在上面可以繪製一個或多個axes
對象(還可以有其他對象等)。axes
對象是一個圖像的主要部分(它包括了圖線、xy軸等部分)。
我們可以使用plt
接口生成figure
對象和axes
對象,然後對axes
對象調用方法來實現畫圖和設置。
總體思路是:
- 實例化
figure
對象 - 實例化
axes
對象 - 對
axes
對象調用方法進行畫圖和設置
例程如下:
import matplotlib.pyplot as plt
from pandas import Series
data = Series([1.47,1.62,1.78,1.94,2.38,2.60],index=['2012','2013','2014','2015','2016','2017'])
#調用plt接口,實例化figure1對象
figure1 = plt.figure(facecolor='w')#faceclolr設置背景顏色
#實例化ax1對象
ax1 = figure1.add_subplot(111)#ax1是figure1的第1行第一列的第1張圖表
#注意下一行的對象是'ax1',它是一個axes對象,調用的是matplotlib.axes繪圖函數
ax1.plot(data,label='income', color = 'r', linestyle=':', marker = 's')
#接下來我們調用ax1的方法對它進行設置
ax1.set_title('Income chart')
ax1.set_xlabel('Year')
ax1.set_ylabel('income')
ax1.annotate('Largest point',xy=(5,2.60),xytext=(3,2.5), arrowprops=dict(arrowstyle='->'))
用這種方式畫出來的圖,每一個對象都有它自己的名字,方便後面繼續調用、修改。代碼也就多了兩行實例化的過程,並沒有麻煩很多,個人很喜歡用這種方式畫圖(也給人一種很踏實的感覺)。
類比上面的表一和表二,給出對於axes對象的方法函數表:
函數名 | 作用 |
---|---|
ax.bar() | 條形圖 |
ax.barh() | 橫排條形圖 |
ax.boxplot() | 箱線圖 |
ax.hist() | 頻率直方圖 |
ax.plot() | 折線圖 |
函數名 | 作用 |
---|---|
ax.set_title() | 設置圖表標題 |
ax.set_xlabel(); ax.set_ylabel | 設置x;y軸標題 |
ax.set_xticks(); ax.set_yticks() | 設置x;y軸刻度 |
ax.set_xlim(); ax.set_ylim() | 設置x;y軸範圍 |
ax.annotate() | 設置標註 |
(具體的參數和用法詳見 https://matplotlib.org/api/axes_api.html#basic )
注意表一和表三,表二和表四的異同:
- 表一表二中的
plt
是固定的名字,不論畫什麼都是plt.xxx()
,而表三和表四中ax.xxx()
中的ax
要改成你實例的對象名。 - 注意對比表二和表四,很多作用相同的東西,跑到了axes這裏要多加一個
set_
用實例化axes的方式畫圖很重要,因爲多子圖的繪製更是需要依賴axes對象。
我還會分兩期分別介紹一下axes與多子圖的繪製和axes與pandas繪圖的關係。
覺得有用的話,不要吝惜評論點贊分享哦,希望大家多多包涵,有任何問題歡迎指正、討論。
本文基於CC-BY-SA 4.0協議,歡迎轉載
(博客看累了?去我的B站瞧一瞧?)