Matplotlib 數據可視化
matplotlib庫的介紹
數據可視化第三方庫
matplotlib.pyplot 是繪製各類可視化圖形的命令子庫,相當於快捷方式。
import matplotlib.pyplot as plt
plt.plot([3,1,4,5,2])
plt.ylabel("grade")
plt.savefig('test',dpi=600) # 默認PNG文件
plt.show()
plt.plot(x,y,format_string,**kwargs)
format_string:控制曲線的格式字符串 可選
**kwargs:第二組前面的參數或者更多組
- color:控制顏色,color = ‘green’
- linestyle:線條風格,linestyle=‘dashed’
- marker:標記風格,marker = ‘o’
- markerfacecolor:標記顏色,markerfacecolor=‘blue’
- markersize:標記尺寸,markersize=20
由顏色字符、風格字符和標記字符組成
顏色字符 | 說明 | 顏色字符 | 說明 |
---|---|---|---|
‘b’ | 藍色 | ‘m’ | 洋紅色 |
‘g’ | 綠色 | ‘y’ | 黃色 |
‘r’ | 紅色 | ‘k’ | 黑色 |
‘c’ | 青綠色 | ‘w’ | 白色 |
‘#008000’ | RGB某種顏色 | ‘0.8’ | 灰度值字符串 |
風格字符 | 說明 |
---|---|
‘-’ | 實線 |
‘–’ | 破折線 |
‘-.’ | 點劃線 |
‘:’ | 虛線 |
" " | 無線條 |
標記字符 | 說明 |
---|---|
‘.’ | 點標記 |
‘,’ | 像素標記(極小點) |
‘o’ | 實心圈標記 |
‘v’ | 倒三角標記 |
‘^’ | 上三角標記 |
‘>’ | 右三角標記 |
‘<’ | 左三角標記 |
‘1’ | 下花三角標記 |
‘2’ | 上花三角標記 |
‘3’ | 左花三角標記 |
‘4’ | 右花三角標記 |
‘s’ | 實心方形標記 |
‘p’ | 實心五角標記 |
‘*’ | 星形標記 |
‘h’ | 豎六邊形標記 |
‘H’ | 橫六邊形標記 |
‘+’ | 十字標記 |
‘x’ | x標記 |
‘D’ | 菱形標記 |
‘d’ | 瘦菱形標記 |
‘|’ | 垂直線標記 |
簡單的線性圖
import matplotlib.pyplot as plt
import numpy as np
data = np.arange(10)
plt.plot(data)
plt.show()
顏色、標記和線類型
x = np.array([1,2,3,4,5,6,7,8,9])
y = np.array([2,5,3,4,8,9,7,6,1])
plt.plot(x,y,'g--')
# 顯式表達
plt.plot(x,y,linestyle = '--',color = 'g')
plt.show()
# 折線圖還可以用標記來凸顯實際數據點
from numpy.random import randn
plt.plot(randn(30).cumsum(),'ko--')
plt.plot(randn(30).cumsum(),color = 'k',linestyle = 'dashed',marker = 'o')
pyplot 的中文顯示
pyplot並不默認支持中文顯示,需要rcParams修改字體實現,會改變全局字體
import matplotlib
matplotlib.rcParams['font.family']='SimHei'
屬性 | 說明 |
---|---|
‘font.family’ | 用於顯示字體的名字 |
‘font.style’ | 字體風格,正常‘nomal’或 斜體‘italic’ |
‘font.size’ | 字體大小,整數字號或者‘large’、‘x-small’ |
import numpy as np
import matplotlib.pyplot as plt
import matplotlib
matplotlib.rcParams['font.family']='SimHei'
matplotlib.rcParams['font.size']=20
a = np.arange(0.0,5.0,0.02)
plt.xlabel('橫軸:時間') plt.ylabel('縱軸:振幅')
plt.plot(a,np.cos(2*np.pi*a),'r--')
plt.show()
第二種方法,在有中文輸出的地方,增加一個屬性:fontproperties
import numpy as np
import matplotlib.pyplot as plt
a = np.arange(0.0,5.0,0.02)
plt.xlabel('橫軸:時間',fontproperties='SimHei',fontsize=20)
plt.ylabel('縱軸:振幅',fontproperties='SimHei',fontsize=20) plt.plot(a,np.cos(2*np.pi*a),'r--')
plt.show()
pyplot 的文本顯示
函數 | 說明 |
---|---|
plt.xlabel() | 對x軸增加文本標籤 |
plt.ylabel() | 對y軸增加文本標籤 |
plt.title() | 對圖形整體增加文本標籤 |
plt.text() | 在任意位置增加文本 |
plt.annotate() | 在圖形中增加帶箭頭的註解 |
import numpy as np
import matplotlib.pyplot as plt
a = np.arange(0.0,5.0,0.02)
plt.plot(a,np.cos(2*np.pi*a),'r--')
plt.xlabel('橫軸:時間',fontproperties='SimHei',fontsize=15,color='green') plt.ylabel('縱軸:振幅',fontproperties='SimHei',fontsize=15)
plt.title(r'正弦波實例 $y=cos(2\pi x)$',fontproperties='SimHei',fontsize=25) plt.text(2,1,r'$\mu=100$',fontsize=15)
plt.axis([-1,6,-2,2])
plt.grid(True) # 加入網格線
plt.show()
plt.annotate(s,xy=arrow_crd,xytext=text_crd,arrowprops=dict)
import numpy as np
import matplotlib.pyplot as plt
a = np.arange(0.0,5.0,0.02)
plt.plot(a,np.cos(2*np.pi*a),'r--')
plt.xlabel('橫軸:時間',fontproperties='SimHei',fontsize=15,color='green') plt.ylabel('縱軸:振幅',fontproperties='SimHei',fontsize=15)
plt.title(r'正弦波實例 $y=cos(2\pi x)$',fontproperties='SimHei',fontsize=25) plt.annotate(r'$\mu=100$',xy=(2,1),xytext=(3,1.5), arrowprops=dict(facecolor='black',shrink=0.1,width=2))
plt.axis([-1,6,-2,2]) # 控制座標軸範圍
plt.grid(True) # 加入網格線
plt.show()
pyplot的子繪圖區域
# 繪圖區域
plt.subplot(nrows,ncols,plot_number)
plt.subpllot(3,2,4) # 定位在三行兩列第四個繪圖區域
plt.subpllot(324) # 逗號去掉也可以
plt.subplot2grid(GridSpec,CurSpec,colspan=1,rowspan=1)
# 理念:設定網格,選中網格,確定選中行列區域數量,編號從0開始
plt.subplot2grid((3,3),(1,0),colspan=2)
圖片與子圖
import matplotlib.pyplot as plt
import numpy as np
fig = plt.figure()
ax1 = fig.add_subplot(2,2,1)
plt.plot([1.5,3.5,-2,1.6])
ax2 = fig.add_subplot(2,2,2)
plt.plot(np.random.randn(50).cumsum(),'k--')
ax3 = fig.add_subplot(2,2,3)
plt.plot([1.5,3.5,-2,1.6])
fig,axes = plt.subplots(2,3)
fig,axes = plt.subplots(2,3)
axes[0,1]
plt.show()
調整子圖周圍間距
fig,axes = plt.subplots(2,2,sharex = True,sharey = True)
# sharex = True,sharey = True 表示子圖擁有相同的x軸y軸
for i in range(2):
for j in range(2):
axes[i,j].hist(np.random.randn(500),bins = 50,color = 'k',alpha = 0.5)
plt.subplots_adjust(wspace = 0,hspace = 0) # 圖片的寬度和高度百分比
pyplot的基礎圖表函數
函數 | 說明 |
---|---|
plt.plot(x,y,fmt,…) | 座標圖 |
plt.boxplot(data,notch,position) | 箱形圖 |
plt.bar(left,height,width,bottom) | 條形圖 |
plt.barh(width,bottom,left,height) | 橫向條形圖 |
plt.polar(theta,r) | 極座標圖 |
plt.pie(data,explode) | 餅圖 |
plt.psd(x,NFFT=256,pad_to,Fs) | 功率譜密度圖 |
plt.specgram(x,NFFT=256,pad_to,F) | 繪製譜圖 |
plt.cohere(x,y,NFFT=256,Fs) | X-Y的相關性函數 |
plt.scatter(x,y) | 散點圖,x和y長度相同 |
plt.step(x,y,where) | 步階圖 |
plt.hist(x,bins,normed) | 直方圖 |
plt.contour(X,Y,Z,N) | 等值圖 |
plt.vlines() | 垂直圖 |
plt.stem(x,y,linefmt,markerfmt) | 柴火圖 |
plt.plot_date() | 繪製數據日期 |
pyplot 餅圖繪製
import matplotlib.pyplot as plt
labels = 'Frogs','Hogs','Dogs','Logs'
sizes = [15,30,45,10]
explode = (0,0.1,0,0)
plt.pie(sizes,explode=explode,labels=labels,autopct='%1.1f%%', shadow=False,startangle=90)
plt.axis('equal')
plt.show()
pyplot直方圖的繪製
import numpy as np
import matplotlib.pyplot as plt
np.random.seed(0)
mu,sigma = 100,20 # 均值和標準差
a = np.random.normal(mu,sigma,size = 100) # bin = 20 直方的條數
plt.hist(a,20,density=1,histtype='stepfilled',facecolor='b',alpha=0.75) plt.title('Histogram')
plt.show()
pyplot極座標的繪製
import numpy as np
import matplotlib.pyplot as plt
N=20
theta = np.linspace(0.0,2*np.pi,N,endpoint=False)
radii = 10*np.random.rand(N)
width = np.pi/4*np.random.rand(N)
ax = plt.subplot(111,projection='polar')
bars = ax.bar(theta,radii,width = width,bottom=0.0)
for r,bar in zip(radii,bars):
bar.set_facecolor(plt.cm.viridis(r/10.))
bar.set_alpha(0.5)
plt.show()
pyplot散點圖的繪製
import numpy as np
import matplotlib.pyplot as plt
fig,ax = plt.subplots()
ax.plot(10*np.random.randn(100),10*np.random.randn(100),'o')
ax.set_title('Simple Scatter')
plt.show()
16個matplotlib繪圖實用小技巧
1. 添加標題-title
import numpy as np
import matplotlib.pyplot as plt
# 顯示中文
plt.rcParams['font.sans-serif'] = [u'SimHei']
plt.rcParams['axes.unicode_minus'] = False
%matplotlib inline
x=np.arange(0,10)
plt.title('這是一個示例標題')
plt.plot(x,x*x)
plt.show()
輸出:
- 添加文字-text
設置座標和文字即可
import numpy as np
import matplotlib.pyplot as plt
# 顯示中文
plt.rcParams['font.sans-serif'] = [u'SimHei']
plt.rcParams['axes.unicode_minus'] = False
%matplotlib inline
x=np.arange(-10,11,1)
y=x*x
plt.plot(x,y)
plt.title('這是一個示例標題')
# 添加文字
plt.text(-2.5,30,'function y=x*x')
plt.show()
輸出:
3. 添加註釋-annotate
- xy:爲備註的座標點
- xytext:備註文字的座標(默認爲xy的位置)
- arrowprops:在xy和xytext之間繪製一個箭頭
import numpy as np
import matplotlib.pyplot as plt
# 顯示中文
plt.rcParams['font.sans-serif'] = [u'SimHei']
plt.rcParams['axes.unicode_minus'] = False
%matplotlib inline
x=np.arange(-10,11,1)
y=x*x
plt.title('這是一個示例標題')
plt.plot(x,y)
# 添加註釋
plt.annotate('這是一個示例註釋',xy=(0,1),xytext=(-2,22),arrowprops={'headwidth':10,'facecolor':'r'})
plt.show()
輸出:
4. 設置座標軸名稱-xlabel/ylabel
import numpy as np
import matplotlib.pyplot as plt
# 顯示中文
plt.rcParams['font.sans-serif'] = [u'SimHei']
plt.rcParams['axes.unicode_minus'] = False
%matplotlib inline
x=np.arange(1,20)
plt.xlabel('示例x軸')
plt.ylabel('示例y軸')
plt.plot(x,x*x)
plt.show()
輸出:
5.添加圖例-legend
import numpy as np
import matplotlib.pyplot as plt
# 顯示中文
plt.rcParams['font.sans-serif'] = [u'SimHei']
plt.rcParams['axes.unicode_minus'] = False
%matplotlib inline
plt.plot(x,x)
plt.plot(x,x*2)
plt.plot(x,x*3)
plt.plot(x,x*4)
# 直接傳入legend
plt.legend(['生活','顏值','工作','金錢'])
plt.show()
輸出:
6. 調整顏色-color
傳顏色參數,支持以下幾種方式
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline
x=np.arange(1,5)
#顏色的幾種方式
plt.plot(x,color='g')
plt.plot(x+1,color='0.5')
plt.plot(x+2,color='#FF00FF')
plt.plot(x+3,color=(0.1,0.2,0.3))
plt.show()
輸出:
7. 切換線條樣式-marker
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline
x=np.arange(1,5)
plt.plot(x,marker='o')
plt.plot(x+1,marker='>')
plt.plot(x+2,marker='s')
plt.show()
輸出:
- 顯示數學公式-mathtext
格式如下: 作爲開始和結束符,如\omega $,中間的將解析出公式中的符號
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline
plt.title('chenqionghe')
plt.xlim([1,8])
plt.ylim([1,5])
plt.text(2,4,r'$ \alpha \beta \pi \lambda \omega $',size=25)
plt.text(4,4,r'$ \sin(0)=\cos(\frac{\pi}{2}) $',size=25)
plt.text(2,2,r'$ \lim_{x \rightarrow y} \frac{1}{x^3} $',size=25)
plt.text(4,2,r'$ \sqrt[4]{x}=\sqrt{y} $',size=25)
plt.show()
輸出:
9. 顯示網格-grid
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline
x='a','b','c','d'
y=[15,30,45,10]
plt.grid()
# 也可以設置顏色、線條寬度、線條樣式
# plt.grid(color='g',linewidth='1',linestyle='-.')
plt.plot(x,y)
plt.show()
輸出:
10. 調整座標軸刻度-locator_params
同時調整x軸和y軸:plt.locator_params(nbins=20)只調整x軸:plt.locator_params(‘‘x’,nbins=20)只調整y軸:plt.locator_params(‘‘y’,nbins=20)
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline
x=np.arange(0,30,1)
plt.plot(x,x)
# x軸和y軸分別顯示20個
plt.locator_params(nbins=20)
plt.show()
輸出:
11. 調整座標軸範圍-axis/xlim/ylim
- axis:[0,5,0,10],x從0到5,y從0到10
- xlim:對應參數有xmin和xmax,分別能調整最大值最小值
- ylim:同xlim用法
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline
x=np.arange(0,30,1)
plt.plot(x,x*x)
#顯示座標軸,plt.axis(),4個數字分別代表x軸和y軸的最小座標,最大座標
#調整x爲10到25
plt.xlim(xmin=10,xmax=25)
plt.plot(x,x*x)
plt.show()
輸出:
12. 調整日期自適應-autofmt_xdate
有時候顯示日期會重疊在一起,非常不友好,調用plt.gcf().autofmt_xdate(),將自動調整角度
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline
x=pd.date_range('2020/01/01',periods=30)
y=np.arange(0,30,1)
plt.plot(x,y)
plt.gcf().autofmt_xdate()
plt.show()
輸出:
- 添加雙座標軸-twinx
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline
x=np.arange(1,20)
y1=x*x
y2=np.log(x)
plt.plot(x,y1)
# 添加一個座標軸,默認0到1
plt.twinx()
plt.plot(x,y2,'r')
plt.show()
輸出:
- 填充區域-fill/fill_beween
fill填充函數區域
import numpy as np
import matplotlib.pyplot as plt
# 顯示中文
plt.rcParams['font.sans-serif'] = [u'SimHei']
plt.rcParams['axes.unicode_minus'] = False
%matplotlib inline
x=np.linspace(0,5*np.pi,1000)
y1=np.sin(x)
y2=np.sin(2*x)
plt.plot(x,y1)
plt.plot(x,y2)
# 填充
plt.fill(x,y1,'g')
plt.fill(x,y2,'r')
plt.title('這是一個示例標題')
plt.show()
輸出:
fill_beween填充函數交叉區域
import numpy as np
import matplotlib.pyplot as plt
# 顯示中文
plt.rcParams['font.sans-serif'] = [u'SimHei']
plt.rcParams['axes.unicode_minus'] = False
%matplotlib inline
plt.title('這是一個示例標題')
x=np.linspace(0,5*np.pi,1000)
y1=np.sin(x)
y2=np.sin(2*x)
plt.plot(x,y1)
plt.plot(x,y2)
# 填充
plt.fill_between(x,y1,y2,where=y1>y2,interpolate=True)
plt.show()
輸出:
15. 畫一個填充好的形狀-matplotlib.patche
import numpy as np
import matplotlib.pyplot as plt
import matplotlib.patches as mptaches
%matplotlib inline
xy1=np.array([0.2,0.2])
xy2=np.array([0.2,0.8])
xy3=np.array([0.8,0.2])
xy4=np.array([0.8,0.8])
fig,ax=plt.subplots()
#圓形,指定座標和半徑
circle=mptaches.Circle(xy1,0.15)
ax.add_patch(circle)
#長方形
rect=mptaches.Rectangle(xy2,0.2,0.1,color='r')
ax.add_patch(rect)
#多邊形
polygon=mptaches.RegularPolygon(xy3,6,0.1,color='g')
ax.add_patch(polygon)
# 橢圓
ellipse=mptaches.Ellipse(xy4,0.4,0.2,color='c')
ax.add_patch(ellipse)
ax.axis('equal')
plt.show()
輸出:
16. 切換樣式-plt.style.use
matplotlib支持多種樣式,可以通過plt.style.use切換樣式,例如:plt.style.use('ggplot')
輸入 plt.style.available
可以查看所有的樣式:
import matplotlib.pyplot as plt
plt.style.available
輸出:
示例代碼,ggplot樣式:
import numpy as np
import matplotlib.pyplot as plt
import matplotlib.patches as mptaches
%matplotlib inline
plt.style.use('ggplot')
# 新建4個子圖
fig,axes=plt.subplots(2,2)
ax1,ax2,ax3,ax4=axes.ravel()
# 第一個圖
x,y=np.random.normal(size=(2,100))
ax1.plot(x,y,'o')
# 第二個圖
x=np.arange(0,10)
y=np.arange(0,10)
colors=plt.rcParams['axes.prop_cycle']
length=np.linspace(0,10,len(colors))
for s in length:
ax2.plot(x,y+s,'-')
# 第三個圖
x=np.arange(5)
y1,y2,y3=np.random.randint(1,25,size=(3,5))
width=0.25
ax3.bar(x,y1,width)
ax3.bar(x+width,y2,width)
ax3.bar(x+2*width,y3,width)
# 第四個圖
for i,color in enumerate(colors):
xy=np.random.normal(size=2)
ax4.add_patch(plt.Circle(xy,radius=0.3,color=color['color']))
ax4.axis('equal')
plt.show()
輸出: