今天小編就爲大家分享一篇Python實現平行座標圖的繪製(plotly)方式,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
平行座標圖簡介
當數據的維度超過三維時,此時數據的可視化就變得不再那麼簡單。爲解決高維數據的可視化問題,我們可以使用平行座標圖。以下關於平行座標圖的解釋引自百度百科:爲了克服傳統的笛卡爾直角座標系容易耗盡空間、 難以表達三維以上數據的問題, 平行座標圖將高維數據的各個變量用一系列相互平行的座標軸表示, 變量值對應軸上位置。爲了反映變化趨勢和各個變量間相互關係,往往將描述不同變量的各點連接成折線。所以平行座標圖的實質是將m維歐式空間的一個點Xi(xi1,xi2,…,xim) 映射到二維平面上的一條曲線。在N條平行的線的背景下,(一般這N條線都豎直且等距),一個在高維空間的點可以被表示爲一條拐點在N條平行座標軸的折線,在第K個座標軸上的位置就表示這個點在第K個維的值。
繪製平行座標圖
本文主要介紹兩種利用Python繪製平行座標圖的方法,分別是利用pandas包繪製和利用plotly包繪製(默認已安裝pandas包和plotly包)。
利用pandas實現平行座標圖的繪製
import matplotlib.pyplot as plt
import pandas as pd
import seaborn as sns
from pandas.plotting import parallel_coordinates
data = sns.load_dataset('iris')
fig,axes = plt.subplots()
parallel_coordinates(data,'species',ax=axes)
fig.savefig('parallel.png')
繪製的平行座標圖如下所示:
從上圖可以看到x軸上變量共用一個y座標軸,此時因sepal_length、sepal_width、petal_length以及petal_width這四個變量的值得範圍相近,利用這種方式作出的共用y軸的平行座標圖有着很好的可視化效果;但假如sepal_length、sepal_width、petal_length以及petal_width這些變量的值的範圍相差較大時,這種共用y軸的平行座標圖就不再適用,此時我們需要的是y軸獨立的平行座標圖。下面介紹的另一種方法實現的就是y軸獨立的平行座標圖。
利用plotly實現平行座標圖的繪製
plotly繪圖有兩種模式,一種是online模式,另一種是offline模式。本文使用的是offline模式,且是在jupyter notebook中進行繪圖。
首先熟悉一下plotly的繪圖方式:
import plotly as py
import plotly.graph_objs as go
py.offline.init_notebook_mode(connected=True) # 初始化設置
py.offline.iplot({
"data": [go.Parcoords(
line = dict(color = 'blue'),
dimensions = list([
dict(range = [1,5],
constraintrange = [1,2],
label = 'A', values = [1,4]),
dict(range = [1.5,5],
tickvals = [1.5,3,4.5],
label = 'B', values = [3,1.5]),
dict(range = [1,5],
tickvals = [1,2,4,5],
label = 'C', values = [2,4],
ticktext = ['text 1', 'text 2', 'text 3', 'text 4']),
dict(range = [1,5],
label = 'D', values = [4,2])
])
)],
"layout": go.Layout(title="My first parallel coordinates")
})
繪製圖形如下所示:
繪製鳶尾花數據的平行座標圖:
df = sns.load_dataset('iris')
df['species_id'] = df['species'].map({'setosa':1,'versicolor':2,'virginica':3}) #用於顏色映射
py.offline.iplot({
"data": [go.Parcoords(
line = dict(color = df['species_id'],
colorscale = [[0,'#D7C16B'],[0.5,'#23D8C3'],[1,'#F3F10F']]),
dimensions = list([
dict(range = [2,8],
constraintrange = [4,8],
label = 'Sepal Length', values = df['sepal_length']),
dict(range = [1,6],
label = 'Sepal Width', values = df['sepal_width']),
dict(range = [0,8],
label = 'Petal Length', values = df['petal_length']),
dict(range = [0,4],
label = 'Petal Width', values = df['petal_width'])
])
)],
"layout": go.Layout(title='Iris parallel coordinates plot')
})
繪製的圖形如下所示:
注:關於plotly.offline.iplot、go.Parcoords以及go.Layout的用法可以利用help關鍵字查看相關幫助文檔,與pyecharts不同,plotly提供的幫助文檔非常詳細。
推薦我們的Python學習扣qun:913066266 ,看看前輩們是如何學習的!從基礎的python腳本到web開發、爬蟲、django、數據挖掘等【PDF,實戰源碼】,零基礎到項目實戰的資料都有整理。送給每一位python的小夥伴!每天都有大牛定時講解Python技術,分享一些學習的方法和需要注意的小細節,點擊加入我們的 python學習者聚集地