10個必會的python數據可視化庫

大致瀏覽一下Python庫索引,你將會看到幾乎每個數據可視化需要的庫,從用於眼動研究的GazeParser到用於神經網絡訓練的實時可視化的pastalog。雖然這些庫中有很多庫只能完成一些特定任務,但有些庫可以應用於任何領域。

今天,我們將簡要介紹10個跨學科的Python數據可視化庫,從衆所周知的到晦澀難懂的。我們注意到,使用Mode Python Notebooks可以輕鬆地在本地運行Python。

Matplotlib

[圖片上傳失敗...(image-a3d273-1550144242914)]

兩個直方圖(matplotlib)

matplotlib是Python數據可視化庫中的泰斗。儘管它已有十多年的歷史,但它仍是Python使用者最廣泛使用的繪畫庫。其設計與20世紀80年代開發的一種專有編程語言----MATLAB非常相似。

因爲matplotlib是第一個Python數據可視化庫,所以很多其它的庫都是以其爲基礎構建的,亦或者在分析期間與其協同合作的。一些庫,如pandas和Seaborn,都是對matplotlib的“包裝器”,使我們能夠用更少的代碼以多種方式訪問matplotlib。

儘管matplotlib有助於瞭解數據,但它對於快速、輕鬆地創建可發佈的圖表用處不大。正如Chris Moffitt在他的Python可視化工具的概述中所稱,matplotlib“功能非常強大,但同時也很複雜”。

Matplotlib一直以來因其有着獨特的90年代氣息的默認風格飽受詬病。即將發佈的matplotlib 2.0承諾會有很多新的風格來解決這個問題。

開發者:John D. Hunter

更多資料:matplotlib.org

Seaborn

[圖片上傳失敗...(image-1633e-1550144242914)]

Seaborn利用matplotlib的強大功能,幾行代碼就能創建漂亮的圖表。其與matplotlib主要的區別是Seaborn的默認樣式以及更美觀、更現代的調色板設計。因爲Seaborn建立在matplotlib之上,所以你需要了解matplotlib來調整Seaborn 的默認值。

開發者: Michael Waskom

更多資料:

http://web.stanford.edu/~mwaskom/software/seaborn/index.html

ggplot

[圖片上傳失敗...(image-a4d108-1550144242914)]

ggplot 是由基於R語言的繪圖系統---ggplot2建立的,也是《圖形語法》(The Grammar of Graphics)中的概念。Ggplot的操作與matplotlib不同:它允許你對組件進行分層以創建完整的繪圖。例如,你可以從座標軸開始,然後添加點,再添加線、趨勢線等。儘管圖形語法被譽爲繪圖的“直觀”方法,但經驗豐富的matplotlib用戶可能需要時間來適應這種新的思維模式。

據創造者所說,ggplot不是爲創建高度定製的圖形而設計的。它爲更簡單的繪圖方法犧牲了複雜性。

ggplot與pandas緊密集成,因此在使用ggplot時,最好將數據存儲在數據幀中。

開發者: ŷhat

更多資料:http://ggplot.yhathq.com/

Bokeh

三個城市的交互式天氣統計(連續分析)

和ggplot一樣,Boken也是《圖形語法》(The Grammar of Graphics)中的概念,但與ggplot不同的是,它完全基於Python,不是從R語言移植過來的。其優勢在於能夠創建交互式的、可直接用於網絡的繪圖,這些繪圖可以很容易地輸出爲JSON 對象,HTML文檔或交互式web應用程序。Bokeh還支持流媒體和實時數據。

Bokeh提供了三個具有不同控制級別的接口,以適應不同的用戶類型。最高級別是快速創建圖表。它包括創建常見圖表的方法,如條形圖、方框圖和柱狀圖。中間層與matplotlib具有相同的特性,允許你控制每個圖表的基本構建塊(例如散點圖中的點)。最底層面向開發人員和軟件工程師。它沒有預先設置的默認值,並且要求你定義圖表的每個元素。

開發者:Continuum Analytics

更多資料: http://bokeh.pydata.org/en/latest/

Pygal

[圖片上傳失敗...(image-75715a-1550144242914)]

方框圖

與Bokeh和Plotly一樣,pygal提供了可以嵌入到Web瀏覽器中的交互式繪圖。其主要區別在於能夠將圖表輸出爲SVG格式。只要你在處理較小的數據集,SVG就可以幫你做得很好。但是,如果你製作的圖表中有數十萬個數據點,它們將很難呈現,並且會變得遲鈍。

由於每種圖表類型都被包裝成一個方法,並且內置的樣式很漂亮,所以用幾行代碼就可以很容易地創建一個美觀的圖表。

開發者:Florian Mounier

更多資料: http://www.pygal.org/en/latest/index.html

Plotly
[圖片上傳失敗...(image-e14ab8-1550144242914)]

折線圖(Plotly)

你可能知道Plotly是一個用於數據可視化的在線平臺,但你是否也知道可以從Python notebook 訪問它的功能?和Bokeh 一樣,Plotly的專長是製作交互式繪圖,但它提供了一些在大多數庫中找不到的圖表,如等高線圖,樹狀圖和三維圖表。

開發者: Plotly

更多資料:https://plot.ly/python/

Geoplotlib

[圖片上傳失敗...(image-85854c-1550144242914)]

等值線圖 (Andrea Cuttone)

geoplotlib是用於創建地圖和繪製地理數據的工具箱。你可以用它來創建各種各樣的地圖類型,比如等值線圖、熱圖和點密度地圖。必須安裝pyglet(一個面向對象編程接口),才能使用geoplotlib。儘管如此,由於大多數Python數據可視化庫都不提供地圖,所以最好有一個專門針對它們的庫。

開發者:Andrea Cuttone

更多資料:https://github.com/andrea-cuttone/geoplotlib

Gleam

[圖片上傳失敗...(image-450ad2-1550144242914)]

趨勢線散點圖(David Robinson)

Gleam的靈感來自R語言的Shiny包。它允許你只使用Python腳本就可以將分析轉化爲交互式web應用程序,所以你不必瞭解任何其他語言,如HTML,CSS或JavaScript。Gleam可以使用任何Python數據可視化庫。一旦創建了一個繪圖,就可以在上面構建字段,這樣用戶就可以過濾和排序數據。

開發者:David Robinson

更多資料:https://github.com/dgrtwo/gleam

Missingno

[圖片上傳失敗...(image-18f99-1550144242914)]

無效矩陣(Aleksey Bilogur)

處理丟失的數據是一件痛苦的事。missingno允許你通過直觀的總結快速衡量數據集的完整性,而不是艱難地瀏覽表格。你可以根據熱圖或樹形圖中的完成度或點相關來過濾和排序數據。

開發者:Aleksey Bilogur

更多資料:https://github.com/ResidentMario/missingno

Leather

[圖片上傳失敗...(image-dd2489-1550144242914)]

帶有一致比例的網格圖 (Christopher Groskopf)

Leather的創建者Christopher Groskopf說的好:“Leather是一個爲那些現在需要圖表而不在乎是否完美的人設計的Python圖表庫”它可用於處理所有數據類型,然後生成SVG圖像,這樣你在調整圖像大小時就不會損失圖像質量。由於這個庫相對較新,一些文檔仍在編寫中。你可以做的圖表很基礎,但這就是目的。

開發者:Christopher Groskopf

號:923414804
    羣裏有志同道合的小夥伴,互幫互助,
    羣裏有不錯的視頻學習教程和PDF!
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章