Pandas——數據可視化

1.前言

首先import我們需要用到的模塊,除了 pandas,我們也需要使用 numpy 生成一些數據,這節裏使用的 matplotlib 僅僅是用來 show 圖片的, 即 plt.show()。

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

2.Series可視化

這是一個線性的數據,我們隨機生成1000個數據,Series 默認的 index 就是從0開始的整數,但是這裏我顯式賦值以便讓大家看的更清楚

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

data = pd.Series(np.random.randn(100),index=np.arange(100))  # 隨機生成1000個數據服從標準正太分佈
data.cumsum()    # 爲了方便觀看效果, 我們累加這個數據
data.plot()    # pandas 數據可以直接觀看其可視化形式
plt.show()

在這裏插入圖片描述
熟悉 matplotlib 的朋友知道如果需要plot一個數據,我們可以使用 plt.plot(x=, y=),把x,y的數據作爲參數存進去,但是data本來就是一個數據,所以我們可以直接plot。

3.Dataframe 可視化

我們生成一個100*4 的DataFrame,並對他們累加

data = pd.DataFrame(np.random.randn(100,4),index=np.arange(100),columns=list("ABCD"))
data.cumsum()
print(data)
data.plot()
plt.show()

在這裏插入圖片描述
這個就是我們剛剛生成的4個column的數據,因爲有4組數據,所以4組數據會分別plot出來。

4.畫散點圖

主要說一下 plot 和 scatter. 因爲scatter只有x,y兩個屬性,我們我們就可以分別給x, y指定數據

ax = data.plot.scatter(x='A',y='B',color='DarkBlue',label='Class1')
# 將之下這個 data 畫在上一個 ax 上面
data.plot.scatter(x='A',y='C',color='LightGreen',label='Class2',ax=ax)
plt.show()

在這裏插入圖片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章