圖的用途+panda繪圖(二):箱線圖、面積圖、散點圖

約定:

%matplotlib inline
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

圖的用途+pandas繪圖

一、箱線圖 Box Chart

  • 箱線圖的用途

箱線圖(Boxplot)也稱箱須圖(Box-whisker Plot),它是用一組數據中的最小值、第一四分位數、中位數、第三四分位數和最大值來反映數據分佈的中心位置和散佈範圍,可以粗略地看出數據是否具有對稱性。通過將多組數據的箱線圖畫在同一座標上,則可以清晰地顯示各組數據的分佈差異,爲發現問題、改進流程提供線索。

這裏寫圖片描述

箱線圖作爲描述統計的工具之一,其功能有獨特之處,主要有以下幾點:

1.直觀明瞭地識別數據批中的異常值

2.利用箱線圖判斷數據批的偏態和尾重

3.利用箱線圖比較幾批數據的形狀

圖中白點即爲異常值,關於異常值 https://www.zhihu.com/question/36172806 有詳解。

  • 類型1:單箱線圖
se=pd.Series(np.random.randint(1,10,10))
se.plot.box();
print(se)
0    5
1    1
2    2
3    6
4    8
5    3
6    4
7    8
8    4
9    8
dtype: int32

png

  • 類型2:多箱線圖
df = pd.DataFrame(np.random.rand(10, 5), columns=['A', 'B', 'C', 'D', 'E'])
df.boxplot();

png

  • 類型3:水平箱線圖
df.plot.box(vert=False, positions=[1, 4, 5, 6, 8]);

png

二、面積圖 Area Chart

  • 面積圖的用途

面積圖又稱區域圖,強調數量隨時間而變化的程度,也可用於引起人們對總值趨勢的注意。堆積面積圖還可以顯示部分與整體的關係。折線圖和麪積圖都可以用來幫助我們對趨勢進行分析,當數據集有合計關係或者你想要展示局部與整體關係的時候,使用面積圖爲更好的選擇

  • 類型1:面積圖
df = pd.DataFrame(np.random.randint(0,10, (10,3)), columns=['a', 'b', 'c'])
df.plot.area(stacked=False);

png

  • 類型2:堆積面積圖
df.plot.area();

png

三、散點圖 Scatter Chart

  • 散點圖的用途

散點圖是指數據點在直角座標系平面上的分佈圖,散點圖表示因變量隨自變量而變化的大致趨勢,通常用於迴歸分析,據此可以選擇合適的函數對數據點進行迴歸擬合。
多組散點圖通常用於聚類,能直觀地看出每組數據點的分佈。

  • 類型1:散點圖
df = pd.DataFrame(np.random.rand(50, 4), columns=['a', 'b', 'c', 'd'])
df.plot.scatter(x='a', y='b');

png

  • 類型2:多組散點圖
ax = df.plot.scatter(x='a', y='b', color='DarkBlue', label='Group 1');
df.plot.scatter(x='c', y='d', color='DarkGreen', label='Group 2', ax=ax);

png

類型3:

df.plot.scatter(x='a', y='b', c='c', s=50);

png

類型4:

df.plot.scatter(x='a', y='b', s=df['c']*200);

png

謝謝大家的瀏覽,
希望我的努力能幫助到您,
共勉!

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章