慣例先來簡單介紹下什麼是散點圖:用兩組數據構成多個座標點,考察座標點的分佈,判斷兩變量之間是否存在某種關聯或總結座標點的分佈模式。散點圖將序列顯示爲一組點。值由點在圖表中的位置表示。類別由圖表中的不同標記表示。(來源:百度百科)
散點圖很主要的是可以很直觀的查看兩組數據之間的關係,另外還可以很顯示數據的分佈情況。乾巴巴的描述來描述去也沒有一個圖來的直觀容易理解:
例如這張圖,x軸數據和y軸數據就存在很強的正向關!
而這幅散點圖,顯示數據分佈,對於分類有很大的幫助。
繪製簡單散點圖
既然已經知道了散點圖的主要作用,那麼下邊讓我們來繪製一個散點圖吧,一步一步,從簡單到進階!
先來看一下我們的數據源,依然是一組小學的語數外考試成績:
基於上述數據源,繪製語文成績與總成績的散點圖:
繪製幾個圖之後,大家就會發現,常規的畫布啊標題啊標籤之類的設置都是通用的,只有畫圖函數是不一樣的,而大多數時候圖想畫出花樣來着,也是在各個參數上做文章,先來看下這個簡單的散點圖畫出來是什麼樣子的吧:
通過這個圖能夠看出,語文成績和總成績之間存在一定的線性關係,當然和前邊那個示例圖相比沒有那麼明顯。這是語文成績和總成績的圖,但是我們數據一共有三個學科數據,可不可以把三個學科的圖繪製到一起呢?
當然是可以的啊,和繪製堆疊條形圖和環形圖的原理是一樣的,下邊我們來繪製一下三個學科和總成績之間的散點圖。
代碼含義都以註釋的形式標註到對應代碼後了,其實就是在同一塊畫布上重複繪製散點圖,散點和環形或者條形圖不同,後邊繪製的圖形覆蓋先繪製圖形的情形幾乎可以忽略,所以不用進行其他設置,直接繪圖就可以,代碼中對代表每一個學科的散點形狀進行了指定,其實還可以指定顏色,實驗發現系統默認的顏色還不錯,就沒有指定顏色(發現自己指定的顏色還不如系統指定的好看,有點悲傷):
通過這個圖能夠很明顯的看出數學成績與總成績之間的線性關係更強,有點符合上學時候的真實情況了,數學纔是拉開分差的學科啊!
氣泡圖
其實氣泡圖是從散點圖衍生出來的,散點圖只有兩個維度的數據,x軸和y軸,氣泡圖比散點圖多了一個維度,即標記點的大小可以代表一個維度,衡量大小。
以學校成績數據爲例,我們給散點圖添加一個維度,即給標記的大小賦值來看下有什麼變化。比如語文成績:
效果圖:
代碼中我們賦值給參數s的是語文成績,而y軸也是語文成績,所以能夠看到,點的位置越靠近上方,點越大,如果我們賦值給s的值是總成績的畫,那麼點的位置越靠右,點就會越大。
這裏爲了和前邊的圖進行對比,用了二維的數據繪圖,有興趣的小夥伴可以找一個三個維度的數據試一下,自己敲一遍收穫更大哦!