R語言可視化 ggplot2—基本用法+顏色、大小、形狀和其他圖形屬性

基本用法

library(ggplot2)

讓樣本可重複

set.seed(1410) 

diamonds數據集中隨機取100個數據

dsmall <- diamonds[sample(nrow(diamonds), 100), ]

畫圖,默認點圖

qplot(carat, price, data = diamonds)

這張圖顯示出了變量之間很強的相關關係,以及一些很明顯的異常值,此外,可以看出在豎直方向上有一些有趣的條紋。這種相關關係似乎是指數型的,因此我們應該首先對變量進行一些變換。由於qplot()支持將變量的函數作爲參數,因此我們可以畫出log(price)log(carat)的圖形:

qplot(log(carat), log(price), data = diamonds)

現在這種關係就接近於線性了。然而,由於圖中的元素有很大的重疊,所以我們在下結論時需要小心。

函數的參數同樣可以是已有變量的某種組合。例如,如果我們對鑽石的體積(用x×y×z近似)和其重量之間的關係感興趣,那麼我們可以這樣做:

qplot(carat, x * y * z, data = diamonds)

顏色、顏色、大小、形狀和其他圖形屬性

將 color 變量映射到點的顏色 (上),cut 變量映射到點的形狀 (下)

qplot(carat, price, data = dsmall, colour = color)
qplot(carat, price, data = dsmall, shape = cut)

將 alpha 值從 1/10(上) 變動到 1/100(中) 再到1/200(下),來看大部分的點在哪裏 進行重疊。

qplot(carat, price, data = diamonds, alpha = I(1/10))
qplot(carat, price, data = diamonds, alpha = I(1/100))
qplot(carat, price, data = diamonds, alpha = I(1/200))
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章