三、數據可視化
觀測(observation)、變量(variable)、數據矩陣(data matrix)
數據集中趨勢的測量(measures of center)
-均值(mean)、中位數(median)、衆數(mode)
數據分散趨勢的測量
-值域、方差、標準差、四分位距
穩健統計量(robust stastics)
-是:中位數、四分位差(受極端值影響小)
-否:均值、標準差、值域(受極端值影響大)
一個變量的可視化
---柱狀圖(histogram)、點圖(dot plot)
---箱圖(box plot)(中位數、分位點、極端值)
兩個變量的關係
---散點圖:方向、形狀、強度、極端值
數據可視化
繪圖函數(graphics包)
-plot /hist/boxplot/points/lines/text/title/axis
plot()
-plot(x,y,....)
參數:xlab/ylab/lwd/lty/pch/col
par()
---用於設置全局參數(作用於R中的所有plot繪圖)
bg/mar(和邊界邊距)/las(排版方式)/mfrow(分畫板 行)/mfcol(分畫板
列)
lattice繪圖函數
lattice包
.xyplot/bwplot/histtogram/stripplot/dotplot/splom/levelplot/contourplot
格式:xyplot(y~x|f*g,data)
f*g 分類變量
panel函數,用於控制每個面板內的繪圖
--grid包
實現了獨立於base的繪圖系統
lattice包是基於grid創建的,很少直接從grid 包調用函數
lattice與base的重要區別
Base繪圖函數直接在圖像設備上繪圖
lattice繪圖函數返回了trellis類對象
打印函數真正執行了在設備上繪圖
命令執行時,trellis類對象會被自動打印,所有看起來就像lattice函數直接完成了繪圖
ggplot2繪圖系統
層(layer)
繪圖函數
qplot()
ggplot()
R語言的顏色
grDevice包
-colorRamp() &colorRampPalette()
- 顏色名字可使用colors()獲取
RColorBrewer包
- 三類調色板 sequential / diverging / qualitative
-調色板信息可與colorRamp/ colorRampPalette結合使用
過程
極值
分類