R語言中常見的圖形函數:
函數 | 圖形 | 功能 |
---|---|---|
hist | 直方圖 | 分佈 |
sm.density.compare | 密度圖 | 分佈 |
boxplot | 箱線圖 | 分佈 |
xioplot | 小提琴圖 | 分佈 |
barplot | 條形圖 | 分佈 |
dotchart | Cleveland圖 | 分佈 |
pie | 餅圖 | 分佈 |
plot | 根據作圖對象而異,最簡單的是散點圖 | 關係(對散點圖),圖形不同功能不同 |
pairs | 散點圖矩陣 | 關係 |
corrgram | 相關圖 | 關係 |
函數 | 圖形 | 功能 |
---|---|---|
qqplot | QQ圖 | 假設檢驗 |
mosai | 馬賽克圖 | 假設檢驗 |
stars | 星狀圖 | 突出特徵 |
sunflowerplot | 向日葵散點圖 | 突出特徵 |
contour | 等高圖 | 聚類 |
heatmap | 熱圖 | 聚類 |
分析數據分佈情況的圖形繪製
直方圖
hist(x, breaks = , freq = , ...)
參數 | 參數描述 |
---|---|
x | 數值向量 |
breaks | 分段區間,取值一個向量(各區間端點)或者一個數字(拆分爲多少段),或者一個字符串(計算劃分區間的算法名稱),或者一個函數(劃分區間個數的方法) |
freq | 是否以頻數作圖。默認TRUE,畫出頻數直方圖 取值FALSE時畫頻率直方圖 |
條形圖
barplot(height, beside = , horiz = , ...)
參數 | 參數描述 |
---|---|
height | 數值,數據結構必須是向量或者矩陣 |
beside | 默認值爲FALSE,每一列都將給出堆砌的“子條”高度,若beside=TRUE,則每一列都表示一個分組並列 |
horiz | 邏輯值,默認爲FALSE,改成TRUE圖形變爲橫向條形圖 |
餅圖
pie(x, labels = names(x), radius = 0.8, ...)
參數 | 參數描述 |
---|---|
x | 非負的數值向量,x中的值表示餅圖切片的區域 |
labels | 標籤,一個或多個給切片命名的表達式或者字符串 |
radius | 半徑,取值從-1到1,其中數字表示餅圖的半徑大小,負數表示從180°開始繪製餅圖,正數表示從0°開始繪製餅圖 |
分析數據間關係的圖形繪製
分析數據間的關係時,常用散點圖和多變量相關矩陣圖查看數據間的相關情況。這兩種圖形都能分析不同數值型特徵間的關係。
- 散點圖主要通過查看數據分佈情況來分析特徵間的相關關係
- 多變量相關矩陣圖根據兩兩之間的相關係數來分析兩兩間的相關關係
散點圖
plot(x, y, ...)
參數名稱 | 參數解釋 |
---|---|
x, y | 接收類似向量類型的一維數據。 表示x和y軸對應的數據。無默認值。 |
多變量相關矩陣圖
corrgram(x, order = , lower.panel = , upper.panel = , text.panel = ,diag.panel = , ...)
參數名稱 | 參數解釋 |
---|---|
x | 每行作爲一個觀測值的數據框或者相關係數矩陣 |
order | 變量排序,默認FALSE,相關矩陣按數據框名對變量排序,當order爲TRUE時,相關矩陣將使用主成分分析法對變量重排序,這將使得二元變量的關係模式更爲明顯 |
lower.panel | 主對角線下方的元素類型 |
upper.panel | 主對角線上方的元素類型 |
text.panel | 取值panel.txt輸出的變量名字 |
diag.panel | 控制着主對角線元素類型panel.minmax輸出變量的最大最小值 |