一、相關性矩陣計算:
[1] 加載數據:
data = read.csv(“231-6057_2016-04-05-ZX_WD_2.csv”,header=FALSE)
說明:csv格式的數據,header=FALSE 表示沒有標題,即數據從第一行開始。
[2] 計算相關性矩陣(可以自己指定採用的方法,“pearson”, “kendall”, “spearman”)
注:cor(x,y,method = c(“pearson”, “kendall”, “spearman”))
cor_matr = cor(data)
cor_matr
二 相關係數的顯著性水平(Correlation significance levels (p-value))
使用Hmisc 包,不僅可以計算相關性矩陣,還可以計算對應的顯著性水平
[1] 安裝包 Hmisc (依賴包也會一併安裝,lib代表安裝包的路徑)
install.packages(“Hmisc”,lib=“E:/Program Files/R/R-3.3.0/library/”)
[2] 加載包
library(Hmisc)
[3] 計算相關性和顯著水平 (as.matrix(data) 表示將data轉換成矩陣)
rcorr(as.matrix(data))
輸出說明:
r :第一個矩陣爲相關性矩陣
n : 處理數據的總記錄數(行數)
P : 顯著性水平矩陣(越小說明越顯著)
三、可視化相關性分析
[1] 使用 symnum() 函數實現可視化 (cor_matr 是我們上文中cor()函數計算出來的相關性矩陣)
symnum(cor_matr)
符號說明:在輸出的最後一行,說明了符號的意義,例如 [0.9 , 0.95) 這個區間使用 * 表示。其他符號類似
[2] 使用 corrplo