R進行相關性分析

一、相關性矩陣計算:

[1] 加載數據:
  data = read.csv(“231-6057_2016-04-05-ZX_WD_2.csv”,header=FALSE)
說明:csv格式的數據,header=FALSE 表示沒有標題,即數據從第一行開始。
[2] 計算相關性矩陣(可以自己指定採用的方法,“pearson”, “kendall”, “spearman”)
注:cor(x,y,method = c(“pearson”, “kendall”, “spearman”))
  cor_matr = cor(data)
  cor_matr

二 相關係數的顯著性水平(Correlation significance levels (p-value))

使用Hmisc 包,不僅可以計算相關性矩陣,還可以計算對應的顯著性水平
[1] 安裝包 Hmisc (依賴包也會一併安裝,lib代表安裝包的路徑)
  install.packages(“Hmisc”,lib=“E:/Program Files/R/R-3.3.0/library/”)
[2] 加載包
  library(Hmisc)
[3] 計算相關性和顯著水平 (as.matrix(data) 表示將data轉換成矩陣)
  rcorr(as.matrix(data))
輸出說明:
r :第一個矩陣爲相關性矩陣
n : 處理數據的總記錄數(行數)
P : 顯著性水平矩陣(越小說明越顯著)

三、可視化相關性分析

[1] 使用 symnum() 函數實現可視化 (cor_matr 是我們上文中cor()函數計算出來的相關性矩陣)
symnum(cor_matr)
符號說明:在輸出的最後一行,說明了符號的意義,例如 [0.9 , 0.95) 這個區間使用 * 表示。其他符號類似
[2] 使用 corrplo

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章