<Data Visualization> 數據導入導出與基本處理 - R

以下是導入:
- txt 格式導入:

data<-read.table("C:\\Users\\Administrator\\Desktop\\myfile.txt",header=F)#TXT讀入
  • CSV 格式導入:
data<-read.csv("C:\\Users\\Administrator\\Desktop\\myfile.csv")  #CSV數據讀入
  • xlsx 格式導入
library("xlsx")
data<-read.xlsx("C:\\Users\\Administrator\\Desktop\\myfile.xlsx",sheetName="file",header=F,encoding='UTF-8')
  • 剪切板 直接複製(容易出錯):
data <- read.table("clipboard", header = T, sep = '\t')#直接複製

以下是導出

  • csv:
write.table(mydata2, file ="C:\\Users\\Administrator\\Desktop\\newdata.csv", sep =",", row.names =FALSE)
  • txt
write.table(mydata2,file="C:\\Users\\Administrator\\Desktop\\newdata.txt" , sep =" ", row.names =FALSE,col.names =TRUE, quote =FALSE)

以下爲數據連接

  • merge 的用法:
    • 語法:merge(x, y, by = , by.x = , by.y = , all = , all.x = , all.y = , sort = , suffixes = , incomparables = , ...)
    • 這裏寫圖片描述
  • join函數 (plyr包)
    • 語法:join(x, y, by = NULL, type = "left", match = "all")
  • inner_join/full_join/left_join/right_join 函數 (dplyr包):
    • inner_join(x, y) :只包含同時出現在x,y表中的行
    • left_join(x, y) :包含所有x中以及y中匹配的行
    • right_join(x, y,by=c(“Name”=”name”)) :包含所有y中以及x中匹配的行
    • full_join(x,y,by=c(“Name”=”name”)) :包含所以x、y中的行
    • semi_join(x, y) :包含x中,在y中有匹配的行,結果爲x的子集
    • anti_join(x, y) :包含x中,不匹配y的行,結果爲x的子集,與semi_join相反
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章