現在又用到R語言了,當年學習的時候,很多函數用的都很熟練,沒想到現在竟然忘了一大截。。。寫個筆記還是很有必要的。。持續更新……
此處作目錄
- 連接mysql的操作
- 數據框的合併(merge)
- 數據框去重(news=news[!duplicated(news),])
- 輸出表格csv
- 刪除某些列有na的行final_news=news[complete.cases(news[,'shoucang']),]
1.連接Mysql
(1)先去控制面板ODBC數據源處新建數據源。
(2)R代碼如下
library(RODBC) #加載庫
myconn<-odbcConnect("mydb",uid="root",pwd="12345",DBMSencoding="utf-8") #創建連接
sqlTables(myconn) #顯示所有的表
news_total<-sqlQuery(myconn,"select * from news_total") #執行查詢後的結果存入幀中
news_detail<-sqlQuery(myconn,"select * from news_detail") #執行查詢後的結果存入幀中
close(myconn) #關閉連接
2.數據框合併
如下爲左連接
news=merge(news_total, news_detail[,2:6],by.x ="entity_id",by.y = "entity_id",all.x = T )
4.輸出表格
write.csv(b,"C:\\Users\\jmw\\Desktop\\queshi.csv",fileEncoding = "utf-8",row.names=F)