R語言篩選兩列中元素相同的重複數據

原創

那个年轻人

2019-09-07 17:41

思想：將讀取的數據當做數據庫中的數據表，讀取的數據放置到數據內存中臨時存儲，以SQL語句對數據進行篩選，得出想要的數據內容。

數據情況

篩選V2和V3兩列中，元素的重複次數超過2次以上的數據，其中2和3的重複次數超過3次，需要篩選出來。

其中：找出V2和V3 同時重複大於3

篩選數據R語言程序

library(sqldf)
data <- read.csv("data.csv")
head(data)
zdata <- sqldf("select * from data t where (select count(1) from data where V2 = t.V2 and V3 = t.V3)>2")
print(zdata)

使用的SQL語句爲：

select * from data t where (select count(1) from data where V2=t.V2 and V3=t.V3)>2

得到曬選的效果如下所示：

方法二

v1=c(1,21,5,5,8,8)
v2=c(2,5,2,8,2,2)
v3=c(3,6,3,9,3,3)
v4=c(4,7,3,4,7,4)
data=data.frame(v1,v2,v3,v4)
head(data)
data $v2v5=paste(data$ v2,data $v5) a=table(data$ v2v5)
tarid=names(a)[a>2]
res=data[data$v2v5%in%tarid,]
print(res)

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

R語言篩選兩列中元素相同的重複數據

數據情況

篩選數據R語言程序

使用的SQL語句爲：

得到曬選的效果如下所示：

方法二

數據挖掘算法模型開發

R語言篩選兩列中元素相同的重複數據

動態數據下的Echarts可視化平臺構建

windows下自動化設置環境變量——腳本配置

基因卡方列聯表P值檢驗——相關係數圖形

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結