spark中對rdd的幾個操作

union()
union將包含兩個rdd中的所有元素

rddA.union(rddB)

distinct()
distinct會去掉一個rdd中重複的元素

rddA.distinct()

interaction()
交集:返回兩個rdd所共有的元素

rddA.interaction(rddB) 

subtract()
取子集:返回只存在rddA中不存在rddB中的元素

rddA.subtract(rddB) 
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章