Linux 獲取兩個 csv 文件的交集和差集

 sort 差集

sort -m <(sort big.csv | uniq) <(sort small.csv | uniq) <(sort small.csv | uniq) | uniq -u  > final.csv

grep 交集

grep -F -f big.csv small.csv > union_set.csv

grep 差集

# 注意,是 big - small 的結果
grep -F -v -f small.csv big.csv > difference_set.csv

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章