LINUX Shell 下求兩個文件交集和差集的辦法

假設兩個文件FILE1和FILE2用集合A和B表示,FILE1內容如下:

FILE2內容如下:

基本上有兩個方法,一個是comm命令,一個是grep命令。分別介紹如下:

 

comm命令 , Compare sorted files FILE1 and FILE2 line by line. With  no options, produce three-column output.  Column one contains lines unique to FILE1, column two contains lines unique to FILE2, and column three contains lines common to both files. 要注意兩個文件必須是排序和唯一(sorted and unique)的,默認輸出爲三列,第一列爲是A-B,第二列B-A,第三列爲A交B。

直接運行結果如下:

僅僅排序:

排序並且唯一:

如果只想要交集,如下即可:

至於差集,讀者自己思考了。

 

grep 命令是常用的搜索文本內容的,要找交集,如下即可:

grep不要求排序,但是因爲是集合操作,唯一是必須的(不然怎麼是集合呢?)。所以:

差集呢?

第一行結果爲B-A,所以爲空;第二行爲A-B。注意順序很重要!

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章