對find,xargs,grep和管道的一些深入理解

轉自於:http://fatmouse.xyz/2016/05/10/2016-05-10-find-grep-xargs-and-pipe/

問題

相信大家都知道在目錄中搜索含有固定字符串文件的命令:

1
find . -name '*.py' |xargs grep test

剛開始的時候,我不熟悉xargs命令,所以直接使用的命令是

1
find . -name '*.py' |grep test

結果並不是自己所期望的。此命令只是找出文件名*.txttest的情況。

這裏我就研究一下,究竟xargs做了什麼,使得結果不相同。

參數與標準輸入

這兩個詞我們在Linux命令中是很常見的。但是參數和標準輸入其實是有區別的。我們日常使用的很多命令,例如ls -lah .中。lah.都是命令ls的參數。至於標準輸入,可以說它某種流數據。而通常來講標準輸入的流數據來源就是我們的終端輸入。在Linux命令中,有些命令可以接收標準輸入,有些是不能的。像上面的ls,就是隻能接收參數,不能接收標準輸入。像cat命令或echo命令,這些是可以的。

怎麼分辨一個命令可不可以接收標準輸入?很簡單,當你敲完命令回車後,終端會等待接收你的輸入,例如當你在終端輸入cat後,終端會等待你輸入字符,當你輸入一些字符後,然後按Ctrl-C發送終止符號。這時cat命令接收標準輸入完畢,執行命令,也就是將剛纔鍵入的內容輸出的標準輸出上(屏幕)。

管道

管道的作用是將前面命令的標準輸出作爲後面命令的標準輸入。這裏要注意,後面的命令接收的是標準輸入,所以如果命令不支持接收標準輸入,那麼就不能直接使用管道,例如常用的ls命令,只能使用參數,而不能使用標準輸入,所以[command] | ls是不能使用的。而命令如echocat就可以。那麼肯定有方法來實現這些不能使用標準輸入的命令與管道結合,這時候xargs便出場了。

xargs命令

xargs命令通俗來講就是將標準輸入轉成各種格式化的參數,所以命令[command 1] | xargs [command 2]就是將command 1的標準輸出結果,通過管道|變成xargs的標準輸入,然後xargs再將此標準輸入變成參數,傳給[command 2]。這樣一來,通過xargs命令,我們便可以在管道後面使用那些不接收標準輸入的命令了。例如[command 1]|xargs ls,是不是很熟悉?

find與grep

有了以上的知識點,到這裏終於可以解答最開始的問題了。爲什麼命令

1
find . -name '*.py' |grep test


1
find . -name '*.py' |xargs grep test

的結果是不一樣的了。

我們首先來查看grep手冊。通過man grep命令。

1
2
DESCRIPTION
       grep searches the named input FILEs (or standard input if no files are named, or if a single hyphen-minus (-) is given as file name) for lines containing a match to the given PATTERN.  By default, grep prints the matching lines.

這裏可以看到grep是支持標準輸入的。

假設目錄存在如下文件:

1
2
$ ls
Altitest.py  python.py  runora.py  test.py  TransferFile.py

那麼對於第一個命令find . -name '*.py' |grep test,是將前面命令的標準輸出作爲標準輸入傳給了grep test,那麼grep是從這些標準輸入尋找test字符,也就是文件名組成的字符流

1
2
3
$ find . -name '*.py' |grep test
./Altitest.py
./test.py

可以看到最終選擇出的是這些文件名。

而對於第二個命令find . -name '*.py' |xargs grep test,通過xargsfind得到的文件名成爲了參數傳給後面的grep,那麼這時候這些文件名就是實實在在的文件標識,grep接收後會按正常的使用方式在各文件中搜尋字符串。

1
2
3
4
5
6
7
#find . -name '*.py' |xargs grep test
./runora.py:testConn = cx_Oracle.connect('user/passwd@tns')
./runora.py:testCursor = testConn.cursor()
./runora.py:testCursor.execute("select * from table")
./runora.py:rows = testCursor.fetchall()
./runora.py:testCursor.close()
./runora.py:testConn.close()

到這裏算是將findgrepxargs和管道的作用理解清楚了。

  1. xargs還有指定參數位置的作用。假設我們要將目錄下所有的.py文件放到Python目錄中去,可以使用命令
    find . -name '*.py' | xargs -I {} mv {} ./Python
    參數-I指定了管道前命令作爲參數所應該在管道後面命令的位置。

  2. 我們在查看很多命令手冊時,手冊會說明命令的使用方法。例如
    grep [OPTIONS] PATTERN [FILE...],也就是命令的最後一個位置是文件名[FILE]
    這裏要注意這個文件名[FILE]也是參數


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章