Linux shell xargs命令詳解,xargs與管道的區別

Linux shell xargs命令詳解,xargs與管道的區別

目錄

Linux shell xargs命令詳解,xargs與管道的區別

一、爲什麼要用xargs,問題的來源

二、xargs是什麼,與管道有什麼不同

三、xargs的一些有用的選項


[work@app61 ~/workdir/ya]$ xargs --help

Usage: xargs [-0prtx] [--interactive] [--null] [-d|--delimiter=delim]

[-E eof-str] [-e[eof-str]] [--eof[=eof-str]]

[-L max-lines] [-l[max-lines]] [--max-lines[=max-lines]]

[-I replace-str] [-i[replace-str]] [--replace[=replace-str]]

[-n max-args] [--max-args=max-args]

[-s max-chars] [--max-chars=max-chars]

[-P max-procs] [--max-procs=max-procs] [--show-limits]

[--verbose] [--exit] [--no-run-if-empty] [--arg-file=file]

[--version] [--help] [command [initial-arguments]]

一、爲什麼要用xargs,問題的來源

在工作中經常會接觸到xargs命令,特別是在別人寫的腳本里面也經常會遇到,但是卻很容易與管道搞混淆,本篇會詳細講解到底什麼是xargs命令,爲什麼要用xargs命令以及與管道的區別。爲什麼要用xargs呢,我們知道,linux命令可以從兩個地方讀取要處理的內容,一個是通過命令行參數,一個是標準輸入。例如cat、grep就是這樣的命令,舉個例子:

1

echo 'main' cat test.cpp

這種情況下cat會輸出test.cpp的內容,而不是'main'字符串,如果test.cpp不存在則cat命令報告該文件不存在,並不會嘗試從標準輸入中讀取。echo 'main' | 會通過管道將 echo 的標準輸出(也就是字符串'main')導入到 cat 的標準輸入,也就是說此時cat的標準輸入中是有內容的,其內容就是字符串'main'但是上面的內容中cat不會從它的標準輸入中讀入要處理的內容。(注:標準輸入是有一個緩衝區的,就像我們在程序中使用scanf函數從標準輸入中讀取一樣,實際上是從標準輸入的緩衝區中讀取的)。其實基本上linux的命令中很多的命令的設計是先從命令行參數中獲取參數,然後從標準輸入中讀取,反映在程序上,命令行參數是通過main函數 int main(int argc,char*argv[]) 的函數參數獲得的,而標準輸入則是通過標準輸入函數例如C語言中的scanf讀取到的。他們獲取的地方是不一樣的。例如:

1

echo 'main' cat

這條命令中cat會從其標準輸入中讀取內容並處理,也就是會輸出 'main' 字符串。echo命令將其標準輸出的內容 'main' 通過管道定向到 cat 的標準輸入中。

1

cat

如果僅僅輸入cat並回車,則該程序會等待輸入,我們需要從鍵盤輸入要處理的內容給cat,此時cat也是從標準輸入中得到要處理的內容的,因爲我們的cat命令行中也沒有指定要處理的文件名。大多數命令有一個參數  -  如果直接在命令的最後指定 -  則表示從標準輸入中讀取,例如:

1

echo 'main' cat -

這樣也是可行的,會顯示 'main' 字符串,同樣輸入 cat - 直接回車與輸入 cat 直接回車的效果也一樣,但是如果這樣呢:

1  

echo 'main' cat test.cpp -

同時指定test.cpp 和 - 參數,此時cat程序會先輸出test.cpp的內容,然後輸出標準輸入'main'字符串,如果換一下順序變成這樣:

1  

echo 'main' cat test.cpp

則會先輸出標準輸入'main'字符串,然後輸出test.cpp文件的內容。如果去掉這裏的 - 參數,則cat只會輸出test.cpp文件的內容。另外如果同時傳遞標準輸入和文件名,grep也會同時處理這兩個輸入,例如:

1

echo 'main' grep 'main' test.cpp -

該命令的輸出結果是:
test.cpp:int main()
(standard input):main

此時grep也會同時處理標準輸入和文件test.cpp中的內容,也就是說會在標準輸入中搜索 'main' 也會在文件 test.cpp (該文件名從grep命令行參數中獲得)中搜索 'main'。也就是說我們看到當命令行參數與標準輸入同時存在的時候grep和cat是會同時處理這兩個輸入的,但是有很多命令並不是都處理。大多命令一般情況下是首先在命令行中查找要處理的內容的來源(是從文件還是從標準輸入,還是都有),如果在命令行中找不到與要處理的內容的來源相關的參數則默認從標準輸入中讀取要處理的內容了,當然這取決於命令程序的內部實現,就像cat命令,加不加 - 參數他的表現又不同。

另外很多程序是不處理標準輸入的,例如 kill , rm 這些程序如果命令行參數中沒有指定要處理的內容則不會默認從標準輸入中讀取。所以:

1

echo '516' kill

這種命裏是不能執行的。

1

echo 'test' rm -f

這種也是沒有效果的。

這兩個命令只接受命令行參數中指定的處理內容,不從標準輸入中獲取處理內容。想想也很正常,kill 是結束進程,rm是刪除文件,如果要結束的進程pid和要刪除的文件名需要從標準輸入中讀取,這個也很怪異吧。 但是像 cat與grep這些文字處理工具從標準輸入中讀取待處理的內容則很自然。

但是有時候我們的腳本卻需要 echo '516' | kill 這樣的效果,例如 ps -ef | grep 'ddd' | kill 這樣的效果,篩選出符合某條件的進程pid然後結束。這種需求對於我們來說是理所當然而且是很常見的,那麼應該怎樣達到這樣的效果呢。有幾個解決辦法:

1. 通過 kill `ps -ef | grep 'ddd'`    
#這種形式,這個時候實際上等同於拼接字符串得到的命令,其效果類似於  kill $pid

2. for procid in $(ps -aux | grep "some search" | awk '{print $2}'); do kill -9 $procid; done   
#其實與第一種原理一樣,只不過需要多次kill的時候是循環處理的,每次處理一個

3. ps -ef | grep 'ddd' | xargs kill  
#OK,使用了xargs命令,鋪墊了這麼久終於鋪到了主題上。xargs命令可以通過管道接受字符串,並將接收到的字符串通過空格分割成許多參數(默認情況下是通過空格分割) 然後將參數傳遞給其後面的命令,作爲後面命令的命令行參數。

二、xargs是什麼,與管道有什麼不同

xargs與管道有什麼不同呢,這是兩個很容易混淆的東西,看了上面的xargs的例子還是有點雲裏霧裏的話,我們來看下面的例子弄清楚爲什麼需要xargs:

echo '--help' | cat
輸出:
--help

echo '--help' | xargs cat
輸出:

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

Usage: cat [OPTION]... [FILE]...

Concatenate FILE(s), or standard input, to standard output.

 

  -A, --show-all           equivalent to -vET

  -b, --number-nonblank    number nonempty output lines

  -e                       equivalent to -vE

  -E, --show-ends          display $ at end of each line

  -n, --number             number all output lines

  -s, --squeeze-blank      suppress repeated empty output lines

  -t                       equivalent to -vT

  -T, --show-tabs          display TAB characters as ^I

  -u                       (ignored)

  -v, --show-nonprinting   use ^ and M- notation, except for LFD and TAB

      --help     display this help and exit

      --version  output version information and exit

 

With no FILE, or when FILE is -, read standard input.

 

Examples:

  cat f - g  Output f's contents, then standard input, then g's contents.

  cat        Copy standard input to standard output.

 

Report cat bugs to [email protected]

GNU coreutils home page: <http://www.gnu.org/software/coreutils/>

General help using GNU software: <http://www.gnu.org/gethelp/>

For complete documentation, run: info coreutils 'cat invocation'

可以看到 echo '--help' | cat   該命令輸出的是echo的內容,也就是說將echo的內容當作cat處理的文件內容了,實際上就是echo命令的輸出通過管道定向到cat的輸入了。然後cat從其標準輸入中讀取待處理的文本內容。這等價於在test.txt文件中有一行字符 '--help' 然後運行  cat test.txt 的效果。

而 echo '--help' | xargs cat 等價於 cat --help 什麼意思呢,就是xargs將其接受的字符串 --help 做成cat的一個命令參數來運行cat命令,同樣  echo 'test.c test.cpp' | xargs cat 等價於 cat test.c test.cpp 此時會將test.c和test.cpp的內容都顯示出來。

三、xargs的一些有用的選項

相信到這裏應該都知道xargs的作用了,那麼我們看看xargs還有一些有用的選項:

1. -d 選項
默認情況下xargs將其標準輸入中的內容以空白(包括空格、Tab、回車換行等)分割成多個之後當作命令行參數傳遞給其後面的命令,並運行之,我們可以使用 -d 命令指定分隔符,例如:
echo '11@22@33' | xargs echo
輸出:
11@22@33
默認情況下以空白分割,那麼11@22@33這個字符串中沒有空白,所以實際上等價於 echo 11@22@33 其中字符串 '11@22@33' 被當作echo命令的一個命令行參數

echo '11@22@33' | xargs -d '@' echo
輸出:
11 22 33
指定以@符號分割參數,所以等價於 echo 11 22 33 相當於給echo傳遞了3個參數,分別是11、22、33

2. -p 選項
使用該選項之後xargs並不會馬上執行其後面的命令,而是輸出即將要執行的完整的命令(包括命令以及傳遞給命令的命令行參數),詢問是否執行,輸入 y 才繼續執行,否則不執行。這種方式可以清楚的看到執行的命令是什麼樣子,也就是xargs傳遞給命令的參數是什麼,例如:
echo '11@22@33' | xargs -p -d '@'  echo
輸出:
echo 11 22 33
 ?...y      ==>這裏詢問是否執行命令 echo 11 22 33 輸入y並回車,則顯示執行結果,否則不執行
 11 22 33   ==>執行結果

3. -n 選項
該選項表示將xargs生成的命令行參數,每次傳遞幾個參數給其後面的命令執行,例如如果xargs從標準輸入中讀入內容,然後以分隔符分割之後生成的命令行參數有10個,使用 -n 3 之後表示一次傳遞給xargs後面的命令是3個參數,因爲一共有10個參數,所以要執行4次,才能將參數用完。例如:

echo '11@22@33@44@55@66@77@88@99@00' | xargs -d '@' -n 3 echo
輸出結果:
11 22 33
44 55 66
77 88 99
00
等價於:
echo 11 22 33
echo 44 55 66
echo 77 88 99
echo 00
實際上運行了4次,每次傳遞3個參數,最後還剩一個,就直接傳遞一個參數。

4. -E 選項,有的系統的xargs版本可能是-e  eof-str
該選項指定一個字符串,當xargs解析出多個命令行參數的時候,如果搜索到-e指定的命令行參數,則只會將-e指定的命令行參數之前的參數(不包括-e指定的這個參數)傳遞給xargs後面的命令
echo '11 22 33' | xargs -E '33' echo
輸出:
11 22

可以看到正常情況下有3個命令行參數 11、22、33 由於使用了-E '33' 表示在將命令行參數 33 之前的參數傳遞給執行的命令,33本身不傳遞。等價於 echo 11 22 這裏-E實際上有搜索的作用,表示只取xargs讀到的命令行參數前面的某些部分給命令執行。

注意:-E只有在xargs不指定-d的時候有效,如果指定了-d則不起作用,而不管-d指定的是什麼字符,空格也不行。

echo '11 22 33' | xargs -d ' ' -E '33' echo 

=> 輸出 11 22 33


echo '11@22@33@44@55@66@77@88@99@00 aa 33 bb' | xargs -E '33' -d '@' -p  echo 

=> 輸出 11 22 33 44 55 66 77 88 99 00 aa 33 bb

## -0 選項表示以 '\0' 爲分隔符,一般與find結合使用

find . -name "*.txt"
輸出:
./2.txt
./3.txt
./1.txt     => 默認情況下find的輸出結果是每條記錄後面加上換行,也就是每條記錄是一個新行

find . -name "*.txt" -print0
輸出:
./2.txt./3.txt./1.txt     => 加上 -print0 參數表示find輸出的每條結果後面加上 '\0' 而不是換行

find . -name "*.txt" -print0 | xargs -0 echo
輸出:
./2.txt ./3.txt ./1.txt

find . -name "*.txt" -print0 | xargs -d '\0' echo
輸出:
./2.txt ./3.txt ./1.txt

xargs的 -0 和 -d '\0' 表示其從標準輸入中讀取的內容使用 '\0' 來分割,由於 find 的結果是使用 '\0' 分隔的,所以xargs使用 '\0' 將 find的結果分隔之後得到3個參數: ./2.txt ./3.txt ./1.txt  注意中間是有空格的。上面的結果就等價於 echo ./2.txt ./3.txt ./1.txt

實際上使用xargs默認的空白分隔符也是可以的  find . -name "*.txt"  | xargs  echo   因爲換行符也是xargs的默認空白符的一種。find命令如果不加-print0其搜索結果的每一條字符串後面實際上是加了換行

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章