速查筆記(Linux Shell編程<上>)

 

零、shell中的內部變量:


1.    $?:    表示shell命令的返回值.
2.    $$:    表示當前shell的pid.
3.    $!:    最後一個放入後臺作業的PID值.
4.    $0:    表示腳本的名字.
5.    $1--$9,${10}: 表示腳本的第一到九個參數,和第十個參數.
6.    $#:    表示參數的個數.
7.    $*,$@: 表示所有的參數. 
       兩者的區別如下: //都是雙引號惹的禍^-^
       /> set 'apple pie' pears peaches
       /> for i in $*
       >  do
       >  echo $i
       >  done
       apple
       pie
       pears
       peaches
    
       /> set 'apple pie' pears peaches
       /> for i in $@
       >  do
       >  echo $i
       >  done
       apple
       pie
       pears
       peaches
    
       /> set 'apple pie' pears peaches
       /> for i in "$*"
       >  do
       >  echo $i
       >  done
       apple pie pears    peaches
    
       /> set 'apple pie' pears peaches
       /> for i in "$@"
       >  do
       >  echo $i
       >  done
       apple pie    //這裏的單引號將兩個單詞合成一個.
       pears
       peaches

 

一、正則表達式在vi中的用法:


1.    ^:      如/^love,表示所有以love開頭的行.
2.    $:      如/love$,表示所有以love結尾的行.
3.    .:       如/l..e, dot表示任意字符,如love,l22e,live等.
4.    *:      如/*love, *表示0多多個字符,這裏表示love前面可以有0個多任意多個空格字符,如/go*gle,可以表示ggle,gogle,google,goooooooogle.
5.    []:     如/[Ll]ove,[]中的任意一個字符都可能成爲候選者,如Love和love.
6.    [x-y]: 如/[A-Z]t, 表示[]中指定範圍內的字符都可能成爲候選者,如At, It等, 也可表示多個區間段如:[a-zA-TV-Z]表示所有除V之外的所有大小寫英文字符.
7.    [^]:   如/[^A-Z]ove,表示A-Z之內的任意字符都是非法的, 如Love,Dove等.
8.    \:      轉義符,    如果想表示任何meta字符的原義, 需使用在meta字符前加轉義符\, 如\.將只表示dot,而不能在表示任何其他字符了.
9.    \<:    如/\<love, 表示任何單詞的開始, 如love和lover, 但是glove將非法.
10.  \>:   如/love\>, 表示任何單詞的結束, 如love和glove, 但是lover將非法.
11.  \(..\):      如/\(love\)able/\1rs/, 這裏的\1表示love, 這種標籤替代最多達到\9, 該例子表示用lovers代替loveable.
12.  x\{m\}:   如x\{5\}, 表示x被重複5次,如xxxxx.
13.  x\{m,\}:  如x\{5,\}, 表示x被至少重複5次,如xxxxx,xxxxxxxx.
14.  x\{m,n\}:如x\{5,10\}, 表示x被重複5-10次,如xxxxx,xxxxxxxx.
以下爲grep的正則表示式用法:
15.  \w和\W: 等同於[a-zA-Z0-9].
16.  \b: 等同於\<和\>,均表示單詞的邊界.
以下爲grep的正則表示式的擴展用法(grep -E或egrep):
17.  +:   如/lo+ve, +表示1個或者多個先前的字符,這裏表示love,loove,但是lve非法.
18.  ?:   如/lo?ve, ?表示0個或者1個先前的字符, 這裏只表示love和lve.
19.  (a|b|c):  如/l(o|i)ve, 表示或的意思,這裏表示love和live. (o|i)和[oi]的主要區別就是(word|word)可以表示單詞之間或的關係,[]只能表示字符.
20.  x{m},x{m,},x{m,n}  等同於grep普通模式中的x\{m\},x\{m,\},x\{m,n\}.

 

二、grep家族:


1.    家族成員:
       egrep: 執行帶有擴展正則表達式元字符的grep搜索.
       fgrep:  將關閉grep的所有正則功能, 即搜索字符串中所有正則元字符都將只是表示其字符本意.
2.    返回值: 
       0: 表示成功
       1: 表示搜索字符串不存在
       2: 表示搜索文件不存在.    
3.    grep的選項規則:
       -#,-A#和-B#: 表示在輸出匹配內容的時候同時也輸出其上下指定數量的行數, 如grep -2 "love" *, 該例輸出匹配love的上下兩行, 
       grep -A2 "love" * 該例輸出匹配love的後兩行, grep -B2 "love" * 該例輸出匹配love的前兩行. 這裏A表示after,B表示before.
       -F: 等同於fgrep, 這個選項將關閉所有正則功能,即所有正則的元字符均表示其本身含義.
       -c: 不輸出找到的內容,只是輸出在該文件中有多少匹配的行數.
       -h: 不輸出匹配搜索字符串的文件的文件名,只是輸出內容.
       -i:  搜索時忽略大小寫.
       -l:  只顯示匹配搜索內容的文件名, 不顯示具體的內容.
       -L: 只顯示沒有包含搜索內容的文件名.
       -n: 輸出匹配內容的同時也輸出其所在的行號.
       -v: 反向搜索,輸出不匹配搜索字符串的行.
       -w:只打印以完整單詞形式匹配的行, 如果該搜索字符爲某個單詞的部分內容,將不會被輸出.
       -x: 只打印以行形式匹配的行, 如果該搜索字符爲行的部分內容,將不會被輸出.
       -q: 不會輸出任何信息, 該選項主要用於測試某個搜索字符或搜索pattern在執行grep命令之後的返回值.
       -r: 表示遞歸的搜索當前目錄的子目錄中的文件.  
4.    對於普通模式的grep,如果搜索的字符中普通字符前面加入\,則該字符按照擴展grep(egrep或者grep -E)的正則規則進行查找.如grep "love\|live" filename, 
       將等同於egrep "love|live" filename,這裏的\|將按照egrep中的|元字符處理, 再如, egrep "3+" filename等同於grep "3\+" filename.

 

三、sed:


1.    sed命令:
       ,:  表示範圍.
       1) sed -n '/west/,/east/p' datafile 表示打印所有從包含west開始到包含east的行,如果直到文件的結尾都沒有包含east的行,將打印west後面的所有行.
           其實邏輯很簡單, 就是sed在發現包含west行之後開發打印該行,直到發現包含east的行打印才結束,否則一直打印直到文件的末尾.
       2) sed -n '5,/^northeast/p' datafile 表示從第五行開始打印,直到遇到以northeast開始的行結束打印.
        
       !:  表示對匹配結果取反.
       1) sed '/north/!d' datafile 將刪除所有不包含north的行.

       a: 追加命令.
       1) sed '/^north/a first line \
           second line \
           third line' datafile 將會在所有包含north行的後面追加first line \r second line \n third line. 其中\表示下一行還有內容的連詞. 如果是c-shell:
           sed '/^north/a first line \\
           second line \\
           third line' datafile 其中多出來的\是轉義符.
        
       d: 表示刪除.
       1) sed '/north/d' datafile 將刪除所有包含north的行.
       2) sed '3d' datafile    將刪除第三行.
       3) sed '3,$d' datafile    將刪除第三行到文件的結尾行.
       4) sed 'd' datafile 將刪除所有行.
        
       e: 表示多點編輯.
       1) sed -e '1,3d' -e 's/Hemenway/Jones/' datafile    一個sed語句執行多條編輯命令, 因此命令的順序會影響其最終結果.
       2) sed -e 's/Hemenway/Jones/' -e 's/Jones/Max/' datafile 先用Jones替換Hemenway, 再用Max替換Jones.

       h和g/G: 保持和獲取命令.
       1) sed -e '/northeast/h' -e '$G' datafile sed將把所有包含northeast的行輪流緩存到其內部緩衝區, 最後將只是保留最後一個匹配的行, 
           $G是將緩衝區的行輸出到$G匹配行的後面, 該例表示將最後一個包含northeast的行追加到文件的末尾.
       2) sed -e '/WE/{h; d;}' -e '/CT/{G;}' datafile 表示將包含WE的行保存到緩衝區, 然後刪除該行,最後將緩衝區中保存的那份輸出到CT行的後面.
       3) sed -e '/northeast/h' -e '$g' datafile 表示將包含northeast的行保存到緩衝區, 再將緩衝區中保存的那份替換文件的最後一行並輸出.
           再與h合用時, g表示替換, G表示追加到匹配行後面.
       4) sed -e '/WE/{h; d;}' -e '/CT/{g;}' datafile 保留包含WE的行到緩衝區, 如果有新的匹配行出現將會替換上一個存在緩衝區中的行, 如果此時發現有
           包含CT的行出現, 就用緩衝區中的當前行替換這個匹配CT的行, 之後如果有新的WE出現, 將會用該新行替換緩衝區中數據, 當前再次遇到CT的時候,將用最
           新的緩衝區數據替換該CT行.
    
       i: 表示插入.
       1) sed '/north/i first line \
           second line \
           third line' datafile    其規則和a命令基本相同, 只是a是將額外的信息輸出到匹配行的後面, i是將額外信息輸出到匹配行的前面.
        
       p: 表示打印.
       1) sed '/north/p' datafile 將打印所有包含north的行.
       2) sed '3p' datafile    將打印第三行.
       3) sed '3,$p' datafile    將打印第三行到文件的結尾行.
       4) sed 'p' datafile 將打印所有行.
       注: 使用p的時候sed將會輸出指定打印的行和所有行, 當其與-n選項組合時候,將只是打印輸出匹配的行.
        
       n: 下一行命令.
       1) sed '/north/ {n; s/Chin/Joseph/}' datafile 將先定位包含north的行, 然後取其下一行作爲目標行, 再在該目標行上執行s/Chin/Joseph/的替換操作.
       2) sed '/north/ {n; n; s/Chin/Joseph/}' datafile 將取north包含行的後兩行作爲目標行.
       注: {}作爲嵌入的腳本執行.
        
       q: 退出命令.
       1) sed '5q' datafile 到第五行退出(輸出第五行).
       2) sed '/north/q' datafile 輸出到包含north的行退出(輸出包含north的行).
       3) sed '/Lewis/ {s/Lewis/Joseph/; q}' datafile 將先定位包含Lewis的行, 然後用Joseph替換Lewis,最後退出sed操作.
        
       r: 文件讀入.
       1) sed '/Suan/r newfile' datafile    在輸出時,將newfile的文件內容跟隨在datafile中包含Suan的行後面輸出,如果多行都包含Suan,則文件被多次輸出.
    
       s: 表示替換.
       1) sed 's/west/north/g' datafile    將所有west替換爲north, g表示如果一行之內多次出現west,將全部替換, 如果沒有g命令,將只是替換該行的第一個匹配.
       2) sed -n 's/^west/north/p' datafile    將所有以west開頭的行替換爲north, 同時只是輸出替換匹配的行.
       3) sed -n '1,5 s/\(Mar\)got/\1ianne/p' datafile    將從第一行到第五行中所有的Margot替換爲Marianne, \1是\(Mar\)的變量替代符.
        
       w: 文件寫入.
       1) sed -n '/north/w newfile2' datafile    將datafile中所有包含north的行都寫入到newfile2中.
        
       x: 互換命令.
       1) sed -e '/pat/h' -e '/Margot/x' datafile x命令表示當定位到包含Margot行,互換緩衝區和該匹配Margot行的數據, 即緩衝區中的數據替換該匹配行顯示, 
           該匹配行進入緩衝區, 如果在交換時緩衝區是空, 則該匹配行被換入緩衝區, 空行將替換該行顯示, 後面依此類推. 如果交換後, 再次出現匹配pat的行, 該
           行將仍然會按照h命令的規則替換(不是交換, 交換隻是發生在發現匹配Margot的時候)緩衝區中的數據.
    
       y: 變形命令.
       1) sed '1,3y/abcd/ABCD/' datafile 將1到3行中的小寫abcd對應者替換爲ABCD,注意abcd和ABCD是一一對應的. 如果他們的長度不匹配,sed將報錯.
       2) sed 'y/abcdefghijklmnopqrstuvwxyz/ABCDEFGHIJKLMNOPQRSTUVWXYZ/' datafile 將datafile中所有的小寫字符替換爲大寫字母.


四、awk家族:


1.    執行方式:
      1) awk 'pattern' filename 如awk '/Mary/' employees
      2) awk '{action}' filename 如awk '{print $1}' employees
      3) awk 'pattern {action}' filename 如awk '/Mary/ {print $1}' employees 
      注: 模式/Mary/對action的作用範圍是從其後面的第一個左花括號開始,到第一個右花括號結束. 其後的pattern將不會影響前面的action.
    
2.    內置變量:
       $0:    表示一整行(相當於數據庫中一條記錄).
       NR:    當前行號.
       NF:    當前記錄的域(相當於數據庫中的字段)數量
       RS:    行分隔符(缺省爲回車).
       FS:    域分隔符,缺省爲\t. awk -F: '{print $1,$2,$3}' employees 這裏FS等於":".
       OFS:輸出域分隔符, awk  -F: '{print $1,$2,$3}' employees 這裏OFS等於" "空格, 因爲在$1和$2之間是空格分開的.
       ARGC: 命令行參數的數量.
       ARGV: 命令行參數數組.
       ENVIRON: 從shell傳遞來的包含當前環境變量的數組.
       ERRNO: 錯誤號.
       FILENAME: 當前的輸入文件名.
    
3.    格式化輸出:
       轉義碼:
       \b:    Backspace.
       \n:    換行.
       \r:    回車.
       \t:    製表符.    
    
       格式化說明符:
       %c:    單個ASCII字符.
       %d:    十進制數字.
       %e:    科學記數法表示的數字.
       %f:    浮點數.
       %o:    八進制數字.
       %s:    打印字符串.
       %x:    十六進制數字.
       -:    表示左對齊,如%-15d, 在十進制數字的後面會有一些空格,同時該數字是左對齊的. %+15d或%15d表示右對齊,當數字不足15位的時候.
       #:    如%#o或%#x, 會在八進制的數字前面加入0,十六進制前加0x.

4.    操作符:
       ~:    匹配運算符. 如awk '$1~/Mary/' employees, 表示第一個域($1)中包含Mary的被打印, 如果其他域包含,第一個域沒有,則仍然視爲無效.
       !~:    不匹配運算符. 如awk '$1!~/Mary/' employees, 表示第一個域($1)中不包含Mary的被打印, 如果其他域包含,第一個域沒有,則仍然視爲有效.
       <,>,<=,>=,!=,==: 關係運算符. awk '$3>5000 {print $3}' datafile
       cond ? expr1 : expr2 條件表達式 awk '{max = $1 > $2 ? $1 : $2; print max}' datafile
       =,+=,-=,*=,/=,%=: 賦值運算符.
       -,+,*,/,%,^(x^y[乘方]): 數學運算符.
       &&, ||, !: 邏輯運算符.
       ,: 表示範圍, awk '/Tom/,/Mary/' datafile 其規則可參照sed中逗號運算符.
    
5.    選項:
       -F:    指定特定的分隔符,而不是缺省的\t, 如-F:,這裏分隔符是":".    

6.    awk編程:
       1) BEGIN: 其後緊跟着動作塊, 該塊將會在任何輸入文件被讀入之前執行, 如一些初始化工作, 或者打印一些輸出標題.
       awk 'BEGIN{FS=":"; OFS="\t";ORS="\n\n"} {print $1,$2,$3}' file
       即使輸入文件不存在, BEGIN塊動作仍然會被執行.
        
       2) END: 其後也緊隨動作塊, 該動作模塊將在整個輸入文件處理完畢之後被處理, 但是END需要有文件名的輸入.
       awk 'END {print "The end\n"} filename.
        
       3) 輸入輸出重新定向:
       awk 'BEGIN {print "Hello" > "newfile"}' datafile 文件名一定要用雙引號擴起來, > 如果文件存在,則清空後重寫新文件.
       awk 'BEGIN {print "Hello" >> "newfile"}' datafile 文件名一定要用雙引號擴起來, > 如果文件存在, 則在文件末尾追加寫入.
       awk 'BEGIN {getline name < "/dev/tty"; print name}' getline是awk的內置函數, 就像c語言的gets, 將輸入賦值給name變量.
        
       4) system函數可以執行shell中的命令,這些命令必須用雙引號擴起.
       awk 'END { system("clear"); system ("cat " FILENAME)}' filename
        
       5) 條件語句:
       if (expr) { stat; } else { stat; }
       if (expr) { stat; } else if { stat; } else { stat; }
       awk '{ if ($7 <= 2) { print "less than 2", $7 } else if ($7 <= 4) { print "less than 4", $7 } else { print "the others", $7 } }' datafile
        
       6) 循環語句:
       while (expr) { stat; }
       for (i = 1; i <= NF; i++) { stat; }
       break;
       continue;
       exit(exitcode);    awk 將退出. 退出後的$?將會是這裏的exitcode.
       next; 讀取下一條記錄. awk '{ if ($7 == 3) { next } else { print $0 }}' datafile 將不會輸出$7等於3的記錄.
        
       7) 數組:
       awk的數組和pl/sql中數組有些類似, 都是通過哈希表來實現的,其下標可以是數字, 也可以是字符串.
       awk '{name[x++]=$3};END{for(i = 0; i < NR; i++) { print i, name[i]}}' employees
       awk '{id[NR]=$3};END{for (x = 1; x <= NR; x++) { print id[x]} }' employees
       awk '/^Tom/{name[NR]=$1}; END{for (i in name) { print name[i]}}' employees 特殊的for語句
       awk '/Tom/{count["tom"]++}; /Mary/{count["mary"]++}; END{print "count[tom] = ",count["tom"]; print "count[mary] = ", count["mary"]}' employees
       awk '{count[$2]++};END{for (name in count) {print name,count[name]}}' datafile 域變量也可以作爲數組的下標.

7.    內置函數:
       1) sub/gsub(regexp, substitution string, [target string]); gsub和sub的差別是sub只是替換每條記錄中第一個匹配正則的, gsub則替換該記錄中所有匹配
       正則的, 就是vi中s/src/dest/ 和s/src/dest/g的區別, 如果target string沒有輸入, 其缺省值是$0.
       awk '{sub(/Tom/,"Thomas"); print}' employees
       awk '{sub(/Tom/,"Thomas",$1); print}' employees
        
       awk '{gsub(/Tom/,"Thomas"); print}' employees
       awk '{gsub(/Tom/,"Thomas",$1); print}' employees
        
       2) index(string ,substring) 返回子字符串第一次被匹配的位置(1開始)
       awk 'BEGIN{print index("hollow", "low") }'
        
       3) length(string) 返回字符串的長度.
       awk 'BEGIN{print length("hello")}'
        
       4) substr(string, starting position, [length])
       awk 'BEGIN{print substr("Santa Claus",7,6)}'
       awk 'BEGIN{print substr("Santa Claus",7)}'
        
       5) match(string, regexp) 返回正則表示在string中的位置, 沒有定位返回0
       awk 'BEGIN{print match("Good ole USA",/[A-Z]+$/)}'

       6) toupper(string)和tolower(string) 僅僅gawk有效.
       awk 'BEGIN{print toupper("linux"), tolower("BASH")}'

       7) split(string, array, [field seperator]) 如果不輸入field seperator, FS內置變量作爲其缺省值.
       awk 'BEGIN{split("12/24/99",date,"/"); for (i in date) {print date[i]} }'
        
       8) variable = sprintf(format, ...) 和printf的最大區別就是他返回格式化後的字符串.
       awk '{line = sprintf("%-15s %6.2f ",$5,$6); print line}' datafile
        
       9) systime() 返回1970/1/1到當前時間的整秒數.
        
       10) variable = strftime(format, [timestamp])
        
       11) 數學函數: atan2(x,y), cos(x), exp(x)[求冪], int(x)[求整數], log(x), rand()[隨機數], sin(x), sqrt(x), srand(x)

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章