馬哥2019linux文本工具使用及正則表達式(包括擴展)(已更完)

視頻地址:https://www.bilibili.com/video/av33607474?from=search&seid=5154656399870843571

筆記摘要:

grep、sed、awk介紹;正則表達式的字符、次數、錨定 、分組的用法及實例;拓展正則表達式。
正則表達式匹配圖詳見 https://blog.csdn.net/qq_40993864/article/details/104486953

1 gerp

1.1語法

grep [-abcEFGhHilLnqrsvVwxy][-A<顯示列數>][-B<顯示列數>][-C<顯示列數>][-d<進行動作>][-e<範本樣式>][-f<範本文件>][--help][範本樣式][文件或目錄...]

1.2參數:
常用:
在這裏插入圖片描述

完整:

     -a 或 --text : 不要忽略二進制的數據。
    -A<顯示行數> 或 --after-context=<顯示行數> : 除了顯示符合範本樣式的那一列之外,並顯示該行之後的內容。
    -b 或 --byte-offset : 在顯示符合樣式的那一行之前,標示出該行第一個字符的編號。
    -B<顯示行數> 或 --before-context=<顯示行數> : 除了顯示符合樣式的那一行之外,並顯示該行之前的內容。
    -c 或 --count : 計算符合樣式的列數。
    -C<顯示行數> 或 --context=<顯示行數>或-<顯示行數> : 除了顯示符合樣式的那一行之外,並顯示該行之前後的內容。
    -d <動作> 或 --directories=<動作> : 當指定要查找的是目錄而非文件時,必須使用這項參數,否則grep指令將回報信息並停止動作。
    -e<範本樣式> 或 --regexp=<範本樣式> : 指定字符串做爲查找文件內容的樣式。
    -E 或 --extended-regexp : 將樣式爲延伸的正則表達式來使用。
    -f<規則文件> 或 --file=<規則文件> : 指定規則文件,其內容含有一個或多個規則樣式,讓grep查找符合規則條件的文件內容,格式爲每行一個規則樣式。
    -F 或 --fixed-regexp : 將樣式視爲固定字符串的列表。
    -G 或 --basic-regexp : 將樣式視爲普通的表示法來使用。
    -h 或 --no-filename : 在顯示符合樣式的那一行之前,不標示該行所屬的文件名稱。
    -H 或 --with-filename : 在顯示符合樣式的那一行之前,表示該行所屬的文件名稱。
    -i 或 --ignore-case : 忽略字符大小寫的差別。
    -l 或 --file-with-matches : 列出文件內容符合指定的樣式的文件名稱。
    -L 或 --files-without-match : 列出文件內容不符合指定的樣式的文件名稱。
    -n 或 --line-number : 在顯示符合樣式的那一行之前,標示出該行的列數編號。
    -o 或 --only-matching : 只顯示匹配PATTERN 部分。
    -q 或 --quiet或--silent : 不顯示任何信息。
    -r 或 --recursive : 此參數的效果和指定"-d recurse"參數相同。
    -s 或 --no-messages : 不顯示錯誤信息。
    -v 或 --revert-match : 顯示不包含匹配文本的所有行。
    -V 或 --version : 顯示版本信息。
    -w 或 --word-regexp : 只顯示全字符合的列。
    -x --line-regexp : 只顯示全列符合的列。
    -y : 此參數的效果和指定"-i"參數相同。 

1.3實例

理論:

用途 指令
從文件內容查找匹配指定字符串的行 $ grep “被查找的字符串” 文件名
從文件內容查找與正則表達式匹配的行 $ grep –e “正則表達式” 文件名
查找時不區分大小寫 $ grep –i “被查找的字符串” 文件名
查找匹配的行數 $ grep -c “被查找的字符串” 文件名
從文件內容查找不匹配指定字符串的行 $ grep –v “被查找的字符串” 文件名
從根目錄開始查找所有擴展名爲 .log 的文本文件,並找出包含 “ERROR” 的行 $ find / -type f -name “*.log”
例子:從當前目錄開始查找所有擴展名爲 .in 的文本文件,並找出包含 “thermcontact” 的行 find . -name “*.in” rgs 管道符grep “thermcontact”

實例:

grep -q “root” /etc/passwd
echo $?  #-q靜默無輸出,使用echo $?,爲0表示有輸出
#上述的代餐,常用來判斷命令執行成功與否:
grep -q "root" /etc/passwd &> /dev/null

nmap:網絡掃描工具

搜尋網段內存活的主機思路:
#1 nmap搜尋網段 
nmap -V  -sP ip網段

#2 過濾host is up 的上一行得到ip地址
nmap -V  -sP ip網段 | grep -B1 "Host is up"

# 3 八過濾的結果寫在自定義文件裏,沒有這步也ok
nmap -V  -sP ip網段 | grep -B1 "Host is up" > nmap.log

# 4 截取第五列
cat nmap.log | grep report | cut -d " " -f5
過濾:
#且:
grep root /etc/passwd | grep bash
#二者都支持的多個過濾 語法相同
# 或:
grep -e root -e bash -e shutdown /etc/passwd 

# grep -f 相當於grep -e 
比如 h.txt裏有 root bash 兩個關鍵字,執行
grep -f h.txt /etc/passwd
效果就是過濾出/etc/passwd裏有root或bash的字段

2 sed

語法

sed [-hnV][-e<script>][-f<script文件>][文本文件]

參數說明:

-e<script>或--expression=<script> 以選項中指定的script來處理輸入的文本文件。
-f<script文件>或--file=<script文件> 以選項中指定的script文件來處理輸入的文本文件。
-h或--help 顯示幫助。
-n或--quiet或--silent 僅顯示script處理後的結果。
-V或--version 顯示版本信息。

動作說明:

a :新增, a 的後面可以接字串,而這些字串會在新的一行出現(目前的下一行)~
c :取代, c 的後面可以接字串,這些字串可以取代 n1,n2 之間的行!
d :刪除,因爲是刪除啊,所以 d 後面通常不接任何咚咚;
i :插入, i 的後面可以接字串,而這些字串會在新的一行出現(目前的上一行);
p :打印,亦即將某個選擇的數據印出。通常 p 會與參數 sed -n 一起運行~
s :取代,可以直接進行取代的工作哩!通常這個 s 的動作可以搭配正規表示法!例如 1,20s/old/new/g 就是啦! 

詳情:https://blog.csdn.net/qq_40993864/article/details/104661496

3 awk

語法

awk [選項參數] 'script' var=value file(s)
或
awk [選項參數] -f scriptfile var=value file(s)

選項參數說明:

-F fs or --field-separator fs
指定輸入文件折分隔符,fs是一個字符串或者是一個正則表達式,如-F:。
-v var=value or --asign var=value
賦值一個用戶定義變量。
-f scripfile or --file scriptfile
從腳本文件中讀取awk命令。
-mf nnn and -mr nnn
對nnn值設置內在限制,-mf選項限制分配給nnn的最大塊數目;-mr選項限制記錄的最大數目。這兩個功能是Bell實驗室版awk的擴展功能,在標準awk中不適用。
-W compact or --compat, -W traditional or --traditional
在兼容模式下運行awk。所以gawk的行爲和標準的awk完全一樣,所有的awk擴展都被忽略。
-W copyleft or --copyleft, -W copyright or --copyright
打印簡短的版權信息。
-W help or --help, -W usage or --usage
打印全部awk選項和每個選項的簡短說明。
-W lint or --lint
打印不能向傳統unix平臺移植的結構的警告。
-W lint-old or --lint-old
打印關於不能向傳統unix平臺移植的結構的警告。
-W posix
打開兼容模式。但有以下限制,不識別:/x、函數關鍵字、func、換碼序列以及當fs是一個空格時,將新行作爲一個域分隔符;操作符**和**=不能代替^和^=;fflush無效。
-W re-interval or --re-inerval
允許間隔正則表達式的使用,參考(grep中的Posix字符類),如括號表達式[[:alpha:]]。
-W source program-text or --source program-text
使用program-text作爲源代碼,可與-f命令混用。
-W version or --version
打印bug報告信息的版本。

詳情: https://www.runoob.com/linux/linux-comm-awk.html

4 正則表達式

4.1定義及名詞解釋

在這裏插入圖片描述

4.2字符匹配

在這裏插入圖片描述

# 過濾三個字符的文件 .表示任意一個字符
ls | grep -w "..."

# 過濾三個字符的文件,整行只有三個字符

# 過濾三個字符的文件,中間是. 要用轉義字符\
ls | grep -w ".\.."

4.3 次數匹配

在這裏插入圖片描述

# 匹配a開頭 c結尾 中間爲a-z的任意字符
grep "a[a-z]c"

# 儘可能多的匹配
grep "a[a-z]*c"

#一旦匹配則不繼續,只出現一次,非貪婪模式或懶惰模式
grep "a[a-z]\?c"
# 過濾ip地址
grep "[0-9.]\{7,\}"
grep "[0-9.]\{7,\}" | head -n1
grep -o "[[:digit]]\{1,3\}[.] 再重複三次"

#進階寫法 (考慮合法地址)
grep "inet [0-9.]\+"
grep "inet [0-9.]\+" | cut -d" " -f2  #只截取ip地址
# 過濾分區利用率
df | grep "/dev/sd" |grep -o "[0-9]\{1,3\}%"
df | grep "/dev/sd" |grep -o "[0-9]\{1,3\}%"|grep -o "[0-9]\+" #只要數字
df | grep "/dev/sd" |grep -o "[0-9]\{1,3\}%"|grep -o "[0-9]\+"| sort -nr | head -n1  #數字排序後截取第一個

4.4 位置錨定

在這裏插入圖片描述

#行首
grep "^root" /etc/passwd  #root開頭的行
grep -v "^root" /etc/passwd #非root開頭的行
grep -v "^root" /etc/passwd |grep -v "^$" #非root開頭的行且開頭不爲空 $表空行

#行尾
grep "^bash" /etc/passwd  #bash結尾的行

#空行
grep -v "^[[:space:]]*$" #過濾空格或tab鍵開頭的行

#單詞
grep -w "\<root"  #過濾root爲詞首的字符
grep -w "root\>"  #過濾root爲詞尾的字符
grep -w "\<root\>" #過濾root這整個單詞

4.5 分組

在這裏插入圖片描述

#字符捆綁整體處理
grep "\(root\)\{3\}" #過濾出現了3次的root

grep "\(hhh\)\{3\}.*\(zzz\)\+\1.*\2" #\1 和\2分別表示第一、第二個(),同理多個小括號按順序排序就可以 \1  \2  \3 \4 ......

#分組可嵌套

#後向引用:引用前面的分組括號中的模式所匹配的字符,而非模式本身
eg:
echo roothhrbbt | grep '\(r..t\).*\1' 
#無輸出結果,因爲後向引用
echo roothhroot | grep '\(r..t\).*\1'
有輸出結果爲:roothhroot

#前後必須是相同的字符
grep "^\(.*\).*\1$" /etc/passwd
grep "^\(.*\):.*/\1$"/etc/passwd  #:後開頭  和\後結尾的字符相同
針對類似於bash:x:506:508::home/bash:/bin/bash

grep "^a\|^b.*" #表a開頭後面不管或b開頭後面隨意,輸出的是a,bxxxxxxx
grep "^\(a\|b\).*" #輸出的是a或b開頭的行
grep "^[ab]"#輸出的是a或b開頭的行

5 擴展正則表達式

5.1egrep及擴展正則表達式

在這裏插入圖片描述

5.2擴展正則表達式次數匹配

在這裏插入圖片描述

5.3位置錨定

在這裏插入圖片描述

5.4 分組

在這裏插入圖片描述

6練習題(無答案)

在這裏插入圖片描述在這裏插入圖片描述

#1

#2

#3
echo /etc/rc.d/init.d/functions |grep -Eo "[^/]*$"
echo /etc/rc.d/init.d/functions |grep -Eo "[^/]*/?$" #/?表/可有可無
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章