1.條件判斷

if語句格式：{if(表達式) {語句；語句；...}}

統計系統用戶數

0-10001系統用戶，大於1000普通用戶

#awk -F: '{if($3>0 && $3<1000){count++;}} END{print count}' /etc/passwd

記住：awk是逐行處理。所以對每一行進行判斷處理後進行加1操作。

打印普通用戶

[root@bigdata3 dan_test]# awk -F : '{if($3 >1000){print $1}}' /etc/passwd

統計普通用戶數

[root@bigdata3 dan_test]# awk -F : '{if($3 >1000){ i++}} END{print i}' /etc/passwd

if ...else 語句格式：{if(表達式) {語句；語句；...} else{語句；語句；...}}

#awk -F：'{if ($3 == 0){print $1} else {print $7}}' /etc/passwd
#awk -F：'{if ($3 == 0){count++} else {i++}}' /etc/passwd
#awk -F：'{if ($3 == 0){count++} else {i++}} END{print "管理員個數："count;print"系統用戶數:"i }' /etc/passwd

統計普通用戶個數，系統用戶個數，管理員的個數

[root@bigdata3 dan_test]# awk -F : '{if($3==0){i++} else if($3>0 && $3<100){j++} else if($3>1000){k++}} END{print "管理員用戶數："i;print"系統用戶數："j;print"普通用戶數"k}' /etc/passwd

2.循環

2.1 for循環C風格for

[root@bigdata3 dan_test]# awk 'BEGIN{for(i=1;i<5;i++){print i}}'

[root@bigdata3 dan_test]# awk -F: '{for(i=1;i<=5;i++){print $0}}' awk.txt

cat awk.txt

dandan:dandan1

[root@bigdata3 dan_test]# awk -F: '{for(i=1;i<=NF;i++){print $i}}' awk.txt

NF:表示列的個數

2.2 whiel循環

cat password

[root@bigdata3 dan_test]# awk -F : '/^root/{i=1;while(i<8){print $i;i++}}' password

[root@bigdata3 dan_test]# awk -F : '{i=1;while(i<NF){print $i;i++}}' password

解釋：是針對每一行，循環該行按照：切割後的次數，並將該字段打印出來。

主要理解點：針對每一行進行循環，理解的時候注意對awk的工作原理的理解

[root@bigdata3 dan_test]# awk -F : '{i=1;while(i<10){print $0;i++}}' password

表示將每行打印10次

cat b.txt

[root@bigdata3 dan_test]# awk '{i=1;while(i<=NF){print $i;i++}}' b.txt

實際上是對每行的內容進行遍歷

awk默認分割是對空行的分割

（1）對每一行進行循環，第一行循環2次，分別打印每個字段
（2）第二行循環3次，分別打印每個字段
（3）第三行循環4次，分別打印每個字段

因此實際上是對每行內容的遍歷

3. awk數組

數組：存儲一系列相同類型的元素，健/值方式存儲，通過下標（健）來訪問值。awk中數組稱爲關聯數組，不僅可以使用數字作爲下標，還可以使用字符串作爲下標。數組元素的鍵和值存儲在 awk 程序內部的一個表中，該表採用散列算法，因此數組元素是隨機排

序。

數組格式：array[index]=value

數據準備：

[root@bigdata3 dan_test]# tail -n5 /etc/passwd

[root@bigdata3 dan_test]# tail -n5 /etc/passwd | awk -F: '{username[++i]=$1} END{print username[i]}'

分析：該數組定義是將每行的第一個字段賦值給數組username,此時i沒操作一次進行加一，到最後打印的是行處理結束時所賦值的字段，由於只有5行，所以打印username[5] flume。END是行處理完了才執行。

注意：++i數組的下標是先從1開始，i++數組的下標是先從0開始。

那麼如果想打印數組中每個元素呢？此時需要for循環在END語句中進行遍歷

[root@bigdata3 dan_test]# tail -n5 /etc/passwd | awk -F: '{username[++i]=$1} END{for (i in username){print username[i],i}}'

下標從i++開始注意變化：

[root@bigdata3 dan_test]# tail -n5 /etc/passwd | awk -F: '{username[i++]=$1} END{for (i in username){print username[i],i}}'

統計/etc/passwd下各類型shell的數量

cat /etc/shell

[root@bigdata3 dan_test]# awk -F: '{shells[$NF]++} END{for(i in shells){print i,shells[i]}}' /etc/passwd

知識點準備：

（1）數組默認初始值是0
（2）a[i]++表示對數組元素值自加
（3）shells[$NF]:表示把每行的最後一個字段作爲索引，同時其值自加

推理過程：

shell[/bin/bash]：當讀取第一行數據時候遇到/bin/bash此時其數組對應的值加一，數組值爲1
當讀取第二行數據遇到/sbin/nologin，此時shell[/sbin/nologin]其對應的數組值加一，數組值爲1
當讀取第三行數據時，遇到/bin/bash，數組值shell[/bin/bash]加一，此時對應值爲2
當讀取第四行數據時，遇到/sbin/nologin，此時shell[/sbin/nologin]其對應的數組值加一，數組值爲2
......
依次類推
最終直到所有的行被讀完，數組中保存的累計值就爲該字符串索引出現的次數
推理時候一定要聯想讀取數據是一行一行處理和一般數組區別開來。
遍歷最終結果的時候，類似於數學中的反函數，可以把字符串作爲索引的這類數組問題理解爲反函數。這樣給字符串統計帶來了方便，即awk中shell[字符串]++這樣的數組用來統計某個文件中字符串出現的次數。也就是你想統計誰，讓誰作爲索引然後循環遍歷就可以了。

統計 TCP 連接狀態

[root@bigdata3 dan_test]# netstat -antp |awk '/^tcp/{a[$6]++}END{for(v in a)print a[v],v}'

打印/etc/services出現次數大於等於 2 的

[root@bigdata3 dan_test]# tail /etc/services |awk '{a[$1]++}END{for(v in a) if(a[v]>=2){print a[v],v}}'

awk腳本編程實例講解（判斷，循環，數組）

1.條件判斷

2.循環

2.1 for循環C風格for

2.2 whiel循環

3. awk數組

Hive-SQL面試題2詳解（窗口函數作爲輔助列在計算中的應用）

Oozie任務調度阻塞及內存優化方法

一文帶你讀懂Hbase概念、架構及原理

Hive-SQL工作中常用函數總結及案例實戰

Redis集羣刪除後重建後報：unrecoverable erro:corrupted cluster config file）錯誤解決方案

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結