关于awk多文件处理

原創

zxdave

2019-04-07 14:06

关于awk的多文件处理
########################

awk的数据输入有两个来源，标准输入和文件，后一种方式支持多个文件。

如：
1. shell的Pathname Expansion方式：

awk '{...}' *.txt
# *.txt先被shell解释，替换成当前目录下的所有*.txt

2. 直接指定多个文件：

awk '{...}' a.txt b.txt c.txt ...
# awk对多文件的处理流程是，依次读取各个文件内容，如上例，先读a.txt，再读b.txt....

在多文件处理的时候，如何对不同文件做不同的操作呢？

########################
# 处理 2 个文件
########################

当awk读取的文件只有两个的时候，比较常用的有两种方法：

(1) 一种是
awk 'NR==FNR{...}NR>FNR{...}' file1 file2
或
awk 'NR==FNR{...}NR!=FNR{...}' file1 file2

(2) 另一种是 awk 'NR==FNR{...;next}{...}' file1 file2

FNR和NR这两个awk内置变量的意义
FNR The input record number in the current input file. #已读入当前文件的记录数

NR The total number of input records seen so far. #已读入的总记录数

next    Stop processing the current input record. The next input record is
        read and processing starts over with the first pattern in the AWK
        program. If the end of the input data is reached, the END block(s),
        if any, are executed.

awk 'NR==FNR{...}NR>FNR{...}' file1 file2
# 读入file1的时候，已读入file1的记录数FNR一定等于awk已读入的总记录数NR，因为file1是awk读入的首个文件，故读入file1时执行前一个命令块{...}
# 读入file2的时候，已读入的总记录数NR一定>读入file2的记录数FNR，故读入file2时执行后一个命令块{...}

awk 'NR==FNR{...;next}{...}' file1 file2
# 读入file1时，满足NR==FNR，先执行前一个命令块，但因为其中有next命令，故后一个命令块{...}是不会执行的
# 读入file2时，不满足NR==FNR，前一个命令块{..}不会执行，只执行后一个命令块{...}

########################
# 处理多个文件
########################

当awk处理的文件超过两个时，显然上面那种方法就不适用了。因为读第3个文件或以上时，也满足NR>FNR (NR!=FNR)，显然无法区分开来，所以就要用到更通用的方法了：

1. ARGIND # 当前被处理参数标志

awk 'ARGIND==1{...}ARGIND==2{...}ARGIND==3{...}... ' file1 file2 file3 ...复制代码

2. ARGV # 命令行参数数组

awk 'FILENAME==ARGV[1]{...}FILENAME==ARGV[2]{...}FILENAME==ARGV[3]{...}...' file1 file2 file3 ...复制代码

3. 把文件名直接加入判断

awk 'FILENAME=="file1"{...}FILENAME=="file2"{...}FILENAME=="file3"{...}...' file1 file2 file3 ...复制代码

############

案例１处理两个文件

############
# cat a
1:adf
2:adf
3:fds
4:vds
5:ldv
# cat b
a asd
b dfs
c sfd
d asd
e ldk
用b文件的第一个字段将a文件的第二个字段替换掉
# awk 'BEGIN{FS="[: ]+";OFS=":"}NR==FNR{a[k]=$1;k++;next}{print $1,a[i];i++}' b a
1:a
2:b
3:c
4:d
5:e

#########

案例２处理三个文件

#########
再加一文件c
# cat cone a234
two afd
three adsf
four adsf
five bsdf
将a,b,c三个文件的第一个字段提取出来，生成一个新文件
# awk 'BEGIN{FS="[: ]+";OFS=":"}ARGIND==1{a[i]=$1;i++;next}ARGIND==2{b[k]=$1;k++;next}{print a[v],b[n],$1;v++;n++}' a b c
1:a:one
2:b:two
3:c:three
4:d:four
5:e:five

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

关于awk多文件处理

iNeuOS工业互联网操作系统，增加电力IEC104协议

MySQL5.7 基於GTID的多源複製實踐

MySQL5.7 傳統複製和GTID複製間的在線互相切換

zabbix監控MySQL多實例實踐

shell編程中的變量擴展

awk 內置變量和函數

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結