文件的格式化与相关处理

1.格式化打印:printf

printf '打印格式'实际内容
参数:
\a	警告声音输出
\b	退格键(backspace)
\f	清除屏幕(form feed)
\n	输出新的一行
\r	就是enter
\t	水平的Tab
\v	垂直的Tab
\xNN	NN为两位数的数字,可以转换数字成为字符
c语言程序中
%ns	那个n是数字,s代表String,即多少个字符
%ni	n是数字,i代表integer,即多少整数字数
%N.nf	那个n与N都是数字,f代表floating(浮点),如果有小数字数。假设要10个位数,
但小数点有两位,即为%10.2f。
%s	代表一个不固定长度的字符串

2.awk:好用的数据处理工具

swk是一个非常棒的数据处理工具,相比于sed常常作用于一整行的处理,awk则比较倾向于将一行分成数个“字段”来处理。awk适合处理小型的数据处理。

awk '条件类型1{动作1} 条件类型2{动作2} ......'filename
awk 可以处理后续接的文件,也可以读取来自前个命令的standard output

awk主要是处理每一行的字段内的数据,而默认的字段的分隔符为空格键或tab键。

awk的逻辑运算符

>,<,>=,<=,==,!=

  • 所有awk的动作,即在{}内的动作,如果有需要多个命令辅助时可利用分号“;”间隔,或者直接以[enter]按键来隔开每个命令。
  • 逻辑运算中,如果是等于的情况,务必使用“==”!
  • 格式化输出时,在printf的格式设置中,务必加上\n,才能进行分析!
  • 与bash,shell的变量不同,在awk中,变量可以直接使用,不需加上$符号。

3文件比较工具

  • diff
    diff就是比较两个文件之间的区别的,以行为单位,一般是用在ascll纯文本的比较上,在同个文件或者软件的新旧版本上。
  • cmp
    cmp的用处没有diff那么广泛,主要也是用来比较两个文件,主要时利用“字节”单位去比较,因此主要比较二进制文件。
  • patch
    与diff有密不可分的关系。

文件打印准备:pr

在linux下打印纯文本,可以加标题,页码等,且标题中会有文件时间,文件名和页码三大项目。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章