Shell筆記——命令:Sort,uniq,join,cut,paste,split

原文地址：Shell筆記——命令:Sort,uniq,join,cut,paste,split作者：fengpiaoxue

轉自：http://blog.csdn.net/wklken/article/details/6562098

Sort,uniq,join,cut,paste,split

命令—— Sort

Sort 可將許多不同的域按不同的列順序分類

命令格式：

sort –cmu –o out-putfile [other options] *pos1 *pos2 input-files

選項：

-c 測試文件是否已經分類

-m 合併兩個分類文件

-u 刪除所有複製行

-o 存儲 sort 結果的輸出文件名

-b 使用域進行分類是，忽略首個空格

-n 指定分類是域上數字分類

-t 域分隔符；用非空個或者 tab 鍵分割域

-r 對分類次序或比較求逆

+n n 爲域號，使用此域開始分類

n n 爲域號，在分類比較時忽略此域，一般與 +n 一起使用

post m,n 傳遞到 m,n ， m 爲域號， n 爲開始分類字符數

示例 :

1. 保存輸出

$sort –o result sortfile

$sort sortfile > result

Sort 的啓動方式， sort 認爲一空格 / 多空格爲分隔符，要加入其他的，必須使用 -t ，執行時，先查看 -t, 若是有，使用其進行分割，若是無，使用空格

2. 查看文件是否已排序

$sort –c sortfile

3. 使用其他分隔符

$sort –t : sortfile

4. 排完序後求逆

$sort –t : -r sortfile

5. 唯一分類，原文件中重複行去除

$sort –u sortfile

6. 指定分類域， 1 開始

$sort –t : -k 4 sortfile

$sort –t : -k 4 –k 1 sortfile

7. 指定 sort 序列

$sort +0 -2 +3 sortfile

8. 將兩個分類文件合併

$sort –m sorted-file1 sorted_file2

命令—— uniq

Uniq 從文本文件中去除或禁止重複行，一般 uniq 假定文件已分類排序，並且結果正確 [sort –u 唯一性選項去除所有的重複行 ]

Uniq 中重複行指持續不斷重複出現的行

格式 :uniq –udc –f input-file output-file

選項：

-u 只顯示不重複行

-d 只顯示有重複的行，每種重複顯示一行

-c 打印每一重複行出現的次數

-f n 爲數字，前 n 個域被忽略

1. 只顯示非重複行

$uniq –u sortfile

2. 提取非重複行到某個文件

$uniq –u sortfile result

3. 只顯示重複行

$uniq –d sortfile

4. 打印重複行及其出現的次數

$uniq –c sortfile

5. 忽略比較指定列

$uniq –f2 parts.txt

命令—— join

將來自兩個分類文本文件的行連在一起

前提： file1,file2 已分類

每個文件都有一些元素與另一文件相關——連

有點像求並集

注： joio 時文本域要少於 20=

格式： join [options] input-file input-file2

選項：

an n 爲數字，用於連接時從文件 n 中顯示不匹配行 ,-a1 表示第一個文件的不匹配行

o n,m n 爲文件號， m 爲域號， 1,3 表示只顯示文件 1 的第三域

j n m n 爲文件號， m 爲域使用其他域做連接域

t 域分隔符用來設置非空格 / 非 tab 分隔符

1. 連接兩個文件 [ 默認連接域爲域 0]

$Join name.txt. turn.txt

2. 顯示第一個文件的不匹配行

$join –a1 name.txt town.txt

3. 設置顯示連接結果

$join –o 1.1,2.2 name.txt town.txt

第一個文件第一個域和第二個文件第二個域作爲顯示結果

4. 設置連接域

$join –j 1 3 –j 2 2 file1 file2

命令—— cut

用來從標準輸入或文本文件中剪切列或域

可將剪切到的文本貼到另一個文件中

格式 :cut [options] file1 file2

選項：

-c list 指定剪切字符數

-f field 指定剪切域數

-d 指定與空格 /tab 不同的分隔符

-c 指定剪切的字符範圍，字符，如 -c 1,5,7 第 1,5,6,7 字符 -c 1-50 前 50 個字符

-f 指定剪切的域範圍 -f 1,5 剪切 1,5 兩個域 -f 1,10-12 剪切 1,10,11,12 四個域

1. 使用域分隔符

$cut –d : -f3 data

[root@localhost temp]# cut -d: -f1 /etc/passwd |head -5
root
bin
daemon
adm
lp

–d : 指示cut改用：爲分隔符，-f1表示第一個字段意思。

2. 剪切指定域

$cut –d : -f1,3 data ##表示取出各行第一及第三個字段意思

3. 剪切字符

$who –u | cut –c 1-8

[root@localhost temp]# who -u
root     tty1         2011-10-19 22:09 old         2463 (:0)
root     pts/0        2011-11-04 08:48   .          7804 (192.168.0.86)
root     pts/2        2011-10-31 09:25 old        18934 (:0.0)
root     pts/3        2011-10-31 09:47 old        18934 (:0.0)
[root@localhost temp]# who -u |cut -c 1-8
root
root
root
root

命令： paste

Paste 將數據貼到相關文件中

存在兩個不同來源數據應先分類，確保文件行數同

格式 :paste –d –s file1 file2

選項：

-d 指定不同分隔符

-s 將每個文件合併成行而不是按行黏貼

File1

File2

1. 合併之

$paste file1 file2

1 A

2 B

2. 指定分隔符

$paste –d: file2 file1

A:1

B:2

3. 合併兩行，而非按行黏貼

$paste –s file1 file2

命令： split

用來將文件切分爲小文件

格式： split –output_file_size input_filename output_filename

其中 out_file_size 爲被分割行數，默認 1000

Shell筆記——命令:Sort,uniq,join,cut,paste,split

Ansible安裝docker以及docker-compose

Linux系統Centos7搭建Sentinel

RabbitMQ 使用問題總結

DELL服務器iDRAC批量管理工具介紹——RACADM

Django入門課程一

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結