Linux 常用文本命令總結

原創

2020-02-22 07:45

查看端口占用情況

netstat -tuanp

centos6 linux禁用IPv6，解決大量 TIME_WAIT ::ffff:127.0.0.1:59299

沒設置好很多服務無法訪問

http://www.qbage.com/post/48-centos6-disable-ipv6.html

linux shell 用sed命令在文本的行尾或行首添加字符

http://www.cnblogs.com/aaronwxb/archive/2011/08/19/2145364.html

jq : Linux下json的命令行工具

http://blog.chinaunix.net/uid-24774106-id-3830242.html

文本處理

linux 多行轉換爲單行每5行合併成一行

awk '{if(NR%5) {ORS=""} else {ORS="\n\n"};print;}'

建立索引

awk 'NR==FNR { a[$2]=$1; next } {{printf $1} for(i=2;i<=NF;i++) { printf " "a[$i]" "} {print ""} } ' deerwester.txt company >company_index

變量自增

i=`expr $i + 1`

sed 文件的一行
content =`sed -n "${i},${dd}p" user_index_Inverseindex`

awk \t , 分割。for 變量處理 $i 字段
echo $content |awk 'BEGIN{FS="[\t =,]"}{for(i=2;i<NF;i++) {printf " "$i" "} print " "}' >>red_index

awk多文件輸出

awk '{ if(NF==3)print $0 > 1;else print $0 > 2 }' 0

6 隨機數

在BEGIN模塊設定隨機數種子srand()，在逐行讀取文件的模塊輸出隨機數rand()。

其中rand()的大小在(0,1)之間。

[python]view
plaincopy

awk -F"\t" 'BEGIN{  

    srand();  

}{    

    value=int(rand()*100);  

    print value  

    if(value<=10)  

        print value"\t"NR  

}'

注意,srand()需要寫在BEGIN模塊，才能正常產生隨機數，這是awk的工作機制決定的。

假設 a.txt 包括 a, c, b 三行。假設 b.txt 包括 d, e, c, b 四行。

交集，把兩個文件放到一起排序，只輸出次數多於一次的項：
$ sort a.txt b.txt | uniq -d
b
c

求一個文件的差集（A-B）

[root@rhlei aaa]# cat a
1
2
3
4
[root@rhlei aaa]# cat b
2
4
5
6
[root@rhlei aaa]# sort a b |uniq -u
1
3
5
6
[root@rhlei aaa]# sort a b b |uniq -u
1
3

並集，把兩個文件放到一起排序，重複的項只算一次：
$ sort a.txt b.txt | uniq
a
b
c
d
e

差集(A-B)，把B的元素重複2份和A的元素放到一起排序，只輸出出現一次的項：
$ sort a.txt b.txt b.txt | uniq -u
a

對稱差，把兩個文件放到一起排序，只輸出出現一次的項：
$ sort a.txt b.txt | uniq -u
a
d
e

bash script: find max, group by and sort by column

http://stackoverflow.com/questions/15397205/bash-script-find-max-group-by-and-sort-by-column

且聽風雨999

發佈了101 篇原創文章 · 獲贊 39 · 訪問量 40萬+

私信關注

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

Linux 常用文本命令總結

centos6 linux禁用IPv6，解決大量 TIME_WAIT ::ffff:127.0.0.1:59299

bash script: find max, group by and sort by column

lightdb hash index的性能和限制

Linux下常用文本處理命令

hadoop 2.2 錯誤總結

solr 使用

gbdt 資料

Hadoop安裝 SSH無密碼驗證登錄

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結

Linux 常用文本命令 總結

centos6 linux禁用IPv6，解決大量 TIME_WAIT ::ffff:127.0.0.1:59299

Linux 常用文本命令總結