不排序去除文件中的重複行轉

原創

2018-12-02 21:12

awk ' !x[$0]++' file3

簡要解釋一下，awk 的基本執行流程是，對文件的每一行，做一個指定的邏輯判斷，如果邏輯判斷成立，則執行指定的命令；如果邏輯判斷不成立，則直接跳過這一行。

我們這裏寫的 awk 命令是 !x[$0]++，意思是，首先創建一個 map 叫 x，然後用當前行的全文 $0 作爲 map 的 key，到 map 中查找相應的 value，如果沒找到，則整個表達式的值爲真，可以執行之後的語句；如果找到了，則表達式的值爲假，跳過這一行。由於表達式之後有 ++，因此如果某個 key 找不到對應的 value，該 ++ 操作會先把對應的 value 設成 0，然後再自增成 1，這樣下次再遇到重複的行的時候，對應的 key 就能找到一個非 0 的 value 了。

我們前面說過，awk 的流程是先判斷表達式，表達式爲真的時候就執行語句，可是我們前面寫的這個 awk 命令裏只有表達式，沒有語句，那我們執行什麼呢？原來，當語句被省略的時候，awk 就執行默認的語句，即打印整個完整的當前行。就這樣，我們通過這個非常簡短的 awk 命令實現了去除重複行並保留原有文件順序的功能。

寫入其他文件

awk ' !x[$0]++' file3 > file4

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

LINUX中查看端口與相應進程

LINUX中查看端口與相應進程 Standard 本文介紹了在 Linux 中查看端口占用情況的一些方法。全程需要用到下列程序： netstat：一個命令行工具，用來顯示網絡連接，路由表，和一些網絡接口數據 fuser：一

FlyingStudio_CUMT

2020-07-07 04:17:12

linux rm刪除文件原理

很多時候，我們都會發現，某個進程在對當前文件讀寫，但是我們依然能夠rm，是不是很奇怪？而windows下面，肯定會報錯，”當前文件正在被使用“，這就得從linux下面刪除文件的原理說起了。　　　　　　 Linux是通過link的

2020-07-07 11:32:21

常用轉義符，makedown通用

ACSII常用轉義符[1]，makedown通用參考 [1]http://www.w3chtml.com/html/ref/ascii.html

2020-07-07 06:34:39

Linux環境下如何啓用 core dump生成core文件

Linux環境下進程發生異常而掛掉，通常很難查找原因，但是一般Linux內核給我們提供的核心文件，記錄了進程在崩潰時候的內存映像，當程序崩潰時，存儲內存的相應信息，主用用於對程序進行調試。但是生成core文件需要設置開關，具體步驟如下：

2020-07-06 22:03:09

Docker使用中積累的一些技巧

映射當前目錄的子目錄 -v `pwd`/data/namesrv/logs:/root/logs 例：>>echo `pwd`/data/namesrv/logs /opt/data/namesrv/logs 自動重啓 --r

2020-07-06 22:03:09

配置rsync服務端及2臺機器配置文件同步（Linux 實測通過）

（後面列一下我們用的sersync,使用sersync 大概628G 大小不一的圖片文件及文件夾，15個同步工作組線程，同步了13個小時，io 大概13到15 MB/s，大概1G一分鐘。剛開始10個同步工作組線程，速度很慢，增加了5個同

2020-07-06 15:23:44

打包mysql、tomcat、jdk爲一個軟件

打包mysql、tomcat、jdk爲一個軟件博客分類：成長中的點滴我們在本地開發web應用的時候，直接在IDE裏面就可以完成jdk、容器、數據庫的配置和集成。但是如果當我們把應用程序交付給用戶使用的

2020-07-05 13:54:32

安裝zend server 500錯誤internal server error

按照網上的說法吧亂碼改就行，改完還是照舊出錯。用DREAMWEAVER新建一個XML，打算複製粘貼過去存個新文件然後刪掉舊的，突然發現<?xml，再看我改的那個亂碼沒有問號，暈呀沒搞過XML不知道文件頭呀。

2020-07-05 12:32:45

Kerberos原理和使用

Kerberos原理Kerberos 服務是單點登錄系統，這意味着您對於每個會話只需向服務進行一次自我驗證，即可自動保護該會話過程中所有後續事務的安全

2020-07-05 00:58:08

filebeat將日誌輸入到elasticsearch

filebeat安裝配置官網直接從官網下載到本地配置filebeat.yml文件最基礎配置,更多詳細配置，根據實際情況而定 - type: log # 將false改成ture，否則filebeat不生效 e

2020-07-04 23:46:53

centos7.5 安裝 redis5.0.5

服務器環境：CentOS Linux release 7.5.1804 redis版本：5.0.5 [root@localhost ~]# tar -zxvf redis-5.0.5.tar.gz [root@localhost

2020-07-04 23:46:53

centos7.5安裝Elasticsearch，Kibana，Logstash

環境要求： # jdk 最低版本是8 java -version echo $JAVA_HOME # 操作系統：centos7 bash-4.2$ cat /etc/centos-release CentOS Linux rel

2020-07-04 23:46:53

centos7 開發環境搭建

vm fusion必看文檔更改root密碼 passwd 遠程連接 # PermitRootLogin yes 警號去掉，重啓network vi /etc/ssh/sshd_config /etc/rc.d/init.d/n

2020-07-04 23:46:53

Linux下Jboss部署

jboss web 2.1.9GA 安裝步驟 jboss web採用tomcat作爲基礎進行了優化，默認增加了apr功能，提高併發性能。安裝和部署流程同tomcat。在安裝前需安裝jdk1.6及以上版本。 1.下載最新的jbos

2020-07-04 10:42:54

Linux下ftp安裝及使用

1、查詢是否安裝vsftpd: rpm -qa |grep vsftpd 或者查詢當前ftp進程：ps -ef|grep vsftpd 已安裝顯示未安裝顯示 2、下載vsftpd地址: http://rpmfind.net/lin

2020-07-04 10:42:54

24小時熱門文章

Python 潮流週刊#52：Python 處理 Excel 的資源

最新文章

最新評論文章