sed 匹配最短模式的方法

原創

2020-06-19 18:48

目前爲止，我們只執行了簡單的字符串替換。雖然這很方便，但是我們還可以匹配規則表達式。例如，以下 sed 命令將匹配從 '<' 開始、到 '>' 結束、並且在其中包含任意數量字符的短語。下例將刪除該短語（用空字符串替換）：
　　$ sed -e 's/<.*>//g' myfile.html
　　這是要從文件除去 HTML 標記的第一個很好的 sed 腳本嘗試，但是由於規則表達式的特有規則，它不會很好地工作。原因何在？當 sed 試圖在行中匹配規則表達式時，它要在行中查找最長的匹配。在我的前一篇 sed 文章中，這不成問題，因爲我們使用的是 'd' 和 'p' 命令，這些命令總要刪除或打印整行。但是，在使用 's///' 命令時，確實有很大不同，因爲規則表達式匹配的整個部分將被目標字符串替換，或者，在本例中，被刪除。這意味着，上例將把下行：
　　<b>This</b> is what <b>I</b> meant.
　　變成：
　　meant.
　　我們要的不是這個，而是：
　　This is what I meant.

　　幸運的是，有一種簡便方法來糾正該問題。我們不輸入“'<' 字符後面跟有一些字符並以 '>' 字符結束”的規則表達式，而只需輸入一個“'<' 字符後面跟有任意數量非 '>' 字符並以 '>' 字符結束”的規則表達式。這將與最短、而不是最長的可能性匹配。

新命令如下：

　　$ sed -e 's/<[^>]*>//g' myfile.html
　　在上例中，'[^>]' 指定“非 '>'”字符，其後的 '*' 完成該表達式以表示“零或多個非 '>' 字符”。對幾個 html 文件測試該命令，將它們管道輸出到 "more"，然後仔細查看其結果。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

linux加載動態庫失敗

一般我們在Linux下執行某些外部程序的時候可能會提示找不到共享庫的錯誤, 比如: tmux: error while loading shared libraries: libevent-1.4.so.2: cannot open sha

2024-05-21 00:52:55

Shell/Python中的用戶名獲取

一、幾個基本概念登錄用戶（login user）：通過登錄方式進入系統的用戶，強調登錄身份。當前用戶（current user）：執行一個進程或者命令時所使用的用戶身份，強調執行身份。舉

2024-05-19 00:44:35

Linux中的tty和pts

一、幾個基本概念 tty（Teletypewriter）來源於“電傳打印機”，Linux系統中則是終端設備的統稱，同時也代指操作系統中支持終端設備的tty子系統。 console（控制檯）

2024-05-18 00:45:13

Netgear無線路由器漏洞復現（CVE-2019-20760）

漏洞概述漏洞服務： uhttpd 漏洞類型：遠程命令執行影響範圍： 1.0.4.26之前的NETGEAR R9000設備會受到身份驗證繞過的影響解決建議：更新版本漏洞復現操作環境： ubuntu:22.04 qemu-ve

2024-05-14 23:17:30

記一些CISP-PTE題目解析

0x01 命令執行直接payload: 127.0.0.1 &whoami，發現可以成功執行whoami命令然後ls ../ ，發現有個key.php文件嘗試用cat命令查看發現不行被攔截了。（其實題目過濾了常用的查看文件的命

2024-05-11 23:51:24

dolphinscheduler 之變量篇

場景：查詢數據表總數，然後根據總數判斷走哪個分支節點 1.將sql結果輸出到變量 2.分支判斷 3.輸出結果小結本文總結了DophineSheduler上下游任務之間參數傳遞的方法，並對其中的易錯點進行了梳理，同時給出了具體

2024-05-11 00:57:01

MySQL 通過 systemd 啓動時 hang 住了……

mysqld：哥，我起不來了…… 作者：賁紹華，愛可生研發中心工程師，負責項目的需求與維護工作。其他身份：柯基鏟屎官。愛可生開源社區出品，原創內容未經授權不得隨意使用，轉載請聯繫小編並註明來源。本文約 2100 字，預計閱讀需要 7

2024-05-10 00:35:39

windows開機自啓動bat文件

步驟： 1、win+R，打開運行，輸入“shell:startup”，打開Windows啓動文件夾 2、將.bat快捷文件粘貼到Windows啓動文件夾中 3、重啓電腦後，系統自啓動.bat文件

2024-05-08 21:56:26

[oeasy]python0015_鍵盤改造_將esc和capslock對調_hjkl_移動_雙手正位

鍵盤改造 🥋 回憶上次內容上次練習了複製粘貼按鍵作用 <kb

2024-05-06 11:45:36

WhaleScheduler爲銀行業全信創環境打造統一調度管理平臺解決方案

項目背景數字金融是數字經濟的重要支撐和驅動力。近年來，我國針對數字金融的發展政策頻頻出臺，《金融科技發展規劃（2022-2025年）》、《“十四五”數字經濟發展規劃》、《關於銀行業保險業數字化轉型的指導意見》、《金融標準化“十四五”

2024-04-19 21:18:25

這篇 DolphinScheduler on k8s 雲原生部署實踐，值得所有大數據人看！

在當前快速發展的技術格局中，企業尋求創新解決方案來簡化運營並提高效率成爲一種趨勢。 Apache DolphinScheduler作爲一個強大的工具，允許跨分佈式系統進行復雜的工作流任務調度。本文將深入探討如何將Apache Dolphin

2024-04-17 21:18:15

雲原生週刊：CNCF 2023 年度調查報告｜ 2024.4.15

開源項目推薦 highlight 該項目是一個開源全棧監控平臺。其功能包括錯誤監控、會話重放、日誌記錄、分佈式跟蹤等。 Helm Compose Helm Compose 是一個 helm 插件，用於在單個配置文件中管理一個或多個圖表的多個

2024-04-15 22:48:41

個人開發者，Spring Boot 項目如何部署

今天給大家分享一下，作爲個人開發者，Spring Boot 項目是如何部署的。環境介紹 Linux docker docker-compose 目錄結構 erwin-windrunner - backups - data - jars -

2024-04-14 21:17:25

Linux 運維高級指令03

Linux 運維高級指令03 hostname指令作用：操作服務器的主機名（讀取）. hostname 表示輸出完整的主機名。 hostname -f 表示輸出當前主機名中的FQDN（全限定域名）。

2024-04-12 10:50:26

從CVE復現看棧溢出漏洞利用

最近復現了兩個棧溢出漏洞的cve，分別是CVE-2017-9430和CVE-2017-13089，簡單記錄一下real wrold中的棧溢出漏洞學習。目前，棧溢出漏洞主要出現在iot固件中，linux下的已經很少了，所以這兩個洞都是17年，

2024-04-12 10:45:32

24小時熱門文章

最新文章

最新評論文章