正则表达式回溯规则与问号（懒惰量词）的使用

原創

wangxiaopang1003

2018-08-25 09:47

问题描述：

匹配一对标记<p>和</p>以及二者之间的所有文本。

<p>
    The very .......beginning of a parapraph.
</p>
<p>
    Then you have to find the end of the paragraph
</p>

解决方案：

<p>.*?</p>

不正确的：

<p>.*</p>     少了一个问号

理由：

在匹配了目标文本中的第一个 <p>之后，引擎会达到 <  .* > 。*号会匹配到文本结束的所有内容。当< .* >把肚子吃饱后，引擎才会试图去匹配目标文本末尾的 '<' 。引擎回溯，在文本的最后一个位置，显然会失败，如果失败，那么引擎会再一次回溯，在文本的倒数第二个字符处尝试匹配 '<'。这个过程会一直继续，直到匹配 '<'成功。如果一直没有匹配到，那么最终 <.*>会用完所有回溯位置，然后整个匹配宣布失败。

如果在整个回溯过程中'<'匹配到了，那么接着尝试匹配</>，如果匹配失败，引擎会接着进行回溯，直到</p>整个被匹配到。最后匹配到的是整个内容。从后往前推。

在其后放一个问题来使任何量词变成懒惰量词，如 <*? > 、<+?>、<??>、<{7，42}?>,一个懒惰量词会重复尽可能少的次数。从前往后推。

<*>最长可能的匹配。

<*?>最短可能的匹配。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

「游记」2024 吉林省赛和 2024 东北四省赛

Before 本文是 \(2024\) 中國大學生程序設計競賽全國邀請賽（長春）暨第 \(17\) 屆吉林省大學生設計競賽和新建比賽的遊記寫的很爛寫的很爛寫的很爛 Day0 省賽報到及熱身賽。 \(14：00\) 前報到。 \(12：

2024-05-18 14:35:35

Qt/C++音视频开发74-合并标签图形/生成yolo运算结果图形/文字和图形合并成一个/水印滤镜

一、前言在使用yolo做人工智能運算後，運算結果除了一個方框，還可能需要增加文字顯示在對應方框上，以便標記是何種物體，比如顯示是人還是動物，或者還有可能追蹤人員，顯示該人員的姓名。這種應用場景非常普遍，而且非常有必要，可以非常直觀的直接看

2024-05-18 14:35:25

WPS技巧——MARK住

一、如何對一列數據進行相同操作，比如全都添加雙引號 https://www.jiachong.com/wps/340708.html 1.首先打開表格,按Ctrl+C複製第一個單元格內容, 2.然後把複製的單元格內容按Ctrl+V粘貼到與其

2024-05-18 14:34:35

LightDB通过金融信创生态实验室测试

　　恆生電子LightDB順利通過了金融信創生態實驗室的產品測試，本次測試基於典型金融業務場景並在國產硬件環境中進行，經過測試，LightDB在產品性能、功能性、兼容性以及可靠性等多個維度100%符合金融業務系統，表現優異。　　在本

2024-05-18 14:32:25

国产数据库金融行业实践者：LightDB通过强制性国家标准GB18030-2022最高级别认证

　　8月1日，強制性國家標準GB 18030-2022《信息技術中文編碼字符集》實施。10月09日，恆生電子LightDB正式通過中國電子技術標準化研究院強制性國家標準GB18030-2022《信息技術中文編碼字符集》最高級（實現級別

2024-05-18 14:32:25

记一次asp.net 8 服务器爆满的解决过程

1.描述一下服務器配置: 一臺2c4g的centos,做api接口反代一臺8c16g的windows 2019 作爲實際服務器,跑了iis,sql server,mongodb,redis 2.業務描述 2.0 服務器分爲兩個站

2024-05-18 14:26:04

一次nginx文件打开数的问题排查处理

現象：nginx域名配置合併之後，發現consul-template無法完成nginx重載，然後發現需要重啓nginx，才能讓配置生效。注意：下次哪個服務有報錯，就看重啓時所有日誌輸出，各種情況日誌輸出。不要忽略細節。很多時候其實已經

2024-05-18 14:17:33

docker 运行minio standalone模式

sudo docker run -it -d --name minio_latest -p 9000:9000 -p 9001:9001 -v /minio/data:/data -e MINIO_ROOT_USER="賬號" -e MIN

2024-05-18 14:15:13

HTML 09 - Quotations

Quotations in HTML allow you to include and format quoted text within your web content. HTML provides tags such as <bl

2024-05-18 14:14:12

HTML 10 - Comments

HTML Comments are used to comment in HTML codes, so the developer can understand the purpose of that code section and it

2024-05-18 14:14:12

Nginx R31 doc 官方文档-01-nginx 如何安装

從 Ubuntu 存儲庫安裝預構建的 Ubuntu 包更新 Ubuntu 存儲庫信息： sudo apt-get update 安裝包： sudo apt-get install nginx 驗證安裝： sudo ngin

2024-05-18 14:01:41

Android 15 的新功能与适配

前臺服務變化前臺服務一直是比較損耗電池壽命的操作，在 Android 15 Beta 2 裏，**dataSync 和 mediaProcessing 的前臺服務類型現在有大約 6 小時的超時時間**，之後系統將調用 Android 15

2024-05-18 14:00:31

高薪线下周末班马上开班，手把手带你提升职业技能

管理學大師彼得·德魯克說“終身學習是現在社會的生存法則”，而現實中，很少有人能清醒地意識到這一點，人們總是習慣在舒適區兜圈，重複做已經掌握的事情，對真正需要突破的職業困境視而不見。偶爾看到同事跳槽漲薪，技術越來越嫺熟，自己也期望着可以跟他

霍格沃茲測試學院

2024-05-18 13:54:11

提升团队生产力：2024年必知的一体化协同办公平台

本文介紹的主流一體化協同辦公平臺有：Worktile、PingCode、Microsoft Teams、釘釘、Google Workspace、Jive、Avaya、Bitrix24、Asana、ClickUp、飛書。在現代工作環

2024-05-18 13:54:00

Mono 支持LoongArch架构

近期，著名的.NET開源社區Mono正式支持LoongArch（龍架構），目前LoongArch64架構已出現在.NET社區主幹分支上。詳細內容可以跟蹤 https://github.com/mono/mono/issues/21381,

2024-05-18 13:53:40

24小時熱門文章

最新文章

最新評論文章