PHP正則表達式模式修正符

PHP正則表達式 /i, /is, /s, /isU等 都是些什麼東西呢?

1、正則表達式運算順序
( ) 圓括號因爲是內存處理所以最高
* ? + { } 重複匹配內容其次
^ $ \b 邊界處理第三
條件處理第四
最後按照運算順序計算匹配
2、正則表達式模式修正符
i 正則內容在匹配時候不區分大小寫(默認是區分的)
m 在匹配首內容或者尾內容時候採用多行識別匹配
S 將轉義回車取消是爲單行匹配如. 匹配的時候
x 忽略正則中的空白
A 強制從頭開始匹配
D 強制$匹配尾部無任何內容 \n
U 禁止貪婪匹配 只跟蹤到最近的一個匹配符並結束,
常用在採集程序上的正則表達式
i 匹配大小寫

s 模式中的圓點元字符(.)匹配所有的字符,包括換行符

x 模式中的空白字符除了被轉義的或在字符類中的以外完全被忽略,在未轉義的字符類之外的 # 以及下一個換行符之間的所有字符,包括兩 頭,也都被忽略

A (PCRE_ANCHORED) 如果設定了此修正符,模式被強制爲“anchored”,即強制僅從目標字符串的開頭開始匹配即自動在模式開頭加上^。

D (PCRE_DOLLAR_ENDONLY) 如果設定了此修正符,模式中的美元元字符僅匹配目標字符串的結尾。沒有此選項時,如果最後一個字符是換行符的話,美元符號也會匹配此字符之前(但不會匹配 任何其它換行符之前)。如果設定了 m 修正符則忽略此選項。Perl 中沒有與其等價的修正符。  S 當一個模式將被使用若干次時,爲加速匹配起見值得先對其進行分析。如果設定了此修正符則會進行額外的分析。目前,分析一個模式僅對沒有單一固定起始字符的 non-anchored 模式有用。

U (PCRE_UNGREEDY) 本修正符反轉了匹配數量的值使其不是默認的重複,而變成在後面跟上“?”才變得重複。這和 Perl 不兼容。也可以通過在模式之中設定 (?U) 修正符來啓用此選項。

X (PCRE_EXTRA) 此 修正符啓用了一個 PCRE 中與 Perl 不兼容的額外功能。模式中的任何反斜線後面跟上一個沒有特殊意義的字母導致一個錯誤,從而保留此組合以備將 來擴充。默認情況下,和 Perl 一樣,一個反斜線後面跟一個沒有特殊意義的字母被當成該字母本身。當前沒有其它特性受此修正符控制。即:貪婪模式,最 大限度匹配 如:/a[\w]+?e/U匹配abceadeddd中的abceade而不是abce,如果不加U修正,則匹配abce  u (PCRE_UTF8) 此修正符啓用了一個 PCRE 中與 Perl 不兼容的額外功能。模式字符串被當成 UTF-8。本修正符在 Unix 下自 PHP 4.1.0 起可用,在 win32 下自 PHP 4.2.3 起可用。

<?php

echo '<pre>';

$str = '<ul>hello world<li>hi</li><li>hello</li></ul>';

$pattern = '~<li>.*</li>~';

preg_match($pattern,$str,$matches);

var_dump($matches);


$pattern1 = '~<li>.*?</li>~';

preg_match($pattern1,$str,$matches1);

var_dump($matches1);


$pattern2 = '~<li>.*</li>~U';

preg_match($pattern2,$str,$matches2);

var_dump($matches2);


$pattern3 = '~<li>.*?</li>~U';

preg_match($pattern3,$str,$matches3);

var_dump($matches3);


事實證明,加了U,原來是貪婪匹配的變成非貪婪匹配,非貪婪匹配的卻變成了貪婪匹配。
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章