PHP正則表達式 /i, /is, /s, /isU等參數含義詳解

i: 表示in-casesensitive,即大小寫不敏感
s: PCRE_DOTALL,表示點號可以匹配換行符。
U: 表示PCRE_UNGREEDY,表示非貪婪,相當於perl/python語言的.*?,在匹配過程中,對於.*正則,一有匹配立即執行,而不是等.*消費了所有字符再一一回退。

PHP正則表達式模式後面通常帶有 /i, /is, /s, /isU等參數,那麼這都是些什麼東西呢?下面我們一起來看看:

i 匹配大小寫

s 模式中的圓點元字符(.)匹配所有的字符,包括換行符

x 模式中的空白字符除了被轉義的或在字符類中的以外完全被忽略,在未轉義的字符類之外的 # 以及下一個換行符之間的所有字符,包括兩頭,也都被忽略

A (PCRE_ANCHORED) 如果設定了此修正符,模式被強制爲“anchored”,即強制僅從目標字符串的開頭開始匹配即自動在模式開頭加上^。

D (PCRE_DOLLAR_ENDONLY) 如果設定了此修正符,模式中的美元元字符僅匹配目標字符串的結尾。沒有此選項時,如果最後一個字符是換行符的話,美元符號也會匹配此字符之前(但不會匹配任何其它換行符之前)。如果設定了 m 修正符則忽略此選項。Perl 中沒有與其等價的修正符。 S 當一個模式將被使用若干次時,爲加速匹配起見值得先對其進行分析。如果設定了此修正符則會進行額外的分析。目前,分析一個模式僅對沒有單一固定起始字符的 non-anchored 模式有用。

U (PCRE_UNGREEDY) 本修正符反轉了匹配數量的值使其不是默認的重複,而變成在後面跟上“?”才變得重複。這和 Perl 不兼容。也可以通過在模式之中設定 (?U) 修正符來啓用此選項。

X (PCRE_EXTRA) 此 修正符啓用了一個 PCRE 中與 Perl 不兼容的額外功能。模式中的任何反斜線後面跟上一個沒有特殊意義的字母導致一個錯誤,從而保留此組合以備將 來擴充。默認情況下,和 Perl 一樣,一個反斜線後面跟一個沒有特殊意義的字母被當成該字母本身。當前沒有其它特性受此修正符控制。即:貪婪模式,最 大限度匹配如:/a[/w]+?e/U匹配abceadeddd中的abceade而不是abce,如果不加U修正,則匹配abce u (PCRE_UTF8) 此修正符啓用了一個 PCRE 中與 Perl 不兼容的額外功能。模式字符串被當成 UTF-8。本修正符在 Unix 下自 PHP 4.1.0 起可用,在 win32 下自 PHP 4.2.3 起可用。

模式修正符
模式修正符 -- 解說正則表達式模式中使用的修正符
說明
  下面列出了當前在 PCRE 中可能使用的修正符。括號中是這些修正符的內部 PCRE 名。修正符中的空格和換行被忽略,其它字符會導致錯誤。

i (PCRE_CASELESS)
  如果設定此修正符,模式中的字符將同時匹配大小寫字母。

m(PCRE_MULTILINE)
  默認情況下,PCRE 將目標字符串作爲單一的一“行”字符所組成的(甚至其中包含有換行符也是如此)。“行起始”元字符(^)僅僅匹配字符串的起始,“行結束”元字符($)僅僅匹配字符串的結束,或者最後一個字符是換行符時其前面(除非設定了 D 修正符)。這和 Perl 是一樣的。

  當設定了此修正符,“行起始”和“行結束”除了匹配整個字符串開頭和結束外,還分別匹配其中的換行符的之後和之前。這和 Perl 的 /m 修正符是等效的。如果目標字符串中沒有“\n”字符或者模式中沒有 ^ 或 $,則設定此修正符沒有任何效果。

s(PCRE_DOTALL)
  如果設定了此修正符,模式中的圓點元字符(.)匹配所有的字符,包括換行符。沒有此設定的話,則不包括換行符。這和 Perl 的 /s 修正符是等效的。排除字符類例如 [^a] 總是匹配換行符的,無論是否設定了此修正符。

x(PCRE_EXTENDED)
  如果設定了此修正符,模式中的空白字符除了被轉義的或在字符類中 的以外完全被忽略,在未轉義的字符類之外的 # 以及下一個換行符之間的所有字符,包括兩頭,也都被忽略。這和 Perl 的 /x 修正符是等效的,使得可以在複雜的模式中加入註釋。然而注意,這僅適用於數據字符。空白字符可能永遠不會出現於模式中的特殊字符序列,例如引入條件子模式的序列 (?( 中間。

e
  如果設定了此修正符,preg_replace() 在替換字符串中對逆向引用作正常的替換,將其作爲 PHP 代碼求值,並用其結果來替換所搜索的字符串。

  只有 preg_replace() 使用此修正符,其它 PCRE 函數將忽略之。

  注: 本修正符在 PHP3 中不可用。

A(PCRE_ANCHORED)
  如果設定了此修正符,模式被強制爲“anchored”,即強制僅從目標字符串的開頭開始匹配。此效果也可以通過適當的模式本身來實現(在 Perl 中實現的唯一方法)。

D(PCRE_DOLLAR_ENDONLY)
  如果設定了此修正符,模式中的美元元字符僅匹配目標字符串的結尾。沒有此選項時,如果  最後一個字符是換行符的話,美元符號也會匹配此字符之前(但不會匹配任何其它換行符之前)。如果設定了 m 修正符則忽略此選項。Perl 中沒有與其等價的修正符。

S
  當一個模式將被使用若干次時,爲加速匹配起見值得先對其進行分析。如果設定了此修正符則會進行額外的分析。目前,分析一個模式僅對沒有單一固定起始字符的 non-anchored 模式有用。

U(PCRE_UNGREEDY)
  本修正符反轉了匹配數量的值使其不是默認的重複,而變成在後面跟上“?”才變得重複。這和 Perl 不兼容。也可以通過在模式之中設定 (?U) 修正符或者在數量符之後跟一個問號(如 .*?)來啓用此選項。

X(PCRE_EXTRA)
  此修正符啓用了一個 PCRE 中與 Perl 不兼容的額外功能。模式中的任何反斜線後面跟上一個沒有特殊意義的字母導致一個錯誤,從而保留此組合以備將來擴充。默認情況下,和 Perl 一樣,一個反斜線後面跟一個沒有特殊意義的字母被當成該字母本身。當前沒有其它特性受此修正符控制。

u(PCRE_UTF8)
  此修正符啓用了一個 PCRE 中與 Perl 不兼容的額外功能。模式字符串被當成 UTF-8。本修正符在 Unix 下自 PHP 4.1.0 起可用,在 win32 下自 PHP 4.2.3 起可用。自 PHP 4.3.5 起開始檢查模式的 UTF-8 合法性。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章