正則表達式

JS的正則表達式

//校驗是否全由數字組成

function isDigit(s)    
{    
var patrn=/^[0-9]{1,20}$/;    
if (!patrn.exec(s)) return false    
return true    
}    



//校驗登錄名:只能輸入5-20個以字母開頭、可帶數字、“_”、“.”的字串
Java代碼 複製代碼
function isRegisterUserName(s)        
{        
var patrn=/^[a-zA-Z]{1}([a-zA-Z0-9]|[._]){4,19}$/;        
if (!patrn.exec(s)) return false    
return true    
}    

//校驗用戶姓名:只能輸入1-30個以字母開頭的字串
Java代碼 複製代碼
function isTrueName(s)        
{        
var patrn=/^[a-zA-Z]{1,30}$/;        
if (!patrn.exec(s)) return false    
return true    
}        
}}    
    
//校驗密碼:只能輸入6-20個字母、數字、下劃線        
<PRE class=java name="code">function isPasswd(s)        
{        
var patrn=/^(\w){6,20}$/;        
if (!patrn.exec(s)) return false    
return true    
}    
//校驗普通電話、傳真號碼:可以“+”開頭,除數字外,可含有“-”        
    
<PRE class=java name="code">function isTel(s)        
{        
//var patrn=/^[+]{0,1}(\d){1,3}[ ]?([-]?(\d){1,12})+$/;        
var patrn=/^[+]{0,1}(\d){1,3}[ ]?([-]?((\d)|[ ]){1,12})+$/;        
if (!patrn.exec(s)) return false    
return true    
}    
 
 
 
  1. //校驗郵政編碼        
        
    <PRE class=java name="code">function isPostalCode(s)        
    {        
    //var patrn=/^[a-zA-Z0-9]{3,12}$/;        
    var patrn=/^[a-zA-Z0-9 ]{3,12}$/;        
    if (!patrn.exec(s)) return false    
    return true    
    }    
//校驗搜索關鍵字        
    
<PRE class=java name="code">function isSearch(s)        
{        
var patrn=/^[^`~!@#$%^&*()+=|\\\][\]\{\}:;'\,.<>/?]{1}[^`~!@$%^&()+=|\\\]        
                [\]\{\}:;'\,.<>?]{0,19}$/;        
if (!patrn.exec(s)) return false    
return true    
}        
    
function isIP(s) //by zergling        
{        
var patrn=/^[0-9.]{1,20}$/;        
if (!patrn.exec(s)) return false    
return true    
}    
 
  
<SPAN style="FONT-SIZE: 18pt">正則表達式</SPAN>        
    
<PRE class=java name="code">"^\\d+$"  //非負整數(正整數 + 0)        
"^[0-9]*[1-9][0-9]*$"  //正整數        
"^((-\\d+)|(0+))$"  //非正整數(負整數 + 0)        
"^-[0-9]*[1-9][0-9]*$"  //負整數        
"^-?\\d+$"    //整數        
"^\\d+(\\.\\d+)?$"  //非負浮點數(正浮點數 + 0)        
"^(([0-9]+\\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\\.[0-9]+)|([0-9]*[1-9][0-9]*))$"         
//正浮點數        
"^((-\\d+(\\.\\d+)?)|(0+(\\.0+)?))$"  //非正浮點數(負浮點數 + 0)        
"^(-(([0-9]+\\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\\.[0-9]+)|([0-9]*[1-9][0-9]*)))$"         
//負浮點數        
"^(-?\\d+)(\\.\\d+)?$"  //浮點數        
"^[A-Za-z]+$"  //由26個英文字母組成的字符串        
"^[A-Z]+$"  //由26個英文字母的大寫組成的字符串        
"^[a-z]+$"  //由26個英文字母的小寫組成的字符串        
"^[A-Za-z0-9]+$"  //由數字和26個英文字母組成的字符串        
"^\\w+$"  //由數字、26個英文字母或者下劃線組成的字符串        
"^[\\w-]+(\\.[\\w-]+)*@[\\w-]+(\\.[\\w-]+)+$"    //email地址        
"^[a-zA-z]+://(\\w+(-\\w+)*)(\\.(\\w+(-\\w+)*))*(\\?\\S*)?$"  //url        
"^[A-Za-z0-9_]*$"    
 
  1. 簡單的說,正則表達式是一種可以用於模式匹配和替換的強有力的工具。其作用如下:   
  2.   
  3. 測試字符串的某個模式。例如,可以對一個輸入字符串進行測試,看在該字符串是否存在一個電話號碼模式或一個信用卡號碼模式。這稱爲數據有效性驗證。    
  4.   
  5. 替換文本。可以在文檔中使用一個正則表達式來標識特定文字,然後可以全部將其刪除,或者替換爲別的文字。    
  6.   
  7. 根據模式匹配從字符串中提取一個子字符串。可以用來在文本或輸入字段中查找特定文字。    
  8. 基本語法    
  9.   
  10.   
  11.   
  12. 在對正則表達式的功能和作用有了初步的瞭解之後,我們就來具體看一下正則表達式的語法格式。   
  13.   
  14.     
  15.   
  16. 正則表達式的形式一般如下:     
  17.   
  18.   
  19.   
  20. /love/  其中位於“/”定界符之間的部分就是將要在目標對象中進行匹配的模式。用戶只要把希望查找匹配對象的模式內容放入“/”定界符之間即可。爲了能夠使用戶更加靈活的定製模式內容,正則表達式提供了專門的“元字符”。所謂元字符就是指那些在正則表達式中具有特殊意義的專用字符,可以用來規定其前導字符(即位於元字符前面的字符)在目標對象中的出現模式。    
  21.   
  22. 較爲常用的元字符包括: “+”, “*”,以及 “?”。   
  23.   
  24.   
  25.   
  26. “+”元字符規定其前導字符必須在目標對象中連續出現一次或多次。   
  27.   
  28.   
  29.   
  30. “*”元字符規定其前導字符必須在目標對象中出現零次或連續多次。   
  31.   
  32.   
  33.   
  34. “?”元字符規定其前導對象必須在目標對象中連續出現零次或一次。   
  35.   
  36.   
  37.   
  38. 下面,就讓我們來看一下正則表達式元字符的具體應用。    
  39.   
  40.   
  41.   
  42. /fo+/  因爲上述正則表達式中包含“+”元字符,表示可以與目標對象中的 “fool”, “fo”, 或者 “football”等在字母f後面連續出現一個或多個字母o的字符串相匹配。    
  43.   
  44.   
  45.   
  46. /eg*/  因爲上述正則表達式中包含“*”元字符,表示可以與目標對象中的 “easy”, “ego”, 或者 “egg”等在字母e後面連續出現零個或多個字母g的字符串相匹配。    
  47.   
  48.   
  49.   
  50. /Wil?/  因爲上述正則表達式中包含“?”元字符,表示可以與目標對象中的 “Win”, 或者“Wilson”,等在字母i後面連續出現零個或一個字母l的字符串相匹配。    
  51.   
  52.   
  53.   
  54. 有時候不知道要匹配多少字符。爲了能適應這種不確定性,正則表達式支持限定符的概念。這些限定符可以指定正則表達式的一個給定組件必須要出現多少次才能滿足匹配。   
  55.   
  56.   
  57.   
  58. {n} n 是一個非負整數。匹配確定的 n 次。例如,'o{2}' 不能匹配 "Bob" 中的 'o',但是能匹配 "food" 中的兩個 o。   
  59.   
  60.   
  61.   
  62. {n,} n 是一個非負整數。至少匹配 n 次。例如,'o{2,}' 不能匹配 "Bob" 中的 'o',但能匹配 "foooood" 中的所有 o。'o{1,}' 等價於 'o+''o{0,}' 則等價於 'o*'。   
  63.   
  64.   
  65.   
  66. {n,m} m 和 n 均爲非負整數,其中n <= m。最少匹配 n 次且最多匹配 m 次。例如,"o{1,3}" 將匹配 "fooooood" 中的前三個 o。'o{0,1}' 等價於 'o?'。請注意在逗號和兩個數之間不能有空格。   
  67.   
  68.   
  69.   
  70. 除了元字符之外,用戶還可以精確指定模式在匹配對象中出現的頻率。例如,/jim {2,6}/ 上述正則表達式規定字符m可以在匹配對象中連續出現2-6次,因此,上述正則表達式可以同jimmy或jimmmmmy等字符串相匹配。    
  71.   
  72. 在對如何使用正則表達式有了初步瞭解之後,我們來看一下其它幾個重要的元字符的使用方式。    
  73.   
  74. <PRE class=java name="code">\s:用於匹配單個空格符,包括tab鍵和換行符;    
  75. \S:用於匹配除單個空格符之外的所有字符;    
  76. \d:用於匹配從09的數字;    
  77. \w:用於匹配字母,數字或下劃線字符;    
  78. \W:用於匹配所有與\w不匹配的字符;    
  79. . :用於匹配除換行符之外的所有字符。    
  80. </PRE>   
  81.   
  82. (說明:我們可以把\s和\S以及\w和\W看作互爲逆運算)    
  83.   
  84. 下面,我們就通過實例看一下如何在正則表達式中使用上述元字符。    
  85.   
  86. /\s+/ 上述正則表達式可以用於匹配目標對象中的一個或多個空格字符。    
  87.   
  88. /\d000/ 如果我們手中有一份複雜的財務報表,那麼我們可以通過上述正則表達式輕而易舉的查找到所有總額達千元的款項。    
  89.   
  90. 除了我們以上所介紹的元字符之外,正則表達式中還具有另外一種較爲獨特的專用字符,即定位符。定位符用於規定匹配模式在目標對象中的出現位置。 較爲常用的定位符包括: “^”, “$”, “\b” 以及 “\B”。   
  91.   
  92. <PRE class=java name="code">“^”定位符規定匹配模式必須出現在目標字符串的開頭   
  93. “$”定位符規定匹配模式必須出現在目標對象的結尾   
  94. “\b”定位符規定匹配模式必須出現在目標字符串的開頭或結尾的兩個邊界之一   
  95. “\B”定位符則規定匹配對象必須位於目標字符串的開頭和結尾兩個邊界之內,   
  96.       即匹配對象既不能作爲目標字符串的開頭,也不能作爲目標字符串的結尾。   
  97. </PRE>   
  98.   
  99. 同樣,我們也可以把“^”和“$”以及“\b”和“\B”看作是互爲逆運算的兩組定位符。舉例來說: /^hell/ 因爲上述正則表達式中包含“^”定位符,所以可以與目標對象中以 “hell”, “hello”或“hellhound”開頭的字符串相匹配。 /ar$/ 因爲上述正則表達式中包含“$”定位符,所以可以與目標對象中以 “car”, “bar”或 “ar” 結尾的字符串相匹配。 /\bbom/ 因爲上述正則表達式模式以“\b”定位符開頭,所以可以與目標對象中以 “bomb”, 或 “bom”開頭的字符串相匹配。/man\b/ 因爲上述正則表達式模式以“\b”定位符結尾,所以可以與目標對象中以 “human”, “woman”或 “man”結尾的字符串相匹配。    
  100.   
  101. 爲了能夠方便用戶更加靈活的設定匹配模式,正則表達式允許使用者在匹配模式中指定某一個範圍而不侷限於具體的字符。例如:    
  102.   
  103. <PRE class=java name="code">/[A-Z]/  上述正則表達式將會與從A到Z範圍內任何一個大寫字母相匹配。   
  104. /[a-z]/  上述正則表達式將會與從a到z範圍內任何一個小寫字母相匹配。    
  105. /[0-9]/  上述正則表達式將會與從09範圍內任何一個數字相匹配。    
  106. /([a-z][A-Z][0-9])+/ 上述正則表達式將會與任何由字母和數字組成的字符串,如 “aB0” 等相匹配。   
  107. </PRE>   
  108.   
  109. 這裏需要提醒用戶注意的一點就是可以在正則表達式中使用 “()” 把字符串組合在一起。“()”符號包含的內容必須同時出現在目標對象中。因此,上述正則表達式將無法與諸如 “abc”等的字符串匹配,因爲“abc”中的最後一個字符爲字母而非數字。    
  110.   
  111. 如果我們希望在正則表達式中實現類似編程邏輯中的“或”運算,在多個不同的模式中任選一個進行匹配的話,可以使用管道符 “|”。例如:/to|too|2/ 上述正則表達式將會與目標對象中的 “to”, “too”, 或 “2” 相匹配。   
  112.   
  113. 正則表達式中還有一個較爲常用的運算符,即否定符 “[^]”。與我們前文所介紹的定位符 “^” 不同,否定符 “[^]”規定目標對象中不能存在模式中所規定的字符串。例如:/[^A-C]/ 上述字符串將會與目標對象中除A,B,和C之外的任何字符相匹配。一般來說,當“^”出現在 “[]”內時就被視做否定運算符;而當“^”位於“[]”之外,或沒有“[]”時,則應當被視做定位符。   
  114.   
  115. 最後,當用戶需要在正則表達式的模式中加入元字符,並查找其匹配對象時,可以使用轉義符“\”。例如:/Th\*/  上述正則表達式將會與目標對象中的“Th*”而非“The”等相匹配。   
  116.   
  117. 在構造正則表達式之後,就可以象數學表達式一樣來求值,也就是說,可以從左至右並按照一個優先級順序來求值。優先級如下:   
<PRE class=java name="code">1.\ 轉義符        
2.(), (?:), (?=), [] 圓括號和方括號        
3.*, +, ?, {n}, {n,}, {n,m} 限定符        
4.^, $, \anymetacharacter 位置和順序        
5.|“或”操作        
</PRE>    
  1.   
  2.   
  3.   
  4. <SPAN style="FONT-SIZE: 18pt">使用實例</SPAN>    
  5.   
  6. 在. 1.2中帶有一個功能強大的RegExp()對象,可以用來進行正則表達式的匹配操作。其中的test()方法可以檢驗目標對象中是否包含匹配模式,並相應的返回truefalse。   
  7.   
  8. 我們可以使用.編寫以下腳本,驗證用戶輸入的郵件地址的有效性。   
<PRE class=java name="code"><html>        
<head>        
  <. language=".1.2">        
     <!-- start hiding        
     function verifyAddress(obj)        
     {        
      var email = obj.email.value;        
      var pattern =        
/^([a-zA-Z0-9_-])+@([a-zA-Z0-9_-])+(\.[a-zA-Z0-9_-])+/;        
      flag = pattern.test(email);        
      if(flag)        
      {        
       alert(“Your email address is correct!”);        
       return true;        
      }        
      else        
       {        
        alert(“Please try again!”);        
        return false;        
        }        
      }        
     // stop hiding -->        
    </.>        
  </head>        
  <body>        
   <form .Submit="return verifyAddress(this);">        
    <input name="email" type="text">        
    <input type="submit">        
    </form>        
  </body>        
</html>        
</PRE>    
  1. <SPAN style="FONT-SIZE: 18pt">正則表達式對象</SPAN>   
  2.   
  3. 本對象包含正則表達式模式以及表明如何應用模式的標誌。   
  4.   
  5. <PRE class=java name="code">語法 1 re = /pattern/[flags]   
  6. 語法 2 re = new RegExp("pattern",["flags"])    
  7. </PRE>   
  8.   
  9. 參數   
  10.   
  11. re   
  12.   
  13. 必選項。將要賦值爲正則表達式模式的變量名。    
  14. Pattern   
  15.   
  16. 必選項。要使用的正則表達式模式。如果使用語法 1,用 "/" 字符分隔模式。如果用語法 2,用引號將模式引起來。    
  17. Flags    
  18.   
  19. 可選項。如果使用語法 2 要用引號將 flag 引起來。標誌可以組合使用,可用的有:    
  20.   
  21. <PRE class=java name="code">g (全文查找出現的所有 pattern)    
  22. i (忽略大小寫)    
  23. m (多行查找)    
  24. </PRE>   
  25.   
  26.   
  27.   
  28. <SPAN style="FONT-SIZE: 18pt">示例</SPAN>   
  29.   
  30. 下面的示例創建一個包含正則表達式模式及相關標誌的對象(re),向您演示正則表達式對象的用法。在本例中,作爲結果的正則表達式對象又用於 match 方法中:   
<PRE class=java name="code">function MatchDemo()        
{        
var r, re; // 聲明變量。        
var s = "The rain in Spain falls mainly in the plain";        
re = new RegExp("ain","g"); // 創建正則表達式對象。        
r = s.match(re); // 在字符串 s 中查找匹配。        
return(r);        
}        
</PRE>        
    
  1.   
  2.   
  3. 返回值: ain,ain,ain,ain\\   
  4.   
  5. 屬性 lastIndex 屬性 | source 屬性\\   
  6.   
  7. 方法 compile 方法 | exec 方法 | test 方法\\   
  8.   
  9. 要求 版本 3\\   
  10.   
  11. 請參閱 RegExp 對象 | 正則表達式語法 | String 對象\\   
  12.   
  13.   
  14.   
  15. <SPAN style="FONT-SIZE: 18pt">exec 方法</SPAN>   
  16.   
  17. 用正則表達式模式在字符串中運行查找,並返回包含該查找結果的一個數組。   
  18.   
  19. rgExp.exec(str)   
  20. 參數   
  21. rgExp    
  22.   
  23. 必選項。包含正則表達式模式和可用標誌的正則表達式對象。    
  24. str    
  25.   
  26. 必選項。要在其中執行查找的 String 對象或字符串文字。    
  27. 說明\\   
  28.   
  29. 如果 exec 方法沒有找到匹配,則它返回 null。如果它找到匹配,則 exec 方法返回一個數組,並且更新全局 RegExp 對象的屬性,以反映匹配結果。數組的0元素包含了完整的匹配,而第1到n元素中包含的是匹配中出現的任意一個子匹配。這相當於沒有設置全局標誌 (g) 的 match 方法。   
  30.   
  31. 如果爲正則表達式設置了全局標誌,exec 從以 lastIndex 的值指示的位置開始查找。如果沒有設置全局標誌,exec 忽略 lastIndex 的值,從字符串的起始位置開始搜索。   
  32.   
  33.   
  34.   
  35. exec 方法返回的數組有三個屬性,分別是 input、index 和 lastIndex。Input 屬性包含了整個被查找的字符串。Index 屬性中包含了整個被查找字符串中被匹配的子字符串的位置。LastIndex 屬性中包含了匹配中最後一個字符的下一個位置。   
  36. 示例\\   
  37.   
  38. 下面的例子舉例說明了 exec 方法的用法:   
<PRE class=java name="code">function RegExpTest()        
{        
var ver = Number(.EngineMajorVersion() + "." + .EngineMinorVersion())        
if (ver >= 5.5){ // 測試 J. 的版本。        
var src = "The rain in Spain falls mainly in the plain.";        
var re = /\w+/g; // 創建正則表達式模式。        
var arr;        
while ((arr = re.exec(src)) != null)        
document.write(arr.index + "-" + arr.lastIndex + arr + "\t");        
}        
else{        
alert("請使用 J. 的更新版本");        
}        
}        
</PRE>        
    
  1.   
  2.   
  3. 返回值:0-3The 4-8rain 9-11in 12-17Spain 18-23falls 24-30mainly 31-33in 34-37the 38-43plain   
  4.   
  5.   
  6.   
  7. test 方法\\   
  8.   
  9. 返回一個 Boolean 值,它指出在被查找的字符串中是否存在模式。   
  10.   
  11. rgexp.test(str)    
  12. 參數\\   
  13.   
  14. rgexp   
  15.   
  16. 必選項。包含正則表達式模式或可用標誌的正則表達式對象。    
  17.   
  18.   
  19.   
  20. str    
  21.   
  22. 必選項。要在其上測試查找的字符串。    
  23. 說明   
  24.   
  25. test 方法檢查在字符串中是否存在一個模式,如果存在則返回 true,否則就返回 false。   
  26.   
  27. 全局 RegExp 對象的屬性不由 test 方法來修改。   
  28. 示例   
  29.   
  30. 下面的例子舉例說明了 test 方法的用法:   
  31.   
<PRE class=java name="code">function TestDemo(re, s)        
{        
var s1; // 聲明變量。        
// 檢查字符串是否存在正則表達式。        
if (re.test(s)) // 測試是否存在。        
s1 = " contains "; // s 包含模式。        
else    
s1 = " does not contain "; // s 不包含模式。        
return("'" + s + "'" + s1 + "'"+ re.source + "'"); // 返回字符串。        
}        
</PRE>    
  1.   
  2.   
  3.   
  4. 函數調用:document.write (TestDemo(/ain+/ ,"The rain in Spain falls mainly in the plain."));   
  5. 返回值:'The rain in Spain falls mainly in the plain.' contains 'ain+'  
  6. <SPAN style="FONT-SIZE: 18pt">match 方法</SPAN>   
  7.   
  8. 使用正則表達式模式對字符串執行查找,並將包含查找的結果作爲數組返回。\\   
  9.   
  10. stringObj.match(rgExp)    
  11. 參數\\   
  12.   
  13. stringObj    
  14.   
  15. 必選項。對其進行查找的 String 對象或字符串文字。    
  16.   
  17.   
  18.   
  19. rgExp    
  20.   
  21. 必選項。爲包含正則表達式模式和可用標誌的正則表達式對象。也可以是包含正則表達式模式和可用標誌的變量名或字符串文字。    
  22. 說明\\   
  23.   
  24. 如果 match 方法沒有找到匹配,返回 null。如果找到匹配返回一個數組並且更新全局 RegExp 對象的屬性以反映匹配結果。   
  25.   
  26. match 方法返回的數組有三個屬性:input、index 和 lastIndex。Input 屬性包含整個的被查找字符串。Index 屬性包含了在整個被查找字符串中匹配的子字符串的位置。LastIndex 屬性包含了最後一次匹配中最後一個字符的下一個位置。   
  27.   
  28. 如果沒有設置全局標誌 (g),數組的 0 元素包含整個匹配,而第 1 到 n 元素包含了匹配中曾出現過的任一個子匹配。這相當於沒有設置全局標誌的 exec 方法。如果設置了全局標誌,元素 0 到 n 中包含所有匹配。   
  29. 示例\\   
  30.   
  31. 下面的示例演示了match 方法的用法:   
<PRE class=java name="code">function MatchDemo()        
{        
var r, re; // 聲明變量。        
var s = "The rain in Spain falls mainly in the plain";        
re = /ain/i; // 創建正則表達式模式。        
r = s.match(re); // 嘗試匹配搜索字符串。        
return(r); // 返回第一次出現 "ain" 的地方。        
}        
</PRE>    
  1.   
  2. 返回值:ain   
  3. 本示例說明帶 g 標誌設置的 match 方法的用法。   
<PRE class=java name="code">function MatchDemo()        
{        
var r, re; // 聲明變量。        
var s = "The rain in Spain falls mainly in the plain";        
re = /ain/ig; // 創建正則表達式模式。        
r = s.match(re); // 嘗試去匹配搜索字符串。        
return(r); // 返回的數組包含了所有 "ain"        
// 出現的四個匹配。        
}        
</PRE>    
  1.   
  2. 返回值:ain,ain,ain,ain   
  3. 上面幾行代碼演示了字符串文字的 match 方法的用法。   
  4.   
  5. <PRE class=java name="code">var r, re = "Spain";   
  6. r = "The rain in Spain".replace(re, "Canada");   
  7. return r;   
  8. </PRE>   
  9.   
  10. 返回值:The rain in Canada   
  11.   
  12.   
  13.   
  14. <SPAN style="FONT-SIZE: 18pt">search 方法</SPAN>   
  15.   
  16. 返回與正則表達式查找內容匹配的第一個子字符串的位置。   
  17. stringObj.search(rgExp)   
  18. 參數\\   
  19.   
  20. stringObj    
  21.   
  22. 必選項。要在其上進行查找的 String 對象或字符串文字。    
  23.   
  24.   
  25.   
  26. rgExp    
  27.   
  28. 必選項。包含正則表達式模式和可用標誌的正則表達式對象。    
  29. 說明   
  30. search 方法指明是否存在相應的匹配。如果找到一個匹配,search 方法將返回一個整數值,指明這個匹配距離字符串開始的偏移位置。如果沒有找到匹配,則返回 -1。   
  31.   
  32.   
  33.   
  34. 示例\\   
  35.   
  36. 下面的示例演示了 search 方法的用法。   
<PRE class=java name="code">function SearchDemo()        
{        
var r, re; // 聲明變量。        
var s = "The rain in Spain falls mainly in the plain.";        
re = /falls/i; // 創建正則表達式模式。        
r = s.search(re); // 查找字符串。        
return(r); // 返回 Boolean 結果。        
}        
</PRE>    
  1.   
  2. 返回值:18  
  3.   
  4. <SPAN style="FONT-SIZE: 18pt">正則表達式語法</SPAN>   
  5.   
  6. 一個正則表達式就是由普通字符(例如字符 a 到 z)以及特殊字符(稱爲元字符)組成的文字模式。該模式描述在查找文字主體時待匹配的一個或多個字符串。正則表達式作爲一個模板,將某個字符模式與所搜索的字符串進行匹配。   
  7. 這裏有一些可能會遇到的正則表達式示例:   
    
<PRE class=java name="code">J. VB. 匹配        
/^\[ \t]*$/ "^\[ \t]*$" 匹配一個空白行。        
/\d{2}-\d{5}/ "\d{2}-\d{5}" 驗證一個ID 號碼是否由一個2位數字,一個連字符以及一個5位數字組成。        
/<(.*)>.*<\/\1>/ "<(.*)>.*<\/\1>" 匹配一個 HTML 標記。        
</PRE>    
  1. 下表是元字符及其在正則表達式上下文中的行爲的一個完整列表:   
  2. 字符 描述    
  3.   
  4. \ 將下一個字符標記爲一個特殊字符、或一個原義字符、或一個 後向引用、或一個八進制轉義符。例如,'n' 匹配字符 "n"'\n' 匹配一個換行符。序列 '\\' 匹配 "\" 而 "\(" 則匹配 "("。    
  5. ^ 匹配輸入字符串的開始位置。如果設置了 RegExp 對象的 Multiline 屬性,^ 也匹配 '\n' 或 '\r' 之後的位置。    
  6. $ 匹配輸入字符串的結束位置。如果設置了RegExp 對象的 Multiline 屬性,$ 也匹配 '\n' 或 '\r' 之前的位置。    
  7. * 匹配前面的子表達式零次或多次。例如,zo* 能匹配 "z" 以及 "zoo"。 * 等價於{0,}。    
  8. + 匹配前面的子表達式一次或多次。例如,'zo+' 能匹配 "zo" 以及 "zoo",但不能匹配 "z"。+ 等價於 {1,}。    
  9. ? 匹配前面的子表達式零次或一次。例如,"do(es)?" 可以匹配 "do" 或 "does" 中的"do" 。? 等價於 {0,1}。    
  10. {n} n 是一個非負整數。匹配確定的 n 次。例如,'o{2}' 不能匹配 "Bob" 中的 'o',但是能匹配 "food" 中的兩個 o。    
  11. {n,} n 是一個非負整數。至少匹配n 次。例如,'o{2,}' 不能匹配 "Bob" 中的 'o',但能匹配 "foooood" 中的所有 o。'o{1,}' 等價於 'o+''o{0,}' 則等價於 'o*'。    
  12. {n,m} m 和 n 均爲非負整數,其中n <= m。最少匹配 n 次且最多匹配 m 次。劉, "o{1,3}" 將匹配 "fooooood" 中的前三個 o。'o{0,1}' 等價於 'o?'。請注意在逗號和兩個數之間不能有空格。    
  13. ? 當該字符緊跟在任何一個其他限制符 (*, +, ?, {n}, {n,}, {n,m}) 後面時,匹配模式是非貪婪的。非貪婪模式儘可能少的匹配所搜索的字符串,而默認的貪婪模式則儘可能多的匹配所搜索的字符串。例如,對於字符串 "oooo"'o+?' 將匹配單個 "o",而 'o+' 將匹配所有 'o'。    
  14. . 匹配除 "\n" 之外的任何單個字符。要匹配包括 '\n' 在內的任何字符,請使用象 '[.\n]' 的模式。    
  15.   
  16. (pattern) 匹配pattern 並獲取這一匹配。所獲取的匹配可以從產生的 Matches 集合得到,在VB. 中使用 SubMatches 集合,在J. 中則使用 $0…$9 屬性。要匹配圓括號字符,請使用 '\(' 或 '\)'。    
  17.   
  18. (?:pattern) 匹配 pattern 但不獲取匹配結果,也就是說這是一個非獲取匹配,不進行存儲供以後使用。這在使用 "或" 字符 (|) 來組合一個模式的各個部分是很有用。例如, 'industr(?:y|ies) 就是一個比 'industry|industries' 更簡略的表達式。    
  19. (?=pattern) 正向預查,在任何匹配 pattern 的字符串開始處匹配查找字符串。這是一個非獲取匹配,也就是說,該匹配不需要獲取供以後使用。例如, 'Windows (?=95|98|NT|2000)' 能匹配 "Windows 2000" 中的 "Windows" ,但不能匹配 "Windows 3.1" 中的 "Windows"。預查不消耗字符,也就是說,在一個匹配發生後,在最後一次匹配之後立即開始下一次匹配的搜索,而不是從包含預查的字符之後開始。    
  20. (?!pattern) 負向預查,在任何不匹配Negative lookahead matches the search string at any point where a string not matching pattern 的字符串開始處匹配查找字符串。這是一個非獲取匹配,也就是說,該匹配不需要獲取供以後使用。例如'Windows (?!95|98|NT|2000)' 能匹配 "Windows 3.1" 中的 "Windows",但不能匹配 "Windows 2000" 中的 "Windows"。預查不消耗字符,也就是說,在一個匹配發生後,在最後一次匹配之後立即開始下一次匹配的搜索,而不是從包含預查的字符之後開始    
  21.   
  22.   
  23.   
  24. x|y 匹配 x 或 y。例如,'z|food' 能匹配 "z" 或 "food"'(z|f)ood' 則匹配 "zood" 或 "food"。    
  25. [xyz] 字符集合。匹配所包含的任意一個字符。例如, '[abc]' 可以匹配 "plain" 中的 'a'。    
  26. [^xyz] 負值字符集合。匹配未包含的任意字符。例如, '[^abc]' 可以匹配 "plain" 中的'p'。    
  27. [a-z] 字符範圍。匹配指定範圍內的任意字符。例如,'[a-z]' 可以匹配 'a' 到 'z' 範圍內的任意小寫字母字符。    
  28. [^a-z] 負值字符範圍。匹配任何不在指定範圍內的任意字符。例如,'[^a-z]' 可以匹配任何不在 'a' 到 'z' 範圍內的任意字符。    
  29.   
  30.   
  31.   
  32. \b 匹配一個單詞邊界,也就是指單詞和空格間的位置。例如, 'er\b' 可以匹配"never" 中的 'er',但不能匹配 "verb" 中的 'er'。    
  33.  
  34. \B 匹配非單詞邊界。'er\B' 能匹配 "verb" 中的 'er',但不能匹配 "never" 中的 'er'。    
  35. \cx 匹配由x指明的控制字符。例如, \cM 匹配一個 Control-M 或回車符。 x 的值必須爲 A-Z 或 a-z 之一。否則,將 c 視爲一個原義的 'c' 字符。    
  36. \d 匹配一個數字字符。等價於 [0-9]。    
  37. \D 匹配一個非數字字符。等價於 [^0-9]。    
  38. \f 匹配一個換頁符。等價於 \x0c 和 \cL。    
  39. \n 匹配一個換行符。等價於 \x0a 和 \cJ。    
  40. \r 匹配一個回車符。等價於 \x0d 和 \cM。    
  41.  
  42. \s 匹配任何空白字符,包括空格、製表符、換頁符等等。等價於 [ \f\n\r\t\v]。    
  43. \S 匹配任何非空白字符。等價於 [^ \f\n\r\t\v]。    
  44. \t 匹配一個製表符。等價於 \x09 和 \cI。    
  45. \v 匹配一個垂直製表符。等價於 \x0b 和 \cK。    
  46. \w 匹配包括下劃線的任何單詞字符。等價於'[A-Za-z0-9_]'。    
  47. \W 匹配任何非單詞字符。等價於 '[^A-Za-z0-9_]'。    
  48.   
  49. \xn 匹配 n,其中 n 爲十六進制轉義值。十六進制轉義值必須爲確定的兩個數字長。例如, '\x41' 匹配 "A"'\x041' 則等價於 '\x04' & "1"。正則表達式中可以使用 ASCII 編碼。.    
  50. \num 匹配 num,其中 num 是一個正整數。對所獲取的匹配的引用。例如,'(.)\1' 匹配兩個連續的相同字符。    
  51. \n 標識一個八進制轉義值或一個後向引用。如果 \n 之前至少 n 個獲取的子表達式,則 n 爲後向引用。否則,如果 n 爲八進制數字 (0-7),則 n 爲一個八進制轉義值。    
  52. \nm 標識一個八進制轉義值或一個後向引用。如果 \nm 之前至少有is preceded by at least nm 個獲取得子表達式,則 nm 爲後向引用。如果 \nm 之前至少有 n 個獲取,則 n 爲一個後跟文字 m 的後向引用。如果前面的條件都不滿足,若 n 和 m 均爲八進制數字 (0-7),則 \nm 將匹配八進制轉義值 nm。 
  53. \nml 如果 n 爲八進制數字 (0-3),且 m 和 l 均爲八進制數字 (0-7),則匹配八進制轉義值 nml。    
  54.   
  55.   
  56.   
  57. \un 匹配 n,其中 n 是一個用四個十六進制數字表示的 Unicode 字符。例如, \u00A9 匹配版權符號 (?)。    
  58. <SPAN style="FONT-SIZE: 18pt">優先權順序</SPAN>   
  59.   
  60. 在構造正則表達式之後,就可以象數學表達式一樣來求值,也就是說,可以從左至右並按照一個優先權順序來求值。    
  61. 下表從最高優先級到最低優先級列出各種正則表達式操作符的優先權順序:  
  62. <PRE class=java name="code">操作符 描述    
  63. \ 轉義符    
  64. (), (?:), (?=), [] 圓括號和方括號    
  65. *, +, ?, {n}, {n,}, {n,m} 限定符    
  66. ^, $, \anymetacharacter 位置和順序    
  67. | “或”操作    
  68. </PRE>   
  69.   
  70. 普通字符   
  71. 普通字符由所有那些未顯式指定爲元字符的打印和非打印字符組成。這包括所有的大寫和小寫字母字符,所有數字,所有標點符號以及一些符號。    
  72.   
  73. 最簡單的正則表達式是一個單獨的普通字符,可以匹配所搜索字符串中的該字符本身。例如,單字符模式 'A' 可以匹配所搜索字符串中任何位置出現的字母 'A'。這裏有一些單字符正則表達式模式的示例:   
  74.   
  75. <PRE class=java name="code">/a/   
  76. /7/   
  77. /M/   
  78. </PRE>   
  79.   
  80. 等價的 VB. 單字符正則表達式爲:   
  81.   
  82. <PRE class=java name="code">"a"  
  83. "7"  
  84. "M"  
  85. </PRE>   
  86.   
  87. 可以將多個單字符組合在一起得到一個較大的表達式。例如,下面的 J. 正則表達式不是別的,就是通過組合單字符表達式 'a''7'以及 'M' 所創建出來的一個表達式。    
  88. /a7M/   
  89.   
  90. 等價的 VB. 表達式爲:   
  91. "a7M"  
  92.   
  93. 請注意這裏沒有連接操作符。所需要做的就是將一個字符放在了另一個字符後面。   
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章