常用正則表達式大全!(例如:匹配中文、匹配html)

匹配中文字符的正則表達式: [u4e00-u9fa5]   
  評註:匹配中文還真是個頭疼的事,有了這個表達式就好辦了 
  匹配雙字節字符(包括漢字在內):[^x00-xff] 
  評註:可以用來計算字符串的長度(一個雙字節字符長度計2,ASCII字符計1) 
  匹配空白行的正則表達式:ns*r 
  評註:可以用來刪除空白行 
  匹配HTML標記的正則表達式:<(S*?)[^>]*>.*?|<.*? /> 
  評註:網上流傳的版本太糟糕,上面這個也僅僅能匹配部分,對於複雜的嵌套標記依舊無能爲力 
  匹配首尾空白字符的正則表達式:^s*|s*$ 
  評註:可以用來刪除行首行尾的空白字符(包括空格、製表符、換頁符等等),非常有用的表達式 
  匹配Email地址的正則表達式:w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)* 
  評註:表單驗證時很實用 
  匹配網址URL的正則表達式:[a-zA-z]+://[^s]* 
  評註:網上流傳的版本功能很有限,上面這個基本可以滿足需求 
  匹配帳號是否合法(字母開頭,允許5-16字節,允許字母數字下劃線):^[a-zA-Z][a-zA-Z0-9_]{4,15}$ 
  評註:表單驗證時很實用 
  匹配國內電話號碼:d{3}-d{8}|d{4}-d{7} 
  評註:匹配形式如 0511-4405222 或 021-87888822 
  匹配騰訊QQ號:[1-9][0-9]{4,} 
  評註:騰訊QQ號從10000開始 
  匹配中國郵政編碼:[1-9]d{5}(?!d) 
  評註:中國郵政編碼爲6位數字 
  匹配身份證:d{15}|d{18} 
  評註:中國的身份證爲15位或18位 
  匹配ip地址:d+.d+.d+.d+ 
  評註:提取ip地址時有用 
  匹配特定數字: 
  ^[1-9]d*$    //匹配正整數 
  ^-[1-9]d*$   //匹配負整數 
  ^-?[1-9]d*$   //匹配整數 
  ^[1-9]d*|0$  //匹配非負整數(正整數 + 0) 
  ^-[1-9]d*|0$   //匹配非正整數(負整數 + 0) 
  ^[1-9]d*.d*|0.d*[1-9]d*$   //匹配正浮點數 
  ^-([1-9]d*.d*|0.d*[1-9]d*)$  //匹配負浮點數 
  ^-?([1-9]d*.d*|0.d*[1-9]d*|0?.0+|0)$  //匹配浮點數 
  ^[1-9]d*.d*|0.d*[1-9]d*|0?.0+|0$   //匹配非負浮點數(正浮點數 + 0) 
  ^(-([1-9]d*.d*|0.d*[1-9]d*))|0?.0+|0$  //匹配非正浮點數(負浮點數 + 0) 
  評註:處理大量數據時有用,具體應用時注意修正 
  匹配特定字符串: 
  ^[A-Za-z]+$  //匹配由26個英文字母組成的字符串 
  ^[A-Z]+$  //匹配由26個英文字母的大寫組成的字符串 
  ^[a-z]+$  //匹配由26個英文字母的小寫組成的字符串 
  ^[A-Za-z0-9]+$  //匹配由數字和26個英文字母組成的字符串 
  ^w+$  //匹配由數字、26個英文字母或者下劃線組成的字符串 
  在使用RegularExpressionValidator驗證控件時的驗證功能及其驗證表達式介紹如下: 
  只能輸入數字:“^[0-9]*$” 
  只能輸入n位的數字:“^d{n}$” 
  只能輸入至少n位數字:“^d{n,}$” 
  只能輸入m-n位的數字:“^d{m,n}$” 
  只能輸入零和非零開頭的數字:“^(0|[1-9][0-9]*)$” 
  只能輸入有兩位小數的正實數:“^[0-9]+(.[0-9]{2})?$” 
  只能輸入有1-3位小數的正實數:“^[0-9]+(.[0-9]{1,3})?$” 
  只能輸入非零的正整數:“^+?[1-9][0-9]*$” 
  只能輸入非零的負整數:“^-[1-9][0-9]*$” 
  只能輸入長度爲3的字符:“^.{3}$” 
  只能輸入由26個英文字母組成的字符串:“^[A-Za-z]+$” 
  只能輸入由26個大寫英文字母組成的字符串:“^[A-Z]+$” 
  只能輸入由26個小寫英文字母組成的字符串:“^[a-z]+$” 
  只能輸入由數字和26個英文字母組成的字符串:“^[A-Za-z0-9]+$” 
  只能輸入由數字、26個英文字母或者下劃線組成的字符串:“^w+$” 
  驗證用戶密碼:“^[a-zA-Z]w{5,17}$”正確格式爲:以字母開頭,長度在6-18之間, 
  只能包含字符、數字和下劃線。 
  驗證是否含有^%&'',;=?$"等字符:“[^%&'',;=?$x22]+” 
  只能輸入漢字:“^[u4e00-u9fa5],{0,}$” 
  驗證Email地址:“^w+[-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*$” 
  驗證InternetURL:“^http://([w-]+.)+[w-]+(/[w-./?%&=]*)?$” 
  驗證電話號碼:“^((d{3,4})|d{3,4}-)?d{7,8}$” 
  正確格式爲:“XXXX-XXXXXXX”,“XXXX-XXXXXXXX”,“XXX-XXXXXXX”, 
  “XXX-XXXXXXXX”,“XXXXXXX”,“XXXXXXXX”。 
  驗證身份證號(15位或18位數字):“^d{15}|d{}18$” 
  驗證一年的12個月:“^(0?[1-9]|1[0-2])$”正確格式爲:“01”-“09”和“1”“12” 
  驗證一個月的31天:“^((0?[1-9])|((1|2)[0-9])|30|31)$” 
  正確格式爲:“01”“09”和“1”“31”。 
  匹配中文字符的正則表達式: [u4e00-u9fa5] 
  匹配雙字節字符(包括漢字在內):[^x00-xff] 
  匹配空行的正則表達式:n[s| ]*r 
  匹配HTML標記的正則表達式:/<(.*)>.*|<(.*) />/ 
  匹配首尾空格的正則表達式:(^s*)|(s*$) 
  匹配Email地址的正則表達式:w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)* 
  匹配網址URL的正則表達式:http://([w-]+.)+[w-]+(/[w- ./?%&=]*)? 
  (1)應用:計算字符串的長度(一個雙字節字符長度計2,ASCII字符計1) 
  String.prototype.len=function(){return this.replace([^x00-xff]/g,"aa").length;} 
  (2)應用:javascript中沒有像vbscript那樣的trim函數,我們就可以利用這個表達式來實現 
  String.prototype.trim = function() 
  { 
  return this.replace(/(^s*)|(s*$)/g, ""); 
  } 
  (3)應用:利用正則表達式分解和轉換IP地址 
  function IP2V(ip) //IP地址轉換成對應數值 
  { 
  re=/(d+).(d+).(d+).(d+)/g //匹配IP地址的正則表達式 
  if(re.test(ip)) 
  { 
  return RegExp.$1*Math.pow(255,3))+RegExp.$2*Math.pow(255,2))+RegExp.$3*255+RegExp.$4*1 
  } 
  else 
  { 
  throw new Error("Not a valid IP address!") 
  } 
  } 
  (4)應用:從URL地址中提取文件名的javascript程序 
  s="http://www.9499.net/page1.htm"; 
  s=s.replace(/(.*/){0,}([^.]+).*/ig,"$2") ;//Page1.htm 
  (5)應用:利用正則表達式限制網頁表單裏的文本框輸入內容 
  用正則表達式限制只能輸入中文:οnkeyup="value=value.replace(/[^u4E00-u9FA5]/g,'') "onbeforepaste="clipboardData.setData(''text'',clipboardData.getData(''text'').replace(/[^u4E00-u9FA5]/g,''))" 
  用正則表達式限制只能輸入全角字符: οnkeyup="value=value.replace(/[^uFF00-uFFFF]/g,'') "onbeforepaste="clipboardData.setData(''text'',clipboardData.getData(''text'').replace(/[^uFF00-uFFFF]/g,''))" 
  用正則表達式限制只能輸入數字:οnkeyup="value=value.replace(/[^d]/g,'') "onbeforepaste= "clipboardData.setData(''text'',clipboardData.getData(''text'').replace(/[^d]/g,''))" 

  用正則表達式限制只能輸入數字和英文:οnkeyup="value=value.replace(/[W]/g,'') "onbeforepaste="clipboardData.setData(''text'',clipboardData.getData(''text'').replace(/[^d]/g,''


editplus查找替換的正則表達式應用

表達式        說明
\t        製表符.
\n        新行.
.        匹配任意字符.
|        匹配表達式左邊和右邊的字符. 例如, "ab|bc" 匹配 "ab" 或者 "bc".
[]        匹配列表之中的任何單個字符. 例如, "[ab]" 匹配 "a" 或者 "b". "[0-9]" 匹配任意數字.
[^]        匹配列表之外的任何單個字符. 例如, "[^ab]" 匹配 "a" 和 "b" 以外的字符. "[^0-9]" 匹配任意非數字字符.
*        其左邊的字符被匹配任意次(0次,或者多次). 例如 "be*" 匹配 "b", "be" 或者 "bee".
+        其左邊的字符被匹配至少一次(1次,或者多次). 例如 "be+" 匹配 "be" 或者 "bee" 但是不匹配 "b".
?        其左邊的字符被匹配0次或者1次. 例如 "be?" 匹配 "b" 或者 "be" 但是不匹配 "bee".
^        其右邊的表達式被匹配在一行的開始. 例如 "^A" 僅僅匹配以 "A" 開頭的行.
contentnbsp;       其左邊的表達式被匹配在一行的結尾. 例如 "econtentquot; 僅僅匹配以 "e" 結尾的行.
()        影響表達式匹配的順序,並且用作表達式的分組標記.
\        轉義字符. 如果你要使用 "\" 本身, 則應該使用 "\\".
正則表達式應用——刪除空行   ^[ \t]*\n
表達式的分組使用()來標記. 表達式的分組可以被引用爲 \0, \1, \2, \3, 等等. \0 表示被匹配的所有字符串. \1 表示被匹配的第一個分組, \2 表示第二個分組, 依此類推. 舉例如下.

原文        查找         替換                 結果
abc     (ab)(c)        \0-\1-\2        abc-ab-c
abc     a(b)(c)        \0-\1-\2        abc-b-c
abc     (a)b(c)        \0-\1-\2        abc-a-c

【1】正則表達式應用——替換指定內容到行尾
原始文本如下面兩行
abc aaaaa
123 abc 444

希望每次遇到“abc”,則替換“abc”以及其後到行尾的內容爲“abc efg”
即上面的文本最終替換爲:
abc efg
123 abc efg

解決:
① 在替換對話框,查找內容裏輸入“abc.*”
② 同時勾選“正則表達式”複選框,然後點擊“全部替換”按鈕
其中,符號的含義如下:
“.” =匹配任意字符
“*” =匹配0次或更多

注意:其實就是正則表達式替換,這裏只是把一些曾經提出的問題加以整理,單純從正則表達式本身來說,就可以引申出成千上萬種特例。

【2】正則表達式應用——數字替換
希望把
asdadas123asdasdas456asdasdasd789asdasd
替換爲:
asdadas[123]asdasdas[456]asdasdasd[789]asdasd

在替換對話框裏面,勾選“正則表達式”複選框;
在查找內容裏面輸入“[0-9][0-9][0-9]”,不含引號
“替換爲:”裏面輸入“[\0\1\2]”,不含引號
範圍爲你所操作的範圍,然後選擇替換即可。

實際上這也是正則表達式的使用特例,“[0-9]”表示匹配0~9之間的任何特例,同樣“[a-z]”就表示匹配a~z之間的任何特例
上面重複使用了“[0-9]”,表示連續出現的三個數字
“\0”代表第一個“[0-9]”對應的原型,“\1”代表第二個“[0-9]”對應的原型,依此類推
“[”、“]”爲單純的字符,表示添加“[”或“]”,如果輸入“其它\0\1\2其它”,則替換結果爲:

asdadas其它123其它asdasdas其它456其它asdasdasd其它789其它asdasd

功能增強(by jiuk2k):
如果將查找內容“[0-9][0-9][0-9]”改爲“[0-9]*[0-9]”,對應1 或 123 或 12345 或 …
大家根據需要定製

相關內容還有很多,可以自己參考正則表達式的語法仔細研究一下

【3】正則表達式應用——刪除每一行行尾的指定字符
因爲這幾個字符在行中也是出現的,所以肯定不能用簡單的替換實現
比如
12345 1265345
2345
需要刪除每行末尾的“345”
這個也算正則表達式的用法,其實仔細看正則表達式應該比較簡單,不過既然有這個問題提出,說明對正則表達式還得有個認識過程,解決方法如下
解決:
在替換對話框中,啓用“正則表達式”複選框
在查找內容裏面輸入“345contentrdquo;
這裏“contentrdquo;表示從行尾匹配

如果從行首匹配,可以用“^”來實現,不過 EditPlus 有另一個功能可以很簡單的刪除行首的字符串
a. 選擇要操作的行
b. 編輯-格式-刪除行註釋
c. 在彈出對話框裏面輸入要清除的行首字符,確定

【4】正則表達式應用——替換帶有半角括號的多行
幾百個網頁中都有下面一段代碼:
\n
在替換對話框啓用“正則表達式”選項,這時就可以完成替換了

【5】正則表達式應用——刪除空行
啓動EditPlus,打開待處理的文本類型文件。
①、選擇“查找”菜單的“替換”命令,彈出文本替換對話框。選中“正則表達式”複選框,表明我們要在查找、替換中使用正則表達式。然後,選中“替換範圍”中的“當前文件”,表明對當前文件操作。
②、單擊“查找內容”組合框右側的按鈕,出現下拉菜單。
③、下面的操作添加正則表達式,該表達式代表待查找的空行。(技巧提示:空行僅包括空格符、製表符、回車符,且必須以這三個符號之一作爲一行的開頭,並且以回車符結尾,查找空行的關鍵是構造代表空行的正則表達式)。
直接在”查找”中輸入正則表達式“^[ \t]*\n”,注意\t前有空格符。
(1)選擇“從行首開始匹配”,“查找內容”組合框中出現字符“^”,表示待查找字符串必須出現在文本中一行的行首。
(2)選擇“字符在範圍中”,那麼在“^”後會增加一對括號“[]”,當前插入點在括號中。括號在正則表達式中表示,文本中的字符匹配括號中任意一個字符即符合查找條件。
(3)按一下空格鍵,添加空格符。空格符是空行的一個組成成分。
(4)選擇“製表符”,添加代表製表符的“\t”。
(5)移動光標,將當前插入點移到“]”之後,然後選擇“匹配 0 次或更多”,該操作會添加星號字符“*”。星號表示,其前面的括號“[]”內的空格符或製表符,在一行中出現0個或多個。
(6)選擇“換行符”,插入“\n”,表示回車符。
④、“替換爲”組合框保持空,表示刪除查找到的內容。單擊“替換”按鈕逐個行刪除空行,或單擊“全部替換”按鈕刪除全部空行(注意:EditPlus有時存在“全部替換”不能一次性完全刪除空行的問題,可能是程序BUG,需要多按幾次按鈕)。


發佈了23 篇原創文章 · 獲贊 0 · 訪問量 4萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章