常用正則表達式大全！（例如：匹配中文、匹配html）

匹配中文字符的正則表達式： [u4e00-u9fa5]
　　評註：匹配中文還真是個頭疼的事，有了這個表達式就好辦了
　　匹配雙字節字符(包括漢字在內)：[^x00-xff]
　　評註：可以用來計算字符串的長度（一個雙字節字符長度計2，ASCII字符計1）
　　匹配空白行的正則表達式：ns*r
　　評註：可以用來刪除空白行
　　匹配HTML標記的正則表達式：<(S*?)[^>]*>.*?|<.*? />
　　評註：網上流傳的版本太糟糕，上面這個也僅僅能匹配部分，對於複雜的嵌套標記依舊無能爲力
　　匹配首尾空白字符的正則表達式：^s*|s*$
　　評註：可以用來刪除行首行尾的空白字符(包括空格、製表符、換頁符等等)，非常有用的表達式
　　匹配Email地址的正則表達式：w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*
　　評註：表單驗證時很實用
　　匹配網址URL的正則表達式：[a-zA-z]+://[^s]*
　　評註：網上流傳的版本功能很有限，上面這個基本可以滿足需求
　　匹配帳號是否合法(字母開頭，允許5-16字節，允許字母數字下劃線)：^[a-zA-Z][a-zA-Z0-9_]{4,15}$
　　評註：表單驗證時很實用
　　匹配國內電話號碼：d{3}-d{8}|d{4}-d{7}
　　評註：匹配形式如 0511-4405222 或 021-87888822
　　匹配騰訊QQ號：[1-9][0-9]{4,}
　　評註：騰訊QQ號從10000開始
　　匹配中國郵政編碼：[1-9]d{5}(?!d)
　　評註：中國郵政編碼爲6位數字
　　匹配身份證：d{15}|d{18}
　　評註：中國的身份證爲15位或18位
　　匹配ip地址：d+.d+.d+.d+
　　評註：提取ip地址時有用
　　匹配特定數字：
　　^[1-9]d*$　　 //匹配正整數
　　^-[1-9]d*$ 　 //匹配負整數
　　^-?[1-9]d*$　　 //匹配整數
　　^[1-9]d*|0$　 //匹配非負整數（正整數 + 0）
　　^-[1-9]d*|0$　　 //匹配非正整數（負整數 + 0）
　　^[1-9]d*.d*|0.d*[1-9]d*$　　 //匹配正浮點數
　　^-([1-9]d*.d*|0.d*[1-9]d*)$　 //匹配負浮點數
　　^-?([1-9]d*.d*|0.d*[1-9]d*|0?.0+|0)$　 //匹配浮點數
　　^[1-9]d*.d*|0.d*[1-9]d*|0?.0+|0$　　 //匹配非負浮點數（正浮點數 + 0）
　　^(-([1-9]d*.d*|0.d*[1-9]d*))|0?.0+|0$　　//匹配非正浮點數（負浮點數 + 0）
　　評註：處理大量數據時有用，具體應用時注意修正
　　匹配特定字符串：
　　^[A-Za-z]+$　　//匹配由26個英文字母組成的字符串
　　^[A-Z]+$　　//匹配由26個英文字母的大寫組成的字符串
　　^[a-z]+$　　//匹配由26個英文字母的小寫組成的字符串
　　^[A-Za-z0-9]+$　　//匹配由數字和26個英文字母組成的字符串
　　^w+$　　//匹配由數字、26個英文字母或者下劃線組成的字符串
　　在使用RegularExpressionValidator驗證控件時的驗證功能及其驗證表達式介紹如下:
　　只能輸入數字：“^[0-9]*$”
　　只能輸入n位的數字：“^d{n}$”
　　只能輸入至少n位數字：“^d{n,}$”
　　只能輸入m-n位的數字：“^d{m,n}$”
　　只能輸入零和非零開頭的數字：“^(0|[1-9][0-9]*)$”
　　只能輸入有兩位小數的正實數：“^[0-9]+(.[0-9]{2})?$”
　　只能輸入有1-3位小數的正實數：“^[0-9]+(.[0-9]{1,3})?$”
　　只能輸入非零的正整數：“^+?[1-9][0-9]*$”
　　只能輸入非零的負整數：“^-[1-9][0-9]*$”
　　只能輸入長度爲3的字符：“^.{3}$”
　　只能輸入由26個英文字母組成的字符串：“^[A-Za-z]+$”
　　只能輸入由26個大寫英文字母組成的字符串：“^[A-Z]+$”
　　只能輸入由26個小寫英文字母組成的字符串：“^[a-z]+$”
　　只能輸入由數字和26個英文字母組成的字符串：“^[A-Za-z0-9]+$”
　　只能輸入由數字、26個英文字母或者下劃線組成的字符串：“^w+$”
　　驗證用戶密碼:“^[a-zA-Z]w{5,17}$”正確格式爲：以字母開頭，長度在6-18之間，
　　只能包含字符、數字和下劃線。
　　驗證是否含有^%&'',;=?$"等字符：“[^%&'',;=?$x22]+”
　　只能輸入漢字：“^[u4e00-u9fa5],{0,}$”
　　驗證Email地址：“^w+[-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*$”
　　驗證InternetURL：“^http://([w-]+.)+[w-]+(/[w-./?%&=]*)?$”
　　驗證電話號碼：“^((d{3,4})|d{3,4}-)?d{7,8}$”
　　正確格式爲：“XXXX-XXXXXXX”，“XXXX-XXXXXXXX”，“XXX-XXXXXXX”，
　　“XXX-XXXXXXXX”，“XXXXXXX”，“XXXXXXXX”。
　　驗證身份證號（15位或18位數字）：“^d{15}|d{}18$”
　　驗證一年的12個月：“^(0?[1-9]|1[0-2])$”正確格式爲：“01”-“09”和“1”“12”
　　驗證一個月的31天：“^((0?[1-9])|((1|2)[0-9])|30|31)$”
　　正確格式爲：“01”“09”和“1”“31”。
　　匹配中文字符的正則表達式： [u4e00-u9fa5]
　　匹配雙字節字符(包括漢字在內)：[^x00-xff]
　　匹配空行的正則表達式：n[s| ]*r
　　匹配HTML標記的正則表達式：/<(.*)>.*|<(.*) />/
　　匹配首尾空格的正則表達式：(^s*)|(s*$)
　　匹配Email地址的正則表達式：w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*
　　匹配網址URL的正則表達式：http://([w-]+.)+[w-]+(/[w- ./?%&=]*)?
　　(1)應用：計算字符串的長度（一個雙字節字符長度計2，ASCII字符計1）
　　String.prototype.len=function(){return this.replace([^x00-xff]/g,"aa").length;}
　　(2)應用：javascript中沒有像vbscript那樣的trim函數，我們就可以利用這個表達式來實現
　　String.prototype.trim = function()
　　{
　　return this.replace(/(^s*)|(s*$)/g, "");
　　}
　　(3)應用：利用正則表達式分解和轉換IP地址
　　function IP2V(ip) //IP地址轉換成對應數值
　　{
　　re=/(d+).(d+).(d+).(d+)/g //匹配IP地址的正則表達式
　　if(re.test(ip))
　　{
　　return RegExp.$1*Math.pow(255,3))+RegExp.$2*Math.pow(255,2))+RegExp.$3*255+RegExp.$4*1
　　}
　　else
　　{
　　throw new Error("Not a valid IP address!")
　　}
　　}
　　(4)應用：從URL地址中提取文件名的javascript程序
　　s="http://www.9499.net/page1.htm";
　　s=s.replace(/(.*/){0,}([^.]+).*/ig,"$2") ;//Page1.htm
　　(5)應用：利用正則表達式限制網頁表單裏的文本框輸入內容
　　用正則表達式限制只能輸入中文：οnkeyup="value=value.replace(/[^u4E00-u9FA5]/g,'') "onbeforepaste="clipboardData.setData(''text'',clipboardData.getData(''text'').replace(/[^u4E00-u9FA5]/g,''))"
　　用正則表達式限制只能輸入全角字符： οnkeyup="value=value.replace(/[^uFF00-uFFFF]/g,'') "onbeforepaste="clipboardData.setData(''text'',clipboardData.getData(''text'').replace(/[^uFF00-uFFFF]/g,''))"
　　用正則表達式限制只能輸入數字：οnkeyup="value=value.replace(/[^d]/g,'') "onbeforepaste= "clipboardData.setData(''text'',clipboardData.getData(''text'').replace(/[^d]/g,''))"

　　用正則表達式限制只能輸入數字和英文：οnkeyup="value=value.replace(/[W]/g,'') "onbeforepaste="clipboardData.setData(''text'',clipboardData.getData(''text'').replace(/[^d]/g,''

editplus查找替換的正則表達式應用

表達式        說明
\t        製表符.
\n        新行.
.        匹配任意字符.
|        匹配表達式左邊和右邊的字符. 例如, "ab|bc" 匹配 "ab" 或者 "bc".
[]        匹配列表之中的任何單個字符. 例如, "[ab]" 匹配 "a" 或者 "b". "[0-9]" 匹配任意數字.
[^]        匹配列表之外的任何單個字符. 例如, "[^ab]" 匹配 "a" 和 "b" 以外的字符. "[^0-9]" 匹配任意非數字字符.
*        其左邊的字符被匹配任意次(0次，或者多次). 例如 "be*" 匹配 "b", "be" 或者 "bee".
+        其左邊的字符被匹配至少一次(1次，或者多次). 例如 "be+" 匹配 "be" 或者 "bee" 但是不匹配 "b".
?        其左邊的字符被匹配0次或者1次. 例如 "be?" 匹配 "b" 或者 "be" 但是不匹配 "bee".
^        其右邊的表達式被匹配在一行的開始. 例如 "^A" 僅僅匹配以 "A" 開頭的行.
contentnbsp;       其左邊的表達式被匹配在一行的結尾. 例如 "econtentquot; 僅僅匹配以 "e" 結尾的行.
()        影響表達式匹配的順序，並且用作表達式的分組標記.
\        轉義字符. 如果你要使用 "\" 本身, 則應該使用 "\\".
正則表達式應用——刪除空行   ^[ \t]*\n
表達式的分組使用()來標記. 表達式的分組可以被引用爲 \0, \1, \2, \3, 等等. \0 表示被匹配的所有字符串. \1 表示被匹配的第一個分組, \2 表示第二個分組, 依此類推. 舉例如下.

原文        查找         替換                 結果
abc     (ab)(c)        \0-\1-\2        abc-ab-c
abc     a(b)(c)        \0-\1-\2        abc-b-c
abc     (a)b(c)        \0-\1-\2        abc-a-c

【1】正則表達式應用——替換指定內容到行尾
原始文本如下面兩行
abc aaaaa
123 abc 444

希望每次遇到“abc”，則替換“abc”以及其後到行尾的內容爲“abc efg”
即上面的文本最終替換爲：
abc efg
123 abc efg

解決：
① 在替換對話框，查找內容裏輸入“abc.*”
② 同時勾選“正則表達式”複選框，然後點擊“全部替換”按鈕
其中，符號的含義如下：
“.” ＝匹配任意字符
“*” ＝匹配0次或更多

注意：其實就是正則表達式替換，這裏只是把一些曾經提出的問題加以整理，單純從正則表達式本身來說，就可以引申出成千上萬種特例。

【2】正則表達式應用——數字替換
希望把
asdadas123asdasdas456asdasdasd789asdasd
替換爲:
asdadas[123]asdasdas[456]asdasdasd[789]asdasd

在替換對話框裏面，勾選“正則表達式”複選框；
在查找內容裏面輸入“[0-9][0-9][0-9]”，不含引號
“替換爲:”裏面輸入“[\0\1\2]”，不含引號
範圍爲你所操作的範圍，然後選擇替換即可。

實際上這也是正則表達式的使用特例，“[0-9]”表示匹配0～9之間的任何特例，同樣“[a-z]”就表示匹配a～z之間的任何特例
上面重複使用了“[0-9]”，表示連續出現的三個數字
“\0”代表第一個“[0-9]”對應的原型，“\1”代表第二個“[0-9]”對應的原型，依此類推
“[”、“]”爲單純的字符，表示添加“[”或“]”，如果輸入“其它\0\1\2其它”，則替換結果爲：

asdadas其它123其它asdasdas其它456其它asdasdasd其它789其它asdasd

功能增強（by jiuk2k）：
如果將查找內容“[0-9][0-9][0-9]”改爲“[0-9]*[0-9]”，對應1 或 123 或 12345 或 …
大家根據需要定製

相關內容還有很多，可以自己參考正則表達式的語法仔細研究一下

【3】正則表達式應用——刪除每一行行尾的指定字符
因爲這幾個字符在行中也是出現的,所以肯定不能用簡單的替換實現
比如
12345 1265345
2345
需要刪除每行末尾的“345”
這個也算正則表達式的用法，其實仔細看正則表達式應該比較簡單，不過既然有這個問題提出，說明對正則表達式還得有個認識過程，解決方法如下
解決：
在替換對話框中，啓用“正則表達式”複選框
在查找內容裏面輸入“345contentrdquo;
這裏“contentrdquo;表示從行尾匹配

如果從行首匹配，可以用“^”來實現，不過 EditPlus 有另一個功能可以很簡單的刪除行首的字符串
a. 選擇要操作的行
b. 編輯－格式－刪除行註釋
c. 在彈出對話框裏面輸入要清除的行首字符，確定

【4】正則表達式應用——替換帶有半角括號的多行
幾百個網頁中都有下面一段代碼：
\n
在替換對話框啓用“正則表達式”選項，這時就可以完成替換了

【5】正則表達式應用——刪除空行
啓動EditPlus，打開待處理的文本類型文件。
①、選擇“查找”菜單的“替換”命令，彈出文本替換對話框。選中“正則表達式”複選框，表明我們要在查找、替換中使用正則表達式。然後，選中“替換範圍”中的“當前文件”，表明對當前文件操作。
②、單擊“查找內容”組合框右側的按鈕，出現下拉菜單。
③、下面的操作添加正則表達式，該表達式代表待查找的空行。（技巧提示：空行僅包括空格符、製表符、回車符，且必須以這三個符號之一作爲一行的開頭，並且以回車符結尾，查找空行的關鍵是構造代表空行的正則表達式）。
直接在”查找”中輸入正則表達式“^[ \t]*\n”，注意\t前有空格符。
（1）選擇“從行首開始匹配”，“查找內容”組合框中出現字符“^”，表示待查找字符串必須出現在文本中一行的行首。
（2）選擇“字符在範圍中”，那麼在“^”後會增加一對括號“[]”，當前插入點在括號中。括號在正則表達式中表示，文本中的字符匹配括號中任意一個字符即符合查找條件。
（3）按一下空格鍵，添加空格符。空格符是空行的一個組成成分。
（4）選擇“製表符”，添加代表製表符的“\t”。
（5）移動光標，將當前插入點移到“]”之後，然後選擇“匹配 0 次或更多”，該操作會添加星號字符“*”。星號表示，其前面的括號“[]”內的空格符或製表符，在一行中出現0個或多個。
（6）選擇“換行符”，插入“\n”，表示回車符。
④、“替換爲”組合框保持空，表示刪除查找到的內容。單擊“替換”按鈕逐個行刪除空行，或單擊“全部替換”按鈕刪除全部空行（注意：EditPlus有時存在“全部替換”不能一次性完全刪除空行的問題，可能是程序BUG，需要多按幾次按鈕）。