正則表達式

$
  匹配行結束符。例如正則表達式weasel$ 能夠匹配字符串"He's a weasel"的末尾,但是不能匹配字符串"They are a bunch of weasels."。
  ^
  匹配一行的開始。例如正則表達式^When in能夠匹配字符串"When in the course of human events"的開始,但是不能匹配"What and When in the"。
  *
  匹配0或多個正好在它之前的那個字符。例如正則表達式.*意味着能夠匹配任意數量的任何字符。
  /
  這是引用符,用來將這裏列出的這些元字符當作普通的字符來進行匹配。例如正則表達式/$被用來匹配美元符號,而不是行尾,類似的,正則表達式/.用來匹配點字符,而不是任何字符的通配符。
  [ ]
  [c1-c2]
  [^c1-c2]
  匹配括號中的任何一個字符。例如正則表達式r[aou]t匹配rat、rot和rut,但是不匹配ret。可以在括號中使用連字符-來指定字符的區間,例如正則表達式[0-9]可以匹配任何數字字符;還可以制定多個區間,例如正則表達式[A-Za-z]可以匹配任何大小寫字母。另一個重要的用法是“排除”,要想匹配除了指定區間之外的字符——也就是所謂的補集——在左邊的括號和第一個字符之間使用^字符,例如正則表達式[^269A-Z] 將匹配除了2、6、9和所有大寫字母之外的任何字符。
  /< />
  匹配詞(word)的開始(/<)和結束(/>)。例如正則表達式/<the能夠匹配字符串"for the wise"中的"the",但是不能匹配字符串"otherwise"中的"the"。注意:這個元字符不是所有的軟件都支持的。
  /( /)
  將 /( 和 /) 之間的表達式定義爲“組”(group),並且將匹配這個表達式的字符保存到一個臨時區域(一個正則表達式中最多可以保存9個),它們可以用 到 的符號來引用。
  |
  將兩個匹配條件進行邏輯“或”(Or)運算。例如正則表達式(him|her) 匹配"it belongs to him"和"it belongs to her",但是不能匹配"it belongs to them."。注意:這個元字符不是所有的軟件都支持的。
  +
  匹配1或多個正好在它之前的那個字符。例如正則表達式9+匹配9、99、99、9999、99999、……(一個或一個以上“9”)。注意:這個元字符不是所有的軟件都支持的。
  ?
  匹配0或1個正好在它之前的那個字符。注意:這個元字符不是所有的軟件都支持的。
  /{i/}
  /{i,j/}
  匹配指定數目的字符,這些字符是在它之前的表達式定義的。例如正則表達式A[0-9]/{3/} 能夠匹配字符"A"後面跟着正好3個數字字符的串,例如A123、A348等,但是不匹配A1234。而正則表達式[0-9]/{4,6/} 匹配連續的任意4個、5個或者6個數字字符。注意:這個元字符不是所有的軟件都支持的。
  最簡單的元字符是點,它能夠匹配任何單個字符(注意不包括新行符)。假定有個文件test.txt包含以下幾行內容:
  he is a rat
  he is in a rut
  the food is Rotten
  I like root beer
  我們可以使用grep命令來測試我們的正則表達式,grep命令使用正則表達式去嘗試匹配指定文件的每一行,並將至少有一處匹配表達式的所有行顯示出來。命令
  grep r.t test.txt
  在test.txt文件中的每一行中搜索正則表達式r.t,並打印輸出匹配的行。正則表達式r.t匹配一個r接着任何一個字符再接着一個t。所以它將匹配文件中的rat和rut,而不能匹配Rotten中的Rot,因爲正則表達式是大小寫敏感的。要想同時匹配大寫和小寫字母,應該使用字符區間元字符(方括號)。正則表達式[Rr]能夠同時匹配R和r。所以,要想匹配一個大寫或者小寫的r接着任何一個字符再接着一個t就要使用這個表達式:[Rr].t。
  要想匹配行首的字符要使用抑揚字符(^)——又是也被叫做插入符。例如,想找到text.txt中行首"he"打頭的行,你可能會先用簡單表達式he,但是這會匹配第三行的the,所以要使用正則表達式^he,它只匹配在行首出現的h。
  有時候指定“除了×××都匹配”會比較容易達到目的,當抑揚字符(^)出現在方括號中是,它表示“排除”,例如要匹配he ,但是排除前面是t or s的情況(也就是the和she),可以使用:[^st]he。
  可以使用方括號來指定多個字符區間。例如正則表達式[A-Za-z]匹配任何字母,包括大寫和小寫的;正則表達式[A-Za-z][A-Za-z]* 匹配一個字母后面接着0或者多個字母(大寫或者小寫)。當然我們也可以用元字符+做到同樣的事情,也就是:[A-Za-z]+ ,和[A-Za-z][A-Za-z]*完全等價。但是要注意元字符+ 並不是所有支持正則表達式的程序都支持的。關於這一點可以參考後面的正則表達式語法支持情況。
  要指定特定數量的匹配,要使用大括號(注意必須使用反斜槓來轉義)。想匹配所有100和1000的實例而排除10和10000,可以使用:10/{2,3/},這個正則表達式匹配數字1後面跟着2或者3個0的模式。在這個元字符的使用中一個有用的變化是忽略第二個數字,例如正則表達式0/{3,/} 將匹配至少3個連續的0。
  簡單的例子
  這裏有一些有代表性的、比較簡單的例子。
  vi 命令 作用
  :%s/ */ /g 把一個或者多個空格替換爲一個空格。
  :%s/ *$// 去掉行尾的所有空格。
  :%s/^/ / 在每一行頭上加入一個空格。
  :%s/^[0-9][0-9]* // 去掉行首的所有數字字符。
  :%s/b[aeio]g/bug/g 將所有的bag、beg、big和bog改爲bug。
  :%s/t/([aou]/)g/h$t/g 將所有tag、tog和tug分別改爲hat、hot和hug(注意用group的用法和使用引用前面被匹配的字符)。
  中級的例子(神奇的咒語)
  例1
  將所有方法foo(a,b,c)的實例改爲foo(b,a,c)。這裏a、b和c可以是任何提供給方法foo()的參數。也就是說我們要實現這樣的轉換:
  之前 之後
  foo(10,7,2) foo(7,10,2)
  foo(x+13,y-2,10) foo(y-2,x+13,10)
  foo( bar(8), x+y+z, 5) foo( x+y+z, bar(8), 5)
  下面這條替換命令能夠實現這一魔法:
  :%s/foo(/([^,]*/),/([^,]*/),/([^)]*/))/foo($2,$1,$3)/g
  現在讓我們把它打散來加以分析。寫出這個表達式的基本思路是找出foo()和它的括號中的三個參數的位置。第一個參數是用這個表達式來識別的::/([^,]*/),我們可以從裏向外來分析它:
  [^,] 除了逗號之外的任何字符
  [^,]* 0或者多個非逗號字符
  /([^,]*/) 將這些非逗號字符標記爲,這樣可以在之後的替換模式表達式中引用它
  /([^,]*/), 我們必須找到0或者多個非逗號字符後面跟着一個逗號,並且非逗號字符那部分要標記出來以備後用。
  現在正是指出一個使用正則表達式常見錯誤的最佳時機。爲什麼我們要使用[^,]*這樣的一個表達式,而不是更加簡單直接的寫法,例如:.*,來匹配第一個參數呢?設想我們使用模式.*來匹配字符串"10,7,2",它應該匹配"10,"還是"10,7,"?爲了解決這個兩義性(ambiguity),正則表達式規定一律按照最長的串來,在上面的例子中就是"10,7,",顯然這樣就找出了兩個參數而不是我們期望的一個。所以,我們要使用[^,]*來強制取出第一個逗號之前的部分。
  這個表達式我們已經分析到了:foo(/([^,]*/),這一段可以簡單的翻譯爲“當你找到foo(就把其後直到第一個逗號之前的部分標記爲”。然後我們使用同樣的辦法標記第二個參數爲。對第三個參數的標記方法也是一樣,只是我們要搜索所有的字符直到右括號。我們並沒有必要去搜索第三個參數,因爲我們不需要調整它的位置,但是這樣的模式能夠保證我們只去替換那些有三個參數的foo()方法調用,在foo()是一個重載(overoading)方法時這種明確的模式往往是比較保險的。然後,在替換部分,我們找到foo()的對應實例,然後利用標記好的部分進行替換,是的第一和第二個參數交換位置。
  例2
  假設有一個CSV(comma separated value)文件,裏面有一些我們需要的信息,但是格式卻有問題,目前數據的列順序是:姓名,公司名,州名縮寫,郵政編碼,現在我們希望講這些數據重新組織,以便在我們的某個軟件中使用,需要的格式爲:姓名,州名縮寫-郵政編碼,公司名。也就是說,我們要調整列順序,還要合併兩個列來構成一個新列。另外,我們的軟件不能接受逗號前後面有任何空格(包括空格和製表符)所以我們還必須要去掉逗號前後的所有空格。
  這裏有幾行我們現在的數據:
  Bill Jones, HI-TEK Corporation , CA, 95011
  Sharon Lee Smith, Design Works Incorporated, CA, 95012
  B. Amos , Hill Street Cafe, CA, 95013
  Alexander Weatherworth, The Crafts Store, CA, 95014
  ...
  我們希望把它變成這個樣子:
  Bill Jones,CA 95011,HI-TEK Corporation
  Sharon Lee Smith,CA 95012,Design Works Incorporated
  B. Amos,CA 95013,Hill Street Cafe
  Alexander Weatherworth,CA 95014,The Crafts Store
  ...
  我們將用兩個正則表達式來解決這個問題。第一個移動列和合並列,第二個用來去掉空格。
  下面就是第一個替換命令:
  :%s//([^,]*/),/([^,]*/),/([^,]*/),/(.*/)/, ,/
  這裏的方法跟例1基本一樣,第一個列(姓名)用這個表達式來匹配:/([^,]*/),即第一個逗號之前的所有字符,而姓名內容被用標記下來。公司名和州名縮寫字段用同樣的方法標記爲和,而最後一個字段用/(.*/)來匹配("匹配所有字符直到行末")。替換部分則引用上面標記的那些內容來進行構造。
  下面這個替換命令則用來去除空格:
  :%s/[ /t]*,[ /t]*/,/g
  我們還是分解來看:[ /t]匹配空格/製表符,[ /t]* 匹配0或多個空格/製表符,[ /t]*,匹配0或多個空格/製表符後面再加一個逗號,最後,[ /t]*,[ /t]*匹配0或多個空格/製表符接着一個逗號再接着0或多個空格/製表符。在替換部分,我們簡單的我們找到的所有東西替換成一個逗號。這裏我們使用了結尾的可選的g參數,這表示在每行中對所有匹配的串執行替換(而不是缺省的只替換第一個匹配串)。
  例3
  假設有一個多字符的片斷重複出現,例如:
  Billy tried really hard
  Sally tried really really hard
  Timmy tried really really really hard
  Johnny tried really really really really hard
  而你想把"really"、"really really",以及任意數量連續出現的"really"字符串換成一個簡單的"very"(simple is good!),那麼以下命令:
  :%s//(really /)/(really /)*/very /
  就會把上述的文本變成:
  Billy tried very hard
  Sally tried very hard
  Timmy tried very hard
  Johnny tried very hard
  表達式/(really /)*匹配0或多個連續的"really "(注意結尾有個空格),而/(really /)/(really /)* 匹配1個或多個連續的"really "實例。
  困難的例子(不可思議的象形文字)
  Coming soon.
  不同工具中的正則表達式
  OK,你已經準備使用RE(regular expressions,正則表達式),但是你並準備使用vi。所以,在這裏我們給出一些在其他工具中使用RE的例子。另外,我還會總結一下你在不同程序之間使用RE可能發現的區別。
  當然,你也可以在Visual C++編輯器中使用RE。選擇Edit->Replace,然後選擇"Regular expression"選擇框,Find What輸入框對應上面介紹的vi命令:%s/pat1/pat2/g中的pat1部分,而Replace輸入框對應pat2部分。但是,爲了得到vi的執行範圍和g選項,你要使用Replace All或者適當的手工Find Next and Replace(譯者按:知道爲啥有人罵微軟弱智了吧,雖然VC中可以選中一個範圍的文本,然後在其中執行替換,但是總之不夠vi那麼靈活和典雅)。
  sed
  Sed是Stream EDitor的縮寫,是Unix下常用的基於文件和管道的編輯工具,可以在手冊中得到關於sed的詳細信息。
  這裏是一些有趣的sed腳本,假定我們正在處理一個叫做price.txt的文件。注意這些編輯並不會改變源文件,sed只是處理源文件的每一行並把結果顯示在標準輸出中(當然很容易使用重定向來定製):
  sed腳本 描述
  sed 's/^$/d' price.txt 刪除所有空行
  sed 's/^[ /t]*$/d' price.txt 刪除所有隻包含空格或者製表符的行
  sed 's/"//g' price.txt 刪除所有引號
  awk
  awk是一種編程語言,可以用來對文本數據進行復雜的分析和處理。可以在手冊中得到關於awk的詳細信息。這個古怪的名字是它作者們的姓的縮寫(Aho,Weinberger和Kernighan)。
  在Aho,Weinberger和Kernighan的書The AWK Programming Language中有很多很好的awk的例子,請不要讓下面這些微不足道的腳本例子限制你對awk強大能力的理解。我們同樣假定我們針對price.txt文件進行處理,跟sed一樣,awk也只是把結果顯示在終端上。
  awk腳本 描述
  awk ' !~ /^$/' price.txt 刪除所有空行
  awk 'NF > 0' price.txt awk中一個更好的刪除所有空行的辦法
  awk ' ~ /^[JT]/ ' price.txt 打印所有第二個字段是'J'或者'T'打頭的行中的第三個字段
  awk ' !~ /[Mm]isc/ {print + }' price.txt 針對所有第二個字段不包含'Misc'或者'misc'的行,打印第3和第4列的和(假定爲數字)
  awk ' !~ /^[0-9]+/.[0-9]*$/ ' price.txt 打印所有第三個字段不是數字的行,這裏數字是指d.d或者d這樣的形式,其中d是0到9的任何數字
  awk ' ~ /John|Fred/ ' price.txt 如果第二個字段包含'John'或者'Fred'則打印整行
  grep
  grep是一個用來在一個或者多個文件或者輸入流中使用RE進行查找的程序。它的name編程語言可以用來針對文件和管道進行處理。可以在手冊中得到關於grep的完整信息。這個同樣古怪的名字來源於vi的一個命令,g/re/p,意思是global regular expression print。
  下面的例子中我們假定在文件phone.txt中包含以下的文本,——其格式是姓加一個逗號,然後是名,然後是一個製表符,然後是電話號碼:
  Francis, John 5-3871
  Wong, Fred 4-4123
  Jones, Thomas 1-4122
  Salazar, Richard 5-2522
  grep命令 描述
  grep '/t5-...1' phone.txt 把所有電話號碼以5開頭以1結束的行打印出來,注意製表符是用/t表示的
  grep '^S[^ ]* R' phone.txt 打印所有姓以S打頭和名以R打頭的行
  grep '^[JW]' phone.txt 打印所有姓開頭是J或者W的行
  grep ', ..../t' phone.txt 打印所有姓是4個字符的行,注意製表符是用/t表示的
  grep -v '^[JW]' phone.txt 打印所有不以J或者W開頭的行
  grep '^[M-Z]' phone.txt 打印所有姓的開頭是M到Z之間任一字符的行
  grep '^[M-Z].*[12]' phone.txt 打印所有姓的開頭是M到Z之間任一字符,並且點號號碼結尾是1或者2的行
  egrep
  egrep是grep的一個擴展版本,它在它的正則表達式中支持更多的元字符。下面的例子中我們假定在文件phone.txt中包含以下的文本,——其格式是姓加一個逗號,然後是名,然後是一個製表符,然後是電話號碼:
  Francis, John 5-3871
  Wong, Fred 4-4123
  Jones, Thomas 1-4122
  Salazar, Richard 5-2522
  egrep command Description
  egrep '(John|Fred)' phone.txt 打印所有包含名字John或者Fred的行
  egrep 'John|22$|^W' phone.txt 打印所有包含John 或者以22結束或者以W的行
  egrep 'net(work)?s' report.txt 從report.txt中找到所有包含networks或者nets的行
  正則表達式語法支持情況
  命令或環境 . [ ] ^ $ /( /) /{ /} ? + | ( )
  vi X X X X X
  Visual C++ X X X X X
  awk X X X X X X X X
  sed X X X X X X
  Tcl X X X X X X X X X
  ex X X X X X X
  grep X X X X X X
  egrep X X X X X X X X X
  fgrep X X X X X
  perl X X X X X X X X X
  vi替換命令簡介
  Vi的替換命令:
  :ranges/pat1/pat2/g
  其中
  : 這是Vi的命令執行界面。
  range 是命令執行範圍的指定,可以使用百分號(%)表示所有行,使用點(.)表示當前行,使用美元符號($)表示最後一行。你還可以使用行號,例如10,20表示第10到20行,.,$表示當前行到最後一行,.+2,$-5表示當前行後兩行直到全文的倒數第五行,等等。
  s 表示其後是一個替換命令。
  pat1 這是要查找的一個正則表達式,這篇文章中有一大堆例子。
  pat2 這是希望把匹配串變成的模式的正則表達式,這篇文章中有一大堆例子。
  g 可選標誌,帶這個標誌表示替換將針對行中每個匹配的串進行,否則則只替換行中第一個匹配串。

五、常用的正則表達式   常用的正則表達式主要有以下幾種:
  匹配中文字符的正則表達式: [/u4e00-/u9fa5]
  評註:匹配中文還真是個頭疼的事,有了這個表達式就好辦了哦
  獲取日期正則表達式:/d{4}[年|/-|/.]/d{1,2}[月|/-|/.]/d{1,2}日?
  評註:可用來匹配大多數年月日信息。
  匹配雙字節字符(包括漢字在內):[^/x00-/xff]
  評註:可以用來計算字符串的長度(一個雙字節字符長度計2,ASCII字符計1)
  匹配空白行的正則表達式:/n/s*/r
  評註:可以用來刪除空白行
  匹配HTML標記的正則表達式:<(/S*?)[^>]*>.*?</>|<.*? />
  評註:網上流傳的版本太糟糕,上面這個也僅僅能匹配部分,對於複雜的嵌套標記依舊無能爲力
  匹配首尾空白字符的正則表達式:^/s*|/s*$
  評註:可以用來刪除行首行尾的空白字符(包括空格、製表符、換頁符等等),非常有用的表達式
  匹配Email地址的正則表達式:/w+([-+.]/w+)*@/w+([-.]/w+)*/./w+([-.]/w+)*
  評註:表單驗證時很實用
  匹配網址URL的正則表達式:[a-zA-z]+://[^/s]*
  評註:網上流傳的版本功能很有限,上面這個基本可以滿足需求
  匹配帳號是否合法(字母開頭,允許5-16字節,允許字母數字下劃線):^[a-zA-Z][a-zA-Z0-9_]{4,15}$
  評註:表單驗證時很實用
  匹配國內電話號碼:/d{4}-/d{7}|/d{3}-/d{8}
  評註:匹配形式如 0511-4405222 或 021-87888822
  匹配騰訊QQ號:[1-9][0-9]/{4,/}
  評註:騰訊QQ號從10000開始
  匹配中國郵政編碼:[1-9]/d(?!/d)
  評註:中國郵政編碼爲6位數字
  匹配身份證:/d{17}[/d|X]|/d{15}
  評註:中國的身份證爲15位或18位
  匹配ip地址:((2[0-4]/d|25[0-5]|[01]?/d/d?)/.){3}(2[0-4]/d|25[0-5]|[01]?/d/d?)。
  評註:提取ip地址時有用
  匹配特定數字:
  ^[1-9]/d*$ //匹配正整數
  ^-[1-9]/d*$ //匹配負整數
  ^-?[1-9]/d*$ //匹配整數
  ^[1-9]/d*|0$ //匹配非負整數(正整數 + 0)
  ^-[1-9]/d*|0$ //匹配非正整數(負整數 + 0)
  ^[1-9]/d*/./d*|0/./d*[1-9]/d*$ //匹配正浮點數
  ^-([1-9]/d*/./d*|0/./d*[1-9]/d*)$ //匹配負浮點數
  ^-?([1-9]/d*/./d*|0/./d*[1-9]/d*|0?/.0+|0)$ //匹配浮點數
  ^[1-9]/d*/./d*|0/./d*[1-9]/d*|0?/.0+|0$ //匹配非負浮點數(正浮點數 + 0)
  ^(-([1-9]/d*/./d*|0/./d*[1-9]/d*))|0?/.0+|0$ //匹配非正浮點數(負浮點數 + 0)
  評註:處理大量數據時有用,具體應用時注意修正
  匹配特定字符串:
  ^[A-Za-z]+$ //匹配由26個英文字母組成的字符串
  ^[A-Z]+$ //匹配由26個英文字母的大寫組成的字符串
  ^[a-z]+$ //匹配由26個英文字母的小寫組成的字符串
  ^[A-Za-z0-9]+$ //匹配由數字和26個英文字母組成的字符串
  ^/w+$ //匹配由數字、26個英文字母或者下劃線組成的字符串
  評註:最基本也是最常用的一些表達式
  Function IsRegu(Regu,s)
  '正則表達式校驗
  If Regu="" Then
  Exit Function
  End if
  Dim Re,Sre
  Set Re = New RegExp
  Re.Pattern = Regu
  Sre = Re.Test(s)
  If Sre = True Then
  IsRegu = True
  Else
  IsRegu = False
  End If
  End Function
  tmp="[email protected]"
  if (IsRegu("/w+([-+.]/w+)*@/w+([-.]/w+)*/./w+([-.]/w+)*",tmp )) =false then
  msgbox "E-mail地址不合法 !"
  FieldCheck#N=false
  end if
  不同的語言(如PHP和JAVA)、相同語言的不同類庫(如來自Sun的Java Regular Expression類庫跟Apache Jakarta的正則表達式類庫)間,用法會有所差別,在使用的時候,要注意這些差別。

六、Editplus等軟件中正則替換技巧   正則表達式類
  【1】 正則表達式應用——替換指定內容到行尾
  【2】 正則表達式應用——數字替換----------------------------Microshaoft@CCF,jiuk2k@CCF
  【3】 正則表達式應用——刪除每一行行尾的指定字符
  【4】 正則表達式應用——替換帶有半角括號的多行
  【5】 正則表達式應用——刪除空行----------------------------江德華
  軟件技巧類
  ------------------------------------------------------
  【6】 軟件技巧——鍵盤記錄的注意事項
  【7】 軟件技巧——關閉文檔標籤的便捷方法
  【8】 軟件技巧——如何去掉 EditPlus 保存文本文件時的添加後綴提示?
  【9】 軟件技巧——提示找不到語法文件的解決辦法
  【10】軟件技巧——設置editplus支持其它文字,如韓文----------jackywu1978@LJF
  【11】軟件技巧——FTP 上傳的設置----------------------------李應文2.11漢化版
  【12】軟件技巧——如何禁用備份文件功能?
  【13】軟件技巧——添加語法文件、自動完成文件、以及剪輯庫文件
  工具集成類
  ------------------------------------------------------
  【14】工具集成——編譯器集成例子(Java、Borland C++、Visual C++、Inno Setup、nsis、C#)
  【15】工具集成——讓Editplus調試PHP程序----------------------avenger,aukw@CCF
  【16】工具集成——打造 PHP 調試環境(二)----------------------老七2.11漢化版
  【17】在 WINPE 中集成 EDITPLUS
  後續添加
  ------------------------------------------------------
  【18】支持帶UTF-8標記/不帶UTF-8標記的文件
  每個步驟都說得很詳細了,就沒有必要貼圖了,體積不要太大才好。
  【1】正則表達式應用——替換指定內容到行尾
  原始文本如下面兩行
  abc aaaaa
  123 abc 444
  希望每次遇到“abc”,則替換“abc”以及其後到行尾的內容爲“abc efg”
  即上面的文本最終替換爲:
  abc efg
  123 abc efg
  解決:
  ① 在替換對話框,查找內容裏輸入“abc.*”
  ② 同時勾選“正則表達式”複選框,然後點擊“全部替換”按鈕
  其中,符號的含義如下:
  “.” =匹配任意字符
  “*” =匹配0次或更多
  注意:其實就是正則表達式替換,這裏只是把一些曾經提出的問題加以整理,單純從正則表達式本身來說,就可以引申出成千上萬種特例。
  【2】正則表達式應用——數字替換 (Microshaoft@CCF,jiuk2k@CCF)
  希望把
  asdadas123asdasdas456asdasdasd789asdasd
  替換爲:
  asdadas[123]asdasdas[456]asdasdasd[789]asdasd
  在替換對話框裏面,勾選“正則表達式”複選框;
  在查找內容裏面輸入“[0-9][0-9][0-9]”,不含引號
  “替換爲:”裏面輸入“[/0/1/2]”,不含引號
  範圍爲你所操作的範圍,然後選擇替換即可。
  實際上這也是正則表達式的使用特例,“[0-9]”表示匹配0~9之間的任何特例,同樣“[a-z]”就表示匹配a~z之間的任何特例
  上面重複使用了“[0-9]”,表示連續出現的三個數字
  “/0”代表第一個“[0-9]”對應的原型,“/1”代表第二個“[0-9]”對應的原型,依此類推
  “[”、“]”爲單純的字符,表示添加“[”或“]”,如果輸入“其它/0/1/2其它”,則替換結果爲:
  asdadas其它123其它asdasdas其它456其它asdasdasd其它789其它asdasd
  功能增強(by jiuk2k@CCF):
  如果將查找內容“[0-9][0-9][0-9]”改爲“[0-9]*[0-9]”,對應1 或 123 或 12345 或 ...
  大家根據需要定製
  相關內容還有很多,可以自己參考正則表達式的語法仔細研究一下
  【3】正則表達式應用——刪除每一行行尾的指定字符
  因爲這幾個字符在行中也是出現的,所以肯定不能用簡單的替換實現
  比如
  12345 1265345
  2345
  需要刪除每行末尾的“345”
  這個也算正則表達式的用法,其實仔細看正則表達式應該比較簡單,不過既然有這個問題提出,說明對正則表達式還得有個認識過程,解決方法如下
  解決:
  在替換對話框中,啓用“正則表達式”複選框
  在查找內容裏面輸入“345$”
  這裏“$”表示從行尾匹配
  如果從行首匹配,可以用“^”來實現,不過 EditPlus 有另一個功能可以很簡單的刪除行首的字符串
  a. 選擇要操作的行
  b. 編輯-格式-刪除行註釋
  c. 在彈出對話框裏面輸入要清除的行首字符,確定
  【4】正則表達式應用——替換帶有半角括號的多行
  幾百個網頁中都有下面一段代碼:
  <script LANGUAGE="JavaScript1.1">
  <!--
  htmlAdWH('93163607', '728', '90');
  //-->
  </SCRIPT>
  我想把它們都去掉,可是找了很多search & replace的軟件,都是隻能對“一行”進行操作。
  EditPlus 打開幾百個網頁文件還是比較順暢的,所以完全可以勝任這個工作。
  具體解決方法,在 Editplus 中使用正則表達式,由於“(”、“)”被用做預設表達式(或者可以稱作子表達式)的標誌,所以查找
  “<script LANGUAGE="JavaScript1.1">/n<!--/nhtmlAdWH('93163607', '728', '90'.);/n//-->/n</SCRIPT>/n”
  時會提示查找不到,所以也就無法進行替換了,這時可以把“(”、“)”使用任意字符標記替代,即半角句號:“.”。替換內容爲
  <script LANGUAGE="JavaScript1.1">/n<!--/nhtmlAdWH.'93163607', '728', '90'.;/n//-->/n</SCRIPT>/n
  在替換對話框啓用“正則表達式”選項,這時就可以完成替換了
  補充:(lucida@DRL)
  對( ) 這樣的特殊符號,應該用/( /)來表示,這也是很標準的regexp語法,可以寫爲
  <script LANGUAGE="JavaScript1.1">/n<!--/nhtmlAdWH/('93163607', '728', '90'/);/n//-->/n</SCRIPT>/n
  【5】正則表達式應用——刪除空行
  啓動EditPlus,打開待處理的文本類型文件。
  ①、選擇“查找”菜單的“替換”命令,彈出文本替換對話框。選中“正則表達式”複選框,表明我們要在查找、替換中使用正則表達式。然後,選中“替換範圍”中的“當前文件”,表明對當前文件操作。
  ②、單擊“查找內容”組合框右側的按鈕,出現下拉菜單。
  ③、下面的操作添加正則表達式,該表達式代表待查找的空行。(技巧提示:空行僅包括空格符、製表符、回車符,且必須以這三個符號之一作爲一行的開頭,並且以回車符結尾,查找空行的關鍵是構造代表空行的正則表達式)。
  直接在"查找"中輸入正則表達式“^[ /t]*/n”,注意/t前有空格符。
  (1)選擇“從行首開始匹配”,“查找內容”組合框中出現字符“^”,表示待查找字符串必須出現在文本中一行的行首。
  (2)選擇“字符在範圍中”,那麼在“^”後會增加一對括號“[]”,當前插入點在括號中。括號在正則表達式中表示,文本中的字符匹配括號中任意一個字符即符合查找條件。
  (3)按一下空格鍵,添加空格符。空格符是空行的一個組成成分。
  (4)選擇“製表符”,添加代表製表符的“/t”。
  (5)移動光標,將當前插入點移到“]”之後,然後選擇“匹配 0 次或更多”,該操作會添加星號字符“*”。星號表示,其前面的括號“[]”內的空格符或製表符,在一行中出現0個或多個。
  (6)選擇“換行符”,插入“/n”,表示回車符。
  ④、“替換爲”組合框保持空,表示刪除查找到的內容。單擊“替換”按鈕逐個行刪除空行,或單擊“全部替換”按鈕刪除全部空行(注意:EditPlus有時存在“全部替換”不能一次性完全刪除空行的問題,可能是程序BUG,需要多按幾次按鈕)。
  【6】軟件技巧——鍵盤記錄的注意事項
  EditPlus 的鍵盤記錄有些類似於 UltraEdit 的宏操作,不過功能相對單一,錄製的文件可編輯性較差。
  由於基本無法編輯錄制的文件,所以錄製的時候爲了避免錄製失敗,推薦純粹使用鍵盤操作,以下是比較關鍵的幾個鍵盤組合:
  Ctrl+F = 調出查找對話框
  Ctrl+H = 調出替換對話框
  Alt+F4 = 關閉作用,比如,關閉查找對話框、關閉替換對話框,等等
  其它鍵盤快捷鍵在“幫助-快捷鍵列表”裏面可以很容易的查找到,這裏就不細說了。
  【7】軟件技巧——關閉文檔標籤的便捷方法
  右鍵單擊文檔標籤工具條,彈出菜單中選擇“標籤選項”,選中“用鼠標中間的按鈕關閉”,這裏包括鼠標的滾輪。
  【8】軟件技巧——如何去掉 EditPlus 保存文本文件時的添加後綴提示?
  如果你使用 EditPlus 進行文本編輯,那麼每次創建文本文件,編輯後保存時,儘管文件類型下拉列表中顯示的是文本文件, EditPlus 還是詢問你是否添加".txt"後綴,是不是很煩?
  解決方法:
  ① 在程序目錄建立一個空的文件“template.txt”
  ② “工具-參數設置-模板”裏面,單擊“添加”按鈕添加模板,“菜單文本”這裏輸入“Text”,瀏覽“template.txt”,之後確定即可
  ③ “文件-新建-text”,就可以建立一個空的文本文件,保存時,這個文件自動帶有擴展名".txt",也就避免了令人頭疼的確認
  ④ 模板設置文件名稱爲“template.ini”,如果和主程序同一路徑,可以使用相對路徑
  羅嗦了點,不過管用
  要自動創建帶有某種後綴的文件,方法同上。
  【9】軟件技巧——提示找不到語法文件 *.stx 的解決辦法
  原因多爲設置的語法文件不存在或者是路徑設置不對。這是因爲 EditPlus 的語法是設置文件採用的是絕對路徑,而在你設置了語法文件之後,再把程序複製到其它目錄,因而導致 EditPlus 無法找到該語法文件。
  解決辦法:
  在主程序目錄裏,找到 Setting.ini 這是 EditPlus 存放語法的文件
  查找後綴爲“.stx”、“acp”的文本內容,或者查找帶有驅動器符號的行,比如
  Syntax file=C:/Program Files/EditPlus 2/cpp.stx
  那麼,就把”C:/Program Files/EditPlus 2/“替換成你當前軟件的路徑。
  其它提示找不到文件的解決方法同上
  【10】軟件技巧——設置editplus支持其它文字,如韓文
  在editplus裏打開文件,出來打開文件對話框;然後點擊“轉換器”後面的那個省略號,會出來自定義轉換器對話框;在右邊選擇你需要的編碼方式,添加到左邊,然後點確定;最後在下拉框中選擇需要的編碼方式,然後打開文件即可。
  【11】軟件技巧——FTP 上傳的設置
  “文件->遠程操作->FTP 上傳”在“設置”選項卡中設置好參數(“子目錄”前面應該加“/”如“/web/”),點擊“確定”回到“FTP 上傳”選項卡,然後點擊“上傳”即可;“批量上傳”的設置類似。
  【12】軟件技巧——如何禁用備份文件功能?
  在“參數選擇”的文件選項頁,禁用“'保存時自動創建備份文件”選項
  【13】軟件技巧——添加語法文件、自動完成文件、以及剪輯庫文件
  要添加 *.STX(語法文件)或 *.ACP(自動完成文件):
  1. 選擇“參數選擇→語法”
  2. 單擊“添加”按鈕,命名,在“擴展名”部分輸入對應擴展名(不帶“.”)
  3. 瀏覽/輸入 STX(語法文件部分) 以及 ACP(自動完成文件部分)。
  添加剪輯庫文件(*.CTL)
  複製相應 *.CTL 文件到軟件安裝目錄,重新啓動 EditPlus ,則系統自動識別。
  作者主頁有很多語法自動完成文件下載,地址
  http://editplus.com/files.html
  【14】工具集成——編譯器集成例子(Java、Borland C++、Visual C++、Inno Setup、nsis)
  在“工具→參數選擇→用戶工具”選項頁設置,設置步驟
  ① 設置組名稱,這裏也可以不設置
  ② 單擊“添加工具→應用程序”按鈕並進行如下設置
  ③ 各種類似"$(FilePath)"的參數可以在文本框右側的箭頭下拉菜單中獲取,具體含義如下
  參數 描述
  $(FilePath) 文件路徑(文件全名,含目錄和文件名)
  $(FileDir) 文件目錄(不帶文件名)
  $(FileName) 文件名(不帶目錄)
  $(FileNameNoExt) 不帶擴展名的文件名(不帶目錄)
  $(FileExt) 擴展名(當前文件)
  $(ProjectName) 工程名稱(當前工程名)
  $(CurLine) 當前行號(光標位置處的行號)
  $(CurCol) 當前列號(光標位置處的列號)
  $(CurSel) 當前文本(插入當前選定文本)
  $(CurWord) 當前單詞(插入當前單詞)
  $(WindowList) 顯示當前窗口列表並選擇特定文件
  例子 1. Java 編譯器
  菜單文本:Java 編譯器
  命令:c:/java/bin/javac.exe
  參數:"$(FilePath)"
  初始目錄:$(FileDir)
  捕獲輸出:開啓
  要運行已編譯的 Java 類文件,你可以進行如下設置:
  菜單文本:Java
  命令:c:/java/bin/java.exe
  參數:$(FileNameNoExt)
  初始目錄:$(FileDir)
  “命令”部分應當替換爲實際的 Java 解釋器的路徑。
  例子 2. Borland C++
  菜單文本:Borland C
  命令:c:/bc/bin/bcc32.exe
  參數:-Ic:/bc/include -Lc:/bc/lib -n$(FileDir) $(FilePath)
  初始目錄:c:/bc/bin
  捕獲輸出:開啓
  例子 3. Visual C++
  菜單文本:Visual C++
  命令:c:/msdev/vc98/bin/cl.exe
  參數:"$(FilePath)"
  初始目錄:$(FileDir)
  捕獲輸出:開啓
  例子 4. Inno Setup
  菜單文本:編譯 Inno
  命令:C:/Program Files/Inno Setup 4/Compil32.exe”
  參數:/cc $(FileName)
  初始目錄:$(FileDir)
  捕獲輸出:開啓
  例子 5. nsis
  菜單文本:編譯 nsis
  命令:C:/NSIS/makensis.exe
  參數:$(FileName)
  初始目錄:$(FileDir)
  捕獲輸出:開啓
  例子 6. C#
  菜單文本:編譯 C#
  命令:C:/WINDOWS/Microsoft.NET/Framework/v1.0.3705/csc.exe
  參數:$(FileName)
  初始目錄:$(FileDir)
  捕獲輸出:開啓
  在上面設置中,在命令部分,必須使用系統中各自編譯器的絕對路徑。
  設置完畢後,你可以在“工具”菜單運行對應工具了,運行結果會顯示在底部的輸出窗口,你也可以通過快捷鍵(Ctrl + 0-9) 運行,或者是通過“用戶工具欄”的快捷按鈕運行。
  要運行已編譯的 *.exe 文件,你可以進行如下設置(此時可執行文件需要和編譯文件同名):
  菜單文本:Run
  命令:$(FileNameNoExt)
  參數:
  初始目錄:$(FileDir)
  【15】工具集成—— 讓Editplus調試PHP程序
  1:打開Editplus,選擇"工具->配置用戶工具..."菜單。
  2:在彈出的窗口中選擇"添加工具->應用程序",給新程序起一個好記的名字,比如這裏我們用"Debug PHP",在"菜單文本"中輸入"Debug PHP"。點擊"命令行"右邊的按鈕,找到你的php.exe所在的路徑,例如這裏是"c:/php/php.exe"。再點擊"參數"右邊的下拉按鈕選擇"文件路徑",最後再把"捕獲輸出"前面的複選框選上。
  3:現在測試一下,新建一個php文件,按快捷鍵Ctrl+1可以激活剛纔我們設置的工具(如果你設置了多個工具,快捷鍵可能會有所不同),現在你可以看到它已經能正常工作了。但是還有一點不太理想:如果你的PHP程序出錯,在輸出窗口會提示你第幾行出錯 ,單擊這一行提示,Editplus老是提示你找不到某某文件,是否新建。接下下我們要修正這個功能。
  4:打開剛纔用戶工具設置窗口,找到剛纔設置的"Debug PHP"工具。點擊"捕獲輸出"複選框旁邊的"輸出模式"按鈕,會彈出一個定義輸出模式的窗體,把"使用默認輸出模式"前面的複選框去掉, 在"正則表達式"這一項的文本框中輸入" ^.+ in (.+) line ([0-9]+) "(不包括引號),細心的朋友可能會發現,這裏使用的也正則表達式的語法。然後,在下面的"文件名"下拉菜單中選擇"預設表達式 1",即上邊正則表達式中的第一個參數,"行"下拉菜單項選擇"預設表達式 2","列"下拉項保持爲空。然後保存設置。
  5:好了,現在再來試一下吧,雙擊出錯的行數,Editplus就會自動激活出錯文件,並把光標定位到出錯行,是不是特別方便呢?!
  現在,Editplus經過我們的"改造",已經可以即時的調試PHP文件了,雖然還不是"可視化"界面的,但對於一些平常的小程序來查錯還是非常好用的。Editplus真是不款不可多得的好工具,如果你有什麼使用技巧,不要忘了大家一起分享哦。^O^
  如果不能切換錯誤行號,請嘗試作如下修改: (by aukw@CCF)
  1.php.ini 中html_errors = Off打開
  //如果你不打開,3.中的表達式要修改
  2.參數改成:-q -f "$(FilePath)"
  //不加"符號的話文件名有空格的文件調試失敗。。
  //-q不輸出html頭信息,你去掉也行,不過調試時候你一般用不到那些header信息
  3." ^.+ in (.+) line ([0-9]+) " 改成 "^.+ in (.+) on line ([0-9]+)$"
  //如果還是不行,請注意調試結果,自己修改表達式來取出文件名和行號
  【16】工具集成——打造 PHP 調試環境(二)
  1: 把剪輯庫定位在 PHP4 Functions 上就可以在編輯時, 利用[插入]->[匹配剪輯]命令,就可以自動完成末輸入完整的 PHP 函數(或直接按 F2 鍵)
  2: 類似上面,在選擇部分文字後,同樣可以自動完成。(同 F2)
  3: 在[參數選擇]->[設置和語法]->PHP->自動完成, 選擇目錄下的 php.acp 文件,你可以定製自己的自動完成方式.
  4: 想要即時預覽文件,可在[參數選擇]->[工具]->WEB 服務器中添加本地目錄,(注意不要加 http:// , 應是一個有效的站點)。
  如: 主機->localhost/php | 根目錄->D:/php
  主機->localhost/asp | 根目錄->D:/asp
  主機->localhost/cgi | 根目錄->D:/cgi
  完成設置後只要腳本文件位於這些目錄下(子目錄也沒問題), 就能夠正確解釋.
  5: 各種語法和模板文件可以在 http://editplus.com/files.html 獲得,可根據需要選用和編輯。
  6: Ctrl+F11 可顯示當前文件中的函數列表.
  7: 添加各種用戶工具.如:
  啓動MYSQL服務器管理工具->C:/mysql/bin/winmysqladmin.exe
  啓動Apache服務器->C:/Apache/bin/Apache.exe -k start
  啓動Apache服務器->C:/Apache/bin/Apache.exe -k stop (shutdown)
  8: DBG 附帶有一個 prof_results.php 文件,可剖析 PHP 程序的性能.
  雖不是真正的調試器,但已經夠了.
  OK! 經過改造後,是不是有點象一個 IDE 什麼?還差點,沒有即時幫助...看我的,再來:
  9: 把 php_manual_en.chm (最好是擴展幫助手冊)加入到用戶工具中, 當遇到需要參考的關鍵字時, 把光標定位其上, 按下快捷鍵 Ctrl+1, 看到了嗎.
  在輸入時有想不起來的函數名時, 先按照第 1 條的方法調出函數, 然後...怎麼樣?
  以上有的是對於調試工具的設置,由於此類工具比較多,大家設置時參考以上的基本就差不多了,所以就不過多的列舉了。
  【17】在 WINPE 中集成 EDITPLUS
  可以基於目前的bartpe做得WINPE中,菜單使用nu2menu製作
  默認位置爲 /programs/editplus/
  默認系統位置爲光盤的 i386 目錄
  i386/system32 的 autorun.bat 中添加外殼集成(系統右鍵)
  regedit /s %SystemDrive%/programs/editplus/REG.REG
  regsvr32 /s /programs/editplus/EPPSHELL.DLL
  (reg.reg保存了epp的工具欄信息,當然註冊用戶也可以放置註冊信息)
  複製editplus安裝包裏面的文件到programs/editplus/,注意,如果有setting.ini,刪掉該文件,在nu2menu裏面加入以下句子(可以根據需要安排位於特定菜單條目下)
  <MITEM TYPE="ITEM" DISABLED="@Not(@FileExists(@GetProgramDrive()/Programs/EditPlus/editplus.exe))" CMD="RUN"
  FUNC="@GetProgramDrive()/Programs/EditPlus/editplus.exe">EditPlus 文本編輯</MITEM>
  【18】支持帶UTF-8標記/不帶UTF-8標記的文件 Lei@DRL提出並測試
  這裏Byte Order Mark翻譯爲標記/文件頭/標籤
  參數選擇-文件-裏面設置“支持不帶有UTF-8文件頭的UTF-8文件”,我這裏翻譯標籤爲UTF-8文件頭,如果複選該項,應該是保存爲不帶標籤的Utf-8,如果不復選,應該是保存成帶有BOM的UTF-8。
  這樣就可以打開帶簽名的UTF-8文件,並且可以正常編輯,但是又不能打開不帶簽名的了,想要打開不帶簽名的還需要改回來...不過雖然有點麻煩,但是總算能用了
  1.驗證用戶名和密碼:("^[a-zA-Z]/w{5,15}$")正確格式:"[A-Z][a-z]_[0-9]"組成,並且第一個字必須爲字母6~16位;
  2.驗證電話號碼:("^(/d{3.4}-)/d{7,8}$")正確格式:xxx/xxxx-xxxxxxx/xxxxxxxx;
  3.驗證身份證號(15位或18位數字):("^/d{15}|/d{18}$");
  4.驗證Email地址:("^/w+([-+.]/w+)*@/w+([-.]/w+)*/./w+([-.]/w+)*$");
  5.只能輸入由數字和26個英文字母組成的字符串:("^[A-Za-z0-9]+$") ;
  6.整數或者小數:^[0-9]+/.{0,1}[0-9]{0,2}$
  7.只能輸入數字:"^[0-9]*$"。
  8.只能輸入n位的數字:"^/d{n}$"。
  9.只能輸入至少n位的數字:"^/d{n,}$"。
  10.只能輸入m~n位的數字:。"^/d{m,n}$"
  11.只能輸入零和非零開頭的數字:"^(0|[1-9][0-9]*)$"。
  12.只能輸入有兩位小數的正實數:"^[0-9]+(.[0-9]{2})?$"。
  13.只能輸入有1~3位小數的正實數:"^[0-9]+(.[0-9]{1,3})?$"。
  14.只能輸入非零的正整數:"^/+?[1-9][0-9]*$"。
  15.只能輸入非零的負整數:"^/-[1-9][]0-9"*$。
  16.只能輸入長度爲3的字符:"^.{3}$"。
  17.只能輸入由26個英文字母組成的字符串:"^[A-Za-z]+$"。
  18.只能輸入由26個大寫英文字母組成的字符串:"^[A-Z]+$"。
  19.只能輸入由26個小寫英文字母組成的字符串:"^[a-z]+$"。
  20.驗證是否含有^%&',;=?$/"等字符:"[^%&',;=?$/x22]+"。
  21.只能輸入漢字:"^[/u4e00-/u9fa5]{0,}$"
  22.驗證URL:"^http://([/w-]+/.)+[/w-]+(/[/w-./?%&=]*)?$"。
  23.驗證一年的12個月:"^(0?[1-9]|1[0-2])$"正確格式爲:"01"~"09"和"1"~"12"。
  24.驗證一個月的31天:"^((0?[1-9])|((1|2)[0-9])|30|31)$"正確格式爲;"01"~"09"和"1"~"31"。
  .(小圓點)
  匹配除換行符號外的任意字符
  /w
  匹配字母、數字、下劃線和漢字
  /s
  匹配任意空白字符
  /d
  匹配數字
  /b
  匹配單詞的開始或結束
  ^
  匹配字符串的開始,或排除
  $
  匹配字符串的結束
  以上都是單個字符匹配
  如果要求匹配元字符中的符號,則需要加反斜槓。例如/+表示匹配加號
  www.baidu.com和www/.baidu/.com
  *
  重複零次或多次
  +
  重複一次或多次
  ?
  重複零次或一次
  {n}
  重複n次
  {n,}
  至少重複n次
  {n,m}
  重複n到m次
  /d{1,3}/./d{1,3}/./d{1,3}/./d{1,3}
  ^w{3}/..+/./w+$
  []
  表示匹配中括號中的任一字符
  ()
  小括號內的爲一個整體
  |
  前後兩者任意匹配一種
  /(?0/d{2}[)-]?/d{8}
  (/(0/d{2}/)/d{8})|(0/d{2}-/d{8})|0/d{2}/d{8}
  /W:與/w相反
  /S:與/s相反
  /D:與/d相反
  /B:與/b相反
  [^something]:與[something]相反
  0/d{2}-/d{8}
  /b/w{6}/b
  ^/w+
  <a[^>]+>
  Windows98|Windows2000|WindosXP
  ((2[0-4]/d|25[0-5]|[01]?/d/d?)/.){3}(2[0-4]/d|25[0-5]|[01]?/d/d?)
  ^/w+([-+.]/w+)*@/w+([-.]/w+)*/./w+([-.]/w+)*$
  ^/+?[1-9][0-9]*$和^/-[1-9][]0-9“*$
  ^[A-Za-z]+$和^[A-Z]+$和^[a-z]+$
  ^[a-zA-Z]/w{5,15}$

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章