C#學習之正則表達式基礎

概念、定義、介紹參考源碼中註釋部分。

新建控制檯應用程序,源碼如下:

using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.Text.RegularExpressions;

namespace _07使用正則表達式
{
    class Program
    {
        static void Main(string[] args)
        {
            #region 概念、定義、介紹
            //1、 .:匹配除\n之外的任何單個字符。例如正則表達式“b.g”能匹配如下字符串:“big”、“bug”、“b g”,但是不匹配“buug”,“b..g”可以匹配“buug”。 
            //2、[ ] :匹配括號中的任何一個字符。例如正則表達式“b[aui]g”匹配bug、big和bag,但是不匹配beg、baug。可以在括號中使用連字符“-”來指定字符的區間來簡化表示,
            //例如正則表達式[0-9]可以匹配任何數字字符,這樣正則表達式“a[0-9]c”等價於“a[0123456789]c”就可以匹配“a0c”、“a1c”、“a2c”等字符串;還可以制定多個區間,
            //例如“[A-Za-z]”可以匹配任何大小寫字母,“[A-Za-z0-9]”可以匹配任何的大小寫字母或者數字。
            //3、| :將兩個匹配條件進行邏輯“或”運算。‘z|food’ 能匹配 “z” 或 “food”。‘(z|f)ood’ 則匹配 “zood” 或 “food”。 //注意^$問題。
            //4、( ) :將 () 之間括起來的表達式定義爲“組”(group),並且將匹配這個表達式的字符保存到一個臨時區域,這個元字符在字符串提取的時候非常有用。
            //把一些字符表示爲一個整體。改變優先級、定義提取組兩個作用。
            //5、*:匹配0至多個在它之前的子表達式,和通配符*沒關係。例如正則表達式“zo*”(等同於z(o)*)能匹配 “z” 、“zo”以及 “zoo”;
            //因此“.*”意味着能夠匹配任意字符串。"z(b|c)*"→zb、zbc、zcb、zccc、zbbbccc。"z(ab)*"能匹配z、zab、zabab(用括號改變優先級)。

            //6、+ :匹配前面的子表達式一次或多次,和*對比(0到多次)。例如正則表達式9+匹配9、99、999等。 “zo+”能匹配 “zo”以及 “zoo” ,不能匹配"z"。
            //7、? :匹配前面的子表達式零次或一次。例如,“do(es)?” 可以匹配 “do” 或 “does” 。一般用來匹配“可選部分”。(終止貪婪模式)
            //8、{n} :匹配確定的 n 次。“zo{2}”→zoo。例如,“e{2}” 不能匹配“bed”中的“e”,但是能匹配“seed”中的兩個“e”。 //seeeed,不可以。
            //9、{n,} :至少匹配n次。例如,“e{2,}”不能匹配“bed”中的“e”,但能匹配 “seeeeeeeed”中的所有“e”。 
            //10、{n,m} :最少匹配 n 次且最多匹配 m 次。“e{1,3}”將匹配“seeeeeeeed”中的前三個“e”。 {2,5}//bed,seed,seeed;beeeeed錯誤。限定符:限定前面的正則表達式出現的次數。 
            //11、^(shift+6) :匹配一行的開始。例如正則表達式“^regex”能夠匹配字符串“regex我會用”的開始,但是不能匹配“我會用regex”。
            //12、^另外一種意思:非!([^0-9])
            //13、$ :匹配行結束符。例如正則表達式“浮雲$” 能夠匹配字符串“一切都是浮雲”的末尾,但是不能匹配字符串“浮雲呀”  

            //簡寫表達式
            //1、\d:代表一個數字,等同於[0-9]   \\d  →\d
            //2、\D:代表非數字,等同於[^0-9]
            //3、\s:代表換行符、Tab製表符等空白字符 ,(空格、回車、製表符)
            //4、\S:代表非空白字符(a0%$@@)
            //5、\w:匹配字母或數字或下劃線或漢字,即能組成單詞的字符,除%&#@!$等字符。[a-zA-Z0-9_漢字]
            //6、\W:非\w ,等同於[^\w] %

            //在.net中使用正則表達式的時候就使用Regex這個類
            //Regex.IsMatch();//判斷一個字符串是否匹配某個正則表達式
            //Regex.Match();//從某個字符串中提取匹配正則表達式的某個子字符串(只能提取一個)
            //Regex.Matches();//
            //Regex.Replace();//
            #endregion

            #region Regex.IsMatch()
            string reg = "^a.+b$";
            bool b = Regex.IsMatch("axxx.b", reg);
            Console.WriteLine(b);

            Console.WriteLine(Regex.IsMatch("bbbbg", "^b.*g$")); //yes
            Console.WriteLine(Regex.IsMatch("bg", "^b.*g$")); //yes
            Console.WriteLine(Regex.IsMatch("gege", "^b.*g$"));//No

            string regexp = @"\d{6}";
            string msg = "中關村軟件園100094,哈哈厚黑!";
            //這時,返回的結果是true,因爲正則表達式中沒有寫開始(^)和結束($)   ^和$
            //所以,IsMatch()方法在msg這個字符串中,只要找到任何一個與regexe匹配的字符串就返回true
            Console.WriteLine(Regex.IsMatch(msg, regexp));//true

            string regexp1 = @"^\d{6}$"; //這時才表示整個字符串必須與該正則表達式完全匹配
            string msg1 = "中關村軟件園100094,哈哈厚黑!";
            Console.WriteLine(Regex.IsMatch(msg1, regexp1));//false,完全匹配

            //string regexp = "^(z|food)$";
            string regexp2 = "^z|food$";
            while (true)
            {
                Console.WriteLine("請輸入一個字符串:");
                string msg2 = Console.ReadLine();

                Console.WriteLine(Regex.IsMatch(msg2, regexp2));
            }

            //對比說明:
            //1.^z|food$
            //表示以z開頭的任意字符串 或者 以 food結尾的任意字符串都返回true
            //原因是:|的優先級最低。所以上邊的表達式其實: (^z)|(food$)

            //2.z|food
            //表示 z 或者 food 不表示,zood,但是,由於該正則表達式沒有寫^ 和$ 。所以在整個字符串中,只要有任意一個位置出現z或者food都返回true

            //3.^(z|f)ood$ 這個才表示要麼是zood要麼是food,只能匹配這兩個。
            //^zood$|^food$  ,與^z|food$不一樣,^z|food$表示z.......或者......food
            #endregion
        }
    }
}



發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章