正則表達式與re庫

正則表達式：
regular expression regex RE

通用的字符串表達框架

簡潔表達一組字符串的表達式

針對字符串表達“簡潔”和“特徵”思想的工具

判斷某字符串的特徵歸屬

主要應用在字符串匹配中

使用：

編譯：將符合正則表達式語法的字符串轉換成正則表達式特徵。

p = re.compile(regex)

#編譯後的特徵與一組字符串對應，編譯前的正則表達式只是一個符合正則表達式語法的單一字符串，不是真正意義上的正則表達式

語法：由字符和操作符構成。

常用操作符：

. 表示任何單個字符

[] 字符集，對單個字符給出取值範圍 [abc]表示a、b、c，[a-z]表示a到z單個字符。

[^] 非字符集，對單個字符給出排除範圍 [^abc]表示非a或非b的單個字符

* 前一個字符0次或無限次擴展 abc*表示ab、abc、abccc等

+ 前一個字符1次或無限次擴展 abc+表示abc、abcc、abccc等

？前一個字符0次或1次擴展 abc?表示ab、abc

| 左右表達式任意一個 abc|def表示abc、def

{m} 擴展前一個字符m次 ab{2}c表示abbc

{m,n} 擴展前一個字符m至n次(含n) ab{1,2}c表示abc、abbc

^ 匹配字符串開頭 ^abc表示abc且在一個字符串的開頭

$ 匹配字符串結尾 $abc表示abc且在一個字符串的結尾

() 分組標記，內部只能使用|操作符 (abc)表示abc，(abc|def)表示abc、def

\d 數字，等價於[0-9]

\w 單詞字符，等價於[A-Za-z0-9_]

經典正則表達式:

^[A-Za-z]+$ 由26個字母組成的字符串

^[A-Za-z0-9]+$ 由26個字母和數字組成的字符串

^-?\d+$ 整數形式的字符串

^[0-9]*[1-9][0-9]*$ 正整數形式的字符串

[\u4e00-\u9fa5] 匹配中文字符

----------------------------------------------------------------------------------------------------------------------------------------------------

RE庫的使用：

使用re（正則表達式）庫 import re

re庫使用raw string類型表達正則表達式，表示爲：r.'text'，如r'[1-9]\d{5}'

原生字符串：不包含轉義符的字符串

也可使用string類型，但該類型將'\'視作轉義符，表達繁瑣，如'[1-9]\\d{5}'

RE庫主要功能函數：

re.search(pattern,string,flags=0)

在一個字符串中搜索匹配正則表達式的第一個位置，返回match對象

pattern：正則表達式的字符串或原生字符串表示

string：待匹配字符串

flags：正則表達式使用時的控制標記

re.I/re.IGNORECASE，忽略正則表達式的大小寫，[A-Z]能匹配小寫字符

re.M/re.MULTILINE，正則表達式中的^操作符能夠將給定字符串的每行當作匹配開始

re.S/re.DOTALL，正則表達式中的.操作符能夠匹配所有字符，默認匹配除換行外所有字符

re.match(pattern,string,flags=0)

從一個字符串的開始位置起匹配正則表達式，返回match對象

使用時注意用if語句判斷是否返回的match對象是空的，否則如是，系統報錯

re.findall(pattern,string,flags=0)

搜索字符串，以列表類型返回全部匹配的子串

re.split(pattern,string,maxsplit=0,flags=0)

將一個字符串按照正則表達式匹配結果進行分割，返回列表類型

（匹配的部分去掉，剩下的部分分別作爲分割的字符串元素放到列表裏）

maxsplit：最大分割數，剩餘部分作爲最後一個元素輸出

re.finditer(pattern,string,flags=0)

搜索字符串，返回一個匹配結果的迭代類型，每個迭代元素是match對象

re.sub(pattern,repl,string,cout=0,flags=0)

在一個字符串中替換所有匹配正則表達式的子串，返回替換後的字符串

repl：替換匹配字符串的字符串

cout：匹配的最大替換次數

RE庫的match對象（一次匹配的結果）

match對象的屬性：

.string，待匹配的文字

.re，匹配時使用的pattern對象（正則表達式）

.pos，正則表達式搜索文本開始位置

.endpos，正則表達式搜索文本的結束位置

match對象的方法：

.group(0)，獲得匹配後的字符串

.start()，匹配字符串在原始字符串的開始位置

.end()，匹配字符串在原始字符串的結束位置

.span()，返回(.start(),.end())

RE庫的貪婪匹配和最小匹配

例：

match = re.search(r'PY.*N','PYANBNCNDN')

match.group(0)

返回'PYANBNCNDN'

RE庫默認採用貪婪匹配，即輸出匹配最長的子串

最小匹配，在操作符後加*

例：

match = re.search(r'PY.*？N','PYANBNCNDN')

match.group(0)

返回'PYAN'

正則表達式與re庫

vue項目獲取富文本編輯器wangEditor內容導出爲word（html轉word格式並下載）

dotnet C# 創建 X11 應用時設置窗口背景顏色

Navicat安裝與激活教程

TDengine docker安裝方法

vue3組件通信與props

sapui5

Alpine Linux apk add DNS lookup error

部分JDK版本的發佈時間

工作中用到的腳本合集

合併代碼時Beyond Compare設置

正則表達式與re庫

鼠標消失/文字模糊/相對位置

python print輸出不自動換行

信息組織與提取方法

python 漢諾塔攻略

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結