MySQL必知必會九：用正則表達式進行搜索

1. 基本字符匹配

我們從一個非常簡單的例子開始。下面的語句檢索列prod_name包含文本1000的所有行：

mysql> SELECT prod_name FROM products WHERE prod_name REGEXP '1000' ORDER BY prod_name;
+--------------+
| prod_name    |
+--------------+
| JetPack 1000 |
+--------------+

分析：除關鍵字LIKE被REGEXP替代外，這條語句看上去非常像使用LIKE的語句。它告訴MySQL： REGEXP後所跟的東西作爲正則表達式（與文字正文1000匹配的一個正則表達式）處理。

爲什麼要費力地使用正則表達式？在剛纔的例子中，正則表達式確實沒有帶來太多好處（可能還會降低性能），不過，請考慮下面的例子：

mysql> SELECT prod_name FROM products WHERE prod_name REGEXP '.000' ORDER BY prod_name;
+--------------+
| prod_name    |
+--------------+
| JetPack 1000 |
| JetPack 2000 |
+--------------+

分析：這裏使用了正則表達式.000。 .是正則表達式語言中一個特殊的字符。它表示匹配任意一個字符，因此， 1000和2000都匹配且返回。
LIKE與REGEXP的區別：LIKE匹配整個列。如果被匹配的文本在列值中出現， LIKE將不會找到它，相應的行也不被返回（除非使用通配符）。而REGEXP在列值內進行匹配，如果被匹配的文本在列值中出現， REGEXP將會找到它，相應的行將被返回。這是一個非常重要的差別。
匹配不區分大小寫：MySQL中的正則表達式匹配不區分大小寫。爲區分大小寫，可使用BINARY關鍵字，如WHERE prod_name REGEXP BINARY 'JetPack .000'。

2. 進行OR匹配

爲搜索兩個串之一（或者爲這個串，或者爲另一個串），使用|，如下所示：

mysql> SELECT prod_name FROM products WHERE prod_name REGEXP '1000|2000' ORDER BY prod_name;
+--------------+
| prod_name    |
+--------------+
| JetPack 1000 |
| JetPack 2000 |
+--------------+

分析：語句中使用了正則表達式1000|2000。 |爲正則表達式的OR操作符。它表示匹配其中之一，因此1000和2000都匹配並返回。
使用|從功能上類似於在SELECT語句中使用OR語句，多個OR條件可併入單個正則表達式。兩個以上的OR條件可以給出兩個以上的OR條件。例如，'1000 | 2000 | 3000'將匹配1000或2000或3000。

3. 匹配幾個字符之一

匹配任何單一字符。但是，如果你只想匹配特定的字符，怎麼辦？可通過指定一組用[和]括起來的字符來完成，如下所示：

mysql> SELECT prod_name FROM products WHERE prod_name REGEXP '[123] Ton' ORDER BY prod_name;
+-------------+
| prod_name   |
+-------------+
| 1 ton anvil |
| 2 ton anvil |
+-------------+

分析：這裏，使用了正則表達式[123] Ton。 [123]定義一組字符，它的意思是匹配1或2或3，因此， 1 ton和2 ton都匹配且返回（沒有3 ton）。

正如所見， []是另一種形式的OR語句。事實上，正則表達式[123]Ton爲[1|2|3]Ton的縮寫，也可以使用後者。但是，需要用[]來定義OR語句查找什麼。爲更好地理解這一點，請看下面的例子：

mysql> SELECT prod_name FROM products WHERE prod_name REGEXP '1|2|3 Ton' ORDER BY prod_name;
+---------------+
| prod_name     |
+---------------+
| 1 ton anvil   |
| 2 ton anvil   |
| JetPack 1000  |
| JetPack 2000  |
| TNT (1 stick) |
+---------------+

分析：MySQL假定你的意思是'1'或'2'或'3 ton'。除非把字符|括在一個集合中，否則它將應用於整個字符串。

字符集合也可以被否定，即，它們將匹配除指定字符外的任何東西。爲否定一個字符集，在集合的開始處放置一個^即可。因此，儘管[123]匹配字符1、 2或3，但[^123]卻匹配除這些字符外的任何東西。

4. 匹配範圍

範圍不限於完整的集合， [1-3]和[6-9]也是合法的範圍。此外，範圍不一定只是數值的， [a-z]匹配任意字母字符。

mysql> SELECT prod_name FROM products WHERE prod_name REGEXP '[1-5] Ton' ORDER BY prod_name;
+--------------+
| prod_name    |
+--------------+
| .5 ton anvil |
| 1 ton anvil  |
| 2 ton anvil  |
+--------------+

分析：這裏使用正則表達式[1-5] Ton。 [1-5]定義了一個範圍，這個表達式意思是匹配1到5，因此返回3個匹配行。由於5 ton匹配，所以返回.5 ton。

5.匹配特殊字符

爲了匹配特殊字符，必須用\\爲前導。 \\-表示查找-， \\.表示查找.。

mysql> SELECT vend_name FROM vendors WHERE vend_name REGEXP '\\.' ORDER BY vend_name;
+--------------+
| vend_name    |
+--------------+
| Furball Inc. |
+--------------+

\也用來引用元字符（具有特殊含義的字符）。

元字符	說明
\\f	換頁
\\n	換行
\\r	回車
\\t	製表
\\v	縱向製表

匹配\：爲了匹配反斜槓\字符本身，需要使用\\\。
\或\：多數正則表達式實現使用單個反斜槓轉義特殊字符，以便能使用這些字符本身。但MySQL要求兩個反斜槓（ MySQL自己解釋一個，正則表達式庫解釋另一個）。

6. 匹配字符類

可以使用預定義的字符集，稱爲字符類（ character class）。

類	說明
[:alnum:]	任意字母和數字（同[a-zA-Z0-9]）
[:alpha:]	任意字符（同[a-zA-Z]）
[:blank:]	空格和製表（同[\\t]）
[:cntrl:]	ASCII控制字符（ ASCII 0到31和127）
[:digit:]	任意數字（同[0-9]）
[:graph:]	與[:print:]相同，但不包括空格
[:lower:]	任意小寫字母（同[a-z]）
[:print:]	任意可打印字符
[:punct:]	既不在[:alnum:]又不在[:cntrl:]中的任意字符
[:space:]	包括空格在內的任意空白字符（同[\f\n\r\t\v]）
[:upper:]	任意大寫字母（同[A-Z]）
[:xdigit:]	任意十六進制數字（同[a-fA-F0-9]）

7. 匹配多個實例

元字符	說明
*	0個或多個匹配
+	1個或多個匹配（等於{1,}）
?	0個或1個匹配（等於{0,1}）
{n}	指定數目的匹配
{n,}	不少於指定數目的匹配
{n,m}	匹配數目的範圍（ m不超過255）

mysql> SELECT prod_name FROM products WHERE prod_name REGEXP '[[:digit:]]{4}' ORDER BY prod_name;
+--------------+
| prod_name    |
+--------------+
| JetPack 1000 |
| JetPack 2000 |
+--------------+

分析：如前所述， [:digit:]匹配任意數字，因而它爲數字的一個集合。 {4}確切地要求它前面的字符（任意數字）出現4次，所以[[:digit:]]{4}匹配連在一起的任意4位數字。

8. 定位符

元字符	說明
^	文本的開始
$	文本的結尾
[[:<:]]	詞的開始
[[:>:]]	詞的結尾

mysql> SELECT prod_name FROM products WHERE prod_name REGEXP '^[0-9\\.]';
+--------------+
| prod_name    |
+--------------+
| .5 ton anvil |
| 1 ton anvil  |
| 2 ton anvil  |
+--------------+

分析：^匹配串的開始。因此， ^[0-9\\.]只在.或任意數字爲串中第一個字符時才匹配它們。

^的雙重用途：^有兩種用法。在集合中（用[和]定義），用它來否定該集合，否則，用來指串的開始處。
使REGEXP起類似LIKE的作用： LIKE和REGEXP的不同在於， LIKE匹配整個串而REGEXP匹配子串。利用定位符，通過用^開始每個表達式，用$結束每個表達式，可以使REGEXP的作用與LIKE一樣。
簡單的正則表達式測試：可以在不使用數據庫表的情況下用SELECT來測試正則表達式。REGEXP檢查總是返回0（沒有匹配）或1（匹配）。可以用帶文字串的REGEXP來測試表達式，並試驗它們。相應的語法如下：SELECT 'hello' REGEXP '[0-9]';這個例子顯然將返回0（因爲文本hello中沒有數字）。

MySQL必知必會九：用正則表達式進行搜索

1. 基本字符匹配

2. 進行OR匹配

3. 匹配幾個字符之一

4. 匹配範圍

5.匹配特殊字符

6. 匹配字符類

7. 匹配多個實例

8. 定位符

公司新來一個幹練小夥，把 MyBatis 替換成 MyBatis-Plus，上線後哭暈在廁所。。。

Testin雲測上線華爲Pura 70系列真機測試服務！

5款開源、美觀、強大的WPF UI組件庫

10分鐘本地運行llama3及初體驗

golang 表格

手寫協議報文 c語言手法

甲骨文(Oracle)宣佈將以74億美元收購Sun公司

MySQL必知必會十三：分組數據

圖解HTTP六：HTTP 首部

圖解HTTP三：HTTP 報文內的 HTTP 信息

Python3關於selenium的強制等待、隱式等待和顯式等待(附上EC的主要方法)

圖解HTTP七：確保 Web 安全的 HTTPS

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結