正则表达式

原創

2019-10-28 03:40

在爬虫的时候，正则表达式是一个非常好的助手，这篇博文主要记录下正则表达式中的基本符号。

符号	含义	示例	说明
*	匹配前面的字符0次或更多次	ab	匹配aa或bbb或bbbbbb，
+	匹配前面的字符1次或更多次	a+b+	匹配abbb或aabbb
?	匹配前面的字符0次或1次
{m}	匹配前面的字符m次
{m,}	匹配前面的字符m次或更多次
{m,n}	匹配前面的字符m次到n次
\b	匹配单词的开始或结束	\ba\b	匹配a
^	匹配字符串开始	^is	匹配以is开始的字符串
$	匹配字符串结束	are$	匹配以end结尾的字符串
.	匹配除换行符外的任意单个字符
\w	匹配字母或数字或汉字或下划线
\s	匹配任意的空字符串
\d	匹配数字
[]	匹配中括号里的任意一个字符
[^]	匹配不在中括号里的任意一个字符	[^aeiou]	匹配任意非元音字母字符
?!	不包含		表示后面的字符不能出现在目标字符串里
\|	分支	b(a\|b\|c)e	匹配bae或bbe或bce

下面是re模块的几个核心函数。
1.re.compile(pattern, flags=0)
返回正则表达式对象
2.re.match(pattern, string, flags=0)
如果成功匹配字符串的话，返回对象，否则，返回None
3.re.findall(pattern, string, flags=0)
查找字符串所有与正则表达式匹配的模式，返回字符串的列表
4.re.sub(pattern, repl, string, count=0, flags=0)
用指定的字符串去替换原子符串中与正则表达式相匹配的模式。

sentence = "我你dirty talk，你dirty talk，我"
m = re.sub("[dirty talk]+","*",sentence)
m

Out：

'我你*，你*，我'

5.re.split(pattern, string, maxsplit=0, flags=0)
用与正则表达式相匹配的模式去分割字符串，返回列表。

sentence = "Help# on   & function, split in module re"
m = re.split("[#&,(?!(\s))]+",sentence)
m

Out:

['Help', 'on', 'function', 'split', 'in', 'module', 're']

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

Python学习二：列表、循环、元组、字典

《毫無障礙學Python》鄧文淵著學習筆記 1.列表結構（List） (又稱清單，即爲其他語言的數組Array) 列表的使用：列表名 = [元素1,元素2,…] 中括號隔開，元素數據類型可同可不同，獲取元素值方法：下標訪問（下

2020-07-08 11:00:43

Python学习一：变量与数据类型、表达式、条件语句

《毫無障礙學Python》鄧文淵著學習筆記變量與數據類型、表達式、條件語句變量 score = 80 #Python變量不聲明就可使用，Python會根據變量值設定數據類型，該score爲int型 fruit = "香蕉"

2020-07-08 11:00:42

Python学习六：web数据抓取与分析

《毫無障礙學Python》鄧文淵著學習筆記 web數據抓取與分析 1.網址解析 . 　　通過Python的 urlparse組件中的 urlparse函數，可對網址進行解析，其返回值爲元組類型的ResultParse對象，通過其

2020-07-08 11:00:42

Python学习五：sqlite数据库

《毫無障礙學Python》鄧文淵著學習筆記 sqlite數據庫注：需要有數據庫基礎（會用SQL語句創建表，對錶內容進行增刪改查操作即可） sqlite安裝教程參考：https://www.runoob.com/sqlite/

2020-07-08 11:00:42

Python学习四：文件操作

《毫無障礙學Python》鄧文淵著學習筆記文件操作 1. open() 函數 open() 函數打開文件　　python內建函數可打開指定文件用於對文件讀取、修改、添加內容　　open(filename[,mode]

2020-07-08 11:00:42

Python学习三：函数、导包、目录（文件夹）管理

《毫無障礙學Python》鄧文淵著學習筆記 1.函數 1.1 函數基本（1）語法： . 　　def 函數名(參數1，參數2，參數3,…): 　　#參數可無　　　　程序塊　　return 返回值1,返回值2,返回值3…

2020-07-08 11:00:42

Python：计算类别分布CalculateClassDistribution

import numpy as np import pandas as pd from sklearn import datasets from sklearn.ensemble import RandomForestClassifie

2020-07-08 07:35:14

Python调用matlab 函数

在python中啓動matlab： engine = matlab.engine.start_matlab() 如果輸入的變量X是表格式的數據（n*d），即 ndarray格式，需要進行轉換後再輸入： data_list= matla

2020-07-08 07:35:11

Python：将sklearn自带数据转存为CSV文件

import numpy as np import pandas as pd from sklearn import datasets X,y = datasets.load_breast_cancer(return_X_y=True

2020-07-08 07:35:10

Python:一排三个子图

import matplotlib.pyplot as plt import numpy as np import pandas as pd path1 = r"D:\ExperimentalData\Jain\jain.csv" pa

2020-07-08 07:35:10

Python : 一排三个子图（二）

import matplotlib.pyplot as plt import numpy as np import pandas as pd path11 = r"D:\ExperimentalData\Jain\multiCenter

2020-07-08 07:35:08

Python：New Balanced Active Learning Model and Optimization Algorithm--2018IJCAI

參考文獻：New Balanced Active Learning Model and Optimization Algorithm--2018IJCAI 原文代碼找了好久沒有找到，至少Github上沒有找到（2020-06-10之前）

2020-07-08 07:35:07

Python：在python中调用Weka的方法

讓您你們失望了，我啥都沒寫。提供鏈接 https://blog.csdn.net/weixin_30832351/article/details/94889557

2020-07-08 07:35:07

Python：两个ndarray数据进行矩阵乘法

import numpy as np a = np.array([[1,2,3],[1,2,3],[1,2,3]]) # print(a) # print(a ** 2) c = np.array([1,2,3]) b = np.arr

2020-07-08 07:35:07

Python: numpy.random的使用

import numpy as np print(np.random.random()) 0.7714546557122427 輸出單個0-1之間的隨機數 import numpy as np print(np.random.r

2020-07-08 07:35:07

24小時熱門文章

最新文章

最新評論文章