python正則過濾標點符號

原創

2020-02-23 18:22

import re

# 過濾不了\\ \ 中文（）還有————
r1 = u'[a-zA-Z0-9’!"#$%&\'()*+,-./:;<=>?@，。?★、…【】《》？“”‘’！[\\]^_`{|}~]+'  # 用戶也可以在此進行自定義過濾字符

# 者中規則也過濾不完全
r2 = "[\s+\.\!\/_,$%^*(+\"\']+|[+——！，。？、~@#￥%……&*（）]+"

# \\\可以過濾掉反向單槓和雙槓，/可以過濾掉正向單槓和雙槓，第一個中括號裏放的是英文符號，第二個中括號裏放的是中文符號，第二個中括號前不能少|，否則過濾不完全
r3 = "[.!//_,$&%^*()<>+\"'?@#-|:~{}]+|[——！\\\\，。=？、：“”‘’《》【】￥……（）]+"

# 去掉括號和括號內的所有內容
r4 = "\\【.*?】+|\\《.*?》+|\\#.*?#+|[.!/_,$&%^*()<>+""'?@|:~{}#]+|[——！\\\，。=？、：“”‘’￥……（）《》【】]"

text = "\崔芸，\\我愛=+你！【我//""們】~————結/婚'吧:：！這.!！_#？?（）個‘’“”￥$主|意()不錯......！"

print(re.sub(r3, '', text))

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

Python---序列化

https://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000/00143192607210600a668b5112e4a979dd2

2020-07-04 06:20:28

Python配置TensorFlow-GPU環境（筆記I）-2018-10-25

系統：Windows10 Python：Anaconda3-5.0.0-Windows-x86_64 主要步驟： 1、環境配置打開Anaconda Prompt，輸入清華倉庫鏡像，這樣更新會快一些。同樣在

2020-06-30 19:47:46

【Python】Paramiko模塊實現Linux服務器遠程文件操作

ssh是一個協議，OpenSSH是其中一個開源實現，paramiko是Python的一個庫，實現了SSHv2協議(底層使用cryptography)。有了Paramiko以後，我們就可以在Python代碼中直接使用SSH協議對遠程服務器

2020-06-30 17:38:31

【Python】內置os.path模塊最常用的一些用法

os.path模塊主要用於文件的屬性獲取，在編程中經常用到，以下是該模塊的幾種常用方法。更多的方法可以去查看官方文檔：http://docs.python.org/library/os.path.html # -*- coding:u

2020-06-30 17:38:17

【Python】hashlib模塊實現MD5加密

MD5消息摘要算法（英語：MD5 Message-Digest Algorithm），一種被計算機安全領域廣泛使用的密碼散列函數，可以產生出一個128位（16字節）的散列值（hash value），用以提供消息的完整性保護，用於確保信息

2020-06-30 16:35:19

【Python】PyCryptodome模塊中5種AES加密模式介紹

分組密碼有五種工作體制： 1.電碼本模式（Electronic Codebook Book (ECB)）； 2.密碼分組鏈接模式（Cipher Block Chaining (CBC)）； 3.計算器模式（Counter (CTR)）；

2020-06-30 16:35:16

【Python】shutil內置模塊複製和重命名文件

在日常工作和生活中，我們經常要複製和重命名文件，如果遇到大量數據處理時，手動去操作非常麻煩，現在我們可以通過python的shutil模塊完成，以下主要介紹幾種場景： 1.複製一個文件到其他目錄，不重新命名； 2.複製一個文件到其他目錄，

2020-06-30 16:35:16

【Python】pyinstaller模塊打包的exe在windows環境無法使用問題彙總

問題一：解決pyinstaller打包發佈後的exe文件打開控制檯閃退的問題 pyinstaller打包發佈後的exe文件在自己電腦能夠正常使用，但是給到別人的電腦時，打開exe文件卻發生閃退，看不到具體的原因。 1、定位問題： 1.1.

2020-06-30 16:35:16

模塊01----Collections

collections的常用類型有：計數器(Counter)雙向隊列(deque)默認字典(defaultdict)有序字典(OrderedDict)可命名元組(namedtuple)使用以上類型時需要導入模塊 from collecti

2020-06-28 10:53:07

python 得進化

編程新手 1 def factorial(x): 2 if x == 0: 3 return 1 4 else:

2020-06-26 21:10:06

python 解碼 unicode 明文

方法1：若爲json 格式，使用json.loads 解碼方法2：使用unicode_escape 解碼方法3：使用eval In [1]: import json In [2]: s = '\u4f60\u597d\uff0

2020-06-26 21:09:50

【教程】在Eclipse中使用PyDev進行Python開發

在折騰：【記錄】使用Python的IDE：Eclipse+PyDev 的過程中，已經：【教程】在Eclipse中安裝PyDev 了，且已經：【教程】在Eclipse中配置剛安裝好的PyDev插件所以，接着去驗證PyD

2020-06-26 21:09:50

beautifulsoup菜鳥教程bs4

http://www.jsphp.net/python/show-24-214-1.html https://beautifulsoup.readthedocs.io/zh_CN/v4.4.0/

2020-06-22 06:50:25

python---aiohttp的使用 python asyncio 獲取協程返回值和使用callback 500併發測試

aiohttp教程 https://www.cnblogs.com/ssyfj/p/9222342.html#14.clientsession-用於在多個連接之間同一網站共享cookie，請求頭等參考教程 https://www.jia

2020-06-22 06:50:25

Selenium 總結

Selenium Selenium是一個Web的自動化測試工具，最初是爲網站自動化測試而開發的，類型像我們玩遊戲用的按鍵精靈，可以按指定的命令自動操作，不同是Selenium 可以直接運行在瀏覽器上，它支持所有主流的瀏覽器（包括Ph

2020-06-22 06:50:19

24小時熱門文章

最新文章

最新評論文章