import re
def remove(text):
punctuation = '[{?!,;+"\'' # \ 無法去掉,空格可以去掉
text = re.sub(r'[{}]+'.format(punctuation), '', text)
return text.strip().lower()
text = " '[{!,; + ? Hello, world 你好世界! "
print(remove(text))
print(re.sub(r"[^a-zA-Z0-9\u4e00-\u9fa5]", '',text)) #提取字符
print(re.sub(r"[\u4e00-\u9fa5]", '',text)) #提取中文
python3 正則對str去掉標點符號及符號,及提取字符
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章
虛擬環境只導出項目需要的依賴的版本
yahuuu
2020-07-08 07:41:49
Python3 012:100到200的素數
依汉南
2020-07-08 05:45:09
Python3 個稅計算
依汉南
2020-07-08 05:45:09
Python3 階乘求和
依汉南
2020-07-08 05:45:09
Python3 磁盤讀寫
依汉南
2020-07-08 05:45:09
Python3 完全平方數
依汉南
2020-07-08 05:45:09
Python3 這天第幾天
依汉南
2020-07-08 05:45:09
Python3 copy
依汉南
2020-07-08 05:45:09
Python3 數字組合
依汉南
2020-07-08 05:45:09
分享一款pycharm / intellij好看的主題。(python和java)
pycharm / intellij 直接導入jar包,應用即可。 圖 java配色。 傳送門 提取碼:do0w
qq_43355847
2020-07-08 03:50:43
pandas 多級表頭
df.columns.get_level_values(0).values # 索引層級從0開始 返回一個list df.columns.to_list() # 返回一個 [(), (), ()]
qq_43355847
2020-07-08 03:14:50
關於pandas多級表頭,輸出Excel文件空白行問題
qq_43355847
2020-07-08 03:14:50
解決python第三方庫使用pip安裝失敗的問題
Life will be better
2020-07-07 23:46:23
關於 Jupyter notebook 的 kernel error 問題
汤姆鱼
2020-07-07 23:19:57