python3 正則對str去掉標點符號及符號,及提取字符

import re

def remove(text):
   punctuation = '[{?!,;+"\''  # \ 無法去掉,空格可以去掉
    text = re.sub(r'[{}]+'.format(punctuation), '', text)
    return text.strip().lower()
    
text = " '[{!,; + ? Hello, world 你好世界! "
print(remove(text))
print(re.sub(r"[^a-zA-Z0-9\u4e00-\u9fa5]", '',text))  #提取字符
print(re.sub(r"[\u4e00-\u9fa5]", '',text))  #提取中文
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章