python通過re正則表達式切割中英文

import re

s = 'alibaba阿里巴巴' # 待分割字符串
en_letter = '[\u0041-\u005a|\u0061-\u007a]+' # 大小寫英文字母
zh_char = '[\u4e00-\u9fa5]+' # 中文字符

print(re.findall(zh_char,s) + re.findall(en_letter,s))

# 輸出: ['阿里巴巴', 'alibaba']

 

 

範圍 說明
\u4e00-\u9fa5 漢字的unicode範圍
\u0030-\u0039 數字的unicode範圍
\u0041-\u005a 大寫字母unicode範圍
\u0061-\u007a 小寫字母unicode範圍
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章