import re
s = 'alibaba阿里巴巴' # 待分割字符串
en_letter = '[\u0041-\u005a|\u0061-\u007a]+' # 大小寫英文字母
zh_char = '[\u4e00-\u9fa5]+' # 中文字符
print(re.findall(zh_char,s) + re.findall(en_letter,s))
# 輸出: ['阿里巴巴', 'alibaba']
範圍 | 說明 |
---|---|
\u4e00-\u9fa5 | 漢字的unicode範圍 |
\u0030-\u0039 | 數字的unicode範圍 |
\u0041-\u005a | 大寫字母unicode範圍 |
\u0061-\u007a | 小寫字母unicode範圍 |