Impala & Hive 保留中文字符

先放impala的:

select
city
from 表名
where ds >= %start_date%
and ds <= %end_date%
and REGEXP_LIKE(city,'^[\u4e00-\u9fa5]*$')
字符 說明
\u4e00-\u9fa5 漢字的unicode範圍
\u0030-\u0039 數字的unicode範圍
\u0041-\u005a 大寫字母unicode範圍
\u0061-\u007a 小寫字母unicode範圍

注意:
數字 和 字母可以不使用上面提供的unicode碼來分辨, 而使用下面的方式 (其實都是一樣的):

^[\u4e00-\u9fa5_a-zA-Z0-9]+$
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章