先放impala的:
select
city
from 表名
where ds >= %start_date%
and ds <= %end_date%
and REGEXP_LIKE(city,'^[\u4e00-\u9fa5]*$')
字符 | 說明 |
---|---|
\u4e00-\u9fa5 | 漢字的unicode範圍 |
\u0030-\u0039 | 數字的unicode範圍 |
\u0041-\u005a | 大寫字母unicode範圍 |
\u0061-\u007a | 小寫字母unicode範圍 |
注意:
數字 和 字母可以不使用上面提供的unicode碼來分辨, 而使用下面的方式 (其實都是一樣的):
^[\u4e00-\u9fa5_a-zA-Z0-9]+$