python cx_Oracle 查询到生僻字报错问题处理

关于编码

GBK编码是GB2312编码的超集,向下完全兼容GB2312,同时GBK收录了Unicode基本多文种平面中的所有CJK汉字。

GB18030编码向下兼容GBK和GB2312,兼容的含义是不仅字符兼容,而且相同字符的编码也相同。GB18030收录了所有Unicode3.1中的字符,包括中国少数民族字符,GBK不支持的韩文字符等等,也可以说是世界大多民族的文字符号都被收录在内。

UTF-8包含全世界所有国家需要用到的字符,是国际编码,通用性强。

出现的错误

>>> a='䶮'
>>> a
'䶮'
>>> a.encode('gbk')
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
UnicodeEncodeError: 'gbk' codec can't encode character '\u4dae' in position 0: illegal multibyte sequence

#gb18030 

>>> a.encode('gb18030')
b'\xfe\x9f'
>>> b=a.encode('gb18030')
>>> b

#因为utf-8 包含全世界所有国家需要用到的字符,这里在连接时指定编码可以解决这个问题
connection = cx_Oracle.connect("hr", userpwd, "dbhost.example.com/orclpdb1", encoding="UTF-8")
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章