python cx_Oracle 查詢到生僻字報錯問題處理

關於編碼

GBK編碼是GB2312編碼的超集,向下完全兼容GB2312,同時GBK收錄了Unicode基本多文種平面中的所有CJK漢字。

GB18030編碼向下兼容GBK和GB2312,兼容的含義是不僅字符兼容,而且相同字符的編碼也相同。GB18030收錄了所有Unicode3.1中的字符,包括中國少數民族字符,GBK不支持的韓文字符等等,也可以說是世界大多民族的文字符號都被收錄在內。

UTF-8包含全世界所有國家需要用到的字符,是國際編碼,通用性強。

出現的錯誤

>>> a='龑'
>>> a
'龑'
>>> a.encode('gbk')
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
UnicodeEncodeError: 'gbk' codec can't encode character '\u4dae' in position 0: illegal multibyte sequence

#gb18030 

>>> a.encode('gb18030')
b'\xfe\x9f'
>>> b=a.encode('gb18030')
>>> b

#因爲utf-8 包含全世界所有國家需要用到的字符,這裏在連接時指定編碼可以解決這個問題
connection = cx_Oracle.connect("hr", userpwd, "dbhost.example.com/orclpdb1", encoding="UTF-8")
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章