關於編碼
GBK編碼是GB2312編碼的超集,向下完全兼容GB2312,同時GBK收錄了Unicode基本多文種平面中的所有CJK漢字。
GB18030編碼向下兼容GBK和GB2312,兼容的含義是不僅字符兼容,而且相同字符的編碼也相同。GB18030收錄了所有Unicode3.1中的字符,包括中國少數民族字符,GBK不支持的韓文字符等等,也可以說是世界大多民族的文字符號都被收錄在內。
UTF-8包含全世界所有國家需要用到的字符,是國際編碼,通用性強。
出現的錯誤
>>> a='龑'
>>> a
'龑'
>>> a.encode('gbk')
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
UnicodeEncodeError: 'gbk' codec can't encode character '\u4dae' in position 0: illegal multibyte sequence
#gb18030
>>> a.encode('gb18030')
b'\xfe\x9f'
>>> b=a.encode('gb18030')
>>> b
#因爲utf-8 包含全世界所有國家需要用到的字符,這裏在連接時指定編碼可以解決這個問題
connection = cx_Oracle.connect("hr", userpwd, "dbhost.example.com/orclpdb1", encoding="UTF-8")