在python代碼中輸出一個字符的unicode編碼

如果ch是一個unicode字符:print '\u%04x' % ord(ch)
ord(ch)返回的是這個字符的unicode編碼的10進制形式,只需要將其按照unicode的格式用16進制打印出來即可

例如:


上面這個例子中就打印出了"你"、"好"、"a"這三個unicode字符的unicode碼。

unicode字符就是unicode字符串中的字符,對於字符串常量來說,以u爲前綴的是unicode字符串;如果一個是從utf-8文本文件中讀取的一行str,轉換過爲unicode字符串只需要decode即可:
line = myfile.readline()
uniline = line.decode('utf-8') //此時uniline就是unicode字符串了,如果是gbk格式的文件,則要用gbk編碼來decode
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章