web信息中常會遇到“\u4f60\u597d”類型的字符。首先’\u‘開頭就基本表明是跟unicode編碼相關的,“\u”後的16進制字符串是相應漢字的utf-16編碼。python裏decode()和encode()爲我們提供瞭解碼和編碼的方法。其中decode('unicode_escape')能將此種字符串解碼爲unicode字符串。
比如:
有篇講python編碼的文章比較好,http://blog.csdn.net/liuxincumt/article/details/8183391
另附兩個在線工具
1、漢字轉換unicode編碼
http://www.bangnishouji.com/tools/chtounicode.html
2、漢字編碼查詢
http://xn--p8s370b.xn--fiqs8s/