[url]http://blog.csdn.net/moodytong/article/details/8136258[/url]
字符串編碼常用類型:utf-8,gb2312,cp936,gbk等。
python中,我們使用decode()和encode()來進行解碼和編碼
在python中,使用unicode類型作爲編碼的基礎類型。即
decode encode
str ---------> unicode --------->str
u = u'中文' #顯示指定unicode類型對象u
str = u.encode('gb2312') #以gb2312編碼對unicode對像進行編碼
str1 = u.encode('gbk') #以gbk編碼對unicode對像進行編碼
str2 = u.encode('utf-8') #以utf-8編碼對unicode對像進行編碼
u1 = str.decode('gb2312')#以gb2312編碼對字符串str進行解碼,以獲取unicode
u2 = str.decode('utf-8')#如果以utf-8的編碼對str進行解碼得到的結果,將無法還原原來的unicode類型
如上面代碼,str\str1\str2均爲字符串類型(str),給字符串操作帶來較大的複雜性。
好消息來了,對,那就是python3,在新版本的python3中,取消了unicode類型,代替它的是使用unicode字符的字符串類型(str),字符串類型(str)成爲基礎類型如下所示,而編碼後的變爲了字節類型(bytes)但是兩個函數的使用方法不變:
decode encode
bytes ------> str(unicode)------>bytes
u = '中文' #指定字符串類型對象u
str = u.encode('gb2312') #以gb2312編碼對u進行編碼,獲得bytes類型對象str
u1 = str.decode('gb2312')#以gb2312編碼對字符串str進行解碼,獲得字符串類型對象u1
u2 = str.decode('utf-8')#如果以utf-8的編碼對str進行解碼得到的結果,將無法還原原來的字符串內容
python
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章
不同字符編碼轉換(UTF8 UNICODE ANSI)
suhiymof
2020-07-04 14:14:50
一文搞懂文件在不同的平臺傳輸過程中的編碼轉換
simpleGq
2020-07-01 12:26:50
Linux 編碼轉換 (iconv失敗的解決方法)
躺着的树懒
2020-06-27 01:05:39
關於爬取數據保存到json文件,中文是unicode解決方式
time_tries_all
2020-06-07 01:39:48
php cp936轉utf8編碼轉換亂碼問題的解決方案
南通SEO
2020-05-19 22:52:46
FreeBSD中文亂碼問題
郗富琦
2020-02-23 11:44:06
linux 批量編碼轉換公具
helloworldyu
2020-02-23 05:45:56
iconv 用法封裝
simdsoft
2020-02-21 09:07:09
stringByAddingPercentEncodingWithAllowedCharacters和CFURLCreateStringByAddingPercentEscapes的使用
漂泊_
2020-02-20 18:42:10
perl 自動識別編碼,轉換編碼
zhaoyangjian724
2019-01-25 22:07:15
Linux使用iconv進行編碼轉換
Wang93IT
2018-10-20 05:43:47
轉:中文編碼基礎知識介紹
fzy112001
2018-09-06 15:41:13
java:實現字符串到二進制字符、16進制字符、unicode字符、base64字符之間的轉換
云潇洒
2018-09-03 19:10:12
常見字符編碼介紹以及相互轉換
春天随风而逝
2018-09-03 18:11:14