在 Python3 中，bytes 和 str 的互相轉換方式是

原創

adolfmc

2020-11-11 13:43

str.encode('utf-8')
bytes.decode('utf-8')

字符串前加 b

python3.x裏默認的str是(py2.x裏的)unicode, bytes是(py2.x)的str, b 前綴代表的就是bytes

python2.x裏, b前綴沒什麼具體意義，只是爲了兼容python3.x的這種寫法

小知識：

python2默認字符編碼是ASCII, 當你用python2的解釋器去運行你寫好的py2代碼(硬盤中), 解釋器會用ASCII的編碼規則去讀取, 由於ACSII編碼不支持中文, 所以我們一般在py2代碼首行: #encoding: utf-8來指定字符編碼規則爲utf-8

python3默認的字符編碼是Unicode, 當你用python3的解釋器去執行你寫好的py3代碼(硬盤中), 解釋器會用UTF-8編碼規則來讀取

例: response = b'<h1>Hello World!</h1>' # b' ' 表示這是一個 bytes 對象

作用： b" "前綴表示：後面字符串是bytes 類型。

用處：網絡編程中，服務器和瀏覽器只認bytes 類型數據。

如：send 函數的參數和 recv 函數的返回值都是 bytes 類型

附：

在 Python3 中，bytes 和 str 的互相轉換方式是
str.encode('utf-8')
bytes.decode('utf-8')

字符串前加 u

u/U:表示unicode字符串
不是僅僅是針對中文, 可以針對任何的字符串，代表是對字符串進行unicode編碼。
一般英文字符在使用各種編碼下, 基本都可以正常解析, 所以一般不帶u；但是中文, 必須表明所需編碼, 否則一旦編碼轉換就會出現亂碼。
建議所有編碼方式採用utf-8，即在py文件開頭添加: # coding: utf-8

例：u"我是含有中文字符組成的字符串。"

作用：後面字符串以 Unicode 格式進行編碼，一般用在中文字符串前面，防止因爲源碼儲存格式問題，導致再次使用時出現亂碼。

字符串前加 r

r/R:非轉義的原始字符串
與普通字符相比，其他相對特殊的字符，其中可能包含轉義字符，即那些，反斜槓加上對應字母，表示對應的特殊含義的，比如最常見的”\n”表示換行，”\t”表示Tab等。而如果是以r開頭，那麼說明後面的字符，都是普通的字符了，即如果是“\n”那麼表示一個反斜槓字符，一個字母n，而不是表示換行了。
以r開頭的字符，常用於正則表達式，對應着re模塊。

例：r"\n\n\n\n”　　# 表示一個普通生字符串 \n\n\n\n，而不表示換行了。

作用：去掉反斜槓的轉移機制。

（特殊字符：即那些，反斜槓加上對應字母，表示對應的特殊含義的，比如最常見的”\n”表示換行，”\t”表示Tab等。）

應用：常用於正則表達式，對應着re模塊。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

在 Python3 中，bytes 和 str 的互相轉換方式是

字符串前加 b

字符串前加 u

字符串前加 r

System.Object未被引用的程序集中定義

Java 信號量（semaphore）搭配CountDownLatch 實現多線程處理循環內邏輯並限制創建線程數

【面試準備】項目經驗——接口自動化項目

docker install ubuntu ssh

CentOS7端口被佔用的解決辦法

逆向採集數據

vmware linux改硬盤大小,vmware中爲linux增加硬盤和增加硬盤空間的方法

html javascript讀取文件內容

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結