Python pickle模塊:實現Python對象的持久化存儲

Python 中有個序列化過程叫作 pickle,它能夠實現任意對象與文本之間的相互轉化,也可以實現任意對象與二進制之間的相互轉化。也就是說,pickle 可以實現 Python 對象的存儲及恢復。
 

值得一提的是,pickle 是 python 語言的一個標準模塊,安裝 python 的同時就已經安裝了 pickle 庫,因此它不需要再單獨安裝,使用 import 將其導入到程序中,就可以直接使用。

pickle 模塊提供了以下 4 個函數供我們使用:

dumps():將 Python 中的對象序列化成二進制對象,並返回;
loads():讀取給定的二進制對象數據,並將其轉換爲 Python 對象;
dump():將 Python 中的對象序列化成二進制對象,並寫入文件;
load():讀取指定的序列化數據文件,並返回對象。
以上這 4 個函數可以分成兩類,其中 dumps 和 loads 實現基於內存的 Python 對象與二進制互轉;dump 和 load 實現基於文件的 Python 對象與二進制互轉。

pickle.dumps()函數

此函數用於將 Python 對象轉爲二進制對象,其語法格式如下:
dumps(obj, protocol=None, *, fix_imports=True)

此格式中各個參數的含義爲:

obj:要轉換的 Python 對象;
protocol:pickle 的轉碼協議,取值爲 0、1、2、3、4,其中 0、1、2 對應 Python 早期的版本,3 和 4 則對應 Python 3.x 版本及之後的版本。未指定情況下,默認爲 3。
其它參數:爲了兼容 Python 2.x 版本而保留的參數,Python 3.x 中可以忽略。

【例 1】

import pickle
tup1 = ('I love Python', {1,2,3}, None)
# 使用 dumps() 函數將 tup1 轉成 p1
p1 = pickle.dumps(tup1)
print(p1)
輸出結果爲:

b'\x80\x03X\r\x00\x00\x00I love Pythonq\x00cbuiltins\nset\nq\x01]q\x02(K\x01K\x02K\x03e\x85q\x03Rq\x04N\x87q\x05.'

pickle.loads()函數

此函數用於將二進制對象轉換成 Python 對象,其基本格式如下:

loads(data, *, fix_imports=True, encoding='ASCII', errors='strict')

其中,data 參數表示要轉換的二進制對象,其它參數只是爲了兼容 Python 2.x 版本而保留的,可以忽略。

【例 2】在例 1 的基礎上,將 p1 對象反序列化爲 Python 對象。

import pickle
tup1 = ('I love Python', {1,2,3}, None)
p1 = pickle.dumps(tup1)
# 使用 loads() 函數將 p1 轉成 Python 對象
t2 = pickle.loads(p1)
print(t2)

運行結果爲:

('I love Python', {1, 2, 3}, None)
注意,在使用 loads() 函數將二進制對象反序列化成 Python 對象時,會自動識別轉碼協議,所以不需要將轉碼協議當作參數傳入。並且,當待轉換的二進制對象的字節數超過 pickle 的 Python 對象時,多餘的字節將被忽略。

pickle.dump()函數

此函數用於將 Python 對象轉換成二進制文件,其基本語法格式爲:

dump (obj, file,protocol=None, *, fix mports=True)

其中各個參數的具體含義如下:
obj:要轉換的 Python 對象。
file:轉換到指定的二進制文件中,要求該文件必須是以"wb"的打開方式進行操作。
protocol:和 dumps() 函數中 protocol 參數的含義完全相同,因此這裏不再重複描述。
其他參數:爲了兼容以前 Python 2.x版本而保留的參數,可以忽略。

【例 3】將 tup1 元組轉換成二進制對象文件。

import pickle
tup1 = ('I love Python', {1,2,3}, None)
# 使用 dumps() 函數將 tup1 轉成 p1
with open ("a.txt", 'wb') as f: # 打開文件
pickle.dump(tup1, f) # 用dump函數將Python對象轉成二進制對象文件

運行完此程序後,會在該程序文件同級目錄中,生成 a.txt 文件,但由於其內容爲二進制數據,因此直接打開會看到亂碼。

pickle.load()函數

此函數和 dump() 函數相對應,用於將二進制對象文件轉換成 Python 對象。該函數的基本語法格式爲:
load(file, *, fix_imports=True, encoding='ASCII', errors='strict')

其中,file 參數表示要轉換的二進制對象文件(必須以 "rb" 的打開方式操作文件),其它參數只是爲了兼容 Python 2.x 版本而保留的參數,可以忽略。

【例 4】將例 3 轉換的 a.txt 二進制文件對象轉換爲 Python 對象。

import pickle
tup1 = ('I love Python', {1,2,3}, None)
# 使用 dumps() 函數將 tup1 轉成 p1
with open ("a.txt", 'wb') as f: # 打開文件
pickle.dump(tup1, f) # 用dump函數將Python對象轉成二進制對象文件
with open ("a.txt", 'rb') as f: # 打開文件
t3 = pickle.load(f) # 將二進制文件對象轉換成Python對象
print(t3)

運行結果爲:

('I love Python', {1, 2, 3}, None)

總結

看似強大的 pickle 模塊,其實也有它的短板,即 pickle 不支持併發地訪問持久性對象,在複雜的系統環境下,尤其是讀取海量數據時,使用 pickle 會使整個系統的 I/O讀取性能成爲瓶頸。這種情況下,可以使用 ZODB。

ZODB 是一個健壯的、多用戶的和麪向對象的數據庫系統,專門用於存儲 Python 語言中的對象數據,它能夠存儲和管理任意複雜的 Python 對象,並支持事務操作和併發控制。並且,ZODB 也是在 Python 的序列化操作基礎之上實現的,因此要想有效地使用 ZODB,必須先學好 pickle。

有關 ZODB 的詳細介紹,讀者可自行搜索相關文檔,本節不再具體講解。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章