Python中使用pickle持久化對象
Python中可以使用 pickle 模塊將對象轉化爲文件保存在磁盤上,在需要的時候再讀取並還原。具體用法如下:
pickle.dump(obj, file[, protocol])
這是將對象持久化的方法,參數的含義分別爲:
obj: 要持久化保存的對象;
file: 一個擁有 write() 方法的對象,並且這個 write() 方法能接收一個字符串作爲參數。這個對象可以是一個以寫模式打開的文件對象或者一個 StringIO 對象,或者其他自定義的滿足條件的對象。
protocol: 這是一個可選的參數,默認爲 0 ,如果設置爲 1 或 True,則以高壓縮的二進制格式保存持久化後的對象,否則以ASCII格式保存。
對象被持久化後怎麼還原呢?pickle 模塊也提供了相應的方法,如下:
pickle.load(file)
只有一個參數 file ,對應於上面 dump 方法中的 file 參數。這個 file 必須是一個擁有一個能接收一個整數爲參數的 read() 方法以及一個不接收任何參數的 readline() 方法,並且這兩個方法的返回值都應該是字符串。這可以是一個打開爲讀的文件對象、StringIO 對象或其他任何滿足條件的對象。
下面是一個基本的用例:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 | # -*- coding: utf-8 -*- import pickle # 也可以這樣: # import cPickle as pickle obj = { "a" : 1 , "b" : 2 , "c" : 3 } # 將 obj 持久化保存到文件 tmp.txt 中 pickle.dump(obj, open ( "tmp.txt" , "w" )) # do something else ... # 從 tmp.txt 中讀取並恢復 obj 對象 obj2 = pickle.load( open ( "tmp.txt" , "r" )) print obj2 |
不過實際應用中,我們可能還會有一些改進,比如用 cPickle 來代替 pickle ,前者是後者的一個 C 語言實現版本,擁有更快的速度,另外,有時在 dump 時也會將第三個參數設爲 True 以提高壓縮比。