https://www.jb51.net/article/65101.htm
JSON進階
Python的dict對象可以直接序列化爲JSON的{},不過,很多時候,我們更喜歡用class表示對象,比如定義Student類,然後序列化:
1 2 3 4 5 6 7 8 9 10 |
|
運行代碼,毫不留情地得到一個TypeError:
1 2 3 |
|
錯誤的原因是Student對象不是一個可序列化爲JSON的對象。
如果連class的實例對象都無法序列化爲JSON,這肯定不合理!
別急,我們仔細看看dumps()方法的參數列表,可以發現,除了第一個必須的obj參數外,dumps()方法還提供了一大堆的可選參數:
https://docs.python.org/2/library/json.html#json.dumps
這些可選參數就是讓我們來定製JSON序列化。前面的代碼之所以無法把Student類實例序列化爲JSON,是因爲默認情況下,dumps()方法不知道如何將Student實例變爲一個JSON的{}對象。
可選參數default就是把任意一個對象變成一個可序列爲JSON的對象,我們只需要爲Student專門寫一個轉換函數,再把函數傳進去即可:
1 2 3 4 5 6 7 8 |
|
這樣,Student實例首先被student2dict()函數轉換成dict,然後再被順利序列化爲JSON。
不過,下次如果遇到一個Teacher類的實例,照樣無法序列化爲JSON。我們可以偷個懶,把任意class的實例變爲dict:
print(json.dumps(s, default=lambda obj: obj.__dict__))
因爲通常class的實例都有一個__dict__屬性,它就是一個dict,用來存儲實例變量。也有少數例外,比如定義了__slots__的class。
同樣的道理,如果我們要把JSON反序列化爲一個Student對象實例,loads()方法首先轉換出一個dict對象,然後,我們傳入的object_hook函數負責把dict轉換爲Student實例:
1 2 3 4 5 |
|
運行結果如下:
1 |
|
打印出的是反序列化的Student實例對象。
小結
Python語言特定的序列化模塊是pickle,但如果要把序列化搞得更通用、更符合Web標準,就可以使用json模塊。
json模塊的dumps()和loads()函數是定義得非常好的接口的典範。當我們使用時,只需要傳入一個必須的參數。但是,當默認的序列化或反序列機制不滿足我們的要求時,我們又可以傳入更多的參數來定製序列化或反序列化的規則,既做到了接口簡單易用,又做到了充分的擴展性和靈活性。