轉載自:http://www.cnblogs.com/coser/archive/2011/12/14/2287739.html
什麼是json:
JSON(JavaScript Object Notation) 是一種輕量級的數據交換格式。易於人閱讀和編寫。同時也易於機器解析和生成。它基於JavaScript Programming Language, Standard ECMA-262 3rd Edition - December 1999的一個子集。JSON採用完全獨立於語言的文本格式,但是也使用了類似於C語言家族的習慣(包括C, C++, C#, Java, JavaScript, Perl, Python等)。這些特性使JSON成爲理想的數據交換語言。
JSON建構於兩種結構:
“名稱/值”對的集合(A collection of name/value pairs)。不同的語言中,它被理解爲對象(object),紀錄(record),結構(struct),字典(dictionary),哈希表(hash table),有鍵列表(keyed list),或者關聯數組 (associative array)。
值的有序列表(An ordered list of values)。在大部分語言中,它被理解爲數組(array)。
這些都是常見的數據結構。事實上大部分現代計算機語言都以某種形式支持它們。這使得一種數據格式在同樣基於這些結構的編程語言之間交換成爲可能。
jso官方說明參見:http://json.org/
Python操作json的標準api庫參考:http://docs.python.org/library/json.html
對簡單數據類型的encoding 和 decoding:
使用簡單的json.dumps方法對簡單數據類型進行編碼,例如:
1
2
3
4
5
6
|
4
data1 = { 'b' : 789 , 'c' : 456 , 'a' : 123 } d1 = json.dumps(data1,sort_keys = True ,indent = 4 ) print d1 |
輸出:
{
"a": 123,
"b": 789,
"c": 456
}
輸出的數據被格式化之後,變得可讀性更強,但是卻是通過增加一些冗餘的空白格來進行填充的。json主要是作爲一種數據通信的格式存在的,而網絡通信是很在乎數據的大小的,無用的空格會佔據很多通信帶寬,所以適當時候也要對數據進行壓縮。separator參數可以起到這樣的作用,該參數傳遞是一個元組,包含分割對象的字符串。
1
2
3
4
5
|
print 'DATA:' , repr (data) print 'repr(data)
:' , len ( repr (data)) print 'dumps(data)
:' , len (json.dumps(data)) print 'dumps(data,
indent=2) :' , len (json.dumps(data,
indent = 4 )) print 'dumps(data,
separators):' , len (json.dumps(data,
separators = ( ',' , ':' ))) |
輸出:
DATA: {'a': 123, 'c': 456, 'b': 789}
repr(data) : 30
dumps(data) : 30
dumps(data, indent=2) : 46
dumps(data, separators): 25
通過移除多餘的空白符,達到了壓縮數據的目的,而且效果還是比較明顯的。
另一個比較有用的dumps參數是skipkeys,默認爲False。 dumps方法存儲dict對象時,key必須是str類型,如果出現了其他類型的話,那麼會產生TypeError異常,如果開啓該參數,設爲True的話,則會比較優雅的過度。
1
2
|
data = { 'b' : 789 , 'c' : 456 ,( 1 , 2 ): 123 } print json.dumps(data,skipkeys = True ) |
輸出:
{"c": 456, "b": 789}
處理自己的數據類型
json模塊不僅可以處理普通的python內置類型,也可以處理我們自定義的數據類型,而往往處理自定義的對象是很常用的。
首先,我們定義一個類Person。
1
2
3
4
5
6
7
8
9
|
class Person( object ): def __init__( self ,name,age): self .name = name self .age = age def __repr__( self ): return 'Person
Object name : %s , age : %d' % ( self .name, self .age) if __name__ = = '__main__' : p = Person( 'Peter' , 22 ) print p |
如果直接通過json.dumps方法對Person的實例進行處理的話,會報錯,因爲json無法支持這樣的自動轉化。通過上面所提到的json和python的類型轉化對照表,可以發現,object類型是和dict相關聯的,所以我們需要把我們自定義的類型轉化爲dict,然後再進行處理。這裏,有兩種方法可以使用。
方法一:自己寫轉化函數
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
|
''' Created
on 2011-12-14 @author:
Peter ''' import Person import json p = Person.Person( 'Peter' , 22 ) def object2dict(obj): #convert
object to a dict d = {} d[ '__class__' ] = obj.__class__.__name__ d[ '__module__' ] = obj.__module__ d.update(obj.__dict__) return d def dict2object(d): #convert
dict to object if '__class__' in d: class_name = d.pop( '__class__' ) module_name = d.pop( '__module__' ) module = __import__ (module_name) class_ = getattr (module,class_name) args = dict ((key.encode( 'ascii' ),
value) for key,
value in d.items()) #get
args inst = class_ ( * * args) #create
new instance else : inst = d return inst d = object2dict(p) print d #{'age':
22, '__module__': 'Person', '__class__': 'Person', 'name': 'Peter'} o = dict2object(d) print type (o),o #<class
'Person.Person'> Person Object name : Peter , age : 22 dump = json.dumps(p,default = object2dict) print dump #{"age":
22, "__module__": "Person", "__class__": "Person", "name": "Peter"} load = json.loads(dump,object_hook = dict2object) print load #Person
Object name : Peter , age : 22 |
上面代碼已經寫的很清楚了,實質就是自定義object類型和dict類型進行轉化。object2dict函數將對象模塊名、類名以及__dict__存儲在dict對象裏,並返回。dict2object函數則是反解出模塊名、類名、參數,創建新的對象並返回。在json.dumps 方法中增加default參數,該參數表示在轉化過程中調用指定的函數,同樣在decode過程中json.loads方法增加object_hook,指定轉化函數。
方法二:繼承JSONEncoder和JSONDecoder類,覆寫相關方法
JSONEncoder類負責編碼,主要是通過其default函數進行轉化,我們可以override該方法。同理對於JSONDecoder。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
|
''' Created
on 2011-12-14 @author:
Peter ''' import Person import json p = Person.Person( 'Peter' , 22 ) class MyEncoder(json.JSONEncoder): def default( self ,obj): #convert
object to a dict d = {} d[ '__class__' ] = obj.__class__.__name__ d[ '__module__' ] = obj.__module__ d.update(obj.__dict__) return d class MyDecoder(json.JSONDecoder): def __init__( self ): json.JSONDecoder.__init__( self ,object_hook = self .dict2object) def dict2object( self ,d): #convert
dict to object if '__class__' in d: class_name = d.pop( '__class__' ) module_name = d.pop( '__module__' ) module = __import__ (module_name) class_ = getattr (module,class_name) args = dict ((key.encode( 'ascii' ),
value) for key,
value in d.items()) #get
args inst = class_ ( * * args) #create
new instance else : inst = d return inst d = MyEncoder().encode(p) o = MyDecoder().decode(d) print d print type (o),
o |
對於JSONDecoder類方法,稍微有點不同,但是改寫起來也不是很麻煩。看代碼應該就比較清楚了。