python json文本處理詳解

json介紹

JSON(JavaScript Object Notation) 是一種輕量級的數據交換格式。易於人閱讀和編寫。同時也易於機器解析和生成。
數據格式可以簡單地理解爲鍵值對的集合(A collection of name/value pairs)。不同的語言中,它被理解爲對象(object),紀錄(record),結構(struct),字典(dictionary),哈希表(hash table),有鍵列表(keyed list),或者關聯數組 (associative array)。
值的有序列表(An ordered list of values)。在大部分語言中,它被理解爲數組(array)。

方法

json.dumps

dump的功能就是把Python對象encode爲json對象,一個編碼過程。注意json模塊提供了json.dumps和json.dump方法,區別是dump直接到文件,而dumps到一個字符串,這裏的s可以理解爲string。

json.dump

不僅可以把Python對象編碼爲string,還可以寫入文件。因爲我們不能把Python對象直接寫入文件,這樣會報錯TypeError: expected a string or other character buffer object,我們需要將其序列化之後纔可以。

json.loads

從Python內置對象dump爲json對象我們知道如何操作了,那如何從json對象decode解碼爲Python可以識別的對象呢?是的用json.loads方法,當然這個是基於string的,如果是文件,我們可以用json.load方法。

實例1:

#!/usr/bin/python

import json

data = [ { 'a':'A', 'b':(2, 4), 'c':3.0} ]
print 'DATA:', repr(data)

data_string = json.dumps(data)
print 'JSON:', data_string

print type(data)
print type(data_string)

with open('output.json','w') as fp:
	json.dump(data,fp)

print type(fp)
decoded_json = json.loads(data_string)
print type(decoded_json)

print decoded_json[0]['a']



loaded_json = json.load(fp)
print type(loaded_json)
print loaded_json()

json和Python對象轉換過程中,數據類型不完全一致,有對應。

Python Json
dict object
list,tuple array
str,unicode string
int,long,float number
TRUE TRUE
FALSE FALSE
None null

json.dumps常用參數

一些參數,可以讓我們更好地控制輸出。常見的比如sort_keys,indent,separators,skipkeys等。

sort_keys

輸出時字典的是按鍵值排序的,而不是隨機的。

import json

data = [ { 'a':'A', 'b':(2, 4), 'c':3.0 } ]
print 'DATA:', repr(data)

unsorted = json.dumps(data)
print 'JSON:', json.dumps(data)
print 'SORT:', json.dumps(data, sort_keys=True)

輸出:

$ python js2.py
DATA: [{'a': 'A', 'c': 3.0, 'b': (2, 4)}]
JSON: [{"a": "A", "c": 3.0, "b": [2, 4]}]
SORT: [{"a": "A", "b": [2, 4], "c": 3.0}]

indent

就是更個縮進,讓我們更好地看清結構。

import json

data = [ { 'a':'A', 'b':(2, 4), 'c':3.0 } ]
print 'DATA:', repr(data)

print 'NORMAL:', json.dumps(data, sort_keys=True)
print 'INDENT:', json.dumps(data, sort_keys=True, indent=2)

輸出:

$ python js3.py
DATA: [{'a': 'A', 'c': 3.0, 'b': (2, 4)}]
NORMAL: [{"a": "A", "b": [2, 4], "c": 3.0}]
INDENT: [
  {
    "a": "A", 
    "b": [
      2, 
      4
    ], 
    "c": 3.0
  }
]

separators

提供分隔符,可以出去白空格,輸出更緊湊,數據更小。默認的分隔符是(’, ', ': '),有白空格的。不同的dumps參數,對應文件大小一目瞭然。

data = [ { 'a':'A', 'b':(2, 4), 'c':3.0 } ]
print 'DATA:', repr(data)
print 'repr(data)             :', len(repr(data))
print 'dumps(data)            :', len(json.dumps(data))
print 'dumps(data, indent=2)  :', len(json.dumps(data, indent=2))
print 'dumps(data, separators):', len(json.dumps(data, separators=(',',':')))

輸出:

DATA: [{'a': 'A', 'c': 3.0, 'b': (2, 4)}]
repr(data)             : 35
dumps(data)            : 35
dumps(data, indent=2)  : 76
dumps(data, separators): 29

ensure_ascii

支持中文
print json.dumps(servies,ensure_ascii=False)

error錯誤

json需要字典的的鍵是字符串,否則會拋出ValueError。

data = [ { 'a':'A', 'b':(2, 4), 'c':3.0, ('d',):'D tuple' } ]

print 'First attempt'
try:
    print json.dumps(data)
except (TypeError, ValueError) as err:
    print 'ERROR:', err

print
print 'Second attempt'
print json.dumps(data, skipkeys=True)

輸出:

First attempt
ERROR: keys must be a string

Second attempt
[{"a": "A", "c": 3.0, "b": [2, 4]}]
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章