需求
Python中通過Key訪問字典,當Key不存在時,會引發‘KeyError’異常。爲了避免這種情況的發生,可以使用collections類中的defaultdict()方法來爲字典提供默認值。
語法格式:
collections.defaultdict([default_factory[, …]])
該函數返回一個類似字典的對象。defaultdict是Python內建字典類(dict)的一個子類(見下文的背景補充),它重寫了方法_missing_(key),增加了一個可寫的實例變量default_factory,實例變量default_factory被missing()方法使用,如果該變量存在,則用以初始化構造器,如果沒有,則爲None。其它的功能和dict一樣。
第一個參數爲default_factory屬性提供初始值,默認爲None;其餘參數包括關鍵字參數(keyword arguments)的用法,和dict構造器用法一樣。
背景補充
defaultdict屬於內建函數dict的一個子類,調用工廠函數提供缺失的值。
什麼是工廠函數?
Python 2.2 統一了類型和類, 所有的內建類型現在也都是類, 在這基礎之上, 原來的 所謂內建轉換函數象int(), type(), list() 等等, 現在都成了工廠函數。 也就是說雖然他 們看上去有點象函數, 實質上他們是類。當你調用它們時, 實際上是生成了該類型的一個實 例, 就象工廠生產貨物一樣。
下面這些大家熟悉的工廠函數在老的Python 版裏被稱爲內建函數:
int(), long(), float(), complex()
str(), unicode(), basestring()
list(), tuple()
type()
以前沒有工廠函數的其他類型,現在也都有了工廠函數。除此之外,那些支持新風格的類的全新的數據類型,也添加了相應的工廠函數。下面列出了這些工廠函數:
dict()
bool()
set(), frozenset()
object()
classmethod()
staticmethod()
super()
property()
file()
1、使用list作第一個參數,可以很容易將鍵-值對序列轉換爲列表字典。
代碼如下:
In [6]: from collections import defaultdict
In [7]: s=[('yellow',1),('blue', 2), ('yellow', 3), ('blue', 4), ('red', 1)]
In [8]: d=defaultdict(list)
In [9]: for k, v in s:
...: d[k].append(v)
...: a=sorted(d.items())
...: print(a)
# 輸出結果
[('blue', [2, 4]), ('red', [1]), ('yellow', [1, 3])]
當字典中沒有的鍵第一次出現時,default_factory自動爲其返回一個空列表,list.append()會將值添加進新列表;再次遇到相同的鍵時,list.append()將其它值再添加進該列表。
這種方法比使用dict.setdefault()更爲便捷,dict.setdefault()也可以實現相同的功能。
代碼如下:
In [10]: s = [('yellow', 1), ('blue', 2), ('yellow', 3), ('blue', 4), ('red', 1)]
In [11]: d={}
In [12]: for k, v in s:
...: d.setdefault(k,[]).append(v)
...: print('\n',d)
...: a=sorted(d.items())
...: print('\n',a)
# 輸出結果
{'yellow': [1, 3], 'blue': [2, 4], 'red': [1]}
[('blue', [2, 4]), ('red', [1]), ('yellow', [1, 3])]
整合三者(defaultdict、setdefault和dict)可以看一下例子:
import collections
s = [('yellow', 1), ('blue', 2), ('yellow', 3), ('blue', 4), ('red', 1)]
# defaultdict
d = collections.defaultdict(list)
for k, v in s:
d[k].append(v)
# Use dict and setdefault
g = {}
for k, v in s:
g.setdefault(k, []).append(v)
# Use dict
e = {}
for k, v in s:
e[k] = v
輸出結果爲:
list(d.items())
[('blue', [2, 4]), ('red', [1]), ('yellow', [1, 3])]
>>> list(g.items())
[('blue', [2, 4]), ('red', [1]), ('yellow', [1, 3])]
>>> list(e.items())
[('blue', 4), ('red', 1), ('yellow', 3)]
>>> d
defaultdict(<class 'list'>, {'blue': [2, 4], 'red': [1], 'yellow': [1, 3]})
>>> g
{'blue': [2, 4], 'red': [1], 'yellow': [1, 3]}
>>> e
{'blue': 4, 'red': 1, 'yellow': 3}
>>> d.items()
dict_items([('blue', [2, 4]), ('red', [1]), ('yellow', [1, 3])])
>>> d["blue"]
[2, 4]
>>> d.keys()
dict_keys(['blue', 'red', 'yellow'])
>>> d.default_factory
<class 'list'>
>>> d.values()
dict_values([[2, 4], [1], [1, 3]])
可以看出collections.defaultdict(list)使用起來效果和運用dict.setdefault()比較相似的。
2、defaultdict還可以被用來計數,將default_factory設爲int即可。
代碼如下:
In [13]: from collections import defaultdict
In [14]: s = 'mississippi'
In [15]: d = defaultdict(int)
In [16]: for k in s:
...: d[k] += 1
...: print('\n',d)
...: a=sorted(d.items())
...: print('\n',a)
# 輸出結果
defaultdict(<class 'int'>, {'m': 1, 'i': 4, 's': 4, 'p': 2})
[('i', 4), ('m', 1), ('p', 2), ('s', 4)]
字符串中的字母第一次出現時,字典中沒有該字母,default_factory函數調用int()爲其提供一個默認值0,加法操作將計算出每個字母出現的次數。
函數int()是常值函數的一種特例,總是返回0。使用匿名函數(lambda function)可以更快、更靈活的創建常值函數,返回包括0在內的任意常數值。
代碼:
In [17]: from collections import defaultdict
In [18]: def constant_factory(value):
...: return lambda: value
...: d = defaultdict(constant_factory('<missing>'))
...: print('\n',d)
...: d.update(name='John', action='ran')
...: print('\n',d)
...: print('\n','%(name)s %(action)s to %(object)s' % d)
# 輸出結果
defaultdict(<function constant_factory.<locals>.<lambda> at 0x7f94cb0ca7b8>, {})
defaultdict(<function constant_factory.<locals>.<lambda> at 0x7f94cb0ca7b8>, {'name': 'John', 'action': 'ran'})
John ran to <missing>
3、default_factory設爲set時,可以用defaultdict建立集合字典(a dictionary of sets)。
代碼:
In [19]: from collections import defaultdict
In [20]: s = [('red', 1), ('blue', 2), ('red', 3), ('blue', 4), ('red', 1), ('blue', 4)]
In [21]: d = defaultdict(set)
In [22]: for k, v in s:
...: d[k].add(v)
...: print('\n',d)
...: a=sorted(d.items())
...: print('\n',a)
defaultdict(<class 'set'>, {'red': {1, 3}, 'blue': {2, 4}})
[('blue', {2, 4}), ('red', {1, 3})]