python中collections的defaultdict方法使用_例子說明(二)

需求

Python中通過Key訪問字典,當Key不存在時,會引發‘KeyError’異常。爲了避免這種情況的發生,可以使用collections類中的defaultdict()方法來爲字典提供默認值。

語法格式:

collections.defaultdict([default_factory[, …]])

該函數返回一個類似字典的對象。defaultdict是Python內建字典類(dict)的一個子類(見下文的背景補充),它重寫了方法_missing_(key),增加了一個可寫的實例變量default_factory,實例變量default_factory被missing()方法使用,如果該變量存在,則用以初始化構造器,如果沒有,則爲None。其它的功能和dict一樣

第一個參數爲default_factory屬性提供初始值,默認爲None;其餘參數包括關鍵字參數(keyword arguments)的用法,和dict構造器用法一樣。

背景補充

defaultdict屬於內建函數dict的一個子類,調用工廠函數提供缺失的值。

什麼是工廠函數?

Python 2.2 統一了類型和類, 所有的內建類型現在也都是類, 在這基礎之上, 原來的 所謂內建轉換函數象int(), type(), list() 等等, 現在都成了工廠函數。 也就是說雖然他 們看上去有點象函數, 實質上他們是類。當你調用它們時, 實際上是生成了該類型的一個實 例, 就象工廠生產貨物一樣。
下面這些大家熟悉的工廠函數在老的Python 版裏被稱爲內建函數:
int(), long(), float(), complex()
str(), unicode(), basestring()
list(), tuple()
type()
以前沒有工廠函數的其他類型,現在也都有了工廠函數。除此之外,那些支持新風格的類的全新的數據類型,也添加了相應的工廠函數。下面列出了這些工廠函數:
dict()
bool()
set(), frozenset()
object()
classmethod()
staticmethod()
super()
property()
file()

1、使用list作第一個參數,可以很容易將鍵-值對序列轉換爲列表字典。
代碼如下:

In [6]: from collections import defaultdict                                                                                                                                   

In [7]: s=[('yellow',1),('blue', 2), ('yellow', 3), ('blue', 4), ('red', 1)]                                                                                                  

In [8]: d=defaultdict(list)                                                                                                                                                   

In [9]: for k, v in s: 
   ...:         d[k].append(v) 
   ...: a=sorted(d.items()) 
   ...: print(a)      
# 輸出結果                                                                                                                                                        
[('blue', [2, 4]), ('red', [1]), ('yellow', [1, 3])]

當字典中沒有的鍵第一次出現時,default_factory自動爲其返回一個空列表,list.append()會將值添加進新列表;再次遇到相同的鍵時,list.append()將其它值再添加進該列表。

這種方法比使用dict.setdefault()更爲便捷,dict.setdefault()也可以實現相同的功能。
代碼如下:

In [10]: s = [('yellow', 1), ('blue', 2), ('yellow', 3), ('blue', 4), ('red', 1)]                                                                                             

In [11]: d={}                                                                                                                                                                 

In [12]: for k, v in s: 
    ...:         d.setdefault(k,[]).append(v) 
    ...: print('\n',d) 
    ...: a=sorted(d.items()) 
    ...: print('\n',a)                                                                                                                                                        
# 輸出結果
 {'yellow': [1, 3], 'blue': [2, 4], 'red': [1]}

 [('blue', [2, 4]), ('red', [1]), ('yellow', [1, 3])]

整合三者(defaultdict、setdefault和dict)可以看一下例子:

import collections
s = [('yellow', 1), ('blue', 2), ('yellow', 3), ('blue', 4), ('red', 1)]
 
# defaultdict
d = collections.defaultdict(list)
for k, v in s:
    d[k].append(v)
    
# Use dict and setdefault    
g = {}
for k, v in s:
    g.setdefault(k, []).append(v)
    
# Use dict
e = {}
for k, v in s:
    e[k] = v

輸出結果爲:

list(d.items())
[('blue', [2, 4]), ('red', [1]), ('yellow', [1, 3])]
>>> list(g.items())
[('blue', [2, 4]), ('red', [1]), ('yellow', [1, 3])]
>>> list(e.items())
[('blue', 4), ('red', 1), ('yellow', 3)]
>>> d
defaultdict(<class 'list'>, {'blue': [2, 4], 'red': [1], 'yellow': [1, 3]})
>>> g
{'blue': [2, 4], 'red': [1], 'yellow': [1, 3]}
>>> e
{'blue': 4, 'red': 1, 'yellow': 3}
>>> d.items()
dict_items([('blue', [2, 4]), ('red', [1]), ('yellow', [1, 3])])
>>> d["blue"]
[2, 4]
>>> d.keys()
dict_keys(['blue', 'red', 'yellow'])
>>> d.default_factory
<class 'list'>
>>> d.values()
dict_values([[2, 4], [1], [1, 3]])

可以看出collections.defaultdict(list)使用起來效果和運用dict.setdefault()比較相似的。

2、defaultdict還可以被用來計數,將default_factory設爲int即可。
代碼如下:

In [13]: from collections import defaultdict                                                                                                                                  

In [14]: s = 'mississippi'                                                                                                                                                    

In [15]: d = defaultdict(int)                                                                                                                                                 

In [16]: for k in s: 
    ...:         d[k] += 1 
    ...: print('\n',d) 
    ...: a=sorted(d.items()) 
    ...: print('\n',a)                                                                                                                                                        
# 輸出結果
 defaultdict(<class 'int'>, {'m': 1, 'i': 4, 's': 4, 'p': 2})

 [('i', 4), ('m', 1), ('p', 2), ('s', 4)]

字符串中的字母第一次出現時,字典中沒有該字母,default_factory函數調用int()爲其提供一個默認值0,加法操作將計算出每個字母出現的次數。

函數int()是常值函數的一種特例,總是返回0。使用匿名函數(lambda function)可以更快、更靈活的創建常值函數,返回包括0在內的任意常數值。
代碼:

In [17]: from collections import defaultdict                                                                                                                                  

In [18]: def constant_factory(value): 
    ...:         return lambda: value 
    ...: d = defaultdict(constant_factory('<missing>')) 
    ...: print('\n',d) 
    ...: d.update(name='John', action='ran') 
    ...: print('\n',d) 
    ...: print('\n','%(name)s %(action)s to %(object)s' % d)                                                                                                                  
# 輸出結果
 defaultdict(<function constant_factory.<locals>.<lambda> at 0x7f94cb0ca7b8>, {})

 defaultdict(<function constant_factory.<locals>.<lambda> at 0x7f94cb0ca7b8>, {'name': 'John', 'action': 'ran'})

 John ran to <missing>

3、default_factory設爲set時,可以用defaultdict建立集合字典(a dictionary of sets)。
代碼:

In [19]: from collections import defaultdict                                                                                                                                  

In [20]: s = [('red', 1), ('blue', 2), ('red', 3), ('blue', 4), ('red', 1), ('blue', 4)]                                                                                      

In [21]: d = defaultdict(set)                                                                                                                                                 

In [22]: for k, v in s: 
    ...:         d[k].add(v) 
    ...: print('\n',d) 
    ...: a=sorted(d.items()) 
    ...: print('\n',a)                                                                                                                                                        

 defaultdict(<class 'set'>, {'red': {1, 3}, 'blue': {2, 4}})

 [('blue', {2, 4}), ('red', {1, 3})]
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章