set
(集合)是一個非常有用的數據結構。它與列表(list
)的行爲類似,區別在於set
不能包含重複的值。
這在很多情況下非常有用。例如你可能想檢查列表中是否包含重複的元素,你有兩個選擇,第一個需要使用for
循環,就像這樣:
some_list = ['a', 'b', 'c', 'b', 'd', 'm', 'n', 'n']
duplicates = []
for value in some_list:
if some_list.count(value) > 1:
if value not in duplicates:
duplicates.append(value)
print(duplicates)
### 輸出: ['b', 'n']
但還有一種更簡單更優雅的解決方案,那就是使用集合(sets)
,你直接這樣做:
some_list = ['a', 'b', 'c', 'b', 'd', 'm', 'n', 'n']
duplicates = set([x for x in some_list if some_list.count(x) > 1])
print(duplicates)
### 輸出: set(['b', 'n'])
集合還有一些其它方法,下面我們介紹其中一部分。
1.交集
你可以對比兩個集合的交集(兩個集合中都有的數據),如下:
valid = set(['yellow', 'red', 'blue', 'green', 'black'])
input_set = set(['red', 'brown'])
print(input_set.intersection(valid))
### 輸出: set(['red'])
2.差集
你可以用差集(difference)找出無效的數據,相當於用一個集合減去另一個集合的數據,例如:
valid = set(['yellow', 'red', 'blue', 'green', 'black'])
input_set = set(['red', 'brown'])
print(input_set.difference(valid))
### 輸出: set(['brown'])
你也可以用符號來創建集合,如:
a_set = {'red', 'blue', 'green'}
print(type(a_set))
### 輸出: <type 'set'>
集合還有一些其它方法,我會建議訪問官方文檔並做個快速閱讀。