python 初學7:Python Set 介紹及應用

Python也包含有 集合 類型。集合是由不重複元素組成的無序的集。它的基本用法包括成員檢測和消除重複元素。集合對象也支持像 聯合,交集,差集,對稱差分等數學運算。

集合結構如下:

set1 = {'hello', 'hello', 'word', 'word'}
set1
# 輸出結果實現自動去重
{'hello', 'word'}

1、集合創建

可以使用大括號 { } 或者 set() 函數創建集合,

創建格式:

parame = {value01,value02,...}
或者
set(value)

注意:創建一個空集合必須用 set() 而不是 { },因爲 { } 是用來創建一個空字典。

# 創建空集合
>>> empty_set = set()
>>> type(empty_set)
  <class 'set'>


# 創建空字典
>>> empty_dict = {}
>>> type(empty_dict)
  <class 'dict'>

2、集合的基本操作

2.1 添加元素

語法格式:

s.add(x)

將元素 x 添加到集合 s 中,如果元素已存在,則不進行任何操作。

s = set(('hello','world'))
print(s)

# 向集合 s 中添加元素
s.add('!')
print('添加元素後的集合是:%s' % s)

# 輸出結果是:
添加元素後的集合是:{'world', '!', 'hello'}

除了 add() 方法可以添加元素外,還有一個方法,也可以添加元素,並且參數可以是列表,元組,字典等,語法格式如下:

s.update( x )

參數 x 可以是一個,也可以是多個,多個參數之間用逗號相隔

# 1)添加列表
s.update([1,3],[2,4])
print('添加元素後的集合是:%s' % s)

# 2)添加元組
s.update(('h', 'j'))
print('添加元素後的集合是:%s' % s)

2.2 移除元素

語法格式如下:

s.remove( x )

將元素 x 從集合 s 中移除,如果元素不存在,則會發生錯誤。

# 將元素 2 從集合中移除
s.remove(2)
print('移除元素 2 後的集合是:%s' % s)

# 如果移除集合中不存在的元素會報異常
# 移除集合中不存在的集合
s.remove('hi')
print('移除元素後的集合是:%s' % s)

# 異常信息
Traceback (most recent call last):
  File "test.py", line 20, in <module>
  s.remove('hi')
  KeyError: 'hi'

此外還有一個方法也是移除集合中的元素,且如果元素不存在,不會發生錯誤。格式如下所示:

s.discard( x )
>>>thisset = set(("Google", "Runoob", "Taobao"))
>>> thisset.discard("Facebook")  # 不存在不會發生錯誤
>>> print(thisset)
{'Taobao', 'Google', 'Runoob'}

我們也可以設置隨機刪除集合中的一個元素,語法格式如下:

s.pop()
# 隨機刪除集合中的一個元素
print(s)

s.pop()

print('移除元素後的集合是:%s' % s)

輸出結果:
{1, 3, 4, 'world', '!', 'hello', 'h', 'j'}
移除元素後的集合是:{3, 4, 'world', '!', 'hello', 'h', 'j'}

注意:在交互模式,pop 是刪除集合的第一個元素(排序後的集合的第一個元素)。

2.3 計算集合元素個數

語法格式如下:

len(s)

計算集合 s 元素個數。

print('集合 s 的長度是:%s' % len(s))

# 輸出結果
集合 s 的長度是:7

2.4 清空集合

語法格式如下:

s.clear()

清空集合 s

s.clear()
print('集合清空後的結果是:%s' % s)

# 輸出結果:
集合清空後的結果是:set()

2.5 判斷元素是否存在

語法格式如下:

x in s

判斷元素 x 是否在集合 s 中,存在返回 True,不存在返回 False。

# 判斷元素是否存在
s = {'hello',  'word'}
# 判斷元素 hello 是否在集合 s 中

print(hello' in s)

# 輸出結果:True

2.6 集合運算

集合之間的運算符分別是‘-’、‘|’、‘&’、‘^’ ; 下面以兩個集合之間的運算爲例進行講解:

  • ‘-’:代表前者中包含後者中不包含的元素
  • ‘|’:代表兩者中全部元素聚在一起去重後的結果
  • ‘&’:兩者中都包含的元素
  • ‘^’:不同時包含於兩個集合中的元素
>>> a = set('afqwbracadaagfgbrafg')
>>> b = set('rfgfgfalacazamddg')
>>> a                                  
{'r', 'q', 'd', 'b', 'w', 'g', 'f', 'c', 'a'}
>>> b
{'r', 'd', 'g', 'f', 'l', 'z', 'c', 'm', 'a'}
# 集合a中包含而集合b中不包含的元素
>>> a - b                              
{'b', 'w', 'q'}
 # 集合a或b中包含的所有元素
>>> a | b                             
{'d', 'g', 'l', 'c', 'r', 'q', 'b', 'w', 'f', 'z', 'm', 'a'}
# 集合a和b中都包含了的元素
>>> a & b                              
{'r', 'd', 'g', 'f', 'c', 'a'}
# 不同時包含於a和b的元素
>>> a ^ b                              
{'l', 'q', 'b', 'w', 'z', 'm'}

3、集合推導式

和列表一樣,集合也支持推導式

# 判斷元素是否存在
>>> a = {x for x in 'abracadabra' if x not in 'abc'}
>>> a
{'r', 'd'}

4、集合內置方法

4.1 difference()

difference() 方法用於返回集合的差集,即返回的集合元素包含在第一個集合中,但不包含在第二個集合(方法的參數)中,返回一個新的集合。
** difference() 方法語法:**

set.difference(set)

實例:
兩個集合的差集返回一個集合,元素包含在集合 x ,但不在集合 y :

# 求兩個集合的差集,元素在 x 中不在 y 中
x = {"apple", "banana", "cherry"}
y = {"google", "microsoft", "apple"}

z = x.difference(y)

print('兩個集合的差集是:%s' % z)

# 輸出結果爲:
{'cherry', 'banana'}

4.2 difference_update()

  • difference_update() 方法用於移除兩個集合中都存在的元素。
  • difference_update() 方法與 difference() 方法的區別在於 difference() 方法返回一個移除相同元素的新集合,而 difference_update() 方法是直接在原來的集合中移除元素,沒有返回值。
x = {"apple", "banana", "cherry"}
y = {"google", "microsoft", "apple"}

x.difference_update(y)

print(x)
結果爲:
{'banana', 'cherry'}


x1 = {1,2,3,4}
y1 = {1,2,3}

x1.difference_update(y1)

print(x1)

# 結果爲:
{4}

4.3 intersection()

intersection() 方法用於返回兩個或更多集合中都包含的元素,即交集,返回一個新的集合。

intersection() 方法語法:

set.intersection(set1, set2 ... etc)

**參數:**
set1 -- 必需,要查找相同元素的集合
set2 -- 可選,其他要查找相同元素的集合,可以多個,多個使用逗號 , 隔開

實例:

# 返回兩個或者多個集合的交集
x = {"apple", "banana", "cherry"}
y = {"google", "runoob", "apple"}

z = x.intersection(y)

print(z)

# 返回三個集合的交集
x = {"a", "b", "c"}
y = {"c", "d", "e"}
z = {"f", "g", "c"}

result = x.intersection(y, z)
print('三個集合的差集是:%s' % result)

# 輸出結果:

{'apple'}
兩個集合的差集是:{'c'}

4.4 intersection_update()

  • intersection_update() 方法用於獲取兩個或更多集合中都重疊的元素,即計算交集。
  • intersection_update() 方法不同於 intersection() 方法,因爲 intersection() 方法是返回一個新的集合,而 intersection_update() 方法是在原始的集合上移除不重疊的元素。

intersection_update() 方法語法:

set.intersection_update(set1, set2 ... etc)

**參數**
set1 -- 必需,要查找相同元素的集合
set2 -- 可選,其他要查找相同元素的集合,可以使用多個多個,多個使用逗號‘,’ 隔開

實例:

# 返回一個無返回值的集合交集
x = {"apple", "banana", "cherry"}
y = {"google", "runoob", "apple"}

x.intersection_update(y)

print(x)

x = {"a", "b", "c"}
y = {"c", "d", "e"}
z = {"f", "g", "c"}

x.intersection_update(y, z)

print(x)

# 輸出結果:
{'apple'}
{'c'}

4.5 union()

union() 方法返回兩個集合的並集,即包含了所有集合的元素,重複的元素只會出現一次,返回值返回一個新的集合

語法:

union() 方法語法:

set.union(set1, set2...)
參數
set1 -- 必需,合併的目標集合
set2 -- 可選,其他要合併的集合,可以多個,多個使用逗號 , 隔開。

實例:

# 合併兩個集合,重複元素只會出現一次:

x = {"apple", "banana", "cherry"}
y = {"google", "runoob", "apple"}
 
z = x.union(y) 
 
print(z)
輸出結果爲:

{'cherry', 'runoob', 'google', 'banana', 'apple'}


# 合併多個集合:

實例 1
x = {"a", "b", "c"}
y = {"f", "d", "a"}
z = {"c", "d", "e"}
 
result = x.union(y, z) 
 
print(result)
輸出結果爲:

{'c', 'd', 'f', 'e', 'b', 'a'}

4.6 isdisjoint()

isdisjoint() 方法用於判斷兩個集合是否包含相同的元素,如果沒有返回 True,否則返回 False。

語法:

isdisjoint() 方法語法:

set.isdisjoint(set)

實例:

x = {"apple", "banana", "cherry"}
y = {"google", "runoob", "apple"}
# 判斷集合 y 中是否包含集合 x 中的元素,如果沒有返回 True, 有則返回 False
z = x.isdisjoint(y)
# 結果返回 False,說明集合 y 中有和 x 中相同的元素
print(z)


x = {"apple", "banana", "cherry"}
y = {"google", "runoob", "baidu"}
# 判斷集合 y 中是否包含集合 x 中的元素,如果沒有返回 True, 有則返回 False
z = x.isdisjoint(y)
# 結果返回 True,說明集合 y 中沒有和 x 中相同的元素
print(z)


輸出結果:
False
True

4.7 issubset()

issubset() 方法用於判斷集合的所有元素是否都包含在指定集合中,如果是則返回 True,否則返回 False。

語法:

issubset() 方法語法:

set.issubset(set)

**參數**
set -- 必需,要比查找的集合
返回值
返回布爾值,如果都包含返回 True,否則返回 False

實例:

# 判斷集合 x 的所有元素是否都包含在集合 y 中:
x = {"a", "b", "c"}
y = {"f", "e", "d", "c", "b", "a"}
 
z = x.issubset(y) 
 
print(z)

輸出結果
# 說明 集合 x 中的元素都包含在 y 中
True

注意: 必須是集合中的元素都包含在內,否則結果爲false

# 集合 y 中只有元素 b 和 c ,執行結果爲False 
x = {"a", "b", "c"}
y = {"f", "e", "d", "c", "b","y"}

z = x.issubset(y)

print(z)

結果輸出;
False

4.8 issuperset()

issuperset() 方法用於判斷指定集合的所有元素是否都包含在原始的集合中,如果是則返回 True,否則返回 False。

語法:

set.issuperset(set)

實例:

# 判斷集合 y 的所有元素是否都包含在集合 x 中:
x = {"f", "e", "d", "c", "b", "a"}
y = {"a", "b", "c"}
 
z = x.issuperset(y) 
 
print(z)
輸出結果爲:

True


# 如果沒有全部包含返回 False:

實例 1
x = {"f", "e", "d", "c", "b"}
y = {"a", "b", "c"}
 
z = x.issuperset(y) 
 
print(z)
輸出結果爲:

False

4.9 symmetric_difference()

symmetric_difference() 方法返回兩個集合中不重複的元素集合,即會移除兩個集合中都存在的元素,結果返回一個新的集合。

語法:

set.symmetric_difference(set)

實例:

# 返回兩個集合組成的新集合,但會移除兩個集合的重複元素:
x = {"apple", "banana", "cherry"}
y = {"google", "runoob", "apple"}

z = x.symmetric_difference(y)

print(z)

輸出結果:
{'banana', 'google', 'cherry', 'runoob'}

4.10 symmetric_difference_update()

symmetric_difference_update() 方法移除當前集合中在另外一個指定集合相同的元素,並將另外一個指定集合中不同的元素插入到當前集合中。

語法:

set.symmetric_difference_update(set)

實例:

# 在原始集合 x 中移除與 y 集合中的重複元素,並將不重複的元素插入到集合 x 中:
x = {"apple", "banana", "cherry"}
y = {"google", "runoob", "apple"}

x.symmetric_difference_update(y)

print(x)

輸出結果:
{'runoob', 'cherry', 'banana', 'google'}

後記:其他幾個方法是對集合的增刪改查,如:add() clear() copy() update() pop() remove() discard() 等方法,這些方法在對集合的基本操作章節有詳解,大家到時候按需使用。

總結

本節學習了 Python 數據結構之集合的操作與使用,給後面關於集合相關的應用打下基礎。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章