python中的set操作

[python] view plaincopy
  1. python的set和其他語言類似, 是一個無序不重複元素集, 基本功能包括關係測試和消除重複元素. 集合對象還支持union(聯合), intersection(交), difference(差)和sysmmetric difference(對稱差集)等數學運算.  
  2.   
  3. sets 支持 x in set, len(set),和 for x in set。作爲一個無序的集合,sets不記錄元素位置或者插入點。因此,sets不支持 indexing, slicing, 或其它類序列(sequence-like)的操作。  
  4.   
  5.    
  6.   
  7. 下面來點簡單的小例子說明把。  
  8.   
  9. >>> x = set('spam')  
  10. >>> y = set(['h','a','m'])  
  11. >>> x, y  
  12. (set(['a''p''s''m']), set(['a''h''m']))  
  13.   
  14. 再來些小應用。  
  15.   
  16. >>> x & y # 交集  
  17. set(['a''m'])  
  18.   
  19. >>> x | y # 並集  
  20. set(['a''p''s''h''m'])  
  21.   
  22. >>> x - y # 差集  
  23. set(['p''s'])  
  24.   
  25. 記得以前個網友提問怎麼去除海量列表裏重複元素,用hash來解決也行,只不過感覺在性能上不是很高,用set解決還是很不錯的,示例如下:  
  26.   
  27. >>> a = [11,22,33,44,11,22]  
  28. >>> b = set(a)  
  29. >>> b  
  30. set([33114422])  
  31. >>> c = [i for i in b]  
  32. >>> c  
  33. [33114422]  
  34.   
  35. 很酷把,幾行就可以搞定。  
  36.   
  37. 1.8 集合   
  38.    
  39. 集合用於包含一組無序的對象。要創建集合,可使用set()函數並像下面這樣提供一系列的項:  
  40.   
  41.    
  42.   
  43. s = set([3,5,9,10])      #創建一個數值集合  
  44.   
  45. t = set("Hello")         #創建一個唯一字符的集合  
  46.   
  47.    
  48.   
  49. 與列表和元組不同,集合是無序的,也無法通過數字進行索引。此外,集合中的元素不能重複。例如,如果檢查前面代碼中t集合的值,結果會是:  
  50.   
  51.    
  52.   
  53. >>> t  
  54.   
  55. set(['H''e''l''o'])  
  56.   
  57.    
  58.   
  59. 注意只出現了一個'l'。  
  60.   
  61. 集合支持一系列標準操作,包括並集、交集、差集和對稱差集,例如:  
  62.   
  63.    
  64.   
  65. a = t | s          # t 和 s的並集  
  66.   
  67. b = t & s          # t 和 s的交集  
  68.   
  69. c = t – s          # 求差集(項在t中,但不在s中)  
  70.   
  71. d = t ^ s          # 對稱差集(項在t或s中,但不會同時出現在二者中)  
  72.   
  73.    
  74.   
  75. 基本操作:  
  76.   
  77. t.add('x')            # 添加一項  
  78.   
  79. s.update([10,37,42])  # 在s中添加多項  
  80.   
  81.    
  82.   
  83. 使用remove()可以刪除一項:  
  84.   
  85. t.remove('H')  
  86.   
  87.    
  88.   
  89. len(s)  
  90. set 的長度  
  91.   
  92. in s  
  93. 測試 x 是否是 s 的成員  
  94.   
  95. not in s  
  96. 測試 x 是否不是 s 的成員  
  97.   
  98. s.issubset(t)  
  99. s <= t  
  100. 測試是否 s 中的每一個元素都在 t 中  
  101.   
  102. s.issuperset(t)  
  103. s >= t  
  104. 測試是否 t 中的每一個元素都在 s 中  
  105.   
  106. s.union(t)  
  107. s | t  
  108. 返回一個新的 set 包含 s 和 t 中的每一個元素  
  109.   
  110. s.intersection(t)  
  111. s & t  
  112. 返回一個新的 set 包含 s 和 t 中的公共元素  
  113.   
  114. s.difference(t)  
  115. s - t  
  116. 返回一個新的 set 包含 s 中有但是 t 中沒有的元素  
  117.   
  118. s.symmetric_difference(t)  
  119. s ^ t  
  120. 返回一個新的 set 包含 s 和 t 中不重複的元素  
  121.   
  122. s.copy()  
  123. 返回 set “s”的一個淺複製  
  124.   
  125.   
  126. 請注意:union(), intersection(), difference() 和 symmetric_difference() 的非運算符(non-operator,就是形如 s.union()這樣的)版本將會接受任何 iterable 作爲參數。相反,它們的運算符版本(operator based counterparts)要求參數必須是 sets。這樣可以避免潛在的錯誤,如:爲了更可讀而使用 set('abc') & 'cbs' 來替代 set('abc').intersection('cbs')。從 2.3.1 版本中做的更改:以前所有參數都必須是 sets。  
  127.   
  128. 另外,Set 和 ImmutableSet 兩者都支持 set 與 set 之間的比較。兩個 sets 在也只有在這種情況下是相等的:每一個 set 中的元素都是另一箇中的元素(二者互爲subset)。一個 set 比另一個 set 小,只有在第一個 set 是第二個 set 的 subset 時(是一個 subset,但是並不相等)。一個 set 比另一個 set 打,只有在第一個 set 是第二個 set 的 superset 時(是一個 superset,但是並不相等)。  
  129.   
  130. 子 set 和相等比較並不產生完整的排序功能。例如:任意兩個 sets 都不相等也不互爲子 set,因此以下的運算都會返回 False:a<b, a==b, 或者a>b。因此,sets 不提供 __cmp__ 方法。  
  131.   
  132. 因爲 sets 只定義了部分排序功能(subset 關係),list.sort() 方法的輸出對於 sets 的列表沒有定義。  
  133.   
  134.   
  135. 運算符  
  136.    運算結果  
  137.   
  138. hash(s)  
  139.    返回 s 的 hash 值  
  140.   
  141.   
  142. 下面這個表列出了對於 Set 可用二對於 ImmutableSet 不可用的運算:  
  143.   
  144. 運算符(voperator)  
  145. 等價於  
  146. 運算結果  
  147.   
  148. s.update(t)  
  149. s |= t  
  150. 返回增加了 set “t”中元素後的 set “s”  
  151.   
  152. s.intersection_update(t)  
  153. s &= t  
  154. 返回只保留含有 set “t”中元素的 set “s”  
  155.   
  156. s.difference_update(t)  
  157. s -= t  
  158. 返回刪除了 set “t”中含有的元素後的 set “s”  
  159.   
  160. s.symmetric_difference_update(t)  
  161. s ^= t  
  162. 返回含有 set “t”或者 set “s”中有而不是兩者都有的元素的 set “s”  
  163.   
  164. s.add(x)  
  165.   
  166. 向 set “s”中增加元素 x  
  167.   
  168. s.remove(x)  
  169.   
  170. 從 set “s”中刪除元素 x, 如果不存在則引發 KeyError  
  171.   
  172. s.discard(x)  
  173.   
  174. 如果在 set “s”中存在元素 x, 則刪除  
  175.   
  176. s.pop()  
  177.   
  178. 刪除並且返回 set “s”中的一個不確定的元素, 如果爲空則引發 KeyError  
  179.   
  180. s.clear()  
  181.   
  182. 刪除 set “s”中的所有元素  
  183.   
  184.   
  185. 請注意:非運算符版本的 update(), intersection_update(), difference_update()和symmetric_difference_update()將會接受任意 iterable 作爲參數。從 2.3.1 版本做的更改:以前所有參數都必須是 sets。  
  186.   
  187. 還請注意:這個模塊還包含一個 union_update() 方法,它是 update() 方法的一個別名。包含這個方法是爲了向後兼容。程序員們應該多使用 update() 方法,因爲這個方法也被內置的 set() 和 frozenset() 類型支持。  

發佈了41 篇原創文章 · 獲贊 50 · 訪問量 43萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章