Python中容易被忽略的內置類型

Python中的內置類型是我們開發中最常見的,很多人都能熟練的使用它們。

然而有一些內置類型確實不那麼常見的,或者說往往會被我們忽略,所以這次的主題就是帶領大家重新認識這些“不同尋常”的內置類型。

1.frozenset

不可變集合(frozenset)與普通的set一樣,只不過它的元素是不可變的,因此諸如addremoveupdate等可以添加/刪除/改變集合內元素的方法是不存在的,換句話說一旦frozenset建立後你將不再可能更改集合內的元素。

其他的方法與set一致:

>>> frozen = frozenset([1, 1, 2, 3, 4, 5, 6, 6]) 
frozenset({1, 2, 3, 4, 5, 6}) 
>>> frozen | {1, 2, 3, 7, 8} 
frozenset({1, 2, 3, 4, 5, 6, 7, 8}) 
>>> frozen ^ {1, 2, 3, 7, 8} 
frozenset({4, 5, 6, 7, 8})

2.range

range事實上相當得常見,所以你也許會奇怪我爲什麼把它列出來。

其實原因很簡單,因爲大部分人熟悉range的使用,但並不清楚range到底是什麼。返回迭代器?返回一個可迭代對象?range本身又是什麼呢?

答案揭曉:

>>> range

<class 'range'>

是的,range是個class!所以當我們使用for i in range(1, 10)這樣的代碼時,實際上我們遍歷了一個range對象,而range也實現了可迭代對象需要的__iter__魔法方法,所以它自身是可迭代對象:

>>> range.__iter__

<slot wrapper '__iter__' of 'range' objects>

因此,range既不返回迭代器,也不返回其他可迭代對象,而是返回的自己。

3.bytearray

bytearray一般情況下並不常見,它主要爲了可以實現原地修改bytes對象而出現,因爲bytes和str一樣是不可變對象,例如這樣是非法的:

>>> b = '測試用例a'.encode('utf8') 
>>> b[-1] = 98 # change 'a' -> 'b' 
Traceback (most recent call last): File "", line 1, in TypeError: 'bytes' object does not support item assignment 

而當我們把bytes的內容複製給bytearray時就可以進行原地修改了:

>>> array = bytearray(b) 
>>> array[-1] = 98 
>>> array.decode('utf8') 

bytearray對象沒有字面常量,因此只能通過構造函數創建,它有着和bytes一樣的方法,只是可變以及多了一些序列對象的特性。如果要創建一個bytearray可以有如下的幾種方法: - bytearray()返回一個空的bytearray對象 - bytearray(10)創建一個長度爲10且內容被0填充的bytearray - bytearray(iterable)會將可迭代對象的內容轉換成bytes然後存入對象中 - bytearray(b'Hi!')將已有的二進制數據複製進對象

另外bytearray還提供了fromhex和hex方便將數據以16進制的形式輸入輸出:

>>> array.hex()
'e6b58be8af95e794a8e4be8b62'
>>> bytearray().fromhex('e6b58be8af95e794a8e4be8b62').decode('utf8')

'測試用例b'

4.memoryview

memoryview提供了直接訪問對象內存的機制,只要目標對象支持[buffer protocol],例如bytesbytearray

memoryview有個稱爲“元素”的概念,也就是對象規定的最小的內存單元,比如bytes和bytearray的最小內存單元就是一個byte,具體取決於對象的實現。

len(view)通常等於len(view.tolist()),也就是等於view的“元素”數量。如果view.ndim == 0,那麼整個view的內存會被視作一個整體,len會返回1,如果view.ndim == 1那麼就正常返回“元素”的個數。view.itemsize會返回單個“元素”的大小。單位是byte。

view.readonly表示當前的memoryview是否是隻讀的,例如bytes對象的view就是隻讀的,view.readonly的值爲True。是否只讀取決於被引用的對象是否可變以及對buffer protocol的實現。

對於使用完畢的memoryview應該儘快調用其release()方法釋放資源,而且部分對象在被view引用時會自動進行一些限制,比如bytearray會禁止調整大小,及時釋放view是資源可以解除這些限制。

結合示例可以更清晰地瞭解這些特性:

>>> data = bytearray(b'abcefg')
>>> v = memoryview(data)
>>> v.readonly
False
>>> v[0] = ord(b'z')
>>> data
bytearray(b'zbcefg')
>>> v[1:4] = b'123'
>>> data
bytearray(b'z123fg')
>>> v[2:3] = b'spam'
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
ValueError: memoryview assignment: lvalue and rvalue have different structures
>>> v[2:6] = b'spam'
>>> data

bytearray(b'z1spam')

5.dict-views

準確的說,這不是一種類型,而是一種概念。然而typing裏仍然將其視爲一種類型,所以也就羅列在此了。

概念:返回自dict.keys(),dict.values()和dict.items()的對象被稱作dict-views。

對於views對象,可以使用len,成員檢測,它本身也是可迭代對象:

>>> dishes = {'eggs': 2, 'sausage': 1, 'bacon': 1, 'spam': 500}
>>> keys = dishes.keys()
>>> values = dishes.values()
 
>>> # iteration
>>> n = 0
>>> for val in values:
...     n += val
>>> print(n)
504
 
>>> # keys and values are iterated over in the same order (insertion order)
>>> list(keys)
['eggs', 'sausage', 'bacon', 'spam']
>>> list(values)
[2, 1, 1, 500]
#學習中遇到問題沒人解答?小編創建了一個Python學習交流羣:153708845
 
>>> # view objects are dynamic and reflect dict changes
>>> del dishes['eggs']
>>> del dishes['sausage']
>>> list(keys)
['bacon', 'spam']
 
>>> # set operations
>>> keys & {'eggs', 'bacon', 'salad'}
{'bacon'}
>>> keys ^ {'sausage', 'juice'}

{'juice', 'sausage', 'bacon', 'spam'}

從例子中可以看出,views保持着元素的插入順序(插入順序的保證從python3.6開始)以及views動態反應了key/value的插入和刪除以及修改,因此在某些場景下views對象是相當有用的。

6.The Ellipsis Object (...)

...不是一個類型,不過算是一個內置對象。

它沒什麼特殊的含義,僅表示省略,通常被用在type hints中:

>>> ...
Ellipsis
>>> from typing import Callable

>>> func: Callable[..., None] = lambda x,y:print(x*y)

func是一個沒有返回值的函數,參數列表沒有做任何限制。

你也可以寫成Ellipsis,兩者是等價的,不過顯然是...這種形式更簡單明瞭。

以上就是這些容易被忽略和遺忘的內置類型,如有錯誤和疏漏歡迎指出。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章