python中list, tuple, dictionary, set的底層細節

1.列表實現是基於數組或基於鏈表結構的。
2.列表和元組的區別是顯然的:
列表是動態的,其大小可以該標 (重新分配),
而元組是不可變的,一旦創建就不能修改。
3.字典
a.CPython使用僞隨機探測(pseudo-random probing)的散列表(hash table)(哈希表)作爲字典的底層數據結構。由於這個實現細節,只有可哈希的對象才能作爲字典的鍵。Python中所有不可變的內置類型都是可哈希的。可變類型(如列表,字典和集合)就是不可哈希的,因此不能作爲字典的鍵。
注:普通的set無法作爲dict的鍵,必須選擇被“凍結”的不可變集合類:frozenset。顧名思義,一旦初始化,集合內數據不可修改。
b.建立哈希表的具體過程如下:
1)數據添加:把key通過哈希函數轉換成一個整型數字,然後就將該數字對數組長度進行取餘,取餘結果就當作數組的下標,將value存儲在以該數字爲下標的數組空間裏。
2)數據查詢:再次使用哈希函數將key轉換爲對應的數組下標,並定位到數組的位置獲取value。
c.本質上看哈希函數不可能做成一個一對一的映射關係,其本質是一個多對一的映射,這也就引出了下面一個概念–哈希衝突或者說哈希碰撞。哈希碰撞是不可避免的,但是一個好的哈希函數的設計需要儘量避免哈希碰撞。
4.集合
a.集合何時使用:當元素順序的重要性不如元素的唯一性和測試元素是否包含在集合中時使用。
b.set集合和dict一樣也是基於散列表的,只是他的表元只包含值的引用而沒有對鍵的引用,其他的和dict基本上是一致的
c.set的去重是通過兩個函數__hash__和__eq__結合實現的。
1)當兩個變量的哈希值不相同時,就認爲這兩個變量是不同的
2)當兩個變量哈希值一樣時,調用__eq__方法,當返回值爲True時認爲這兩個變量是同一個,應該去除一個。返回FALSE時,不去重
5.list有以下幾個特點:
a.元素有位置下標,以索引就可以直接取到元素 --> 連續的存儲空間,以偏移量計算取得元素,不必遍歷所有元素
b.元素無論如何改變,表對象不變,也就是其id不變 --> 分離式結構,表頭和元素內容分開儲存,這樣在更改list時,表對象始終是同一個,只是其指向的地址不同
c.元素可以是任意類型 --> 既要要求是連續存儲,又可以存儲不同類型的數據,那麼其用的就是元素外置的方式,存儲的只是地址的引用
d.可以任意添加新元素 --> 要能不斷地添加新元素,其使用了動態擴充的策略
6. 列表的底層實現
a.CPython 如何實現列表初始化:
先分配一個對象的內存塊,同時將這個內存塊的大小置零。再給這個對象分配一個內存槽的大小。分配的槽的大小,會比元素個數大一點,目的就是爲了防止在每次添加元素的時候都去調用分配內存的函數。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章