HashMap
內部結構
內部是一個Node數組,每個Node都是鏈表的頭,當鏈表的大小達到8之後鏈表轉變成紅黑樹。
put操作
final V putVal(int hash, K key, V value, boolean onlyIfAbsent, boolean evict) { Node<K,V>[] tab; Node<K,V> p; int n, i; // 當table爲空或者長度爲0,執行resize if ((tab = table) == null || (n = tab.length) == 0) n = (tab = resize()).length; // 根據hash計算對應數組下標 if ((p = tab[i = (n - 1) & hash]) == null) // 如果沒有值,直接插入 tab[i] = newNode(hash, key, value, null); else { // 如果有值 Node<K,V> e; K k; if (p.hash == hash && ((k = p.key) == key || (key != null && key.equals(k)))) // key存在,把當前節點引用存在e中 e = p; else if (p instanceof TreeNode) // 如果是樹節點,插入樹中。這裏也一樣,如果key衝突了,就返回衝突節點的引用,存儲在e中 e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value); else { // 插入鏈表 for (int binCount = 0; ; ++binCount) { // 插入到鏈表末尾 if ((e = p.next) == null) { p.next = newNode(hash, key, value, null); // 此時如果 binCount大於等於7(因爲是從0開始),則將鏈表轉變成紅黑樹 if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st treeifyBin(tab, hash); break; } // 找到元素,break if (e.hash == hash && ((k = e.key) == key || (key != null && key.equals(k)))) break; // 向後遍歷 p = e; } } // 修改e所在位置的值(這個位置代碼的作用就是處理鏈表中和樹中的衝突key) if (e != null) { // existing mapping for key V oldValue = e.value; // 新value覆蓋舊value if (!onlyIfAbsent || oldValue == null) e.value = value; afterNodeAccess(e); // 返回舊value return oldValue; } } ++modCount; // 容量達到閾值,擴容 if (++size > threshold) resize(); afterNodeInsertion(evict); return null; }
流程可以概括爲:如果Node數組爲空則先按照默認容量初始化數組。利用計算得到的hsah值確定數組下標,
1. 如果下標所在位置的Node爲null,則直接新創建節點放在此處;
2. 如果下標所在位置的Node不爲null,則判斷是否已存在相同key的Node,有則臨時存儲衝突key涉及的Node的引用;
3. 如果key不衝突,則判斷當前位置的Node的類型,如果爲TreeNode,則將其插入樹中,如果和樹中已有的key衝突了,把涉及到的節點的引用返回並臨時存儲;如果不是TreeNode,則從頭開始遍歷鏈表,把新結點插入到鏈表尾部,插完之後判斷是否達到鏈表的閾值,決定是否進行紅黑樹的轉變。
4. 如果有衝突key需要處理,也就是臨時變量存儲的Node引用不爲空,則用新value覆蓋舊的value,並返回舊的value。
5. 如果沒有衝突key,則判斷添加完畢之後是否需要擴容。
下面說一下擴容
// 初始化或者加倍table的大小。如果table爲空,則按照默認容量初始化; // 如果table不爲空,則根據規則把老數組的數據放到新數組中。 final Node<K,V>[] resize() { // 老數組:擴容之前的數組 Node<K,V>[] oldTab = table; // 如果老數組爲空,老容量爲0 int oldCap = (oldTab == null) ? 0 : oldTab.length; // 老的擴容閾值,默認爲0(擴容閾值=容量*負載因子,默認情況下達到容量的75%即需要擴容) int oldThr = threshold; int newCap, newThr = 0; // 老容量大於0,也就是老數組不爲空 if (oldCap > 0) { // 如果老容量大於等於最大容量 if (oldCap >= MAXIMUM_CAPACITY) { // 擴容閾值設置爲Integer的最大值 threshold = Integer.MAX_VALUE; // 返回舊容量 return oldTab; } // 新容量=2*舊容量;新容量小於最大容量 並且 老容量大於等於默認初始化容量(16) else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY && oldCap >= DEFAULT_INITIAL_CAPACITY) // 新擴容閾值=2*老擴容閾值 newThr = oldThr << 1; // double threshold } // 如果老的擴容閾值大於0 else if (oldThr > 0) // initial capacity was placed in threshold // 新容量 = 老的擴容閾值 newCap = oldThr; else { // zero initial threshold signifies using defaults // 老的擴容閾值等於0,也就是初始化的時候【這裏可以看出,在這個地方進行了初始化的工作:設置默認容量,設置擴容閾值】 // 新容量等於默認的容量 newCap = DEFAULT_INITIAL_CAPACITY; // 新的擴容閾值等於默認容量的75% newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY); } if (newThr == 0) { // 如果新擴容閾值等於0,則設置新的擴容閾值(新容量的75%) float ft = (float)newCap * loadFactor; newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ? (int)ft : Integer.MAX_VALUE); } // 更新擴容閾值! threshold = newThr; @SuppressWarnings({"rawtypes","unchecked"}) // 按照新容量new了一個新的Node數組 Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap]; // 更新table! table = newTab; // 第一次初始化爲oldTab=null,不走這個 if (oldTab != null) { // 這裏纔是真正意義上的擴容操作! // 遍歷老數組 for (int j = 0; j < oldCap; ++j) { Node<K,V> e; // 老數組當前位置的元素不爲null if ((e = oldTab[j]) != null) { // 置空,這裏可以看出:table中存放的只是Node的引用 oldTab[j] = null; // 如果沒有後繼元素 if (e.next == null) // 根據當前元素的hash,放進新數組對應的位置 newTab[e.hash & (newCap - 1)] = e; else if (e instanceof TreeNode) // 如果當前元素類型爲TreeNode,主要分爲兩個部分:1. 將樹進行節點拆分 2. 如果達到退化閾值6,將把紅黑樹退化成鏈表 ((TreeNode<K,V>)e).split(this, newTab, j, oldCap); else { // 對鏈表的拆分,實際上和上一步類似,都是把原結構拆分成high和low兩部分 // low鏈的head和tail Node<K,V> loHead = null, loTail = null; // high鏈的head和tail Node<K,V> hiHead = null, hiTail = null; Node<K,V> next; // 查看循環條件可知:遍歷原鏈表e,一直到最後e.next=null do { // 下一個節點 next = e.next; // 根據條件:(e.hash & oldCap) == 0 把原鏈表劃分成兩部分 if ((e.hash & oldCap) == 0) { if (loTail == null) // low鏈表爲空,直接放在頭結點 loHead = e; else // 否則放在尾部 loTail.next = e; // 移動尾指針 loTail = e; } else { // 過程同上 if (hiTail == null) hiHead = e; else hiTail.next = e; hiTail = e; } } while ((e = next) != null); // 把low鏈放在新表j的位置上。新表的下標位置與舊錶一致都爲j if (loTail != null) { loTail.next = null; newTab[j] = loHead; } // 把high鏈放在新表[j+oldCap]的位置上 if (hiTail != null) { hiTail.next = null; newTab[j + oldCap] = hiHead; } } } } } // 返回新table return newTab; }
總結一下過程:
1. 如果table爲null,則按照默認配置初始化,容量爲16,擴容閾值爲16*0.75=12【也就是添加完第13個元素的時候啓動擴容】。
2. 如果table不爲null:①、如果老容量大於0,則新容量=2*老容量,新擴容閾值=2*老擴容閾值。②、在不滿足①的前提下,新容量=老的擴容閾值。③、在不滿足①個②的前提下,初始化新容量爲默認的16,新擴容閾值爲12。
3. 如果新的擴容閾值爲0,則將其設置爲新容量的%75。然後更新HashMap的成員變量threshold爲新的擴容閾值。
4. 利用前面計算出來的新容量,new一個新的Node數組。然後更新HashMap的成員變量table爲新的數組。
5. 如果老數組裏面有數據,則將老數組裏的數據轉移到新數組。遍歷老數組,①:當前元素的後繼爲null,直接把當前元素放在新數組的e.hash & (newCap - 1)位置上。②:如果當前節點有後繼元素並且元素類型爲TreeNode,則按照樹的規則進行拆分;如果元素數量達到閾值6,則退化成一個鏈表。③:如果當前節點有後繼元素並且元素類型爲Node,則按照(e.hash & oldCap) == 0規則將鏈表拆分爲兩部分,一部分放在新數組j的位置上,一部分放在新數組j+oldCap位置上。
6. 返回新數組。
簡單來講:
1. 當table需要初始化或者需要擴容的時候執行resize。初始化的時候按照默認值進行初始化(容量=16,擴容閾值=12);擴容的時候新容量是老容量的2倍,擴容閾值也是老擴容閾值的2倍。
2. 每次擴容都會新建一個數組,然後將老table中的元素re-hash到新的table中, 但元素在新舊table中的位置存在一定的聯繫:要麼下標相同,要麼相差一個oldCap(原table的大小)。
未完待續
Hashtable
--
LinkedHashMap
--
WeakHashMap
--
.