這個問題是在面試時常問的幾個問題,一般在問這個問題之前會問Hashmap和HashTable的區別?面試者一般會回答:hashtable是線程安全的,hashmap是線程不安全的。
那麼面試官就會緊接着問道,爲什麼hashmap不是線程安全的,會造成什麼問題麼?於是面試者就回答:HashMap在併發情況下的put操作會造成死循環。
這時候就會被面試官問:HashMap在併發爲什麼造成死循環?
很多面試者這時候就會一臉懵。沒有過相關經驗和深入的理解源碼是很難回答這個問題的。
下面我們就通過HahMap源碼來驗證下,多線程併發put操作爲何會生成環形鏈表,產生死循環。
這是HashMap擴容的源碼
/**
* Transfers all entries from current table to newTable.
*/
void transfer(Entry[] newTable, boolean rehash) {
int newCapacity = newTable.length;
for (Entry<K,V> e : table) {
while(null != e) {
//(關鍵代碼)
Entry<K,V> next = e.next;
if (rehash) {
e.hash = null == e.key ? 0 : hash(e.key);
}
int i = indexFor(e.hash, newCapacity);
e.next = newTable[i];
newTable[i] = e;
e = next;
} // while
}
}
開始之前先回顧一下HashMap的擴容機制:
HashMap默認設定的裝載因子爲0.75(可改),HashMap的大小爲length,已經裝載的元素數量爲num,當( num / length )> 裝載因子時,
開始擴容
先創建一個散列表HashMap:Map<Integer> map = new HashMap<Integer>(2);
,裝載因子默認0.75,當插入第二個元素時,會發生擴容
我們先在map中放入6、8兩個元素。
這時有兩個線程都執行put操作,那麼在此刻兩個線程都對HashMap進行擴容,這時候就注意在上文的源碼裏註釋爲(關鍵代碼)這一行:Entry<K,V> next = e.next;
假如兩個線程分別爲A、B兩個線程。A線程在執行到關鍵代碼
這一行線程就被掛起,那麼此刻A線程中:e = 6; next = 8;
接着B線程開始進行擴容,假設新的散列表中,節點6 和 節點8 還是會產生散列衝突,那麼線程B的擴容過程爲:
-
先申請一個空間爲舊散列表兩倍大的空間
-
將節點6 遷移至新散列表
-
將節點8 遷移至新散列表
此時線程B的擴容已經完成,節點8 的後繼節點爲節點6 ,節點6的後繼節點爲null。
我們將新舊兩個散列表做個對比:
回顧一下線程A的當前狀態:e = 6; next = 8;
,處於掛起狀態。接着A線程取消掛起狀態,接着執行(關鍵代碼)之後的代碼:將e = 6;
節點遷移至新的散列表,並將next = 8
的節點賦值給e
。擴容並遷移節點6後的狀態,如下圖所示:
於是第二次執行while循環時,當前待處理節點:e = 8;
在執行(關鍵代碼)這一行時,由於線程B在擴容時將節點8的後繼節點變爲節點6,所以next不是爲null,而是next = 6;
接着開始執行第三次while循環,由於節點6的後繼節點爲null,所以 next = null;
,執行完第三次while循環的結果爲:
循環結束。
可以看到擴容後的散列表中鏈表成環,如果這時候執行get()
方法查詢,就會導致死循環。
總結
HashMap的方法不是線程安全的。HashMap在併發執行put操作時發生擴容,可能會導致節點丟失,產生環形鏈表等情況。
- 節點丟失,會導致數據不準
- 生成環形鏈表,會導致get()方法死循環。
知識拓展
在jdk1.7中,由於擴容時使用頭插法,在併發時可能會形成環狀列表,導致死循環,在jdk1.8中改爲尾插法,可以避免這種問題,但是依然避免不了節點丟失的問題。
建議
HashMap的設計初衷就不是在併發情況下使用,如果有併發的場景,推薦使用ConcurrentHashMap