HashMap初始容量剖析

問題: 確定只裝載10個元素, HashMap初始容量多少是最佳?

答案: 16

目的: 防止HashMap頻繁擴容,影響性能

解析:

HashMap的底層數據結構是由 數組 和 單向鏈表 組成

	擴容概念: 當所用數組的長度  大於 初始長度 * 0.75(負載因子)時,數組擴容
		Map<String, String> map = new HashMap<String, String>();
		等同於
		Map<String, String> map = new HashMap<String, String>(16);
		
		初始化容量默認爲16,當數組使用超過 16 * 0.75 = 12 時(數組使用第13個元素時)擴容

舉例:

	map的初始容量爲4,向map中放入6個元素,有可能擴容,有可能不擴容

	如果所用數組長度小於 4 * 0.75 = 3,不擴容

不擴容,數據結構如下:

		由於key的hash值相同,產生碰撞,放入到數組中的同一位置,形成單向鏈表

不擴容的數據結構

擴容的情況如下:

由於key的hash值不同,放入到數組中的不同位置,當放第四個元素時,HashMap擴容爲8

擴容源碼如下:
// ++ this.size = 4      this.threshold = 4 * 0.75 = 3
if (++this.size > this.threshold) {
    this.resize();
}

擴容數據結構

假設10個元素尋址運算得到的index都不相同,初始容量應爲 10 / 0.75 = 13.3向上取整,初始容量爲14,此時不會擴容

通過閱讀HashMap源碼可知,容量大小爲 2 的 n次方.所以應該取第一個大於14 的 2 的 n次方 值,爲 16

新的問題: 容量大小爲什麼必須是 2 的 n次方?14爲什麼不行??

原因: 避免 哈希桶資源浪費

解析:

 map.put("key","value")時,尋址算法爲 length-1 & key.hash --> 13 &  key.hash
    length-1 : 00000000000000000000000000001101
    key1.hash: 11111111111111110000111100000111
    --------------------------------
    00000000000000000000000000000101 = 5

    如果容量爲14 , length-1 = 13  , 13的二進制位1101,1101 與別的數值 進行 & 運算, 倒數第二位得到的永遠是0,對空間造成浪費,同時會增大hash尋址得到的index相同的概率

    所以length-1 的二進制 應當全部爲1,將hash表的長度設爲2的N次方

    2的N次方 -1 的二進制全部爲1,所有的哈希桶均有被使用的可能

    避免了上述問題,所以初始容量應爲16


    其實無論你的HashMap(x)中的x設置爲多少,HashMap的大小都是2^n。2^n是大於x的第一個數。因爲HashMap的初始化代碼中有以下這行代碼:
	    static final int tableSizeFor(int var0) {
	        int var1 = var0 - 1;
	        var1 |= var1 >>> 1;
	        var1 |= var1 >>> 2;
	        var1 |= var1 >>> 4;
	        var1 |= var1 >>> 8;
	        var1 |= var1 >>> 16;
	        return var1 < 0 ? 1 : (var1 >= 1073741824 ? 1073741824 : var1 + 1);
	    }
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章