HashMap學習——數據結構、存儲格式、源碼理解

數據結構+存儲格式


JDK8之前HashMap是利用數組+鏈表的形式以Entry<K,V>對象存儲數據。

Entry<K,V>中包含key,value,hash,next信息如下:

static class Entry<K,V> implements Map.Entry<K,V> {
    final K key;
    V value;
    Entry<K,V> next;
    int hash;
}

從這裏可以看出,每個Entry裏都會存放自己下一個數據,也就是next中存放的數據,從而形成鏈表的形式。那麼爲什麼不是直接通過數組存儲,偏偏要結合鏈表呢?原因是HashMap在存儲數據的時候,會先計算Key的hashCode,通過(hashCode & (length-1))生成在數組中存放位置的index,計算出來的index會出現相同的情況,但是數組的同一index不能存儲多個數據,所以當index的位置已經有數據的時候,就會將新數據存入index位置,並將之前處於index位置的數據存入到新數據的next中。

可以結合這個圖片進行理解


 補充知識:

鏈表在插入數據的時候時間複雜度爲O(1),效率較數組高,但是在讀取的時候時間複雜度爲O(n),效率較數組低;

數組在插入數據的時候時間複雜度爲O(n),效率較鏈表低,但是在讀取的時候時間複雜度爲O(1),效率較鏈表高;


按照上面的數據存儲格式中的描述,當index相等的情況相等過多的時候就會導致鏈表過長,鏈表過長的時候,讀取效率就較爲低下,所以在JDK8中HashMap進行了優化,JDK8之後HashMap是利用數組+(鏈表 or 紅黑樹)的形式以Node<K,V>存儲數據。紅黑樹也可以理解爲平衡二叉樹,他會根據插入的值動態的調整數據所處位置。那麼爲什麼是鏈表 or紅黑樹呢?可以先根據下圖感受一下鏈表與二叉樹與紅黑樹的區別

從鏈表的長度和二叉樹的深度來看,從圖中可以很直觀的感受到相同的數據,用鏈表存儲的時候長度過長,那麼在讀取的時候效率就會很低。用紅黑樹存儲的時候,查詢效率明顯會高於鏈表存儲。但是紅黑樹也帶來了問題,那就是由於他會動態的調整數據,所以會導致在插入的時候很耗時間。爲了解決這個問題,HashMap會在當鏈表長度小於8的時候,用鏈表存儲數據。但是當鏈表長度大於8的時候,就會自動將鏈表轉化爲紅黑樹來存儲數據。這也就是爲什麼是鏈表 or 紅黑樹的原因了。


源碼

put方法

public V put(K key, V value) {
    return putVal(hash(key), key, value, false, true);
}

static final int hash(Object key) {
    int h;
    return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}

final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                   boolean evict) {
    Node<K,V>[] tab; Node<K,V> p; int n, i;
    if ((tab = table) == null || (n = tab.length) == 0)
        n = (tab = resize()).length;
    if ((p = tab[i = (n - 1) & hash]) == null)
        tab[i] = newNode(hash, key, value, null);
    else {
        Node<K,V> e; K k;
        if (p.hash == hash &&
            ((k = p.key) == key || (key != null && key.equals(k))))
            e = p;
        else if (p instanceof TreeNode)
            e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
        else {
            for (int binCount = 0; ; ++binCount) {
                if ((e = p.next) == null) {
                    p.next = newNode(hash, key, value, null);
                    if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                        treeifyBin(tab, hash);
                    break;
                }
                if (e.hash == hash &&
                    ((k = e.key) == key || (key != null && key.equals(k))))
                    break;
                p = e;
            }
        }
        if (e != null) { // existing mapping for key
            V oldValue = e.value;
            if (!onlyIfAbsent || oldValue == null)
                e.value = value;
            afterNodeAccess(e);
            return oldValue;
        }
    }
    ++modCount;
    if (++size > threshold)
        resize();
    afterNodeInsertion(evict);
    return null;
}

get方法

public V get(Object key) {
    Node<K,V> e;
    return (e = getNode(hash(key), key)) == null ? null : e.value;
}

final Node<K,V> getNode(int hash, Object key) {
    Node<K,V>[] tab; Node<K,V> first, e; int n; K k;
    if ((tab = table) != null && (n = tab.length) > 0 &&
        (first = tab[(n - 1) & hash]) != null) {
        if (first.hash == hash && // always check first node
            ((k = first.key) == key || (key != null && key.equals(k))))
            return first;
        if ((e = first.next) != null) {
            if (first instanceof TreeNode)
                return ((TreeNode<K,V>)first).getTreeNode(hash, key);
            do {
                if (e.hash == hash &&
                    ((k = e.key) == key || (key != null && key.equals(k))))
                    return e;
            } while ((e = e.next) != null);
        }
    }
    return null;
}

 


總結

JDK8之前,HashMap以數組+鏈表的形式來存儲數據,但是存在着鏈表過長,數據讀取較慢的問題。所以在JDK8之後進行了優化,優化後HashMap以數組+(鏈表 or 紅黑樹)來存儲數據。由於紅黑樹在插入的時候會動態根據數據大小自動調整數據,所以插入效率會低一些,爲了解決這個問題呢,HashMap設定了一個閥值,默認爲8,也就是說一開始使用HashMap的時候還是用鏈表來存儲數據,當鏈表長度超過閥值的時候,就自動將鏈表轉換爲紅黑樹來存儲數據。這樣在一定程度上能提升性能。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章