HashMap學習——數據結構、存儲格式、源碼理解

數據結構+存儲格式

JDK8之前HashMap是利用數組+鏈表的形式以Entry<K,V>對象存儲數據。

Entry<K,V>中包含key，value，hash，next信息如下：

static class Entry<K,V> implements Map.Entry<K,V> {
    final K key;
    V value;
    Entry<K,V> next;
    int hash;
}

從這裏可以看出，每個Entry裏都會存放自己下一個數據，也就是next中存放的數據，從而形成鏈表的形式。那麼爲什麼不是直接通過數組存儲，偏偏要結合鏈表呢？原因是HashMap在存儲數據的時候，會先計算Key的hashCode，通過（hashCode & (length-1)）生成在數組中存放位置的index，計算出來的index會出現相同的情況，但是數組的同一index不能存儲多個數據，所以當index的位置已經有數據的時候，就會將新數據存入index位置，並將之前處於index位置的數據存入到新數據的next中。

可以結合這個圖片進行理解

補充知識：

鏈表在插入數據的時候時間複雜度爲O(1)，效率較數組高，但是在讀取的時候時間複雜度爲O(n)，效率較數組低；

數組在插入數據的時候時間複雜度爲O(n)，效率較鏈表低，但是在讀取的時候時間複雜度爲O(1)，效率較鏈表高；

按照上面的數據存儲格式中的描述，當index相等的情況相等過多的時候就會導致鏈表過長，鏈表過長的時候，讀取效率就較爲低下，所以在JDK8中HashMap進行了優化，JDK8之後HashMap是利用數組+（鏈表 or 紅黑樹）的形式以Node<K,V>存儲數據。紅黑樹也可以理解爲平衡二叉樹，他會根據插入的值動態的調整數據所處位置。那麼爲什麼是鏈表 or紅黑樹呢？可以先根據下圖感受一下鏈表與二叉樹與紅黑樹的區別

從鏈表的長度和二叉樹的深度來看，從圖中可以很直觀的感受到相同的數據，用鏈表存儲的時候長度過長，那麼在讀取的時候效率就會很低。用紅黑樹存儲的時候，查詢效率明顯會高於鏈表存儲。但是紅黑樹也帶來了問題，那就是由於他會動態的調整數據，所以會導致在插入的時候很耗時間。爲了解決這個問題，HashMap會在當鏈表長度小於8的時候，用鏈表存儲數據。但是當鏈表長度大於8的時候，就會自動將鏈表轉化爲紅黑樹來存儲數據。這也就是爲什麼是鏈表 or 紅黑樹的原因了。

源碼

put方法

public V put(K key, V value) {
    return putVal(hash(key), key, value, false, true);
}

static final int hash(Object key) {
    int h;
    return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}

final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                   boolean evict) {
    Node<K,V>[] tab; Node<K,V> p; int n, i;
    if ((tab = table) == null || (n = tab.length) == 0)
        n = (tab = resize()).length;
    if ((p = tab[i = (n - 1) & hash]) == null)
        tab[i] = newNode(hash, key, value, null);
    else {
        Node<K,V> e; K k;
        if (p.hash == hash &&
            ((k = p.key) == key || (key != null && key.equals(k))))
            e = p;
        else if (p instanceof TreeNode)
            e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
        else {
            for (int binCount = 0; ; ++binCount) {
                if ((e = p.next) == null) {
                    p.next = newNode(hash, key, value, null);
                    if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                        treeifyBin(tab, hash);
                    break;
                }
                if (e.hash == hash &&
                    ((k = e.key) == key || (key != null && key.equals(k))))
                    break;
                p = e;
            }
        }
        if (e != null) { // existing mapping for key
            V oldValue = e.value;
            if (!onlyIfAbsent || oldValue == null)
                e.value = value;
            afterNodeAccess(e);
            return oldValue;
        }
    }
    ++modCount;
    if (++size > threshold)
        resize();
    afterNodeInsertion(evict);
    return null;
}

get方法

public V get(Object key) {
    Node<K,V> e;
    return (e = getNode(hash(key), key)) == null ? null : e.value;
}

final Node<K,V> getNode(int hash, Object key) {
    Node<K,V>[] tab; Node<K,V> first, e; int n; K k;
    if ((tab = table) != null && (n = tab.length) > 0 &&
        (first = tab[(n - 1) & hash]) != null) {
        if (first.hash == hash && // always check first node
            ((k = first.key) == key || (key != null && key.equals(k))))
            return first;
        if ((e = first.next) != null) {
            if (first instanceof TreeNode)
                return ((TreeNode<K,V>)first).getTreeNode(hash, key);
            do {
                if (e.hash == hash &&
                    ((k = e.key) == key || (key != null && key.equals(k))))
                    return e;
            } while ((e = e.next) != null);
        }
    }
    return null;
}

總結

JDK8之前，HashMap以數組+鏈表的形式來存儲數據，但是存在着鏈表過長，數據讀取較慢的問題。所以在JDK8之後進行了優化，優化後HashMap以數組+（鏈表 or 紅黑樹）來存儲數據。由於紅黑樹在插入的時候會動態根據數據大小自動調整數據，所以插入效率會低一些，爲了解決這個問題呢，HashMap設定了一個閥值，默認爲8，也就是說一開始使用HashMap的時候還是用鏈表來存儲數據，當鏈表長度超過閥值的時候，就自動將鏈表轉換爲紅黑樹來存儲數據。這樣在一定程度上能提升性能。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

HashMap學習——數據結構、存儲格式、源碼理解

數據結構+存儲格式

源碼

PDManer [元數建模]-v4.9.0 發佈：一款簡單好用的數據庫建模平臺

使用neovim打造go ide(支持代碼跳轉, 代碼補全, 實時語法檢查)

sql求連續值問題

cs01 CSS Syntax

挑戰程序設計競賽 2.3章習題 poj 3046 Ant Counting

[MASM拾遺]Offset僞指令

h30 HTML Layout Elements

瞭解顯卡

一款基於C#開發的通訊調試工具（支持Modbus RTU、MQTT調試）

Linux/Golang/glibC系統調用

排序算法（二）——插入排序原理及Java實現

排序算法（一）——冒泡排序原理及Java實現

JVM內存分區、垃圾回收算法、垃圾回收器的整理記憶

使用echarts做圖表展示（基礎展示demo代碼）

HashMap學習——數據結構、存儲格式、源碼理解

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結