Java集合類源碼分析(七):HashMap&LinkedHashMap

我的github:xjwhhh的github
希望大家多多關注,共同進步

Java集合類源碼分析(一):Collcetion接口
Java集合類源碼分析(二):List接口
Java集合類源碼分析(三):AbstractList類
Java集合類源碼分析(四):ArrayList&LinkedList
java集合類源碼分析(五):Map接口
Java集合類源碼分析(六):AbstractMap類
Java集合類源碼分析(七):HashMap&LinkedHashMap
Java集合類源碼分析(八):AbstractSet類
Java集合類源碼分析(九):HashSet&LinkedHashSet

HashMap源碼分析

基於哈希表的map實現類,允許所有可選的map操作,也允許null作爲鍵和值

與HashTable不同處在於HashMap不是同步的,允許null值

HashMap對於順序也不做保證

相比於之前的版本,jdk1.8在解決哈希衝突時有了較大的變化,當數組總容量大於64且鏈表長度大於閾值(默認爲8)時,將鏈表轉化爲紅黑樹,以減少搜索時間。原本Map.Entry接口的實現類Entry改名爲了Node。轉化爲紅黑樹時改用另一種實現TreeNode。

有兩個值影響HashMap的效率,initial capacity和load factor
initial capacity是創建哈希表時的初始大小
load factor是決定哈希表達到多滿時進行自動擴容

HashMap的底層主要是基於數組和鏈表來實現的,它之所以有相當快的查詢速度主要是因爲它是通過計算散列碼來決定存儲的位置。HashMap中主要是通過key的hashCode來計算hash值的,只要hashCode相同,計算出來的hash值就一樣。如果存儲的對象對多了,就有可能不同的對象所算出來的hash值是相同的,這就出現了所謂的hash衝突。解決hash衝突的方法有很多,HashMap底層是通過鏈表來解決hash衝突的。

public HashMap(int initialCapacity, float loadFactor) {
    if (initialCapacity < 0)
        throw new IllegalArgumentException("Illegal initial capacity: " +
                                           initialCapacity);
    if (initialCapacity > MAXIMUM_CAPACITY)
        initialCapacity = MAXIMUM_CAPACITY;
    if (loadFactor <= 0 || Float.isNaN(loadFactor))
        throw new IllegalArgumentException("Illegal load factor: " +
                                           loadFactor);
    this.loadFactor = loadFactor;
    this.threshold = tableSizeFor(initialCapacity);
}

指定初始容量和加載因子

public HashMap(int initialCapacity) {
    this(initialCapacity, DEFAULT_LOAD_FACTOR);
}

指定初始容量,使用默認加載因子

public HashMap() {
    this.loadFactor = DEFAULT_LOAD_FACTOR; // all other fields defaulted
}

使用默認初始容量和加載因子

public HashMap(Map<? extends K, ? extends V> m) {
    this.loadFactor = DEFAULT_LOAD_FACTOR;
    putMapEntries(m, false);
}
final void putMapEntries(Map<? extends K, ? extends V> m, boolean evict) {
    int s = m.size();
    if (s > 0) {
        if (table == null) { // pre-size
            float ft = ((float)s / loadFactor) + 1.0F;
            int t = ((ft < (float)MAXIMUM_CAPACITY) ?
                     (int)ft : MAXIMUM_CAPACITY);
            if (t > threshold)
                threshold = tableSizeFor(t);
        }
        else if (s > threshold)
            resize();
        for (Map.Entry<? extends K, ? extends V> e : m.entrySet()) {
            K key = e.getKey();
            V value = e.getValue();
            putVal(hash(key), key, value, false, evict);
        }
    }
}

使用參數map構造新map,使用默認加載因子

public V get(Object key) {
    Node<K,V> e;
    return (e = getNode(hash(key), key)) == null ? null : e.value;
}

/**
 * Implements Map.get and related methods
 *
 * @param hash hash for key
 * @param key the key
 * @return the node, or null if none
 */
final Node<K,V> getNode(int hash, Object key) {
    Node<K,V>[] tab; Node<K,V> first, e; int n; K k;
    if ((tab = table) != null && (n = tab.length) > 0 &&
        (first = tab[(n - 1) & hash]) != null) {
        if (first.hash == hash && // always check first node
            ((k = first.key) == key || (key != null && key.equals(k))))
            return first;
        if ((e = first.next) != null) {
            if (first instanceof TreeNode) // 紅黑樹
                return ((TreeNode<K,V>)first).getTreeNode(hash, key);
            // 鏈表
            do {
                if (e.hash == hash &&
                    ((k = e.key) == key || (key != null && key.equals(k))))
                    return e;
            } while ((e = e.next) != null);
        }
    }
    return null;
}

獲得鍵與參數key相等的鍵值對的值

final Node<K,V>[] resize() {
    // 當前table保存
    Node<K,V>[] oldTab = table;
    // 保存table大小
    int oldCap = (oldTab == null) ? 0 : oldTab.length;
    // 保存當前閾值 
    int oldThr = threshold;
    int newCap, newThr = 0;
    // 之前table大小大於0
    if (oldCap > 0) {
        // 之前table大於最大容量
        if (oldCap >= MAXIMUM_CAPACITY) {
            // 閾值爲最大整形
            threshold = Integer.MAX_VALUE;
            return oldTab;
        }
        // 容量翻倍,使用左移,效率更高
        else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
            oldCap >= DEFAULT_INITIAL_CAPACITY)
            // 閾值翻倍
            newThr = oldThr << 1; // double threshold
    }
    // 之前閾值大於0
    else if (oldThr > 0)
        newCap = oldThr;
    // oldCap = 0並且oldThr = 0,使用缺省值(如使用HashMap()構造函數,之後再插入一個元素會調用resize函數,會進入這一步)
    else {           
        newCap = DEFAULT_INITIAL_CAPACITY;
        newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
    }
    // 新閾值爲0
    if (newThr == 0) {
        float ft = (float)newCap * loadFactor;
        newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
                  (int)ft : Integer.MAX_VALUE);
    }
    threshold = newThr;
    @SuppressWarnings({"rawtypes","unchecked"})
    // 初始化table
    Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
    table = newTab;
    // 之前的table已經初始化過
    if (oldTab != null) {
        // 複製元素,重新進行hash
        for (int j = 0; j < oldCap; ++j) {
            Node<K,V> e;
            if ((e = oldTab[j]) != null) {
                oldTab[j] = null;
                if (e.next == null)
                    newTab[e.hash & (newCap - 1)] = e;
                else if (e instanceof TreeNode)
                    ((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
                else { // preserve order
                    Node<K,V> loHead = null, loTail = null;
                    Node<K,V> hiHead = null, hiTail = null;
                    Node<K,V> next;
                    // 將同一桶中的元素根據(e.hash & oldCap)是否爲0進行分割,分成兩個不同的鏈表,完成rehash
                    do {
                        next = e.next;
                        if ((e.hash & oldCap) == 0) {
                            if (loTail == null)
                                loHead = e;
                            else
                                loTail.next = e;
                            loTail = e;
                        }
                        else {
                            if (hiTail == null)
                                hiHead = e;
                            else
                                hiTail.next = e;
                            hiTail = e;
                        }
                    } while ((e = next) != null);
                    if (loTail != null) {
                        loTail.next = null;
                        newTab[j] = loHead;
                    }
                    if (hiTail != null) {
                        hiTail.next = null;
                        newTab[j + oldCap] = hiHead;
                    }
                }
            }
        }
    }
    return newTab;
}

進行擴容,會伴隨着一次重新hash分配,並且會遍歷hash表中所有的元素,是非常耗時的。在編寫程序中,要儘量避免resize。

public V put(K key, V value) {
    return putVal(hash(key), key, value, false, true);
}

final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
               boolean evict) {
    Node<K,V>[] tab; Node<K,V> p; int n, i;
    if ((tab = table) == null || (n = tab.length) == 0) // table爲空或length爲0
        n = (tab = resize()).length; // 初始化
    if ((p = tab[i = (n - 1) & hash]) == null) // 如果hash所在位置爲null,直接put
        tab[i] = newNode(hash, key, value, null);
    else { // tab[i]有元素,遍歷節點後添加
        Node<K,V> e; K k;
        // 如果hash、key都相等,直接覆蓋
        if (p.hash == hash &&
            ((k = p.key) == key || (key != null && key.equals(k))))
            e = p;
        else if (p instanceof TreeNode) // 紅黑樹添加節點
            e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
        else { // 鏈表
            for (int binCount = 0; ; ++binCount) {
                if ((e = p.next) == null) { // 找到鏈表最後一個節點,插入新節點
                    p.next = newNode(hash, key, value, null);
                    // 鏈表節點大於閾值8,調用treeifyBin方法,當tab.length大於64將鏈表改爲紅黑樹
                    // 如果tab.length < 64或tab爲null,則調用resize方法重構鏈表.
                    if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                        treeifyBin(tab, hash);
                    break;
                }
                // hash、key都相等,此時節點即要更新節點
                if (e.hash == hash &&
                    ((k = e.key) == key || (key != null && key.equals(k))))
                    break;
                p = e;
            }
        }
        // 當前節點e = p.next不爲null,表示鏈表中原本存在相同的key,則返回oldValue
        if (e != null) { // existing mapping for key
            V oldValue = e.value;
            // onlyIfAbsent值爲false,參數主要決定存在相同key時是否執行替換
            if (!onlyIfAbsent || oldValue == null)
                e.value = value;
            afterNodeAccess(e);
            return oldValue;
        }
    }
    ++modCount;
    if (++size > threshold) // 檢查是否超過閾值
        resize();
    afterNodeInsertion(evict);
    return null; // 原HashMap中不存在相同的key,插入鍵值對後返回null
}

將鍵值與參數key相等的鍵值對的值進行更新

public void putAll(Map<? extends K, ? extends V> m) {
    putMapEntries(m, true);
}

將參數map裏的所有鍵值對加入原map

public V remove(Object key) {
    Node<K,V> e;
    return (e = removeNode(hash(key), key, null, false, true)) == null ?
        null : e.value;
}

/**
 * Implements Map.remove and related methods
 *
 * @param hash hash for key
 * @param key the key
 * @param value the value to match if matchValue, else ignored
 * @param matchValue if true only remove if value is equal
 * @param movable if false do not move other nodes while removing
 * @return the node, or null if none
 */
final Node<K,V> removeNode(int hash, Object key, Object value,
                           boolean matchValue, boolean movable) {
    Node<K,V>[] tab; Node<K,V> p; int n, index;
    if ((tab = table) != null && (n = tab.length) > 0 &&
        (p = tab[index = (n - 1) & hash]) != null) {
        Node<K,V> node = null, e; K k; V v;
        // 直接命中
        if (p.hash == hash &&
            ((k = p.key) == key || (key != null && key.equals(k))))
            node = p;
        else if ((e = p.next) != null) {
            if (p instanceof TreeNode) // 在紅黑樹中查找
                node = ((TreeNode<K,V>)p).getTreeNode(hash, key);
            else { // 在鏈表中查找
                do {
                    if (e.hash == hash &&
                        ((k = e.key) == key ||
                         (key != null && key.equals(k)))) {
                        node = e;
                        break;
                    }
                    p = e;
                } while ((e = e.next) != null);
            }
        }
        // 命中後刪除
        if (node != null && (!matchValue || (v = node.value) == value ||
                             (value != null && value.equals(v)))) {
            if (node instanceof TreeNode) // 在紅黑樹中刪除節點
                ((TreeNode<K,V>)node).removeTreeNode(this, tab, movable);
            else if (node == p) // 鏈表首節點刪除
                tab[index] = node.next;
            else // 多節點鏈表刪除
                p.next = node.next;
            ++modCount;
            --size;
            afterNodeRemoval(node);
            return node;
        }
    }
    return null;
}

刪除鍵與參數key相同的鍵值對

public void clear() {
    Node<K,V>[] tab;
    modCount++;
    if ((tab = table) != null && size > 0) {
        size = 0;
        for (int i = 0; i < tab.length; ++i)
            tab[i] = null; // 把哈希數組中所有位置都賦爲null
    }
}

清空

LinkedHashMap源碼分析

LinkedHashMap繼承了HashMap,所以HashMap的一些方法或者屬性也會被繼承;同時也實現了Map結構

LinkedHashMap保存着元素插入的順序,並且可以按照我們插入的順序進行訪問

LinkedHashMap會將元素串起來,形成一個雙鏈表結構。其結構在HashMap結構上增加了鏈表結構。數據結構爲(數組 + 單鏈表 + 紅黑樹 + 雙鏈表)

LinkedHashMap具有可預知的迭代順序,根據鏈表中元素的順序可以分爲:按插入順序的鏈表,和按訪問順序(調用get方法)的鏈表。

默認是按插入順序排序,如果指定按訪問順序排序,那麼調用get方法後,會將這次訪問的元素移至鏈表尾部,不斷訪問可以形成按訪問順序排序的鏈表。

public LinkedHashMap(int initialCapacity, float loadFactor) {
    super(initialCapacity, loadFactor);
    accessOrder = false;
}

/**
 * Constructs an empty insertion-ordered <tt>LinkedHashMap</tt> instance
 * with the specified initial capacity and a default load factor (0.75).
 *
 * @param  initialCapacity the initial capacity
 * @throws IllegalArgumentException if the initial capacity is negative
 */
public LinkedHashMap(int initialCapacity) {
    super(initialCapacity);
    accessOrder = false;
}

/**
 * Constructs an empty insertion-ordered <tt>LinkedHashMap</tt> instance
 * with the default initial capacity (16) and load factor (0.75).
 */
public LinkedHashMap() {
    super();
    accessOrder = false;
}

public LinkedHashMap(Map<? extends K, ? extends V> m) {
    super();
    accessOrder = false;
    putMapEntries(m, false);
}

putMapEntries是調用到父類HashMap的函數

public LinkedHashMap(int initialCapacity,
                     float loadFactor,
                     boolean accessOrder) {
    super(initialCapacity, loadFactor);
    this.accessOrder = accessOrder;
}

可以指定accessOrder的值,從而控制訪問順序,true爲訪問順序,false爲插入順序

按照訪問的次序來排序的含義:當調用LinkedHashMap的get(key)或者put(key, value)時,碰巧key在map中被包含,那麼LinkedHashMap會將key對象的entry放在線性結構的最後。

按照插入順序來排序的含義:調用get(key), 或者put(key, value)並不會對線性結構產生任何的影響。

private void linkNodeLast(LinkedHashMap.Entry<K,V> p) {
    LinkedHashMap.Entry<K,V> last = tail;
    tail = p;
    if (last == null)
        head = p;
    else {
        p.before = last;
        last.after = p;
    }
}

將結點鏈接到雙鏈表的末尾,維護插入順序

// apply src's links to dst
private void transferLinks(LinkedHashMap.Entry<K,V> src,
                           LinkedHashMap.Entry<K,V> dst) {
    LinkedHashMap.Entry<K,V> b = dst.before = src.before;
    LinkedHashMap.Entry<K,V> a = dst.after = src.after;
    if (b == null)
        head = dst;
    else
        b.after = dst;
    if (a == null)
        tail = dst;
    else
        a.before = dst;
}

此函數用dst結點替換結點,只考慮了before與after域,並沒有考慮next域,next會在調用transferLinks函數中進行設定。

void reinitialize() {
    super.reinitialize();
    head = tail = null;
}

初始化,調用父類的初始化,雙向鏈表的頭尾結點都設爲null

Node<K,V> newNode(int hash, K key, V value, Node<K,V> e) {
    LinkedHashMap.Entry<K,V> p =
        new LinkedHashMap.Entry<K,V>(hash, key, value, e);
    linkNodeLast(p);
    return p;
}

此函數在HashMap類中也有實現,LinkedHashMap重寫了該函數,所以當實際對象爲LinkedHashMap,桶中結點類型爲Node時,我們調用的是LinkedHashMap的newNode函數,而非HashMap的函數,newNode函數會在調用put函數時被調用。

LinkedHashMap並沒有重寫HashMap的put方法,而是重寫了newNode,調用linkNodeLast()來實現對雙向鏈表的維護

可以看到,除了新建一個結點之外,還把這個結點鏈接到雙鏈表的末尾了,這個操作維護了插入順序。

TreeNode<K,V> newTreeNode(int hash, K key, V value, Node<K,V> next) {
    TreeNode<K,V> p = new TreeNode<K,V>(hash, key, value, next);
    linkNodeLast(p);
    return p;
}

當桶中結點類型爲TreeNode時候,插入結點時調用的此函數,也會鏈接到末尾。

void afterNodeRemoval(Node<K,V> e) { // unlink
    LinkedHashMap.Entry<K,V> p =
        (LinkedHashMap.Entry<K,V>)e, b = p.before, a = p.after;
    // 將 p 節點的前驅後後繼引用置空
    p.before = p.after = null;
    // b 爲 null,表明 p 是頭節點
    if (b == null)
        head = a;
    else
        b.after = a;
    // a 爲 null,表明 p 是尾節點
    if (a == null)
        tail = b;
    else
        a.before = b;
}

在刪除節點後,回調方法 afterNodeRemoval 會被調用。LinkedHashMap 覆寫該方法,並在該方法中完成了移除被刪除節點的操作
1.根據 hash 定位到桶位置
2.遍歷鏈表或調用紅黑樹相關的刪除方法
3.從 LinkedHashMap 維護的雙鏈表中移除要刪除的節點

void afterNodeInsertion(boolean evict) { // possibly remove eldest
    LinkedHashMap.Entry<K,V> first;
    if (evict && (first = head) != null && removeEldestEntry(first)) {
        K key = first.key;
        removeNode(hash(key), key, null, false, true);
    }
}

根據條件判斷是否移除最近最少被訪問的節點

void afterNodeAccess(Node<K,V> e) { // move node to last
    LinkedHashMap.Entry<K,V> last;
    if (accessOrder && (last = tail) != e) {
        LinkedHashMap.Entry<K,V> p =
            (LinkedHashMap.Entry<K,V>)e, b = p.before, a = p.after;
        p.after = null;
        if (b == null)
            head = a;
        else
            b.after = a;
        if (a != null)
            a.before = b;
        else
            last = b;
        if (last == null)
            head = p;
        else {
            p.before = last;
            last.after = p;
        }
        tail = p;
        ++modCount;
    }
}

此函數在很多函數中都會被回調,LinkedHashMap重寫了HashMap中的此函數。若訪問順序爲true,且訪問的對象不是尾結點,會將之鏈接到尾節點的後面,即用來更新訪問順序的

public boolean containsValue(Object value) {
    for (LinkedHashMap.Entry<K,V> e = head; e != null; e = e.after) {
        V v = e.value;
        if (v == value || (value != null && value.equals(v)))
            return true;
    }
    return false;
}

containsValue函數根據雙鏈表結構來查找是否包含value,是按照插入順序進行查找的,與HashMap中的此函數查找方式不同,HashMap是使用按照桶遍歷,沒有考慮插入順序。

發佈了43 篇原創文章 · 獲贊 27 · 訪問量 4萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章