ThreadLocalMap源碼分析

分析ThreadLocalMap源碼的原因,是想看看使用WeakReference的類似Map數據結構是如何銷燬已被回收的WeakReference指向的對象。瞭解銷燬的算法,學習其思路,以備以後自己開發類似功能。

static class Entry extends WeakReference<ThreadLocal<?>> {
    /** The value associated with this ThreadLocal. */
    Object value;

    Entry(ThreadLocal<?> k, Object v) {
        super(k);
        value = v;
    }
}

Entry[] table; // 這是ThreadLocalMap保存數據的地方。

table[i].get();獲取的是WeakReference指向的值,而不是value。這個值會在除WeakReference外,沒有其他引用指向的時候,被JVM回收。

問題提出:
如果WeakReference指向的值,即ThreadLocal,被JVM回收後(常見是,在Thread結束後的一次gc)。table不錯陳舊數據處理,會怎麼樣?答案是table無限增大,效率隨時間的增長不斷的降低。如何高效的回收,是學習的重點。

private int expungeStaleEntry(int staleSlot);如果發現table一個slot,使得table[slot].get() == null。表明數據陳舊,需回收。調用該方法。
代碼:

private int expungeStaleEntry(int staleSlot) {
    Entry[] tab = table;
    int len = tab.length;

    // expunge entry at staleSlot
    tab[staleSlot].value = null;
    tab[staleSlot] = null;
    size--;

    // Rehash until we encounter null
    Entry e;
    int i;
    for (i = nextIndex(staleSlot, len);
         (e = tab[i]) != null;
         i = nextIndex(i, len)) {
        ThreadLocal<?> k = e.get();
        if (k == null) {
            e.value = null;
            tab[i] = null;
            size--;
        } else {
            int h = k.threadLocalHashCode & (len - 1);
            if (h != i) {
                tab[i] = null;

                // Unlike Knuth 6.4 Algorithm R, we must scan until
                // null because multiple entries could have been stale.
                while (tab[h] != null)
                    h = nextIndex(h, len);
                tab[h] = e;
            }
        }
    }
    return i;
}

不僅將當前slot的Entry置空,還要檢查slot到下一個爲null的slot之間的entry。如果爲陳舊的數據,則置空。如果不是,進行rehash。
rehash的原理是:int h = k.threadLocalHashCode & (len - 1); h!=i,表明當初在新增的時候,就發生了hash衝突,導致該entry在table的位置後移。處理方式是:將tab[i]=null,重新找index爲h及之後的table,直道找到table[h]=null,然後將table[h] = e。hash衝突會隨後介紹。
返回值是下一個table[slot]==null的slot;

private boolean cleanSomeSlots(int i, int n)。這個函數實際是調用expungeStaleEntry清除陳舊數據的。
代碼:

private boolean cleanSomeSlots(int i, int n) {
    boolean removed = false;
    Entry[] tab = table;
    int len = tab.length;
    do {
        i = nextIndex(i, len);
        Entry e = tab[i];
        if (e != null && e.get() == null) {
            n = len;
            removed = true;
            i = expungeStaleEntry(i);
        }
    } while ( (n >>>= 1) != 0);
    return removed;
}

比較有意思的是這句:while ( (n >>>= 1) != 0); 循環log2(n)次,目的是平衡不做清除(高效但是陳舊數據殘留)和全部判斷並做清除(對一些插入操作性能造成影響)。這種做法目前挺高效,並且工作挺不錯,所以就用着了。
if (e != null && e.get() == null) { n = len; 意味着一旦發現有陳舊數據,循環次數將增加。
返回值,是否有陳舊值被清除。

private void set(ThreadLocal

private void set(ThreadLocal<?> key, Object value) {

    // We don't use a fast path as with get() because it is at
    // least as common to use set() to create new entries as
    // it is to replace existing ones, in which case, a fast
    // path would fail more often than not.

    Entry[] tab = table;
    int len = tab.length;
    int i = key.threadLocalHashCode & (len-1);

    for (Entry e = tab[i];
         e != null;
         e = tab[i = nextIndex(i, len)]) {
        ThreadLocal<?> k = e.get();

        if (k == key) {
            e.value = value;
            return;
        }

        if (k == null) {
            replaceStaleEntry(key, value, i);
            return;
        }
    }

    tab[i] = new Entry(key, value);
    int sz = ++size;
    if (!cleanSomeSlots(i, sz) && sz >= threshold)
        rehash();
}

有了上面的介紹,這段就很好理解了。replaceStaleEntry(key, value, i);這句以後再研究,有點複雜(向前去除陳舊數據)。
這句有點意思:
if (!cleanSomeSlots(i, sz) && sz >= threshold) rehash(); 如果有陳舊值被處理,那麼一定不會進行rehash。如果沒有陳舊值被刪除,則看當前table的entry數量是否大於閾值。是,則rehash。

private void rehash() {
    expungeStaleEntries();

    // Use lower threshold for doubling to avoid hysteresis
    if (size >= threshold - threshold / 4)
        resize();
}

清除所有陳舊值,然後resize。

rezie()有點意思,處理hash衝突的方式和HashMap不一樣。
代碼:

private void resize() {
    Entry[] oldTab = table;
    int oldLen = oldTab.length;
    int newLen = oldLen * 2;
    Entry[] newTab = new Entry[newLen];
    int count = 0;

    for (int j = 0; j < oldLen; ++j) {
        Entry e = oldTab[j];
        if (e != null) {
            ThreadLocal<?> k = e.get();
            if (k == null) {
                e.value = null; // Help the GC
            } else {
                int h = k.threadLocalHashCode & (newLen - 1);
                while (newTab[h] != null)
                    h = nextIndex(h, newLen);
                newTab[h] = e;
                count++;
            }
        }
    }

    setThreshold(newLen);
    size = count;
    table = newTab;
}

將新的table大小設爲舊的table大小的2倍。然後將舊的table中entry挨個插入到新的table中,當然,插入前還是要判斷entry是否過期。
插入過程中,如果發現hash衝突(int h = k.threadLocalHashCode & (newLen - 1); ),則查找h之後的table元素,知道table[h] != null,將table[h] = e;
這應該是另一種hash探測法吧,還得找時間學學。

對比WeakHashMap,大致原理與ThreadLocalMap相似。
WeakHashMap執行expungeTableEntries()是在resize(), size(), getTable()等方法中。而不是在每一次插入。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章