ThreadLocalMap源碼分析

原創

2018-08-31 15:20

分析ThreadLocalMap源碼的原因，是想看看使用WeakReference的類似Map數據結構是如何銷燬已被回收的WeakReference指向的對象。瞭解銷燬的算法，學習其思路，以備以後自己開發類似功能。

static class Entry extends WeakReference<ThreadLocal<?>> {
    /** The value associated with this ThreadLocal. */
    Object value;

    Entry(ThreadLocal<?> k, Object v) {
        super(k);
        value = v;
    }
}

Entry[] table; // 這是ThreadLocalMap保存數據的地方。

table[i].get()；獲取的是WeakReference指向的值，而不是value。這個值會在除WeakReference外，沒有其他引用指向的時候，被JVM回收。

問題提出：
如果WeakReference指向的值，即ThreadLocal，被JVM回收後（常見是，在Thread結束後的一次gc）。table不錯陳舊數據處理，會怎麼樣？答案是table無限增大，效率隨時間的增長不斷的降低。如何高效的回收，是學習的重點。

private int expungeStaleEntry(int staleSlot)；如果發現table一個slot，使得table[slot].get() == null。表明數據陳舊，需回收。調用該方法。
代碼：

private int expungeStaleEntry(int staleSlot) {
    Entry[] tab = table;
    int len = tab.length;

    // expunge entry at staleSlot
    tab[staleSlot].value = null;
    tab[staleSlot] = null;
    size--;

    // Rehash until we encounter null
    Entry e;
    int i;
    for (i = nextIndex(staleSlot, len);
         (e = tab[i]) != null;
         i = nextIndex(i, len)) {
        ThreadLocal<?> k = e.get();
        if (k == null) {
            e.value = null;
            tab[i] = null;
            size--;
        } else {
            int h = k.threadLocalHashCode & (len - 1);
            if (h != i) {
                tab[i] = null;

                // Unlike Knuth 6.4 Algorithm R, we must scan until
                // null because multiple entries could have been stale.
                while (tab[h] != null)
                    h = nextIndex(h, len);
                tab[h] = e;
            }
        }
    }
    return i;
}

不僅將當前slot的Entry置空，還要檢查slot到下一個爲null的slot之間的entry。如果爲陳舊的數據，則置空。如果不是，進行rehash。
rehash的原理是：int h = k.threadLocalHashCode & (len - 1); h!=i，表明當初在新增的時候，就發生了hash衝突，導致該entry在table的位置後移。處理方式是：將tab[i]=null，重新找index爲h及之後的table，直道找到table[h]=null，然後將table[h] = e。hash衝突會隨後介紹。
返回值是下一個table[slot]==null的slot；

private boolean cleanSomeSlots(int i, int n)。這個函數實際是調用expungeStaleEntry清除陳舊數據的。
代碼：

private boolean cleanSomeSlots(int i, int n) {
    boolean removed = false;
    Entry[] tab = table;
    int len = tab.length;
    do {
        i = nextIndex(i, len);
        Entry e = tab[i];
        if (e != null && e.get() == null) {
            n = len;
            removed = true;
            i = expungeStaleEntry(i);
        }
    } while ( (n >>>= 1) != 0);
    return removed;
}

比較有意思的是這句：while ( (n >>>= 1) != 0); 循環log2(n)次，目的是平衡不做清除（高效但是陳舊數據殘留）和全部判斷並做清除（對一些插入操作性能造成影響）。這種做法目前挺高效，並且工作挺不錯，所以就用着了。
if (e != null && e.get() == null) { n = len; 意味着一旦發現有陳舊數據，循環次數將增加。
返回值，是否有陳舊值被清除。

private void set(ThreadLocal

private void set(ThreadLocal<?> key, Object value) {

    // We don't use a fast path as with get() because it is at
    // least as common to use set() to create new entries as
    // it is to replace existing ones, in which case, a fast
    // path would fail more often than not.

    Entry[] tab = table;
    int len = tab.length;
    int i = key.threadLocalHashCode & (len-1);

    for (Entry e = tab[i];
         e != null;
         e = tab[i = nextIndex(i, len)]) {
        ThreadLocal<?> k = e.get();

        if (k == key) {
            e.value = value;
            return;
        }

        if (k == null) {
            replaceStaleEntry(key, value, i);
            return;
        }
    }

    tab[i] = new Entry(key, value);
    int sz = ++size;
    if (!cleanSomeSlots(i, sz) && sz >= threshold)
        rehash();
}

有了上面的介紹，這段就很好理解了。replaceStaleEntry(key, value, i);這句以後再研究，有點複雜（向前去除陳舊數據）。
這句有點意思：
if (!cleanSomeSlots(i, sz) && sz >= threshold) rehash(); 如果有陳舊值被處理，那麼一定不會進行rehash。如果沒有陳舊值被刪除，則看當前table的entry數量是否大於閾值。是，則rehash。

private void rehash() {
    expungeStaleEntries();

    // Use lower threshold for doubling to avoid hysteresis
    if (size >= threshold - threshold / 4)
        resize();
}

清除所有陳舊值，然後resize。

rezie()有點意思，處理hash衝突的方式和HashMap不一樣。
代碼：

private void resize() {
    Entry[] oldTab = table;
    int oldLen = oldTab.length;
    int newLen = oldLen * 2;
    Entry[] newTab = new Entry[newLen];
    int count = 0;

    for (int j = 0; j < oldLen; ++j) {
        Entry e = oldTab[j];
        if (e != null) {
            ThreadLocal<?> k = e.get();
            if (k == null) {
                e.value = null; // Help the GC
            } else {
                int h = k.threadLocalHashCode & (newLen - 1);
                while (newTab[h] != null)
                    h = nextIndex(h, newLen);
                newTab[h] = e;
                count++;
            }
        }
    }

    setThreshold(newLen);
    size = count;
    table = newTab;
}

將新的table大小設爲舊的table大小的2倍。然後將舊的table中entry挨個插入到新的table中，當然，插入前還是要判斷entry是否過期。
插入過程中，如果發現hash衝突（int h = k.threadLocalHashCode & (newLen - 1); ），則查找h之後的table元素，知道table[h] != null，將table[h] = e；
這應該是另一種hash探測法吧，還得找時間學學。

對比WeakHashMap，大致原理與ThreadLocalMap相似。
WeakHashMap執行expungeTableEntries()是在resize(), size(), getTable()等方法中。而不是在每一次插入。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

ThreadLocalMap源碼分析

基於 Nginx Ingress + 雲效 AppStack 實現灰度發佈

12款高效開源Wiki系統推薦，打造團隊知識管理利器

C語言--右移左移

一個開源且全面的C#算法實戰教程

dotnet 基於 DirectML 控制檯運行 Phi-3 模型

自定義MyBatis插件

一款.NET開源、功能強大、跨平臺的繪圖庫 - OxyPlot

常用的 Git 指令

鼠標控制軟件有可能和虛擬機軟件產生衝突

sm4加密工具類

準備1千萬個隨機數字，保存到文件並順序讀取

Integer和int的比較，大數據量情況下造成頻繁gc的原因分析

JDK線程池實踐

ThreadLocalMap源碼分析

SPI示例和項目結構記錄

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結