CopyOnWriteArrayList 併發集合源碼分析

在CopyOnWriteArrayList裏處理寫操作(包括add、remove、set等)是先將原始的數據通過JDK1.6的Arrays.copyof()來生成一份新的數組

然後在新的數據對象上進行寫,寫完後再將原來的引用指向到當前這個數據對象,這樣保證了每次寫都是在新的對象上(因爲要保證寫的一致性,這裏要對各種寫操作要加一把鎖,JDK1.6在這裏用了重入鎖),

然後讀的時候就是在引用的當前對象上進行讀(包括get,iterator等),不存在加鎖和阻塞,針對iterator使用了一個叫 COWIterator的閹割版迭代器,因爲不支持寫操作,當獲取CopyOnWriteArrayList的迭代器時,是將迭代器裏的數據引用指向當前 引用指向的數據對象,無論未來發生什麼寫操作,都不會再更改迭代器裏的數據對象引用,所以迭代器也很安全。

CopyOnWriteArrayList中寫操作需要大面積複製數組,所以性能肯定很差,但是讀操作因爲操作的對象和寫操作不是同一個對象,讀之 間也不需要加鎖,讀和寫之間的同步處理只是在寫完後通過一個簡單的“=”將引用指向新的數組對象上來,這個幾乎不需要時間,這樣讀操作就很快很安全,適合 在多線程裏使用,絕對不會發生ConcurrentModificationException ,所以最後得出結論:CopyOnWriteArrayList適合使用在讀操作遠遠大於寫操作的場景裏,比如緩存。

Copy-On-Write簡稱COW,是一種用於程序設計中的優化策略。其基本思路是,從一開始大家都在共享同一個內容,當某個人想要修改這個內容的時候,纔會真正把內容Copy出去形成一個新的內容然後再改,這是一種延時懶惰策略。從JDK1.5開始Java併發包裏提供了兩個使用CopyOnWrite機制實現的併發容器,它們是CopyOnWriteArrayList和CopyOnWriteArraySet。CopyOnWrite容器非常有用,可以在非常多的併發場景中使用到。

除了加鎖外,其實還有一種方式可以防止併發修改異常,這就是將讀寫分離技術(不是數據庫上的)。

1、Java中“=”操作只是將引用和某個對象關聯,假如同時有一個線程將引用指向另外一個對象,一個線程獲取這個引用指向的對象,那麼他們之間不會發生ConcurrentModificationException,他們是在虛擬機層面阻塞的,而且速度非常快,幾乎不需要CPU時間。

2、JAVA中兩個不同的引用指向同一個對象,當第一個引用指向另外一個對象時,第二個引用還將保持原來的對象。

什麼是CopyOnWrite容器

  CopyOnWrite容器即寫時複製的容器。通俗的理解是當我們往一個容器添加元素的時候,不直接往當前容器添加,而是先將當前容器進行Copy,複製出一個新的容器,然後新的容器裏添加元素,添加完元素之後,再將原容器的引用指向新的容器。這樣做的好處是我們可以對CopyOnWrite容器進行併發的讀,而不需要加鎖,因爲當前容器不會添加任何元素。所以CopyOnWrite容器也是一種讀寫分離的思想,讀和寫不同的容器。

CopyOnWriteArrayList的實現原理

  在使用CopyOnWriteArrayList之前,我們先閱讀其源碼瞭解下它是如何實現的。以下代碼是向CopyOnWriteArrayList中add方法的實現(向CopyOnWriteArrayList裏添加元素),可以發現在添加的時候是需要加鎖的,否則多線程寫的時候會Copy出N個副本出來。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
/**
     * Appends the specified element to the end of this list.
     *
     * @param e element to be appended to this list
     * @return <tt>true</tt> (as specified by {@link Collection#add})
     */
    publicboolean add(E e) {
    finalReentrantLock lock = this.lock;
    lock.lock();
    try{
        Object[] elements = getArray();
        intlen = elements.length;
        Object[] newElements = Arrays.copyOf(elements, len +1);
        newElements[len] = e;
        setArray(newElements);
        returntrue;
    }finally {
        lock.unlock();
    }
    }

   讀的時候不需要加鎖,如果讀的時候有多個線程正在向CopyOnWriteArrayList添加數據,讀還是會讀到舊的數據,因爲寫的時候不會鎖住舊的CopyOnWriteArrayList。

1
2
3
publicE get(int index) {
    returnget(getArray(), index);
}

   JDK中並沒有提供CopyOnWriteMap,我們可以參考CopyOnWriteArrayList來實現一個,基本代碼如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
importjava.util.Collection;
importjava.util.Map;
importjava.util.Set;
 
publicclass CopyOnWriteMap<K, V>implements Map<K, V>, Cloneable {
    privatevolatile Map<K, V> internalMap;
 
    publicCopyOnWriteMap() {
        internalMap =new HashMap<K, V>();
    }
 
    publicV put(K key, V value) {
 
        synchronized(this) {
            Map<K, V> newMap =new HashMap<K, V>(internalMap);
            V val = newMap.put(key, value);
            internalMap = newMap;
            returnval;
        }
    }
 
    publicV get(Object key) {
        returninternalMap.get(key);
    }
 
    publicvoid putAll(Map<? extends K, ? extendsV> newData) {
        synchronized(this) {
            Map<K, V> newMap =new HashMap<K, V>(internalMap);
            newMap.putAll(newData);
            internalMap = newMap;
        }
    }
}

   實現很簡單,只要瞭解了CopyOnWrite機制,我們可以實現各種CopyOnWrite容器,並且在不同的應用場景中使用。

CopyOnWrite的應用場景

  CopyOnWrite併發容器用於讀多寫少的併發場景。比如白名單,黑名單,商品類目的訪問和更新場景,假如我們有一個搜索網站,用戶在這個網站的搜索框中,輸入關鍵字搜索內容,但是某些關鍵字不允許被搜索。這些不能被搜索的關鍵字會被放在一個黑名單當中,黑名單每天晚上更新一次。當用戶搜索時,會檢查當前關鍵字在不在黑名單當中,如果在,則提示不能搜索。實現代碼如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
packagecom.ifeve.book;
 
importjava.util.Map;
 
importcom.ifeve.book.forkjoin.CopyOnWriteMap;
 
/**
 * 黑名單服務
 *
 * @author fangtengfei
 *
 */
publicclass BlackListServiceImpl {
 
    privatestatic CopyOnWriteMap<String, Boolean> blackListMap =new CopyOnWriteMap<String, Boolean>(
            1000);
 
    publicstatic booleanisBlackList(String id) {
        returnblackListMap.get(id) == null? false : true;
    }
 
    publicstatic void addBlackList(String id) {
        blackListMap.put(id, Boolean.TRUE);
    }
 
    /**
     * 批量添加黑名單
     *
     * @param ids
     */
    publicstatic void addBlackList(Map<String,Boolean> ids) {
        blackListMap.putAll(ids);
    }
 
}

   代碼很簡單,但是使用CopyOnWriteMap需要注意兩件事情:

  1. 減少擴容開銷。根據實際需要,初始化CopyOnWriteMap的大小,避免寫時CopyOnWriteMap擴容的開銷。

  2. 使用批量添加。因爲每次添加,容器每次都會進行復制,所以減少添加次數,可以減少容器的複製次數。如使用上面代碼裏的addBlackList方法。

CopyOnWrite的缺點

  CopyOnWrite容器有很多優點,但是同時也存在兩個問題,即內存佔用問題和數據一致性問題。所以在開發的時候需要注意一下。

  內存佔用問題。因爲CopyOnWrite的寫時複製機制,所以在進行寫操作的時候,內存裏會同時駐紮兩個對象的內存,舊的對象和新寫入的對象(注意:在複製的時候只是複製容器裏的引用,只是在寫的時候會創建新對象添加到新容器裏,而舊容器的對象還在使用,所以有兩份對象內存)。如果這些對象佔用的內存比較大,比如說200M左右,那麼再寫入100M數據進去,內存就會佔用300M,那麼這個時候很有可能造成頻繁的Yong GC和Full GC。之前我們系統中使用了一個服務由於每晚使用CopyOnWrite機制更新大對象,造成了每晚15秒的Full GC,應用響應時間也隨之變長。

  針對內存佔用問題,可以通過壓縮容器中的元素的方法來減少大對象的內存消耗,比如,如果元素全是10進制的數字,可以考慮把它壓縮成36進制或64進制。或者不使用CopyOnWrite容器,而使用其他的併發容器,如ConcurrentHashMap

  數據一致性問題。CopyOnWrite容器只能保證數據的最終一致性,不能保證數據的實時一致性。所以如果你希望寫入的的數據,馬上能讀到,請不要使用CopyOnWrite容器。

發佈了89 篇原創文章 · 獲贊 21 · 訪問量 10萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章