JAVA集合框架探究（二）

文章目錄

一、SubList源碼解析

在上一篇AbstractList的源碼裏，有一個類是SubList，繼承自AbstractList。平時經常會使用到，是返回list的一部分。下面看一下sublist是怎麼實現的。

首先有幾個成員變量，

	private final AbstractList<E> l;
    private final int offset;
    private int size;

l是存放原list的引用。
offset字面意思是用來存儲偏移量，具體有什麼用一會再看。
size是用來存儲當前元素數量。

1、SubList

    SubList(AbstractList<E> list, int fromIndex, int toIndex) {
        if (fromIndex < 0)
            throw new IndexOutOfBoundsException("fromIndex = " + fromIndex);
        if (toIndex > list.size())
            throw new IndexOutOfBoundsException("toIndex = " + toIndex);
        if (fromIndex > toIndex)
            throw new IllegalArgumentException("fromIndex(" + fromIndex +
                                               ") > toIndex(" + toIndex + ")");
        l = list;
        offset = fromIndex;
        size = toIndex - fromIndex;
        this.modCount = l.modCount;
    }

構造函數中可以看到，l存儲了list引用，offerset等於List的開始下標，size等於結束下標減去開始下標。SubList的修改次數modCount使用的是原list的modCount。

2、get set

    public E set(int index, E element) {
        rangeCheck(index);
        checkForComodification();
        return l.set(index+offset, element);
    }

    public E get(int index) {
        rangeCheck(index);
        checkForComodification();
        return l.get(index+offset);
    }

SubList中的get set方法均是將index加上offset，變爲真正list的索引，這說明了SubList只是原List的一部分的引用。

3、add

    public void add(int index, E element) {
        rangeCheckForAdd(index);
        checkForComodification();
        l.add(index+offset, element);
        this.modCount = l.modCount;
        size++;
    }

SubList中的add也是將index加上offset，修改爲真正的list的索引值，然後調用原List的add方法。並且會修改this.modCount。修改size。

4、rangeCheck

    private void rangeCheck(int index) {
        if (index < 0 || index >= size)
            throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
    }

可以看到很多方法都在最開始調用了這個方法，判斷索引index是否有效。

5、rangeCheckForAdd

    private void rangeCheckForAdd(int index) {
        if (index < 0 || index > size)
            throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
    }

rangeCheckForAdd 和 rangeCheck兩個方法的區別是rangeCheckForAdd在add時調用，是>不是>=。

6、checkForComodification

    private void checkForComodification() {
        if (this.modCount != l.modCount)
            throw new ConcurrentModificationException();
    }

checkForComodification方法是比較modCount是否一致，因爲this.modCount在構造函數中被初始化過，原list中的add也會修改modCount。如果兩者不一致，就會拋出異常。

這個地方就需要注意，SubList只是原List的一段映射，如果對其進行了修改也會影響到原list。原List其餘元素並沒有被刪除。另外因爲SubList一直引用原List，也會影響原List被回收。

二、ArrayList源碼解析

可以看到ArrayList的繼承結構，ArrayList是List接口的一個實現類。我們知道ArrayList是基於數組實現的，所以查詢效率是很高的。

1、構造方法

	 private static final int DEFAULT_CAPACITY = 10;

    private static final Object[] EMPTY_ELEMENTDATA = {};

    private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};
    
	transient Object[] elementData; // non-private to simplify nested class access

    private int size;

    public ArrayList(int initialCapacity) {
        if (initialCapacity > 0) {
            this.elementData = new Object[initialCapacity];
        } else if (initialCapacity == 0) {
            this.elementData = EMPTY_ELEMENTDATA;
        } else {
            throw new IllegalArgumentException("Illegal Capacity: "+
                                               initialCapacity);
        }
    }

    public ArrayList() {
        this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
    }

    public ArrayList(Collection<? extends E> c) {
        elementData = c.toArray();
        if ((size = elementData.length) != 0) {
            // c.toArray might (incorrectly) not return Object[] (see 6260652)
            if (elementData.getClass() != Object[].class)
                elementData = Arrays.copyOf(elementData, size, Object[].class);
        } else {
            // replace with empty array.
            this.elementData = EMPTY_ELEMENTDATA;
        }
    }

可以看到ArrayLIst的默認初始化容量是10，這個是是elementData[]這個數組的大小，而size指的是數組裏面存放有數據的數量，也就是list的大小。所以它們不是一個概念。
EMPTY_ELEMENTDATA是一個空數組，它的作用是當用戶指定該 ArrayList 容量爲 0 時，返回該空數組。DEFAULTCAPACITY_EMPTY_ELEMENTDATA是另一個空數組實例，當用戶沒有指定 ArrayList 的容量時(即調用無參構造函數)，返回的是該數組。剛創建一個 ArrayList 時，其內數據量爲 0。當用戶第一次添加元素時，該數組將會擴容，變成默認容量爲 10(DEFAULT_CAPACITY) 的一個數組。它與 EMPTY_ELEMENTDATA 的區別就是：該數組是默認返回的，而後者是在用戶指定容量爲 0 時返回。

elementData是真正存放元素的數組，當用戶往集合裏面添加元素時，該數組會進行擴容。

有兩個構造函數，分別是有參和無參的：

無參構造函數中，數組初始化爲DEFAULTCAPACITY_EMPTY_ELEMENTDATA。
有參構造函數中，當數量>0時，會構造初始容量大小的數組。如果初始值爲0的話，數組初始化爲EMPTY_ELEMENTDATA。

還有一個參數爲Collection的構造函數

public ArrayList(Collection<? extends E> c) {
       //將集合轉化成Object[]數組
       elementData = c.toArray();
       //把轉化後的Object[]數組長度賦值給當前ArrayList的size，並判斷是否爲0
       if ((size = elementData.length) != 0) {
           // c.toArray might (incorrectly) not return Object[] (see 6260652)
           // 這句話意思是：c.toArray 可能不會返回 Object[]，可以查看 java 官方編號爲 6260652 的 bug
           if (elementData.getClass() != Object[].class)
               // 若 c.toArray() 返回的數組類型不是 Object[]，則利用 Arrays.copyOf(); 來構造一個大小爲 size 的 Object[] 數組
               elementData = Arrays.copyOf(elementData, size, Object[].class);
       } else {
           // 替換空數組
           this.elementData = EMPTY_ELEMENTDATA;
       }
   }

直接將Collection使用toArray方法轉換爲數組再賦值給elementData。並且將長度賦值爲size()。

2、add

   public boolean add(E e) {
       ensureCapacityInternal(size + 1);  // Increments modCount!!
       elementData[size++] = e;
       return true;
   }

   public void add(int index, E element) {
       rangeCheckForAdd(index);

       ensureCapacityInternal(size + 1);  // Increments modCount!!
       System.arraycopy(elementData, index, elementData, index + 1,
                        size - index);
       elementData[index] = element;
       size++;
   }

add方法不帶Index時，是默認添加到最後。
add方法首先會檢查index索引值是否合法。ensureCapacityInternal方法是保證數組容量足夠。該方法定義如下：

    private void ensureExplicitCapacity(int minCapacity) {
       modCount++;

       // overflow-conscious code
       if (minCapacity - elementData.length > 0)
           grow(minCapacity);
   }

當容量不夠時會進行擴容，擴容方法後邊再看。
然後使用arraycopy方法進行數組拷貝，再在指定位置添加元素。所以ArrayList插入元素性能較低。

3、remove

    public E remove(int index) {
       rangeCheck(index);

       modCount++;
       E oldValue = elementData(index);

       int numMoved = size - index - 1;
       if (numMoved > 0)
           System.arraycopy(elementData, index+1, elementData, index,
                            numMoved);
       elementData[--size] = null; // clear to let GC do its work

       return oldValue;
   }

   public boolean remove(Object o) {
       if (o == null) {
           for (int index = 0; index < size; index++)
               if (elementData[index] == null) {
                   fastRemove(index);
                   return true;
               }
       } else {
           for (int index = 0; index < size; index++)
               if (o.equals(elementData[index])) {
                   fastRemove(index);
                   return true;
               }
       }
       return false;
   }

   private void fastRemove(int index) {
       modCount++;
       int numMoved = size - index - 1;
       if (numMoved > 0)
           System.arraycopy(elementData, index+1, elementData, index,
                            numMoved);
       elementData[--size] = null; // clear to let GC do its work
   }

remove方法也是同理，都需要進行arraycopy操作，性能比較低。

3.addAll

    public boolean addAll(int index, Collection<? extends E> c) {
        rangeCheckForAdd(index);

        Object[] a = c.toArray();
        int numNew = a.length;
        ensureCapacityInternal(size + numNew);  // Increments modCount

        int numMoved = size - index;
        if (numMoved > 0)
            System.arraycopy(elementData, index, elementData, index + numNew,
                             numMoved);

        System.arraycopy(a, 0, elementData, index, numNew);
        size += numNew;
        return numNew != 0;
    }

addAll方法是直接將Collection轉爲數組，再調用兩次arraycopy完成插入。

4.grow

    private void grow(int minCapacity) {
        // overflow-conscious code
        int oldCapacity = elementData.length;
        int newCapacity = oldCapacity + (oldCapacity >> 1);
        if (newCapacity - minCapacity < 0)
            newCapacity = minCapacity;
        if (newCapacity - MAX_ARRAY_SIZE > 0)
            newCapacity = hugeCapacity(minCapacity);
        // minCapacity is usually close to size, so this is a win:
        elementData = Arrays.copyOf(elementData, newCapacity);
    }

每次擴容都是之前的1.5倍，如果擴容後超過MAX_ARRAY_SIZE，就設置爲MAX_ARRAY_SIZE。MAX_ARRAY_SIZE也是Integer.MAX_VALUE - 8;

5.indexOf

    public boolean contains(Object o) {
        return indexOf(o) >= 0;
    }

    public int indexOf(Object o) {
        if (o == null) {
            for (int i = 0; i < size; i++)
                if (elementData[i]==null)
                    return i;
        } else {
            for (int i = 0; i < size; i++)
                if (o.equals(elementData[i]))
                    return i;
        }
        return -1;
    }

    public int lastIndexOf(Object o) {
        if (o == null) {
            for (int i = size-1; i >= 0; i--)
                if (elementData[i]==null)
                    return i;
        } else {
            for (int i = size-1; i >= 0; i--)
                if (o.equals(elementData[i]))
                    return i;
        }
        return -1;
    }

這幾個方法中，參數都是可以爲Null的。

經過對ArrarList的源碼進行分析，可以看到爲什麼ArrarList的查改性能高，增刪性能較低的原因，後面我們再分析和它相反的一個類：LinkedList。

本文基於JDK1.8進行分析。

JAVA集合框架探究（二）

JAVA集合框架探究（二）

文章目錄

一、SubList源碼解析

1、SubList

2、get set

3、add

4、rangeCheck

5、rangeCheckForAdd

6、checkForComodification

二、ArrayList源碼解析

1、構造方法

2、add

3、remove

3.addAll

4.grow

5.indexOf

如何使用 JS 判斷用戶是否處於活躍狀態

通過HPA+CronHPA組合應對業務複雜彈性伸縮場景

ElementUI button源碼解析

JAVA語法糖

fail-fast機制解讀

kafka如何保證消息不丟失不被重複消費

RPC框架淺析

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結