JAVA集合框架探究(二)
文章目錄
一、SubList源碼解析
在上一篇AbstractList的源碼裏,有一個類是SubList,繼承自AbstractList。平時經常會使用到,是返回list的一部分。下面看一下sublist是怎麼實現的。
首先有幾個成員變量,
private final AbstractList<E> l;
private final int offset;
private int size;
l是存放原list的引用。
offset字面意思是用來存儲偏移量,具體有什麼用一會再看。
size是用來存儲當前元素數量。
1、SubList
SubList(AbstractList<E> list, int fromIndex, int toIndex) {
if (fromIndex < 0)
throw new IndexOutOfBoundsException("fromIndex = " + fromIndex);
if (toIndex > list.size())
throw new IndexOutOfBoundsException("toIndex = " + toIndex);
if (fromIndex > toIndex)
throw new IllegalArgumentException("fromIndex(" + fromIndex +
") > toIndex(" + toIndex + ")");
l = list;
offset = fromIndex;
size = toIndex - fromIndex;
this.modCount = l.modCount;
}
構造函數中可以看到,l存儲了list引用,offerset等於List的開始下標,size等於結束下標減去開始下標。SubList的修改次數modCount使用的是原list的modCount。
2、get set
public E set(int index, E element) {
rangeCheck(index);
checkForComodification();
return l.set(index+offset, element);
}
public E get(int index) {
rangeCheck(index);
checkForComodification();
return l.get(index+offset);
}
SubList中的get set方法均是將index加上offset,變爲真正list的索引,這說明了SubList只是原List的一部分的引用。
3、add
public void add(int index, E element) {
rangeCheckForAdd(index);
checkForComodification();
l.add(index+offset, element);
this.modCount = l.modCount;
size++;
}
SubList中的add也是將index加上offset,修改爲真正的list的索引值,然後調用原List的add方法。並且會修改this.modCount。修改size。
4、rangeCheck
private void rangeCheck(int index) {
if (index < 0 || index >= size)
throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
}
可以看到很多方法都在最開始調用了這個方法,判斷索引index是否有效。
5、rangeCheckForAdd
private void rangeCheckForAdd(int index) {
if (index < 0 || index > size)
throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
}
rangeCheckForAdd 和 rangeCheck兩個方法的區別是rangeCheckForAdd在add時調用,是>不是>=。
6、checkForComodification
private void checkForComodification() {
if (this.modCount != l.modCount)
throw new ConcurrentModificationException();
}
checkForComodification方法是比較modCount是否一致,因爲this.modCount在構造函數中被初始化過,原list中的add也會修改modCount。如果兩者不一致,就會拋出異常。
這個地方就需要注意,SubList只是原List的一段映射,如果對其進行了修改也會影響到原list。原List其餘元素並沒有被刪除。另外因爲SubList一直引用原List,也會影響原List被回收。
二、ArrayList源碼解析
可以看到ArrayList的繼承結構,ArrayList是List接口的一個實現類。我們知道ArrayList是基於數組實現的,所以查詢效率是很高的。
1、構造方法
private static final int DEFAULT_CAPACITY = 10;
private static final Object[] EMPTY_ELEMENTDATA = {};
private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};
transient Object[] elementData; // non-private to simplify nested class access
private int size;
public ArrayList(int initialCapacity) {
if (initialCapacity > 0) {
this.elementData = new Object[initialCapacity];
} else if (initialCapacity == 0) {
this.elementData = EMPTY_ELEMENTDATA;
} else {
throw new IllegalArgumentException("Illegal Capacity: "+
initialCapacity);
}
}
public ArrayList() {
this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
}
public ArrayList(Collection<? extends E> c) {
elementData = c.toArray();
if ((size = elementData.length) != 0) {
// c.toArray might (incorrectly) not return Object[] (see 6260652)
if (elementData.getClass() != Object[].class)
elementData = Arrays.copyOf(elementData, size, Object[].class);
} else {
// replace with empty array.
this.elementData = EMPTY_ELEMENTDATA;
}
}
可以看到ArrayLIst的默認初始化容量是10,這個是是elementData[]這個數組的大小,而size指的是數組裏面存放有數據的數量,也就是list的大小。所以它們不是一個概念。
EMPTY_ELEMENTDATA是一個空數組,它的作用是當用戶指定該 ArrayList 容量爲 0 時,返回該空數組。DEFAULTCAPACITY_EMPTY_ELEMENTDATA是另一個空數組實例,當用戶沒有指定 ArrayList 的容量時(即調用無參構造函數),返回的是該數組。剛創建一個 ArrayList 時,其內數據量爲 0。當用戶第一次添加元素時,該數組將會擴容,變成默認容量爲 10(DEFAULT_CAPACITY) 的一個數組。它與 EMPTY_ELEMENTDATA 的區別就是:該數組是默認返回的,而後者是在用戶指定容量爲 0 時返回。
elementData是真正存放元素的數組,當用戶往集合裏面添加元素時,該數組會進行擴容。
有兩個構造函數,分別是有參和無參的:
- 無參構造函數中,數組初始化爲DEFAULTCAPACITY_EMPTY_ELEMENTDATA。
- 有參構造函數中,當數量>0時,會構造初始容量大小的數組。如果初始值爲0的話,數組初始化爲EMPTY_ELEMENTDATA。
還有一個參數爲Collection的構造函數
public ArrayList(Collection<? extends E> c) {
//將集合轉化成Object[]數組
elementData = c.toArray();
//把轉化後的Object[]數組長度賦值給當前ArrayList的size,並判斷是否爲0
if ((size = elementData.length) != 0) {
// c.toArray might (incorrectly) not return Object[] (see 6260652)
// 這句話意思是:c.toArray 可能不會返回 Object[],可以查看 java 官方編號爲 6260652 的 bug
if (elementData.getClass() != Object[].class)
// 若 c.toArray() 返回的數組類型不是 Object[],則利用 Arrays.copyOf(); 來構造一個大小爲 size 的 Object[] 數組
elementData = Arrays.copyOf(elementData, size, Object[].class);
} else {
// 替換空數組
this.elementData = EMPTY_ELEMENTDATA;
}
}
直接將Collection使用toArray方法轉換爲數組再賦值給elementData。並且將長度賦值爲size()。
2、add
public boolean add(E e) {
ensureCapacityInternal(size + 1); // Increments modCount!!
elementData[size++] = e;
return true;
}
public void add(int index, E element) {
rangeCheckForAdd(index);
ensureCapacityInternal(size + 1); // Increments modCount!!
System.arraycopy(elementData, index, elementData, index + 1,
size - index);
elementData[index] = element;
size++;
}
add方法不帶Index時,是默認添加到最後。
add方法首先會檢查index索引值是否合法。ensureCapacityInternal方法是保證數組容量足夠。該方法定義如下:
private void ensureExplicitCapacity(int minCapacity) {
modCount++;
// overflow-conscious code
if (minCapacity - elementData.length > 0)
grow(minCapacity);
}
當容量不夠時會進行擴容,擴容方法後邊再看。
然後使用arraycopy方法進行數組拷貝,再在指定位置添加元素。所以ArrayList插入元素性能較低。
3、remove
public E remove(int index) {
rangeCheck(index);
modCount++;
E oldValue = elementData(index);
int numMoved = size - index - 1;
if (numMoved > 0)
System.arraycopy(elementData, index+1, elementData, index,
numMoved);
elementData[--size] = null; // clear to let GC do its work
return oldValue;
}
public boolean remove(Object o) {
if (o == null) {
for (int index = 0; index < size; index++)
if (elementData[index] == null) {
fastRemove(index);
return true;
}
} else {
for (int index = 0; index < size; index++)
if (o.equals(elementData[index])) {
fastRemove(index);
return true;
}
}
return false;
}
private void fastRemove(int index) {
modCount++;
int numMoved = size - index - 1;
if (numMoved > 0)
System.arraycopy(elementData, index+1, elementData, index,
numMoved);
elementData[--size] = null; // clear to let GC do its work
}
remove方法也是同理,都需要進行arraycopy操作,性能比較低。
3.addAll
public boolean addAll(int index, Collection<? extends E> c) {
rangeCheckForAdd(index);
Object[] a = c.toArray();
int numNew = a.length;
ensureCapacityInternal(size + numNew); // Increments modCount
int numMoved = size - index;
if (numMoved > 0)
System.arraycopy(elementData, index, elementData, index + numNew,
numMoved);
System.arraycopy(a, 0, elementData, index, numNew);
size += numNew;
return numNew != 0;
}
addAll方法是直接將Collection轉爲數組,再調用兩次arraycopy完成插入。
4.grow
private void grow(int minCapacity) {
// overflow-conscious code
int oldCapacity = elementData.length;
int newCapacity = oldCapacity + (oldCapacity >> 1);
if (newCapacity - minCapacity < 0)
newCapacity = minCapacity;
if (newCapacity - MAX_ARRAY_SIZE > 0)
newCapacity = hugeCapacity(minCapacity);
// minCapacity is usually close to size, so this is a win:
elementData = Arrays.copyOf(elementData, newCapacity);
}
每次擴容都是之前的1.5倍,如果擴容後超過MAX_ARRAY_SIZE,就設置爲MAX_ARRAY_SIZE。MAX_ARRAY_SIZE也是Integer.MAX_VALUE - 8;
5.indexOf
public boolean contains(Object o) {
return indexOf(o) >= 0;
}
public int indexOf(Object o) {
if (o == null) {
for (int i = 0; i < size; i++)
if (elementData[i]==null)
return i;
} else {
for (int i = 0; i < size; i++)
if (o.equals(elementData[i]))
return i;
}
return -1;
}
public int lastIndexOf(Object o) {
if (o == null) {
for (int i = size-1; i >= 0; i--)
if (elementData[i]==null)
return i;
} else {
for (int i = size-1; i >= 0; i--)
if (o.equals(elementData[i]))
return i;
}
return -1;
}
這幾個方法中,參數都是可以爲Null的。
經過對ArrarList的源碼進行分析,可以看到爲什麼ArrarList的查改性能高,增刪性能較低的原因,後面我們再分析和它相反的一個類:LinkedList。
本文基於JDK1.8進行分析。