【集合框架】ArrayList源码分析
一、前言
小胖觉得呀,Java集合框架,是面试考察的一个大重点!不管是你翻看大厂还是小公司,面试中都有对集合的要求,集合的知识也是非常多的。我在CSDN上找了很多的资料,包括框架图、ArrayList考察点等。有很多比较好的资料,包括敖丙写的3篇文章质量都是非常高的。本着分享技术的目的,也想自己好好的梳理一下。本系列文章包含:List、Set、Map、HashMap、CurrentHashMap、CopyOnWriteArrayList等。还是一个目的,让你能搞懂一些集合的知识,以及集合的经典面试题。本文只有ArrayList的源码分析
二、Java集合有哪些
上面两个图是我翻看了JDK1.8源码之后,画的一个简单的图,复杂的图连线真的很多,完全看不了。网上的图也都非常的复杂。
简单解释上面类的关系:
- Vector、ArrayList和LinkedList都实现了List接口
- HashSet实现了Set接口,LinkedHashSet继承自HashSet
- SortedSet继承了Set接口,TreeSet实现NavigableSet,NavigableSet继承SortedSet
- Hashtable和hashMap实现Map接口,LinkedHashMap继承HashMap
- SortedMap继承了Map接口,TreeMap实现NavigableMap,NavigableMap继承SortedMap
很复杂,真的很复杂!!!
三、面试考察重点在哪?
ArrayList底层原理、HashMap底层原理、CurrentHashMap与HashMap的区别。这三个内容是非常重要的,基本上都是必须要掌握的知识。
四、List家族有哪些?
1.Vector
Vector集合是一个比较古老的集合类,在Java1.1的时候就有了,Vector实现List集合,元素可以重复,顺序按照插入的顺序(即不会自动排序)。他是线程安全的,但是不推荐使用,因为它使用了Synchronized同步机制的对象锁的形式。
很多的方法都是下面的这种形式
public synchronized E set(int index, E element) {
if (index >= elementCount)
throw new ArrayIndexOutOfBoundsException(index);
E oldValue = elementData(index);
elementData[index] = element;
return oldValue;
}
public synchronized boolean add(E e) {
modCount++;
ensureCapacityHelper(elementCount + 1);
elementData[elementCount++] = e;
return true;
}
2.ArrayList底层原理
ArrayList集合:实现List集合,元素可以重复,顺序按照插入的顺序(即不会自动排序)。他是线程不安全的,单线程考虑使用ArrayList。
然而答上面的内容很难满足面试官
他们经常就会问你你知道ArrayList底层吗?
我曾经第一次遇到这个问题的时候是懵的,底层不就是数组,顺序表来实现…
其实他也就是想问你,是否看过源码。
我觉得你可以从以下几个方面来介绍:ArrayList的3个构造参数、add方法或插入方法、删除方法、ArrayList扩容机制等。
ArrayList构造方法
public ArrayList(int initialCapacity) {
if (initialCapacity > 0) {
this.elementData = new Object[initialCapacity]; //创建对应大小的数组
} else if (initialCapacity == 0) {
this.elementData = EMPTY_ELEMENTDATA; //创建一个空的数组
} else {
throw new IllegalArgumentException("Illegal Capacity: " + initialCapacity); //传入的参数非法
}
}
public ArrayList() {
this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA; //默认是创建一个空数组对象
}
public ArrayList(Collection<? extends E> c) { //把集合C的元素在创建的时候添加到数组当中
elementData = c.toArray();
if ((size = elementData.length) != 0) {
// c.toArray might (incorrectly) not return Object[] (see 6260652)
if (elementData.getClass() != Object[].class)
elementData = Arrays.copyOf(elementData, size, Object[].class);
} else {
// replace with empty array.
this.elementData = EMPTY_ELEMENTDATA;
}
}
ArrayList的无参数构造方法,会传入一个空的对象。一个int参数的构造方法,会传入对象大小的对象。也可以传入一个集合,当集合有值的时候,把对象复制到elementData中。
add方法、插入方法
public boolean add(E e) {
ensureCapacityInternal(size + 1); // Increments modCount!!
elementData[size++] = e; //在size中插入,然后size加1
return true;
}
public void add(int index, E element) {
rangeCheckForAdd(index);
ensureCapacityInternal(size + 1); // Increments modCount!!
System.arraycopy(elementData, index, elementData, index + 1, size - index); //元素后移,空出index位置
elementData[index] = element; //插入index
size++;
}
private void rangeCheckForAdd(int index) { //检查index位置是否合法
if (index > size || index < 0)
throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
}
ArrayList的add方法有两个,直接add元素的会先检查集合是否需要扩容,然后在末尾添加元素e,elementData[size++] = e;
第二个会检查index的位置,防止越界。之后使用arraycopy的方法,把index之后的元素向后移以为,再放入元素。
System.arraycopy(elementData, index, elementData, index + 1, size - index);
/**
@param src the source array. //原数组
@param srcPos starting position in the source array. //开始移动的位置
@param dest the destination array. //目标数组
@param destPos starting position in the destination data. //开始复制的地址
@param length the number of array elements to be copied. //复制的长度
*/
public static native void arraycopy(Object src, int srcPos,Object dest, int destPos,int length);
这个arraycopy是一个C语言写的方法,它的5个参数:第一个是原来的数组,第二个是开始的位置,第三个是复制的目标数组,第四个是开始位置复制的地址,第五个是复制的长度。
把array数组中的元素全部复制到newArray中,应该怎么写?
System.arraycopy(array, 0, newArray, 0, size );
这样是不是就理解了一些
ArrayList删除方法
public E remove(int index) {
rangeCheck(index); //检查索引的下标是否正确
modCount++;
E oldValue = elementData(index);
int numMoved = size - index - 1; //需要移动的元素的个数
if (numMoved > 0)
System.arraycopy(elementData, index+1, elementData, index, numMoved); //移动元素
elementData[--size] = null; // clear to let GC do its work //把移动完最后一个元素置为null
return oldValue;
}
public boolean remove(Object o) { //按照对象,移除某一个对象
if (o == null) {
for (int index = 0; index < size; index++)
if (elementData[index] == null) {
fastRemove(index);
return true;
}
} else {
for (int index = 0; index < size; index++)
if (o.equals(elementData[index])) { //移除相应的对象
fastRemove(index);
return true;
}
}
return false;
}
ArrayList扩容机制
默认的初始化的情况下容量是10,add之后会有ensureCapacityInternal的判断,把size+1和原来的elementData对象的Size进行对比,返回的DEFAULT_CAPACITY和minCapacity的最大值,当超过10之后,11比10大,进入到grow的函数,使用位运算,扩容原来的一半。
public boolean add(E e) {
ensureCapacityInternal(size + 1); // Increments modCount!! //这里判断是否扩容
elementData[size++] = e;
return true;
}
private static int calculateCapacity(Object[] elementData, int minCapacity) { //这里的一层判断真的很奇怪,如果数组中没有元素,分配10个大小的元素,否则返回size+1
if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
return Math.max(DEFAULT_CAPACITY, minCapacity);
}
return minCapacity;
}
private void ensureCapacityInternal(int minCapacity) { //minCapacity 此时等于size+1
ensureExplicitCapacity(calculateCapacity(elementData, minCapacity));
}
private void ensureExplicitCapacity(int minCapacity) { //minCapacity 此时等于size+1
modCount++;
// overflow-conscious code
if (minCapacity - elementData.length > 0) //minCapacity比数组中元素的长度长的时候
grow(minCapacity); //做扩容的方法
}
private void grow(int minCapacity) { //扩容方法
// overflow-conscious code
int oldCapacity = elementData.length; //原来长度
int newCapacity = oldCapacity + (oldCapacity >> 1); //新的长度是原来的1.5倍,原来长度右移一位就是原来长度的0.5了
if (newCapacity - minCapacity < 0) //第一次插入的时候会使用,newCapacity=oldCapacity=0,所以直接等于10
newCapacity = minCapacity;
if (newCapacity - MAX_ARRAY_SIZE > 0) //数组越界
newCapacity = hugeCapacity(minCapacity);
// minCapacity is usually close to size, so this is a win:
elementData = Arrays.copyOf(elementData, newCapacity); //做扩容
}
看到这里不经让我想到一个题目:ArrayList(int initialCapacity)会不会初始化数组大小?也就是第二个构造函数
public ArrayList(int initialCapacity) {
if (initialCapacity > 0) {
this.elementData = new Object[initialCapacity];
} else if (initialCapacity == 0) {
this.elementData = EMPTY_ELEMENTDATA;
} else {
throw new IllegalArgumentException("Illegal Capacity: "+ initialCapacity);
}
}
初始化了一个空的数组,但是List的大小还是0,因为List的大小是返回size的。
这道题是敖丙在这篇文章中提到的,我开始还有点懵,看完了扩容机制后基本了解了。
初始化的时候,会初始化对应空间的空数组,但是不会该表size的大小。当用户第一次添加的时候ensureCapacityInternal(size+1);
进入到calculateCapacity方法由于数组是不为空的,返回长度minCapacity=1,进入到grow方法后,oldCapacity等于6,newCapacity等于1,newCapacity还是等于6,elementData做扩容等于6。但是size还是1.
注意:size不等于ArrayList的容量,size是ArrayList中存在元素的个数。
上面的代码,虽然在默认情况下是10的容量,但是还是无法set进去,因为set会检查index的索引的正确性,是通过size来确认的,size不是ArrayList的大小,而是ArrayList中含有的元素的个数。
3.LinkedList
LinkedList集合,实现List集合,元素可以重复,顺序按照插入的顺序,单链表。他是线程不安全的。
四、List集合经典面试题
ArrayList的底层原理知道吗?
知道,我看过ArrayList的源码。主要回答可以从增加、删除元素、扩容机制、构造方法上面答。
ArrayList里面可以放int?
ArrayList放int是可以正常使用的,但是这里面涉及了自动装箱。ArrayList里面存放的内容是对象,对于基本的数据类型,我们只能使用对应的包装类。
自动装箱和自动拆箱你解释一遍吧?
自动装箱,在程序编译后转化成了对应的包装类。自动拆箱,在程序编译后转化城里对应的还原类。
大于128的比较就是false,自动装箱和拆箱的知识还是有一点了,小胖就先不写了。这一点就当课后作业吧。
好的!我就是懒
Vector和ArrayList他们如何扩容?
Vector增长原来的1倍,ArrayList默认的初始化容量是10,ArrayList增长原来的0.5倍
Vector每次扩容一次,增长一倍
private void grow(int minCapacity) {
// overflow-conscious code
int oldCapacity = elementData.length;
int newCapacity = oldCapacity + ((capacityIncrement > 0) ?
capacityIncrement : oldCapacity);
if (newCapacity - minCapacity < 0)
newCapacity = minCapacity;
if (newCapacity - MAX_ARRAY_SIZE > 0)
newCapacity = hugeCapacity(minCapacity);
elementData = Arrays.copyOf(elementData, newCapacity);
}
说说 ArrayList,Vector, LinkedList 的存储性能和特性?
ArrayList和Vector都是使用的数组的方式储存数字,他们可以直接通过序号索引元素,但是在插入的时候,需要元素的移动等内存的操作,所以索引数据快但是插入慢。Vector和ArrayList的本质区别就是使用的Synchronized的代码块形式,他是线程安全的,但是性能是比ArrayList差的。LinkedList使用双向链表,可以按需要索引,向前或向后遍历,插入数据的速度较快。总结:ArrayList在查询的时候速度较快,LinkedList在插入或者删除的时候速度较快。
不做重复的事情吧,以后我还会继续更新上面的内容,你们可以先看看大佬写的内容。
阿里面试,面试官没想到一个ArrayList,我都能跟他扯半小时
五、参考资料
ArrayList源码; 博客https://blog.csdn.net/qq_35190492/article/details/103883964
未完待续
本人知识有限,如果有错误,欢迎各位指正。谢谢~