【集合框架】ArrayList源码分析

一、前言

小胖觉得呀，Java集合框架，是面试考察的一个大重点！不管是你翻看大厂还是小公司，面试中都有对集合的要求，集合的知识也是非常多的。我在CSDN上找了很多的资料，包括框架图、ArrayList考察点等。有很多比较好的资料，包括敖丙写的3篇文章质量都是非常高的。本着分享技术的目的，也想自己好好的梳理一下。本系列文章包含：List、Set、Map、HashMap、CurrentHashMap、CopyOnWriteArrayList等。还是一个目的，让你能搞懂一些集合的知识，以及集合的经典面试题。本文只有ArrayList的源码分析

二、Java集合有哪些

上面两个图是我翻看了JDK1.8源码之后，画的一个简单的图，复杂的图连线真的很多，完全看不了。网上的图也都非常的复杂。

简单解释上面类的关系:

Vector、ArrayList和LinkedList都实现了List接口

HashSet实现了Set接口，LinkedHashSet继承自HashSet
SortedSet继承了Set接口，TreeSet实现NavigableSet，NavigableSet继承SortedSet

Hashtable和hashMap实现Map接口，LinkedHashMap继承HashMap
SortedMap继承了Map接口，TreeMap实现NavigableMap，NavigableMap继承SortedMap

很复杂，真的很复杂！！！

三、面试考察重点在哪？

ArrayList底层原理、HashMap底层原理、CurrentHashMap与HashMap的区别。这三个内容是非常重要的，基本上都是必须要掌握的知识。

四、List家族有哪些？

1.Vector

Vector集合是一个比较古老的集合类，在Java1.1的时候就有了，Vector实现List集合，元素可以重复，顺序按照插入的顺序(即不会自动排序)。他是线程安全的，但是不推荐使用，因为它使用了Synchronized同步机制的对象锁的形式。
很多的方法都是下面的这种形式

public synchronized E set(int index, E element) {
    if (index >= elementCount)
        throw new ArrayIndexOutOfBoundsException(index);
    E oldValue = elementData(index);
    elementData[index] = element;
    return oldValue;
}
public synchronized boolean add(E e) {
    modCount++;
    ensureCapacityHelper(elementCount + 1);
    elementData[elementCount++] = e;
    return true;
}

2.ArrayList底层原理

ArrayList集合：实现List集合，元素可以重复，顺序按照插入的顺序(即不会自动排序)。他是线程不安全的，单线程考虑使用ArrayList。

然而答上面的内容很难满足面试官
他们经常就会问你你知道ArrayList底层吗？

我曾经第一次遇到这个问题的时候是懵的，底层不就是数组，顺序表来实现…

其实他也就是想问你，是否看过源码。

我觉得你可以从以下几个方面来介绍：ArrayList的3个构造参数、add方法或插入方法、删除方法、ArrayList扩容机制等。

ArrayList构造方法

public ArrayList(int initialCapacity) {
    if (initialCapacity > 0) {
        this.elementData = new Object[initialCapacity];  //创建对应大小的数组
    } else if (initialCapacity == 0) {
        this.elementData = EMPTY_ELEMENTDATA;   //创建一个空的数组
    } else {
            throw new IllegalArgumentException("Illegal Capacity: " + initialCapacity);  //传入的参数非法
    }
}
public ArrayList() {
    this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;  //默认是创建一个空数组对象
}
public ArrayList(Collection<? extends E> c) {   //把集合C的元素在创建的时候添加到数组当中
    elementData = c.toArray();
    if ((size = elementData.length) != 0) {
        // c.toArray might (incorrectly) not return Object[] (see 6260652)
        if (elementData.getClass() != Object[].class)
            elementData = Arrays.copyOf(elementData, size, Object[].class);
    } else {
        // replace with empty array.
        this.elementData = EMPTY_ELEMENTDATA;
    }
}

ArrayList的无参数构造方法，会传入一个空的对象。一个int参数的构造方法，会传入对象大小的对象。也可以传入一个集合，当集合有值的时候，把对象复制到elementData中。

add方法、插入方法

public boolean add(E e) {
    ensureCapacityInternal(size + 1);  // Increments modCount!!
    elementData[size++] = e;   //在size中插入，然后size加1
    return true;
}
public void add(int index, E element) {
    rangeCheckForAdd(index);

    ensureCapacityInternal(size + 1);  // Increments modCount!!
    System.arraycopy(elementData, index, elementData, index + 1, size - index); //元素后移，空出index位置
    elementData[index] = element;  //插入index
    size++;
}

private void rangeCheckForAdd(int index) {   //检查index位置是否合法
    if (index > size || index < 0)
        throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
}

ArrayList的add方法有两个，直接add元素的会先检查集合是否需要扩容，然后在末尾添加元素e，elementData[size++] = e;

第二个会检查index的位置，防止越界。之后使用arraycopy的方法，把index之后的元素向后移以为，再放入元素。

System.arraycopy(elementData, index, elementData, index + 1, size - index);
/**
    @param      src      the source array.     //原数组
    @param      srcPos   starting position in the source array.  //开始移动的位置
    @param      dest     the destination array.  //目标数组
    @param      destPos  starting position in the destination data.   //开始复制的地址
    @param      length   the number of array elements to be copied.   //复制的长度
*/
public static native void arraycopy(Object src,  int  srcPos,Object dest, int destPos,int length);

这个arraycopy是一个C语言写的方法，它的5个参数：第一个是原来的数组，第二个是开始的位置，第三个是复制的目标数组，第四个是开始位置复制的地址，第五个是复制的长度。

把array数组中的元素全部复制到newArray中，应该怎么写？

System.arraycopy(array, 0, newArray, 0, size );

这样是不是就理解了一些

ArrayList删除方法

public E remove(int index) {
    rangeCheck(index);     //检查索引的下标是否正确

    modCount++;
    E oldValue = elementData(index);
    
    int numMoved = size - index - 1;   //需要移动的元素的个数
    if (numMoved > 0)
        System.arraycopy(elementData, index+1, elementData, index, numMoved);   //移动元素
    elementData[--size] = null; // clear to let GC do its work    //把移动完最后一个元素置为null

    return oldValue;
}
public boolean remove(Object o) {  //按照对象，移除某一个对象
    if (o == null) {
        for (int index = 0; index < size; index++)
            if (elementData[index] == null) {
                fastRemove(index);
                return true;
            }
    } else {
        for (int index = 0; index < size; index++)  
            if (o.equals(elementData[index])) {    //移除相应的对象
                fastRemove(index);
                return true;
            }
    }
    return false;
}

ArrayList扩容机制
默认的初始化的情况下容量是10，add之后会有ensureCapacityInternal的判断，把size+1和原来的elementData对象的Size进行对比，返回的DEFAULT_CAPACITY和minCapacity的最大值，当超过10之后，11比10大，进入到grow的函数，使用位运算，扩容原来的一半。

public boolean add(E e) {
    ensureCapacityInternal(size + 1);  // Increments modCount!!   //这里判断是否扩容
    elementData[size++] = e;
    return true;
}

private static int calculateCapacity(Object[] elementData, int minCapacity) {   //这里的一层判断真的很奇怪，如果数组中没有元素，分配10个大小的元素，否则返回size+1
    if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
        return Math.max(DEFAULT_CAPACITY, minCapacity);
    }
    return minCapacity;
}

private void ensureCapacityInternal(int minCapacity) {    //minCapacity 此时等于size+1
    ensureExplicitCapacity(calculateCapacity(elementData, minCapacity)); 
}

private void ensureExplicitCapacity(int minCapacity) {     //minCapacity 此时等于size+1
    modCount++;
    
    // overflow-conscious code
    if (minCapacity - elementData.length > 0)      //minCapacity比数组中元素的长度长的时候
        grow(minCapacity);                         //做扩容的方法
}

private void grow(int minCapacity) {               //扩容方法
    // overflow-conscious code 
    int oldCapacity = elementData.length;          //原来长度       
    int newCapacity = oldCapacity + (oldCapacity >> 1);   //新的长度是原来的1.5倍，原来长度右移一位就是原来长度的0.5了
    if (newCapacity - minCapacity < 0)             //第一次插入的时候会使用，newCapacity=oldCapacity=0,所以直接等于10
        newCapacity = minCapacity;
    if (newCapacity - MAX_ARRAY_SIZE > 0)          //数组越界
        newCapacity = hugeCapacity(minCapacity);
    // minCapacity is usually close to size, so this is a win:
    elementData = Arrays.copyOf(elementData, newCapacity);   //做扩容
}

看到这里不经让我想到一个题目：ArrayList(int initialCapacity)会不会初始化数组大小？也就是第二个构造函数

public ArrayList(int initialCapacity) {
    if (initialCapacity > 0) {
        this.elementData = new Object[initialCapacity];
    } else if (initialCapacity == 0) {
        this.elementData = EMPTY_ELEMENTDATA;
    } else {
        throw new IllegalArgumentException("Illegal Capacity: "+ initialCapacity);
    }
}

初始化了一个空的数组，但是List的大小还是0，因为List的大小是返回size的。

这道题是敖丙在这篇文章中提到的，我开始还有点懵，看完了扩容机制后基本了解了。

初始化的时候，会初始化对应空间的空数组，但是不会该表size的大小。当用户第一次添加的时候ensureCapacityInternal(size+1);
进入到calculateCapacity方法由于数组是不为空的，返回长度minCapacity=1，进入到grow方法后，oldCapacity等于6，newCapacity等于1，newCapacity还是等于6，elementData做扩容等于6。但是size还是1.

注意：size不等于ArrayList的容量，size是ArrayList中存在元素的个数。

上面的代码，虽然在默认情况下是10的容量，但是还是无法set进去，因为set会检查index的索引的正确性，是通过size来确认的，size不是ArrayList的大小，而是ArrayList中含有的元素的个数。

3.LinkedList

LinkedList集合，实现List集合，元素可以重复，顺序按照插入的顺序，单链表。他是线程不安全的。

四、List集合经典面试题

ArrayList的底层原理知道吗？

知道，我看过ArrayList的源码。主要回答可以从增加、删除元素、扩容机制、构造方法上面答。

ArrayList里面可以放int？

ArrayList放int是可以正常使用的，但是这里面涉及了自动装箱。ArrayList里面存放的内容是对象，对于基本的数据类型，我们只能使用对应的包装类。

自动装箱和自动拆箱你解释一遍吧？

自动装箱，在程序编译后转化成了对应的包装类。自动拆箱，在程序编译后转化城里对应的还原类。

大于128的比较就是false，自动装箱和拆箱的知识还是有一点了，小胖就先不写了。这一点就当课后作业吧。

好的！我就是懒

Vector和ArrayList他们如何扩容？

Vector增长原来的1倍，ArrayList默认的初始化容量是10，ArrayList增长原来的0.5倍

Vector每次扩容一次，增长一倍

private void grow(int minCapacity) {
    // overflow-conscious code
    int oldCapacity = elementData.length;
    int newCapacity = oldCapacity + ((capacityIncrement > 0) ?
                                     capacityIncrement : oldCapacity);
    if (newCapacity - minCapacity < 0)
        newCapacity = minCapacity;
    if (newCapacity - MAX_ARRAY_SIZE > 0)
        newCapacity = hugeCapacity(minCapacity);
    elementData = Arrays.copyOf(elementData, newCapacity);
}

说说 ArrayList,Vector, LinkedList 的存储性能和特性？

ArrayList和Vector都是使用的数组的方式储存数字，他们可以直接通过序号索引元素，但是在插入的时候，需要元素的移动等内存的操作，所以索引数据快但是插入慢。Vector和ArrayList的本质区别就是使用的Synchronized的代码块形式，他是线程安全的，但是性能是比ArrayList差的。LinkedList使用双向链表，可以按需要索引，向前或向后遍历，插入数据的速度较快。总结：ArrayList在查询的时候速度较快，LinkedList在插入或者删除的时候速度较快。

不做重复的事情吧，以后我还会继续更新上面的内容，你们可以先看看大佬写的内容。
阿里面试，面试官没想到一个ArrayList，我都能跟他扯半小时

五、参考资料

ArrayList源码; 博客https://blog.csdn.net/qq_35190492/article/details/103883964

未完待续

本人知识有限，如果有错误，欢迎各位指正。谢谢~

【集合框架】ArrayList源码分析