【集合框架】ArrayList源码分析

一、前言

小胖觉得呀,Java集合框架,是面试考察的一个大重点!不管是你翻看大厂还是小公司,面试中都有对集合的要求,集合的知识也是非常多的。我在CSDN上找了很多的资料,包括框架图、ArrayList考察点等。有很多比较好的资料,包括敖丙写的3篇文章质量都是非常高的。本着分享技术的目的,也想自己好好的梳理一下。本系列文章包含:List、Set、Map、HashMap、CurrentHashMap、CopyOnWriteArrayList等。还是一个目的,让你能搞懂一些集合的知识,以及集合的经典面试题。本文只有ArrayList的源码分析

二、Java集合有哪些

http://ftp.zouzhifeng.com/collection.png
http://ftp.zouzhifeng.com/map.png
上面两个图是我翻看了JDK1.8源码之后,画的一个简单的图,复杂的图连线真的很多,完全看不了。网上的图也都非常的复杂。

简单解释上面类的关系:

  1. Vector、ArrayList和LinkedList都实现了List接口

  1. HashSet实现了Set接口,LinkedHashSet继承自HashSet
  2. SortedSet继承了Set接口,TreeSet实现NavigableSet,NavigableSet继承SortedSet

  1. Hashtable和hashMap实现Map接口,LinkedHashMap继承HashMap
  2. SortedMap继承了Map接口,TreeMap实现NavigableMap,NavigableMap继承SortedMap

很复杂,真的很复杂!!!

三、面试考察重点在哪?

ArrayList底层原理、HashMap底层原理、CurrentHashMap与HashMap的区别。这三个内容是非常重要的,基本上都是必须要掌握的知识。

四、List家族有哪些?

1.Vector

Vector集合是一个比较古老的集合类,在Java1.1的时候就有了,Vector实现List集合,元素可以重复,顺序按照插入的顺序(即不会自动排序)。他是线程安全的,但是不推荐使用,因为它使用了Synchronized同步机制的对象锁的形式。
很多的方法都是下面的这种形式

public synchronized E set(int index, E element) {
    if (index >= elementCount)
        throw new ArrayIndexOutOfBoundsException(index);
    E oldValue = elementData(index);
    elementData[index] = element;
    return oldValue;
}
public synchronized boolean add(E e) {
    modCount++;
    ensureCapacityHelper(elementCount + 1);
    elementData[elementCount++] = e;
    return true;
}
2.ArrayList底层原理

ArrayList集合:实现List集合,元素可以重复,顺序按照插入的顺序(即不会自动排序)。他是线程不安全的,单线程考虑使用ArrayList。

然而答上面的内容很难满足面试官
他们经常就会问你你知道ArrayList底层吗?

我曾经第一次遇到这个问题的时候是懵的,底层不就是数组,顺序表来实现…

其实他也就是想问你,是否看过源码。

我觉得你可以从以下几个方面来介绍:ArrayList的3个构造参数、add方法或插入方法、删除方法、ArrayList扩容机制等。

ArrayList构造方法

public ArrayList(int initialCapacity) {
    if (initialCapacity > 0) {
        this.elementData = new Object[initialCapacity];  //创建对应大小的数组
    } else if (initialCapacity == 0) {
        this.elementData = EMPTY_ELEMENTDATA;   //创建一个空的数组
    } else {
            throw new IllegalArgumentException("Illegal Capacity: " + initialCapacity);  //传入的参数非法
    }
}
public ArrayList() {
    this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;  //默认是创建一个空数组对象
}
public ArrayList(Collection<? extends E> c) {   //把集合C的元素在创建的时候添加到数组当中
    elementData = c.toArray();
    if ((size = elementData.length) != 0) {
        // c.toArray might (incorrectly) not return Object[] (see 6260652)
        if (elementData.getClass() != Object[].class)
            elementData = Arrays.copyOf(elementData, size, Object[].class);
    } else {
        // replace with empty array.
        this.elementData = EMPTY_ELEMENTDATA;
    }
}

ArrayList的无参数构造方法,会传入一个空的对象。一个int参数的构造方法,会传入对象大小的对象。也可以传入一个集合,当集合有值的时候,把对象复制到elementData中。

add方法、插入方法

public boolean add(E e) {
    ensureCapacityInternal(size + 1);  // Increments modCount!!
    elementData[size++] = e;   //在size中插入,然后size加1
    return true;
}
public void add(int index, E element) {
    rangeCheckForAdd(index);

    ensureCapacityInternal(size + 1);  // Increments modCount!!
    System.arraycopy(elementData, index, elementData, index + 1, size - index); //元素后移,空出index位置
    elementData[index] = element;  //插入index
    size++;
}

private void rangeCheckForAdd(int index) {   //检查index位置是否合法
    if (index > size || index < 0)
        throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
}

ArrayList的add方法有两个,直接add元素的会先检查集合是否需要扩容,然后在末尾添加元素e,elementData[size++] = e;

第二个会检查index的位置,防止越界。之后使用arraycopy的方法,把index之后的元素向后移以为,再放入元素。

System.arraycopy(elementData, index, elementData, index + 1, size - index);
/**
    @param      src      the source array.     //原数组
    @param      srcPos   starting position in the source array.  //开始移动的位置
    @param      dest     the destination array.  //目标数组
    @param      destPos  starting position in the destination data.   //开始复制的地址
    @param      length   the number of array elements to be copied.   //复制的长度
*/
public static native void arraycopy(Object src,  int  srcPos,Object dest, int destPos,int length);

这个arraycopy是一个C语言写的方法,它的5个参数:第一个是原来的数组,第二个是开始的位置,第三个是复制的目标数组,第四个是开始位置复制的地址,第五个是复制的长度。

把array数组中的元素全部复制到newArray中,应该怎么写?

System.arraycopy(array, 0, newArray, 0, size );

这样是不是就理解了一些

ArrayList删除方法

public E remove(int index) {
    rangeCheck(index);     //检查索引的下标是否正确

    modCount++;
    E oldValue = elementData(index);
    
    int numMoved = size - index - 1;   //需要移动的元素的个数
    if (numMoved > 0)
        System.arraycopy(elementData, index+1, elementData, index, numMoved);   //移动元素
    elementData[--size] = null; // clear to let GC do its work    //把移动完最后一个元素置为null

    return oldValue;
}
public boolean remove(Object o) {  //按照对象,移除某一个对象
    if (o == null) {
        for (int index = 0; index < size; index++)
            if (elementData[index] == null) {
                fastRemove(index);
                return true;
            }
    } else {
        for (int index = 0; index < size; index++)  
            if (o.equals(elementData[index])) {    //移除相应的对象
                fastRemove(index);
                return true;
            }
    }
    return false;
}

ArrayList扩容机制
默认的初始化的情况下容量是10,add之后会有ensureCapacityInternal的判断,把size+1和原来的elementData对象的Size进行对比,返回的DEFAULT_CAPACITY和minCapacity的最大值,当超过10之后,11比10大,进入到grow的函数,使用位运算,扩容原来的一半。

public boolean add(E e) {
    ensureCapacityInternal(size + 1);  // Increments modCount!!   //这里判断是否扩容
    elementData[size++] = e;
    return true;
}

private static int calculateCapacity(Object[] elementData, int minCapacity) {   //这里的一层判断真的很奇怪,如果数组中没有元素,分配10个大小的元素,否则返回size+1
    if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
        return Math.max(DEFAULT_CAPACITY, minCapacity);
    }
    return minCapacity;
}

private void ensureCapacityInternal(int minCapacity) {    //minCapacity 此时等于size+1
    ensureExplicitCapacity(calculateCapacity(elementData, minCapacity)); 
}

private void ensureExplicitCapacity(int minCapacity) {     //minCapacity 此时等于size+1
    modCount++;
    
    // overflow-conscious code
    if (minCapacity - elementData.length > 0)      //minCapacity比数组中元素的长度长的时候
        grow(minCapacity);                         //做扩容的方法
}

private void grow(int minCapacity) {               //扩容方法
    // overflow-conscious code 
    int oldCapacity = elementData.length;          //原来长度       
    int newCapacity = oldCapacity + (oldCapacity >> 1);   //新的长度是原来的1.5倍,原来长度右移一位就是原来长度的0.5了
    if (newCapacity - minCapacity < 0)             //第一次插入的时候会使用,newCapacity=oldCapacity=0,所以直接等于10
        newCapacity = minCapacity;
    if (newCapacity - MAX_ARRAY_SIZE > 0)          //数组越界
        newCapacity = hugeCapacity(minCapacity);
    // minCapacity is usually close to size, so this is a win:
    elementData = Arrays.copyOf(elementData, newCapacity);   //做扩容
}

看到这里不经让我想到一个题目:ArrayList(int initialCapacity)会不会初始化数组大小?也就是第二个构造函数

public ArrayList(int initialCapacity) {
    if (initialCapacity > 0) {
        this.elementData = new Object[initialCapacity];
    } else if (initialCapacity == 0) {
        this.elementData = EMPTY_ELEMENTDATA;
    } else {
        throw new IllegalArgumentException("Illegal Capacity: "+ initialCapacity);
    }
}

初始化了一个空的数组,但是List的大小还是0,因为List的大小是返回size的。

这道题是敖丙在这篇文章中提到的,我开始还有点懵,看完了扩容机制后基本了解了。
http://ftp.zouzhifeng.com/arraylist.png
初始化的时候,会初始化对应空间的空数组,但是不会该表size的大小。当用户第一次添加的时候ensureCapacityInternal(size+1);
进入到calculateCapacity方法由于数组是不为空的,返回长度minCapacity=1,进入到grow方法后,oldCapacity等于6,newCapacity等于1,newCapacity还是等于6,elementData做扩容等于6。但是size还是1.

注意:size不等于ArrayList的容量,size是ArrayList中存在元素的个数。
http://ftp.zouzhifeng.com/arraylist1.png
上面的代码,虽然在默认情况下是10的容量,但是还是无法set进去,因为set会检查index的索引的正确性,是通过size来确认的,size不是ArrayList的大小,而是ArrayList中含有的元素的个数。

3.LinkedList

LinkedList集合,实现List集合,元素可以重复,顺序按照插入的顺序,单链表。他是线程不安全的。

四、List集合经典面试题

ArrayList的底层原理知道吗?

知道,我看过ArrayList的源码。主要回答可以从增加、删除元素、扩容机制、构造方法上面答。

ArrayList里面可以放int?

ArrayList放int是可以正常使用的,但是这里面涉及了自动装箱。ArrayList里面存放的内容是对象,对于基本的数据类型,我们只能使用对应的包装类。

自动装箱和自动拆箱你解释一遍吧?

自动装箱,在程序编译后转化成了对应的包装类。自动拆箱,在程序编译后转化城里对应的还原类。
在这里插入图片描述
在这里插入图片描述
大于128的比较就是false,自动装箱和拆箱的知识还是有一点了,小胖就先不写了。这一点就当课后作业吧。

好的!我就是懒

Vector和ArrayList他们如何扩容?

Vector增长原来的1倍,ArrayList默认的初始化容量是10,ArrayList增长原来的0.5倍

Vector每次扩容一次,增长一倍

private void grow(int minCapacity) {
    // overflow-conscious code
    int oldCapacity = elementData.length;
    int newCapacity = oldCapacity + ((capacityIncrement > 0) ?
                                     capacityIncrement : oldCapacity);
    if (newCapacity - minCapacity < 0)
        newCapacity = minCapacity;
    if (newCapacity - MAX_ARRAY_SIZE > 0)
        newCapacity = hugeCapacity(minCapacity);
    elementData = Arrays.copyOf(elementData, newCapacity);
}

说说 ArrayList,Vector, LinkedList 的存储性能和特性?

ArrayList和Vector都是使用的数组的方式储存数字,他们可以直接通过序号索引元素,但是在插入的时候,需要元素的移动等内存的操作,所以索引数据快但是插入慢。Vector和ArrayList的本质区别就是使用的Synchronized的代码块形式,他是线程安全的,但是性能是比ArrayList差的。LinkedList使用双向链表,可以按需要索引,向前或向后遍历,插入数据的速度较快。总结:ArrayList在查询的时候速度较快,LinkedList在插入或者删除的时候速度较快。

不做重复的事情吧,以后我还会继续更新上面的内容,你们可以先看看大佬写的内容。
阿里面试,面试官没想到一个ArrayList,我都能跟他扯半小时

五、参考资料

ArrayList源码; 博客https://blog.csdn.net/qq_35190492/article/details/103883964

未完待续

本人知识有限,如果有错误,欢迎各位指正。谢谢~

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章