最近深入了解了一下LinkList ArrayList的区别和性能。以往问及什么时候用ArrayList什么时候用LinkedList,往往答案是,当大量随机检索数据时使用ArrayList,当频繁插入删除操作时使用LinkedList。按照数据结构来说,确实是LinkedList在插入删除操作时的复杂度要低于ArrayList。但在现实代码实现以及实际执行性能上,却不一定是这样。根据查阅的资料整理如下。
首先要了解两种List的不同应该先了解其代码实现。
ArrayList是通过索引访问的数组实现,而LinkedList使用过 链表原理实现。
ArrayList的get(i)不需要遍历可以直接通过索引获取数据,而LinkedList需要遍历,遍历到i索引位置时将当前位置数据返回。
网上有人贴了这样一段代码:
public static void main(String[] args) {
// TODO Auto-generated method stub
LinkedList list = new LinkedList();
for (int i =0;i<=1000000; i++) {
list.add(i);
}
long start = System.currentTimeMillis();
list.get(1);
long end = System.currentTimeMillis();
System.out.println(" time to traverse 1st element " + (end - start) );
start = System.currentTimeMillis();
list.get(999999);
end = System.currentTimeMillis();
System.out.println(" time take to traverse 999999th element " + (end - start) );
}
time to traverse 1st element 0
time to traverse 999999th element 0
他问既然LinkedList需要遍历读取数据,为什么我获取第一个数据和最后一个数据用的时间是一样的。
看一下LinkedList的get代码就应该明白了,遍历可能会从列表头部或末尾开始进行,取决于i在列表的前半部还是后半部分:
public Object get(int index) {
//check the index is valid first .. code not shown here
Entry e = header; //starting node
//go forwards or backwards depending on which is closer
if (index < size/2) {
for (int i = 0; i <= index; i++)
e = e.next; }
else {
for (int i = size; i > index; i--)
e = e.previous;
}
return e;
}
同样在特定索引位置插入数据时,也是先遍历到那个位置再进行插入。这样很容易理解,当很大数据量时(比如1W),在LinkedList前部和后部进行删除插入操作,速度会很快,但是如果是在中部进行操作,测试结果就不那么乐观了,性能甚至不及ArrayList。
所以建议在数据量很大,同时存在链表头部以及尾部的频繁操作,并且很少执行中部数据操作时使用链表。其实这种情况也可以考虑使用ArrayDeque,因为链表在新增数据时会创建额外对象,记录上一node和下一个node的信息,会占用额外空间,而ArrayDeque则不会增加额外空间,不会增加GC工作。其他情况在ArrayList初始化大小设置合理时使用ArrayList能获得更好性能。
知道LinkedList的应用场景,再说说如何正确使用LinkedList。
首先是遍历,遍历LinkedList必须使用iterator不能使用for循环,因为每次for循环体内通过get(i)取得某一元素时都需要对list重新进行遍历,性能消耗极大。
另外不要试图使用indexOf等返回元素索引,并利用其进行遍历,例如下面的代码:
final int startPos = lst.indexOf( first ) + 1; //使用indexlOf对list进行了遍历,当结果为空时会遍历整个列表。
final ListIterator<String> iter = lst.listIterator( startPos ); //如果startPos的元素
在列表前半部,那这两行代码相当于平均要遍历了列表1.25的长度,因为 listIterator( startPos )也需要从头遍历,当到达指定元素后开始循环如下操作。
while ( iter.hasNext() ) {
if ( iter.next().length() == 5 )
iter.remove();
}
实际测试:
public class TestList {
private final static int SIZE = 100000000;
private LinkedList<Integer> ll = new LinkedList<Integer>();
private ArrayList<Integer> al = new ArrayList<Integer>(1000000);
public static void main(String[] args) {
TestList testList = new TestList();
System.out.println(" time to add element to 1st of ArrayList " + String.valueOf(testList.TestAddToHeadOfArrayList() ));
System.out.println(" time to add element to 1st of LinkedList " + String.valueOf(testList.TestAddToHeadOfLinkedList()) );
}
public long TestAddToHeadOfArrayList() {
for (int i = 0; i < SIZE; ++i) {
al.add(i);
}
long start = System.nanoTime();
al.add(0,-1);
long end = System.nanoTime();
return end - start;
}
public long TestAddToHeadOfLinkedList() {
for (int i = 0; i < SIZE; ++i) {
ll.add(i);
}
long start = System.nanoTime();
ll.add(0,-1);
long end = System.nanoTime();
return end - start;
}
}
使用如上代码测试,测试环境:
CPU I-5 2.6GHZ 内存16G 硬盘SSD 250G JVM1.6
在1亿条数据的al和ll列表前端执行插入,结果:
al — 51522813 纳秒(当插入数据后正好列表空间已满时,执行时间大概249400289纳秒)
ll — 91185 纳秒