在Java的java.util包中,有一批类被称为集合类
集合类,顾名思义,就是存放对象的集合的类,可以是数组形式【ArrayList】,也可以是链表形式【LinkedList】,也可以是两种形式结合【HashMap】。
Java的集合类的父类是Collection接口,主要分为三大类:List、Map、Set。
其中,List是一组元素的集合,最常用到的为ArrayList、LinkedList;
Map是一组成对对象【键值对】的集合,根据Key来存取Value,最常用到的为HashMap和LinkedList;
Set是一个真正数学意义上的元素的集合,其中不包含重复的元素,最常用到的为HashSet和TreeSet。
其中,在JDK的源码中,Set的底层实现都是使用对应的Map来实现的,将存取于Set中的元素作为Map的Key,使用同一个对象作为Value。例如,HashSet中是使用了一个HashMap来作为内部存储实现,
TreeSet也是如此,内部使用了一个TreeMap来存放元素,图就不贴了。
ArrayList和LinkedList的区别前面已经写过博客。
HashMap和TreeMap的区别:
HashMap是基于散列表实现,内部存储结构为邻接表【数组+链表】;
TreeMap是基于红黑树实现,内部存储结构为红黑树。
因此存入HashMap的键值对要求key必须提供hashCode()方法作为散列依据,此方法为Object类中已有;
而对于TreeMap来说,要么在初始化TreeMap时,提供一个Comparator作为比较键大小的依据,或者要求key的类必须实现Comparable。如果这两个条件都没有满足,那向Treemap中put的时候就会报出异常。
==================================强大的分割线======================================
总体来说,Vector和ArrayList是一致的,实现的接口也是完全一样,内部的存储结构也基本一致【都是数组】,每个方法的实现也几乎相同。
区别在于,Vector是线程安全的,每个方法都加了synchronized修饰符,而ArrayList没有。
而且Vector是JDK1.0引入的,而ArrayList是JDK1.2引入的。
==================================强大的分割线======================================
再来说ArrayList和LinkedList的区别,上面说过ArrayList内部是数组实现的,LinkedList内部是链表实现的。
因此,当遇到读取比较多,插入、删除比较少的时候,推荐使用ArrayList,毕竟数组读取速度飞快,插入删除速度需要移动大量元素;而当遇到插入删除比较多的时候,推荐使用LinkedList。
==================================强大的分割线======================================
SynchronizedList只是提供了一个对List对象的封装,对List的每个操作都添加了synchronized修饰,基本上与Vector一致,只是用法不同而已。比如现在已经有个LinkedList,如果想要一个线程安全的List,只需执行Collections.synchronized(linkedList)即可,没有任何的元素拷贝操作,此时,如果用Vector实现,则必须遍历LinkedList,将其中的每一个元素拷贝到Vector中。
==================================强大的分割线======================================
从JDK1.2起,就有了HashMap,正如前一篇文章所说,HashMap不是线程安全的,因此多线程操作时需要格外小心。
在JDK1.5中,伟大的Doug Lea给我们带来了concurrent包,从此Map也有安全的了。
ConcurrentHashMap具体是怎么实现线程安全的呢,肯定不可能是每个方法加synchronized,那样就变成了HashTable。
从ConcurrentHashMap代码中可以看出,它引入了一个“分段锁”的概念,具体可以理解为把一个大的Map拆分成N个小的HashTable,根据key.hashCode()来决定把key放到哪个HashTable中。
在ConcurrentHashMap中,就是把Map分成了N个Segment,put和get的时候,都是现根据key.hashCode()算出放到哪个Segment中:
测试程序:
- import java.util.concurrent.ConcurrentHashMap;
- public class ConcurrentHashMapTest {
- private static ConcurrentHashMap<Integer, Integer> map = new ConcurrentHashMap<Integer, Integer>();
- public static void main(String[] args) {
- new Thread("Thread1"){
- @Override
- public void run() {
- map.put(3, 33);
- }
- };
- new Thread("Thread2"){
- @Override
- public void run() {
- map.put(4, 44);
- }
- };
- new Thread("Thread3"){
- @Override
- public void run() {
- map.put(7, 77);
- }
- };
- System.out.println(map);
- }
- }
ConcurrentHashMap中默认是把segments初始化为长度为16的数组。
根据ConcurrentHashMap.segmentFor的算法,3、4对应的Segment都是segments[1],7对应的Segment是segments[12]。
(1)Thread1和Thread2先后进入Segment.put方法时,Thread1会首先获取到锁,可以进入,而Thread2则会阻塞在锁上:
(2)切换到Thread3,也走到Segment.put方法,因为7所存储的Segment和3、4不同,因此,不会阻塞在lock():
以上就是ConcurrentHashMap的工作机制,通过把整个Map分为N个Segment(类似HashTable),可以提供相同的线程安全,但是效率提升N倍,默认提升16倍。