Java 集合

image

上图是java 集合框架的接口继承图,集合中有两个基本接口:Collection 和 Map。Collection 实现了 Iterable 接口,所以所有实现了 Iterable 接口的类都能使用 Iterator 迭代器。

image

image

上图是Java 集合框架的类的继承图

实体集合/映射 接口 重复项 有序/排序 元素调用方法 实现类数据结构 值是否可为NULL 是否为同步
ArrayList List 可以重复 插入排序 equals() 可调大小数组 YES NO
LinkedList List 可以重复 插入排序 equals() 链表 YES NO
Vector List 可以重复 插入排序 equals() 可调大小数组 YES
HashSet Set 元素唯一 无顺序 equals()、hashCode() Hash表
LinkedHashSet Set 元素唯一 插入排序 equals()、hashCode() Hash表和双向链表
TreeSet SortedSet 元素唯一 排序 equals()、compareTo() 红黑树
HashMap Map 键唯一 无顺序 equals()、hashCode() Hash表
LinkedHashMap Map 键唯一 键插入顺序/条目访问顺序 equals()、hashCode() Hash表和双向链表
Hashtable Map 键唯一 无顺序 equals()、hashCode() Hash表 NO YES
TreeMap SortedMap 键唯一 键序排列 equals()、compareTo() 红黑树

对JAVA的集合的理解是相对于数组:
  数组是大小固定的,并且同一个数组只能存放类型一样的数据(基本类型/引用类型),JAVA集合可以存储和操作数目不固定的一组数据。 所有的JAVA集合都位于 java.util包中!
  只有实现了 Iterable 接口的类才能使用 iterator() 方法返回一个 Iterator , Collection 继承了Iterable接口,所以List,Set,Queue等都实现了Iterable接口并且覆写了接口中的iterator()方法,所以才能使用迭代器输出。另外对于foreach语句,只有实现了Iterable接口的类才可以使用。
JDK源码Iterable接口:

public interface Iterable<T> {
    Iterator<T> iterator();
}

JDK源码Iterator接口:

public interface Iterator<T> {
    boolean hasNext();
    E next();
    void remove(); 
}

一个类要实现Iterable接口,主要是实现iterator()方法,通过返回一个实现了Iterator接口的匿名内部类对象。例如:

public class IterablerClass<t> implements Iterable<t>{
      ......
    @Override
    public Iterator<t> iterator() {
        return new Iterator<t>() {
            private Integer index = 0;
            @Override
            publicboolean hasNext() {...}
            @Override
            public String  next(){...}
            @Override
            public void remove(){...}
         }
        ......
 }

1.1 Collection接口

Collection是最基本的集合接口,声明了适用于JAVA集合(只包括Set和List)的通用方法。 Set 和List 都继承了Collection。

1.1.1 Collection接口的方法:

  1. boolean add(Object o) :向集合中加入一个对象的引用
  2. void clear() :删除集合中所有的对象,即不再持有这些对象的引用
  3. boolean isEmpty() :判断集合是否为空
  4. boolean contains(Object o) : 判断集合中是否持有特定对象的引用
  5. Iterartor iterator() :返回一个Iterator对象,可以用来遍历集合中的元素
  6. boolean remove(Object o) :从集合中删除一个对象的引用
  7. int size() :返回集合中元素的数目
  8. Object[] toArray() : 返回一个数组,该数组中包括集合中的所有元素

关于:Iterator() 和toArray() 方法都用于集合的所有的元素,前者返回一个Iterator对象,后者返回一个包含集合中所有元素的数组。

1.1.2 Iterator接口声明了如下方法:

  1. hasNext() :判断集合中元素是否遍历完毕,如果没有,就返回true
  2. next() :返回下一个元素
  3. remove() :从集合中删除上一个有next()方法返回的元素。

1.2 List(列表)

List的特征是其元素以线性方式存储,集合中可以存放重复对象。

1.2.1 List接口主要实现类包括:

● ArrayList() : 代表长度可以改变得数组。可以对元素进行随机的访问,向ArrayList()中插入与删除元素的速度慢。
● LinkedList(): 在实现中采用链表数据结构。插入和删除速度快,访问速度慢。
对于List的随机访问来说,就是只随机来检索位于特定位置的元素。 List 的 get(int index) 方法放回集合中由参数index指定的索引位置的对象,下标从“0” 开始。最基本的两种检索集合中的所有对象的方法:
1: for循环和get()方法:

  for(int i=0; i < list.size();i++){  
     System.out.println(list.get(i));  
   }  

2: 使用 迭代器(Iterator):

   Iterator it=list.iterator();  
   while(it.hashNext()){  
      System.out.println(it.next());  
  }  

1.2.2 List的功能方法

实际上有两种List:一种是基本的ArrayList,其优点在于随机访问元素,另一种是更强大的LinkedList,它并不是为快速随机访问设计的,而是具有一套更通用的方法。
● List:次序是List最重要的特点:它保证维护元素特定的顺序。List为Collection添加了许多方法,使得能够向List中间插入与移除元素(这只推 荐LinkedList使用。)一个List可以生成ListIterator,使用它可以从两个方向遍历List,也可以从List中间插入和移除元 素。
● ArrayList:由数组实现的List。允许对元素进行快速随机访问,但是向List中间插入与移除元素的速度很慢。ListIterator只应该用来由后向前遍历 ArrayList,而不是用来插入和移除元素。因为那比LinkedList开销要大很多。
● LinkedList :对顺序访问进行了优化,向List中间插入与删除的开销并不大。随机访问则相对较慢。(使用ArrayList代替。)还具有下列方 法:addFirst(), addLast(), getFirst(), getLast(), removeFirst() 和 removeLast(), 这些方法 (没有在任何接口或基类中定义过)使得LinkedList可以当作堆栈、队列和双向队列使用。

1.3 Set(集合)

Set是最简单的一种集合。集合中的对象不按特定的方式排序,并且没有重复对象。 Set接口主要实现了两个实现类:
● HashSet: HashSet类按照哈希算法来存取集合中的对象,存取速度比较快
● TreeSet :TreeSet类实现了SortedSet接口,能够对集合中的对象进行排序,对象要实现comparable 或 comparator接口。
Set 的用法:存放的是对象的引用,没有重复对象

  Set set = new HashSet();  
  String s1 = new String("hello");  
  String s2 = s1;  
  String s3 = new String("world");  
  set.add(s1);  
  set.add(s2);  
  set.add(s3);  
  System.out.println(set.size());//打印集合中对象的数目 为 2。 

Set 的 add()方法是如何判断对象是否已经存放在集合中?

  boolean isExists=false;  
  Iterator iterator=set.iterator();  
  while(it.hasNext()){  
      String oldStr=it.next();  
      if(newStr.equals(oldStr)){   
          isExists=true;   
      }  
  } 

Set的功能方法
Set具有与Collection完全一样的接口,因此没有任何额外的功能,不像前面有两个不同的List。实际上Set就是Collection,只 是行为不同。(这是继承与多态思想的典型应用:表现不同的行为。)Set不保存重复的元素(至于如何判断元素相同则较为负责)
Set : 存入Set的每个元素都必须是唯一的,因为Set不保存重复元素。加入Set的元素必须定义equals()方法以确保对象的唯一性。Set与Collection有完全一样的接口。Set接口不保证维护元素的次序。
● HashSet:为快速查找设计的Set。存入HashSet的对象必须定义hashCode()。
● TreeSet: 保存次序的Set, 底层为树结构。使用它可以从Set中提取有序的序列。
● LinkedHashSet:具有HashSet的查询速度,且内部使用链表维护元素的顺序(插入的次序)。于是在使用迭代器遍历Set时,结果会按元素插入的次序显示。

1.HashSet的底层用哈希散列表来存储对象(默认长度为16的数组)

    Set set=new HashSet();
      set.add(obj);

内部存储过程为 : 定义h=obj.hashCode,得到obj对象的哈希码h,再对h进行hash散列运算,对数组长度进行求余,假如长度为16,则返回一个0-15之间的值,然后这个值就是存在HashSet数组中的下标。如果下标位置没有对象(不起冲突),则把obj加到该位置;如果已近有对象(起冲突),则用equals判断两对象是否相等,相等则舍弃obj,不相等,则把obj以节点(链表)的方式加在该对象下面。

2.HashSet是如何判断元素重复的
HashSet不能添加重复的元素,当调用add(Object)方法时候,首先会调用Object的hashCode方法判hashCode是否已经存在,如不存在则直接插入元素;如果已存在则调用Object对象的equals方法判断是否返回true,如果为true则说明元素已经存在,如为false则插入元素。
查看了JDK源码,发现HashSet竟然是借助HashMap来实现的,利用HashMap中Key的唯一性,来保证HashSet中不出现重复值。具体参见代码:

public class HashSet<E>
    extends AbstractSet<E>
    implements Set<E>, Cloneable, java.io.Serializable
{
    private transient HashMap<E,Object> map;
    private static final Object PRESENT = new Object();
    public HashSet() {
        map = new HashMap<E,Object>();
    }
    public boolean contains(Object o) {
        return map.containsKey(o);
    }
    public boolean add(E e) {
        return map.put(e, PRESENT)==null;
    }
}

由此可见,HashSet中的元素实际上是作为HashMap中的Key存放在HashMap中的。下面是HashMap类中的put方法:

public V put(K key, V value) {
    if (key == null)
        return putForNullKey(value);
    int hash = hash(key.hashCode());
    int i = indexFor(hash, table.length);
    for (Entry<K,V> e = table[i]; e != null; e = e.next) {
        Object k;
        if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
            V oldValue = e.value;
            e.value = value;
            e.recordAccess(this);
            return oldValue;
        }
    }
}

从这段代码中可以看出,HashMap中的Key是根据对象的hashCode() 和 euqals()来判断是否唯一的。
结论:为了保证HashSet中的对象不会出现重复值,在被存放元素的类中必须要重写hashCode()和equals()这两个方法。

1.4 Map(映射)

Map 是一种把键对象和值对象映射的集合,它的每一个元素都包含一对键对象和值对象。 Map没有继承于Collection接口 从Map集合中检索元素时,只要给出键对象,就会返回对应的值对象。

1.4.1 Map 的常用方法:

1 添加,删除操作:

  Object put(Object key, Object value): 向集合中加入元素   
  Object remove(Object key): 删除与KEY相关的元素   
  void putAll(Map t):  将来自特定映像的所有元素添加给该映像   
  void clear():从映像中删除所有映射   

2 查询操作:

Object get(Object key):获得与关键字key相关的值 。Map集合中的键对象不允许重复,也就说,任意两个键对象通过equals()方法比较的结果都是false.,但是可以将任意多个键独享映射到同一个值对象上。

Map的功能方法

  1. 方法put(Object key, Object value) 添加一个“值”(想要得东西)和与“值”相关联的“键”(key)(使用它来查找)。
  2. 方法get(Object key) 返回与给定“键”相关联的“值”。可以用containsKey()和containsValue()测试Map中是否包含某个“键”或“值”。

标准的Java类库中包含了几种不同的Map:HashMap, TreeMap, LinkedHashMap, WeakHashMap, IdentityHashMap。它们都有同样的基本接口Map,但是行为、效率、排序策略、保存对象的生命周期和判定“键”等价的策略等各不相同。
执行效率是Map的一个大问题。看看get()要做哪些事,就会明白为什么在ArrayList中搜索“键”是相当慢的。而这正是HashMap提高速 度的地方。HashMap使用了特殊的值,称为“散列码”(hash code),来取代对键的缓慢搜索。“散列码”是“相对唯一”用以代表对象的int值,它是通过将该对象的某些信息进行转换而生成的。所有Java对象都 能产生散列码,因为hashCode()是定义在基类Object中的方法。
HashMap就是使用对象的hashCode()进行快速查询的。此方法能够显着提高性能。
● Map : 维护“键值对”的关联性,使你可以通过“键”查找“值”
● HashMap:Map基于散列表的实现。插入和查询“键值对”的开销是固定的。可以通过构造器设置容量capacity和负载因子load factor,以调整容器的性能。
● LinkedHashMap: 类似于HashMap,但是迭代遍历它时,取得“键值对”的顺序是其插入次序,或者是最近最少使用(LRU)的次序。只比HashMap慢一点。而在迭代访问时发而更快,因为它使用链表维护内部次序。
● TreeMap : 基于红黑树数据结构的实现。查看“键”或“键值对”时,它们会被排序(次序由Comparabel或Comparator决定)。TreeMap的特点在 于,你得到的结果是经过排序的。TreeMap是唯一的带有subMap()方法的Map,它可以返回一个子树。
● WeakHashMao :弱键(weak key)Map,Map中使用的对象也被允许释放: 这是为解决特殊问题设计的。如果没有map之外的引用指向某个“键”,则此“键”可以被垃圾收集器回收。
● IdentifyHashMap: : 使用==代替equals()对“键”作比较的hash map。专为解决特殊问题而设计。

1.5 其他特征

List,Set,Map将持有对象一律视为Object型别。
Collection、List、Set、Map都是接口,不能实例化。
继承自它们的 ArrayList, Vector, HashTable, HashMap是具象class,这些才可被实例化,Vector, HashTable是线程安全的,但效率比ArrayList,HashMap低。
vector容器确切知道它所持有的对象隶属什么型别。vector不进行边界检查。

总结

  1. 如果涉及到堆栈,队列等操作,应该考虑用List,对于需要快速插入,删除元素,应该使用LinkedList,如果需要快速随机访问元素,应该使用ArrayList。
  2. 如果程序在单线程环境中,或者访问仅仅在一个线程中进行,考虑非同步的类,其效率较高,如果多个线程可能同时操作一个类,应该使用同步的类。
  3. 在除需要排序时使用TreeSet,TreeMap外,都应使用HashSet,HashMap,因为他们 的效率更高。
  4. 要特别注意对哈希表的操作,作为key的对象要正确复写equals和hashCode方法。
  5. 容器类仅能持有对象引用(指向对象的指针),而不是将对象信息copy一份至数列某位置。一旦将对象置入容器内,便损失了该对象的型别信息。
  6. 尽量返回接口而非实际的类型,如返回List而非ArrayList,这样如果以后需要将ArrayList换成LinkedList时,客户端代码不用改变。这就是针对抽象编程。

注意

  1. Collection没有get()方法来取得某个元素。只能通过iterator()遍历元素。
  2. Set和Collection拥有一模一样的接口。
  3. List,可以通过get()方法来一次取出一个元素。使用数字来选择一堆对象中的一个,get(0)…。(add/get)
  4. 一般使用ArrayList。用LinkedList构造堆栈stack、队列queue。
  5. Map用 put(k,v) / get(k),还可以使用containsKey()/containsValue()来检查其中是否含有某个key/value。
    HashMap会利用对象的hashCode来快速找到key。
  6. Map中元素,可以将key序列、value序列单独抽取出来。
    使用keySet()抽取key序列,将map中的所有keys生成一个Set。
    使用values()抽取value序列,将map中的所有values生成一个Collection。
    为什么一个生成Set,一个生成Collection?那是因为,key总是独一无二的,value允许重复。

ListIterator和Iterator

  1. 使用范围不同,Iterator可以应用于所有的集合,Set、List和Map和这些集合的子类型。而ListIterator只能用于List及其子类型。
  2. ListIterator有add方法,可以向List中添加对象,而Iterator不能。
  3. ListIterator和Iterator都有hasNext()和next()方法,可以实现顺序向后遍历,但是ListIterator有hasPrevious()和previous()方法,可以实现逆向(顺序向前)遍历。Iterator不可以。
  4. ListIterator可以定位当前索引的位置,nextIndex()和previousIndex()可以实现。Iterator没有此功能。
  5. 都可实现删除操作,但是ListIterator可以实现对象的修改,set()方法可以实现。Iterator仅能遍历,不能修改。
发布了48 篇原创文章 · 获赞 11 · 访问量 1万+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章