HashTable,HashMap,LIST,SET,MAP的区别和联系

Collection:List、Set
Map:HashMap、HashTable

如何在它们之间选择


一、Array , Arrays

Java所有“存储及随机访问一连串对象”的做法,array是最有效率的一种。

1、
效率高,但容量固定且无法动态改变。
array还有一个缺点是,无法判断其中实际存有多少元素,length只是告诉我们array的容量。

2、Java中有一个Arrays类,专门用来操作array
      arrays中拥有一组static函数,
equals():比较两个array是否相等。array拥有相同元素个数,且所有对应元素两两相等。
fill():将值填入array中。
sort():用来对array进行排序。
binarySearch():在排好序的array中寻找元素。
System.arraycopy():array的复制。


二、Collection , Map

若撰写程序时不知道究竟需要多少对象,需要在空间不足时自动扩增容量,则需要使用容器类库,array不适用。

1、Collection 和 Map 的区别

容器内每个为之所存储的元素个数不同。
Collection类型者,每个位置只有一个元素。
Map类型者,持有 key-value pair,像个小型数据库。

2、各自旗下的子类关系

Collection
      --List:将以特定次序存储元素。所以取出来的顺序可能和放入顺序不同。
            --ArrayList / LinkedList / Vector
      --Set : 不能含有重复的元素
            --HashSet / TreeSet
Map
      --HashMap
      --HashTable
      --TreeMap

3、其他特征

*    List,Set,Map将持有对象一律视为Object型别。
*    Collection、List、Set、Map都是接口,不能实例化。
     继承自它们的 ArrayList, Vector, HashTable, HashMap是具象class,这些才可被实例化。
*    vector容器确切知道它所持有的对象隶属什么型别。vector不进行边界检查。


三、Collections

Collections是针对集合类的一个帮助类。提供了一系列静态方法实现对各种集合的搜索、排序、线程完全化等操作。
相当于对Array进行类似操作的类——Arrays。
如,Collections.max(Collection coll); 取coll中最大的元素。
      Collections.sort(List list); 对list中元素排序

四、如何选择?

1、容器类和Array的区别、择取
     *    容器类仅能持有对象引用(指向对象的指针),而不是将对象信息copy一份至数列某位置。
     *    一旦将对象置入容器内,便损失了该对象的型别信息。

2、
    *    在各种Lists中,最好的做法是以ArrayList作为缺省选择。当插入、删除频繁时,使用LinkedList();
       Vector总是比ArrayList慢,所以要尽量避免使用。
    *    在各种Sets中,HashSet通常优于HashTree(插入、查找)。只有当需要产生一个经过排序的序列,才用TreeSet。
       HashTree存在的唯一理由:能够维护其内元素的排序状态。
    *    在各种Maps中
       HashMap用于快速查找。
    *    当元素个数固定,用Array,因为Array效率是最高的。

结论:最常用的是ArrayList,HashSet,HashMap,Array。


注意:

1、Collection没有get()方法来取得某个元素。只能通过iterator()遍历元素。
2、Set和Collection拥有一模一样的接口。
3、List,可以通过get()方法来一次取出一个元素。使用数字来选择一堆对象中的一个,get(0)...。(add/get)
4、一般使用ArrayList。用LinkedList构造堆栈stack、队列queue。

5、Map用 put(k,v) / get(k),还可以使用containsKey()/containsValue()来检查其中是否含有某个key/value。
     HashMap会利用对象的hashCode来快速找到key。
    
*    hashing
         哈希码就是将对象的信息经过一些转变形成一个独一无二的int值,这个值存储在一个array中。
         我们都知道所有存储结构中,array查找速度是最快的。所以,可以加速查找。
      
         发生碰撞时,让array指向多个values。即,数组每个位置上又生成一个梿表。

6、Map中元素,可以将key序列、value序列单独抽取出来。
使用keySet()抽取key序列,将map中的所有keys生成一个Set。
使用values()抽取value序列,将map中的所有values生成一个Collection。

为什么一个生成Set,一个生成Collection?那是因为,key总是独一无二的,value允许重复。

---------------------------------------------------------------------------------------
特别介绍1:HashTable VS HashMap
 
HashTable的应用非常广泛,HashMap是新框架中用来代替HashTable的类,也就是说建议使用HashMap,不要使用HashTable。
 
这里简单分析他们的区别。 
1.HashTable的方法是同步的,HashMap未经同步,所以在多线程场合要手动同步HashMap这个区别就像Vector和ArrayList一样。(最主要的区别)

2.HashTable不允许null值(key和value都不可以),HashMap允许null值(key和value都可以,只容许有一个null值的key,可以有多个null值的value)。

3.HashTable有一个contains(Object value),功能和containsValue(Object value)功能一样。

4.HashTable使用Enumeration,HashMap使用Iterator。

以上只是表面的不同,它们的实现也有很大的不同。

5.HashTable中hash数组默认大小是11,增加的方式是 old*2+1。HashMap中hash数组的默认大小是16,而且一定是2的指数。

6.哈希值的使用不同,HashTable直接使用对象的hashCode,代码是这样的:
int hash = key.hashCode();
int index = (hash & 0x7FFFFFFF) % tab.length;
而HashMap重新计算hash值,而且用与代替求模:
int hash = hash(k);
int i = indexFor(hash, table.length);
static int hash(Object x) {
   int h = x.hashCode();

   h += ~(h << 9);
   h ^= (h >>> 14);
   h += (h << 4);
   h ^= (h >>> 10);
   return h;
}
static int indexFor(int h, int length) {
   return h & (length-1);
}
以上只是一些比较突出的区别,当然他们的实现上还是有很多不同的,比如
HashMap对null的操作。
 
特别介绍2:ArrayList VS Vector VS LinkList

VECTOR是每个操作都同步的,如果你觉得集合中的数据安全性要求很高那就用VECTOR

ARRAYLIST并不是线程安全的,除了这点,跟VECTOR没什么差别,都是通过数组的方式来实现一个集合

LINKLIST跟ARRAYLIST的区别是,LINKLIST是用链表的方式实现的集合,所以在LIST的增、删、迭代等几个操作上,与ARRAYLIST速度有所差别。如果一个LIST需要频繁做删除操作的话应该选择LINKLIST,

ArrayList适合随机访问
LinkedList才是适合顺序访问的链 但是其元素的增减比ArrayList高.

特别介绍3:HashSet VS TreeSet

两者区别的形象展示:假设输入值的顺序为:1,4,3,1,用HashSet输出的顺序为:1,4,3(可能);用TreeSet输出的顺序为:1,3,4(如Windows的文件夹,不能重复,且有顺序)。

HashSet

此类实现 Set 接口,由哈希表(实际上是一个 HashMap 实例)支持。它不保证集合的迭代顺序;特别是它不保证该顺序恒久不变。此类允许使用 null 元素。
此类为基本操作提供了稳定性能,这些基本操作包括 add、remove、contains 和 size,假定哈希函数将这些元素正确地分布在桶中。对此集合进行迭代所需的时间与 HashSet 实例的大小(元素的数量)和底层 HashMap 实例(桶的数量)的“容量”的和成比例。因此,如果迭代性能很重要,则不要将初始容量设置得太高(或将加载因子设置得太低)。
注意:HashSet要重写hashCode和equals方法。

我们应该为要存放到散列表的各个对象定义hashCode()和equals();
import java.util.HashSet;
import java.util.Iterator;

public class HashSetTest {
         public static void main(String[] args)
         {
                 HashSet hs=new HashSet();
                
                 hs.add(new Student(1,"zhangsan"));
                 hs.add(new Student(2,"lishi"));
                 hs.add(new Student(3,"wangwu"));
                 hs.add(new Student(1,"zhangsan"));
                
                 Iterator it=hs.iterator();
                 while(it.hasNext())
                 {
                         System.out.println(it.next());
                 }
         }
}
class Student         //HashSet要重写hashCode和equals方法
{
         int num;
         String name;
  

发布了35 篇原创文章 · 获赞 2 · 访问量 9万+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章