JAVA集合框架的特點及實現原理簡介

1.集合框架總體架構

collection
圖片描述

  • 集合大致分爲Set、List、Queue、Map四種體系,其中List,Set,Queue繼承自Collection接口,Map爲獨立接口
  • Set的實現類有:HashSet,LinkedHashSet,TreeSet...
  • List下有ArrayList,Vector,LinkedList...
  • Map下有Hashtable,LinkedHashMap,HashMap,TreeMap...
list 有序,可重複 ArrayList:數組,查詢快,增刪慢。線程不安全. Vector:數組,查詢快,增刪慢。線程安全. LinkedList:鏈表,查詢慢,增刪快。線程不安全
set 無序(不嚴謹),唯一 HashSet:無序,唯一,哈希表實現,通過hashCode()和equals()保證唯一。 LinkedHashSet:繼承自hashset,底層是鏈表和哈希表。(FIFO插入有序,唯一) TreeSet:底層是紅黑樹。(唯一,有序)
map KV形式的鍵值對 TreeMap:有序,不是線程安全的。 HashMap:無序,不是線程安全的,HashMap允許null值(key和value都允許) HashTable:無序,線程安全的,不允許null值,

2. Set

Set 接口繼承Collection,用於存儲不含重複元素的集合。
Set是簡化版的Map。Set把元素作爲key存儲在自己的Map實例中(Entry),value則是一個空的Object。

HashSet

底層是哈希表,當插入元素時,HashSet會調用該對象的hashCode()方法得到hashCode,然後根據hashCode決定該對象在哈希表中的存儲位置。(這裏有個問題,如果hashcode不是均勻分佈的,而是集中在一個區域,極端情況下,hash表會變成鏈表)
HashSet去重原理:通過equals()方法比較,且其hashCode()方法返回值也相等。 (可以通過覆寫hashCode和equals方法改變其去重規則,進行自定義去重)

TreeSet

TreeSet底層是紅黑樹;加入元素時,必須加入同類型的對象,否則會發生ClassCastException異常,因爲TreeSet會調用集合元素的compareTo()方法來比較元素之間的大小關係(自然排序)。
compareTo()方法的返回值決定了順序:

  • -1 表示放在紅黑樹的左邊,即逆序輸出;
  • 1 表示放在紅黑樹的右邊,即順序輸出;
  • 0 表示元素相同,僅存放第一個元素自然排序(treeset去重的原理);

其次,TreeSet也可以通過比較器排序。

LinkedHashSet

繼承自HashSet,底層是鏈表和哈希表。

  • 由鏈表保證元素有序(插入順序)。
  • 由哈希表保證元素唯一

TreeSet, LinkedHashSet and HashSet 的區別

  • 都實現Set接口,不包含重複元素
  • 都不是線程安全的,如果要使用線程安全可以Collections.synchronizedSet()
  • TreeSet的主要功能用於排序
  • LinkedHashSet的主要功能用於保證FIFO,即有序的集合(先進先出)
  • HashSet只是通用的存儲數據的集合
  • 插入速度: HashSet>LinkHashSet>TreeSet(內部實現排序)
  • HashSet不保證順序,LinkHashSet保證FIFO(先進先出),TreeSet安裝內部實現排序,也可以自定義排序規則
  • HashSet和LinkHashSet允許null, (只能有一個null) 但TreeSet中插入null時會報NullPointerException

3. List

list的實現類有ArrayList,Vector,LinkedList...其中ArrayList和Vector很相似,均是以數組作爲底層實現,不同之處在於Vector是線程安全的。

ArrayList

ArrayList基於數組實現,不是線程安全的,內部維護了一個可變長的對象數組,集合內所有元素存儲於這個數組中,並實現該數組長度的動態伸縮。
ArrayList使用數組拷貝來實現指定位置的插入和刪除。

LinkedList

LinkedList內部以鏈表的形式來保存元素,因此隨機訪問集合時性能較差,但插入,刪除元素時性能較好。
LinkedList不僅實現了List接口,還實現了Deque接口,可以被當成雙端隊列來使用,即可被當成“棧”來使用,也可以當成隊列使用。

ArrayList 和LinkedList比較

  • 兩者都是List接口的實現類,都不是線程安全。List的另外一個實現類vector是線程安全的。
  • ArrayList是基於動態數組的數據結構,而LinkedList是基於鏈表的數據結構。
  • 對於隨機訪問get和set(查詢操作),ArrayList要優於LinkedList.(LinkedList要移動指針)
  • 對於增刪操作(add和remove),LinkedList優於ArrayList。

4. Map

Map集合用於保存映射關係的數據,Map集合中保存了兩組值,一組是 key, 一組是 value。
Map的key不能重複。
key和value之間存在單向一對一的關係, 通過key,能找到唯一確定的value。
Map將key和value封裝至一個叫做Entry的對象中,Map中存儲的元素實際是Entry。只有在keySet()和values()方法被調用時,Map纔會將keySet和values對象實例化。

HashMap

key 是通過hash表來存儲,value是通過鏈表來存儲。
HashMap將Entry對象存儲在一個數組中,並通過哈希表來實現對Entry的快速訪問。(通過key的哈希值計算Entry在數組中的index,以此訪問value) (拉鍊法,解決hash碰撞)

HashTable

幾乎和HashMap一樣,都是通過數組存儲Entry,以key的哈希值計算Entry在數組中的index,用拉鍊法解決哈希衝突。二者最大的不同在於,Hashtable是線程安全的,其提供的方法幾乎都是同步的。

ConcurrentHashMap

ConcurrentHashMap是HashMap的線程安全版,提供比Hashtable更高效的併發性能。

Hashtable 在進行讀寫操作時會鎖住整個Entry數組,這就導致數據越多性能越差。
ConcurrentHashMap使用分離鎖的思路解決併發性能,其將 Entry數組拆分至16個Segment中,以哈希算法決定Entry應該存儲在哪個Segment。這樣就可以實現在寫操作時只對一個Segment 加鎖,大幅提升了併發寫的性能。
在進行讀操作時,ConcurrentHashMap在絕大部分情況下都不需要加鎖,其Entry中的value是volatile的,這保證了value被修改時的線程可見性,無需加鎖便能實現線程安全的讀操作。
ConcurrentHashMap它不能保證讀操作的絕對一致性。ConcurrentHashMap保證讀操作能獲取到已存在Entry的value的最新值,同時也能保證讀操作可獲取到已完成的寫操作的內容,但如果寫操作是在創建一個新的Entry,那麼在寫操作沒有完成時,讀操作是有可能獲取不到這個Entry的。

HashMap和HashTable,ConcurrentHashMap的區別

  • 三者在數據存儲層面的機制原理基本一致
  • HashMap不是線程安全的
  • Hashtable是線程安全的,能保證絕對的數據一致性
  • ConcurrentHashMap 也是線程安全的,使用分離鎖和volatile等方法極大地提升了讀寫性能,同時也能保證在絕大部分情況下的數據一致性。但其不能保證絕對的數據一致性,在一個線程向Map中加入Entry的操作沒有完全完成之前,其他線程有可能讀不到新加入的Entry
  • HashTable不允許使用null作爲key和value,如果放入null將引發NullPointerException異常,但HashMap可以使用null作爲key或value(只能有一個key爲null,可以多個value爲null)。
  • 如果在遍歷的同時,修改HashTable的大小,容易應發異常。可以用代替,ConcurrentHashMap是HashMap的線程安全版,提供比Hashtable更高效的併發性能

參考資料:
JAVA集合框架中的常用集合及其特點、適用場景、實現原理簡介
java集合框架總結以及源碼分析

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章