HashSet源碼分析

原創

程序员爱瑜珈

2020-02-24 23:58

轉自;

HashSet 是一個沒有重複元素的集合。
它是由HashMap實現的，不保證元素的順序，而且HashSet允許使用 null 元素。
HashSet是非同步的。如果多個線程同時訪問一個哈希 set，而其中至少一個線程修改了該 set，那麼它必須保持外部同步。這通常是通過對自然封裝該 set 的對象執行同步操作來完成的。如果不存在這樣的對象，則應該使用 Collections.synchronizedSet 方法來“包裝” set。最好在創建時完成這一操作，以防止對該 set 進行意外的不同步訪問：

Set s = Collections.synchronizedSet(new HashSet(...));

HashSet通過iterator()返回的迭代器是fail-fast的。

public class HashSet<E>
extends AbstractSet<E>
implements Set<E>, Cloneable, java.io.Serializable
{
static final long serialVersionUID = -5024744406713321676L;
// HashSet是通過map(HashMap對象)保存內容的
private transient HashMap<E,Object> map;
// PRESENT是向map中插入key-value對應的value
// 因爲HashSet中只需要用到key，而HashMap是key-value鍵值對；
// 所以，向map中添加鍵值對時，鍵值對的值固定是PRESENT
private static final Object PRESENT = new Object();
// 默認構造函數
public HashSet() {
// 調用HashMap的默認構造函數，創建map
map = new HashMap<E,Object>();
}
// 帶集合的構造函數
public HashSet(Collection<? extends E> c) {
// 創建map。
// 爲什麼要調用Math.max((int) (c.size()/.75f) + 1, 16)，從 (c.size()/.75f) + 1 和 16 中選擇一個比較大的樹呢？
// 首先，說明(c.size()/.75f) + 1
// 因爲從HashMap的效率(時間成本和空間成本)考慮，HashMap的加載因子是0.75。
// 當HashMap的“閾值”(閾值=HashMap總的大小*加載因子) < “HashMap實際大小”時，
// 就需要將HashMap的容量翻倍。
// 所以，(c.size()/.75f) + 1 計算出來的正好是總的空間大小。
// 接下來，說明爲什麼是 16 。
// HashMap的總的大小，必須是2的指數倍。若創建HashMap時，指定的大小不是2的指數倍；
// HashMap的構造函數中也會重新計算，找出比“指定大小”大的最小的2的指數倍的數。
// 所以，這裏指定爲16是從性能考慮。避免重複計算。
map = new HashMap<E,Object>(Math.max((int) (c.size()/.75f) + 1, 16));
// 將集合(c)中的全部元素添加到HashSet中
addAll(c);
}
// 指定HashSet初始容量和加載因子的構造函數
public HashSet(int initialCapacity, float loadFactor) {
map = new HashMap<E,Object>(initialCapacity, loadFactor);
}
// 指定HashSet初始容量的構造函數
public HashSet(int initialCapacity) {
map = new HashMap<E,Object>(initialCapacity);
}
HashSet(int initialCapacity, float loadFactor, boolean dummy) {
map = new LinkedHashMap<E,Object>(initialCapacity, loadFactor);
}
// 返回HashSet的迭代器
public Iterator<E> iterator() {
// 實際上返回的是HashMap的“key集合的迭代器”
return map.keySet().iterator();
}
public int size() {
return map.size();
}
public boolean isEmpty() {
return map.isEmpty();
}
public boolean contains(Object o) {
return map.containsKey(o);
}
// 將元素(e)添加到HashSet中
public boolean add(E e) {
return map.put(e, PRESENT)==null;
}
// 刪除HashSet中的元素(o)
public boolean remove(Object o) {
return map.remove(o)==PRESENT;
}
public void clear() {
map.clear();
}
// 克隆一個HashSet，並返回Object對象
public Object clone() {
try {
HashSet<E> newSet = (HashSet<E>) super.clone();
newSet.map = (HashMap<E, Object>) map.clone();
return newSet;
} catch (CloneNotSupportedException e) {
throw new InternalError();
}
}
// java.io.Serializable的寫入函數
// 將HashSet的“總的容量，加載因子，實際容量，所有的元素”都寫入到輸出流中
private void writeObject(java.io.ObjectOutputStream s)
throws java.io.IOException {
// Write out any hidden serialization magic
s.defaultWriteObject();
// Write out HashMap capacity and load factor
s.writeInt(map.capacity());
s.writeFloat(map.loadFactor());
// Write out size
s.writeInt(map.size());
// Write out all elements in the proper order.
for (Iterator i=map.keySet().iterator(); i.hasNext(); )
s.writeObject(i.next());
}
// java.io.Serializable的讀取函數
// 將HashSet的“總的容量，加載因子，實際容量，所有的元素”依次讀出
private void readObject(java.io.ObjectInputStream s)
throws java.io.IOException, ClassNotFoundException {
// Read in any hidden serialization magic
s.defaultReadObject();
// Read in HashMap capacity and load factor and create backing HashMap
int capacity = s.readInt();
float loadFactor = s.readFloat();
map = (((HashSet)this) instanceof LinkedHashSet ?
new LinkedHashMap<E,Object>(capacity, loadFactor) :
new HashMap<E,Object>(capacity, loadFactor));
// Read in size
int size = s.readInt();
// Read in all elements in the proper order.
for (int i=0; i<size; i++) {
E e = (E) s.readObject();
map.put(e, PRESENT);
}
}
}

說明：

HashSet的代碼實際上非常簡單，通過上面的註釋應該很能夠看懂。它是通過HashMap實現的，若對HashSet的理解有困難，建議先學習以下HashMap；學完HashMap之後，在學習HashSet就非常容易了。

通過Iterator遍歷HashSet

第一步：根據iterator()獲取HashSet的迭代器。
第二步：遍歷迭代器獲取各個元素。

// 假設set是HashSet對象
for(Iterator iterator = set.iterator();
iterator.hasNext(); ) {
iterator.next();
}

3.2 通過for-each遍歷HashSet

第一步：根據toArray()獲取HashSet的元素集合對應的數組。
第二步：遍歷數組，獲取各個元素。

// 假設set是HashSet對象，並且set中元素是String類型
String[] arr = (String[])set.toArray(new String[0]);
for (String str:arr)
System.out.printf("for each : %s\n", str);

HashSet的遍歷測試程序如下：

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

源碼-JDK源碼IDEA搭建

1.IDEA創建簡單的JAVA程序 2. 將JDK源碼複製到項目中首先找到JDK安裝路徑將該壓縮包解壓，放到項目中。補充：windows下jdk源碼編譯缺少UNIXToolkit和FontConfigManag

2020-07-02 23:13:01

Java集合大整理

此處爲整理，更詳細的源碼分析請查閱 JDK源碼分析其他文章。爲了適應csdn的窗口大小，表格嚴重變形了。。。 null 值重複底層實現擴容增、刪、迭代包含備註 HashSet 允許，j

2020-06-27 18:51:12

JDK源碼分析-BlockingQueue

概述BlockingQueue 意爲“阻塞隊列”，它在 JDK 中是一個接口。所謂阻塞，簡單來說就是當某些條件不滿足時，讓線程處於等待狀態。例如經典的“生產者-消費者”模型，當存放產品的容器滿的時候，生產者處於等待狀態；而當容器爲空的時

2020-06-20 09:40:15

JDK源碼分析-ScheduledExecutorService

概述接口的繼承結構如下：下面分析這幾個接口的定義。Executor從名字來看，Executor 可譯爲“執行器”，它的作用就是執行任務。該接口只有一個 execute 方法：public interface Executor {

2020-06-20 09:40:15

JDK源碼分析-ScheduledThreadPoolExecutor

概述ScheduledThreadPoolExecutor 也是一個線程池類，是線程池類 ThreadPoolExecutor 的子類。除了 ThreadPoolExecutor 相關的方法之外，它還增加了執行定時任務和週期性任務的方法

2020-06-20 08:36:32

Java學習(28) -- 源碼閱讀（HashSet&LinkedHashSet&TreeSet）

一.HashSet 特點： 1.HashSet中不能有相同的元素，可以有一個Null元素，存入的元素是無序的。 2.HashSet如何保證唯一性？ 1).HashSet底層數據結構是哈希表，哈希表就是存儲唯一系列的表，而哈希值是由對象的h

狂奔岻蜗牛

2020-07-06 06:35:31

集合（二）：Set : HashSet; LinkedHashSet; TreeSet

文章目錄集合（二）Set一、HashSet1、概述及特點2、HashSet元素唯一性解析及代碼優化代碼優化二、LinkedHashSet三、TreeSet1、概述及特點二叉樹存儲數據保證元素唯一性且排序原理圖解2、自然排序演示3、

2020-07-01 23:19:28

HashSet源碼粗略解析

複習下java的常用集合框架，java常用的集合大致有兩種類型，一種實現了Collection接口表示普通的集合，一種實現了Map接口表示嚴格的鍵值對，其中Collection又分爲List接口類型和Set接口類型，其中List接口類型允

不断完善的少年

2020-06-29 20:16:18

【集合類】源碼解析之 HashSet類、LinkedHashSet類

大綱HashSet類聲明重點字段構造函數Set 方法實現序列化Object 方法LinkedHashSet類聲明構造器HashSet 方法 HashSet 哈希表結構（其實用的是Map），線程不安全，不保證順序，自動去重（必須覆蓋

拧螺丝的工具人

2020-06-29 16:36:49

Java的String Arraylist及Hash

String 本質 String底層本質是char[]，例如String str=“abc”, 相當於 char[] arr = {‘a’,‘b’,‘c’}; 創建對象兩種形式： String str =“abc”, 和 Stri

2020-06-29 08:34:51

HashSet有序無序問題-深入分析（JDK8）

HashSet 是否無序 (一) 問題起因：《Core Java Volume I—Fundamentals》中對HashSet的描述是這樣的： HashSet：一種沒有重複元素的無序集合解釋：我們一般說HashSet是無序的，它

2020-06-24 01:44:49

3. Longest Substring Without Repeating Characters（HashSet + 雙指針）

Longest Substring Without Repeating Characters 【題目】 Given a string, find the length of the longest substring without re

2020-06-23 08:12:25

HashSet簡單實現

package com.yys.student; import java.util.HashMap; /** * Created by yys on 2017/5/11. */ public class SxtHashSet {

2020-06-20 20:35:44

Java中HashSet的學習

HashSet是非同步的，允許使用null元素。如果多個線程同時訪問一個Hashset，而其中至少一個線程修改了該set，那麼它必須保持外部同步。這通常是通過對自然封裝該set的對象執行同步操作來完成的。如果不存在這樣的對象，則應該使用

2020-06-20 12:27:00

JAVA源碼分析之HashMap 1.7

一、簡介類定義： public class HashMap<K,V> extends AbstractMap<K,V> implements Map<K,V>, Cloneable, Serial

技术路上的苦行僧

2020-06-26 00:07:12

24小時熱門文章

最新文章

最新評論文章