目錄
HsahMap
JDK環境:1.8
HsahMap實現類 繼承了 AbstractMap抽象類,並實現了Map,Cloneable,Serializable 接口 表示可以被 克隆,序列化
public class HashMap<K,V> extends AbstractMap<K,V> implements Map<K,V>, Cloneable, Serializable{
// 內容
}
存儲的內容: key-value 鍵值對
數據結構:數組+鏈表(單向)+ 1.8後新增紅黑樹(當一個數組裏,鏈表長度>=(閾值-默認8)-1 的時候 會將鏈表轉化成紅黑樹(平衡))
重要參數:
0、初始容量(默認):static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; //容量爲16
0-1、最大容量:static final int MAXIMUM_CAPACITY = 1 << 30; //初始化最大容量:1<<30
1、負載因子(默認):static final float DEFAULT_LOAD_FACTOR = 0.75f; //0.75爲最優
1-1、負載因素:final float loadFactor; // 默認爲 DEFAULT_LOAD_FACTOR 可修改調整
2、閾值(默認):static final int TREEIFY_THRESHOLD = 8; // 鏈表中長度>=8-1 的時候會轉爲紅黑樹
3、成員屬性:transient Node<K, V>[] table; // 數組的長度總是 長度總是2的冪(自動調整)。
static class Node<K,V> implements Map.Entry<K,V> {
final int hash;
final K key;
V value;
Node<K,V> next;
}
4、臨界值(容量):int threshold; // 負載因子*容量
關鍵方法 構造,put-resize,get,remove
構造
/* 無參數 默認長度16,負載因子0.75 */
public HashMap() {
this.loadFactor = DEFAULT_LOAD_FACTOR; // all other fields defaulted
}
/* 一個參數 還是調用2個帶參構造(傳入的容量,加載因子取默認值)*/
public HashMap(int initialCapacity) {
this(initialCapacity, DEFAULT_LOAD_FACTOR);
}
/* 兩個參數 */
public HashMap(int initialCapacity, float loadFactor) {
if (initialCapacity < 0) // 長度必須>=0
throw new IllegalArgumentException("Illegal initial capacity: " +
initialCapacity);
if (initialCapacity > MAXIMUM_CAPACITY)//如果傳入的容量 大於最大容量 1<<30的話 ,則將傳入的容量調整爲最大容量
initialCapacity = MAXIMUM_CAPACITY;
if (loadFactor <= 0 || Float.isNaN(loadFactor)) // 加載因子必須>0
throw new IllegalArgumentException("Illegal load factor: " +
loadFactor);
this.loadFactor = loadFactor;
this.threshold = tableSizeFor(initialCapacity); // 負載容量
}
/* 參數爲Map */
public HashMap(Map<? extends K, ? extends V> m) {
this.loadFactor = DEFAULT_LOAD_FACTOR;
putMapEntries(m, false);
}
put()-resize()
put() 返回值是value
public V put(K key, V value) {
return putVal(hash(key), key, value, false, true);
}
然後進入 putVal()看看
// 第三個參數 onlyIfAbsent 如果是 true,那麼只有在不存在該 key 時纔會進行 put 操作
// 第四個參數 evict 我們這裏不關心
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
Node<K,V>[] tab; Node<K,V> p; int n, i;
// 第一次 put 值的時候,會觸發下面的 resize(),類似 java7 的第一次 put 也要初始化數組長度
// 第一次 resize 和後續的擴容有些不一樣,因爲這次是數組從 null 初始化到默認的 16 或自定義的初始容量
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
// 找到具體的數組下標,如果此位置沒有值,那麼直接初始化一下 Node 並放置在這個位置就可以了
if ((p = tab[i = (n - 1) & hash]) == null)
tab[i] = newNode(hash, key, value, null);
else {// 數組該位置有數據
Node<K,V> e; K k;
// 首先,判斷該位置的第一個數據和我們要插入的數據,key 是不是"相等",如果是,取出這個節點
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
e = p;
// 如果該節點是代表紅黑樹的節點,調用紅黑樹的插值方法。。。。。。具體 自行看源碼
else if (p instanceof TreeNode)
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
else {
// 到這裏,說明數組該位置上是一個鏈表
for (int binCount = 0; ; ++binCount) {
// 插入到鏈表的最後面(Java7 是插入到鏈表的最前面)
if ((e = p.next) == null) {
p.next = newNode(hash, key, value, null);
// TREEIFY_THRESHOLD 爲 8,所以,如果新插入的值是鏈表中的第 9 個
// 會觸發下面的 treeifyBin,也就是將鏈表轉換爲紅黑樹
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
treeifyBin(tab, hash);
break;
}
// 如果在該鏈表中找到了"相等"的 key(== 或 equals)
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
// 此時 break,那麼 e 爲鏈表中[與要插入的新值的 key "相等"]的 node
break;
p = e;
}
}
// e!=null 說明存在舊值的key與要插入的key"相等"
// 對於我們分析的put操作,下面這個 if 其實就是進行 "值覆蓋",然後返回舊值
if (e != null) {
V oldValue = e.value;
if (!onlyIfAbsent || oldValue == null)
e.value = value;
afterNodeAccess(e);
return oldValue;
}
}
++modCount;
// 如果 HashMap 由於新插入這個值導致 size 已經超過了閾值,需要進行擴容
if (++size > threshold)
resize();
afterNodeInsertion(evict);
return null;
}
resize() 擴容後容量爲原來的 2 倍
1.7 擴容後 會重新計算hash值,1.8擴容後 原有的元素不會計算,相當於元素位置不會移動,新增的元素插入在尾部
final Node<K,V>[] resize() {
Node<K,V>[] oldTab = table;
int oldCap = (oldTab == null) ? 0 : oldTab.length; //老容量
int oldThr = threshold; //老閾值
int newCap, newThr = 0;
if (oldCap > 0) { // 對應數組擴容
if (oldCap >= MAXIMUM_CAPACITY) { //如果老容量大於最大的容量的話,則設置 最大容量爲Integer最大數值(之後不再擴容)
threshold = Integer.MAX_VALUE;
return oldTab;
}
// 將數組大小擴大一倍
else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
oldCap >= DEFAULT_INITIAL_CAPACITY)
// 將閾值擴大一倍
newThr = oldThr << 1; // double threshold
}
else if (oldThr > 0) // 對應使用 new HashMap(int initialCapacity) 初始化後,第一次 put 的時候
newCap = oldThr;
else {// 對應使用 new HashMap() 初始化後,第一次 put 的時候
newCap = DEFAULT_INITIAL_CAPACITY;
newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
}
if (newThr == 0) {
float ft = (float)newCap * loadFactor;
newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
(int)ft : Integer.MAX_VALUE);
}
threshold = newThr;
// 用新的數組大小初始化新的數組
Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
table = newTab; // 如果是初始化數組,到這裏就結束了,返回 newTab 即可
if (oldTab != null) {
// 開始遍歷原數組,進行數據遷移。
for (int j = 0; j < oldCap; ++j) {
Node<K,V> e;
if ((e = oldTab[j]) != null) {
oldTab[j] = null;
// 如果該數組位置上只有單個元素,那就簡單了,簡單遷移這個元素就可以了
if (e.next == null)
newTab[e.hash & (newCap - 1)] = e;
// 如果是紅黑樹,具體我們就不展開了
else if (e instanceof TreeNode)
((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
else {
// 這塊是處理鏈表的情況,
// 需要將此鏈表拆成兩個鏈表,放到新的數組中,並且保留原來的先後順序
// loHead、loTail 對應一條鏈表,hiHead、hiTail 對應另一條鏈表,代碼還是比較簡單的
Node<K,V> loHead = null, loTail = null;
Node<K,V> hiHead = null, hiTail = null;
Node<K,V> next;
do {
next = e.next;
if ((e.hash & oldCap) == 0) {
if (loTail == null)
loHead = e;
else
loTail.next = e;
loTail = e;
}
else {
if (hiTail == null)
hiHead = e;
else
hiTail.next = e;
hiTail = e;
}
} while ((e = next) != null);
if (loTail != null) {
loTail.next = null;
// 第一條鏈表
newTab[j] = loHead;
}
if (hiTail != null) {
hiTail.next = null;
// 第二條鏈表的新的位置是 j + oldCap,這個很好理解
newTab[j + oldCap] = hiHead;
}
}
}
}
}
return newTab;
}
get()
- 計算 key 的 hash 值,根據 hash 值找到對應數組下標: hash & (length-1)
- 判斷數組該位置處的首位元素是否剛好就是我們要找的,
- 判斷該元素類型是否是 TreeNode,
- 是,用紅黑樹的方法取數據,如果不是,遍歷鏈表,直到找到相等(==或equals)的 key。
final Node<K,V> getNode(int hash, Object key) {
Node<K,V>[] tab; Node<K,V> first, e; int n; K k;
if ((tab = table) != null && (n = tab.length) > 0 &&
(first = tab[(n - 1) & hash]) != null) {
// 判斷第一個節點是不是就是需要的
if (first.hash == hash && // always check first node
((k = first.key) == key || (key != null && key.equals(k))))
return first;
if ((e = first.next) != null) {
// 判斷是否是紅黑樹
if (first instanceof TreeNode)
return ((TreeNode<K,V>)first).getTreeNode(hash, key);
// 鏈表遍歷
do {
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
return e;
} while ((e = e.next) != null);
}
}
return null;
}
remove()
方法類似於get() ,唯一多了個 根據匹配到額值 再做刪除
final Node<K,V> removeNode(int hash, Object key, Object value,
boolean matchValue, boolean movable) {
Node<K,V>[] tab; Node<K,V> p; int n, index;
if ((tab = table) != null && (n = tab.length) > 0 &&
(p = tab[index = (n - 1) & hash]) != null) {
Node<K,V> node = null, e; K k; V v;
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
node = p;
else if ((e = p.next) != null) {
if (p instanceof TreeNode)
node = ((TreeNode<K,V>)p).getTreeNode(hash, key);
else {
do {
if (e.hash == hash &&
((k = e.key) == key ||
(key != null && key.equals(k)))) {
node = e;
break;
}
p = e;
} while ((e = e.next) != null);
}
}
// 上面代碼與get()基本一樣
// 根據查詢到的值 刪除
if (node != null && (!matchValue || (v = node.value) == value ||
(value != null && value.equals(v)))) {
if (node instanceof TreeNode) //如果是樹結構 ,那麼以紅黑樹刪除
((TreeNode<K,V>)node).removeTreeNode(this, tab, movable);
else if (node == p) // 該node節點是首節點
tab[index] = node.next; //刪除 在數組內替換
else
p.next = node.next; //node不是首節點 p是node的父節點,只需要把p的下一個節點指向到node的下一個節點即可把node從鏈表中刪除了
++modCount;
--size;
afterNodeRemoval(node);
return node;
}
}
return null;
}
總 結
HashMap 裏面的東西 的確很多很多 ,這只是簡單但的 讀了一遍 腦子疼
技術總是向前看的 jdk1.7的HashMap 瞭解就可以了 ,例如 1.8的內部類叫是Node,1.7則是叫Entry 內容都一樣
- 1.7採用數組+單鏈表,1.8在單鏈表超過一定長度後改成紅黑樹存儲
- 1.7擴容時需要重新計算哈希值和索引位置(resize()裏面調用transfer()),1.8並不重新計算哈希值,巧妙地採用和擴容後容量進行&操作來計算新的索引位置。
- 1.7插入元素到單鏈表中採用頭插入法,1.8採用的是尾插入法(在併發擴容的狀態下,不會造成 鏈表死循環)。