在這之前,先介紹一下負載因子和容量的屬性。大家都知道其實一個 HashMap 的實際容量就 因子*容量,其默認值是 16×0.75=12; 這個很重要,對效率很一定影響!當存入HashMap的對象超過這個容量時,HashMap 就會重新構造存取表。這就是一個大問題,我後面慢慢介紹,反正,如果你已經知道你大概要存放多少個對象,最好設爲該實際容量的能接受的數字。
兩個關鍵的方法,put和get:
先有這樣一個概念,HashMap是聲明瞭 Map,Cloneable, Serializable 接口,和繼承了 AbstractMap 類,裏面的 Iterator 其實主要都是其內部類HashIterator 和其他幾個 iterator 類實現,當然還有一個很重要的繼承了Map.Entry 的 Entry 內部類,由於大家都有源代碼,大家有興趣可以看看這部分,我主要想說明的是 Entry 內部類。它包含了hash,value,key 和next 這四個屬性,很重要。put的源碼如下
public Object put(Object key, Object value) { Object k = maskNull(key); |
這個就是判斷鍵值是否爲空,並不很深奧,其實如果爲空,它會返回一個static Object 作爲鍵值,這就是爲什麼HashMap允許空鍵值的原因。
int hash = hash(k); int i = indexFor(hash, table.length); |
table???不要驚訝,其實HashMap也神不到哪裏去,它就是用 table 來放的。最牛的就是用 hash 能正確的返回索引。其中的hash算法,我跟JDK的作者 Doug 聯繫過,他建議我看看《The art of programing vol3》可恨的是,我之前就一直在找,我都找不到,他這樣一提,我就更加急了,可惜口袋空空啊!!!
不知道大家有沒有留意 put 其實是一個有返回的方法,它會把相同鍵值的 put 覆蓋掉並返回舊的值!如下方法徹底說明了 HashMap 的結構,其實就是一個表加上在相應位置的Entry的鏈表:
for (Entry e = table[i]; e != null; e = e.next) { if (e.hash == hash && eq(k, e.key)) { Object oldvalue = e.value; e.value = value; //把新的值賦予給對應鍵值。 e.recordAccess(this); //空方法,留待實現 return oldvalue; //返回相同鍵值的對應的舊的值。 } } modCount++; //結構性更改的次數 addEntry(hash, k, value, i); //添加新元素,關鍵所在! return null; //沒有相同的鍵值返回 } |
我們把關鍵的方法拿出來分析:
void addEntry(int hash, Object key, Object value, int bucketIndex) { table[bucketIndex] = new Entry(hash, key, value, table[bucketIndex]); |
因爲 hash 的算法有可能令不同的鍵值有相同的hash碼並有相同的table索引,如:key=“33”和key=Object g的hash都是-8901334,那它經過indexfor之後的索引一定都爲i,這樣在new的時候這個Entry的next就會指向這個原本的table[i],再有下一個也如此,形成一個鏈表,和put的循環對定e.next獲得舊的值。到這裏,HashMap的結構,大家也十分明白了吧?
if (size++ >= threshold) //這個threshold就是能實際容納的量 resize(2 * table.length); //超出這個容量就會將Object table重構 |
所謂的重構也不神,就是建一個兩倍大的table(我在別的論壇上看到有人說是兩倍加1,把我騙了),然後再一個個indexfor進去!注意!!這就是效率!!如果你能讓你的HashMap不需要重構那麼多次,效率會大大提高!
說到這裏也差不多了,get比put簡單得多,大家,瞭解put,get也差不了多少了。對於collections我是認爲,它是適合廣泛的,當不完全適合特有的,如果大家的程序需要特殊的用途,自己寫吧,其實很簡單。(作者是這樣跟我說的,他還建議我用LinkedHashMap,我看了源碼以後發現,LinkHashMap其實就是繼承HashMap的,然後override相應的方法,有興趣的同人,自己looklook)建個 Object table,寫相應的算法,就ok啦。
舉個例子吧,像 Vector,list 啊什麼的其實都很簡單,最多就多了的同步的聲明,其實如果要實現像Vector那種,插入,刪除不多的,可以用一個Object table來實現,按索引存取,添加等。
如果插入,刪除比較多的,可以建兩個Object table,然後每個元素用含有next結構的,一個table存,如果要插入到i,但是i已經有元素,用next連起來,然後size++,並在另一個table記錄其位置。