HashSet如何保證元素的唯一性-跟蹤源碼解析

自己的理解:HashSet的底層數據結構用的是哈希表(HashMap),當往HashSet上添加一條元素時。

  public boolean add(E e) {
        return map.put(e, PRESENT)==null;//PRESENT是一個一樣的Object對象,調用HashMap的put方法
    }

點進put方法如下:

 public V put(K key, V value) {
        if (table == EMPTY_TABLE) {
            inflateTable(threshold);
        }
        if (key == null)
            return putForNullKey(value);
        int hash = hash(key);
        int i = indexFor(hash, table.length);
        for (Entry<K,V> e = table[i]; e != null; e = e.next) {
            Object k;
            if (e.hash == hash && ((k = e.key) == key ||key.equals(k))) {
                V oldValue = e.value;
                e.value = value;
                e.recordAccess(this);
                return oldValue;
            }
        }
        modCount++;
        addEntry(hash, key, value, i);
        return null;
    }

進入hash(key)方法:

   //利用hashCode()方法返回一個hash值

    final int hash(Object k) {
        int h = hashSeed;
        if (0 != h && k instanceof String) {
            return sun.misc.Hashing.stringHash32((String) k);
        }
        h ^= k.
hashCode();
        h ^= (h >>> 20) ^ (h >>> 12);
        return h ^ (h >>> 7) ^ (h >>> 4);
    }

答案明顯易見:當HashSet添加一條元素時,調用HashMap的put方法先調用hashCode()方法判斷key的hash值是否一樣,再調用對象的equals方法。

總結:

當HashSet中放入了兩個對象後,默認他們的hashCode都是不一樣的,因此不需要調用equals方法就能確定這兩個對象不是同一個,但是如果這兩個對象的值是一樣的,這種判斷結果就不符合要求了,因此需要重寫hashcode方法,將兩個對象的hashcode值設爲相同,這樣就可以進入equals判斷階段,equals方法是繼承自object類的,比較的是對象的地址值,所以判斷的結果也必定不同,這又不符合要求了,因此也需要重寫equals方法。經過改寫以上兩個方法,可以完成兩個對象的比較,只要兩個對象的內容(值)相同,就判斷爲同一個對象,不得重複存儲。哈希表就像一個個桶,每個桶都有一個hashcode,只要元素的hashcode相同,equals如果爲false,那麼這些元素都掛在這個桶裏。

 

另外,判斷是否包含某元素(contains),list和set也是不同的:

ArrayList:判斷包含,以及刪除,都是依據元素的equals方法。

HashSet:判斷包含,以及刪除,都是依據元素的hashCode方法。當hashCode值相同時,在判斷一次equals方法。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章