面試中經常被問到的list如何去重,用來考察你對list數據結構,以及相關方法的掌握,體現你的java基礎學的是否牢固。
我們大家都知道,set集合的特點就是沒有重複的元素。如果集合中的數據類型是基本數據類型,可以直接將list集合轉換成set,就會自動去除重複的元素,這個就相對比較簡單。
如下示例:
public class Test {
public static void main(String[] args) {
List list = new ArrayList();
list.add(11);
list.add(12);
list.add(13);
list.add(14);
list.add(15);
list.add(11);
System.out.println(list);
Set set = new HashSet();
List newList = new ArrayList();
set.addAll(list);
newList.addAll(set);
System.out.println(newList);
}
}
輸出結果爲:
自己去試
我們可以看到去重成功了。
在面試中被問到list去重問題,大部分回答都會是list和set互轉,利用set自動去除重複屬性的方法去重,但是這樣的回答並不會得分。
當list集合中存儲的類型是對象類型的時候,我們就不能簡單的只把list集合轉換成set集合。
我們定義一個對象類:
public class People {
private String name;
private String phoneNumber;
public String getName() {
return name;
}
public void setName(String name) {
this.name = name;
}
public String getPhoneNumber() {
return phoneNumber;
}
public void setPhoneNumber(String phoneNumber) {
this.phoneNumber = phoneNumber;
}
public People(String name, String phoneNumber) {
super();
this.name = name;
this.phoneNumber = phoneNumber;
}
@Override
public String toString() {
return "People{" +
"name='" + name + '\'' +
", phoneNumber='" + phoneNumber + '\'' +
'}';
}
}
我們使用上面的set去重的方法去重:
public static void main(String[] args) {
List<People> listPeople = new ArrayList<People>();
listPeople.add(new People("張三", "11111"));
listPeople.add(new People("張三", "22222"));
listPeople.add(new People("李四", "33333"));
listPeople.add(new People("張三", "22222"));
Set<People> setData = new HashSet<People>();
setData.addAll(listPeople);
System.out.println("list:" + listPeople.toString());
System.out.println("set:" + setData.toString());
}
運行後輸出的結果爲:自己去試
我們可以看到第二個張三和最後一個張三,信息都一樣,卻沒有被去重。
當list集合中存儲的是對象時,我們需要在對象的實體類中去重寫equals()方法和hashCode()方法,如下:
public class People {
private String name;
private String phoneNumber;
public String getName() {
return name;
}
public void setName(String name) {
this.name = name;
}
public String getPhoneNumber() {
return phoneNumber;
}
public void setPhoneNumber(String phoneNumber) {
this.phoneNumber = phoneNumber;
}
public People(String name, String phoneNumber) {
super();
this.name = name;
this.phoneNumber = phoneNumber;
}
@Override
public String toString() {
return "People{" +
"name='" + name + '\'' +
", phoneNumber='" + phoneNumber + '\'' +
'}';
}
@Override
public boolean equals(Object arg0) {
// TODO Auto-generated method stub
People p = (People) arg0;
return name.equals(p.name) && phoneNumber.equals(p.phoneNumber);
}
@Override
public int hashCode() {
// TODO Auto-generated method stub
String str = name + phoneNumber;
return str.hashCode();
}
}
此時運行上面的test方法,去重就成功了。
最後,我們拿出String中的equals()方法和hashCode()方法源碼來加深認識:
equals()
public boolean equals(Object anObject) {
if (this == anObject) {
return true;
}
if (anObject instanceof String) {
String anotherString = (String)anObject;
int n = count;
if (n == anotherString.count) {
char v1[] = value;
char v2[] = anotherString.value;
int i = offset;
int j = anotherString.offset;
while (n-- != 0) {
if (v1[i++] != v2[j++])
return false;
}
return true;
}
}
return false;
}
比較兩個對象時,首先先去判斷兩個對象是否具有相同的地址,如果是同一個對象的引用,則直接放回true;如果地址不一樣,則證明不是引用同一個對象,接下來就是挨個去比較兩個字符串對象的內容是否一致,完全相等返回true,否則false。
hashCode()
public int hashCode() {
int h = hash;
if (h == 0 && count > 0) {
int off = offset;
char val[] = value;
int len = count;
for (int i = 0; i < len; i++) {
h = 31*h + val[off++];
}
hash = h;
}
return h;
}
hashCode()官方定義:
hashcode方法返回該對象的哈希碼值。支持該方法是爲哈希表提供一些優點,例如,java.util.Hashtable 提供的哈希表。
hashCode 的常規協定是:
在 Java 應用程序執行期間,在同一對象上多次調用 hashCode 方法時,必須一致地返回相同的整數,前提是對象上 equals 比較中所用的信息沒有被修改。從某一應用程序的一次執行到同一應用程序的另一次執行,該整數無需保持一致。
如果根據 equals(Object) 方法,兩個對象是相等的,那麼在兩個對象中的每個對象上調用 hashCode 方法都必須生成相同的整數結果。
以下情況不是必需的:如果根據 equals(java.lang.Object) 方法,兩個對象不相等,那麼在兩個對象中的任一對象上調用 hashCode 方法必定會生成不同的整數結果。但是,程序員應該知道,爲不相等的對象生成不同整數結果可以提高哈希表的性能。
實際上,由 Object 類定義的 hashCode 方法確實會針對不同的對象返回不同的整數。(這一般是通過將該對象的內部地址轉換成一個整數來實現的,但是 JavaTM 編程語言不需要這種實現技巧。)
當equals方法被重寫時,通常有必要重寫 hashCode 方法,以維護 hashCode 方法的常規協定,該協定聲明相等對象必須具有相等的哈希碼。
當然,List去重的方法很多,可以用for循環或者使用java8新特性stream等等,