數據結構與算法——並查集(不相交集合)

認識並查集

對於並查集(不相交集合),很多人會感到很陌生沒聽過或者不是特別瞭解。實際上並查集是一種挺高效的數據結構。實現簡單,只是所有元素統一遵從一個規律所以讓辦事情的效率高效起來。

對於定意義,百科上這麼定義的:

並查集,在一些有N個元素的集合應用問題中,我們通常是在開始時讓每個元素構成一個單元素的集合,然後按一定順序將屬於同一組的元素所在的集合合併,其間要反覆查找一個元素在哪個集合中。其特點是看似並不複雜,但數據量極大,若用正常的數據結構來描述的話,往往在空間上過大,計算機無法承受;即使在空間上勉強通過,運行的時間複雜度也極高,根本就不可能在比賽規定的運行時間(1~3秒)內計算出試題需要的結果,只能用並查集來描述。

並查集是一種樹型的數據結構,用於處理一些不相交集合(Disjoint Sets)的合併及查詢問題。常常在使用中以森林來表示。

並查集解析

基本思想

  • 初始化,一個森林每個都爲獨立。通常用數組表示,每個值初始爲-1。各自爲根
    在這裏插入圖片描述
  • join(a,b) 操作。a,b兩個集合合併。注意這裏的a,並不是a,b合併,而是a,b的集合合併。這就派生了一些情況:
  • a,b如果是獨立的(沒有和其他合併),那麼直接a指向b(或者b指向a),即data[a]=b;同時爲了表示這個集合有多少個,原本-1的b再次-1.即data[b]=-2.表示以b爲父親的節點有|-2|個。
    在這裏插入圖片描述
    在這裏插入圖片描述
  • a,b如果有集合(可能有父親,可能自己是根),那麼我們當然不能直接操作a,b(因爲a,b可能已經指向別人了.)那麼我們只能操作a,b的祖先。因爲a,b的祖先是沒有指向的(即數據爲負值表示大小)。那麼他們首先一個負值要加到另外一個上面去。另外這個數值要變成指向的那個表示聯繫。
    在這裏插入圖片描述

對於上述你可能會有疑問:

如何查看a,b是否在一個集合?

  • 查看是否在一個集合,只需要查看節點根祖先的結果是否相同即可。因爲只有根的數值是負的,而其他都是正數表示指向的元素。所以只需要一直尋找直到不爲正數進行比較即可

a,b合併,究竟是a的祖先合併在b的祖先上,還是b的祖先合併在a上?

  • 這裏會遇到兩種情況,這個選擇也是非常重要的。你要弄明白一點:樹的高度+1的化那麼整個元素查詢的效率都會降低!

所以我們通常是:小數指向大樹(或者低樹指向高樹),這個使得查詢效率能夠增加!
在這裏插入圖片描述
當然,在高度和數量的選擇上,還需要你自己選擇和考慮。

其他路徑壓縮?

每次查詢,自下向上。當我們調用遞歸的時候,可以順便壓縮路徑,因爲我們查找一個元素其實只需要直到它的祖先,所以當他距離祖先近那麼下次查詢就很快。並且壓縮路徑的代價並不大!
在這裏插入圖片描述

代碼實現

並查集實現起來較爲簡單,直接貼代碼!

package 並查集不想交集合;

import java.util.Scanner;
public class DisjointSet {
	static int tree[]=new int[100000];//假設有500個值
	public DisjointSet() 	{set(this.tree);}
	public DisjointSet(int tree[]) 
	{
		this.tree=tree;
		set(this.tree);
	}
	public void set(int a[])//初始化所有都是-1 有兩個好處,這樣他們指向-1說明是自己,第二,-1代表當前森林有-(-1)個
	{
		int l=a.length;
		for(int i=0;i<l;i++)
		{
			a[i]=-1;
		}
	}
	public int search(int a)//返回頭節點的數值
	{
		if(tree[a]>0)//說明是子節點
		{
			return tree[a]=search(tree[a]);//路徑壓縮
		}
		else
			return a;
	}
	public int value(int a)//返回a所在樹的大小(個數)
	{
		if(tree[a]>0)
		{
			return value(tree[a]);
		}
		else
			return -tree[a];
	}
	public void union(int a,int b)//表示 a,b所在的樹合併
	{
		int a1=search(a);//a根
		int b1=search(b);//b根
		if(a1==b1) {System.out.println(a+"和"+b+"已經在一棵樹上");}
		else {
		if(tree[a1]<tree[b1])//這個是負數,爲了簡單減少計算,不在調用value函數
		{
			tree[a1]+=tree[b1];//個數相加  注意是負數相加
			tree[b1]=a1;       //b樹成爲a的子樹,直接指向a;
		}
		else
		{
			tree[b1]+=tree[a1];//個數相加  注意是負數相加
			tree[a1]=b1;       //b樹成爲a的子樹,直接指向a;
		}
		}
	}
	public static void main(String[] args)
	{		
		DisjointSet d=new DisjointSet();
		d.union(1,2);
		d.union(3,4);
		d.union(5,6);
		d.union(1,6);
		
		d.union(22,24);
		d.union(3,26);
		d.union(36,24);
		System.out.println(d.search(6));	//頭
		System.out.println(d.value(6));     //大小
		System.out.println(d.search(22));	//頭
		System.out.println(d.value(22));     //大小
	}
}

在這裏插入圖片描述

結語

  • 並查集屬於簡單但是很高效率的數據結構。在集合中經常會遇到。如果不採用並查集而傳統暴力效率太低,而不被採納。
  • 另外,並查集還廣泛用於迷宮遊戲中,下面有機會可以介紹用並查集實現一個走迷宮小遊戲。大家歡迎關注!
  • 最後,歡迎大家關注筆者公衆號,一起學習、交流!筆者學習資源也放置公衆號和大家一起分享!
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章