(資料)二分圖(偶圖)最大匹配解法之一匈牙利算法

什麼是二分圖,什麼是二分圖的最大匹配,這些定義我就不講了,網上隨便都找得到。二分圖的最大匹配有兩種求法,第一種是最大流(我在此假設讀者已有網絡流的知識);第二種就是我現在要講的匈牙利算法。這個算法說白了就是最大流的算法,但是它跟據二分圖匹配這個問題的特點,把最大流算法做了簡化,提高了效率。匈牙利算法其實很簡單,但是網上搜不到什麼說得清楚的文章。所以我決定要寫一下。
最大流算法的核心問題就是找增廣路徑(augment path)。匈牙利算法也不例外,它的基本模式就是:

初始時最大匹配爲空
while 找得到增廣路徑
    do 把增廣路徑加入到最大匹配中去

可見和最大流算法是一樣的。但是這裏的增廣路徑就有它一定的特殊性,下面我來分析一下。
(注:匈牙利算法雖然根本上是最大流算法,但是它不需要建網絡模型,所以圖中不再需要源點和匯點,僅僅是一個二分圖。每條邊也不需要有方向。)

圖1 圖2


圖1是我給出的二分圖中的一個匹配:[1,5]和[2,6]。圖2就是在這個匹配的基礎上找到的一條增廣路徑:3->6->2->5->1->4。我們藉由它來描述一下二分圖中的增廣路徑的性質:

(1)有奇數條邊。
(2)起點在二分圖的左半邊,終點在右半邊。
(3)路徑上的點一定是一個在左半邊,一個在右半邊,交替出現。(其實二分圖的性質就決定了這一點,因爲二分圖同一邊的點之間沒有邊相連,不要忘記哦。)
(4)整條路徑上沒有重複的點。
(5)起點和終點都是目前還沒有配對的點,而其它所有點都是已經配好對的。(如圖1、圖2所示,[1,5]和[2,6]在圖1中是兩對已經配好對的點;而起點3和終點4目前還沒有與其它點配對。)
(6)路徑上的所有第奇數條邊都不在原匹配中,所有第偶數條邊都出現在原匹配中。(如圖1、圖2所示,原有的匹配是[1,5]和[2,6],這兩條配匹的邊在圖2給出的增廣路徑中分邊是第2和第4條邊。而增廣路徑的第1、3、5條邊都沒有出現在圖1給出的匹配中。)
(7)最後,也是最重要的一條,把增廣路徑上的所有第奇數條邊加入到原匹配中去,並把增廣路徑中的所有第偶數條邊從原匹配中刪除(這個操作稱爲增廣路徑的取反),則新的匹配數就比原匹配數增加了1個。(如圖2所示,新的匹配就是所有藍色的邊,而所有紅色的邊則從原匹配中刪除。則新的匹配數爲3。)

不難想通,在最初始時,還沒有任何匹配時,圖1中的兩條灰色的邊本身也是增廣路徑。因此在這張二分圖中尋找最大配匹的過程可能如下:

(1)找到增廣路徑1->5,把它取反,則匹配數增加到1。
(2)找到增廣路徑2->6,把它取反,則匹配數增加到2。
(3)找到增廣路徑3->6->2->5->1->4,把它取反,則匹配數增加到3。
(4)再也找不到增廣路徑,結束。

當然,這只是一種可能的流程。也可能有別的找增廣路徑的順序,或者找到不同的增廣路徑,最終的匹配方案也可能不一樣。但是最大匹配數一定都是相同的。

對於增廣路徑還可以用一個遞歸的方法來描述。這個描述不一定最準確,但是它揭示了尋找增廣路徑的一般方法:
“從點A出發的增廣路徑”一定首先連向一個在原匹配中沒有與點A配對的點B。如果點B在原匹配中沒有與任何點配對,則它就是這條增廣路徑的終點;反之,如果點B已與點C配對,那麼這條增廣路徑就是從A到B,再從B到C,再加上“從點C出發的增廣路徑”。並且,這條從C出發的增廣路徑中不能與前半部分的增廣路徑有重複的點。

比如圖2中,我們要尋找一條從3出發的增廣路徑,要做以下3步:
(1)首先從3出發,它能連到的點只有6,而6在圖1中已經與2配對,所以目前的增廣路徑就是3->6->2再加上從2出發的增廣路徑。
(2)從2出發,它能連到的不與前半部分路徑重複的點只有5,而且5確實在原匹配中沒有與2配對。所以從2連到5。但5在圖1中已經與1配對,所以目前的增廣路徑爲3->6->2->5->1再加上從1出發的增廣路徑。
(3)從1出發,能連到的不與自已配對並且不與前半部分路徑重複的點只有4。因爲4在圖1中沒有與任何點配對,所以它就是終點。所以最終的增廣路徑是3->6->2->5->1->4。

但是嚴格地說,以上過程中從2出發的增廣路徑(2->5->1->4)和從1出發的增廣路徑(1->4)並不是真正的增廣路徑。因爲它們不符合前面講過的增廣路徑的第5條性質,它們的起點都是已經配過對的點。我們在這裏稱它們爲“增廣路徑”只是爲了方便說明整個搜尋的過程。而這兩條路徑本身只能算是兩個不爲外界所知的子過程的返回結果。
顯然,從上面的例子可以看出,搜尋增廣路徑的方法就是DFS,可以寫成一個遞歸函數。當然,用BFS也完全可以實現。

至此,理論基礎部份講完了。但是要完成匈牙利算法,還需要一個重要的定理:

如果從一個點A出發,沒有找到增廣路徑,那麼無論再從別的點出發找到多少增廣路徑來改變現在的匹配,從A出發都永遠找不到增廣路徑。

要用文字來證明這個定理很繁,話很難說,要麼我還得多畫一張圖,我在此就省了。其實你自己畫幾個圖,試圖舉兩個反例,這個定理不難想通的。(給個提示。如果你試圖舉個反例來說明在找到了別的增廣路徑並改變了現有的匹配後,從A出發就能找到增廣路徑。那麼,在這種情況下,肯定在找到別的增廣路徑之前,就能從A出發找到增廣路徑。這就與假設矛盾了。)
有了這個定理,匈牙利算法就成形了。如下:

初始時最大匹配爲空
for 二分圖左半邊的每個點i
    do 從點i出發尋找增廣路徑。如果找到,則把它取反(即增加了總了匹配數)。

如果二分圖的左半邊一共有n個點,那麼最多找n條增廣路徑。如果圖中共有m條邊,那麼每找一條增廣路徑(DFS或BFS)時最多把所有邊遍歷一遍,所花時間也就是m。所以總的時間大概就是O(n * m)。

 

發佈了25 篇原創文章 · 獲贊 13 · 訪問量 13萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章