關於KM算法的詳細解釋

本沙茶今年AHOI的時候，遇到裸的最佳匹配的題，竟然把KM算法搞忘了，幸虧是WJMZBMR神犇保佑，臨時亂弄一通，想起來了……這MS反映出了本沙茶以前在看某些經典算法的時候看得不深，木有理解透徹……
前幾天又遇到一道最佳匹配的題，發現KM算法竟然又忘了……米辦法，只有把這個搞死人的算法的具體過程重新看了一遍，終於懂了……
【KM算法及其具體過程】
（1）可行點標：每個點有一個標號，記lx[i]爲X方點i的標號，ly[j]爲Y方點j的標號。如果對於圖中的任意邊(i, j, W)都有lx[i]+ly[j]>=W，則這一組點標是可行的。特別地，對於lx[i]+ly[j]=W的邊(i, j, W)，稱爲可行邊；
（2）KM算法的核心思想就是通過修改某些點的標號（但要滿足點標始終是可行的），不斷增加圖中的可行邊總數，直到圖中存在僅由可行邊組成的完全匹配爲止，此時這個匹配一定是最佳的（因爲由可行點標的的定義，圖中的任意一個完全匹配，其邊權總和均不大於所有點的標號之和，而僅由可行邊組成的完全匹配的邊權總和等於所有點的標號之和，故這個匹配是最佳的）。一開始，求出每個點的初始標號：lx[i]=max{e.W|e.x=i}（即每個X方點的初始標號爲與這個X方點相關聯的權值最大的邊的權值），ly[j]=0（即每個Y方點的初始標號爲0）。這個初始點標顯然是可行的，並且，與任意一個X方點關聯的邊中至少有一條可行邊；
（3）然後，從每個X方點開始DFS增廣。DFS增廣的過程與最大匹配的Hungary算法基本相同，只是要注意兩點：一是隻找可行邊，二是要把搜索過程中遍歷到的X方點全部記下來（可以用vst搞一下），以進行後面的修改；
（4）增廣的結果有兩種：若成功（找到了增廣軌），則該點增廣完成，進入下一個點的增廣。若失敗（沒有找到增廣軌），則需要改變一些點的標號，使得圖中可行邊的數量增加。方法爲：將所有在增廣軌中（就是在增廣過程中遍歷到）的X方點的標號全部減去一個常數d，所有在增廣軌中的Y方點的標號全部加上一個常數d，則對於圖中的任意一條邊(i, j, W)（i爲X方點，j爲Y方點）：
<1>i和j都在增廣軌中：此時邊(i, j)的(lx[i]+ly[j])值不變，也就是這條邊的可行性不變（原來是可行邊則現在仍是，原來不是則現在仍不是）；
<2>i在增廣軌中而j不在：此時邊(i, j)的(lx[i]+ly[j])的值減少了d，也就是原來這條邊不是可行邊（否則j就會被遍歷到了），而現在可能是；
<3>j在增廣軌中而i不在：此時邊(i, j)的(lx[i]+ly[j])的值增加了d，也就是原來這條邊不是可行邊（若這條邊是可行邊，則在遍歷到j時會緊接着執行DFS(i)，此時i就會被遍歷到），現在仍不是；
<4>i和j都不在增廣軌中：此時邊(i, j)的(lx[i]+ly[j])值不變，也就是這條邊的可行性不變。
這樣，在進行了這一步修改操作後，圖中原來的可行邊仍可行，而原來不可行的邊現在則可能變爲可行邊。那麼d的值應取多少？顯然，整個點標不能失去可行性，也就是對於上述的第<2>類邊，其lx[i]+ly[j]>=W這一性質不能被改變，故取所有第<2>類邊的(lx[i]+ly[j]-W)的最小值作爲d值即可。這樣一方面可以保證點標的可行性，另一方面，經過這一步後，圖中至少會增加一條可行邊。
（5）修改後，繼續對這個X方點DFS增廣，若還失敗則繼續修改，直到成功爲止；

下面分析整個算法的時間複雜度：每次修改後，圖中至少會增加一條可行邊，故最多增廣M次、修改M次就可以找到僅由可行邊組成的完全匹配（除非圖中不存在完全匹配，這個可以通過預處理得到），故整個算法的時間複雜度爲O(M * (N + 一次修改點標的時間))。而一次修改點標的時間取決於計算d值的時間，如果暴力枚舉計算，這一步的時間爲O(M)，優化：可以對每個Y方點設立一個slk值，表示在DFS增廣過程中，所有搜到的與該Y方點關聯的邊的(lx+ly-W)的最小值（這樣的邊的X方點必然在增廣軌中）。每次DFS增廣前，將所有Y方點的slk值設爲+∞，若增廣失敗，則取所有不在增廣軌中的Y方點的slk值的最小值爲d值。這樣一次修改點標的時間降爲O(N)，總時間複雜度降爲O(NM)。

需要注意的一點是，在增廣過程中需要記下每個X、Y方點是否被遍歷到，即fx[i]、fy[j]。因此，在每次增廣前（不是對每個X方點增廣前）就要將所有fx和fy值清空。

代碼：

void init_d()
{
    re(i, n) E[i].pre = E[i].next = i; m = n;
}
void add_edge(int a, int b, int len)
{
    E[m].a = a; E[m].b = b; E[m].len = len; E[m].pre = E[a].pre; E[m].next = a; E[a].pre = m; E[E[m].pre].next = m++;
}
inline int dist(int x, int y, int x0, int y0)
{
    return abs(x - x0) + abs(y - y0);
}
bool dfs(int x)
{
    int y, x0; fx[x] = _FLAG;
    for (int p=E[x].next; p != x; p=E[p].next) {
        y = E[p].b;
        if (lx[x] + ly[y] > E[p].len) {
            if (lx[x] + ly[y] - E[p].len < slk[y]) slk[y] = lx[x] + ly[y] - E[p].len;
        } else if (fy[y] != _FLAG) {
            fy[y] = _FLAG; x0 = z[y];
            if (x0 == -1 || dfs(x0)) {z[y] = x; return 1;}
        }
    }
    return 0;
}
void solve()
{
    re(i, n) {
        lx[i] = -INF;
        for (int p=E[i].next; p != i; p=E[p].next) if (E[p].len > lx[i]) lx[i] = E[p].len;
    }
    re(i, n0) {ly[i] = 0; z[i] = -1;}
    int d;
    re(i, n) {
        re(j, n0) slk[i] = INF; _FLAG++;
        while (!dfs(i)) {
            d = INF; re(j, n0) if (fy[j] != _FLAG && slk[j] < d) d = slk[j];
            re(j, n) if (fx[j] == _FLAG) lx[j] -= d;
            re(j, n0) {slk[j] = INF; if (fy[j] == _FLAG) ly[j] += d;}
            _FLAG++;
        }
    }
    res = 0; re(i, n) res += lx[i]; re(i, n0) res += ly[i];
}

轉載地址：http://www.cppblog.com/MatoNo1/archive/2011/07/23/151724.aspx