外部排序優化之敗者樹與勝者樹

概述:

勝者樹和敗者樹都是完全二叉樹,是樹形選擇排序的一種變型。每個葉子結點相當於一個選手,每個中間結點相當於一場比賽,每一層相當於一輪比賽。不同的是,勝者樹的中間結點記錄的是勝者的標號;而敗者樹的中間結點記錄的敗者的標號。勝者樹與敗者樹可以在log(n)的時間內找到最值。任何一個葉子結點的值改變後,利用中間結點的信息,還是能夠快速地找到最值。在k路歸併排序中經常用到。

勝者樹:

勝者樹的一個優點是,如果一個選手的值改變了,可以很容易地修改這棵勝者樹。只需要沿着從該結點到根結點的路徑修改這棵二叉樹,而不必改變其他比賽的結果。
勝者樹的中間結點記錄的是勝者的標號
勝者樹的示例。規定數值小者勝。
這裏寫圖片描述

  1. b3 PK b4,b3勝b4負,內部結點ls[4]的值爲3;
  2. b3 PK b0,b3勝b0負,內部結點ls[2]的值爲3;
  3. b1 PK b2,b1勝b2負,內部結點ls[3]的值爲1;
  4. b3 PK b1,b3勝b1負,內部結點ls[1]的值爲3。

葉子結點b3的值變爲11時,重構的勝者樹如圖所示
這裏寫圖片描述
1. b3 PK b4,b3勝b4負,內部結點ls[4]的值爲3;
2. b3 PK b0,b0勝b3負,內部結點ls[2]的值爲0;
3. b1 PK b2,b1勝b2負,內部結點ls[3]的值爲1;
4. b0 PK b1,b1勝b0負,內部結點ls[1]的值爲1。.

敗者樹:

敗者樹是勝者樹的一種變體。在敗者樹中,用父結點記錄其左右子結點進行比賽的敗者,而讓勝者參加下一輪的比賽。敗者樹的根結點記錄的是敗者,需要加一個結點來記錄整個比賽的勝利者。採用敗者樹可以簡化重構的過程
敗者樹的中間結點記錄的敗者的標號
敗者樹示例,規定數大者敗。
這裏寫圖片描述

  1. b3 PK b4,b3勝b4負,內部結點ls[4]的值爲4;
  2. b3 PK b0,b3勝b0負,內部結點ls[2]的值爲0;
  3. b1 PK b2,b1勝b2負,內部結點ls[3]的值爲2;
  4. b3 PK b1,b3勝b1負,內部結點ls[1]的值爲1;
  5. 在根結點ls[1]上又加了一個結點ls[0]=3,記錄的最後的勝者。

敗者樹重構過程如下:
將新進入選擇樹的結點與其父結點進行比賽:將敗者存放在父結點中;而勝者再與上一級的父結點比較。
比賽沿着到根結點的路徑不斷進行,直到ls[1]處。把敗者存放在結點ls[1]中,勝者存放在ls[0]中。
是當b3變爲13時,敗者樹的重構圖:
這裏寫圖片描述

注意,敗者樹的重構跟勝者樹是不一樣的,敗者樹的重構只需要與其父結點比較。b3與結點ls[4]的原值比較,ls[4]中存放的原值是結點4,即b3與b4比較,b3負b4勝,則修改ls[4]的值爲結點3。同理,以此類推,沿着根結點不斷比賽,直至結束。

敗者樹和勝者樹的區別
由上可知,敗者樹簡化了重構。敗者樹的重構只是與該結點的父結點的記錄有關,而勝者樹的重構還與該結點的兄弟結點有關。所以敗者樹常用語外部歸併排序。

重要批註
文章寫到這裏,我突然發現,敗者樹還真不能解決賽馬問題。爲什麼這麼說呢?因爲在賽馬問題中,可以同時比較5匹馬,選出最快的。而在敗者樹中,是每次同時比較兩個數,選其中的較小值。也就是說,如果賽馬問題變換成這樣:有5組馬,每組有5匹馬,並且每組的馬按照速度快慢排列好。現在只有一個2跑道的馬場,現在要將總共這25匹馬按照速度排序。 這個問題纔是敗者樹可以解決的。嘿嘿,描述的問題其實就是外部歸併排序了。5組排好序的馬,就是5個數組,按照大小排序好。

勝者樹和敗者樹的應用
貼一道題:給定一個數組array,長度爲16。如何採用最少的比較次數找出第二大的元素?
1. 直觀方法是通過兩次冒泡排序,15+14=29 次比較可找到第二大的元素。然而直觀方法顯然沒有應用到一些已經比較過的信息。

  1. 採用歸併排序,構造勝者樹。與該勝者比較過的元素有4個(大概就是勝者樹的高度),只需要對這些元素進行比較即可,共比較次數15(勝者樹)+ (4-1)=18 次比較。

注:也就是說勝者樹在求數組最大值,次大值得時候,有用武之地。

敗者樹在外排序的k路平衡歸併中使用,它是一個完全二叉樹,其非葉節點(中間節點)爲比較中的敗者。根節點爲最後一次比較的敗者。最終勝利者則被直接輸出(或到輸出緩衝區)。

敗者樹的引入是因爲:k路平衡歸併中,若不使用敗者樹,則對每次對k路需要比較k-1次得到最值對於總共n個記錄的每一趟歸併共需要(n-1)(k-1)次比較。若有m個歸併初始段,歸併趟數爲logk(m) ,總共比較次數logk(m)(n-1)(k-1)。引入敗者樹(由k個元素構造成敗者樹)則每次不需要k-1次比較,只需要log2(k)次即可。

參考

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章