勝者樹與敗者樹

轉載自博文
*-_
勝者樹與敗者樹

勝者樹和敗者樹都是完全二叉樹,是樹形選擇排序的一種變型。每個葉子結點相當於一個選手,每個中間結點相當於一場比賽,每一層相當於一輪比賽。

不同的是,勝者樹的中間結點記錄的是勝者的標號;而敗者樹的中間結點記錄的敗者的標號。

勝者樹與敗者樹可以在log(n)的時間內找到最值。任何一個葉子結點的值改變後,利用中間結點的信息,還是能夠快速地找到最值。在k路歸併排序中經常用到。

一、勝者樹

勝者樹的一個優點是,如果一個選手的值改變了,可以很容易地修改這棵勝者樹。只需要沿着從該結點到根結點的路徑修改這棵二叉樹,而不必改變其他比賽的結果。

在這裏插入圖片描述

Fig.1是一個勝者樹的示例。規定數值小者勝。

1.         b3 PK b4,b3勝b4負,內部結點ls[4]的值爲3;

2.         b3 PK b0,b3勝b0負,內部結點ls[2]的值爲3;

3.         b1 PK b2,b1勝b2負,內部結點ls[3]的值爲1;

4.         b3 PK b1,b3勝b1負,內部結點ls[1]的值爲3。.

當Fig. 1中葉子結點b3的值變爲11時,重構的勝者樹如Fig. 2所示。

1.         b3 PK b4,b3勝b4負,內部結點ls[4]的值爲3;

2.         b3 PK b0,b0勝b3負,內部結點ls[2]的值爲0;

3.         b1 PK b2,b1勝b2負,內部結點ls[3]的值爲1;

4.         b0 PK b1,b1勝b0負,內部結點ls[1]的值爲1。.

Fig. 2

 

 

二、敗者樹

 

       敗者樹是勝者樹的一種變體。在敗者樹中,用父結點記錄其左右子結點進行比賽的敗者,而讓勝者參加下一輪的比賽。敗者樹的根結點記錄的是敗者,需要加一個結點來記錄整個比賽的勝利者。採用敗者樹可以簡化重構的過程。

 

Fig. 3

Fig. 3是一棵敗者樹。規定數大者敗。

1.         b3 PK b4,b3勝b4負,內部結點ls[4]的值爲4;

2.         b3 PK b0,b3勝b0負,內部結點ls[2]的值爲0;

3.         b1 PK b2,b1勝b2負,內部結點ls[3]的值爲2;

4.         b3 PK b1,b3勝b1負,內部結點ls[1]的值爲1;

5.         在根結點ls[1]上又加了一個結點ls[0]=3,記錄的最後的勝者。

敗者樹重構過程如下:

·            將新進入選擇樹的結點與其父結點進行比賽:將敗者存放在父結點中;而勝者再與上一級的父結點比較。

·            比賽沿着到根結點的路徑不斷進行,直到ls[1]處。把敗者存放在結點ls[1]中,勝者存放在ls[0]中。

Fig. 4

       Fig. 4是當b3變爲13時,敗者樹的重構圖。

 

       注意,敗者樹的重構跟勝者樹是不一樣的,敗者樹的重構只需要與其父結點比較。對照Fig. 3來看,b3與結點ls[4]的原值比較,ls[4]中存放的原值是結點4,即b3與b4比較,b3負b4勝,則修改ls[4]的值爲結點3。同理,以此類推,沿着根結點不斷比賽,直至結束。

 

        由上可知,敗者樹簡化了重構。敗者樹的重構只是與該結點的父結點的記錄有關,而勝者樹的重構還與該結點的兄弟結點有關。



敗者樹 多路平衡歸併外部排序


一 外部排序的基本思路

假設有一個72KB的文件,其中存儲了18K個整數,磁盤中物理塊的大小爲4KB,將文件分成18組,每組剛好4KB。

首先通過18次內部排序,把18組數據排好序,得到初始的18個歸併段R1~R18,每個歸併段有1024個整數。

然後對這18個歸併段使用4路平衡歸併排序:

第1次歸併:產生5個歸併段

R11   R12    R13    R14    R15

其中

R11是由{R1,R2,R3,R4}中的數據合併而來

R12是由{R5,R6,R7,R8}中的數據合併而來

R13是由{R9,R10,R11,R12}中的數據合併而來

R14是由{R13,R14,R15,R16}中的數據合併而來

R15是由{R17,R18}中的數據合併而來

把這5個歸併段的數據寫入5個文件:

foo_1.dat    foo_2.dat    foo_3.dat     foo_4.dat     foo_5.dat

 

第2次歸併:從第1次歸併產生的5個文件中讀取數據,合併,產生2個歸併段

R21  R22

其中R21是由{R11,R12,R13,R14}中的數據合併而來

其中R22是由{R15}中的數據合併而來

把這2個歸併段寫入2個文件

bar_1.dat   bar_2.dat

 

第3次歸併:從第2次歸併產生的2個文件中讀取數據,合併,產生1個歸併段

R31

R31是由{R21,R22}中的數據合併而來

把這個文件寫入1個文件

foo_1.dat

此即爲最終排序好的文件。

 

二 使用敗者樹加快合併排序

外部排序最耗時間的操作時磁盤讀寫,對於有m個初始歸併段,k路平衡的歸併排序,磁盤讀寫次數爲

|logkm|,可見增大k的值可以減少磁盤讀寫的次數,但增大k的值也會帶來負面效應,即進行k路合併

的時候會增加算法複雜度,來看一個例子。

把n個整數分成k組,每組整數都已排序好,現在要把k組數據合併成1組排好序的整數,求算法複雜度

u1: xxxxxxxx

u2: xxxxxxxx

u3: xxxxxxxx

.......

uk: xxxxxxxx

算法的步驟是:每次從k個組中的首元素中選一個最小的數,加入到新組,這樣每次都要比較k-1次,故

算法複雜度爲O((n-1)*(k-1)),而如果使用敗者樹,可以在O(logk)的複雜度下得到最小的數,算法複雜

度將爲O((n-1)*logk), 對於外部排序這種數據量超大的排序來說,這是一個不小的提高。

 

關於敗者樹的創建和調整,可以參考清華大學《數據結構-C語言版》

 

三 產生二進制測試數據

打開Linux終端,輸入命令

dd if=/dev/urandom of=random.dat bs=1M count=512

 這樣在當前目錄下產生一個512M大的二進制文件,文件內的數據是隨機的,讀取文件,每4個字節

看成1個整數,相當於得到128M個隨機整數。


四 程序實現

  1. #include <assert.h>
  2. #include <fcntl.h>
  3. #include <stdio.h>
  4. #include <stdlib.h>
  5. #include <string.h>
  6. #include <unistd.h>
  7. #include <sys/time.h>
  8. #include <sys/types.h>
  9. #include <sys/stat.h>
  10. #define MAX_INT ~(1<<31)
  11. #define MIN_INT 1<<31
  12. //#define DEBUG
  13. #ifdef DEBUG
  14. #define debug(...) debug( __VA_ARGS__)
  15. #else
  16. #define debug(...)
  17. #endif
  18. #define MAX_WAYS 100
  19. typedef struct run_t {
  20. int *buf; /* 輸入緩衝區 */
  21. int length; /* 緩衝區當前有多少個數 */
  22. int offset; /* 緩衝區讀到了文件的哪個位置 */
  23. int idx; /* 緩衝區的指針 */
  24. } run_t;
  25. static unsigned int K; /* K路合併 */
  26. static unsigned int BUF_PAGES; /* 緩衝區有多少個page */
  27. static unsigned int PAGE_SIZE; /* page的大小 */
  28. static unsigned int BUF_SIZE; /* 緩衝區的大小, BUF_SIZE = BUF_PAGES*PAGE_SIZE */
  29. static int *buffer; /* 輸出緩衝區 */
  30. static char input_prefix[] = "foo_";
  31. static char output_prefix[] = "bar_";
  32. static int ls[MAX_WAYS]; /* loser tree */
  33. void swap(int *p, int *q);
  34. int partition(int *a, int s, int t);
  35. void quick_sort(int *a, int s, int t);
  36. void adjust(run_t ** runs, int n, int s);
  37. void create_loser_tree(run_t **runs, int n);
  38. long get_time_usecs();
  39. void k_merge(run_t** runs, char* input_prefix, int num_runs, int base, int n_merge);
  40. void usage();
  41. int main(int argc, char **argv)
  42. {
  43. char filename[100];
  44. unsigned int data_size;
  45. unsigned int num_runs; /* 這輪迭代時有多少個歸併段 */
  46. unsigned int num_merges; /* 這輪迭代後產生多少個歸併段 num_merges = num_runs/K */
  47. unsigned int run_length; /* 歸併段的長度,指數級增長 */
  48. unsigned int num_runs_in_merge; /* 一般每個merge由K個runs合併而來,但最後一個merge可能少於K個runs */
  49. int fd, rv, i, j, bytes;
  50. struct stat sbuf;
  51. if (argc != 3) {
  52. usage();
  53. return 0;
  54. }
  55. long start_usecs = get_time_usecs();
  56. strcpy(filename, argv[1]);
  57. fd = open(filename, O_RDONLY);
  58. if (fd < 0) {
  59. printf("can't open file %s\n", filename);
  60. exit(0);
  61. }
  62. rv = fstat(fd, &sbuf);
  63. data_size = sbuf.st_size;
  64. K = atoi(argv[2]);
  65. PAGE_SIZE = 4096; /* page = 4KB */
  66. BUF_PAGES = 32;
  67. BUF_SIZE = PAGE_SIZE*BUF_PAGES;
  68. num_runs = data_size / PAGE_SIZE; /* 初始時的歸併段數量,每個歸併段有4096 byte, 即1024個整數 */
  69. buffer = (int *)malloc(BUF_SIZE);
  70. run_length = 1;
  71. run_t **runs = (run_t **)malloc(sizeof(run_t *)*(K+1));
  72. for (i = 0; i < K; i++) {
  73. runs[i] = (run_t *)malloc(sizeof(run_t));
  74. runs[i]->buf = (int *)calloc(1, BUF_SIZE+4);
  75. }
  76. while (num_runs > 1) {
  77. num_merges = num_runs / K;
  78. int left_runs = num_runs % K;
  79. if(left_runs > 0) num_merges++;
  80. for (i = 0; i < num_merges; i++) {
  81. num_runs_in_merge = K;
  82. if ((i+1) == num_merges && left_runs > 0) {
  83. num_runs_in_merge = left_runs;
  84. }
  85. int base = 0;
  86. printf("Merge %d of %d,%d ways\n", i, num_merges, num_runs_in_merge);
  87. for (j = 0; j < num_runs_in_merge; j++) {
  88. if (run_length == 1) {
  89. base = 1;
  90. bytes = read(fd, runs[j]->buf, PAGE_SIZE);
  91. runs[j]->length = bytes/sizeof(int);
  92. quick_sort(runs[j]->buf, 0, runs[j]->length-1);
  93. } else {
  94. snprintf(filename, 20, "%s%d.dat", input_prefix, i*K+j);
  95. int infd = open(filename, O_RDONLY);
  96. bytes = read(infd, runs[j]->buf, BUF_SIZE);
  97. runs[j]->length = bytes/sizeof(int);
  98. close(infd);
  99. }
  100. runs[j]->idx = 0;
  101. runs[j]->offset = bytes;
  102. }
  103. k_merge(runs, input_prefix, num_runs_in_merge, base, i);
  104. }
  105. strcpy(filename, output_prefix);
  106. strcpy(output_prefix, input_prefix);
  107. strcpy(input_prefix, filename);
  108. run_length *= K;
  109. num_runs = num_merges;
  110. }
  111. for (i = 0; i < K; i++) {
  112. free(runs[i]->buf);
  113. free(runs[i]);
  114. }
  115. free(runs);
  116. free(buffer);
  117. close(fd);
  118. long end_usecs = get_time_usecs();
  119. double secs = (double)(end_usecs - start_usecs) / (double)1000000;
  120. printf("Sorting took %.02f seconds.\n", secs);
  121. printf("sorting result saved in %s%d.dat.\n", input_prefix, 0);
  122. return 0;
  123. }
  124. void k_merge(run_t** runs, char* input_prefix, int num_runs, int base, int n_merge)
  125. {
  126. int bp, bytes, output_fd;
  127. int live_runs = num_runs;
  128. run_t *mr;
  129. char filename[20];
  130. bp = 0;
  131. create_loser_tree(runs, num_runs);
  132. snprintf(filename, 100, "%s%d.dat", output_prefix, n_merge);
  133. output_fd = open(filename, O_CREAT|O_WRONLY|O_TRUNC,
  134. S_IRWXU|S_IRWXG);
  135. if (output_fd < 0) {
  136. printf("create file %s fail\n", filename);
  137. exit(0);
  138. }
  139. while (live_runs > 0) {
  140. mr = runs[ls[0]];
  141. buffer[bp++] = mr->buf[mr->idx++];
  142. // 輸出緩衝區已滿
  143. if (bp*4 == BUF_SIZE) {
  144. bytes = write(output_fd, buffer, BUF_SIZE);
  145. bp = 0;
  146. }
  147. // mr的輸入緩衝區用完
  148. if (mr->idx == mr->length) {
  149. snprintf(filename, 20, "%s%d.dat", input_prefix, ls[0]+n_merge*K);
  150. if (base) {
  151. mr->buf[mr->idx] = MAX_INT;
  152. live_runs--;
  153. } else {
  154. int fd = open(filename, O_RDONLY);
  155. lseek(fd, mr->offset, SEEK_SET);
  156. bytes = read(fd, mr->buf, BUF_SIZE);
  157. close(fd);
  158. if (bytes == 0) {
  159. mr->buf[mr->idx] = MAX_INT;
  160. live_runs--;
  161. }
  162. else {
  163. mr->length = bytes/sizeof(int);
  164. mr->offset += bytes;
  165. mr->idx = 0;
  166. }
  167. }
  168. }
  169. adjust(runs, num_runs, ls[0]);
  170. }
  171. bytes = write(output_fd, buffer, bp*4);
  172. if (bytes != bp*4) {
  173. printf("!!!!!! Write Error !!!!!!!!!\n");
  174. exit(0);
  175. }
  176. close(output_fd);
  177. }
  178. long get_time_usecs()
  179. {
  180. struct timeval time;
  181. struct timezone tz;
  182. memset(&tz, '\0', sizeof(struct timezone));
  183. gettimeofday(&time, &tz);
  184. long usecs = time.tv_sec*1000000 + time.tv_usec;
  185. return usecs;
  186. }
  187. void swap(int *p, int *q)
  188. {
  189. int tmp;
  190. tmp = *p;
  191. *p = *q;
  192. *q = tmp;
  193. }
  194. int partition(int *a, int s, int t)
  195. {
  196. int i, j; /* i用來遍歷a[s]...a[t-1], j指向大於x部分的第一個元素 */
  197. for (i = j = s; i < t; i++) {
  198. if (a[i] < a[t]) {
  199. swap(a+i, a+j);
  200. j++;
  201. }
  202. }
  203. swap(a+j, a+t);
  204. return j;
  205. }
  206. void quick_sort(int *a, int s, int t)
  207. {
  208. int p;
  209. if (s < t) {
  210. p = partition(a, s, t);
  211. quick_sort(a, s, p-1);
  212. quick_sort(a, p+1, t);
  213. }
  214. }
  215. void adjust(run_t ** runs, int n, int s)
  216. {
  217. int t, tmp;
  218. t = (s+n)/2;
  219. while (t > 0) {
  220. if (s == -1) {
  221. break;
  222. }
  223. if (ls[t] == -1 || runs[s]->buf[runs[s]->idx] > runs[ls[t]]->buf[runs[ls[t]]->idx]) {
  224. tmp = s;
  225. s = ls[t];
  226. ls[t] = tmp;
  227. }
  228. t >>= 1;
  229. }
  230. ls[0] = s;
  231. }
  232. void create_loser_tree(run_t **runs, int n)
  233. {
  234. int i;
  235. for (i = 0; i < n; i++) {
  236. ls[i] = -1;
  237. }
  238. for (i = n-1; i >= 0; i--) {
  239. adjust(runs, n, i);
  240. }
  241. }
  242. void usage()
  243. {
  244. printf("sort <filename> <K-ways>\n");
  245. printf("\tfilename: filename of file to be sorted\n");
  246. printf("\tK-ways: how many ways to merge\n");
  247. exit(1);
  248. }

五 編譯運行

gcc sort.c -o sort -g

./sort random.dat 64

以64路平衡歸併對random.dat內的數據進行外部排序。在I5處理器,4G內存的硬件環境下,實驗結果如下

文件大小    耗時

128M        14.72 秒

256M        30.89 秒

512M        71.65 秒

1G             169.18秒

 

六 讀取二進制文件,查看排序結

  1. #include <assert.h>
  2. #include <fcntl.h>
  3. #include <stdio.h>
  4. #include <stdlib.h>
  5. #include <string.h>
  6. #include <unistd.h>
  7. #include <sys/time.h>
  8. #include <sys/types.h>
  9. #include <sys/stat.h>
  10. int main(int argc, char **argv)
  11. {
  12. char *filename = argv[1];
  13. int *buffer = (int *)malloc(1<<20);
  14. struct stat sbuf;
  15. int rv, data_size, i, bytes, fd;
  16. fd = open(filename, O_RDONLY);
  17. if (fd < 0) {
  18. printf("%s not found!\n", filename);
  19. exit(0);
  20. }
  21. rv = fstat(fd, &sbuf);
  22. data_size = sbuf.st_size;
  23. bytes = read(fd, buffer, data_size);
  24. for (i = 0; i < bytes/4; i++) {
  25. printf("%d ", buffer[i]);
  26. if ((i+1) % 10 == 0) {
  27. printf("\n");
  28. }
  29. }
  30. printf("\n");
  31. close(fd);
  32. free(buffer);
  33. return 0;
  34. }


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章