堆排序及其分析

前言


記得在學習數據結構的時候一味的想用代碼實現算法,重視的是寫出來的代碼有一個正確的輸入,然後有一個正確的輸出,那麼就很滿足了。從網上看了許多的代碼,看了之後貌似懂了,自己寫完之後也正確了,但是不久之後就忘了,因爲大腦在回憶的時候,只依稀記得代碼中的部分,那麼的模糊,根本不能再次寫出正確的代碼,也許在第一次寫的時候是因爲參考了別人的代碼,看過之後大腦可以進行短暫的高清晰記憶,於是欺騙了我,以爲自己寫出來的,滿足了成就感。可是代碼是計算機識別的,而我們更喜歡文字,圖像。所以我們在學習算法的時候要注重算法的原理以及算法的分析,用文字,圖像表達出來,然後當需要用的時候再將文字轉換爲代碼。記憶分爲三個步驟:編碼,存儲和檢索,就以學習爲例,先理解知識,再歸納知識,最後鞏固知識,爲了以後的應用而方便檢索知識。


堆排序過程


堆分爲大根堆和小根堆,是完全二叉樹。大根堆的要求是每個節點的值都不大於其父節點的值,即A[PARENT[i]] >= A[i]。在數組的非降序排序中,需要使用的就是大根堆,因爲根據大根堆的要求可知,最大的值一定在堆頂。

既然是堆排序,自然需要先建立一個堆,而建堆的核心內容是調整堆,使二叉樹滿足堆的定義(每個節點的值都不大於其父節點的值)。調堆的過程應該從最後一個非葉子節點開始,假設有數組A = {1, 3, 4, 5, 7, 2, 6, 8, 0}。那麼調堆的過程如下圖,數組下標從0開始,A[3] = 5開始。分別與左孩子和右孩子比較大小,如果A[3]最大,則不用調整,否則和孩子中的值最大的一個交換位置,在圖1中是A[7] > A[3] > A[8],所以A[3]與A[7]對換,從圖1.1轉到圖1.2。


所以建堆的過程就是

  1. for ( i = heapLen/2; i >= 0; i++)  
  2.        do AdjustHeap(A, heapLen, i)  

調堆:如果初始數組是非降序排序,那麼就不需要調堆,直接就滿足堆的定義,此爲最好情況,運行時間爲Θ(1);如果初始數組是如圖1.5,只有A[0] = 1不滿足堆的定義,經過與子節點的比較調整到圖1.6,但是圖1.6仍然不滿足堆的定義,所以要遞歸調整,一直到滿足堆的定義或者到堆底爲止。如果遞歸調堆到堆底才結束,那麼是最壞情況,運行時間爲O(h) (h爲需要調整的節點的高度,堆底高度爲0,堆頂高度爲floor(logn) )。

建堆完成之後,堆如圖1.7是個大根堆。將A[0] = 8 與 A[heapLen-1]交換,然後heapLen減一,如圖2.1,然後AdjustHeap(A, heapLen-1, 0),如圖2.2。如此交換堆的第一個元

素和堆的最後一個元素,然後堆的大小heapLen減一,對堆的大小爲heapLen的堆進行調堆,如此循環,直到heapLen == 1時停止,最後得出結果如圖3。


  1. /* 
  2.     輸入:數組A,堆的長度hLen,以及需要調整的節點i 
  3.     功能:調堆 
  4. */  
  5.   
  6. void AdjustHeap(int A[], int hLen, int i)  
  7. {  
  8.     int left = LeftChild(i);  //節點i的左孩子  
  9.     int right = RightChild(i); //節點i的右孩子節點  
  10.     int largest = i;  
  11.     int temp;  
  12.   
  13.     while(left < hLen || right < hLen)  
  14.     {  
  15.         if (left < hLen && A[largest] < A[left])  
  16.         {  
  17.             largest = left;  
  18.         }  
  19.           
  20.         if (right < hLen && A[largest] < A[right])  
  21.         {  
  22.             largest = right;  
  23.         }  
  24.   
  25.         if (i != largest)   //如果最大值不是父節點  
  26.         {  
  27.              temp = A[largest]; //交換父節點和和擁有最大值的子節點交換  
  28.              A[largest] = A[i];  
  29.              A[i] = temp;  
  30.   
  31.             i = largest;         //新的父節點,以備迭代調堆  
  32.             left = LeftChild(i);  //新的子節點  
  33.             right = RightChild(i);  
  34.         }  
  35.         else  
  36.         {  
  37.             break;  
  38.         }  
  39.     }  
  40. }  
  41.   
  42. /* 
  43.     輸入:數組A,堆的大小hLen 
  44.     功能:建堆 
  45. */  
  46. void BuildHeap(int A[], int hLen)  
  47. {  
  48.     int i;  
  49.     int begin = hLen/2 - 1;  //最後一個非葉子節點  
  50.     for (i = begin; i >= 0; i--)  
  51.     {  
  52.         AdjustHeap(A, hLen, i);    
  53.     }  
  54. }  
  55.   
  56. /* 
  57.     輸入:數組A,待排序數組的大小aLen 
  58.     功能:堆排序 
  59. */  
  60. void HeapSort(int A[], int aLen)  
  61. {  
  62.     int hLen = aLen;  
  63.     int temp;  
  64.   
  65.     BuildHeap(A, hLen);      //建堆  
  66.   
  67.     while (hLen > 1)  
  68.     {  
  69.         temp = A[hLen-1];    //交換堆的第一個元素和堆的最後一個元素  
  70.         A[hLen-1] = A[0];  
  71.         A[0] = temp;  
  72.         hLen--;        //堆的大小減一  
  73.         AdjustHeap(A, hLen, 0);  //調堆  
  74.     }  
  75. }  


性能分析


    • 調堆:上面已經分析了,調堆的運行時間爲O(h)。
    • 建堆:每一層最多的節點個數爲n1 = ceil(n/(2^(h+1))),

因此,建堆的運行時間是O(n)。

    • 循環調堆(代碼67-74),因爲需要調堆的是堆頂元素,所以運行時間是O(h) = O(floor(logn))。所以循環調堆的運行時間爲O(nlogn)。

總運行時間T(n) = O(nlogn) + O(n) = O(nlogn)。對於堆排序的最好情況與最壞情況的運行時間,因爲最壞與最好的輸入都只是影響建堆的運行時間O(1)或者O(n),而在總體時間中佔重要比例的是循環調堆的過程,即O(nlogn) + O(1) =O(nlogn) + O(n) = O(nlogn)。因此最好或者最壞情況下,堆排序的運行時間都是O(nlogn)。而且堆排序還是原地算法(in-place algorithm)

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章