經典算法---堆排序(Heapsort)

堆排序Heapsort是指利用堆這種數據結構所設計的一種排序算法。堆積是一個近似完全二叉樹的結構,並同時滿足堆積的性質:即子結點的鍵值或索引總是小於(或者大於)它的父節點。

堆排序的平均時間複雜度爲Ο(nlogn) 

算法步驟:

1. 創建一個堆H[0..n-1]

2. 把堆首(最大值)和堆尾互換

3. 把堆的尺寸縮小1,並調用shift_down(0),目的是把新的數組頂端數據調整到相應位置

4. 重複步驟2,直到堆的尺寸爲1

 

堆:

堆實際上是一棵完全二叉樹,其任何一非葉節點滿足性質: Key[i]<=key[2i+1]&&Key[i]<=key[2i+2]或者Key[i]>=Key[2i+1]&&key>=key[2i+2] 即任何一非葉節點的關鍵字不大於或者不小於其左右孩子節點的關鍵字。 堆分爲大頂堆和小頂堆,滿足Key[i]>=Key[2i+1]&&key>=key[2i+2]稱爲大頂堆,滿足 Key[i]<=key[2i+1]&&Key[i]<=key[2i+2]稱爲小頂堆。由上述性質可知大頂堆的堆頂的關鍵字肯定是所有關鍵字中最大的,小頂堆的堆頂的關鍵字是所有關鍵字中最小的。

堆排序思想:

利用大頂堆(小頂堆)堆頂記錄的是最大關鍵字(最小關鍵字)這一特性,使得每次從無序中選擇最大記錄(最小記錄)變得簡單。 其基本思想爲(大頂堆): 1)將初始待排序關鍵字序列(R1,R2….Rn)構建成大頂堆,此堆爲初始的無序區; 2)將堆頂元素R[1]與最後一個元素R[n]交換,此時得到新的無序區(R1,R2,……Rn-1)和新的有序區(Rn),且滿足R[1,2...n-1]<=R[n]; 3)由於交換後新的堆頂R[1]可能違反堆的性質,因此需要對當前無序區(R1,R2,……Rn-1)調整爲新堆,然後再次將R[1]與無序區最後一個元素交換,得到新的無序區(R1,R2….Rn-2)和新的有序區(Rn-1,Rn)。不斷重複此過程直到有序區的元素個數爲n-1,則整個排序過程完成。 操作過程如下: 1)初始化堆:將R[1..n]構造爲堆; 2)將當前無序區的堆頂元素R[1]同該區間的最後一個記錄交換,然後將新的無序區調整爲新的堆。 因此對於堆排序,最重要的兩個操作就是構造初始堆和調整堆,其實構造初始堆事實上也是調整堆的過程,只不過構造初始堆是對所有的非葉節點都進行調整。

一個圖示實例

給定一個整形數組a[]={16,7,3,20,17,8},對其進行堆排序。 首先根據該數組元素構建一個完全二叉樹,得到 


然後需要構造初始堆,則從最後一個非葉節點開始調整,調整過程如下:


2016交換後導致16不滿足堆的性質,因此需重新調整


這樣就得到了初始堆。


先進行一次調整時其成爲大頂堆,

即每次調整都是從父節點、左孩子節點、右孩子節點三者中選擇最大者跟父節點進行交換(交換之後可能造成被交換的孩子節點不滿足堆的性質,因此每次交換之後要重新對被交換的孩子節點進行調整)。有了初始堆之後就可以進行排序了。


此時3位於堆頂不滿堆的性質,則需調整繼續調整  


 這樣整個區間便已經有序了。從上述過程可知,堆排序其實也是一種選擇排序,是一種樹形選擇排序。只不過直接選擇排序中,爲了從R[1...n]中選擇最大記錄,需比較n-1次,然後從R[1...n-2]中選擇最大記錄需比較n-2次。事實上這n-2次比較中有很多已經在前面的n-1次比較中已經做過,而樹形選擇排序恰好利用樹形的特點保存了部分前面的比較結果,因此可以減少比較次數。對於n個關鍵字序列,最壞情況下每個節點需比較log2(n)次,因此其最壞情況下時間複雜度爲nlogn。堆排序爲不穩定排序,不適合記錄較少的排序。 上面描述了這麼多,簡而言之,堆排序的基本做法是:首先,用原始數據構建成一個大()堆作爲原始無序區,然後,每次取出堆頂元素,放入有序區。由於堆頂元素被取出來了,我們用堆中最後一個元素放入堆頂,如此,堆的性質就被破壞了。我們需要重新對堆進行調整,如此繼續N次,那麼無序區的N個元素都被放入有序區了,也就完成了排序過程。

(建堆是自底向上)

實際應用:

實際中我們進行堆排序是爲了取得一定條件下的最大值或最小值,例如:需要在100個數中找到10個最大值,因此我們定義一個大小爲10的堆,把100中的前十個數據建立成小頂堆(堆頂最小),然後從100個數據中的第11個數據開始與堆頂比較,若堆頂小於當前數據,則把堆頂彈出,把當前數據壓入堆頂,然後把數據從堆頂下移到一定位置即可,

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章