原理:
堆排序是指利用堆(最大堆、最小堆)這種數據結構所設計的一種排序算法。其中堆是一種完全二叉樹的結構,並滿足子結點的鍵值或索引總是小於(或者大於)它的父結點。
用最大堆排序的基本思想:堆排序從最大堆的頂部不斷取走堆頂元素放到有序序列中,直到堆的元素被全部取完。
算法過程:
(1)、建堆:從len/2到第一個節點0處一直調用調整堆的過程,其中len爲數組長度,len/2表示節點深度。
(2)、調整堆:比較節點i和它的孩子節點left(i),right(i),選出三者最大者,如果最大值不是節點i而是它的一個孩子節點,那便交換節點i和該節點,然後再調用調整堆過程,這是一個遞歸的過程。調整堆的過程時間複雜度與堆的深度有關係,是lgn的操作。
(3)、堆排序:主要利用上面兩個過程進行。首先是根據元素構建堆,然後將堆的根節點取出(一般是與最後一個節點進行交換),將前面len-1個節點繼續進行堆調整的過程,然後再將根節點取出,這樣一直到所有節點都取出。
代碼:
def BuildHeap(seq):
length = len(seq)
for i in range(0, int((length / 2)))[::-1]:
AdjustHeap(seq, i, length)
def AdjustHeap(seq, root, length):
lchild = 2 * root + 1
rchild = 2 * root + 2
rootmax = root
if lchild < length and seq[lchild] > seq[rootmax]:
rootmax = lchild
if rchild < length and seq[rchild] > seq[rootmax]:
rootmax = rchild
if rootmax != root:# 如果做了堆調整,則rootmax的值等於左節點或者右節點的,進行對調值操作
seq[rootmax], seq[root] = seq[root], seq[rootmax]
AdjustHeap(seq, rootmax, length)
def HeapSort(seq):
length = len(seq)
BuildHeap(seq)#建立初始堆
for i in range(0, length)[::-1]:
seq[0], seq[i] = seq[i], seq[0]#將根節點取出與最後一位做對調
AdjustHeap(seq, 0, i)#對前面len-1個節點繼續進行堆調整過程
return seq
if __name__ == "__main__":
l = [2, 1]
print(l)
HeapSort(l)
print(l)
其中,[::-1]第一個參數表示起始點包括起始點,第二個參數表示結束點但不包括結束點,最後一個參數如果爲負的話,需要保證第一個參數大於第二個參數,表示依次遞減逆序,否則會輸出空列表。
優點:
只需做n-1趟排序,選出較大的n-1個關鍵字即可以使得文件有序。
缺點:
由於建初始堆所需的比較次數較多,所以堆排序不適宜於記錄數較少的文件。
複雜度:
時間複雜度爲O(nlogn),空間複雜度爲O(1),是一種不穩定的排序算法。
(排序的穩定性是指如果在排序的序列中,存在前後相同的兩個元素時,排序前和排序後他們的相對位置不發生變化。)
(建堆的時間複雜度是O(n),調整堆的時間複雜度是lgn,調用了n-1次,所以堆排序的時間複雜度是O(nlgn) )