(14)堆

一、簡介

    堆數據結構的性質:堆:任何結點的值都小於或等於其孩子的值的完全二叉樹爲小根堆,任何結點的值都大於或等於其孩子的值的完全二叉樹爲大根堆。爲了方便使用完全二叉樹的性質,假定數組從下標1開始。這樣:

leftChild = 2*i;
rightChild = 2*i + 1;
parent = i/2;
    堆數據結構算法分析:

    堆排序的最壞時間複雜度爲O(nlogn)。堆序的平均性能較接近於最壞性能。由於建初始堆所需的比較次數較多,所以堆排序不適宜於記錄數較少的文件。堆排序是就地排序,輔助空間爲O(1)。堆排序是不穩定的。

    堆數據結構實現如下所示:

#include"stdio.h"
inline void swap(int &a,int &b)
{
	int temp=a;
        a=b;
        b=temp;
	
}
void HeapAdjust(int array[],int i,int nLength)//自頂向下調整堆
{
	int nChild;
	int nTemp;//賦值爲待調整的 節點
	 
	for(nTemp=array[i];2*i<nLength;i=nChild)//2*i<nLength說明還有左孩子
	{
		nChild=2*i;//左孩子  
			
		/*一共兩個子節點的話得到 較大的一個*/		   
		if(nChild<nLength-1&&array[nChild+1]>array[nChild])//nChild<nLength-1 判斷到頭沒有
		      ++nChild;
		   
		    /*如果較大子節點大於父節點  將子節點 調整到父節點*/
		if(nTemp<array[nChild])
		      array[i]=array[nChild];
		else
		      break;//這個地方不加 會出錯  第一個會輸出第二個 
		      
                array[nChild]=nTemp;//子節點 等於父節點 (不執行break)
	} 
}
void HeapSort(int a[],int length)
{
	/*初建堆 */
    for(int i=length/2;i>0;--i)//從最後一個 非葉子節點調整 (這裏的  i是下標) 
	   HeapAdjust(a,i,length);
   
    for(int i=length;i>1;--i)
    {
       	  swap(a[1],a[i]);	/*第一個最大元素跟最後一個交換*/

       	  HeapAdjust(a,1,i);//調整堆 (注意 length=i  由於堆是逐漸變小的)
    }
	
}
int main()
{
	int a[10]={0,1,2,5,3,8,4,7,6};
	HeapSort(a,8);
	 
	for(int i=1;i<9;i++)
	   printf("%d\n",a[i]);
	return 0;
}
    利用堆數據結構可實現優先級隊列,優先隊列是0個或多個元素的集合,每個元素都有一個優先權或值,對優先隊列執行的操作有查找、插入一個新元素和刪除。在最小優先隊列(min priority queue)中,查找操作用來搜索優先權最小的元素,刪除操作用來刪除該元素;對於最大優先隊列(max priority queue),查找操作用來搜索優先權最大的元素,刪除操作用來刪除該元素。優先權隊列中的元素可以有相同的優先權,查找與刪除操作可根據任意優先權進行。

    優先級隊列代碼實現如下所示:

#include <iostream>
using namespace std;
template<class T>

class priqueue {
private:
	int	n, maxsize;
	T	*x;
	void swap(int &i, int &j)//根據座標交換數組元素的值
	{	T t = i; i = j; j = t; }
public:
	priqueue(int m)//初始化數組
	{	maxsize = m;
		x = new T[maxsize+1];
		n = 0;
	}
        
	void insert(T t)
	{	int i, p;
		x[++n] = t; //插入的元素放到最後
		for (i = n; i > 1 && x[p=i/2] > x[i]; i = p)    
                    swap(x[p], x[i]);
               
	}
        
	T extractmin()//向下調整堆
	{	           
                int i, c;
		T t = x[1];
		x[1] = x[n--];
                
		for (i = 1; (c=2*i) <= n; i = c) {
			if (c+1<=n && x[c+1]<x[c])
				c++;
			if (x[i] <= x[c])
				break;
			swap(x[c], x[i]);
		}
		return t;
	}
        void print(int n)
        {
                for (int i = 1; i < n; i++) //輸出堆
                        cout << x[i] << " ";
        }
        
};

template<class T>
void pqsort(T v[], int n)//先初始化一個數組,然後插入建立一個堆
{	priqueue<T> pq(n); 
	int i;
	for (i = 0; i < n; i++)
            pq.insert(v[i]);
        cout<<"輸出排序後的堆:";
        pq.print(n);
}

int main()
{	const int	n = 10;
	int	i, v[n];
        /*以下是通過向上調整堆 建立一個10個元素的堆*/
	for (i = 0; i < n; i++)
		v[i] = n-i;      
	pqsort(v, n);
        cout<<"\n執行插入和刪除操作(輸入0代表刪除最小值,輸入其他代表插入)"<<endl;
	priqueue<int> pq(100);
        int count=0;
	while (cin >> i)
		if (i == 0)
                {
                    if(count)
                        cout <<"刪除的最小元素爲:"<<pq.extractmin() << "\n";
                    else
                        cout<<"請先插入元素"<<endl;
                }	
		else
                {
                    pq.insert(i);
                    count++;
                }
	return 0;
}
二、原理

    (1)高效性。堆中所有結點和根結點之間相差的層數在logn之內。因此其執行效率很高,堆排序通過在同一數組中包含兩種抽象結構(堆和元素序列)來避免使用額外空間。

    (2)正確性,即堆數據結構的不變性質。

    (3)抽象性。

    (4)過程抽象。

    (5)抽象數據類型。

三、習題

    (1)習題1:實現基於堆的優先級隊列,儘可能的提高運行速度。

    爲了提高向上調整堆的速度,在x[0]放置哨兵==當前插入的元素。省去了每次都判斷i>1,向上調整堆結束:x[p] <= x[i]。代碼如下:

void insert(T t) //向上調整堆
{	
    int i, p;
    x[++n] = t; //插入的元素放到最後               
    x[0]=t;        
    for (i = n;  x[p=i/2] > x[i]; i = p)    
        swap(x[p], x[i]);       
}

    (2)習題4:如何使用優先級隊列解決下列問題:

    a、構件霍夫曼碼;

    b、計算大型浮點數集合的和;

    c、在存有10億個數的文件中找到最大的100W個數;

    d、將多個較小的有序文件歸併爲一個較大的有序文件;

    解答:

    a、構造哈夫曼樹時候,需要選取當前數組的兩個最小值,刪除兩個最小值,並將計算之和插入原來數組,採用堆,初建堆,兩次調用選取最小值的函數。計算之和之後,調用插入堆並調整堆;b、如果將較小浮點數和較大浮點數相加可能造成丟失精度。所以每次取最小的兩個相加。然後將和插入數組集合。最後剩下一個就是所有浮點數的和;c、典型的topK;d、將所有小文件要插入的當前值組成一個堆。取堆最小值,插入排序數組。調整堆。然後插入該小文件下一個元素(無後繼則不操作)。

    (3)習題7:在一些計算機上,除以2求當前範圍的中點是二分搜索程序中開銷最大的部分。假設我們已經正確構建了待搜索的數組,說明如何使用乘以2的操作來替代除法。給出建立並搜索這樣一個數組的算法。

     修改後的二分搜索從i=1開始,每次迭代將i設置爲2i或2i+1.元素x[1]包含中值,x[2]包含第一個四分位值,x[3]包含第三個四分位值,等等。一種能在O(n)時間內將n元有序數組調整爲“堆搜索”順序的算法。作爲該方法的先驅,考慮把一個2^k-1元的有序數組a拷貝到一個“堆搜索”數組b中:a中奇數位的元素按順序放到b的後半部分,模4餘2位置的元素按順序放到b中剩餘部分的後半部分,等等。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章