堆的應用

原創

lim要不断刷新lim

2018-08-27 18:21

第一個是ali的面試題：

第一題是本週淘寶上有5億個商品成交數據，讓你找出銷量最高的10000個商品。

直接想起來優先隊列也就是堆。從而引出堆的一個重要的應用------大數據

【適用範圍】
海量數據前n大，並且n比較小，堆可以放入內存

基本原理及要點：最大堆求前n小，最小堆求前n大。方法，比如求前n小，我們比較當前元素與最大堆裏的最大元素，如果它小於最大元素，則應該替換那個最大元素。這樣最後得到的n個元素就是最小的n個。適合大數據量，求前n小，n的大小比較小的情況，這樣可以掃描一遍即可得到所有的前n元素，效率很高。（爲什麼說使用堆效率很高，一般的優先隊列效率比較低麼？進行對比分析,。見《數據結構》P125）

第二題：題目介紹：

輸入爲不斷地數字流，實時顯示出當前已經輸入的數字序列的中位數

雙堆，一個最大堆與一個最小堆結合，可以用來維護中位數。

解答：

求中位數的方法很多，對於大數據量最經典是桶的計數方法，但是對於這個問題不適用，因爲數據是不斷變化的

可以用最大堆和最小堆來解答這個問題：

1.假設當前的中位數爲m，其中最大堆維護的是<=m的數字序列，最小堆維護的是>=m的數字序列，但是兩個堆都不包含m

2.當新的數字到達時，比如爲a，將a與m進行比較，若a<=m 則將其加入到最大堆中，否則將其加入到最小堆中

3.如果此時最小堆和最大堆的元素個數的差值>=2 ，則將m加入到元素個數少的堆中，然後從元素個數多的堆將根節點賦值到m，最後重建兩個最大堆和最小堆，返回到2（複雜度爲建堆的複雜度O（nlogn））

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

算法複雜度漸近符號總結

本文根據算法導論第三章總結，但其中加入了我對本章的一些補充，並且配合算法導論習題進行講解。相信本文會讓你對漸近記號有更深入地理解。一、定義介紹對於某個比較簡單的算法，我們有時候確實能夠精確地分析出算法的複雜度，比如算法複雜度爲

2020-07-07 16:10:03

尋找第二小元素

《算法導論》第三版9.1-1 把n個元素分成一對對，每一對進行一次比較得出一個較小值，這是第一輪篩選，以此類推，一共進行⌈ lgn⌉ 輪篩選，n-1次比較。第二小的元素一定在某一輪篩選中與最小的進行比較被PK掉了，但是不能確定是

2020-07-06 17:25:41

《算法導論》學習之旅-第十二章-二叉搜索樹

文章目錄序言什麼是二叉搜索樹查詢二叉搜索樹查找最大關鍵字元素和最小關鍵字元素前驅和後繼插入和刪除插入刪除總結序言搜索樹數據結構支持許多動態集合操作，包括：SEARCH, MINIMUM, MAXIMUM, INSERT, D

2020-07-08 10:23:22

《算法導論》學習之旅-第十一章-散列表

文章目錄序言直接尋址表散列表通過鏈接法解決衝突散列函數除法散列法乘法散列法全域散列表開放尋址法線性探測法平方探測法雙重散列法序言許多應用需要一種動態集合結構，他至少支持插入，查找，刪除等字典操作。而散列表就是一種實現字典操作

2020-07-08 10:23:22

《算法導論》-讀書筆記-第七章-快速排序(QUICKSORT)

序言快速排序，顧名思義就是具有較快的排序速度，它利用了跟歸併排序一樣的分治思想。它同時是一種原址性的排序方法，最好情況下的時間複雜度爲O(nlgn)，最壞情況下的時間複雜度爲O(n2)。快速排序的描述快速排序利用的是分治

2020-07-08 10:23:21

《算法導論》學習之旅-第十五章-動態規劃

序言書中介紹動態規劃比較複雜，看得不是特別地懂，我將從我自己理解的動態規劃來做一些記錄和介紹。什麼是動態規劃在說動態規劃之前，我們先談一談斐波那契數列。斐波那契數列是第n個元素和第n-1個和第n-2個元素之和即 f(n) =

2020-07-08 10:23:21

《算法導論》學習筆記-第八章-線性時間排序（Linear_time Sort）

文章目錄序言排序算法的下界決策樹模型（decision-tree model）最壞情況的下界計數排序基數排序桶排序結語序言前面的章節主要講述的排序算法都是通過比較來得到已排序好的數列，我們通常稱這一類排序算法爲比較排序。比如

2020-07-08 10:23:21

《算法導論》學習之旅-第十章-基本數據結構

文章目錄序言棧和隊列棧隊列鏈表鏈表的搜索鏈表的插入鏈表的刪除指針和對象的實現對象的多數組表示對象的單數組表示有根樹的表示二叉樹分支無限制的有根樹序言在本章中，我們將會討論如何使用指針的基本數據結構來構造動態集合，下面主要介紹

2020-07-08 10:23:21

帶路徑壓縮的並查集C/C++模板

拿下面一道入門並查集的題作爲例子重點在於father數組、getFather函數、union函數這篇博文的目的是記錄下並查集的模板！題目背景若某個家族人員過於龐大，要判斷兩個是否是親戚，確實還很不容易，現在給出某個親戚關係圖，

2020-07-08 10:21:35

用先序序列和中序序列創建二叉樹

題目描述輸入格式第一行：樹的中序遍歷第二行：同樣的樹的前序遍歷輸出格式單獨的一行表示該樹的後序遍歷。輸入輸出樣例輸入 #1複製 ABEDFCHG CBADEFGH 輸出 #1複製 AEFDBHGC 模板如下：重在

2020-07-08 10:21:35

《算法導論》爲什麼經典

長期以來，我對於是否要在博客上寫非技術類的東西取決不下。同是從0開頭學習技術，一定會遇到許多相似的問題，我把它們記下來，還會給人以幫助。但是非技術類的東西，寫了也是給自己看的，在沒有從“對小我的思考”轉變爲“對大我的思考”之前(看了劉未鵬

爱你的人总会到来

2020-07-07 15:28:49

《算法導論》學習心得（三）—— 歸併排序（Java）

源碼下載。看書看到第二部分了——排序，排序的算法主要有插入排序，歸併排序，冒泡排序，堆排序，快速排序，計數排序，基數排序和桶排序，本文就先講插入排序，歸併排序和冒泡排序。冒泡排序——它重複地走訪過要排序的數列，一次比較兩個

小小程序猿_

2020-07-07 00:27:21

《算法導論》學習心得（四）—— 堆排序（Java）

堆排序是一種很常見的排序方法，它的思想是利用數據結構--堆。具體的實現細節： 1. 構建一個最大堆。對於給定的包含有n個元素的數組A[n]，構建一個最大堆（最大堆的特性是，某個節點的值最多和其父節點的值一樣大。這樣，堆中的最大元素存放在根

小小程序猿_

2020-07-07 00:27:11

最壞情況爲線性時間的選擇算法之Python實現

算法導論第三版，9.3 import random import math #returns the number of elements that smaller than x #the input is A[p...r] in

2020-07-06 17:25:52

找出數組X和Y中所有2n個元素的中位數

算法導論第三版，9.3-8 算法：如果兩個數組長度爲1，選出較小的那個一個否則，取出兩個數組的中位數。取有較大中位數的數組的低區和較低中位數數組的高區，組合成新的長度爲n的數組。找出新數組的中位數思路：既然用遞

2020-07-06 17:25:52

24小時熱門文章

最新文章

最新評論文章