漫畫 | 什麼是跳躍表？

原創

2019-02-14 15:13

轉自：https://baijiahao.baidu.com/s?id=1571323359136961&wfr=spider&for=pc

幾天以前......

幾天之後......

拍賣行的商品總數量有幾十萬件，對應數據庫商品表的幾十萬條記錄。

如果是按照商品名稱精確查詢還好辦，可以直接從數據庫查出來，最多也就上百條記錄。

如果是沒有商品名稱的全量查詢怎麼辦？總不可能把數據庫裏的所有記錄全查出來吧，而且還要支持不同字段的排序。

所以，只能提前在內存中存儲有序的全量商品集合，每一種排序方式都保存成獨立的集合，每次請求的時候按照請求的排序種類，返回對應的集合。

比如按價格字段排序的集合：

比如按等級字段排序的集合：

需要注意的是，當時還沒有Redis這樣的內存數據庫，所以小灰只能自己實現一套合適的數據結構來存儲。

拍賣行商品列表是線性的，最容易表達線性結構的自然是數組和鏈表。可是，無論是數組還是鏈表，在插入新商品的時候，都會存在性能問題。

按照商品等級排序的集合爲例，如果使用數組，插入新商品的方式如下：

如果要插入一個等級是3的商品，首先要知道這個商品應該插入的位置。使用二分查找可以最快定位，這一步時間複雜度是O（logN）。

插入過程中，原數組中所有大於3的商品都要右移，這一步時間複雜度是O（N）。所以總體時間複雜度是O（N）。

如果使用鏈表，插入新商品的方式如下：

如果要插入一個等級是3的商品，首先要知道這個商品應該插入的位置。鏈表無法使用二分查找，只能和原鏈表中的節點逐一比較大小來確定位置。這一步的時間複雜度是O（N）。

插入的過程倒是很容易，直接改變節點指針的目標，時間複雜度O（1）。因此總體的時間複雜度也是O（N）。

這對於擁有幾十萬商品的集合來說，這兩種方法顯然都太慢了。

——————————————

新節點和各層索引節點逐一比較，確定原鏈表的插入位置。O（logN）

把索引插入到原鏈表。O（1）

利用拋硬幣的隨機方式，決定新節點是否提升爲上一級索引。結果爲“正”則提升並繼續拋硬幣，結果爲“負”則停止。O（logN）

總體上，跳躍表插入操作的時間複雜度是O（logN），而這種數據結構所佔空間是2N，既空間複雜度是 O（N）。

自上而下，查找第一次出現節點的索引，並逐層找到每一層對應的節點。O（logN）

刪除每一層查找到的節點，如果該層只剩下1個節點，刪除整個一層（原鏈表除外）。O（logN）

總體上，跳躍表刪除操作的時間複雜度是O（logN）。

小灰和大黃並不知道，他們的這一解決方案和若干年後Redis當中的Sorted-set不謀而合。而Sorted-set這種有序集合，正是對於跳躍表的改進和應用。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

這可能是最簡單的AVL二叉平衡查找樹講解

二叉平衡查找樹AVL詳解看懂這篇文章所需的知識點樹、二叉搜索樹、樹高、樹深、層等概念 AVL樹概念：任意節點的左右子樹的高度差不能大於1的樹即爲AVL樹，是爲了解決在頻繁插入刪除等動態更新下出現的時間複雜度退化的問題，所以平

2020-07-08 11:54:55

數據結構：AVL樹旋轉原理和簡易實現

AVL樹旋轉原理和簡易實現二叉搜索樹雖然可以提高搜索效率，但是如果插入的數據有序時很有可能變成單支，如果變成單支樹的時候，那麼查找時效率也不高了。因此引入AVL樹。 AVL樹是當向這棵樹插入節點的時候，要保證每個節點的左右子樹的

2020-07-08 12:19:01

數據結構：紅黑樹的旋轉原理和模擬實現

紅黑樹的旋轉原理和模擬實現我們瞭解到AVL樹雖然效率很高，但是它是通過多次的旋轉纔到達一個絕對的平衡，旋轉的消耗其實也很大。因此開始引入近似平衡的一棵樹----紅黑樹（RBTree）。紅黑樹每一個節點不是紅色的就是黑色的，它保證

2020-07-08 12:19:01

數據結構：大數據處理問題

1.給定100億個整數，設計算法找到只出現一次的整數？ ①方法一 100億個整數就是400億個字節，42億九千萬是4G，那麼1G就是10億字節，所以要存下100億個整數需要40G的內存空間。因此我們採用位圖100億個整數大概就是1

2020-07-08 12:19:01

數據結構：布隆過濾器

布隆過濾器假如現在有40億個ip地址（string類型），然後給你一個ip地址，讓你查找這個ip地址在不在這40億個ip地址裏？我們應該怎麼做呢？如果用哈希表來處理的話，這裏有40億的數據，數據量太大，因此太佔用空間如果用

2020-07-08 12:19:01

樹上剖分

————————————————18.4.18更新有時我們會遇到這樣的問題：在一棵樹上，每次詢問兩點間路徑上的和或者是最值。但我們用搜索時，時間就會到O（n），這樣根本就完不成算法。但樹上剖分就可以縮短修改的時間。樹上剖分的算法簡介我們定

蒟蒻午时已到

2020-07-08 11:59:23

2.7 封裝Request

request作爲前後臺交換的橋樑，有重要作用。 request常用的方法有讀參數：public String getParameter(String paramName);讀取屬性public Object getAttribut

2020-07-08 11:48:30

樹的總結（二）---非空二叉樹的高度和寬度

1.非空二叉樹的高度 1.1非遞歸算法實現求解非空二叉樹的高度算法思想：採用層次遍歷的算法，設置變量level記錄當前結點所在的層數，設置變量last指向當前層的最右的結點，每次層次遍歷出隊的時候與last指針比較（fron

2020-07-08 11:41:54

樹的總結（一）

考研加油！！！！！！！ 1.1樹的重要概念 1.樹是一種重要的非線性結構；在有n個結點的樹中有n-1條邊； 2.在結點個數爲n(n>1)的各棵樹中，深度最小的樹的深度是多少？它有多少葉子結點？多少分支結點？深度最大的樹的深度是多少？它有多

2020-07-08 11:41:54

【劍指offer】題61：二叉樹序列化、反序列化

使用stringstream http://blog.csdn.net/xw20084898/article/details/21939811 stringstream 是 C++ 提供的另一個字串型的串流(stream)

2020-07-08 11:22:52

基本數據結構——線性結構（棧）

1.什麼是線性結構線性結構是一種有序數據項的集合，其中每個數據項都有唯一的前驅和後繼（除了第一個沒有前驅，最後一個沒有後繼）。新的數據項加入到數據集中時，只會加入到原有某個數據項之前或之後。具有這種性質的數據集，就稱爲線性結構。

weixin_38324954

2020-07-08 11:06:52

Trie 前綴樹/字典樹

一、Trie的介紹： 1、主要應用場景：搜索引擎的自動補全功能：Trie樹+詞頻(概率)權重因子 IP路由：最長前綴匹配，Trie路由算法

放羊的大飞

2020-07-08 10:58:58

數據結構——數組（3）在有序數組中找出重複的次數最多的數

先總結有序數組，無序的後面再總結。。 1.以空間換時間法。算法思想：目標數組array[length]，是一個有序數組，比如int array[]={1,1,2,2,4,4,4,4,4,5,5,6,10};總共有13個元素，

2020-07-08 10:38:18

數據結構——數組（1）數組求和&打印二維數組&判斷數組是否遞增

數組求和方法一：直接一次for循環 int GetSum1(int *a,int n) { int sum=0; for (int i=0; i<n;i++) { sum+=a[i];

2020-07-08 10:38:18

藍橋杯遞歸練習覆蓋牆壁

題目描述你有一個長爲N寬爲2的牆壁，給你兩種磚頭：一個長2寬1，另一個是L型覆蓋3個單元的磚頭。如下圖： 0 0 0 00 磚頭可以旋轉，兩種磚頭可以無限制提供。你的任務是計算用這兩種來覆蓋N*2的牆壁的覆蓋方法。例如一個2*3

2020-07-08 10:21:35

24小時熱門文章

最新文章

最新評論文章