【數據結構與算法之美】跳錶：爲什麼Redis一定要用跳錶來實現有序集合？（Redis跳錶、ConcurrentSkipListMap、紅黑樹、TreeMap）

原創

2020-06-20 03:30

目錄

一、什麼是跳錶？

二、跳錶的時間複雜度？

三、跳錶的空間複雜度及如何優化？

四、高效的動態插入和刪除？

五、跳錶索引動態更新？

六、課後作業

一、什麼是跳錶？

爲一個值有序的鏈表建立多級索引，比如每2個節點提取一個節點到上一級，我們把抽出來的那一級叫做索引或索引層。如下圖所示，其中down表示down指針，指向下一級節點。以此類推，對於節點數爲n的鏈表，大約可以建立log2n-1級索引。像這種爲鏈表建立多級索引的數據結構就稱爲跳錶。

加來一層索引之後，查找一個結點需要遍歷的結點個數減少了，也就是說查找效率提高了；

Redis用跳錶來實現有序集合；

二、跳錶的時間複雜度？

1.計算跳錶的高度
如果鏈表有n個節點，每2個節點抽取抽出一個節點作爲上一級索引的節點，那第1級索引的節點個數大約是n/2，第2級索引的節點個數大約是n/4，依次類推，第k級索引的節點個數就是n/(2^k)。假設索引有h級別，最高級的索引有2個節點，則有n/(2^h)=2，得出h=log2n-1，包含原始鏈表這一層，整個跳錶的高度就是log2n。
2.計算跳錶的時間複雜度
假設我們在跳錶中查詢某個數據的時候，如果每一層都遍歷m個節點，那在跳錶中查詢一個數據的時間複雜度就是O(m*logn)。那這個m是多少呢？如下圖所示，假設我們要查找的數據是x，在第k級索引中，我們遍歷到y節點之後，發現x大於y，小於後面的節點z，所以我們通過y的down指針，從第k級下降到第k-1級索引。在第k-1級索引中，y和z之間只有3個節點（包含y和z），所以，我們在k-1級索引中最多隻需要遍歷3個節點，以此類推，每一級索引都最多隻需要遍歷3個節點。所以m=3。因此在跳錶中查詢某個數據的時間複雜度就是O(logn)。

三、跳錶的空間複雜度及如何優化？

1.計算索引的節點總數
如果鏈表有n個節點，每2個節點抽取抽出一個節點作爲上一級索引的節點，那每一級索引的節點數分別爲：n/2，n/4，n/8，…，8，4，2，等比數列求和n-1，所以跳錶的空間複雜度爲O(n)。
2.如何優化時間複雜度
如果鏈表有n個節點，每3或5個節點抽取抽出一個節點作爲上一級索引的節點，那每一級索引的節點數分別爲（以3爲例）：n/3，n/9，n/27，…，27，9，3，1，等比數列求和n/2，所以跳錶的空間複雜度爲O(n)，和每2個節點抽取一次相比，時間複雜度要低不少呢。

四、高效的動態插入和刪除？

跳錶本質上就是鏈表，所以僅插作，插入和刪除操時間複雜度就爲O(1)，但在實際情況中，要插入或刪除某個節點，需要先查找到指定位置，而這個查找操作比較費時，但在跳錶中這個查找操作的時間複雜度是O(logn)，所以，跳錶的插入和刪除操作的是時間複雜度也是O(logn)。

五、跳錶索引動態更新？

當往跳錶中插入數據的時候，可以選擇同時將這個數據插入到部分索引層中，那麼如何選擇這個索引層呢？可以通過隨機函數來決定將這個節點插入到哪幾級索引中，比如隨機函數生成了值K，那就可以把這個節點添加到第1級到第K級索引中。

六、課後作業

1. 爲什麼 Redis 要用跳錶來實現有序集合，而不是紅黑樹？

解答：插入、刪除、查找以及迭代輸出有序序列這幾個操作，紅黑樹也可以完成，時間複雜度跟跳錶是一樣的。但是，按照區間來查找數據這個操作，紅黑樹的效率沒有跳錶高。對於按照區間查找數據這個操作，跳錶可以做到 O(logn) 的時間複雜度定位區間的起點，然後在原始鏈表中順序往後遍歷就可以了。這樣做非常高效。

Redis 之所以用跳錶來實現有序集合，還有其他原因，比如，跳錶更容易代碼實現。雖然跳錶的實現也不簡單，但比起紅黑樹來說還是好懂、好寫多了，而簡單就意味着可讀性好，不容易出錯。還有，跳錶更加靈活，它可以通過改變索引構建策略，有效平衡執行效率和內存消耗。

1. 跳錶如果每三個或者五個結點提取一個結點作爲上級索引，對應的在跳錶中查詢數據的時間複雜度是多少呢？

解答：如果每三個或者五個節點提取一個節點作爲上級索引，那麼對應的查詢數據時間複雜度，應該也還是 O(logn)。
假設每 5 個節點提取，那麼最高一層有 5 個節點，而跳錶高度爲 log5n，每層最多需要查找 5 個節點，即 O(mlogn) 中的 m = 5，最終，時間複雜度爲 O(logn)。
空間複雜度也還是 O(logn)，雖然省去了一部分索引節點，但是似乎意義不大。
參考跳錶的 Java 實現ConcurrentSkipListMap。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

數據結構算法---遞歸

一、遞歸思想　　遞歸的思想就是把一個問題分解成一個個的子問題和子子問題，然後這些子問題逐級返回，得到最終結果。總結一下遞歸需要滿足的幾個條件：一個問題的解可以分解爲幾個子問題的解。問題與子問題，求解思路完全一樣。存在遞

2020-07-06 04:20:28

回溯法經典—n-皇后問題

n-皇后問題是回溯法中經典中的經典，其基本問題描述是:在一個nxn的格子中放n個皇后，使得每個皇后不能相互攻擊，任意兩個皇后能夠互相攻擊的條件是他們在同一條對角線或者同一行或者同一列上問題可以轉換爲從第0行開始放置皇后一直放到n-1行，

闪电侠的博客

2020-07-06 18:29:00

LRJ生成可重複的排列

#include <iostream> using namespace std; void print_emu(int a[], int x[], int n, int cur) { if (cur == 3) { for

闪电侠的博客

2020-07-06 18:28:59

杭電oj 2544 固定起點終點最短路徑解題報告

注:鄙人最近按照此分類來刷題，假期的最低限度是刷掉所有的DP類，並且每一道題目寫一個解題報告，如果有志同道合的朋友，歡迎加QQ 823797837共同學習交流，也可以加羣ACM新手羣161986576，老鳥飛過 Prob

闪电侠的博客

2020-07-06 18:28:59

杭電2059解題報告

Problem Description 據說在很久很久以前，可憐的兔子經歷了人生中最大的打擊——賽跑輸給烏龜後，心中鬱悶，發誓要報仇雪恨，於是躲進了杭州下沙某農業園臥薪嚐膽潛心修煉，終於練成了絕技，能夠毫不休息得以恆定的速度(VR m

闪电侠的博客

2020-07-06 18:28:59

回溯算法：子集樹和排列樹

假設現在有一列數a[0],a[1], ...a[n-1] ①如果一個問題的解的長度不是固定的，並且解和元素順序無關，即可以從中選擇0個或多個，那麼解空間的個數將是指數級別的，爲2^n,可以用下面的子集樹來表示所有的解(假設這裏n=4)

闪电侠的博客

2020-07-06 18:28:59

把一個字符串的大寫字母放到字符串的後面，各個字符的相對位置不變，不能申請額外的空間

例如AbcDeFGhi ->bceiADFG 這道題目是今年騰訊的面試題，我的想法是基於冒泡的思想，從頭開始掃描，遇到小寫字母就往前面冒初始：AbcDeFGhi 冒'b'： bAcDeFGhi 冒'c'： bcADeFGhi 冒'e'：

闪电侠的博客

2020-07-06 18:28:59

c++中關於explicit的一些總結

首先看下以下代碼 #include <iostream> using namespace std; class A { public: A(int v): value(v) { cout << "構造" << endl;}

闪电侠的博客

2020-07-06 18:28:59

如何判斷一個單鏈表有環，並且求出交匯處

單鏈表有環的情景如下，爲了方便起見，假定入口之前的鏈表長度爲L，循環長度爲K 循環鏈表示意圖我們可以用兩個指針，p1每次移動一格，p2每次移動兩格，初始化都爲頭結點HEAD 隨着指針慢慢推進，一定會出現以下的情況某一時刻兩指

闪电侠的博客

2020-07-06 18:28:59

杭電1176解題報告

原題見這裏關於解題的詳細步驟都已經在代碼註釋裏面了，這裏一定要注意，剛開始gameboy在位置5,因此在第5秒鐘之前，他的活動範圍有限，所以，在循環的時候j的範圍不一定能從0到10 #include <iostream> using

闪电侠的博客

2020-07-06 18:28:59

數據結構算法---二叉樹

一、二叉樹　　在計算機科學中，二叉樹是每個結點最多有兩個子樹的樹結構。通常子樹被稱作“左子樹”（left subtree）和“右子樹”（right subtree）。二叉樹常被用於實現二叉查找樹和二叉堆。　　一棵深度爲k，且有

2020-07-06 04:20:28

數組——數據結構與算法之美【基礎篇】

數組——數據結構與算法之美【基礎篇】什麼是數組線性表連續的內存空間和相同類型的數據爲什麼數組要從0開始編碼什麼是數組線性表數組是一種線性表數據結構，它用一組連續的內存空間，來存儲一組具有相同類型的數據每個線性表上的數據最

2020-07-06 03:14:30

實現佔位符替換接口，同printf

導航語音實現方案(文尾附有源碼) 函數接口如下 char *textTranslate(char *content, …) content：可變參列表中的固定參，包含佔位符的字符串； …：可變參數；返回值：爲替換後的字符串使用

2020-07-04 17:47:17

Java方式實現二叉樹的前中後序遍歷的遞歸及非遞歸算法

最近在研究數據結構算法，發現許多樹類的算法都很靈活，所以研究了一下基礎二叉樹的遞歸以及非遞歸的三種遍歷方式，在這裏記錄下來方便以後回憶。以該樹爲例：二叉樹的遍歷爲三種：前序遍歷、中序遍歷、後續遍歷。前序遍歷（先根遍歷）

追风de少年_SHAOFENG

2020-07-04 13:45:32

AES加密算法原理及java android實現

AES當今最流行的對稱加密算法之一，是DES的替代者。密鑰是AES算法實現加密和解密的根本。對稱加密算法之所以對稱，是因爲這類算法對明文的加密和解密需要使用同一個密鑰。 AES支持三種長度的密鑰：128位，192位，256位平時大家所

2020-07-02 23:37:18

24小時熱門文章

最新文章

最新評論文章