【數據結構與算法之美】紅黑樹（上）：爲什麼工程中都用紅黑樹這種二叉樹？

原創

2020-03-14 17:31

目錄

一、什麼是“平衡二叉查找樹”？

二、如何定義一棵“紅黑樹”？

三、課後思考

一、什麼是“平衡二叉查找樹”？

1. 二叉樹中任意一個節點的左右子樹的高度相差不能大於 1。

2. 完全二叉樹、滿二叉樹其實都是平衡二叉樹，但是非完全二叉樹也有可能是平衡二叉樹。

3. AVL 樹嚴格符合平衡二叉查找樹的定義，即任何節點的左右子樹高度相差不超過 1，是一種高度平衡的二叉查找樹。

4.紅黑樹非嚴格定義的平衡二叉查找樹，它從根節點到各個葉子節點的最長路徑，有可能會比最短路徑大一倍。

5.發明平衡二叉查找樹這類數據結構的初衷是，解決普通二叉查找樹在頻繁的插入、刪除等動態更新的情況下，出現時間複雜度退化的問題。

6.平衡二叉查找樹中“平衡”的意思，其實就是讓整棵樹左右看起來比較“對稱”、比較“平衡”，不要出現左子樹很高、右子樹很矮的情況。這樣就能讓整棵樹的高度相對來說低一些，相應的插入、刪除、查找等操作的效率高一些。

7.只要樹的高度不比 log2n 大很多（比如樹的高度仍然是對數量級的），儘管它不符合我們前面講的嚴格的平衡二叉查找樹的定義，但我們仍然可以說，這是一個合格的平衡二叉查找樹；

8.平衡二叉查找樹其實有很多，比如，Splay Tree（伸展樹）、Treap（樹堆）。

二、如何定義一棵“紅黑樹”？

1.紅黑樹的英文是“Red-Black Tree”，簡稱 R-B Tree。它是一種不嚴格的平衡二叉查找樹

2.定義：紅黑樹中的節點，一類被標記爲黑色，一類被標記爲紅色，幾個要求：

1）根節點是黑色的；

2）每個葉子節點都是黑色的空節點（NIL），也就是說，葉子節點不存儲數據；

3）任何相鄰的節點都不能同時爲紅色，也就是說，紅色節點是被黑色節點隔開的；

4）每個節點，從該節點到達其可達葉子節點的所有路徑，都包含相同數目的黑色節點；

5）第二點要求“葉子節點都是黑色的空節點”，它主要是爲了簡化紅黑樹的代碼實現而設置的；

3.爲什麼說紅黑樹是“近似平衡”的？

1）平衡”的意思可以等價爲性能不退化，“近似平衡”就等價爲性能不會退化的太嚴重。

2）首先，我們來看，如果我們將紅色節點從紅黑樹中去掉，那單純包含黑色節點的紅黑樹的高度是多少呢？

3）我們現在知道只包含黑色節點的“黑樹”的高度，那我們現在把紅色節點加回去，高度會變成多少呢？

4）在紅黑樹中，紅色節點不能相鄰，也就是說，有一個紅色節點就要至少有一個黑色節點，將它跟其他紅色節點隔開。紅黑樹中包含最多黑色節點的路徑不會超過 log2n，所以加入紅色節點之後，最長路徑不會超過 2log2n，也就是說，紅黑樹的高度近似 2log2n。

5）紅黑樹的高度只比高度平衡的 AVL 樹的高度（log2n）僅僅大了一倍，在性能上，下降得並不多。這樣推導出來的結果不夠精確，實際上紅黑樹的性能更好。

三、課後思考

1.爲什麼工程中都喜歡用紅黑樹，而不是其他平衡二叉查找樹呢？

1）AVL 樹是一種高度平衡的二叉樹，所以查找的效率非常高，但是，有利就有弊，AVL 樹爲了維持這種高度的平衡，就要付出更多的代價。每次插入、刪除都要做調整，就比較複雜、耗時。所以，對於有頻繁的插入、刪除操作的數據集合，使用 AVL 樹的代價就有點高了。

2）紅黑樹只是做到了近似平衡，並不是嚴格的平衡，所以在維護平衡的成本上，要比 AVL 樹要低。

3）所以，紅黑樹的插入、刪除、查找各種操作性能都比較穩定。對於工程應用來說，要面對各種異常情況，爲了支撐這種工業級的應用，我們更傾向於這種性能穩定的平衡二叉查找樹。

4）紅黑樹是一種平衡二叉查找樹。它是爲了解決普通二叉查找樹在數據更新的過程中，複雜度退化的問題而產生的。紅黑樹的高度近似 log2n，所以它是近似平衡，插入、刪除、查找操作的時間複雜度都是 O(logn)。

5）因爲紅黑樹是一種性能非常穩定的二叉查找樹，所以，在工程中，但凡是用到動態插入、刪除、查找數據的場景，都可以用到它。不過，它實現起來比較複雜，如果自己寫代碼實現，難度會有些高，這個時候，我們其實更傾向用跳錶來替代它。

2.動態數據結構支持動態地數據插入、刪除、查找操作，除了紅黑樹，我們前面還學習過哪些呢？能對比一下各自的優勢、劣勢，以及應用場景嗎？

動態數據結構是支持動態的更新操作，裏面存儲的數據是時刻在變化的，通俗一點講，它不僅僅支持查詢，還支持刪除、插入數據。而且，這些操作都非常高效。如果不高效，也就算不上是有效的動態數據結構了。所以，這裏的紅黑樹算一個，支持動態的插入、刪除、查找，而且效率都很高。鏈表、隊列、棧實際上算不上，因爲操作非常有限，查詢效率不高。那現在你再想一下還有哪些支持動態插入、刪除、查找數據並且效率都很高的的數據結構呢？

1）哈希鏈表
優勢：高效地數據插入、刪除、隨機查找元素。
缺點：需要設計一個好的散列函數，把元素均勻分散到散列表中。
適用場景：適用於在海量數據中隨機訪問數據的場合。

2）跳錶
優勢：高效地查找、插入、刪除數據。
缺點：需要額外的空間來構建索引鏈表
適用場景：適用於需要高效查找數據的場合。

3）二叉查找樹
優勢：高效地查找、插入、刪除數據，實現簡單。
缺點：需要動態地維護左右子樹的高度平衡，否則數據查找會退化成鏈表的順序查找。
適用場景：適用於需要高效查找數據的場合。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

數據結構算法---遞歸

一、遞歸思想　　遞歸的思想就是把一個問題分解成一個個的子問題和子子問題，然後這些子問題逐級返回，得到最終結果。總結一下遞歸需要滿足的幾個條件：一個問題的解可以分解爲幾個子問題的解。問題與子問題，求解思路完全一樣。存在遞

2020-07-06 04:20:28

回溯法經典—n-皇后問題

n-皇后問題是回溯法中經典中的經典，其基本問題描述是:在一個nxn的格子中放n個皇后，使得每個皇后不能相互攻擊，任意兩個皇后能夠互相攻擊的條件是他們在同一條對角線或者同一行或者同一列上問題可以轉換爲從第0行開始放置皇后一直放到n-1行，

闪电侠的博客

2020-07-06 18:29:00

LRJ生成可重複的排列

#include <iostream> using namespace std; void print_emu(int a[], int x[], int n, int cur) { if (cur == 3) { for

闪电侠的博客

2020-07-06 18:28:59

杭電oj 2544 固定起點終點最短路徑解題報告

注:鄙人最近按照此分類來刷題，假期的最低限度是刷掉所有的DP類，並且每一道題目寫一個解題報告，如果有志同道合的朋友，歡迎加QQ 823797837共同學習交流，也可以加羣ACM新手羣161986576，老鳥飛過 Prob

闪电侠的博客

2020-07-06 18:28:59

杭電2059解題報告

Problem Description 據說在很久很久以前，可憐的兔子經歷了人生中最大的打擊——賽跑輸給烏龜後，心中鬱悶，發誓要報仇雪恨，於是躲進了杭州下沙某農業園臥薪嚐膽潛心修煉，終於練成了絕技，能夠毫不休息得以恆定的速度(VR m

闪电侠的博客

2020-07-06 18:28:59

回溯算法：子集樹和排列樹

假設現在有一列數a[0],a[1], ...a[n-1] ①如果一個問題的解的長度不是固定的，並且解和元素順序無關，即可以從中選擇0個或多個，那麼解空間的個數將是指數級別的，爲2^n,可以用下面的子集樹來表示所有的解(假設這裏n=4)

闪电侠的博客

2020-07-06 18:28:59

把一個字符串的大寫字母放到字符串的後面，各個字符的相對位置不變，不能申請額外的空間

例如AbcDeFGhi ->bceiADFG 這道題目是今年騰訊的面試題，我的想法是基於冒泡的思想，從頭開始掃描，遇到小寫字母就往前面冒初始：AbcDeFGhi 冒'b'： bAcDeFGhi 冒'c'： bcADeFGhi 冒'e'：

闪电侠的博客

2020-07-06 18:28:59

c++中關於explicit的一些總結

首先看下以下代碼 #include <iostream> using namespace std; class A { public: A(int v): value(v) { cout << "構造" << endl;}

闪电侠的博客

2020-07-06 18:28:59

如何判斷一個單鏈表有環，並且求出交匯處

單鏈表有環的情景如下，爲了方便起見，假定入口之前的鏈表長度爲L，循環長度爲K 循環鏈表示意圖我們可以用兩個指針，p1每次移動一格，p2每次移動兩格，初始化都爲頭結點HEAD 隨着指針慢慢推進，一定會出現以下的情況某一時刻兩指

闪电侠的博客

2020-07-06 18:28:59

杭電1176解題報告

原題見這裏關於解題的詳細步驟都已經在代碼註釋裏面了，這裏一定要注意，剛開始gameboy在位置5,因此在第5秒鐘之前，他的活動範圍有限，所以，在循環的時候j的範圍不一定能從0到10 #include <iostream> using

闪电侠的博客

2020-07-06 18:28:59

數據結構算法---二叉樹

一、二叉樹　　在計算機科學中，二叉樹是每個結點最多有兩個子樹的樹結構。通常子樹被稱作“左子樹”（left subtree）和“右子樹”（right subtree）。二叉樹常被用於實現二叉查找樹和二叉堆。　　一棵深度爲k，且有

2020-07-06 04:20:28

數組——數據結構與算法之美【基礎篇】

數組——數據結構與算法之美【基礎篇】什麼是數組線性表連續的內存空間和相同類型的數據爲什麼數組要從0開始編碼什麼是數組線性表數組是一種線性表數據結構，它用一組連續的內存空間，來存儲一組具有相同類型的數據每個線性表上的數據最

2020-07-06 03:14:30

實現佔位符替換接口，同printf

導航語音實現方案(文尾附有源碼) 函數接口如下 char *textTranslate(char *content, …) content：可變參列表中的固定參，包含佔位符的字符串； …：可變參數；返回值：爲替換後的字符串使用

2020-07-04 17:47:17

Java方式實現二叉樹的前中後序遍歷的遞歸及非遞歸算法

最近在研究數據結構算法，發現許多樹類的算法都很靈活，所以研究了一下基礎二叉樹的遞歸以及非遞歸的三種遍歷方式，在這裏記錄下來方便以後回憶。以該樹爲例：二叉樹的遍歷爲三種：前序遍歷、中序遍歷、後續遍歷。前序遍歷（先根遍歷）

追风de少年_SHAOFENG

2020-07-04 13:45:32

AES加密算法原理及java android實現

AES當今最流行的對稱加密算法之一，是DES的替代者。密鑰是AES算法實現加密和解密的根本。對稱加密算法之所以對稱，是因爲這類算法對明文的加密和解密需要使用同一個密鑰。 AES支持三種長度的密鑰：128位，192位，256位平時大家所

2020-07-02 23:37:18

24小時熱門文章

最新文章

最新評論文章