夜深人靜寫算法（七）- 線段樹

一、引例

1、區間最值

2、區間求和

二、線段樹的基本概念

1、二叉搜索樹

2、數據域

3、指針表示

4、數組表示

三、線段樹的基本操作

1、構造

2、更新

3、詢問

四、線段樹的經典案例

1、區間最值

2、區間求和

3、區間染色

4、矩形面積並

5、區間K大數

五、線段樹的常用技巧

1、離散化

2、lazy-tag

3、子樹收縮

六、線段樹的多維推廣

1、二維線段樹 - 矩形樹

2、三維線段樹 - 空間樹

七、線段樹相關題集整理

一、引例

1、區間最值

【例題1】給定一個n（n <= 100000）個元素的數組A，有m(m <= 100000)個操作，共兩種操作：

1、Q a b 詢問：表示詢問區間[a, b]的最大值；

2、C a c 更新：表示將第a個元素變成c；

靜態的區間最值可以利用RMQ來解決，但是RMQ的ST算法是在元素值給定的情況下進行的預處理，然後在O(1)時間內進行詢問，這裏第二種操作需要實時修改某個元素的值，所以無法進行預處理。

由於每次操作都是獨立事件，所以m次操作都無法互相影響，於是時間複雜度的改善只能在單次操作上進行優化了，我們可以試想能否將任何的區間[a, b]（a < b）都拆成log(b-a+1)個小區間，然後只對這些拆散的區間進行詢問，這樣每次操作的最壞時間複雜度就變成log(n)了。

2、區間求和

【例題2】給定一個n(n <= 100000)個元素的數組A，有m(m <= 100000)個操作，共兩種操作：

1、Q a b 詢問：表示詢問區間[a, b]的元素和；

2、A a b c 更新：表示將區間[a, b]的每個元素加上一個值c；

先來看樸素算法，兩個操作都用遍歷來完成，單次時間複雜度在最壞情況下都是O(n)的，所以m次操作下來總的時間複雜度就是O(nm)了，複雜度太高。

再來看看樹狀數組，對於第一類操作，樹狀數組可以在log(n)的時間內出解；然而第二類操作，還是需要遍歷每個元素執行add操作，複雜度爲nlog(n)，所以也不可行。這個問題同樣也需要利用區間拆分的思想。

線段樹就是利用了區間拆分的思想，完美解決了上述問題。

二、線段樹的基本概念

1、二叉搜索樹

線段樹是一種二叉搜索樹，即每個結點最多有兩棵子樹的樹結構。通常子樹被稱作“左子樹”（left subtree）和“右子樹”（right subtree）。線段樹的每個結點存儲了一個區間（線段），故而得名。

圖二-1-1

如圖二-1-1所示，表示的是一個[1, 6]的區間的線段樹結構，每個結點存儲一個區間（注意這裏的存儲區間並不是指存儲這個區間裏面所有的元素，而是只需要存儲區間的左右端點即可），所有葉子結點表示的是單位區間（即左右端點相等的區間），所有非葉子結點（內部結點）都有左右兩棵子樹，對於所有非葉子結點，它表示的區間爲[l, r]，那麼令mid爲(l + r)/2的下整，則它的左兒子表示的區間爲[l, mid]，右兒子表示的區間爲[mid+1, r]。基於這個特性，這種二叉樹的內部結點，一定有兩個兒子結點，不會存在有左兒子但是沒有右兒子的情況。

基於這種結構，葉子結點保存一個對應原始數組下標的值，由於樹是一個遞歸結構，兩個子結點的區間並正好是父結點的區間，可以通過自底向上的計算在每個結點都計算出當前區間的最大值。

需要注意的是，基於線段樹的二分性質，所以它是一棵平衡樹，樹的高度爲log(n)。

2、數據域

瞭解線段樹的基本結構以後，看看每個結點的數據域，即需要存儲哪些信息。

首先，既然線段樹的每個結點表示的是一個區間，那麼必須知道這個結點管轄的是哪個區間，所以其中最重要的數據域就是區間左右端點[l, r]。然而有時候爲了節省全局空間，往往不會將區間端點存儲在結點中，而是通過遞歸的傳參進行傳遞，實時獲取。

再者，以區間最大值爲例，每個結點除了需要知道所管轄的區間範圍[l, r]以外，還需要存儲一個當前區間內的最大值max。

圖二-2-1

以數組A[1:6] = [1 7 2 5 6 3]爲例，建立如圖二-2-1的線段樹，葉子結點的max域爲數組對應下標的元素值，非葉子結點的max域則通過自底向上的計算由兩個兒子結點的max域比較得出。這是一棵初始的線段樹，接下來討論下線段樹的詢問和更新操作。

在詢問某個區間的最大值時，我們一定可以將這個區間拆分成log(n)個子區間，並且這些子區間一定都能在線段樹的結點上找到（這一點下文會着重講解），然後只要比較這些結點的max域，就能得出原區間的最大值了，因爲子區間數量爲log(n)，所以時間複雜度是O( log(n) )。

更新數組某個元素的值時我們首先修改對應的葉子結點的max域，然後修改它的父結點的max域，以及祖先結點的max域，換言之，修改的只是線段樹的葉子結點到根結點的某一條路徑上的max域，又因爲樹高是log(n)，所以這一步操作的時間複雜度也是log(n)的。

3、指針表示

接下來討論一下結點的表示法，每個結點可以看成是一個結構體指針，由數據域和指針域組成，其中指針域有兩個，分別爲左兒子指針和右兒子指針，分別指向左右子樹；數據域存儲對應數據，根據情況而定(如果是求區間最值，就存最值max；求區間和就存和sum)，這樣就可以利用指針從根結點進行深度優先遍歷了。

以下是簡單的線段樹結點的C++結構體：

  struct treeNode {
        Data data;                 // 數據域
        treeNode *lson, *rson;     // 指針域
    }*root;

4、數組表示

實際計算過程中，還有一種更加方便的表示方法，就是基於數組的靜態表示法，需要一個全局的結構體數組，每個結點對應數組中的一個元素，利用下標索引。

例如，假設某個結點在數組中下標爲p，那麼它的左兒子結點的下標就是2*p，右兒子結點的下標就是2*p+1(類似於一般數據結構書上說的堆在數組中的編號方式)，這樣可以將所有的線段樹結點存儲在相對連續的空間內。之所以說是相對連續的空間，是因爲有些下標可能永遠用不到。

還是以長度爲6的數組爲例，如圖二-4-1所示，紅色數字表示結點對應的數組下標，由於樹的結構和編號方式，導致數組的第10、11位置空缺。

圖二-4-1

這種存儲方式可以不用存子結點指針，取而代之的是當前結點的數組下標索引，以下是數組存儲方式的線段樹結點的C++結構體：

  struct treeNode {
        Data data;                         // 數據域
  int pid;                           // 數組下標索引
  int lson() { return pid << 1; }
  int rson() { return pid<<1|1; }    // 利用位運算加速獲取子結點編號
    }nodes[ MAXNODES ];

接下來我們關心的就是MAXNODES的取值了，由於線段樹是一種二叉樹，所以當區間長度爲2的冪時，它正好是一棵滿二叉樹，數組存儲的利用率達到最高（即100%），根據等比數列求和可以得出，滿二叉樹的結點個數爲2*n-1，其中n爲區間長度（由於C++中數組長度從0計數，編號從1開始，所以MAXNODES要取2*n）。那麼是否對於所有的區間長度n都滿足這個公式呢？答案是否定的，當區間長度爲6時，最大的結點編號爲13，而公式算出來的是12（2*6）。

那麼 MAXNODES 取多少合適呢？

爲了保險起見，我們可以先找到比n大的最小的二次冪，然後再套用等比數列求和公式，這樣就萬無一失了。舉個例子，當區間長度爲6時，MAXNODES = 2 * 8；當區間長度爲1000，則MAXNODES = 2 * 1024；當區間長度爲10000，MAXNODES = 2 * 16384。至於爲什麼可以這樣，明眼人一看便知。

三、線段樹的基本操作

線段樹的基本操作包括構造、更新、詢問，都是深度優先搜索的過程。

1、構造
線段樹的構造是一個二分遞歸的過程，封裝好了之後代碼非常簡潔，總體思路就是從區間[1, n]開始拆分，拆分方式爲二分的形式，將左半區間分配給左子樹，右半區間分配給右子樹，繼續遞歸構造左右子樹。

當區間拆分到單位區間時（即遍歷到了線段樹的葉子結點），則執行回溯。回溯時對於任何一個非葉子結點需要根據兩棵子樹的情況進行統計，計算當前結點的數據域，詳見註釋4。

  void segtree_build(int p, int l, int r) {
        nodes[p].reset(p, l, r);                  // 註釋1
  if (l < r) {
  int mid = (l + r) >> 1;
            segtree_build(p<<1, l, mid);          // 註釋2
            segtree_build(p<<1|1, mid+1, r);      // 註釋3
            nodes[p].updateFromSon();             // 註釋4
        }
    }

註釋1：初始化第p個結點的數據域，根據實際情況實現reset函數

註釋2：遞歸構造左子樹

註釋3：遞歸構造右子樹

註釋4：回溯，利用左右子樹的信息來更新當前結點，updateFromSon這個函數的實現需要根據實際情況進行求解，在第四節會詳細討論

構造線段樹的調用如下：segtree_build(1, 1, n);

2、更新

線段樹的更新是指更新數組在[x, y]區間的值，具體更新這件事情是做了什麼要根據具體情況而定，可以是將[x, y]區間的值都變成val（覆蓋），也可以是將[x, y]區間的值都加上val（累加）。

更新過程採用二分，將[1, n]區間不斷拆分成一個個子區間[l, r]，當更新區間[x, y]完全覆蓋被拆分的區間[l, r]時，則更新管轄[l, r]區間的結點的數據域，詳見註釋2和註釋3。

  void segtree_insert(int p, int l, int r, int x, int y, ValueType val) {
  if( !is_intersect(l, r, x, y) ) {              // 註釋1
  return ;
        }
  if( is_contain(l, r, x, y) ) {                 // 註釋2
            nodes[p].updateByValue(val);               // 註釋3
    return ;
        }
        nodes[p].giveLazyToSon();                      // 註釋4
  int mid = (l + r) >> 1;
        segtree_insert(p<<1, l, mid, x, y, val);       // 註釋5
        segtree_insert(p<<1|1, mid+1, r, x, y, val);   // 註釋6
        nodes[p].updateFromSon();                      // 註釋7
    }

註釋1：區間[l, r]和區間[x, y]無交集，直接返回

註釋2：區間[x, y]完全覆蓋[l, r]

註釋3：更新第p個結點的數據域，updateByValue這個函數的實現需要根據具體情況而定，會在第四節進行詳細討論

註釋4：這裏先賣個關子，參見第五節的lazy-tag

註釋5：遞歸更新左子樹

註釋6：遞歸更新右子樹

註釋7：回溯，利用左右子樹的信息來更新當前結點

更新區間[x, y]的值爲val的調用如下：segtree_insert(1, 1, n, x, y, val);

3、詢問

線段樹的詢問和更新類似，大部分代碼都是一樣的，只有紅色部分是不同的，同樣是將大區間[1, n]拆分成一個個小區間[l, r]，這裏需要存儲一個詢問得到的結果ans，當詢問區間[x, y]完全覆蓋被拆分的區間[l, r]時，則用管轄[l, r]區間的結點的數據域來更新ans，詳見註釋1的mergeQuery接口

。

  void segtree_query (int p, int l, int r, int x, int y, treeNode& ans) {
      if( !is_intersect(l, r, x, y) ) {
          return ;
        }
      if( is_contain(l, r, x, y) ) {
            ans.mergeQuery(p);                          // 註釋1
          return;
        }
        nodes[p].giveLazyToSon();
  int mid = (l + r) >> 1;
        segtree_query(p<<1, l, mid, x, y, ans);
        segtree_query(p<<1|1, mid+1, r, x, y, ans);
        nodes[p].updateFromSon();                       // 註釋2
    }

註釋1：更新當前解ans，會在第四節進行詳細討論

註釋2：和更新一樣的代碼，不再累述

四、線段樹的經典案例

線段樹的用法千奇百怪，接下來介紹幾個線段樹的經典案例，加深對線段樹的理解。

1、區間最值

區間最值是最常見的線段樹問題，引例中已經提到。接下來從幾個方面來討論下區間最值是如何運作的。

數據域：

int pid; // 數組索引

int l, r; // 結點區間(一般不需要存儲)

ValyeType max; // 區間最大值

初始化：

void treeNode::reset(int p, int l, int r) {

pid = p;

max = srcArray[l]; // 初始化只對葉子結點有效

}

單點更新：

void treeNode::updateByValue(ValyeType val) {

max = val;

}

合併結點：

void treeNode::mergeQuery(int p) {

max = getmax( max, nodes[p].max );

}

回溯統計：

void treeNode::updateFromSon() {

max = nodes[ lson() ].max;

mergeQuery( rson() );

}

結合上一節線段樹的基本操作，在構造線段樹的時候，對每個結點執行了一次初始化，初始化同時也是單點更新的過程，然後在回溯的時候統計，統計實質上是合併左右結點的過程，合併結點做的事情就是更新最大值；詢問就是將給定區間拆成一個個能夠在線段樹結點上找到的區間，然後合併這些結點的過程，合併的結果ans一般通過引用進行傳參，或者作爲全局變量，不過儘量避免使用全局變量。

2、區間求和

區間求和問題一般比區間最值稍稍複雜一點，因爲涉及到區間更新和區間詢問，如果更新和詢問都只遍歷到詢問（更新）區間完全覆蓋結點區間的話，會導致計算遺留，舉個例子來說明。

用一個數據域sum來記錄線段樹結點區間上所有元素的和，初始化所有結點的sum值都爲0，然後在區間[1, 4]上給每個元素加上4，如圖四-2-1所示：

圖四-2-1

圖中[1, 4]區間完全覆蓋[1, 3]和[4, 4]兩個子區間，然後分別將值累加到對應結點的數據域sum上，再通過回溯統計sum和，最後得到[1, 6]區間的sum和爲16，看上去貌似天衣無縫，但是實際上操作一多就能看出這樣做是有缺陷的。例如當我們要詢問[3, 4]區間的元素和時，在線段樹結點上得到被完全覆蓋的兩個子區間[3, 3]和[4, 4]，累加區間和爲0 + 4 = 4，如圖四-2-2所示。

圖四-2-2

這是因爲在進行區間更新的時候，由於[1, 4]區間完全覆蓋[1, 3]區間，所以我們並沒有繼續往下遍歷，而是直接在[1, 3]這個結點進行sum值的計算，計算完直接回溯。等到下一次訪問[3, 3]的時候，它並不知道之前在3號位置上其實是有一個累加值4的，但是如果每次更新都更新到葉子結點，就會使得更新的複雜度變成O(n)，違背了使用線段樹的初衷，所以這裏需要引入一個lazy-tag的概念。

所謂lazy-tag，就是在某個結點打上一個“懶惰標記”，每次更新的時候只要更新區間完全覆蓋結點區間，就在這個結點打上一個lazy標記，這個標記的值就是更新的值，表示這個區間上每個元素都有一個待累加值lazy，然後計算這個結點的sum，回溯統計sum。

當下次訪問到有lazy標記的結點時，如果還需要往下訪問它的子結點，則將它的lazy標記傳遞給兩個子結點，自己的lazy標記置空。

這就是爲什麼在之前在講線段樹的更新和詢問的時候有一個函數叫giveLazyToSon了。接下來看看一些函數的實現。

數據域：

int pid; // 數組索引

int len; // 結點區間長度

ValyeType sum; // 區間元素和

ValyeType lazy; // lazy tag

初始化：

void treeNode::reset(int p, int l, int r) {

pid = p;

len = r - l + 1;

sum = lazy = 0;

}

單點更新：

void treeNode::updateByValue(ValyeType val) {

lazy += val;

sum += val * len;

}

lazy標記繼承：

void treeNode::giveLazyToSon() {

if( lazy ) {

nodes[ lson() ].updateByValue(lazy);

nodes[ rson() ].updateByValue(lazy);

lazy = 0;

}

合併結點：

void treeNode::mergeQuery(int p) {

sum += nodes[p].sum;

}

回溯統計：

void treeNode::updateFromSon() {

sum = nodes[ lson() ].sum;

mergeQuery( rson() );

}

對比區間最值，區間求和的幾個函數的實現主旨是一致的，因爲引入了lazy-tag，所以需要多實現一個函數用於lazy標記的繼承，在進行區間求和的時候還需要記錄一個區間的長度len，用於更新的時候計算累加的sum值。

3、區間染色

【例題3】給定一個長度爲n(n <= 100000)的木板，支持兩種操作：

1、P a b c 將[a, b]區間段染色成c；

2、Q a b 詢問[a, b]區間內有多少種顏色；

保證染色的顏色數少於30種。

對比區間求和，不同點在於區間求和的更新是對區間和進行累加；而這類染色問題則是對區間的值進行替換（或者叫覆蓋），有一個比較特殊的條件是顏色數目小於30。

我們是不是要將30種顏色的有無與否都存在線段樹的結點上呢？答案是肯定的，但是這樣一來每個結點都要存儲30個bool值，空間太浪費，而且在計算合併操作的時候有一步30個元素的遍歷，大大降低效率。然而30個bool值正好可以壓縮在一個int32中，利用二進制壓縮可以用一個32位的整型完美的存儲30種顏色的有無情況。

因爲任何一個整數都可以分解成二進制整數，二進制整數的每一位要麼是0，要麼是1。二進制整數的第i位是1表示存在第i種顏色；反之不存在。

數據域需要存一個顏色種類的位或和colorBit，一個顏色的lazy標記表示這個結點被完全染成了lazy，基本操作的幾個函數和區間求和非常像，這裏就不出示代碼了。

和區間求和不同的是回溯統計的時候，對於兩個子結點的數據域不再是加和，而是位或和。

4、矩形面積並

【例題4】給定n(n <= 100000)個平行於XY軸的矩形，求它們的面積並。如圖四-4-1所示。

圖四-4-1

這類二維的問題同樣也可以用線段樹求解，核心思想是降維，將某一維套用線段樹，另外一維則用來枚舉。具體過程如下：

第一步：將所有矩形拆成兩條垂直於x軸的線段，平行x軸的邊可以捨去，如圖四-4-2所示。

圖四-4-2

第二步：定義矩形的兩條垂直於x軸的邊中x座標較小的爲入邊，x座標較大的爲出邊，入邊權值爲+1，出邊權值爲-1，並將所有的線段按照x座標遞增排序，第i條線段的x座標記爲X[i]，如圖四-4-3所示。

圖四-4-3

第三步：將所有矩形端點的y座標進行重映射(也可以叫離散化)，原因是座標有可能很大而且不一定是整數，將原座標映射成小範圍的整數可以作爲數組下標，更方便計算，映射可以將所有y座標進行排序去重，然後二分查找確定映射後的值，離散化的具體步驟下文會詳細講解。如圖四-4-4所示，藍色數字表示的是離散後的座標，即1、2、3、4分別對應原先的5、10、23、25（需支持正查和反查）。假設離散後的y方向的座標個數爲m，則y方向被分割成m-1個獨立單元，下文稱這些獨立單元爲“單位線段”，分別記爲<1-2>、<2-3>、<3-4>。

圖四-4-4

第四步：以x座標遞增的方式枚舉每條垂直線段，y方向用一個長度爲m-1的數組來維護“單位線段”的權值，如圖四-4-5所示，展示了每條線段按x遞增方式插入之後每個“單位線段”的權值。

當枚舉到第i條線段時，檢查所有“單位線段”的權值，所有權值大於零的“單位線段”的實際長度之和(離散化前的長度)被稱爲“合法長度”，記爲L，那麼(X[i] - X[i-1]) * L，就是第i條線段和第i-1條線段之間的矩形面積和，計算完第i條垂直線段後將它插入，所謂"插入"就是利用該線段的權值更新該線段對應的“單位線段”的權值和（這裏的更新就是累加）。

圖四-4-5

如圖四-4-6所示：紅色、黃色、藍色三個矩形分別是3對相鄰線段間的矩形面積和，其中紅色部分的y方向由<1-2>、<2-3>兩個“單位線段”組成，黃色部分的y方向由<1-2>、<2-3>、<3-4>三個“單位線段”組成，藍色部分的y方向由<2-3>、<3-4>兩個“單位線段”組成。特殊的，在計算藍色部分的時候，<1-2>部分的權值由於第3條線段的插入(第3條線段權值爲-1)而變爲零，所以不能計入“合法長度”。

以上所有相鄰線段之間的面積和就是最後要求的矩形面積並。

圖四-4-6

那麼這裏帶來幾個問題：

1、是否任意相鄰兩條垂直x軸的線段之間組成的封閉圖形都是矩形呢？答案是否定的，如圖四-4-7所示，其中綠色部分爲四個矩形的面積並中的某塊有效部分，它們同處於兩條相鄰線段之間，但是中間有空隙，所以它並不是一個完整的矩形。

2、每次枚舉一條垂直線段的時候，需要檢查所有“單位線段”的權值，如果用數組維護權值，那麼這一步檢查操作是O(m)的，所以總的時間複雜度爲O(nm)，其中n表示垂直線段的個數，複雜度太大需要優化。

圖四-4-7

優化自然就是用線段樹了，之前提到了降維的思想，x方向我們繼續採用枚舉，而y方向的“單位線段”則可以採用線段樹來維護，和一般問題一樣，首先討論數據域。

數據域：

int pid; // 數組索引

int l, r; // 結點代表的“單位線段”區間[l, r] (注意，l和r均爲離散後的下標)

int cover; // [l, r]區間被完全覆蓋的次數

int len; // 該結點表示的區間內的合法長度

注意，這次的線段樹和之前的線段樹稍微有點區別，就是葉子結點的區間端點不再相等，而是相差1，即l+1 == r。因爲一個點對於計算面積來說是沒有意義的。

算法採用深度優先搜索的後序遍歷，記插入線段爲[a, b, v]，其中[a, b]爲線段的兩個端點，是離散化後的座標；v是+1或-1，代表是入邊還是出邊，每次插入操作二分枚舉區間，當線段樹的結點代表的區間被插入區間完全覆蓋時，將權值v累加到結點的cover域上。由於是後續遍歷，在子樹全部遍歷完畢後需要進行統計。插入過程修改cover，同時更新len。

回溯統計過程對cover域分情況討論：

當cover > 0時，表示該結點代表的區間至少有一條入邊沒有被出邊抵消，換言之，這塊區間都應該在“合法長度”之內，則 len = Y[r] - Y[l]（Y[i]代表離散前第i大的點的y座標）；更加通俗的理解是至少存在一個矩形的入邊被掃描到了，而出邊還未被掃描到，所以這塊面積需要被計算進來。

當cover等於0時，如果該區間是一個單位區間（即上文所說的“單位線段”，l+1 == r，也是線段樹的葉子結點），則 len = 0；否則，len需要由左子樹和右子樹的計算結果得出，又因爲是後序遍歷，所以左右子樹的len都已經計算完畢，從而不需要再進行遞歸求解，直接將左右兒子的len加和就是答案，即len = lson.len + rson.len。

圖四-4-8

圖四-4-8所示爲上述例子的初始線段樹，其中根結點管轄的區間爲[1, 4]，代表"單位線段”的兩個端點。對於線段樹上任何一棵子樹而言，根結點管轄區間爲[l, r]，並且mid = (l + r) / 2，那麼如果它不是葉子結點，則它的左子樹管轄的區間就是[l, mid]，右子樹管轄的區間就是[mid, r]。葉子結點管轄區間的左右端點之差爲1（和之前的線段樹的區間分配方式稍有不同）。

這樣就可以利用二分，在O(n)的時間內遞歸構造初始的線段樹。

圖四-4-9

圖四-4-9所示爲插入第一條垂直線段[1, 3, 1]（插入區間[1, 3]，權值爲1）後的情況，插入過程類似建樹過程，二分遞歸執行插入操作，當插入區間完全覆蓋線段樹結點區間時，將權值累加到對應結點（圖中綠色箭頭指向的結點）的cover域上；否則，繼續遞歸左右子樹。然後進行自底向上的統計，統計的是len的值。

[2, 4]這個結點的cover域爲0，所以它的len等於兩棵子樹的len之和，[1, 4]亦然。

圖四-4-10

圖四-4-10所示爲插入第二條垂直線段[2, 4, 1]（插入區間[2, 4]，權值爲1）後的情況，只需要修改一個結點（圖中綠色箭頭指向的結點）的cover域，該結點的兩棵子樹不需要再進行遞歸計算，回溯的時候，計算根結點len值時，由於根結點的cover域爲0，所以它的len等於左右子樹的len之和。

圖四-4-11

圖四-4-11所示爲插入第三條垂直線段[1, 3, -1]（插入區間[1, 3]，權值爲-1）後的情況，直觀的看，現在Y方向只有[2, 4]一條線段了，所以根結點的len就是Y[4] - Y[2] = 15。

講完插入，就要談談詢問。在每次插入之前，需要詢問之前插入的線段中，在y方向的“合法長度”L，根據線段樹結點的定義，y方向“合法長度”總和其實就是根結點的len，所以這一步詢問操作其實是O(1)的，在插入過程中已經實時計算出來，再加上插入的O(log n)的時間複雜度，已經完美解決了上述複雜度太大的問題了。

5、區間K大數

【例題5】給定n(n <= 100000)個數的數組，然後m(m <= 100000)條詢問，詢問格式如下：

1、l r k 詢問[l, r]的第K大的數的值

這是一個經典的面試題，利用了線段樹劃分區間的思想，線段樹的每個結點存的不只是區間端點，而是這個區間內所有的數，並且是按照遞增順序有序排列的，建樹過程是一個歸併排序的過程，從葉子結點自底向上進行歸併，對於一個長度爲6的數組[4, 3, 2, 1, 5, 6]，建立線段樹如圖四-5-1所示。

圖四-5-1

從圖中可以看出，線段樹的任何一個結點存儲了對應區間的數，並且進行有序排列，所以根結點存儲的一定是一個長度爲數組總長的有序數組，葉子結點存儲的遞增序列爲原數組元素。

每次詢問，我們將給定區間拆分成一個個線段樹上的子區間，然後二分枚舉答案T，再利用二分查找統計這些子區間中大於等於T的數的個數，從而確定T是否是第K大的。

對於區間K大數的問題，還有很多數據結構都能解決，這裏僅作簡單介紹。

五、線段樹的常用技巧

1、離散化

在講解矩形面積並的時候曾經提了一下離散化，現在再詳細的說明一下，所謂離散化就是將無限的個體映射到有限的個體中，從而提高算法效率。

舉個簡單的例子，一個實數數組，我想很快的得到某個數在整個數組裏是第幾大的，並且詢問數很多，不允許每次都遍歷數組進行比較。

那麼，最直觀的想法就是對原數組先進行一個排序，詢問的時候只需要通過二分查找就能在O( log(n) )的時間內得出這個數是第幾大的了，離散化就是做了這一步映射。

對於一個數組[1.6, 7.8, 5.5, 11.1111, 99999, 5.5]，離散化就是將原來的實數映射成整數(下標)，如圖五-1-1所示：

圖五-1-1

這樣就可以將原來的實數保存在一個有序數組中，詢問第K大的是什麼稱爲正查，可以利用下標索引在O(1)的時間內得到答案；詢問某個數是第幾大的稱爲反查，可以利用二分查找或者Hash得到答案，複雜度取決於具體算法，一般爲O(log(n))。

2、lazy-tag

這個標記一般用於處理線段樹的區間更新。

線段樹在進行區間更新的時候，爲了提高更新的效率，所以每次更新只更新到更新區間完全覆蓋線段樹結點區間爲止，這樣就會導致被更新結點的子孫結點的區間得不到需要更新的信息，所以在被更新結點上打上一個標記，稱爲lazy-tag，等到下次訪問這個結點的子結點時再將這個標記傳遞給子結點，所以也可以叫延遲標記。

3、子樹收縮

子樹收縮是子樹繼承的逆過程，子樹繼承是爲了兩棵子樹獲得父結點的信息；而子樹收縮則是在回溯的時候，如果兩棵子樹擁有相同數據的時候在將數據傳遞給父結點，子樹的數據清空，這樣下次在訪問的時候就可以減少訪問的結點數。

六、線段樹的多維推廣

1、二維線段樹 - 矩形樹

線段樹是處理區間問題的，二維線段樹就是處理平面問題的了，曾經寫過一篇二維線段樹的文章，就不貼過來了，直接給出傳送門：二維線段樹。

2、三維線段樹 - 空間樹

線段樹-二叉樹，二維線段樹-四叉樹，三維線段樹自然就是八叉樹了，分割的是空間，一般用於三維計算幾何，當然也不一定用在實質的空間內的問題。

比如需要找出身高、體重、年齡在一定範圍內並且顏值最高的女子，就可以用三維線段樹（三維空間最值問題），嘿嘿嘿！！！

七、線段樹相關題集整理

區間最值

I Hate It ★☆☆☆☆ 最值-單點更新，批量查詢

Sticks Problem ★★☆☆☆ 最值-二分枚舉 + 批量查詢

Balanced Lineup ★★☆☆☆ 最值-批量查詢

Frequent values ★★☆☆☆ 最值-批量查詢

Billboard ★★☆☆☆ 最值-單點更新、批量查詢

Huge Mission ★★☆☆☆ 最值-區間更新，單點詢問

Gcd & Lcm game ★★★☆☆ 利用LCM和GCD的素拆表示

Another LIS ★★★★☆ 最值（線段樹）+ 樹狀數組

WorstWeather Ever ★★★★☆ 很好的邏輯題，線段樹維護最值

Special Subsequence ★★★★☆ 動態規劃 + 區間最值

Minimizing maximizer ★★★★☆ 動態規劃 + 區間最值

區間求和

A Simple Problem with Integers ★☆☆☆☆ 求和-區間更新，區間求和

Thermal Death of the Universe ★☆☆☆☆ 求和-區間更新，區間求和

Buy Tickets ★★☆☆☆ 求和-單點更新，區間求和

Turing Tree ★★★☆☆ 求和-離線區間求和

Help with Intervals ★★★☆☆ 求和-異或的應用

Sequence operation ★★★☆☆ 求和-異或的應用

Coder ★★★☆☆ 求和-線段樹 + 樹狀數組

區間染色

Just a Hook ★☆☆☆☆ 染色-批量染色，單次統計

Mayor's posters ★☆☆☆☆ 染色-批量染色，單次統計(離散化)

Count Color ★★☆☆☆ 染色-批量染色，批量查詢

A Corrupt Mayor's Performance Art ★★☆☆☆ 染色-批量染色，批量查詢

Horizontally Visible Segments ★★★☆☆ 染色-批量染色，子樹收縮

Can you answer these queries? ★★★☆☆ 染色-批量染色，子樹收縮

Color the Ball ★★★☆☆ 染色-最長連續區間

LCIS ★★★☆☆ 染色-最長連續遞增子序列

Memory Control ★★★★☆ 染色-內存分配

Man Down ★★★☆☆ 動態規劃 + 區間染色

矩形問題

Atlantis ★☆☆☆☆ 離散化 + 矩形面積並

City Horizon ★☆☆☆☆ 矩形面積並

Paint the Wall ★☆☆☆☆ 矩形面積並

Posters ★★☆☆☆ 中空矩形面積並

Covered Area ★★☆☆☆ 矩形面積並

Picture ★★★☆☆ 矩形周長

Colourful Rectangle ★★★☆☆ 多色矩形面積並

End of Windless Days ★★★☆☆ 投影三角換算 + 矩形面積並

區間K大數

K-th Number ★★★☆☆ 區間K大數

Kth number ★★★☆☆ 區間K小數

Feed the dogs ★★★☆☆ 區間K大數

二維線段樹

Luck and Love ★★☆☆☆ 二維最值

Mosaic ★★☆☆☆ 二維最值

Matrix Searching ★★☆☆☆ 二維最值

附題解：我是線段樹題解

夜深人靜寫算法（七）- 線段樹

ziw2pdf

apisix~helm方式的部署到k8s

firmeye - IoT固件漏洞挖掘工具

夜深人靜寫算法（一）- 搜索入門

夜深人靜寫算法（二）- 動態規劃

夜深人靜寫算法（三）- 樹狀數組

夜深人靜寫算法（十五）- 霍夫曼編碼

解題報告 (五) Burnside引理和Polya定理

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結