rt。用\(\LaTeX\)整理了公式。
之前那篇很混亂而且咕咕咕到現在的隨筆:st表、樹狀數組與線段樹 筆記與思路整理
一、構成方式
樹狀數組是一種樹狀的結構(廢話),但是只需要 $ O(n)$ 的空間複雜度。區間查詢和單一修改時間複雜度都爲 \(O(log\ n)\) ,利用差分區間修改也可以達到 \(O(log\ n)\) ,但此時不能區間查詢。通過維護兩個數組可以達到 \(O(log\ n)\) 的區間修改與查詢。
樹狀數組是基於一棵二叉樹,爲便於思想上向數組轉化,這裏稍微變形:(Excel繪圖23333)
如果要在一棵樹上存儲一個數組並且便於求和,我們可以想到讓每個父節點存儲其兩個子節點的和。(就決定是你啦!線段樹!)
爲了達到 \(O(n)\) 的空間複雜度,刪去一些節點(放棄線段樹)後如下:
標有序號的節點爲樹狀數組,序號從左向右增大。
二、運算規律
觀察上一節的圖可得,每個樹狀數組的節點都儲存了\(2^k\)個原數組節點的數據(\(k\)爲節點深度)。也就是說,在上面的圖中:
t[1] = a[1];
t[2] = a[1] + a[2];
t[3] = a[3];
t[4] = a[1] + a[2] + a[3] + a[4];
t[5] = a[5];
t[6] = a[5] + a[6];
t[7] = a[7];
t[8] = a[1] + a[2] + a[3] + a[4] + a[5] + a[6] + a[7] + a[8];
所以說,這棵樹的(不是我自己推出來的)規律是:
\[t[i] = a[i - 2^k + 1] + a[i - 2^k + 2] + ... + a[i]\]
//\(k\)爲\(i\)的二進制中從最低位到高位連續零的長度
將\(2^k\)稱爲\(lowbit(i)\),則代碼如下:
void add(int pos, int val){ //將節點pos增加val
for(int i=pos; i<=n; i+=lowbit(i)){
t[i] += val;
}
}
int ask(int pos){ //求節點pos前綴和
int ans = 0;
for(int i=pos; i>0; i-=lowbit(i)){
ans += t[i];
}
return ans;
}
int query_sum(int l, int r){ //利用前綴和求[l, r]總和
return ask(r) - ask(l);
}
那麼問題來了,怎麼求這個 \(2^k\) 呢?
有一個巧妙的(我自己也沒推出來的)算法是:
\[lowbit(x) = x \& (-x)\]
抄一段證明如下:
這裏利用的負數的存儲特性,負數是以補碼存儲的,對於整數運算 \(x\&(-x)\)有
● 當\(x\)爲\(0\)時,即 \(0 \& 0\),結果爲\(0\);//因此實際運算的時候如果真的出現了\(lowbit(0)\)會卡死,要從\(1\)開始存儲
●當\(x\)爲奇數時,最後一個比特位爲\(1\),取反加\(1\)沒有進位,故\(x\)和\(-x\)除最後一位外前面的位正好相反,按位與結果爲\(0\)。結果爲\(1\)。
●當\(x\)爲偶數,且爲\(2^m\)時,\(x\)的二進制表示中只有一位是\(1\)(從右往左的第\(m+1\)位),其右邊有\(m\)位\(0\),故\(x\)取反加\(1\)後,從右到左第有\(m\)個\(0\),第\(m+1\)位及其左邊全是\(1\)。這樣,\(x\& (-x)\) 得到的就是\(x\)。
●當\(x\)爲偶數,卻不爲\(2^m\)的形式時,可以寫作\(x= y \times (2^k)\) 。其中,\(y\)的最低位爲\(1\)。實際上就是把\(x\)用一個奇數左移\(k\)位來表示。這時,\(x\)的二進制表示最右邊有\(k\)個\(0\),從右往左第\(k+1\)位爲\(1\)。當對x取反時,最右邊的\(k\)位\(0\)變成\(1\),第\(k+1\)位變爲\(0\);再加\(1\),最右邊的\(k\)位就又變成了\(0\),第\(k+1\)位因爲進位的關係變成了\(1\)。左邊的位因爲沒有進位,正好和\(x\)原來對應的位上的值相反。二者按位與,得到:第\(k+1\)位上爲\(1\),左邊右邊都爲\(0\)。結果爲\(2^k\)。
總結一下:\(x\&(-x)\),當\(x\)爲\(0\)時結果爲\(0\);\(x\)爲奇數時,結果爲\(1\);\(x\)爲偶數時,結果爲\(x\)中\(2\)的最大次方的因子。
三、具體操作
1.區間查詢單點修改
如上文所說,使用循環維護一條樹上路徑即可。
模板題: 洛谷 P3374
查看源碼
#include "bits/stdc++.h"
using namespace std;
int a[500010], t[500010];
int n, m;
int lowbit(int x){
return x & (-x);
}
void add(int pos, int val){
for(int i=pos; i<=n; i+=lowbit(i)){
t[i] += val;
}
}
int query_node(int pos){
int ans = 0;
for(int i=pos; i>0; i-=lowbit(i)){
ans += t[i];
}
return ans;
}
int query_range(int l, int r){
return query_node(r) - query_node(l-1);
}
int main(){
cin >> n >> m;
int opt, pos, l, r, num;
for(int i=1; i<=n; i++){
scanf("%d", &a[i]);
add_node(i, a[i]);
}
while(m--){
scanf("%d", &opt);
if(opt == 1){
scanf("%d%d", &pos, &num);
add_node(pos, num);
}
if(opt == 2){
scanf("%d%d", &l, &r);
printf("%d\n", query_range(l, r));
}
}
return 0;
}
2.單點查詢區間修改
利用差分的思想,設數組\(b[i]=a[i]-a[i-1]\),用樹狀數組\(t[~]\)表示\(b[~]\)。(這裏默認\(a[0]=b[0]=0\))
來一組樣例:
\(a[~]=\{1,~5,~4,~2,~3,~1,~2,~5\}\)
\(b[\ ] = \{ 1,\ 4,\ -1,\ -2,\ 1,\ -2,\ 1,\ 3\}\)
處理區間\([1,\ 5]\),將其中所有元素+1:
\(a[~]=\{1,~{\color{red}{6,~5,~3,~4,~2,}}~2,~5\}\)
\(b[\ ] = \{ 1,\ {\color{red}5,}\ -1,\ -2,\ 1,\ -2,\ {\color{red}0,}\ 3 \}\)
可以看到,只有 \(b[1]\) 和 \(b[6]\) 發生了變化。(即更改區間\([l, r]\)時的節點\(l\)與節點\(r+1\))因此,以 \(b[\ ]\) 爲原數組的 \(t[\ ]\) 只需要執行兩次 \(add()\) 即可。但是,在查詢 \(a[i]\) 的時候就需要查詢 \(b[1...i]\) 之和,在 \(log\ n\) 時間裏只能查詢單個節點的值。
模板題:洛谷 P3368
查看源碼
#include "bits/stdc++.h"
using namespace std;
int a[500010], t[500010];
int n, m;
int lowbit(int x){
return x & (-x);
}
void add_node(int pos, int val){
for(int i=pos; i<=n; i+=lowbit(i)){
t[i] += val;
}
}
void add_range(int l, int r, int val){
add_node(l, val);
add_node(r+1, -val);
}
int query_node(int pos){
int ans = 0;
for(int i=pos; i>0; i-=lowbit(i)){
ans += t[i];
}
return ans;
}
int main(){
cin >> n >> m;
int opt, pos, l, r, num;
for(int i=1; i<=n; i++){
scanf("%d", &a[i]);
add_node(i, a[i] - a[i-1]);
}
while(m--){
scanf("%d", &opt);
if(opt == 1){
scanf("%d%d%d", &l, &r, &num);
add_range(l, r, num);
}
if(opt == 2){
scanf("%d", &pos);
printf("%d\n", query_node(pos));
}
}
return 0;
}
3.區間查詢區間修改
關於區間查詢與區間修改的操作,考慮維護兩個樹狀數組來優化差分:
(本段參考了xenny的博客)
\(\sum_{i=1}^{n}a[i] =\sum_{i=1}^n \sum_{j=1}^it[j]\)
則
\[
\begin{align*}& a[1] + a[2] + ... + a[n]\\ = ~&(t[1]) + (t[1] + t[2]) + ... + (t[1] + t[2] + ... + t[n]) \\ = ~&n * t[1] + (n-1) * t[2] + ... + t[n]\\ =~& n * (t[1] + t[2] + ... + t[n]) - (0 * t[1] + 1 * t[2] + ... + (n - 1) * t[n])\end{align*}
\]
所以上式可以變爲\(∑^n_{i = 1}a[i] = n∑^n_{i = 1}t[i] - ∑^n_{i = 1}( t[i] * (i - 1) )\)
因此,實現了區間查詢與區間修改之後可以實現線段樹的某些功能。但這種實現方式與線段樹還有所差異,詳情見下一節“優勢與侷限”。
模板題:洛谷 P3372 (線段樹模板1)
查看源碼
#include "bits/stdc++.h"
using namespace std;
typedef long long ll;
ll a[500010], t1[500010], t2[500010];
int n, m;
int lowbit(int x){
return x & (-x);
}
void add_node(int pos, ll val){
for(int i=pos; i<=n; i+=lowbit(i)){
t1[i] += val;
t2[i] += val * (pos-1);
}
}
void add_range(int l, int r, int val){
add_node(l, val);
add_node(r+1, -val);
}
ll quary_node(int pos){
ll ans = 0;
for(int i=pos; i>0; i-=lowbit(i)){
ans += pos * t1[i] - t2[i];
}
return ans;
}
ll quary_range(int l, int r){
return quary_node(r) - quary_node(l-1);
}
int main(){
cin >> n >> m;
int opt, pos, l, r;
ll num;
for(int i=1; i<=n; i++){
scanf("%d", &a[i]);
add_node(i, a[i] - a[i-1]);
}
while(m--){
scanf("%d", &opt);
if(opt == 1){
scanf("%d%d%lld", &l, &r, &num);
add_range(l, r, num);
}
if(opt == 2){
scanf("%d %d", &l, &r);
printf("%lld\n", quary_range(l, r));
}
}
return 0;
}
四、優勢與侷限
很顯然,在相同的實現下(區間查詢、區間修改),樹狀數組的碼量要小於線段樹等,運行時的常數與佔用空間也較小。
但實際上,樹狀數組只能維護前綴操作和(前綴和,前綴積,前綴最大最小),而線段樹可以維護區間操作和。
使用樹狀數組來“維護區間操作和”的實現,本質上是取右端點的前綴和,然後對左端點左邊的前綴和的逆元做一次操作。因此,如果不存在逆元的操作(乘法(P.s.:模不爲質數)、區間最值等)就無法用樹狀數組完成。