K-D tree大意:建立在暴力平衡树替罪羊树上的一种暴力数据分割方式
而且在某些问题上拥有玄学的时间复杂度,感觉很废
也可以去看看ball tree,比这个优秀(但是麻烦
前置芝士:替罪羊树
自己找资料学吧,懒得写
时间复杂度:
不好说啊,视题目而定吧
对于k维数据,像查询一些区间内的点和第几远就是的(不会证明
但是对于找近邻感觉完全没法分析(玄学
听说BBF可以优化?
算法:
给你一堆点,每个点有k个座标(k维直角座标系)
已经说了是暴力数据分割了,你应该知道怎么做吧
存储信息:
每个点存一下自己的左右儿子,子树大小(重建需要),子树中每一位座标最大和最小(判断区域)即可
有时要顺应题目要求存一些点权和或最大、小值之类
插入:
总体来讲就是像平衡树设置一个根,然后一个一个元素插入,每次只增加一个节点;
但我们判断新建点进左子树还是进右子树的策略改变,因为我们有多个判断指标,是多维而不是普通平衡树的一维,所以我们要采取特殊的分割方式:
第一,很容易想到的是轮换分割:
每个座标轮流着来,众生平等,让每个座标都尽量平均。
example:这一层用x分割,下一层用y分割,再下一层用x分割
第二,有点神奇的方差分割:
可以参考:方差
但是这玩意很少用,也没什么人专门卡K-D tree
而且用起来需要大量的加法和乘法,而它们都是很慢的,常数大,有时还没有轮换快
我们这里所说的分割,实际上是通过当前点x的座标与新建点y的座标相比来确定进入哪一棵子树
如果现在的座标判断是wd,d存储座标,则:
- 若y.d[wd]<=x.d[wd],进入左子树
- 若y.d[wd]>x.d[wd],进入右子树
当我们无路可走,即当前点标号为0(即没有建过)时,就可以新建点在这里安家了
查询:
就是暴力,每到一个点就用当前点信息更新答案,注意是当前点而不是区间。
然后就是尽量剪枝
感觉每个题剪枝都不太一样啊
但是很明确的有几种
-
查询某块区域的点,直接通过判断座标来得出区域相交信息来剪枝
如果查询的区间包括当前点表示的区间,直接加上当前区间的总答案
如果有交集但不包括,就左右子树都进入查询(可见其暴力
如果没有交集,直接回溯 -
查询k远离,维护一个小根堆,每次比较一下当前的区间中的最远距离和堆顶
如果最远距大于堆顶,就左右子树爆搜
如果不,直接回溯 -
查询k近邻,
感觉就是假的,每次比较左右子树的最小值,同时像上面比较最近距离和堆顶
左子树小就先走左子树,右儿子小就先走右子树,什么玩意
技巧:
先给你n个点的时候可以不一个一个插入(很慢)
直接一发重建函数把树建出来:
rt=build(1,n,0);
代码:
代码中可以看到一个函数:nth_element
其实没什么高级的,就是将l~r的指定位置mid搞一搞,前面的数小于a[mid],后面的数大于a[mid]
因为有多维所以要写一个重载运算符或一个cmp函数
#include<bits/stdc++.h>
using namespace std;
const double alpha=0.7;
const int k=2;
struct pt{
int d[k],w;
}a[200010];
struct data{
int mx[k],mn[k],sum,ls,rs,sz;
pt p;
}tree[200010];
int stk[200010];
int n,ans,tot,word,top,rt;
int operator <(pt u,pt v){
return u.d[word]<v.d[word];
}
int newnode(){//记得写垃圾回收,不然一拍平重建就会变成两倍空间
if(top) return stk[top--];
return ++tot;
}
void up(int x){//更新
int l=tree[x].ls;
int r=tree[x].rs;
for(int i=0;i<2;i++){
tree[x].mx[i]=tree[x].mn[i]=tree[x].p.d[i];
if(l) tree[x].mx[i]=max(tree[x].mx[i],tree[l].mx[i]);
if(r) tree[x].mx[i]=max(tree[x].mx[i],tree[r].mx[i]);
if(l) tree[x].mn[i]=min(tree[x].mn[i],tree[l].mn[i]);
if(r) tree[x].mn[i]=min(tree[x].mn[i],tree[r].mn[i]);
}
tree[x].sum=tree[l].sum+tree[r].sum+tree[x].p.w;
tree[x].sz=tree[l].sz+tree[r].sz+1;
}
int build(int l,int r,int wd){//重建
if(l>r) return 0;
int mid=(l+r)>>1;
int x=newnode();
word=wd,nth_element(a+l,a+mid,a+r+1);//就是找个当前维度的中值啦
tree[x].p=a[mid];
tree[x].ls=build(l,mid-1,wd^1);
tree[x].rs=build(mid+1,r,wd^1);
up(x); return x;
}
void flt(int x,int num){//拍平
int l=tree[x].ls;
int r=tree[x].rs;
if(l) flt(l,num);
stk[++top]=x;
a[tree[l].sz+num+1]=tree[x].p;
if(r) flt(r,num+tree[l].sz+1);
}
void check(int &x,int wd){
int l=tree[x].ls,r=tree[x].rs;
if(tree[x].sz*alpha<tree[l].sz||tree[x].sz*alpha<tree[r].sz)
flt(x,0),x=build(1,tree[x].sz,wd);
}
void ins(int &x,pt y,int wd){
if(x==0){
x=newnode();
tree[x].p=y;
tree[x].ls=0;
tree[x].rs=0;
up(x);
return;
}
if(y.d[wd]<=tree[x].p.d[wd]) ins(tree[x].ls,y,wd^1); //wd^1是针对2维,多维请写一个nxt数组轮换
else ins(tree[x].rs,y,wd^1);
up(x),check(x,wd);
}
bool in(){
//判断满足条件
}
bool out(){
//判断不满足条件
}
int query(int x,int x1,int y1,int x2,int y2){
if(x==0) return 0;
int ans=0,l=tree[x].ls,r=tree[x].rs;
if(in()) return tree[x].sum; //总体包括则直接返回整个区间答案
if(out()) return 0; //整个不包括则返回0
if(in()) ans+=tree[x].p.w; //当前点是否满足
ans+=query(l,x1,y1,x2,y2)+query(r,x1,y1,x2,y2);
return ans;
}
int main(){
scanf("%d",&n);
}
例题:
1941: [Sdoi2010]Hide and Seek:入门
2648: SJY摆棋子:入门
2716: [Violet 3]天使玩偶:入门
以上三道都是找最近、最远点对的入门题。
4520: [Cqoi2016]K远点对:第k远,要用堆(优先队列)维护
4066: 简单题:求平面上某矩形和,带插入,插入的话就一直往下走,直到能插入为止
3489: A simple rmq problem:不那么裸的kd-tree,把pre,next,i看做三个维度就可以搞了
2850: 巧克力王国:求某条直线下的点权和,比简单题还简单
3053: The Closest M Points:用堆维护,注意多组数据,每次要清空tr