K-D tree详解

K-D tree大意:建立在暴力平衡树替罪羊树上的一种暴力数据分割方式

而且在某些问题上拥有玄学的时间复杂度,感觉很废
也可以去看看ball tree,比这个优秀(但是麻烦


前置芝士:替罪羊树

自己找资料学吧,懒得写


时间复杂度:

不好说啊,视题目而定吧
对于k维数据,像查询一些区间内的点和第几远就是O(nlogn)O(nn11k)O(nlogn)到O(n\cdot n^{1-\frac {1}{k}})的(不会证明
但是对于找近邻感觉完全没法分析(玄学
听说BBF可以优化?


算法:

给你一堆点,每个点有k个座标(k维直角座标系)
已经说了是暴力数据分割了,你应该知道怎么做吧

存储信息:

每个点存一下自己的左右儿子,子树大小(重建需要),子树中每一位座标最大和最小(判断区域)即可
有时要顺应题目要求存一些点权和或最大、小值之类

插入:

总体来讲就是像平衡树设置一个根,然后一个一个元素插入,每次只增加一个节点;
但我们判断新建点进左子树还是进右子树的策略改变,因为我们有多个判断指标,是多维而不是普通平衡树的一维,所以我们要采取特殊的分割方式:

第一,很容易想到的是轮换分割
每个座标轮流着来,众生平等,让每个座标都尽量平均。
example:这一层用x分割,下一层用y分割,再下一层用x分割

第二,有点神奇的方差分割
可以参考:方差
但是这玩意很少用,也没什么人专门卡K-D tree
而且用起来需要大量的加法和乘法,而它们都是很慢的,常数大,有时还没有轮换快

我们这里所说的分割,实际上是通过当前点x的座标与新建点y的座标相比来确定进入哪一棵子树
如果现在的座标判断是wd,d存储座标,则:

  • 若y.d[wd]<=x.d[wd],进入左子树
  • 若y.d[wd]>x.d[wd],进入右子树

当我们无路可走,即当前点标号为0(即没有建过)时,就可以新建点在这里安家了

查询:

就是暴力,每到一个点就用当前点信息更新答案,注意是当前点而不是区间。

然后就是尽量剪枝
感觉每个题剪枝都不太一样啊
但是很明确的有几种

  1. 查询某块区域的点,直接通过判断座标来得出区域相交信息来剪枝
    如果查询的区间包括当前点表示的区间,直接加上当前区间的总答案
    如果有交集但不包括,就左右子树都进入查询(可见其暴力
    如果没有交集,直接回溯

  2. 查询k远离,维护一个小根堆,每次比较一下当前的区间中的最远距离和堆顶
    如果最远距大于堆顶,就左右子树爆搜
    如果不,直接回溯

  3. 查询k近邻,感觉就是假的,每次比较左右子树的最小值,同时像上面比较最近距离和堆顶
    左子树小就先走左子树,右儿子小就先走右子树,什么玩意


技巧:

先给你n个点的时候可以不一个一个插入(很慢)
直接一发重建函数把树建出来:

rt=build(1,n,0);

代码:

代码中可以看到一个函数:nth_element
其实没什么高级的,就是将l~r的指定位置mid搞一搞,前面的数小于a[mid],后面的数大于a[mid]
因为有多维所以要写一个重载运算符或一个cmp函数

#include<bits/stdc++.h>
using namespace std;
const double alpha=0.7;
const int k=2;
struct pt{
	int d[k],w;
}a[200010];
struct data{
	int mx[k],mn[k],sum,ls,rs,sz;
	pt p;
}tree[200010];
int stk[200010];
int n,ans,tot,word,top,rt;
int operator <(pt u,pt v){
	return u.d[word]<v.d[word];
}
int newnode(){//记得写垃圾回收,不然一拍平重建就会变成两倍空间
	if(top) return stk[top--];
	return ++tot;
}
void up(int x){//更新
	int l=tree[x].ls;
	int r=tree[x].rs;
	for(int i=0;i<2;i++){
		tree[x].mx[i]=tree[x].mn[i]=tree[x].p.d[i];
		if(l) tree[x].mx[i]=max(tree[x].mx[i],tree[l].mx[i]);
		if(r) tree[x].mx[i]=max(tree[x].mx[i],tree[r].mx[i]);
		if(l) tree[x].mn[i]=min(tree[x].mn[i],tree[l].mn[i]);
		if(r) tree[x].mn[i]=min(tree[x].mn[i],tree[r].mn[i]);
	}
	tree[x].sum=tree[l].sum+tree[r].sum+tree[x].p.w;
	tree[x].sz=tree[l].sz+tree[r].sz+1;
}
int build(int l,int r,int wd){//重建
	if(l>r) return 0;
	int mid=(l+r)>>1;
	int x=newnode();
	word=wd,nth_element(a+l,a+mid,a+r+1);//就是找个当前维度的中值啦
	tree[x].p=a[mid];
	tree[x].ls=build(l,mid-1,wd^1);
	tree[x].rs=build(mid+1,r,wd^1);
	up(x); return x;
}
void flt(int x,int num){//拍平	
	int l=tree[x].ls;
	int r=tree[x].rs;
	if(l) flt(l,num);
	stk[++top]=x;
	a[tree[l].sz+num+1]=tree[x].p;
	if(r) flt(r,num+tree[l].sz+1);
}
void check(int &x,int wd){
	int l=tree[x].ls,r=tree[x].rs;
	if(tree[x].sz*alpha<tree[l].sz||tree[x].sz*alpha<tree[r].sz)
	flt(x,0),x=build(1,tree[x].sz,wd);
}
void ins(int &x,pt y,int wd){
	if(x==0){
		x=newnode();
		tree[x].p=y;
		tree[x].ls=0;
		tree[x].rs=0;
		up(x);
		return;
	}
	if(y.d[wd]<=tree[x].p.d[wd]) ins(tree[x].ls,y,wd^1); //wd^1是针对2维,多维请写一个nxt数组轮换
	else ins(tree[x].rs,y,wd^1);
	up(x),check(x,wd);
}
bool in(){
	//判断满足条件
}
bool out(){
	//判断不满足条件
}
int query(int x,int x1,int y1,int x2,int y2){
	if(x==0) return 0;
	int ans=0,l=tree[x].ls,r=tree[x].rs;
	if(in()) return tree[x].sum; //总体包括则直接返回整个区间答案
	if(out()) return 0; //整个不包括则返回0
	if(in()) ans+=tree[x].p.w; //当前点是否满足				
	ans+=query(l,x1,y1,x2,y2)+query(r,x1,y1,x2,y2);
	return ans;
}
int main(){
	scanf("%d",&n);
}

例题:

1941: [Sdoi2010]Hide and Seek:入门
2648: SJY摆棋子:入门
2716: [Violet 3]天使玩偶:入门
以上三道都是找最近、最远点对的入门题。
4520: [Cqoi2016]K远点对:第k远,要用堆(优先队列)维护
4066: 简单题:求平面上某矩形和,带插入,插入的话就一直往下走,直到能插入为止
3489: A simple rmq problem:不那么裸的kd-tree,把pre,next,i看做三个维度就可以搞了
2850: 巧克力王国:求某条直线下的点权和,比简单题还简单
3053: The Closest M Points:用堆维护,注意多组数据,每次要清空tr

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章