蓝桥杯18届第八题——日志统计（尺取法，数据处理）

原創

2020-05-02 15:02

日志统计

小明维护着一个程序员论坛。现在他收集了一份"点赞"日志，日志共有N行。
其中每一行的格式是：ts id
表示在ts时刻编号id的帖子收到一个"赞"。
现在小明想统计有哪些帖子曾经是"热帖"。如果一个帖子曾在任意一个长度为D的时间段内收到不少
于K个赞，小明就认为这个帖子曾是"热帖"。
具体来说，如果存在某个时刻T满足该帖在[T, T+D)这段时间内(注意是左闭右开区间)收到不少于K个
赞，该帖就曾是"热帖"。
给定日志，请你帮助小明统计出所有曾是"热帖"的帖子编号。
【输入格式】
第一行包含三个整数N、D和K。
以下N行每行一条日志，包含两个整数ts和id。
对于50%的数据，1 <= K <= N <= 1000
对于100%的数据，1 <= K <= N <= 100000 0 <= ts <= 100000 0 <= id <= 100000
【输出格式】
按从小到大的顺序输出热帖id。每个id一行。
【输入样例】
7 10 2
0 1
0 10
10 10
10 1
9 1
100 3
100 3
【输出样例】
1
3

题意

①、热帖定义：存在某个时刻T满足该帖在[T, T+D)这段时间内(注意是左闭右开区间)收到不少于K个
赞，该帖就曾是"热帖"。
②、统计出所有曾是"热帖"的帖子编号。

解题思路

题目要求在给定的时间区间（[T, T+D)）范围内，统计出曾是"热帖"的帖子编号。
很显然，既然是在给定区间内做统计，那就要用到尺取法的思想来解题。
ps：若对尺取法不太熟悉的朋友，可以点击下面链接学习、巩固。
尺取法详解与练习

数据处理

尺取法的应用要在有序的条件下进行，但题目给我们的是无序的 ts 与 id ，那如何巧妙地将 ts 与 id 的数据进行处理呢？
①、ts 与 id 之间是有联系、不可分割存储，这里利用结构体的形式将 ts 与 id 联系在一起。

struct node{
	int ts;
	int id;
};

②、vector工具存储N组 ts 与 id 结构体，并得到结构体组，方便进行排序。
注意：vector最好不要开过大空间，否则将vector中会出现多余的元素，导致下面从小到大的排序出现错误，这里只需开到N就足够了。

vector<node> ts_id(N);

③、尺取法是在时间 ts 上应用，以 ts 的大小来对结构体组的进行排序。

//自定义比较函数
bool cmp(node r1, node r2)
{
	return r1.ts<r2.ts;
}
//将vector中的元素按ts从小到大排序 
sort(ts_id.begin(), ts_id.end(), cmp);

通过自定义比较函数的方式，能够将结构体组以结构体中的某个变量的大小对结构体组进行排序。
不得不说，sort函数是很实用的排序函数！

尺取法的运用

代码一：
每改变一次左指针，都重新统计[ts_id[r].ts ~ ts_id[l].ts+D)区间上的id出现次数。
这种方法效率并不高，复杂度为O(n²)。

#include<bits/stdc++.h>
#define ll long long
using namespace std;
struct node{
	int ts;
	int id;
};

bool cmp(node r1, node r2)
{
	return r1.ts<r2.ts;
}

int main()
{
	ll N, D, K;
	cin>>N>>D>>K;
		
	//vector不要开过大空间
	//否则将vector中会出现多余的元素
	//从小到大的排序出现错误 
	vector<node> ts_id(N); 
	for(int i=0; i<N; i++)
		cin>>ts_id[i].ts>>ts_id[i].id;
	
	//将vector中的元素按ts从小到大排序 
	sort(ts_id.begin(), ts_id.end(), cmp);
	
	//每改变一次左指针，都重新统计[ts_id[r].ts~ts_id[l].ts+D)区间上的id出现次数
	set <int> ans;
	for(int l=0; l<N; l++)
	{
		map <int, int> cnt;
		for(int r=l; ts_id[r].ts<ts_id[l].ts+D && r<N; r++)
		{
			cnt[ts_id[r].id]++;
			if(cnt[ts_id[r].id]==K)
			{
				ans.insert(ts_id[r].id);
				break;
			}
		}
	}
	
	set<int>::iterator iter;
	for(iter=ans.begin(); iter!=ans.end(); iter++)
		cout<<*iter<<endl;
	
	return 0;
}

代码二：
在ts的时间轴上，区间[ts_id[r].ts ~ ts_id[l].ts+D)进行移动。
避免了每次移动左指针后都要重新统计 [ts_id[r].ts ~ ts_id[l].ts+D)区间上的id出现次数。
复杂度为O(n)。

#include<bits/stdc++.h>
#define ll long long
using namespace std;
struct node{
	int ts;
	int id;
};

bool cmp(node r1, node r2)
{
	return r1.ts<r2.ts;
}

int main()
{
	ll N, D, K;
	cin>>N>>D>>K;
	
	//vector不要开过大空间
	//否则将vector中会出现多余的元素
	//从小到大的排序出现错误 
	vector<node> ts_id(N); 
	
	for(int i=0; i<N; i++)
		cin>>ts_id[i].ts>>ts_id[i].id;
	
	//将vector中的元素按ts从小到大排序 
	sort(ts_id.begin(), ts_id.end(), cmp);
	
	//以区间[ts_id[r].ts ~ ts_id[l].ts+D)进行移动
	set <int> ans;
	map <int, int> cnt;
	for(int l=0, r=0; l<N; l++)
	{
		while(r<N && ts_id[r].ts<ts_id[l].ts+D)
		{
			cnt[ts_id[r].id]++;
			if(cnt[ts_id[r].id]==K)
				ans.insert(ts_id[r].id);
			r++;
		}
		//左指针出现的id去掉
		//左指针向右移动 
		cnt[ts_id[l].id]--;
	}
	
	set<int>::iterator iter;
	for(iter=ans.begin(); iter!=ans.end(); iter++)
		cout<<*iter<<endl;
	
	return 0;
}

总结

①、使用vector存储多组结构体，形成结构体组，便于排序。
②、通过设计sort函数参数——自定义比较函数，实现结构体组以结构体中的某个变量的大小对结构体组进行排序。
③、尺取法算法效率优化。

希望能够将自己的一些学习经验分享给有需要的人。
我是小郑，一个坚持不懈的小白。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

蓝桥杯18届第八题——日志统计（尺取法，数据处理）

日志统计

题意

解题思路

数据处理

尺取法的运用

总结

洛谷題集——單源最短路徑（弱化版、spfa+鄰接表）

洛谷題集——最大食物鏈計數（動態規劃、圖的基本應用、BFS）

基礎算法題——奇怪的分式（避免小數運算）

藍橋杯15屆第十題——生命之樹（dfs， vector）

0/1揹包例題及解析（裝箱問題、kkksc03考前臨時抱佛腳）

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結