2015蓝桥杯——密文搜索

原創

2019-06-11 09:52

题目描述：

标题：密文搜索

福尔摩斯从X星收到一份资料，全部是小写字母组成。 他的助手提供了另一份资料：许多长度为8的密码列表。 
福尔摩斯发现，这些密码是被打乱后隐藏在先前那份资料中的。

请你编写一个程序，从第一份资料中搜索可能隐藏密码的位置。要考虑密码的所有排列可能性。

数据格式：

输入第一行：一个字符串s，全部由小写字母组成，长度小于1024*1024 紧接着一行是一个整数n,表示以下有n行密码，1<=n<=1000 
紧接着是n行字符串，都是小写字母组成，长度都为8

要求输出： 一个整数, 表示每行密码的所有排列在s中匹配次数的总和。

例如： 用户输入： aaaabbbbaabbcccc 2 aaaabbbb abcabccc

则程序应该输出： 4

这是因为：第一个密码匹配了3次，第二个密码匹配了1次，一共4次。

资源约定： 峰值内存消耗 < 512M CPU消耗 < 3000ms

请严格按要求输出，不要画蛇添足地打印类似：“请您输入…” 的多余内容。

所有代码放在同一个源文件中，调试通过后，拷贝提交该源码。

注意: main函数需要返回0 注意: 只使用ANSI C/ANSI C++ 标准，不要调用依赖于编译环境或操作系统的特殊函数。 注意: 
所有依赖的函数必须明确地在源文件中 #include ， 不能通过工程设置而省略常用头文件。

提交时，注意选择所期望的编译器类型。

思路1：

先对原串做一下预处理：对于原串中每8个连续的子串，存入二维数组中的一行中。然后对于子串，也是存入一行，之后与二维数组的每一行进行匹配，累加完全相同的。

其中，存每一行时，每一行开26个空间，每个空间对应一个小写字母，记录每个小写字母出现的次数。

不过，这种暴力解法，复杂度达到了10^10，所有如果数据量过大，会超时应该，不过对于蓝桥杯，应该可以拿一些分。

代码：

#include <bits/stdc++.h>
#define maxn 11288576 + 50
using namespace std;

string s;
int n;
int cnt[maxn][30];
int rem[30];
int ans;

void init(){
	int len = s.length();
	for(int i = 0; i <= len-8; ++i){
		for(int j = 0; j < 8; ++j){
			char ch = s[i + j];
			cnt[i][ch - 'a']++;
		}
	}
}

void calc(){
	int len = s.length();
	for(int i = 0; i <= len-8; ++i){
		int flag = 1;
		for(int j = 0; j < 26; ++j){
			if(cnt[i][j] != rem[j]){
				flag = 0;
				break;
			}
		}
		if(flag) ans++;
	}
}

int main(){
	cin >> s >> n;
	init();
	for(int t = 1; t <= n; ++t){
		string tmp;
		cin >> tmp;
		memset(rem, 0, sizeof(rem));
		for(int i = 0; i < 8; ++i){
			char ch = tmp[i];
			rem[ch - 'a']++;
		}
		calc();
	}
	cout << ans << endl;
	return 0;
}

思路2：

仔细分析上面的代码，发现主要的时间开销来自于子串与原串进行匹配时，需要遍历每一行，而原串的长度最大可达10^6，所以很费时。

既然发现是查找部分耗时严重，那么就尽力去优化查找了，不难想到二分查找，不过由于二分查找，一般适用于数字，所以就想，能否将这由8个字母组成的子串转为数字，方法是：将这26个字母对应0~25，就可以将这个子串转为26机制数，最后再转为10进制即可。这样就可以用二分进行查找了。

另外，不想手撸二分的话，可以直接用STL容器：set, map。这里由于每个子串匹配的数量不仅仅只有1个，所以我用来map。

代码：

#include <bits/stdc++.h>
typedef long long ll;
using namespace std;

string s;
int n;
map<ll, int>  mp;
int ans;

void init(){
	int len = s.length();
	for(int i = 0; i <= len - 8; ++i){
		//  将原串中从i开始之后的8个字符存入向量中 
		vector<char> v;			 
		for(int j = 0; j < 8; ++j){
			char ch = s[i + j];
			v.push_back(ch);
		}
		// 为了和子串比较，先排序 
		sort(v.begin(), v.end());
		// 将这个8个字符转为26进制数字，便于二分查找 
		ll sum = 0;
		for(int j = 0; j < 8; ++j){
			char ch = v[j];
			sum = sum * 26 + (ch - 'a');
		}
		mp[sum]++;
	}
}

int main(){
	cin >> s >> n;
	init();
	for(int t = 1; t <= n; ++t){
		string tmp;
		cin >> tmp;
		vector<char> v;			 
		for(int i = 0; i < 8; ++i){
			char ch = tmp[i];
			v.push_back(ch);
		}
		// 为了和原串比较，先排序 
		sort(v.begin(), v.end());
		// 将这个8个字符转为26进制数字，便于二分查找 
		ll sum = 0;
		for(int i = 0; i < 8; ++i){
			char ch = v[i];
			sum = sum * 26 + (ch - 'a');
		}
		ans += mp[sum];	
	}
	cout << ans << endl;
	return 0;
}

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

2015蓝桥杯——密文搜索

UVA - 10305 --- 拓撲排序

一個不能理解的異常問題 -- 待解決，先記錄下，也希望大佬們不吝賜教

入坑VSCode -- 詳細配置：運行C++/C代碼在終端運行文件讀入配置刷題模板

2015藍橋杯——密文搜索

Codeforces Round #556 (Div. 2) -- C 1150C - Prefix Sum Primes

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結