2015蓝桥杯——密文搜索

题目描述:

标题:密文搜索

福尔摩斯从X星收到一份资料,全部是小写字母组成。 他的助手提供了另一份资料:许多长度为8的密码列表。 
福尔摩斯发现,这些密码是被打乱后隐藏在先前那份资料中的。

请你编写一个程序,从第一份资料中搜索可能隐藏密码的位置。要考虑密码的所有排列可能性。

数据格式:

输入第一行:一个字符串s,全部由小写字母组成,长度小于1024*1024 紧接着一行是一个整数n,表示以下有n行密码,1<=n<=1000 
紧接着是n行字符串,都是小写字母组成,长度都为8

要求输出: 一个整数, 表示每行密码的所有排列在s中匹配次数的总和。

例如: 用户输入: aaaabbbbaabbcccc 2 aaaabbbb abcabccc

则程序应该输出: 4

这是因为:第一个密码匹配了3次,第二个密码匹配了1次,一共4次。

资源约定: 峰值内存消耗 < 512M CPU消耗 < 3000ms

请严格按要求输出,不要画蛇添足地打印类似:“请您输入…” 的多余内容。

所有代码放在同一个源文件中,调试通过后,拷贝提交该源码。

注意: main函数需要返回0 注意: 只使用ANSI C/ANSI C++ 标准,不要调用依赖于编译环境或操作系统的特殊函数。 注意: 
所有依赖的函数必须明确地在源文件中 #include , 不能通过工程设置而省略常用头文件。

提交时,注意选择所期望的编译器类型。

思路1:

先对原串做一下预处理:对于原串中每8个连续的子串,存入二维数组中的一行中。然后对于子串,也是存入一行,之后与二维数组的每一行进行匹配,累加完全相同的。

其中,存每一行时,每一行开26个空间,每个空间对应一个小写字母,记录每个小写字母出现的次数。

不过,这种暴力解法,复杂度达到了10^10,所有如果数据量过大,会超时应该,不过对于蓝桥杯,应该可以拿一些分。

代码:

#include <bits/stdc++.h>
#define maxn 11288576 + 50
using namespace std;

string s;
int n;
int cnt[maxn][30];
int rem[30];
int ans;

void init(){
	int len = s.length();
	for(int i = 0; i <= len-8; ++i){
		for(int j = 0; j < 8; ++j){
			char ch = s[i + j];
			cnt[i][ch - 'a']++;
		}
	}
}

void calc(){
	int len = s.length();
	for(int i = 0; i <= len-8; ++i){
		int flag = 1;
		for(int j = 0; j < 26; ++j){
			if(cnt[i][j] != rem[j]){
				flag = 0;
				break;
			}
		}
		if(flag) ans++;
	}
}

int main(){
	cin >> s >> n;
	init();
	for(int t = 1; t <= n; ++t){
		string tmp;
		cin >> tmp;
		memset(rem, 0, sizeof(rem));
		for(int i = 0; i < 8; ++i){
			char ch = tmp[i];
			rem[ch - 'a']++;
		}
		calc();
	}
	cout << ans << endl;
	return 0;
}

思路2:

仔细分析上面的代码,发现主要的时间开销来自于子串与原串进行匹配时,需要遍历每一行,而原串的长度最大可达10^6,所以很费时。

既然发现是查找部分耗时严重,那么就尽力去优化查找了,不难想到二分查找,不过由于二分查找,一般适用于数字,所以就想,能否将这由8个字母组成的子串转为数字,方法是:将这26个字母对应0~25,就可以将这个子串转为26机制数,最后再转为10进制即可。这样就可以用二分进行查找了。

另外,不想手撸二分的话,可以直接用STL容器:set, map。这里由于每个子串匹配的数量不仅仅只有1个,所以我用来map。

代码:

#include <bits/stdc++.h>
typedef long long ll;
using namespace std;

string s;
int n;
map<ll, int>  mp;
int ans;

void init(){
	int len = s.length();
	for(int i = 0; i <= len - 8; ++i){
		//  将原串中从i开始之后的8个字符存入向量中 
		vector<char> v;			 
		for(int j = 0; j < 8; ++j){
			char ch = s[i + j];
			v.push_back(ch);
		}
		// 为了和子串比较,先排序 
		sort(v.begin(), v.end());
		// 将这个8个字符转为26进制数字,便于二分查找 
		ll sum = 0;
		for(int j = 0; j < 8; ++j){
			char ch = v[j];
			sum = sum * 26 + (ch - 'a');
		}
		mp[sum]++;
	}
}

int main(){
	cin >> s >> n;
	init();
	for(int t = 1; t <= n; ++t){
		string tmp;
		cin >> tmp;
		vector<char> v;			 
		for(int i = 0; i < 8; ++i){
			char ch = tmp[i];
			v.push_back(ch);
		}
		// 为了和原串比较,先排序 
		sort(v.begin(), v.end());
		// 将这个8个字符转为26进制数字,便于二分查找 
		ll sum = 0;
		for(int i = 0; i < 8; ++i){
			char ch = v[i];
			sum = sum * 26 + (ch - 'a');
		}
		ans += mp[sum];	
	}
	cout << ans << endl;
	return 0;
} 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章