题目描述:
标题:密文搜索
福尔摩斯从X星收到一份资料,全部是小写字母组成。 他的助手提供了另一份资料:许多长度为8的密码列表。
福尔摩斯发现,这些密码是被打乱后隐藏在先前那份资料中的。
请你编写一个程序,从第一份资料中搜索可能隐藏密码的位置。要考虑密码的所有排列可能性。
数据格式:
输入第一行:一个字符串s,全部由小写字母组成,长度小于1024*1024 紧接着一行是一个整数n,表示以下有n行密码,1<=n<=1000
紧接着是n行字符串,都是小写字母组成,长度都为8
要求输出: 一个整数, 表示每行密码的所有排列在s中匹配次数的总和。
例如: 用户输入: aaaabbbbaabbcccc 2 aaaabbbb abcabccc
则程序应该输出: 4
这是因为:第一个密码匹配了3次,第二个密码匹配了1次,一共4次。
资源约定: 峰值内存消耗 < 512M CPU消耗 < 3000ms
请严格按要求输出,不要画蛇添足地打印类似:“请您输入…” 的多余内容。
所有代码放在同一个源文件中,调试通过后,拷贝提交该源码。
注意: main函数需要返回0 注意: 只使用ANSI C/ANSI C++ 标准,不要调用依赖于编译环境或操作系统的特殊函数。 注意:
所有依赖的函数必须明确地在源文件中 #include , 不能通过工程设置而省略常用头文件。
提交时,注意选择所期望的编译器类型。
思路1:
先对原串做一下预处理:对于原串中每8个连续的子串,存入二维数组中的一行中。然后对于子串,也是存入一行,之后与二维数组的每一行进行匹配,累加完全相同的。
其中,存每一行时,每一行开26个空间,每个空间对应一个小写字母,记录每个小写字母出现的次数。
不过,这种暴力解法,复杂度达到了10^10,所有如果数据量过大,会超时应该,不过对于蓝桥杯,应该可以拿一些分。
代码:
#include <bits/stdc++.h>
#define maxn 11288576 + 50
using namespace std;
string s;
int n;
int cnt[maxn][30];
int rem[30];
int ans;
void init(){
int len = s.length();
for(int i = 0; i <= len-8; ++i){
for(int j = 0; j < 8; ++j){
char ch = s[i + j];
cnt[i][ch - 'a']++;
}
}
}
void calc(){
int len = s.length();
for(int i = 0; i <= len-8; ++i){
int flag = 1;
for(int j = 0; j < 26; ++j){
if(cnt[i][j] != rem[j]){
flag = 0;
break;
}
}
if(flag) ans++;
}
}
int main(){
cin >> s >> n;
init();
for(int t = 1; t <= n; ++t){
string tmp;
cin >> tmp;
memset(rem, 0, sizeof(rem));
for(int i = 0; i < 8; ++i){
char ch = tmp[i];
rem[ch - 'a']++;
}
calc();
}
cout << ans << endl;
return 0;
}
思路2:
仔细分析上面的代码,发现主要的时间开销来自于子串与原串进行匹配时,需要遍历每一行,而原串的长度最大可达10^6,所以很费时。
既然发现是查找部分耗时严重,那么就尽力去优化查找了,不难想到二分查找,不过由于二分查找,一般适用于数字,所以就想,能否将这由8个字母组成的子串转为数字,方法是:将这26个字母对应0~25,就可以将这个子串转为26机制数,最后再转为10进制即可。这样就可以用二分进行查找了。
另外,不想手撸二分的话,可以直接用STL容器:set, map。这里由于每个子串匹配的数量不仅仅只有1个,所以我用来map。
代码:
#include <bits/stdc++.h>
typedef long long ll;
using namespace std;
string s;
int n;
map<ll, int> mp;
int ans;
void init(){
int len = s.length();
for(int i = 0; i <= len - 8; ++i){
// 将原串中从i开始之后的8个字符存入向量中
vector<char> v;
for(int j = 0; j < 8; ++j){
char ch = s[i + j];
v.push_back(ch);
}
// 为了和子串比较,先排序
sort(v.begin(), v.end());
// 将这个8个字符转为26进制数字,便于二分查找
ll sum = 0;
for(int j = 0; j < 8; ++j){
char ch = v[j];
sum = sum * 26 + (ch - 'a');
}
mp[sum]++;
}
}
int main(){
cin >> s >> n;
init();
for(int t = 1; t <= n; ++t){
string tmp;
cin >> tmp;
vector<char> v;
for(int i = 0; i < 8; ++i){
char ch = tmp[i];
v.push_back(ch);
}
// 为了和原串比较,先排序
sort(v.begin(), v.end());
// 将这个8个字符转为26进制数字,便于二分查找
ll sum = 0;
for(int i = 0; i < 8; ++i){
char ch = v[i];
sum = sum * 26 + (ch - 'a');
}
ans += mp[sum];
}
cout << ans << endl;
return 0;
}