HDU4281

HDU4281

字符串有关的算法，大致可以分为三类。一是像本题一样，用哈希函数来解（定长字符串）；二是KMP算法（包括其变种）；三是AC自动机。

这个问题，由于子串之间需要相互比较的组合太多，为了避免重复的比较计算，需要找到一个有效的办法进行处理。不然就组合爆炸了。所以，字符串的哈希函数是一个好的选择。各个子串都计算一个哈希值，字符串比较问题就变成了哈希值比较的问题。进一步，把哈希值放入容器map中，就很快知道各个字串是否都不同（数一下数量）。m*l长的字符串，分为m个l长的子串，各个子串的哈希值作为key放入容器map中，如果容器map中有m个元素，说明各个字串都不相同。

有关字符串哈希值的计算，可以参见：B00013 字符串哈希函数。其中的内容来自百度百科，可惜编码质量太差，不可以直接用的。

计算哈希函数有各种各样的算法。本程序用的是BKDRHash算法，其中的基数一般取素数，以降低哈希值冲突的概率。这个基数，在实际计算时，可以看作是进制。

计算各个字符串的哈希值的方法也是本程序的一个亮点。这里也是按照无名大神的做法做的。

先计算函数hv()，对于字符串s，若其长度为n，则hv(n+1)=0，hv(i)=h(i+1)*base+第i个字符的ASCII值。这里的base为计算哈希值的基数。

再计算函数nbase()，该函数定义为nbase(1)=1，nbase(i)=nbase(i-1)*base。

这样，对于字符串s，第i个字符开始的长度为l的各个子串的哈希值hash(i)＝hv(i)-hv(i+l)*nbase(l)。

以上的哈希值计算方法，主要是为了减少计算量。

同样是为了加快程序运行速度，程序中使用了一个带参数的宏定义“#define getHashval(n, l) hv[n] - hv[n+l] * nbase[l]”，比起使用函数来要好一些，至少省去了程序调用返回和参数传递。这也是有经验程序员的常见做法。

其他需要说明的，都在程序注释里了。

AC程序如下：

[cpp]view
plain copy
 
/* HDU4821 String */  

#include <iostream>  

#include <string>  

#include <map>  

using namespace std;  

#define getHashval(n, l) hv[n] - hv[n+l] * nbase[l]  

typedef unsigned long long ULL;  

const int base = 131;  

ULL hv[100000+1];  

ULL nbase[100000+1];  

map<ULL, int> hashmap; // 类型为map，实际当作一个集合来使用  

int main()  

{  

    int m, l, count;  

    string s;  

    nbase[0] = 1;  

    for(int i=1; i<=100000; i++)  

        nbase[i] = nbase[i-1] * base;  

    // 输入m和l  

    while (scanf("%d%d", &m, &l) != EOF) {  

        //输入字符串  

        cin >> s;  

        // 计数清零  

        count = 0;  

        // 计算长度为l，各个字串的哈希值  

        int len = (int)s.length();  

        hv[len] = 0;  

        for(int i=len-1; i>=0; i--)  

            hv[i] = hv[i+1] * base + s.at(i);  

        // 窗口A，长度为m*l，在输入字符串上滑动，每次滑动１个字符，可以看到len-m*l+1个字串  

        int end = len-m*l;  

        for(int i=0; i<l && i<=end; i++) {  

            //哈希值集合初始化：清空  

            hashmap.clear();  

            // 将长度为m*l的串，切割为长度为l的m个子串，分别将各个子串的哈希值放入hashmap集合  

            // map中，map的key是子串的哈希值，map的值是一个计数，即相同哈希值出现n次的话则值为n  

            for(int j=i; j<i+m*l; j+=l)  

                hashmap[getHashval(j, l)]++;  

            if((int)hashmap.size() == m)  

                count++;  

            // 窗口B，长度为m*l，开始与窗口A重合，每次向右滑动l个字符，到窗口右边与字符右边对齐为止  

            // 每滑动一次B窗口，将最左边那长度l子串的哈希值移出hashmap集合，右边子串的哈希值添加到集合  

            int end2 = len-m*l-l;  

            for (int j=i; j<=end2; j+=l) {  

                ULL temp = getHashval(j, l);  

                hashmap[temp]--;  

                if(hashmap[temp] == 0)  

                    hashmap.erase(temp);  

                hashmap[getHashval(j+m*l, l)]++;  

                if((int)hashmap.size() == m)  

                    count++;  

            }  

        }  

        // 输出结果  

        cout << count << endl;  

    }  

    return 0;  

}

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

Python3中的deque模塊（雙向隊列）

Windows輸出當前文件夾內的所有文件目錄名稱。

thinkPHP中引入富文本編輯器。

電腦有網絡，QQ卻登錄不上？

Thinkphp如何發送郵件。

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結