哈希(蛤铪)

哈希

——————————18.5.14更新

——————————18.5.15更新 哈希的判断

哈希是神马东西呢。。。。简单来说它是一个函数啦。。。就这么样(好难呀)

哈希的简介

它是将一个复杂的字符串用一个函数将它映射成一个数字的过程。哈希的函数有很多,也很玄学,因为它看起来很容易错,有很多反例,但是它就是不错。它主要用于判断两个字符串是否相等,具体地实现是判断两个字符的哈希函数的值是否一样即可。

哈希的函数

一下函数都是针对一个字符串A的:(其中p 是质数,len 为字符串长度,cntAi 为该位字符在该字符串中出现次数)

hash(A)=i=1lenAipi

hash(A)=i=1lenAipleni

还有一个特殊的一个函数:
hash(A)=i=1lenAipcntAi

两个字符串的hash值相同,我们就可以认为两个字符串相等。

具体实现哈希的方法

1.取模

首先我们要取两个很棒的质数p,mod,p表示哈希函数中的p,mod是hash函数的取模(因为哈希函数的值十分大,取模才能比较大小,而且mod比p的选取更加重要)
这里介绍几个很棒的质数:(mod=1234321237,998244353)(p=1e9+7,1e9+9)
代码:

long long hash[maxn],p,mod;//longlong避免溢出 
void gethash(string a){
    int i,len=a.length();
    hsh[0]=a[0];
    for(i=1;i<len;i++)
        hsh[i]=((hsh[i-1]*p)%mod+a[i])%mod;//计算从首位到该位构成的子串的hash值 
}

2.自然溢出(稍微比取模好)

运用longlong有上限的功能,将hash值模longlong的上限,常数更小。(要用到unsigned long long,因为它取不到负数)
代码:

unsigned long long hash[maxn],p;//unsigned long long 取不到负数 
void gethash(string a){
    int i,len=a.length();
    hsh[0]=a[0];
    for(i=1;i<len;i++)
        hsh[i]=hsh[i-1]*pa[i];//计算从首位到该位构成的子串的hash值 
}

哈希的技巧

1.O1 计算A中A[l]至A[r]的hash值

想一想我们之前算出的hash值储存方式中每个数组的值是什么?:

hash(k)=i=1kaipleni

hash(l,r)=i=lraipri=i=1raiprii=1laipliprl

可推得:
hash(l,r)=hashrhash(l1)prl

而p的次幂可以数组预处理储存,就O1 计算了。在线计算是Ologn
当然,也可以推得前面另一种hash函数的A[l]-A[r]的值,不过要求出逆元,要复杂一些(玄学出错)。

2.双哈希

有些题的数据很强,哈希很容易被卡(哈希很玄学),所以要用到它。顾名思义,即蛤两次,比较两个hash值的大小即可。注意两个hash函数的mod必须不一样。

这些就是hash的内容了,以后应该会更哈希树的内容。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章