Codeforces1334G Substring Search【通配字符匹配问题】

原創

Master.Yi

2020-06-14 07:57

题目描述：

给出字母排列 $p$ 以及字符串 $s,t$
$s$ 中的字符 $c$ 可以匹配 $t$ 中的 $c$ 和 $p_{c}$ ，求 $s$ 在 $t$ 中的出现位置。
$n\le2*10^5$

题目描述：

法一：枚举字符累加匹配数

枚举一个字符 $c$ ，将 $s$ 中为 $c$ 的位置设为1， $t$ 中匹配的位置设为1，然后做卷积。
每个字符都做完后 $i$ 位置的值就是 $[i-|s|+1,i]$ 匹配 $s$ 的位置个数，检验是否等于 $|s|$ 即可。
复杂度 $O(\sum*n\log n)$ ， $\sum$ 是字符集大小，这里是 $26$ 。
不太能过，可以虚数部分利用起来减小2的常数。

法二：差异计算式求和

将每个位置的匹配信息写作一个计算式，当且仅当匹配时为0，其余时候为正数，那么就只需要检验最后对应位置的和是否为0即可。
此题中 $s$ 匹配 $t[l,r]$ 计算式为 $\sum_{i=0}^{r-l}(s_i-t_{l+i})^2*(p_{s_i}-t_{l+i})^2$ ，将平方拆开之后做FFT。
拆开之后每一项形如 $coef*(s_i^a*p_{s_i}^b)*t_{l+i}^c$ ，总共需要 9 次FFT 以及 2 个前缀和。
upd：实际上可以根据两个位置的幂次和来FFT，比如把 $a+b$ 相同的合并在一起，然后乘上对应的 $c$ ，这样只需要做 3 次FFT 和 2 个前缀和。
复杂度 $O(n\log n*C)$ ， $C$ 是计算式决定的常数。

如果将FFT改写为NTT，由于是在模意义下，可能被卡。可以选择取两个模数；或者更简便的方法是将字符随机一个 $[0,mod)$ 以内的权值，这样做的话甚至可以把计算式中的平方给去掉（相当于是在哈希了）。

法三：枚举字符bitset匹配

FFT和bitset其实是在做差不多的事情，对每个字符预处理出一个bitset $T[c]$ 表示 $c$ 字符在 $t$ 中的出现位置，然后求出这个字符在 $t$ 中的匹配位置 $match[c]$ 。在此题中 $mat[c]=T[c]~|~T[p_c]$

然后用一个 $bitset~ans$ 记录每个位置对 $s$ 的前 $i$ 个字符是否匹配，每次添加 $s[i]$ 时，令 $ans\&=match[s[i]]>>i$ ，最后 $ans$ 的第 $i$ 位为1就代表 $[i,i+|s|-1]$ 和 $s$ 匹配了。

复杂度 $O(预处理+\frac {nm}w)$ ，这个算法当 $n\ge10^5$ 时一般无法通过。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

Codeforces1334G Substring Search【通配字符匹配问题】

题目描述：

题目描述：

法一：枚举字符累加匹配数

法二：差异计算式求和

法三：枚举字符bitset匹配

物理机开关机

LOJ#2278. 「HAOI2017」字符串【差異區間長度限制下的字符串匹配】

LOJ#6537. 毒瘤題(加強版)(再加強版)【找出出現奇數次的數】

CF963D Frequency of String【多串在母串的出現位置】

LOJ#517. 「LibreOJ β Round #2」計算幾何瞎暴力【全局異或、排序，區間求和】

LOJ#3298. 「BJOI2020」封印

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結