最小回文分解NlogN算法

原創

2020-07-02 19:03

本文翻譯自這篇論文
譯者水平有限，如有錯漏，還望指出
論文中有僞代碼可以幫助理解
衆所周知，字符串的border有和等差數列相關的一些性質（border group），可以參考2015年集訓隊論文集裏的《淺談字符串匹配的幾種方法》一文，迴文串的迴文border也有類似的性質。

tips：
真後綴定義類似真子集

下面給出算法所用到的幾個引理
引理1
令y爲迴文串x的後綴，y是x的border當且僅當y是迴文串
證明顯然
引理2
令y爲x的後綴且 $| x | \leq | 2 y |$ ，x是迴文串當且僅當y是迴文串
證明顯然
引理3
令y爲x的真後綴， $| x | - | y |$ 是x的循環節當且僅當y是迴文串
顯然
引理4

令y爲迴文串x的最長迴文真後綴，z爲y的最長迴文真後綴，不妨令 $x = u y, y = v z$ ，那麼有

$(1) | u | \geq | v |$

$(2) i f | u | > | v |, | u | > | z |$

$(3) i f | u | = | v |, u = v$

由前三個引理可證

有了上述4個引理，我們可以類似border group搞事情

對於一個前綴 $S_{1, j}$ ，定義 $P_{j}$ 爲下標集合 ${p_{1}, p_{2} . . . p_{m}}, p_{1} < p_{2} < . . . < p_{m}$ 表示 $S_{1, j}$ 的所有迴文後綴的開頭，定義差值爲 $p_{i + 1} - p_{i}$ ，那麼有

引理5

$P_{j}$ 的差值單調不增，且最多有 $O (\log j)$ 種取值

由引理4顯然

對每個不同的差值 $Δ$ ，定義 $P_{j, Δ} = {p_{i} : 1 < i \leq m, p_{i} - p_{i - 1} = Δ}$ ，特殊的， $P_{j, \infty} = {p_{1}}$ ，每一個 $P_{j, Δ}$ 可以表示爲三元組 $(min P_{j, Δ}, Δ, | P_{j, Δ})$ ，將三元組按 $Δ$ 降序記在鏈表 $G_{j}$ 中

那麼由引理5， $G_{j}$ 的大小是 $O (\log j)$ 的，接下來證明 $G_{j}$ 能用 $O (| G_{j - 1} |)$ 時間從 $G_{j - 1}$ 推過來。衆所周知，每個 $i \in P_{j - 1}$ 要麼被 $i - 1 \in P_{j}$ 替代要麼被刪除，那麼有

引理6

令 $p_{i}$ 和 $p_{i + 1}$ 爲 $P_{j - 1, Δ}$ 中的相鄰元素， $p_{i} - 1 \in P_{j}$ 當且僅當 $p_{i + 1} - 1 \in P_{j}$

易證

有了引理6，可以想象，三元組 $(i, Δ, k) \in G_{j - 1}$ 或被刪除或被替換爲 $(i - 1, Δ, k)$ ，也即

G_{j}^{'} = {(i - 1, Δ, k) : (i, Δ, k) \in G_{j - 1}, i > 1, and S_{i - 1} = S_{j}}

但是，我們的新三元組似乎有些不合定義，需要做一些調整：若 $p_{i} \in P_{j - 1, Δ}$ 被 $p_{i} - 1$ 替換，而 $p_{i - 1} = p_{i} - Δ \in P_{j - 1}$ 被刪除，那麼 $p_{i} - 1$ 就不應該在 $P_{j, Δ}$ 裏。注意到只有每組第一個元素可能需要調整，故我們分裂出每組第一個元素，即

replace (p_{i} - 1, Δ, k) with (p_{i} - 1, Δ^{'}, 1) and (if k > 1) (p_{i} - 1 + Δ, Δ, k - 1)

其中

Δ^{'}

爲

p_{i} - 1

在

P_{j}

中新的差值

令 $G_{j}^{″}$ 爲 $G_{j}^{'}$ 經過上述變換的結果，可以看出差值的維護已經基本無誤了，接下來只需要合併差值相等的三元組，就可以通過 $G_{j}^{″}$ 得到正確的 $G_{j}$ 了

引理7

$G_{j}$ 可由 $G_{j - 1}$ 用 $O (| G_{j - 1} |) = O (| \log j |)$ 時間計算出

上述7個引理足夠維護 $G_{j}$ ，接下來解釋如何通過 $P_{j, Δ}$ 和 $P_{j - Δ, Δ}$ 的聯繫快速轉移DP值

引理8

若有 $(i, Δ, k) \in G_{j}, k \geq 2$ ，則有 $(i, Δ, k - 1) \in G_{j - Δ}$

畫圖可證

由引理8，若 $| P_{j, Δ} \geq 2 |$ 則 $P_{j, Δ} = P_{j - Δ, Δ} \cup {max P_{j, Δ}}$ ，憑此即可在常數時間利用 $P L_{j - Δ, Δ}$ 計算 $P L_{j, Δ} = min {P L_{i - 1} + 1 : i \in P_{j, Δ}}$ 。 $P L_{i}$ 表示第 $i$ 個前綴的最小回文分解大小。我們把 $P L_{j, Δ}$ 存在 $G P L_{m}, m = min P_{j, Δ} - Δ$ 中，顯然當 $| P_{j, Δ} | \geq 2$ 的時候 $P L_{j, Δ}$ 和 $P L_{j - Δ, Δ}$ 對應下標相同，接下來證明一個引理，來說明在 $j - Δ$ 到 $j$ 中不會有其他時刻訪問此位置

引理9

令 $m = min P_{j, Δ} - Δ$ ， $\forall l \in [j - Δ + 1, j - 1], m \notin P_{l}$

易證

綜上，我們有

定理10

最小回文分解可以用 $O (n \log n)$ 時間 $O (n)$ 空間計算

沒懂可以看論文裏的僞代碼

後面的東西暫時不感興趣，不翻了

例題：

Codeforces Round #454 div1 E Reverses

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

最小回文分解NlogN算法

MySQL 核心模塊揭祕 | 18 期 | 鎖在內存里長什麼樣*

使用perf工具生成火焰圖

大齡程序員思考

響應式界面控件DevExtreme * 更強的數據分析和可視化功能

HttpSecurity 是如何組裝過濾器鏈的

數說海南——近6年海南各市縣人口簡單看

長序列中Transformers的高級注意力機制總結

WebStorm 創建 Vue 項目

Min_25篩代碼

最小回文分解NlogN算法

GDOI2016總結

CV1873 樹的點分治

bzoj4722 由乃

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結