KMP算法(複習自用)


一直以來學習都有點浮躁,抓着半截就跑,今天學習KMP算法時,連示例代碼都沒有讀一遍就開始手擼代碼,根本沒有理解完整正文的意思。最後不僅求next寫錯了,KMP匹配也寫錯了,於是反反覆覆回去看教程,兩三個小時才寫出來。

KMP算法,不管是主算法還是預處理的next求取,在學習中要深刻把握住兩個不同的下標,思考何時應該往回退(術語回溯),何時應該+1,何時應該置零。

問題概述

有主串s,模式串p。求:s有多少子串等於p?出現在s的什麼位置?
詳細描述見洛谷P3375 【模板】KMP字符串匹配

算法講解

本文略去暴力算法的分析。

定義next數組

記p的前i位爲子串t。
若存在u,使得u既是t的前綴,也是t的後綴,則u最長的長度記錄於next[i]。

其實我感覺這裏命名爲next怪怪的,但是我也沒有想到更貼切且簡潔的描述的方式,這樣看來,就按它的用途來命名也無可厚非。

KMP主算法

匹配進行到主串的pos1位和模式串的第pos2位時,發現不匹配(在這之前的pos2-1位全部匹配)。在這時如果把pos2退回到第一位,就是暴力算法;而退回到已經和s匹配了的後一項,則爲KMP算法。

如何回退呢?這裏就要用到的就是next數組,它可以指引我們應該回退到第幾位。
圖轉自 洛谷網校 阮行止
圖轉自 洛谷網校 阮行止

值得注意的是,如果pos2已經退回到0了,那就無法繼續回退了,此時應該將pos1加1進行下一步的比較。

快速求取next數組

接下來描述如何求取next。
next數組的思路和動規更加貼近,若已知前i-1位的next數組,如何求取第i位的next呢?

記錄next[i-1]爲tmp。

  • 如果p[i]=p[tmp+1],那麼next[i]就等於tmp+1
  • 如果p[i]!=p[tmp+1],那麼就回溯tmp,令tmp=next[tmp]
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章