第5章 串(string)
串:串(string)是由零个或多个字符组成的有限序列,又名叫字符串。
关于串的匹配,文中介绍了两种算法:
1、朴素的模式匹配算法,时间复杂度O((n-m+1)*m)
2、KMP模式匹配算法,时间复杂度O(n+m)
其中n为主串长度,m为要匹配的子串长度。
朴素的模式匹配算法
模式匹配的算法Index,假设主串S和要匹配的子串T的长度存在S[0]与T[0]中,实现代码如下:
/* 返回子串T在主串S中第pos个字符之后的位置。若不存在,则函数返回值为0。*/
/* T非空,1<=pos<=StrLength(s)。 */
int Index ( String S, String T, int pos)
{
int i = pos;
int j = 1;
while ( i<= S[0] && j <= T[0])
{
if ( S[i] == T[j] )
{
++i;
++j;
}
else
{
i = i-j+2;
j = 1;
}
if ( j > T[0])
return i-T[0];
else
return 0;
}
}
KMP模式匹配算法
KMP算法仅当模式与主串之间存在许多“部分匹配”的情况下才体现出它的优势,否则与朴素的模式匹配差异并不明显,算法实现如下:
/* 通过计算返回子串T的next数组 */
void get_next(String T, int *next)
{
int i,j;
i=1;
j=0;
next[1]=0;
while (i<T[0])
{
if (j==0 || T[i]==T[j])
{
++i;
++j;
next[i] = j;
}
else
j=next[j];
}
}
/* 返回子串T在主串S中第pos个字符之后的位置。若不存在,则函数返回值为0。*/
/* T非空,1<=pos<=StrLength(s)。 */
int Index_KMP ( String S, String T, int pos)
{
int i = pos;
int j = 1;
int next[255];
get_next(T, next);
while ( i<= S[0] && j <= T[0])
{
if ( j==0 || S[i] == T[j] )
{
++i;
++j;
}
else
{
j = next[j];
}
if ( j > T[0])
return i-T[0];
else
return 0;
}
}
KMP模式匹配算法改进,对求next函数进行了改良
/* 求模式串T的next函数修正值并存入数组nextval */
void get_nextval(String T, int *next)
{
int i,j;
i=1;
j=0;
nextval[1]=0;
while (i<T[0])
{
if (j==0 || T[i]==T[j])
{
++i;
++j;
if (T[i] != T[j])
nextval[i] = j;
else
nextval[i] = nextval[j];
}
else
j=next[j];
}
}