《大话数据结构》读书笔记(一)

第5章 串(string)


串:串(string)是由零个或多个字符组成的有限序列,又名叫字符串。


关于串的匹配,文中介绍了两种算法:

1、朴素的模式匹配算法,时间复杂度O((n-m+1)*m)

2、KMP模式匹配算法,时间复杂度O(n+m)

其中n为主串长度,m为要匹配的子串长度。


朴素的模式匹配算法

模式匹配的算法Index,假设主串S和要匹配的子串T的长度存在S[0]与T[0]中,实现代码如下:


/* 返回子串T在主串S中第pos个字符之后的位置。若不存在,则函数返回值为0。*/
/* T非空,1<=pos<=StrLength(s)。 */
int Index ( String S, String T, int pos)
{
	int i = pos;
	int j = 1;
	
	while ( i<= S[0] && j <= T[0])
	{
		if ( S[i] == T[j] )
		{
			++i;
			++j;
		}
		else
		{
			i = i-j+2;
			j = 1;
		}
		if ( j > T[0])
			return i-T[0];
		else
			return 0;
	}
}


KMP模式匹配算法

KMP算法仅当模式与主串之间存在许多“部分匹配”的情况下才体现出它的优势,否则与朴素的模式匹配差异并不明显,算法实现如下:

/* 通过计算返回子串T的next数组 */
void get_next(String T, int *next)
{
	int i,j;
	i=1;
	j=0;
	next[1]=0;
	while (i<T[0])
	{
		if (j==0 || T[i]==T[j])
		{
			++i;
			++j;
			next[i] = j;
		}
		else
			j=next[j];
	}    
}
/* 返回子串T在主串S中第pos个字符之后的位置。若不存在,则函数返回值为0。*/
/* T非空,1<=pos<=StrLength(s)。 */
int Index_KMP ( String S, String T, int pos)
{
	int i = pos;
	int j = 1;
	
	int next[255];
	get_next(T, next);
	while ( i<= S[0] && j <= T[0])
	{
		if ( j==0 || S[i] == T[j] )
		{
			++i;
			++j;
		}
		else
		{
			j = next[j];
		}
		if ( j > T[0])
			return i-T[0];
		else
			return 0;
	}
}

KMP模式匹配算法改进,对求next函数进行了改良

/* 求模式串T的next函数修正值并存入数组nextval */
void get_nextval(String T, int *next)
{
	int i,j;
	i=1;
	j=0;
	nextval[1]=0;
	while (i<T[0])
	{
		if (j==0 || T[i]==T[j])
		{
			++i;
			++j;
			if (T[i] != T[j])
				nextval[i] = j;
			else
				nextval[i] = nextval[j];
		}
		else
			j=next[j];
	}    
}
发布了11 篇原创文章 · 获赞 11 · 访问量 12万+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章