算符优先分析程序&对着注释理解代码

一 实验目的和要求

1.理解自下而上分析算法的构造思想。
2.理解算符文法和算符优先文法的概念。
3.掌握 FIRSTVT 集、LASTVT 集和算符优先关系表的构造方法。
4.理解素短语和最左素短语的概念,并掌握其寻求方法。
5.理解算符优先分析算法,能够使用某种高级语言实现一个算符优先分析程序。

二 实验内容

编写一个算符优先分析程序,能实现以下功能:
1.输入文法,判断是否为算符文法;
2.构造并输出该文法的每个非终结符的 FIRSTVT 集和 LASTVT 集;
3.构造并输出算符优先分析表,判断是否为算符优先文法,若不是提示无法进行分析;
4.任意输入一个输入串,可得到成功的分析或错误的提示,输出其分析过程或打印语法 分析树。

三 实验过程

产生式为:
E→E+T|T
T→T*F|F
F-> P^ F|P
P→(E)|i

3.1什么是算符文法?

如果一个文法G中的任何产生式的右部候选项都不含两个连续的非终结符,即不含形如 P->…QR…

3.2FIRSTVT和LASTVT

3.2.1构造FIRSTVT

1,FIRSTVT(P)
对算符文法G的每个非终结符P

定义:FIRSTVT(P)={a|P=>a…,或P=>Qa…,a属于VT,Q 属于VN}

2,集合FIRSTVT(P)的构造方法

规则一:若有产生式P→a…或 P→Qa…,则a∈FIRSTVT(P);
规则二:若a∈FIRSTVT(Q)且有产生式P→Q…,则a∈FIRSTVT(P) ;
规则三:反复使用以上两条规则,直到FIRSTVT(P)不再增大为止。

3.2.3构造LASTVT

1,LASTVT(P)
对算符文法G的每个非终结符P

定义:LASTVT(P)={a|P=>…a,或P=>…aQ,a含于VT,Q 含于VN}

2,集合LASTVT(P)的构造方法

规则一:若有产生式P→…a或 P→…aQ,则a∈LASTVT(P);
规则二:若a∈LASTVT(Q)且有产生式 P→…Q,则a∈LASTVT(P) ;
规则三:反复使用以上两条规则,直到LASTVT( P)不再增大为止。

3.2.4思路

这个实验和上个实验LL(1)分析,差不多,思路方法都一样。 首先为了提高效率,将产生式进行化简,为了不考虑产生式中的"- 和>"符号 化简如下。
E->E+T
E->T
T->T*F
T->F
F->P^F
F->P
P->(E)
P->i
对于判断是不是算符文法,只要遍历一下产生式 然后if判断一下。对于FIRSTVT集,对每一条产生式使用以上规则,再结合if判断,LASTVT集和FIRSTVT集求法一样。
在这里插入图片描述

3.3优先分析表

1,算符优先关系表的构造方法
利用文法G中的每个非终结符P的FIRSTVT集和LASTVT集,我们就能方便地构造文法G的算符优先关系表,其构造方法如下:

规则一:对形如P→…ab…或P→…aQb…的产生式,有a=b;
规则二:对形如P→…aR…的产生式,若有b∈FIRSTVT®,则a<b;
规则三:对形如P→…Rb…的产生式,若有a∈LASTVT®,则a>b;
规则四:对于语句括号#,有#=#,且若a∈FIRSTVT(S)和b∈LASTVT(S),则有#<a且b>#。

2,思路
首先定义一个char类型的二维数组来存发优先关系(<,>,=)使用之前进行初始化一下,然后遍历产生式,根据上面四个规则进行判断,对表赋值。
在这里插入图片描述
在以上算法描述中,为了能够计算#与其它终结符之间的关系,一般在文法的产生式中添加一个新的产生式Z ->#E#

3.4分析过程

一个算符优先文法G的任何句型#N1a1N2a2 … NmamNm+1#的最左素短语是满足如下条件的最左子串:Njaj … NiaiNi+1 :(其中, ai是终结符, Ni是可有可无的非终结符)
aj-1<aj
aj=aj+1,aj+1=aj+2 ,…,ai-1=ai
ai>ai+1
在这里插入图片描述
实际分析时,为了便于识别符号串,一般首先将“#”压入分析栈,当分析成功时,分 析栈中只剩下文法的开始符号和“#”。这里,将“#”作为输入串的结束符,并非文法中的 符号。
在这里插入图片描述

①移进:将输入串的一个符号移进分析栈。
②归约:发现栈顶呈“可归约串”,并用适当的相应符号去替换这个串。
③接受:宣布最终分析成功,可看作是归约的一种特殊形式。
④报错:发现栈顶内容与输入串相悖,调用出错处理程序进行诊察和校正,并对栈顶内容和输入符号进行调整

在这里插入图片描述
最后结果
在这里插入图片描述
思路: 栈顶的终结符或者次栈顶的终结符和输入字符a的优先级比较,a的优先级低于栈顶的优先级,就规约。a的优先级高于或者等于栈顶的就移进.

四 使用代码

1,Base.h文件

#ifndef BASE_H_
#define BASE_H_
#include<iostream>
#include<fstream>
using namespace std;
struct Proce{ //用结构体数组来存放产生式
	char Left;//存放产生式的左部
	char Right[100];//存放产生式的右部
};
struct Myset{
	char VN;//用于存放FIRSTVT(P)和LASTVT(P)的非终结符
	char VT[100]; //用于存放FIRSTVT(P)和LASTVT(P)的终结符
};
class Base
{
public:
	int flag;
	struct Proce pro[100];      //产生式
	struct Myset firstvt[100];  //firstvt集合
	struct Myset lastvt[100];   //lastvt集合
public:
	Base() :flag(0){
		memset(firstvt, 0, sizeof(firstvt)); //置空字符串
		memset(lastvt, 0, sizeof(lastvt));
		memset(pro, 0, sizeof(pro));
	}
	int is_VN(char ch); //判断是否是非终结符,默认大写字母为非终结符,其他为终结符
	void is_gram(Proce pro[], int length); //判断文法是否为算符文法
	void NoAdd(Myset VNT[], int length1); //去掉集合中重复部分
	void FIRSTVT(Proce pro[], Myset firstvt[], int length);//求各非终结符的FIRSTVT集合
	void LASTVT(Proce pro[], Myset lastvt[], int length);//求各非终结符的FIRSTVT集合
};
#endif

2,Base.cpp文件

#include "Base.h"
int Base::is_VN(char ch) //判断是否是非终结符,默认大写字母为非终结符,其他为终结符
{
	if (ch >= 'A'&&ch <= 'Z')
		return 1;
	else
		return 0;
}
void Base::is_gram(Proce pro[], int length) //判断文法是否为算符文法
{
	for (int i = 0; i < length; i++)
	{
		for (int j = 0; j < strlen(pro[i].Right) - 1; j++)
		if (is_VN(pro[i].Right[j]) == 1 && is_VN(pro[i].Right[j + 1]) == 1)//两个非终结符在一起了;
		{
			flag = 1;
			break;
		}
	}
	if (flag == 1)
	{
		cout << "该文法不是算符文法!" << endl;
		return;
	}
	else
		cout << "该文法是算符文法!" << endl;
}
void Base::NoAdd(Myset VNT[], int length1) //去掉集合中重复部分
{
	char str1[20];//非终结符
	char str2[20][100];//终结符
	int length;
	for (int i = 0; i < length1; i++)
	{
		str1[i] = VNT[i].VN;
		strcpy(str2[i], VNT[i].VT);//把终结符复制给str2
	}
	for (int i = 0; i < length1; i++)
		memset(VNT[i].VT, 0, sizeof(VNT[i].VT));//清空
	for (int i = 0; i < length1; i++)
	{
		int t = 0;
		for (int j = 0; j < strlen(str2[i]); j++)
		{
			flag = 1;
			for (int k = 0; k < t; k++)
			if (VNT[i].VT[k] == str2[i][j])//重复了
				flag = 0;
			if (flag == 1)
				VNT[i].VT[t++] = str2[i][j];
		}
		length = strlen(VNT[i].VT);
	}
}
//求各非终结符的FIRSTVT集合
void Base::FIRSTVT(Proce pro[], Myset firstvt[], int length)
{
	int  m = 0;//非终结符个数,flag记录产生式个数
	int  j, k;
	while (flag < length)//length=9产生式总个数
	{
		j = 0;
		firstvt[m].VN = pro[flag].Left;
		while (firstvt[m].VN == pro[flag].Left)
		{
			if (is_VN(pro[flag].Right[0]) == 0) //P->a...则将a加入firstvt(P)中
				firstvt[m].VT[j++] = pro[flag].Right[0];
			else if (is_VN(pro[flag].Right[0]) == 1 && is_VN(pro[flag].Right[1]) == 0) //P->Qa...则将a加入firstvt(P)中
				firstvt[m].VT[j++] = pro[flag].Right[1];
			flag++;
		}
		m++;
	}
	for (int i = length - 1; i >= 0; i--) //P->Q...,则将Q中的终结符加入P中
	if (is_VN(pro[i].Right[0]) == 1 && pro[i].Left != pro[i].Right[0])
	{
		for (j = 0; j < m; j++)   //E->E跳出
		if (firstvt[j].VN == pro[i].Right[0])
			break;
		for (k = 0; k < m; k++)
		if (firstvt[k].VN == pro[i].Left)
			break;
		strcat(firstvt[k].VT, firstvt[j].VT);//firstvt[j].VT添加到firstvt[k].VT后面(strcat字符串连接函数)
	}
	NoAdd(firstvt, m);//去重
	for (int i = 1; i < m; i++) //集合输出
	{
		cout << "FIRSTVT(";
		cout << firstvt[i].VN << ")" << "=" << "{";
		cout << firstvt[i].VT[0];
		for (int j = 1; j < strlen(firstvt[i].VT); j++)
			cout << "," << firstvt[i].VT[j];
		cout << "}" << endl;
	}
}
void Base::LASTVT(Proce pro[], Myset lastvt[], int length)//求各非终结符的FIRSTVT集合
{
	int m = 0;//非终结符个数,flag记录产生式个数
	int  j, k, t;
	while (flag < length)
	{
		j = 0;
		lastvt[m].VN = pro[flag].Left;//把非终结符赋给VN
		while (lastvt[m].VN == pro[flag].Left)
		{
			t = strlen(pro[flag].Right) - 1;
			if (is_VN(pro[flag].Right[t]) == 0) //P->...a则将a加入lastvt(P)中
				lastvt[m].VT[j++] = pro[flag].Right[t];
			else if (is_VN(pro[flag].Right[t]) == 1 && is_VN(pro[flag].Right[t - 1]) == 0) //P->...aQ则将a加入lastvt(P)中
				lastvt[m].VT[j++] = pro[flag].Right[t - 1];
			flag++;
		}
		m++;
	}
	for (int i = length - 1; i >= 0; i--) //P->...Q,则将Q中的终结符加入P中
	{
		t = strlen(pro[flag].Right) - 1;
		if (is_VN(pro[i].Right[t]) == 1 && pro[i].Left != pro[i].Right[t])
		{
			for (j = 0; j < m; j++)
			if (lastvt[j].VN == pro[i].Right[t])
				break;
			for (k = 0; k < m; k++)
			if (lastvt[k].VN == pro[i].Left)
				break;
			strcat(lastvt[k].VT, lastvt[j].VT);
		}
	}
	NoAdd(lastvt, m);
	for (int i = 0; i < m; i++) //集合输出
	{
		cout << "LASTVT(";
		cout << lastvt[i].VN << ")" << "=" << "{";
		cout << lastvt[i].VT[0];
		for (j = 1; j < strlen(lastvt[i].VT); j++)
			cout << "," << lastvt[i].VT[j];
		cout << "}" << endl;
	}
}

3,TableStack.h文件

#ifndef TABLESTACK_H_
#define TABLESTACK_H_
#include"Base.h"
class TableStack :public Base
{
	char table[50][50]; //存放优先表
	int step;           //序号
	char S[100];          //符号栈
public:
	TableStack() :step(1)
	{
		memset(table, 0, sizeof(table));//置空字符串
		memset(S, 0, sizeof(S));
	}
	void Table(Proce pro[], Myset firstvt[], Myset lastvt[], int length); //优先关系表 //返回非终结符个数
	char GetIndex(char a, char b); //找到a,b对应的关系
	void control(char *str);
	void out();
};
#endif

4,TableStack.cpp文件

#include "TableStack.h"
#include<string>
void TableStack::Table(Proce pro[], Myset firstvt[], Myset lastvt[], int length) //优先关系表 
{
	char str[50]; //存放终结符
	int i, k, i1, i2;
	int t = 0;
	memset(str, 0, sizeof(str));//初始化
	for (i = 0; i < length; i++) //遍历所有的产生式
	{
		flag = 1;
		for (k = 0; k <strlen(pro[i].Right); k++)//找终结符
		if (is_VN(pro[i].Right[k]) == 0)
		{
			for (i1 = 0; i1 < t; i1++)
			if (pro[i].Right[k] == str[i1])//已经存在了flag = 0;
				flag = 0;
			if (flag == 1)
				str[t++] = pro[i].Right[k];
		}
	}
	for (i = 0; i < strlen(str); i++)//与习惯保持一致,将#置于最后一个
	{
		if (str[i] == '#')
			swap(str[i], str[strlen(str) - 1]);//#和最后一个交换,把#放最后一个
	}
	for (i = 1; i <= strlen(str); i++)
	{
		table[0][i] = str[i - 1]; //第一列的终结符
		table[i][0] = str[i - 1]; //第一行的终结符 
	}
	for (int i = 0; i < length; i++)//遍历所有的产生式
	{
		int length1 = strlen(pro[i].Right);
		for (int j = 0; j < length1 - 1; j++)//遍历产生式的右部
		{
			if (is_VN(pro[i].Right[j]) == 0 && is_VN(pro[i].Right[j + 1]) == 0)//P->...ab...  
			{
				for (i1 = 0; i1 <= strlen(str); i1++)//遍历终结符
				for (i2 = 0; i2 <= strlen(str); i2++)
				if (table[0][i1] == pro[i].Right[j] && table[i2][0] == pro[i].Right[j + 1])//a=b
				{
					if (table[i1][i2] != 0) //刚开始表里面的值都为0
					{
						cout << "该文法不是算符优先文法!" << endl;
						return;
					}
					else//赋值=
						table[i1][i2] = '=';
				}
			}
			if (j < length1 - 2 && is_VN(pro[i].Right[j]) == 0 && is_VN(pro[i].Right[j + 2]) == 0 && is_VN(pro[i].Right[j + 1]) == 1)//P->...aQb... #E#,(E)
			{
				for (i1 = 0; i1 <= strlen(str); i1++)//遍历终结符
				for (i2 = 0; i2 <= strlen(str); i2++)
				if (table[0][i1] == pro[i].Right[j] && table[i2][0] == pro[i].Right[j + 2])//a=b
				{
					if (table[i1][i2] != 0)
					{
						cout << "该文法不是算符优先文法!" << endl;
						return;
					}
					else
					{
						table[i1][i2] = '=';
					}

				}
			}
			if (is_VN(pro[i].Right[j]) == 0 && is_VN(pro[i].Right[j + 1]) == 1)//P->...aQ...且Q=>b...或Q=>Rb...
			{                                                                  //P->X1 X2...Xi Xi+1.....Xn
				for (i1 = 0; table[0][i1] != pro[i].Right[j]; i1++);//a不等于b
				for (k = 0; firstvt[k].VN != pro[i].Right[j + 1]; k++);//非终结符P,Q不相等
				for (i2 = 0; i2 <= strlen(str); i2++)//遍历终结符
				for (t = 0; t < strlen(firstvt[k].VT); t++)//遍历firstvt集合
				if (table[i2][0] == firstvt[k].VT[t])       //firstvt(Xi+1)中的每个a  Xi<a
				{
					if (table[i1][i2] != 0)
					{
						cout << "该文法不是算符优先文法!" << endl;
						return;
					}
					else
						table[i1][i2] = '<';
				}
			}
			if (is_VN(pro[i].Right[j]) == 1 && is_VN(pro[i].Right[j + 1]) == 0)//P->...Qb...且Q=>..a或Q=>..aR
			{                                                                  //P->X1 X2...Xi Xi+1.....Xn
				for (t = 0; lastvt[t].VN != pro[i].Right[j]; t++);//非终结符P,Q不相等
				for (int k = 0; k < strlen(lastvt[t].VT); k++)//遍历lastvt集合
				for (i1 = 0; i1 <= strlen(str); i1++)//遍历终结符
				for (i2 = 0; i2 <= strlen(str); i2++)
				if (table[0][i1] == lastvt[t].VT[k] && table[i2][0] == pro[i].Right[j + 1])
				{                                                                  //lastvt(Xi)中的每个a >b
					if (table[i1][i2] != 0)
					{
						cout << "该文法不是算符优先文法!" << endl;
						return;
					}
					else
						table[i1][i2] = '>';
				}
			}
		}
	}
	for (int i = 0; i <= strlen(str); i++)
	{
		for (int j = 0; j <= strlen(str); j++)
			cout << table[i][j] << "    ";
		cout << endl;
	}
	cout << "---------------------------------------" << endl;
}
char TableStack::GetIndex(char a, char b) //找到a,b对应的关系
{
	int i, j;
	for (i = 0; table[0][i] != a; i++);
	for (j = 0; table[j][0] != b; j++);
	return table[i][j];
}
void TableStack::control(char *str)
{
	char a;   //输入串里面的每个字符
	int flag = 0;
	char Q;
	int j, k;
	cout << "步骤" << "\t\t符号栈" << "\t\t输入串" << "\t\t动作" << endl;
	a = str[0];//输入串的第一个字符赋给a
	k = 1;     //栈顶指针   栈S的深度
	S[k] = '#'; //栈里面压#
	while (a != '#')
	{
		a = str[flag++]; //把下一个输入字符读入a中                     //N1a1N2a2...aj-1Nj
		if (is_VN(S[k]) == 0)//j指向栈顶的终结符
			j = k;
		else                //栈顶是非终结符 j指向它下面的终结符
			j = k - 1;                            //j指向栈的最上面的终结符
		while (GetIndex(S[j], a) == '>')//外面a的优先级低于栈顶的 就规约
		{                                  
			do{ //自栈顶向栈底方向找出最左子串S[i]<S[i+1]…S[j]>a
				Q = S[j];
				if (is_VN(S[j - 1]) == 0) //j从最左素短语末逐步移向首
					j = j - 1;
				else
					j = j - 2;
			} while (S[j] == Q); //S[j]<Q时表明找到了最左素短语的首部
			cout << step++ << "\t\t" << S + 1 << "\t\t" << str + flag - 1 << "\t\t归约" << endl;
			for (int i = j + 2; i <= k; i++)
				S[i] = 0;
			k = j + 1;
			S[k] = 'N';   //栈顶的这些符号与某一个候选对应相等,就规约到N上
		}
		if (GetIndex(S[j], a) == '<' || GetIndex(S[j], a) == '=')//外面a的优先级高于或者等于栈顶的 就移进
		{
			cout << step++ << "\t\t" << S + 1 << "\t\t" << str +flag - 1;
			if (a != '#')
			{
				cout << "\t\t移进" << endl;
			}
			k = k + 1; //移进来的a就变成了栈顶终结符
			S[k] = a;
		}
		else
		{
			cout << "抱歉,输入的句子有误" << endl;
			return;
		}
	}
	cout << "\t\t接受" << endl << "恭喜您,分析成功" << endl;
	cout << "---------------------------------------------------" << endl;
}
void TableStack::out()
{
	char str3[100] = { 0 };//用于存放一个产生式子
	char str2[100];//用于存放待检测的字符串
	char filename[10];//文件名
	int length = 0; //记录产生式个数
	cout << "请输入文件名:";
	cin >> filename;
	ifstream fin(filename);
	if (!fin)
	{
		cout << "Cannot open the file.\n"; //未找到对应的文件名的文件
		exit(1);
	}
	while (fin)
	{
		fin.getline(str3, 100); //读出一个产生式
		cout << str3 << endl;
		pro[length].Left = str3[0];//产生式的左部
		strcpy(pro[length].Right, str3 + 3);
		length++;
	}
	length -= 1;
	is_gram(pro, length);
	cout << "各非终结符的FIRSTVT集合如下:" << endl;
	FIRSTVT(pro, firstvt, length);
	cout << "各非终结符的LASTVT集合如下:" << endl;
	LASTVT(pro, lastvt, length);
	cout << "-------------构造分析表如下------------" << endl;
	Table(pro, firstvt, lastvt, length);
	cout << "---------------------分析表过程---------------------" << endl;
	cout << "请任意输入一个输入串(以#号键结束):" << endl;
	cin >> str2;
	control(str2);
}

5,main.cpp文件

//编译器VS2013
#include"TableStack.h"
int main()
{
	TableStack s;
	s.out();
	system("pause");
	return 0;
}

五 实验结果

代码总共406行
在这里插入图片描述

六 总结

文法存放用,每一条文法都以->为界限,可以分为左半部分和右半部分,左半部分就一个非终结符,所以用结构体来存放。每个文法它是由终结符和非终结符组成,所以用结构体来存放终结符与非终结符。最主要的是分析表的构造,算符优先算符的实现。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章