词法分析设计实验报告附代码.docx
- 文档编号:23362797
- 上传时间:2023-05-16
- 格式:DOCX
- 页数:14
- 大小:186.83KB
词法分析设计实验报告附代码.docx
《词法分析设计实验报告附代码.docx》由会员分享,可在线阅读,更多相关《词法分析设计实验报告附代码.docx(14页珍藏版)》请在冰豆网上搜索。
词法分析设计实验报告附代码
词法分析设计实验报告(附代码)
实验一词法分析设计
实验学时:
4
实验类型:
综合
实验要求:
必修
一、实验目的
通过本实验的编程实践,使学生了解词法分析的任务,掌握词法分析程序设计的原理和构造方法,使学生对编译的基本概念、原理和方法有完整的和清楚的理解,并能正确地、熟练地运用。
二、实验内容
用VC++/VB/JAVA语言实现对C语言子集的源程序进行词法分析。
通过输入源程序从左到右对字符串进行扫描和分解,依次输出各个单词的内部编码及单词符号自身值;若遇到错误则显示“Error”,然后跳过错误部分继续显示;同时进行标识符登记符号表的管理。
以下是实现词法分析设计的主要工作:
(1)从源程序文件中读入字符。
(2)统计行数和列数用于错误单词的定位。
(3)删除空格类字符,包括回车、制表符空格。
(4)按拼写单词,并用(内码,属性)二元式表示。
(属性值——token的机内表示)
(5)如果发现错误则报告出错
(6)根据需要是否填写标识符表供以后各阶段使用。
单词的基本分类:
◆关键字:
由程序语言定义的具有固定意义的标识符。
也称为保留字例如if、for、while、printf;单词种别码为1。
◆标识符:
用以表示各种名字,如变量名、数组名、函数名;
◆常数:
任何数值常数。
如125,1,0.5,3.1416;
◆运算符:
+、-、*、/;
◆关系运算符:
<、<=、=、>、>=、<>;
◆分界符:
;、,、(、)、[、];
a(6,a)标识符(2,1)
﹤=(4,<=)关系运算符(2,2)
3bErrorError(2,4)
%ErrorError(2,4)
)(2,))分界符(2,5)
;(2,;)分界符(2,6)
实验报告正文:
◆功能描述:
该程序具有词法分析功能,即面对一段程序源代码,通过该程序,能检查出源代码是否由词法错误。
◆三、词法分析实验设计思想及算法:
◆首先构造六个表,key[]={"auto","break","case","catch","char","class","const","continue","default","delete","do","double","else","enum","float","for","if","int","long","new","private","protected","public","register","return","short","static","struct","switch","this","void","while","then"};关键字表,单词种别码1;
Delimiter[]={";","(",")","[","]",",",".","{","}"};分界符表单词种别码2
Operator[]={"+","-","*","/"};算术运算符表单词种别码3
R_operators[]={"<","<=","==",">",">="},关键字表,单词种别码1;
stringNumber[100];常数表单词种别码5;
stringIdentifier[100];标示符表单词种别码6;
构造关键字判断函数Iskey(),字母判断函数Isletter(),数字判断函数Isnumber();
构造标示符判别函数InsertId(),若输入的标示符在标示符数组Identifier[]中,返回其下标,若不在,将该标示符插到数组末尾。
构造标示符判别函数InsertNumber(),若输入的数字在数字数组Number[]中,返回其下标,若不在,将该数字插到数组末尾。
具体分析函数analyse()具体实现输入源代码的识别。
anaiyse()构造思路,程序设计图:
综合以上分析,画出整个程序的运行分析程序图,如下:
整个程序的运行分析程序图
◆软件的测试方法和测试结果:
首先,将要分析的源代码写入一个文本,存于磁盘中,然后运行程序,输入源代码文件存放的路径,若输入路径正确,程序将自动分析源代码,若输入路径不正确,程序将显示,路径错误,请重新输入的提示。
下面为具体的运行实例:
源代码为:
Ifi=0thenn++;
a﹤=3b%)
输出满足要求。
◆实验总结(设计的特点、不足、收获与体会):
通过此次实验,让我了解到如何设计、编制并调试词法分析程序,熟悉了构造词法分析程序的手工方式的相关原理,加深了对编译原理词法分析的理解,本次使用C++语言直接编写此法分析程序,也让我重新熟悉了C++语言的相关内容,加深了对C++语言的用途的理解。
本程序的数据输入采取直接从文件中读取,而不是由键盘输入,因此在测试过程中,输入得到大大简化,但是本程序的关键字表只初始化了一部分关键字,还可继续扩充(只需扩大数组,向其中补充要添加的关键字),而且程序的测试数据存在不足,程序可能存在未发现的漏洞,以上两点有待改善。
附录该程序的源代码:
#include
#include
usingnamespacestd;
//数据定义
#defineMAX33
charch='';
staticintline=1,row=0;
intNumberCount=0,IdCount=0;
stringkey[]={"auto","break","case","catch","char","class","const","continue","default","delete","do","double",
"else","enum","float","for","if","int","long","new","private","protected","public","register","return","short","static",
"struct","switch","this","void","while","then"};//关键字表单词种别码1
stringDelimiter[]={";","(",")","[","]",",",".","{","}"};//分界符表单词种别码2
stringOperator[]={"+","-","*","/"};//算术运算符表单词种别码3
stringR_operators[]={"<","<=","==",">",">="};//关系运算符表单词种别码4
stringNumber[100];//常数表单词种别码5
stringIdentifier[100];//标示符表单词种
别码6//数据分析
intIskey(stringc){//关键字判断
inti;
for(i=0;i if(key[i].compare(c)==0)return1; } return0; }//判断是否为字母 intIsLetter(charc){ if(((c<='z')&&(c>='a'))||((c<='Z')&&(c>='A'))){ if((ch<='Z')&&(ch>='A'))ch=ch+32;//转换成小写 return1; } elsereturn0; } intIsNumber(charc){//判断是否为数字 if(c>='0'&&c<='9')return1; elsereturn0; } //将arr中的标示符插入符号表并且返回符号表的指针 intInsertId(strings){ for(inti=0;i { if(Identifier[i]==s){ returni; break; } elseif(IdCount==i+1){ Identifier[IdCount]=s; returnIdCount; IdCount++; } } }//将arr中的常实数插入常数表并且返回常数表的指针 intInsertNumber(strings){ for(inti=0;i { if(Number[i]==s){ returni; break; } elseif(NumberCount==i+1){ Number[NumberCount]=s; returnNumberCount; NumberCount++; } } } voidanalyse(FILE*fpin){ //arr相当于课本中的strToken stringarr=""; while((ch=fgetc(fpin))! =EOF)//判断是否读取到文件末尾或者读取出错 { arr=""; if(ch==''||ch=='\t'||ch=='\n')//删除空格类字符,包括回车、制表符空格 { if(ch=='\n'){ line++; row=0; } } elseif(IsLetter(ch)) { while(IsLetter(ch)||IsNumber(ch)) { arr=arr+ch; ch=fgetc(fpin); } fseek(fpin,-1L,SEEK_CUR);//文件指针回移一个位置 if(Iskey(arr)) { row++;//识别出一个字符,列增加一 cout< <<"\t\t关键字"<<"\t\t("< < } else { row++;//识别出一个字符,列增加一 InsertId(arr); cout< } } //处理常数 elseif(IsNumber(ch)) { while(IsNumber(ch))//||ch=='.'&&IsNumber(fgetc(fpin)) { arr=arr+ch; ch=fgetc(fpin); } if(IsLetter(ch)) { while(IsLetter(ch)||IsNumber(ch)) { arr=arr+ch; ch=fgetc(fpin); } fseek(fpin,-1L,SEEK_CUR); row++; cout< } else{ InsertNumber(arr); row++;//识别出一个字符,列增加一 cout< }//处理算符 else{ row++; arr=ch; switch(ch){ case'+': { ch=fgetc(fpin); if(ch=='('||IsNumber(ch)||IsLetter(ch)) { fseek(fpin,-1L,SEEK_CUR); cout<<"+"<<"\t\t(3,+)"<<"\t\t算术运算符"<<"\t\t("< else cout< }break; case'-': { ch=fgetc(fpin); if(ch=='('||IsNumber(ch)||IsLetter(ch)) {fseek(fpin,-1L,SEEK_CUR);cout<<"-"<<"\t\t(3,-)"<<"\t\t算术运算符"<<"\t\t("< else{cout< }break; case'*': cout<<"-"<<"\t\t(3,*)"<<"\t\t算术运算符"<<"\t\t("< case'=': { ch=fgetc(fpin); if(ch=='=') {cout<<"=="<<"\t\t(4,==)"<<"\t\t关系运算符"<<"\t\t("< else{fseek(fpin,-1L,SEEK_CUR);cout<<"="<<"\t\t(4,=)"<<"\t\t关系运算符"<<"\t("< }break; case'/': cout< case'(': case')': case'[': case']': case';': case'.': case',': case'{': case'}': cout< case'>': {ch=fgetc(fpin); if(ch=='=')cout<<">="<<"\t\t(4,>=)"<<"\t\t关系运算符"<<"\t\t("< else{cout<<">"<<"\t\t(4,>)"<<"\t\t关系运算符"<<"\t\t("< fseek(fpin,-1L,SEEK_CUR);} }break; case'<': {ch=fgetc(fpin); if(ch=='=')cout<<"<="<<"\t\t(4,<=)"<<"\t\t关系运算符"<<"\t("< elseif(ch=='>')cout<<"<>"<<"\t\t(4,<>)"<<"\t\t关系运算符"<<"\t("< else{cout<<"<"<<"\t\t(4,<)"<<"\t\t关系运算符"<<"\t("< fseek(fpin,-1L,SEEK_CUR);} }break; default: cout< } } } } intmain(){ charin_fn[30]; FILE*fpin; cout<<"请输入源文件名(包括路径和后缀名): "; for(;;){ cin>>in_fn; if((fpin=fopen(in_fn,"r"))! =NULL)break; elsecout<<"文件路径错误! 请输入源文件名(包括路径和后缀名): "; } cout<<"\n********************分析如下*********************"< cout<<"单词二元序列类型位置(行,列)"< analyse(fpin); fclose(fpin); return0; }
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 词法 分析 设计 实验 报告 代码