中国象棋游戏的设计与实现毕业设计.docx
- 文档编号:10417039
- 上传时间:2023-02-11
- 格式:DOCX
- 页数:58
- 大小:102.13KB
中国象棋游戏的设计与实现毕业设计.docx
《中国象棋游戏的设计与实现毕业设计.docx》由会员分享,可在线阅读,更多相关《中国象棋游戏的设计与实现毕业设计.docx(58页珍藏版)》请在冰豆网上搜索。
中国象棋游戏的设计与实现毕业设计
毕业论文声明
本人郑重声明:
1.此毕业论文是本人在指导教师指导下独立进行研究取得的成果。
除了特别加以标注地方外,本文不包含他人或其它机构已经发表或撰写过的研究成果。
对本文研究做出重要贡献的个人与集体均已在文中作了明确标明。
本人完全意识到本声明的法律结果由本人承担。
2.本人完全了解学校、学院有关保留、使用学位论文的规定,同意学校与学院保留并向国家有关部门或机构送交此论文的复印件和电子版,允许此文被查阅和借阅。
本人授权大学学院可以将此文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本文。
3.若在大学学院毕业论文审查小组复审中,发现本文有抄袭,一切后果均由本人承担,与毕业论文指导老师无关。
4.本人所呈交的毕业论文,是在指导老师的指导下独立进行研究所取得的成果。
论文中凡引用他人已经发布或未发表的成果、数据、观点等,均已明确注明出处。
论文中已经注明引用的内容外,不包含任何其他个人或集体已经发表或撰写过的研究成果。
对本文的研究成果做出重要贡献的个人和集体,均已在论文中已明确的方式标明。
学位论文作者(签名):
年月
关于毕业论文使用授权的声明
本人在指导老师的指导下所完成的论文及相关的资料(包括图纸、实验记录、原始数据、实物照片、图片、录音带、设计手稿等),知识产权归属华北电力大学。
本人完全了解大学有关保存,使用毕业论文的规定。
同意学校保存或向国家有关部门或机构送交论文的纸质版或电子版,允许论文被查阅或借阅。
本人授权大学可以将本毕业论文的全部或部分内容编入有关数据库进行检索,可以采用任何复制手段保存或编汇本毕业论文。
如果发表相关成果,一定征得指导教师同意,且第一署名单位为大学。
本人毕业后使用毕业论文或与该论文直接相关的学术论文或成果时,第一署名单位仍然为大学。
本人完全了解大学关于收集、保存、使用学位论文的规定,同意如下各项内容:
按照学校要求提交学位论文的印刷本和电子版本;学校有权保存学位论文的印刷本和电子版,并采用影印、缩印、扫描、数字化或其它手段保存或汇编本学位论文;学校有权提供目录检索以及提供本学位论文全文或者部分的阅览服务;学校有权按有关规定向国家有关部门或者机构送交论文的复印件和电子版,允许论文被查阅和借阅。
本人授权大学可以将本学位论文的全部或部分内容编入学校有关数据库和收录到《中国学位论文全文数据库》进行信息服务。
在不以赢利为目的的前提下,学校可以适当复制论文的部分或全部内容用于学术活动。
论文作者签名:
日期:
指导教师签名:
日期:
毕业设计
中国象棋游戏的设计与实现
摘要
中国象棋发展至今已有数千年的历史了,它是中华民族智慧的结晶。
在我国,中国象棋的普及程度是其它棋类无法比拟的,大至国际、国内比赛,小至社区街道。
如今,仅中国就有2亿人会下中国象棋,且中国象棋的发展趋势日益国际化。
本文首先研究了中国象棋在计算机中的表示问题,讨论如何产生着法等一系列相关内容,其次研究了博弈树的搜索技术及在此基础上发展起来的相关剪枝算法。
系统使用MFC文档视图体系结构和VisualC++开发工具,实现了一个具有一定棋力的中国象棋人机对弈程序。
此博弈程序实现了人机博弈,悔棋,电脑难度设置,着法名称生成等功能。
关键词:
中国象棋人工智能博弈树Alpha-Beta搜索
1前言
1.1中国象棋游戏设计背景和研究意义
中国象棋游戏流传至今已经有数千年的历史了,是一种古老的文化,它集文化、科学、艺术、竞技于一体,有利于开发人的智慧,锻炼人的思维,培养人的毅力,增强人的竞争意识。
自从计算机发明,向各个领域发展,到成为我们现在每天工作和生活必不可少的一部分的这个过程中,电子游戏也逐步渗入我们每个人的娱乐活动中。
在计算机已经普及的今天,对于可以用计算机进行程序编辑的人来说,开发属于自己的游戏,已经不再是梦想,中国象棋历史悠久不仅源远流长,而且基础广泛,作为一项智力运动更成为我们游戏开发的首选对象。
中国象棋是一项智力游戏,以往都是人和人下棋,现在有了计算机我们可以和计算机竞技,人可以与计算机进行对弈。
控制计算机的是人类,而人工智能是综合性很强的一门边缘学科,它的中心任务是研究如何使计算机去做那些过去只能靠人的智力才能做的工作。
因此,对游戏开发过程中的人工智能技术的研究自然也就成了业界的一个热门研究方向。
1.2国内外象棋软件发展概况
最早的象棋软件是一副可以外出携带的电子棋盘,后来升级到电视游戏机。
开始出现的一些容量很小的象棋软件如:
DOS界面《将族》、WIN31程序的《中国象棋》等等,与其说人类下不过电脑,倒不如说是没有耐性等待电脑程序慢吞吞的搜索算法,有时甚至怀疑软件是否在搜索中死掉了。
后来,网络上先后出现了真正的WINDOWS窗口界面的象棋专业高级软件《棋隐》、《象棋世家》、《象棋参谋》、《象棋奇兵》等。
总而言之,各类象棋软件既有自身的优点,也存在共通性的缺陷,如:
中局审势不够智能化,走不出弃子取势的人性化佳构,残局时智力明显低于人脑,难以走出残局例胜的必然着法等。
放眼未来,象棋软件已经走完了一波持续上涨的行情,有可能出现逐步降温的滑坡趋势。
1.3中国象棋游戏设计研究方法
本系统主要用VisualC++进行开发,里面的MFC类库,使游戏开发更加方便,并利用人工智能相关搜索算法实现人工智能的着法生成,从而完善整个游戏的功能。
该象棋人机博弈系统实现的功能主要包括:
1、选手选择(人或电脑);
2、人机对弈(人与电脑竞技);
3、电脑棋力难度选择(电脑下棋能力难度选择,共有4级:
按电脑配置选择难度);
4、悔棋、还原;
5、着法名称显示(象棋走棋规范名称)。
1.4本文的主要工作
第一部分主要介绍了中国象棋游戏开发的背景及意义、国内外象棋软件的发展概况和象棋游戏的设计研究方法;
第二部分介绍了棋局表示方法和着法生成;
第三部分介绍了走棋和博弈程序的实现;
第四部分介绍了界面设计和系统的实现。
2棋局表示和着法生成
2.1棋盘和棋子的表示
对于中国象棋棋盘局面的表示可采用传统而简单的“棋盘数组”。
即用一个9*10的数组来存储棋盘上的信息,数组的每个元素存储棋盘上是否有棋子。
这种表示方法简单易行。
按此方法棋盘的初始情形如下所示:
BYTECChessBoard[9][10]={
R,0,0,P,0,0,p,0,0,r,
H,0,C,0,0,0,0,c,0,h,
E,0,0,P,0,0,p,0,0,e,
A,0,0,0,0,0,0,0,0,a,
K,0,0,P,0,0,p,0,0,k,
A,0,0,0,0,0,0,0,0,a,
E,0,0,P,0,0,p,0,0,e,
H,0,C,0,0,0,0,c,0,h,
R,0,0,P,0,0,p,0,0,r
};
给所有棋子定义一个值:
#defineR_BEGINR_KING
#defineR_ENDR_PAWN
#defineB_BEGINB_KING
#defineB_ENDB_PAWN
#defineNOCHESS0//没有棋子
黑方:
#defineB_KING1//黑帅
#defineB_CAR2//黑车
#defineB_HORSE3//黑马
#defineB_CANON4//黑炮
#defineB_BISHOP5//黑士
#defineB_ELEPHANT6//黑象
#defineB_PAWN7//黑卒
红方:
#defineR_KING8//红将
#defineR_CAR9//红车
#defineR_HORSE10//红马
#defineR_CANON11//红炮
#defineR_BISHOP12//红士
#defineR_ELEPHANT13//红相
#defineR_PAWN14//红兵
判断颜色:
#defineIsBlack(x)(x>=B_BEGIN&&x<=B_END)//判断某个棋子是不是黑色
#defineIsRed(x)(x>=R_BEGIN&&x<=R_END)//判断某个棋子是不是红色
对于着法的表示,直接借用棋盘数组的下标来记录着法的起点和目标点。
至于是什么棋子在走,以及是否吃子、吃的是什么子,在着法结构中并不记录。
这些信息由外部读取棋盘上起点、终点的数据获得。
着法结构定义如下,其中还包含了对着法的历史得分的记录项,以供后面要讲到的“历史启发”所用。
typedefstruct
{
shortnChessID;//表明是什么棋子
CHESSMANPOSFrom;//起始位置
CHESSMANPOSTo;//走到什么位置
intScore;//走法的分数
}CHESSMOVE;
有了对棋盘局面和着法的表示之后,程序才能够完成以下操作:
生成所有合法着法;
执行着法、撤销着法;
针对某一局面进行评估。
因而,棋局表示好比是整个程序(计算机下棋引擎部分)的地基,之后所有的操作都将建立在其基础上。
2.2着法生成
在着法生成器中,采用的基本思想就是遍历整个棋盘(一个接一个地查看棋盘上的每个位置点),当发现有当前下棋方的棋子时先判断它是何种类型的棋子,然后根据其棋子类型而相应地找出其所有合法着法并存入着法队列。
这里谈到的“合法着法”包括以下几点:
1、各棋子按其行子规则行子。
诸如马跳“日”字、象走“田”字、士在九宫内斜行等等(这里需要特别注意的是卒(兵)的行子规则会随其所在位置的不同而发生变化——过河后可以左右平移)。
2、行子不能越出棋盘的界限。
当然所有棋子都不能走到棋盘的外面,同时某些特定的棋子还有自己的行棋界限,如将、士不能出九宫,象不能过河。
3、行子的半路上不能有其它子阻拦(除了炮需要隔一个子才能打子之外)以及行子的目的点不能有本方的棋子(当然不能自己吃自己了)。
4、将帅不能碰面(本程序中只在生成计算机的着法时认为将帅碰面是非法的,而对用户所走的导致将帅碰面的着法并不认为其非法,而只是产生败局罢了)。
产生了着法后要将其存入着法队列以供搜索之用,由于搜索会搜索多层(即考虑双方你来我往好几步,这样才有利于对局面进行评估以尽可能避免“目光短浅”),所以在把着法存入着法队列的时候还要同时存储该着法所属的搜索层数。
因此可以将着法队列定义为二维数组m_MoveList[8][70],其中第一个数组下标为层数,第二个数组下标为每一层的全部着法数。
关于搜索层数,设定为4,实际使用的是1到3(在界面中将其限定为1—3)。
搜索层数的增加会显著提高电脑的下棋水平(当然计算机的棋力在很大程度上也依赖于局面评估)。
在配置为1.5G,512M内存的计算机上最多只能搜索3层,再多将导致搜索时间达到令人无法容忍的地步(这里还需要特别说明的是,搜索的速度也和着法生成的效率以及局面评估的复杂度有关,因为每分析一个结点都要执行这两种操作)。
对于每一层的着法数,也就是当前下棋方针对当前局面的所有可选的合法着法,据有关数据统计在象棋实战中一般最多情况下也就五六十种。
定义第二个数组下标为70,应当可以保证十分的安全。
3走棋和博弈程序的实现
3.1博弈程序的实现
3.1.1搜索算法
搜索算法对于整个下棋引擎来说都是至关重要的。
它如同程序的心脏,驱动着整个程序。
搜索算法的好坏直接影响着程序执行的效率(从某种角度上,它影响着计算机的下棋水平。
因为,计算机必须在有限的时间内完成思考,搜索速度快意味着在相同的时间内程序可以“看”得更远,“想”的更多)。
关于棋类对弈程序中的搜索算法,已有成熟的Alpha-Beta搜索算法以及其它一些辅助增强算法(还有众多基于Alpha-Beta算法的派生、变种算法)。
我们在程序中直接借鉴了Alpha-Beta搜索算法并辅以历史启发。
本节先介绍Alpha-Beta搜索算法:
在中国象棋里,双方棋手获得相同的棋盘信息。
他们轮流走棋,目的就是吃掉对方的将或帅,或者避免自己的将或帅被吃。
……
表示红方走棋
表示黑方走棋
……
……
图1博弈树
又此,可以用一棵“博弈树”(图1)来表示下棋的过程——树中每一个结点代表棋盘上的一个局面,对每一个局面(结点)根据不同的走法又产生不同的局面(生出新的结点),如此不断进行下去直到再无可选择的走法,即到达叶子结点(棋局结束)。
中国象棋的博弈树的模型大概如下图所示,可以把其中连接结点的线段看作是着法,不同的着法自然产生不同的局面。
该树包含三种类型的结点:
1、奇数层的中间结点(以及根结点),表示轮到红方走棋;
2、偶数层的中间结点,表示轮到黑方走棋;
3、叶子结点,表示棋局结束。
现在让计算机来下中国象棋,它应当选择一步对它最有利的着法(最终导致它取胜的着法)。
获得最佳着法的方法就是“试走”每一种可能的着法,比较它们所产生的不同后果,然后从中选出能够产生对自己最有利的局面的着法。
结合上面所讲的博弈树,若给每个结点都打一个分值来评价其对应的局面(这一任务由后面所讲的局面评估来完成),那么可以通过比较该分值的大小来判断局面的优劣。
假定甲乙两方下棋,甲胜的局面是一个极大值(一个很大的正数),那么乙胜的局面就是一个极小值(极大值的负值),和棋的局面则是零值(或是接近零的值)。
如此,当轮到甲走棋时他会尽可能地让局面上的分值大,相反轮到乙走棋时他会选尽可能地让局面上的分值小。
反映到博弈树上,即如果假设奇数层表示轮到甲方走棋,偶数层表示轮到乙方走棋。
那么由于甲方希望棋盘上的分值尽可能大,则在偶数层上会挑选分值最大的结点——偶数层的结点是甲走完一步棋之后的棋盘局面,反映了甲方对棋局形势的要求。
同样道理,由于乙方希望棋盘上的分值尽可能小,那么在奇数层上会选择分值最小的结点。
这是“最小-最大”(Minimax)的基本思想。
这样搜索函数在估值函数的协助下可以通过在奇数层选择分值最大(最小)的结点,在偶数层选择分值最小(最大)的结点的方式来搜索以当前局面为根结点、限定搜索层数以内的整棵树来获得一个最佳的着法。
然而不幸的是,博弈树相当庞大(它会成指数增长),因而搜索(限定层数以内的)整棵树是一件相当费时的工作——其时间复杂度为O(bn)。
其中b是分枝因子,即针对各种局面的合法着法的数目的平均值,n是搜索的深度。
对于中国象棋而言,在中盘时平均着法数目大约是40种左右,那么搜索4层需要检查250万条路线,搜索5层需要检查1亿条路线,搜索6层需要检查40亿条路线!
Alpha-Beta搜索能在不影响搜索精度的前提下大幅减少工作量。
因为,如果考虑到下棋是一个你来我往的交替进行并且相互“较劲”的过程。
由于每一方都会尽可能将局面导向对自己有利而对对方不利的方向(假定下棋双方对棋局有着同样的认知,即你认为对你很糟糕的局面,在你的对手看来则是对他很有利的局面),那么某些局面由于能够产生出很糟糕的局面因而根本没有再继续考虑的价值。
所以当你看到某个局面有可能产生很糟糕的局面时(确切地说这里的“很糟糕”是与之前分析的情况相比较而言的),你应当立刻停止对其剩余子结点的分析——不要对它再抱任何幻想了,如果你选择了它,那么你必将得到那个很糟糕的局面,甚至可能更糟。
这样一来便可以在很大程度上减少搜索的工作量,提高搜索效率,这称为“树的裁剪”。
下面用图来进一步说明“树的裁剪”。
为了简便起见,将博弈树进行了简化——每个结点只有三个分支,实际情况中,刚才讲过在盘中应有大约40个分支。
假定棋盘上的局面发展到了结点A(图2),现在轮到你走棋了,你是“最大的一方”——即你希望棋局的分值尽可能的高。
用搜索两层来看一看“树的裁剪”对提高搜索效率的帮助。
图中
表示该结点要取子结点中的最大值;
表示该结点要取子结点中的最小值。
A
C
D
B
-8
-2
10
-8
?
2
…
…
…
图2树的裁剪
首先,考察结点A的子结点B。
结点B所属的这一层是轮到你的对手——“最小者”来走棋了,目的是使得棋局的分值尽可能的小。
依次考察结点B的各个子结点,查看它们的分值(因为事先约定好了搜索两层,现在已达到搜索深度的要求了,所以就停下来调用局面评估函数来给它打分)。
结点B的第一个子结点(从左到右算起)返回-8,第二个子结点返回了-2,第三个子结点返回了2。
由于结点B这层是你的对手来做选择,假设他一定会做出明智的选择(你不能寄希望于你的对手会走出一步“昏招”),那么他会选择返回值为-2的那个结点。
-2最终也就成了从结点B传递回的值,即倘若你(现在位于结点A)选择了产生结点B的走法,使得局面发展到了结点B。
那么下一步,你的对手的选择就会使得棋局发展成为分值为-2的那个结点所表示的局面。
再来分析结点A的第二个子结点C,结点C与结点B同属一层,它依然是轮到你的对手作选择。
依次查看结点C的各个子结点的分值,其第一个子结点返回了2……。
采用“裁剪”方法。
不必再继续考察结点C的剩余子结点了,因为结点C已经够糟糕的了,不管结点C的剩余子结点有怎样的分值,它最多只能传回-8(有可能其剩余子结点中还有分值更小的结点,因而结点C还有可能传回更小的值)。
而与前面已经分析过的结点B所传回-2相比较,作为“最大一方”的你显然更不愿意看到2的局面。
所以,你当然不会选择相应的着法使得局面发展成为结点C。
因为那样的话,下一步你的对手就会带给你一个分值不高于2的局面。
由此,在不影响搜索质量的前提下避免了搜索“无价值的”结点C的剩余子结点的大量工作,从而节省了宝贵时间,为在同样机器配置下搜索更多的层数提供了可能。
“最小-最大”的思想再加上“对树的裁剪”,这就是Alpha-Beta搜索算法的核心。
最基本的Alpha-Beta算法的代码如下:
intAlphaBeta(intdepth,intalpha,intbeta)
{
if(depth==0)//如果是叶子节点(到达搜索深度要求)
returnEvaluate();//则由局面评估函数返回估值
GenerateLegalMoves();//产生所有合法着法
while(MovesLeft())//遍历所有着法
{
MakeNextMove();//执行着法
intval=-AlphaBeta(depth-1,-beta,-alpha);//递归调用UnmakeMove();//撤销着法
if(val>=beta)//裁剪
returnbeta;
if(val>alpha)//保留最大值
alpha=val;
}
returnalpha;
}
3.1.2着法排序
Alpha-Beta搜索算法是在“最小-最大”的基础上引入“树的裁剪”的思想以期提高效率,它的效率将在很大程度上取决于树的结构——如果搜索了没多久就发现可以进行“裁剪”了,那么需要分析的工作量将大大减少,效率自然也就大大提高;而如果直至分析了所有的可能性之后才能做出“裁剪”操作,那此时“裁剪”也已经失去了它原有的价值(因为你已经分析了所有情况,这时的Alpha-Beta搜索已和“最小-最大”搜索别无二致了)。
因而,要想保证Alpha-Beta搜索算法的效率就需要调整树的结构,即调整待搜索的结点的顺序,使得“裁剪”可以尽可能早地发生。
可以根据部分已经搜索过的结果来调整将要搜索的结点的顺序。
因为,通常当一个局面经过搜索被认为较好时,其子结点中往往有一些与它相似的局面(如个别无关紧要的棋子位置有所不同)也是较好的。
由J.Schaeffer所提出的“历史启发”(HistoryHeuristic)就是建立在这样一种观点之上的。
在搜索的过程中,每当发现一个好的走法,就给该走法累加一个增量以记录其“历史得分”,一个多次被搜索并认为是好的走法的“历史得分”就会较高。
对于即将搜索的结点,按照“历史得分”的高低对它们进行排序,保证较好的走法(“历史得分”高的走法)排在前面,这样Alpha-Beta搜索就可以尽可能早地进行“裁剪”,从而保证了搜索的效率。
对于着法的排序可以使用各种排序算法,在程序中采用了归并排序。
归并排序的空间复杂度为O(n),时间复杂度为O(nlog2n),具有较高的效率。
3.1.3局面评估
前文已经讲过了棋局表示、着法生成、搜索算法(包括搜索辅助“历史启发”),在象棋程序中如果说搜索算法是心脏,那么局面评估就是大脑。
搜索算法负责驱动整个程序,而局面评估则负责对搜索的内容进行判断和评价。
因而搜索与局面评估是整个下棋引擎的核心。
首先,先介绍一下在局面评估中需要考虑的因素。
就不同的棋类可能要考虑的因素略有差异。
在中国象棋中所要考虑的最基本的几个因素包括如下四点:
1、子力总和
子力是指某一棋子本身所具有的价值。
通俗地讲就是一个棋子它值个什么价。
例如,车值10的话,那可能马值6,卒值2等等。
所以在评估局面时,首先要考虑双方的子力总和的对比。
比如红方拥有士象全加车马炮,而黑方只有残士象加双马,则红方明显占优。
2、棋子位置
棋子位置,或称控制区域,是指某一方的棋子在棋盘上所占据(控制)的位置。
例如,沉底炮、过河卒、以及车占士角等都是较好的棋子位置状态,而窝心马、将离开底线等则属较差的棋子位置状态。
3、棋子的机动性
棋子的机动性指棋子的灵活度(可移动性)。
例如,起始位置的车机动性较差,所以下棋讲究早出车。
同样四面被憋马腿的死马机动性也较差(对于一步也不能走的棋子,可以认为其机动性为零)。
4、棋子的相互关系
这一点的分析较为复杂,因为一个棋子与其它子之间往往存在多重关系。
如:
一个马可能在对方的炮的攻击之下同时它又攻击着对方的车。
在程序中,估值函数最后返回的是每一方的总分的差值,而各方的总分就是上面所提到的四个因素的打分的总和。
对于子力打分和控制区域打分,只要遍历棋盘,当遇到棋子时简单地去查事先定义好的“子力价值表”和“控制区域价值表”,取出相对应的值进行累加即可。
对于机动性打分,需要求出各个子总共有多少种走法,然后根据各个子所不同的机动性价值每多一种走法就加一次相应的分数。
对棋子间相互关系的打分,要用到以下几个数据:
intm_BaseValue[15];//存放棋子基本价值
intm_FlexValue[15];//存放棋子灵活性分值
shortm_AttackPos[10][9];//存放每一位置被威胁的信息
BYTEm_GuardPos[10][9];//存放每一位置被保护的信息
BYTEm_FlexibilityPos[10][9];//存放每一位置上棋子的灵活性分值
intm_chessValue[10][9];//存放每一位置上棋子的总价值
其中计算机会进行所有棋子值的判断,AttackPos和GuardPos分别记录该棋子受到的威胁和被保护的值。
当遍历一遍棋盘之后,子力打分、控制区域打分和机动性打分都可以完成,而关系表也可以填完。
之后,再根据关系表来具体考察棋子的相互关系,进行关系打分。
分析关系时,首先,对王的攻击保护应分离出来单独考虑,因为对王的保护没有任何意义,一旦王被吃掉整个游戏就结束了。
其次,对一个普通子,当它既受到攻击又受到保护的时候要注意如下几个问题:
1、攻击者子力小于被攻击者子
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 中国象棋 游戏 设计 实现 毕业设计