人工智能αβ剪枝实现的一字棋实验报告.docx
- 文档编号:26589171
- 上传时间:2023-06-20
- 格式:DOCX
- 页数:17
- 大小:121.54KB
人工智能αβ剪枝实现的一字棋实验报告.docx
《人工智能αβ剪枝实现的一字棋实验报告.docx》由会员分享,可在线阅读,更多相关《人工智能αβ剪枝实现的一字棋实验报告.docx(17页珍藏版)》请在冰豆网上搜索。
人工智能αβ剪枝实现的一字棋实验报告
人工智能α-β剪枝实现的一字棋实验报告
实验5:
α-β剪枝实现一字棋
一、实验目的
学习极大极小搜索及α-β剪枝算法实现一字棋。
二、实验原理
1.游戏规则
"一字棋"游戏(又叫"三子棋"或"井字棋"),是一款十分经典的益智小游戏。
"井字棋"的棋盘很简单,是一个3×3的格子,很像中国文字中的"井"字,所以得名"井字棋"。
"井字棋"游戏的规则与"五子棋"十分类似,"五子棋"的规则是一方首先五子连成一线就胜利;"井字棋"是一方首先三子连成一线就胜利。
2.极小极大分析法
设有九个空格,由MAX,MIN二人对弈,轮到谁走棋谁就往空格上放一只自己的棋子,谁先使自己的棋子构成"三子成一线"(同一行或列或对角线全是某人的棋子),谁就取得了胜利。
○
╳
用圆圈表示MAX,用叉号代表MIN
○
○
○
比如左图中就是MAX取胜的棋局。
╳
╳
估价函数定义如下设棋局为P,估价函数为e(P)。
(1)若P对任何一方来说都不是获胜的位置,则e(P)=e(那些仍为MAX空着的完全的行、列或对角线的总数)-e(那些仍为MIN空着的完全的行、列或对角线的总数)
(2)若P是MAX必胜的棋局,则e(P)=+∞(实际上赋了60)。
(3)若P是B必胜的棋局,则e(P)=-∞(实际上赋了-20)。
比如P如下图示,则e(P)=5-4=1
○
╳
需要说明的是,+∞赋60,-∞赋-20的原因是机器若赢了,则不论玩家下一步是否会赢,都会走这步必赢棋。
3.α-β剪枝算法
上述的极小极大分析法,实际是先生成一棵博弈树,然后再计算其倒推值,至使极小极大分析法效率较低。
于是在极小极大分析法的基础上提出了α-β剪枝技术。
α-β剪枝技术的基本思想或算法是,边生成博弈树边计算评估各节点的倒推值,并且根据评估出的倒推值范围,及时停止扩展那些已无必要再扩展的子节点,即相当于剪去了博弈树上的一些分枝,从而节约了机器开销,提高了搜索效率。
具体的剪枝方法如下:
(1)对于一个与节点MIN,若能估计出其倒推值的上确界β,并且这个β值不大于MIN的父节点(一定是或节点)的估计倒推值的下确界α,即α≥β,则就不必再扩展该MIN节点的其余子节点了(因为这些节点的估值对MIN父节点的倒推值已无任何影响了)。
这一过程称为α剪枝。
(2)对于一个或节点MAX,若能估计出其倒推值的下确界α,并且这个α值不小于MAX的父节点(一定是与节点)的估计倒推值的上确界β,即α≥β,则就不必再扩展该MAX节点的其余子节点了(因为这些节点的估值对MAX父节点的倒推值已无任何影响了)。
这一过程称为β剪枝。
从算法中看到:
(1)MAX节点(包括起始节点)的α值永不减少;
(2)MIN节点(包括起始节点)的β值永不增加。
在搜索期间,α和β值的计算如下:
(1)一个MAX节点的α值等于其后继节点当前最大的最终倒推值。
(2)一个MIN节点的β值等于其后继节点当前最小的最终倒推值。
4.输赢判断算法设计
因为每次导致输赢的只会是当前放置的棋子,输赢算法中只需从当前点开始扫描判断是否已经形成三子。
对于这个子的八个方向判断是否已经形成三子。
如果有,则说明有一方胜利,如果没有则继续搜索,直到有一方胜利或者搜索完整个棋盘。
三、实验代码
#include
usingnamespacestd;
intnum=0;//记录棋盘上棋子的个数
intp,q;//判断是否平局
inttmpQP[3][3];//表示棋盘数据的临时数组,其中的元素0表示该格为空,
intnow[3][3];//存储当前棋盘的状态
constintdepth=3;//搜索树的最大深度
voidInit(){//初始化棋盘状态
for(inti=0;i<3;i++)
for(intj=0;j<3;j++)
now[i][j]=0;//将初值均置为0
}
voidPrintQP(){//打印棋盘当前状态
for(inti=0;i<3;i++){
for(intj=0;j<3;j++)
cout< cout< } } voidplayerinput(){//用户通过此函数来输入落子的位置,比如: 用户输入31,则表示用户在第3行第1列落子。 intx,y; L1: cout<<"请输入您的棋子位置(xy): "< cin>>x>>y; if(x>0&&x<4&&y>0&&y<4&&now[x-1][y-1]==0) now[x-1][y-1]=-1;//站在电脑一方,玩家落子置为-1 else{ cout<<"非法输入! "< gotoL1; } } intCheckwin()//检查是否有一方赢棋(返回0: 没有任何一方赢;1: 计算机赢;-1: 人赢) {//该方法没有判断平局 for(inti=0;i<3;i++){ if((now[i][0]==1&&now[i][1]==1&&now[i][2]==1)||(now[0][i]==1&&now[1][i]==1&&now[2][i]==1)||(now[0][0]==1&&now[1][1]==1&&now[2][2]==1)||(now[2][0]==1&&now[1][1]==1&&now[0][2]==1))//正方行连成线 return1; if((now[i][0]==-1&&now[i][1]==-1&&now[i][2]==-1)||(now[0][i]==-1&&now[1][i]==-1&&now[2][i]==-1)||(now[0][0]==-1&&now[1][1]==-1&&now[2][2]==-1)||(now[2][0]==-1&&now[1][1]==-1&&now[0][2]==-1))//反方行连成线 return-1; } return0; } intvalue(){//评估当前棋盘状态的值(同时可以用p或q判断是否平局) p=0;q=0; for(inti=0;i<3;i++){//计算机一方将棋盘中的空格填满自己的棋子,既将棋盘数组中的0变为1 for(intj=0;j<3;j++){ if(now[i][j]==0) tmpQP[i][j]=1; else tmpQP[i][j]=now[i][j]; } } for(inti=0;i<3;i++)//计算共有多少连成3个1的行 p+=(tmpQP[i][0]+tmpQP[i][1]+tmpQP[i][2])/3; for(inti=0;i<3;i++)//计算共有多少连成3个1的列 p+=(tmpQP[0][i]+tmpQP[1][i]+tmpQP[2][i])/3; p+=(tmpQP[0][0]+tmpQP[1][1]+tmpQP[2][2])/3;//计算共有多少连成3个1的对角线 p+=(tmpQP[2][0]+tmpQP[1][1]+tmpQP[0][2])/3; for(inti=0;i<3;i++){//人一方 //将棋盘中的空格填满自己的棋子,既将棋盘数组中的0变为-1 for(intj=0;j<3;j++){ if(now[i][j]==0) tmpQP[i][j]=-1; else tmpQP[i][j]=now[i][j]; } } for(inti=0;i<3;i++)//计算共有多少连成3个-1的行 q+=(tmpQP[i][0]+tmpQP[i][1]+tmpQP[i][2])/3; for(inti=0;i<3;i++)//计算共有多少连成3个1的列 q+=(tmpQP[0][i]+tmpQP[1][i]+tmpQP[2][i])/3; q+=(tmpQP[0][0]+tmpQP[1][1]+tmpQP[2][2])/3;//计算共有多少连成3个1的对角线 q+=(tmpQP[2][0]+tmpQP[1][1]+tmpQP[0][2])/3; returnp+q;//返回评估出的棋盘状态的值 } intcut(int&val,intdep,boolmax){//主算法部分,实现a-B剪枝的算法,val为上一个结点的估计值,dep为搜索深度,max记录上一个结点是否为上确界 if(dep==depth||dep+num==9)//如果搜索深度达到最大深度,或者深度加上当前棋子数已经达到9,就直接调用估计函数 returnvalue(); inti,j,flag,temp;//flag记录本层的极值,temp记录下层求得的估计值 boolout=false;//out记录是否剪枝,初始为false if(max)//如果上一个结点是上确界,本层则需要是下确界,记录flag为无穷大;反之,则为记录为负无穷大 flag=10000;//flag记录本层节点的极值 else flag=-10000; for(i=0;i<3&&! out;i++){//双重循环,遍历棋盘所有位置 for(j=0;j<3&&! out;j++){ if(now[i][j]==0){//如果该位置上没有棋子 if(max){//并且上一个结点为上确界,即本层为下确界,轮到用户玩家走了。 now[i][j]=-1;//该位置填上用户玩家棋子 if(Checkwin()==-1)//如果用户玩家赢了 temp=-10000;//置棋盘估计值为负无穷 else temp=cut(flag,dep+1,! max);//否则继续调用a-B剪枝函数 if(temp flag=temp; if(flag<=val)//如果本层的极值已经小于上一个结点的估计值,则不需要搜索下去,剪枝 out=true; } else{//如果上一个结点为下确界,即本层为上确界,轮到计算机走了。 now[i][j]=1;//该位置填上计算机棋子 if(Checkwin()==1)//如果计算机赢了 temp=10000;//置棋盘估计值为无穷 else temp=cut(flag,dep+1,! max);//否则继续调用a-B剪枝函数 if(temp>flag) flag=temp; if(flag>=val) out=true; } now[i][j]=0;//把模拟下的一步棋还原,回溯 } } } if(max){//根据上一个结点是否为上确界,用本层的极值修改上一个结点的估计值 if(flag>val) val=flag; } else{ if(flag val=flag; } returnflag;//函数返回的是本层的极值 } intcomputer(){ intm=-10000,val=-10000,dep=1;//m用来存放最大的val intx_pos,y_pos;//记录最佳走步的坐标 charch; cout<<"您希望先走吗? (y/n)"; cin>>ch; while(ch! ='y'&&ch! ='n'){ cout<<"非法输入! "<<"您希望先走吗(y/n)"< cin>>ch; } system("cls"); Init(); cout<<"棋盘如下: "< PrintQP(); if(ch=='n'){//计算机先走 L5: for(intx=0;x<3;x++){ for(inty=0;y<3;y++){ if(now[x][y]==0){ now[x][y]=1; cut(val,dep,1);//计算机试探的走一步棋,棋盘状态改变了,在该状态下计算出深度为dep-1的棋盘状态估计值val if(Checkwin()==1){ cout<<"电脑将棋子放在: "< PrintQP(); cout<<"电脑获胜! 游戏结束."< return0; } if(val>m){//m要记录通过试探求得的棋盘状态的最大估计值 m=val; x_pos=x;y_pos=y; } val=-10000; now[x][y]=0; } } } now[x_pos][y_pos]=1; val=-10000; m=-10000; dep=1; cout<<"电脑将棋子放在: "< PrintQP(); cout< num++; value(); if(p==0){ cout<<"平局! "< return0; } playerinput();//玩家走一步棋 PrintQP(); cout< num++; value(); if(p==0){ cout<<"平局! "< return0; } if(Checkwin()==-1){ cout<<"您获胜! 游戏结束."< return0; } gotoL5; } else{//人先走 L4: playerinput(); PrintQP(); cout< num++; value(); if(q==0){ cout<<"平局! "< return0; } if(Checkwin()==-1){ cout<<"您获胜! 游戏结束."< return0; } for(intx=0;x<3;x++){ for(inty=0;y<3;y++){ if(now[x][y]==0){ now[x][y]=1; cut(val,dep,1); if(Checkwin()==1){ cout<<"电脑将棋子放在: "< PrintQP(); cout<<"电脑获胜! 游戏结束."< return0; } if(val>m){ m=val; x_pos=x;y_pos=y; } val=-10000; now[x][y]=0; } } } now[x_pos][y_pos]=1; val=-10000; m=-10000; dep=1; cout<<"电脑将棋子放在: "< PrintQP(); cout< num++; value(); if(q==0){ cout<<"平局! "< return0; } gotoL4; } return0; } intmain(){ computer(); system("pause"); return0; } 4.主要函数 1估值函数 估价函数: intCTic_MFCDlg: : evaluate(intboard[]) 完成功能: 根据输入棋盘,判断当前棋盘的估值,估价函数为前面所讲: 若是MAX的必胜局,则e=+INFINITY,这里为+60 若是MIN的必胜局,则e=-INFINITY,这里为-20,这样赋值的原因是机器若赢了,则不考虑其它因素。 其它情况,棋盘上能使CUMPUTER成三子一线的数目为e1 棋盘上能使PLAYER成三子一线的数目为e2, e1-e2作为最终权值 参数: board: 待评估棋盘 返回: 评估结果 2.Alpha-Beta剪枝算法 AlphaBeta剪枝主函数: intCTic_MFCDlg: : AlphaBeta(intBoard[],intDepth,intturn,intAlpha,intBeta,int*result) 完成功能: 根据输入棋盘,搜索深度,及其他参数,给出一个相应的最优解,存入result中。 参数: board: 待评估棋盘 Depth: 搜索深度 turn: 当前是机器走(MAX结点)还是玩家走(MIN结点) Alpha: alpha值,第一次调用默认-100 Beta: beta值,第一次调用默认+100 result: 输出结果 返回: 若当前点为MAX节点,则返回alpha值; 若当前点为MIN节点,则返回beta值 3.判断胜负 intCTic_MFCDlg: : isWin(intcurPos) 完成功能: 根据输入棋盘,判断当前棋盘的结果,COMPUTER胜? PLAYER胜? 平局? 参数: board: 待评估棋盘 返回: -1表示: 尚未结束 0表示: 平局 1表示: PLAYER胜 2表示: COMPUTER胜 五、实验截图 六、实验总结 通过本次实验进一步对老师课堂上所讲的α-β剪枝有了更加深刻的了解,对它的一般实现有了初步的认识。 搜索深度并非越深越好,局限于估值函数是根据能够成三子一线的数目决定的,所以搜索到最后一层,如果有人胜,则出现∞,如果没人胜,则三子一线数目为0,所以毫无意义。 。 这也是为什么大多数情况下都是平局的原因。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 人工智能 剪枝 实现 一字棋 实验 报告