基于vc手写数字识别程序设计设计.docx
- 文档编号:9671213
- 上传时间:2023-02-05
- 格式:DOCX
- 页数:26
- 大小:135.91KB
基于vc手写数字识别程序设计设计.docx
《基于vc手写数字识别程序设计设计.docx》由会员分享,可在线阅读,更多相关《基于vc手写数字识别程序设计设计.docx(26页珍藏版)》请在冰豆网上搜索。
基于vc手写数字识别程序设计设计
基于VC手写数字识别程序设计
1、摘要
自上世纪六十年代以来,计算机视觉与图像处理越来越受到人们的关注,并逐渐成为一门重要的学科领域。
而作为它们的研究对象的数字图像,也因为它含有研究目标的丰富信息而成为越来越重要的研究对象。
图像识别的目标是用计算机自动完成某些信息的处理,用来替代人工去处理图像分类及识别的任务。
手写数字识别是图像识别学科下的一个分支,是图像处理和模式识别领域研究的课题之一,由于其具有很强的实用性一直是多年来的研究热点。
由于手写体数字的随意性很大,例如,笔画的粗细,字体的大小,倾斜等等都直接影响到字符的正确识别,所以手写体数字识别是一个很有挑战性的课题。
在过去的数十年中,研究者们提出了许多的识别方法,取得了较大的成果。
手写体数字识别实用性很强,在大规模数据统计(如例行年检,人口普查),财务,税务,邮件分拣等等应用领域中都有广阔的应用前景。
本课题拟研究手写体数字识别的理论和方法,开发一个小型的手写体数字识别系统。
本次设计主要完成以下几个工作:
手写数字绘制问题、数字的预处理问题、特征提取问题、特征库的建立问题、数字识别问题。
关键词:
绘制数字;预处理;特征提取;特征库;数字识别
2、原理
本次设计主要用到图像的二值化处理、图像特征提取和模板匹配法三个知识点,下面将对这三个知识点进行简单介绍:
2.1、图像的二值化处理
图像的二值化处理就是将图像上的像素点的灰度值设置为0或255,也就是将整个图像呈现出明显的黑白效果。
在手写数字识别系统中,我们在VC可视化编程界面中在一个固定大小的控件中手写了一个数字,在程序中获得的只是以这个控件左上角为原点的一系列坐标。
在内存中我们开辟一个大小跟这个控件区域大小相同的二维数组(以像素为单位,即生成一张图片的长跟宽跟这个矩形区域相等),这样内存中图像的数据区域的二维数组就跟手写区域的坐标相同,我们再取出手写区域的坐标值,将这些坐标值对应到图像图像数据区域中,并且将它的灰度值置为255(白色),将图像数据区域的其它坐标值下的灰度值置为0(黑色),这样我们就得到了一张手写数字的二值化图像。
在数字图像处理中,二值图像占有非常重要的地位,图像的二值化有利于图像的进一步处理,使图像变得简单,而且数据量减小,能凸显出感兴趣的目标的轮廓。
2.2、模板匹配法
模板匹配法是图像识别中最具有代表性的方法之一。
它是将从待识别的图像提取的若干特征量与模板对应的特征量进行比较,计算图像和模板特征量之间的距离,用最小距离法判定所属类。
模板匹配通常事先建立标准模板库。
这里,模板库中的标准模板是数字样本的特征向量。
具体过程是:
对于一个待测试的样本X,计算X和训练集中的某样本Xj(0 循环计算待测样本和训练集中各已知样本之间的距离,比较所有的距离值,找出距离待测样本最近的已知样本,其中所对应的样本所属的类别就是待测样本X所属的类别。 2.3、图像的特征提取 若直接把预处理后的数据作为输入量,进行分类计算时数据时数据量大,同时由于手写字体的多样化及图像本身和预处理过程中附带的某些干扰的影响,对系统的容错能力要求较高。 特征提取的目的就是从分析数字的拓扑结构入手,把它的某些结构特征提取出来,使数字的位移、大小变化、字形畸形等干扰相对较小,也就是把那些反映数字特征的关键信息提供给系统,这样就等于间接地增加了系统的容错能力,而且经过特征提取后数据量也大大减少了,这样就提高了识别的效率。 手写数字识别的特征提取极大程度地影响着分类器的设计和性能,以及识别的效果和效率。 为了保证所要求的分类识别的正确率和节省资源,希望依据最少的特征达到所要求的分类识别的正确率。 在进行手写数字识别的过程中,特征提取应遵循以下原则: 1)特征应能尽量包含字符的有用信息。 2)特征的提取方法应简单而且提取快速。 3)各个特征之间的相关性应尽可能小。 4)特征数量尽可能少。 5)特征应有较好的抗干扰能力。 3、系统设计 本系统主要包括了主界面、图像绘制、特征提取、学习、识别、清除六个模块,其总框图如图3.0所示: 主界面 清除 识别 学习 特征提取 图像绘制 图3.0系统总框图 以下是各模块详细设计: 3.1、主界面 主界面主要由绘图区,学习、识别和清除三个按钮构成,通过调用VC++库里的CBrush、CRect、CBitmap来进行相关操作,学习、识别和清除三个按钮首先通过建立三个CBitmap类,通过位图将其画出来,如图3.1.1、3.1.2、3.1.3所示;再建立一个SPLASH类,最后通过程序来设计总界面,如图3.1.4所示: 图3.1.1学习按钮 图3.1.2识别按钮 图3.1.3清除按钮 图3.1.4总界面 3.2、图像绘制 图像的绘制主要是按下鼠标左键、拖动鼠标、放开鼠标左键这样一个过程,本次设计通过OnLButtonDown()(鼠标左键按下函数)、OnMouseMove()(鼠标移动函数)、OnLButtonUp()(鼠标左键放开函数)来实现图像的绘制,流程图如图3.2所示: 结束 放开鼠标左键,执行OnLButtonUp() 拖动鼠标,执行OnMouseMove() 按下鼠标左键,执行OnLButtonDown() 将鼠标放在绘图区域 图3.2图像绘制流程图 3.3、特征提取 本模块首先要创建一个结构体变量来表示所绘图形的各种特征,比如value(手写数字值)、VHDerection(水平垂直特征)、length1(第一个笔画长度)等等,具体情况看附录->程序清单里的特征提取函数,每个特征的提取如图3.3流程图所示: 开始 求lenth的值 求lenend的值 求lenfirst的值 通过switch语句选出不同水平垂直特征值执行相对应case语句,mytezheng->lenth++ 1 mytezheng->lenth=1 求出两个相邻点p和q的距离 mytezheng->decon=1,判断相邻两点x、y的大小,分别给出不同的水平垂直特征值 0 (p>1)||(q>1) 判断1、0两点x、y的大小,分别给出不同的水平垂直特征值 mytezheng->lenth=1 1 0 j==0 结束 图3.3特征提取流程图 3.4、学习 首先点击学习按钮,判断当前写入数值是否已在模板中,随后出现输入学习值对话框,提取特征值,最后存入模板,如图3.4所示: 存在 不存在 结束 点击学习按钮 判断当前值是否存在模板中 显示模板中已存有该值 存入模板 提取特征值 图3.4学习流程图 3.5、识别 识别过程就相当于一个查询过程,首先点击识别按钮,然后提取特征值,将特征值与模板一一对比,若有则显示其值,若无则显示无法识别,如图3.5所示: 无 有 显示识别出的值 结束 显示无法识别 逐一对比 提取特征值 点击识别按钮 图3.5识别流程图 3.6、清除 清除最为简单,把绘图区域的每个点设置为白点,即二值图像中灰度值都变为255,流程如图3.6所示: 结束 绘图区每个点设置为白色 点击清除按钮 图3.6清除流程图 4、系统调试 运行程序后,会出现如图3.1.4所示的图样,然后往绘图区写一个2,然后点击学习按钮,出现如图4.1所示图样,说明所写数字已存在模板中。 图4.1学习调试 点击确定后点击清除按钮,再输入一个8,如图4.2所示,这次就跟之前不一样了,说明模板库里没有刚刚写入的数字,然后往两个编辑框里都输入8以后点击OK,这样就完成了学习的功能。 图4.2学习调试 点击清除之后,往绘图区写入一个4,如图4.3所示说明识别成功。 图4.3识别调试 清除调试只要点击清除按钮,它就会弹出图3.1.4的样子。 识别率如表4.1: 数字 测试次数 正确次数 识别率 0 20 16 80% 1 20 19 95% 2 20 18 90% 3 20 18 90% 4 20 17 85% 5 20 13 65% 6 20 16 80% 7 20 19 95% 8 20 9 45% 9 20 17 85% 表4.1识别率统计 分析: 从表中可以看出8和5较难识别,因为其特征不太好提取,特征比较多样化,所以需要大量的学习,丰富模板库,这样可以提高识别率。 5、心得体会 本文对基于VC++6.0的手写数字识别系统的基本原理及方法进行了介绍。 手写体数字识别是一个极具研究价值的课题,手写数字的样品类别总共只有0一9十类,与其它的大字符集的识别(汉字识别)相比要相对容易。 本文所采用的模板匹配分类器既节省时间,简便易行,也可以达到较高地识别效果。 但是在系统的设计上由于时间的限制导致系统界面的设计不够美观,特征训练不够导致识别率不够高。 手写体数字的特征提取是一个非常复杂的问题,可以考虑在识别的时候使用有监督的识别方法,这样在识别的同时可以更新特征库,这里所说的更新是把导致识别错误的模板替换掉这样出错的几率就会越来越小从而使特征库越来越完善,进一步提高识别的准确度。 6、参考文献 (1)张立凡等著.手写数字识别系统设计.北京: 印刷学院学报,2009年04期. (2)冯伟兴著.VisualC++数字图像模式识别技术详解.北京: 机械工业出版社,2010年9月. (3)张宏林著.精通VisualC++数字图像模式识别技术及工程实践.北京: 人民邮电出版社,2008年8月. (4)章毓晋著.图像工程(中册)图像分析(第二版).北京: 清华大学出版社,2009年7月. (5)谢凤英著.VisualC++数字图像处理.北京: 电子工业出版社,2008年5月. 附录: 程序清单: 1、初始化程序 CPatternView: : CPatternView() {//TODO: addconstructioncodehere mouseDown=0; //初始化,使得每个点皆为白点 for(inti=0;i<16;i++) for(intj=0;j<16;j++) bitgraph[i][j]=0; //初始化,使得坐标序列中的点皆为空点 mytime=0; for(i=0;i<100;i++){ mypoint[i].x=-1; mypoint[i].y=-1; } mytime=0; curvalue=-1; mytezheng=(TEZHENG*)malloc(sizeof(TEZHENG)); mytezheng->value=-1; mytezheng->lenth=0; mytezheng->lenth1=0; for(i=0;i<15;i++) mytezheng->VHDerection[i]=-1; mytezheng->decon=0; //打开保存模板特征量的文件 if(cf.Open("mydata.dat",CFile: : modeCreate|CFile: : modeNoTruncate|CFile: : modeReadWrite)==NULL){ AfxMessageBox("打开文件失败,\n您最好退出程序"); } } 2、创建主界面程序 voidCPatternView: : OnDraw(CDC*pDC) {CPatternDoc*pDoc=GetDocument(); ASSERT_VALID(pDoc);/*ASSERT_VALID是一个断定宏,如果pDoc为NULL就不继续运行*/ //TODO: adddrawcodefornativedatahere //Erasethebackground //创建一个面色刷 CBrushBrush(RGB(128,0,0));/*CBrush是封装了Windows图形设备接口(GDI)中画刷的MFC类,用于构造CBrush对象,然后传给需要画刷的CDC成员函数*/ CBrush*pOldBrush=pDC->SelectObject(&Brush);//选择刷到设备上下文 //Gettheareathatneedstobeerased(擦除). CRectrcClip;//CRect从tagRECT结构派生而来 pDC->GetClipBox(&rcClip);/*该函数得到一个能够完整包含当前可见区域的最小矩形的大小*/ //Paintthearea. pDC->PatBlt(rcClip.left,rcClip.top,rcClip.Width(),rcClip.Height(),PATCOPY);//使用当前选入指定设备环境中的刷子绘制给定的矩形区域 pDC->SelectObject(pOldBrush);//取消选择刷出设备上下文 //三个模拟位图按钮 CBitmapbitmapstudy,bitmaprecognize,bitmapclear;/*类CBitmap封装了Windows图形设备接口(GDI)中的位图*/ CDCdcMemory1,dcMemory2,dcMemory3;/*通过CDC对象的成员函数进行所有的绘图*/ bitmapstudy.LoadBitmap(IDB_BITMAP_STUDY);/*从模块的可执行文件中加载IDB_BITMAP_STUDY位图资源*/ dcMemory1.CreateCompatibleDC(pDC);/*创建一个与PDC兼容的内存设备上下文环境(DC)*/ dcMemory1.SelectObject(&bitmapstudy);/*选择bitmapstudy到dcMemory1的上下文环境中*/ pDC->BitBlt(220,20,50,20,&dcMemory1,0,0,SRCCOPY);/*对&dcMemory1中的像素进行位块转换,以传送到目标设备环境*/ bitmaprecognize.LoadBitmap(IDB_BITMAP_RECOGNIZE); dcMemory2.CreateCompatibleDC(pDC); dcMemory2.SelectObject(&bitmaprecognize); pDC->BitBlt(220,80,50,20,&dcMemory2,0,0,SRCCOPY); bitmapclear.LoadBitmap(IDB_BITMAP_CLEAR); dcMemory3.CreateCompatibleDC(pDC); dcMemory3.SelectObject(&bitmapclear); pDC->BitBlt(220,140,50,20,&dcMemory3,0,0,SRCCOPY); //画板 CBrushBrushBoard(RGB(255,255,255)); //Selectthebrushintothedevicecontext. pOldBrush=pDC->SelectObject(&BrushBoard); //Paintthearea. pDC->PatBlt(8,8,176,240,PATCOPY); //Unselectbrushoutofdevicecontext pDC->SelectObject(pOldBrush); pDC->SetTextColor(RGB(255,255,255));//设置当前环境(HDC)的字体颜色 pDC->SetTextAlign(TA_CENTER|TA_TOP);//指定设备环境设置文字对齐标志 pDC->SetBkMode(TRANSPARENT);/*TRANSPARENT是使用透明的输出,也就是文字的背景是不改变的*/ } 3、学习程序 voidCPatternView: : OnStudy(void) {//输入数字值的对话框 InputDialoginputdlg; cf.SeekToBegin();//定位当前文件指针到文件开头 intnFileSize=cf.GetLength();//获取文件长度 inti=nFileSize/sizeof(TEZHENG); TEZHENG*temp; temp=(TEZHENG*)malloc(sizeof(TEZHENG)); //计算当前画板中数字的特征值 GetTeZheng(); //首先判断当前的数字类型是否已经在模板中 for(intj=0;j cf.Read((void*)temp,sizeof(TEZHENG));//从文件cf的当前位置读数据 for(intk=0;k<15;k++){ if(temp->VHDerection[k]! =mytezheng->VHDerection[k])//判断水平特征 break; } if((k==15)&&(temp->decon==mytezheng->decon)&&(temp->lenfirst==mytezheng->lenfirst)&&(temp->lenth1==mytezheng->lenth1)&&(temp->lenth==mytezheng->lenth)&&(temp->lenend==mytezheng->lenend)){ chars[20]; sprintf(s,"您输入的是: %d,数据已有",temp->value); AfxMessageBox(s); break; } } //说明该数字类型不在模板中 if(j==i){ if(inputdlg.DoModal()==IDOK){ //判断数字输入对话框中的两个数字是否相同 if(inputdlg.m_value1! =inputdlg.m_value2){ AfxMessageBox("您的输入有误,\n请重新输入"); } //相同,则将新的数字类型写入模板文件中 else{ GetTeZheng(); try{ mytezheng->value=inputdlg.m_value1; cf.SeekToEnd();//定位当前文件指针到文件尾 cf.Write(&mytezheng->value,sizeof(signedchar));//将文件数据写入当前文件位置 cf.Write(mytezheng->VHDerection,sizeof(signedchar)*15); cf.Write(&mytezheng->lenth1,sizeof(signedchar)); cf.Write(&mytezheng->lenth,sizeof(signedchar)); cf.Write(&mytezheng->decon,sizeof(signedchar)); cf.Write(&mytezheng->lenfirst,sizeof(signedchar)); cf.Write(&mytezheng->lenend,sizeof(signedchar)); } catch(CFileException*e){ //Alertusertoerror e->Delete(); }//endtry-catch }//endif-else }//endif }//endif return; } 4、识别程序 voidCPatternView: : OnRecognize(void) {cf.SeekToBegin(); intnFileSize=cf.GetLength(); inti=nFileSize/sizeof(TEZHENG); TEZHENG*temp; temp=(TEZHENG*)malloc(sizeof(TEZHENG)); //计算特征值 GetTeZheng(); //在模板文件中寻找,是否有与当前特征值相同的 for(intj=0;j cf.Read((void*)temp,sizeof(TEZHENG)); for(intk=0;k<15;k++){ if(temp->VHDerection[k]! =mytezheng->VHDerection[k]) break; } //找到识别结果 if((k==15)&&(temp->decon==mytezheng->decon)&&(temp->lenfirst==mytezheng->lenfirst)&&(temp->lenth1==mytezheng->lenth1)&&(temp->lenth==mytezheng->lenth)&&(temp->lenend==mytezheng->lenend)){ chars[20]; sprintf(s,"您输入的是: %d",temp->value); AfxMessageBox(s); break;//搜索结束 } } if(j==i){ AfxMessageBox("抱歉,无法识别"); } return; } 5、清除程序 voidCPatternView: : OnClear(void) {CDC*pDC=GetDC();/*检索一指定窗口的客户区域或整个屏幕的显示设备上下文环境的句柄,以后可以在GDI函数中使用该句柄来在设备上下文环境中绘图*/ CBrushBrushBoard(RGB(255,255,255)); CBrushpOldBrush; pDC->PatBlt(8,8,176,240,PATCOPY); for(inti=0;i<16;i++) for(intj=0;j<16;j++) bitgraph[i][j]=0; mouseDown=0; mytime=0; for(i=0;i<100;i++){ mypoint[i].x=-1; mypoint[i].y=-1; } curvalue=-1; mytezheng->value=-1; mytezheng->lenth=0; mytezheng->lenth1=0; for(i=0;i<15;i++) mytezheng->VHDerection[i]=-1; mytezheng->decon=0; return; } 6、特征提取程序 voidCPatternView: : GetTeZheng() {intp,q; inti=0; //从第一个点到最后一个点 for(intj=0;j if(i==0){mytezh
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 vc 手写 数字 识别 程序设计 设计