基于神经网络的手写数字识别系统的设计与实现Word格式.docx
- 文档编号:12979132
- 上传时间:2022-10-01
- 格式:DOCX
- 页数:48
- 大小:298.39KB
基于神经网络的手写数字识别系统的设计与实现Word格式.docx
《基于神经网络的手写数字识别系统的设计与实现Word格式.docx》由会员分享,可在线阅读,更多相关《基于神经网络的手写数字识别系统的设计与实现Word格式.docx(48页珍藏版)》请在冰豆网上搜索。
第二章手写体数字识别 4
2.1手写体数字识别的一般方法及难点 4
2.2图像预处理概述 5
2.3图像预处理的处理步骤 5
2.3.1图像的平滑去噪 5
2.3.2二值话处理 6
2.3.3归一化 7
2.3.4细化 8
2.4小结 9
第三章特征提取 10
3.1特征提取的概述 10
3.2统计特征 10
3.3结构特征 11
3.3.1结构特征提取 11
3.3.2笔划特征的提取 11
3.3.3数字的特征向量说明 12
3.3知识库的建立 12
第四章神经网络在数字识别中的应用 14
4.1神经网络简介及其工作原理 14
4.1.1神经网络概述[14] 14
4.1.2神经网络的工作原理 14
4.2神经网络的学习与训练[15] 15
4.3BP神经网络 16
4.3.1BP算法 16
4.3.2BP网络的一般学习算法 16
4.3.3BP网络的设计 18
4.4BP学习算法的局限性与对策 20
4.5对BP算法的改进 21
第五章系统的实现与结果分析 23
5.1软件开发平台 23
5.1.1MATLAB简介 23
5.1.2MATLAB的特点 23
5.1.3使用MATLAB的优势 23
5.2系统设计思路 24
5.3系统流程图 24
5.4MATLAB程序设计 24
5.5实验数据及结果分析 26
结论 27
参考文献 28
致谢 30
附录 31
摘要
手写体数字识别是模式识别中一个非常重要和活跃的研究领域,数字识别也不是一项孤立的技术,它所涉及的问题是模式识别的其他领域都无法回避的;
应用上,作为一种信息处理手段,字符识别有广阔的应用背景和巨大的市场需求。
因此,对数字识别的研究具有理论和应用的双重意义。
人工神经网络识别方法是近年该研究领域的一种新方法,该方法具有一些传统技术所没有的优点:
良好的容错能力、分类能力强、并行处理和自学习能力,并且是离线训练和在线识别的。
这些优点使它在手写体字符的识别中能对大量数据进行快速实时处理,并达到良好的识别效果。
由于手写体数字识别难于建立精确的数学模型,所以本文采用BP神经网络对这一问题进行处理。
神经网络模式识别的一个关键步骤是预处理和特征提取,对于手写体数字识别,本文采用了一种基于结构特征和统计特征的提取方法,并用程序实现了这一特征提取过程。
通过测试,本识别系统对于较规范的手写体数字的识别达到了很好的识别效果。
关键词:
手写体数字识别,特征提取,人工神经网络,MATLAB
II
ABSTRACT
Handwrittencharacterrecognitionisaveryimportantandactiveresearchinpatternrecognition.Theoretically,itisnotanisolatedtechnique.Itconcernswiththeproblemthatalltheotherareasofpatternrecognitionmustconfronted;
practically,beingakindofinformationprocessingmeasured, characterrecognitionhasaverybroadapplicationbackgroundandvastneedofmarket.Thus,itisofboththeoreticalandpracticalsignificance.
Artificialneuralnetworkrecognitionmethodisanewmethodoftheresearchfieldinrecentyears,andthismethodhassomemeritthattraditionaltechniquedonothave;
goodtoleranceforerror,strongsortingability,strongparallelhandlingabilityandstrongself-learningabilityaswellasitsoff-linetrainingandon-linerecognizing.Allthesemeritscontributeitsperfectperformanceinhandlingvastdatasetandhandlingintimelymanner.
It’sdifficulttomakeaccuratemathematicsmodelforhandwrittennumeralrecognition,soBPneuralnetworksisusedhere.Thekeystepsofneuralnetworkspatternrecognitionarepreprocessingandfeaturesubsetselection.Inthispaper,algorithmoffeaturesubsetselectionbasingonstructuralcharacteristicsandstatisticalcharacteristicshasbeenadoptedinhandwrittennumeralrecognition,andtheprocessoffeaturesubsetselectionhadbeenrealizedinprogram.
Recognitionsysteminthispaperhasachievedagoodrateofrecognitioninrandomhandwrittennumeralbytest.
Keyword:
handwrittennumeralrecognition,featureextraction,artificialneuralnetwork,MATLAB
基于神经网络的手写数字识别系统的设计与实现
第一章绪论
第一章绪论
1.1手写体数字识别研究的发展及研究现状
模式识别[2]是六十年代初迅速发展起来的一门学科。
由于它研究的是如何用机器来实现人(及某些动物)对事物的学习、识别和判断能力,因而受到了很多科技领域研究人员的注意,成为人工智能研究的一个重要方面。
一个模式识别系统的基本职能是对系统所要处理的模式归属于哪一类做出判别,从该系统的模式输入到系统做出判别之间,主要包括信息检测、预处理、特征提取和分类几大环节。
字符识别是模式识别领域中的一个非常活跃的分支。
一方面是由于问题本身的难度使之成为一个极具挑战性的课题;
另一方面,是因为字符识别不是一项孤立的应用技术,其中包含的模式识别领域中其他分支都会遇到的一些基本和共性的问题。
从50年代开始,许多的研究者就在这一研究领域开展了广泛的探索并为模式识别的发展产生了积极的影响。
字符识别,从采用的输入设备来分,可分为脱机识别(又称为光学字符识别OpticalCharacterRecognition,OCR)和联机识别,脱机字符又分为印刷体和手写字符识别,从对书写者要求来分,手写字符又分为限制性和非限制性的手写字符识别。
在联机手写字符识别中,计算机能够通过与计算机相连的手写输入设备获得输入字符笔划的顺序、笔划的方向以及字符的形状,所以相对OCR来说它更容易识别一些。
但联机字符识别有一个重要的不足就是要求输入者必须在指定的设备上书写,然而人们在生活中大部分的书写情况是不满足这一要求的,比如人们填写各种表格资料,开具支票等。
如果需要计算机去认识这些已经成为文字的东西,就需要OCR技术。
比起联机字符识别来,OCR不要求书写者在特定输入设备上书写,它可以与平常一样书写,所以OCR的应用更为广泛。
OCR所使用的输入设备可以是任何一种图像采集设备,如扫描仪、数字相机等。
通过使用这类采集设备,OCR系统将书写者已经写好的文字作为图像输入到计算机中,然后由计算机去识别。
由于OCR的输入只是简单的一副图像,它就不能像联机输入那样比较容易的从物理上获得字符笔划的顺序信息,因此OCR是一个更具挑战性的问题。
脱机字符识别(OCR)分为印刷体OCR和手写OCR。
印刷体字符比手写体字符少了随机性,它的识别相对容易些,难点已经不在识别环节,而在于字符的分割上。
印刷体识别的错误绝大多数都是错误的分割引起的[3]。
对于手写体OCR,无论是联机还是脱机识别,手写体的识别都要经历由限制性手写体识别到非限制性手写体识别两个阶段。
本文将以手写体数字为代表,讨论非限制性手写体字符的识别。
脱机字符识别的研究最早始于上个世纪六十年代,是为了应付汉英翻译的需要。
八十年代后的研究重心转移到脱机手写字符的识别上。
对于小类别数的字符集如数字、
27
字母的识别,已经可以做到对书写不加任何的限制。
非限制性手写OCR的研究始终以阿拉伯数字为主导。
这事因为,第一,十个阿拉伯数字是全世界的一套通用字符。
第二,在数字的许多应用场合,如报表、账单、支票等,手写体还难以被印刷体所替代,而且对识别的可靠性要求极高。
三,由于类别数少,所以模式识别中的许多方法研究均可以以数字识别作为实验背景。
对脱机手写体字符的研究,人们由简单集成笔画密度、笔画方向和背景特征方法过渡到特征匹配方法,进而过渡到结合神经网络方法,随着对识别可靠性要求的提高,九十年代以后,多分类器集成方法成为了一个研究重点。
1.2神经网络在手写体数字识别中的应用
目前,随着计算机的迅速发展,性能价格比的不断提高,模式识别技术已经从理论探讨为主发展到大量的实际应用,人们将更多的注意力开始转向那些用于语音、图像、机器人以及人工智能等的模式识别实际问题。
解决这些问题的关键是需要进行复杂而庞大的实时数据处理,而现有计算机的存贮容量及计算复杂性的局限,使得真正实时化的应用受阻。
这种面向实时应用的模式识别问题促使人们开始将并行处理的神经网络[4]应用到模式识别,而神经网络模式识别技术又将模式识别实时应用推进了一大步,手写体数字识别就是这种应用的一个很重要的领域。
手写体数字识别是一项极具研究价值的课题,随着神经网络[1]和模糊逻辑技术的发展,人们对这一问题的研究又采用了许多新的方法和手段,也使得这一古老的课题焕发出新的生命力[5]。
目前国际上有相当多的学者在研究这一课题,它包括了模式识别领域中所有典型的问题:
数据的采集、处理及选择、输入样本表达的选择、模式识别分类器的选择以及用样本集对识别器的有指导的训练。
人工神经网络为手写体数字识别提供了新的手段。
正是神经网络所具有的这种自组织自学习能力、推广能力、非线性和运算高度并行的能力使得模式识别成为目前神经网络最为成
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 神经网络 手写 数字 识别 系统 设计 实现