基于深度学习的验证码识别方法设计与实现.docx
- 文档编号:1960143
- 上传时间:2022-10-25
- 格式:DOCX
- 页数:29
- 大小:316.88KB
基于深度学习的验证码识别方法设计与实现.docx
《基于深度学习的验证码识别方法设计与实现.docx》由会员分享,可在线阅读,更多相关《基于深度学习的验证码识别方法设计与实现.docx(29页珍藏版)》请在冰豆网上搜索。
基于深度学习的验证码识别方法设计与实现
本科毕业设计(论文)
学院(部)
电子信息学院
题目
基于深度学习的验证码识别
方法设计与实现
年级
2014专业电子信息工程
班级
14电信学号1428403048
姓名
温美松
指导老师
黄鹤职称副教授
论文提交日期
2018年5月
中文摘要-1-
Abstract一2一
第一章绪论-4-
1.1课题研究背景及意义-4-
1.2国内外研究现状-5-
1.3研究内容-6一
1.4论文结构-6-
第二章深度学习的基本理论-8-
2.1神经元的数学模型-8-
2.2多层前向神经网络-9-
2.3深度神经网络-10-
2.4神经网络的学习方式-11-
第三章验证码图像处理技术-12-
3.1图像预处理-12-
3.2字符定位和分割-13-
第四章卷积神经网络的设计与实现-16-
4.1网络结构-16-
4.2网络初始化-19-
4.3误差反向传播-21-
4.3.1全连接层的反向传播-22-
4.3.2池化层的反向传播-23-
4.3.3卷积层的反向传播-24-
第五章网络性能分析-25-
5.1参数的选择-25-
5.2识别结果-25-
5.3隐层神经元数量对网络性能的影响-26-
5.4学习率对网络性能的影响-28-
第六章总结-30-
6.1工作总结-30-
6.2不足与展望-30-
参考文献-32-
致谢-35-
苏州大学本科生毕业设讣(论文)
中文摘要
验证码是一个系统区分人类与非人类行为的有效方式。
验证码识别技术能够使讣算机程序输入正确的验证码,伪装成人类用户进入目标系统。
另一方面,系统方面需要考虑破解验证码识别技术,修补验证方式的可能漏洞,使之能够更有效地区分人类与计算机的行为。
深度学习能够使计算机更好地处理复杂的输入,因此能够识别更为复杂的验证码。
深度学习是人工智能的一个重要分支,对于识别验证码图像,相对一些其他的学习算法,深度学习在同样的计算资源的条件下,具有更为优秀的性能,因此在处理同样的问题时深度学习能够节省一定的计算资源。
本课题主要讨论了基于深度学习的验证码识别方法设计•与实现。
具体地,第一步采集验证码图像。
这些验证码图像来源有两种:
一是通过编程仿照常见的验证码图像生成数据集;二是从网站上下载验证码图像保存成数据集。
第二步对验证码数据集进行去噪、定位等预处理,再使用垂直投影法进行分割,将分割出来的字符保存为学习样本。
第三步构建卷积神经网络,使用采集的部分验证码图片对网络进行训练,调整参数。
最后一步使用剩余的验证码图像对训练好的网络测试,整理测试结果,统计正确率,分析不同参数对神经网络性能的影响。
经过测试,本论文设计的卷积神经网络基本能够成功地识别验证码图像,对仅包含数字的验证码图像识别效果较好,正确率达99.28%o
关键词:
深度学习,卷积神经网络,验证码识别,图像处理
苏州大学木科生毕业设汁(论文)
Abstract
Theverificationcodeisaneffectivewaytodistinguishhumanornon-humanbehavior.Theverificationcoderecognitiontechnologyenablesthecomputerprogramtoinputthecorrectverificationcode,disguisedasahumanusertoenterthetargetsystem.Ontheotherhand,thesystemneedstoconsidercrackingtheverificationcoderecognitiontechnology,repairthepossibleholesintheverificationmethods,sothatitcanmoreeffectivelydistinguishthebehaviorofhumanandcomputer.Deeplearningenablescomputerstoprocesscomplexinputsbetter,andthereforetorecognizemorecomplexverificationcodes・Itisanimportantbranchofartificialintelligence・Fortherecognitionofverificationcodeimages,comparedwithsomeotherlearningalgorithms,deeplearninginthesameconditionofcomputingresources,hasbetterperformance.Therefore,deeplearningcansavecertaincomputingresourceswhendealingwiththesameproblemsthanothergeneralalgorithms.
Thispapermainlydiscussesthedesignandimplementationofverificationcoderecognitionmethodbasedondeeplearning.Specifically,thefirststepistocapturetheimagesof什wverificationcode・TherearetwosourcesoftheseCAPTC-codeimages:
oneistogeneratebyprogrammingtoemulatecommonCAPTC-codeimages;theotheristodownloadtheCAPTC-codeimagesfromwebsitesandsavethemintodatasets・Thesecondstepistopre-processthedatasetofverificationcodesuchasde-noising,locating,andthenusingverticalprojectionmethodtosegmentthecharactersandsavethecharactersastrainingsamples.ThethirdstepistoconstructtheconvolutionalneuralnetworkandtotrainthenetworkusingsomepicturesoftheCAPTCAtoadjusttheparameters.ThelaststepistousetherestofHieverificationcodeimagestotestthenetwork.Andthencollatethetestresults,countthecorrectrateandanalyztheeffectofdifferentparametersontheperformanceofneuralnetwork・
Aftertesting,theconvolutionalneuralnetworkdesignedinthispapercanrecognizetheimageofverificationcodesuccessfully,anditisbettertorecognizetheimagewhichonlycontainnumbers,thecorrectrateis99.28%・
苏州大学木科生毕业设汁(论文)
Keywords:
DeepLearning,ConvolutionalNeuralNetwork,VerificationCode
Identification,ImageProcessing
苏州大学本科生毕业设计(论文)
第一章绪论
人丄智能指的是模仿生物神经学,构建神经元的数学模型,使其能对复杂的信息进行处理。
自从西班牙解剖学家Cajal在19世纪末创立神经元学说之后,神经元的一些生物学特征和相关的部分电学性质相继被发现。
1943年,神经元的M-P模型被首次提出,创建该模型的是来自美国的心理学家McCulloch以及另一位数学家Pittso来自加拿大的神经心理学家Hebb在1949年提出了“Hebb法则”,他认为学习现象的发生在于神经元突触的产生和变化。
来自美国的心理学家Rosenblatt结合了以上三人的理论,首次用精确的数学算法来定义神经网络,提出了“感知机”模型。
神经网络的基础就是感知机。
一般的神经网络也叫多层感知机,分为输入层、隐藏层和输出层,而具有多个隐藏层的神经网络就是深度神经网络。
深度学习就是运用深度神经网络,模仿人脑对声音、图像等数据进行解释的过程,能够很好地将复杂多变的输入映射为具体输出,具有从少量样本中学习集中特征的能力。
1.1课题研究背景及意义
深度学习的应用领域有很多,其中之一就是验证码识别。
验证码是一个系统区分人类与非人类的有效方式。
验证码识别技术能够使讣算机程序输入正确的验证码,伪装成人类用户进入目标系统。
另一方面,系统方面需要先了解然后破解验证码识别技术,修补自身验证码的可能漏洞,使之能够更有效地区分人类与计算机的行为。
随着互联网技术的发展,人们在使用互联网的同时越来越注重验证码的有效保护,希望网络的能够做到人类能识别而拦截所有机器程序的程度。
当遇到黑客对网站发起攻击的时候,验证码就是网站安全的笫一道防线(21,27],因此针对验证码识别的研究的实践意义不容小觑。
我们可以通过研究验证码的识别技术,从根本上了解验证码的识别细节,从而做出针对性措施,加强验证码的保护能力,使验证码能够继续实现本身的价值。
深度学习的初衷就是为了让计算机在处理某些问题时,能够拥有近似于人类的处理能力,这与验证码存在的意义是相对立的。
验证码不希望机器能够像人类一样识别图像中的字符,而深度学习则努力使计•算机能够尽可能地接近其至超越人类。
这一点一般的机器学习手段也能够实现,但是深度学习的优势在于能够将LI标的特征逐级提
苏州大学本科生毕业设汁(论文)
取,比如我们学习汉字,先从基本的横、竖、撇、捺开始,最后将这些基本的特征进行组合,形成LI标的完整特征,据此能够进行学习将LI标分类或者预测。
1.2国内外研究现状
早在1986年,Rumelhar.Hinton等人就初步将反向传播算法(BP,BackPropagation)应用于神经网络的学习之中⑴,使神经网络的学习过程变得简单可行。
但是,第一因为训练数据集规模太小,第二山于计算资源有限,即使训练一个比较简单的网络都可能需要非常长的时间。
与其它的机器学习模型相比较,当时的BP网络模型在正确率上并没有明显优势,更多的学者普遍青睐其他的浅层的机器学习模型,比如支持向量机模型、Boostin
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 深度 学习 验证 识别 方法 设计 实现