蔬菜图像的模式识别技术应用.docx
- 文档编号:7548857
- 上传时间:2023-01-24
- 格式:DOCX
- 页数:26
- 大小:122.30KB
蔬菜图像的模式识别技术应用.docx
《蔬菜图像的模式识别技术应用.docx》由会员分享,可在线阅读,更多相关《蔬菜图像的模式识别技术应用.docx(26页珍藏版)》请在冰豆网上搜索。
蔬菜图像的模式识别技术应用
摘要
图像识别技术是人类视觉认知的延伸,是人工智能的一个重要领域,随着计算机技术和人工智能技术的发展,图像识别技术越来越成为人工智能的基础技术。
蔬菜图像的识别是当今各农产品市场急需采用的一项人工智能技术。
如何有效的对蔬菜图像进行处理,并提取其特征是蔬菜图像识别技术的核心问题。
本文以蔬菜图像的分割为主线,利用3种方法对分割后的蔬菜图像进行特征提取,并验证其有效性。
首先,蔬菜图像的分割的目的是将蔬菜图像的背景进行去除,仅保留蔬菜图像的前景部分。
为此,需要将蔬菜图像的前景部分与背景部分进行区别。
实验表明,利用K均值聚类算法辅以形态学操作能有效地对蔬菜图像进行分割。
对分割后的蔬菜图像进行特征提取,分别提取颜色一致性矢量(CCVs)、和差直方图矢量(SDH)及边界/内部像素分类(BIC)特征矢量作为图像的特征。
利用提取出的特征矢量,对同种类的蔬菜图像和不同种类的蔬菜图像进行比较,以验证矢量的有效性。
实验证明相似图像之间的矢量距离值较小,相似度较大,因此提取出的特征矢量能做为图像的特征。
关键词:
图像分割,图像特征提取,K均值聚类,颜色一致性矢量(CCVs),和差直方图(SDH),边界/内部像素分类(BIC)
Abstract
Imagerecognitiontechnologyisanextensionofthehumanvisualcognitionandanimportantfieldofartificialthedevelopmentofcomputertechnologyandartificialintelligencetechnology,imagerecognitiontechnologyhasbecomethebasisofartificialintelligenceimageidentificationasanartificialintelligencetechnologyisanurgentneedoftoday'svariousmarketsforagriculturaltoeffectivelydealingwiththevegetableimageprocessing,andextractingitscharacteristicsisthecoreissueofvegetableimagerecognitiontechnology.Vegetableimagesegmentationisthemainlineofthispaperandweusethreemethodsforfeatureextraction,andverifyitseffectiveness.
Firstofall,thepurposeofimagesegmentationisimagebackgroundremoval,retainingonlyprospectsofthedothis,weneedtodistinguishtheforegroundpartandbackgroundpartoftheresultsshowthatusingK-Meansclusteringalgorithmwithmorphologicaloperationcaneffectivelysegmentvegetableimage.
Fortheimageofvegetablesaftersegmentation,weneedtoextracttheirthispaper,weextractcolorconsistencyvector(CCVs),differencehistogramvector(SDH)andboundary/internalpixelsclassificationfeaturevectors(BIC)ascharacteristicsoftheimage.Inordertoverifythevalidityofthevector,usingthefeaturevectorstocomparedifferentimages,bothofthesamekindofvegetablesimagesanddifferentkindsofvegetablesimages.Experimentsprovethatthesmallervaluesofthevectordistancebetweensimilarimages,thebiggersimilarityis,sotheextractedfeaturevectorcanasacharacteristicoftheimage.
Keywords:
imagesegmentation,imagefeatureextraction,K-Meansclustering,colorconsistencyvector(CCVs),differencehistogramvector(SDH),boundary/internalpixelsclassificationfeaturevectors(BIC)
1绪论1
课题研究的目的与意义1
蔬菜识别的发展概况2
机器视觉及模式识别2
机器视觉2
模式识别3
论文的主要工作4
论文的内容安排4
2蔬菜图像预处理5
图片数据5
蔬菜图像的简单预处理6
图像的灰度化7
图像的二值化7
蔬菜图像的分割7
具有封闭外层轮廓的蔬菜图像的背景去除算法8
K-Means聚类算法9
含阴影图像的分割算法12
实验结果与分析14
本章小结16
3蔬菜图像的特征提取18
颜色特征提取18
颜色一致性特征矢量CCVs18
纹理特征提取23
和差直方图特征矢量SDH24
形状特征提取26
边界/内部像素分类特征矢量BIC27
实验结果与分析29
本章小结30
4全文总结与展望31
全文总结31
展望31
参考文献32
致谢33
1绪论
课题研究的目的与意义
智能识别蔬菜是当今各农产品市场及超市急需采用的一项技术。
由于,蔬菜的采购批发是一项繁重的工作,对于批发商来说,在采购蔬菜时,往往在蔬菜的量上和种类上会达到一定要求。
传统的采购方式不但费时,而且会受到人为的因素影响导致相似种类蔬菜的误判。
智能化蔬菜识别技术不但有利于蔬菜的规模化采购,而且能精确地将蔬菜进行分类。
因此研究一个智能化的蔬菜识别系统,必然可以改善人们的生活质量。
蔬菜图像的预处理及特征提取方法研究正是蔬菜识别系统开发过程中两个核心的问题,对于有效的蔬菜识别系统至关重要。
蔬菜识别的发展概况
目前,国内外在图像识别领域已经开展了很多研究工作。
传统的模式识别方法考虑到图像的颜色、纹理、形状等特征(Stehlingetal.,2002;Unser,1986;Passetal.,1997),Heidemann(2004)在此基础上又提出了一种利用直方图、颜色及形状特征来自动进行图像分类的无监督训练方法。
关于农产品分类问题,Veggievision(Bolleetal.,1996)首次提出超市农产品识别系统,该系统是利用图像的颜色、纹理及维度特征。
由于,该系统研制时间较早,并未利用现今图像领域发展的优势,存在很多不足之处。
事实上,农产品的分类问题可以看作是目标识别问题的一个特例。
目前,Agarwaletal.(2004)和JurieandTriggs(2005)提出了利用目标图像中的特殊区域来识别的物体的方法。
这种方法称作特征包,效果理想。
机器视觉及模式识别
视觉是人类最高的感知器官,人类感知外界信息,80%以上是通过视觉得到的,而图像实际上是对这种感知能力的一种认为的增强方式,也就是说人通过图像对客观物体建立明确意义的描述。
随着数字图像处理技术的成熟,图像作为人类感知外部世界更丰富而直接的载体,正成为越来越重要的研究对象。
人们利用计算机等设备模拟人的视觉来采集图像并进行数字信号转换也通过计算机实现对图像的传输、处理与理解等视觉信息处理的全过程形成了一门新学科机器视觉。
同时机器视觉处理的原始信息又多为图像,因此该领域又和数字图像处理和模式识别有十分密切的关系。
1.3.1机器视觉
机器视觉,是指由人类设计并在计算机环境下实现的模拟或在现与人类视觉有关的某些智能行为的技术。
如对印刷与手写文字识别,图像模式识别和物体三维表面的形状知识感知等。
机器视觉技术是多学科的交叉与结合,它涉及到计算机、数学、光学、心理学、生理学、物理学、信号处理等诸多学科。
研究机器视觉的目的是要实现对人类视觉的模拟和延伸,换而言之,对模拟高等动物的视觉系统而言,完成对物体的形状和类别的识别是最重要的。
同时计算机视觉处理的原始信息多是图像,因此该领域又和图像处理及模式识别有着十分密切的关系。
从应用的观点来看,计算机视觉这一课题的研究是很明确的:
从计算机对图像分析与理解的角度,计算机视觉的任务可以划分为两个层次:
低层次的方法很少使用图像内容的知识,如降低图像的噪声的图像预处理,对比度增强和图像的尖锐化;低层次的方法一般是以输入、输出都是图像为特点。
高层次的方法涉及图像分割(把图像分为不同区域或目标物),从图像中提取特征(边缘、轮廓物体标识),从而完成对被识别物体的总体理解。
1.3.2模式识别
模式识别是对表征事物或现象的各种形式的(数值的、文字的和逻辑关系的)信息进行处理和分析,以对事物或现象进行描述、辨认、分类和解释的过程,是信息科学和人工智能的重要组成部分。
模式识别是一种从大量信息和数据出发,在专家经验和已有认识的基础上,利用计算机和数学推理的方法对形状、模式、曲线、数字、字符格式和图形自动完成识别的过程。
模式识别研究主要集中在两个方面,即研究生物体(包括人)是如何感知对象的,属于认知科学的范畴,以及在给定的任务下,如何用计算机实现模式识别的理论和方法。
前者是生理学家、心理学家、生物学家和神经生理学家的研究内容,后者通过数学家、信息学专家和计算机科学工作者近几十年来的努力,已经取得了系统的研究成果。
模式识别通常包括相互关联的两个阶段,即学习阶段和测试阶段,前者是对样本进行特征选择,寻找分类的规律并进行学习的过程,后者是根据分类规律对未知样本集进行分类和识别的过程。
广义的模式识别属于计算机科学中智能模拟的研究范畴,内容非常广泛,包括声音和语言识别、文字识别、指纹识别、声纳信号和地震信号分析、照片图片分析、化学模式识别等等。
模式识别问题一般包括以下三种主要的方法:
统计模式识别方法:
统计模式识别方法是受数学中的决策理论的启发而产生的一种识别方法,它一般假定被识别的对象或经过特征提取的向量是符合一定分布规律的随机变量。
其基本思想是将特征提取阶段得到的特征向量定义在一个特征空间中,这个空间包含了所有的特征向量,不同的特征向量,或者说不同类别的对象都对应于空间中的一点。
在分类阶段,则利用统计决策的原理对特征空间进行划分,从而达到识别不同特征的对象的目的。
统计模式识别中应用的统计决策分类理论相对比较成熟,研究的重点是特征提取。
人工神经网络模式识别:
人工神经网络的研究起源于对生物神经系统的研究。
人类以及很多高级动物都具有很强的模式识别能力,这些都是因为它们具有发达的神经网络系统。
人工神经网络是根据生物神经学原理而建立的人工网络模型,保持了生物神经网络的许多能力与优良特性。
人工神经网络区别于其他识别方法的最大特点是它对待识别的对象不要求有太多的分析与了解,具有一定的智能化处理的特点。
句法结构模式识别:
句法模式识别也称结构法模式识别,每个模式利用它的各个部分(称为子模式或者模式基元)的组合表示。
利用模式的结构与语言的句法之间的相似性,模式的识别常以句法分析的方式进行,即依据给定的一组句法规则来分析模式的结构。
句法结构模式识别着眼于对待识别对象的结构特征的描述。
在上述三种方法中,统计模式识别是经典的分类识别方法,在图像模式识别中有着非常广泛的应用[1]、[2]。
论文的主要工作
一、蔬菜图像预处理。
本部分主要针对蔬菜图像背景的去除进行研究,并将所采集的蔬菜图像分两种情况:
1、具有封闭外层轮廓的图像(如:
包菜、萝卜、西红柿等)。
2、其他图像。
针对这两种图像,以K-Means聚类算法为主要的手段进行分割。
二、蔬菜图像的特征提取。
本部分主要提取图像的三种特征:
颜色一致性特征矢量(CCVs)、和差直方图特征矢量(SDH)、边界/内部像素分类特征矢量(BIC)。
其中CCVs属于图像的颜色特征,SDH属于图像的纹理特征,BIC属于图像的形状特征。
最后,利用提取出的图像特征矢量来比较图像之间差别。
论文的内容安排
第一章绪论。
阐述了课题研究的目的和意义。
介绍了蔬菜识别的发展概况,以及对当前国内外有关农产品识别的研究工作进行了简要概述。
指出了本文的研究工作。
第二章蔬菜图像预处理。
介绍了图像预处理过程中几个基本的变换。
确定了本文图像分割的主要手段,即K-Means聚类算法,并对其进行了详细的阐述。
第三章蔬菜图像的特征提取。
首先对常用的图像颜色、纹理、形状特征进行了阐述。
然后确定了本文所采用的特征提取方法,即颜色一致性矢量(CCVs)、和差直方图(SDH)、边界/内部像素分类(BIC)。
并将所提取出的图像特征矢量用于图像之间的比较,验证其有效性。
第四章全文总结与展望。
对论文研究工作进行回顾总结。
2蔬菜图像预处理
图片数据
本论文所采用的照片大小均为640×480。
每幅图像均RGB颜色空间形式存储,每一个颜色通道占用8bit。
各图像均为光照均匀图像。
每一种类蔬菜图像5张,分别为5种不同的摆向,共9种蔬菜。
图为各种类蔬菜的原始图像。
(a)菠菜
(b)包菜
(c)花菜
(d)黄瓜
(e)韭菜
(f)萝卜
(g)芹菜
(h)青菜
(i)西红柿
图9类蔬菜的原始图像
蔬菜图像的简单预处理
由于本设计对精度要求不高,实现图像的特征提取即可,且图像的前景与背景像素值差较大,所以本设计只对图像进行简单的灰度变换及二值处理,更多侧重图像前景的分割。
2.2.1图像的灰度化
由于彩色图像较为复杂,使得图像处理的很多算法都没法展开,因此有必要对它进行灰度处理,即图像中的每一个像素的R、G、B值相等。
图为包菜图像灰度化后的图像。
图包菜图像灰度化后的图像
2.2.2图像的二值化
在进行了灰度化处理之后,图像中的每一个像素只有一个值,那就是图像的灰度值,他们的大小决定了像素的亮暗程度,在本系统中需要获取几何形状特征参数,所以还要对已经进行了灰度处理后的图像进行二值化处理,用几何学中的概念进行分析和特征描述。
蔬菜灰度图像的二值化处理方法:
设f(i,j)表示像素在(i,j)位置的灰度值,二值化可以按照下式进行:
=
式
式中t为二值化阈值。
如果阈值过大会增加许多虚假信息,阈值过小有会丢失许多信息,所以阈值的选取很重要[3]。
图为包菜图像二值化后的图像。
图包菜图像二值化后的图像
蔬菜图像的分割
对于本设计的图像分割,目的是将图像的前景与背景区分开来,以便提取出前景部分的特征。
2.3.1具有封闭外层轮廓的蔬菜图像的背景去除算法
观察采集的蔬菜图像,发现包菜、西红柿等蔬菜图像都具有封闭的外层轮廓,若能将它们的外层轮廓线提取出来,则可以以该轮廓线为界,里面为前景部分,外面为背景部分。
为了使蔬菜图像的外层轮廓显现出来,先对二值化后的图像利用Canny算子进行边缘检测。
图为二值化的包菜图像进行边缘检测后的图像。
图包菜图像边缘检测后的图像
算法说明:
一、外层轮廓的跟踪。
首先,对像素的8邻域进行编码,使得像素点的8个邻域方向均可以用数字代替。
然后,置图像最左端为起始点,按逆时针方向搜寻邻近点,其中像素点8个邻域方向分别标记为0,1,2,3,4,5,6,7。
当搜寻到第一个白色点时,记为起始点。
通过前一次搜寻的次数K来确定下一次搜寻的方向Ki。
依次下去,直至下一搜寻点为起始点时,跟踪完毕[4]、[5]、[6]。
图为包菜图像外层轮廓线图像。
图包菜图像外层轮廓线图像
二、轮廓填充。
为使前景部分保留下来,将提取出的轮廓线内部填充为白色。
然后将填充后的图像与原图像逻辑与操作则可以达到去除图像背景的目的。
图为包菜图像内部填充后的图像。
图包菜图像填充后的图像
三、背景去除。
将填充后的图像与原图像逻辑与操作,即将背景去除。
图为背景去除后的包菜图像。
图包菜图像去除背景后的图像
2.3.2K-Means聚类算法
封闭外层轮廓的蔬菜图像的背景去除算法仅仅适合于图像前景与背景像素灰度区别较大,且提取出来的前景外侧轮廓线是封闭的情况。
对于前景与背景灰度区别较小的情况,则不能通过这种方法来进行分割。
为此,需要寻找一种更加通用的方法。
K-Means聚类算法是一种自适应搜索算法,其基本思想是:
通过迭代不断调整聚类中心,最终将数据集中的个体划分为K类,使其所有个体到所属类的类中心的欧式距离之和最小。
算法说明:
设由n个数据点组成的数据集为X={
|
∈
,i=1,2,…,n},每个数据点
是由d个表征其特征的数据组成的向量。
K均值聚类的目标是将这n个数据点划分成K类组成聚类集C={
|k=1,2,…,K},其中
类的类中心设为
,定义被划分到
类的点
到类中心
的欧式距离为:
D(
)=
(
∈
)式
那么,所有被划分到
类的点
到该类的类中心
的欧式距离之和为:
M(
)=
式
式中统计的是聚类集C中的第k个划分子类
中的点到该类中心的欧式距离之和。
那么,将聚类集中的各个子类都统计一次,就得到了数据集中的所有点
到其所属类的类中心的欧式距离之和为:
S(
)=
=
=
式
其中,
=
。
由此可见,要使式中的S(
)的值最小,类中心
应取该聚类子集
中各数据点的平均值。
K均值聚类的迭代过程可以描述为如下过程[7]:
:
按照最大化最小化原则,选定K个数据点作为K个子类划分的初始类中心。
:
计算各数据点到类中心的欧式距离,按照最近邻原则将其划分到各类中心表示的子类中,得到K个子类数据集。
:
计算各个子类数据集中各点的平均值,把该平均值作为该子类新的类中心。
:
计算所有数据点到其所属类中心的欧式距离之和S(
),判断类中心和S(
)的值是否发生改变。
如果是,就转到第
(2)步;如果否,就转到第(5)步。
:
终止迭代,算法结束。
算法改进:
由于K均值聚类算法对初始类中心的依赖性较大。
若是随机的选择聚类初始类中心,最终分割出的图像存在着很大的不稳定性。
为此,给初始类中心的选择添加一个限定条件:
使初始类中心的均值等于利用最大类间差值法(大津法)[8]、[9]分割图像时的阈值。
K-Means聚类算法用于蔬菜图像分割的步骤:
:
将图像缩小尺寸至原来的1/4,记为I1。
:
将彩色图像I1从RGB颜色空间转至HSV颜色空间。
:
提取出HSV颜色空间中图像的3个通道的图像。
:
对该3个通道的图像进行聚类,观察效果,选取效果最好的通道图像,记为I2。
:
将I2尺寸放大至原始图像尺寸。
图为包菜图像由RGB颜色空间转化为HSV颜色空间后,3个通道的图像。
观察可知,V通道图像前景部分和背景部分差别较大,因此选择V通道图像来进行图像的聚类。
(a)H通道图像
(b)S通道图像
(c)V通道图像
图包菜图像HSV颜色空间下3通道图像
图为各种类蔬菜聚类后图像。
(a)青菜
(b)包菜
(c)芹菜
(d)韭菜
(e)菠菜
(f)花菜
图各类蔬菜聚类后的图像
2.3.3含阴影图像的分割算法
对于含有阴影的图像,使用K均值聚类算法则不能起到很好的分割效果,阴影区域和前景图像聚类在一起了,如图所示。
含阴影的黄瓜图像
K-Means算法分割后的图像
含阴影的茄子图像
K-Means算法分割后的图像
图含阴影的蔬菜图像分割后的图像
若对K均值聚类算法分割后的图像再次进行聚类分割,实验发现,再次聚类后,很好的将与阴影同侧的轮廓线凸显出来了。
但同时,前景其他部分内容随同阴影一同被去除了,如图所示。
图黄瓜图像二次分割后的图像
观察图,前景中丢失的内容肯定是在聚类的过程中,同阴影部分聚类在一起了。
为此,需要将这部分内容与阴影部分进行区分。
由阴影区域的性质可知,其区域较为光滑,像素较为一致,波动小。
而黄瓜表明则相对粗糙,像素值波动较大。
基于这一区别,利用梯度算子来将两部分区分开来,如图所示,已经对其进行了膨胀,腐蚀等处理,其中白色部分是梯度值大于所设定的梯度阈值的部分,黑色反之。
图梯度化操作后的图像
观察黄瓜图像分割后的图像和图,可以发现若将两幅图像进行逻辑与操作,则可以大致得到图所丢失的那部分前景内容(注意,不完全是丢失的那部分),再将与操作后的图像与图进行或操作,则可以将阴影部分给去除了,如图所示。
黄瓜
茄子
图含阴影的蔬菜图像分割后的图像
实验结果与分析
观察图可以发现花菜图像聚类后边缘存在着很多的噪声,针对这种情况,考虑将具有封闭外层轮廓的蔬菜图像的背景去除算法与K-Means聚类算法结合起来。
因为,若直接对图像进行外层轮廓跟踪,则可能因为边界部分像素与背景像素差异不大,导致不能得到一封闭的外层轮廓。
通过聚类后的图像,虽然存在噪声,但图像边缘很好得凸显出来了。
图为所以蔬菜图像背景去除后的图像。
(a1)花菜原图像
(a2)花菜分割后图像
(b1)西红柿原图像
(b2)西红柿分割后图像
(c1)黄瓜原图像
(c2)黄瓜分割后图像
(d1)萝卜原图像
(d2)萝卜分割后图像
(e1)菠菜原图像
(e2)菠菜分割后图像
(f1)韭菜原图像
(f2)韭菜分割后图像
(g1)芹菜原图像
(g2)芹菜分割后图像
(h1)青菜原图像
(h2)青菜分割后图像
(i1)包菜原图像
(i2)包菜分割后图像
图各类蔬菜分割图像
本章小结
图像预处理是后续特征提取工作的前提,其中图像分割是图像预处理阶段高级的层面,其实质就是把图像分成若干个特定的、具有独特性质的区域并提出感兴趣目标的技术和过程。
它是由图像处理到图像分析的关键步骤。
本设计分割的目的是将图像的前景部分从图像中分割出来。
由于图像背景简单,光照均匀,使用两种方法对图像进行分割:
一、具有封闭外层轮廓的蔬菜图像的背景去除算法,二、K-Means聚类算法。
实验结果证实了两种方法分割图像的有效性,获得了满意的结果。
虽然,利用两种算法对本设计采集的图像分割效果良好,但这两种方法也有局限性:
第一、外层边缘跟踪算法仅仅对边缘部分像素值与背景像素值差别较大的情况,对于差别较小的情况,往往不能起到很好的分割效果。
因此它仅作为一种辅助算法。
第二、K-Means聚类算法是本设计分割过程中的主要算法,对本设计所采集的图像中95%以上的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 蔬菜 图像 模式识别 技术 应用