书签分享收藏举报版权申诉 / 41

立即下载加入VIP,免费下载

当前位置：首页 > 经管营销 > 经济市场 > 计算机视觉的手势跟踪与识别技术的分析研究.docx

计算机视觉的手势跟踪与识别技术的分析研究.docx

文档编号：29565170
上传时间：2023-07-24
格式：DOCX
页数：41
大小：1.29MB

《计算机视觉的手势跟踪与识别技术的分析研究.docx》由会员分享，可在线阅读，更多相关《计算机视觉的手势跟踪与识别技术的分析研究.docx（41页珍藏版）》请在冰豆网上搜索。

计算机视觉的手势跟踪与识别技术的分析研究.docx

计算机视觉的手势跟踪与识别技术的分析研究

基于计算机视觉的手势跟踪与识别技术的研究

1绪论2

1．1手势识别研究的意义2

1．2手势识别国内外研究现状2

1.3基于视觉的手势跟踪与识别流程图3

2基于计算机视觉的手势识别基础理论3

2．1模式识别概述3

2．2基于计算机视觉的手势跟踪理论4

2．3基于计算机视觉的手势识别理论5

2．3．1神经网络算法5

2．3．2基于模板匹配的算法6

2．3．3统计分析算法7

2．3．4隐马尔可夫模型（HMM>7

2．4基于计算机视觉的手势跟踪与识别系统8

3手势图像预处理及特征提取8

3．1手势图像预处理8

3．1．1图像平滑9

3．1.2图像色彩空间转换10

3．1.3图像二值化11

3.1.4图像形态学处理12

3．2手势图像特征提取13

4手势跟踪算法研究13

4．1Kalman跟踪算法13

4．2Camshift跟踪算法15

4．2．1颜色概率模型15

5基于计算机视觉的手势跟踪与识别算法实验16

5．2手势图像预处理及特征提取实验结果17

5．2．1手势图像获取及手势样本库的建立17

5．2.2手势图像的预处理19

5．2手势跟踪实验结果及分析20

5．3实时手势识别实验结果及分析21

5．3．1手势识别系统流程21

5.4手势跟踪与识别在人机交互中的应用21

6总结与展望23

7附录：

24

7.1程序重要部分代码24

7.2手势识别的视频27

7.3国内外生产手势识别软件的厂家28

1绪论

1．1手势识别研究的意义

在人机交互的发展过程中先后出现了基于文本方式的键盘、基于图形方式的鼠标等交互接，然而从某种程度上说，这些机械设备在人机交互方面是不方便和不和谐的。

它把机器作为人机交互的中心，在人机交互时人需要去适应机器的输入输出设备，对机器没有主动控制的能力。

随着计算机科学的快速发展，研究符合人类交流习惯的人机交互技术成为国内外关注的热点，这些研究包括人脸识别、面部表情识别、头部运动跟踪、眼睛识别、手势识别以及人体姿势识别等。

总体来说，人机交互的研究已经从以计算机为中心转移到以人为中心，大大提高了人机交互的效率。

手势作为人类最自然的表达方式之一，在日常生活中得到了广泛的应用。

手势生动、形象、直观，而且蕴涵着丰富的信息，是人与人沟通的重要媒介。

目前基于手势的交互已经成为人机交互的重要内容。

手势识别的应用前景十分广阔：

（1>对于聋哑人而言，特别是文化程度比较低的聋哑人，使用手语和正常人交流更加方便和高效。

手语是用手势表示意思的语言，对不熟悉手语的普通人来说，理解手语是非常困难的。

如果有一套可以翻译手语的系统，则将大大方便聋哑人与正常人之间的交流；（2>利用手势对虚拟现实中的智能设备进行控制。

比如在虚拟场景内利用手势实现虚拟钢琴的演奏，又如用机器人的虚拟手抓取物体等；（3>研究人类对于视觉语言的理解规律，提高计算机对人类语言的理解能力；（4>手势交互是虚拟现实中多通道接口的重要组成部分之一。

1．2手势识别国内外研究现状

根据外围设备采集手势图像方式的不同可以把手势识别分为两种：

基于数据手套的手势识别和基于视觉的手势识别。

基于数据手套的手势识别是通过数据手套和位置跟踪来测量手势运动的轨迹和时序信息，其优点是系统的识别率高，缺点是输入设备昂贵，并且要求打手势的人穿戴复杂的数据手套，给人带来很多不便，因此这种方式不能成为未来发展的趋势。

基于视觉的手势识别是计算机通过对摄像头拍摄的手势图像进行分析和处理提取出手的位置及形状。

这种方法在实现时无需购买昂贵的设备，仅需要廉价的摄像头和低端处理能力的PC机即可。

并且在操作时更加自然、方便，符合以人为本和自由性的要求，是手势识别未来发展的趋势。

但是这种方法的识别效率比基于数据手套的手势识别低，而且能够识别的手势种类受到很大的限制，是目前亟待解决的问题。

国外很早就开始了对手势识别的研究工作。

Huang创建的手语识别系统使用3D神经网络的方法识别了15个不同的手势。

Stamert51等人使用隐马尔可夫模型（HMM>对输入视频序列中的美国手势中带有词性的40个词汇随机组成的句子进行了识别，其中HMM参数的估计采用的是EM算法。

系统对分离单词的识别和由5个单词组成的句子（句子的结构限定为代词+动词+名词+形容词+代词>的识别分别进行了测试，识别正确率达90％。

Zhu[6]使用主成分分析方法创建统计结构，从而识别活跃对象的形状，即模型化系统和弹性对象的识别。

Vogler和MetaxastTl开发的手语理解系统通过固定在人身上的物理传感器和一个能够对手臂进行精确定位的摄像机来获取手臂位置信息。

系统采用独立的语言模型对包括53个单词的手语集进行了测试，识别率也达到90％。

我国对手势识别的研究起步较晚，但近年来也取得了显著的成果。

例如文献f81中使用神经网络方法和Hough变换对中国手语中的20种手势进行识别。

在文献[91q丁采用基于表观的手势模型，提取八个手势特征组成特征向量，采用二次分类（粗分类和细分类>的方法对10个常用的静态手势进行识别。

张秋余、姚开博等采用矩形特征描述手势，用改进的AdaBoost算法训练分类器，在复杂背景下对手势的跟踪与识别取得了不错的效果。

中科院的单彩峰提出了结合均值漂移的粒子滤波（TheMeanShiftEmbeddedParticleFilter，MSEPF>，通过在时序模板中引入时空轨迹，提出了时序模板轨迹概念，将跟踪得到的手势运动轨迹压缩到单幅图像中，实现了对预先定义的动态手势的识别。

山东大学的徐立群等提出了一种基于颜色概率模型并融合运动信息进行手势跟踪的新方法。

利用肤色概率查找表将图像序列转换为肤色概率分布图，用运动信息和肤色概率分布对搜索窗口进行初始化，然后对肤色概率分布图进行迭代运算，得到手势的位置和大小，从而实现了对六种孤立手势的识别。

1.3基于视觉的手势跟踪与识别流程图

本课题的主要内容是研究基于计算机视觉的手势跟踪与识别。

首先对手势跟踪与识别各个阶段的算法进行了分析，提出基于Hu矩特征和“一对多"径向基核函数支持向量机相结合的手势识别算法，并在MicrosoftVisualC++6．0开发环境下，借助OpenCV开源库，实现了对从摄像头输入的10个常用手势的识别，以验证提出算法的可行性，并以此为基础建立了一个简单的手势交互系统。

基于视觉的手势跟踪与识别流程图见图1-1。

图1-1基于视觉的手势跟踪与识别流程图

2基于计算机视觉的手势识别基础理论

在人与人的交际过程中，经常会用到手势，手势的语义强大并且直观，可以很好地表达思想，与自然语言形成互补。

所以近些年来，手势识别的研究得到了很大的关注和发展。

本章主要介绍基于视觉的手势识别的一些基础理论。

2．1模式识别概述

模式识别诞生于20世纪20年代，随着40年代计算机的出现，50年代人工智能的兴起，模式识别在60年代初迅速发展成--f]学科1131。

它所研究的理论和方法在很多科学和技术领域中得到了广泛的重视，推动了人工智能的发展，扩大了计算机应用的可能性。

几十年来，模式识别研究取得了大量的成果，在很多方面都得到了广泛的应用。

但是，由于模式识别涉及到很多复杂的问题，现有的理论和方法对于解决这些问题还有很多不足之处。

通常，我们把通过对具体的个别事物进行观测所得到的具有时间和空间分布的信息称为模式，把各模式所属的类别称为模式类。

模式识别是对表征事物或者现象的各种形式的信息进行分析和处理，来实现对事物或现象进行描述、辨认、分类和解释，是信息科学和人工智能的重要组成部分。

人们为了掌握客观事物，就将事物按照相似度组成类别。

模式识别的作用和目的就在于面对某一具体事物时将其J下确的归入某一类别。

有两种基本的模式识别方法，即统计模式识别方法和结构模式识别方法。

与此相应的模式识别系统都由两个过程组成，即设计与实现。

设计是指用一定数量的样本（叫做训练集或学习集>进行分类器的设计。

实现是指用所设计的分类器对待识别的样本进行分类决策。

基于统计方法的模式识别主要由4个部分组成：

数据获取、预处理、特征提取和选择、分类决策，如图2-1所示。

图2-1模式识别系统的基本构成

1．数据获取

为了使计算机能够对各种现象进行分类识别，要用计算机可以运算的符号来表示所研究的对象。

通常输入对象的信息有一维波形、物理参量和逻辑值、二维图像3种类型，通过测量、采样和量化，可以用矩阵或向量表示二维图像或一维波形。

这就是数据获取的过程。

2．预处理

预处理的目的是去除噪声，加强有用的信息，并对输入测量仪器或其他因素所造成的退化现象进行复原。

3．特征提取

由图像或波形所获得的数据量是相当大的。

例如，一个文字图像可以有几千个数据，一个心电图波形也可能有几千个数据。

为了有效地实现分类识别，就要对原始数据进行变换，得到最能反映分类本质的特征。

这就是特征提取和选择的过程。

一般我们把原始数据组成的空间叫测量空间，把分类识别赖以进行的空间叫做特征空间，通过变换，可把在维数较高的测量空间中表示的模式变为在维数较低的特征空间中表示的模式。

4．分类决策

分类决策就是在特征空间中用统计方法把被识别对象归为某一类别。

基本做法是在样本训练集基础上确定某个判决规则，使按这种判决规则对被识别对象进行分类所造成的错误识别率最小或引起的损失最小。

2．2基于计算机视觉的手势跟踪理论

手势分割与跟踪是手势识别的基础，其好坏将影响识别率的大小。

手势分割的方法大体分为三种：

基于运动信息的、基于运动模板的和基于颜色信息的。

基于运动信息的手势分割是通过对前后两帧图像做差分运算来检测手势的，当手势运动时则图像发生变化。

运动估计的依据是图像强度发生变化，用图像序列中相邻图像的差来表示强度的变化。

图像差运算非常简单，这是由于在图像差运算中仅仅涉及到了像素强度的相减。

在实际的手势识别系统中，摄像机的位置是固定的，对手势序列中相邻两帧图像做差分运算便能有效地保留运动的部分（即手势>，滤除图像中保持不变的背景区域。

基于运动模板的手势分割是用模板匹配方法寻找运动的手势，一般把二维可变形模板作为插值节点去近似物体轮廓。

模板由平均点集合、点可变性参数和外部变形构成，平均点集合描述的是某一组形状的平均形状，点可变性参数描述的是可变形模板的全局运动。

通常用基于可变形模板的人手模型来跟踪人手。

二维模板实现简单，但对手的姿念有一定限制。

三维模板则不受手的姿态的限制，但其参数过多使得实现困难。

基于颜色信息的分割在图像分割中占有重要地位。

颜色分割与其他两种方法相比，具有高效性和鲁棒性等特点，得到了广泛的应用。

但是在复杂背景的情况下或者光照变化快时，基于颜色的分割效果不好，为了解决这个问题，目前众多研究者尝试利用融合多种信息的技术进行手势分割。

国内外对手势跟踪的研究很多，例如利用粒子滤波（ParticleFilter>对手势跟踪获得了较好的效果。

Camshift[巧J（ContinuouslyAdaptiveMeanShift>是一种基于颜色概率模型的跟踪算法，它是MeanShift算法的改进与扩展，可以处理动态变化的分布。

当视频序列一帧一帧变化时，Camshift能够自动调节搜索窗的大小和位置，定位被跟踪目标的中心和大小，并且用当前帧定位的结果来预测下一帧图像中目标的中心和大小，每帧图像都这样处理，就形成了连续的跟踪。

2．3基于计算机视觉的手势识别理论

基于视觉的手势识别可以分为基于单目视觉的手势识别和基于多目视觉的手势识别。

基于单目视觉的手势识别就是通过单个摄像机来采集手势图像，从而建立平面手势模型。

这种方法处理的数据量较小，识别速度快，但是对于用户手势的输入限制较大。

基于多目视觉的手势识别是通过两个或两个以上的摄像机来采集图像，建立的是立体模型。

这种方法对于用户手势的输入限制较小，可以实现更加自然的人机交互，但由于立体模型的复杂性，需要处理大量的数据，识别时间长，无法实现实时的识别。

基于视觉的手势识别算法可分为神经网络算法、模板匹配，统计分析算法、和隐马尔可夫模型（HiddenMarkovModelHMM>等。

2．3．1神经网络算法

对人工神经网络的研究早在20世纪40年代就已经开始了。

有人以包含0-1和1-0变化的随机模型作为模型化神经系统的基础。

到了50年代中期和60年代初期，人们已设计出称为感知机（perceptrons>的学习机器，引起了模式识别理论界人士的重视。

80年代中期提出的对多层感知机的新训练算法（称为以反扩散学习的广义德尔塔（Delta>规则>是非常有效的。

广义德尔塔规则在许多实际问题中得到了成功的应用，使得多层感知机类机器成为目自玎使用神经网络的主要模型之一。

神经网络是指利用工程技术手段模拟人脑神经网络的结构和功能的一种技术，其目的是使机器具有人脑那样的感知、学习和推理功能。

神经网络方法在手势识别领域得到了广泛的使用。

它对信息处理具有自组织、自学习等特点，有较强的抗干扰能力。

它是由许多具有非线性映射能力的神经元组成的一种大规模并行处理网络，神经元之间通过权相连。

文献『16]qbM．Yeasin采用了TDNN（TimeDelayNeutralNetwork时延神经网络>的手势识别技术。

BP神经网络模型实现了多层网络学习的设想。

它是一种单向传播的多层前向神经网络，除输入输出节点外还有一层或多层隐层节点，同层节点之I、日J没有耦合，输入信号从输入层节点依次传过各层节点，最后到达输出层节点。

每一层节点的输出只影响下一层节点的输出。

BP神经网络结构分三层：

输入层、隐含层和输出层。

图2-2是一个三层前馈神经网络模型，输入层、中间隐含层和输出层的神经元个数分别为5、50和9。

图2-2三层前馈神经网络模型

BP网络学习是典型的有导师学习。

训练集包含M个样本，对第P个训练样本（P=1,2，…，M>，单元／的实际输出为郇．，，它的第i个输入（也即第i个神经元的输入>为

，则：

（2-1>

BP算法中大多选用S型函数作为输出函数，即：

（2-2>

2．3．2基于模板匹配的算法

模板匹配算法就是将输入的原始数据与预先存储的模板进行匹配，通过测量两个模板之间的相似度进行识别。

模板匹配的方法多用于静态手势识别中，如CuiYuntao通过计算模板的相关系数来进行预测匹配。

文献f181中张良国、吴江琴、高文等人首先改进了Hausdorff距离，接下来通过比较预处理后的输入图像的Hausdorff距离和标准模板库中各种图像的Hausdorff距离进行判断。

Hausdorff距离是描述两组点集之间相似程度的一种量度，它是两个点集之间距离的一种定义形式【191：

假设有两组集合A={

}，B={

}，则这两个点集之上的Hausdorff距离定义为：

（2-3>

（2-4>

（2-5>

是点集A和点集B间的距离范式

这里，式（2-3>称为双向Hausdorff距离，是Hausdorff距离的最基本形式；式（2-4>（2-5>中的h（A，B>和h（B，A>分别称为从A集合到B集合和从B集合到A集合的单向Hausdorff距离。

即h（A，B>实际上首先对点集A中的每个点

到距离此点最近的B集中点b，之间的距离

进行排序，然后取该距离中的最大值作为h（A，B>的值，h（B，A>同理可得。

由式（2-3>知，双向Hausdorff距离H（A,B>是单向距离h（A，B>和h（B，A>两者中的较大者，它度量了两个点集之间的最大不匹配程度。

2．3．3统计分析算法

统计分类算法是在模式识别发展的过程中建立的经典方法，它用概率统计模型得到各类别的特征向量分布，以达到分类的目的。

统计分类算法是一种监督学习的模式识别方法。

如何将分类器设计得更有效，识别率更高，是需要重点解决的问题。

当几个类别的样本在特征空间的分布符合一定的拓扑结构，并且我们知道各个类别的概率分布函数时，我们就可以利用统计分类方法进行模式识别。

常用的统计分类方法有很多，例如‘'by．product”方法、决策树和决策表方法等。

模式的统计分类方法，又称为决策理论识别方法，它是将各模式类别看成是用某个随机向量实现的集合。

属于同一类别的各个模式之间的差异，有些是由环境噪声和传感器的因素引起的，有些是模式本身所具有的随机性质引起的。

在通常情况下，不同类别的两个模式之间的距离要大于同一类别的两个模式之间的距离，这样就可以将特征空间准确的划分为几个区域，其中各个区域同各个类别是一一对应的。

若不满足上述条件，则对每个特征向量估计其属于某一类的概率，概率值最大的类就是该点所属的类别。

统计分类方法常用的分类器主要有贝叶斯分类器、线性判别函数、树分类器、最小距离分类、近邻法分类、聚类分析等。

2．3．4隐马尔可夫模型（HMM>

在给定前一个状态的情况下，随机变量序列的下一个状态的出现是条件独立的。

每一个时刻的随机变量有一个度量值，这个度量值的分布与该时刻的状态有关。

这样的模型称为隐马尔可夫模型（HMM>。

隐马尔可夫模型是在Markov链的基础之上发展起来的。

实际问题比马尔可夫链所描述的更为复杂，观察到的事件并不是与状态一一对应的，而是通过一组概率分布相联系的。

它是一个双重随机过程：

一是描述状态转移的马尔可夫链是基本随机过程；另一个是描述状态和观察值之间的统计对应关系是随机过程。

基于以上原因观察者只能看到观察值不能直接看到状态，即让观察者通过一个随机过程去感知状态的情况，所以称之为“隐”Markov模型。

如图2-3为隐马尔可夫模型组成的示意图。

HMM作为信号的一种统计模型，已经在语音信号处理领域得到了广泛应用，近年来很多研究者也将HMM用于手语识别领域。

但是应用于手势识别时有很多约束。

首先，动态手势信号不满足马尔可夫性质，也就是说随机向量当前的状态只与前一状态有关；其次，仅用隐马尔可夫模型对手势建模远远不够，会导致隐马尔可夫模型将许多信号作为噪声处理。

图2-3：

隐马尔可夫模型组成

2．4基于计算机视觉的手势跟踪与识别系统

计算机视觉研究就是计算机通过对一幅或多幅图像进行分析，从中获取三维世界的运动信息或者集合特征，例如物体的位置、形状、姿态运动等信息，接下来对这些信息进行分析、处理，以达到认识三维世界的目的。

计算机视觉作为一门新兴的学科，正在受到越来越多的关注。

视觉运动分析方法因具有适用范围广、抗电子干扰能力强、测量精度高和保密性好等优点，在军事、导航、机器人技术、气象分析、医疗诊断、交通管制、安全防范等领域得到了广泛的应用。

手势作为人类最自然的表达方式之一，在日常生活中得到了广泛的应用。

同时，手势具有适应性强、形象生动及简便易行等特点，比较适合在非特定环境下对机器人的控制。

通常一个完整的手势跟踪与识别系统，分为以下几个部分：

（1>手势的检测与跟踪：

手势的检测与跟踪是手势识别的基础，其好坏将影响识别率的大小。

手势分割的方法大体分为三种：

基于运动信息的、基于运动模板的和基于颜色信息的。

国内外对手势跟踪也做了大量研究，常用的有卡尔曼滤波（KalmallFilter>、粒子滤波（ParticleFilter>等跟踪方法。

（2>静态手势识别：

静态手势识别是指对于静态图片中手的形状和手的姿势进行识别。

国内外对静态手势识别做了大量研究。

例如文献f81中提出了一种使用神经网络方法和Hough变换对中国手语中的20种手势进行识别。

在文献『91中采用基于表观的手势模型，提取八个手势特征组成特征向量，采用二次分类（粗分类和细分类>的方法对10个常用的静态手势进行识别。

（3>动态手势识别：

动态手势识别是对连续的手势序列进行实时的跟踪，通过对跟踪到的手势运动的时空轨迹（spatial．temporaltrajectory>或手势状态轨迹（statetrajectory>进行处理，以识别摆手等动态手势。

3手势图像预处理及特征提取

手势图像的预处理和特征提取是下一步要进行的手势跟踪与识别的前提，其质量的好坏既关系到手势的识别率，又关系到所建立的人机交互系统的整体性能。

本章针对图像采集时所遇到的光照变化、旋转、平移等不确定因素，对手势图像的预处理和特征提取进行了分析。

3．1手势图像预处理

在手势图像的预处理阶段，为了得到理想的分割效果，本文对采集到的手势图像采用了图像平滑、色彩空间转换、图像二值化以及形态学处理等算法以得到准确的手势二值化图像。

3．1．1图像平滑

图像平滑的目的是为了消除噪声。

图像噪声的来源有三种：

一是在光电、电磁转换过程中引入的人为噪声；二是大气层电（磁>暴、闪电、电压、浪涌等引起的强脉冲性冲激噪声；三是自然起伏性噪声，由物理量的不连续性或粒子性引起，这类噪声又可分为热噪声、散粒噪声等。

消除噪声的方法又可以分为空间域方法或频率域方法，亦可以分为全局处理方法或局部处理方法等。

1．邻域平均法

邻域平均法I刎是简单的空域处理方法。

这种方法的基本思想是用几个像素灰度的平均值来代替每个像素的灰度。

假定有一幅NXN个像素的图像

，平滑处理后得到一幅图像

。

由下式决定：

<3-1）

式中，

S是点伍纠所在领域的中点的坐标集合，但不包括

点；M是集合内坐标点的总数。

式（3．1>说明，平滑后的图像中

每个像素的灰度值，均由似一邻域中包含的像素灰度值的平均值来决定。

2．中值滤波法

中值滤波【211是一种非线性滤波，由于它在实际运算过程中并不需要图像的统计特性，所以比较方便。

中值滤波首先是被应用到一维信号处理技术中，后来被二维图像信号处理技术所引用。

在一定的条件下，它可以克服线性滤波器所带来的图像细节模糊，而且对滤除脉冲干扰及图像扫描噪声最为有效。

但是对一些细节，特别是点、线、尖顶细节多的图像不宜采用中值滤波的方法。

3．频域平滑技术

图像的平滑既能够在空域中进行，又能够在频域中进行。

频域平滑技术是一维信号低通滤波器在二维图像中的推广。

对于一幅图像，它的边缘、跳跃部分以及噪声都代表图像的高频分量，而大面积的背景区和变化缓慢的部分则代表图像的低频分量，用频域低通滤波器除去其高频分量就能去掉噪声，从而使图像得到平滑。

滤波器的数学表达式为：

<3-2）

其中F（u，D为原图像的傅立叶变换，

为平滑后图像的傅立叶变换，

是滤波器的转移函数。

常用的低通滤波器有：

（1>理想低通滤波器

一个理想低通滤波器的传递函数为：

<3-3）

其中D。

为截止频率，

是点

理想低通滤波器在处理过程中会产生比较严重的模糊和“振铃”现象，这是由于H（u,v>在D。

处由1突变到0，这种理想的H（u,v>，D对应的冲激响应h（u,v>在空域中表现为同心环的形式，并且此同心环数与D。

成反比，D。

小，同心环数越多，模糊程度越厉害。

正是由于理想低通滤波存在“振铃"现象，其平滑效果才下降。

（2>巴特沃斯滤波器

一个巴特沃斯滤波器的传递函数为：

（3-4>

其中D。

为截止频率，当D（u,v>=D。

时，H（u，v>降为最大值的1/2。

，n为阶数，取正整数，阶数刀控制曲线的形状。

由于转移特性曲线较为平滑，没有振铃效应，故图像的模糊将减少。

（3>指数型滤波器

一个指数形滤波器的传递函数为：

（3-5>

其中Do为截止频率，n为阶数，当D（u,v>=D。

时，H（u，v>降为最大值的l／e。

用指数形滤波器滤波后的图像比用巴特沃斯滤波器滤波后的图像模糊一些，但没有振铃效应。

图3-1（a>（b>（c>（d>分别是原图像、加椒盐噪声的图像、中值滤波效果图以及3×3邻域滤波效果图。

可见，用中值滤波的方法进行图像的平滑处理效果比较理想，因此本文在手势预处理中采用中值滤波法对图像进行平滑。

图3-1图像平滑效果

3．1.2图像色彩空间转换

计算机色彩理论认为，一种颜色在计算机中有多种不同的表达方式，从

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

下载	加入VIP,免费下载

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 计算机视觉手势跟踪识别技术分析研究

冰豆网所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

关于本文

本文标题：计算机视觉的手势跟踪与识别技术的分析研究.docx
链接地址：https://www.bdocx.com/doc/29565170.html

计算机视觉的手势跟踪与识别技术的分析研究.docx

热门标签