计算机视觉与图像处理模式识别机器学习学科之间的关系.docx
- 文档编号:9463609
- 上传时间:2023-02-04
- 格式:DOCX
- 页数:5
- 大小:106.60KB
计算机视觉与图像处理模式识别机器学习学科之间的关系.docx
《计算机视觉与图像处理模式识别机器学习学科之间的关系.docx》由会员分享,可在线阅读,更多相关《计算机视觉与图像处理模式识别机器学习学科之间的关系.docx(5页珍藏版)》请在冰豆网上搜索。
计算机视觉与图像处理模式识别机器学习学科之间的关系
计算机视觉与图像处理、模式识别、机器学习学科之间的关系
D
是人工智能的另一研究分支。
我们所指的模式识别主要是对语音波形、地震波、心电图、脑电图、图片、照片、文字、符号、生物传感器等对象的具体模式进行辨识和分类。
模式识别研究主要集中在两方面,一是研究生物体(包括人)是如何感知对象的,属于认识科学的范畴,二是在给定的任务下,如何用计算机实现模式识别的理论和方法。
应用计算机对一组事件或过程进行辨识和分类,所识别的事件或过程可以是文字、声音、图像等具体对象,也可以是状态、程度等抽象对象。
这些对象与数字形式的信息相区别,称为模式信息。
模式识别与统计学、心理学、语言学、计算机科学、生物学、控制论等都有关系。
它与人工智能、图像处理的研究有交叉关系。
机器学习(MachineLearning)是研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。
它是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域,它主要使用归纳、综合而不是演绎。
机器学习在人工智能的研究中具有十分重要的地位。
一个不具有学习能力的智能系统难以称得上是一个真正的智能系统,但是以往的智能系统都普遍缺少学习的能力。
随着人工智能的深入发展,这些局限性表现得愈加突出。
正是在这种情形下,机器学习逐渐成为人工智能研究的核心之一。
它的应用已遍及人工智能的各个分支,如专家系统、自动推理、自然语言理解、模式识别、计算机视觉、智能机器人等领域。
机器学习的研究是根据生理学、认知科学等对人类学习机理的了解,建立人类学习过程的计算模型或认识模型,发展各种学习理论和学习方法,研究通用的学习算法并进行理论上的分析,建立面向任务的具有特定应用的学习系统。
这些研究目标相互影响相互促进。
人类研究计算机的目的,是为了提高社会生产力水平,提高生活质量,把人从单调复杂甚至危险的工作中解救出来。
今天的计算机在计算速度上已经远远超过了人,然而在很多方面,特别是在人类智能活动有关的方面例如在视觉功能、听觉功能、嗅觉功能、自然语言理解能力功能等等方面,还不如人。
这种现状无法满足一些高级应用的要求。
例如,我们希望计算机能够及早地发现路上的可疑情况并提醒汽车驾驶员以避免发生事故,我们更希望计算机能帮助我们进行自动驾驶,目前的技术还不足以满足诸如此类高级应用的要求,还需要更多的人工智能研究成果和系统实现的经验。
什么是人工智能呢?
人工智能,是由人类设计并在计算机环境下实现的模拟或再现某些人智能行为的技术。
一般认为,人类智能活动可以分为两类:
感知行为与思维活动。
模拟感知行为的人工智能研究的一些例子包括语音识别、话者识别等与人类的听觉功能有关的“计算机听觉”,物体三维表现的形状知识、距离、速度感知等与人类视觉有关的“计算机视觉”,等等。
模拟思维活动的人工智能研究的例子包括符号推理、模糊推理、定理证明等与人类思维有关的“计算机思维”,等等。
从图像处理和模式识别发展起来的计算机视觉研究对象之一是如何利用二维投影图像恢复三维景物世界。
计算机视觉使用的理论方法主要是基于几何、概率和运动学计算与三维重构的视觉计算理论,它的基础包括射影几何学、刚体运动力学、概率论与随机过程、图像处理、人工智能等理论。
计算机视觉要达到的基本目的有以下几个:
(1)根据一幅或多幅二维投影图像计算出观察点到目标物体的距离;
(2)根据一幅或多幅二维投影图像计算出目标物体的运动参数;
(3)根据一幅或多幅二维投影图像计算出目标物体的表面物理特性;
(4)根据多幅二维投影图像恢复出更大空间区域的投影图像。
计算机视觉要达到的最终目的是实现利用计算机对于三维景物世界的理解,即实现人的视觉系统的某些功能。
在计算机视觉领域里,医学图像分析、光学文字识别对模式识别的要求需要提到一定高度。
又如模式识别中的预处理和特征抽取环节应用图像处理的技术;图像处理中的图像分析也应用模式识别的技术。
在计算机视觉的大多数实际应用当中,计算机被预设为解决特定的任务,然而基于机器学习的方法正日渐普及,一旦机器学习的研究进一步发展,未来“泛用型”的电脑视觉应用或许可以成真。
人工智能所研究的一个主要问题是:
如何让系统具备“计划”和“决策能力”?
从而使之完成特定的技术动作(例如:
移动一个机器人通过某种特定环境)。
这一问题便与计算机视觉问题息息相关。
在这里,计算机视觉系统作为一个感知器,为决策提供信息。
另外一些研究方向包括模式识别和机器学习(这也隶属于人工智能领域,但与计算机视觉有着重要联系),也由此,计算机视觉时常被看作人工智能与计算机科学的一个分支。
机器学习是研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。
它是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域,它主要使用归纳、综合而不是演译。
为了达到计算机视觉的目的,有两种技术途径可以考虑。
第一种是仿生学方法,即从分析人类视觉的过程入手,利用大自然提供给我们的最好参考系——人类视觉系统,建立起视觉过程的计算模型,然后用计算机系统实现之。
第二种是工程方法,即脱离人类视觉系统框框的约束,利用一切可行和实用的技术手段实现视觉功能。
此方法的一般做法是,将人类视觉系统作为一个黑盒子对待,实现时只关心对于某种输入,视觉系统将给出何种输出。
这两种方法理论上都是可以使用的,但面临的困难是,人类视觉系统对应某种输入的输出到底是什么,这是无法直接测得的。
而且由于人的智能活动是一个多功能系统综合作用的结果,即使是得到了一个输入输出对,也很难肯定它是仅由当前的输入视觉刺激所产生的响应,而不是一个与历史状态综合作用的结果。
不难理解,计算机视觉的研究具有双重意义。
其一,是为了满足人工智能应用的需要,即用计算机实现人工的视觉系统的需要。
这些成果可以安装在计算机和各种机器上,使计算机和机器人能够具有“看”的能力。
其二,视觉计算模型的研究结果反过来对于我们进一步认识和研究人类视觉系统本身的机理,甚至人脑的机理,也同样具有相当大的参考意义。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计算机 视觉 图像 处理 模式识别 机器 学习 学科 之间 关系