人工智能数据搜索智能感知与交互识别Word格式.docx
- 文档编号:14365080
- 上传时间:2022-10-22
- 格式:DOCX
- 页数:18
- 大小:64.40KB
人工智能数据搜索智能感知与交互识别Word格式.docx
《人工智能数据搜索智能感知与交互识别Word格式.docx》由会员分享,可在线阅读,更多相关《人工智能数据搜索智能感知与交互识别Word格式.docx(18页珍藏版)》请在冰豆网上搜索。
可以说,基于激活数据学的数据搜索推动人工智能更好地理解人类和感知世界实现质的飞跃。
第一节
智能感知与交互
(一)生物感知
大千世界,不少动植物体内的“时钟”比人类对于时间的感觉更加自觉、更加准确。
候鸟能准确地知道自己的出发日期及时刻,昆虫和某些植物也有类似的感知能力。
在田野里到处飞翔、采集花蜜的蜜蜂体内就有十分准确的时钟,知道什么花在上午可采到花蜜,什么花在下午可采到花蜜。
地震前,植物能感知到地震即将爆发,并随着不同的时间相应地产生变化和反应。
一般而言,“感”是信息获取的过程,通过感知方法、机制和设备获取自身、其他对象与物理环境的各种物理信息;
而“知”则更多的是利用“感”获取的信息进行识别、推理、判断与决策。
[1]有些东西是我们用眼睛看不到的,如黑暗中的物体,但我们可以凭借手和身体感知它们的存在。
有些东西是我们无法用手和身体触摸到的,如远处的物体或者风景
,但我们可以用眼睛感知它们的存在。
有些东西我们无法用眼睛看到,也无法用手和身体碰触到,如歌声、音乐、话语等,但我们可以用耳朵感知它们的存在。
还有一些东西是我们的感官无法直接感觉到的,如紫外线、红外线、细胞、粒子与电磁波等,我们可以制造各种仪器,借助工具感知它们的存在。
还有一种情况,通过眼、耳、鼻、舌、身、意获取外面的信息,反馈给心神,瞬间得到答案或相应的缘起缘灭等信息。
这是一种特殊的修者的境界或状态。
人类用心念来诠释自己器官所接收的信号,称为感知。
为什么我们能够感知到呢?
因为人体的每个器官(包括感觉、生殖与内脏器官)都是外在世界信号的“接收器”,只要是它范围内的信号,经过某种刺激,器官就能将其接收,并转换成感觉信号,再经由自身的神经网络传输到我们心念思维的中心——“头脑”中,进行情感格式化的处理,之后就产生了我们的感知。
感知的意义范围很广,主要意思是客观事物通过感觉器官在人脑中的直接反映。
感知能力则是通过感觉器官感觉某样不可视或者肉眼无法直接观察的物体,并能通过感觉描绘出其具体形状或者运动状态的一种超能力。
这种能力不是人人皆有的,但是通过后天大量的刻苦练习,人可以获得一定程度的这种能力,比如可以感觉出背后某物体的形状、颜色
、运动状态。
其实质是物体向外辐射的红外线被人体向外辐射的脑电波擒获,在脑部形成
对该物体一定的判断。
所有生物都具备感知能力,都有感与知的关系。
感和知是生物具备的本能,感知能力
在不同物种、不同个体间各不相同,感和知都是在本能作用和存在环境里自然形成的。
作为蝙蝠饵食的褐色蛾、尺蛾或叶卷蛾等昆虫,听到蝙蝠发出的超声波,就知道为保护自己而进行防御。
只要蝙蝠飞进30米防线,蛾就马上合上翅膀,从空中急速掉落地面。
当蝙蝠不在附近时,蛾会再次飞起。
蛾也许有能听到蝙蝠发出的超声波的耳朵吧?
科学家对蛾的听觉部位做了研究,认为在其胸部和躯干之间,也就是在腰部两旁,好像有一对能感知超声波的器官,构造非常简单,功能却十分优越。
这对器官有感觉神经细胞,能放大超声波的振动,并把信号传到大脑而决定其行动。
当蝙蝠飞来时,无论从哪个侧面向蛾逼近,蛾的神经细胞都会产生较强的信号,于是蛾为防止被捕捉而做锯齿形或复杂形式的飞行,以此逃避。
当蝙蝠飞至约6米距离时,蛾的感觉细胞就产生更强的脉冲,频率急剧加快,这样,蛾只好停止飞行,迅速掉落到地面上。
蛾诱骗蝙蝠的这个行动,实际上早在蝙蝠意料之中。
先前正飞向蛾的蝙蝠突然改变方向估算出蛾落下时的轨迹路线,在蛾掉落地面之前逮住它,蛾成为蝙蝠口中之物。
感知力在人和高级动物的个体生存过程中发挥着超越应激反应的积极作用,是与环境互动,发生知觉反应的根本原因。
人类拥有高级的语言能力、思维能力、学习能力,很多人认为人类不能和其他动物相提并论,但是为什么在很多灾难到来之前,动物都会有一些预感并躲避灾难,而人类这种最高级的动物却完全没有意识到,只能坐以待毙。
人们研究认为,过去的人类也具有类似动物的感知能力,现在却由于某种原因削弱了这种能力。
直觉是所有动物的本能,人类也是凭借直觉得以生存延续至今的。
人类的祖先一定也拥有优于其他动物的本能,才能在大自然中完美进化。
从某种意义上说,人类文明是一个人类对世界和自己不断认知的过程,所谓认知就是对有用的数据——信息进行采集过滤、加工处理、预测输出、调整反馈的全过程。
(二)机器感知
人的感知通过计算机离散化处理方式可被记录、被量化、被计算。
通常来说,机器感知就是借助各种传感器识别周边环境,这些传感器相当于人的眼、耳、鼻、皮肤等。
比如视觉感知,类比人类的视觉系统,用摄影头代替人眼对目标进行识别、跟踪和测量等。
当前,服务机器的计算机视觉已经相当完善了,如人脸识别、图像识别、定位测距等。
可以说,在为人类提供服务时,“看得见东西”的机器比“盲人”机器有用得多。
再如声音感知,
语音是人机交互最常用、最便捷的方式,由此,对服务机器而言,语音识别是必备的重要功能之一。
计算机将人的感知活动合理地“分割”或“碎片化”,把对感知的“整体性”、连续性分析转化为“个体性”的离散化处理。
这种离散化处理就是对人的感知的整体进行解构,展示为相互关联的独立特征,然后通过汇总特征达到对人的感知的整体把握。
这样的过程是基于离散的角度解构与重构感知活动,在现实和虚拟的离散空间中完成的。
计算机通过对抽象化数据的信息加工,即编码、存储、提取、遗忘,实现对人的数据的可识别、可感知。
人工智能和计算机模拟作为侧重于关注实际应用的认知信息加工理论中最具代表性的独特的研究方法,大多通过对人脑心理过程的模拟对人的内部信息加工过程进行逻辑分析。
人工智能的本质是对人类思维的信息过程的模拟,是人类智能的物化。
机器思维(即人工智能)表明,思维形式在思维活动中对于思维内容具有相对独立性,它可从人脑中分化出来,物化为机械、物理的运动形式,部分地代替人的思维活动。
机器与人脑的本质区别在于其本身是一种无意识的机械活动的过程,而人类的意识是长久以来文明社会长期进化发展的产物,是人类在生理基础上的心理过程,是人类由情感、直觉、想象等一系列的精神活动构成的精神世界。
人类智能在执行任务和工作时会考虑主观与客观的因素来进行决策、行动,它是社会的产物,而机器智能则是被动地接受一种逻辑指令来开展工作。
二者相比较,总是人脑思维优先于机器思维。
人类拥有“完形”认知的心理能力,能让我们把碎片信息编制完整。
这是一种高度统合的能力,我们能把躯体五感统合起来,共同构成对世界的感觉。
[2]同样,人从各个方面得到的碎片知识也有一种统合的能力,大脑会把碎片粘贴起来,把碎片之间的部分补齐,以期构成一个完整的知识世界,而机器缺少物理世界的生活经验,处理的是人类的二手信息,对于周围的物理世界缺乏真实接触。
虽然目前人工智能已经可以精细识别人类的表情
,能够读懂人的情绪,但是其缺乏对于他人心理的常识系统,仍然难以“理解”人类日常的语言。
因此,人工智能和人类智能最大的差异或许是:
真实世界与抽象符号之间的关联性
。
人工智能处理的是符号与符号之间的关系,而人类头脑处理的是真实世界到符号的投影
[3]
认知科学的自主感知和人类对自身及所处环境的自主感知一样,首先通过视觉、听觉和触觉等类似的传感器获取庞大的自身及外界环境中的各种信息。
毫无疑问,这些信息是海量的,如果不经处理便直接交给处理能力有限的大脑,就会导致系统过载。
海量信息中只有一小部分对系统的某一认知行为起主导作用,所以没必要进行信息筛选,这样能提高
系统的认知效率。
因此,基于认知科学的智能加工机器的感知机理也需要能够选择与智能机器自主感知相关的特征。
基于认知科学的感知内容主要包括信息获取、学习经验知识、推理决策等方面。
感知是连接主体(智能机器)与客体的桥梁,虽然研究中常常把感知问题如计算机视觉、语音识别等孤立出来进行研究,但很多问题是和主体环境密不可分的,对于这类问题如自动驾驶、机器人导航等,必须与主体相结合。
这种结合为感知系统和作为主体的智能机器提供了很好的互补信息,典型的情形如主体的运动可以为视觉系统提供从不同角度观察环境的能力,从而弥补了视觉系统基线长度受限,以及成像光照和姿态的问题,同时可以提供从对象已知视角学习未知视角表示的能力,变化头部位置与朝向同样为听觉系统提供了更加准确地辨认声源的能力。
同时,不同感知器官间相互补充,可以提供对客体的更加完整的表达与理解。
一旦感知系统随主体进入真实环境,就不可避免地需要面对开集问题,以往闭集条件下的一些假设如解的存在性就不再能够得以保障,因而问题的难度将大大增加。
与此同时,与主体结合的感知一旦出错,付出的代价也会大大增加。
(三)交互识别
不管是人类还是机器,感知都是最基层的,而认知则是往上再进一步的升华。
在认知的基础上,服务机器才能理解人类的各个方面,才能与人类更自然地交互。
感知为智能机器提供了被动的信息获取能力,相对于感知而言,交互可以提供一定程度上的主动能力,这种交互能力为感知增加了从多维度主动获取信息的能力,如同所有动物的感知系统,脱离交互的感知其获取信息的能力是非常有限的。
从孤立问题进行研究的角度,感知和交互看似是相互独立的,实际上却常常是紧密相关的。
感知为交互的探索提供了关于交互对象
、交互强度、交互效果的信息;
与此同时,交互则为感知提供了多维度的感知能力。
以前我们是以机器为中心进行交互的,未来在万物互联浪潮下,会以人为中心进行交互,人根据语音的控制、视觉的控制,配合手的操作完成交互。
从作为计算机载体的其他设备/装置的角度来看,计算机也不再是单一呆板的控制台形象。
小到手表,大到各种航行器,计算机在其中扮演着不可或缺的重要角色。
因此,除了需要和人类用户交互之外,计算机还需要和自然环境交互,因而其感知和交互的对象不仅仅是人类,还有各种真实世界。
例如,对机器而言,需要与其拥有者及之外的其他人和环境进行交互。
当今的大型飞机更像一台会飞行的计算机,其在自动飞行及盲降过程中都需要和环境进行有效的交互,这就要求计算系统具备感知外界的能力,实现类似人类的感
知功能。
近年来,人工智能也已经进入新一轮的快速发展期,有一点是明确的,感知和交互除了是智能行为自身最好的体现外,还是智能发育的基础和支撑。
人类得以在自然界中长期生存,一个重要的原因就是拥有迅速认识并理解其所处环境的能力,而这其中的关键环节是利用人类视觉系统完成对目标的定位与识别,同时实现对视觉场景的理解与描述。
如果计算机能够实现自动的图像识别,必将进一步丰富与方便人类生活,这促使图像识别技术成为当前人工智能领域重要的研究方向之一。
图像识别是指利用计算机视觉、模式识别、机器学习等技术方法
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 人工智能 数据 搜索 智能 感知 交互 识别
![提示](https://static.bdocx.com/images/bang_tan.gif)