智能机器人 第二章.docx
- 文档编号:29962921
- 上传时间:2023-08-03
- 格式:DOCX
- 页数:27
- 大小:447.59KB
智能机器人 第二章.docx
《智能机器人 第二章.docx》由会员分享,可在线阅读,更多相关《智能机器人 第二章.docx(27页珍藏版)》请在冰豆网上搜索。
智能机器人第二章
第二章小心!
机器车辆!
20世纪70年代,每当汽车沿着位于斯坦福大学后面山脚下的道路行驶时,奇怪的景象就会映入乘车者的眼帘。
层层地形中,有骑马场、奶牛场、小餐馆。
山顶上有一个玻璃般明亮的圆形建筑物,它是刚着陆的太空船吗?
险峻的盘山道边立着橙色路标“小心机器车辆”。
难道是1951年的电影“地球平静的日子”中,有恶意的外星机器人把守着的坡道入口吗?
这样猜并不全错。
这个建筑物是通用电话电气公司从斯坦福大学租借来的,用作中央研究实验室。
20世纪60年代中期计划发生了变化,这个建筑物不得不在未建筑好的情况下被搁置。
由于找不到其他买主,建筑物就归斯坦福大学所有,作为临时仓库并供校内的课题组使用。
约翰.麦卡锡的“人工智能项目”、之后又改名为斯坦福大学人工智能实验室(SAIL)的组织从1968年到1979年一直设在那里,算是在那里时间最长的团体了,直到斯坦福大学管理处发现运作和维护这个庞大机构的费用很高时才有所变化。
路标警告人们,小心细长的由电视发射装置控制的电气车辆,它有纸牌桌那么大,称为斯坦福卡特车。
有时,它会在建筑物旁的车道上或停车场内用它那四个小轮胎以人行走的速度行驶。
这个卡特车由房里的人通过观察机器人发射的电视信号来进行遥控。
在人工智能实验室里,一屋子的计算机处理接收到的电视图像,进而控制卡特车。
斯坦福卡特车的确是个自主的移动机器人。
1971年,在博士生罗德.施米特(RodSchmidt)的工作中,在一种严格的机器人测试下,卡特车能缓慢地沿着白线行进。
我的工作重点是,在1975年使它能看着地平线上的树木而沿直线前进,在1979年它能窥视到、并能设法绕过障碍物。
遗憾的是,穿过三十米长的屋子竟花了五个小时,令人难以理解,并且在四次实验中就有一次会失败。
图2.1斯坦福大学人工智能实验室的卡特车
20世纪70年代,在机器和道路都处于尝试阶段的情况下,斯坦福卡特车以合成图像再定位的方式,在实验室外面的道路行驶。
传统机器人的典型特征是行动笨拙,这足以使机器人的狂热者感到很懊恼。
1969年,约翰.麦卡锡在一篇文章“计算机控制的汽车”中提到,以斯坦福卡特车为基础,可研制出一种计算机驱动的有视觉的机器人,它能在正常交通状况下行驶。
保守的观点认为,自动车辆将会在埋有信号发射线的特殊路面上行驶。
三十年过去了,计算机技术虽已飞速发展,但仍未出现自动驾驶车辆。
为什么这些聪明人的直觉与实际相差如此悬殊?
当从特定的优势的角度来看某一领域时,对完成这一领域的任务在智力、感觉、动力上需克服的困难常会出现估计上的错误。
经过上亿年进化而成的人脑恰是人类最有优势之处。
人类的动物祖先之所以被进化所选择,是因为获得了生命的必需品、繁殖以及打败了对手。
比较而言,文字、数学、逻辑推理等就是近期文明的产物。
我们发现感觉是很自然和轻松的,而“大脑工作”是困难和乏味的。
稍稍一瞥就能看到棋盘上棋子位置,但下出一步好棋则需费力思考。
人们为建造可感觉、能行动、会思考的机器而花费的数十年努力,使人们有了一个完全不同的认识。
机器的感觉和行动,正如思考一样,由许多简单的步骤组成。
很明显,在照相机中进行可靠的棋子定位所需的步骤,千倍于下出好棋的步骤。
从第二次世界大战所使用的技术中,得到了机器像动物或人一样行动的可能性。
一方面,武器的伺服机构要求电子驱动装置能跟踪精确动作,并对轻微变化进行响应。
另一方面,数字计算机可以破译代码、计算火力布置、模拟原子弹爆炸。
以超人的精确度和无比的速度执行着巨大的数学和逻辑程序。
控制论的产物
数学家诺伯特.维纳(NorbertWiener)对投弹瞄准器的复杂性预测和防空火炮指挥系统的理论发展起到重要作用,他与来自美、英等国的一些心理学家、生物学家、工程师以及其他领域的科学家一同开辟一个新领域。
维纳称之为控制论,即关于生命体和机器中控制和通讯的科学5。
以此为基础,科研人员将许多电子器件组成人工神经系统,以学习、识别简单模式,并研制龟形的、可躲避障碍、能寻找光线的机器人。
图2.21950年,沃尔特博士在对一个感应光线的小乌龟动手术
从图中可看到,在小乌龟“埃尔西”机械顶上装有碰撞检测开关,还有一个保护外壳。
图2.31964年,两个最早型号的“霍普金斯野兽”在插座上充电
这种机器人通过声纳引导,能沿墙寻找插头。
大的机器人增加了一层含有光电管电路的装置,能从远处找到光学上和墙有反差的插头。
从1948年到1951年,英国心理学家沃尔特(W.GreyWalter)在英国造了六个电子乌龟,它们都带有超微型电子管大脑、旋转光电眼睛、接触开关式触角6。
它们能在行走时避开障碍,在有特定光线召唤时能返回出发地。
当几只小乌龟在一块时,它们会对彼此间的控制光线和触觉信号有所反应,表现出意想不到的社会行为,例如跳舞。
20世纪60年代,比电子管尺寸小、价格便宜、功耗少的晶体管出现后,约翰.霍普金斯大学应用物理实验室研制了更复杂的机器人。
“霍普金斯野兽”在实验室大厅里漫步,侧面的声纳引导装置能使它一直处在中线上。
电池不足时,特制的光电管眼睛会在洁白的墙上寻找小黑块,这是电源插座的明显特征,找到后就插入充电。
“野兽”激发了一些模仿者。
有些机器人用电视摄像机代替光电管,用集成晶体管逻辑门实施控制,每台计算机的集成电路中包含数以百万计的这种逻辑门。
有些机器人则对基本动作技能加以完善,增加了新的动作,如抖动脱开充电臂。
控制论的早期研究成果曾给这个领域带来近二十年的繁荣,但在20世纪60年代晚期走向低谷。
因为遇到了更具挑战性的问题,而传统研究方法却无能为力,如研制实际的阅读机。
人工智能体
电子计算机给机器思考带来了完全不同的方法。
1936年,艾伦.图灵(AlanTuring)提出通用计算机的数学原型,它可通过编程模仿任何信息处理器,图灵用它来表述当时未解决的问题。
在第二次世界大战中,他的想法付诸于巨型电子计算机,成为英国的最高机密。
这些机器破译了德军潜艇密码,使盟军战船得以躲开德军火力密集点,从而赢得了战争。
二战后,图灵考虑研制具有人脑各项功能的通用计算机。
尽管他在战时的成果一直被保密到1974年,但他在智能机器方面的思考,通过1950年BBC广播电台的系列讨论和一些文章公诸于世。
图灵于1953年去世,但在此问题上的争论一直都在进行着。
在美国,冯.诺伊曼(JohnvonNeumann)将数学和计算机用于原子弹设计,也进行着人工模仿生命和思维方面的思考。
他的研究在1956年去世之后中断了。
但是悬而未决的问题仍然有待解决,随着更聪明的计算机程序的出现,电子“大脑”的巨大能力可不可以完成超过死记硬背的任务呢?
第一代计算机似乎是机器思考领域的车头。
它们确实大如火车头,在当时它的工作能力是惊人的,可解决许多一直劳累着数学家的计算问题。
1955年左右,一批充满激情的年轻学者,开始从事研究扩展计算机技能这一挑战性课题。
1956年,在达特茅斯大学召开的有关这一研究领域的第一次会议上,约翰.麦卡锡称之为人工智能。
会议上,艾伦.纽厄尔(AllenNewell)、赫伯特.西蒙(HerbertSimon)和乔治.肖(GeorgeShaw)展示了他们研制的“逻辑推理者”,也就是这一领域中第一个运转程序。
以罗素和怀特海德著名的《数学原理》一书中的数论公理为基础,“逻辑推理者”能够应用演绎推理的规则证明许多定理。
令人困惑的是,尽管以“逻辑推理者”为核心的计算机JOHNNIAC每秒可以超人般地进行上万次运算,而一个大学新生在定理证明方面却比它做的又快又好。
程序需将符号译成数字,对一个逻辑语句进行一个规则的推理需要几百次的计算,定理证明则需对很多很长的推理链进行探测,直到找到一种证法。
在此之后的十年中,计算机程序能证明几何定理、解决微积分问题、下跳棋和国际象棋。
虽然在数学和编程方面采取了许多高效措施,但这些程序在实际应用中也仅仅具有新手的实力。
很明显,每个程序都不会超过编写它的专家。
因此,似乎没有办法赋予程序以生活中的“判断力”。
易之难
20世纪60年代末到70年代初,计算机大脑推理和智能图像处理间的差距越来越悬殊。
麻省理工学院的马文.明斯基(MarvinMinsky)科研小组和斯坦福大学的约翰.麦卡锡小组将电视摄像机、机械臂与计算机相连,于是“思维”程序就可以直接从真实环境中获取信息,早期的结果难以令人满意。
当推理程序能像大学一年级学生一样完成推理任务时,程序不但很难编写,而且在运行中得花费几个小时才能找到并拿起桌面上的块状物,就这还经常失败,表现得比六个月的婴儿还差。
现在,环境交互程序与推理计算程序间的差距仍然存在。
在二战后的五十年中,计算机处理能力增长了百万倍,受此激励,上述各项技术在几十年间都有极大的提高,但机器人只有婴儿或小动物的行为能力,这确实让人感到惭愧。
20世纪80年代以来,计算机在国际象棋上已达到国际特级大师的水平。
1997年5月,IBM的“深蓝”击败了国际特级大师卡斯帕罗夫,而卡斯帕罗夫或许是人类目前最优秀的棋手。
遗憾的是,“深蓝”需要人来帮助看和移动棋子。
还没有一个机器人能完成卡斯帕罗夫所做的工作,机器就连一个小孩的行为都实现不了。
对于机器而言,计算要比推理容易得多,推理又要比感知和行动容易得多。
为什么难易顺序正好与人相反呢?
在十亿年的进化过程中,人类祖先的第一个进化选择都为了能在逆境的竞争中赢得生命要素,常常用一生的时间在竞争中更有效地感知和行动。
达尔文的进化过程使人类的大脑具有获取和行动的特殊本领───这点因为太平常而常被忽略。
另一方面,像下棋这样的深度理性思考能力,是近期才获得的,或许不到十万年。
参与这项思维活动的大脑组织得并不很好,绝对地讲,人类并不非常擅于此道。
但直到计算机出现以后,人类的这一局限才显露出来。
算术运算能力也非人类的长项,它是在近百万年来随着人口的增长和财产的积累中,才逐渐成为一项必需技能的。
在进行算术运算之前,我们很幸运地具备了感觉和处理能力、语言技能,并找到了数字的合适表述。
本章后面的计算表明,只有机器的计算能力百万倍于20世纪90年代中期的家用计算机时,它才具有人脑的感知和运动控制功能,这些深层次功能是人类大脑独特之处。
算术能力是人类行为的某一极端表现。
出于好奇,人们偶然要进行庞大的脑力运算技能表演,一些“闪电人脑”在12位数一出现即可完成相加运算,在1分钟内可完成相乘运算。
而家用计算机要比此强上几百万倍。
在追求另外一些极端的行为中,现有计算机可大致与人类匹敌,如下棋的深度思考、定理证明、从众多症状中诊断病因等等。
当推理问题超出狭窄的逻辑范围,需要一些形象化或更广泛的常识来辅助判断时,计算机就比不上人类了。
时至今日,人工智能程序还没能展示出人类常识。
例如,一个医疗诊断程序遇到坏自行车时,或许会开出抗生素的处方。
这并不奇怪,因为它缺乏人、疾病、自行车的概念。
用这样的程序处理日常生活中的细节问题的话,它们当然会不知所措,因为每个要素和其他要素都会以庞大的“组合爆炸”式相互作用。
[1985年,德克萨斯奥斯丁的微电子和计算机协会开始执行一项称为“Cyc”(取自Encyclopedia)项目,目的是建立一个常识数据库。
研制者们估计数据库最终要包含上亿条有关日常事物的逻辑语句。
由于图像检索等应用程序需建立更大的数据库,而这个基本要求并不过分,所以这项计划目前仍在进行之中。
]
尽管机器有许多不足之处有待弥补,但在20世纪的大部分时间里,每二十年机器计算力就会有上千倍的提高。
在计算机领域中,这个发展势头至少可以维持几十年。
用不了五十年,便宜的计算机在原始信息的加工处理能力上将与人脑相匹敌,甚至胜出。
但通过编程使这些强大的机器像人一样感觉、思考的前景又如何呢?
与昆虫比赛
控制论试图通过模仿神经系统的物理构造来实现其功能。
20世纪60年代构造最简单的人工神经系统时,面临的困难使此方向的研究停滞不前。
然而20世纪80年代,在神经网络的影响下,该方向又重获生机,此时计算机已具有对神经网络进行有意义模拟的能力。
通过重复学习步骤来改变相互连接权值,神经网络可根据给定的输入产生理想的输出。
在某些模式识别问题中,输入和输出的关系不清楚,但不太复杂,神经网络有时能轻松地提供比其他程序技术更好的结果。
但最多只有涉及几千个神经元,数量上比一只昆虫的还少,因而目前的模拟还不能完成复杂行为。
直接复制神经系统以获得智能行为的方法还受其他问题的限制。
因为考察大脑的运作细节是个既慢又烦琐的过程,所以真实神经系统高一层次的功能和结构仍然是未知的。
高速浏览真实神经系统的微小细节的新工具,也许在将来会有所作为。
人工智能已经成功地实现了理性思维表层的意识行为,这也使表层下面众多未被探测的无意识的过程显露出来。
建造真正的智能机器就意味着要探索这些领域,从理性顶层探索到适应性底层。
随着功能不断增强的计算机被用于空前复杂的适应性系统,或被用于空前全面的推理程序,这个探索历程或许会开始于两端中的任一端。
我认为机器人领域中的实用技术能够首先做到这一点,它能超常地将计算机科学中的推理程序、适应程序以及强有力的数学工具结合起来,建造在物质世界中可看到和可行动的系统。
我觉得机器人的发展大体上重复了生物的进化,所涌现出的一代代机器人的性能类似于不断增加的动物神经系统的复杂性。
机器人研制的过程是,首先观察人和动物的神经元、组织结构、行为特性,接着进行机器人设计,最后再由市场的成功与否检验。
在此过程中,可采用无限制的任何有效方法来解决出现的问题。
目前,控制最好的商业机器人的计算机能够产生昆虫级的行为。
它们的耗资不少,社会用途却很少,仅在工厂作为喷涂车、点焊车、安装电子器件和将东西移来移去。
现在世界上这种机器人的数量也仅在十万个左右。
在太空应用领域中,例如星球、宇宙探测等,性能更为完善的机器会有更大的潜在市场。
几十年来,这一诱人的前景一直促使政府和工业资助保持在适度的水准上,遗憾的是研究进展相当缓慢。
20世纪90年代,在计算机飞速发展的激励下,这个领域开始发展。
研究中的机器能在室内和室外的正常环境中顺利行走,商业程序能阅读课文并翻译语言。
在未来十年中,机器全面智能化的进程将大大加速,我相信机器人数量会大增,应用范围会慢慢拓宽以满足普遍要求,最终成为通用机器人。
最初,这些物质世界中的机器就像数据海洋中的个人电脑一样,只能死板地服从预先安排的命令序列。
渐渐地,它们的技巧和能力增长,最终在每件事上都超过人类。
通用机器人的内容在下一章中介绍,这章论述的是它们出现的前期积累过程。
20世纪60年代中期到80年代中期,大部分工业机器人是汽车装配线上的机械臂,并且大部分的机器人研究者也只关心机械臂。
绝大多数机械臂是固定的,所处的环境也很简单。
因此在工业或研究背景下,机械臂能很好地与专用夹子、检测器和其它装置机构配合。
它们具有非常有效的专用功能,但背离了通用机器人的许多要求。
固定机械臂与移动机器人似乎处在不同的进化途径上。
移动机器人面临的是多样的、充满怪异的世界,所以它的感觉和行为必须具有灵活性。
移动机器人是这一新生的计算机控制机器人领域中的最年轻一代,并在1985年后成为此领域中的主角。
1985年前为数不多的工作重点之一是阿波罗登月计划。
大约从1965年开始,NASA的喷气推进实验室致力于半自主行星行走者的研制。
几十年来,他们的努力随着每次实际发射而潮起潮落。
这最终在火星探测器索杰纳(Sojourner)和其上更小的探测器上取得了成功,1997年,正是索杰纳成功地探测了火星的一部分。
另一个是1966年到1972年间一直运作的斯坦福研究院的机器人谢基(Shakey)7,它是第一个计算机控制的移动机器人。
1968年到1980年,斯坦福大学卡特车计划是另一个典型代表,此项计划的成果是两篇博士论文,其中一篇是我的论文。
我现在还记得卡特车计划的详细内容。
20世纪70年代末,价格相对便宜、体积相对小的计算机问世后,世界上出现了更小型的移动机器人。
绘图方法
约翰.麦卡锡的“计算机控制车辆”一文中所述的情形能实现吗?
1969年,斯坦福研究院研制的当时唯一的计算机控制的自主有轮小车,实际是高1.5米、移动缓慢的室内机器人。
谢基是人工智能第一次研究高潮的产物,它的推理程序运用定理证明的方法,以判断屋子、墙壁、门窗、道路等障碍物或可移开的物体。
将摄像机和范围测定装置的数据转化成推理程序可识别场景描述的程序,以及使机器人执行运算结果的程序,都被认为是外围程序,它们由辅助工程师完成。
20世纪70年代早期,计算机视觉研究开始还不到十年,几乎所有视觉研究都是在“块组合”基础上进行的,最初的计算机视觉成果是麻省理工学院研制的,它能在桌面上寻找小孩的积木。
斯坦福研究院建立了一个与上匹配的系统,实验场所是四周白墙的屋子,屋里放有一些颜色一致的障碍物和锲型物。
谢基是在1970年《生命》杂志上有点误导文章的焦点,它的最大成就是把一个锲型物移到阻塞物边,先举起,紧接着放下,最后脱开,整个过程被逐一地记录在胶片上。
这是个多任务过程,对每个易出错的过程都需要花几个小时进行处理。
麦卡锡的挑战性在于对未涉足领域的介入。
斯坦福人工智能实验室和数字设备公司在1969年研制的PDP-10能以1/2MIPS(MIPS,Million-Instruction-Per-Second,是指每秒执行一百万条指令,每条指令类似两个八位数字量相加)速度运行。
为满足行驶的需要,机器人必需每秒处理多幅图像。
如何做到这一点呢?
一个很好的数字化路面图像本身就是百万个数字量的排列。
一个程序遍历这些像素(图像的基本元素)要几秒钟,重要的处理就需要几倍长的时间,它怎么能快速响应交通、路标、路障以及其他在图像中一闪而过的细节呢?
也许程序可以选取每个图像中的必要部分。
1971年,罗德.施米特在第一篇以斯坦福卡特车为主题的论文中使用了此方法。
施米特的方案充分利用了存储空间,程序被有效集成为大约二十万字节,程序的编写很费力。
这样,卡特车沿着地上的白线缓慢地移动。
在这个方案的具体实现中,使用了对摄像场景里中线的位置进行预测的预测器,以过去的位置为基础,约搜索下一幅图像的10%后,再确定它的位置。
新得到的位置作为下一步预测和移动方向计算的输入信息。
用PDP-10的一半运算能力,即1/4MIPS,程序就可1秒钟处理一幅图片。
如果场景中的白线无间断,无太大弯曲,并且是干净的,明亮程度一致均匀,卡特车一次能沿线移动15米。
应付简单的意外情况,例如因阴影导致的明亮程度的改变,处理时间就要增加好几倍。
若要对路障、路标以及其他意外做出检测和反应的话,问题将变得更复杂了。
谢基与同时期的其他移动机器人的视觉程序在原理上是一样的,先将图像简化到极少系列的几何边缘,然后再进行处理。
在户外场景中,这种获取简单边缘特性的方法并不适用,而需要更多复杂的图形和颜色类型。
在乔舒亚.莱德伯格(JoshuaLederberg)、约翰.麦卡锡以及斯坦福的一位获诺贝尔奖的遗传学家的热情支持下,斯坦福人工智能实验室开始研究与“块组合”方法不同的方案,研究成果用于寻找火星上的生命迹象。
计算机根据水手4、6、7、9号所拍摄的火星数字图像,先对几何图形和颜色做记录,再分析对同一位置在不同时间所得到的图像,于是就可检测出任何细微的差异。
由于飞船不能确切定位,只能大体定位,所以图像的配准可根据表面特征完成。
研究生林恩.夸姆(LynnQuam)和其他人使用了统计分析、强度对比、查找和转化方法,完成了这项工作。
很遗憾,没发现明确的生命迹象。
由于成功地处理了复杂的自然场景,火星探测方法看来也适合户外自动车辆的图像处理。
NASA的火星行走计划得到促进,于是斯坦福卡特车方案和火星计划的关系就更加密切了。
我怀着对太空和机器人研究的憧憬,于1971年底进入这个课题组,随后我采用了布鲁斯.鲍姆加特(BruceBaumgart)的小车方案,另一位研究生在计算机图形和视觉方面对其加以研究。
起初小车还不怎么出名,但与夸姆讨论后,实施计划被制定出来,这使我能研制出运转车辆和PDP-10驻留的动力控制软件。
夸姆和课题组将图像方法用于视觉导航。
到1973年,我有一个很好的机会建立驱动机器人的新硬件,并能测试其软件。
由于一次遥控失误,我使可怜的卡特车撞到了坡道。
几个月以来的低维护费无法使之修复,图像发送机仍处于瘫痪状态,我只好向麦卡锡请求补充投资几千美元。
他答应了,但条件是我首先得证明编写计算机视觉程序的能力。
实时处理在火星图像的处理中并不是问题。
这一任务耗时数年,直到发射水手9号,每次卫星都得到数十幅图像中寻找精确的密度匹配部分。
斯坦福卡特车方案放弃了精确度和覆盖度,以换取速度。
许多任务似乎只需两个基本的图像操作就能完成,一是挑选出好的特征集(图像中许有特别的区域),另一个是对同一区域从不同视角来寻找。
三角测量、障碍检测、机器人运动演绎可以确定三维位置。
我寻找实现这些想法的快速算法。
采用空间压缩图像技术可完成大量工作,4、16、64以及更多像素的平方被平均为一个数,然后用汇编语言巧妙地编码,而我的算子能在一幅图中挑出许多有用特征,并得到另一幅图。
整个过程计算机大约只用10秒钟。
1975年,我以此为基础编写了跟踪斯坦福人工智能实验室周围路面水平特征的程序,控制卡特车的行驶方向。
程序反复地数字化图像,用15秒决定每幅图像间路面边界(通常是两边的树)、天空间特征的水平位移,算出行驶校正量,这样机器人一次可向前移动多达10米。
对于这种简单的任务,它会出色地完成,观看起来也觉得很有趣,但却对主要的目的用处不大:
即为接受复杂情形的考验,通过视觉跟踪三维环境使小车穿过障碍区。
这需要建立映射图、进行障碍识别以及设计安全路线,最终根据周围环境的情况推断及更正机器人的运动。
我的想法是从开始就全部由三维图像处理方法来解决这些任务,希望机器人最终能在实验室外面崎岖的路面上行走。
图2.41970年───机器人谢基对障碍物进行处理
斯坦福研究院研制的谢基,是由远端大型计算机控制的,通过摄像机轮廓处理和激光范围测定,推理程序会得到有选择的场景数据。
在一个好天里,它能在几小时内执行一些计划,包括从一地移到另一地,以及推开障碍物以达到目标。
斯坦福卡特车携带着一台摄像机,于是很自然地在移动中通过多视点进行三角测距。
由于环境难以预测,所以卡特车的运动必须随着被跟踪物体位置的变化而随时计算出。
火星课题组也面临着同样的问题,研究生唐纳德.杰内里(DonaldGennery)专门为此编写了“摄像机求解程序”。
从1977年初开始,我一直对这个方法进行研究。
程序能在一幅照片上选取100多个特征量,然后驱动机器人向前移动大约一米。
停下来拍另一张照片,再在上面寻找同样的特征量。
最后,摄像机求解程序确定机器人的运动,特征量的三维位置能够解释一幅图到另一幅图的明显位移。
不管更精细的调整,但程序的出错率从来没有低于25%,这意味着机器人对它的位置感到困惑之前,最多移动四米。
摄像机求解程序不断地纠正机器人位置的估计值,使特征量尽可能排列起来,丢弃那些相去甚远的。
这非常适用有很少匹配错误的近似二维的太空飞船图像,并且在具备很好的初始摄像位置估计和图像间侧面位移的情况下。
在场景中,有干扰的图像产生较差的位置估计,再加上一帧到另一帧的视觉失真,我面对的数据是另一码事。
由于视点的不同,或有光线影响,或存在摄像机的干扰,在第一幅图中选定的区域会在第二幅图中消失或改变,所以10%到20%的特征量匹配是错误的。
前移立体照片中摄像机轴附近的点在数学上是不可行的,因此在我的低分辨率图像中,位置精确性是适度的。
在每四次行走中,非常有必要在其中三次追踪大约100个特征量,这样机器得花几分钟去计算。
我在数学和假设方面对程序下了几个月的功夫,但收效甚少。
后来,我选择增加一些机器人硬件来减少不确定性。
多摄像机或者可重新定位的摄像机,能在机器人上实现真正的立体视觉和相关视点精确定位,消除不确定性。
这样的话,两个特征量间的共有三维距离保持不变,可以消除机器人在两次运动停止间的不匹配特征量。
维克.沙因曼(VicScheinman)是一个正在读研究生的工程师,他的研究兴趣是机械臂,但他常为
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 智能机器人 第二章 智能 机器人 第二