机器人的构造.docx
- 文档编号:7143540
- 上传时间:2023-01-21
- 格式:DOCX
- 页数:9
- 大小:56.84KB
机器人的构造.docx
《机器人的构造.docx》由会员分享,可在线阅读,更多相关《机器人的构造.docx(9页珍藏版)》请在冰豆网上搜索。
机器人的构造
1.以人类为榜样
机器人专家可以创造具有可比性的多功能性和技能的机器人。
当自动执行人们执行的任务时,自然会考虑使人能够执行任务的物理和智力机制。
从人类的例子来看,究竟什么是有争议的。
创造人形机器人的一心一意的方法可能不是实现某些类似人类的最佳方式。
例如,洗碗机与它们取代的手动洗碗机几乎没有相似之处。
2.令人高兴的镜子
人类是社会动物,通常喜欢彼此观察和互动。
人们高度重视人类特有的的特征,如人声和表情和身体运动的外观等等。
人类是自恋的,人类的自恋在媒体中得到了反映,在画画,雕塑,机械玩具,照片等创作中都可以看到人的影子。
机器人技术作为一种强大的新媒介,可以创造在现实世界中运作并展现人类形态和行为的类人机器人。
3.理解能力
人形机器人的许多研究人员将类人机器人看作是一种更好地理解人类的工具。
通过人形机器人的构建,来测试人类的理解能力,从而补充了认知科学等学科研究人员的分析。
科学家,发展心理学家和语言学家已经发现了人体与人类认知之间的紧密联系。
通过以类似于人的方式体现并且位于人类环境中,类人机器人可能能够利用类似的人工智能机制(AI)。
研究人员还试图找到一种方法,使机器人能够以类似于人类婴儿的方式自主发展。
4.与人类世界的交流
日常生活中的基础设施都是以人为基础来设计的,人类使用的工具与人类的灵巧相匹配。
比如门的尺寸往往方便一个人穿行,桌子和椅子的高度与人体相匹配。
仿人机器人可以潜在地利用这些特征,从而简化任务并避免改变机器人所需要的环境的需要。
5.与人的交流
人类之间的许多类型的交流依赖于人的表情和行为,而类人机器人可以潜在地简化和增强人机交互。
人们已经具备执行许多特定任务的能力,这个任务的知识及经验可能更容易转移到人形机器人而不是身体截然不同的机器人。
6.娱乐,文化和代理
很多的娱乐形式(戏剧、主题公园等)将会非常的依赖类人机器人。
二.发展概况
三.行走
双足行走是类人机器人的一个重要研究课题,特别是和人有相同身高重量的类人机器人,双足行走时的动态稳定性至关重要。
“零力矩点”是判定仿人机器人动态稳定运动的重要指标,ZMP落在脚掌的范围里面,则机器人可以稳定的行走。
地面对你的所有作用力的总和,与你身体的惯性力、其它外力产生的总和在这一点的力矩为零。
与之共同出现的还有另一个叫“支撑多边形”(SupportPolygon)的概念,当你单腿站立时这个多边形就是你的足底,双腿站立时就是你两只脚底连起来的多边形。
根据Honda官网上的说法,Asimo的控制有三个部分(地面作用力控制、目标ZMP控制和足迹落点控制),围绕ZMP和支撑多边形展开——基本思路就是,你要么通过改变足底向地面施力的点、或改变躯干的运动状态以改变ZMP的位置;要么通过选择好的落脚点得到能包含ZMP的支撑多边形——总之,要保证Asimo的ZMP始终能落在它的支撑多边形里。
这个思路看起来直截了当,然而ZMP这个理论本身却是有缺陷的——当ZMP落在支撑多边形边缘的时候,理论上认为机器人是不稳定的,但它实际上是可以稳定的;另外,如下图所示非水平支撑面的情况,即使ZMP落在机器人的SupportPolygon内,机器人还是会摔倒。
因此,ZMP作为一个表征整个系统稳定性的控制变量是不完善的。
ASIMO经过30年研制和11次换代现在已经能实现不同速度的稳定步行,而且还能实现慢速跑动步态以及转弯、上下楼梯等动作。
但现在所有研制出来的双足步行机器人都是根据ZMP(零力矩点)稳定准则对各个关节进行动作预设来实现的,这类机器人都算是主动步行机器人。
与人类步行相比它们所实现的步态更加不自然和不流畅。
另外,复杂的控制和驱动系统造成了此类机器人的能量效率相当低下,例如:
ASIMO能耗比被动步行机器人高20倍以上。
被动步行的理论是受到哈佛大学学者Mochon和Mcmahon所提出的“弹道步行”模型的启发,由加拿大学者McGeer于20世纪90年代所提出[1]。
被动动态行走是研究双足(两条腿)步行系统的一种方法,这个系统包括人类或其他双足动物。
被动行走可以被视为混合系统产生的一种物理现象,其中包括腿摆动动作的连续动态和离散的腿交换事件。
分析混合系统得到步态生成和稳定性。
被动步行可以展示一个稳定的极限环。
当状态保持稳定极限环,步行系统是稳定的。
BostonDynamics就这样花式虐了全世界做人形机器人研究的各大企业和实验室……却没有任何专利或论文可以让我们对他们的技术和算法一探究竟。
不过,从Atlas行走的姿态来看,大家都推测它用的是CapturePoint。
CapturePoint的意思其实就更简单了:
它是地面上的一个点,当机器人快倒时,踩到这个点就可能调整自身至完全静止。
你可以想象你在玩“一二三木头人”,然后停在了某单腿站立的奇怪姿势,在你终于站不住的时候你会怎么做呢?
你的另一只脚可能会最终着地、可能着地之后你还是站不稳需要多倒腾几步。
因此在CapturePoint这个概念上又延伸出一个叫“N-stepCaptureRegion”的概念,说的是踩到某个区域内,你还要再走(踉跄)N步才能完全停下来。
图a)是静止时候的CaptureRegion示意图图;b)是跑步时候的示意图图;c)是当跑步时前方只有几块石头能落脚的示意图。
CaptureRegion的大小、形状、位置是与你的状态有关的:
本来你单腿站着的时候是站在N=0的区域内,但如果有人突然推你一下,你瞬间有了要倒下的速度,那可能你脚下的CaptureRegion可能就变成N=1甚至大于1了。
提出这个概念有什么用呢?
记得前面说,ZMP作为表征系统稳定程度的量是不完善的,而N-StepCapturable(就是在N步以内机器人能停下来)就正好可以代替它成为一个可靠的表示系统稳定程度的量。
在这个基础上,机器人行走过程中,我们可以选择保证它的步伐总是踩在N小于2的区域(比较小心翼翼的走法)、也可以踩在N=3、N=4的区域(比较勇敢的走法);一旦发现系统状态变化导致机器人踩在N大于设定值的区域里(比如Atlas在雪地里一个趔趄),就赶紧多走两步稳定下来。
当然,这个N-stepCaptureRegion是需要实时计算的。
原因是,它们的腿都是六个自由度,膝盖伸直的时候,“机械腿”处在我们说的“奇异”状态(Singularity)。
奇异状态时机械腿比正常状态下失去一个自由度,这对机器人而言意味着遇到干扰时可调整的选择受限了,更难适应多变未知的环境。
另外,弯曲的膝盖也能化解一些脚落地时的冲击。
通俗一点说,人在遇到复杂地形、比如河边的乱石堆、或走过摇晃的绳索桥时,也一样会倾向于屈膝行走防止摔倒;腿脚弱的老年人,也经常会弯曲膝盖走得很慢。
上面讲了ZMP和CapturePoint两种判定机器人系统稳定状态的方法和基于其理论设计采用的控制方法。
它们虽然是人形机器人双足行走控制的重要理论基础,但在实际应用中也只是一个小环节。
除了计算ZMP运动轨迹或身体质心的运动轨迹、计算CaptureRegion、计划机器人每一步的落点,机器人还需要在更底层的控制(控制每个关节的力矩或速度/位置)中实现这个轨迹、需要从机器人身上无数的传感器(陀螺仪、加速度计、每个关节的运动传感器、手脚的力传感器……)实时估测自身的运动信息、需要在更底层控制好每个关节的执行器。
抛开身体构造本身的复杂性不说,腿和手臂本来就是完全不同的工作方式:
腿是通过它的“末端执行器”(endeffector,也就是脚)与地面接触的作用力(包括支撑力和摩擦力)“推动”自身移动同时保持平衡;手臂则是自身固定,控制endeffector即手移动去操作外界物体。
腿的这种工作方式,决定了它一不需要极其精确的位置控制;二需要能准确控制脚对地面的作用力(也就是地面对脚的作用力);三需要能够应对每次脚落地的冲击。
出于这种需求,很多足式机器人会使用一种特殊的执行器,叫SeriesElasticActuator(SEA,串联弹性执行器),这是一个在电机和齿轮箱后面串联一个弹簧的设计:
这样的设计还是挺精妙的:
这一个大弹簧就像一个减震器,正好能从机械上减少地面作用力对齿轮箱的冲击;然后呢,在弹簧那里装一个位置传感器测量弹簧长度的变化,就可以测量电机输出的力,可以对一个关节直接进行准确的力矩控制;最后,这个弹簧还能储存一部分能量,大大提高足式机器人的能量利用效率。
在实际使用中,SEA通常需要一个又大又重的弹簧。
原因如下:
机器人的腿至少要能够承载全身重量,而机器人都是很重的;同时我们也要求弹簧形变不能太大,否则控制会变得非常困难——又要能测量到那么大的力,又要形变小,那弹簧就只有非常硬(Stiffness足够大),硬的弹簧就必然非常大了。
所以,实际使用SEA的腿都是这样的:
BostonDynamics用的执行器根本不是电机,而是液压系统。
虽然整个系统以及控制都非常复杂,液压系统相比电机系统有两个重要优势:
能量密度大、能量利用效率高。
能量密度大是说同等系统体积下,液压系统比电机系统能输出更大的力;能量利用效率高则是说液压系统的能量损耗比电机系统更小。
这些优势对于一个负载很重又不能拖着一根电源线的野外机器人来说无疑非常重要。
在新版Atlas上,他们的机械工程师也把液压的优势发挥地淋漓尽致——他们把液压管道都用金属3D打印打进了腿部结构里,就像人类的骨骼和血管一样,进一步缩小了整个系统的体积、减轻系统重量。
跌倒
尽量避免跌倒。
华南理工大学根据仿人机器人当前的步行状态、姿态信息和ZMP位置信息可以对机器人的稳定可控性进行判定,并根据跌倒是否可控进行机器人倒地控制或机器人稳定控制。
定位与避障
人工地标可以简化定位。
丰田的Asimo使用了一个安装在下身的摄像头,它能够俯视地面找到人工地标来进行位置纠正。
行走时使用立体视觉的方法进行避障,同时需要进行复杂的判断和控制,需要进行大量的计算。
二.操作
类人机器人的操作重点是使用拟人化的胳膊、手和传感器,去执行人类常做的动作。
类人机器人的手臂有7个自由度,其中肩部有三个,肘部有一个,腕部有三个。
为了降低机械的复杂程度,机器人手臂的自由度有时会少于7个,比如Asimo的手臂有5个自由度。
操作的传感
一个机器人在拥有了躯壳和稳定的运动控制以后,它需要感知周围的环境和物体:
知道在走过一堆乱石时应该把哪里作为落脚点、知道完成倒饮料任务时应该在哪里抓起哪里落下——如果没有传感器,机器人就只能做些预先编好的动作,顺带把你的生活搞得一团糟。
Asimo采用和人类类似的双目立体视觉,运行自家秘密的视觉算法,在相对简单的室内环境、物体模型已知的情况下,能够识别三维物体的形状位置、做出相应的操作。
对在室外或更复杂环境运动的机器人而言,提前获取精确的三维地形信息对实现稳定的双足行走控制意义重大,机器人需要在这些信息已知的基础上计算CaptureRegion、计划它的足迹落点等等;错误的地面高度信息很可能就会导致机器人一步踩下去施力不太对而直接倒下。
因此,目前最先进的双目立体视觉技术也无法提供机器人需要的精度足够高的三维环境信息,它们还需要额外的立体传感设备辅助。
在Atlas和其他参加DARPA大赛的机器人头上,你都能看到一个不停旋转的东西:
这个东西叫LIDAR(激光雷达传感器),就是以激光作为探测手段的雷达。
LIDAR通过向环境各个方向发射并接收反射回来的激光,分析获取场景的三维地形。
人形机器人头上所用的LIDAR通常可以探测到几十米远,同时达到近处毫米远处厘米级别的精度。
基于模型的视觉和基于特征的视觉
基于边缘的三维视觉系统(VVV系统)
除了视觉以外,我们人类还有很多很多的传感器在明里暗里帮助我们走路不要摔倒。
这些传感器有的能在人形机器人上找到类似的对应、有的却还根本无法实现。
仅就平稳走路这个任务而言:
人有内耳平衡及测速装置,机器人有IMU(惯性测量单元)(另外,人的视觉也在帮助维持平衡)
人有关节感受器,能知道关节位置速度扭矩等,机器人有关节位置/速度传感器,某些机器人有关节力矩传感器(比如前面说的SEA)
人有遍布全身的皮肤压力传感器(tactilesensor),能够知道外界对自己的作用力大小方向作用点;机器人没有,或只有特定位置(手腕、脚踝)有六轴力传感器。
深度学习
人类有自主学习的能力,所以我们希望类人机器人也具备这一功能,也就是说机器人要有更高的智能化。
这不禁让我们想到人工智能的话题,图像识别、语言识别等与机器人相结合。
我们简单的看一下深度学习打造的聊天机器人。
目前市场上有各种类型的机器人,比如有京东JIMI这种客服机器人,儿童教育机器人,小冰这种娱乐聊天机器人,Aexa这种家居控制机器人、车载控制机器人、Viv这种全方位服务类型机器人等等。
目标驱动的聊天机器人指的是聊天机器人有明确的服务目标或者服务对象,比如客服机器人,儿童教育机器人,这种目标驱动的聊天机器人也可以被称作特定领域的聊天机器人。
无目标驱动聊天机器人指的是聊天机器人并非为了特定领域服务目的而开发的,比如纯粹聊天或者出于娱乐聊天目的以及计算机游戏中的虚拟人物的聊天机器人都属于此类。
基于深度学习的聊天机器人的绝大多数技术都是在Encoder-Decoder(或者称作是SequencetoSequence)深度学习技术框架下进行改进的。
可以把它看作适合处理由一个句子(或篇章)生成另外一个句子(或篇章)的通用处理模型。
对于句子对
X和Y可以是同一种语言,也可以是两种不同的语言。
Encoder顾名思义就是对输入句子X进行编码,将输入句子通过非线性变换转化为中间语义表示C:
对于解码器Decoder来说,其任务是根据句子X的中间语义表示C和之前已经生成的历史信息来生成i时刻要生成的单词yi:
对应的
其含义是当用户输入Message后,经过Encoder-Decoder框架计算,首先由Encoder对Message进行语义编码,形成中间语义表示C,Decoder根据中间语义表示C生成了聊天机器人的应答Response。
这样,用户反复输入不同的Message,聊天机器人每次都形成新的应答Response,形成了一个实际的对话系统。
在实际实现聊天系统的时候,一般Encoder和Decoder都采用RNN模型,RNN模型对于文本这种线性序列来说是最常用的深度学习模型。
考虑到RNN对长度敏感的问题,提出了针对聊天机器人场景优化的Encoder-Decoder模型,核心思想是将Encoder用多层前向神经网络来代替RNN模型,神经网络的输出代表上下文信息Context和当前输入Message的中间语义表示,而Decoder依据这个中间表示来生成对话Response。
三.运动和交流
目前有四种流行的生成方式粗体全身运动:
1.使用动作捕捉系统
2.离线使用图形用户界面(GUI)
3.实时使用遥操作界面
4.使用自动运动规划
1.在生成类人机器人的运动时经常使用人体运动捕捉系统,例如电影制片厂用于特殊效果的系统,通常用于记录人体运动。
通常,人类受试者在他或她的身体上佩戴容易检测到的标记时执行动作。
这些标记的运动由放置在房间中的摄像机记录,然后软件随时间推断这些标记的3-D位置。
快速路径规划技术,如快速探索随机树(RRT)可以自动计算人类机器人的无碰撞机体。
给定人体和环境的几何模型,初始姿势和目标姿势,规划系统自动搜索从初始位置到人体位置的无人体的全身运动。
动力学滤波器
amane和Nakamura提出的动力学滤波器可以将一个可行的动态转换成一个给定人形的可行的动态滤波器。
这包括一个控制器和优化器,如图所示。
控制器通过使用关于给定粗略运动的局部和全局反馈回路以及人形模型的当前状态来计算参考关节加速度。
图56.31显示了人类行走的运动捕获数据以及由动态滤波器产生的物理上可行的运动。
自动平衡器通过求解二次规划优化问题来计算每个样本的所有关节角度,以便将给定运动转换为平衡运动[56.81]。
这种方法不适用于动态平衡占主导地位的动作,例如行走动作。
但是,这种方法对于静态平衡占主导地位的动作是有效的,例如当人形生物站立时,机器人以最小化动力学的作用缓慢移动的同时仍然保持稳定性。
自动平衡器基于以下方法计算全身运动:
1.将重心(CoG)固定在垂直轴上,该轴垂直指向支撑人形的多边形;
2.保持对可接受值的影响,以满足平衡条件。
从操作点运动生成全身运动
前面描述的示例GUI和遥操作界面使人能够控制机器人上特定点的运动。
控制器的协调使用三个不同的控制类别:
约束处理,操作任务和位姿。
控制层次结构处理这三类控制器之间的冲突场景。
约束基元(例如关节限制)具有最高优先级,而姿势基元具有最低优先级。
位姿基圆的一个优点是它们可以以连续的方式控制冗余自由度。
为了实现这种控制层次结构,将操作任务投射到约束零空间中,并将位姿投影到约束零空间前的任务零空间。
在模拟中测试的爬梯行为证明了这种控制框架。
在该示例中,预先指定了质心,手和脚的期望轨迹。
在进行模拟运算时,全身控制系统生成了一个关于这些粗糙运动规范的指令,这样就产生了爬梯子的动作。
通过仿真,仿真机器人成功地抵抗了意外的干扰。
一些类人生物的眼球运动根据人眼运动建模。
这些生物启发的主动视觉方法通常有四种类型的视觉行为:
扫视
平滑追随
前庭视觉反射
聚散
图示一个仿生控制模型,集成了扫视、平滑追随、VOR和OKR
通过波束成形可以实现声源分离。
为了有效地执行波束形成,声源定位是必不可少的。
可以利用视觉来在视野内找到说话者。
在HRP-2的头部使用了一个摄像头和一个八通道麦克风阵列,并通过使用声源分离的方法在多个声源的存在下成功进行语音识别。
总结:
我简单讲了人形机器人在双足行走控制、机械设计、感知环境上的困难和解决方法,然而这些远远不足以完整讲述实现一个真的能够为人类服务的人形机器人所要面对的挑战。
我们没有能够讲到跑步和跳跃,也没有细说如何在保持平衡的同时机械臂实现一些操作(比如推门和搬箱子),更没有提到机器人真正实用所需要的“智慧”。
人形机器人目前还纠结在如何实现那些人靠潜意识就能做好的事情;而真正能够把顶层的人工智能加入,恐怕还要机器人学家们继续奋斗。
另外,虽然我们看到深度学习的发展让机器视觉在识别物体、理解场景上有了长足的进步,要让AI真正对机器人有帮助,做人工智能的研究人员也还有很长的路要走。
1.背景
柔软的可穿戴式机器人重量轻,符合人体工程学且功率要求低,适用于各种应用,从工业场景中的增强人体强度到运动损伤患者的医疗援助。
了解这些装置如何影响人体的生理学和运动学指标,是量化它们的优缺点,评估它们对不同应用的适用性以及指导后续设计改进的基础。
可穿戴式机器人技术在运动过程中成功地增强了人体力量,降低了人类行走的代谢成本,恢复了对患有瘫痪患者的动态能力,帮助改善了中风患者,从人类运动中获取能量,并在人体运动控制下进行基础研究。
这些感受器具有机械连接金属,能够准确地传递高强度的力量。
虽然这是一个优势,但它的代价是:
1)显着的惯性,影响人体运动的运动学和装置的动力要求;2)需要与生物接触对象进行对接,从而增加机械复杂性和尺寸;3)不美观,不方便。
最近推出的柔软材料可以将力和扭矩传递给人体,它允许设计可穿戴的机器人装置:
轻巧,美观且兼容的机器,一定程度上牺牲了之前准确性和可靠性。
exosuit是由织物或弹性体制成的衣服般的装置,包裹在人的肢体周围并与人体的肌肉平行工作。
exosuits的特点是它们依靠人体的结构完整性来传递身体部分之间的反作用力,而不是用刚性的机械框架,因此更像外部肌肉的外部骨骼。
内在的顺应性去除了与接头和手臂轮廓的对齐,所以能够将它们穿在日常服装下面。
Exosuits主要通过电缆,电动机,嵌入到外骨骼来传动实现人体某些功能。
2.方法
exosuit是一种由柔软材料制成的装置,包围人体,并将力传递给佩戴者的骨骼结构。
在电缆驱动的外套中,人造肌腱沿着目标关节布线并且连接到其两侧的锚点。
一对鲍登线缆将动力从致动单元传递到锚定点。
Bowden电缆护套(5mm)连接到手臂带,而其内部肌腱(最大负载136kg)连接到前臂带。
当任何一个
肌腱缩短,将两个锚点拉紧,在肘部施加弯曲或伸展力矩。
肩部通过不可伸展的织带连接到手臂带,覆盖肩部并环绕胸部;其目的是通过依靠来自肩部和胸腔的反作用力来防止臂带向关节中心移动。
固定在远端锚点上的称重传感器(Futek,LCM300)测量弯曲肌腱的张力,绝对编码器(AMS,AS5047P,1000脉冲/转),安装在手臂和前臂绑带之间的3D打印接头(Shapeways,多功能塑料),感知肘部的角度位置。
塑料接头,在肘部可以旋转,依靠人体关节的结构完整性来传递身体部分之间的力。
致动器设计
它包括与行星齿轮箱串联的电动机,能够在肘关节处提供高达8.5Nm的连续扭矩(足以满足日常生活活动),其角位置由增量编码器监控。
齿轮箱的输出轴驱动一个滑轮,两个肌腱围绕着滑轮以相反的方向缠绕,不受限制。
在塑料外壳中,有三个球形弹簧,而塑料防止了滑轮从滑动中脱落。
控制
此控制算法有两个目的:
一是允许外衣与其佩戴者一起以最小的交互力一起移动,这要求能够跟踪与作用在前臂上的重力相等且相反的与位置相关的力分布;二是要求此装置具有反向驱动性,这不能通过机械方式实现,因为电机齿轮箱的高减速比会增加反射电机阻抗,而鲍登电缆会使传动效率低下。
采用并置导纳控制的方法实现反向驱动。
图示的控制系统包括一个外扭矩环和一个内部的速度环。
该系统负责跟踪位置相关的扭矩,即平衡重力。
实践中,它计算动作参照和交互作用,从而创建虚拟反向驱动。
实验
实验的目的是评估exosuit对人体运动学和生物力学的影响。
通过比较运动的平滑性和准确性,健康受试者的生物扭矩和肌肉激活模式,在有和没有穿戴exosuit的帮助下进行肘部的受控运动。
参与者佩戴设备,通过屏幕显示特征性运动,并且显示了在一个特定的反馈中提供了一个可以反复提供视觉反馈的位置。
确保在所需的速度下,参与者被要求尽可能准确地匹配特征的屏幕。
结论
针对上肢的柔性和便携式外骨骼的优点,能够直观地提供移动所需的力矩,在工业和临床应用上有广阔的前景。
研究结果表明,该装置与人体并不完全兼容,影响运动的速度和准确性,但与人体肌肉并行工作,显着延缓了疲劳的发生。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 机器人 构造