四旋翼神经元控制外文翻译Word文件下载.docx
- 文档编号:18329802
- 上传时间:2022-12-15
- 格式:DOCX
- 页数:17
- 大小:618.46KB
四旋翼神经元控制外文翻译Word文件下载.docx
《四旋翼神经元控制外文翻译Word文件下载.docx》由会员分享,可在线阅读,更多相关《四旋翼神经元控制外文翻译Word文件下载.docx(17页珍藏版)》请在冰豆网上搜索。
安全,准确地收集有关环境信息的能力对于许多军用或民用需要迅速安全的部署人员的需求是非常重要的。
最近的微型飞行器(MAV)平台的增长证明了他们的战略重要性。
体积小,重量轻,用途广泛的飞行器将主导侦察领域,无论是军事情报,或搜索和救援。
微型飞行器最大的优势和劣势在于它们的大小。
如果体积小,微型飞行器将易于运输,难以探测,制造更便宜。
然而,这也使得它们更加不稳定,难以控制,并且需要有效载荷的传感器和控制器的硬件更加的小型化。
传统的微型飞行器是小型化的飞机,由于其更大的固有稳定性。
然而,由于控制器的硬件和软件变得更强大,旋翼机正逐渐流行。
他们在悬停和垂直进行起飞和降落的能力,使它们非常适用于近距离的信息搜集任务。
一个旋翼飞行器包括如图1中的4个旋翼,代替直升机中的可变桨距主旋翼,飞行器是通过调整各个电机之间的相对速度来进行操纵的。
例如,增加旋翼1的速度,而在同一时间以同样量减小旋翼3的速度会引起飞行器倾倒。
在相反方向上的调节将导致相反的运动。
横滚的调整是使用旋翼4和2进行相同的操作。
最后,旋翼之间的转动方向上的差异可以用来使飞行器绕z轴旋转。
这样的控制,使飞行器内在不稳定,其中任何电机的不平衡都需要控制器不断的输入,以保持飞行器保持在空中。
然而,它显着降低了固定桨距电机和小型电机的机械复杂性。
它也提供了使有较小的叶片带来的更好的安全性,并将其封装在一个机体里。
相关工作:
四旋翼控制器以往的工作范围包括从传统的基于模型的比例积分微分(PID)控制器,到现代和最优的基于模型的技术。
然而,微型飞行器对干扰和未知的动力变化非常敏感,使得精确的模型很困难,这导致了对自适应控制方法的探索。
一个主要基于模型的控制器,增加上神经网络以考虑动态和未知参数的非线性,被证明是成功的。
同样地,使用神经网络来充当一个现代控制策略观察者可能是可取的。
图1:
四旋翼布局:
横滚(围绕x轴旋转)由用相反的数值调整电机2和4来控制。
俯仰(围绕y轴旋转)由旋翼1和3作相似的调整来控制。
偏航(围绕z轴旋转)由旋翼2,4同时调整一个和旋翼1,3大小相同,方向相反的调整量来实现控制。
用人工控制的飞行期间所采集的数据点同时使用神经网络和强化学习来增强一个控制器也被探索过。
然而,由于四旋翼飞行器固有的不稳定性,它们不能在没有一些稳定性辅助的情况下由人工操作飞行。
由于之前的工作使用人类飞行员控制下的数据,它会导致一个人为的约束,就是即使自适应控制器已经训练好了也会使用这些平滑稳定的操作。
然而,这种监督的强化学习控制在无人直升机自主控制的情况下已被证明是非常有效。
无模型自适应控制在许多领域有一个经过验证的成功率,从机械手,单机器人导航,多个自主车辆的协调。
这种控制可以用来设计一个没有建立一个完整模型需求的控制器或飞行员的训练以及稳定例程的关联。
在这项工作中,神经网络被用来在功能上近似的替换掉现实的模型,来为四旋翼飞行提供必要的信息。
神经网络建立一个从输入到输出的非线性映射,通过它我们假设可以充分捕捉旋翼的动态和创建一个强大的控制器。
作为使用监督学习和记录的数据点集合以确定正确的行为的替代,如在几个如前所述的情况下,我们使用神经演化算法来整定一个训练有素的控制器。
神经-进化算法基于一些的成本函数将每个控制器排名。
更高性能的控制器随后以一定的概率发生突变,以搜索一个最佳解决方案。
这项工作采用增广拓扑结构(NEAT)算法的神经演变。
该算法允许在网络中修改包括对权重的改变以及拓扑的改变。
我们的工作使用实时NEAT算法,使之后在硬件中实施的进一步的控制器训练和调整成为可能。
许多神经进化算法的一个缺点是在大型搜索域,它们需要多次反复,才能找到一个甚至是平庸的解决方案。
尽管在陆上机器人身上神经进化工作的非常成功,在该领域一个坏的解决方案意味着机器人不会朝着目标,但对于神经网络的学习仍然可以提供足够的信息。
在无人机领域一个坏的解决方案意味着坠毁,并且不能提供一点有用的信息来学习。
内容:
这个工作的目的是开发能够在三维空间中的运动过程中保持四旋翼稳定性的控制器。
我们假设开发了自适应控制器将在几种类型的条件下保持稳定:
未建模的干扰(代表阵风),传感器和致动器的噪声(如存在于所有物理环境),以及参数化的差别(用参数来显示这种控制器控制下能够稳定的能力的范围)。
本文阐述了神经控制器在MAV旋翼飞行层次的开发和测试。
第2节介绍了用于开发仿真的模型。
第3节讨论了控制器的公式化,以及它们的训练。
第4节总结了我们关键的实验发现与最终控制器。
第5条给出了结论言论和重申这项工作的贡献。
2.建模与仿真
四旋翼飞行器的数学模型是在先前开发的模型的基础上建立的。
我们这里简要总结了其发展过程。
首先,有两个坐标系统要注意的,地球坐标系,和飞行器的坐标系。
这是通过三个连续的旋转相关联的。
横滚(Roll):
绕x轴旋转
俯仰(Pitch):
绕y轴旋转
偏航(Yaw):
绕z轴旋转
主要的空气动力,
,是由机身上的电机提供,正比于电机的转速的平方
其中,U1是所有四个转子的总推力,U2是转子2和4的推力差(即横滚力矩),U3是转子3和1的推力差(即俯仰力矩),U4是对角的电机的推力差(即偏航力矩)。
推力和阻力系数,分别为B和D,都是飞行器依赖的参数,它们也是正比于电机之间的速度差。
为了得出运动方程,我们先从力的平衡方程开始,
其中R是旋转矩阵,Fb的是体积力。
这产生了飞行器在地球坐标系中的x,y和z轴的加速度。
为了找到角加速度,我们还需要一个力矩平衡,
其中I是机体性矩阵,
是转动惯量,α被角加速度,
是角速度,
为机身的扭矩。
这引出了在上述的力和力矩方面的运动方程:
其中,x,y和z表示飞行器在地球参照系中的位置,
是横滚,俯仰角和偏航角,如上所述。
其他变量,不包括
和Ω,是飞行器参数。
这些参数的值,如在此工作中使用的,在表2中。
假设在某个很短的时间步长内有一个恒定的加速度,我们就可以在这个时间步长内确定速度和位置的变化。
时间步长的适当选择为我们提供了所选择的四旋翼飞行器的几个参数的相对准确的模拟。
3、控制器简介
飞四旋翼飞行器,因为其电机速度差异的固有敏感性,即使在模拟中,也是一个难题。
虽然,从理论上讲,需要学习的信息可以在单个目标函数中进行编码,进行搜索的空间是非常大的,而成功飞行的控制器的解空间是非常小的。
由于我们对飞行器四个电机响应速度不同的理解,我们在控制器的开发中使用这方面的知识。
为了代替只用一个控制器来控制所希望的位置的输入和移动到目标位置所需的转子速度的输出,我们开发了有层次结构的控制器。
在最高层级,位置控制器在姿态控制器提供的横滚角,俯仰角,偏航角,以及垂直速度的帮助下移动飞行器。
此姿态控制器被进一步分解成几个简单的控制器,每一个都能调整电机速度以独立地控制四个姿态变量。
图2:
姿态控制器的结构独立地调整电机速度来控制横滚角,俯仰角和偏航角,以及垂直速度。
每个控制器接收来自所需的设定点的积分和微分的差异来做为输入。
3.1姿态控制器
姿态控制器负责飞行器的稳定性和运动。
它调整电机速度使飞行器达到成所需的由横滚角,俯仰角,偏航角,以及垂直速度描述的姿态和轨道。
3.1.1姿态控制器简介
这个控制器接受期望姿态的信息和传感器的信息,其中传感器的信息是以四个姿态变量期望的和实际的差的微分和积分的形式来传输的。
这给控制器提供了有关绝对误差,以及误差如何变化的信息。
依据这些,控制器输出所有四个电机所需的期望转子速度。
由于四旋翼的姿态即使在转速很小的变化时也非常敏感,直接训练姿态控制器被证明是非常具有挑战性的。
作为替换,它被细分为在图2中展示的四个控制器,分别独立地使用相应的三个输入来调整横滚角,俯仰角偏航角和垂直速度。
这四个姿态参数被组合如下:
其中,
是每个转子的速度,
,是横滚角,俯仰角和偏航角的调整量,
是垂直速度的调节量。
将姿态控制器分开可以使四个神经控制器独立的进行训练,这使得它们可以很快的学习并在飞行器上达到期望的效果,当所有四个控制器都进行了培训,它们就将合并起来,如图3所示并像公式6一样呈现。
这导致一个姿态控制器产生一个期望的电机速度需要12个原始的输入。
图3:
对每个神经控制器的输入和输出进行组合,以形成一个单一的,更高水平的姿态控制器,输出的电机速度是由四个子控制器计算得出的。
3.1.2姿态控制器的训练
上述每一个在图2(横滚,俯仰,偏转和垂直速度)显示出的单个控制器是分别训练得。
为了从一个稳定悬停开始,
一开始仅仅被设置为克服重力的水平。
PID控制器是对这三个角度中的任意一个而设计的。
该PID控制器进行了调整,使其有一个没有超调的合理的快的反应时间。
这个PID控制器被用作训练的起始点。
与对一些稳定的目标函数进行训练不同,这些独立角度控制器被训练来匹配期望PID控制器,在神经进化训练过程中合格度定义如下:
其中
神经控制器预计的调整量,
是PID控制器接受输入后计算得调整量。
这个合格度是基于PID控制器和神经控制器的电机速度之差来改变的。
这个合格度是这个差的负指数,所以一个小的差会导致一个很大的接近1的合格度而一个大的差将导致一个接近0的合格度。
在训练过程中,每个姿态控制器都被给予七个涵盖了预期运动范围的数据点:
[
]是给横滚角和俯仰角控制器的,而[-
]是给偏航角控制器的。
神经控制器的插值将允许将允许它达到给定范围内的任何角度并使飞行器保持在那个状态。
这些数据点对所有潜在的控制器合格度评估都是一样的。
这个合格度测量了这个控制器作PID响应时的时间是10s。
在运行时,是神经控制器,而不是PID控制器在指挥飞行器的下一个电机速度。
这使控制器可以去跟踪实现给定点的PID大致曲线。
在10s结束时,这个模拟被重置而给出下一个期望角度。
这总体上有100个潜在的控制器。
每一个都以零隐藏节点开始,否则就连接上范围为-3和3之间的随机权网络。
这种NEAT神经进化算法允许随机加入的隐藏节点(3%)和额外的链路(5%)。
由于电机速度调整需要按期望姿态变量的符号进行正和负的调整,一个双曲正切函数被用作激活函数,将激活节点值定在-1和1之间。
训练在3000次重复后完成。
用合适度评估来学习PID控制器为后续的训练提供了一个稳定的开始。
一个新的种群是从最好的控制器中伴随着权重的高达20%的突变率而诞生的。
这个新的种群是针对基于实际上升时间和超调的目标来进行评估的。
这个种群是为另外1000个幕而训练的,到最后最好的控制器将被用在联合姿态控制器里。
由于前置的工作在用PID控制器调整姿态时有困难,用于垂直速度控制的第四个控制器是基于10秒模拟内的实际垂直速度来进行评估的。
尽管角度可以各自独立的控制,推力的调整则依赖于飞行器的横滚角和俯仰角。
作用在水平的飞行器上的推力的增加只会增加垂直速度,而当飞行器倾斜时,一个同样大小的推力调整将导致一个小一些的垂直速度增加,同时增加在倾斜方向上的速度。
考虑到这个问题,处置素的控制器的评估包括70个不同的配置,每个运行10秒钟。
这允许一个很大的横滚角和偏航角的范围来用在任何评估中。
这将运行1000训练幕。
一旦所有四个控制器被训练好了,它们将被合并成一个如前所述的单一姿态控制器。
根据最终操作的环境,这个姿态控制器将被进一步训练来处理特殊类型的干扰。
在这项工作中,进一步的训练并没有提供给控制器,而测试表明分开的训练足够产生一个能在任何要求的姿态上稳定的四旋翼的控制器。
3.2位置控制器
要真正的移动这个飞行器,必须有一个更高级的控制器来给姿态控制器提供目标姿态。
为了完成这项工作,这个更高级的控制器只考虑移动飞行器去一个行的(x,y,z)坐标。
但是,根据不同的任务,一个对周围环境有更大感知的和拥有路径规划能力的控制器将更合适。
3.2.1位置控制器简介
图4:
输入是期望位置和当前位置的差和当前的速度,输出是期望横滚角和俯仰角和期望的垂直速度。
期望偏航角总是被设置为0,因为所有的运动都是由设置横滚角,俯仰角,偏航角和垂直速度来实现的。
在这项工作中,位置控制器将在x,y,z方向上的期望位置与当前位置的差和在三个方向上的当前速度作为输入进行接收。
控制器输出移动到目的地的姿态。
因为四旋翼的灵活性,到任何位置都只需要两个姿态角。
即使用三个角可以实现多种位置调动(比如通过横滚角和俯仰角改变空间位置,此时偏航角目的是保持固定装设的相机保持在一个固定的视角),为了这个工作,期望偏航角被设置为0,允许只用横滚角和俯仰角和期望垂直速度来做出所有动作。
这大大减少了搜索成功的控制器所需的搜索空间。
3.2.2位置控制器的训练
训练以及评估每一个潜在的控制器是以达到目标位置以及在此过程中穿过整个距离的能力为基础的。
这一系列训练的目的包括了一个覆盖了从出发点出发的所有方向的网格的点。
初始种群和突变性质和用于姿态控制器的同类是类似的。
然而,训练时间达到了15000幕,以给控制器提供通往目的地的直接的路线。
4.实验结果
一旦控制器的整个等级制度建立完成,我们进行了一些实验来测试他们的鲁棒性。
我们的实验通过了我们的假设,那就是这个自适应控制器是鲁棒的并能在数种情况下保持飞行器稳定:
不能建模的扰动(比如阵风),传感器和执行器的噪声(在所有物理环境中都出现),还有参数差异(表现一个设计的参数的范围,该参数描述飞行器在控制器控制下稳定的能力)。
这个控制器在这任意一个部分的成功性和控制器将飞行器移动到一系列航点的能力将在这部分进行探讨。
4.1航点控制
对控制器最重要的测试是是看它能否进行实际的飞行。
在这个测试中,我们选了一系列航点。
每一个航点都提供给了控制器,当飞行器在航点周围达到了稳定,就会提供一个新的航点。
图5:
最终控制器飞过一系列航点。
直线路线是虚线,实际路线是直线。
a)显示了一些飞行器经过的路长。
B)显示了相同模式的航点,其中路程增大到了一个规定的大小。
长度大的飞行距离导致了更顺畅的飞行路径,但两个情况下飞行器都成功到达了给出的航点。
图5显示了飞行器飞过这一系列航点同时展示了最佳的路径。
在图5a中很明显的是在一个很小的尺度上控制器没有找到最佳路径。
但是它找到了一个路径实现了目标并保持了稳定。
当这个相同的模式在一个更大的距离尺度上运用时,这个路径更加顺畅,如图5b所示
4.2抗扰
对于微型飞行器来说一个很大的障碍是干扰。
由于飞行器的重量很轻,一阵很小的风就能产生很明显的影响。
轻的重量和小的体积要求了慢一点的控制器不能去处理正在发生的干扰,而只能预测干扰发生了。
因此干扰被模型化为位置和姿态上的不连续的跳动,控制器必须克服它。
我们通过在横滚角和俯仰角上进行孤立的干扰以及在所有轴上进行干扰来测试这个控制器。
结果在所有情况下是相似的,但是只在图6和图7中显示了俯仰角的情况。
图6显示了每30秒,倾斜飞行器俯仰角60度的效果。
神经元控制器在稳定飞行器方面是非常成功的,而且能在3秒内回复到初始的悬浮位置。
这比PID控制器不能在下一个干扰来到前恢复到起始位置的情况要高级太多。
PID控制器能保持稳定,但不能快速恢复飞行器的位置。
图6:
每30秒将俯仰角干扰60度的情况下进行位置恢复。
PID控制器能使飞行器稳定,但要消耗几分钟时间来重回原点。
神经元控制器可以稳定并在3秒内重回原点。
图7:
在俯仰角收到干扰后的回复时间。
神经元控制器甚至能处理上下反转的情况,而PID控制器在面对超过60度的干扰时完全不能恢复。
图7显示了60度的干扰正好是PID控制器能处理的极限。
但是神经元控制器能够在上下完全颠倒的情况下恢复过来。
在这种情况下,需要几米的高度来恢复,但是完成一整个恢复动作只需要15秒。
如上面提到的,在其他轴上干扰的表现与纯粹在俯仰角上干扰的情况类似。
4.3噪声容忍度
真实世界里的控制器不同于仿真,必须在有噪声的环境下工作。
噪声来自于描述位置和姿态的传感器噪声,和控制电机速度的执行器的噪声。
我们的仿真器在这种想法上进行发展,允许增加各种类型的噪声。
在这两种噪声源之上,还有两种类型的噪声,偏置噪声和随机噪声。
偏置噪声将影响认知真实位置和姿态的能力,除非控制器经过了一些附加的真实飞行时传感器有关的训练。
因此在我们的仿真中,我们重点放在设计的控制器在总量增加的随机噪声中到底能做到的多好。
我们希望随机变化能在数值上被抵消掉,那么当噪声没有困住信号,就能保持飞行器稳定。
我们的仿真器不是以电机的动力学为模型。
它们能允许在一个信号周期内完成速度的一个很大的变化。
在噪声环境中,四旋翼在走放大的路径时一直保持稳定。
这个对噪声不稳定的响应也许会被实际的电机动力响应过滤掉,当控制器在硬件上使用时。
图8:
随机传感器噪声与稳定动作的大小的平均范围的图。
它显示了神经元控制器处理多5倍噪声的能力。
超过此图范围外的噪声将导致飞行不稳定。
4.3.1传感器噪声
这个控制器需要位置,速度和姿态传感器的数据。
我们的测试显示最终的控制器可以经受得住所有输入上的随机突变。
噪声等级越高,飞行器就会在保持稳定悬浮的状态下穿过更大的空间。
图8显示噪声突变如何改变飞行器的稳定性。
神经元控制器可以在45%的传感器噪声的情况下保持0.5米高的悬浮状态。
另一方面PID控制器只能处理10%的噪声,而且在悬停时要求2m半径的空间。
神经元控制器能处理接近5倍大小的噪声,而且只需要1/12的空间。
图9:
随机执行器噪声与稳定动作时的平均范围的图。
显示了神经元控制器可以处理多5倍的噪声。
4.3.2执行器噪声
执行器噪声来源于许多种外部的影响,它会阻止旋翼到达期望的速度,或者它本身是电机运动的结果。
为了探索这种噪声的影响,随机噪声被加到了每个执行器上。
我们的测试显示甚至只有2%的执行器噪声就使PID控制器产生灾难性的失败。
受训过的神经元控制器可以在15%的噪声下保持稳定。
随着噪声的增加,四旋翼为了保持稳定会在一个更大的空间内运行。
在增加的噪声情况下保持悬浮时离原始点的平均距离在图9中显示出来了。
4.4参数灵敏度
一个从仿真控制器设计移动到实际硬件上的重要挑战是模型的不准确。
在硬件组装之前控制器经常要进行测试,意味着设计的改变依然会发生,这会影响到系统的参数,并且因此仿真的系统将不再匹配硬件。
即使在控制器设计开始前硬件就已做好,参数测量时的困难(例如阻尼系数)会导致仿真与硬件间的不准确。
一个鲁棒性强的控制器可以处理一个范围内的参数值,使在硬件与仿真不匹配时也能保持飞行器稳定。
为了测试鲁棒性,经过了设计参数训练后的控制器被放在仿真的四轴飞行器,在调整后的参数下进行简单的移动。
调整两个关键的参数,推力系数和质量后,完成演习的时间在图10中显示了出来。
神经元控制器可以处理大致两倍于PID控制器的参数改变。
图10:
完成一个说明处理参数变化能力的简单动作的时间。
这显示出神经元控制器
可以处理大致两倍于PID控制器的参数改变。
5.结论
四轴飞行器在微型飞行器中,在提供非凡的操作性方面是独一无二的。
它与有翼飞行要求向前飞不同,它允许悬停飞行。
同时保持一个简单的机械结构,不像飞机一样需要操作平面,也不想直升机一样需要可变桨距的螺旋桨。
这种机械的简单性是以控制器复杂性增加为代价的。
四轴飞行器是内在不稳定的,它对旋翼速度的一点点改变都非常敏感。
先前的工作发展了一个建立在模型上的控制器,它能成功的操控悬停状态下的四轴飞行器,但是这种控制在小的飞行器上会更难实现。
这次的工作展示了一个连续的方法来制作一个自适应的飞行器控制器。
它也突出了这种控制器经受模型与现实不符的问题的能力。
在这片论文中,我们展现了一个小的(0.5kg)四轴飞行器的分级神经元控制器。
控制目标的第一阶段是稳定飞行器并依据要求的姿态(横滚角,俯仰角,偏航角和垂直速度)输出电机速度。
这个控制器是在围绕各个变量的四个独立部分上发展起来的,一开始被训练,使之接近PID控制器的结果。
然后这四个部分被合并使控制器能被进一步训练以提高它的鲁棒性。
控制的第二阶段是在第一阶段提供的合适的姿态上实现一个要求的(x,y,z)位置。
仿真的结果显示稳定的四轴飞行器控制是通过这样的控制结构来实现的。
另外,这个结果显示分级的控制在从一个规定大小干扰下恢复的速度比基本PID控制器快。
它能在5倍于PID控制器的传感器噪声和8倍的执行器噪声下提供稳定的飞行。
最后,尽管控制器是以仅仅一组参数进行设计的,它的鲁棒性允许参数进行重大的改变而不需重新训练控制器。
进一步的工作将是在实际的硬件上运行以验证仿真的结果。
当前的工作也包括扩展更高级的位置控制器来达到不仅是跟踪到目标位置,也能接受传感器输入来规避障碍的能力。
6.致谢
ThisworkwaspartiallysupportedbyAFOSRgrantFA9550-08-1-0187andNSFgrantIIS-0910358.
7.参考文献
[1]A.K.AgoginoandK.Tumer.E_cientevaluationfunctionsforevolvingcoordination.EvolutionaryComputation,16
(2):
257{288,2008.
[2]S.Bouabdallah.Autonomoussystemslab.http:
//www.asl.ethz.ch/education/master/aircraft/2008-L10-Homework.pdf,2008.
[3]S.Bouabdallah,P.Murrieri,andR.Siegwart.Designandcontrolofanindoormicroquadrotor.IEEEInternationalConferenceonRoboticsandAutomation,5:
4393{4398,2004.
[4]S.Bouabdallah,P.Murrieri,andR.Siegwart.Towards
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 四旋翼 神经元 控制 外文 翻译