当前位置：世界数码科技网 >> 热门转载 >> 文章正文

被踢翻后秒爬起来！浙大机器狗《影》展示新绝技八技能陌生环境随机反应|面试

发布于：2020-12-24 被浏览：3372次

对于自然界中的一种动物来说，在各种陌生的环境中灵活切换相应的运动技能似乎是一种条件反射和与生俱来的能力，但如何让机器人掌握这种能力是很有挑战性的，也是全世界机器人专家长期探索的课题。

2020年12月，中国科学家团队实现的一项机器人创新被选为《科学机器人学》杂志月度封面论文。研究人员来自爱丁堡大学高级智能机器人实验室和浙江大学朱秋国教授领导的机器人团队。

基于四足机器人，科研人员提出了一种多专家学习框架，让机器人具备了应对各种意外情况的自主能力，并在运动响应敏捷度和灵活度方面表现优异。

图|封面纸(来源：科学机器人学)

这项研究中使用的四足机器人是被称为中国版波士顿动力公司的“幻影”机器人。DeepTech此前曾独家专访过这个机器人：《浙大机器狗 “绝影” 的逆袭，从技术上 “被虐” 到应用上追赶独家专访》。

关于这篇封面论文的算法特点和贡献，DeepTech联系了该论文的通讯作者李志斌，进行交流。

让机器狗“集各家之长于一身”

李志斌目前是爱丁堡大学信息学院的助理教授，领导高级智能机器人实验室(见文章末尾的主页)。他的研究兴趣包括机器人的动态运动控制、机器人在(超)人类水平上的自主运动、多臂协调和抓取操作等。他在机器人硬件平台、力与柔顺控制等领域也有着丰富的经验。

据他介绍，机器人在实际应用中通常会面临两种挑战：一是在任务层，二是在算法方面。

这种方法在首先，传统方法中，机器人要去执行某种任务，需要算法工程师、程序员们对其进行编程，一般而言都是针对某一个具体任务来编程。.无疑是有缺点的，比如在野外救灾或地震现场搜救工作中，机器人所处的环境会非常复杂，地面可能会被障碍物遮挡，高低不平，湿滑，机器人也会出现各种摔倒等意外情况。

因此，如果出现 100 种或者 1000 种不同的情况，还要去执行多项任务，用传统方法去编程是非常难涵盖的，其量级也不可扩展，开发人员不可能 “先知先觉” 预先编程出所有的特定解决方案。,要求机器人独立决定在新环境中做什么来完成任务。

在其次，机器人遇到新的情况需要随机应变，灵活应付。,以前的许多研究中，几乎所有人都在训练机器人的个人技能方面做得很好，如行走、跑步、故障恢复等。但在演示中，有时要求操作人员根据当时机器人的情况，用遥控器切换模式和操作，大大降低了实用性。

本研究提出的多专家系统相当于每个“专家”训练一项基本技能，如行走、故障恢复、跌倒和攀爬等。学习个体技能后，将不同的“专家”一起训练，通过门控神经网络在不同的事件和条件下激活和派遣每个专家，使其形成不同的协调组合，克服不同的问题。

通过这一技能加持，四足机器人觉一可以在没有导航的楼梯、沙砾堆和崎岖的道路上自动奔跑和转弯，甚至在被踢倒或翻倒时迅速恢复正常姿势。

“最后形成的那个综合‘专家’，相当于是集各家之长于一身，懂得融会贯通，这就让机器人具备了在当时那种特定情况下所需要的技能组合，而且能够根据不同情况千变万化、举一反三，去自主恢复继续执行任务。”李智彬说道。

机器人摸爬滚打的能力有了怎样的提升？请看以下效果：

8 项“专家技能”融会贯通，关键恢复能力控制在 1 秒内

具体来说，本文提到的多专家学习体系结构被命名为MELA,它是由深度神经网络(DNN)和门控神经网络(GNN)组成的分层强化学习(HRL)结构。

为了帮助解释，研究人员定义了几个关键术语：运动技能、专家和运动模式。

运动技能：是一种反馈策略，它可以产生协调的行动来完成特定类型的任务，这是构建更复杂行动的基础；DNN；专家：;的专业运动技能运动模式：,的一种四肢协调运动模式，如站立、原地旋转、向前/向后小跑、向左和向右转动以及从跌倒中恢复。

图|不同的技能类型(来源：科学机器人学)

研究人员为机器人训练了八种运动技能，包括：(1)从背部翻身；(2)碾压；(3)体态控制；(4)站立平衡；(5)左转；(6)右转；(7)小步小跑；(8)大步小跑。

不同的技能需要不同的触发方式，八种技能的整合是MELA综合可变技能，产生适应性行为的基础。

面对不同情况下，GNN 生成可变权重（）来融合所有八个专家网络的参数，这样新合成的运动技能可以通过混合各个专家的有效技能，快速生成不同的运动技能，来适应各种未知场景。

图|多专家学习框架MELA的原理(来源：科学机器人学)

实验结果表明，依靠 MELA 输出的融合技能加持，“绝影” 机器人的关键恢复能力控制在 1 秒内（恢复身体姿态平均 0.5s，恢复小跑模式平均 0.4s），也显示出了在非结构化环境下更强的可靠性和通障性能。

另一个值得注意的诀窍是，研究人员从生物运动控制中获得了灵感，这使得运动控制和学习的框架更接近真正的四足动物。

例如，动物的运动行为是由中枢神经系统控制的，中枢神经系统重置身体关节的参考位置，并根据参考位置与实际位置的差异，刺激肌肉活动产生适当的力来进行姿势调整。

由于阻抗控制提供的弹簧阻尼特性类似于生物肌肉的弹性，因此研究团队应用了平衡点（EP）控制假设，通过调控平衡点来生成关节扭矩。

受肌肉系统生物力学控制和EP假说的启发，研究人员实际上将机器人控制分为两层：在底层，团队使用扭矩控制为机器人配置关节阻抗模式；在顶层，指定深度神经网络（DNN）为所有关节产生设定平衡点，以调节姿势和关节扭矩，建立与环境的力相互作用，.在此基础上，MELA可以输出更接近真实四足动物的运动策略。

图|机器狗跌倒爬起连贯反应(来源：爱丁堡高级智能机器人实验室)

下一步，仍需更多跨界合作

“这种多专家系统和多技能集成框架允许机器人切换自己的运动策略并适应环境。这是第一次在步行机器人上应用，这就是为什么这项成就可以被科学机器人公司评为封面。至少取得了质的突破，与以往的研究形成了代差。”李志斌说。

据了解，这种多专家融合技能的思路，也能够延伸到其他机器人平台上。包括各种四足和双足机器人，以及轮式和履带式机器人，甚至可以用于抓取操作的机器人。机器抓不同东西的策略是不一样的，本质是不同专家的技能延伸。无论是抓纸、书、杯子、裸皂、球体、不同硬度的物体等等。他们都需要不同的专家技能策略。

关于进一步改进和提高的空间，他说，为了不断突破，未来的研究可以集成视觉、触觉传感等，以开发多感知型运动技能。还需要与更多的业内优秀团队合作和探索

例如，对于机器人本身而言，现在普遍还缺少一种 “电子皮肤”。

目前，机器人机载传感器需要积累大量的训练经验来判断各种情况。由于机载传感器有限，很多经验只有统计上是正确的，但对于特殊情况不一定是最好的，只能说成功率很高。

但是，自然界的生物中，小到毛虫、蠕虫，大到各种动物、人类，都是有皮的。如果机器人要在废墟上钻一个洞，进入后周围是什么环境，如何通过，障碍物如何接触机身表面，现有的传统传感器在这样复杂的环境下是不够的，“电子皮肤”需要更精细的感知和区分。

另一方面，机器人对外部的感知理解能力仍然有待提高。

比如有雾的环境，因为有雾，或者因为燃烧产生的烟雾，仅靠计算机视觉无法清晰区分；再比如机器人从室内走到室外，外面是零下的无雪环境。机器视觉中，地面可能和平时一样，雷达检测不到障碍物。但是在这种情况下，人在走路和开车的时候，会注意路面可能打滑的可能性，而机器人并没有意识到这种调整策略。这些“非接触”外部传感器，包括辐射、温度和气体检测，也非常关键。

“目前，这项研究背后只有两个专家团队，但机器人研究不能闭门造车。正如机器人现在拥有多专家能力一样，我们欢迎与更多跨学科和跨学科团队合作，以碰撞更多创新理念和可能性。”李志斌最后说道。

groups.inf.ed.ac.uk/advr_

https://robotics.sciencemag.org/content/5/49/eabb2174_

arxiv.org/abs/2012.05810

https://www .艾德。AC。英国/信息学/news-events/stories/2020/teaching-a-robot-dog-new-ticks-with-dr-Alex-Li _

标签：机器人技能专家

被踢翻后秒爬起来！浙大机器狗《影》展示新绝技 八技能陌生环境随机反应|面试

被踢翻后秒爬起来！浙大机器狗《影》展示新绝技八技能陌生环境随机反应|面试