资讯

外媒: 美国陆军如何将机器人变成团队合作者?

编译 2021-11-10 09:34 DDing 来源:AGV网

美国陆军研究实验室(ARL)的机器人操纵器RoMan在马里兰州的阿德尔菲实验中心考虑抓取和移动树枝的最佳方法。

中国AGV网(www.chinaagv.com)据美国电气电子工程师学会(IEEE )旗下旗舰出版物IEEE Spectrum的记者撰文所摘录,作者Evan Ackerman是IEEE Spectrum的高级编辑。自2007 年以来,他撰写了6,000 多篇关于机器人和技术的文章。他拥有火星地质学学位,擅长吹奏风笛。

“我可能不应该站得这么近。”当机器人慢慢靠近我面前地板上的一根大树枝时,我心里想。让我紧张的不是树枝的大小——而是机器人在自主运行,虽然我知道它应该做什么,但我不完全确定它会做什么。如果一切都像美国陆军研究实验室(ARL)的机器人专家所期望的那样进行,那么机器人将识别分支、抓住它并将其拖到一边。这些人知道他们在做什么,但我在机器人周围花了足够多的时间,无论如何我都向后退了一小步。

该机器人名为RoMan,意为Robotic Manipulator,大小与大型割草机相当,带有履带式底座,可帮助它处理大多数地形。在前面,它有一个配备摄像头和深度传感器的蹲下躯干,以及从最初在NASA 喷气推进实验室为DARPA 机器人竞赛开发的原型灾难响应机器人收获的一对手臂。RoMan 今天的工作是道路清理,这是一项多步骤任务,ARL 希望机器人尽可能自主地完成。操作员并没有指示机器人以特定方式抓取特定物体并将它们移动到特定位置,而是告诉RoMan“走开一条路”。然后由机器人做出实现该目标所需的所有决定。

自主决策的能力不仅是让机器人有用的原因,也是让机器人成为机器人的原因。我们重视机器人,因为它们能够感知周围发生的事情,根据这些信息做出决策,然后在没有我们输入的情况下采取有用的行动。过去,机器人决策遵循高度结构化的规则——如果你感觉到这一点,那就去做。在像工厂这样的结构化环境中,这很有效。但在混乱、陌生或定义不明确的环境中,对规则的依赖使得机器人在处理任何无法提前准确预测和计划的事情上是出了名的糟糕。

RoMan,以及许多其他机器人,包括家用吸尘器、无人机和自动驾驶汽车通过人工神经网络来应对半结构化环境的挑战——一种松散地模仿生物大脑中神经元结构的计算方法。大约十年前,人工神经网络开始应用于各种各样的半结构化数据,这些数据以前对于运行基于规则的编程(通常称为符号推理)的计算机来说非常难以解释。人工神经网络不是识别特定的数据结构,而是能够识别数据模式,识别与网络之前遇到的数据相似(但不相同)的新数据。事实上,人工神经网络的部分吸引力在于它们是通过实例进行训练的,通过让网络摄取带注释的数据并学习自己的模式识别系统。对于具有多层抽象的神经网络,这种技术称为深度学习。

尽管人类通常参与训练过程,即使人工神经网络受到人类大脑神经网络的启发,但深度学习系统所做的模式识别与人类看待世界的方式有着根本的不同。通常几乎不可能理解输入到系统中的数据与系统输出数据的解释之间的关系。而这种差异——深度学习的“黑匣子”不透明性——给RoMan 这样的机器人和陆军研究实验室带来了潜在的问题。

在混乱、陌生或定义不明确的环境中,对规则的依赖使机器人在处理任何无法提前准确预测和计划的事情时出了名的糟糕。

这种不透明度意味着必须谨慎使用依赖深度学习的机器人。深度学习系统擅长识别模式,但缺乏人类通常用来做出决策的世界理解,这就是为什么此类系统在其应用程序定义明确且范围狭窄时表现最佳的原因。“当你有结构良好的输入和输出,你可以将你的问题封装在这种关系中,我认为深度学习做得很好,”汤姆霍华德说罗切斯特大学机器人与人工智能实验室的负责人,并为RoMan 和其他地面机器人开发了自然语言交互算法。“对智能机器人进行编程时的问题是,这些深度学习构建块的实际规模有多大?”Howard 解释说,当您将深度学习应用于更高级别的问题时,可能的输入数量会变得非常大,解决该规模的问题可能具有挑战性。当这种行为通过一个170 公斤的双臂军用机器人表现出来时,意外或无法解释的行为的潜在后果要严重得多。

几分钟后,RoMan没有动静--它仍然坐在那里,思索着树枝,手臂像螳螂一样摆着。在过去的10年里,陆军研究实验室的机器人合作技术联盟(RCTA)一直在与来自卡内基梅隆大学、佛罗里达州立大学、通用动力陆地系统公司、JPL、麻省理工学院、QinetiQ北美公司、中佛罗里达大学、宾夕法尼亚大学和其他顶级研究机构的机器人专家合作,开发用于未来地面作战车辆的机器人自主能力。RoMan是该进程的一部分。

RoMan 正在慢慢思考的“清除路径”任务对机器人来说很难,因为任务太抽象了。RoMan 需要识别可能挡住路径的物体,推断这些物体的物理特性,弄清楚如何抓住它们以及最适合应用哪种操纵技术(如推、拉或举),然后做到这一点。对于一个对世界了解有限的机器人来说,这是很多步骤和很多未知数。

ARL 机动和移动人工智能项目首席科学家Ethan Stump 表示,这种有限的理解是ARL 机器人开始不同于其他依赖深度学习的机器人的地方。他说:“基本上可以要求陆军在世界任何地方开展行动。我们没有在我们可能开展行动的所有不同领域收集数据的机制。我们可能会被部署到地球另一边的某个未知森林。世界,但我们会被期望表现得和我们在自家后院一样好。”大多数深度学习系统只能在它们接受过训练的领域和环境中可靠地运行。即使域类似于“旧金山的每条可行驶的道路”,机器人也会做得很好,因为这是一个已经收集的数据集。但,Stump 说,这不是军队的选择。如果陆军深度学习系统表现不佳,他们就不能简单地通过收集更多数据来解决问题。

ARL 的机器人还需要对他们正在做的事情有广泛的认识。Stump 解释说:“在任务的标准操作命令中,你有目标、约束、关于指挥官意图的段落——基本上是任务目的的叙述——它提供了人类可以解释的上下文信息,并在需要时为他们提供结构做出决定以及何时需要即兴发挥。”。换句话说,RoMan 可能需要快速清除路径,也可能需要安静地清除路径,具体取决于任务的更广泛目标。即使是最先进的机器人,这也是一个很大的要求。“我想不出可以处理此类信息的深度学习方法。”Stump 说。

ARL的机器人在崎岖地形[上、中]中测试自主导航技术,其目标是能够跟上人类队友的步伐。ARL 还在开发具有操纵能力[底部] 的机器人,可以与物体进行交互,这样人类就不必这样做了。埃文·阿克曼

当我观看时,RoMan 被重置为第二次尝试移除分支。ARL 的自治方法是模块化的,其中深度学习与其他技术相结合,机器人正在帮助ARL 找出适合哪些技术的任务。目前,RoMan 正在测试从3D 传感器数据中识别对象的两种不同方法:UPenn 的方法基于深度学习,而Carnegie Mellon 正在使用一种称为通过搜索感知的方法,该方法依赖于更传统的3D 模型数据库。仅当您提前确切知道要查找哪些对象时,通过搜索进行感知才有效,但训练速度要快得多,因为每个对象只需要一个模型。当物体的感知困难时,它也可以更准确- 例如,如果物体被部分隐藏或颠倒。

感知是深度学习往往擅长的事情之一。ARL 的计算机科学家Maggie Wigness说:“计算机视觉社区使用深度学习在这些方面取得了疯狂的进步。”“我们在其中一些模型中取得了很好的成功,这些模型在一个环境中训练并推广到新环境,我们打算继续将深度学习用于此类任务,因为它是最先进的。”

ARL 的模块化方法可能会以利用其特定优势的方式结合多种技术。例如,使用基于深度学习的视觉对地形进行分类的感知系统可以与基于逆强化学习方法的自动驾驶系统一起工作,其中模型可以通过人类士兵的观察快速创建或完善。传统的强化学习基于已建立的奖励函数优化解决方案,并且通常在您不一定确定最佳行为是什么样子时应用。这对陆军来说不是什么问题,他们通常可以假设训练有素的人类会在附近向机器人展示正确的做事方式。“当我们部署这些机器人时,事情会很快发生变化,”威格尼斯说。”

深度学习面临的不仅仅是数据稀疏问题和快速适应问题。还存在稳健性、可解释性和安全性的问题。“这些问题并不是军方独有的,”Stump 说,“但当我们谈论可能具有杀伤力的系统时,这一点尤其重要。”需要明确的是,ARL 目前并未研究致命的自主武器系统,但该实验室正在帮助更广泛地为美国军方的自主系统奠定基础,这意味着考虑未来可能使用此类系统的方式。

深度网络的要求在很大程度上与陆军任务的要求不一致,这是一个问题。

Stump 表示,安全显然是重中之重,但目前还没有明确的方法可以让深度学习系统变得可验证安全。Stump 说:“在安全约束下进行深度学习是一项重大的研究工作。很难将这些约束添加到系统中,因为你不知道系统中已有的约束来自哪里。所以当任务发生变化或上下文发生变化时,很难解决这个问题。这甚至不是一个数据问题;这是一个架构问题。ARL 的模块化架构,无论是使用深度学习的感知模块,还是使用逆向强化学习的自动驾驶模块或其他东西,都可以构成更广泛的自主系统的一部分,该系统融合了军队所需的安全性和适应性。系统中的其他模块可以在更高级别上运行,使用更可验证或可解释的不同技术,并且可以介入以保护整个系统免受不利的不可预测行为的影响。“如果其他信息进入并改变了我们需要做的事情,那么那里就会有一个层次结构。这一切都以理性的方式发生。”

尼古拉斯-罗伊(Nicholas Roy)是美国麻省理工学院机器人技术小组的负责人,他自称是"有点像乌合之众",因为他对一些关于深度学习能力的说法持怀疑态度,他同意ARL机器人专家的观点,即深度学习方法往往不能处理军队必须准备应对的那种挑战。"陆军总是进入新的环境,而对手总是试图改变环境,所以机器人所经历的训练过程根本无法与他们所看到的相匹配,"罗伊说。"因此,深度网络的要求在很大程度上与军队任务的要求不一致,这是一个问题。"

作为RCTA 的一部分,从事地面机器人抽象推理工作的Roy 强调,当应用于具有明确功能关系的问题时,深度学习是一项有用的技术,但是当您开始查看抽象概念时,并不清楚深度学习是否是一种可行的方法。“我对如何以支持更高层次推理的方式组合神经网络和深度学习非常感兴趣,”罗伊说。“我认为这归结为组合多个低级神经网络来表达更高级别概念的概念,我认为我们还不了解如何做到这一点。”Roy 给出了使用两个独立神经网络的示例,一个用于检测汽车物体,另一个用于检测红色物体。它'与使用基于具有逻辑关系的结构化规则的符号推理系统相比,将这两个网络组合成一个更大的网络来检测红色汽车要困难得多。“很多人都在研究这个,但我还没有看到推动这种抽象推理的真正成功。”

在可预见的未来,ARL 将通过让人类进行更高级的推理和偶尔的低级建议来确保其自主系统的安全和稳健。人类可能不会一直直接参与其中,但我们的想法是人类和机器人在团队合作时更有效。当机器人协作技术联盟计划的最新阶段于2009 年开始时,Stump 说,“我们在伊拉克和阿富汗已经有很多年了,在那里机器人经常被用作工具。我们一直试图弄清楚我们可以做些什么来将机器人从工具转变为团队中更多的队友。”

当人类主管指出分支中抓取可能最有效的区域时,RoMan 会得到一些帮助。机器人对树枝实际上是什么没有任何基本知识,而这种缺乏世界知识(我们认为是常识)是各种自主系统的基本问题。让人类利用我们丰富的经验进行少量指导可以使RoMan 的工作更加轻松。确实,这一次RoMan 成功地抓住了树枝,并大声地将它拖过房间。

把一个机器人变成一个好的队友可能很困难,因为找到合适的自主权可能很棘手。太少了,需要一个人的大部分或全部注意力来管理一个机器人,这可能适用于爆炸物处理等特殊情况,但在其他情况下效率不高。太多的自主权,你会开始在信任、安全和可解释性方面遇到问题。

“我认为我们在这里寻找的水平是让机器人在工作犬的水平上进行操作。”Stump 解释道:“他们完全理解我们在有限的情况下需要他们做什么,如果他们面临新的情况,他们有少量的灵活性和创造力,但我们不希望他们创造性地解决问题。如果他们需要帮助,他们会回到我们身边。”

RoMan 不太可能很快发现自己在外地执行任务,即使是作为人类团队的一部分。它在很大程度上是一个研究平台。但是ARL 正在为RoMan 和其他机器人开发的软件称为自适应规划器参数学习(APPL),很可能首先用于自动驾驶,然后用于更复杂的机器人系统,包括像RoMan 这样的移动机械手。APPL 结合了在经典自主导航系统下分层排列的不同机器学习技术(包括逆向强化学习和深度学习)。这允许将高级目标和约束应用于低级编程之上。人类可以使用遥控演示、纠正干预和评估反馈来帮助机器人适应新环境,而机器人可以使用无监督的强化学习来动态调整其行为参数。结果是一个自治系统可以享受机器学习的许多好处,同时还提供陆军需要的那种安全性和可解释性。与应用程序,

看着商业和工业自主系统的快速发展(自主汽车只是一个例子),我们很想知道为什么陆军似乎在某种程度上落后于技术发展水平。但是,正如斯坦普发现自己不得不向陆军将领解释的那样,当涉及到自主系统时,Stump说:"有很多棘手的问题,但工业的棘手问题与陆军的棘手问题不同。陆军没有在有大量数据的结构化环境中操作其机器人的奢侈,这就是为什么ARL在APPL中投入了如此多的精力,并为人类保留了一席之地。展望未来,人类可能仍然是ARL正在开发的自主框架的一个关键部分。这就是我们试图用我们的机器人系统建立的东西。这就是我们的保险杠贴纸:'从工具到队友'。"

Agility 公司首席技术官Jonathan Hurst

Agility 公司首席技术官Jonathan Hurst告诉我们:

“数字是非常非常灵活的自动化,”当我们向他询问此事时。我们正在做的事情的价值是一般性的,有一个机器人可以搬运三四个小时的手提包,然后从拖车上卸下箱子三四个小时,如果你改变了,跟上你”你的工作流程完全。其中许多空间是专门围绕人类外形设计的,像Digit 这样的机器人有可能完成所有这些不同的无聊、重复的工作。然后当事情变得复杂时,人类仍然在做。“

当您开始考虑典型的仓库情况时,在人类环境中拥有类人机器人的价值就会发挥作用,这些情况对于人类来说是微不足道的,但对于轮式机器人来说却是不可能的。例如,Hurst 说Digit 能够使用凳子接触高架子上的物体。当然,你可以设计一个带有扩展系统的轮式机器人,使其能够到达高架子,但你现在增加了更多的成本和复杂性,而通用类人机器人的全部意义在于,在人类环境中,你只需不必担心环境挑战。或者,无论如何,这就是想法,但正如Hurst所解释的那样,Digit 最终以大部分人形外形的形式更像是设计时考虑到特定功能的副作用:

我们并没有着手制造类人机器人,但是,我们着手解决移动性问题,并且一直在有条不紊地理解世界上的物理交互。Agility 从我们的机器人Cassie 开始,Cassie 的一个大问题是我们机器人的身体没有足够的惯性来抵消向前摆动的腿,这就是为什么Digit 有一个直立的躯干。我们想在Cassie 的偏航方向上给自己更多的控制权,所以我们尝试在机器人上放一条尾巴,结果证明最好的尾巴是一对双边对称的尾巴,一个在两边。

我们的目标是设计一种机器,它可以在人们去哪里的同时操纵世界上的事物,我们最终得到了这种外形。对我们来说,这是一条与绝大多数人形机器人截然不同的道路,我们的机器有很多其他大多数机器所没有的微妙之处。

Agility的数字人形机器人-Digit humanoid

IEEE Spectrum:那么你是说,Digit的手臂一开始是作为尾巴来帮助Cassie控制偏航的?

Jonathan Hurst:有很多这样的例子——我们一直在沿着这条路走下去,我们找到了解决偏航控制等问题的方法,它碰巧看起来就像对动物一样,但它也是一个在几个方面都是最佳的解决方案。不同的方式,例如物理交互和能够在机器人跌倒时抓住它。这并不是一件事和另一件事之间的妥协,而是直接针对这三个不同性能设计目标的正确解决方案。

回顾过去,我们首先问,我们应该在Cassie 上安装反作用轮还是陀螺仪来控制偏航?嗯,那只是浪费了质量。我们可以使用尾巴,有很多漂亮的机器人都有尾巴,但通常它们是用来控制俯仰的。动物也一样。如果你看看蜥蜴,它们会用尾巴在空中重新定向,然后在跳跃后用脚着地。Cassie 不需要尾巴,但我们在地面上只有几只小脚可以工作。如果你看看其他双足动物,他们每个人都有其他获得偏航权限的方法。如果您观看鸵鸟奔跑,当它转弯时,它会伸出翅膀以获得所需的控制。

因此,所有这些事情都恰到好处,双边对称的一对尾巴是控制两足动物偏航的最佳方式。当你看到Digit 走路并且它的手臂在摆动时,这不是我们为了使运动看起来正确而添加的东西。它看起来是对的,因为它确实是对的——这是流动性的物理学。这对我们来说是一个好兆头,表明我们正走在获得我们想要的性能的正确道路上。

“我们将用于通用目的,但从一些最简单的用例开始。”Jonathan Hurst说。

IEEE Spectrum:我们已经看到Digit 展示了非常令人印象深刻的移动技能。为什么我们会在半受限的仓库环境中看到演示,而不是在更直接利用Digit 独特优势的地方?

Jonathan Hurst: 它是关于找到最早、最合适和最有价值的用例。这个机器人有很多东西,我们不会只是一个手提包包装机器人。我们没有为这个应用制造专门的机器人,但我们有几个非常大的物流合作伙伴,他们对这台机器的灵活性和操纵能力感兴趣。是的,你现在看到的是平坦地板上的机器人,但它也不会被路缘、台阶、电线盖或地面上的其他东西绊倒。你不必担心这样的事情。所以接下来,这是卸货拖车旁边的一个简单过渡,它必须跨过缝隙,上下东西以及地板上的箱子等等。我们是为了通用目的,

首席执行官Damion Shelton:我们正试图缩小行业空间,与合作伙伴达成明确的价值主张并在那里进行部署。我们可以尊重通用用例的难度,努力尽早部署并盈利,而不是继续推动户外应用。福特机会的福与祸在于它超级有趣,但也超级难。所以这是非常激励人心的,我们很清楚这就是最终机会之一,但它离部署时间表也太远了,它只是没有映射到可行的商业模式。

这是每个机器人公司迟早都会遇到的一个问题,他们的愿望必须屈从于以长期可持续的方式销售机器人的现实。这绝对不是坏事,只是意味着我们可能不得不相应地调整我们的期望。不管你的机器人有什么样的尖端功能,如果它不能有效地完成枯燥、肮脏或危险的事情,没有人会付钱给你。可以说,具有成本效益的实用性是目前双足机器人面临的最大挑战之一。过去,我对Digit 的举重技术印象深刻,或者它爬上陡峭泥泞的山坡的能力.当Agility 通过在仓库中执行枯燥的重复性任务开始为Agility 赚钱时,我也会印象深刻,因为这意味着Agility 将能够继续致力于那些更复杂、更令人兴奋的事情。“这不是一般的操作,我们也没有解决机器人技术的巨大挑战。然而。但我们正在路上。”Hurst说。

0 0

网友评论

取消