资讯

监督学习对自动化的未来至关重要

转载 2022-01-10 15:12 京天机器人 来源:京天机器人
北京天智航医疗科技股份有限公司

自动化的主要目标是解放人们以提高生产力。这意味着可以使用机器人系统代替一个人做枯燥或重复的任务。这使人们能够通过专注于需要更多思考、创造力和解决问题的任务来完成更多工作——这些任务最终会产生更多价值。当机器人系统能够以一定程度的自主权完成其任务时,例如,从随机放置的零件箱中挑选零件而不是需要整齐的零件堆,人们就更加解放了。然而,机器人仍然不能把一切都做好。例如,让机器人看到并与其环境交互的最佳视觉算法仍然不是 100% 准确。

这些用于重现任务的算法,无论是检测物体还是学习握住金属部件,都是通过一遍又一遍地重复相同的动作来学习的。他们做的动作越多,他们得到的结果越好。但是,这只适用于任务永不改变、零件不变或零件以相同的位置和方向呈现的情况。当任务的任何一个方面发生变化时,算法可能无法应对环境的变化。

指导机器人:

为了提高这种性能并处理这些新情况,许多算法采用了一种称为监督学习的策略。由于这些机器人中的许多都部署在曾经执行机器人任务的人仍然在附近的环境中,因此监督学习背后的想法是,如果机器人遇到由于环境中的某些条件而不知道如何执行的情况 它以前从未见过——一个它从未见过的部件、两个部件粘在一起、机器卡住等——一个人可以提供机器人需要的缺失信息。该信息可能采用新标签的形式(是的,它仍然是一瓶肥皂,即使它颠倒了)或新演示(您需要在此处获取这个新部件)。用户示教,提供附加信息,机器人重新开始工作。

人向机器人提供的这种纠正性帮助在人们相互转移技能方面也很常见。在许多不同的行业中,这种类型的指导已经发生了数千年,并且仍然是新员工接受教育的常见方式(与课堂环境相反,或除了课堂环境之外)。甚至有些公司正在使用人工智能来更好地捕捉这种指导。

那么人们有时间做这个机器人导师吗?好吧,通过自动化将人们从重复性任务中解放出来,我们无意中创造了一个知识渊博的工人资源,他们已经与机器人系统一起提供指导以提高绩效。想象一下,以前所有时间都在一台机器上工作的工人,现在管理一组机器人,偶尔通过提供来自他们自己的专业知识的额外信息来调整每个机器人的性能。他们更有权力,因为他们的生产力更高,他们从自己执行不受欢迎的任务中解脱出来,并且他们仍在利用他们丰富的知识通过指导不断改进机器人系统。

可用性是关键

设计一个可由工人通过监督学习有效训练的机器人系统的一个关键要素是确保工人用来提供额外信息的界面易于使用。如果执行监督学习的人是机器操作员(很常见)而不是机器人工程师(非常罕见),则尤其如此。如果我们想利用人们熟悉(并擅长)指导这一事实并将其应用于改进自动化系统,那么用于向机器人提供该信息的界面需要与他们培训其他人的方式相似。例如,通常情况下,工人展示动作以教授技能。你需要像这样拿着工具,然后按这里。随着“协作机器人”的出现,人们现在可以通过移动机器人的手臂来直接演示动作。此外,我们开始看到可以观察人的动作的视觉系统,例如用喷漆器绘画,并使用该演示来定义机器人的动作。这很有效,因为它与人们相互展示动作的方式非常相似。以这种方式教授机器人是很自然的,即使是那些没有丰富机器人技术经验的人也可以训练机器人。这是实现更快速采用自动化的关键。

从学习的角度来看,工人可能需要(至少一次)展示一项任务是如何完成的,以便机器人可以从中学习。工作人员定义了一组完成任务的步骤,并在某些逻辑流中表示这些步骤。工作人员通常使用流程图来教导其他工作人员或与其他工作人员交流流程如何逐步进行。现在有 No Code 软件可以为机器人编程提供相同的流程图界面。这意味着,工作人员无需学习编码,而是可以根据他们已经熟悉的内容学习对话界面,而且工作量要少得多。

具有显着降低学习曲线的 No Code 软件也使学习机器人变得更加容易。机器人技术的教育障碍非常高,其中很大一部分源于学习使用机器人的本地编程语言进行编程所需的时间。相反,当快速学习编程时,这些宝贵的技能提升时间可以用于更多地了解机器人执行任务的最佳方式。机器人如何最好地固定零件?机器人如何处理可变性?机器人如何最有可能在任务中失败?工人进入机器人“头部”的次数越多,他们就越能帮助引导机器人取得成功。

适应新形势

机器人学习能力的一个关键部分是何时可以在新情况下使用该知识。

现在,当我们谈论机器人的学习能力时,我们实际上是在谈论软件或算法的学习能力。这意味着,要使这种类型的学习真正有用,一旦学会了一项技能,无论使用何种机器人或硬件来完成任务,它都应该有效。这是一个简单的想法,但在实践中很少像这样工作。

例如,假设一个算法学会了从带有真空抓手的小型工业机器人的垃圾箱中拾取圆柱体。它知道零件的外观,以及真空杯的放置位置,以便牢固地固定零件。现在,用户想要使用带有两指抓手的更大机器人。该算法仍然知道如何操纵圆柱体,但它需要关于这个更大的手臂的新信息,以及两指抓手的最佳抓握位置。这种学习技能基础知识的过程,与特定硬件无关,称为抽象,人们一直在这样做。将五把不同的锤子交给熟练的木匠,他们仍然可以钉钉子,因为他们知道超出工具限制的任务。

所以现在想象一个机器操作员负责多个这样的机器人。他们必须提供这些附加信息,以便机器人在这些新情况下抓取零件。但是,该操作员必须处理许多此类机器和情况,可能涉及不同品牌的机器人。该用户必须具有一致的界面来提供这些额外信息,这意味着机器人必须运行相同的叠加软件。这个通用的软件层也有利于算法,因为算法现在是机器人的标准化接口,以及机器人的表示,它的大小和配置是不可知的。毕竟,机器人仍然可以移动和抓取,只是碰巧更大并且有一只不同的手。

最近的技术进步允许学习算法(例如所描述的算法)适用于任何品牌的机器人,因为它们运行在一个通用的底层软件平台上。想想适用于 PC 的 Windows——一种算法可以在多台不同的计算机上运行,并且所有底层软件都可以正常工作。在这种情况下,这个通用平台让每个机器人在算法眼中看起来都一样,使得机器人之间的技能转换变得更加容易。

结论

能够自己解决问题的机器人还有很多东西要向我们学习,而监督式学习是传授这些知识的一种方式。然而,为了真正实现监督学习,系统需要可供提供额外知识的人使用用户界面需要类似于人们已经相互教学的方式,并且易于使用,以便向机器人展示绳索就像向另一个人展示一样自然。这就需要配套通用的操作系统。

此外,机器人硬件的通用软件平台可以使监督学习更快地抽象到新情况,因为机器人和工具在算法中看起来是相同的,即使它们可能具有不同的大小和配置。将所有这些放在一起,通过正确的监督学习架构(对话式、直观的机器人编程界面、跨机器人模型和品牌的通用界面,以及针对监督学习输入和教学进行优化的软件),机器人不仅变得更有效,而且能够处理非常难以编程的任务,并且使用机器人的机器操作员得到充分利用——实现了以前不可能达到的生产力水平。

0 0

网友评论

取消