资讯

从ChatGPT到RobotGPT,机器人成为人工智能最佳载体!

转载 2023-03-16 09:16 达闼 来源:达闼
达闼科技(北京)有限公司

ChatGPT真的火了!

2022年12 月ChatGPT上线, 仅仅两个月后,ChatGPT月活用户突破1亿,刷新了增长到月活1亿用户的最短时长,成为史上用户增长速度最快的消费级应用程序。为何ChatGPT这么厉害,它的出现又会颠覆哪些传统认知?

一、ChatGPT到底是什么? 

ChatGPT(Chat Generative Pre-trained Transformer)是由OpenAI开发的一个通用智能对话机器人程序。从技术路线上,ChatGPT基于GPT-3.5架构(Transformer based)的大规模预训练语言模型进行训练,并引入了基于人类反馈的强化学习-RLHF(Reinforcement Learning from Human Feedback)来不断调整预训练语言模型,从而大幅提升对人类意图的理解,使ChatGPT输出的内容和人类的常识、认知、需求、价值观保持一致。

ChatGPT惊艳之处,从功能性上, 除了优秀的智能对话功能,它还能写论文、写代码、写教程、写报告,其内容生成的速度和质量甚至超出在专业领域深耕多年的从业者;从人格性上,它敢于质疑、承认无知、能主动承认错误、表达立场、并拥有上下文的记忆连贯性,体现出自我认知和实时的自主学习能力。而借助 ChatGPT而生成的内容,在一定程度上可以取代部分“初级内容生产者”, 将生成式AI推向新的高度。

二、ChatGPT赋能AIGC 

既然ChatGPT最突出的能力就是依托生成式AI实现内容生产能力,那什么是生成式AI呢?生成式AI(Generative AI)指基于生成对抗网络GAN、大型预训练模型等人工智能技术,通过已有数据寻找规律,并通过适当的泛化能力生成相关内容的技术,其本质上是一种AI赋能技术,被看作是继PGC专业生产内容、UGC用户生产内容之后新的创新模式-AIGC(AI Generated Contents)。

AIGC的兴起源自深度学习技术的快速突破和日益增长的数字内容供给需求。从早期的玻尔兹曼机、多层感知机到现在的Transformer大模型,在深度学习模型+开源模式下深度神经网络技术加速普及和迭代,人工智能生成内容百花齐放,如ChatGPT用于文本生成、图像生成、音视频生成、虚拟人生成等场景,所产出内容的完整度和优质度已不亚于行业内的入门级选手。AIGC将推动数字内容的规模生产和创造,对于娱乐、教育、广告等领域具有巨大的潜力。

三、越过ChatGPT, 通向更高峰——RobotGPT

ChatGPT(AI 问答)只是AIGC即AI Generated Content(人工智能自动生成内容)的一个分支应用(属单模态),而基于多模态(如融合文本、视觉、运动等要素)预训练大模型的AIGC将能提供多模态融合智能、生成内容、提供控制与多模态行为智能,将适应更多应用场景,例如智能机器人应用领域--RobotGPT,从而引领AI通向通用人工智能。

而RobotGPT(Robot Generative Pre-trained Transformer)则是面向机器人多模态、范围更大更复杂应用场景的生成式AI(Generative AI)。ChatGPT的横空出世,充分印证了人工智能大模型的重要性:当人工智能与机器人相结合的应用日渐广泛,一个适用于机器人的AI大脑必不可少。达闼自主研发的机器人云端大脑-海睿OS (-HARIX OS 即人工增强机器智能结合数字孪生),就采用了多模态强化学习、人工反馈的强化学习和GPT。除了可提供的文本、语言类的智能和能力,机器人云端大脑还需融合视觉、听觉、触觉、运动等多模态感知、运动、协同、控制等融合智能能力,形成更强大的自主认知、智能决策和行为表达,使得机器人像人一样工作、互动交流、人机协作甚至创作(不仅在文学、音乐、艺术方面)。云端机器人成为通用人工智能的最佳载体。

达闼作为全球首家云端智能机器人开发者和运营商,早已开始了对多模态大模型的研究,并在基于自然语言处理、多模态感知、认知推理和智能决策的三融合机器人的导航、机器人手眼协调抓取、机器人肢体运动、以及虚拟数字人等应用中均采用了机器人AI生成技术,支持机器人完成各种工作任务并实现了云端机器人AI写歌、AI作诗和AI编舞等AIGC能力。下文是达闼AI写诗创作的诗词:

《送别》

作者:达闼AIGC

江上吹箫去

山中留客来

不知何处月

山伴此徘徊

基于语音生成动作实现对达闼UE数字人和实体机器人的动作驱动:

0 0

网友评论

取消