财新传媒
财新传媒
1111111
财新通行证
T中

GPT革命|谷歌推2代AI机器人 能听话会学习

文|财新 杜知航,祝宇欢(实习)
2023年07月31日 20:20
RT-2能理解自然语言,能识别物体,还能进行逻辑判断,做出合理的动作
news 原图 谷歌近日推出AI机器人模型Robotics Transformer 2(RT-2),作为视觉-语言-动作(vision-language-action,VLA)模型,RT-2配备了大语言模型技术,直接从互联网学习知识,可以识别物体、理解语言命令,然后做出有逻辑的动作。图:谷歌DeepMind

  【财新网】机器人AI引入大语言模型,即使遇到见过的新情况,也能理解。谷歌近日推出AI机器人模型Robotics Transformer 2(RT-2),作为视觉-语言-动作(vision-language-action,VLA)模型,RT-2配备了大语言模型技术,直接从互联网学习知识,可以识别物体、理解语言命令,然后做出有逻辑的动作。

  RT-2主要有三种能力:符号理解(Symbol understanding)、推理(Reasoning)和人类识别(Human recognition),依靠这些能力,机器人可以理解“捡起即将从桌子上掉下来的袋子”或“把香蕉移到2加1的和的标志那里”这样的命令——其中的物体或场景是原有机器人数据中从未有过的,机器人模型使用了互联网的知识,最后完成操作。

责任编辑:屈运栩 | 版面编辑:王影

财新网所刊载内容之知识产权为财新传媒及/或相关权利人专属所有或持有。未经许可,禁止进行转载、摘编、复制及建立镜像等任何使用。

如有意愿转载,请发邮件至hello@caixin.com,获得书面确认及授权后,方可转载。

推荐阅读
财新移动
说说你的看法...
分享
取消
发送
注册
 分享成功

订阅财新网主编精选版电邮>>