智东西
编译 | 陈佳慧
编辑 | 徐珊
智东西9月21日消息,据The Verge报道,丰田研究院(TRI)成功研发出一种突破性的生成式AI技术即机器人行为模型,在“机器人幼儿园”中教导机器人各种灵巧的技能。该机器人行为模型基于AI的扩散策略,可以在数十次新技能的演示后学习新技能。
运用该机器人行为模型,能让机器人产出一致性强、可重复和高性能的结果。而且机器人学习和产出的速度极快,不再需要人工来进行编码和修复编码错误,提高了机器人的实用性,也在构建机器人大型行为模型(LBM)方向上迈进了一步。
一、机器人也上学,通过机器人行为模型掌握超60项挑战性技能
据TOYOTA官网公告,以前,教机器人新行为的技术进展缓慢、效率较低,而且一般在执行任务时有很多限制性条件,所执行的任务也是非常具体和细节的。机器人专家需要花费大量时间编写复杂的代码,可能还要不断修改代码错误,以此为机器人添加新行为。
现在,有了机器人行为模型。研究员认为,触觉是这个机器人行为模型的关键要素。他们给机器人提供了一种大拇指般大小的触觉传感器,能够让机器人通过触觉来感知和学习,从而像人类一样更轻松地执行各种复杂任务。据The Verge报道,研究人员就曾在“机器人幼儿园”教机器人如何做早餐。
“机器人幼儿园”的运作方式是,首先由一位“老师”展示一套技能,然后机器人的模型在后台学习几个小时,最后机器人成功形成新的工作行为。丰田研究院的灵巧操纵实验室经理Ben Burchfiel说,他们经常是在下午教机器人,让它学习一晚上,第二天早上就可以来看到它的新行为了。
到目前为止,研究人员已经使用机器人行为模型,成功培训机器人获得了超过60项具有挑战性的技能,例如倒液体、使用工具以及操控可变形物体等。并且他们希望在2024年底前将这个数字增加到1000项。
▲机器人搅拌液体(图源:TOYOTA官网)
二、自主观察学习新技能,机器人大型行为模型正在创建
丰田研究院的研究人员在研发出现在的机器人行为模型后,还试图为机器人创建大型行为模型。丰田研究院机器人研究副总裁Russ Tedrake说,大型行为模型与大语言模型类似,是通过观察来学习,然后能够执行从没有教过的新技能。
谷歌在其AI学习模型机器人变压器RT-2的研发中,其实也在研究类似的技术。与丰田研究人员的方法类似,他们的机器人利用自己获得的经验来推断如何执行任务。从理论上讲,经过AI训练的机器人最终可以实现,只给出一个大致方向,而不需要任何具体的行动指令就可以完成任务,例如“清理那个溢出的东西”。
不过,根据纽约时报报道,谷歌的机器人研发还有很长的路要走。同时,泰晤士报也称,研究工作通常是“缓慢而费力的”,提供足够的训练数据比向AI模型提供从互联网下载的数据要难得多。
结语:机器人获得触觉提升技能学习速度,未来或能实现机器人自主拓展新技能
丰田研究院的机器人行为模型让机器人获得了触觉,相比于从前训练机器人的人工编码和错误查找,新模型不仅减少了人力付出,也提高了机器人学习新技能的速度,让机器人能够帮助人们更快、更好地完成更多任务。
而丰田研究院研究人员称,他们正在构建机器人大型行为模型,谷歌也在不断尝试开发类似技术。有了现在的机器人行为模型的出现,在研究院与科技公司的探索下,未来机器人大型行为模型或许也有可能成为现实,机器人通过观察自主拓展新技能也有可能实现。
来源:The Verge