人形机器人+LLMs=? 答案就在这个2分钟视频里

作者：机器之能发布时间：2024-01-25

生成式AI

机器之能报道

编辑：Sia

你可以用自然语言与机器人交谈，并要求它完成一项任务。未来对机器人的控制可能会像骑马，你可以把AI看作是骑手，机器人的物理智能就是马。

当生成 AI 被植入数千个系统中时，迟早有一天也会来到人形机器人身上。

不过，Agility Robotics CEO Damion Shelton 最初并不相信它们的双足机器人需要这玩意儿。

就我们的用例而言，还没有让大型语言模型（ LLM ）控制机器人的需求。客户不需要和自己的机器人进行有趣的对话，他们需要借助机器人的物理原理替代重复性劳作。

当亚马逊于 10 月中旬开始测试 Agility Robotics 的双足机器人Digit 时，这位亮蓝色的自主「打工人」看起来也比实际情况更聪明。

「现实是，机器人还没有自我意识，它们现在甚至没有使用大型语言模型，」 Damion Shelton 当时说道。

仅仅两个月后，情况就发生了变化。

在本周三发布的两分钟「Embodied AI」演示中，升级后的 Digit 顺利完成工程师随意布置的口头任务。

已关注

关注

重播分享赞

关闭

观看更多

正在加载

退出全屏

视频加载失败，请刷新页面再试

刷新

视频详情

我们很好奇，将这项技术集成到 Digit 中可以实现什么。为此，Agility Robotics 给 Digit 创建了一个演示空间。

视频中，机器人前方排列了四个不同高度的编号塔，身后也有三个不同高度的编号塔。后面的三个编号塔上，各有一个由几个不同特征（颜色、图案还有数字）定义的盒子。

工作人员给 Digit 编码了这些环境信息，但没有编码任何具体任务。接入能理解复杂自然语言命令的 LLM 后，Digit 能否顺利完成随机分配的任务？

视频中，机器人被告知将「达斯维达的光剑」颜色的盒子放到前面最高的塔上。

演示视频界面，左下角的叠加层显示了机器人的内心独白，右下角的叠加层显示了物理世界中3D 导航的情况。

Digit 并没有瞬间完成任务，而是深思熟虑地、慢慢进行着。

在 LLM （接受了流行文化参考资料的训练）赋能下，Digit 知道什么是「达斯维达的光剑」。

它会思考「我应该找出可以使用的命令」，「应该首先评估环境，看看有哪些物品和位置可用」，以及「达斯维达的光剑是红色的，所以，红色的盒子是我需要移动的。」

移动到目标位置后，「我应该把红色盒子拿起来」。「现在有了红色盒子，我应该移动到前排最高的塔的位置，即编码是 4 的塔。」

机器人还知道，前排最高的塔是 4 号塔。「我将首先移动到红色盒子的位置。」

移动到目标位置后，机器人将光剑盒子放到了目标编码塔上。

最后，它宣布工作完成：「我相信我已经完成了任务，因为我已经将达斯维达的光剑颜色的盒子（红色，盒子 2 ）移到了前排最高的塔楼（塔 4 ）。

已关注

关注

重播分享赞

关闭

观看更多

正在加载

退出全屏

视频加载失败，请刷新页面再试

刷新

视频详情

Digit 的内在思维全过程

已关注

关注

重播分享赞

关闭

观看更多

正在加载

退出全屏

视频加载失败，请刷新页面再试

刷新

视频详情

外在物理世界完整的3D导航过程

这个演示表明，LLM 能帮助机器人将抽象的人类命令转化为机器人可以理解的较低级别命令，因此，人们能够用自然语言与 Digit 交谈并要求它执行任务。

这也展示出 LLM 如何增强人形机器人、让它们变得更通用、部署更快。Agility Robotics 表示。这是一种自然的契合，并将 Digit 描述为「AI 的物理化身」。

这不仅让人想起 Damion Shelton 的一个比喻，他曾将机器人控制比作骑马，「你可以把更高级的 AI 看作是骑手，机器人的物理智能就是马。」

目前，该公司正准备在俄勒冈州的一家大型生产工厂每年生产 10,000 个 Digit 机器人。

除了与亚马逊的合作之外，该初创公司本月还开始在佐治亚州的 Spanx 配送中心测试其人形机器人。

已关注

关注

重播分享赞

关闭

观看更多

正在加载

退出全屏

视频加载失败，请刷新页面再试

刷新

视频详情

Agility 表示，公司自主系统能够大幅降低机器人适应新仓库和任务的成本。但 AI 功能将使这一过程变得更快，这意味着，机器人可以部署到更广泛的任务领域，并最终走出仓库。

有关 LLM 应用潜力的尝试是令人兴奋的—— 作为一种商用机器人系统，Digit 要与人类一起工作也需要学会倾听他们的声音。

一些顶尖大学、研究实验室和公司正在探索将更高级的智能形式嫁接到机器人身上，解决现有方法难以解决的复杂机器人问题。

卡耐基梅隆大学机器人学教授 Chris Atkeson 表示，开发人员正陷入一场激烈的竞争，以将最具吸引力、最有能力的智能体推向市场。

「无论谁先脱颖而出……都可能会占据大量市场份额，」他说。

今年早些时候，波士顿动力公司开始使用 ChatGPT 为其四足机器人 Spot 提供语音提示。

丰田研究所也在使用生成式 AI 加速机器人学习，不用改代码，只用较少的案例就能教会机器人更多的任务。到目前为止，他们已经教会机器人 60 种不同的技能。

最近，麻省理工学院 CSAIL 主任 Daniela Rus 也公开了自己的创业项目 Liquid AI——通过一种新型神经网络结构，即使在移动机器人有限的硬件能力下，也能享受生成 AI 的魔力。

她指出，与模型预测解决方案相比，有了生成式 AI，可以得到更快、更流畅、更像人类的控制解决方案。

她认为，这是非常强大的。未来的机器人的行动不会那么机械，动作会更流畅，就像人类。

参考链接

https://www.youtube.com/watch?v=CnkM0AecxYA

转载请联系本公众号获得授权

投稿或寻求报道：content@jiqizhixin.com

近期资讯

联想申请连接器及电子设备专利，能夹装固定连接器安装板

金融界2024年12月25日消息，国家知识产权局信息显示，联想（北京）有限公司申请一项名为“连接器及电子设备”的专利，公开号CN119171120A，申请日期为2024年8月。

金融界 2024-12-25

浙江索罗威取得修正正弦波逆变器专利，实现修正正弦波逆变输出

金融界2024年12月25日消息，国家知识产权局信息显示，浙江索罗威科技有限公司取得一项名为“修正正弦波逆变器”的专利，授权公告号CN222192166U，申请日期为2024年4月。

金融界 2024-12-25

华夏天信智能物联取得多负载变频器专利，能够实现针对多个负载的有效变频控制

金融界2024年12月25日消息，国家知识产权局信息显示，华夏天信智能物联股份有限公司取得一项名为“一种多负载变频器”的专利，授权公告号CN222192170U，申请日期为2024年4月。

金融界 2024-12-25

西安图为电气取得一种三相四线制逆变器电路及储能系统专利，保持在三相不平衡负载下三相相电压也是平衡的

金融界2024年12月25日消息，国家知识产权局信息显示，西安图为电气技术有限公司取得一项名为“一种三相四线制逆变器电路及储能系统”的专利，授权公告号CN222192163U，申请日期为2023年12月。专利摘要显示，本实用新型关于一种三相四线制逆变器电路及储能系统。

金融界 2024-12-25

威胜能源取得一种逆变串并联电路专利，能保证低至 14V 光伏输入时有逆变输出，提高电压输入范围

金融界2024年12月25日消息，国家知识产权局信息显示，威胜能源技术股份有限公司取得一项名为“一种逆变串并联电路”的专利，授权公告号CN222192164U，申请日期为2024年4月。

金融界 2024-12-25

上海航天科工申请小型化BGA焊接型接插件专利，具有很好的电磁屏蔽性能

金融界2024年12月25日消息，国家知识产权局信息显示，上海航天科工电器研究院有限公司申请一项名为“小型化BGA焊接型接插件”的专利，公开号CN119171116A，申请日期为2024年8月。

金融界 2024-12-25

纳百川电子科技申请钳口式插座专利，能高效可靠完成连接和固定

金融界2024年12月25日消息，国家知识产权局信息显示，东莞市纳百川电子科技有限公司申请一项名为“一种钳口式插座”的专利，公开号CN119171118A，申请日期为2024年11月。

金融界 2024-12-25

吉林省中赢高科技申请双层端子专利，增加接触面积减小接触电阻

金融界2024年12月25日消息，国家知识产权局信息显示，吉林省中赢高科技有限公司申请一项名为“一种双层端子”的专利，公开号CN119171113A，申请日期为2024年9月。

金融界 2024-12-25

苏州同泰新能源科技取得电压转换电路等专利，实现电压转换并滤波得到交流电压信号

金融界2024年12月25日消息，国家知识产权局信息显示，苏州同泰新能源科技股份有限公司取得一项名为“电压转换电路、光伏接线盒和光伏组件”的专利，授权公告号CN222192165U，申请日期为2024年1月。专利摘要显示，本公开实施例提供一种电压转换电路、光伏接线盒和光伏组件。

金融界 2024-12-25

上海宏力达取得可控逆变输出的桥式整流功率模块专利，同时具备三相全桥整流、全桥逆变转换、单相桥式整流功能

金融界2024年12月25日消息，国家知识产权局信息显示，上海宏力达信息技术股份有限公司取得一项名为“种可控逆变输出的桥式整流功率模块”的专利，授权公告号CN222192162U，申请日期为2023年12月。

金融界 2024-12-25

人形机器人+LLMs=? 答案就在这个2分钟视频里

推荐体验

相关资讯

有关视频《5分钟搭建ChatGPT语音QQ机器人……》的若干问题

三分钟 ChatGPT 接入钉钉机器人

10分钟从0搭建微信chatGpt聊天机器人

人形机器人的未来，藏在人工智能的历史里

大模型技术实践（三）｜10分钟用LangChain和Llama 2打造心灵疗愈机器人

近期资讯

联想申请连接器及电子设备专利，能夹装固定连接器安装板

浙江索罗威取得修正正弦波逆变器专利，实现修正正弦波逆变输出

华夏天信智能物联取得多负载变频器专利，能够实现针对多个负载的有效变频控制

西安图为电气取得一种三相四线制逆变器电路及储能系统专利，保持在三相不平衡负载下三相相电压也是平衡的

威胜能源取得一种逆变串并联电路专利，能保证低至 14V 光伏输入时有逆变输出，提高电压输入范围

上海航天科工申请小型化BGA焊接型接插件专利，具有很好的电磁屏蔽性能

纳百川电子科技申请钳口式插座专利，能高效可靠完成连接和固定

吉林省中赢高科技申请双层端子专利，增加接触面积减小接触电阻

苏州同泰新能源科技取得电压转换电路等专利，实现电压转换并滤波得到交流电压信号

上海宏力达取得可控逆变输出的桥式整流功率模块专利，同时具备三相全桥整流、全桥逆变转换、单相桥式整流功能

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响