机器之心报道
机器之心编辑部
能语音对话,VLM 视觉,每天工作 20 小时。
总会有这一天,但我们没想到来的居然这么快。
北京时间 8 月 6 日晚,硅谷著名具身智能创业公司 Figure 正式发布了自己的新一代人形机器人 Figure 02。
除了样子够科幻,这种机器人也有着足够通用的智能,它可以与人类实时对话,自动学习如何装配零件。事实上,Figure 02 正在宝马位于 Spartanburg 的工厂实习工作,我们仿佛已经进入了未来。
Figure 工程和设计团队完成了对 Figure 02 硬件和软件的彻底重新设计。在人工智能、视觉、电池、电子设备、传感器和执行器等关键技术上均取得了重大进步。
具体来说,Figure 02 主要包括以下特点:
全面改进:通用 + 人形 + 实用化
这回升级,最大的变化可能是 Figure 02 真的准备好回应语音指令了。
去年那支惊艳科技圈 demo 里,站在 Figure 01 前的人类向这位机器人提问:「可以拿点东西给我吃吗?」它不仅识别出面前的物体是苹果,它更懂得苹果可以直接食用,于是它把苹果递给了面前的人,说道:「当然,拿去吃吧。」
今年 3 月,OpenAI 宣布与 Figure 合作开发具身智能,让人形机器人拥有了实时有效的对话能力。背靠 OpenAI,Figure 能够快速迭代机器人语音到语音的能力。Figure 表示,由于 Figure 02 的端侧算力大幅提升,已经可以完全自主地在现实世界中执行各种任务。
在 Figure 02 上,机器人语音推理的实现主要得益于内置的麦克风和扬声器连接到与 OpenAI 合作训练的定制 AI 模型上。
Figure 02 的导航系统使用了 VLM(视觉语言模型),这使得机器人上的摄像头能够进行语义基础研究和快速常识性视觉推理。VLM 是当前众多造车新势力正在研究的智能驾驶新方向,在机器人领域,这种方法显然也可以在很多任务上实现突破性的效果。
续航能力可以说是人形机器人实用化面临的最大挑战之一。Figure 02 机器人躯干内定制有容量为 2.25 KWh 的电池组,可以比 Figure 01 多提供 50% 以上的能量,从而最大程度地延长机器人的运行时间。Figure AI 的创始人、CEO Brett Adcock 表示,他们希望 Figure 02 每天能够实现约 20 小时以上的有效工作。
我们可以看到,Figure 02 的外观变得更加具有整体性,这是因为它采用了全新的外骨骼结构。相比于 Figure 01,机器人的外形设计转变较为彻底。另外它也采用了集成布线的设计。集成布线具有以下好处:
从 Figure 01 到 Figure 02,外形上有很大改观。
除了更好的布线,Figure 02 还设计了定制的电线端子和连接器,以提高机器人的可靠性。
为了能像人类一样理解世界,Figure 02 通过多摄像头 + AI 驱动的视觉系统来进行感知与推理。其在头部、前躯干和后躯干共有 6 个板载 RGB 摄像头,使得机器人具有超越人类的视觉能力。
最后还有灵巧的手指。Figure 02 搭载了第四代机械手,有 16 个自由度,并具有与人类相当的力量,可以胜任各种复杂任务,整个手包含了机械、电气、控制和传感器等技术。
Brett Adcock 表示,随着机器人的不断运行,AI 数据引擎将收集并整理数据用于训练模型,不断提升性能。
看到 Figure 02 这么精彩的亮相,让人不禁想起了马斯克家的擎天柱,两者相比,不知道谁更胜一筹。
还有网友表示「Figure 02 预示着一个新时代的开始,这是目前世界上最先进的机器人,未来已来。」
创业公司 Figure:半个硅谷都在投
Figure 由 Brett Adcock 于 2022 年创立,是一家总部位于美国的机器人公司,专门开发人形机器人。该公司的目标是开发通用人形机器人,为人类带来积极影响,为后代创造更美好的生活。
在生成式 AI 技术爆发后,很多以具身智能为目标的机器人公司不断出现,而 Figure 在其中显得尤为亮眼。2023 年 3 月,Figure 走出隐身模式,推出了原型机器人 Figure 01,其外观和动作都与人类相似。这是一款专为体力劳动设计的双足机器人,最初针对的是物流和仓储行业。
2023 年 5 月,该公司从 Parkway Venture Capital 领投的投资者手中筹集了 7000 万美元。
同年 10 月,Figure 放出 Figure 01 双足机器人行走视频。
很快到了今年 1 月,Figure 01 已经学会了煮咖啡。
2024 年 1 月 18 日,Figure 宣布与宝马合作,在汽车制造工厂部署人形机器人。此时的 Figure 01 号称已经可以自主完成现实世界中的任务了。
Figure 01 在宝马工厂里工作。
今年 3 月,Figure 宣布完成惊人的 6.75 亿美元 B 轮融资,公司估值达到 26 亿美元。投资者包括微软、英特尔、OpenAI Startup Fund、Amazon Industrial Innovation Fund 、英伟达、贝索斯、「木头姐」的方舟投资、Parkway Venture Capital、Align Ventures 等。
与此同时,Figure 还宣布与 OpenAI 建立合作伙伴关系,包括 OpenAI 为 Figure 的人形机器人构建专门的 AI 模型,使其机器人能够处理和推理语言。
3 月 13 日,借助 OpenAI 技术,Figure 01 可以与人类进行全面对话。
从直立行走,完成复杂任务到与人自然交互。这些技术亮点也是 Figure 和一直希望回归机器人领域的 OpenAI 达成合作协议的重要原因之一 —— 将 OpenAI 的研究与 Figure 的机器人经验结合起来,为人形机器人开发下一代 AI 模型。
在今天 Figure 02 发布后,高度集成的硬件与 VLM 等新一代 AI 技术结合,让我们距离真正具有通用能力的人形机器人更近了一步。
很快,物理世界也要迎来 AI 带来的变革了?
参考内容:
https://x.com/Figure_robot/status/1820791819023909031
https://www.youtube.com/watch?v=0SRVJaOg9Co
https://www.therobotreport.com/figure-02-humanoid-robot-is-ready-to-get-to-work/