历时 18 个月,地表最强人形机器人诞生了!黑色外观颜值爆表,五指灵活,号称是地球上最先进的 AI 硬件,还有 OpenAI 的模型加持推理。现在,它已经进宝马工厂打工了,干 20 小时都不带停的那种!
号称 OpenAI 二代机器人「Figure 02」,真的来了!Figure AI 终于官宣了第二代人形机器人,完全换了一身新形象 —— 黑色的外观,更加灵活的五指。
创始人 Brett Adcock 表示,「这是『地表最强』的人形机器人」!
值得一提的是,Figure 02 的设计评审耗时 18 个月完成。
据介绍,迭代后的 Figure 手部具有 16 个自由度,能够承受与人类相当的力量。
现在的它,已经进入宝马车厂开始打工了,可以无休止地狂干 20 个小时。
Figure 02 还可以与人类直接开启「语音对话」,这背后依旧用上了 OpenAI 最先进的定制 AI 模型,通过语音-语音进行推理。
与初代类似,它拥有一个机载的视觉模型(VLM),可通过摄像头,完成视觉推理。
去年,初代机器人 Figure 01,同样在 OpenAI 大模型的加持下,能够看、听、遵循人类指令。
不仅如此,这家明星初创背后,还得到了英伟达、阿尔特曼、贝索斯等大佬的联合投资。
如今,工程和设计团队在 Figure 02 上完成了一次从零开始的硬件和软件重新设计。
其中,在包括人工智能、计算机视觉、电池、电子设备、传感器和执行器等关键技术上,取得了巨大的进步:
Figure 02 机器人与其前身 Figure 01 身高相似,但在很多方面都进行了改进。最明显的变化是机器人的「皮肤」采用了哑光黑色外观,而不是 Figure 01 的铬金属饰面。
之前的机器人看起来像穿着盔甲,而 Figure 02 看起来像一辆现代跑车,拥有流线型的曲线和精致的外观。
另一个变化部分就是电缆。在 Figure 01 中,电缆被故意布置在机身外部,以支持测试夹具、更换传感器和电机,并加快维修速度。而在 Figure 02 中,所有电缆都集成到了四肢中,保护它们免受环境的影响,并为长时间在生产线上工作做好准备。
Figure AI 表示,新机器人的电池容量比 Figure 01 大 50%,能够在实际部署中工作更长时间。电池已集成到人形机器人的躯干中,使其重心更接近中心线位置,使得机器人更加灵活。
Figure AI 还为其定制了电机,与关节传动系统集成在一起,以优化每个关节的功率和性能。
机器人设计的一大难题,就是可靠地通过旋转关节布线。我们可以看到,Figure 02 的肩部、肘部、髋部和膝部四个主要关节组设计非常简洁,完美解决了这个难题。
准备好接收语音指令
AI 模型的训练决定了机器人智能和能力的核心,因此 Figure AI 与 OpenAI 的合作可谓「如虎添翼」,能够快速测试、验证和迭代机器人的语音互动功能。
早在 GPT-4o 发布前,Figure AI 的视频就展示了机器人如何通过语音指令与人类互动,最新发布的 Figure 02 在 OpenAI 定制模型到加持下,也可以通过麦克风和扬声器人类进行对话。
Figure AI 表示,Figure 02 的计算和 AI 推理能力提升了 3 倍,可以在现实世界中完全自主地执行任务。
新型号配备了六个 RGB 摄像头,用于感知物理世界,此外还配备了一个车载视觉语言模型,能够快速进行常识性的视觉推理。
视觉模型能够处理所有车载图像以进行感知、避障,最重要的是进行手眼协调,以便机器人能够识别并拾取面前的物体。
另外,比起 Figure 01,Figure 02 拥有 3 倍机载计算能力和 AI 推理能力。这使得机器人能够完全自主地执行实际的 AI 任务。
这里 AI 数据引擎会提供最新的 AI 模型,并直接直接在设备的 GPU 上运行。
操控人手能抓的物体
自成立以来,Figure AI 已经在机器人手部的设计和功能上投入了大量资金。由此得到的最新设计,不仅具有十六个自由度(DoF),而且能够承载最多 25 公斤(55.1 磅)的物体。
与此同时,这双「手」的外观也与人类都非常相似 —— 有四根手指和一个拇指。具体来说,每根手指由一个集成单元驱动,该单元包括传感器和电机。
手腕是另一个新颖的设计,提供了与人类手腕相似的运动范围,同时将所有电力和传感信号线路封装并引导到手和手指。
Figure AI 表示,他们的目标就是让机器人能够操控任何人类手能抓住的物体。
资金雄厚,但人形机器人赛道竞争激烈
Figure AI 最初摆脱「隐身」模式还是在 2023 年 3 月,推出了通用人形机器人 Figure 01,希望能应用于工业制造、物流、仓储、零售等多个行业以解决全球范围内的劳动短缺问题。
根据创始人 Adcock 的设想,机器人们可以替人类承担不安全和不受欢迎的工作,构建一个更加自动化且高效的未来。并且他坚称,Figure AI 的这项技术绝不会被武器化。
很难想象,Figure AI 第一代全规模机器人的构建仅花了短短 6 个月的时间,不得不说,这得益于包括 CTO Jerry Pratt 在内的 40 名行业专家组成的强大团队。
作为 2024 年初的投资宠儿,Figure AI 目前已筹集了 6.75 亿美元资金。
凭借雄厚的资金,联合创始人兼 CEO Brett Adcock 正在全速推进,目标是在未来 2~5 年内将自主双足机器人推向市场。
其实,今年早些时候,Figure AI 就已经在南卡罗来纳州一家宝马工厂测试了。在这里,AI 模型训练的数据会被收集起来。
在演示中我们可以看到,机器人完全展现出了在工业环境中运行的能力,还能学习执行基本任务。
当然,这个越来越卷的赛道中,其他竞争对手也没闲着。
Agility Robotics 的 Digit 和 Apptronik 的 Apollo,早就把自家机器人部署到了 GXO 物流公司中,执行简单任务。
马斯克家的 Optimus,也很早就被「下放」到了特斯拉工厂;波士顿动力,也有意在现代设施中,给最新版 Atlas 进行测试。
在科幻故事中,我们早就见识过各类人形机器人,但在商业产品的推出上,它们其实一直进展缓慢。
一方面是受限于研究环境,另一方面,设计也非常昂贵。
然而,LLM 和多模态 AI 模型的发展,改变了这一切!如果模型能快速分析实时视频和音频输入,还能以类人音频和动作进行相应,那科幻中的场景,显然不会很遥远了。
拥有 Optimus 的马斯克最近大胆预言,地球上有超过 100 亿台人形机器人的市场,这意味着未来每个人会拥有不止一台机器人。
此外,英伟达的 GR00T 项目也在进行时,展示了 AI 在指导人形机器人方面的进展。
Jim Fan 发布的这个视频中,人类远程操作员可以通过佩戴 Apple Vision Pro 来引导机器人完成正确动作。
快速 QA
由于官方并没有透露太多信息,因此外媒 IEEE Spectrum 找到了 Figure 的控制总监 Michael Rose 和硬件总监 Vadim Chernyak,并做了一波快速的 QA。
问:Figure 02 有多少个部件?这些是全部吗?
答:有几百个独特的部件,总共有几千个部件。不,这不是全部。
问:Figure 02 每走一步都会留下 Figure 标志吗?
答:如果表面足够柔软的话,是的。
问:「可更换的腿」是很难做到的吗,还是因为只需要做一条腿而更容易呢?
答:我们选择制作可更换的腿是为了便于制造。
问:电池包也是可更换的吗?
答:我们的电池是可更换的,但这不是一个快速更换的过程。
问:Figure 02 膝盖后面和肘关节处那个看起来软软的东西是什么呢?
答:这些是软限位器,它们以受控的方式限制运动范围,并防止机器人夹伤。
问:你们把拇指的马达藏哪了?
答:拇指现在完全包含在手中。
问:脖子上的「皮肤」是什么?
答:这种皮肤是一种柔软的织物,即使机器人移动头部,也能保持干净无缝的外观。
问:当 Figure 02 的头部转动时,它的身体也会转动,手臂也会移动。这是必要的,还是只是出于美学考虑?
答:只是出于美学考虑。
问:上半身和肩膀看起来比其他人形机器人窄得多。为什么设计成这样?
答:我们认为将机器人设计成与人类相似的比例非常重要。这使我们能够完成目标使用场景,并更容易适应环境。
问:Figure 02 的步态是如何设计的?
答:机器人使用模型预测控制器来确定脚步位置和维持平衡所需的力量,从而跟随预定的轨迹。
问:2.25 千瓦时的电量在视频中的那些任务中能运行多长时间?
答:我们的目标是让产品运行 5 小时。
参考资料:
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。