本文作者:杜玉
来源:硬AI
8月6日周二,背后由OpenAI、微软、英伟达、亚马逊创始人贝佐斯等出资支持的人工智能机器人初创公司Figure AI发布了第二代人形机器人Figure 02,称其为“地球上最先进的AI硬件”,距离向工业用户销售量产人形机器人的目标又近了一步。
据介绍,这是Figure AI向市场推出性能最高的人形机器人,将人体形态的灵活性与先进的人工智能相结合,可在商业应用中执行各种任务,并且在不久的将来可应用到家庭中。
有网友分析称,Figure 02可以学习并进行自我纠正,这是一个新时代的开始,“这是未来的诞生。”
与今年3月才发布的第一代机器人Figure 01相比,Figure 02不仅在外观上更为时尚,还将硬件和软件重新设计,在AI、计算机视觉、电池、电子设备、传感器和执行器等关键技术中取得进步。
具体来看,在AI方面,通过与OpenAI合作训练的定制AI模型,和借助机器人身上的机载麦克风与扬声器,Figure 02已能与人类进行实时的语音与语音对话(Speech-to-speech)。
Figure 02还配有机载(onboard)视觉语言模型,通过机器人的摄像头实现快速常识性视觉推理。
在CPU和GPU方面,Figure 02比上一代机器人的机载计算与AI推理能力提高了三倍,这使得机器人能够完全自主地在现实世界中执行任务。
最新型号配备了六个RGB摄像头,机器人可以利用它们并通过AI驱动的视觉系统感知和理解物理世界。这款人形机器人还能直接处理所有图像,以实现避障和更重要的手眼协调,这样机器人就可以识别并拾取面前的物品。
为了方便在工业环境中实操,Figure 02采用集成布线,把用于电源和计算通信的所有线缆都在机器人躯干和肢体中内封隐藏起来,是增强可靠性和更紧密的封装,从而保护其免受外部环境干扰,并为工业生产线上的长时间运行做好准备。
截图自Figure AI官方发布的Figure 02工业用例视频
集成布线是与第一代人形机器人区别较大的一个特点。Figure 01的布线曾被特意安排在底盘外部,以支持测试线束、传感器和电机的交换,并加快维修速度。
虽然两代机器人的身高差不多,外观上明显Figure 02更为时尚,拥有哑光黑色饰面的“皮肤”,而不是像穿了盔甲那样的镀铬金属饰面。公司称,第一代机器人的外观设计比较粗糙是为了经受住实验室无数小时的严格测试。
华尔街见闻曾援引文章提到,Figure 01机器人身高为5英尺6英寸,重量60千克,能够持续工作5小时,移动速度达到1.2米/秒,动力系统为电动。拥有类似于人类的手臂、腿部和手部结构,能够上下楼梯和搬运重达20千克的货物。与执行固定命令的传统机器人不同的是,Figure 01具备了初级思考和推理的能力,也就是说大模型已经成为了它的大脑。
而今日发布的Figure 02中2.25 KWh 定制电池组可提供高出50%的电量,在实际部署中工作更长时间。电池被集成到人形机器人的躯干中,使其重心更靠近中心线,有助于使机器人更加灵活。
Figure AI还为第二代机器人制造了定制电机,以优化每个关节的功率和性能,电机与机器人关节的传动系统集成在一起,肩部、肘部、臀部和膝盖等四个主要关节组均设计简洁。有分析称,以往在设计新机器人时,可靠地将内部电缆穿过旋转关节是每个机器人专家的难题。
新型机器人还有一大特征是配置第四代手部装置,最新设计具有16个自由度(DoF)和可与人类媲美的力量,可承载高达25公斤(55.1 磅)的重量,并灵活执行各种类似人类的任务。
公司称,自2022年成立以来,就投入重金研发机器人手的设计与功能。最新代机器手与人类的手造型相似,每只手上都有四根手指和一个相对的拇指,目标是能够操纵人手可以抓住的任何东西。
每根手指都由一个传感器和电机集成的单元驱动,手腕是另一种新颖的设计,它提供与人类手腕类似的运动范围,同时将所有电源和传感器信号线包裹并布线到手和手指。
截图自Figure AI CEO的社交媒体
公司称,Figure 02最近在美国南卡罗来纳州的宝马汽车工厂进行用例训练,并收集用于AI模型的数据,已成功证明其系统可以在工业环境中运行,并且可以学习执行基本任务。
Figure AI的目标不仅是制造能提高工业生产力和效率的机器人,还有能改善人类生活质量的AI人形机器人。与OpenAI的牢固合作伙伴关系则有助于快速测试、验证和迭代实时语音指令功能。
截图自Figure AI官方发布的Figure 02工业用例视频
有分析指出,Figure AI无疑为今年资本市场的宠儿,在2月的B轮融资中斩获6.75亿美元时曾估值26亿美元。借助这些雄厚资金,公司联合创始人兼首席执行官Brett Adcock称正“全力以赴”,争取在未来两到五年内将自主双足机器人推向市场。
此前,评论界普遍将Figure AI的机器人称为“行走的ChatGPT”,预计将会把OpenAI最新发布的GPT-4o等多模态大模型继续集成在其中,打造能推理、看、听、说的人形实体ChatGPT机器人。
目前,其竞争对手Agility Robotics的人形机器人Digit,以及Apptronik公司的机器人Apollo都已部署到合约物流巨头GXO Logistics中执行相对简单的任务。亚马逊也正在测试Digit,梅赛德斯-奔驰则在测试Apollo。此外,特斯拉计划在其工厂中使用自研人形机器人Optimus,而波士顿动力公司(Boston Dynamics)计划在现代汽车的工厂中测试其最新版本的机器人Atlas。