Figure AI最近推出了他们的最新人形机器人作品——Figure 01,这款机器人搭载了OpenAI的尖端AI技术,展现了令人震撼的对话交互能力。它的动作灵活、反应迅速,与人类的交流几乎毫无障碍,让人难以分辨其真伪。这一创新成果在Figure AI获得OpenAI、微软、英伟达等公司投资后的仅仅半个月内就成功问世,预示着未来可能发生的巨大变革。
Figure 01不仅能听会说,还能理解并执行复杂的人类指令。在展示视频中,我们看到它能够准确理解人类的意图,并根据自然语言指令执行各种动作,如抓取、放置物品,甚至解释自己的行为逻辑。此外,该机器人还能详细描述所见之物,例如听到“想吃东西”的指令时,它会立刻递上一个苹果。更令人印象深刻的是,这些演示都是实时进行的,没有经过任何加速处理,充分展示了该机器人的惊人速度和敏捷性。
数字经济应用实践专家骆仁童博士表示,Figure 01是一款具有划时代意义的人形机器人,它将OpenAI的强大AI技术与先进的机器人硬件完美结合,为我们揭示了未来机器人的无限可能性。
Figure人形机器人的智能源自先进的端到端大语言-视觉模型,标志着具身智能领域的最新突破。
谷歌在类似领域已取得显著进展,然而谷歌的机器人模型当时仅能基于对话执行简单任务,无法与人类进行深度对话或解释其决策逻辑。
相比之下,Figure自2022年成立以来,在短短13天内与OpenAI合作推出了能够自主对话和决策的机器人,显示出机器人智能发展的加速趋势。
Figure联合创始人兼首席执行官Brett Adcock和AI团队负责人Corey Lynch在X平台上详细解析了机器人互动背后的原理。此次突破归功于OpenAI和Figure的共同努力,OpenAI提供视觉推理和语言理解支持,而Figure的神经网络则负责实现快速、低水平、灵巧的机器人动作。
机器人的所有行为均基于学习和内化的能力,无需远程操作。研究人员将机器人摄像头捕捉的图像和机载麦克风转录的文本输入到OpenAI训练的多模态模型中,处理对话历史记录并生成语言响应,再通过文本到语音技术回复人类。同时,该模型还负责决定在机器人上执行哪些学习闭环行为以完成给定命令,通过加载特定的神经网络权重到GPU并执行策略来实现。
Figure 01的成长速度犹如火箭升空,自2022年1月在硅谷诞生以来,这家年轻的公司仅用两年时间便实现了令人瞩目的飞跃。其背后的团队汇集了来自波士顿动力公司、特斯拉、谷歌DeepMind和Archer Aviation等顶尖AI机器人领域的精英力量。2023年4月19日,Figure成功完成7000万美元A轮融资,进一步加速了其发展步伐。
Brett Adcock凭借丰富的创业经验,带领Figure不断突破创新边界。他在2013年创立了求职招聘应用Vettery,并在2018年成功将其卖给Adecco集团。如今,Adcock再次展现其远见卓识,于2022年创立Figure,致力于通过人形机器人解决劳动力短缺问题。
在短短几个月内,Figure 01便展现出惊人的学习能力。今年1月,它成功掌握了制作咖啡的技能,仅需10小时的训练便能熟练操作。一个月后,Figure 01又学会了搬运箱子并运送至传送带的新技能,虽然速度仅为人类的16.7%,但这一进步标志着它在自动化领域的巨大潜力。
与此同时,Figure AI商业化的步伐也在紧锣密鼓地进行。公司与宝马制造公司签订了商业协议,将AI和机器人技术融入汽车生产线,为宝马的工厂注入了新的活力。此外,Figure还宣布完成了6.75亿美元的B轮融资,公司估值飙升至26亿美元。这一轮融资吸引了包括Microsoft、OpenAI创业基金、英伟达、Jeff Bezos、Parkway Venture Capital、Intel Capital和Align Ventures在内的众多硅谷重量级投资者。
值得一提的是,OpenAI与Figure还宣布将共同开发下一代人形机器人AI模型。这一合作将充分利用OpenAI的多模态模型在机器人感知、推理和交互环节的优势,推动人形机器人技术的飞速发展。
在Figure的推文中,其宣布其目标是训练一个世界模型,最终能够卖出十亿个级别的模型驱动的人形机器人。但整体而言,这个市场目前仍处于起步阶段。数字经济应用实践专家骆仁童博士指出,由于未形成产业化,目前人形机器人各大参与者以研发为主,部分参与者从特定功能需求出发进行开发,以寻求一定程度的落地,但从当前的投资动向来看,人形机器人之争会逐步从产品硬件转向智能化程度之争,但进入者还需要谨慎。
Brett Adcock强调,他们的机器人速度已经取得了显著提升,甚至开始接近人类的速度。这一进步不仅揭示了机器人技术的飞速发展,而且还暗示了一个明确的趋势:随着AI大模型的逐渐成熟,它们终将融入我们的现实世界。
在这个过程中,具身智能(Embodied Intelligence)被视为最佳的路径。英伟达创始人黄仁勋也曾敏锐地指出:“具身智能将引领下一波人工智能浪潮。”
成熟的AI大模型就像人工大脑一样,能够模拟人脑的复杂神经网络,从而实现语言理解、视觉识别、情景推理等多种认知功能。这使得机器人能够解决更高层次的认知和决策问题。
同时,各种传感器、执行器和计算单元被集成到机器人的躯体中,使其能够感知和与环境进行互动。例如,视觉系统可以捕捉图像和视频,而触觉传感器则可以感知物体的形状和质地。这种全方位的感知和交互能力使得机器人更加接近人类的行为模式。
Brett Adcock在之前的采访中表示,他们计划在未来1-2年内专注于开发具有里程碑意义的产品。他们希望在不久的将来向公众展示人形机器人的研发成果,这些成果将涵盖AI系统、低级控制等多个方面。最终目标是呈现出能够在日常生活中大展身手的机器人,让我们的生活变得更加便捷和美好。
多家公司正竞相推动人形机器人技术的商业化进程。其中,亚马逊资助的Agility Robotics计划在未来建立一家工厂,预计每年能生产高达1万台的双足机器人Digit,目前该机器人的运营成本为每小时10至12美元。特斯拉的Optimus机器人也备受瞩目,目前已进入关键的研发阶段,尽管在实际应用场景中稍逊于Agility的Digit和Figure AI的Figure 01,但仍保持技术领先地位。马斯克曾公开表示,预计在2024年实现Optimus的部分量产,并在2025年开始大规模商业化落地。
此外,波士顿动力已经推出了多款人形机器人,而1X Technologies则在OpenAI的支持下成功筹集了1亿美元的资金。这些都显示出人形机器人行业的巨大潜力。高盛预测,到2035年,人形机器人市场规模有望达到1540亿美元,有望成为缓解老年护理劳动力短缺问题、减轻家庭和社会负担的新方案。
去年11月,中国工信部发布了《人形机器人创新发展指导意见》,提出到2025年,人形机器人创新体系初步建立,整机产品达到国际先进水平,并实现批量生产;到2027年,技术创新能力显著提升,构建具有国际竞争力的产业生态,综合实力达到世界先进水平。
长远来看,随着执行器、电机组件、传感器等关键部件成本的降低以及计算成本的优化,人形机器人的成本有望低于目前的廉价电动汽车。机器人专家Eric Jang曾指出,尽管许多AI研究者认为通用机器人的普及还需数十年,但ChatGPT的快速崛起提醒我们,技术进步可能比我们预期的更快。
我们有理由期待,在不久的将来,Figure将继续引领AI和机器人技术的发展潮流,特斯拉的擎天柱已经不是唯一值得期待的人形机器人了。
其他人工智能新趋势:
全面超越GPT4?Anthropic的Claude 3会成为全球最强大模型吗?
OpenAI的文本生成视频大模型Sora震撼面世,2024年会是“AI视频生成元年”吗
谷歌发布迄今为止最强AI人工智能大模型Gemini,能打败Openai的GPT4 Turbo吗?
谷歌开源Gemma,全球AI技术竞争进入新阶段?
OpenAI首次举办开发者大会,国内AI大模型创业公司和BAT大厂恐怕都要重新定战略了……
AI 热潮真的只是炒作?看看美媒选出的这 10 大初创公司
商道童言(Innovationcases)欢迎点赞和分享哦!~~
免费电子书:结构化思维 | 荆棘商途 | 年度十词 | 创新企业案例 | 区块链金融
数字经济应用实践专家 骆仁童主讲课程
人工智能:《AI趋势》《ChatGPT》
数字应用:《区块链》《元宇宙》《大数据》
数字中国:《智慧城市》《数字政府》《智慧建筑》《智慧交通》
数字化转型:《制造业数转》《零售业数转》《中小企业创新》
产业数字化:《烟草数转》《银行金融科技》《电力能源互联网》
宏观与趋势:《数字经济》《2024宏观》《双碳》
思维与技能:《数字化思维》《组织变革》
创新与创业:《创业导师》《商业模式》
Python好学编程 2024-12-20