未来已来！OpenAI 大模型加持，Figure 01机器人实现与人类完美交流

作者：头部科技发布时间：2024-03-18

OpenAI 英伟达融资马斯克

文丨Congerry

人形机器人 Figure 又火了。（前情回顾：疯狂的机器人！贝索斯、英伟达等6.75亿美元投资马斯克擎天柱竞品）

原因是，通过与OpenAI的合作，Figure公司使得他们的机器人 Figure 01 能够与人进行深入交流，并根据对话内容独立作出决策和行动。

具体的画风是这样的。

，时长

02:34

当 Figure 01 被问到看到了什么？

Figure 01 可以描述它所看到的场景。

当提问者请求吃东西时，Figure 01 可以从一堆物品中判断苹果可以吃，并拿给提问者。

而当提问者让 Figure 01 思考如何收拾桌面的时候，Figure 01 也可以观察完以后判断把餐具收回沥干架。

整体来看，这段视频展示了Figure 01 在理解环境、做出决策和执行任务方面的能力，同时也体现了它与人类进行交流的能力。

那 Figure 01 是怎么做到的呢？

答案是OpenAI的多模态大模型，但是是不是GPT-4V并没有透露。

Figure 01 的工作流程是这样的：

Figure 01 摄像头捕获的图像和内置麦克风捕获的语音转文本数据被输入到一个由OpenAI训练的大型多模态模型中。这个模型能够理解和处理图像和文本数据。

模型会处理整个对话的历史，包括之前的图像信息，以生成语言回应。这些回应通过文本到语音（text-to-speech）技术转化为语音，回应给人类。

比如提问者通过说出“can I have something to eat?”（我能吃些东西吗？）来与机器人进行交流。模型生成的回应会通过文本到语音技术转换成机器人的声音，以“sure thing”（当然可以）回应用户的请求。

同一个模型还负责决定执行哪个学习到的闭环行为来完成给定的命令。这涉及到将特定的神经网络权重加载到GPU上，并执行相应的策略（policy）。

当然，只有大脑，没有身体也不行。这些策略会指导机器人进行快速而灵巧的操作（fast dexterous manipulation）。

Figure 01 的动作由视觉运动Transformer控制，它将图像直接转化为动作。

它们以 10 Hz 的频率处理来自机器人摄像头的图像，并以 200 Hz 的频率生成 24 个自由度（手腕位置和手指角度）的动作。

全身控制器（Whole Body Controller）能够以更高的1kHz频率输出各个关节的扭矩指令，确保机器人动作的安全性和平衡性，有效防止机身倾覆或关节超限伤害。

不得不说，Figure 01 + OpenAI 实现了人类想象中的人形机器人。

这也让很多网友都直呼疯狂。

当然，对 Figure AI 创始人“用一个世界模型操作十亿个机器人”的目标来说，这仅仅是个开始。

相关资讯

Figure首发OpenAI大模型加持机器人

近日，FigureAI发布了一段引人注目的视频，向公众展示了其最新研发的人形机器人Figure01的多种技能。该视频引发了网友的热议，有人留言称：“未来5-10年绝对是一个疯狂的时代”。据了解，Figure0…

OpenAI

网界 2024-03-19

智哪儿 2024-10-24

500字解释最近热门的Figure01（openai加持），具身机器人，embodied agent

问了一个搞robotics的朋友，Figure 01在robo这个领域来说，其实还是有意义的。其实它主要是厉害在能够准确的执行识别、抓取、移动等任务，而不是自媒体宣传的优势。至于大模型、openai、多模态等等热门关键词，都是给外行和资本看的，如果想了解这方面的技术，可以看看大模型的 function call，这不是很强的技术（相对而言）。更多的信息：figure 01的技术思路和 humane ai 有点相似。既然谈到了多模态，其实现在没有公开的优秀的多模态的产品，哪怕是openai、Google等

OpenAI 谷歌

二次白熊菌 2024-03-16

近期资讯

赶在美台合作落实前，大陆先订购百万架无人机，为收台准备？

美国和台当局最近的“无人机合作”再一次把这个话题推向了风口浪尖。之前听到美方代表团窜访台湾，寻找无人机零部件供应商，并签署了一份庞大的采购协议，不少人深感其中的震撼与不安。（美代表窜台找无人机零部件供应商）自从无人机在实战中展现出其独特的用途后，各方对它的重视程度逐渐增加。

毅见任说 2024-12-27

今天升级！全新岚图梦想家更聪明了

用户仅需一键即可完成“车位到车位”全程领航驾驶辅助。该功能激活后，车辆能自主通过商圈停车场的闸机，自主在停车场巡航，自主驶入公开道路，自主驶入目的地停车场，自主泊入终点车位等，同时U型调头、环岛进出、拥堵路段智能选道、绕行施工区域等复杂道路场景智驾全覆盖。

东风汽车 2024-12-27

新年送礼首选！华为智能手表开启健康新年！

岁末将至，圣诞节、元旦等喜庆节日如约而来，为了开启2025年的健康好彩头，大家不妨为自己或亲友选购一款智能穿戴设备，用科技点亮关怀，用智能守护健康。作为智能穿戴领域的领先品牌，华为凭借十余年的深耕积淀，不断创新，与用户共同成长。

雷科技 2024-12-27

商络电子：已为Meta、小米等VR/AR眼镜供货

钛媒体App12月27日消息，商络电子在互动平台表示，公司高度重视该领域的快速发展和广泛的市场空间，目前已直接或间接供货于Meta、小米、索尼、三星、字节跳动的VR及AR眼镜（包含试制项目），供应产品包括传感器、电感、滤波器、电容、电阻、二三极管、电池、磁性元件等。

钛媒体快报 2024-12-27

智慧重塑豪华北京问界品牌体验中心启幕倒计时

北京问界品牌体验中心即将在长安街沿线东方广场新天地首层盛大启幕。据悉，作为问界品牌对外交流展示的平台，体验中心集品牌体验、产品交互、技术展示、售后服务等于一体，将为消费者打造多场景多触点的全方位品牌体验。作为赛力斯与华为联合打造的融合品牌，问界今年以来新品不断迭代，持续收获市场认可及用户喜爱，屡创行业纪录。

央广网 2024-12-27

年底送礼推荐：华为智能手表助你开启健康生活

随着2025年逐渐临近，转眼间我们又要站在迎接新年的门槛上了。数字系列46mm版本以锐利线条勾勒出“八边形战士”的前卫风格，41mm、42mm的款式则以柔和的曲线搭配金叶设计表圈呈现优雅精致的美感，如同“耀目小光环”，流露出优雅的气质与不凡的品位。

数字尾巴 2024-12-27

日喀则和长白山40米射电望远镜落成启用

12月27日，记者从中国科学院获悉，日喀则和长白山40米射电望远镜宣告建成启用。据悉，在探月工程支持下，中国科学院上海天文台于2023年9月相继启动了位于吉林长白山和西藏日喀则两地的40米口径射电望远镜建设项目。

光明网 2024-12-27

Magic7系列全面升级大王影像荣耀罗巍自信征集网友拍摄难点

荣耀首席影像工程师罗巍，近日微博发布样张再次展示“大王影像”的实力，同时自信回应并向网友广泛征集日常拍摄的难点，希望在未来的影像技术革新中解决消费者的难题。荣耀罗巍在微博中的写到：“我这里公开征集大家平常在手机摄影或录像中想拍，但是没法实现的场景。”

iMobile爱科技 2024-12-27

能碳转型下半场，新奥泛能网想用AI赋能企业

2008年启动的泛能业务，让新奥集团成为了行业里率先看到未来的人。从清洁能源起家，却志不在能源，而在能源产业的数智化赋能。伴随着近年AI等数智技术的飞速进步，新奥构想中的能碳数智化服务迅速落地成为现实，且不断迭代进化。

文艺sao客 2024-12-27

2024过去了，留下十个科技记忆

有人说科技大环境不好，有人闷声发大财；有人说AI真难做，赚不到钱融不到资；有人说AI前景光明，此时不加码更待何时？如果想要给如此复杂的2024梳理出科技发展的主线，我想应该是两个关键词，一个是AI，一个是自强。如果我们心平气和回顾过去几年的手机发布会，应该会承认今年的手机创新是幅度最大，也是最有趣的。

脑极体 2024-12-27

未来已来！OpenAI 大模型加持，Figure 01机器人实现与人类完美交流

推荐体验

相关资讯

Figure首发OpenAI大模型加持机器人

Figure 01：人形机器人与AI模型的完美合作

Figure首发OpenAI大模型加持的机器人demo

最强地表人形机器人：OpenAI加持的最新人形机器人Figure02来了

500字解释最近热门的Figure01（openai加持），具身机器人，embodied agent

近期资讯

赶在美台合作落实前，大陆先订购百万架无人机，为收台准备？

今天升级！全新岚图梦想家更聪明了

新年送礼首选！华为智能手表开启健康新年！

商络电子：已为Meta、小米等VR/AR眼镜供货

智慧重塑豪华北京问界品牌体验中心启幕倒计时

年底送礼推荐：华为智能手表助你开启健康生活

日喀则和长白山40米射电望远镜落成启用

Magic7系列全面升级大王影像荣耀罗巍自信征集网友拍摄难点

能碳转型下半场，新奥泛能网想用AI赋能企业

2024过去了，留下十个科技记忆

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响