3D-LLM：让AI聊天机器人可以解读三维世界

作者：站长之家发布时间：2023-08-01

站长之家（ChinaZ.com）8月1日消息:研究人员推出了一款名为3D-LLM的新方法，可以将对3D 环境的理解融入到大型语言模型中。这意味着聊天机器人将能够理解和处理3D 空间的概念，从而更好地在三维世界中导航和操作。

大型语言模型和多模态语言模型可以处理语音和2D 图像，比如ChatGPT、GPT-4和Flamingo。然而，这些模型缺乏对3D 环境和物理空间的真正理解。研究人员现在提出了一种称为3D LLM 的新方法来解决这个问题。

3D LLM 旨在通过使用点云等3D 数据作为输入，为 AI 提供3D 空间的概念。通过这种方式，多模态语言模型应该理解空间关系、物理和可供性等概念，而这些概念仅靠2D 图像很难掌握。3D LLM可以使人工智能助理能够在3D 世界中更好地导航、规划和行动，例如在机器人技术和实体人工智能领域。

为了训练模型，团队需要收集足够数量的3D 和自然语言数据对 - 与网络上的图像文本对相比，此类数据集是有限的。因此，团队开发了ChatGPT的提示技术来生成不同的3D描述和对话。

结果是包含超过300，000个3D 文本示例的数据集，涵盖3D 标记、回答视觉问题、任务分解和导航等任务。例如，ChatGPT 被要求通过询问有关从不同角度可见的物体的问题来描述3D 卧室场景。

然后，该团队开发了3D 特征提取器，将3D 数据转换为与预训练的2D 视觉语言模型（例如 BLIP-2和 Flamingo）兼容的格式。

此外，研究人员使用3D 定位机制，允许模型通过将文本描述与3D 坐标相关联来捕获空间信息。这也促进了使用 BLIP-2等模型来有效地训练3D LLM 来理解3D 场景。

实验结果显示，3D 语言模型可以生成对3D 场景的自然语言描述，进行3D 感知对话，并将复杂任务分解为3D 动作。这表明，通过结合空间推理能力，人工智能有潜力开发出更接近人类的3D 环境感知。

研究人员计划将这种模型扩展到其他数据模式，如声音，并训练它们执行其他任务。这将进一步提高 AI 助手在多模态环境中的能力。最终的目标是将这些进步应用到可以与3D 环境智能交互的具体 AI 助手中。这意味着未来可能会有更智能的机器人和具体人工智能应用程序。

相关资讯

通过LLM构建聊天机器人必备技巧

聊天机器人在AI领域并不稀奇，尤其是ChatGPT问世之后，很多人都把它当成一个可以随时对话随意提问的聊天机器人。而在实际应用领域，聊天机器人的场景也愈加丰富多样。比如很多人熟知的客服聊天机器人，常用在电商领域，能够快速回答常见问题或者跟踪发货状态等等；还有医疗聊天机器人，在读取患者的症状并且持续提问后，就患者下一步应该采取的措施提出正确的建议；以及还有辅助销售的聊天机器人，用于财务计算、法务咨询相关的聊天机器人等等。那么，如何拥有一个符合自己场景需求的聊天机器人？语言技术教育家Rachael

ChatGPT 客服医疗教育

AI研习所 2023-06-21

张鑫钰 2023-07-24

近期资讯

海豹家族“豹”款集结亮相专业赛道尽显极致驾驶体验

【陕西汽车在线讯】比亚迪海洋网的海豹家族车型可以说是集体优秀，就像有趣的灵魂与好看的皮囊，鱼与熊掌都恰好同框了！每一款都有独特的魅力！像近期关注较高的2025款海豹和海豹07 DM-i，分别搭载了代表比亚迪纯电及插混最新技术的e平台3.0Evo和第五代DM技术，在动力和续航上实现了新的突破；另外还有一位主打运动性能的青年代表作海豹06GT，如果说前两者是内外兼修的谦谦君子，那么这位可是潇洒爱自由的少年郎，不仅能满足你关于速度的想象，还确实能为你带来极致驾驶体验感！日前在西安“豹游记——海豹家族媒体试驾盛会

陕西汽车在线 2024-12-27

在当今数字化浪潮中，数据宛如一座亟待挖掘的宝藏，而Snowflake作为新一代云数据平台的佼佼者，正引领着企业走向高效、灵活的数据管理与分析之路。世达教育推出Snowflake认证课程，旨在满足市场对Snowflake专业技术人才的迫切需求，为数据领域从业者提供提升技能与竞争力的优质学习平台。 [图片] （图片来源于官网） Snowflake是一种基于云的SQL数据仓库，其架构设计旨在提供高可用性、可扩展性和性能。Snowflake的架构分为三个主要部分：存储层、计算层和控制层。 · 存储层：负责数据的存

世达IT-薇儿的梦 2024-12-27

Nothing Phone (2a)| Best Value

最佳价值之选：Nothing Phone (2a) 感谢 @MKBHD 的认可！我们对2025年的发展充满期待，敢于不同，选择Nothing。 [图片] [图片]

Nothing 2024-12-27

S30C（一种中碳钢）金相组织均匀

1. 概述 S30C是一种中碳钢，属于日本JIS G4051-2009标准中的牌号，也称为高级优质碳素钢。这种钢材由电炉、平炉或纯氧转炉炼钢法制造的镇静钢，具有高耐磨性及韧性，金相组织均匀，可加工性优良。 2. 化学成分 S30C的化学成分如下： · 碳(C)：0.27% - 0.33% · 硅(Si)：0.15% - 0.35% · 锰(Mn)：0.60% - 0.90% · 磷(P)：≤0.030% · 硫(S)：≤0.035% · 铜(Cu)：≤0.30% · 镍(Ni)：≤0.20% · 铬(Cr

上海钢泽合金 2024-12-27

提升EDM邮件送达率，精准营销从此开始

EDM邮件群发如何确保高效送达？关键在于四大策略：优化邮件内容、锁定精准目标受众、确保合规发送以及采取技术优化措施。电子邮件营销（EDM）凭借其低成本、高效益的特点，成为了众多企业青睐的营销手段。然而，在实际操作中，如何提升邮件送达率却成为了企业面临的共同挑战。本文将深入探讨EDM邮件群发中提高送达率的有效策略，并结合Zoho Campaigns的实际应用，为企业提供具有操作性的实践指南。一、理解EDM邮件送达率的重要性1. 送达率对市场营销的影响送达率是指成功发送至目标收件人邮箱的电子邮件占总发送邮件数

Zoho云服务 2024-12-27

3D-LLM：让AI聊天机器人可以解读三维世界

推荐体验

相关资讯

通过LLM构建聊天机器人必备技巧

ai聊天机器人怎么用？聊天ai机器人？

ChatGPT 聊天机器人如何革新聊天机器人技术

聊天机器人有哪些？在线ai聊天机器人入口在哪？

ai聊天机器人怎么用？ai聊天机器人app有哪些？

近期资讯

海豹家族“豹”款集结亮相专业赛道尽显极致驾驶体验

统威轮胎保护链23.5-25型

百度网盘拉新与迅雷网盘拉新分别优势是什么？一手推入口哪里找？

建设现代化城市和城市科学

高中政治必修四知识点满分必备小技巧

解锁数据潜能，从Snowflake认证课程启航

Nothing Phone (2a)| Best Value

S30C（一种中碳钢）金相组织均匀

提升EDM邮件送达率，精准营销从此开始

【高中生物】365条高频考点，有了它，成绩稳上85+！

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响