当前位置：首页|资讯|自动驾驶|汽车

NVIDIA Research 研究科学家李柏依：探索基于多模态LLM 的自动驾驶智能体

作者：智东西发布时间：2024-10-25

自动驾驶汽车

让自动驾驶系统适应新环境和不同地区的习惯和法规是自动驾驶领域长期面临的挑战。NVIDIA Research 团队提出的自动驾驶智能体 LLaDA 能够利用 LLM 生成适应不同环境的驾驶策略和指令，为驾驶员和自动驾驶汽车提供多语言和地区交通规则的实时指导，帮助他们更轻松地在陌生的地方导航。此外，LLaDA 还能帮助自动驾驶汽车重新规划出与当地环境更加匹配的运动轨迹，调整自动驾驶汽车的运动规划策略。相关论文成果收录于 CVPR 2024 。

然而，LLaDA 无法实现场景的自动识别，且对场景描述的质量有着较高要求。尽管 GPT-4V 能够提供这种描述，但是却不够准确。为此，NVIDIA Research 提出一个创新的自动化视频字幕生成框架 Wolf。Wolf 采用专家混合方法，利用视觉语言模型(VLMs)的互补优势，能够提升自动驾驶智能体的场景理解能力。

此外，LLaDA 通常是与用户直接交互，并主要处理文本信息。相比之下，自动驾驶系统则需要提供具体的位置和轨迹规划信息。基于这些差异，NVIDIA Research 团队专为自动驾驶领域设计出一种多模态大型语言模型（MM-LLM）TOKEN。TOKEN 通过将复杂的交通环境转化为对象级别的知识单元，增强了自动驾驶车辆在面对长尾事件时的规划能力。该模型还结合了端到端驾驶模型的优势，解决了数据稀缺和标记化效率低下的问题。相关论文收录于 CoRL 2024 。

在上述背景下，智猩猩与 NVIDIA 策划推出「智猩猩公开课 NVIDIA 自动驾驶智能体专场」，并将于10月22日以视频直播形式进行。公开课邀请到 LLaDA 论文第一作者、NVIDIA Research 自动驾驶方向研究科学家李柏依进行主讲，主题为《探索基于多模态LLM 的自动驾驶智能体》。

李柏依博士首先会重点讲解 LLaDA 如何利用 LLM 生成适应不同环境的驾驶策略和指令；之后会解读如何使用 Wolf 框架生成字幕提升智能体的场景理解能力。接下来，李柏依博士会讲解如何基于 TOKEN 分解复杂交通场景提升智能体在长尾事件的规划能力，最后会分享在自动驾驶智能体上的未来研究方向，并进行展望。

推荐体验

相关资讯

NVIDIA Research 研究科学家李柏依：探索基于多模态LLM 的自动驾驶智能体

NVIDIAResearch团队提出的自动驾驶智能体LLaDA能够利用LLM生成适应不同环境的驾驶策略和指令，为驾驶员和自动驾驶汽车提供多语言和地区交通规则的实时指导，帮助他们更轻松地在陌生的地方导航。李柏依…

自动驾驶汽车

智东西 2024-10-25

NVIDIA Research 研究科学家李柏依：探索基于多模态LLM 的自动驾驶智能体 | 公开课预告

在上述背景下，智猩猩与NVIDIA策划推出「智猩猩公开课NVIDIA自动驾驶智能体专场」，并将于10月22日以视频直播形式进行。公开课邀请到LLaDA论文第一作者、NVIDIAResearch自动驾驶方向研究…

车东西 2024-11-05

丰田首席科学家普拉特欲探讨生成式AI用于自动驾驶

丰田汽车首席科学家吉尔普拉特（GillA.Pratt）近日接受采访时表示，计划探讨将生成式人工智能（

生成式AI 人工智能自动驾驶汽车

36氪 2024-10-22

前Uber首席科学家创办自动驾驶公司，用AI大模型预测未来几秒的路况

自动驾驶公司Waabi日前宣布，它正在使用一种生成式人工智能模型来帮助预测车辆的运动轨迹。这项名为Copilot4D的新系统使用激光雷达传感器的大量数据进行训练，这种传感器利用光来感知与物体之间的距离。

自动驾驶 AI大模型人工智能

DeepTech深科技 2024-03-16

综述 | 200+参考文献！自动驾驶的多智能体强化学习

来源：3D视觉工坊添加小助理：cv3d008，备注：方向+学校/公司+昵称，拉你入群。文末附3D视觉行业细分群。扫描下方二维码，加入「3D视觉从入门到精通」知识星球，星球内凝聚了众多3D视觉实战问题，以及各个模块的学习资料：近20门秘制视频课程、最新顶会论文、计算机视觉书籍、优质3D视觉算法源码等。想要入门3D视觉、做项目、搞科研，欢迎扫码加入！ [图片] 0. 论文信息标题：Multi-Agent Reinforcement Learning for Autonomous Driving: A S

3D视觉工坊 2024-08-26

近期资讯

佛山市南海中胜石油气有限公司取得一种安全阀门专利，能最大程度上保障安全阀正常运行

金融界2024年12月27日消息，国家知识产权局信息显示，佛山市南海中胜石油气有限公司取得一项名为“一种安全阀门”的专利，授权公告号CN222209168U，申请日期为2024年7月。

金融界 2024-12-27

常州华立取得一种阀门电动执行器的安装支架专利，能够将电动执行器快速安装在安装座上

金融界2024年12月27日消息，国家知识产权局信息显示，常州华立阀门控制设备有限公司取得一项名为“一种阀门电动执行器的安装支架”的专利，授权公告号CN222209171U，申请日期为2024年4月。

金融界 2024-12-27

方太取得能冷却散热的电磁阀结构专利，散热效果好

金融界2024年12月27日消息，国家知识产权局信息显示，宁波方太厨具有限公司取得一项名为“一种能冷却散热的电磁阀结构”的专利，授权公告号CN222209176U，申请日期为2024年1月。

金融界 2024-12-27

宁波飞狼自动化取得先导阀专利，加快装置反应速度

金融界2024年12月27日消息，国家知识产权局信息显示，宁波飞狼自动化有限公司取得一项名为“先导阀”的专利，授权公告号CN222209179U，申请日期为2024年3月。

金融界 2024-12-27

个性化手机字体设置指南：提升使用体验与视觉享受

想象一下，如果你的手机字体能够独具一格，那会多么酷炫呢！今天，我们就来聊聊怎么在手机上修改字体，让你的手机变得更有个性。首先，你可以在“设置”中找到“显示与亮度”选项，接着点击“文本大小”来调整文字的大小，虽然这不是字体的变化，但能让你的文字看起来更清晰、舒适。

新报观察 2024-12-27

中核核电运行管理有限公司取得一种电磁阀阀芯专利，使活塞稳定封堵通道

金融界2024年12月27日消息，国家知识产权局信息显示，中核核电运行管理有限公司取得一项名为“一种电磁阀阀芯”的专利，授权公告号CN222209175U，申请日期为2024年1月。

金融界 2024-12-27

浙江盾安取得电磁阀专利，解决现有技术中电磁阀的相关问题

金融界2024年12月27日消息，国家知识产权局信息显示，浙江盾安人工环境股份有限公司取得一项名为“电磁阀”的专利，授权公告号CN222209178U，申请日期为2024年3月。

金融界 2024-12-27

河北鹏凯取得自启闭阀门专利，解决现有手动阀门问题

金融界2024年12月27日消息，国家知识产权局信息显示，河北鹏凯机械设备制造有限公司取得一项名为“种自启闭阀门”的专利，授权公告号CN222209172U，申请日期为2024年5月。

金融界 2024-12-27

日照港油品码头有限公司取得可进行控制方式调控的阀门组件专利，能够实现两种远程控制模式的切换

金融界2024年12月27日消息，国家知识产权局信息显示，日照港油品码头有限公司取得一项名为“一种可进行控制方式调控的阀门组件”的专利，授权公告号CN222209173U，申请日期为2024年3月。

金融界 2024-12-27

咸阳鑫瓷泵业取得用于泥浆泵单向阀相关专利，解决单向阀阀盖更换成本高及材料浪费问题

金融界2024年12月27日消息，国家知识产权局信息显示，咸阳鑫瓷泵业有限公司取得一项名为“用于泥浆泵的单向阀阀盖、单向阀组件及其泥浆泵”的专利，授权公告号CN222209169U，申请日期为2024年7月。专利摘要显示，本实用新型公开了一种用于泥浆泵的单向阀阀盖、单向阀组件及其泥浆泵。

金融界 2024-12-27

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2026 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1