36氪独家｜理想智能驾驶围绕“端到端”变阵，加速AI大模型上车

作者：李安琪发布时间：2024-07-17

自动驾驶 AI大模型

文丨李安琪

编辑丨李勤杨轩

在智能驾驶行业，“端到端”正引领着一场技术变革。这最先由特斯拉引起，国内华为、蔚小理等玩家纷纷跟进。技术之外，组织变动也接踵而至。

36氪汽车独家获悉，理想汽车近期成立了“端到端自动驾驶”的实体组织，整体200人出头；同时公司其他团队一些成员也在灵活支援项目。

理想不是唯一这样做的企业。此前蔚来汽车已经率先做出组织变革，成立了专门负责端到端的大模型部门。

理想智能驾驶团队主要分为算法研发、量产研发两个大组，团队约800人。“端到端”的研发主力部署在算法研发组，由理想智能驾驶技术研发负责人贾鹏负责。

具体来看，算法研发下设感知算法、行为智能、认知智能等组。“感知算法”由常黎主导；“行为智能”包含端到端架构、端到端模型、控制模型等，由杨毅负责；“认知智能”包含认知模型、云端模型等，实际由詹锟负责。

如果要打个比方，端到端三个主力小组的职责，分别对应智驾系统的感知能力、行走能力，和认知世界的能力。这基本与理想的端到端方案模块呼应。

前不久，理想公开了其端到端自动驾驶技术方案，其方案分为端到端模型、VLM（即Vision-Language Model，视觉语言模型）视觉语言模型、世界模型三部分。

此外，与算法研发组平行，量产研发组由量产负责人王佳佳负责，包含智能行车、智能泊车、智能安全等。贾鹏与王佳佳均向理想智能驾驶负责人郎咸朋汇报。

针对上述信息，36氪汽车向理想汽车求证，截至发稿，未获回应。

CEO李想公开表示，到今年底或明年初，理想就会推出端到端+VLM的自动驾驶方案，方案将由超1000万clips（视频片段）训练而成。理想还打算将参数达22亿的视觉语言大模型搬上车。

组织架构的实体化，也将从人力调度方面加速理想“端到端”计划的落地。

理想智驾，曲折自研

所谓端到端，就是把传感器数据作为输入，车辆控制指令作为输出，中间环节过程都靠AI神经网络模型来完成。这已经成为智能驾驶行业下一代共识方案。

但“端到端”方案的起势并不容易。据特斯拉计算，完成一个端到端自动驾驶的训练至少需要100万个、分布多样、高质量的 clips （视频片段）才能正常工作。

马斯克曾强调过数据在自动驾驶方面的重要性：“用100万个视频case训练，勉强够用；200万个，稍好一些；300万个，就会感到Wow（惊叹）；到了1000万个，就变得难以置信了。”

对于刚刚转入端到端方案的车企而言，需要耗费一段时间才能看到成果。

然而当下国内的智驾行业竞争激烈，叠加特斯拉FSD（即Full-Self Driving，指特斯拉全自动驾驶软件包）入华、华为智驾的“鲶鱼效应”，小鹏、蔚来等玩家都在积极追击。

理想一直都扮演着智驾追赶者的角色。为了高效追赶，理想内部分成了两队人马。

一是在智驾系统AD Max上选择自研，搭载英伟达Orin芯片与激光雷达，提供城市领航辅助驾驶功能（具备城市道路点到点辅助驾驶能力）；

二是在智驾系统AD Pro上与供应商合作，搭载地平线征程5芯片，无激光雷达，能提供记忆行车、城市LCC（车道居中辅助）等功能。

此前据36氪汽车报道，智驾AD Pro方案启用了智能驾驶供应商轻舟智航。轻舟有300多人，从去年末开始几乎全员驻场在理想的顺义总部。随着近日AD Pro版本车型功能升级，开发任务告一段落，轻舟主要人力已经撤出理想项目。

而在自研方案上，理想的城市领航辅助功能追赶几乎从2023年才开始。一年半多时间里，理想数次切换了智驾的技术路线。

2023年4月，理想喊出了城市NOA落地100城的目标，但“主要是为了应对华为和小鹏的智能驾驶冲击，口号先行”。近半年后，理想主动将“城市NOA100城”改成了“通勤NOA100城”（通勤NOA指在用户高频路段开启点到点辅助驾驶），因为前者“难度太大”。

然而“通勤NOA”的路同样不好走，有理想智能驾驶人士向36氪汽车解释，通勤方案的本质是预先建图，仍然依赖高精地图，不符合行业技术趋势。实际落地扩张效果也不好，“原定目标是一天开拓1条路线，但实际上三个月只构建了2-3条路线，效率很低”。

意识到不对，理想在去年转而全力追击“无图NOA”（指不依赖高精地图的城区点到点辅助驾驶）功能。

不过由于理想纯电车型MEGA失利，理想整体放弃80万辆的销量目标后，公司进入裁员节奏，智能驾驶团队也被波及。目前理想智能驾驶团队人数约800人，与年初的1300人相比已经大幅裁减。

而理想无图智驾方案的推送，也从原本的4月推迟到了7月。直到近日理想才向AD Max用户推送了无图NOA功能，号称全国范围内、可导航的城市道路都可使用功能。

在端到端的效果可检验之前，当下推送的功能版本，是理想智能驾驶占领市场、获得用户口碑的关键。

端到端是一场资源战

在端到端方案的实践中，先行者特斯拉FSD v12版本在北美地区已经取得了令人惊艳的效果。

而国内的玩家也从特斯拉的验证中，找到了通关秘籍：在积累海量的驾驶行为数据、更大云端算力的训练下，端到端方案会更加拟人。

今年4月，马斯克表示，对英伟达H100 AI芯片的采购量将从3.5万增加到8.5万，并计划投资100亿美元用于汽车的联合训练和推理人工智能。此外，特斯拉自研的训练芯片Dojo近期也开始在台积电投入量产。

同样，理想在走上端到端方案之后，也在筹谋更大训练算力。有内部人士告诉36氪，理想认为智能驾驶的下一个竞争点，一定是超算中心。

有知情人士告诉36氪，去年秋季雁栖湖会议上，美团CEO王兴、Y Combinator中国创始人陆奇都劝李想，在云端训练GPU领域加大投入。

据36氪汽车了解，除了去年向火山引擎购买的300多台英伟达服务器外，目前理想还跟阿里云、百度云等云厂商都有合作。“现在在高价收购英伟达的卡。”

同行也预判到了超算的重要性。从云端算力来看，目前华为是国内智能驾驶训练算力最大的玩家。华为表示，6月其智能驾驶训练算力将达3.5EFLOPS。小鹏、蔚来智驾中心算力分别是0.6EFLOPS、1.4 EFLOPS，而据36氪了解，理想的智算中心算力为1.4 EFLOPS。甚至老牌车企长城也在加入战局，超算中心算力为1.64EFLOPS。

端到端之战，不仅是车企智能驾驶技术路线的一次变更，更考验着车企们长期的兵马粮草供给。这将是一场耐力比拼。

36氪独家｜理想智能驾驶围绕“端到端”变阵，加速AI大模型上车

理想智驾，曲折自研

端到端是一场资源战

推荐体验

相关资讯

理想汽车成立端到端实体部门，加速AI大模型上车

激战“端到端”，理想汽车智能驾驶正式进入AI大模型时代

商汤绝影王晓刚：端到端是智能驾驶的“ChatGPT 时刻” | 36氪专访

理想智能驾驶新突破，端到端+VLM系统，老司机级别的驾驶体验！

合成数据企业「光轮智能」获数千万Pre-A轮融资，加速端到端自动驾驶与商业出海 | 36氪首发

近期资讯

美股异动 | 量子计算概念股微美全息(WIMI.US)涨逾77%

手机无法开机的原因及解决方法详解

贵州“高瓦斯突出矿区无煤柱自成巷110工法智能化装备及技术”达到国际领先水平

海尔智家获得发明专利授权：“用于考勤的方法及装置、考勤系统”

格力电器获得发明专利授权：“电机转轴和磁悬浮电机”

数字时代视频电话使用技巧：提升沟通质量与亲密感的指南

TCL 雷鸟新品拍摄眼镜 V3 与光波导黑科技将亮相 CES 2025

全球首个重症医疗大模型落地

北京中轴线的赛博版：除了线上观摩清代皇帝祭祀，还能成为“数字打更人”

中大科技通过专精特新“小巨人”企业复核

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响