36氪独家|理想智能驾驶围绕“端到端”变阵,加速AI大模型上车

文丨李安琪

编辑丨李勤 杨轩

在智能驾驶行业,“端到端”正引领着一场技术变革。这最先由特斯拉引起,国内华为、蔚小理等玩家纷纷跟进。技术之外,组织变动也接踵而至。

36氪汽车独家获悉,理想汽车近期成立了“端到端自动驾驶”的实体组织,整体200人出头;同时公司其他团队一些成员也在灵活支援项目。

理想不是唯一这样做的企业。此前蔚来汽车已经率先做出组织变革,成立了专门负责端到端的大模型部门。

理想智能驾驶团队主要分为算法研发、量产研发两个大组,团队约800人。“端到端”的研发主力部署在算法研发组,由理想智能驾驶技术研发负责人贾鹏负责。

具体来看,算法研发下设感知算法、行为智能、认知智能等组。“感知算法”由常黎主导;“行为智能”包含端到端架构、端到端模型、控制模型等,由杨毅负责;“认知智能”包含认知模型、云端模型等,实际由詹锟负责。

如果要打个比方,端到端三个主力小组的职责,分别对应智驾系统的感知能力、行走能力,和认知世界的能力。这基本与理想的端到端方案模块呼应。

前不久,理想公开了其端到端自动驾驶技术方案,其方案分为端到端模型、VLM(即Vision-Language Model,视觉语言模型)视觉语言模型、世界模型三部分。

此外,与算法研发组平行,量产研发组由量产负责人王佳佳负责,包含智能行车、智能泊车、智能安全等。贾鹏与王佳佳均向理想智能驾驶负责人郎咸朋汇报。

针对上述信息,36氪汽车向理想汽车求证,截至发稿,未获回应。

CEO李想公开表示,到今年底或明年初,理想就会推出端到端+VLM的自动驾驶方案,方案将由超1000万clips(视频片段)训练而成。理想还打算将参数达22亿的视觉语言大模型搬上车。

组织架构的实体化,也将从人力调度方面加速理想“端到端”计划的落地。

理想智驾,曲折自研

所谓端到端,就是把传感器数据作为输入,车辆控制指令作为输出,中间环节过程都靠AI神经网络模型来完成。这已经成为智能驾驶行业下一代共识方案。

但“端到端”方案的起势并不容易。据特斯拉计算,完成一个端到端自动驾驶的训练至少需要100万个、分布多样、高质量的 clips (视频片段)才能正常工作。

马斯克曾强调过数据在自动驾驶方面的重要性:“用100万个视频case训练,勉强够用;200万个,稍好一些;300万个,就会感到Wow(惊叹);到了1000万个,就变得难以置信了。”

对于刚刚转入端到端方案的车企而言,需要耗费一段时间才能看到成果。

然而当下国内的智驾行业竞争激烈,叠加特斯拉FSD(即Full-Self Driving,指特斯拉全自动驾驶软件包)入华、华为智驾的“鲶鱼效应”,小鹏、蔚来等玩家都在积极追击。

理想一直都扮演着智驾追赶者的角色。为了高效追赶,理想内部分成了两队人马。

一是在智驾系统AD Max上选择自研,搭载英伟达Orin芯片与激光雷达,提供城市领航辅助驾驶功能(具备城市道路点到点辅助驾驶能力);

二是在智驾系统AD Pro上与供应商合作,搭载地平线征程5芯片,无激光雷达,能提供记忆行车、城市LCC(车道居中辅助)等功能。

此前据36氪汽车报道,智驾AD Pro方案启用了智能驾驶供应商轻舟智航。轻舟有300多人,从去年末开始几乎全员驻场在理想的顺义总部。随着近日AD Pro版本车型功能升级,开发任务告一段落,轻舟主要人力已经撤出理想项目。

而在自研方案上,理想的城市领航辅助功能追赶几乎从2023年才开始。一年半多时间里,理想数次切换了智驾的技术路线。

2023年4月,理想喊出了城市NOA落地100城的目标,但“主要是为了应对华为和小鹏的智能驾驶冲击,口号先行”。近半年后,理想主动将“城市NOA100城”改成了“通勤NOA100城”(通勤NOA指在用户高频路段开启点到点辅助驾驶),因为前者“难度太大”。

然而“通勤NOA”的路同样不好走,有理想智能驾驶人士向36氪汽车解释,通勤方案的本质是预先建图,仍然依赖高精地图,不符合行业技术趋势。实际落地扩张效果也不好,“原定目标是一天开拓1条路线,但实际上三个月只构建了2-3条路线,效率很低”。

意识到不对,理想在去年转而全力追击“无图NOA”(指不依赖高精地图的城区点到点辅助驾驶)功能。

不过由于理想纯电车型MEGA失利,理想整体放弃80万辆的销量目标后,公司进入裁员节奏,智能驾驶团队也被波及。目前理想智能驾驶团队人数约800人,与年初的1300人相比已经大幅裁减。

而理想无图智驾方案的推送,也从原本的4月推迟到了7月。直到近日理想才向AD Max用户推送了无图NOA功能,号称全国范围内、可导航的城市道路都可使用功能。

在端到端的效果可检验之前,当下推送的功能版本,是理想智能驾驶占领市场、获得用户口碑的关键。

端到端是一场资源战

在端到端方案的实践中,先行者特斯拉FSD v12版本在北美地区已经取得了令人惊艳的效果。

而国内的玩家也从特斯拉的验证中,找到了通关秘籍:在积累海量的驾驶行为数据、更大云端算力的训练下,端到端方案会更加拟人。

今年4月,马斯克表示,对英伟达H100 AI芯片的采购量将从3.5万增加到8.5万,并计划投资100亿美元用于汽车的联合训练和推理人工智能。此外,特斯拉自研的训练芯片Dojo近期也开始在台积电投入量产。

同样,理想在走上端到端方案之后,也在筹谋更大训练算力。有内部人士告诉36氪,理想认为智能驾驶的下一个竞争点,一定是超算中心。

有知情人士告诉36氪,去年秋季雁栖湖会议上,美团CEO王兴、Y Combinator中国创始人陆奇都劝李想,在云端训练GPU领域加大投入。

据36氪汽车了解,除了去年向火山引擎购买的300多台英伟达服务器外,目前理想还跟阿里云、百度云等云厂商都有合作。“现在在高价收购英伟达的卡。”

同行也预判到了超算的重要性。从云端算力来看,目前华为是国内智能驾驶训练算力最大的玩家。华为表示,6月其智能驾驶训练算力将达3.5EFLOPS。小鹏、蔚来智驾中心算力分别是0.6EFLOPS、1.4 EFLOPS,而据36氪了解,理想的智算中心算力为1.4 EFLOPS。甚至老牌车企长城也在加入战局,超算中心算力为1.64EFLOPS。

端到端之战,不仅是车企智能驾驶技术路线的一次变更,更考验着车企们长期的兵马粮草供给。这将是一场耐力比拼。