特斯拉向左,Mobileye向右
从ADAS到自动驾驶,这条路应该怎么走?事实上,在过去的一个月时间里,特斯拉和Mobileye给出了两条不同的路径。
特斯拉选择通过定制芯片来寻求在视觉人工智能能力上的持续提升。这款名为D1的服务器端定制芯片,用于高效训练Autopilot/FSD系统的机器学习算法。而Mobileye则推出了面向不同等级自动驾驶的硬件架构方案,同时自主研发部署下一代传感器,包括激光雷达和4D成像雷达。
特斯拉首席执行官埃隆·马斯克在AI Day发布会上表示,提高用于训练公司神经网络的计算机系统的性能,将是自动驾驶技术进步的关键。“如果一个模型训练需要几天而不是几个小时,这就是技术的差距。”
在此之前,特斯拉先后放弃了Mobileye和英伟达的第三方供应商芯片,转而自主设计了车端处理芯片。但由于没有更强大的数据训练平台,特斯拉一直以来需要倚重通过“用户测试”来发现问题,这在过去几年时间里带来了巨大的安全风险。
过去几年时间,辅助驾驶及自动驾驶初创公司都在使用神经网络来训练识别道路上的物体,但特斯拉更依赖这项技术,一个被称为“Transformer”的神经网络同时接收8个摄像头的数据输入。
而Transformer模型最早是谷歌团队在2017年进行了应用,在目前自然语音处理(NLP)领域的应用非常广泛。而在计算机视觉领域的应用,同样优势明显。
比如,Transformer模型摒弃了传统RNN中的循环结构,解决了RNN不能并行计算的限制,大大加快了模型训练的速度。同时,在CNN模型中,通过卷积计算两个位置之间的关联所需的操作次数是随距离增加的,而Transformer计算两个位置之间的关联所需的操作次数不随距离增加。
更关键的是,Transformer可以产生更具可解释性的模型。从上述这些优势中可以看出,特斯拉的目标是,解决模型训练的效率,同时对于系统做出的决策寻找更多可能的逻辑理解。
到目前为止,与许多同行的策略不同,特斯拉没有使用激光雷达。相反,完全依赖于通过使用神经网络算法来解析来自摄像头的数据输入来解释场景。这需要更多的计算,必须根据摄像头的反馈来实时重建周围环境。
此外,特斯拉也比其他公司收集了更多的真实数据用于训练。数据显示,特斯拉此前雇佣了1000名员工为这些采集的图像进行标记以帮助训练模型。正如特斯拉人工智能负责人安德烈·卡帕西所言,“我们实际上是在从头开始打造系统。”
不过,一些行业人士指出,特斯拉的方法有一个风险,那就是,在一定程度上增加更多的数据可能不会让系统变得更好。“这不是简单的增加更多数据的问题。”
在上个月的特斯拉AI Day发布会上,这家公司的工程团队说了这样的话,“我们没有做太多的持续学习。我们训练系统一次,微调几次,然后就上车。我们需要一些稳定的东西,我们可以广泛地评估。所以我们不会做太多的持续学习……”
而更关键的是,每一次硬件的升级,在软件上的变化似乎都会让特斯拉的系统发生性能上的“倒退”。有海外机构指出,此前特斯拉几次对于横向行驶车辆、路边停放车辆的碰撞,都使用了不同的硬件和软件版本。
显然,特斯拉没有能够在现有的软硬件体系下找到快速、有效的解决方案。
如果,特斯拉按照自己对外宣传的那样,进行了不断的数据训练和模型更新,应该不会在相隔几个月甚至一两年时间里,系统在非常类似的场景下发生同样的问题。显然,随着时间的推移,特斯拉的系统实际上并没有进步,只是变得越来越糟。
一篇来自IEEE的论文这样解释道,这些结果说明,测试一个软件的版本,不太可能发现严重的缺陷。等到新的软件部署完成后才发现缺陷是致命的,这意味着跨多个车型和软件版本的更严格的监管认证不能缺失。
就连特斯拉自动驾驶软件负责人CJ Moore也曾明确表示,马斯克关于自动驾驶能力的说法“与工程现实不符”。显然,自我学习不是根本问题,考虑到特斯拉影子模式在过去5年时间里累计行驶了数十亿英里,但仍然分不清停在路边的警车。
更多的证据是,Waymo声称拥有大约2000万英里的自动驾驶实际道路测试里程,但不可否认的是,这家公司也还远远没有准备好广泛部署Robotaxi。
而对于RoboTaxi业务何时真正全面开放,该公司前任首席执行官John Krafcik曾表示,“我确实和你一样有不确定感,即使是在我的职位上。我不知道什么时候一切都会准备好。”
此外,特斯拉之前发给加州机动车辆管理局的一份备忘录中已经明确表示,“Autopilot和FSD都不是自动驾驶系统,目前还没有任何功能是完全自动的,或让我们的汽车实现真正的自动驾驶。”
此前,一家著名的机构发布报告称,自动驾驶汽车需要行驶数亿英里,甚至是数千亿英里,才能证明其安全方面的可靠性。显然,这样的指标,对于所有企业来说,都是不可能承受的时间成本。
有业内人士指出,如果一个司机需要学习 大量的边缘(长尾)场景才能成为有经验的安全司机,那么任何人都不可能达到。事实证明,人类驾驶员达到良好的驾驶水平并不需要大量边缘场景的经验。
二、
本周,Mobileye进一步强化在L4自动驾驶领域的前瞻性布局。该公司宣布,将于2022年在德国率先部署Robotaxi服务。但和特斯拉不同的是,Mobileye没有去强化视觉的能力,而是为不同功能ODD定义不同路线。
尽管两家公司都在寻求逐步改进他们的驾驶辅助系统,最终发展成完全自动驾驶的解决方案,但Mobileye首席执行官Amnon Shashua认为,特斯拉的方法是错误的。“通过在量产车上部署测试系统,然后不断改进、改进、再改进,听起来很合理,但实际上这是一种蛮力的方式。”
目前,在技术架构方面,Mobileye已经形成了体系化组合,在规模化量产方面,包括传统的满足新车评级要求的L2级及以下ADAS系统(基于单目视觉或者毫米波雷达融合),Mobileye SuperVision(基于360度视觉感知的解决方案)。
在面向L4级自动驾驶出行方面,则部署了视觉感知、雷达和激光雷达感知并行冗余的Mobileye Drive(满足L4级Robotaxi场景要求),同时还用上了高精地图REM众包以及RSS责任敏感安全模型,来实现在不同地域的快速适配。
这其中,除了传感器配置和特斯拉的差异化,Mobileye再次强调了RSS责任敏感安全模型的重要性。作为一套通过数学公式定义的驾驶决策模型,RSS通过制定一系列逻辑上可行的规则和有关适当应对危险场景的策略,明确了自动驾驶怎样才算真正做到安全驾驶。
按照Mobileye的说法,和数百万英里的实际日常行驶或者测试里程来进行验证不同,因为RSS是一个数学模型,只需要相应的场景测试来确保系统决策与规范匹配,从而大大减少了验证的负担。
同时,Amnon Shashua认为,和特斯拉采集数据不同,Mobileye通过采集数据,重点是理解“道路的语义”。在过去的五年时间里,这家公司已经通过合作伙伴的车辆系统积累了超过500万英里的有效数据。
有业内人士表示,某种意义上来说,特斯拉的马斯克对于自动驾驶的理解,更坚定地植根于自己的信仰,这适合一家汽车制造商的模式;而Mobileye更加务实,作为一家供应商,需要根据市场的变化、政策法规以及安全责任来进行灵活调整。
这也可以从几年前双方“分手”时,对于各自的评论可见一斑。
Amnon Shashua认为,全自动驾驶需要在复杂性和需要确保极高的安全性方面进行“范式转变”。特斯拉的做法,在很大程度上会对Mobileye的声誉和整个行业都有很大影响。“我们认为,在这个领域继续与特斯拉合作不符合公司的利益。”
而马斯克表示,Mobileye与其他汽车制造商的协议使其无法跟上特斯拉的技术发展步伐。“因为他们作为第三方供应商,必须支持适配其他汽车制造商同行的数百款车型。”
此外,和特斯拉相比,Mobileye的底气似乎更足。一方面,母公司英特尔在芯片领域的实力和技术积累,可以在下一阶段帮助Mobileye实现芯片层面的技术迭代。同时,Mobileye还在部署下一代传感器的自主研发。
而在数据采集方面,REM地图众包模式得益于更多品牌车企的支持。相反,Shashua认为,训练神经网络识别行人、车辆或交通锥等物体并不需要太多数据。“在这个基本的物体识别任务上,Mobileye的软件已经取得了比人类更好的表现。”
先姑且不评论这种表现是否得到市场的长期验证,但Mobileye的确更像是一个实用主义者。
不过,和Waymo等直接瞄准L4级自动驾驶的公司不同,Mobileye和特斯拉都在尝试渐进式的技术路线,只是各自的策略不太一样。
殊途能否同归,现在还不能下一个明确的结论。但整个行业,的确仍在寻求基准的安全监管评估和功能体验差异化上“摸着石头过河”。