极越引领中国智能“纯视觉”崛起
随着智能网联汽车整车技术研发投入持续加大,中国自动驾驶技术的发展完全可以用“一日千里”来形容,L2级辅助驾驶已经成熟,L3级以及更高级别的自动驾驶商业化进程也驶入了“快车道”,落地应用速度将超出所有人的想象。
而在近日,又有一项核心技术取得突破。极越首先发布了BEV+Transformer的“纯视觉”技术方案,并已经跑通了城区领航辅助驾驶,成为国内首家具备成熟纯视觉能力智能汽车品牌。几乎同一时间,极越又曝光了与百度联合研发的国内首个OCC(Occupancy Network )占用网络技术。
BEV+Transformer“纯视觉”+OCC占用网络,也将完全取代激光雷达,进一步提升“纯视觉”高阶智驾能力。中国自动驾驶的“纯视觉”路线,将在极越和百度的引领下加速崛起。
解码OCC:“纯视觉”方案核心技术,自动驾驶新价值高地
按照自动驾驶的技术方向,其硬件方案可以划分为两大路线:“纯视觉”方案,使用摄像头等被动探测设备,不发射任何探测信号,不依赖回波感知外部世界,目前仅有特斯拉、极越两位玩家。
“多模态融合”方案,依靠激光雷达、毫米波雷达的回波反射,为车辆在行驶环境中提供静态和动态物体的可靠识别数据,绝大多数自动驾驶公司均采用这一方案。对比依赖激光雷达的“多模态融合”方案,“纯视觉”方案技术难度更高,但研发成功后成本更低,可以大幅压缩生产成本。
作为“纯视觉”方案的核心技术之一,OCC是一种基于学习的三维重建方法,通过产生3D体素,将这些3D体素与3D重建体素(Nerf离线训练得到)进行比较,从而实现感知识别,既能辨别出“不能碰的物体”又能发现“可以碰的网格”。
和BEV(Bird's Eye View)鸟瞰视角相比,OCC解决了不识别就不能作为障碍物的问题,能够更好地理解和处理三维空间数据,从而实现更精确和高效的操作,显著增强理解周围环境的能力。有业内人士认为,OCC将彻底弥补当前感知算法最后一公里的缺陷。
在2022年9月的Tesla AI Day上,OCC正式公布,甫一亮相就被公认为将是下一代的感知范式,成为自动驾驶新的价值高地。特斯拉的“如意算盘”,是OCC解决部分特殊场景问题,不需要激光雷达,从而在自动驾驶的激烈竞争中占据领先优势。
但很显然,OCC并不是特斯拉的专利。10月17日,极越公布了中国首个基于“纯视觉”的占用网络DEMO视频,中国自动驾驶技术的商业化落地,又翻开了新的一页。
OCC即将量产:引领“纯视觉”方案崛起,极越走在世界最前列
根据极越发布的OCC演示视频,极越01对周围环境有着强大的感知能力,用3D体素清晰地展示了栏杆、绿植、路障等标准障碍物,同时还精准识别出了施工中的工程车、树木中的路灯等异形障碍物。
其中蓝色网格代表静态建筑物,如路中心护栏隔离带、施工围栏;橙色代表动态交通参与者,包括机动车、非机动车;还有紫色马路沿、绿色绿化带等。每一个网格约15厘米,感知质量非常高,识别也相当准确。
据极越CEO夏一平介绍,最初定义产品时,极越就想走“纯视觉”路线,但出于安全考虑,增加了激光雷达作为冗余兜底,形成了“纯视觉为主+激光雷达”融合的智能驾驶方案,两套双独立系统互为备份、相互补充。如今,随着BEV+Transformer等技术的成熟,极越正式决定采用“纯视觉”方案。
目前,极越的高阶智驾已经进入2.0阶段,BEV+Transformer的“纯视觉”,不再借助激光雷达,并逐步降低对高精地图的依赖程度,配合OCC技术,帮助汽车机器人更准确地还原3D场景,可以获取比激光雷达点云分辨率更高的三维结构信息,还能减少漏检、误检并弥补视觉所不具备的空间高度信息,适应更为复杂的驾驶环境,大幅提升泛化能力。
值得一提的是,随着底层AI视觉算法能力的快速升级,“纯视觉”方案在系统成本、技术迭代、数据闭环、端到端等方面的优势更加明显。
据夏一平透露,极越“纯视觉”方案端到端的训练正在以“周更”的速度快速迭代,并且随着交付量的快速攀升,基于高效数据闭环体系将让极越高阶智驾呈现指数级进化。“数据生产质量和效率,是未来竞争的关键。高效的系统一定是硬件越来越少,模型越来越集中,规则和假设越来越少。”夏一平说到。
可以预料的是,在极越01的引领下,“纯视觉”方案将快速迭代,中国自动驾驶路线更加丰富,在推动自动驾驶商业化的同时,也将为全球汽车行业的创新发展注入了新的动力。