不愿给 不适用 不敢用 汽车数据共享 只是个幻想?
近日,由中国智能网联汽车产业创新联盟提出、电子科技大学牵头的《智能网联汽车数据安全共享模型与规范》CSAE标准已完成征求意见稿和编制说明,现面向全体会员及其他有关单位广泛征求意见。
众所周知,“软件定义汽车”已经成为汽车产业的共识。数据于软件的重要性不言而喻。随着汽车智能化水平的不断提高,汽车产生的大数据越来越多。如何有效地利用这些数据,让其进一步加快汽车产业智能化转型,成为时下汽车产业重点关注的课题。
?数据共享大有裨益
数据体量越大,可供利用的有效数据就越多。数据共享无疑是获得海量数据的捷径。
据知名汽车零部件公司内部人士黄俊介绍,车企与车企之间的数据共享能加快汽车智能网联水平的提升。比如在自动驾驶测试过程中,很多场景数据的共享是非常有意义的。A、B两家车企都在一段公路上进行测试,A车企在测试过程中路遇一只野鹿,而B车企累计测试了100km甚至1000km也没有遇到,这个出现野鹿的数据对于B车企来说就非常宝贵,这样的数据可以丰富B车企的场景库,推动B车企的算法不断迭代。
而车企与用户之间的数据共享,也能助力车企智能化水平更上一层楼。车主在驾驶智能汽车时会产生大量数据,但他们对于车辆收集信息的过程往往是无感的,甚至是不知情,这就导致用户与车辆缺乏互动。事实上,当车企及时将车主的车辆数据反馈给车主,车主将其驾驶体验分享给车企,单车智能的发展进程就会大大提速。
仍以车主在公路上偶遇野鹿为例,一种结果是车辆检测到一个不能识别的场景并上传;另一种情况是,车主主动触发上传该场景,并进行标注。显然,第二种数据于车企更有用处。后台会基于该数据进行进一步训练、丰富算法,使车辆在未来能够处理这样的场景。
中国汽车工程研究院股份有限公司总监陈涛认为,数据共享很有必要。未来是大数据时代,尤其是网络通信技术应用以及云的算力、存储能力大大提升之后,下一步很多科技创新、研发与应用服务,都要基于大数据来实现。要让整个交通系统更智能,光抓单车智能显然不够。这需要全局优化,需要更多元的数据,包括车辆的数据乃至大交通系统的数据。
?国内数据共享相对滞后
事实上,汽车行业关于数据共享的理念早已萌生。这方面,美国的步伐迈得更大一些。去年,美国汽车安全监管机构公布了一项自愿性工作,以收集和提供有关现有自动驾驶汽车测试的全国性数据。美国国家公路交通安全管理局也推出了“自动车辆透明度和参与度的安全测试计划”(AV TEST Initiative),以提供“一个在线的,面向公众的平台,以共享自动驾驶系统的道路测试活动。”以前那些经过测试的自动驾驶汽车现在可以作为AV TEST Initiative的一部分,自愿向NHTSA提交信息,NHTSA将提供查看信息的服务。
全球自动驾驶汽车软件公司Oxbotica正与思科公司(Cisco)合作搭建一个开放漫游平台。该平台能够让自动驾驶车队无缝、安全地共享大容量数据,同时能以低成本的方式行驶。该测试平台经过设计,可完全扩展,能够部署在不同的车队网络中,无论车队规模如何,所处何地,都能安全且便宜地下载数据。
通用汽车也在和宝马合作研发区块链技术,希望通过该技术实现自己和其他汽车制造商之间自动驾驶汽车数据的共享。这都是为了解锁存储在孤岛中的宝贵数据,最终让自动驾驶汽车更快上路。在移动开放区块链倡议(MOBI)的支持下,这一领域的数据共享探索性工作正在进行。
而国内市场的情况是,早前几年,百度曾公开一些数据集,供同行训练和测试使用。但百度一家企业收集的数据量有限,后续又没有更多企业来继续完善这一数据库,国内数据共享的工作便不了了之了。
不过近来,数据共享又有新动态。《智能网联汽车数据安全共享模型与规范》CSAE标准的推出,对智能网联汽车的内置属性数据和行驶数据进行规范化。模型对数据安全隐私级别进行分级,对数据内容进行分类,使得大规模数据的价值挖掘成为可能,在保障数据安全的前提下,获得更高的商业价值。
?面临技术、商业、法规难题
可以看到,国内在智能汽车数据共享方面,仍处于起步阶段。事实上,要做到数据共享非常难。在纽劢科技相关负责人看来,基于目前的硬件设备和云端建设,并没有达到让车辆数据共享的程度。另外,数据共享的概念很广泛,怎样的数据需要共享?共享之后,数据如何支持算法和技术的优化?对于这些问题,行业内其实并没有定义清楚。
同时,国内自动驾驶落地路线分支很多,有的着眼于Robotaxi,有的着眼于前装量产,路线不同对数据的要求和需求也就不同,共享得来的数据能否满足实际需求是一个需要思考的问题。以滴滴为例,它掌握了庞大的数据,但这些数据怎么提供给科技公司优化自动驾驶算法,如何为政府部门优化道路系统做出贡献,涉及技术、商业等多维度。总体而言,数据的能动性目前还比较有限。
的确,数据的定义非常广泛。如果需要图片数据,那么共享得到的文字数据就是无用的。此外,因为传感器、算法不同,车辆产生的数据差异很大,共享得到的数据就需要进一步处理才能“为我所用”,但处理后的数据还有多大价值很难判断。虽然每家车企都把数据看得至关重要,但对于自己到底要什么样的数据,用这些数据做什么,他们还缺乏清晰的认知。
汽车之家车联网商务总经理易晓峰分析,数据共享的前提是数据分层。以高精度地图相关数据为例,底层基础数据客观描述了道路基础信息,可以共享,但车企之间的数据定义格式不尽相同,可能导致共享后也无法共用。中间层的数据算法是数据使用的方案,也可以在一定范围内共享。但最上层的自定义特殊场景属于商业化的范畴,代表了车辆自动驾驶功能和应用场景,这是车企的核心竞争力,这是他们无论如何也不能对外开放的。
当下,智能网联的核心数据基本掌握在车企手中。可以说,车企是数据共享的主体。陈涛认为,那些偏向于研发类的数据、涉及到车辆内部算法策略和逻辑、关于核心技术机密的数据,车企必然不愿意共享,因为这是形成产品壁垒的关键所在。
而与用户应用和用户服务紧密关联的数据,如位置等可以考虑共享,但面临用户隐私泄露问题,需要进行“脱敏”处理。另外,有关车辆基本运动的数据如加速、转向等,也可以共享,但再向内纵深如传感系统数据,企业则会谨慎开放。
可以说,数据是未来汽车行业竞争的核心资源,车企花费巨大资金和精力在数据的采集、标注、处理上,要求企业无偿提供宝贵的、甚至包含有机密商业信息的数据,这确实令企业为难。虽然汽车企业共享数据的行为非常有意义,特别是对于无人驾驶这种需要大量且多样数据的技术,但汽车企业的高层担心这会削弱自身优势,并不愿意分享,这就使得共享数据资源变得难上加难。
即便某一家企业把自家的数据共享出来,在“黑暗森林法则”的重要概念——“猜疑链”的作用下,其它企业真的敢用吗?要知道,在自动驾驶技术中,最重要的就是安全性。
而抛开技术与竞争层面的因素,黄俊认为数据共享也存在法律方面的风险。因为智能网联传感器必然会扫描道路特征,我国自然资源部相关部门将其定义为测绘行为,从国家安全的法律法规角度来讲,有些数据是不能采集、无法处理的,更谈不上分享,这或许是非技术层面的一个很大障碍。
?标准统一是共享前提
有人打了这样一个简单的比喻,数据是车企的私有财产,就好比你有10元钱,为什么要和别人分享?这就涉及到共享的动机和数据的划分,公共数据可以共享,但需要建立共享机制;私有数据事实上也可以共享,但要建立市场化的数据交易机制。
当前,因各车企使用不同的数据处理模式,使得汽车行业中存在数据格式不统一、内容记录不全面,甚至局部数据存储混乱的问题。这些海量的汽车数据具有极大的挖掘价值,但对数据应用方来说,分散且复杂多样的数据无法直接使用。常规的数据整合手段不仅会消耗大量的人力与资源,并会使数据安全受到威胁。
陈涛认为,所谓互联互通,数据的标准、接口、协议相同,是数据共享的第一步。一辆汽车在上海、北京、重庆等不同城市,测试获取的数据必须能上传到同一后台,不能因为城市不同,数据的范式就不同。“就好比大家都要说普通话,而不是我说普通话,但你说粤语。”陈涛说。
智能网联汽车共享数据模型与规范的提出,可以填补当前市场的标准空白。通过建立统一规范的数据格式,指导各车企进行科学规范的数据处理,减少人力与资源的消耗以提升经济价值。使用智能网联汽车共享数据模型,可以提升行业内的数据流通效率并保障数据的隐私安全,充分利用汽车行业数据中所蕴含的价值。
标准统一后,商业模式自然就会衍生出来。在陈涛看来,数据也分为2C和2B。2C数据是直接服务于消费者的,为驾驶和出行服务创造价值;2B数据一类是支撑研发、使车辆性能更优,还有一类是保证物流调度更顺畅,效率更高更经济。当然还有一类数据是满足政府监管的诉求,支持交通管控和安全管控。这三方面的数据都有价值,关键在于如何交易或者交换。
很多数据目前掌握在车企手中,其实车企也未必能够充分利用,但众人皆知数据在未来会产生大量价值和增值服务。虽然可以共享一部分数据,但为什么要共享、共享给谁,这种商业模式还没有探索清楚。陈涛分析,这是一个市场化的环境和机制,如何分配利益,谁为主、谁为辅,数据是交换还是买卖,数据如何变现、价值几何,一环扣一环的路径目前还没理顺。
?需政府或协会牵头
北京大学互联网发展研究中心洪延青博士曾发表观点认为,在路测数据的共享中,事故数据应当认作是公共品,因为它是用生命、鲜血换来的,应当共享出来,不让同样的错误一再出现。
险情数据应鼓励共享,对训练算法非常有意义,能够迅速提升整个行业的水平,政府应该以政策优惠的形式鼓励企业把险情数据开放出来。正常行驶数据也鼓励共享,但应该在企业之间共享,不需要通过政府。不过,无论哪种形式的共享都需要一个强有力的组织者。
黄俊介绍说,国外很多民间组织、非营利组织或者行业组织,在数据共享方面能够起到很大作用,比如说德国汽车工业联合会、美国智能交通运输协会。但国内行业组织的话语权相比国外较弱,所以更适合由政府部门牵头或者政府下属的大数据公司、事业单位来牵头。
“其实标准的制定不是非常难,技术层面几乎没有障碍。只要企业有意愿做标准,就很容易统一,关键在于如何调动大家共享的积极性。这是一个文化问题。国内车企之间的合作偏向保守,车企觉得数据是很重要的资源,不愿意共享;具有互联网精神的IT企业想共享,但又调动不起来这些拥有大数据的车企巨头。”黄俊遗憾地说。
易晓峰也认为,一些数据的共享的确有助于行业进步,如地图数据,但这种共享也有前提,即车企的技术成熟度相当。如果每家企业的数据质量、成本参差不齐,硬要谈共享,也很困难。而且这种共享还需要行业协会、行业联盟类组织牵头,靠企业自发共享不太现实。毕竟,眼下每个企业还处在不断提升自身技术能力的阶段,精力主要集中在采用什么样的技术路线去实现更高级别的自动驾驶功能且商业落地。
爱驰汽车大数据平台部总监李海军补充,数据共享可以实现,只是牵头组织必须是非营利性的。数据并非简单收集后再分发,而是收集后必须经过加工处理,处理过的数据看不出来自哪些车企和车型,而是提炼出一些共性,成为反向赋能汽车智能化的手段。如果能达到这样的效果,车企是有积极性参与数据共享的。当然还有一个难题,就是这个牵头的组织首先要考虑自己如何活下来。