中国信通院洪启安等:智能网联汽车数据要素流通综述
0 引言
近年来,我国数字技术与经济快速发展,数据要素的重要性日益凸显。2014—2019年,我国政府对大数据的关注度逐步提高并实施了多项大数据发展政策。2019年10月,《中国共产党第十九届中央委员会第四次全体会议公报》将数据明确纳入生产要素,体现了数据在推动经济高质量发展中的价值。2023年12月,国家数据局会同有关部门联合印发《“数据要素×”三年行动计划(2024—2026年)》,旨在充分发挥数据要素乘数效应,赋能经济社会发展,“数据要素×交通运输”是重点行动方向之一,明确提出要推进数据要素赋能智能网联汽车创新发展,打通不同主体间的数据壁垒,促进道路基础设施数据、交通流量数据、驾驶行为数据等多源数据融合应用。
智能网联汽车通常具有更开放集成的电子电器架构、更强大的多源数据实时采集传输能力,数据不仅可以用于车辆状态监测、远程控制升级等新型智能化服务,还可以用于后处理分析及产品功能研发。此外,路侧网联汽车基础设施采集的交通状态和车辆驾驶数据同样可以面向汽车提供信息服务和研发数据支持。数据要素在智能网联汽车研发生产、运行服务、售后维保、报废回收等全生命周期中发挥着重要的赋能和驱动作用。
1 数据要素流通范式
1.1 数据要素流通模式
数据要素流通模式主要包括数据开放、数据共享、数据交易3类[1]。
数据开放是指提供方无偿提供数据,需求方免费获取数据,没有货币媒介参与的数据单向流通形式[1]。政府通常通过数据开放平台来开放脱敏和非密的公共数据。截至2023年8月,我国337个城市(含直辖市、副省级与地级行政区)中,目前已经有60.53%的城市上线了公共数据开放平台[2]。企业开放数据通常服务于政府和科研工作者,例如高德地理信息数据开放平台和百度阿波罗(Apollo)自动驾驶开放平台,向科研工作者无偿提供高质量数据,促进新技术新业态创新研发。
数据共享是指互为供需双方、相互提供数据,没有货币媒介参与的数据双向流通形式[1]。企业之间的数据共享可以充分发挥数据的价值,提高资源利用效率,例如汽车制造商与零部件供应商之间共享供应链数据,高效匹配双方的需求和能力。
数据交易是指提供方有偿提供数据,需求方支付获取费用,主要以货币作为交换媒介的数据单向流通形式[1]。数据交易模式正从传统的点对点模式逐步发展为交易机构撮合模式,以解决交易效率低、缺乏监管等问题。目前,我国各地方政府正大力推进大数据交易所的建设。例如,北京国际大数据交易所的交易联盟涵盖了国有企业、金融机构、互联网企业、科研院所等单位,基于其IDeX数据交易平台提供多种数据类型的交易服务。以亚马逊云为代表的科技公司构建的数据交易平台[3]则是基于其强大的数据获取和处理能力以应用程序编程接口(Application Programming Interface,API)、数据集等形式进行数据交易。
1.2 数据要素流通关键技术
在数据流通过程中,需要综合应用数据安全技术、隐私计算技术、计算处理技术、存证溯源技术[4]等,以实现主权保护、安全保护、隐私保护。
数据安全技术主要用以保障数据提供者和数据使用者的权益以及系统的安全,包括身份认证、数字签名、数据脱敏等安全技术。其中,身份认证管理系统从独立身份认证管理和联邦身份认证管理发展到了基于区块链技术的身份管理系统[5],在提高数据透明性和安全性的同时也提高了身份认证效率[6];数字签名技术已经从1978年的RSA数字签名发展到当今面向区块链的多重签名、环签名[7],提高了信息传输的完整性和安全性;数据脱敏技术则首先需要对敏感数据进行识别,进而对数据进行分类分级并打标签,随后通过无效化、随机值、数据替换、对称加密等静态或者动态脱敏的方式对数据进行脱敏处理[8]。此外,还有文件加密技术[9]以及相应的数据安全传输协议等数据安全技术。
隐私计算技术可以加强对流通数据的保护、降低数据泄露的风险及危害。隐私计算技术一般分为算法层和环境层技术[10]。在算法层上,以同态加密为首的现代密码学方式常被用于保障数据的安全性和实现安全多方计算的隐私保护功能[11],但该方法还存在缺乏统一模型性能评价标准、缺乏全流程隐私保护等问题[12];联邦学习技术通过人工智能进行建模以达到加密的目的,可被用于在政企之间建立完整的信用体系以推进智慧城市的数据交换[13]。环境层则通常采用基于可信硬件的隐私计算技术,即通过软硬件结合的方法在中央处理器(Central Processing Unit,CPU)中构建出一个安全区,保证在其内部加载的程序和数据的安全性,与算法层的各技术和协议互相支撑,进一步保障数据提供者和使用者的隐私[14-15]。
计算处理技术主要包括数据预处理技术、数据存储与管理技术、数据分析与挖掘技术等。数据预处理技术包括通过数据清洗来处理缺失值和不一致性等问题、通过数据整合来集成多个数据库或文件、通过数据转换来进行归一化和标准化处理、通过数据减少来提取特征化数据。数据存储与管理技术不断向满足结构化、半结构化和非结构化数据的存储和处理需求[16]发展,云存储和数据湖在促进数据处理技术性能提升的同时也降低了数据的存储成本。数据分析与挖掘技术分为批处理、实时处理、混合计算3类,Casado和Younas认为在机器学习的赋能下以Lambda架构为基础的混合计算方法将进一步赋能数据的流通[17]。
存证溯源技术可以为数据的流通过程提供可追溯和可监管的保障,解决数据主权和权责认定的问题。电子数据存证技术由传统的可信时间戳等技术发展到了基于区块链的数据存证技术[18],依托区块链去中心化和不可篡改的特性有效地保证了数据的真实性和完整性。同样,传统的数据溯源技术基于标识法[19]和逆查询法[20]进行多种溯源模型的构建[21]。随着技术的不断发展,基于区块链的数据溯源模型增强了溯源结果的可信性[22]。
2 智能网联汽车数据分类
智能网联汽车相关数据可以按照数据来源分为3类,分别是用户数据、车辆自有数据以及外部来源数据。表1基于《智能网联汽车数据分类分级实践指南》,在对数据的流通价值进行初步筛选后总结了智能网联汽车的数据分类和来源,并给出了其潜在流通价值、流通场景及对应的流通模式。
表1 智能网联汽车数据分类及潜在流通场景
图1 ETSI定义的面向车联网的MEC架构
基于以上分类,下文将进一步分析智能网联汽车的数据流通价值场景。
3 智能网联汽车数据流通场景
3.1 汽车生产供应链数据流通
智能网联汽车的生产环节中存在多种数据流通场景,包括为解决车辆及零部件生产研发需求的数据流通、为实现供应链追溯目标的数据流通和为满足碳足迹追溯与碳排放监管的数据流通。
基于以上3类数据流通场景,汽车生产供应链数据流通模式如图1所示。当汽车制造商和零部件供应商同时以数据提供者和数据使用者的身份进行数据流通时,汽车制造商可以获取供应商的零部件产品性能规格、库存等数据,零部件供应商能得到汽车制造商的需求和排产计划等数据。汽车制造商、零部件供应商、汽车行业监管部门和金融机构可以利用供应链数据高效实现供应链追溯的目标,进而进行零部件故障溯源、产品质量评估等分析。碳排放监管部门在该数据流通场景中,依据供应链数据为数据使用者进行碳排放计算、合规性评估等相关分析。数据可以点对点的方式进行流通,也可基于数据流通平台进行共享。
图1 汽车生产供应链数据流通模式
目前,汽车生产供应链的数据流通模式正从点对点的模式朝着基于平台的模式发展。宝马公司在德国发起的Catena-X联盟于2020年成立,得到了欧盟和德国联邦经济事务和气候行动部的资助,建立了汽车领域数据空间并发布了相关标准。Catena-X公司在2023年底已经可以为超过170个成员组织提供包括供应链管理、数字孪生、需求和产能管理在内的10项服务,为成员组织之间的数据交易和数据共享提供了很大的便利[23]。此外,还有以“奔驰+微软”“现代+亚马逊云”为例的大型汽车制造商和互联网头部企业合作建立的供应链管理平台。我国工业和信息化部装备工业发展中心也于2022年建立了汽车产业链供应链畅通协调平台,支持汽车制造商以填报需求的模式来提出诉求以解决供应链中存在的问题,一定程度上解决了复工复产时供应链信息流通不畅的问题。
目前国内汽车生产供应链数据流通场景,仍以企业根据自身需求主导的点对点流通模式为主,基于行业平台开展数据流通的验证仍处于初期发展阶段。在汽车生产供应链数字化转型、行业碳足迹追溯监管等新发展要求下,依托行业性平台或数据空间基础设施进行汽车生产研发环节数据流通有望成为未来发展趋势。
3.2 道路交通信息数据流通
道路交通信息能够有效支撑车辆智能驾驶功能的实现。车辆对及时准确的道路交通信号灯数据、道路管控数据、道路交通流量数据、道路交通事故数据等存在流通需求,可以为车辆驾驶员提供驾驶辅助服务,甚至可与车辆自身感知信息融合以支撑智能驾驶功能的实现。此外,导航软件等服务商也对道路信控设施状态等道路交通数据存在流通需求。
基于以上数据流通场景,道路交通信息流通模式如图2所示。当数据在地图及导航服务商与交通部门之间流通时,通常以数据共享的模式进行信号灯配时、道路拥堵状况数据的交换,用来支持导航软件中交通信号灯倒计时等功能的实现,交通部门则能依据路况数据更好地掌握道路状况。当数据以共享的模式在车端用户与地图及导航服务商之间流通时,车端用户将车辆行驶速度、定位等信息提供给地图及导航服务商并接收其反馈的道路交通信息。当数据在车端用户与交通部门之间流通时,交通部门通常以数据开放的形式将道路拥堵指数、出行预测等信息发布在数据开放平台上供用户使用。
图2 道路交通信息流通模式
当前道路交通信息流通仍然存在由于道路交通数据管理部门、各地交通信息服务运营商、地图及导航服务商、车端用户平台数据接口不统一导致的数据共享流通难等问题。伴随数据要素有关政策的推进,以及全国车联网新型基础设施建设的普及,交通部门、车辆、地图及导航服务商等主体间全面高效的数据流通有望加快实现。
3.3 自动驾驶算法训练数据流通
车企和自动驾驶方案供应商在自动驾驶系统研发过程中需要海量数据进行算法训练。在数据资源积累不足时,企业存在车端采集自动驾驶训练数据流通需求。此外,部分地区网联汽车路侧设施采集的海量感知数据可以经处理后服务于车端自动驾驶算法研发,存在路侧设施企业向研发企业流通数据的场景。
基于以上两类数据流通场景,自动驾驶算法训练数据流通模式如图3所示。车端感知数据在各车企及自动驾驶企业之间流通时,潜在的流通模式为数据交易或共享,可以帮助需求方补齐训练数据短板,加快自动驾驶训练算法的成熟。在网联汽车路侧运营企业与车企及自动驾驶企业之间数据流通时,流通模式主要以数据交易形式存在,由路侧运营企业将原始数据或处理后的数据提供给汽车制造商及自动驾驶企业等数据使用者,帮助需求方丰富自动驾驶训练场景库和数据集。对于图商来说,则是以数据共享或交易的模式与汽车制造商及自动驾驶企业进行数据流通。
图3 自动驾驶算法训练数据流通模式
目前,在企业间流通车端采集训练数据时,存在各汽车制造商由于传感器布置位置不同、图像分辨率不同导致的数据可用性问题,以及数据安全、品牌竞争等问题,车端采集自动驾驶算法训练数据的企业间流通活动较少。在路侧设施采集数据向车端算法研发企业流通场景下,仍然面临视场角转换复杂、价值场景自动筛选效率低、数据连续覆盖度不足等数据处理技术难题,成熟案例仍较少。随着数据流通需求的增加和有关数据处理技术的完善,车端和路侧采集的自动驾驶训练数据有望形成成熟的流通模式。
4 未来工作展望
4.1 开展智能网联汽车行业数据流通政策需求研究
伴随智能网联汽车产业的飞速发展,智能网联汽车数据体量将快速提升,数据流通的需求和模式将不断发展,有必要推进整车制造厂商、零部件厂商、第三方机构以及汽车数据处理者等,联合组织开展智能网联汽车行业数据流通政策需求研究,围绕数据所有权、数据共享与使用、数据安全和隐私保护、数据跨境流通等方面开展研究,平衡数据流通各方权益诉求,加快形成适合行业发展的政策体系。
4.2 深化智能网联汽车数据流通潜在场景的可行性研究
持续深化挖掘智能网联汽车数据流通高价值场景,开展可行性研究工作。一方面,围绕汽车生产供应链、道路交通信息服务、自动驾驶算法训练及用户行为数据等流通场景,加强落地性技术、模式、应用、标准研究,开展有关试验验证。另一方面,围绕汽车智能驾驶、智能座舱大模型等新技术对数据的关键需求,加强对新型数据流通场景需求和流通模式的研究。
4.3 推进智能网联汽车数据流通共性标准研制
进一步研究智能网联汽车数据流通标准需求,结合产业及技术成熟度,制定标准体系和路线图。针对智能网联汽车数据流通涉及的数据采集、传输、存储、处理、使用、销毁等各个环节,梳理并提出安全、计算、处理、平台接口、定价等有关标准需求,联合相关单位开展标准制定,形成数据高效安全的流通标准支撑。
4.4 加强智能网联汽车数据流通关键技术研究
一方面,在数据流通通用技术层面,重点开展数据安全、隐私计算、计算处理技术方面的关键技术研究。另一方面,围绕智能网联汽车数据流通特有场景需求,开展相关缺失技术的重点研究,包括自动驾驶训练数据处理、道路信息数据统一接口、路车视角转换、自动驾驶场景库智能生成等关键技术。
4.5 分阶段开展智能网联汽车数据流通验证示范
基于技术可行性、技术标准研究成果,面向兼具高价值和可行性的场景,联合相关车企、零部件厂商、第三方平台公司等,开展数据流通验证。探索搭建智能网联汽车数据流通平台,开展实车验证、创新应用场景挖掘赛等多种形式的数据流通验证示范,培育数据流通在汽车研发、生产制造、材料回收、金融保险等各个环节的服务模式和产业生态,开展高价值场景的规模化推广。
5 结束语
随着汽车智能化和网联化的提高,智能网联汽车的数据体量迅速提升,数据流通的需求和模式也不断发展。本文首先对数据要素的流通模式和关键技术的发展进行了回顾,随后对智能网联汽车数据进行分类并给出其潜在的数据流通价值。在此基础上,进一步总结归纳了汽车生产供应链数据流通、道路交通信息数据流通、自动驾驶算法训练数据流通3种场景并对其数据流通需求、模式和效果进行分析,识别其未来发展趋势。未来,我国应加快完善政策制度保障,健全标准体系,建设数据流通设施,推进智能网联汽车产业高质量发展。
作者简介
洪启安
中国信息通信研究院技术与标准研究所助理工程师,主要从事智能网联汽车路侧数据流通技术与标准等方面的研究工作。
于润东
中国信息通信研究院技术与标准研究所高级工程师,主要从事车联网和智能网联汽车领域政策、技术、标准、安全、测试、数据等方面的研究工作。
于胜波
中国信息通信研究院技术与标准研究所工程师,主要从事智能网联汽车政策法规、技术标准、测试示范及应用推广等方面的研究工作。
龙翔宇
中国信息通信研究院技术与标准研究所工程师,主要从事智能网联汽车政策法规、技术标准、数据要素及应用推广等方面的研究工作。
论文引用格式:
洪启安, 于润东, 于胜波, 等. 智能网联汽车数据要素流通综述[J]. 信息通信技术与政策, 2024, 50(3): 27-34.
-
汽车测试网V课堂
-
微信公众号
-
汽车测试网手机站
编辑推荐
最新资讯
-
4G/5G网络新时代的高效紧急呼叫系统NG-eCal
2024-12-20 22:33
-
海克斯康端齿联轴器测量方案,助力大众汽车
2024-12-20 22:27
-
设计仿真 | 新版本Dytran 用户子程序调用及
2024-12-20 22:26
-
设计仿真 | MSC Nastran高性能求解计算(一
2024-12-20 22:16
-
动力电池揭秘 | 安全性全面解析
2024-12-20 22:13