智能网联汽车数据合规的挑战与应对

  2023年4月20-21日盖世汽车与上海市国际展览(集团)有限公司(SIEC)共同主办第二届中国汽车信息安全数据安全大会上,百度智能交通业务部高级产品架构师李猛表示,百度建设云管端全链路的数据合规方案,包括一个中心、三重防护,全方位保障智能网联汽车的合规安全。

  同时在工具链上管控数据闭环全生命周期信息安全,基于车端安全合规采集模块,云端专有云模式兼顾性能扩展和安全可控,将国密算法、安全审校、脱敏脱密技术贯穿自动驾驶数据闭环全过程中,保障业务稳妥合规。并以国密算法为核心的数据保护机制,保障地理信息自主可控,可信根 + 可信链,保障自动驾驶训练结果和数据安全。构建汽车数据闭环合规的安全基础平台,加强纵深防御、提高边界防护,为汽车数据基础云安全保驾护航。

  智能网联汽车数据合规的挑战与应对

  李猛| 百度智能交通业务部高级产品架构师

  以下为演讲内容整理:

  智能网联汽车数据采集背景及重要性

  随着自动驾驶能力的提升,车上搭载的传感器也越来越多,在行驶过程中会不断采集路测的数据,这里包括了图像、点云、地理位置信息。一台上市的量产车,在触发采集的模式下,一天采集的数据大概在300兆到500兆之间,这是针对乘用车。比如像体积更大、传感器更多的商用车而言,那么数据采集量会更多。

  之前针对智能网联汽车数据采集一直处于模糊的地带,数据怎么采集、使用和管理都没有明确的说法,虽有数据安全相关的法律条规出台,但主要还是针对隐私安全、信息安全、汽车网络安全相关。随着近两年国内外一系列与地理信息安全相关的事件暴雷,监管部门也越发意识到,智能网联汽车由于其采集数据的精确性、持续性、持久性,所以数据的敏感度很较高。

  因此在2022年8月份,自然资源部就发布了《关于促进智能网联汽车发展维护测试地理信息安全的通知》,行业内简称一号文。自然资源部明确将智能网联汽车的数据、存储、管理、使用明确规定为中华人民共和国测绘法所规定的测绘活动,并且未来我们的内资企业、主机厂如果想进行自动驾驶汽车相关的采集、处理,如果不去申请资质,就要委托有资质的图商来代为执行。

  监管部分为什么会越来越重视测绘地理信息安全呢?通过两个案例来看。一则报道表明境外势力持续对我热点资讯网国的一些军事要区、关键基础设施进行测绘地理信息的非法采集,其中很多都涉及到对我国军事区的坐标采集。

  另外一则报道是在俄乌冲突中,谷歌直接曝光了俄罗斯境内所有的战略要地和高像素的卫星图像,包括了俄罗斯导弹的发射井、指挥所、一些秘密的实验地,所以测绘地理信息安全在一定程度上直接关系到国家安全。

  因为智能网联汽车的数据采集已经关系到了测绘安全、信息安全、隐私安全,因此同时受制于测绘法、保密法、个保法等法律条文的约束。那么对于行业从业者如何合理合法使用这些数据,带来更为严峻的挑战。

  不光在中国,国际社会上也都无一例外的对本国测绘地理信息进行了各层级的管控,美国实行的是政府调控型,各个联邦,各个州都可以立法,对测绘行为进行管理,针对一些高分辨率和高精度的测绘地理信息,美国政府同样也是要求这些信息不公开,或者是有限条件下公开。很多欧洲国家对航空航天等相关的测绘地理信息的范畴,对外商的投资基本上是逐步缩减或者是停止审批的。包括就近的东亚各国,比如韩国实行的政府主导型的测绘管理,日本要求测绘成果强制性汇交,所以没有任何一个国家是放任本国的测绘地理信息随意的采集和使用。

  数据合规的方案设计

  在此背景下,百度依赖数据管理应用的最佳实践,设计了一条覆盖汽车云管端的数据合规的方案。具体来讲,在云平台的防护之上,进行了边界隔离,针对不同纬度的数据,其隔离的措施也不相同,像专业的采集车,因其采集数量庞大,单台车每天采集的数据是3T或者4T这样的数据量,并且数据的精细度非常高,图像、点云、地理位置信息也都具备。针对这部分数据,在内部设定的是用物理隔离的方式去进行绝对管控。在大规模集群上,进行了容器的防护,针对数据的进出,也进行了具体数据审计的机制,来保证基础云平台的绝对安全。

  在数据流通机制之上,量产车是设定了车云之间的双向认证和加密信道来保证传输安全,经由传输链回到接入端,在接入端的数据还是一个加密包的状态。只有它通过单向网闸进入合规区之后,在有效监管的条件下,才会把数据包解密解析出来,之后基于解析的数据再去进行应用的处理,这是在传输链入上做的安全管控。

  基于数据应用层的工具链,按照数据使用的不同场景,进行了包括人脸、车牌不可逆的模糊,进行了军事区和关键基础设施的删除。另外按照95号文的规定,对25平方公里的连续性数据也进行了离散和抽帧来确保其连续性是不足以绘图,以此来保证工具链的合规安全。

  工具链合规、传输链合规以及云平台合规的角度,具体的方案设计如下:首先从工具链角度,工具链合规的大原则是全流程管控措施。在车端,是通过图商开发的车端采集模块来进行基础的脱敏脱密动作,也就是一个轻量级的SDK,并且这个SDK其实同时还承担着数据的分级分类、数据的脱敏等动作。换句话说,数据在出车之前已经进行了基础的脱敏,在车云之间通过双向认证和加密信道的形式,让车端的数据通过接入区回到云端。在云端的安全储存进行中转缓存,只有通过单向网闸进入合规作业区,在作业区中才对数据进行解密,之后对于解密的数据成果进行脱敏的校验和脱密执行。最后审校的结果,输出到下游的工具链进行标注,标注数据集用于研发训练,后续研发训练的结果会送到仿真测试来进行集成的测试编译。

  最终验证通过的模型,支持在图商的有效监管之下,下放到车厂的OTA Server,再将模型更新到车端,以此来完成整体的数据闭环流程。在这个流程中的原则一是原始数据永不出车,需要在车端做基础的脱敏,保证其入云之前安全风险降低;二是测绘数据不出云,整个测试数据在图商的有效管控之下,测试成果不关联以及资质图商全管控。

  前面的流程主要与量产车相关,针对采集车,在每一个地方采集时,首先去当地的监管部门进行报备,在报备的基础之上进行专业的采集。因为采集数据量级巨大和精细化程度较高,所以针对这部分数据,是通过离线上传的形式将数据上传到作业区。

  智能网联汽车数据合规的挑战与应对

  图源:演讲嘉宾材料

  传输链路上,在车端的SDK已经进行了车端基础的脱敏,包括地理位置信息的偏转、数据级的加密动作,并且是通过接入区进入到合规管控区中,数据只有进到图商的核心保密区之后,才会将数据进行解密,解密完成之后的数据才会传送到下一个环节进行数据的生产应用。还有整个加解密的过程,是在图商管理的密钥中心之下,这个密钥中心其实是监管部门给我们发的二级跟证书,一级证书是由监管部门管理。图商基于二级根证书再向下游的车厂下发子证书,以此构建三层的信任链,保证整个传输的链路中数据流转的绝对安全。

  数据合规的

  基础

  安全保障

  关于基础云安全,在安全存储的策略上,会通过目录映射、数据索引的机制来提升保密数据调用的性能。因为智能网联汽车采集量大,所以也会基于数据沉降的机制,来进行温冷热合理的层次划分,并且这个划分机制是按照用户的需求进行自定义的调配。

  在数据审计的基础上,围绕数据的分类标准有不同的审计策略。比如量产车回传的CAN数据,一般没有连续的地理位置信息,主要是车辆的状态信息,例如方向盘转角、刹车力度等,这些信息本身测绘安全风险较低或者与测绘毫无关系,可以直接回到云端,不会耗费合规的脱敏资源。再比如触发回传的紧急状态数据,会有车外大量的图像、点云和地理位置信息,那么这部分数据肯定是按照严格合规的管理流程来处理。具体数据审计的策略是围绕不同的应用场景,这样的目的是为了不影响业务的前提下来保障数据的安全。

  在边界安全上,除了会基于云端提供一些标准的软硬件安全组件,也会根据业务的不同属性进行安全域的划分,来保证帐户的最小权限原则,避免了业务间的非授权访问。从整个云平台的防护纬度来看,构建了一个大的边界防护,来控制数据的进出,并且通过数据审计的策略、存储机制、容器防护等机制,来确保纵向防御加固,提供了安全支撑。

  百度

  智能驾驶数据合规的优势

  百度除了作为互联网公司对外提供商业化服务,本身也造车同时也有合作的车企,在长期积累的过程中,提炼了一条覆盖采集、传输、存储、管理、使用全流程、端到端的数据合规的解决方案。从执行角度来看,拥有专业的采集团队和丰富的管理调度的经验。并且在数据回传机制中依据不同数据类型来设计最佳的传输策略,确保效率及安全性。数据处理方面,可以实现自动化的脱敏动作,且自动化准召率均已超过行业标准。

  百度是目前国内19家导航电子地图甲级测绘资质的图商之一,除了在测绘方面具有准入资质外,在云平台领域也具备各类资质认证,包括等保三级、可信云等等。此外,我们也拥有大家熟悉的ISO21434 26262安全认证,具备个人隐私安全、身份信息保护等认证。简而言之,百度既有成熟的解决方案、也有全面的资质认证、同时也具备丰富的实践落地案例,期望未来百度能够依靠合规建设经验,给行业合作伙伴创造更多的价值 。

  (以上内容来自于百度智能交通业务部高级产品架构师李猛于2023年4月20-21日在盖世汽车与上海市国际展览(集团)有限公司(SIEC)共同主办第二届中国汽车信息安全与数据安全大会发表的《智能网联汽车数据合规的挑战与应对》主题演讲。)

原创文章,作者:热点资讯网,如若转载,请注明出处:https://www.bgost.com/31/1312.html