作者:Michael DeKort
来源:SAE 《自动驾驶车辆工程》杂志
自动驾驶汽车测试和训练AI的最佳方法是通过适当的模拟、系统工程和最终状态场景矩阵。 一位资深工程师解释为什么当前的自动驾驶汽车测试方式必须改变。
在一些关键的开发与驾驶场景中,系统根本不可能留给“影子驾驶员”充裕的反应时间,以充分了解当下的驾驶环境,重新取得对车辆的有效控制,并保证安全。
在自动驾驶汽车研发与测试中,开发商通常会采用公共道路“影子驾驶”模式,也就是说车上会配备一名人类驾驶员,但这位驾驶员并不操控方向盘,仅观察被测系统的运转情况。但这一作法实际有两个大前提,第一是车辆已经学会如何适当地应对驾驶过程中的各种事件;第二是人类驾驶员(观察者)的反应足够快,可以阻止任何不利结果的发生。
由于各种各样的原因,看起来“影子驾驶”模式似乎是目前完全自动驾驶汽车研发与测试中不可或缺的组成部分。
事实上,自动驾驶汽车的测试并不轻松,每家制造商均需累积大约一万亿英里的自动驾驶里程,并覆盖甚至多次覆盖所有可能的场景。根据作者的保守估计,假设配置 23.4万 辆汽车,每天以时速 50 英里 24 小时运行,那么累计一万亿英里自动驾驶里程需要 10 年,成本高达 3000 亿美元以上。
除了成本,“影子驾驶员”还存在安全方面的隐患。举个例子,为了训练人工智能和 SAE L3级自动驾驶及控制交接功能,厂商必须让车辆经历一系列真实事故场景。小至剐蹭追尾,大到其他更加危险、更加复杂的场景,整个训练过程可能涉及成千上万个事故场景,极有可能造成不同程度的伤害,甚至伤亡。另外,此类事故场景还必须加上公共道路测试,这也会让整个测试过程更加危险。无论是一些正在借助“影子驾驶员”进行研发测试的系统,还是已经投入使用的 SAE L3 级公共自动驾驶汽车,目前这些系统根本不可能留给“影子驾驶员”充裕的反应时间,以充分了解当下的驾驶环境,重新取得对车辆的有效控制,并保证安全。
正如最近几起自动驾驶事故所掀起的风波一样,“影子驾驶员”出现在公共道路上,有可能削弱消费者对自动驾驶汽车的信心与支持,甚至引来铺天盖地的负面媒体报道,催生更加严格的监管,招致无休止的诉讼,还会造成投资者的信任丧失,给自动驾驶汽车的发展带来沉重的后果,并最终将这项有潜力挽救成数十万民众的技术扼杀在摇篮之中。
值得庆幸的是,我们还有一个解决方案,那就是使用“完整模拟”完成主要验证过程,降低行业对“影子驾驶员”的依赖。该解决方案采用“全系统工程”方法设计,以客户的用户需求和设计流程为基础,并包含“最终状态场景”。
福特和Argo AI正在开发一套虚拟驾驶员系统,支持汽车制造商及其他潜在公司的自动驾驶汽车研发。
合情合理的模拟手段
目前,汽车行业使用的模拟系统远未达到航空航天行业的水平和复杂度(即美国联邦航空管理局FAA的D 级规定),也没有采用适当的实时架构。现阶段,车辆、轮胎和道路模拟的模型均不够精确,特别是在模拟一些恶劣条件时。人工智能看起来似乎已经做好了学习准备,但事实并非如此。更可怕的是,直至真实场景发生之前,此类情况通常都很难发现,而一旦发生,则会给项目进展带来沉重的时间和执行压力,甚至直接让项目叫停。
注意,这些问题并不会暴露在一些常规测试场景下,只有当面对一些非常复杂,或对时间要求很高的场景,迫使车辆达到甚至超过性能极限时才会出现,而这通常也正是问题的开始。
假如不配备全动系统(full motion systems),一些驾驶员在环(DiL)模拟器可能会让开发人员的信心爆棚,但真实情况并非如此乐观。运动系统设备可以配合真人模拟器使用,用于模拟自动驾驶行程,并允许开发人员评估车上人员的晕车感、舒适感及对自动驾驶汽车的信任水平。除了配备合适的运动系统外,开发人员还可以借助“航空航天/DoD/FAA”的仿真技术、最佳做法和测试方法,解决汽车行业面临的自动驾驶模拟挑战。这是因为,一些国防城市战争游戏的游戏场景与很多复杂驾驶场景高度重合,另外还有一些采用了专业模型并提供实时保真的效果,尤其可以发挥重要作用。
如图所示,大多数自动驾驶汽车开发商均无法履行之前的承诺,即在有限范围内推出真正具备SAE L4-L5级自动驾驶功能的自动驾驶汽车。(数据来源:Eric Paul Dennis/Center for Automotive Research)
数据方法论至关重要
并预先定义和构建最困难的场景,整个项目可能将最终远超预计时间,才能做到所有模拟场景的执行,包括在当下及未来无休止地重复修补这些复杂场景。
如果采用敏捷开发流程,可能浪费的时间将难以预估,而且从历史经验来看,一些较为复杂的元素通常很难完成,这只能为日后开发埋下隐患。此外,除非遭遇到一些最复杂和最困难的场景,否则这些设计缺陷通常很难暴露。最终,项目可能不得不进行“修修补补”,大量返工,而不是在一开始就在许多常见场景中设置妥当。
目前,“边缘场景”和“角落场景”经常用于描述事故情景。但事实上,事故情景与任何其他情景并无差别,只是结果是没有人想看到而已。一些真正的“边缘场景”或“角落场景”是在任何情况下都不应该,也不可能发生的 — 例如要求搜索引擎寻找一张猫的图像,但最终得到的是一张垃圾桶的图像。工程师通常不会覆盖所有可能的事故场景,也就是被他们划分在“核心场景”之外的“边缘场景”或“角落场景”。也正因如此,人们有理由进行必要的尽职调查。
模拟仿真的目标应集中在为 AI 堆栈提供可用于辨别不同物体的数字表达式,采用相同的输入速率,并具备相同的模糊度,从而找到妨碍 AI 堆栈做出正确决定的问题。这些数据集中,最难实现的部分常被称为“边缘”或“角落”场景;然而,这些场景才是判断 AI 堆栈是否具备成功决策能力的关键案例。为了清晰定义这些案例,并明确每个案例的预期结果,我们需要一种条理分明的可管理式递归数据方法。
最终状态场景矩阵
除了提供影响上述系统工程方法的场景数据之外,所有各方(包括政策制定机构、验证机构、保险公司和制造商等)都需要尽早了解模拟目标,也就是“项目完工”的定义。只有具备对实时变化的支持能力(从而及时修正任何 AI 感知错误),场景数据集才能真正称得上全面,但相应的工作量几乎与为仿真过程清晰定义“整合’’与“系统模型”一样可观。
从地理围栏到 SAE L4 级和 L5级自动驾驶汽车,要成功实现这些目标,该测试数据集的建立需要依赖众多数据源和数据域;要求全球汽车开发界开展最高水平的尽职调查;必须确保达到必要的安全水平并能够证明这一点;还必须映射到上文提到的仿真系统,并与之同步。
在目前的 AV 测试范例做出改变之前,汽车行业永远不会迎来可以挽救万千生命的 SAE L4 级自动驾驶汽车,也不会迎来真正的全自动驾驶汽车。
作者简历:
Michael DeKort 是Dactle LLC 公司所有人兼首席技术官,他曾在洛克希德马丁公司(Lockheed Martin)工作,拥有丰富的软件工程、程序/系统管理和 DoD/FAA 飞行模拟经验,并曾在美国国土安全部/美国海岸警卫队担任主要 C4ISR 系统工程师。此外,DeKort 还是 SAE 国际自动机工程师学会道路车辆自动驾驶 V&V(测试)工作小组成员,及IEEE Barus Ethics 奖得主。