首页 > 汽车技术 > 正文

基于深度强化学习的自动驾驶评估方法在实际测试中的验证

2023-04-25 21:44:07·  来源:汽车测试网  
 
摘要:本文介绍了基于深度强化学习的自动驾驶评估方法在实际测试中的验证。通过大规模的自然驾驶数据集的训练,我们使用增强现实的测试平台在物理测试轨道和城市测试轨道上对自动驾驶系统进行了模拟实验和现场实验。结果表明,基于深度强化学习的自动驾驶评估

摘要:本文介绍了基于深度强化学习的自动驾驶评估方法在实际测试中的验证。通过大规模的自然驾驶数据集的训练,我们使用增强现实的测试平台在物理测试轨道和城市测试轨道上对自动驾驶系统进行了模拟实验和现场实验。结果表明,基于深度强化学习的自动驾驶评估方法可以无偏见地大幅加快AV的评估过程,提高多个数量级(10^3至10^5倍)。


关键词:深度强化学习、自动驾驶、评估方法、模拟实验、现场实验、增强现实、测试平台


引言

随着自动驾驶技术的发展,越来越多的自动驾驶汽车正在路上行驶。然而,自动驾驶汽车的安全性是一个关键问题,因为即使是一次小小的失误也可能导致事故的发生。因此,评估自动驾驶汽车的安全性变得至关重要。传统的评估方法通常是基于实际测试,但这种方法需要大量的时间和资源,而且有一定的风险。因此,研究人员正在寻找一种更加有效和安全的自动驾驶评估方法。


深度强化学习(Deep Reinforcement Learning, DRL)是一种在智能系统中广泛使用的方法,它可以让系统从环境中获取反馈信息,通过不断地学习和调整,使得系统可以更好地适应环境。因此,DRL可以被应用于自动驾驶汽车的评估中。基于DRL的自动驾驶评估方法可以通过训练虚拟的驾驶代理(Behavioural Vehicle,BV)来评估自动驾驶系统的性能。


为了验证基于DRL的自动驾驶评估方法在实际测试中的有效性,我们进行了大规模的自然驾驶数据集的训练,并使用增强现实的测试平台在物理测试轨道和城市测试轨道上对自动驾驶系统进行了模拟实验和现场实验。在本文中,我们将详细介绍这个评估方法以及我们的实验结果。


基于DRL的自动驾驶评估方法

基于DRL的自动驾驶评估方法可以分为两个阶段:训练阶段和测试阶段。


2.1 训练阶段


在训练阶段,我们使用DRL方法来训练虚拟的驾驶代理(BV),以模拟自动驾驶汽车的行驶过程。我们使用基于深度Q学习的D2RL算法(Deep Double Q-learning from Demonstrations)来进行训练,该算法可以从示例行驶数据中学习,并利用这些数据来优化BV的行驶策略。


在训练阶段,我们使用大规模的自然驾驶数据集来训练BV。这些数据集包含了大量的自动驾驶汽车的行驶数据,包括车速、加速度、方向盘转角等信息。我们利用这些数据来训练BV,使其能够模拟自动驾驶汽车的行驶过程,并且能够学习到有效的行驶策略。


2.2 测试阶段


在测试阶段,我们使用增强现实的测试平台来测试自动驾驶系统的性能。测试平台结合了物理测试轨道和微观交通模拟器SUMO,使得真实的自动驾驶汽车(AV)可以与虚拟的驾驶代理(BV)互动,就像在真实的交通环境中一样。通过同步真实AV和虚拟BV的运动,我们可以在物理测试轨道上对自动驾驶系统进行精确的测试。


我们对两个测试轨道进行了测试:美国移动通信中心(ACM)的4公里长的物理公路测试轨道和Mcity的城市测试轨道。在测试过程中,我们不仅评估了碰撞率,还评估了碰撞类型和碰撞严重程度。


实验结果

我们对基于DRL的自动驾驶评估方法在物理测试轨道和城市测试轨道上进行了模拟实验和现场实验。在模拟实验中,我们使用了真实的自动驾驶汽车(AV)和虚拟的驾驶代理(BV)进行测试。在现场实验中,我们使用了真实的自动驾驶汽车(AV)和真实的驾驶代理(BV)进行测试。


实验结果表明,基于DRL的自动驾驶评估方法可以有效地学习智能测试环境,与直接在NDE中测试AV的结果相比,它可以无偏见地大幅加快AV的评估过程,提高多个数量级(10^3至10^5倍)。具体来说,我们在两个测试轨道上进行了测试,结果表明基于DRL的自动驾驶评估方法比传统的评估方法更加准确和安全。


在物理测试轨道上的测试结果表明,基于DRL的自动驾驶评估方法可以有效地避免碰撞。与传统的评估方法相比,基于DRL的评估方法可以更加精确地预测和避免潜在的碰撞。在城市测试轨道上的测试结果表明,基于DRL的评估方法可以有效地避免交通拥堵和意外事件。与传统的评估方法相比,基于DRL的评估方法可以更好地模拟真实的交通环境,并且可以更好地应对复杂的交通场景。


此外,我们还评估了碰撞类型和碰撞严重程度。实验结果表明,基于DRL的自动驾驶评估方法可以有效地区分不同类型的碰撞,并且可以评估碰撞的严重程度。这些信息对于改进自动驾驶系统的安全性和性能至关重要。


结论

本文介绍了基于深度强化学习的自动驾驶评估方法在实际测试中的验证。通过大规模的自然驾驶数据集的训练,我们使用增强现实的测试平台在物理测试轨道和城市测试轨道上对自动驾驶系统进行了模拟实验和现场实验。实验结果表明,基于DRL的自动驾驶评估方法可以无偏见地大幅加快AV的评估过程,提高多个数量级(10^3至10^5倍),并且可以更加准确地预测和避免潜在的碰撞,评估碰撞的类型和严重程度。这些结果表明,基于DRL的自动驾驶评估方法是一种有效和安全的评估方法,可以为自动驾驶技术的发展提供重要的支持。


在未来的研究中,我们将进一步完善基于DRL的自动驾驶评估方法,以便更好地应对复杂的交通场景,并提高自动驾驶系统的性能和安全性。我们还将探索如何将这种评估方法应用于其他类型的交通工具,以实现更广泛的应用。

分享到:
 
反对 0 举报 0 收藏 0 评论 0
沪ICP备11026917号-25