清华大学车辆与运载学院智能驾驶课题组荣获ICCAS 2020最佳学生论文奖
车辆学院穆尧、彭柏寓等同学发表的论文荣获第20届ICROS国际控制自动化与系统大会(ICCAS 2020)“最佳学生论文奖”
知识与数据联合驱动学习是人工智能领域最重要的发展方向之一。该研究工作以探索能力受限且不确定性环境为对象(典型例子是行驶于城市道路的自动驾驶汽车),提出了模型与数据同步驱动的混合强化学习(MAC,Mixed Actor-Critic)算法,突破了收敛快速性和策略准确性难以同时保障的难题。该法以经验解析模型和真实交互数据的混合表征模型为基础,首次将策略迭代(Policy Iteration)的两步结构扩展为三步结构,即:迭代贝叶斯估计(IBE)、策略评估(PEV)、策略改进(PIM),且理论证明了该三步迭代学习结构的收敛性与最优性,这为模型与数据混合驱动学习提供了全新的统一框架。
以自动驾驶汽车的运动控制任务为例,验证表明:该法有效提升了自动驾驶控制策略的学习速度,与纯数据驱动法相比提速近25倍,同时保证了所求解策略的最优性,与纯模型驱动法相比性能提升约15%。该算法为高级别智能汽车进一步发展自我进化型驾驶智能奠定了基础。
注:ICCAS全称” The International Conference on Control, Automation, and Systems”, 是机器人与智能控制领域的顶级学术会议之一,每年召开一次。
-
汽车测试网V课堂
-
微信公众号
-
汽车测试网手机站
编辑推荐
最新资讯
-
荷兰Zepp氢燃料电池卡车-Europa
2024-12-22 10:13
-
NCACFE -车队油耗经济性报告(2024版)
2024-12-22 10:11
-
R54法规对商用车轮胎的要求(上)
2024-12-22 10:10
-
蔚来ET9数字架构解析
2024-12-22 09:53
-
4G/5G网络新时代的高效紧急呼叫系统NG-eCal
2024-12-20 22:33