清华大学车辆与运载学院智能驾驶课题组荣获ICCAS 2020最佳学生论文奖

车辆学院穆尧、彭柏寓等同学发表的论文荣获第20届ICROS国际控制自动化与系统大会(ICCAS 2020)“最佳学生论文奖”
知识与数据联合驱动学习是人工智能领域最重要的发展方向之一。该研究工作以探索能力受限且不确定性环境为对象(典型例子是行驶于城市道路的自动驾驶汽车),提出了模型与数据同步驱动的混合强化学习(MAC,Mixed Actor-Critic)算法,突破了收敛快速性和策略准确性难以同时保障的难题。该法以经验解析模型和真实交互数据的混合表征模型为基础,首次将策略迭代(Policy Iteration)的两步结构扩展为三步结构,即:迭代贝叶斯估计(IBE)、策略评估(PEV)、策略改进(PIM),且理论证明了该三步迭代学习结构的收敛性与最优性,这为模型与数据混合驱动学习提供了全新的统一框架。

以自动驾驶汽车的运动控制任务为例,验证表明:该法有效提升了自动驾驶控制策略的学习速度,与纯数据驱动法相比提速近25倍,同时保证了所求解策略的最优性,与纯模型驱动法相比性能提升约15%。该算法为高级别智能汽车进一步发展自我进化型驾驶智能奠定了基础。
注:ICCAS全称” The International Conference on Control, Automation, and Systems”, 是机器人与智能控制领域的顶级学术会议之一,每年召开一次。
编辑推荐
最新资讯
-
测迅乌镇&盐城测试场:助力智能网联汽车标
2025-02-22 12:39
-
使用示波器对三相电机驱动器进行测量
2025-02-22 12:37
-
上汽集团大乘用车重磅招聘
2025-02-22 12:25
-
GB/T 44173-2024对开门预警DOW的要求
2025-02-22 12:25
-
声音工程:像用PS一样编辑声音
2025-02-21 17:04