做新能源汽车相关研究,能量管理控制策略是一个绕不开的话题,特别是基于优化算法的能量管理控制策略。
1. 基于优化算法的能量管理控制策略概述
优化算法可分为全局优化和实时优化,受算法本身的限制以及采样时间、模型精度、参数定义等因素的影响,目前这种区分尚不明显。目前主要的优化算法包括下列11种,上期介绍前5种,本期介绍后6种:
- 动态规划(Dynamic Programming,DP)
- 等效燃油消耗最小策略(Equivalent Consumption Minimization Strategy,ECMS)
- 模型预测控制(Model Predictive Control,MPC)
- 神经网络算法(NeuralNetworks,NN)
- 滑模控制(Sliding ModeControl,SMC)
- 无导数优化算法——模拟退火(Simulated Annealing,SA)
- 无导数优化算法——遗传算法(Genetic Algorithm,GA)
- 无导数优化算法——粒子群算法(Particle Swarm Optimization,PSO)
- 无导数优化算法——DIRECT算法
- 博弈论(Game Theory,GT)
- 凸规划(Convex Programming,CP)
2. 无导数优化算法——模拟退火
模拟退火是一种受金属退火过程启发的方法,该方法通过随机搜索,显示目标函数优化的可能最优解的同时保留了符合标准定义的次优解,这样可以防止算法陷入局部极小值,并增强其向全局最优的演化。模拟退火算法相对容易实现,计算结果较好,计算量小,这使得它可以实时应用。由于模拟退火是为解决组合问题而开发的,因而在有限仿真时间内与动态规划算法相比是有竞争力的,同时也很容易扩展到连续优化问题。
3. 无导数优化算法——遗传算法
遗传算法是受自然选择和遗传进化启发的随机方法,也是进化算法的一个特例。它由三个阶段组成:复制,交叉信息和变异。在处理复杂问题时,该算法具有良好的性能。此外,遗传算法只会保存当前状态和最后种群,需要内存资源较少。与其他优化策略相比,遗传算法的主要优势之一是不同代理之间的并行性检测能力,有利于计算帕累托解。遗传算法包含精英主义,以确保最优解被传递到下一个迭代步骤而不发生重大变化。
4. 无导数优化算法——粒子群算法
粒子群算法来自群体中社会有机体的行为,例如蜂群、蚁群和鸟群这些群体在成员之间共享信息。粒子群优化由于解的种群特征与遗传算法中的交叉机制类似,因而被认为是进化算法的一个特例。该算法填充粒子状态、位置和速度。粒子之间可以互相交换信息,并可以存储他们最后的最佳位置和组群的最优解,以改善下一种群。粒子群优化对复杂的目标函数具有鲁棒性,只需要每个粒子的两个变量(即位置和速度)进行迭代。与其他启发式优化算法相比,少量的调谐参数有助于其实现并降低其对初始解的敏感性。
5. 无导数优化算法——DIRECT算法
DIRECT是一种抽样无导数方法,将搜索空间缩放到具有立方体形状的固定区域中,并在每个区域的中心点搜索最优解。最优解需要按照每个立方分区的最长坐标方向重新采样和确认。直到达到终止条件该算法完成,可以用解的精确度和迭代次数来表示。结果的适用性通过成本函数进行评估。图1说明了DIRECT方法的三次迭代。与其他元启发式优化算法相比,DIRECT方法相对简单,既不需要调整参数,也可以处理等式和不等式约束。此外,它在非线性和干扰的情况下具有鲁棒性。
图1DIRECT方法的三次迭代的表示
6. 博弈论
博弈论处理决策者(也称为玩家)之间的互动。根据玩家与其他玩家的行为,游戏可以分为两组。一方面,游戏是“非合作”,玩家采取个人行动,以最大限度地提高自己的回报。另一方面,游戏是“合作”,当采取行动时最大限度地实现群体目标。非合作博弈的一个例子是驾驶员和传动系统之间的互动,可以理解为冲突目标之间的竞争,驾驶员期望性能和燃料经济性。发动机和电动机合作,旨在最大限度地提高他们的综合性能和节省燃料,为一个合作博弈。能量管理中最常见的是双人非合作博弈。驾驶员的意图是获得期望的车辆性能,这导致低效的工作条件,而动力总成本身有油耗优化的目标。该应用突出了博弈论的一个主要优点,即将驾驶员视为控制策略的一部分,预计驾驶风格与燃料消耗。
7. 凸规划
由于车辆模型的复杂性,上述能量管理策略必须处理数学困难,例如非线性、各种约束和计算负担。一些文献还探讨了简化能量管理策略实施的简化技术,包括线性化,二次规划,凸规划和解析方程推导。这些公式适用于强大求解器,可以在较短的时间内获得最优解,并有可能提高鲁棒性。但解的质量受到简化后模型保真度下降的影响,从而得到近似最优解。
凸规划是线性规划和二次规划的推广。只有在问题可以严格表示为凸项时,该算法才可适用,需要将成本函数和不等式约束以凸函数形式表示。车辆模型需要简化以符合凸性要求:
(1)消除整数决策:发动机开关,换挡等;
(2)如果平等约束不是仿射的,平等约束必须放宽;
(3)使用新变量来保持凸面性,如电池能量而不是SOC;
(4)离散时间的问题编码。
8. 小结和展望
这两期我们介绍了当前11种基于优化算法的能量管理控制策略。多数优化目的也是想将更多的工况信息能够实时运用到能量管理控制策略中。随着智能手机日益普及使用GPS、无线连接,可以更便捷地通过网络可获取实时交通环境,将这些获取的信息与模型预测控制相结合,吸收实时交通信息,从而使能量管理策略更加优化。那么能量管理策略与智能交通系统可以有怎样的结合呢?请关注后续文章的介绍:
■ 能量管理控制策略与智能交通系统的结合
■ 测试评价过程针对能量管理控制策略的研究
■ 能量管理控制策略未来发展趋势分析