首页 > 汽车技术 > 正文

连续系统与离散系统LQR问题求解:以车辆二自由度模型为例

2021-12-23 08:51:10·  来源:智能运载装备研究所  作者:刘玉杰  
 
线性二次型最优控制(Linear Quadratic Regulator,LQR)是一种具有二次型性能指标的最优控制方法,用稳定性理论解决“参数优化问题”,通过选取适当的权重参数
线性二次型最优控制(Linear Quadratic Regulator,LQR)是一种具有二次型性能指标的最优控制方法,用稳定性理论解决“参数优化问题”,通过选取适当的权重参数,可以在保证系统稳定的前提下,使二次型性能指标最小化,从而使系统的过渡过程具有较好的性能,因此在实践上得到广泛应用。LQR控制思想是通过计算最优控制变量使得二次型目标函数最小化,详细推导过程可详见公众号文章:无人驾驶控制算法之LQR控制一种面向二自由度动力学模型应用的控制器和观测器设计迭代方法。但是,连续系统与离散系统的LQR问题求解是有区别的,因此,本文就以车辆二自由度模型为例,分别对连续系统和离散系统的LQR问题求解展开讨论。
首先,对两个系统的Riccati方程和最优反馈增益进行推导。
一.连续系统有限时间状态调节器
假定线性时变受控系统状态方程为:


其中,m维控制向量u(t)不受约束。
要求确定u(t),使得如下性能指标为最小:


构造哈密顿函数:


控制方程为:


故最优控制为:


通常,希望最优控制以状态反馈形式,为此假定




最优控制对应的规范方程组为:






可得


代入规范方程组得:








由x(t)任意可得Riccati方程为:






综上所述,连续时间有限时间状态调节器问题最终归结为Riccati方程求解问题。由Riccati方程求出P,便可得出最优控制:



其中,L(t)为最优状态反馈增益矩阵。
二.连续系统无限时间状态调节器
针对上述连续系统有限时间状态调节器问题,当tf→∞时,LQR问题的性能指标为


线性定常系统的无限时间状态调节器问题可以看成时线性可变系统退化为线性定常系统且控制时间tf→∞时的极限情况。这时Riccati方程的解随着tf→∞将趋于一稳态值。它是下列Riccati代数方程的解:


最优控制为:



三.离散系统有限时间状态调节器
假设线性时变离散系统的状态方程为:


二次型性能指标为:


采用极小值原理进行求解,首先构造哈密顿函数:



控制方程为



假设


代入协态方程中得:


由状态方程和控制方程可得:



可得


将上式代入并消去等式两端的x(k),可得K(k)必须满足如下Riccati矩阵差分方程:


对上式方括号部分应用矩阵求逆引理:





可得Riccati方程的另一个形式:


从k=N开始反向递推计算式即可决定K(k)。
下面来计算u(k)。由式得:



可得



则控制变量可写成另一种形式:


对上式大括号内引用前面的矩阵求逆引理,令



可得


则最优反馈增益矩阵为:



四.离散系统无限时间状态调节器
与连续系统无限时间状态调节器相类似,当N→∞时,LQR的性能指标为



参考上述离散系统的有限时间状态调节器,将时变矩阵换成常数阵,增益矩阵K趋近于一常值矩阵,可得Riccati方程为:



则最优控制为:



五.仿真求解
基于LQR对汽车二自由度模型进行控制,并将其分成连续和离散系统进行对比。对于离散系统利用迭代法对Riccati方程进行求解,进而求解K值;而连续系统则直接利用MATLAB中LQR命令对K值进行求解。结果显示,无论是连续系统还是离散系统所求K值是几乎相同的(如表1所示),也就是说明连续与离散系统的调节效果几乎相同(如图1,红线表示连续系统,蓝线表示离散系统)。由此可知,在对Riccati方程进行求解时,无论使用离散方法求解还是连续方法求解对系统的控制效果几乎是相同的,不过值得说明的是,两者结果的差别还与系统离散的精度有关。
表1 增益矩阵K对比
连续系统
离散系统
K1
0.0895
0.0784
K2
0.07
0.0587


 
分享到:
 
反对 0 举报 0 收藏 0 评论 0
沪ICP备11026917号-25