第9章 控制系统的状态空间分析笔记
1. 引言:经典控制理论 vs 现代控制理论
1.1 经典控制理论
- 基础:建立在输入-输出关系或传递函数的基础上。
- 适用范围:主要用于单输入单输出 (SISO)、线性、定常系统。
- 分析域:复频域 (Complex Frequency Domain)。
1.2 现代控制理论
- 基础:建立在 n 个一阶微分方程组(一阶向量-矩阵微分方程)的基础上。
- 适用范围:多输入多输出 (MIMO)、线性(L)或非线性(Non-L)、定常(TI)或时变(TV)系统。
- 分析域:时域 (Time Domain)。
- 优势:
- 向量-矩阵表示法极大简化了系统的数学表达式。
- 状态变量、输入或输出数目的增加不会增加方程形式的复杂性。
2. 传递函数的状态空间表达式
将传递函数转化为状态空间表达式是现代控制理论建模的基础。一般形式为:
U(s)Y(s)=sn+a1sn−1+⋯+anb0sn+b1sn−1+⋯+bn
状态空间标准形式
{x˙(t)=Ax(t)+Bu(t)y(t)=Cx(t)+Du(t)
对应于传递函数
U(s)Y(s)=sn+a1sn−1+⋯+anb0sn+b1sn−1+⋯+bn
其状态空间表达式为:
- A 矩阵(友矩阵):最后一行由特征方程系数的负数构成,上方为移位单位阵。
A=00⋮0−an10⋮0−an−101⋮0−an−2……⋱……00⋮1−a1
B=00⋮01
C=[bn−anb0bn−1−an−1b0…b1−a1b0]
状态方程
x˙1x˙2⋮x˙n−1x˙n=00⋮0−an10⋮0−an−101⋮0−an−2⋯⋯⋯⋯00⋮1−a1x1x2⋮xn−1xn+00⋮01u
输出方程
y=[bn−anb0bn−1−an−1b0⋯b1−a1b0]x1x2⋮xn+b0u
可观测标准形的结构通常是可控标准形的转置形式:
A=010⋮0001⋮0………⋱…000⋮1−an−an−1−an−2⋮−a1
- B 矩阵:包含 bi 与 ai 的组合项。
bn−anb0bn−1−an−1b0⋮⋮b1−a1b0
C=[00…01]
状态方程:
x˙1x˙2⋮⋮x˙n=01⋮000⋮0⋯⋯⋱⋯00⋮1−an−an−1⋮−a1x1x2⋮⋮xn+bn−anb0bn−1−an−1b0⋮⋮b1−a1b0u
输出方程:
y=[00⋯01]x1x2⋮xn−1xn+b0u
当系统极点 p1,p2,…,pn 互不相同时,通过部分分式展开:
U(s)Y(s)=b0+s+p1c1+s+p2c2+⋯+s+pncn
- A 矩阵:对角阵,对角元素为特征根的负数 (−pi) 。
- B 矩阵:全 1 列向量。
- C 矩阵:由留数 ci 构成的行向量。
状态矩阵:
x˙1x˙2⋮⋮x˙n=−p10−p20⋱−pnx1x2⋮⋮xn+11⋮⋮1u
输出矩阵:
y=[c1c2⋯cn]x1x2⋮⋮xn+b0u
当系统存在重极点时使用。重极点使部分状态变量无法完全解耦,所以无法表达成对角线标准形,但可以表达成若当标准形。例如 (s+p1) 为三部分重根。
U(s)Y(s)=b0+(s+p1)3c1+(s+p1)2c2+s+p1c3+s+p4c4+⋯+s+pncn
- A 矩阵:形成若当块 (Jordan Block),对角线上为特征根,上对角线为 1。
A=−p1001−p1001−p1(对应重根部分)
状态方程:
x˙1x˙2x˙3x˙4⋮⋮x˙n=−p1000⋮01−p10⋯⋯01−p10⋮00⋮0−p40⋯⋯⋱0⋮00−pnx1x2x3x4⋮⋮xn+0011⋮⋮1u
输出方程
y=[c1c2⋯cn]x1x2⋮xn+b0u
3. 定常系统状态方程的解
3.1 齐次状态方程的解 (x˙=Ax)
3.1.1 幂级数法求解
类比标量方程 x˙=ax 的解 x(t)=eatx(0),向量微分方程 x˙=Ax 的解为:
x(t)=eAtx(0)
其中 eAt 称为矩阵指数。
3.1.2 矩阵指数 (Matrix Exponential)
eAt=k=0∑∞k!Aktk=I+At+2!A2t2+3!A2t3…
- 性质:
- dtdeAt=eAtA=AeAt
- eA(t+s)=eAteAs
- (eAt)−1=e−At
- 若 AB=BA,则 e(A+B)t=eAteBt;若 AB=BA,则通常不相等。
3.1.3 拉普拉斯变换法求解
对 x˙=Ax 进行拉氏变换:
sX(s)−x(0)=AX(s)⟹(sI−A)X(s)=x(0)
X(s)=(sI−A)−1x(0)
进行反变换得到解:
x(t)=L−1[(sI−A)−1]x(0)=eAtx(0)
3.1.4 状态转移矩阵 (State-Transition Matrix) Φ(t)
- 定义:定义状态转移矩阵 Φ(t) 为满足齐次状态方程 x˙(t)=Ax(t) 的解 x(t)=Φ(t)x(0) 的线性变换矩阵
- 对于LTI系统,齐次状态方程 x˙(t)=Ax(t) 的解可以写成 x(t)=eAtx(0)=Φ(t)x(0) ,故LTI系统的状态转移矩阵 Φ(t)=eAt
等价说法:Φ(t) 是 n×n 维矩阵,并且是以下方程的唯一解
{Φ˙(t)=AΦ(t)Φ(0)=I
- LTI系统下的解(和状态矩阵的关系):注意仅在LTI条件下可用(我们只讨论LTI系统,但状态空间模型可用于描述LTV系统),使用Laplace 变换易得
Φ(t)=eAt=L−1[(sI−A)−1]
- 物理意义:描述了系统从初始状态 x(0) 随时间的自由运动转移。(它包含系统自由运动的所有信息)
- 性质(在我们讨论的LTI系统下):
- 同一性:Φ(0)=I
- 可逆转性:Φ(t)=[Φ(−t)]−1,Φ−1(t)=Φ(−t)
- 结合律/半群性质:Φ(t1+t2)=Φ(t1)Φ(t2)=Φ(t2)Φ(t1),[Φ(t)]n=Φ(nt)
- 传递性:Φ(t2−t0)=Φ(t2−t1)Φ(t1−t0)=Φ(t1−t0)Φ(t2−t1)
- 一个好用的结论:使用同一性质易得从状态转移矩阵反解状态矩阵的方法 A=dtdΦ(t)t=0
- 当然,如果不用这个性质,可以从特征值和特征向量的角度求出状态矩阵 A
3.1.5 LTI 系统齐次状态方程解的特点
从系统的时域响应反解状态转移矩阵
- n 阶系统至少需要 n 组对应的时域零输入响应才能推导出其状态转移矩阵
把n组系统时域响应填充成矩阵形式
X(0)=[x1(0)x2(0)⋯xn(0)]X(t)=[x1(t)x2(t)⋯xn(t)]
根据定义可以写出
X(t)=Φ(t)X(0)
从而有
Φ(t)=X(t)[X(0)]−1
显然,这要求 X(0) 是可逆矩阵(满秩矩阵),所以至少要有 n 组对应的时域零输入响应,而且需要它们线性无关
求得状态转移矩阵后,还可以进一步用 A=dtdΦ(t)t=0 反解状态矩阵
解的结构和特征
对于线性定常系统 x˙=Ax,如果 λ 是矩阵 A 的特征值,v 是对应的特征向量,那么该系统的一个特解形式必然是:
x(t)=eλtv
如果存在共轭复数特征值的情况,特征值会有形式:λ=σ±jω,特征向量也会变成复向量 v=u±jw (包含实部向量 u 和虚部向量 w),特解形式会变成这样(本质上是一样的,只是我们习惯把复数化简成三角函数):
x(t)=eσt[ucos(ωt)−wsin(ωt)]
可以通过逆向操作提取特征值和特征向量:假设看到解的形式
x(t)=eσt(cos(ωt)⋅余弦系数向量a+sin(ωt)⋅正弦系数向量b)
我们就知道有特征值 λ=σ±jω ,同时对应的特征向量为
v=a∓jb
通过分析解的形式,我们可以从给定的解中找出特征值和特征向量并填充到对角矩阵 Λ,然后利用特征值分解定理 A=PΛP−1,求得特征矩阵
Λ=λ10000λ200⋯⋯⋱⋯000λnP=[v1v2⋯vn]
最后使用特征值分解定理求得状态矩阵
A=PΛP−1
3.2 非齐次状态方程的解 (x˙=Ax+Bu)
3.2.1 求解公式
通过积分因子法或拉氏变换法推导,非齐次方程的解由两部分组成:
x(t)=零输入响应eAtx(0)+零状态响应∫0teA(t−τ)Bu(τ)dτ
若初始时刻为 t0,则:
x(t)=eA(t−t0)x(t0)+∫t0teA(t−τ)Bu(τ)dτ
初始时刻为 0 的话,可以写成
x(t)=Φ(t)x(0)+∫0tΦ(t−τ)Bu(τ)dτ
3.2.2 求解实例
对于系统 A=[−11−0.50],B=[0.50],求单位阶跃响应。
- 计算 (sI−A)−1。
- 求Laplace反变换得 Φ(t)=eAt=L−1[(sI−A)−1] 。
- 利用积分公式计算 x(t)=A−1(eAt−I)B (针对单位阶跃输入零状态响应的简化公式)。
x(t)=零输入响应eAtx(0)+零状态响应∫0teA(t−τ)Bu(τ)dτ=eAtx(0)+eAt[∫0te−Aτdτ]Bu
其中积分项的闭合形式的解为
∫0te−Aτdτ=∫0t(I−Aτ+2!A2τ2−⋯)dτ=[Iτ−2!Aτ2+3!A2τ3−⋯]0t=−A−1(e−At−I)=A−1(I−e−At)
从而得到针对阶跃输入的简化公式
x(t)=eAtx(0)+A−1(eAt−I)Bu
在初始状态为零且输入为阶跃的情况下,可以进一步化简成(阶跃输入的零状态响应)
x(t)=A−1(eAt−I)Bu
- 最后通过 y=Cx 得到输出。
4. 可控性 (Controllability)
4.1 定义
如果存在一个无约束的控制向量 u(t),能在有限时间间隔 [t0,t1] 内,将系统从初始状态 x(t0) 转移到任一终止状态(通常指原点),则称系统在 t0 时刻是状态可控的。若对所有状态成立,则为状态完全可控。
- 可控性一般指的是状态可控性,解题时建议明确说明“状态可控”
4.2 判据 (可控性条件)
对于 n 维系统 x˙=Ax+Bu:
- 代数判据:系统状态完全可控的充要条件是 可控性矩阵 Qc 的秩为 n。
Qc=[BABA2B…An−1B],rank(Qc)=n
- 推广:对于 r 维输入,Qc 维度为 n×nr,秩仍需为 n 。
- S平面判据:传递函数 U(s)X(s) 中不出现零极点相消(相约现象)。如果发生相约,则被约去的模态不可控。
4.3 输出可控性
- 定义:能在有限时间内将初始输出 y(t0) 转移到任一最终输出 y(t1)。
- 输出可控性与状态可控性无关,是两个独立的概念。
- 判据:矩阵 [CB,CAB,…,CAn−1B,D] 的秩为 m(m 为输出维数)。
不可控系统:包含一种在物理上与输入量不相连接的子系统
4.4 可稳定性 (Stabilizability)
对于部分可控系统,如果其不可控模态是稳定的(特征值实部小于0),则称系统是可稳定的。
5. 可观测性 (Observability)
5.1 定义
如果系统的每一个初始状态 x(t0) 都可以通过有限时间间隔 [t0,t1] 内的输出观测值 y(t) 唯一确定,则称系统是完全可观测的。
5.2 判据 (可观测性条件)
对于系统 x˙=Ax,y=Cx:
- 代数判据:系统状态完全可观测的充要条件是 可观测性矩阵 Qo 的秩为 n。
Qo=CCA⋮CAn−1,rank(Q)=n
或者,等价地
Qo=[C∗A∗C∗…(A∗)n−1C∗]
注:课件中使用 A∗,C∗ 表示共轭转置,对于实数矩阵即为转置 AT,CT。即需 rank[CT,ATCT,…]=n。
- S平面判据:从闭环传递函数的角度,闭环传递函数中不发生零极点相消,是状态既完全可观,也完全可控的充要条件。
- 注意,这个判据并不保证随意选择的状态变量一定既完全可观也完全可控,只是保证一定能找到一组既完全可观,也完全可控的状态变量
5.3 可检测性 (Detectability)
对于部分可观测系统,如果其不可观测模态是稳定的,则称系统是可检测的。
6. 对偶原理 (Principle of Duality)
系统 S1 (x˙=Ax+Bu,y=Cx) 与系统 S2 (z˙=A∗z+C∗v,n=B∗z) 互为对偶系统。
S1:{x˙=Ax+Buy=Cx⇔S2:{z˙=A∗z+C∗vn=B∗z
原理内容:
- 系统 S1 的可观性矩阵是系统 S1 的可控性矩阵
- 系统 S1 是状态完全可控的 ⟺ 系统 S2 是状态完全可观测的。
- 系统 S1 是状态完全可观测的 ⟺ 系统 S2 是状态完全可控的。
可检测性:对于一个局部可观测的系统,如果其不可观测的模态是稳定的,其可观测的模态是不稳定的,那么就称该系统是可检测的。