分布参数系统控制是控制理论的一个重要分支。相对于集总参数系统,分布参数系统使用分布参数的偏微分方程对系统进行描述,并且结果比集总参数系统要精确的多,但问题求解的复杂度也要高得多,可以说是相当难的一个方向。本次学习材料主要是RSVP的上课课件以及我们Deutscher教授编著的德语材料:Zustandsregelung verteilt-parametrischer Systeme(原来可以免费下载,现在好像要收费了,如果需要可以邮件我)。此外,本文将以理解和应用为主,因此一些涉及到数学的复杂证明会被省略,并且会尽量以通俗的语言进行描述。准备好了吗?开始咯。
分布参数系统
概念
分布参数是什么?它是一个与集总参数相对的概念。我们之前在自控原理以及现代控制中所学习的系统都是集总参数系统,它们的系统状态都能通过有限个状态参数$x_1,x_2,…,x_n$描述。这有限个状态就是所谓的集总参数,我们通过这些状态的微分方程来分析并且控制整个系统。而现实中大多数系统是无法用有限个状态参数来表示的。例如一个长为$L$的导热棒,棒上每个位置的温度都可以是不同的,因此我们无法使用有限个位置上的温度作为状态来描述整个系统,只有将区间$[0,L]$上所有位置的温度都作为状态参数,而这样的位置由无限多个,于是我们便得到一个无限维的状态参数,它可以写成温度相对于位置的函数:$T(z)$,其中$z\in[0,L]$,这就是分布参数。若导热棒温度随时间变化,它的状态参数便也是$t$的函数,表示为$T(z,t)$。
分布参数系统就是以分布参数作为状态参数的系统,我们能通过这些状态的偏微分方程对系统进行分析控制。相比于集总参数系统,分布参数系统将有限维参数变成了无限维参数,将状态向量空间变成了函数空间,将对向量进行变换的矩阵变成了对函数进行操作的算子。而函数空间及算子均属于泛函分析范畴,在本文之后的部分会进行讨论。
控制器设计
分布参数系统是无限维的,但在控制实现时无法直接使用无限维进行操作。因此当我们设计控制器时,需要一个近似的步骤:将无限维近似为有限维。在这里我们有两种近似的过程,分别是:
early-lumping:先将系统过程(Strecke)进行近似,转化为有限维的集总参数系统,再通过现代控制理论相关方法设计控制器。该方法相对容易,但精确度不高,会丢失很多原有的系统信息。
late-lumping:先通过分布参数系统的控制方法设计相应的控制器,再通过对控制器进行近似,来实现对系统的控制。该方法精确度高,但设计过程十分麻烦。
之后的文章我们将分别使用这两种方法对过程进行控制。
数学基础
分布参数系统的计算涉及到了很多泛函以及算子方面的知识。因此接下来将对涉及到的部分数学进行介绍。
函数空间
空间这个概念在数学上是指一种具有特殊性质以及一些额外结构的集合。通俗来说,空间包含两个部分:元素和规则。以一般我们所用到的线性空间为例,它的元素就是向量,而它的规则就是空间中定义的距离,范数,内积,线性结构等等。关于各种空间的定义以及关系,将来有机会会再写一篇文章来解释。
对于函数空间来说,它的元素就是满足一定条件的函数,比如说满足定义域为0到1的所有函数。而函数与函数之间也可以有距离,角度等等规则。在分布参数系统中,我们通常使用的是函数空间中的$L_2$空间。
$L_2$空间
$L_2$空间为以$s$为定义域的所有二次可积函数组成的空间,它是一个函数空间。所谓二次可积是指函数绝对值二次方在定义域上为有限值。其数学表达式为:
其中$s$为函数的定义域,${\Bbb{C}}为函数域。$$L_2$空间是希尔伯特空间(完备的内积空间),也就是说可以在$L_2$空间中定义内积。其内积的具体形式为:
通常现实中的应用(如导热棒上的温度)都是二次可积的。因此在分布参数系统中我们通常选取$L_2$空间为系统的状态空间。
算子
算子(Operator)的定义为:从一个空间到另一个空间的映射。我们可以把它当作一种操作或者运算。当空间的某个元素经过算子的操作,就会映射为另一个空间的另一个元素。在线性空间中,算子的表现形式为矩阵,它的本质就是有限维空间的线性变换。而到了函数空间中,算子就是无限维空间的变换,将函数从一个函数空间映射到另一个函数空间。举个例子,我们学控制理论最熟悉的就是拉普拉斯算子,它的作用就是将信号函数从一个空间(时域)转换到了另一个空间(频域)。而通常我们对函数进行的操作如微分、积分等等都可以看作算子(微分算子、积分算子)。在本次分布参数系统学习中使用最多的例子是导热棒,它的状态方程可以写成:
其中$\partial_z^2$是对$z$的二阶偏微分算子,$b^T(z)$也可以看作一个算子,将它们分别设为$\cal{A}$和$\cal{B}$。因此式(3)就可以化成与集总参数系统中的状态方程类似的形式:
线性算子
在分布参数系统中我们所使用的算子都是线性算子。顾名思义,线性算子就是满足线性运算条件的算子。它在将函数从一个函数空间转换到另一个函数空间时保持加法运算和数乘运算。
线性算子的谱集
在线性空间中,一个矩阵最重要的性质就是特征值与特征根,同时它们也是系统稳定性的重要判断依据。因此作为矩阵的扩展,特征值在线性算子中的表现形式就是谱集。谱这个说法来自于光学,用来表示光谱的现象,而后在量子力学中使用线性算子来描述这些现象,因此谱的说法也被沿用下来了。
设$\mathcal{A}$为空间$\mathcal{H}\to\mathcal{H}$的线性算子。同矩阵一样,算子谱集的计算方式为:
由上式可以得到计算方程:
虽然求解的表达式与矩阵一致,但使用算子求解得到的$\lambda$值并不像矩阵那样是有限个数值。由于函数空间是无限维的,因此算子谱集中的$\lambda$值会有无穷多个。我们可以通过$(\lambda I-\mathcal{A})$的性质对$\lambda$在复平面上进行分类:
预解集:也叫正则集,表示为$\rho(\mathcal{A})$。定义:满足以下条件的$\lambda$称为正则点:
1. $(\lambda I-\mathcal{A})$的值域在$\mathcal{H}$中稠密。
2. $(\lambda I-\mathcal{A})$有连续的逆算子。
这样的$\lambda$的全体称为$\mathcal{A}$的预解集。
谱集:也叫近似点谱,表示为$\sigma(\mathcal{A})$。定义:预解集$\rho(\mathcal{A})$的补集称为$\mathcal{A}$的谱集。即:
若$\lambda\in\sigma(\mathcal{A})$,则称$\lambda$为$\mathcal{A}$的谱点。
由此可以看出,通过$(\lambda I-\mathcal{A})$的性质我们将$\lambda$的值域分成了预解集和谱集。同时我们还可以对谱集进行进一步的分类:
点谱:定义:满足以下条件的$\lambda$称为$\mathcal{A}$的点谱:
1. $\lambda I-\mathcal{A}$的映射不是一一对应的
这些$\lambda$在复平面上是一个个离散的点,因此称它们为点谱。我们将点谱的全体记为$\sigma_p(A)$。由于$\lambda I-\mathcal{A}$的映射不是一一对应的,因此式(6)在空间$\mathcal{H}$中存在非0解,此时的$\lambda$就是算子的特征值,而式(6)求得的非0解也就是特征元素(相当于矩阵中的特征向量)。
连续谱:定义:满足以下条件的$\lambda$称为$\mathcal{A}$的连续谱:
1. $\lambda I-\mathcal{A}$的映射是一一对应的,且$\lambda I-\mathcal{A}$的值域在$\mathcal{H}$中稠密。
2. $\lambda I-\mathcal{A}$的逆算子是不连续的。
这些$\lambda$在复平面上常常是连续的,因此称它们为连续谱。我们将连续谱的全体记为$\sigma_c(\mathcal{A})$。
剩余谱:定义:满足以下条件的$\lambda$称为$\mathcal{A}$的剩余谱:
1. $\lambda I-\mathcal{A}$的映射是一一对应的,但$\lambda I-\mathcal{A}$的值域在$\mathcal{H}$中不稠密。
由于其值域不稠密,在$\mathcal{H}$空间中将存在一部分无法被值域覆盖,相当于存在剩余的空间,因此称这些$\lambda$为剩余谱。我们将剩余谱的全体记为$\sigma_r(\mathcal{A})$。
由点谱、连续谱以及剩余谱的定义我们可以发现,$\sigma_p(\mathcal{A})$、$\sigma_c(\mathcal{A})$和$\sigma_r(\mathcal{A})$是互不相交的集合,并且它们的并集为$\sigma(\mathcal{A})$。在有限维空间中,矩阵的谱集全部都是点谱。而在无限维空间中,算子的谱集就可能会有连续谱以及剩余谱。下面以右移算子为例:
在希尔伯特空间$\mathcal{H}=l^2[1,\infty)$上,我们定义右移算子$\mathcal{T}:l^2\to l^2$,
当$\lambda=0$时:
我们可以发现$\lambda I-\mathcal{T}$的映射是一一对应的,但由于映射后的第一个数始终为0,因此$\lambda I-\mathcal{T}$的值域在$\mathcal{H}$中不稠密,故$\lambda=0$为剩余谱。
在本次学习中我们仅讨论一些特殊结构的算子:Riesz-Spektral算子和Sturm-Liouville算子。它们的谱集只有点谱以及点谱的聚点(属于连续谱)。因此通过它们求得的特征元素$\{\phi_i,i\geq1\}$能够作为整个函数空间$\mathcal{H}$的基,从而方便我们对系统进行分析。
伴随算子
伴随算子(Adjungiert Operator)是算子理论中的一个重要概念,它的定义由空间的内积得到:
设$x,y\in \mathcal{H}$,线性算子$\mathcal{A},\mathcal{B}$满足:
则称$\mathcal{B}$为$\mathcal{A}$的伴随算子,记作$\mathcal{A}^\ast$。若$\mathcal{A}=\mathcal{A}^\ast$,则称$\mathcal{A}$为自伴随算子(Selbstadjungiert Operator)。
在有限维中,设$x,y\in\Bbb{C}^n$,则矩阵$A$的伴随矩阵可由下列等式得出:
因此$A$的伴随矩阵为$A^\ast=\overline{A^T}$。
若$\mathcal{A}$的特征元素$\{\phi_i,i\geq1\}$为$\mathcal{H}$的一组基,则其伴随矩阵$\mathcal{A}^\ast$的特征元素$\{\psi_i,i\geq1\}$也为$\mathcal{H}$的基,并且将它们标准化后满足:
由于$\mathcal{A}$的特征元素$\{\phi_i,i\geq1\}$是$\mathcal{H}$的基,因此空间$\mathcal{H}$中任意元素$\xi$均可以通过$\phi_i$的无穷线性组合表示,其系数就可以利用式(12)进行计算:
Riesz-Spektral算子
Riesz-Spektral算子(Riesz-Spektraloperator)是一种特殊的算子。设$\mathcal{A}$是希尔伯特空间$\mathcal{H}$上的一个线性算子,并且满足:
1. $\mathcal{A}$是一个闭算子。
2. $\mathcal{A}$的特征值$\{\lambda_i,i\geq1\}$只有单根。
3. $\mathcal{A}$的特征元素$\{\phi_i,i\geq1\}$为空间$\mathcal{H}$的一组基,称为Riesz基(Riesz-Basis)。
4. $\mathcal{A}$特征值的闭包$\overline{\{\lambda_i,i\geq1\}}$是完全不相关的(vollständig unzusammenhängend),也就是说$\overline{\{\lambda_i,i\geq1\}}$中没有连续的部分。
则称$\mathcal{A}$为一个Riesz-Spektral算子。
通过上述定义可以看出:条件一表示算子定义域所在的空间是完备的,也就是说空间中所有柯西数列的极限仍在空间内。条件四限制了谱的连续性,虽然特征值的聚点属于连续谱,但实际上它们并不连续,因此空间中任意一点可以使用特征元素的累加得到(若存在连续的连续谱,那么在累加之后还需要增加积分才能表示空间中的元素。因此条件四的作用是将积分项剔除了)。
以上仅给出了Riesz-Spektral算子满足的条件,但当我们得到一个算子并不能马上判断它是不是Riesz-Spektral算子。因此下面我们介绍相对更实用的算子:Sturm-Liouville算子。
Sturm-Liouville算子
Sturm-Liouville算子(Sturm-Liouville-Operator)是Riesz-Spektral算子的一个子集。当算子$\mathcal{L}$满足:
且在希尔伯特空间$L_2(0,1)$存在内积:
并且参数满足:
1. $w(z),p(z),{dp\over dz}(z)$与$q(z)$都是在区间$[0,1]$上的实值连续函数。
2. $p(z)>0$且$w(z)>0$。
3. $\beta_1,\beta_2,\gamma_1,\gamma_2$均为实常数,且$|\beta_1|+|\gamma_1|>0$,$|\beta_2|+|\gamma_2|>0$成立。
此时我们称$\mathcal{L}$为一个Sturm-Liouville算子。
这个定义可以说是相当复杂了,但实际运用中我们可能只会用到一些简单的情况。我们可以将$w(z),p(z),q(z)$都设为常数,并且使得$w=1$,$p>0$,$q$任意取值。此时式(14)就可以化为如下的简单形式:
并且内积也变成了我们熟悉的内积形式:
Sturm-Liouville算子作为Riesz-Spektral算子的特殊情况,拥有着更好的性质。若$\mathcal{L}$在空间$\mathcal{H}$是一个Sturm-Liouville算子,那么它就满足如下性质:
1. $\mathcal{L}$在式(16)所定义的内积下是自伴随算子。
2. $\mathcal{L}$的谱集由一系列孤立单根的实特征值组成,并且只有有限个特征值在复平面的左半平面。
3. $\mathcal{L}$的特征元素在经过标准化后是一组空间$\mathcal{H}$的正交基。
可以发现满足这些性质的Sturm-Liouville算子就和线性空间的矩阵差不多了,我们可以像矩阵一样非常方便的求得特征根与特征元素,并且以此为基来分析整个系统。关于如何计算特征值与特征元素,之后的文章将会举例说明。同时它的第二条性质对我们将来的稳定性判断非常有用。根据性质二,$-\mathcal{L}$只有有限个特征值在复平面的右半平面,那么我们就能通过反馈将这有限个右半平面的特征值移动到左半平面,从而使得系统稳定。
当我们在实际运用时,只需要将遇到的算子与式(14)或式(17)进行比对,若满足就可以说该算子是一个Sturm-Liouville算子,并且满足其所有性质。
小结
- 分布参数将集总参数有限维的向量空间扩展为无限维的函数空间,将矩阵扩展为算子。但分布参数系统的状态方程仍可以使用集总参数系统类似的形式表示。
- 算子是一种空间到空间的映射。
- 矩阵的特征值扩展到线性算子就是谱集,通常用它来表示线性算子的特性。
- 可以通过伴随算子$\mathcal{A}^\ast$的基$\psi_i$来计算空间元素分解后在$\mathcal{A}$的基$\phi_i$前的系数。
- Riesz-Spektral算子与Sturm-Liouville算子为特殊算子,它们拥有良好的性质。