最佳投影方程(optimal projection equations)[1][2][3]是控制理论中,建構局部最佳降階LQG控制器的充分必要条件[4]。
LQG控制(線性二次高斯控制)問題是最优控制領域中最基礎的問題之一,這問題包括了存在不確定性的線性系統,受到加性高斯白噪声的影響,沒有完整的狀態資訊(無法量測到所有的狀態變數,也無法透過回授得知),對應二次的成本泛函。不過存在唯一解,而且可以建構線性動態回授的控制律,易於計算以及實現。而LQG控制器也是非線性系統中最佳擾動控制的基礎[5]。
LQG控制器的架構會類似要控制的系統,兩者會有相同的維度。因此若系統本身就是高維度,要實現(全階)LQG控制器會很困難。降階LQG問題(固定階LQG問題)事先固定LQG控制器的階數,因此克服了這個困難。不過在全階LQG控制器中適用的分離原理,在降階LQG問題中已無法適用,因此這方面會更困難,而且其解也不唯一。不過可以找到數值分析的演算法[4][6][7][8]來求解對應的最佳投影方程。
降階的LQG控制問題幾乎和全階的LQG控制問題相同。令
表示降階LQG控制器的狀態,唯一的差異是LQG控制器的狀態維度
是事先定義好的值,比受控系統的狀態維度
要少。
降階LQG控制器可以表示為下式:


上述公式刻意寫的類似傳統全階LQG控制器的形式,降階的LQG控制問題也可以改寫為下式:


其中

降階LQG控制器的矩陣
和
是由所謂的最佳投影方程(optimal projection equations、OPE)來決定[3]。
維的最佳投影方陣
是OPE的核心。此矩陣的秩在所有狀態下幾乎都等於
。相關投影為斜投影(oblique projection):
。最佳投影方程包括四個矩陣微分方程。前二個是LQG控制器對應的矩陣Riccati微分方程的擴展。在方程式中
表示
,而
為
維的單位矩陣
![{\displaystyle {\begin{aligned}{\dot {P}}(t)={}&A(t)P(t)+P(t)A'(t)-P(t)C'(t)W^{-1}(t)C(t)P(t)+V(t)\\[6pt]&{}+\tau _{\perp }(t)P(t)C'(t)W^{-1}(t)C(t)P(t)\tau '_{\perp }(t),\\[6pt]P(0)={}&E\left({\mathbf {x} }(0){\mathbf {x} }'(0)\right),\\[6pt]&{}-{\dot {S}}(t)=A'(t)S(t)+S(t)A(t)-S(t)B(t)R^{-1}(t)B'(t)S(t)+Q(t)\\[6pt]&{}+\tau '_{\perp }(t)S(t)B(t)R^{-1}(t)B'(t)S(t)\tau _{\perp }(t),\end{aligned}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/78427fd12c675f686999ba90ae076cb79b5b33c9)

若LQG的維度沒有減少,也就是
,則
,上述二個方程就是二個沒有耦合的矩陣Riccati微分方程,對應全階的LQG控制器。若
,則兩個方程會有斜投影項
。這也是為何降階的LQG控制器無法分離的原因,斜投影
是由另外二個矩陣微分方程所決定,其中也和秩的條件(rank conditions)有關。這四個矩陣微分方程組成了最佳投影方程。為了要列出另外二個矩陣微分方程,先定義以下二個矩陣:


則最後二個矩陣微分方程如下:
almost everywhere,
almost everywhere,
其中

此處的 * 表示群廣義逆矩陣(group generalized inverse)或Drazin逆矩陣,是唯一的,定義如下

其中 + 是摩尔-彭若斯广义逆.
矩陣
都需要是非負對稱矩陣。可以建構最佳投影方程的解,而此解可以決定降階LQG控制器矩陣
和
:




上式中的矩陣
是符合以下性質的矩陣:
幾乎在所有狀態下。
可以由
的投影分解中得到[4]:
若降階LQG問題中的所有矩陣都是非時變的,且最終時間(horizon)
趨近無限大,則最佳降階LQG控制器和最佳投影方程也都會是非時變的[1]。此情形下,最佳投影方程左側的微分項會為零。
離散時間的情形類似連續時間的例子,要處理的是將
階傳統離散時間全階LQG問題轉換為事先已知固定階數的
階降階LQG控制器。為了要表示離散時間的OPE,先引入以下二個矩陣:


則離散時間OPE為
.
.
almost everywhere,
almost everywhere.
斜投影(oblique projection)矩陣為

非負對稱矩陣
是離散時間OPE的解,也決定了降階LQG控制器的矩陣
and
:




在上述的方程中,矩陣
是有以下性質的矩陣:
幾乎在所有狀態下。
這些矩陣可以從
的投影因式分解中求得[4]。
如同在連續時間中的例子一樣,若問題中所有的矩陣都是非時變,且且最終時間(horizon)
趨近無限大,降階LQG控制器就會是非時變的。因此離散時間OPE會收斂到穩態解,決定非時變的降階LOG控制器[2]。
離散時間OPE也可以應用在狀態維度,輸入維度或是輸出維度可變的離散時間系統(具有時變維度的離散時間系統)[6]。若在數位控制器中的取樣是不同步的,就可能會出現這類的系統。