En àlgebra lineal i teoria de matrius, el complement de Schur d'una matriu per blocs és defineix de la manera següent.
Assumim que existeixen unes matrius A, B, C, D que són, respectivament, matrius p × p, p × q, q × p, i q × q, i que D és invertible. Aleshores podem definir M com
![{\displaystyle M=\left[{\begin{matrix}A&B\\C&D\end{matrix}}\right]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/06975df014f40e74936e5d74d528ec791a10d21e)
de forma que M és una matriu (p + q) × (p + q).
Si D és invertible, el complement de Schur del bloc D de la matriu M és la matriu p × p definida per
![{\displaystyle M/D:=A-BD^{-1}C\,}](https://wikimedia.org/api/rest_v1/media/math/render/svg/4802194e6bb60a5f2a785f1bc5c60ab136f374c3)
i si A és invertible, el complement de Schur del bloc A de la matriu M és la matriu q × q definida per
![{\displaystyle M/A:=D-CA^{-1}B.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/1a61c84fa8e803d9ff25b5a9bbb1e16186de218b)
En el cas que A o D sigui singular, substituir la pseudoinversa (o inversa generalitzada) per la inversa de M/A i M/D resulta en el complement de Schur generalitzat.
Tot i que ja havia estat utilitzat anteriorment, el complement de Schur s'anomena així perquè va ser Issai Schur qui el va utilitzar per provar el lema de Schur.[1] Emilie Virginia Haynsworth va ser la primera que va anomenar-lo complement de Schur.[2] El complement de Schur és una eina clau en els camps d'anàlisi numèrica, estadística, i anàlisi matricial.
El complement de Schur sorgeix com el resultat d'una eliminació Gaussiana per blocs, en multiplicar la matriu M des de la dreta amb una matriu triangular inferior
![{\displaystyle L={\begin{bmatrix}I_{p}&0\\-D^{-1}C&I_{q}\end{bmatrix}}.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/21c0230a15d6cc7d64f26c868d4317c060873cd4)
Aquí Ip denota una matriu identitat p×p. Després de la multiplicació amb la matriu L, el complement de Schur apareix al bloc superior p×p. El producte de les matrius és
![{\displaystyle {\begin{aligned}ML&={\begin{bmatrix}A&B\\C&D\end{bmatrix}}{\begin{bmatrix}I_{p}&0\\-D^{-1}C&I_{q}\end{bmatrix}}={\begin{bmatrix}A-BD^{-1}C&B\\0&D\end{bmatrix}}\\[4pt]&={\begin{bmatrix}I_{p}&BD^{-1}\\0&I_{q}\end{bmatrix}}{\begin{bmatrix}A-BD^{-1}C&0\\0&D\end{bmatrix}}.\end{aligned}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/adfb30d574515d0d181db3ffe0489504982baa70)
Això és anàleg a una descomposició LDU. Per tant, hem demostrat que
![{\displaystyle {\begin{aligned}{\begin{bmatrix}A&B\\C&D\end{bmatrix}}&={\begin{bmatrix}I_{p}&BD^{-1}\\0&I_{q}\end{bmatrix}}{\begin{bmatrix}A-BD^{-1}C&0\\0&D\end{bmatrix}}{\begin{bmatrix}I_{p}&0\\D^{-1}C&I_{q}\end{bmatrix}},\end{aligned}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/290d03916d21bdfeb0bd1e1239b158efee644af6)
i la inversa de M pot ser expressada implicant D−1 i la inversa del complement de Schur (si existeix) només com
![{\displaystyle {\begin{aligned}&{\begin{bmatrix}A&B\\C&D\end{bmatrix}}^{-1}={\begin{bmatrix}I_{p}&0\\-D^{-1}C&I_{q}\end{bmatrix}}{\begin{bmatrix}\left(A-BD^{-1}C\right)^{-1}&0\\0&D^{-1}\end{bmatrix}}{\begin{bmatrix}I_{p}&-BD^{-1}\\0&I_{q}\end{bmatrix}}\\[4pt]={}&{\begin{bmatrix}\left(A-BD^{-1}C\right)^{-1}&-\left(A-BD^{-1}C\right)^{-1}BD^{-1}\\-D^{-1}C\left(A-BD^{-1}C\right)^{-1}&D^{-1}+D^{-1}C\left(A-BD^{-1}C\right)^{-1}BD^{-1}\end{bmatrix}}\\[4pt]={}&{\begin{bmatrix}\left(M/D\right)^{-1}&-\left(M/D\right)^{-1}BD^{-1}\\-D^{-1}C\left(M/D\right)^{-1}&D^{-1}+D^{-1}C\left(M/D\right)^{-1}BD^{-1}\end{bmatrix}}.\end{aligned}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/49b5ce3a986715e397b49dbb88dfc73b7cfc2dcd)
Cf. El lema d'inversió de matrius que il·lustra relacions entre el que s'ha explicat a dalt i la derivació equivalent amb els rols de A i D intercanviats.
- Si p i q són 1 (és a dir si A, B, C i D són escalars), trobem la fórmula per obtenir la inversa d'una matriu 2 per 2:
- :
![{\displaystyle M^{-1}={\frac {1}{AD-BC}}\left[{\begin{matrix}D&-B\\-C&A\end{matrix}}\right]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/5648f3d0958a38c96d297032e064e55d8ddf260a)
- Amb la condició que AD - BC sigui diferent de zero.
- En general, si A és invertible, llavors
- :
![{\displaystyle {\begin{aligned}M&={\begin{bmatrix}I_{p}&0\\CA^{-1}&I_{q}\end{bmatrix}}{\begin{bmatrix}A&0\\0&D-CA^{-1}B\end{bmatrix}}{\begin{bmatrix}I_{p}&A^{-1}B\\0&I_{q}\end{bmatrix}},\\[4pt]M^{-1}&={\begin{bmatrix}A^{-1}+A^{-1}B(M/A)^{-1}CA^{-1}&-A^{-1}B(M/A)^{-1}\\-(M/A)^{-1}CA^{-1}&(M/A)^{-1}\end{bmatrix}}\end{aligned}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/c6c18ee565c98efa572569452f141b698e5eb676)
- sempre que aquesta inversa existeixi.
- Quan A, i respectivament D, és invertible, el determinant de M és també donat per
- :
, respectivament
- :
,
- cosa que generalitza la fórmula del determinant de matrius 2 × 2.
- (Fórmula d'additivitat de rang de Guttman) Si D és invertible, aleshores el rang de M és donat per
- :
![{\displaystyle \operatorname {rank} (M)=\operatorname {rank} (D)+\operatorname {rank} \left(A-BD^{-1}C\right)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/971c6ecac4acfb92a949b15398898a2cd93e8bd8)
- (Fórmula d'additivitat de la inèrcia de Haynsworth) Si A és invertible, llavors la inèrcia de la matriu per blocs M és igual a la inèrcia de A més la inèrcia de M/A.
Aplicació a la solució d'equacions lineals
[modifica]
El complement de Schur sorgeix naturalment en la solució de sistemes d'equacions lineals com
![{\displaystyle {\begin{aligned}Ax+By&=a\\Cx+Dy&=b\end{aligned}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/61efa3501e486ecce7e628ea41832197488cb0b5)
On x i a són vectors columna de dimensió p, y i b són vectors columna de dimensió q, A, B, C, D són definides com a dalt, i D és invertible. Multiplicant l'equació inferior per
i després restant de l'equació superior es pot obtenir
![{\displaystyle \left(A-BD^{-1}C\right)x=a-BD^{-1}b.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/ff32c4200d918ea47c812c15a4fedcabe7128190)
Per tant, si es pot invertir D així com el complement de Schur de D, es pot resoldre l'equació per x, i llavors utilitzant l'equació
es pot solucionar per y. Això redueix el problema d'invertir una matriu
a invertir una matriu p × p i una matriu q × q. En un cas pràctic, D ha d'estar ben condicionada per a que aquest algoritme sigui numèricament acurat.
En enginyeria elèctrica aquest mètode es fa servir amb el nom d'eliminació de nodes o reducció de Kron.
Aplicacions a teoria de probabilitat i estadística
[modifica]
Assumim que existeixen uns vectors columna aleatoris X i Y pertanyents a Rn i Rm respectivament, on el vector (X, Y) pertanyent a Rn + m té una distribució normal multivariable on la seva covariància és la matriu simètrica i definida positiva següent
![{\displaystyle \Sigma =\left[{\begin{matrix}A&B\\B^{\mathsf {T}}&C\end{matrix}}\right],}](https://wikimedia.org/api/rest_v1/media/math/render/svg/5bf35784653a08212a79b4cc14384603c549bb98)
On
és la matriu de covariància de X,
és la matriu de covariància de Y i
és la matriu de covariància entre X i Y.
Aleshores la covariància condicional de X donada Y és el complement de Schur de C dins
[3]
![{\displaystyle {\begin{aligned}\operatorname {Cov} (X\mid Y)&=A-BC^{-1}B^{\mathsf {T}}\\\operatorname {E} (X\mid Y)&=\operatorname {E} (X)+BC^{-1}(Y-\operatorname {E} (Y))\end{aligned}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/268180dc87aad8c170e5ed70a89a1680ea4dd7e0)
Si agafem la matriu
com la covariància de mostra, i no com la covariància d'un vector aleatori, llavors aquesta pot tenir una distribució de Wishart. En aquest cas, el complement de Schur de C dins
també té una distribució de Wishart.[cal citació]
Condicions per matrius definides positives i semidefinides positives
[modifica]
Prenguem X com una matriu simètrica de nombres reals i definida de la manera següent
![{\displaystyle X=\left[{\begin{matrix}A&B\\B^{\mathsf {T}}&C\end{matrix}}\right].}](https://wikimedia.org/api/rest_v1/media/math/render/svg/d8b556af13ae6692cfd2ae0cfedb944a24c7e486)
Aleshores
- Si A és invertible, llavors X és definida positiva si i només si A i el seu complement de Schur X/A són tots dos definits positius:
- :
[4]
- Si C és invertible, llavors X és definida positiva si i només si C i el seu complement de Schur X/C són tots dos dos definits positius:
- :
![{\displaystyle X\succ 0\Leftrightarrow C\succ 0,X/C=A-BC^{-1}B^{\mathsf {T}}\succ 0.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/feb8804945057ef7e8221cb3b57fcb6a9301bb76)
- Si A és definida positiva, llavors X és semidefinida positiva si i només si el complement de Schur X/A és semidefinit positiu:
- :
[4]
- Si C és definida positiva, llavors X és semidefinida positiva si i només si el complement de Schur X/C és semidefinit positiu:
- :
![{\displaystyle {\text{If }}C\succ 0,{\text{ then }}X\succeq 0\Leftrightarrow X/C=A-BC^{-1}B^{\mathsf {T}}\succeq 0.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/25c6ea6fbc655f92ac36580b18a9a735ffbf0428)
Les declaracions primera i tercera poden ser derivades quan es considera el minimitzador de la quantitat[5]
![{\displaystyle u^{\mathsf {T}}Au+2v^{\mathsf {T}}B^{\mathsf {T}}u+v^{\mathsf {T}}Cv,\,}](https://wikimedia.org/api/rest_v1/media/math/render/svg/f552ed903eaad97e0650051df1dc6306bc5648bd)
Com una funció de v (per u constant).
A més, perquè
![{\displaystyle \left[{\begin{matrix}A&B\\B^{\mathsf {T}}&C\end{matrix}}\right]\succ 0\Longleftrightarrow \left[{\begin{matrix}C&B^{\mathsf {T}}\\B&A\end{matrix}}\right]\succ 0}](https://wikimedia.org/api/rest_v1/media/math/render/svg/ee22e5f6ff2447b9fa19c85a33e5191aee3e40c3)
la segona declaració es compleix a conseqüència de la primera.
Cal notar que això també és així per a la quarta declaració respecte de la tercera.
Aquesta línia de raonament es pot aplicar equivalentment a les matrius semidefinides positives.
Finalment, hi ha també una condició suficient i necessària pel verificar que una matriu X és semidefinida positiva, en termes d'un complement de Schur generalitzat.[1] Aquesta condició pot expressar-se com
- I
![{\displaystyle X\succeq 0\Leftrightarrow A\succeq 0,C-B^{\mathsf {T}}A^{g}B\succeq 0,\left(I-AA^{g}\right)B=0\,}](https://wikimedia.org/api/rest_v1/media/math/render/svg/dafc58815a8a30b1afee50ddd53a0ff44e44e12d)
![{\displaystyle X\succeq 0\Leftrightarrow C\succeq 0,A-BC^{g}B^{\mathsf {T}}\succeq 0,\left(I-CC^{g}\right)B^{\mathsf {T}}=0,}](https://wikimedia.org/api/rest_v1/media/math/render/svg/a8c9ac0b469fb8068b822a29dff7b65e394a6fa5)
On
denota la inversa generalitzada (o pseudoinversa) de
.
- ↑ 1,0 1,1 Zhang, Fuzhen. The Schur Complement and Its Applications. Springer, 2005. DOI 10.1007/b105056. ISBN 0-387-24271-6.
- ↑ Haynsworth, E. V., "On the Schur Complement", Basel Mathematical Notes, #BNB 20, 17 pages, June 1968.
- ↑ von Mises, Richard. «Chapter VIII.9.3». A: Mathematical theory of probability and statistics. Academic Press, 1964. ISBN 978-1483255385.
- ↑ 4,0 4,1 Zhang, Fuzhen. The Schur Complement and Its Applications. Springer, 2005, p. 34.
- ↑ Boyd, S. and Vandenberghe, L. (2004), "Convex Optimization", Cambridge University Press (Appendix A.5.5)