Вы находитесь на странице: 1из 36

Cap tulo 9

El algebra de los valores propios

9.1.

Introducci on

El objetivo de este tema es proporcionar las ideas matem aticas que se usan en el c alculo num erico de los valores propios de matrices. En parte es un repaso de conceptos ya estudiado en cursos b asicos de Algebra Lineal pero el enfasis se pone en aquellos aspectos que son importantes en el an alisis num erico. As , mientras que el objetivo te orico u ltimo, en relaci on con los valores y vectores propios, es la obtenci on de la forma can onica de Jordan que proporciona un sistema completo de invariantes para la semejanza (o conjugaci on) de matrices, esta es de muy poca relevancia desde el punto de vista num erico. La raz on es que la forma can onica de Jordan es altamente inestable y, salvo que se usen algoritmos simb olicos, rara vez se puede obtener con abilidad. A lo largo de este tema veremos que uno de los problemas es que las transformaciones de semejanza no son recomendables para la obtenci on de los valores y vectores propios de matrices. En su lugar, mucho m as ables son las transformaciones de semejanza unitaria. Este planteamiento nos conduce a estudiar 173

174

El a lgebra de los valores propios

con detalle la forma de Schur (compleja y real) que ser a el objetivo nal de los algoritmos de c alculo de valores propios. En este primer tema sobre valores propios nos centraremos en los aspectos te oricos que nos permitir an comprender mejor los algoritmos que veremos en el siguiente tema. Empezaremos repasando los conceptos de Algebra Lineal relacionados con los valores y vectores propios. Entre otras cosas veremos que el conjunto de las matrices con valores propios distintos forman un conjunto denso en el espacio de las matrices cuadradas; lo cual, desde un punto de vista num erico, hace pr acticamente indistinguibles las matrices con valores propios distintos de las que no tienen esta propiedad. Por ello, las matrices que tienen valores propios repetidos se llaman matrices defectuosas. Veremos que no ser defectuosa equivale a ser diagonalizable por semejanza (o conjungaci on). La mayor parte de los problemas en los que hay que calcular valores propios suelen involucrar matrices de n umeros reales. Pero como estas pueden tener valores propios complejos y la teor a b asica es la misma para matrices reales o complejas, en todo este tema, y salvo que se especique lo contrario, F representar a indistintamente el cuerpo de los n umeros reales o el de los complejos.

9.2.

Valores y vectores propios

Si A P Fnn , 0 x P Cn tal que

P C es un valor propio (o autovalor) de A si existe un vector no nulo


Ax  0 x

Al conjunto de valores propios (distintos) de A lo denotaremos por pAq; y a este conjunto se le conoce con el nombre de espectro de A. En algunos libros y art culos se le suele denotar por pAq, pero cada vez se utiliza m as la notaci on que se emplear a aqu : pAq. Si 0 P pAq, los vectores x  0 para los que Ax  0 x se llaman vectores propios o autovectores de A asociados al valor propio 0 . Para 0 P pAq sea S0

 tx P Cn|Ax  0xu

Este conjunto es un subespacio vectorial de Cn que se llama subespacio propio de A asociado a 0 . Como x P S0 p0 In Aqx  0

9.2 Valores y vectores propios

175

resulta que el subespacio propio de A asociado a 0 es Kerp0 In x P S0 entonces p0In AqAx  Ap0In Aqx  0,

Aq. Adem as si

de modo que Ax P S0 . Los subespacios que cumplen esta propiedad (x P S Ax P S ) se llaman subespacios invariantes por A. As pues, los subespacios propios de A son invariantes por A (o A-invariantes). La siguiente propiedad pone de maniesto que vectores propios asociados a valores propios distintos son linealmente independientes Proposici on 9.1 Sea A P Fnn y t1 , . . . , s u pAq. (a) Si para i  1, . . . , s, xi es un vector propio de A asociado al valor propio i , entonces los vectores x1 ,. . . , xs son linealmente independientes. (b) La suma Kerp1 In Aq Kerps In Aq es directa. Demostraci on.- (a) Lo demostraremos por contradicci on. Recordemos que pAq es el conjunto de los valores propios de A y, por lo tanto i  j para i  j . Con los vectores x1 ,. . . , xs constru mos la matriz X  x1 xs . Si x1 ,. . . , xs no son linealmente dependientes, entonces rang X  r s y hay r columnas de X , digamos xi1 ,. . . , xir que son linealmente independientes y vectores propios asociados a los valores propios i1 ,. . . , ir . Sea xj una columna de X tal que j R ti1 , . . . , ir u, entonces xj  1 xi1 r xir . Como xj
 

P Kerpj In Aq y Axi  i xi , k  1, . . . , s, resulta que


k k k 1 r 1 1

0  pj In Aqxj

 pj InAqp1xi r xi q  1pj i qxi r pj i qxi


r

Y como xi1 ,. . . , xir son linealmente independientes k pj

i q  0,
k

 1, . . . , r.

Pero xj  0, de modo que al menos un k  0. Para ese ndice k conclu mos que necesariamente j  ik contradiciendo que todos los valores propios son distintos.

176

El a lgebra de los valores propios

(b) Hay que demostrar que si Ri

Si 0  x P Mj para alg un j , entonces As

i j

 KerpiIn Aq, entonces para j  1, . . . , s Mj  R1 X X Rj 1 X Rj 1 X X Rs  t0u.


vi

Ax  j x  j pv1 vj 1 vj 1 vs q,

i j

P KerpiIn Aq. j x  Ax j x  0

pi j qvi 

i vi j

i j

vi

i j

Avi j x  A

i j

vi

Pero, por el apartado (a), los vectores v1 , . . . , vj 1 , vj 1 , . . . , vs son linealmente independientes. Por consiguiente i  j para i  1, . . . , j 1, j 1, . . . , s, lo que es imposible porque son todos distintos. Introducimos ahora los conceptos de multiplicidad algebraica y geom etrica. Denici on 9.2 Para 0 P pAq se dene la multiplicidad geom etrica de 0 como la dimensi on del subespacio propio de A asociado a 0 , y se denota por mgA p0 q: mgA p0 q  dim Kerp0 In Aq Por otra parte,

los polinomios en la indeterminada con coecientes en F; i.e. In A P Frsnn

P pAq Dx  0 t. q. p0In Aqx  0 detp0In Aq  0 Si denota una indeterminada, la matriz In A est a denida en Frs, el anillo de
0

Como Frs es una anillo conmutativo, podemos calcular el determinante de In A. Es f acil ver que este es un polinomio de grado n con coeciente principal 1: detpIn Aq  n p1 n1 pn1 pn . Los polinomios cuyo coeciente principal es 1 se llaman polinomios m onicos. Y al polinomio m onico detpIn Aq se le llama polinomio caracter stico de A. Lo denotaremos por pA pq  detpIn Aq.

9.2 Valores y vectores propios

177

Si factorizamos este polinomio en C, se descompone como producto de potencias de factores lineales:

tal y como hemos visto m as arriba.

 j , entonces pAq  t1 , 2 , . . . , s u porque 0 P pAq si y s olo si detp0 In Aq  0,


i

ppq  p 1 qm1 p 1 qm2 . . . p 1 qms ,

Denici on 9.3 Al n umero mi se le llama multiplicidad algebraica de i como valor propio de A, y se representa por maA pi q. En otras palabras, la multiplicidad algebraica de un valor propio es su multiplicidad como ra z del polinomio caracter stico. Cuando no haya posibilidad de confusi on, en la notaci on de las multiplicidades algebraica y geom etrica (maA p0 q y mgA p0 q) suprimiremos los sub ndices que hacen referencia a la matriz. Por otra parte, si A, B P Fnn son semejantes; i.e., A  T 1 BT para alguna matriz T P Gln pFq, entonces tienen el mismo polinomio caracter stico, pA pq  pB pq. En efecto, pA pq

  

detpIn Aq  detpIn T 1 BT q  detpT 1 pIn B qT q  detpT 1 q detpT q detpIn B q  detpIn B q  pB pq.

Una consecuendia de esta propiedad es que pAq  pB q y para cada 0 P pAq  pB q, maA p0 q  maB p0 q. Tambi en es cierto que mgA p0 q  mgB p0 q porque Kerp0 In Aq  T 1 Kerp0 In B q, lo cual se demuestra por doble inclusi on como sigue: x P Kerp0 In Aq p0 In Aqx  0 T 1 p0 In B qT x  0 p0In B qT x  0 T x P Kerp0In B q x P T 1 Kerp0In B q. Adem as, como T es invertible, dim Kerp0 In Aq  dim Kerp0 In B q. Las multiplicidades algebraica y geom etrica de cada valor propio est an relacionadas tay y como muestra la siguiente proposici on.

178

El a lgebra de los valores propios

Proposici on 9.4 Para A P Fnn y 0

P pAq,map0q mgp0q.

Demostraci on.- Sea mgp0 q  r y tt1 , . . . , tr u una base del subespacio propio S0  Kerp0 In Aq. Ampliamos 1 , . . . , tr , tr1 , . . . , tn u para obtener  esta base tt una base de Cn . Pongamos T  t1 t2 tn la matriz cuyas columnas son los vectores de la base escogida. Y sea B  T 1 AT . Veamos la forma que tiene esta matriz: AT

 

 

At1

Atr Atr1 tr tr1

tn


Atn


C D

0 t1

0 tr yr1

yn

t1

  0 Ir

 T B.


As

p 0qIr In B  0

C Inr D

Por lo tanto

detpIn B q  p 0 qr detpInr Dq.

Como A y B tienen para cada valor propio las mismas multiplicidades algebraicas y geom etricas y 0 podr a ser valor propio de D, concluimos que r  mgp0 q map0 q.

Denici on 9.5 Sea A P Fnn y 0

P pAq.

(a) Si mgp0 q map0 q entonces se dice que 0 es un valor propio defectuoso de A. En caso contrario se dice que es no defectuoso. La matriz A se dice que es defectuosa si tiene alg un valor propio defectuoso y en caso contrario se dice que es no defectuosa. (b) Si map0 q  1 entonces se dice que 0 es un valor propio simple de A. La matriz A se dice que es simple si todos sus valores propios son simples. (c) Los valores propios no defectuosos que no son simple se llaman semisimples. La matriz A se dice que es semisimple si sus valores propios son simples o semisimples.

9.2 Valores y vectores propios

179

Debe notarse que para una matriz es lo mismo ser semisimple o ser no defectuosa y que las matrices simples tiene todos sus valores propios distintos. En el extremo opuesto, las matrices cuyos valores propios tienen todos multiplicidad geom etrica 1, se llaman no derogatorias. Las matrices simples son a la vez no defectuosas y no derogatorias. Posiblemente la denominaci on de matriz defectuosa se debe al hecho de que casi todas las matrices son no defectuosas. Veremos que, en efecto, el conjunto de matrices no defectuosas es un conjunto abierto y denso en el conjunto de todas las matrices cuadradas. En otras palabras, tan cerca como se quiera de una matriz defectuosa hay matrices que no lo son. Tambi en se dice que la propiedad ser no defectuosa es gen erica para las matrices. Denici on 9.6 A P Fnn se dice que es diagonalizable si es semejante a una matriz diagonal. Si A es diagonalizable, las matrices diagonales a las que es semejante son matrices cuyos elementos diagonales son los valores propios (en alg un orden) de A. En efecto, 1 si T AT  D  Diagpd1 , . . . , dn q entonces A y D tienen el mismo polinomio caracter stico. Pero detpIn Dq  p d1 qp d2 q . . . p dn q; as que d1 , . . . , dn son los valores propios (quiz a repetidos) de D y, por lo tanto, de A. Proposici on 9.7 A P Fnn es no defectuosa si y s olo si es diagonalizable. Demostraci on.- Claramente si A es diagonalizable es no defectuosa porque la mutiplicidad algebraica de sus valores propios es 1. Rec procamente, si A es no defectuosa entonces para cada 0 map0 q  mgp0 q. Supongamos pAq  t1 , . . . , s u y mapi q  mgpi q  mi , i  1, . . . , s.

P pAq se tiene que

180

El a lgebra de los valores propios

Esto signica que dim Kerpi In Aq  mi y m1 ms  n. Pero por la Proposici on 9.1 la suma Kerp1 Aq Kerps In Aq es directa, de modo que dimpKerp1 Aq Kerps In Aqq  m1 ms  n. Es decir, Cn  Kerp1 Aq  ` ` KerpsIn Aq. As , si ttii  , . . . , timi u es una base de Kerpi In Aq y T  t11 t1m1 ts1 tsms , las columnas de T forman una base de Cn y consecuentemente T es invertible. Ahora AT

   

 At11

1 t11

At1m1 1 t1m1

Ats1 Atsms   s ts1 s tsms  1  .. . 

           

t11

t1m1

ts1

   tsms      

... s .. . s

TD

Como T es invertible, T 1 AT

 D con D diagonal.

La demostraci on nos proporciona la siguiente informaci on: Si A es diagonalizable y formamos una matriz T cuyas columnas sean vectores propios asociados a los valores propios de A (un vector propio por cada valor propio) entonces T es invertible y T 1 AT es una matriz diagonal cuyos elementos diagonales son los valores propios de A. Pero el rec proco tambi en es cierto: si T 1 AT  D es diagonal, entonces los valores propios de A son los elementos diagonales de D y la i- esima columna de T es un vector propio de A asociado al valor propio que ocupa la i- esima posici on de la diagonal de D. Si A no es diagonalizable, todav a podemos encontrar una matriz T , no singular, tal que T 1 AT es casi diagonal:

Teorema 9.8 (Forma can onica de Jordan) Dada A P Fnn existe una matriz no singular T P Cnn tal que T 1 AT  J es la forma can onica de Jordan de A. Es decir, J es una matriz diagonal por bloques J  DiagpJn1 p1 q, Jn2 p2 q, . . . , Jns ps qq

9.2 Valores y vectores propios

181

y Jni pi q  DiagpJni1 pi q, Jni2 pi q, . . . , Jniri pi qq con


  0 . . . 0

Jnij pi q 

.  i . . 0 0  . . .. .. P Cnij nij . . . . . . .  0 i 1  0 0 i

J es u nica salvo permutaci on de sus bloques diagonales. Demostraciones de este teorema pueden encontrarse en muchos libros de Algebra Lineal. La forma can onica de Jordan ofrece toda la informaci on sobre la estructura propia de la matriz A. En efecto, sus valores propios son 1 ,. . . , s ; la multiplicidad geom etrica de i es ni y su multiplicidad geom etrica es ri , el n umero de bloques diagonales en Jni pi q. Pero calcular num ericamente la forma can onica de Jordan es una tarea dif cil, si no imposible, por dos razones especialmente: No depende continuamente de A de modo que los errores de redondeo, por peque nos que sean pueden cambiarla completamente. Ejemplo 9.9 Sea
 

Jn p0q  

  

1 .. .. .  .   .. . 1 0

una matriz en forma de Jordan. Para todo lo perque no que se quiera, si se a nade el n umero i al elemento en la posici on pi, iq de Jn p0q la matriz resultante tiene n valores propios distintos y es, por lo tanto, diagonalizable. Su forma de Jordan ser a Diagp, 2, . . . , nq. La distancia entre Jn p0q y esta matriz diagonal es, en la norma de Frobenius, mayor que n 1. Por lo tanto, peque nas modicaciones en los elementos de Jn p0q producen una matriz cuya forma de Jordan est a lejos de la forma de Jordan de Jn p0q (que es ella misma). Por lo tanto la aplicaci on que a cada matriz le asocia su forma de Jordan no es continua.

182

El a lgebra de los valores propios

No se puede calcular de forma estable en general. En realidad, este es un problema incluso cuando la forma de Jordan es diagonal: si T 1 AT  J y T est a muy mal condicionada (pT q  }T } }T 1 } es muy grande) los valores propios obtenidos pueden estar muy lejos de los exactos. El siguiente resultado nos da muestra de ello. Teorema 9.10 (Teorema de Bauer-Fike) Sea A P Fnn una matriz diagonalizable y sea T P Gln pCq tal que T 1 AT  D  Diagp1 , . . . , n q. Entonces, para cada P pA E q, E P Fnn , se tiene que
1 i n

m n |i | }T } }T 1 } }E }

donde

} } es cualquier norma de matriz inducida por una norma de vector

p.

Recordemos que el n umero de condici on de T es pT q  }T } }T 1 }, de modo que este resultado nos dice que si T est a mal condicionada entonces los valores propios de A E pueden estar muy lejos de los de A aunque E sea muy peque na. El siguiente ejemplo nos lo muestra. Ejemplo 9.11 Sean

1 2 3 A  0 0,9990 1 , 0 0 2 Entonces T 1 AT


1 1 0,9623 T  0 0,0005 0,1923 0 0 0,1925




 Diagp1, 0,9990, 2q. Y si

0 0 0 0 0  E 0 5 10 0 105 entonces pA E q  t0,9995 0,0044i, 0,9995 0,0044i, 2, 0001u

El error en el c alculo de los valores propios ser a 2 o rdenes de magnitud mayor que el de la perturbaci on. N otese que pT q  6,8708 103 . Lo que ser a deseable es poder utilizar matrices cuyo n umero de condici on fuera lo m as peque no posible. Estas matrices son las matrices unitarias. Sin embargo, s olo algunas matrices pueden reducirse a forma diagonal usando matrices unitarias tal y como veremos m as adelante.

9.2 Valores y vectores propios

183

Demostraci on Si P pAq entonces m n1in |i |  0 y no hay nada que demostrar. Supondremos entonces que R pAq de modo que  i para todo i  1, . . . , n y In D es invertible. Como P pA E q, existe un vector no nulo x P Cn tal que pA E qx  x. As Ex  pIn Aqx  pIn T DT 1 qx  T pIn DqT 1 x. Pongamos Entonces o y T 1 x  y. T 1 Ex  pIn Dqy

 pIn Dq1T 1Ex  pIn Dq1T 1ET y. }y} }pIn Dq1} }T 1} }E } }T } }y}.

Tomando normas de vector y las correspondientes normas de matriz inducidas

Como y

0

1 }pIn Dq1 } }T 1 } }E } }T }

(9.1)

1 1 ,..., , y para cualquier matriz Dq1  Diag 1 n diagonal B  Diagpb1 , . . . , bn q y para cualquier norma de matriz inducida por una norma de vector
p

Ahora bien pIn

se tiene que

}B }  1m ax | b | in i
En efecto pero

}B }  }m ax }Bx}p x}  1
p

b1 x 1 b x   2 2 Bx   .   . .  As , para cualquier x P Fn unitario tenemos que bn x n

}Bx}p 1m ax |b | }x}p  m ax | b i | in i 1in

184

El a lgebra de los valores propios

Por otra parte, si m ax |bi |


1 i n

 |bk | y tomamos x  ek , el k- esimo vector can onico, n resulta que }Bx}p  |bk |. En conclusi on, para cualquier x P F unitario, }Bx}p m ax |bi | y hay un x de norma 1 tal que }Bx}p  m ax |bi |. Por consiguiente 1in 1in

}B }  }m ax }Bx}p  m ax |bi |. 1in x}  1


p

Continuando con la demostraci on del teorema, tomando cualquier norma de matriz inducida por una norma de vector p 1 }pIn Dq1}  1m ax  n in | | m
i

1 i n

| i |

Sustituyendo en (9.1) conclu mos que


1 i n

m n | i | }T } }T 1 } }E }

que es lo que se quer a demostrar.

9.3.

Semejanza Unitaria

En general no se puede diagonalizar una matriz cualquiera usando matrices unitarias, pero s se puede triangularizar. Para calcular los valores propios esto es suciente porque los valores propios de una matriz triangular son tambi en sus elementos diagonales. El siguiente resultado nos muestra c omo reducir una matriz cualquiera a forma triangular mediante semejanza unitaria. Pero primero la denci on de lo que signica este concepto. Denici on 9.12 Dos matrices A, B P Cnn se dice que son unitariamente semejantes si existe una matriz unitaria U P Cnn tal que B  U AU . Si A, B P Rnn y existe una matriz ortogonal P P Rnn tal que B  P T AP entonces se dice que A y B son ortogonalmente semejantes. Teorema 9.13 (Teorema de Schur) Si A P Fnn entonces A es unitariamente semejante a una matriz triangular superior. Los valores propios de A son los elementos diagonales de dicha matriz triangular.

9.3 Semejanza Unitaria

185

Recordemos que F  R o C. El teorema dice que tanto si A es real como compleja existe una matriz unitaria U P Cnn tal que U AU  T con T triangular superior. De la propia demostraci on del teorema se desprender a que si A es real y sus valores propios son todos reales entonces U tambi en puede tomarse real y, por lo tnato, ortogonal. Sin embargo, si A tiene valores propios complejos no reales entonces U es necesariamente compleja. Demostraci on.- La demostraci on es por inducci on sobre n. Si n  1 no hay nada que probar porque A  ras ya es triangular. Suponemos entonces que el teorema nn est a demostrado para matrices de orden hasta n 1. Sea y 1 P pAq. Sea  APC  u un vector propio unitario de A asociado a 1 y U  u U1 una matriz unitaria. As , el espacio generado por las columnas de U1 es u K . Entonces U AU

  u Au u AU1 u A u U1  Au U AU1 U1 U1 1

Como Au  1 u y u es un vector de norma eucl dea 1, u Au  1 . Y como Au  1 U u  0. Por lo tanto, si ponemos B  U AU y U1  u K , U1 1 1 c  u AU1 , se tiene que   1 c . U AU  0 B

Ahora, B es de tama no pn 1qpn 1q por lo que aplicando la hip otesis de inducci on p n1qpn1q se tiene que existe una matrix unitaria V P C tal que V BV  T1 es una matriz triangular superior. Entonces


1 0 1 0 U AU 0 V 0 V

1 a 0 T1

 T,
 

1 0 donde a  c V , es una matriz triangular superior. Teniendo en cuenta que que detpIn Aq  detpIn T q 
n

0 V es una matriz unitaria y que, por consiguiente, A y T son semejantes, se concluye los elementos diagonales de T . Esto termina la demostraci on del teorema. Una consecuencia importante del Teorema de Schur es el siguiente resultado Corolario 9.14 El conjunto de las matrices complejas de tama no n n con valores nn propios distintos es denso en C .
i 1

 p tiiq; i.e., los valores propios de A son

186

El a lgebra de los valores propios

Im

t77 +e7

t66=t77 e+ t 6 66

e4+t44 t55 + e5 t33=t44=t55 e3+t33

e2+ t22 t11= t22 e1+t11

Re

Figura 9.1: Distintos elementos para la diagonal de E T . El radio de cada disco es menor que 1{2 n Demostraci on.- Hay que probar que dada A P Cnn y dado 0 existe una matriz 1 nn A PC con todos sus valores propios distintos tal que }A A1 } en alguna norma. Usaremos la norma de Frobenius. Por el Teorema de Schur existe una matriz unitaria U P Cnn tal que U AU  T  rtij s. Tal y como se muestra en la Figura 9.1 se pueden escoger n n umeros complejos e1 , . . . , en tales que: (a) |ei | ,y n1{2

(b) t11 e1 , t22 e2 , . . . , tnn en sean todos n umeros distintos De esta forma, si E  Diagpe1 , . . . , en q entonces T E es triangular superior con los n umeros t11 e1 , t22 e2 , . . . , tnn en en la diagonal; siendo estos n umeros sus 1 valores propios. Ahora, si A  U pA E qU y teniendo en cuenta que la norma de Frobenius es unitariamente invariante, resulta que

}A A1}F  }U T U U pE T qU }F }U EU }F  }E }F 
2 2 1{2  p|e1|2 |en|2q1{2  n n

9.3 Semejanza Unitaria

187

que es lo que se quer a demostrar. Este resultado nos muestra una vez m as que s olo es razonable intentar calcular num ericamente los valores propios de matrices diagonalizables y que con alt sima probabilidad los valores propios que puedan devolver los algoritmos van a ser todos distintos. Por otra parte, si A P Rnn es real se desear a poder reducir A a forma triangular usando matrices ortogonales reales; i.e., usando aritm etica real que es m as barata desde el punto de vista del c alculo. Ahora bien, una matriz real puede tener valores propios complejos aunque estos deben aparecer en pares conjugados. Esto es debido a que detpIn Aq se factoriza en R en factores lineales o cuadr aticos; los primeros corresponden a ra ces reales y los segundos tienen ra ces complejas pero ambas conjugadas, debido a que los coecientes de los factores son reales. As pues, no es posible obtener una matriz triangular realizando transformaciones ortogonales sobre una matriz real si esta tiene valores propios complejos. A lo m as que podemos aspirar es a obtener una matriz triangular por bloques con bloques diagonales de tama no 2 2 a lo m as. Teorema 9.15 (Teorema de Schur real) Si A P Rnn , existe una matriz ortogonal P P Rnn tal que P T AP  T , con T una matriz cuasi triangular superior. Es decir, T es una matriz triangular superior por bloques con bloques diagonales de tama no 1 1 o 2 2. Los valores propios de A son los valores propios de los bloques diagonales de T . Los bloques de tama no 1 1 corresponden a valores propios de A reales y los de tama no 2 2 a sus valores propios complejos conjugados. Demostraci on.- Se hace por inducci on sobre n como en el caso complejo. Si n  1 no hay nada que demostrar as que supondremos demostrado el teorema para matrices de tama no menor o igual que n 1. Sea A P Rnn y un valor propio de A. Si P R entonces admite un vector propio, u, real y unitario. Que sea real es consecuencia de que es soluci on del sistema pIn Aqx  0, siendo In A una matriz de n umeros reales y las soluciones de los sistemas se obtienen mediante operaciones sin salir del cuerpo. As Au  u y se procede como en el caso del teorema de Schur complejo. es tambi Si es un n umero complejo entonces en valor propio. Y si u es un vector s. En efecto, propio de A asociado a , u es un vector propio de A asociado a
 su su  u sA s  Au s Au

188

El a lgebra de los valores propios

Pongamos uR

s . Sea siendo imaginaria. As uR , uI P Rn1 y uR , uI  u, u  i la unidad  r r U  uR uI y U  QR su factorizaci on QR real (i.e., Q es real con columnas r ortonormales y R es Im Q  uR , uI y podemos escoger una matriz Q  real) As r es real y ortogonal. Ahora tal que U  Q Q

s u  u 2

uI

s u  u2 i

U T AU

  T T r QT r  Q AQ Q AQ A Q Q T T T r r AQ Q r AQ r Q Q

Pongamos B  QT AQ y observemos que B P R22 porque Q P Rn2 . As AQ  QB T T r r r y Q AQ  Q QB  0 porque las columnas de Q y Q son ortonormales. Por lo tanto   T r B Q A Q U T AU  r T AQ r 0 Q
r T AQ r P Rpn2qpn2q , aplicamos la hip Como Q otesis de inducci on a esta matriz como en el caso complejo. s. En efecto, como u y u s son Falta demostrar que los valores propios de B son y vectores propios asociados a valores propios distintos, son linealmente   independienr  uR uI  QR resulta tes. Y es f acil ver que tambi en uR y uI lo son. Y como U que R es invertible. As

AQR  A uR uI Ahora bien AuR


AuR AuI .

  


uu s s  u u A 2 2 2 1 spuR iuI qq  ppuR iuI q 2 RepquR ImpquI .

1 2

squR ip quI q  pp

De la misma forma AuI A uR uI




 ImpquR RepquI . Entonces 




AuR AuI

uR uI

Repq Impq Impq Repq .

9.4 Vectores propios a la izquierda

189

Como B  QT AQ resulta que AQR  QBR  QRR1 BR y QR consiguiente   Repq Impq 1 R BR  Impq Repq
s como valores propios. y esta matriz tiene y

uR uI . Por

9.4.

Vectores propios a la izquierda

A los vectores propios, tal y como han sido denidos, se les suele llamar vectores propios a la derecha. La raz on es que, en ocasiones, se usan tambi en vectores propios a la izquierda y es necesario distinguirlos. Denici on 9.16 Si A P Fnn y 0 es un valor propio de A, se dice que un vector no nulo y P Cn1 es un vector propio a la izquierda de A asociado al valor propio 0 si y A  y 0 . El subespacio propio a la izquierda de A asociado a 0 es el conjunto de vectores propios por la izquierda junto con el vector 0. Debe observarse que los valores propios de A y A est an relacionados mediante s conjugaci on. Es decir, 0 P pAq si y s olo si 0 P pA q. Como, adem as, conjugando y trasponiendo se tiene que y A  y 0
s0 y, Ay 

el siguiente resultado se sigue de forma inmediata. Proposici on 9.17 y P Cn1 es un vector propio a la izquierda de A asociado al valor propio 0 si y s olo si es un vector propio a la derecha de A asociado al valor s0 . propio Si la matriz A es diagonalizable; o incluso, si 0 es un valor propio simple de A aunque A no sea diagonalizable, entonces en su forma can onica de Jordan el bloque

190

El a lgebra de los valores propios

correspondiente a 0 es de tama no 1 1. Por lo tanto, si


     0   

...

     0   

T 1 AT

J 

..

0 . . . 0 . . . 0

.. .

...

y 0 est a en la posici on pi, iq de J entonces

A  y yi 0 i

y Axi

 0 xi ,

la i- esima la de T 1 y xi la i- esima columna de T . Como T 1 T es la siendo yi matriz identidad se sigue que y x  1. Sin embargo, si 0 es un valor propio con un bloque de Jordan de tama no mayor que 1 este producto escalar es cero. Para verlo basta considerar el caso en el que A es de la forma Jn p0 q. En este caso, un vector  T 1 0 0 propio por la derecha de A es e  y un vector propio por la izquierda 1   es en  0 0 1 .
Qu e pasa, nalmente, si 0 es semisimple pero no simple?. En este caso hay m as de un bloque de Jordan de A asociado a 0 , pero todos ellos son de tama no 1 1; i.e., las mutiplicidades algebraicas y geom etricas de 0 son iguales y mayores que 1. Hay vectores propios a la izquierda y a la derecha cuyo producto escalar es 1, pero los hay tambi en que son ortogonales. El producto escalar entre los vectores propios por la izquierda y la derecha de un valor propio juega un papel fundamental en el an alisis del condicionamiento del problema de calcular los valores propios de una matriz. Los vectores propios a la izquierda se pueden usar para proporcionar otra forma de construir una forma de Schur de una matriz. El proceso ser a el siguiente (se detalla nn s olo el caso complejo, el real ser a similar): Si A P C y P pAq sea u P Cn1 un vector propio a la izquierda de A de norma eucl dea 1 asociado a . Con este vector se construye una matriz unitaria U que tiene el vector u como u ltima columna: U Entonces U AU

U1 u .
 

AU1 U Au   U1 U1 1 U u A  . 1 u u AU1 u Au

9.5 Matrices unitariamente diagonalizables

191

Pero u Au  u u  y u AU1 ortonormales a u. As U AU

 

u U1

0 porque las columnas de U1 son




AU1 U Au U1 1 0

AU1 para obtener una matriz triangular. y aplicamos el proceso de inducci on a U1

9.5.

Matrices unitariamente diagonalizables

Hemos visto que toda matriz compleja es unitariamente semejante a una matriz triangular (teorema de Schur). Algunas tienen la propiedad m as fuerte de ser semejantes a una matriz diagonal. Son las matrices normales. Las introducimos, sin embargo, de otra forma. Denici on 9.18 Una matriz A P Cnn se dice que es normal si conmuta con su traspuesta conjugada. Es decir, si AA  A A. Con esta denici on vemos que las matrices unitarias y las matrices herm ticas son ejemplos de matrices normales. En efecto, si U P Cnn es unitaria entonces U U  U U  In . Y is H P Cnn es herm tica entonces H  H y toda matriz conmuta consigo misma. Veamos ahora que las matrices normales as denidas son precisamente las que son unitariamente diagonalizables. Teorema 9.19 Una matriz es normal si y s olo si es unitariamente diagonalizable. Demostraci on.- Si A P Cnn es unitariamente diagonalizable entonces U AU con U

D

P Cnn unitaria y D  Diagp1, . . . , nq. Entonces A  U DU y


A
s  U DU  U DU

192

El a lgebra de los valores propios

En consecuencia

s U DU A A  U DU

s  U DDU

s son diagonales, conmutan. Es decir, Y como D y D

s A A  U DDU
y A es normal.

s  U DU U DU s  AA ,  U DDU

Rec procamente, por el teorema de Schur para cada A P Cnn existe una matriz unitaria U P Cnn tal que U AU  T , una matriz triangular superior. Si A es normal entonces A A  AA y esto equivale a que T T  T T . Veamos, por inducci on sobre el tama no de T , n, que esto s olo es posible si T es diagonal. Si n  1 no hay nada que demostrar. Supongamos la propiedad demostrada para matrices de tama no a lo m as n 1 y sea T una matriz triangular superior tal que T T  T T . Pongamos   t11 t 12 T  0 T22 Entonces
s t T  11 

t12

0 T22

Por una parte

  | t11 |2 t 12 t12 t12 T22 TT  T22 t12 T22 T


22

Y por otra T T

Para que estas dos matrices sean iguales debe suceder que t 12 t12 }t12}2 y } t }  0 si y s o lo si t  0. En consecuencia 12 2 12 2 T

t11 |2  t|11 t12

T22 T22

s t11 t 12

 0. Pero t 12 t12 

t11 0 0 T22

 T T22 . Aplicando la hip y T T  T T si y s olo si T22 T22 otesis de inducci on a T22 22 conclu mos que T22 , y por lo tanto T , son diagonales.
Este resultado (que las matrices normales sean unitariamente diagonalizables) se conoce con el nombre de Teorema espectral para las matrices normales. Y este, a

9.6 Teor a de Perturbaci on

193

su vez, se expresa diciendo que una matriz A P Fnn es normal si y s olo si se puede escribir en la forma A con v1 ,. . . , vn vectores ortonormales. Se trata, en efecto, de otra forma de escribir U AU V  U entonces V es unitaria y
 
n i 1

i vi vi

 Diagp1, . . . , nq porque si


 

v1 1     . .. V Diagp1 , . . . , n qV   .  v1 . .  vn n n vn v . 1 v1 v1 n

vn

Hay dos tipos de matrices normales especialmente importantes: las matrices unitarias y las matrices herm ticas (ortogonales y sim etricas en el caso real). Las matrices unitarias (ortogonales) son las matrices normales cuyos valores propios est an en la circunferencia unidad (i.e., tienen m odulo 1). Y las matrices herm ticas (sim etricas) son las matrices unitarias cuyos valores propios son n umeros reales. SE deja como ejercicio probar ambas caracterizaciones.

9.6.

Teor a de Perturbaci on

El Teorema de Bauer-Fike (Teorema 9.10) es un ejemplo t pico de un resultado de perturbaci on cuantitativa de valores propios. Es decir, es un resultado sobre c omo var an los valores propios de una matriz al someterla a una perturbaci on aditiva (peque na, habitualmente). Hay muchos otros resultados de este tipo (v ease por ejemplo [20]), pero en esta secci on nos centraremos en lo que se conoce como perturbaci on cualitativa. En particular estudiaremos la continuidad y diferenciabilidad de los valores propios como funciones de la matriz. El objetivo nal es encontrar una expresi on simple para el n umero de condici on del problema de calcular un valor propio de una matriz.

194

El a lgebra de los valores propios

9.6.1.

Continuidad de los valores propios

En el Ejemplo 9.9 hemos visto que, en general, la Forma de Jordan de una matriz no depende continuamente de esta. Este hecho implica que peque nos cambios en la matriz dada pueden resultar en grandes modicaciones en su Forma de Jordan. Esto no signica que no sea posible calcular num ericamente la forma de Jordan de ciertas matrices (de hecho lo es) pero el dise no de cualquier algoritmo con este prop osito deber a tener en cuenta este problema de falta de continuidad y en particular el hecho de que el conjunto de matrices simples es denso en Fnn (Corolario 9.14). Tanto este Corolario como el Ejemplo 9.9 reejan que el problema estriba en la preservaci on de los tama nos de los bloques de Jordan por peque nas perturbaciones. Ahora nos proponemos mostrar que es ah y s olo ah donde est an las dicultades te oricas. Es decir, el objetivo es demostrar que los valores propios de una matriz dependen continuamente de la matriz, y que en el caso de ser simples lo hacen diferenciablemente. Este resultado nos permitir a denir el n umero de condici on del problema de calcular valores propios simples. El problema que queremos abordar es el de calcular los valores propios de cada matriz A P Fnn . La primera dicultad que nos encontramos para plantear la funci on que dene este problema es cu al es su conjunto de llegada. El conjunto de partida est a claro: Fnn (F  R o C) pero hay una peque na dicultad para denir correctamente el conjunto de llegada. Por ejemplo, los valores propios de la matriz A


1 3 0 2

son tanto p1, 2q como p2, 1q. En otras palabras, mirando pAq como una n-tupla de n umeros complejos (posiblemente repetidos), esta est a determinada salvo una permutaci on de sus componentes. Esto nos conduce a considerar en el conjunto Cn la siguiente relaci on de equivalencia:

p1, . . . , nq  p1, . . . , nq i  piq, i  1, . . . , n


para alguna permutaci on P n , el grupo de permutaciones de orden n. Al correspondiente conjunto cociente lo representamos como Cn {. As el problema de calcular los valores propios de una matriz queda denido por la aplicaci on: f : Fnn Cn { r  rp1 , . . . , n qs A ;

9.6 Teor a de Perturbaci on

195

Im

5 5 6 4 4 6 3 2 3

Re
1

Figura 9.2: La distancia optima de emparejamiento es la distancia entre los puntos representados con los s mbolos 6 y 4 ; y esta es independiente de la representaci on elegida donde pAq  p1 , . . . , n q son los valores propios de A en alg un orden. A los elementos de Cn { los llamaremos n-tuplas desordenadas de n umeros complejos. Nuestro objetvo es demostrar que f es una funci on continua. Para ello debemos n dotar a C { de una topolog a. Lo m as natural es considerar en Cn la topolog a habitual (la derivada de cualquier norma) y en Cn { la correspondiente topolog a cociente; es decir, la topolog a m as na que hace que la proyecci on can onica : Cn Cn { r  rp1 , . . . , n qs  p1 , . . . , n q ;

sea una funci on continua. En otras palabras U Cn abierto.

Cn{ abierto si y s olo si 1 pU q

Otra forma de dotar a Cn { de una topolog a es a trav es de una m etrica. Para n r r P C { se dene la distancia de emparejamiento , optimo entre estas dos n-tuplas desordenadas de la siguiente forma:
r rq  m n m dp, ax |j
n 1 j n

p j q |

ry r, resdonde p1 , . . . , n q y p1 , . . . , n q son dos representantes cualesquiera de pectivamente. r r y rq no depende de los representates elegidos para Es f acil demostrar que dp, r. En efecto, tal y como se muestra la Figura 9.2 s olo se trata de una cuesti on

196

El a lgebra de los valores propios

r y r r, dp, rq es la de notaci on: dadas dos n-tuplas de puntos del plano complejo r y otro de r, que est distancia entre los dos puntos, uno de an m as pr oximos y esta es independiente de la indexaci on elegida.

Tambi en se puede demostrar que d es, en efecto, una m etrica para Cn { y que la topolog a cociente y la derivada de esta m etrica son las misma; es decir, que un n subconjunto de C { es abierto en la topolod a cociente si y s olo si es abierto en la topolog a derivada de la distancia de emparejamiento o ptimo. Ambas cuestiones se dejan como ejercicio. Necesitamos ahora analizar de cerca el polinomio caracter stico de una matriz A. Recordemos que pA pq  detpIn Aq. Un an alisis minucioso de este determinante revela (v ease por ejemplo el Teorema 4.11.2 de [11]) que si pA pq  n a1 n1 an1 an entonces ak

1 i1 ... ik n

donde Api1 : ik , i1 : ik q es la submatriz principal de A formada por las las y columnas i1 , . . . , ik . En particular, a1  trpAq y an  p1qn det A. Esta representaci on expl ta de pA pq es importante porque muestra que los coecientes del polinomio caracter stico de una matriz son funciones continuas de esta. Veremos enseguida que esta propiedad es crucial para demostrar que los valores propios, que son las ra ces del polinomio caracter stico, son funciones continuas de la matriz. Para lograr este objetivo haremos uso de un importante resultado sobre funciones anal ticas de una variable compleja (ver Figura 9.3): Lema 9.20 (Teorema de Rouch e) Sean f y g dos funciones anal ticas en el interior y sobre un contorno cerrado simple C. Si |f pz q| |g pz q| en todo punto de entonces las funciones f y f g tienen el mismo n umero de ceros, contando sus multiplicidades, dentro de . Ahora podemos demostrar que los valores propios son funciones continuas de la matriz. Teorema 9.21 La aplicaci on f : Fnn Cn { r  rp1 , . . . , n qs A ;

p1qk det Api1 : ik , i1 : ik q

9.6 Teor a de Perturbaci on

197

Im

Im

n ceros de f= n ceros de f+g


Re

33

32 3(triple) 31

1
12 1(doble) 11 Re

z |f(z)|>|g(z)|

23 21 24 2(cuadruple) 22

Figura 9.3: Interpretaci on del Teorema de Rouch e

Figura 9.4: Valores propios de A E en las bolas disjuntas centradas en los valores propios de A con igual multiplicidad

que a cada matriz le asocia la n-tupla desordenada de sus valores propios (contando multiplicidades) es una funci on continua cuando en Fnn se considera la topolog a n habitual y en C { la derivada de la distancia de emparejamiento optimo. Demostraci on.- Sea } } una norma en Fnn . Debemos demostrar que @ 0 r} y r es la n-tupla desordenada de valores propios de existe tal que si }A A r r rq . A entonces dp, Supongamos jado un 0 y denotemos por i1 ,. . . ,is los valores propios distintos de A. Sea mj la multiplicidad algebraica de ij , j  1, . . . , s. Con centro en cada ij tomamos bolas abiertas de radio que sean disjuntas dos a dos (v ease la Figura 9.4). Sea B pij q la bola con centro en ij y radio . Nuestro objetivo es demostrar r} entonces en el interior de que existe un n umero real positivo tal que si }A A r (v cada bola B pij q hay exactamente mj valores propios (quiz a repetidos) de A ease r m de nuevo la Figura 9.4). Esto implica que la distancia de ij al valor propio de A as r rq , que es lo que se quiere demostrar. pr oximo es menor que . Es decir, dp, Sea pA pq  n a1 n1 an1 an el polinomio caracter stico de A y sea j la circunferencias que forma la frontera de la bola B pij q. Consideremos la funci on polinomial g : C C z ; z n a1 z n1 an1 z an

198

El a lgebra de los valores propios

Para este n umero j 0 existe j 0 tal que si para k  1, . . . , n |ak bk | j y hpz q  z n b1 z n1 bn1 z bn entonces |g pz q hpz q| j para todo z P j . En efecto,

Esta es una funci on anal tica que no se anula en ning un punto de j y que tiene en el interior de cada j un u nico cero de multiplicidad mj . Como j es compacto y g es una funci on continua g alcanza en j su m nimo que es distinto de cero porque, como acabamos de decir, g no se anula en j . Sea j  m n |g pz q| 0.
z j

|gpzq hpzq| |z| |a1 b1||z|


n

n 1

|an1 bn1||z| |an bn| j




n k 0

|z|k

Como j es compacto, la funci on

n k 0

Escogiendo 0 j {Mj conclu mos que |g pz q hpz q| j . Por consiguiente, si ponemos q pz q  hpz q g pz q resulta que |q pz q| j  m n |g pz q| |g pz q| para todo z P j . Por el Teorema de Rouch e g pz q y g pz q q pz q  hpz q tienen el mismo n umero de ceros en el interior de j . Es decir, hpz q tiene mj ceros en el interior de B pij q. Sea, nalmente,
z j

|z |k

alcanza su m aximo en j , digamos Mj .

 1m n . Por la continuidad de los coecientes del polinomio j s j r} y p rpq  caracter stico respecto de la matriz, existe 0 tal que si }A A A n n1 r, entonces |ak bk | b1 b1 b0 es el polinomio caracter stico de A r est para k  1, . . . , n. En conclusi on, para j  1, . . . , s, mj valores propios de A an a demostrar. en el interior de B pi q, que es lo que se quer
j

Corolario 9.22 El conjunto de matrices simples de Fnn es abierto Demostraci on.- Es una consecuencia inmediata del Teorema 9.21. En efecto, sea A una matriz con valores propios simples 1 ,. . . , n y sea 0 tal que B pi qXB pi q  H para i  j . De acuerdo con la demostraci on del Teorema 9.21 existe un ta que si r r }A A} entonces A tiene un u nico valor propio en cada B pi q. En consecuencia, r es simple. Esto demuestra que el conjunto de matrices simple es abierto. A

9.6.2.

Localizaci on de los valores propios

Tal y como hemos comentado en la introducci on de esta secci on, nuestro objetivo nal es calcular el n umero de condici on de los valores propios de una matriz.

9.6 Teor a de Perturbaci on

199

Veremos que los valores propios simples son funciones diferenciables y para ello utilizaremos un resultado auxiliar que es importante en s mismo porque sirve para localizar aproximadamente los valores propios de una matriz, es el llamado Teorema de Gerschgorin: Teorema 9.23 (Teorema de Gerschgorin) Sea A

P Cnn y i 

n j 1 j i

1, . . . , n. Entonces todos los valores propios de A est an localizados en la uni on de los n discos: n

i 1

 

|aij |, i 

tz P C : |z aii| iu : GpAq.

Adem as, si la uni on de k de estos n discos forma una regi on conexa que es disjunta de los restantes n k discos, entonces en dicha regi on hay precisamente k valores propios de A. Demostraci on.- Sea un valor propio de A y x un vector propio asociado a . Pongamos x  rxi s y sea xp la componente no nula de x da mayor m odulo: |xp | |xi |, i  1, . . . , n. Como Ax  x tenemos que: xp que es equivalente a xp p app q 

 rAxsp 

n j 1

apj xj

n j 1 j p

 

apj xj .

La desigualdad triangular nos permite concluir que

|xp|| app| 

n apj xj j 1 j p

n j 1 j p

 

|apj xj | 

n j 1 j p

 

|apj ||xj |

|xp|

n j 1 j p

As pues, | app | p para alg un p; es decir, est a en el disco cerrado con centro en app y radio p . Puesto que no sabemos qu e p corresponde a cada valor propio

 

|apj |  |xp|p

200

El a lgebra de los valores propios

(salvo que conozcamos un vector propio asociado, que es tanto como conocer el propio valor propio, y entonces no estar amos interesados en localizarlo porque lo conocer amos exactamente), s olo podemos concluir que cada valor propio est a en la uni on de todos los posibles discos. Esto es GpAq. Para demostrar la segunda parte escribimos A  D C con D  Diagpa11 , . . . , ann q y por lo tanto C es la misma matriz que A salvo que los elementos diagonales son todos cero. Para t P r0, 1s denimos B ptq  D tC , de forma que B p0q  D y B p1q  A. Observamos que i ptq  por lo que GpB ptqq 
n n j 1 j i

 

|bij ptq| 

n j 1 j i

 

|taij |  ti
n

i 1

tz P C : |z biiptq| iptqu  tz P C : |z aii| tiu


i 1

Por simplicidad vamos a suponer que la regi on conexa que es uni on de k discos y disjunta de los restantes es la formada por los primeros k discos. Denotemos a esta regi on por Gk , i. e. Gk : y por Gc k
k i 1

de forma similar.

 GpAq Gk su complementario respecto de GpAq. As Gk X Gc k  H. Est a claro que en Gk hay k valores propios de Ap0q  D y los restantes n k est an c en Gk . Vamos a demostrar que esto mismo sucede para todo Aptq con t P r0, 1s. Tomando un 0 para que la uni on de los discos Dpaii , q est e en Gk para i  1, . . . , k y en Gc para i  k 1 , . . . , n , por la continuidad de los valores propios, k resulta que existe un 0 tal que si }E } entonces Ap0q E tiene k valores propios en Gk y n k en Gc k . En particular existe un t0 0 tal que para t P r0, t0 q, k valores propios de Aptq est an en Gk y n k en Gc k . Si t0 1 ya hemos terminado. Si no, para probar que Aptq tiene k valores propios en Gk y n k en Gc k para todo t P r0, 1s procedemos por contradicci on. Podemos suponer que existe t1 P rt0 , 1s tal que Aptq tiene k valores propios en Gk y n k en Gc k para t P r0, t1 q y Apt1 q tiene menos de k valores propios en Gk y m as de n k en Gc es; es decir, si k . Si fuera al rev Apt1 q tuviera menos de n k valores propios en Gc y m a s de k en G a k se proceder k

tz P C : |z aii| iu

9.6 Teor a de Perturbaci on

201

Veamos que esto conduce a una contradicci on. En efecto, sean 1 , . . . , s los valores propios no repetidos de Apt1 q en Gk y s1 , . . . , r los que est an en Gc k . Sea 0 un n umero real tal que la uni on de los discos Dpi , q est a en Gk para i  1, . . . , s y en para i  s 1 , . . . , r . Tal y como hemos razonado m as arriba, por la continuidad Gc k de los valores propios, existe un t 0 tal que Apt1 tq tiene en
r i s 1 s

menos de k valores propios en Gk y m as de n k en Gc on k ; lo que es una contradicci porque t1 t t1 y para t t1 la suposici on es que Aptq tiene exactamente k . valores propios en Gk y n k en Gc k Lo siguiente es un ejemplo de aplicaci on del Teorema de Gerschgorin Ejemplo 9.24 La siguiente matriz A

valores propios como Apt1 q y lo mismo en

Dpi , q. Es decir, Apt1 tq tiene

i 1

Dpi , q tantos

1 104 4 10 2

puede verse como una perturbaci on de la matriz Diagp1, 2q. Sus valores propios pueden calcularse a mano: 1 108 y 2 108 . Qu e resultado nos proporciona el Teorema de Gerschgorin? Seg un este teorema, los valores propios de A deben estar 4 en el intervalo r1 10 , 1 104 s y r2 104 , 2 104 s. Por qu e en la recta real? El Teorema de Gerschgorin garantiza que hay un valor propio en la bola de centro 1 y radio 104 y otro en la de centro 2 y el mismo radio. Pero A es real de modo que si sus valores propios fueran complejos deber an ser conjugado uno del otro y no podr a uno estar en una bola y otro en la otra. Por lo tanto deben ser reales. El teorema de Gerschgorin en el ejemplo anterior nos da una idea de que los valores propios de A est an pr oximos a 1 y 2 pero la precisi on es escasa. Hay resultados que mejoran el resultado de este teorema pero no proseguiremos en esa direcci on. El lector interesado puede consultar los libros [9, 22], por ejemplo.

9.6.3.

Diferenciabilidad de los valores propios simples

Podemos ahora afrontar el problema de la diferenciabilidad de los valores propios. Veremos que los valores propios simples son funciones diferenciales de la matriz.

202

El a lgebra de los valores propios

Cuando los valores propios no son simples esta propiedad de diferenciabilidad puede fallar. Consideremos, por ejemplo, la siguiente matriz n n 1 ... ...     A  .  . . 1 0
n El polinomio caracter stico de esta matriz es de modo que A tiene como ? n on valores propios las n ra ces complejas de :  . es diferenciable como funci de pero 1 n 1 d  d n que es 8 en  0 y para n 2. En otras palabras no es diferenciable en  0 cuando n 2. Esto no signica que no puedan calcularse los n umero de condici on de valores propios m ultiples, sino que no se puede hacer usando la diferencial. Centraremos nuestra atenci on en los valores propios simples.

El primer problema a la hora de hablar de la diferenciabilidad de los valores propios simples es el de denir de forma adecuada una funci on que asocie a una matriz un valor propio simple. Esto lo podemos hacer localmente con ayuda del teorema de continuidad de los valores propios. En efecto, este teorema nos asegura que si 0 es un valor propio simple de A P Fnn y 0 es cualquier n umero real para el que las bolas con centro en los valores propios de A y radio son disjuntas dos a dos, r P B pAq resulta que en la bola entonces existe un n umero real 0 tal que si A r. Esto nos permite denir localmente, en el B p0 q hay un u nico valor propio de A entorno de una matriz A con un valor propio simple 0 , una funci on que asocia a cada matriz de dicho entorno el u nico valor propio simple que tiene en el entorno jado de 0 : f : B pAq B p0 q (9.2) r0 r A ; Con esta notaci on tenemos el siguiente resultado Teorema 9.25 Sea A P Fnn , 0 un valor simple de A. Existen bolas abiertas B pAq y B p0 q tales que la funci on denida en (9.2) es diferenciable en todo B pAq. Adem as, si x, y son vectores propios de A, por la derecha e izquierda respectivamente,

9.6 Teor a de Perturbaci on

203

asociados a 0 y E

r A con A r P B pAq entonces A r0

Ex  0 yy Op}E }2q. x

(9.3)

Demostraci on: Para probar que f es diferenciable, supongamos que hemos demostrado la propiedad (9.3) para el valor propio simple 0 de A. Esto signica que para A tE P B pAq se tiene que f pA tE q f pAq t Ex  yy Op|t|}E }2 q. x Ex  yy x

Por lo tanto

l m

f pA tE q f pAq t0 t

y esto signica que f es diferenciable y f 1 pAqpE q  es la diferencial de f en A. As pues s olo debemos demostrar (9.3). Supongamos para ello que J  T 1 AT es la forma de Jordan de A del Teorema 9.8. En realidad, nos interesa considerar una leve variaci on de esta forma cl asica de Jordan. Se trata de lo siguiente. Supongamos que z  0 es un n umero complejo y que Jn pq es un bloque de Jordan. Denamos 1 Jn Dz diere de Jn en que Dz  Diagpz, z 2 , . . . , z n q. Esta matriz es invertible y Dz los elementos en la subdiagonal superior son todos iguales a z en vez de ser todos iguales a 1. Este procedimiento para un bloque de Jordan se puede generalizar a cualquier matriz en forma de Jordan de modo que podemos suponer que la matriz J  T 1 AT de m as arriba es la forma de Jordan de A con {3 en vez de 1 en la superdiagonal. Dado que es un n umero tal que las bolas centradas en los valores propios de A y radio son disjuntas dos a dos, la distancia de 0 a cualquier otro valor propio de A es mayor que . Adem as, como x, y son vectores propios de A por la derecha e izquierda, podemos suponer que el elemento en la posici on p1, 1q de J es 0 , que x es la primera columna de T y que y es la primera la de T 1 . Si no x en ser a un valor propio de A fuera as podr mos sustituir x por x1  que tambi y x por la derecha asociado a 0 y tendr mos que y x1  1, que es lo que se necesita. y Ex yx

204

El a lgebra de los valores propios

rAE Sea E una matriz tal que A

P BpAq y r  T 1 pA E qT J

a la i- Si denotamos por yi esima la de T 1 y por xj a la j - esima columna de T r es resulta que el elemento en la posici on pi, j q de J
r J ij

 yiExj yiAxj  yiExj Jij .

As pues, si ponemos
r J 11

ij

 yiExj , tenemos que

Ax1 y Ex1  0 11 ,  y1 1 r J ii  yi Axi yi Exi  i ii si i 1,


r J ii1 r J ij

 Jii1 yExi1 
i ij

ii 1

ii 1

si Jii1 si Jii1  0

1

 Jij yiExj 

en cualquier otro caso.


r 1 es semejante a  DJD 
1n 2n

r Ahora, si  0 y D  Diagp, 1, . . . , 1q resulta que J r y tiene la siguiente forma: J

0  1  r J .   .  . 1

11 21

2 . . .

12 22


.. .

n1

n2

. . .

   

nn

r  A E, J ry J r Los valores propios de A son los mismos cualquiera que sea  0. r Vamos a usar el Teorema de Gerschgorin para localizar los valores propios de J en el disco de centro 0 11 . El radio de este disco est a acotado por pn 1q siendo  m axt| ij | : 1 i, j nu. Los dem as discos de Gerschgorin est an centrados en i ii y sus radios est an acotados por

3 pn 3q .

(9.4)

Nuestro objetivo es encontrar n umeros reales 0 y (que depender a de ) tales que el disco de centro 0 11 y radio pn 1q sea disjunto de los discos con centro en

9.6 Teor a de Perturbaci on

205

i ii y radio la cantidad de (9.4). En estas condiciones el Teorema de Gerschgorin asegurar a que en el disco con centro en 0 11 y radio ||p| 12 | | 1n |q s olo r habr a un valor propio de J ; i.e. de A E . El radio de este disco nos permitir a valorar la distancia entre 0 y ese valor propio de A E . Veremos que esa distancia se corresponde con la expresi on (9.3). Para que los discos en cuesti on sean disjuntos es suciente que la suma de sus radios sea menor que la distancia entre los correspondientes centros; es decir,

|0
Ahora bien

11

pn 3q . i ii| pn 1q 1 3

|0 11 i ii| |0 i| 2 2 . Y basta elegir y 0 para que


1 3 pn 1q pn 4q

y en particular basta con que 1 3 pn 1q n

porque 0. Procedemos ahora a manipular esta desigualdad. En primer lugar es equivalente a pn 1q2 n 3 ya n2 2 n  2 n (9.5) 2 2 3 6 Recordemos que buscamos un n umero real 0. Con esto en mente, para que se verique (9.5), basta encotrar y positivos de forma que n 0 y n2 6 0. La segunda desigualdad depende de y . Buscamos un n umero real 2 y positivo que depende para el que se cumpla que n2 0. Vista como 2 una inecuaci on en el discriminante es 2 4

4n 
2

2 4

16n 2

206

El a lgebra de los valores propios

que ser a positivo si y s olo si 16n 2 Si


2

1. 
4 para ver mediante una simple

cumple esta condici on, basta escoger sustituci on que n2 0. 2 cumple

16n 2 4 n 0 y resulta 1 y tomamos  2 6 que se verica la desigualdad (9.5). Ahora bien, estas dos condiciones sobre son equivalentes a * " . (9.6) , ? 0 m n 6n 4 n En conclusi on, si 4 , el disco con centro en 0 11 y radio pn 1q tendr a intersecci on vac a con lo discos de centro i ii y radio el n umero de (9.4). Por lo tanto, si cumple esta condici on y 

Exj . As Finalmente, hemos denido  m axt ij : 1 i, j nu y ij  yi pues 1 9 | ij | }yi}2}xj }2}E }2 }T }2}T }2}E }2 donde }}2 es la norma espectral. Pongamos
, ?  m n 6n 4 n y sea
" *

0 un n umero real tal que

m n , . 1 }T } 2 }T }2 Si }E }2 entonces A E P B pAq y  1 m ax t| ij |u }T 1 }2 }T }2 }E }2 i,j n


Con este y  4 , en el disco de centro 0 y Ex y radio pn 1q hay un u nico r  A E . Pero, valor propio de A 1q 2 pn 1q  4pn  Op}E }2 2 q  O p}E } q,
2

"

9.6 Teor a de Perturbaci on

207

debido a la equivalencia de normas. En conclusi on


r0

Ex  0 yy Op}E }2q x

tal y como se deseaba demostrar.

9.6.4.

El n umero de condici on de los valores propios simples

Una vez que sabemos que los valores propios simples de una matriz son funciones diferenciables de esta, podemos calcular f acilmente el n umero de condici on absoluto. En efecto, sabemos que para A P Fnn el n umero de condici on del problema de calcular el valor propio simples 0 es p0 q  }f 1 pAq} siendo f la funci on denida en (9.2) y f 1 pAq la matriz Jacobiana de f . Ahora bien, el Teorema 9.25 nos da una expresi on para la diferencial de f : f 1 pAqpE q  y Ex yx

donde y y x son vectores propios por la izquierda y derecha de A asociados a 0 . Tomaremos valores propios normalizados; es decir, }x}2  }y }2  1. Escribiendo esta diferencial m as formalmente (como aplicaci on lineal): f 1 pAq : Fnn E

C y Ex yx

la matriz Jacobiana, que seguimos denotando como f 1 pAq, es la matriz de esta aplicaci on lineal cuando se toman las bases can ocicas. Es decir, es una matriz 1 n2 que identic andola con una matriz n n, la pi, j q- esima componente es y Eij x yx siendo Eij la matriz cuyos elementos son todos cero excepto el de la posici on pi, j q que es 1. As y Eij x  y i xj

208

El a lgebra de los valores propios

y, en consecuencia, escrita la matriz Jacobiana 1 n2 en forma de matriz n n: 1 1 B  yxT  yx . y x y x

 }y}2 2  1. Pero, tr xx  trpxx q  1 porque trpxx q  |x1 |2 |xn |2  1. Por lo tanto 1 2 p0 q  }f 1 pAq}2  . | y x| Finalmente, como y y x son unitarios |y x|  cos siendo el a ngulo agudo que
donde hemos usado que y y forman y y x. Consecuentemente 2 p0 q  1 | y x|

La norma eucl dea de la matriz Jacobiana 1 n2 corresponde a la norma de Frobenius de B . Es decir, 1 2 yx  1 tr xx tr }f 1pAq}2 xy 2  }B }F  trpB B q  x yy x | y x| 2

 sec

La interpretaci on de este resultado es clara: el problema de calcular un valor propio simple de una matriz est a mal condicionado cuando los vectores propios por la izquierda y derecha son casi perpendiculares, mientras que cuando son colineales o casi colineales est a bien condicionado. En particular si un valor propio tiene asociado un bloque de Jordan de tama no mayor que 1, entonces los vectores propios por la derecha e izquierda son ortogonales (v ease la Secci on 9.4) y su n umero de condici on es 8, lo que concuerda con el ejemplo visto al comienzo de la Secci on 9.6.3. Por el contrario, si A es normal, entonces es unitariamente diagonalizable: U AU  D y los valores propios por la izquierda y por la derecha de A para el mismo valor propio coinciden. Es decir, y x  x x  1 y el problema de calcular valores propios simples est a perfectamente condicionado. De hecho la expresi on (9.3) proporciona, en este caso, una relaci on directa de la perturbaci on en A y la perturbaci on en 0 :

r0 0 | |x Ex| Op}E }2 q }E }2 Op}E }2 q | donde hemos usado que por la desigualdad de Cauchy-Schwarz |x Ex| }x}2 }Ex}2  }Ex}2 y por la compatibilidad de la norma eucl dea y la espectral }Ex}2 }E }2 }x}2  }E }2. No obstante, este resultado tambi en es una consecuenca directa del Teorema

de Bauer-Fike.

Вам также может понравиться