Академический Документы
Профессиональный Документы
Культура Документы
Introduccin o
at ic a1
.c om
El condicionamiento del problema de m nimos cuadrados es un tema importante porque tiene implicaciones no triviales en el estudio de la estabilidad de los algoritmos para este problema. Como es habitual analizaremos en detalle el condicionamiento del problema y estudiaremos la estabilidad de los algoritmos mediante ejemplos signicativos. Recordemos que el problema de m nimos cuadrados consiste en lo siguiente (nos restringiremos al caso en el que la matriz del sistema tiene rango completo):
ww w.
at
em
Dada A Fmn de rango completo y m n, y dado b Fm , calcular x Fn para que }Ax b}2 sea m nima. Ya sabemos que la solucin a este problema es unica y que viene dada por o x AX b
(8.1)
donde AX Fnn es la pseudoinversa o inversa generalizada de Moore-Penrose de A (ver 3.6). Adems, si y Ax es el vector en Im A ms prximo a b entonces a a o y
P b,
siendo P la proyeccin ortogonal sobre Im A. o Nuestro objetivo es estudiar el condicionamiento del Problema (8.1) respecto a perturbacione en A y en b. Es decir, los datos del problema son la matriz A y el vector b. La solucin es el vector de coecientes x o el correspondiente vector y Ax. o As pues Datos: A, b. Soluciones: x, y.
En esta seccin daremos un resultado fundamental sobre el condicionamiento del o problema de m nimos cuadrados. Para entender el enunciado y como apoyo a la demostracin necesitamos introducir algunos conceptos y un par de resultados auo xiliares. En primer lugar debemos recordar que para una matriz A Fmn de rango completo n el nmero de condicin es u o 1 . 2 pAq }A}2 }AX }2 n En segundo lugar, necesitamos el conceto de ngulo entre dos vectores de Fm . Lo a denimos, como es habitual, a partir de la desigualdad de Cauchy-Schwartz: si x, y Fm entonces |xy| }x}2}y}2,
ww
w.
8.2.
at em at
ic a
Tenemos as en realidad, cuatro posibles cuestiones de condicionamiento: Error , relativo en x o y respecto a pequeas perturbaciones en los datos b o A. n
1 .c
om
b Im A
r=Axb y=Ax=Pb
ic a
cos
2
1 .c
1.
.
2
at em at M
w. ww
Equivalentemente
cos
x }x} }yy}
om
En nuestro caso, para calcular el ngulo de b e y debemos hacer el producto escalar a y b P b. Teniendo en cuenta que P es una proyeccin (P 2 P ) ortogonal b o pP P ) resulta que b y As pues
Ahora bien, b y b y siendo y y b y ortogonales (y Im A y b y b P b pIm P qb pIm Aqu ). Por consiguiente, usando el Teorema de Pitgoras, a 2 2 2 }b}2 }y}2 }b y}2 y }b y }2 sen }b}2 Todas estos resultados generalizan los habituales en R2 (Figura 8.1) En tercer lugar, para cualquier norma inducida }Ax} }A} }x}. Necesitaremos una medidad de lo lejos o cerca que est }y } }Ax} de su mximo valor posible: a a
{2
1
om
pAq
de modo que
1 }A}2}AAx}2}Ax}2 2pAq. } }
2
ww
w.
}pAAq1A}2 1 .
n
at em at
ic a
Todas estas acotaciones son claras excepto, quiz, la ultima que viene de la siguiente a observacin: o }x}2 }A1Ax}2 }A1}2}Ax}2,
1 .c
(8.2) (8.3)
siendo 1
}pAAq1}2 12
Demostracin.- La propiedad (8.3) es una consecuencia inmediata de que los valoo res singulares de A son las ra cuadradas positivas de los valores propios de A A, ces 2 y de que 1{n es el mayor valor singular de pA Aq1 (ver Porposiciones 3.12 y 3.16).
Para probar la propiedad (8.2) se usa el Teorema SVD para ver que los valores singulares de pA Aq1 A y los de AX coinciden. Podemos ahora plantear y demostrar el resultado principal Teorema 8.2 Sean b Fm y A Fmn con b $ 0 y rang A n m. Para el problema de mnimos cuadrados (8.1) se cumplen las siguientes propiedades, todo respecto de la norma 2 : (i) El nmero de condicin del problema de calcular y u o 1 . cos (ii) El nmero de condicin del problema de calcular x Fn respecto de b es u o 2 pAq . cos
om
Ax Fn respecto de b es
(8.4)
at em at
(iii) Sea x la solucin del problema de mnimos cuadrados relativo a minimizar o }pA Aqx b}2. Si y pA Aqx y }}A}}2 n entonces A 2 1
ic a
ww
w.
}y y}2 }y }2
1 .c
(8.5)
2 pAq cos
Op 2q.
(8.6)
}x x}2 }x}2
2 pAq
2 pAq2 tan
Op 2q.
(8.7)
(v) Sea x es la solucin del problema de mnimos cuadrados relativo a minimizar o }pA Aqx pb bq}2. Si sen $ 1 y
mx a
siendo 1
n los valores singulares de A, entonces }x x}2 4 pAq 1 1 2pAq2 tan B Op 2q. 2 }x}2 cos
(8.8)
En el caso especial en que m n, el problema de m nimos cuadrados se reduce al de la resolucin de un sistema de ecuaciones lineales. En tal caso 0 y las cotas o de (8.5) y (8.7) se reducen a 2 pAq{ y 2 pAq recuperando los resultados vistos en la Leccin 4. o Demostracin.- Demostraremos las propiedades (i) y (v). La propiedad (ii) se o demuestra de manera muy similar a la propirdad (i), la propiedad (iv) es una caso particular de la (v) y la propiedad (iii) requiere una demostracin independiente o pero parecida a la (iv). (i) La relacin entre b e y es o y
Pb
Como P es una proyeccin ortogonal P % QQ para alguna matriz Q Fnm con o r columnas ortonormales. Sea U Q Q una matriz unitaria. Entonces
ww
siendo P la proyecccin ortogonal sobre Im A. Vimos en la Seccin 4.3 del Cap o o tulo 4 que el nmero de condicin del problema de multiplicar Ax para A dada y x u o variable: f : Fn Fm x ; b Ax es }f Ipxq} }A} }x} , (8.9) }f pxq}{}x} }Ax} En nuestro caso se trata del nmero de condicin del problema y P b respecto de u o b para P dado. Entonces }P }2}b}2 pbq }y}2
w.
at em at
&
ic a
1 .c
om
U P U
% Q I 0 r QQ Q Q n r 0 0 Q
&
}P }2 1pP q 1 }y}2 . En conclusin: Finalmente, recordemos que cos o }b}2 }P }2}b}2 1 , pbq }y }2 cos
1 A y f 1 b. Por hiptesis, }}A}}2 n o A 2 1 y como }A}2 1 , tenemos que }A}2 n . Por el Teorema 3.18 resulta que rangpA Aq n y consecuentemente rangpA tE q n para todo t r0, s. Se
(v) En primer lugar denimos E
pA tE qpA tE qxptq pA tE qpb tf q (8.10) tiene una unica solucin para cada t r0, s. Invertir una matriz es una funcin o o
diferenciable en los elementos de la matriz. Por lo tanto x es una funcin diferenciable o de t en r0, s. Por la denicin de diferencial o xp
mero derivamos
at em at
q xp0q xIp0q Op 2q. Como xp q x, xp0q x, b $ 0 y sen $ 1, tenemos que x $ 0 y }x x}2 }xIp0q}2 Op 2q. (8.11) }x}2 }x}2 Necesitamos una estimacin de }xI p0q}2 . Para ello calculamos xI p0q en (8.10). Prio
ic a
1 .c
2
om
E b.
As
xI p0q pA Aq1 A pf
ww
Tomando normas:
}xIp0q}2 }pAAq1A}2p}f }2 }E }2}x}2q }pAAq1}2}E }2}b Ax}2. }A}2 }A}2, as que }xIp0q}2 }pAAq1A}2p}A}2x}2 }b}2q }pAAq1}2}A}2}b Ax}2 } Aq1 A }2 }A}2 }b}2 }x}2 }pA Aq1 }2 }A}2 }b Ax}2 . }pA 2 }A} }A}
2
}xIp0q}2 pAq }b}2{}Ax}2 1 pAq2 }b Ax}2{}Ax}2 . 2 2 }x}2 }A}2}x}2{}Ax}2 }A}2}x}2{}Ax}2 }2}x }AAx} }2 , cos }Ax}2 } }b}
2 2
Ahora bien,
y tan
sustituyendo en (8.11)
}x x}2 }x}2
2 pAq
1 cos
2 pAq2 tan
om
Op 2q,
ww
w.
at em at
ic a
1 .c