UN Quilmes Espacio de Estados

Control Autom atico 2
Notas de Clase
( (Cubo) ) por M.C. Escher
Por Julio H. Braslavsky Profesor Asociado Automatizacion y Control Industrial Universidad Nacional de Quilmes Agosto 2001
Cap tulo 2 Matematica Descripcion de Sistemas

2.1. Una taxonom a de sistemas
Uno de los problemas m as simples en robotica es el control de la pou de un brazo simple de robot usando un motor colocado en la sicion junta. Matem aticamente, este sistema no es m as que un p endulo con trolado por torque. es despreciable, que el brazo es r Asumiendo que la friccion gido, y que toda la masa del brazo est a concentrada en el extremo libre, apli ngulo respecto de la vertical est cando las leyes de Newton, el a a dado diferencial por la ecuacion Figura P endulo (t) + mg sin (t) = u(t) . m (2.1)
mg
2.1:
El brazo simple de robot es un ejemplo de lo que se llama un sistema din amico, causal, de tiempo continuo, nito-dimensional, no lineal y estacionario. Din amico se reere a que las variables que denen el estado del brazo en un instante t , no dependen en forma instant dado, y anea del torque de control u. Si por ejemplo se aplica un valor de torque constante, tomar a un tiempo no nulo en alcanzar su valor de equilibrio. l la salida deUn sistema no din amico es est atico, y en e pende en forma instant anea de la entrada. Un ejemplo es un u y amplicador electronico donde efectos capacitivos e inductivos son despreciables. Los sistemas est aticos suelen llamarse tambi en sin memoria. Figura 2.2: Amplicador Un sistema es causal o no anticipativo si la salida en un instante dado depende de los valores presentes y pasados de la entrada, y no de valores futuros. Sistemas anticipativos o predictivos pueden adivinar en sistema f tradas futuras. Ningun sico real es anticipativo. La salida actual de un sistema causal depende del pasado de la entrada. Pero cu anto tiempo atr as tienen efecto valores pasados de la entrada? Estrictamente, habr a que volver atr as en el tiempo hasta , lo que no es muy pr actico. El concepto de estado salva este problema. en Denicion 2.1 (Estado). El estado x(t0 ) de un sistema en el instante t0 es la informacion t0 que junto con la entrada u(t) para t t0 determina un vocamente la salida y(t) para todo t t0 . 7
Matem 2. Descripcion atica de Sistemas
Notas de CAUT2 - 8
El estado x(t0 ) resume toda la historia del sistema desde hasta t0 : conociendo el en t0 , podemos predecir la respuesta del brazo de ngulo y velocidad angular valor de a robot a valores de torque u para todo t t0 . Podemos pensar que la entrada para t t0 y las condiciones iniciales x(t0 ) determinan la del sistema para t t0 evolucion x(t), t t0 x(t0 ) u(t), t t0
El ejemplo del brazo de robot es nito-dimensional, puesto que el estado x(t) en un ins tante cualquiera de tiempo t puede ser caracterizado completamente por un numero nito ngulo y velocidad angular). de par ametros (en este caso, dos: a de la Un ejemplo de sistema innito-dimensional aparece en el problema de regulacion temperatura del aula por medio de acondicionadores de aire. La temperatura aparece como completa requiere un una distribuci on en todo el volumen del aula, y su caracterizacion numero innito de datos (la temperatura en todos los puntos del aula). El t ermino en tiempo continuo se reere al hecho de que la variable t es continua, en contraste al caso de un sistema denido por una ecuaci on diferencia x[k + 1] = Ax[k] + Bu[ x] .
2.2.
Sistemas Lineales
Un sistema se llama lineal si cumple con el principio de superposici on, es decir, dados dos pares de condiciones iniciales y entradas, xi ( t ) , t t 0 tenemos que x1 (t) + x2 (t), t t0 xi ( t ) , t t 0 x1 (t0 ) + x2 (t0 ) u1 (t) + u2 (t), t t0 xi ( t 0 ) ui ( t ) , t t 0 R. (2.3) (2.4) xi ( t 0 ) ui ( t ) , t t0 para i = 1, 2 , (2.2)
La propiedad (2.3) es de aditividad, y la propiedad (2.4) de homogeneidad. La combinacion de ambas es la propiedad de superposici on. La propiedad de aditividad permite considerar de la respuesta a condiciones iniciales y la respuesta del sistema como la superposicion aplicadas por separado. excitacion x(t0 ) x ( t ) , t t l 0 u(t) = 0, t t0 x(t) = xl (t) + x f (t), t t0 x(t0 ) = 0 x f (t), t t0 u(t), t t0
Notas de CAUT2 - 9
de su respuesta La respuesta de un sistema lineal es la superposicion y su respuesta forzada (a exlibre (a condiciones iniciales, sin excitacion) con condiciones iniciales nulas relajado). citacion, Los sistemas no lineales, como el brazo de robot, no cumplen con el principio de super posicion.
2.3.
Sistemas lineales estacionarios

x(t0 ) u(t), t t0
Un sistema es estacionario si para cada par condiciones iniciales y entrada x(t), t t0 y cada T R, tenemos que x(t T ), t t0 + T x(t0 + T ) u(t T ) + u2 (t), t t0 + T . (2.6) (2.5)
Es decir, el sistema responde da la misma respuesta, corrida en tiempo, si se le aplica la misma entrada corrida con iguales condiciones iniciales. Un sistema que no cumple esta propiedad se dice inestacionario.
2.3.1.
entrada-salida Representacion
se deduce la representacion de sistemas lineales mediante la integral Por superposicion de convoluci on y(t) = g(t, )u( ) d , (2.7)
donde g(t, ) es respuesta al impulso: la salida del sistema a un impulso unitario (t) en el instante (Chen 1999). La causalidad implica que causalidad g(t, ) = 0 para t < , y como las condiciones iniciales se asumen nulas, (2.7) se reduce a
t
y(t) =
t0
g(t, )u( ) d .
Si el sistema tiene p entradas y q salidas, entonces hablamos de la matriz de respuesta al impulso G (t, ) Rq p . Si el sistema es estacionario entonces para cualquier T se cumple g(t, ) = g(t + T, + T ) = g(t , 0) . entradaAs podemos redenir g(t , 0) simplemente como g(t ). La representacion salida del sistema se reduce a
t t
y(t) =
0
g(t )u( ) d =
g( )u(t ) d .
de causalidad para un sistema lineal estacionario se reduce a g(t) = 0 para La condicion t < 0.
Notas de CAUT2 - 10
2.3.2.
en Espacio de Estados Representacion
Todo sistema lineal nito-dimensional puede describirse mediante ecuaciones de estado (EE) (t) = A(t) x(t) + B(t)u(t) x y(t) = C (t) x(t) + D (t)u(t) . Para un sistema de orden n, el vector de estados es un vector n 1, es decir que tiene n variables de estado, x(t) Rn para cada t. Si el sistema tiene p entradas y q salidas, entonces u(t) R p e y(t) Rq . Las matrices A, B, C , D se suelen llamar A Rnn : de evoluci on B Rn p : de entrada C Rqn : de salida D Rq p : de ganancia directa
en EE se reduce a Cuando el sistema es adem as estacionario, entonces la representacion (t) = Ax(t) + Bu(t) x y(t) = Cx(t) + Du(t) . Aplicando la transformada de Laplace a (2.8) obtenemos (s) x(0) = A x (s) + Bu (s) sx (s) = C x (s) + D u (s) , y de donde siguen (s) = (sI A)1 x(0) + (sI A)1 Bu (s) x (s) = C (sI A)1 x(0) + [C (sI A)1 B + D ]u (s) . y (2.9) (2.8)
(s) y y (s) de x(0) y u (s). Las transLas ecuaciones algebraicas (2.9) permiten computar x formadas inversas dan x(t) e y(t). Asignando x(0) = 0 vemos que la matriz transferencia del sistema es (s) = C (sI A)1 B + D G a otra. En M ATLAB las funciones tf2ss y ss2tf permiten pasar de una representacion Ejemplo 2.1. Supongamos que el brazo de robot trabaja tomando objetos de distinta masa. Entonces m var a con cada objeto y tenemos que escribir (t) + m(t) g sin (t) = u(t) . m(t) El sistema se convierte en inestacionario. que asciende en forma vertical de la suEjemplo 2.2. Consideremos un cohete a reaccion es el producto ve u0 , donde ve < 0 es la velocipercie de la tierra. La fuerza de propulsion (t), supuestas de masa m dad relativa de escape de gases, y u0 < 0 la velocidad de variacion de la gravedad g constante, constantes. Asumiendo la aceleracion (t) = m(t) g + ve u0 . m(t)h
Notas de CAUT2 - 11
mt
t h
ht
Figura 2.3: Cohete
(t) y (t) = u0 , entonces m(t) = m0 + u0 t. Deniendo x1 (t) := h(t) y x2 (t) := h Como m en EE tomando como salida la altura, llegamos a la representacion 1 (t) x 0 1 = 2 (t) x 0 0 y(t) = 1 0 0 x1 (t) + e u0 g + mv x2 (t) 0 +u0 t x1 (t) x2 (t) , x(0) = 0
2, e inestacionario. El sistema es lineal, de dimension
2.4.
en diagrama de bloques Representacion
El diagrama de bloques se obtiene en forma directa de las EE. Ejemplo 2.3. El sistema 1 (t) x 2 0,3 = 2 (t) x 1 8 y(t) = 2 3 x1 (t) 2 + u(t) x2 (t) 0 x1 (t) + 5u(t) x2 (t)
(2.10)
tiene el diagrama de bloques de la Figura 2.4.
2.5.
Linealizacion
La gran mayor a de los sistemas f sicos son no lineales. Una clase importante de ellos se puede describir por las ecuaciones de estado (t) = f ( x(t), u(t), x(t0 ), t) , x y(t) = h( x(t), u(t), x(t0 ), t) , x(t0 ) = x0 (2.11)
donde f y h son campos vectoriales no lineales, es decir, escrita en t erminos escalares, la (t) en (2.11) es componente i de x i (t) = f i ( x1 (t), . . . , xn (t); u1 (t), . . . , um (t); x1 (t0 ), . . . , xn (t0 ); t) x xi ( t 0 ) = xi 0 .
Este tipo de sistemas se trata en detalle en la asignatura Sistemas No Lineales.

5 2

Notas de CAUT2 - 12
ut
x 1 t
x1 t
yt
03

x 2 t

x2 t
Figura 2.4: DB del sistema (2.10)
de estado lineal es una herramienta util para describir sistemas como Una ecuacion de un modelo lineal a partir de uno no (2.11) en forma aproximada. El proceso de obtencion lineal se llama linealizaci on. se realiza alrededor de un punto o trayectoria de operaci La linealizacion on, denida por ( t ), x 0 y u (t) que satisfacen (2.11), valores nominales x (t), t t0 x (t0 ) x (t), t t0 u
no lineal (2.11) para una entrada y estado Nos interesa el comportamiento de la ecuacion (t) + u (t) y x0 = x 0 + x0 para inicial cercanos a los valores nominales, es decir u(t) = u para t t0 . u (t) y x0 sucientemente pequenos
x0 x 0
xt

x t
x t
y aproximacion Figura 2.5: Trayectoria de operacion permanece cercana a la nominal, y escribiSuponemos que la correspondiente solucion (t) + x (t) para cada t t0 . En t de estado no lineal mos x(t) = x erminos de la ecuacion (2.11) tenemos (t) + x (t) = f ( x (t) + x (t), u (t) + u (t), t), x (t0 ) + x (t0 ) = x 0 + x0 x
usanAsumiendo diferenciabilidad, podemos expandir el lado derecho de esta ecuacion (t) y u (t), reteniendo solo los t do series de Taylor alrededor de x erminos de primer orden. es en t Notar que la expansion erminos de x y u; no se hace con respecto a la tercer variable t.
Matem 2. Descripcion atica de Sistemas para la componente i, que queda 1 Especicamos la operacion + x , u + u , t) f i ( x , u , t) + fi (x
Notas de CAUT2 - 13
fi fi , u , t) x1 + + , u , t) xn (x (x x1 xn fi fi , u , t)u1 + + , u , t)um (2.12) + (x (x u1 um
para cada i = 1, . . . , n, y volviendo a la notacion vectorial, Repitiendo la operacion obtenemos f f (t) + x (t) f ( x (t), u (t)) + , u , t) x + , u , t)u x (x (x x u donde la notacion respecto a x,
f x
representa el Jacobiano, o Matriz Jacobiana, del campo vectorial f con f1

x
f x
f1 f f2 2 2 . . . x1 x2 xn . . . . . . . . . . . . fn fn fn . . . xn x1 x2
f1 x2
...
f1 xn
(t) = f ( x (t), u (t), t) , x (t0 ) = x 0 , la relacion entre x (t) y u (t) (el modelo Dado que x incremental) queda aproximadamente descripto por una EE lineal inestacionaria de la forma (t) = A(t) x (t) + B(t)u (t), x donde 0 x (t0 ) = x0 x
f f (t), u (t), t) , B(t) = (t), u (t), t) . (x (x x u de salida y(t) = h( x(t), u(t), t), de donde obteneDe igual manera se expande la ecuacion lineal mos la aproximacion A(t) = y (t) = C (t) x (t) + D (t)u (t), (t), con y (t) = h( x (t), u (t), t) y donde y (t) = y(t) y C (t) = h (t), u (t), t) , (x x D (t) = h (t), u (t), t) . (x u
van a ser en general inestacionarias, aun Notar que las EE obtenidas por linealizacion cuando las funciones originales f y h sean estacionarias, debido a que las matrices Jacobia a lo largo de trayectorias y no puntos estacionarios. nas se evaluan de la Figura 2.6. Las Ejemplo 2.4. Consideremos el p endulo invertido sobre un carro movil ecuaciones de movimiento son 2 ml sin mg sin cos u + M + m sin2 2 = u cos ml sin cos + (m + M) g sin . Ml + m sin2 = y

q m
Notas de CAUT2 - 14
mg l u M
Figura 2.6: P endulo invertido.
vemos que el sistema tiene la forma , x3 = y x4 = Deniendo x1 = y, x2 = y 4 = f ( x, u), donde x R y u R, y f est x a dada como x2 2 u + x ml sin x mg sin x cos x f 1 ( x, u) 3 3 3 4 f 2 ( x, u) 2 M + m sin x 3 f ( x, u) = = f 3 ( x, u) x 4 f 4 ( x, u) 2 u cos x3 x4 ml sin x3 cos x3 + (m + M) g sin x3 Ml + m sin2 x3 (t) 0, u (t) 0 t, que es f tomamos Como trayectoria de operacion acil ver que sa (t), u (t)) 0 (es un equilibrio). Las matrices A y B de los respectivos Jacobianos tisface f ( x de f evaluados sobre esta trayectoria son 0 1 0 0 0 0 0 mg 1 0 f f M M . (0, 0) = ( 0, 0 ) = A= B = 0 0 0 0 1 x u ( M+m) g 1 Ml 0 0 0 Ml Ejemplo 2.5 ((Rugh 1995)). Volvemos al cohete del Ejemplo 2.2. Las ecuaciones de movimiento eran (t) = m(t) g + ve u(t) , m(t)h (t) (Ejercicio 2.2). donde ahora tomamos la velocidad de cambio de masa libre u(t) = m ( t ), Deniendo m(t) como una variable de estado m as, y denotando x1 (t) = h(t), x2 (t) = h x3 (t) = m(t), y tomando u(t) como una entrada independiente llegamos al modelo no lineal x2 (t) 1 (t) x ve . x 2 (t) = u ( t ) g + x ( t ) 3 3 (t) x u(t) alrededor una trayectoria nominal correspondienConsideramos ahora su linealizacion te a un valor constante de la entrada u = u0 < 0. No es dif cil calcular la trayectoria nomi directa, primero de x3 (t), luego x2 (t) y nalmente nal expl citamente mediante integracion
1
Por simplicidad no escribimos la dependencia temporal de x y u.
Matem 2. Descripcion atica de Sistemas x1 (t). Haciendo las cuentas obtenemos 1 (t) = x gt2 m0 ve + 2 u0 1+ u0 t m0 u0 t m0 log 1 + u0 t m0
Notas de CAUT2 - 15
u0 t m0
2 (t) = gt + ve 1 + x 3 (t) = m0 + u0 t . x
Los Jacobianos necesarios son 0 1 0 f , ( x, u) = 0 0 ve u/ x2 3 x 0 0 0
0 f ( x, u) = ve / x3 . u 1
los de x3 (t) y u(t) aparecen) obtenemos la EE Substituyendo los valores nominales (solo (t) y u (t) = u(t) u (t) linealizada en las variables incrementales x (t) = x(t) x 0 1 0 0 ve ve u0 x (t) + 0 0 (t) = x u (t) . 2 m0 + u0 t (m0 + u0 t) 1 0 0 0 Las condiciones iniciales para las variables incrementales est an dadas por 0 x (0) = x(0) 0 . m0
2.6.
Sistemas discretos
La mayor a de los conceptos de EE para sistemas lineales continuos puede transladarse directamente a sistemas discretos, descriptos por ecuaciones diferencia. En este caso la va asume valores en un conjunto denumerable (cuyos elementos pueden riable temporal t solo 2 contarse ). Cuando el sistema discreto se obtiene a partir de un muestreo de un sistema continuo, el caso de muestreo regular, donde t = kT , k = 0, 1, 2 . . . , donde vamos a considerar solo T es el per odo de muestreo. En este caso denotamos las variables discretas (secuencias) como u[k] u(kT ), etc. nita, causalidad, linealidad y el principio de superposiLos conceptos de dimension de las respuestas debido a condiciones iniciales y entradas, son exactamente como en cion el caso continuo. Una salvedad: a diferencia del caso continuo, retardos puros no dan lugar a un sistema innita si el retardo es un multiplo de dimension del per odo de muestreo T .
entrada-salida de sistemas discretos 2.6.1. Descripcion

Denimos la secuencia de impulsos [k] como [k m] =
2
1 0
si k = m si k = m
Es decir, ponerse en correspondencia con los numeros naturales.
Notas de CAUT2 - 16
donde k y m son numeros enteros. Notar que en el caso discreto los impulsos son f acilmente realizables f sicamente. En un sistema lineal discreto toda secuencia de entrada u[k] puede representarse mediante la serie u[k] =
m=
u[m] [k m] .
Si g[k, m] denota la salida de una sistema discreto a una secuencia de impulsos aplicada en el instante m, entonces tenemos que [k m] g[k, m] [k , m]u[m] g[k , m]u[m]
m
(por homogeneidad) (por aditividad) .
[k , m]u[m] g[k , m]u[m]

m
As la salida y[k] excitada por la entrada u[k] puede representarse mediante la serie y[k] =
m=
g[k, m]u[m] .
(2.13)
Si el sistema es causal no habr a salida antes de que la entrada se aplique, por lo que causalidad g[k, m] = 0 para k < m. (2.13) se reduce a Para sistemas discretos causales la representacion y[k] =
m=k0
g[k , m]u[m] ,
y si adem as tenemos estacionariedad, entonces vale la propiedad de invariancia respecto de del sistema mediante la convolucorrimientos en el tiempo y llegamos a la representacion ci on discreta y[k ] =
m=0
g[k m]u[m] = g[m]u[k m] .

m=0
2.6.2.
en Espacio de Estados Representacion
Todo sistema discreto lineal nito-dimensional puede describirse mediante EE (diferencia) x[k + 1] = A[k ] x[k ] + B[k ]u[k ] y[k] = C [k] x[k] + D [k]u[k] , y en el caso estacionario x[k + 1] = Ax[k] + Bu[k] y[k] = Cx[k] + Du[k] . ( z) = Z [ g[k]]. La En este caso, tiene sentido hablar de funciones transferencia discretas, G entre funcion transferencia discreta y representacion de estados es id relacion entica al caso continuo, ( z) = C ( zI A)1 B + D , G y sirven las mismas funciones de M ATLAB ss2tf y tf2ss.
Notas de CAUT2 - 17
2.7. Resumen
La matriz transferencia es racional sii el sistema es lineal, estacionario y de dimension nita. Las representaciones externas asumen condiciones iniciales nulas. innita no pueden describirse en EE. Los sistemas de dimension puede describirse el comportamiento de un sistema no lineal Mediante linealizacion, en forma aproximada mediante un modelo en EE incremental lineal. se realiza alrededor de una trayectoria de operaci La linealizacion on nominal conocida, y los modelos incrementales obtenidos ser an, en general, inestacionarios. Los sistemas discretos tienen representaciones equivalentes a las de sistemas continuos mediante series de convoluci on, funciones transferencia en transformada Z , y EE diferencia. A diferencia del caso continuo, los retardos puros no necesariamente dan lugar a un sistema discreto distribuido.
Tipo de sistema dim. innita lineal dim. nita, lineal
Representacion interna
Representacion externa y(t) =

t0
t t0
G (t, )u( )d
= A(t) x + B(t)u x y = C (t) x + D (t)u
y(t) =
G (t, )u( )d
dim. inf., lineal, est.
y(t) =
t0
G (t, )u( )d
(s)u (s) = G (s) y dim. n., lineal, est. = Ax + Bu x y = Cx + Du y(t) =

t0
G (t, )u( )d
(s)u (s) = G (s) y
2.8.
Ejercicios
de transformada de Laplace de y(t) Ejercicio 2.1. A partir de la denicion (s) = y

0
y(t)est dt
(s) = g (s)u ( s ). probar que para un sistema lineal estacionario y Ejercicio 2.2. Como se modica el sistema del cohete si la velocidad de cambio de masa (t)? Escribir las EE y clasicarlo. u0 es u(t) = m
Matem 2. Descripcion atica de Sistemas Ejercicio 2.3. Considerar un sistema consistente en un retardo puro, y(t) = u(t T ) . nita, estacionario? Es din amico, lineal, de dimension
Notas de CAUT2 - 18
ss y obtener la Ejercicio 2.4. Introducir el sistema (2.10) en M ATLAB utilizando la funcion transferencia con ss2tf. Explorar las herramientas ssdata, tfdata, zpkdata y funcion ltiview. diferencial Ejercicio 2.5. Para la ecuacion 4 1 (t) + y3 (t) = u(t) y 3 3 nomiusar una simple identidad trigonom etrica como ayuda para encontrar una solucion (t) = sin 3t, y(0) = 0, y (0) = 1. Determinar una EE linealizada que nal correspondiente a u describa el comportamiento del sistema alrededor de esta trayectoria nominal. Ejercicio 2.6. Linealizar la EE no lineal 1 (t) = x 1 x2 2 (t)
2 (t) = u(t) x1 (t) x 1 (0) = x 2 (0) = 1, y u (t) = 0. alrededor de la trayectoria nominal originada en x Ejercicio 2.7. Para la EE no lineal 1 (t) x x2 (t) 2 x1 (t) x2 (t) = 2 2 (t) x x1 (t) + x2 1 (t) + x2 (t) + u(t) calcular las posibles soluciones constantes, a menudo denominadas estados de equilibrio, y las correspondientes EE linealizadas. Ejercicio 2.8. Considerar la EE no lineal
u(t) (t) = u(t) x1 (t) x3 (t) x x2 (t) 2 x3 (t) y(t) = x2 (t) 2 x3 (t)
(0) = 3 y entrada nominal constante u (t) = 1. Mostrar que la salida con estado inicial x 2 (t) = 1. Linealizar la EE alrededor de la solucion nominal. Hay algo raro en nominal es y este sistema? de transformada Z de la secuencia y[t] Ejercicio 2.9. De la denicion ( z) = Z [ y[k]] = y
k=0
y [ k ] z k
( z) = g ( z)u ( z ). probar que para un sistema lineal estacionario discreto y
Bibliograf a
Bay, J. S. (1999), Fundamentals of Linear State Space Systems, WCB/McGraw-Hill. Chen, C.-T. (1999), Linear System Theory and Design, 3rd edn, Oxford University Press. Doyle, J. C., Francis, B. A. & Tannenbaum, A. (1992), Feedback control theory, Macmillan Pub. Co. Friedland, B. (1986), Control System Design, McGraw-Hill. Goodwin, G., Graebe, S. & Salgado, M. (2000), Control System Design, Prentice Hall. Goodwin, G. & Sin, K. (1984), Adaptive Filtering Prediction and Control, Prentice-Hall, New Jersey. Rugh, W. J. (1995), Linear System Theory, 2nd edn, Prentice Hall. R. (1992), Introducci Argentina de S anchez Pena, on a la teor a de control robusto, Asociacion Control Autom atico. Seron, M. M., Braslavsky, J. H. & Goodwin, G. C. (1997), Fundamental Limitations in Filtering and Control, CCES Series, Springer-Verlag. Van Loan, C. (1978), Computing integrals involving the matrix exponential, IEEE Trans. Automat. Contr. AC-23(3), 395404.
193
Cap tulo 3 Herramientas de Algebra Lineal

3.1. Vectores y Matrices
Los elementos b asicos en teor a de sistemas lineales son vectores n 1 (columna) o 1 n (la) y matrices n m con elementos reales, es decir, v Rn , A Rnm . Denotamos el elemento i del vector v como vi , y el elemento i j de una matriz A como ai j o [ A]i j . v1 a11 a12 . . . a1m v2 a21 a22 . . . a2m T v v=. = , A = 1 v2 . . . vn . . . . . . . . . . . . . . an1 an2 . . . anm vn En M ATLAB: vectores v = [v1;v2;...;vn] y matrices A=[a11,a12,...,a1m;a21,a22,...,a2m;...].1 est El producto de dos matrices A Rmn y B Rrs solo a denido si n = r. En particular para vectores v Rn , w Rm , tenemos vwT Rnm . Escribimos la matriz n m con todos sus elementos cero como 0nm , simplemente 0 si las dimensiones (M ATLAB [n,m]=size(A)) son claras del contexto. Para matrices cuadradas, m = n, la matriz nula es 0n y la matriz identidad In o simplemente I (M ATLAB I=eye(n)). Asumimos las operaciones de suma y producto de matrices familiares. Lo interesante del producto de matrices es que en general es no conmutativo, es decir, AB y BA no son siempre lo mismo. Denicion 3.1 (Matriz Nilpotente). Si A es cuadrada, para cualquier entero k 0 la pok tencia A est a bien denida, con A0 = I . Si existe un k > 0 tal que Ak = 0 decimos que A es nilpotente. Denicion 3.2 (Traza de una matriz). Para una matriz cuadrada n n, la traza es la suma de los elementos de su diagonal (en M ATLAB trace(A)) tr A =
1
i =1
aii .
Ojo con la transpuesta en M ATLAB cuando se trabaja con vectores o matrices complejos; representa la transpuesta conjugada, la transpuesta sin conjugar es ..
19
3. Herramientas de Algebra Lineal Si A y B son tales que AB es cuadrada, entonces tr[ AB] = tr[ BA].
Notas de CAUT2 - 20
esDenicion 3.3 (Determinante de una matriz). El determinante es otra familiar funcion calar de una matriz cuadrada, det A (M ATLAB det(A)). El determinante puede evaluarse recursivamente mediante la expansi on de Laplace: Sea ci j el cofactor del elemento ai j , o sea i+ j el producto de (1) por el determinante de la submatriz (n 1) (n 1) obtenida de eliminar en A la la i y la columna j. Entonces para cualquier i jo, 1 i n, det A =
ai j ci j .
j=1
(3.1)
sobre la la i. Una expresion an sobre Esta es la expansion aloga existe para la expansion una columna j. Vemos de (3.1) que el determinante no es m as que la suma de productos de los elemen matricial diferenciable todas las veces que uno tos de la matriz, por lo que es una funcion quiera. Si A y B son matrices n n, entonces det( AB) = det( A) det( B) = det( BA). Denicion 3.4 (Inversa de una matriz). La matriz cuadrada A tiene una inversa, A1 , AA1 = A1 A = I , sii det A = 0. para A1 se basa en los En M ATLAB, la inversa se calcula inv(A). Una formula comun cofactores de A. Denicion 3.5 (Adjunto de una matriz). El adjunto de A, adj A, es la matriz cuyo elemento i j es el cofactor ji de A o sea, la transpuesta de la matriz de cofactores. Usando el adjunto, la formula de la inversa es A 1 = adj A det A
La inversa del producto de dos matrices cuadradas no singulares cumple ( AB)1 = B1 A1 . en teor Otra formula muy util a de sistemas lineales es el lema de inversi on de matrices. Lema 3.1 (Inversion de Matrices). Dadas matrices R, S, U , V de dimensiones compatibles, donde R y S son cuadradas y no singulares, entonces
( R US1 V )1 = R1 + R1 U ( S VR1 U )1 VR1 .
3.2.
Bases y Ortonormalizacion
El conjunto de todos los vectores de Rn puede verse como un espacio vectorial lineal con las operaciones est andar de suma de vectores y producto por numeros reales. Las matrices m n (o n m si consideramos vectores la) son operadores lineales denidos sobre estos espacios.
3. Herramientas de Algebra Lineal
Notas de CAUT2 - 21
Denicion 3.6 (Independencia lineal). Dos vectores x1 e x2 en Rn son linealmente indepen lineal de ellos que da el vector nulo, 1 x1 + 2 x2 = 0, es dientes (LI) si la unica combinacion la trivial, 1 = 0, 2 = 0. Sino son linealmente dependientes. El concepto se extiende a un conjunto de cualquier numero de vectores. Si el conjunto de vectores { x1 , x2 , . . . , xm } es linealmente dependiente, entonces existe un conjunto de escalares {1 , 2 , . . . , m } donde al menos uno es distinto de cero, digamos 1 = 0, y 1 x1 + 2 x2 + + m xm = 0 . lineal de los restantes vectores, Entonces podemos escribir x1 como combinacion x1 = 1 (2 x2 + + m xm ). 1
Denicion 3.7 (Dimension de un espacio lineal). La dimensi on de un espacio lineal es el m aximo numero de vectores LI en ese espacio; n en Rn . Denicion 3.8 (Base de un espacio lineal). Un conjunto de vectores LI en Rn es una base de n lineal unica R si todo vector de Rn se puede escribir como una combinacion de los vectores del conjunto. Dada una base {q1 , q2 , . . . , qn } de Rn , todo vector x Rn puede expresarse en forma unica como x = 1 q1 + 2 q2 + + n qn 1 2 , = q1 q2 . . . qn . = Qx . . n = [1 , 2 , . . . , n ]T es la representaci donde x on del vector x con respecto a la base (o en las y sirve para obtener coordenadas) {q1 , q2 , . . . , qn }. La matriz Q es no singular por denicion, n = Q1 x. En par de cualquier vector de R en la base {q1 , q2 , . . . , qn }, x la representacion T ticular, siempre existe la base formada por los versores e1 = [1, 0, . . . , 0] , e2 = [0, 1, . . . , 0]T , etc. En ese caso Q = I . Ejemplo 3.1. Consideremos los vectores q1 = [3, 1]T y q2 = [2, 2]T . Como son LI, forman del vector x = [1, 3]T en las coordenadas {q1 , q2 } es una base en R2 . La representacion [1, 2]T , que se obtiene de = q1 q2 x
1 1
1 3 1 3 1 3
= =
3 2 1 2
1/2 1/2 1/4 3/4 1 = , 2 o sea que x puede escribirse como x = q1 + 2q2 .
Notas de CAUT2 - 22
q2
1
q1
Figura 3.1: Cambio de coordenadas.
Figura 3.2: Bola unitaria en R2 en normas 1, 2 e .
3.2.1.
Norma de vectores
de la idea de magnitud. El concepto de norma de un vector es una generalizacion Denicion 3.9 (Norma de un vector). La norma de un vector x Rn , denotada x , es de Rn en R+ una funcion as el 0) que cumple con las siguientes tres 0 (los reales positivos m propiedades: 1. 2. 3. x 0 para todo x, y x = 0 sii x = 0. x = | | x , para todo escalar . x1 + x2 x1 + x2 para todo x1 , x2 (desigualdad triangular). Dado un vector x = [ x1 x2 . . . xn ]T , tres normas t picas en Rn son x x x
1 2
in=1 | xi | xT x = ma x | xi |
i
norma-1 in=1 | xi |2 norma-2 o eucl dea norma-
En M ATLAB calculamos estas normas con norm(x,1), para la norma 1, norm(x,2) = norm(x), para la norma 2, y norm(x,inf) para la norma . El conjunto de vectores de norma no mayor que la unidad, B1 = { x Rn : x 1}, se llama bola unitaria, que no necesariamente es una bola esf erica; la forma de la bola unitaria depende de la norma (ver Figura 3.2). La norma 2, tambi en llamada eucl dea, es efectivamente la longitud del vector medida desde el origen (que no es el caso de las otras normas). A menos que aclaremos lo contrario, vamos a trabajar siempre con la norma 2.
Un vector x de Rn est a normalizado si x = xT x = 1. Dos vectores x1 y x2 son ortogoT T nales si x1 x2 = x2 x1 = 0. Un conjunto de vectores xi , i = 1, 2, . . . , m, es ortonormal si
xiT x j = 0 1 si i = j , si i = j .
3.2.2.
Ortonormalizacion
Notas de CAUT2 - 23
Dado un conjunto de vectores LI { p1 , p2 , . . . , pm }, podemos obtener un conjunto ortonormal de vectores {q1 , 12 , . . . , 1m } usando el procedimiento de ortonormalizaci on de Schmidt, u1 u2 um ... p1
T p2 (q1 p2 )q1
q1 q2 qm ...
u1 / u1 , u2 / u2 , um / um .
1 T pm m k =1 ( q k p m ) q k
Si Q = [q1 q2 . . . qm ] es una matriz n m, m n, con todas sus columnas ortonormales, entonces QT Q = I . Qu e puede decirse entonces de QQT ?
3.3. Ecuaciones Lineales Algebraicas

Consideremos el conjunto de ecuaciones lineales algebraicas Ax = y (3.2)
donde A Rmn e y Rm son una matriz y un vector dados como datos, y x Rn es el vector incognita a resolver. Este es un problema de m ecuaciones y n incognitas escalares, depender donde puede que m sea menor, igual o mayor que n. La existencia de solucion a de la imagen de A. Denicion 3.10 (Imagen y rango de una matriz). El espacio imagen, o simplemente imagen, de A es el espacio generado haciendo todas las posibles combinaciones lineales de las de la imagen de A es el rango de A. columnas de A. La dimension Denicion 3.11 (Vector nulo y kernel de una matriz). Un vector x se llama vector nulo de A si Ax = 0. El espacio de todos los vectores nulos de A se llama el kernel o espacio nulo de A. En M ATLAB orth(A) da una base ortonormal de la imagen de A, rank(A) da el ran importante que cumplen go, y null(A) da una base ortonormal del kernel. Una relacion del kernel y el rango de una matriz A es la siguiente: siempre la dimension de ker( A) = numero dimension de columnas de A rango( A) Ejemplo 3.2. Sea la matriz 0 1 1 2 A = 1 2 3 4 2 0 2 0 (3.3)
[ a1 a2 a3 a4 ] .
lineal de a1 y a2 . El rango de A es 2, ya que a1 y a2 son LI pero a3 y a4 son combinacion Podemos tomar entonces el conjunto { a1 , a2 } como una base de la imagen de A. La ecuacion del kernel de A es 2, y puede vericarse que los vectores (3.3) implica que la dimension n1 = 1 1 1 0
T
n2 = 0 2 0 1
son vectores nulos de A ( An1 = 0 = An2 ). Como n1 y n2 son LI, {n1 , n2 } es una base del kernel de A.
Notas de CAUT2 - 24
Hemos denido el rango de A como el numero de columnas LI de A, pero como tambi en es igual al numero de las LI de A, necesariamente tenemos la relacion rango( A) m n(m, n) . Con las deniciones de rango y kernel de una matriz, volvemos al problema de obtener de la ecuacion algebraica (3.2). Los siguientes dos teoremas resumen todos los la solucion casos posibles. Teorema 3.1 (Existencia de solucion). Dada una matriz A Rmn y un vector y Rm , x Rn de la ecuacion Ax = y sii y pertenece a la imagen de A, o 1. Existe una solucion sea, rango( A) = rango([ A y]) donde [ A y] Rm(n+1) . x de Ax = y para todo y Rm sii rango( A) = m ( A es de rango 2. Existe una solucion la pleno). Teorema 3.2 (Parametrizacion de todas la soluciones). Dada una matriz A Rmn y un de Ax = y y sea k del vector y Rm , sea x p una solucion n rango( A) la dimension kernel de A. Entonces x p es unica 1. Si k = 0 ( A tiene rango columna pleno), entonces la solucion . 2. Si k > 0 sea {n1 , n2 , . . . , nk } una base del kernel de A. Entonces para cualquier con junto de k numeros reales {i , i = 1, 2, . . . , k} el vector x = x p + 1 n1 + 2 n2 + + k nk de Ax = y. es tambi en solucion Ax = y Ejemplo 3.3. Consideremos la ecuacion x1 0 1 1 2 4 1 2 3 4 x2 = 8 . x3 2 0 2 0 0 x4
T
(3.4)
Puede verse f acilmente que y est a en la imagen de A y que x p = [ 0 4 0 0 ] es una solu Con la base {n1 , n2 } del kernel de A obtenida en el Ejemplo 3.2 podemos expresar la cion. general de (3.4) como solucion x = x p + 1 n1 + 2 n2 1 0 0 1 2 4 = 0 + 1 1 + 2 0 , 0 1 0 donde 1 y 2 pueden tomar cualquier valor en R.
Notas de CAUT2 - 25
A veces podemos encontrar el problema formulado en t erminos de vectores la, xA = y, donde x, y son 1 n y 1 m. Este problema puede tratarse de igual forma al caso columna considerando el problema transpuesto equivalente AT xT = yT . de Ax = y puede obtenerse como x = A\y. El s En M ATLAB la solucion mbolo \ denota matricial por izquierda. Para el caso xA = y usamos la division matricial por division derecha x = y/A. Para el caso de sistemas con matriz A cuadrada (que vamos a encontrar con frecuencia) la existencia de soluciones del sistema de ecuaciones algebraicas (3.2) se reduce a las condiciones dadas en el siguiente corolario. Corolario 3.1 (Sistemas cuadrados). Sea Ax = y donde A es cuadrada. Entonces unica 1. Si A es no singular existe una solucion para cada y, dada por x = A1 y. En de Ax = 0 es x = 0. particular la unica solucion homog 2. La ecuacion enea Ax = 0 tiene soluciones no nulas sii A es singular. El numero del kernel de A. de soluciones LI es igual a la dimension
3.4.
Transformaciones de Semejanza
Ax = y . (3.5)
Una matriz cuadrada A mapea vectores de Rn en Rn ,
Si representamos los vectores de R con respecto a una nueva base {q1 , q2 , . . . , qn } Q, e y = Qy . As (3.5) puede sabemos de 3.2 que tenemos las relaciones x = Q x , la ecuacion alternativamente escribirse como Ax = y
= Qy AQ x
=y ( Q1 AQ) x
de A con respecto a la base {q1 , q2 , . . . , qn }. La matriz A ( Q1 AQ) es la representacion La transformacion = Q1 AQ 1 A A = Q AQ se dicen semejantes. se llama transformaci on de semejanza, y las matrices A y A Recordemos que dada una base {q1 , q2 , . . . , qn }, todo vector x de Rn puede escribirse en , donde Q [q1 , q2 , . . . , qn ], y x es la representaci forma unica como x = Q x on de x en esa base. En particular, si consideramos la base canonica {e1 , e2 , . . . , en } (formada por los versores del vector unitarios), entonces la columna i de una matriz A no es m as que la representacion A = Q1 AQ de Aei con respecto a la base canonica {e1 , e2 , . . . , en }. Escribiendo la relacion la forma AQ = Q A
1 a 2 . . . a n A q1 q2 . . . qn = Q a 1 Qa 2 . . . Qa n Aq1 Aq2 . . . Aqn = Q a
es la representacion de Aqi en la base {q1 , q2 , . . . , qn }. concluimos que la columna i de A
3. Herramientas de Algebra Lineal Ejemplo 3.4. Consideremos la matriz 3 2 1 A = 2 1 0 4 3 1 Calculamos
Notas de CAUT2 - 26
y la base
0 1 4 2 Q = 0 0 1 1 3
0 0 17 = Q1 AQ = 1 0 15 A 0 1 5
0 0 1
Podemos comprobar, por ejemplo, que el vector, digamos z = Aq1 = A 1 = Q z = Qa la ecuacion
{ q 1 , q 2 , . . . , q n }.
0 1 0
1 0 1
verica
1 es la representacion del vector z en la base , es decir que a
3.5.
3.5.1.
Forma Diagonal y Forma de Jordan

Autovalores y autovectores
Los autovalores y autovectores de una matriz juegan un rol clave en el estudio de siste repasamos sus deniciomas lineales estacionarios en ecuaciones de estado. En esta seccion nes e introducimos las formas canonicas asociadas y otras que utilizaremos m as adelante de estados en el an alisis de estabilidad y el c alculo de controladores por realimentacion para estos sistemas.
Camille Jordan (1838-1922)
Denicion 3.12 (Autovalores, autovectores y espectro de una matriz cuadrada). Un numero C es un autovalor de la matriz A Rnn si existe un vector no nulo v Rn tal que Av = v. Este vector v es un autovector (por derecha) de A asociado al autovalor . El conjunto de todos los autovalores de una matriz A se llama el espectro de A. algebraica Los autovalores de A se encuentran resolviendo la ecuacion
( I A)v = 0 .
(3.6)
Esta es un sistema de ecuaciones lineales algebraicas, que como vimos en 3.3, admite soluciones no nulas si la matriz ( I A) es singular (es decir, tiene determinante nulo).
Notas de CAUT2 - 27
Denicion 3.13 (Polinomio caracter stico). El polinomio caracter stico de la matriz cuadrada A es ( ) = det( I A) . Notar que el polinomio ( ) es monico, es decir que el coeciente del t ermino de mayor orden es 1, de grado n, y de coecientes reales. Para cada ra z de ( ) la matriz ( I A) es algebraica (3.6) admite al menos una solucion no nula. singular y, por lo tanto, la ecuacion Concluimos que toda ra z de ( ) es un autovalor de A; y como ( ) tiene grado n, la matriz A necesariamente tiene n autovalores (aunque no necesariamente todos distintos; puede haber repetidos). r = eig(A), En M ATLAB los autovalores de la matriz A se calculan con la funcion T poly(r) donde r = [1 , . . . , n ] es un vector con todos los autovalores de A; la funcion da el polinomio caracter stico de A.
3.5.2.
Forma Companion
En general, el c alculo del polinomio caracter stico de una matriz requiere la expansion de det( I A). Sin embargo, para ciertas matrices el polinomio caracter stico es evidente. Estas son las matrices en la forma companion, (M ATLAB A = compan(p), donde p es un polinomio) 0 0 0 4 1 2 3 4 1 0 0 3 1 0 0 0 0 1 0 2 0 1 0 0 0 0 1 1 0 0 1 0 0 1 0 0 1 1 0 0 0 0 1 0 2 0 1 0 0 0 0 1 3 0 0 1 4 3 2 1 4 0 0 0 con el mismo polinomio caracter stico ( ) = 4 + 1 3 + 2 2 + 3 + 4 . Otro caso en que los autovalores (y el polinomio caracter stico) son particularmente obvios es cuando la matriz A es diagonal, 1 0 0 0 0 2 0 0 A = 0 0 3 0 . . . . . .. . . . . . . . . . 0 0 0 n Aqu los autovalores de A son directamente los elementos de su diagonal. Pero, podemos siempre representar A en forma diagonal? No siempre, depende de si A tiene: Caso 1. autovalores todos reales y distintos Caso 2. autovalores complejos y distintos Caso 3. autovalores repetidos Analizamos cada caso por separado en la siguiente seccion.
Notas de CAUT2 - 28
3.5.3.
Forma de Jordan
La forma de Jordan de una matriz A es la forma diagonal en bloques m as simple a la que puede llevarse la matriz A mediante transformaciones de semejanza. Una matriz diagonal en bloques es una matriz que tiene matrices cuadradas no nulas en la diagonal, y ceros fuera de ella, por ejemplo 0 0 0 0 A= . 0 0 0 0 0 0 anterior. Vemos la forma de Jordan en los tres casos enumerados al nal de la seccion Caso 1: autovalores de A todos reales y distintos En este caso los autovectores correspondientes son LI. Usamos el conjunto de autovec la representacion de A en esta base. La columna 1 tores, {v1 , v2 , . . . , vn }, como base. Sea A de Av1 = 1 v1 en la base nueva, de A es la representacion Av1 = 1 v1 = [ v1
v2 ... vn
1 0 0
. . .
es [1 0 . . . 0]T . La columna 2 es la representacion de y concluimos que la columna 1 de A T Av2 = 2 v2 con respecto a la base nueva, o sea [0 2 0 . . . 0] . Siguiendo este procedimiento, llegamos a que 1 0 0 0 2 0 = A . . . . .. . . . . . . . 0 0 n Concluimos que toda matriz con autovalores distintos tiene una representaci on en forma diagonal (es diagonalizable). Caso 2: autovalores de A complejos y distintos Cuando todos los autovalores son distintos, pero algunos son complejos, no podemos llevar A a una forma diagonal real (aunque si compleja). Siendo A real, los autovalores complejos aparecen siempre en pares conjugados = j, y dan lugar a pares de autovectores tambi en complejos conjugados v = u jw. En este caso no se puede llevar A a una forma diagonal real, pero s a una forma diagonal en bloques real. Para esto, la nueva base debe armarse con los autovectores reales, las partes reales de los autovectores complejos, y las partes imaginarias de los autovectores complejos. Ejemplo 3.5 (Forma block-diagonal real de una matriz con autovalores complejos). Supongamos que la matriz A tiene dos autovalores reales y dos pares de autovalores complejos, {1 , 2 , 1 + j1 , 1 j1 , 2 + j2 , 2 j2 }
3. Herramientas de Algebra Lineal con autovectores
Notas de CAUT2 - 29
{v1 , v2 , u1 + jw1 , u1 jw1 , u2 + jw2 , u2 jw2 }. Formamos entonces la base {v1 , v2 , u1 , w1 , u2 , w2 } . En esta base la matriz A tiene la representacion 1 0 0 0 0 0 0 2 0 0 0 0 0 0 0 0 1 1 . = A 0 0 1 1 0 0 0 0 0 0 2 2 0 0 0 0 2 2
Vemos que hay un bloque de 2 2 por cada par de autovalores complejos conjugados. Caso 3: autovalores de A repetidos Este es un caso especial. Cuando A tiene autovalores repetidos puede que no podamos llevarla a una forma diagonal. Sin embargo, siempre se puede llevar a una forma triangular o diagonal en bloques. Ilustramos el procedimiento para un caso concreto. Supongamos que A Rnn tiene un autovalor con multiplicidad n, es decir, un solo autovalor repetido n veces. Para simplicar consideremos n = 4. Sabemos que la matriz ( A I ) es singular. Ahora, caben las posibilidades de que el kernel (espacio nulo) de 1, 2, 3 o 4. ( A I ) tenga dimension 4, entonces sabemos, del Teorema 3.2, que hay Si el kernel de ( A I ) tiene dimension particular en este cuatro soluciones independientes (no nulas, pues la nula es la solucion caso), correspondientes a una base del kernel {n1 , n2 , n3 , n4 }. 1 2 ( A I ) x = 0 x = n1 n2 n3 n4 3 . 4 En este caso hay 4 autovectores independientes, y A es diagonalizable usando la base { n 1 , n 2 , n 3 , n 4 }. 1. En este caso solo Veamos ahora el otro caso extremo, el kernel de A tiene dimension independiente. Necesitamos tres vectores independienpodemos encontrar una solucion tes m as para armar una base. Una forma de lograrlo es usando el concepto de autovalores generalizados. Denicion 3.14 (Autovector generalizado). Sea A Rnn y un autovalor de A. Un vector v es un autovector generalizado de A de grado n asociado al autovalor si
( A I )n v = 0 y ( A I )n1 v = 0
Si n = 1 el problema se reduce al caso reci en visto. Para n = 4 denimos los vectores v4 v3 v2 v1 v
( A I )v4 = ( A I )v ( A I )v3 = ( A I )2 v ( A I )v2 = ( A I )3 v .
Notas de CAUT2 - 30
Los vectores v1 , v2 , v3 , v4 forman una cadena de autovectores generalizados de longitud 4, y cumplen las propiedades ( A I )v1 = 0, ( A I )2 v2 = 0, ( A I )3 v3 = 0 y ( I A)4 v4 = 0. y adem Estos vectores son LI por denicion, as cumplen con las relaciones Av1 Av2 Av3 Av4
= v1 = v1 + v2 = v2 + v3 = v3 + v4 .
de A con respecto a la base {v1 , v2 , v3 , v4 } 0 0 1 0 . (3.7) 1 0
A partir de estas relaciones, la representacion resulta 1 0 J= 0 0 0 0
de Avi , i = 1, 2, 3, 4, en la Es f acil chequear que las columnas de J son la representacion base {v1 , v2 , v3 , v4 }. Esta matriz triangular es un bloque de Jordan de orden 4. 2, entonces hay dos cadenas de autovectoSi el kernel de ( A I ) tiene dimension res generalizados cuya longitudes sumadas dan 4. Pueden ser {v1 , v2 } y {u1 , u2 }, {v1 } y {u1 , u2 , u3 }, {v1 , v2 , v3 } y {u1 }. En este caso la base se forma con los vectores de las dos cadenas. 3, entonces hay tres cadenas de Igualmente, si el kernel de ( A I ) tiene dimension autovectores generalizados, etc. En el primer caso visto, en que el kernel de ( A I ) tiene 4, tenemos cuatro cadenas triviales de longitud 1. dimension En resumen, si A R44 tiene un autovalor con multiplicidad 4, existe una matriz no = Q1 AQ tiene una de las siguientes formas de singular Q tal que la matriz semejante A Jordan 1 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0 , 0 1 0 , 0 0 0 , 0 0 0 , 0 0 0 0 0 1 0 0 1 0 0 1 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 La forma general a la que podemos llevar una matriz va a ser diagonal en bloques, donde los bloques pueden ser de 1 1 para autovalores reales distintos, 2 2 para pares de autovalores complejos conjugados, y bloques de Jordan para autovalores multiples. La forma de Jordan puede usarse para establecer propiedades generales de matrices. ) = det Q det Q1 det A . Como A es triangular, det A es Por ejemplo, det A = det( Q1 AQ el producto de los autovalores, det A =
i ( A ) ,
i =1
de lo que concluimos que A es no singular sii no tiene autovalores nulos. con una propiedad util de los bloques de Jordan, que es la de Terminamos esta seccion nilpotencia de la matriz ( J I ). k N tal Denicion 3.15 (Matriz Nilpotente). Una matriz A es nilpotente si existe algun que Ak = 0.
Notas de CAUT2 - 31
del bloque de Jordan J en (3.7), la matriz ( J I ) es nilpotente con k = 4, Por denicion ya que 0 1 0 0 0 0 1 0 0 0 0 1 0 0 1 0 , ( J I )2 = 0 0 0 1 , ( J I )3 = 0 0 0 0 , (J I) = 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 ( J I )4 = 0 0 0 0 . 0 0 0 0 En M ATLAB podemos usar [q,d] = eig(A) para calcular los autovalores y la base de autovectores si A es diagonalizable. Si A no es diagonalizable, Chen (1999) menciona la [q,d] = jordan(A), que puede usarse para matrices de dimension moderada, funcion pero disponible solamente en las versiones de M ATLAB con el symbolic toolbox).
3.6.
3.6.1.
Funciones de Matrices Cuadradas

Polinomios
Vimos que para cualquier entero k = 0 la potencia Ak est a bien denida. Dado un m m1 polinomio f ( ) = + a1 + + am denimos f ( A) como f ( A ) = A m + a 1 A m1 + + a m I . Si A es diagonal en bloques, digamos A = Ak = Ak 0 1 0 Ak 2
A1 0 0 A2
es f acil vericar que f ( A1 ) 0 . 0 f ( A2 )
y tambi en
f ( A) =
= Q1 AQ o A = Q1 AQ , como de semejanza A Dada la transformacion 1 )k = Q AQ 1 QAQ1 = Q A k Q 1 , Ak = ( Q AQ tenemos que ) Q 1 f ( A) = Q f ( A o ) = Q 1 f ( A ) Q . f (A
Un resultado importante en el c alculo matricial es el Teorema de Cayley-Hamilton, que establece que toda matriz satisface su propio polinomio caracter stico. Teorema 3.3 (Cayley-Hamilton). Sea ( ) = det( I A) = n + 1 n1 + + n1 + n el polinomio caracter stico de A. Entonces ( A ) = A n + 1 A n1 + + n1 A + n I = 0 . (3.8)
El teorema de Cayley-Hamilton implica que An se puede escribir como una combina lineal de las potencias de A de 0 a n 1. Si multiplicamos (3.8) por A obtenemos que cion lineal de { A, A2 , . . . , An }, que a su vez se puede An+1 se puede escribir como combinacion escribir en t erminos de { I , A, . . . , An1 }. todo polinomio f ( A) puede expresarse, para apropiados i , como una En conclusion, lineal de las potencias de A de 0 a n 1. combinacion f ( A ) = 0 I + 1 A + + n1 A n1 .
Notas de CAUT2 - 32
3.6.2.
Polinomio m nimo
El teorema de Cayley-Hamilton establece que toda matriz satisface su polinomio caracter stico, es decir, si ( ) = det( I A), entonces ( A) = 0. Pero, podr a A satisfacer un polinomio de grado menor al de ( )? La respuesta depende de la multiplicidad de los autovalores de A. Cuando los autovalores son todos de multiplicidad 1 (todos distintos), entonces el polinomio caracter stico es el polinomio de menor grado que A satisface (polinomio m nimo), o sea n en este caso. Cuando hay autovalores con multiplicidad mayor que 1 (repetidos), el polinomio m nimo podr a ser de grado menor que n. El polinomio m nimo se puede expresar como ( ) =
( i )n ,
i
i es la dimension del bloque de Jordan m donde n as grande asociado al autovalor i . Como i n. el autovalor i puede tener m as de un bloque de Jordan asociado, concluimos que n Ejemplo 3.6. En la matriz 1 1 0 1 A= 0 0 0 0 0 0 0 0 0
1 0 2
El autovalor 1 tiene multiplicidad 3, y dos bloques de Jordan asociados: ordenes 2 y 1. El autovalor 2 tiene multiplicidad 1. ( ) = ( ) =
( i )n ( i )n
i i
= ( 1 )3 ( 2 ) , = ( 1 )2 ( 2 ) ,
polinomio caracter stico polinomio m nimo .
El polinomio m nimo es siempre factor del polinomio caracter stico. Como consecuencia del teorema de Cayley-Hamilton vimos que para todo polinomio lineal de las f ( ), el polinomio matricial f ( A) se puede expresar como una combinacion n1 i ), potencias de A, { I , A, . . . , A }. Si el polinomio m nimo se conoce (y por lo tanto los n lineal de un conjunto menor, en realidad f ( A) se puede expresar como una combinacion i 1 n mejor. { I , A, . . . , A }, que es aun
de funciones matriciales 3.6.3. Evaluacion

Una forma de calcular f ( A) (con ( ) si se conoce, y sino con ( )) es mediante la de polinomios: formula de division f ( ) = q( )( ) + h( ) , donde q( ) es el polinomio cociente y h( ) el polinomio resto. Tenemos f ( A) = q( A)( A) + h( A) = q( A)0 + h( A) = h( A) , o sea que todo se reduce a determinar los coecientes del polinomio h( ) = n1 n1 + + 1 + 0 .
Notas de CAUT2 - 33
de polinomios es util si el grado de f ( ) no es mucho mayor que el de La division ( ). De lo contrario es mejor determinar los coecientes de h( ) evaluando f ( ) en los autovalores de A y planteando un sistema de ecuaciones algebraicas. Si los autovalores i de A son todos distintos, los i de h( ) se pueden resolver del sistema de n ecuaciones con n incognitas f ( i ) = q ( i ) ( i ) + h ( i ) = h ( i ) , para i = 1, 2, . . . , n .
Si A tiene autovalores repetidos, hay que derivar f ( ) = q( )( ) + h( ) hasta obtener las ecuaciones faltantes. Ejemplo 3.7. Queremos calcular A100 con A= 0 1 . 1 2
Planteamos el problema como el c alculo de f ( ) = 100 evaluado en A. El polinomio caracter stico de A es ( ) = ( + 1)2 . Sea h( ) = 1 + 0 . En el espectro de A (dos elementos iguales en este caso, = 1) tenemos f (1) = h(1) f (1) = h (1)
(1)100 = 1 + 0
100 (1)99 = 1 ,
y as concluimos que 1 = 100, y 0 = 99, o sea, h( ) = 100 99. Finalmente, A100 = 1 A + 0 I
= 100 =
0 1 1 0 99 1 2 0 1
99 100 . 100 101
Resumimos el resultado que usamos en el ejemplo en un teorema. Teorema 3.4 (Evaluacion de una funcion matricial). Sean dados f ( ) y una matriz A m ni n n con polinomio caracter stico ( ) = im =1 ( i ) , donde i=1 ni = n. Sea h ( ) = n1 n1 + + 1 + 0 el polinomio de orden n 1, con coecientes i a determinar, tal que f ( A) = h( A). Entonces los coecientes i pueden calcularse resolviendo el sistema de n ecuaciones algebraicas f (k) ( i ) = h (k) ( i ) , donde f (k) ( i ) para k = 0, 1, . . . , ni 1, y i = 1, 2, . . . , m, dk h( ) d k
dk f ( ) d k
y
= i
h (k) ( i )
.
= i
3.6.4. Funciones matriciales no necesariamente polinomiales

f ( ) m Dada una funcion as general, una forma de denir f ( A) es usando el Teorema 3.4. Es decir: calculamos el polinomio h( ) de orden n 1 igualando f ( ) = h( ) en el espectro de A, y as denimos f ( A) = h( A).
3. Herramientas de Algebra Lineal Ejemplo 3.8. Queremos calcular e At para A =

0 0 2 0 1 0 1 0 3
Notas de CAUT2 - 34 . El polinomio caracter stico de A es
( ) = ( 1)2 ( 2). Sea h( ) = 2 2 + 1 + 0 . Aplicando el Teorema 3.4 tenemos que 2 f (1) = h(1) f (1) = h (1) f (2) = h(2)
et = 2 + 1 + 0 tet = 22 + 1 e2t = 4 2 + 2 1 + 0 .
Haciendo las cuentas obtenemos 0 = 2tet + e2t , 1 = 3tet + 2et 2e2t , y 2 = e2t et tet . Finalmente e At = h( A) = (e2t et tet ) A2 + (3tet + 2et 2e2t ) A + (2tet + e2t ) I t 2 e e2t 0 2 et 2 e2t . et 0 = 0 2t t 2t t e e 0 2e e Ejemplo 3.9. Consideremos el bloque de Jordan de orden 4 1 1 0 0 0 1 1 0 A= 0 0 1 1 . 0 0 0 1 Su polinomio caracter stico es simplemente ( ) = ( 1 )4 . Si en vez de seleccionar h( ) = 3 3 + 2 2 + 1 + 0 , elegimos h( ) = 3 ( 1 )3 + 2 ( 1 )2 + 1 ( 1 ) + 0 , f ( ) = h( ) en el espectro de A da las expresiones La condicion 0 = f (1 ) , 1 = f (1 ) , 2 = f (2) ( 1 ) , 2! 3 = f (3) ( 1 ) . 3!
La propiedad de nilpotencia de ( A I ) cuando A es un bloque de Jordan,
(1 I A) =
0 0 0 0
1 0 0 0
0 1 0 0
0 0 1 0
, (1 I A)2 =
0 0 0 0
0 0 0 0
1 0 0 0
0 1 0 0
, (1 I A)3 =
0 0 0 0
0 0 0 0
0 0 0 0
1 0 0 0
, (1 I A)4 =
0 0 0 0
0 0 0 0
0 0 0 0
0 0 0 0
general para en este ejemplo permite obtener la expresion f (1 ) f (1 )/1! f (2) (1 )/2! 0 f (1 ) f (1 )/1! f ( A) = 0 0 f (1 ) 0 0 0
f ( A) f (3) (1 )/3! f (2) (1 )/2! . f (1 )/1! f (1 )
exponencial matricial f ( ) = et , tenemos As , por ejemplo, para la funcion t e 1 te1 t t2 e1 t /2! t3 e1 t /3! 0 e 1 t te1 t t2 e1 t /2! . e At = 0 0 e 1 t te1 t 0 0 0 e 1 t
2
en la segunda l Ojo que la diferenciacion nea es con respecto a , no t.
Notas de CAUT2 - 35
3.6.5.
Series de Potencias
matricial f ( A) es a trav Otra forma de denir una funcion es de la serie de potencias de f ( ). Supongamos que f ( ) se puede representar por f ( ) =
i =0
i i
con radio de convergencia . Si todos los autovalores de A tienen magnitud menor que , entonces podemos denir f ( A) como f ( A) =
i =0
i Ai .
(3.9)
es en realidad equivalente a la anteriormente vista en el Teorema 3.4. No lo Esta denicion probamos, pero mostramos un caso particular. Ejemplo 3.10. Consideremos otra vez el bloque de Jordan del Ejemplo 3.9, A=
1 0 0 0 1 1 0 0 0 1 1 0 0 0 1 1
Supongamos que f ( ) tiene el siguiente desarrollo en serie de potencias alrededor de 1 f ( ) = f (1 ) + f (1 )( 1 ) + Entonces f (1 ) ( 1 )2 + 2!
f (1 ) ( A 1 I )2 + 2! Por la propiedad de nilpotencia del bloque de Jordan, ( I A)k = 0 para k n = 4, la que sacamos en el Ejemplo 3.9. serie de potencias se reduce inmediatamente a la expresion f ( A) = f (1 ) I + f (1 )( A 1 I ) +
3.6.6.
e Integracion Matricial Diferenciacion

t
Se dene elemento a elemento, A( )d ,

0
d A(t) dt
son respectivamente
0
ai j ( )d ,
d ai j ( t ) . dt
Con estas deniciones no es dif cil probar que vale la propiedad d (t) B(t) + A(t) B (t) , [ A(t) B(t)] = A dt el teorema fundamental del c alculo, d dt y la regla de Leibniz d dt
g(t) f (t) t
A( )d = A(t) ,
0
(t) A(t, f (t)) f(t) + A(t, )d = A(t, g(t)) g
g(t) f (t)
A(t, )d . t
Notas de CAUT2 - 36
3.6.7.
La Exponencial Matricial
de particular inter Una funcion es en este curso es e At . Como la serie de Taylor et = 2 2 n n 1 + t + 2!t + + nt + converge para todo y t nitos, tenemos que ! e At = I + tA +
k t2 t A + = Ak . 2! k! k =0
(3.10)
expm(A),3 que implementa la expansi En M ATLAB e A se calcula con la funcion on de Pad e. Usando (3.10) es f acil probar las siguientes dos propiedades de e At e0 = I , e A(t1 +t2 ) = e At1 e At2 , e At
1
= e At .
(Como probamos la tercera?) Notar que en general e( A+B)t = e At e Bt (por qu e?). Diferenciando t ermino a t ermino (3.10) obtenemos
d At t k 1 e = Ak dt (k 1)! k =1
=A
tk k (k)! A k =1 tk k (k)! A k=1 A,
=
as tenemos que
d At e dt
= Ae At = e At A.
3.7.
de Lyapunov Ecuacion
AM + MB = C , (3.11)
matricial Es la siguiente ecuacion donde A y B son matrices constantes, respectivamente de dimensiones n n y m m. Las matrices C y la inc ognita M son n m. (3.11) es lineal en M y puede escribirse como sistema de ecuaciones algeLa ecuacion braicas en la forma est andar Ax = y. Ve amoslo para n = 3 y m = 2: a11 a12 a13 m11 m12 m11 m12 c11 c12 a21 a22 a23 m21 m22 + m21 m22 b11 b12 = c21 c22 b21 b22 a31 a32 a33 m31 m32 m31 m32 c31 c32 Haciendo las cuentas y expresando M y C como vectores apilando sus columnas, llegamos a a11 + b11 a12 a13 b12 0 0 m11 c11 a21 a22 + b11 a23 0 b12 0 m21 c21 a31 a32 a33 + b11 0 0 b12 m31 c31 b21 m12 = c12 0 0 a + b a a 11 22 12 13 0 b21 0 a21 a22 + b22 a23 m22 c22 0 0 b21 a31 a32 a33 + b22 m32 c32
3
Ojo no confundir con exp(A), que da la matriz de las exponenciales de los elementos de A.
Notas de CAUT2 - 37
anterior, y M y C es decir A M = C, donde A es la matriz (n m) (n m) de la ecuacion 4 son las matrices M y C convertidas en vectores (n m) 1. tiene solucion unica Como A es cuadrada, por el Corolario 3.1, esta ecuacion si la matriz autovalor nulo. Puede probarse que si i y A es invertible, es decir si no tiene ningun i son respectivamente los autovalores de A y B, los autovalores de A son i + j , i = de Lyapunov tendr unica 1, 2, . . . , n, j = 1, 2, . . . , m. En consecuencia, la ecuacion a solucion si no existen i , j tales que i + j = 0. (3.11) se resuelve con lyap(A,B,-C). En M ATLAB la ecuacion
3.8. Formas Cuadraticas

escalar xT Mx, donde x Rn , es una forma Dada una matriz M Rnn , la funcion cuadr atica. Sin p erdida de generalidad se puede tomar M como sim etrica, M = M T , ya que xT ( Q + QT ) x = 2 xT Qx, para todo x Rn .
Los autovalores de una matriz sim etrica son todos reales, ya que para todo autovalor con T autovector v de M = M , 1. el escalar v Mv (donde v denota la transpuesta conjugada de v) es real (sea v real o no), (v Mv) = v M v = v Mv, y as 2. debe ser real, dado que v Mv = v v = (v v) .
Toda matriz real sim etrica M es diagonalizable, es decir, el orden de su mayor bloque de Jordan es 1. Si no lo fuera, es decir, si existiera un autovector generalizado v de orden mayor autovalor repetido , tendr que 1 asociado a algun a que vericarse que
( I M)k v = 0, ( I M)
Pero entonces
k 1
k > 1, y para algun
(3.12) (3.13)
v = 0.
( I M )k 1 v
( I M )k 1 v = v ( I M )k1 ( I M )k 1 v = v ( I M )2k 2 v = v ( I M )k 2 ( I M )k v
(3.14)
que prueba que M = M T deber a ser nulo por (3.12) y no nulo por (3.13). Una contradiccion no puede tener bloques de Jordan de orden mayor que 1, y por lo tanto debe ser semejante a una matriz diagonal: existe una matriz Q Rnn no singular tal que M = QDQ1 , donde D Rnn es diagonal. Notar que como M es sim etrica y D diagonal, M = QDQ1 = ( QDQ1 )T = ( Q1 )T DQT , que implica que QT = Q1 y QQT = I . Toda matriz no singular Q con esta propiedad se llama ortogonal, y sus columnas son vectores ortonormales.
4
A puede escribirse en forma compacta como A = Imm A + B Inn (: producto de Kronecker).
Notas de CAUT2 - 38
Teorema 3.5. Para toda matriz real sim etrica M existe una matriz ortogonal Q tal que M = QDQT o D = QT MQ ,
donde D es una matriz diagonal con los autovalores de M, que son todos reales, en la diagonal. Una desigualdad importante para una matriz sim etrica M es la desigualdad de RayleighRitz, que dice que para cualquier x Rn
T T T m n x x x Mx ma xx x ,
donde m n y ma x son respectivamente el menor y mayor autovalor de M.
3.8.1.
Matrices denidas y semi-denidas positivas
Denicion 3.16 (Matriz denida y semi-denida positiva). Una matriz sim etrica M se T dice denida positiva, que denotamos M > 0, si x Mx > 0 para todo vector x Rn no nulo. Es semi-denida positiva, que denotamos M 0, si xT Mx 0 para todo vector x Rn no nulo. Si M es denida positiva, entonces xT Mx = 0 sii x = 0. Si M es semi-denida positiva, x no nulo tal que xT Mx = 0. entonces existe algun Existen tests para determinar si una matriz es denida o semi-denida positiva basados en las propiedades del signo de los determinantes de diversas submatrices. Uno de estos tests se basa en los menores principales. Denicion 3.17 (Menores principales). Sea una matriz sim etrica M Rnn con entradas {mi j }. Entonces dados los enteros p = 1, . . . , n y {i1 , i2 , . . . , i p }, con 1 i1 i2 i p n, denimos los menores principales de la matriz M como m i1 ,i1 m i1 i2 m i1 i p m i2 ,i1 m i2 i2 m i2 i p . M(i1 , i2 , . . . , i p ) = det m i p ,i1 m i p i2 m i p i p Los escalares M(1, 2, . . . , p), p = 1, 2, . . . , n, que son simplemente los determinantes de las submatrices de la esquina superior izquierda de M, M(1) = m11 , M(1, 2, 3) = det son los primeros menores principales de M. Teorema 3.6 (Matriz denida (semi-denida) positiva). Una matriz sim etrica M es denida positiva (semi-denida positiva) sii cualquiera de las siguientes condiciones se satisface: 1. Cada uno de sus autovalores es positivo (no negativo). 2. Todos sus primeros menores principales son positivos (todos su menores principales son no negativos).
m11 M(1, 2) = det [ m 21 m11 m12 m13 m21 m22 m23 m31 m32 m33 m12 m22
],
Notas de CAUT2 - 39
3. Existe una matriz no singular N Rnn (una matriz singular N Rnn , o una matriz N Rmn , con m < n) tal que M = N T N . Una matriz sim etrica M es denida negativa (semi-denida negativa ) si M es denida positiva (semi-denida positiva). Ejemplo 3.11. La matriz sim etrica M= m11 m12 m12 m22
si m11 > 0 y m11 m22 m2 es denida positiva si y solo 12 > 0. Es semi-denida positiva si y 2 si m11 0, m22 0, y m11 m22 m12 0. solo
3.9.
en Valores Singulares (SVD) La Descomposicion
Consideremos una matriz A Rmn y denamos M = AT A. Claramente M es n n, sim etrica, y semi-denida positiva. Sus autovalores i son no negativos. Como det( Im AAT ) = mn det( In AT A) las matrices cuadradas AT A y AAT comparten los mismos autovalores positivos y solo dieren en el numero de autovalores nulos. Supongamos que hay r autovalores positivos de M, y sea p = m n(m, n). Entonces podemos ordenar 1 2 r > 0 = r+1 = = p , Los valores singulares de la matriz A son i i ,
i = 1, . . . , p .
Por el Teorema 3.6, para M = AT A existe una matriz ortogonal Q tal que QT AT AQ = D = ST S, donde D es una matriz diagonal con los i2 en la diagonal. La matriz S es m n con los i en la diagonal. Teorema 3.7 (Descomposicion en Valores Singulares). Para toda matriz A Rmn , existen matrices ortonormales U Rmm y V Rnn tales que 1 0 0 2 . . . . . . 0 0 0 0 . . . . . . 0 0
U T AV = S
0 0 . .. . . . p 0 . . . 0
0 0 . . . 0 0 . . .
0 0 . . . 0 0 . . . 0 0 mn
donde 1 2 p 0.
Notas de CAUT2 - 40
Los vectores en las columnas de U = [ u1 ,...,um ] y V = [ v1 ,...,vn ] son los vectores singulares izquierdos y derechos respectivamente de A. Es f acil vericar comparando las columnas de las ecuaciones AV = US y AT U = VST que Avi = i ui i = 1, . . . , p = m n(m, n) . A T ui = i vi en valores singulares (SVD)5 revela muchas propiedades de la matriz La descomposicion entonces A. Por ejemplo, si r es el ndice del valor singular positivo m as pequeno, 1. el rango de A es r, 2. los vectores {vr+1 , . . . , vn } son una base ortonormal del kernel de A, 3. los vectores {u1 , . . . , ur } son una base ortonormal de la imagen de A, 4. tenemos la representacion A=
i =1
i ui viT .
Los valores singulares representan precisamente las longitudes de los semiejes del hiperelipsoide E = { Ax : x = 1}. La Figura 3.3 muestra el conjunto E para una matriz A con 1 = 0,8, 2 = 0,6, 3 = 0,4.
0.5
3 2 1
0.5
1 1 0.5 0 0 0.5 1 1 0.5 0.5 1
Figura 3.3: Hiper-elipsoide E en R3 .
[U,S,V]=svd(A) calcula los valores y vectores singulares. En M ATLAB la funcion
3.10. Normas de Matrices

El concepto de norma de vectores se extiende a matrices. Sea A una matriz m n. La norma de A puede denirse como A = ma x
x =0
5
Ax = sup Ax x x =1
(3.15)
Singular Value Decomposition.
Notas de CAUT2 - 41
Esta norma denida desde la norma de los vectores se llama norma inducida. Usando diferentes normas vectoriales (1, 2, , etc.) obtenemos diferentes normas inducidas. En este curso vamos a utilizar la norma inducida por la norma vectorial eucl dea, x 2 , que es la que se conoce como norma espectral de una matriz. en valores singulares de A es que la Otra propiedad importante de la descomposicion norma espectral de A est a dada por su mayor valor singular, A = 1 . Ejemplo 3.12. Si 1 y 2 son numeros reales, la norma espectral de A= est a dada por (3.15) como A = ma x 2 2
2 2 (1 x1 + x2 )2 + 2 x2 .
1 1 0 2
x1 + x2 =1
con restricciones, calculamos A Para no tener que resolver un problema de optimizacion T a trav es de 1 computando los autovalores de A A. El polinomio caracter stico de AT A es det( I AT A) = det
2 1 1 2 1 2 1
2 2 2 2 = 2 (1 + 1 + 2 ) + 1 2 .
Las ra ces de esta cuadr atica est an dadas por =

2 2 1 + 1 + 2 2 2 2 2 2 (1 + 1 + 2 ) 41 2 2
El radical puede escribirse de forma que su positividad es obvia. Eligiendo el signo positi lgebra llegamos a vo, y despu es de un poco de a A = De (3.16) se ve que A = 1
(1 + 2 )2 + 1 + 2
(1 2 )2 + 1
(3.16)
|1 + 2 | + |1 2 | = ma x(|1 |, |2 |) . 2
La propiedad de que 1 es mayor que la magnitud mayor de los autovalores de A es para cualquier autovalor no nulo i de A Rnn general, y m as aun, p | i | 1 La norma espectral de una matriz A en M ATLAB se calcula con norm(A). Algunas propiedades utiles de la norma espectral de matrices: Ax A x A+B A + B AB A B .
Notas de CAUT2 - 42
3.11. Resumen
En este cap tulo hemos repasado Las deniciones b asicas relativas a vectores y matrices, traza, determinante, e inversa. Bases y conjuntos ortonormales, independencia lineal, el concepto de norma, y el de Schmidt. m etodo de ortonormalizacion de ecuaciones lineales algebraicas, y los Los resultados principales para la solucion Ax = y conceptos de imagen, rango y kernel de una matriz. En particular, la ecuacion sii y est tiene solucion a en la imagen de A. unica tiene solucion si ker( A) = {0} (dim ker( A) = 0). tiene innitas soluciones si dim ker( A) > 0. Transformaciones de semejanza de matrices, que permiten representar una matriz en diferentes coordenadas. Formas diagonales y de Jordan, que muestran la estructura b asica de una matriz dada. No toda matriz puede diagonalizarse, pero siempre se puede obtener la forma de Jordan (diagonal en bloques). Funciones polinomiales de matrices y el teorema de Cayley-Hamilton, que dice que toda matriz satisface su polinomio caracter stico. El polinomio m nimo, que es el polinomio de menor orden ( ) tal que ( A) = 0. Es ste si A no siempre un factor del polinomio caracter stico de la matriz (coincide con e tiene autovalores repetidos). de una matriz cuadrada, f ( A) puede denirse evaluando f ( ) en el Que una funcion lineal de { I , A, . . . , An1 } (o de espectro de A, y por lo tanto, como una combinacion 1 n es el orden del polinomio m { I , A, . . . , An } donde n nimo de A). e integracion de matrices, denida elemento a elemento. Diferenciacion de Lyapunov AM + MB = C, que es una ecuacion lineal algebraica maLa ecuacion nm unica tricial que tiene solucion MR sii los autovalores i de A Rnn , y j de mm BR son tales que i + j = 0, i = 1, . . . , n; j = 1, . . . , m. Las formas cuadr aticas xT Mx, que son funciones escalares cuadr aticas en los elementos del vector x, donde M puede tomarse como sim etrica (o ser reemplada por ( M + M T )/2). Que las matrices sim etricas tienen siempre autovalores reales, y que son siempre diagonalizables. Matrices sim etricas denidas, y semi-denidas positivas, que son aquellas M para las T que x Mx es positiva, y no negativa, respectivamente. en valores singulares de una matriz A. Los valores singulares son La descomposicion la ra z cuadrada de los autovalores de AT A. La norma espectral de una matriz A, que es la inducida por la norma eucl dea de vectores, y es el m aximo valor singular, 1 de A.
Notas de CAUT2 - 43
3.12. Ejercicios
Ejercicio 3.1. Dados los vectores x1 = [2 3 1]T y x2 = [1 1 1]T 1. Calcular sus normas 1, 2 e . 2. Encontrar vectores ortonormales que generen el mismo subespacio. Ejercicio 3.2. Determinar rango y bases siguientes matrices: 0 1 0 4 A1 = 0 0 0 A2 = 3 0 0 1 1 Ejercicio 3.3. Dada la ecuacion 2 1 1 3 3 x = 0 , 1 2 1 Cuantas soluciones tiene? Qu e pasa si y = [1 1 1]T ? Ejercicio 3.4. Dada la ecuacion 1 2 3 4 3 0 1 2 2 x = 2 0 0 0 1 1 general. 1. Encontrar la forma de la solucion de m 2. Encontrar la solucion nima norma eucl dea. Ejercicio 3.5. Dadas 2 0 A= 0 0 1 2 0 0 0 1 2 0 0 0 0 1 0 0 b1 = 1 1 1 2 b2 = 3 1 de la imagen y el kernel para cada una de las 1 1 2 0 1 0 1 2 3 4 A3 = 0 1 2 2 . 0 0 0 1
encontrar las representaciones de la matriz A con respecto a las bases {b1 , Ab1 , A2 b1 , A3 b1 } y {b2 , Ab2 , A2 b2 , A3 b2 }. Ejercicio 3.6. Representar en forma de Jordan las siguientes matrices 1 4 10 0 1 0 0 4 3 0 1 A3 = 0 20 16 . A1 = 0 2 0 A2 = 0 0 0 3 2 4 3 0 25 20 Ejercicio 3.7. Mostrar que si es un autovalor de A con autovector v, entonces f ( ) es un autovalor de f ( A) con autovector v. Ejercicio 3.8. Calcular e At para las matrices A1 y A3 del Ejercicio 3.6.
Notas de CAUT2 - 44
Ejercicio 3.9. Mostrar que funciones de la misma matriz conmutan: f ( A) g( A) = g( A) f ( A). Ejercicio 3.10. Probar que la transformada de Laplace de e At es
L e At = (sI A)1 .
Ejercicio 3.11. Sean todos los autovalores de A distintos, y sea qi un autovector por derecha de A asociado a i , Aqi = i qi . Sea Q = [ q1 de P. Mostrar que 1. 2. pi es un autovector por izquierda de A asociado a i : pi A = i pi .
q2 qn p1 p2
]yP
Q 1 =
pn
. . .
, donde pi es la la i
(sI A)1 =
1 qi pi . s i
0 1 de la ecuacion de Lyapunov con A = [ Ejercicio 3.12. Encontrar M solucion 2 2 ], B = 3, 3 unica? C = [ 3 ]. Existe solucion
Ejercicio 3.13. Son las siguientes matrices denidas o semi-denidas positivas? 2 2 3 2 0 0 1 a1 a1 a2 a1 a3 a2 a3 A1 = 3 1 0 , A2 = 0 0 0 , A3 = a2 a1 a2 2 2 0 2 1 0 2 a3 a1 a3 a2 a2 3 Ejercicio 3.14. Calcular los valores singulares de las siguientes matrices A1 =
1 0 1 , 2 1 0
A2 =
1 2 2 4
Ejercicio 3.15. Calcular la norma espectral de las siguientes matrices A1 = 0 0 , 1 0 A2 = 3 1 , 1 3 A3 = 1 j 0 0 1+ j
Ejercicio 3.16. Dada una constante > 1, mostrar como denir una matriz 2 2 A tal que los autovalores de A sean los dos 1/ y A . Ejercicio 3.17. Si A es invertible probar que A1 A
1
Bibliograf a
193
Cap tulo 4 de la Ecuacion de Estado y Solucion Realizaciones

4.1. Introduccion
Vimos que los sistemas lineales pueden representarse mediante integrales de convo y, si son de dimension nita (a par lucion ametros concentrados), tambi en mediante ecua ciones de estado. En este cap tulo veremos como encontrar soluciones de estas ecuaciones de la ecuacion de estado), y como (solucion transformar modelos en matriz transferencia a ecuaciones de estado (realizacion). Veamos antes brevemente como calcular soluciones cuando uno tiene una descripcion entrada/salida del sistema. Lamentablemente, no existe forma anal tica simple de resolver la integral de convolucion
t
y(t) =
t0
g(t, )u( )d .
(4.1)
La forma m as f acil es calcularla num ericamente en una computadora digital, para lo cual Una forma de discretizar (4.1) hay que aproximarla primero mediante una discretizacion. es en la forma y(k) =
m=k0
g(k, m)u(m),
(4.2)
(4.2) es b de convoludonde es el paso de integraci on. La ecuacion asicamente la ecuacion discreta que discutimos en 2.6.1. cion en dominio En el caso lineal y estacionario, tambi en podemos usar la representacion Si el sistema es de dimension innita, Laplace y(s) = g(s)u(s) para calcular la solucion. (s) no va a ser una funcion racional de s. Salvo casos especiales, resulta m g as f acil calcular directamente en dominio temporal de una discretizacion del tipo (4.2). la solucion (s) es una fun nita, entonces g Cuando el sistema es lineal, estacionario y de dimension (s) tambi racional de s. Si u cion en es racional, el c alculo de y(t) se reduce a calcular polos, en fracciones simples, y nalmente usar una tabla de transformada Lahacer expansion place. En M ATLAB estas operaciones pueden hacerse con las funciones roots y residue. Hay limitaciones, sin embargo, cuando existen polos repetidos, que pueden hacer que la sea muy sensible a errores de computo. solucion En consecuencia, la transformada Laplace no es un m etodo eciente en computadoras digitales. En este cap tulo vemos la forma m as eciente de calcular y(t): obtener primero una en EE de (4.1) (es decir, hacer una realizaci representacion on en EE), y luego resolver las 45
de la Ecuacion de Estado y Realizaciones 4. Solucion ecuaciones (t) = A(t) x(t) + B(t)u(t) x y(t) = C (t) x(t) + D (t)u(t) .
Notas de CAUT2 - 46
(4.3) (4.4)
Consideraremos primero el caso estacionario y luego el caso inestacionario.
de Ecuaciones de Estado Estacionarias 4.2. Solucion

Empezamos con el caso estacionario (invariante en el tiempo), es decir: A, B, C , D cons x(t) de la ecuacion tantes. Queremos determinar la solucion (t) = Ax(t) + Bu(t) x (4.5)
para un estado inicial x(0) y entrada u(t), t 0 dados. Una forma de encontrar la solucion candidata y ver si satisface la en este caso, como es simple, es probar con una solucion Por ejemplo, para si el sistema fuera escalar, ecuacion. (t) = ax(t), x tiene la forma x(t) = eat x(0). No es mala idea entonces suponer sabemos que la solucion que x(t) en (4.5) va a involucrar a la exponencial matricial e At . (4.5) (escrita en la Multipliquemos entonces (por derecha) ambos lados de la ecuacion por la matriz e A . De esta operavariable , que va a ser nuestra variable de integracion) obtenemos cion ( ) e A Ax( ) = e A Bu( ) e A x d A e x( ) = e A Bu( ) . d
de esta ultima entre 0 y t da La integracion ecuacion e A x( ) o lo que es lo mismo, e At x(t) e0 x(0) = Como la inversa de e es e de (4.5) es que la solucion
At
At 0 t 0 t =0 t
=
0
e A Bu( )d ,
e A Bu( )d .
y e = I , como vimos anteriormente, nalmente arribamos a

t 0
x(t) = e At x(0) +
e A(t ) Bu( )d .
(4.6)
(4.6) es la solucion general de la ecuacion de estado (4.5). Suele referirse La ecuacion de (4.6) en la ecuacion de como la f ormula de variaci on de los par ametros. La substitucion de la respuesta salida (4.4) expresa y(t) en la forma siguiente, que evidencia la superposicion a entrada nula y la respuesta a condiciones iniciales nulas: y(t) = Ce At x(0) + C
0 t
e A(t ) Bu( )d + Du(t),
(4.7)
de la Ecuacion de Estado y Realizaciones 4. Solucion
Notas de CAUT2 - 47
de la ecuacion de estado tambi Como adelant aramos en 4.1, la solucion en puede calcularse en el dominio frecuencial haciendo la transformada de Laplace de (4.3) y (4.4) y resolviendo las ecuaciones algebraicas obtenidas: (s) = (sI A)1 [ x(0) + Bu (s)] x (s) = C (sI A)1 [ x(0) + Bu (s)] + D u (s). y Las formulas (4.6) o (4.7) requieren la exponencial matricial e At . Como vimos, e At puede calcularse en m as de una forma, entre otras, 1. Usando el Teorema 3.4 del Cap tulo 3, evaluando f ( ) = et en el espectro de A, y calculando los coecientes del polinomio matricial h( ). 2. Encontrando la forma de Jordan de A = QJQ1 , usando la formula expl cita de e Jt al nal de 3.6.4, y despu es haciendo e At = Qe Jt Q1 . 3. Como L[e At ] = (sI A)1 , calculando la inversa de (sI A) y antitransformando. Ejemplo 4.1. Consideremos la ecuacion (t) = x 0 1 0 x(t) + u(t) 1 2 1
est (4.6). Calculamos e At por el m Su solucion a dada por la ecuacion etodo 3; la inversa de sI A es
(sI A)
s 1 = 1 s + 2
1 s + 2 1 2 1 s (s + 1) (s + 2)/(s + 1)2 1/(s + 1)2 = 1/(s + 1)2 s/(s + 1)2
La matriz e At es la antitransformada Laplace de (sI A)1 , que obtenemos expandiendo en fracciones simples y usando una tabla de transformada Laplace (o en M ATLAB con el ilaplace). symbolic toolbox con la funcion
(s+2) (s+1)2 1 (s+1)2
1 (s+1)2 s (s+1)2
( 1 + t ) e t tet . tet ( 1 t ) e t
de los par Finalmente, usando la formula de variacion ametros (4.6) x(t) =
(1 + t)et x1 (0) tet x2 (0) + tet x1 (0) + (1 t)et x2 (0)
t 0 [1
)e(t ) u( )d . (t )]e(t ) u( )d
t 0 (t
4.2.1.
Comportamiento asintotico de la respuesta a entrada nula
De la forma de e Jt donde J est a en forma de Jordan podemos deducir el comportamiento asintotico de la respuesta del sistema a condiciones iniciales. Consideremos un sistema cuya matriz J = Q1 AQ es 1 1 0 0 0 0 1 1 0 0 J= 0 0 1 0 0 0 0 0 1 0 0 0 0 0 2
Notas de CAUT2 - 48
(t) = Ax(t) + Bu(t) es x(t) = e At x(0), donde ya conoceLa respuesta a entrada nula de x en forma cerrada para e At mos la expresion t e 1 te1 t t2 e1 t /2 0 0 0 e 1 t te1 t 0 0 1 At t 0 e1 0 0 e = Q 0 Q 1 t 0 0 0 e 0 0 0 0 0 e 2 t lineal de los t Vemos que cada elemento de e At ser a una combinacion erminos {e1 t , te1 t , t2 e1 t , e2 t }, que surgen de los autovalores de A y sus multiplicidades. Podemos as deducir que Si todos los autovalores de A, repetidos o no, tienen parte real negativa, e At cuando t ; la respuesta de extingue. Si algun autovalor de A tiene parte real positiva, e At respuesta crece en forma ilimitada.
cuando t ; la
autovalor de A tiene parte real positiva, y los autovalores con parte real cero Si ningun son de multiplicidad 1, e At cuando t para alguna cota R; la respuesta permanece acotada. Si A tiene autovalores con parte real cero de multiplicidad 2 o mayor, e At cuando t ; la respuesta crece en forma ilimitada.
(t) = Ax(t). Estas conclusiones son v alidas en general para la respuesta de un sistema x Ejemplo 4.2 (Oscilador armonico). Para el oscilador arm onico, donde A= obtenemos 0 1 1 0
1
(sI A)1 =
de donde
s 1 1 s
s2
1 s 1 + 1 1 s
e At =
cos t sen t . sen t cos t
La respuesta a entrada nula x(t) = e At x(0) ser a oscilatoria.
4.2.2.
Discretizacion
directa de la formula de los par Una aplicacion de variacion ametros es la discretizacion o diseno de controladores digitales. Dado que la gran mayor de sistemas para simulacion a de los sistemas de control se implementan en forma digital, ser a necesario en alguna etapa discretizar; bien el controlador en tiempo continuo disenado del diseno en base a un modelo en tiempo continuo de la planta, o bien la planta en tiempo continuo misma a n de del controlador discreto en forma directa. realizar el diseno La Figura 4.1 ilustra una planta en tiempo continuo con los conversores
Notas de CAUT2 - 49
medida en tiempo continuo y(t) anal ogico/digital, o muestreador, que convierte la senal en una secuencia de valores discretos y[k], aptos para ser procesados en una computadora digital; y digital/anal ogico, o bloqueador, que convierte la secuencia discreta de control u[k] pro ducida por el controlador digital en la entrada analogica u(t) a la planta. Vamos a asumir por simplicidad que ambos conversores operan en sincronismo y con un per odo regular T .
uk

ut
yt

yk

D/A Gd
x y
Ax Bu Cx Du

A/D
de un sistema en variables de estado Figura 4.1: Esquema de discretizacion Consideremos el sistema en tiempo continuo G dado por sus EE (t) = A(t) x(t) + B(t)u(t) x y(t) = C (t) x(t) + D (t)u(t) . Pretendemos obtener un modelo discreto Gd en EE asumiendo un bloqueador de orden cero (D/A) a la entrada y un muestreador ideal (A/D) a la salida, que son los casos m as simples del bloqueador de orden cero es de estos conversores. La ley de conversion u(t) = u[k],
t [kT, (k + 1) T ),
del muestreador ideal es mientras que la ley de conversion y[k] = y(kT ). simple pero inexacta Discretizacion Hagamos primero un enfoque intuitivo. La forma m as simple de obtener un modelo de la derivada discreto de este sistema es usando la aproximacion (t) x x(t + T ) x(t) T
nos interesa la evolucion del sispara obtener x(t + T ) = x(t) + Ax(t) T + Bu(t) T . Si solo tema en los instantes t = kT , k = 0, 1, 2 . . . , llegamos al modelo x[k + 1] = ( I + AT ) x[k] + BTu[k]. (4.8)
en los instantes de muestreo. El modelo discreto (4.8) es simple de obtener, pero inexacto aun
de la Ecuacion de Estado y Realizaciones 4. Solucion exacta Discretizacion
Notas de CAUT2 - 50
Podemos obtener un modelo discreto exacto del sistema continuo usando la formula de los par general de la EE. Para empezar, de variacion ametros (4.6) que da la solucion notemos que la salida del bloqueador de orden cero (D/A) se mantiene constante durante cada per odo de muestreo T hasta la proxima muestra, u(t) = u(kT ) u[k] para t : kT t < (k + 1) T .
Para esta entrada seccionalmente constante, evaluamos el estado del sistema continuo en el instante de muestreo t = (k + 1) T , x[k + 1] x((k + 1) T ) = e A(k+1)T x(0) +
0
(k +1) T
e A((k+1)T ) Bu( )d
(k+1) T
= e AT e AkT x(0) +
0 T 0
kT
e A(kT ) Bu( )d
+
kT
e A((k+1)T ) Bu[k]d
x[k]
= e AT x[k] +
e A d
Bu[k],
donde en la ultima l nea usamos = (k + 1) T . As llegamos al modelo discreto x[k + 1] = Ad x[k] + Bd u[k] y[k] = Cd x[k] + Dd u[k], donde Ad Cd e AT , C,
T
(4.9)
Bd Dd
e A d B
D.
El modelo (4.9) da el valor exacto de las variables en t = kT . Usando la igualdad A 0T e A d = e AT I , si A es no singular podemos computar Bd con la formula Bd = A1 ( Ad I ) B. Un m etodo mejor, que vale para toda A, surge del siguiente resultado Teorema 4.1 (VanLoan [1978]). Sean dados los enteros positivos n1 , n2 tales que n1 + n2 = n. Si denimos la matriz triangular n n C= A1 B1 0 A2
donde A1 Rn1 n1 , A2 Rn2 n2 y B1 Rn1 n2 , entonces para t 0 A1 t F1 (t) = e F (t) G1 (t) eCt = 1 , donde F2 (t) = e A2 t 0 F2 (t) G1 (t) = 0t e A1 B1 e A2 (t ) d .
B Aplicando el teorema para C = [ A 0 0 ] obtenemos A d = F1 ( T ) y Bd = G1 ( T ). La funcion M ATLAB [Ad,Bd] = c2d(A,B,T) calcula Ad y Bd de estas expresiones.
Notas de CAUT2 - 51
4.3. Ecuaciones de Estado Equivalentes

en EE para un sistema dado no es unica en EE, La descripcion . Dada una representacion en EE distinta equivalente un simple cambio de coordenadas nos lleva a una representacion del mismo sistema. Ejemplo 4.3. Sea el circuito RLC de la Figura 4.2, donde R = 1, L = 1 H y C = 1 F. Como en el capacitor. Si elegimos como variables de estado la tension salida tomamos la tension
x 1
x1
u x 1 x2 x 2 x 2 x2
Figura 4.2: Circuito RLC en el capacitor, obtenemos la descripcion en EE en la resistencia y la tension 1 x 0 1 = 2 x 1 1 y= 0 1 x1 1 + u x2 0 x1 . x2
1 y x 2 obtenemos Si en cambio elegimos las corrientes de lazo x x 0 1 1 = x 1 1 2 y = 1 1 1 x 1 + u 2 x 0 1 x . 2 x
Las dos descripciones en EE valen para el mismo circuito. De hecho puede vericarse que x1 1 0 = x2 1 1 1 x 2 x es decir x = Px o = P 1 x. x
La matriz P (no singular) representa un cambio de coordenadas o transformaci on de equivalencia. Denicion 4.1 (Transformacion de Equivalencia). Sea P Rnn una matriz no singular, y 1 = P x. Entonces la EE sea x x (t) (t) = A (t) + Bu x x (t). (t) + Du y(t) = C = PAP1 , B = CP1 , D = PB, C = D, se dice (algebraicamente) equivalente a la EE donde A es una transformaci en x con las matrices A, B, C , D, y x = P x on de equivalencia.
Notas de CAUT2 - 52
son similares y comparten Por lo visto en el repaso de Algebra Lineal, las matrices A y A los mismos autovalores con la misma estructura de autovectores.1 M ATLAB [Ab,Bb,Cb,Db] = ss2ss(A,B,C,D,P) realiza transformacioLa funcion nes de equivalencia.
4.3.1.
Equivalencia a estado cero
Dos descripciones en EE estacionarias son equivalentes a estado cero si tienen la misma matriz transferencia, (sI A )1 B +D . C (sI A)1 B + D = C en series2 Usando la expansion (4.10)
(sI A)1 =
I A A2 + 2 + 3 + s s s
v alida para todo s que no sea un autovalor de A, podemos escribir (4.10) como Bs A Bs +C 1 + C 2 + . D + CBs1 + CABs2 + = D Teorema 4.2 (Equivalencia a Estado Cero). Dos EE lineales y estacionarias { A, B, C , D } , B , D A mB , C } son equivalentes a estado cero sii D = D y CAm B = C , para m = y {A 0, 1, 2, 3, . . .
4.3.2.
Parametros de Markov
La matriz D representa la ganancia est atica directa del sistema. Cuando D = 0, la matriz (s) = C (sI A)1 B, que no es otra cosa que la transformada transferencia se reduce a G Laplace de la respuesta al impulso G (t) = Ce At B. Los coecientes CB = G (0) CAB = G (0) CA2 B = G (0) . . . son las derivadas de la respuesta al impulso en el origen, y se llaman par ametros de Markov. En otras palabras, dos sistemas en EE son equivalentes a estado cero
sus respuestas al impulso son id enticas . sus ganancias est aticas y sus par ametros de Markov son id enticos.
1 2
Dado que la forma de Jordan es unica, salvo reordenamientos de las y columnas. f ( ) = ( 1 / s )1 = 1 + / s + 2 / s 2 + 3 / s 3 + . Surge de evaluar matricialmente la funcion
Notas de CAUT2 - 53
Es claro que equivalencia algebraica implica equivalencia a estado cero. Pero que dos sistemas tengan la misma matriz transferencia no implica que tengan la misma descripcion en EE. Ejemplo 4.4 (Equivalencia algebraica (t) = x
equivalencia a estado cero). Los sistemas (t) = u(t) x y(t) = x(t).
0 1 0 x(t) + u(t) 0 1 1
y(t) = 1 1 x(t)
son equivalentes a estado cero, ya que para ambos D = 0 y CB = 1, CAm B = 0 para todo (s) = 1/s. No son, sin embargo, transferencia, G m 1, y por ende, tienen la misma funcion algebraicamente equivalentes (tienen distinta dimension).
4.4. Formas Canonicas

Existen formas particulares de las EE que presentan caracter sticas utiles. Estas formas se llaman canonicas y discutimos tres: Forma canonica modal, Forma canonica controlable, Forma canonica del controlador.
4.4.1.
Forma canonica modal
La forma canonica modal es aquella en la que la matriz A del sistema esta en forma de Jordan. Como ya vimos, la matriz de cambio de base Q se forma apilando los autovectores y autovectores generalizados del sistema. Recordemos la salvedad cuando hay autovalores complejos 1,2 = j, , R naturalmente conjugados ya que A es real con autovectores v1,2 = r ju, r, u Rn ,: En vez de apilar v1 y v2 en Q hay que usar r y u para obtener la forma de Jordan real con el bloque [ ]. Ejemplo 4.5. La matriz 0 0 2 A = 2 2 2 0 1 2 tiene autovalores 1 = 1 + j, 2 = 1 j, y 3 = 2, respectivamente con autovectores 1 1 1 1 1 v1 = 1 j 1 , v2 = 1 + j 1 , v3 = 0 . 1 0 1 0 1 La matriz de cambio de base Q =
1 1 1 1 1 0 1 0 1
la lleva a la forma de Jordan real
1 1 0 Q 1 A Q = 1 1 0 . 0 0 2
Notas de CAUT2 - 54
4.4.2.
Forma canonica controlable
Presentamos esta forma canonica para el caso de una sola entrada de control, es decir B Rn . Esta forma canonica se obtiene seleccionando como matriz de cambio de base C = [ B, AB, . . . , An1 B], que lleva a la matriz A a una forma companion, 0 0 . . . 0 n 1 1 0 . . . 0 n1 0 0 1 . . . 0 n2 1 1 C AC = C B = 0 . (4.11) , . . . . .. . . . . . . . . . . . . 0 0 . . . 1 1 0 Obviamente se requiere que la matriz C sea no singular (lo que veremos sucede si el sistema es controlable). uno a uno con el polinomio caracter Esta forma canonica tiene una relacion stico de A, n n1 n2 det( I A) = + 1 + 2 + + n1 + n . [Ac,Bc,Cc,Dc] = canon(A,B,C,D,modal) genera la En M ATLAB la funcion forma canonica modal y canon(A,B,C,D,companion) la forma canonica controlable.
4.4.3.
Forma canonica del controlador
de Una forma canonica similar a la controlable (4.11), pero m as conveniente para diseno control, es la del controlador. Esta est a dada por (caso SISO) 0 1 0 ... 0 0 0 0 1 ... 0 0 . . . . . .. . . . Q1 AQ = . , Q 1 B = . . . . . . . 0 0 0 0 ... 1 n n1 n2 . . . 1 1 La matriz de cambio de base es Q = C R, donde C = [ B, AB, . . . , An1 B] y n1 n2 . . . 2 1 1 n2 n3 . . . 1 1 0 . . . . . . . . . . . . . . . . . . R= 2 1 . . . 0 0 0 1 1 . . . 0 0 0 1 0 ... 0 0 0 del caso multientrada es complicada [ver Rugh, 1995, 13]; volveremos a La derivacion ella en el Cap tulo 6. Ejemplo 4.6. Consideremos un sistema cuyas matrices A y B son 1 2 3 0 A= 0 2 1 , B = 1 1 0 3 1
Notas de CAUT2 - 55
M ATLAB ctrb(A,B), y R con el Calculamos la matriz C = [ B, AB, A2 B] con la funcion 3 polinomio caracter stico de A, poly(A), ( ) = 6 2 + 8 2 0 5 20 8 6 1 C = 1 3 9 , R = 6 1 0 1 3 14 1 0 0 de donde obtenemos 0 1 0 ( C R )1 A ( C R ) = 0 0 1 , 2 8 6 0 ( C R )1 B = 0 . 1
4.5. Realizaciones
Como vimos, todo sistema lineal estacionario (invariante en el tiempo) puede describir entrada-salida con matriz transferencia se por una representacion (s)u (s) = G (s), y nita, tambi interna en EE y si el sistema es de dimension en por una representacion (t) = Ax(t) + Bu(t) x y(t) = Cx(t) + Du(t). Cuando tenemos las EE, { A, B, C , D }, la matriz transferencia puede calcularse en forma (s) = C (sI A)1 B + D. El problema inverso, de obtener las EE { A, B, C , D } unica como G (s), se llama problema de realizaci (s) es reade G on. Diremos que una matriz transferencia G 1 (s) = C (sI A) B + D, y el cu lizable si existe una EE con { A, B, C , D } tales que G adruplo { A, B, C , D } se dice una realizaci on de G (s). existen innitas, ya que un Como vimos con el Ejemplo 4.3, si existe una realizacion, en EE equivalente. M dos simple cambio de coordenadas lleva a una descripcion as aun, pueden tener la misma funcion sistemas en EE no necesariamente de la misma dimension transferencia. Para analizar el problema de realizabilidad necesitamos introducir el concepto de fun transferencia propia. cion transferencia racional (cocienDenicion 4.2 (Funcion transferencia propia). Una funcion te de polinomios) es propia si el grado del polinomio numerador no supera (es menor o igual) al grado del polinomio denominador. Si el grado del numerador es estrictamente se dice estrictamente propia. menor que el del denominador, la funcion de funcion transferencia propia se extiende naturalmente a una matriz La denicion transferencia, que es (estrictamente) propia si todos sus elementos son funciones racionales (estrictamente) propias. (s) es realizable G (s) es una Teorema 4.3 (Realizabilidad). Una matriz transferencia G matriz racional y propia.
Notas de CAUT2 - 56
(s) es realizable, entonces existen matrices { A, B, C , D } tales que Demostraci on. () Si G (s) = C (sI A)1 B + D G 1 = C adj(sI A) B + D det(sI A) Si A es n n, det(sI A) es un polinomio de orden n. Como cada elemento de adj(sI A) es el determinante de una submatriz (n 1) (n 1), C adj(sI A) B es una matriz de polinomios de a lo sumo grado n 1. As (sI A)1 B es racional y (s) racional y propia. estrictamente propia, y si D = 0, G (s) es una matriz racional propia q p descomponemos G (s) = G () + () Si que G ep (s), donde G ep (s) es la parte estrictamente propia de G ( s ). G Denimos d(s) = sr + 1 sr1 + + r1 s + r como el polinomio monico m nimo ep (s). Entonces podemos expresar denominador de los elementos de G comun ep (s) = G 1 N1 sr1 + N2 sr2 + + Nr1 s + Nr , d(s)
donde las Ni son matrices constantes q p. Entonces no es dif cil probar que el con junto de EE en forma canonica del controlador 0 Ip 0 ... 0 0 0 0 Ip ... 0 0 . . . . . u(t) .. . . . (t) = . x x(t) + . . . . . . . 0 0 0 0 ... Ip r I p r1 I p r2 I p . . . 1 I p Ip ()u(t) y = Nr Nr1 Nr2 . . . N1 x(t) + G (s), nalizando la demostracion. de G es una realizacion (s) es realizable sii G (s) es racional y propia. En la Entonces, una matriz transferencia G prueba del Teorema 4.3 tenemos una forma de obtener las matrices A, B, C de la realizacion ( D es directamente G ()). En el caso SISO esta forma es particularmente simple y se reduce a la forma can onica del controlador 0 1 0 0 0 0 0 1 0 0 . . . . . .. . . . (t) = . x (4.12) x(t) . u(t) . . . . . . 0 0 0 0 1 n n1 n2 1 1 y ( t ) = n n1 n2 1 x ( t ) (s) dada por transferencia G correspondiente a una funcion (s) = G 1 s n1 + 2 s n2 + + n s n + 1 s n1 + 2 s n2 + + n (4.13)
Notas de CAUT2 - 57
transferencia corresponde a la forma canonica La misma funcion alternativa del controlador 1 1 2 n1 n 0 1 0 0 0 0 u(t) 0 1 0 0 (t) = x x ( t ) + 0 . . . . . . . .. . . . . . . 0 0 0 1 0 0 y ( t ) = 1 2 3 n1 n x ( t ) . En el caso SIMO (una entrada y varias salidas) la forma es tambi en simple; la unica en la ecuacion (4.12) es en la ecuacion de salida modicacion 1n 13 12 11 2n 23 22 21 y(t) = . (4.14) x(t) . . . . . . . . . . . pn p3 p2 p1 para y R p , que corresponde a la matriz transferencia 11 sn1 + 12 sn2 + + 1n 21 sn1 + 22 sn2 + + 2n . . . n1 n2 p1 s + p2 s + + pn (s) = G s n + 1 s n1 + 2 s n2 + + n SISO (4.12)-(4.13), o la SIMO (4.12)-(4.14), pueden escribirse directamente La realizacion ( s ). de la matriz transferencia G por inspeccion de varios Como encaramos el caso MIMO? Puede considerarse como la superposicion SIMOs, por ejemplo dividiendo la matriz transferencia en columnas y realizando las columnas por separado (cada columna corresponde a un subsistema SIMO), como se ilustra en la Figura 4.3, 11 (s) G 12 (s) G 1m ( s ) G 1 (s) 1 (s) y u y (s) G 2 (s) 22 (s) G 2m ( s ) 21 2 (s) G u = . . . . . . . . . . . . . . . p1 ( s ) G p2 ( s ) G pm (s) p (s) m (s) y u G 1 (s) u u 2 (s) C1 (s) G C2 (s) G Cm (s) = G . . . m (s) u C1 (s)u C2 (s)u Cm (s)u 1 (s) + G 2 (s) + + G m =G

u 1 u 2 u m
Notas de CAUT2 - 58
G C1 G C2 . . . G y
Cm
de un sistema MIMO por columnas Figura 4.3: Representacion
Ci (s), i = 1, . . . , m, de G (s) entonces una de la columna G Si Ai , Bi , Ci , Di es la realizacion de la superposicion es realizacion 1 u1 x1 B1 0 0 x A1 0 0 x 2 0 A2 0 x2 0 B2 0 u2 + = . . . . . . . . . .. ... . . . . . . . . . . . . . . . . . . . n xm 0 0 Am x 0 0 Bm um x1 u1 x2 u2 y = C1 C2 Cm . + D1 D2 Dm . . . . . xm um de un sistema MIMO tambi De forma similar, la realizacion en se puede encarar, mu de varios sistemas MISOs subdividiendo la matriz tatis mutandis, como la superposicion transferencia por las. Ejemplo 4.7. Consideramos la matriz transferencia (s) = G
4s10 2s+1 1 (2s+1)(s+2) 3 s+2 s+1 (s+2)2
2 0 = + 0 0
12 2s+1 1 (2s+1)(s+2) 6(s+2) 1/2 s2 + 5 2 s+1
3 s+2 s+1 (s+2)2 3(s+2) (s+1) (s+2)2
2 0 + 0 0
(4.15)
Realizamos la parte estrictamente propia de (4.15) por columnas.

6(s+2) 1/2 s2 + 5 2 s+1
1 = x yC 1 = 2 = x yC 1
0 1 0 u 5 x1 + 1 1 1 2
12 6 x1 1 0 2
3(s+2) (s+1) s2 +2s+4
0 1 0 x + u 4 2 2 1 2 6 3 = x 1 1 2
Notas de CAUT2 - 59
(s) para obtener su realiFinalmente superponemos las realizaciones de las columnas de G completa. zacion 0 1 0 0 0 0 1 5 0 1 x 0 2 x1 + 1 0 u1 = 2 x x2 0 0 u2 0 0 0 1 (4.16) 0 1 0 0 4 2 y=
12 6 6 3 1 0 1 1 2
x1 2 0 + x2 0 0
u1 u2
4.5.1.
M Realizacion nima
de una matriz transferencia (por coLos m etodos vistos para obtener una realizacion lumnas, por las, etc.) dan en general realizaciones de distintos ordenes. Cabe preguntarse que tenga el menor orden posible, que implicar si ser a posible obtener una realizacion a, en general, el modelo en EE m as simple. Para toda matriz transferencia realizable existen siempre realizaciones de orden m nimo, llamadas realizaciones m nimas. Estas realizaciones equivalentes a estado cero entre s son no solo , sino tambi en algebraicamente equivalentes. Las realizaciones m nimas est an intr nsecamente relacionadas con las propiedades de controlabilidad y observabilidad del sistema que estudiaremos en El Cap tulo 6. La funcion dada { A, B, C , D } M ATLAB [Am,Bm,Cm,Dm] = minreal(A,B,C,D) lleva una realizacion (s) a una realizacion m de G nima.
4.5.2.
Sistemas Discretos
Como es f acil de ver, los conceptos y la teor a de realizaciones que vimos hasta aqu solo con la matriz transferencia G (s) = dependen de las matrices { A, B, C , D } y su relacion C (sI A)1 B + D. Evidentemente entonces, estos conceptos y teor a se aplican tambi en, sin modicaciones, a sistemas de tiempo discreto.
4.6.
de Ecuaciones de Estado Inestacionarias Solucion
Pasemos ahora a analizar el caso inestacionario. Sea entonces el sistema inestacionario descripto por las EE (t) = A(t) x(t) + B(t)u(t) x y(t) = C (t) x(t) + D (t)u(t) , (4.17)
unica inicial x(t0 ) y capara el que asumimos que existe una solucion para cada condicion de las ecuaciones (4.17) es logicamente da entrada de control u(t). La solucion m as dif cil de obtener que en el caso estacionario, pero veremos que la experiencia obtenida va a ser de utilidad. Antes de encarar el caso m as general, con entrada, tratemos solamente la respuesta a condiciones iniciales, es decir, el sistema homog eneo (t) = A(t) x(t) x (4.18) en el caso Vamos a mostrar primero por qu e el m etodo aplicado para deducir la solucion estacionario no sirve. Vale recordar de la teor a de ecuaciones diferenciales que una condi suciente para la existencia y unicidad de solucion de (4.18) es que la funcion matricial cion continua de t. Es decir, A(t) sea una funcion
Notas de CAUT2 - 60
lineal (4.18) con A(t) conPara cada par (t0 , x(t0 )), la ecuacion unica tinua tiene una solucion y continuamente diferenciable. (t) = Ax(t) lo que hicimos fue extender la solucion de la ecuaEn el caso estacionario x At (t) = ax(t) para mostrar que la solucion escalar x general era x(t) = e x(0), usando cion la propiedad de conmutatividad de A con e At en d At e = Ae At = e At A. dt de la ecuacion escalar inesAhora, para el caso inestacionario sabemos que la solucion (t) = a(t) x(t) con condicion inicial x(0) es tacionaria x x(t) = e Sabemos adem as de la propiedad d e dt
t 0 t 0
a( )d
x(0).
(4.19)
a( )d
= a(t)e
t 0
a( )d
=e
t 0
a( )d
a(t).
Probemos a ver si funciona extender directamente (4.19) en forma matricial. Escribimos (4.19) en forma matricial como t x(t) = e 0 A( )d x(0), donde la exponencial matricial e e
t 0 t 0
A( )d
puede expresarse como

t 2
A( )d
= I+
0
1 A( )d + 2
A( )d
0
de la solucion escalar al caso matricial no es v La extension alida en el caso inestacionario pues d e dt

t 0
A( )d
1 = A(t) + A(t) 2
A( )d
0
1 2
A( )d
0
A(t) +
= A(t)e
t 0
A( )d
dado que para distintos tiempos t y las matrices A(t) y A( ) son distintas, y por ende en general no conmutan, A(t) A( ) = A( ) A(t). Concluimos que en general, x(t) = t (t) = A(t) x(t) y debemos usar otro m de x e 0 A( )d x(0) no es una solucion etodo para deri de la matriz fundamental del sistevarla. El m etodo que usaremos requiere la introduccion ma.
4.6.1.
Matriz Fundamental
(t) = A(t) x(t), x (4.20)
Consideremos continua de t. Entonces para cada condicion inicial x(t0 ) donde A(t) Rnn es una funcion x(t). Si tomamos un conjunto de n condiciones iniciales x(t0 ) = existe una unica solucion
Notas de CAUT2 - 61
vi Rn , i = 1, 2, . . . , n, obtendremos n soluciones x(t; vi ).3 Apilemos estas n soluciones en una matriz n n X (t) = x(t; v1 ) x(t; v2 ) x(t; vn )) Rnn para cada t.
de (4.20), no es dif Dado que cada x(t; vi ) es una solucion cil ver que la matriz X (t) a su vez satisface la ecuacion (t) = A(t) X (t) X inicial X (t0 ). con condicion (4.21)
Si X (t0 ) es no singular (es decir, las n condiciones iniciales xi (t0 ) son LI), entonces X (t) se dice una matriz fundamental del sistema (4.20). homog Ejemplo 4.8. Consideremos la ecuacion enea (t) = x 0 0 x(t). t 0 (4.22)
1 (t) = 0 es x1 (t) = x1 (0); la solucion de la primer componente x de la segunda La solucion t 2 2 (t) = tx1 (t) es x2 (t) = 0 x1 ( )d + x2 (0) = t /2 x1 (0) + x2 (0). componente x 1 Para condiciones iniciales x(0) = v1 = [ 1 0 ] y x ( 0 ) = v 2 = [ 2 ] tenemos respectivamente las soluciones 1 1 x(t; v1 ) = 2 y x(t; v2 ) = 2 . t /2 t /2 + 2 Como los estados iniciales v1 y v2 son linealmente independientes, X (t) = es una matriz fundamental de (4.22). Obviamente, como las columnas de X (t0 ) se pueden elegir LI de muchas formas, la matriz fundamental X (t) no es unica . Sin embargo, una propiedad muy importante que s tiene una matriz fundamental X (t) es la siguiente. Teorema 4.4 (No singularidad de la Matriz Fundamental). Una matriz fundamental X (t) es no singular para todo t. t1 = t0 , entonces existir Demostraci on. Si X (t) fuera singular para algun a un vector no nulo (t) X (t) z es una solucion que z tal que X (t1 ) z = 0. Por linealidad del sistema, la funcion cumple (t) = 0 para todo t t1 . Como las soluciones son unicas, (t) = 0 para todo t (la nula es unica), solucion y en particular para t = t0 , es decir 0 = (t0 ) = X (t0 ) z. Llegamos a pues X (t0 ) fue asumida no singular en t0 . En conclusion, si X (t) es una una contradiccion, matriz fundamental, debe ser no singular para todo t. Como una matriz fundamental X (t) es no singular para todo t, su inversa est a bien crucial para la solucion de denida, y por lo tanto podemos hacer la siguiente denicion, EE inestacionarias.
3
1 1 2 t /2 t /2 + 2
2
x(t; v) representa la solucion de (4.20) con condicion inicial x(t0 ) = v. La notacion
Notas de CAUT2 - 62
Denicion 4.3 (Matriz de Transicion de Estado). Sea X (t) cualquier matriz fundamental (t) = A(t) x(t). Entonces la matriz de x (t, t0 ) X ( t ) X 1 ( t 0 )
( t ) = A ( t ) x ( t ). se llama matriz de transici on de estados de x En el caso estacionario ( A(t) = A constante), una matriz fundamental es directamente resulta X (t) = e A(tt0 ) X (t0 ), y as la matriz de transicion ( t , t 0 ) = X ( t ) X 1 ( t 0 ) = e A(tt0 ) . Ejemplo 4.9. Para el sistema (4.22) en el ejemplo anterior obtenemos X 1 (t) = y as (t, t0 ) = 1 1 2 2 t /2 t /2 + 2 1 0 . (t2 t2 ) / 2 1 0 t2 0 /4 + 1 1/2 t2 1/2 0 /4
t2 /4+1 1/2 t2 /4 1/2
Como hemos visto, el m etodo usado en el caso estacionario no pod a aplicarse para general de EE inestacionarias (esencialmente porque A(t) no conmuta derivar la solucion t con t0 A( )d ). Hemos tambi en denido la matriz fundamental X (t), formada apilando n soluciones linealmente independientes del sistema [ x1 (t), x2 (t), . . . , xn (t)], y la matriz de transici on de estados (t, t0 ) = X (t) X 1 (t0 ). En el caso estacionario la ma es simplemente e A(tt0 ) . triz de transicion de la ecuaEn los ejercicios propuestos se pide probar que (t, t0 ) es la unica solucion matricial cion (t, t0 ) = A(t)(t, t0 ), t y que satisface las siguientes propiedades: (t, t) = I 1 ( t , t 0 ) = ( t 0 , t ) (t, t0 ) = (t, t1 )(t1 , t0 ). de Utilizaremos estas propiedades de (t, t0 ) para mostrar que las solucion (t) = A(t) x(t) + B(t)u(t) x y(t) = C (t) x(t) + D (t)u(t) , con condiciones iniciales x(t0 ) = x0 y entrada u(t) est a dada por
t
(t0 , t0 ) = I ,
(4.23)
(4.24) (4.25) (4.26)
(4.27)
x(t) = (t, t0 ) x0 +
(t, ) B( )u( )d .
t0
(4.28)
Notas de CAUT2 - 63
x(t) en (4.28) satisface las conDemostraci on de (4.27). Tenemos que mostrar que la solucion diferencial de EE en (4.27). Evaluando (4.28) en t = t0 y diciones iniciales y la ecuacion usando la propiedad (4.24) vemos que
t0
x(t0 ) = (t0 , t0 ) x0 +
t0
(t0 , ) B( )u( )d
= Ix0 + 0 = x0 .
Usando (4.23) y la regla de Leibniz 4 obtenemos d x(t) = (t, t0 ) x0 + dt t t
t
(t, ) B( )u( )d
t0 t t0 t t0
= A(t)(t, t0 ) x0 + = A(t)(t, t0 ) x0 +
(t, ) B( )u( )d + (t, t) B(t)u(t) t A(t)(t, ) B( )u( )d + (t, t) B(t)u(t)
= A(t) x(t) + B(t)u(t).
La respuesta de la salida en (4.27) est a dada por

t
y(t) = C (t)(t, t0 ) x0 + C (t) La respuesta a entrada nula es
(t, ) B( )u( )d + D (t)u(t).

t0
y(t) = C (t)(t, t0 ) x0 , y la respuesta a condiciones iniciales nulas se puede escribir como

t
y(t) =
t0
(C (t)(t, ) B( ) + D (t) (t )) u( )d ,
(4.29)
entrada-salida vista que corresponde con la representacion

t
y(t) =
t0
G (t, )u( )d .
(4.30)
Comparando (4.29) y (4.30) concluimos que la respuesta del sistema (4.27) a un impulso aplicado en el instante est a dada por G (t, ) = C (t)(t, ) B( ) + D (t) (t )
= C (t) X (t) X 1 ( ) B( ) + D (t) (t ).
(4.31)
general de la EE en sistemas inestacionarios requiere la soluResumiendo, la solucion de la ecuacion cion x(t) = A(t) x(t), de la ecuacion para obtener X (t), o bien la solucion (t, t0 ) = A(t)(t, t0 ) t para obtener (t, t0 ). Estas ecuaciones son dif ciles de resolver, salvo para casos especiales. Hay dos casos especiales que pueden ser muy utiles:
4
Ver 3.6.6:
d dt
g(t) f (t)
(t) A(t, ) f(t) + A(t, )d = A(t, ) g
g(t) A(t, )d . f (t) t
de la Ecuacion de Estado y Realizaciones 4. Solucion 1. La matriz A(t) es triangular; como por ejemplo en 1 (t) x a (t) 0 = 11 2 (t) x a21 (t) a22 (t) x1 (t) . x2 (t)
Notas de CAUT2 - 64
1 (t) = a11 (t) x1 (t) y substituir la escalar x En este caso podemos resolver la ecuacion en la ecuacion de x2 , solucion 2 (t) = a21 (t) x1 (t) + a22 (t) x2 (t). x 2. La matriz A(t) posee la propiedad conmutativa
t t
A(t)
t0
A( )d
=
t0
A( )d
A(t)
para todo t y t0 (como es el caso de A(t) diagonal o constante). Entonces puede pro est barse que la solucion a dada por (t, t0 ) = e
t t0
A( )d
1 k! k =0
A( )d
t0
4.6.2.
Caso Discreto
x[k + 1] = A[k ] x[k ] + B[k ]u[k ] y[k ] = C [k ] x[k ] + D [k ]u[k ]
de las EEs inestacionarias en tiempo discreto La solucion (4.32)
es mucho m as simple que el caso en tiempo continuo. En forma similar denimos la matriz de de transici on de estados discreta como la solucion [k + 1, k0 ] = A[k][k, k0 ], con [k0 , k0 ] = I , k = k0 , k0 + 1, . . .
se obtiene en forma expl La diferencia importante es que en el caso discreto la solucion cita como [k , k0 ] = A[k 1] A[k 2] A[k0 ] (4.33) para k > k0 y [k0 , k0 ] = I . Nota importante: Dado que la matriz fundamental en el caso en tiempo continuo es no de estados est singular para todo t, la matriz de transicion a denida para todo t, t t0 y t < t0 (lo que implica que podemos resolver la EE en tiempo invertido). En el caso discreto, si la matriz A es singular la inversa de [k, k0 ] no est a denida, por lo que la contrapartida discreta de la propiedad (4.26) [k , k0 ] = [k , k1 ][k1 , k0 ] vale si k k1 k0 . solo general de la EE en el caso discreto es La solucion
k 1
x[k ] = [k , k0 ] x0 +
m=k0
[k , m + 1] B[m]u[m].
Notas de CAUT2 - 65
4.7. Ecuaciones Inestacionarias Equivalentes

Denicion 4.4 (Equivalencia de EE Inestacionarias). Sea P(t) una matriz n n no singular = P(t) x(t). Entonces la EE y continuamente diferenciable para todo t. Sea x t (t) x (t)u(t) ( (t) + B x )= A (t) x (t)u(t) , (t) + D y(t) = C donde (t) = [ P(t) A(t) + P (t)] P1 (t) A ( t ) = C ( t ) P 1 ( t ) C (t) = P(t) B(t) B (t) = D (t) D (4.34)
se dice (algebraicamente) equivalente a la EE (4.27) y P(t) es una transformaci on de equivalencia. No es dif cil ver que si X (t) es una matriz fundamental del sistema original (4.27), en (t) = P(t) X (t) es una matriz fundamental del sistema (4.34). tonces X Una propiedad interesante en el caso inestacionario es que es posible llevar al sistema a (t) sea constante. una forma equivalente donde A Teorema 4.5 (Transformacion a matriz de evolucion estacionaria). Sea A0 una matriz n n de equivalencia que lleva (4.27) a constante cualquiera. Entonces existe una transformacion (4.34) con A(t) = A0 . (t) = A(t) x(t), y denamos P(t) = Demostraci on. Sea X (t) una matriz fundamental de x A0 t 1 e X (t). Entonces, (t) = P(t) A(t) + P ( t ) P 1 ( t ) A 1 ( t ) X ( t ) e A0 t . = e A0 t X 1 A ( t ) + A 0 e A0 t X 1 ( t ) + e A0 t X Como 1 ( t ) X ( t ) + X 1 ( t ) X (t) = 0, X ( t ) = A 0 e A0 t X 1 ( t ) X ( t ) e A0 t = A 0 . A (4.35) (4.36)
que sigue de derivar X 1 (t) X (t) = I , el reemplazo de (4.36) en (4.35) muestra que
Es interesante notar que si A0 se elige como la matriz nula, A0 = 0, entonces P(t) = X 1 y el sistema barra se reduce a (t) = 0, A ( t ) = X 1 ( t ) B ( t ) , B (t) = C (t) X (t), C (t) = D (t), D
considerablemente m como se ve en la Figura 4.4. Una representacion as simple, aunque necesitamos conocer una matriz fundamental del sistema original para obtenerla. aun Usando (4.31), es f acil vericar que la respuesta al impulso inestacionaria es invariante con respecto a transformaciones de equivalencia, como pasa en el caso inestacionario. Sin embargo, y a diferencia de lo que pasaba en el caso estacionario, las propiedades de la ma del sistema A(t) pueden cambiar dr triz de evolucion asticamente con una transformacion donde el caso estacionario no es un caso particular de equivalencia! Esta es una excepcion del caso inestacionario (nunca vamos a poder transformar la matriz A(t) en la matriz nula de equivalencia estacionaria). con una transformacion
Notas de CAUT2 - 66
D u B A D u B
x C
x C
inestacionaria equivalente a un sistema con matriz de evolucion Figura 4.4: Transformacion nula.
4.8.
Realizaciones de Sistemas Inestacionarios
En el caso inestacionario no podemos usar la transformada de Laplace para describir el comportamiento entrada-salida del sistema, por lo tanto usamos directamente la descrip en dominio temporal cion
t
y(t) =
t0
G (t, )u( )d .
nita tiene representacion en EE. Vimos en (4.31) que de la Si el sistema es de dimension en EE (4.27) la respuesta al impulso est representacion a dada por G (t, ) = C (t) X (t) X 1 ( ) B( ) + D (t) (t ), para t , (4.37)
( t ) = A ( t ) x ( t ). donde X (t) es una matriz fundamental del sistema x El problema inverso se trata de obtener A(t), B(t), C (t) y D (t) de la respuesta al impulso G (t, ). As , una respuesta al impulso G (t, ) se dice realizable si existen A(t), B(t), C (t) y D (t) tales que se cumple (4.37). Teorema 4.6 (Realizabilidad de sistemas inestacionarios). Una matriz q p de respuesta si puede descomponerse en la forma al impulso G (t, ) es realizable si y solo G (t, ) = M(t) N ( ) + D (t) (t ) (4.38)
entero n. para todo t , donde M, N y D son matrices q n, n p y q p para algun Demostraci on. que cumple (4.37) y M(t) = ) Si G (t, ) es realizable entonces existe una realizacion 1 C (t) X (t) y N ( ) = X ( ) B( ).
) Si G (t, ) puede descomponerse en la forma (4.38) entonces

(t) = N (t)u(t) x y(t) = M(t) x(t) + D (t)u(t)
Notas de CAUT2 - 67
del sistema. En efecto, si A(t) = 0 entonces X (t) = I es una matriz es una realizacion fundamental y M(t) I I 1 N ( ) + D (t) (t ) = G (t, ).
Ejemplo 4.10. La respuesta al impulso G (t) = tet , o G (t, ) = G (t ) = (t )e(t ) , puede factorizarse como et G (t, ) = et tet e inestacionaria y as admite la realizacion (t) = x 0 0 tet u(t) x(t) + 0 0 e t
t
(4.39)
y(t) = e
te
x(t).
1 , s2 2 s+ 2
Alternativamente, la transformada de Laplace de G (t) es L[tet ] = estacionaria tenemos la realizacion (t) = x 0 1 0 x(t) + u(t) 2 2 1
de donde ob-
y(t) = 1 0 x(t).
4.9. Resumen
En este cap tulo: general de la ecuacion de estado para sistemas lineales estacioObtuvimos la solucion narios, conocida como f ormula de variaci on de los par ametros. Aplicamos esta formula exacta de un sistema con un bloqueador de orden cero para obtener la discretizacion a la entrada y un muestreador a la salida. Vimos que sistemas cuyas representaciones en EE est an relacionadas a trav es de un cambio de coordenadas no singular son equivalentes. Vimos tambi en la equivalencia a estado cero de EE, que implica que dos representaciones en EE tienen la misma matriz transferencia, aunque no necesariamente sean algebraicamente equivalentes. Dentro de las innitas formas posibles para las EE a trav es de transformaciones de equivalen cia, presentamos tres formas canonicas utiles: modal, controlable y del controlador. en Introducimos el problema de realizaci on, que consiste en obtener una descripcion de una matriz EE dada una matriz transferencia racional y propia. La realizacion transferencia en forma canonica del controlador es particularmente simple para los adem de una casos de una entrada, y util as para reducir el problema de realizacion matriz transferencia con varias entradas (columnas) superponiendo las realizaciones vista se aplica sin modicaciones a de cada columna. Toda la teor a de realizacion sistemas en tiempo discreto. de la ecuacion de estados de sistemas inestacionarios. La priEstudiamos la solucion notable es que el m en el camera conclusion etodo usado para derivar la solucion so estacionario no sirve. En el caso inestacionario recurrimos a la matriz fundamental
Notas de CAUT2 - 68
X (t), formada apilando n soluciones LI del sistema, y la matriz de transici on de estados 1 A(tt0 ) (t, t0 ) = X (t) X (t0 ), que en el caso estacionario se reduce a e . En general, el computo de (t, ) es dif cil salvo casos especiales como los de A(t) triangular, diagonal o constante. Para sistemas inestacionarios discretos, sin embargo, [k, k0 ] s se en tiempo discreto es v puede calcular expl citamente (la solucion alida en la direccion positiva del tiempo). Vimos transformaciones de equivalencia (algebraica) inestacionarias. Estas llevan el entrada-salida, pero en la que la matriz sistema a una forma con la misma descripcion A(t) puede tener propiedades muy distintas. La respuesta al impulso de un sistema inestacionario es realizable sii G (t, ) admite simple que separa la dependencia en t y . una factorizacion
4.10.
Ejercicios
Ejercicio 4.1. Utilizando la regla de Leibniz para derivar expresiones integrales, vericar que (4.6) satisface (4.5) con estado inicial x(0). Ejercicio 4.2. Probar que los sistemas descriptos por EE equivalentes tienen la misma fun transferencia. cion Ejercicio 4.3. Para los siguientes casos de la matriz A,
3 2 , 1 0
0 1 , 1 2
1 1 , 1 1
5 6 3 4
(t) = Ax(t), y dibujar en forma cua de la respuesta a entrada nula, x obtener una expresion litativa el diagrama de fases (x2 (t) versus x1 (t)). Como es la respuesta a condiciones iniciales sobre las direcciones de los autovalores de A? Vericar los diagramas obtenidos mediante num simulacion erica con un conjunto de distintas condiciones iniciales en el marco de la ventana 2 x1 (0) 2, 2 x2 (0) 2. (Los diagramas corresponden a los tipos de sistemas de segundo orden conocidos respectivamente como nodo, nodo degenerado, foco y ensilladura.) del Teorema 4.3. Ejercicio 4.4. Terminar los detalles de la demostracion para la matriz transferencia Ejercicio 4.5. Hallar una realizacion 2 2s 3 s + 1 (s + 1)(s + 2) . (s) = G s 2 s s+1 s+2 (s) en el ejercicio anterior por de cada columna de G Ejercicio 4.6. Hallar una realizacion separado, y despu es conectarlas en un solo modelo en EE. Son las realizaciones obtenidas equivalentes? (s) en el ejercicio anterior por sepa de cada la de G Ejercicio 4.7. Hallar una realizacion rado, y despu es conectarlas en un solo modelo en EE. Como se compara la realizacion obtenida con las de los ejercicios anteriores?
Notas de CAUT2 - 69
(t, t0 ) satisface las siguientes propiedades Ejercicio 4.8. Probar que la matriz de transicion 1. de la ecuacion diferencial matricial (t, t0 ) es la unica solucion d (t, t0 ) = A(t)(t, t0 ), dt 2. 3. 4. (t, t) = I , 1 ( t , t 0 ) = ( t 0 , t ), ( t , t 0 ) = ( t , t 1 ) ( t 1 , t 0 ). (t0 , t0 ) = I .
para los sistemas Ejercicio 4.9. Encontrar matrices fundamentales y de transicion (t) = x 0 1 x(t), 0 t y (t) = x
1 e2t x(t). 0 1
de Ejercicio 4.10. Mostrar que la matriz de transicion (t) = x tiene la forma (t, t0 ) = para todo t, t0 , donde
(t, t0 ) t ii
A11 (t) A12 (t) x(t) 0 A22 (t) 11 (t, t0 ) 12 (t, t0 ) 0 22 (t, t0 )
= Aii ii (t, t0 ) para i = 1, 2.
(t)) mediante una trans (t), C Ejercicio 4.11. Llevar un sistema estacionario ( A, B, C ) a (0, B de equivalencia inestacionaria. formacion inestacionaria y una estacionaria de la respuesta Ejercicio 4.12. Encontrar una realizacion al impulso G (t) = t2 et .
Bibliograf a
John S. Bay. Fundamentals of Linear State Space Systems. WCB/McGraw-Hill, 1999. Chi-Tsong Chen. Linear System Theory and Design. Oxford University Press, 3rd edition, 1999. John C. Doyle, Bruce A. Francis, and Allen Tannenbaum. Feedback control theory. Macmillan Pub. Co., 1992. B. Friedland. Control System Design. McGraw-Hill, 1986. G.C. Goodwin, S.F. Graebe, and M.E. Salgado. Control System Design. Prentice Hall, 2000. G.C. Goodwin and K.S. Sin. Adaptive Filtering Prediction and Control. Prentice-Hall, New Jersey, 1984. Wilson J. Rugh. Linear System Theory. Prentice Hall, 2nd edition, 1995. Introducci Argentina de Ricardo S anchez Pena. on a la teor a de control robusto. Asociacion Control Autom atico, 1992. M. M. Seron, J. H. Braslavsky, and G. C. Goodwin. Fundamental Limitations in Filtering and Control. CCES Series. Springer-Verlag, 1997. C.F. Van Loan. Computing integrals involving the matrix exponential. IEEE Trans. Automat. Contr., AC-23(3):395404, June 1978.
193
Cap tulo 5 Estabilidad

5.1. Introduccion
La estabilidad de un sistema puede pensarse como una continuidad en su comporta en las entradas o condiciones iniciales, miento din amico. Si se presenta un cambio pequeno en su respuesta perturbada. Por un sistema estable presentar a modicaciones pequenas por pequena que sea, llevar otro lado, en un sistema inestable cualquier perturbacion, a estados y/o salidas a crecer sin l mite o hasta que el sistema se queme, se desintegre o sature. Es evidente entonces que la estabilidad es un requerimiento b asico de los sistemas din amicos destinados a realizar operaciones o procesar senales, y es lo primero que debe de un sistema de control. garantizarse en el diseno
Estable x0 x0
xt

xt
Inestable
Como la respuesta de los sistemas din amicos lineales se descompone en la respuesta a entrada con condiciones iniciales nulas, y la respuesta a condiciones iniciales con entrada nula, podemos hablar de dos tipos de estabilidad: Estabilidad externa, o entrada-salida, que se reere a la estabilidad del sistema con condiciones iniciales nulas. La estabilidad externa describe el efecto de perturbaciones en las entradas sobre el comportamiento din amico de la salida del sistema. Estabilidad interna, que se reere a la estabilidad del sistema autonomo (sin entradas). La estabilidad interna describe el efecto de perturbaciones en las condiciones iniciales sobre comportamiento din amico de los estados del sistema. Estudiaremos estos dos tipos de estabilidad por separado, para sistemas estacionarios primero, y luego para sistemas inestacionarios.
70
5. Estabilidad
Notas de CAUT2 - 71
5.2. Estabilidad Externa de Sistemas Estacionarios

5.2.1. externa Representacion
t t
Sea un sistema lineal, causal y estacionario SISO descripto por la integral de convolu cion y(t) =
0
g(t )u( )d =
g( )u(t )d ,
(5.1)
para el cual asumimos condiciones iniciales nulas (es decir, se encuentra inicialmente relajado). Vamos a estudiar la estabilidad externa del sistema (5.1) con respecto a la familia de de entrada dada u(t) se dice acotada si existe una senales de entrada acotadas. Una senal constante positiva Mu tal que
|u(t)| Mu
para todo t 0.
Ejemplos de senales acotadas son u(t) = sen(t), u(t) = t2 e2t , o u(t) = 2. Denicion 5.1 (Estabilidad entrada-acotada/salida-acotada (BIBO)). 1 Un sistema es estable BIBO (entrada-acotada/salida-acotada) si toda entrada acotada produce una salida acotada. Remarcamos que la estabilidad BIBO se reere a una propiedad del sistema que solo considera los efectos de la entrada sobre la salida, es decir, el comportamiento externo del sistema, independientemente de lo que pase con los estados. El siguiente resultado establece un test para determinar si un sistema SISO es estable BIBO. Teorema 5.1 (Estabilidad BIBO de sistemas SISO). Un sistema SISO es estable BIBO si si su respuesta al impulso g(t) es absolutamente integrable en el intervalo [0, ), es y solo decir, existe una constante M 0 tal que
| g( )|d = M < .
Demostraci on. Supongamos que g(t) es absolutamente integrable. Sea u(t) una entrada arbitraria acotada, es decir, |u(t)| Mu para todo t 0. Entonces
t
| y(t)| =
0 t 0
g( )u(t )d
| g( )||u(t )|d
Mu
| g( )|d el sistema es BIBO.
Mu M,
Nos queda probar que estabilidad BIBO g(t) es absolutamente integrable. Pro equivalente g(t) no es absolutamente integrable no bamos en cambio la implicacion hay estabilidad BIBO. Supongamos entonces que g(t) no es absolutamente integrable, es t1 tal que decir que existe algun
t1 0
1
| g( )|d = .
Bounded Input Bounded Output.
5. Estabilidad Consideremos la entrada acotada u(t1 ) = 1 1 si g( ) 0 si g( ) < 0.
Notas de CAUT2 - 72
La salida del sistema para esta entrada y t = t1 es

t1
y(t1 ) =
0 t1
g( )u(t )d
=
0
| g( )|d = ,
Encontramos entonces una entrada acotada que produce una salida no acotada, por lo que el sistema no es estable BIBO si g(t) no es absolutamente integrable. Este paso concluye la prueba del teorema. absolutamente integrable no necesariamente es acotada y puede Notar que una funcion que es absolutamente integrable y no ir a cero cuando t . Un ejemplo de una funcion no va a cero cuando t es (Figura 5.1) f (t n) = n + (t n)n4 n (t n)n4 para n 1/n3 < t n para n < t n + 1/n3 . para n N, n 2.
n 2 n3
absolutamente integrable que no tiende a 0. Figura 5.1: Funcion
La estabilidad BIBO es la base del cl asico concepto de respuesta en r egimen permanente de un sistema lineal estacionario. Esta es la respuesta del sistema una vez extinguidos los de entrada. transitorios originados en el momento que se aplica la senal Teorema 5.2 (Estabilidad BIBO y respuesta en r egimen permanente). Si un sistema con respuesta al impulso g(t) es estable BIBO, entonces cuando t 1. La salida correspondiente a una entrada constante u(t) = a, para t 0, tiende a la constante (0) a. yrp (t) = g 2. La salida correspondiente a una entrada sinusoidal u(t) = sen 0 t, para t 0, tiende a la sinusoide ( j0 )| sen(0 t + g ( j0 )). yrp (t) = | g Demostraci on.
5. Estabilidad 1. Si u(t) = a para todo t 0, entonces

t t
Notas de CAUT2 - 73
y(t) =
0
g( )u(t )d = a
g( )d
0
y as
l m y(t) = a
0
g( )d = a
0
g( )es d
s=0
(0), = ag
2. Si u(t) = sen 0 t, para t 0, entonces

t
y(t) =
0 t
g( ) sen 0 (t )d g( ) [sen 0 t cos 0 sen 0 cos 0 t] d

t t 0
=
0
= sen 0 t
g( ) cos 0 d cos 0 t
g( ) sen 0 d .
(5.2)
Si g(t) es absolutamente integrable, entonces podemos evaluar
( j) = g
0
g( )e j d =
0
g( ) cos d j
( j) Re g
g( ) sen d
0 ( j) Im g
( j) ( j)|e j g = |g ( j)| cos g ( j) j| g ( j)| sen g ( j). = |g
Finalmente de (5.2), cuando t y(t) sen 0 t
g( ) cos 0 d cos 0 t
g( ) sen 0 d
( j0 ) + cos 0 t Im g ( j0 ) = sen 0 t Re g ( j0 )| [sen 0 t cos g ( j0 ) + cos 0 t sen g ( j0 )] = |g ( j0 )| sen(0 t + g ( j0 )). = |g
El teorema anterior especica la respuesta de un sistema BIBO a senales constantes y sinusoidales una vez que los transitorios se extinguen. Este resultado es la base del ltrado de senales. El test de estabilidad BIBO del Teorema 5.1 sirve para una clase general de sistemas lineales estacionarios. Sin embargo, para utilizarlo necesitamos disponer de la respuesta al impulso del sistema para poder evaluar si es absolutamente integrable. Este puede no ser nita, existe un test un test f acil de realizar. Si el sistema es adem as causal y de dimension que puede resultar mucho m as aplicable. Corolario 5.1 (Estabilidad BIBO para funciones racionales y propias). Un sistema SISO (s) es BIBO estable si y solo transferencia racional y propia g si todos los con una funcion (s) tienen parte real negativa. polos de g
5. Estabilidad
Notas de CAUT2 - 74
(s) tiene un polo en p con multiplicidad m, es claro que su expansion en Demostraci on. Si g fracciones simples incluir a los t erminos 1 1 1 , , . . . , s p (s p)2 (s p)m (s) la respuesta al impulso del sistema relajado La transformada de Laplace inversa de g incluir a entonces combinaciones lineales de las exponenciales e pt , te pt , t2 e pt , . . . , tm1 e pt . si p Es f acil chequear que todos estos t erminos ser an absolutamente integrables si y solo pertenece al semiplano (abierto, sin incluir al eje j) izquierdo del plano complejo, lo que, usando el Teorema 5.1, concluye la prueba del corolario.
j
Estabilidad
Inestabilidad 0
de estabilidad externa para polos de sistemas continuos Figura 5.2: Region Este corolario da el resultado de estabilidad de sistemas lineales que se ve en teor a de control cl asico (Control Autom atico 1); la estabilidad del sistema queda determinada por transferencia, siendo la region de estabilidad el semiplano izquierdo los polos de la funcion (abierto) del plano complejo (Figura 5.2). Como vemos ahora, este tipo de estabilidad solo tiene en cuenta el comportamiento externo del sistema, ignorando el efecto de condiciones iniciales, que se asumen nulas. El resultado m as general, del Teorema 5.1, nos permite transferencia racional y analizar sistemas que no necesariamente van a tener una funcion propia, como ilustramos en el siguiente ejemplo. positiva de la Figura 5.3 que incluye un Ejemplo 5.1. Sea el sistema en realimentacion retardo unitario, T = 1, y una ganancia est atica de valor a. El sistema es de dimension transferencia racional. Cuando innita, puesto que incluye un retardo, y no tiene funcion la entrada es un impulso, u(t) = (t), la salida est a dada por g(t) = a (t 1) + a2 (t 2) + a3 (t 3) + =
i =1
ai ( t i ) .
i Podemos considerar los impulsos como positivos, con lo que | g(t)| = i =1 | a | ( t i ), y as
| g(t)|dt =
i =1
| a |i =
| a| 1| a|
<
si | a| 1 si | a| < 1.
si | a| < 1. Concluimos que el sistema es BIBO estable si y solo
5. Estabilidad
a u
+ +
Notas de CAUT2 - 75
T y
Figura 5.3: Sistema realimentado con retardo.
5.2.2.
Caso MIMO
Los resultados de estabilidad BIBO para sistemas MIMO siguen de los de sistemas SISO, si cada una de sus entradas ya que una matriz transferencia sera BIBO estable si y solo son BIBO estables. Los tests del Teorema 5.1 y el Corolario 5.1 se extienden as de forma inmediata al caso MIMO; deben realizarse sobre cada elemento de la respuesta al impulso o matriz transferencia del sistema.
5.2.3.
interna Representacion
nita sabemos que disponemos tambi En el caso causal y de dimension en de la repre en ecuaciones de estado del sistema, sentacion = Ax(t) + Bu(t) x y(t) = Cx(t) + Du(t). interna, la estabilidad BIBO depender En t erminos de esta representacion a de los autova lores de la matriz A, ya que todo polo de G (s) es necesariamente un autovalor de A, dado que (s) = C (sI A)1 B + D G 1 = C adj(sI A) B + D . det(sI A) Por lo tanto, si todos los autovalores de A tienen parte real negativa, todos los polos de (s) tendr G an parte real negativa, y el sistema ser a estable BIBO. (s), ya que pueden producirse cancelaNo obstante, no todo autovalor de A es un polo de G (s). As ciones entre ceros y polos al computar G , un sistema puede ser estable BIBO aunque algunos autovalores de A no tengan parte real negativa, como vemos en el siguiente ejemplo. Ejemplo 5.2. El sistema
1 10 2 x(t) + u(t) 0 1 0 y(t) = 2 3 x(t) 2u(t),

(t) x a pesar de tener un autovalor con parte real positiva en = 1, es estable BIBO, dado que transferencia su funcion (s) = C (sI A)1 B + D = g tiene un unico polo en s = 1. 2(1 s) , (s + 1)
5. Estabilidad
Notas de CAUT2 - 76
5.2.4.
Caso discreto
El caso discreto es an alogo al caso continuo, mutatis mutandis, con el sistema descripto por y[k ] =
m=0
g[k m]u[m] = g[m]u[k m],

m=0
donde g[k] es la secuencia respuesta a un impulso discreto aplicado en el instante k = 0. Resumimos los resultados principales en los siguientes teoremas. Teorema 5.3 (Estabilidad BIBO discreta). Un sistema discreto MIMO con matriz respuesta si cada gi j [k] es absolutamente sumable, al impulso G [k] = gi j [k] es estable BIBO si y solo es decir, existe una constante M > 0 tal que
k =0
| g[k ]| M < .
Notar que en el caso de tiempo continuo las funciones absolutamente integrables pueden no ser acotadas, o no tender a 0 cuando t . En el caso de tiempo discreto, si g[k] es absolutamente sumable entonces debe necesariamente ser acotada y aproximarse a 0 cuando k . Demostraci on. La prueba de este teorema es similar a la del Teorema 5.1. El resultado sobre la respuesta en r egimen permanente de un sistema discreto es esencialmente id entico al caso continuo. Teorema 5.4 (Respuesta en r egimen permanente discreta). Si un sistema discreto con respuesta al impulso g[k] es estable BIBO, entonces, cuando k , ( 1 ) a. 1. La salida excitada por u[k] = a, para k 0, tiende a g (e j0 )| sen(0 k + 2. La salida excitada por u[k] = sen o k, para k 0, tiende a | g (e j0 )), donde g ( z) es la transformada Z de g[k], g ( z) = g
m=0
g [ m ] z m .
El siguiente corolario da un test de estabilidad externa para sistemas discretos descriptos por matrices transferencia racionales y propias. La principal diferencia con el caso con de estabilidad para los polos del sistema, que en el caso discreto es el tinuo es la region interior del c rculo unitario (Figura 5.4). Corolario 5.2 (Estabilidad BIBO para funciones discretas racionales y propias). Un sis ( z) = [ g i j ( z)] es estable tema discreto MIMO con matriz transferencia racional y propia G i j ( z) tiene magnitud menor que 1. si todo polo de g BIBO si y solo ( z) tiene un polo pi con multiplicidad mi , entonces su expansion en fracDemostraci on. Si G ciones simples incluye los t erminos 1 1 1 , ,..., 2 z pi ( z pi ) ( z p i ) mi
5. Estabilidad
Notas de CAUT2 - 77
( z) da una respuesta al impulso G [k] que inpor lo que la transformada Z inversa de G cluir a los factores pik , kpik , . . . , kmi 1 pik . No es dif cil ver que cada uno de estos t erminos va a ser absolutamente sumable si y solo si | pi | < 1, lo que concluye la prueba.
j Inestabilidad
Estabilidad 0
de estabilidad externa para polos de sistemas discretos Figura 5.4: Region
Ejemplo 5.3. Sea un sistema discreto estacionario con respuesta al impulso g[k] = 1/k, para k 1, y g[0] = 0. Analizamos si g[k] es absolutamente sumable,
k =0
| g[k]| = 1 + 2 + 3 + 4 +
= 1+
1 1 1 1 1 + + + ++ 2 3 4 5 8 1 1 1 > 1 + + + + = . 2 2 2
1 1 ++ 9 16
La secuencia de la respuesta al impulso es acotada pero no sumable, por lo tanto el sistema no es BIBO.
5.3.
Estabilidad Interna de Sistemas Estacionarios
bajo condiciones iniciales nulas, y se refer La estabilidad BIBO se denio a al compor entre salidas y entradas tamiento externo del sistema, o sea, aquel observable en la relacion independientemente de estados del sistema. Ahora estudiamos la estabilidad interna del sistema, que se reere al comportamiento de los estados del sistema. Consideramos la respuesta a condiciones iniciales x(0) = x0 y con entradas nulas, es decir, (t) = Ax(t). x (5.3)
La estabilidad interna describe las propiedades de convergencia de las trayectorias a puntos de operaci on o de equilibrio del sistema. Denicion 5.2 (Punto de Equilibrio). Un punto de equilibrio xe de un sistema en EE (t) = f ( x(t)) x es un vector constante tal que si x(0) = xe , entonces x(t) = xe para todo t 0.
5. Estabilidad
Notas de CAUT2 - 78
de punto de equilibrio vale para sistemas no lineales, que pueden tener La denicion varios. Para sistemas lineales, salvando los casos en que la matriz A tenga autovalores nulos, existe un solo punto de equilibrio: el origen. Ejemplo 5.4. Consideremos el sistema (t) = x 1 3 x(t) 3 9 (5.4)
Este sistema tiene una matriz A con un autovalor nulo, por lo que tiene el kernel de A es no trivial. Podemos vericar que ker A est a generado por el vector xe = [3, 1]T . La direc denida por xe es entonces un conjunto de equilibrios, es decir que hay innitos puntos cion de equilibrio, en particular no aislados. Como vemos en la Figura 5.5, cualquier condicion inicial que no est e exactamente sobre la recta de equilibrios generada por el vector [3, 1]T dar a origen a una trayectoria que crecer a en forma ilimitada con t. Condiciones iniciales sobre la recta de equilibrios dar an origen a trayectorias invariantes (el sistema no se mover a de inicial). la condicion
x2 t
x1 t
yt

Figura 5.6: Espacio de estados (unidimensional) del sistema (5.5)
Figura 5.5: Retrato de fase del sistema (5.4) Veamos ahora el sistema discreto x[k + 1] = 2 0 x[k]. 0 1/2
En este sistema los equilibrios est an denidos por los x tales que x[k + 1] = x[k], es decir, ( A I ) xe = 0. Como la matriz ( A I ) es no singular, el unico equilibrio posible es el origen xe = [0, 0]T . Por ultimo, consideremos el sistema no lineal (t) = sen x(t). x (5.5)
(t) = sen xe 0 obtenemos xe = k , donde k = 0, 1, . . . . Hay innitos Haciendo x puntos de equilibrio, pero en este caso son aislados (Figura 5.6).
5. Estabilidad
Notas de CAUT2 - 79
Para los sistemas lineales que tratamos en esta materia interesa tener un equilibrio unico en EE equivalente y estable en el origen. Este ser a un equilibrio en cualquier representacion del sistema. recibe el nombre del El tipo de estabilidad interna que estudiamos en esta seccion estudios pioneros en el tema cient co ruso Alexander Mikhailovich Lyapunov, que realizo a nes del siglo 19. Lyapunov introdujo por primera vez m etodos que permiten determinar la estabilidad de sistemas de ecuaciones diferenciales sin necesidad de calcular expl citamente las soluciones. El concepto de estabilidad introducido por Lyapunov hace hincapi e en las propiedades de puntos particulares en el espacio de estados, los puntos de equilibrio, y se basa en una matem generalizacion atica del concepto de energ a de sistemas mec anicos. Los m etodos de Lyapunov pueden aplicarse a sistemas no lineales e inestacionarios.
Aleksandr Lyapunov (1857-1918)
(t) = Denicion 5.3 (Estabilidad en el sentido de Lyapunov). El (equilibrio del) sistema x inicial Ax(t) es estable en el sentido de Lyapunov, o simplemente estable, si toda condicion nita origina una trayectoria acotada. (t) = Ax(t) es asint Denicion 5.4 (Estabilidad Asintotica). El sistema x oticamente estable inicial nita origina una trayectoria acotada que adem si toda condicion as tiende al origen cuando t . (t) = Ax(t) es inestable si no es estable. Denicion 5.5 (Inestabilidad). El sistema x
Estabilidad Lyapunov
Estabilidad asintotica
Inestabilidad
Para sistemas del tipo (5.3) la estabilidad queda determinada por los autovalores de A. (t) = Ax(t) es Teorema 5.5 (Estabilidad Interna). El sistema x
5. Estabilidad
Notas de CAUT2 - 80
si todos los autovalores de A tienen parte 1. estable en el sentido de Lyapunov si y solo real no positiva, y aquellos con parte real cero est an asociados a un bloque de Jordan de orden 1 de A. si todos los autovalores de A tienen parte real nega2. asintoticamente estable si y solo tiva. Demostraci on. Notamos primero que la estabilidad de una EE no ser a alterada por transfor (t) = Px(t), donde P es una matriz no maciones de equivalencia algebraica, puesto que en x (t). Y si x(t) tiene a cero, tambi ( t ). singular, si x(t) es acotado tambi en lo ser ax en lo har ax 1 (t) = Ax(t), donde A = PAP tiene los mismos au En el sistema transformado es x tovalores que A. Sean 1 , 2 , . . . , m son los autovalores de A Rnn con multiplicidad ri , im =1 ri = n. de equivalencia que lleva el sistema a su forma canonica Sea P la transformacion modal, o sea que A es diagonal en bloques, J1 0 0 0 0 J2 0 0 0 0 J3 0 A= . . . . . . . . . . . . . . . 0 0 0 Jm donde el bloque Ji Rri ri es el bloque de Jordan asociado al autovalor i . (t) es x(t) = e At (t) = Ax de x La solucion x(0), donde e At tambi en es diagonal en bloques e J1 t 0 0 0 0 e J2 t 0 0 J3 t 0 At 0 e 0 e = . . . . . . . . . . . . . . . . 0 0 0 e Jm t Como vimos, cada e Ji t involucra t erminos con las exponenciales ei t , tei t , t2 ei t , etc., depen puede diendo de la multiplicidad de i . Es claro entonces que la respuesta del sistema solo autovalor tiene parte real positiva y todos los autovalores con parte ser acotada si ningun real nula est an asociados a bloques de Jordan de orden 1. Para que el estado converja asintoticamente al origen, es necesario que todos los autovalores tengan parte real estrictamente negativa. Ejemplo 5.5. Sea el sistema 0 0 0 (t) = 0 0 0 x(t). x 0 0 1 Tiene un autovalor doble en 0 y uno simple en 1. Como el autovalor nulo est a asociado a dos bloques de Jordan de orden 1, concluimos que el sistema es estable en el sentido de Lyapunov. El sistema 0 1 0 (t) = 0 0 0 x(t), x 0 0 1 sin embargo, tiene los mismos autovalores, pero esta vez el autovalor nulo est a asociado a un bloque de Jordan de orden 2, y por lo tanto el sistema es inestable.
5. Estabilidad
Notas de CAUT2 - 81
5.3.1.
Relaciones entre Estabilidad Externa e Interna
entre estabilidad externa y estabilidad interna puede resumirse en el diagraLa relacion ma de la Figura 5.7.
Lyapunov Asint otica
BIBO
Figura 5.7: Relaciones entre estabilidad externa y estabilidad interna estabilidad asintotica Por denicion, implica estabilidad Lyapunov. Por otro lado, como todo polo de la matriz transferencia del sistema (s) = C (sI A)1 B + D G debe ser un autovalor de A, estabilidad interna asintotica implica estabilidad BIBO. Sin (s), ya que puede haber canembargo, no todo autovalor de A aparecer a como polo de G celaciones de ceros y polos. Por lo tanto, estabilidad BIBO no implica estabilidad interna; es decir, un sistema puede ser BIBO estable pero no Lyapunov o asintoticamente estable, como mostramos en el siguiente ejemplo. diferencial Ejemplo 5.6 (Bay [1999, p.299]). Consideremos el sistema dado por la ecuacion +y 2y = u u. y (5.6)
Veremos que este sistema es BIBO estable pero no asintoticamente estable. Primeramente en espacio de estados. Asumiendo condiciones iniciales llevamos (5.6) a una representacion para obtener la funcion transferencia) la transformada Laplace de (5.6) nos da nulas (solo (s) = (s 1)u (s), (s2 + s 2) y es decir, (s) y (s) u g(s) = s2 s1 . +s2 (5.7)
(s) de (5.7) en la forma canonica transferencia g Realizamos ahora la funcion del controlador = x 0 1 0 x+ u 2 1 1 (5.8)
y = 1 1 x. Los autovalores de la matriz A de (5.8) son 1 = 1, 2 = 2. Por el Teorema 5.5, el sistema no es internamente estable, ni asintoticamente, ni Lyapunov, ya que tiene un autovalor con parte real positiva. (s) de (5.7) tenemos que transferencia g Sin embargo, si factorizamos la funcion (s) = g 1 (s 1) = , (s 1)(s + 2) s+2
transferencia no tiene ningun polo con parte real no negativa. Por el por lo que la funcion Corolario 5.1, el sistema es BIBO estable.
5. Estabilidad
Notas de CAUT2 - 82
5.3.2.
Sistemas discretos
Las deniciones de estabilidad en el sentido de Lyapunov y asintotica son las mismas para sistemas en tiempo discreto x[k + 1] = Ax[k]. El Teorema 5.5 se reformula de la siguiente forma. Teorema 5.6 (Estabilidad Lyapunov para sistemas discretos). El sistema x[k + 1] = Ax[k] es si todos los autovalores de A tienen mag1. estable en el sentido de Lyapunov si y solo nitud no mayor que 1, y aquellos con magnitud igual a 1 est an asociados a un bloque de Jordan de orden 1 de A. si todos los autovalores de A tienen magnitud menor 2. asintoticamente estable si y solo que 1.
5.4. El Teorema de Lyapunov

(t) = Ax(t). La im Da una forma alternativa de chequear estabilidad asintotica de x portancia de este resultado (en su forma general) es que permite estudiar la estabilidad de sistemas m as generales, como por ejemplo inestacionarios o no lineales. Denicion 5.6 (Matriz Hurwitz). Diremos que una matriz A es Hurwitz si todos sus autovalores tienen parte real negativa. si dada cualquier Teorema 5.7 (Teorema de Lyapunov). La matriz A es Hurwitz si y solo matriz sim etrica y denida positiva N , la ecuaci on de Lyapunov AT M + MA = N unica tiene una solucion sim etrica y denida positiva M. (5.9) es un caso especial de la ecuacion de Lyapunov Demostraci on. () La ecuacion AM + MB = C que vi eramos en 3.7, con A = AT , B = A, y C = N . Como A y AT tienen los mismos autovalores, si A es Hurwitz no hay dos autovalores i y j tales que i + j = 0. As , por de Lyapunov es no singular y tiene una solucion unica lo visto en 3, la ecuacion M para cada N . Postulamos la siguiente candidata a solucion
(5.9)
M=
0
e A t Ne At dt.
(5.10)
Substituyendo (5.10) en (5.9) da AT M + MA =

0
AT e A t Ne At dt +
0
e A t Ne At Adt
=
0
T
d T e A t Ne At dt dt
t=0
= e A t Ne At
= 0 N = N,
5. Estabilidad
Notas de CAUT2 - 83
donde hemos usado el hecho de que l m e At = 0 puesto que A es Hurwitz. As mostramos de la ecuacion de Lyapunov (5.9). que en efecto M de (5.10) es solucion TN De (5.10) se ve tambi en que si N es sim etrica, tambi en lo es M. Factoricemos N = N es una matriz no singular, y consideremos donde N xT Mx =
0
T T Ne At xdt = xT e A t N
At x 2 Ne 2 dt .
(5.11)
y e At son no singulares, para cualquier x no nulo el integrando de (5.11) es positivo Como N para cada t. Es decir, xT Mx > 0 para todo x = 0, y concluimos que M es denida positiva. () Mostramos que si M y N son denidas positivas entonces A es Hurwitz. Sea un autovalor de A y v = 0 el autovector correspondiente, es decir, Av = v. Tomando la traspuesta conjugada obtenemos v AT = v . As , de (5.9)
v Nv = v AT Mv + v MAv = ( + )v Mv = 2 Re v Mv.
(5.12)
Como los t erminos v Mv y v Nv son reales y positivos, como vi eramos en el 3, (5.12) implica que Re < 0 y muestra que A es Hurwitz. m Un corolario de este resultado que nos va a ser util as adelante es el siguiente. m n con m < n si para cualquier matriz N Corolario 5.3. La matriz A es Hurwitz si y solo y la propiedad N N A rango O rango . = n, . . A n1 N nmn de Lyapunov la ecuacion TN AT M + MA = N
unica tiene una solucion sim etrica y denida positiva M. Un resultado importante que usamos en la prueba del Teorema de Lyapunov es el siguiente, que resumimos en un teorema aparte. de Lyapunov Teorema 5.8. Si A es Hurwitz, entonces la ecuacion AT M + MA = N unica tiene una solucion para cada N que puede ser expresada como
M=
0
e A t Ne At dt.
5.4.1.
Estabilidad Interna de Sistemas Discretos
general de Lyapunov XM + MY = C vista en La contrapartida discreta de la ecuacion el Cap tulo 3 es M XMY = C , (5.13)
5. Estabilidad
Notas de CAUT2 - 84
donde las matrices X e Y son respectivamente n n y m m y las matrices M y C son (5.13) es una ecuacion lineal en M que n m. De forma similar al caso visto, la ecuacion puede reescribirse en la forma A M = C. Si i es un autovalor de X y j un autovalor de Y, para que exista una solucion unica la condicion M de (5.13) es que i j = 1 para todo i , j. (5.14)
(5.14). Sea u un autovector derecho Puede verse intuitivamente como surge la condicion (vector columna n 1) asociado al autovalor i de X ; o sea, Xu = i u. Sea v un autovector izquierdo (vector la 1 m) asociado al autovalor j de Y ; o sea, vY = j v. Si pensamos a (5.13) en t matricial la ecuacion erminos de la funcion
F ( M)
M XMY,
se reduce a F ( M) = C. Evaluando F en la matriz n m M = uv, tenemos que la ecuacion
F (uv) = uv XuvY = (1 i j )uv,

por lo que lo 1 i j son autovalores de (5.13). Si 1 i j = 0, entonces existe una solucion F ( M) = C. De otro modo, pueden o no existir soluciones. unica de la ecuacion de estabilidad para el sistema discreto x[k + Volvemos entonces ahora a la condicion 1] = Ax[k]. Teorema 5.9 (Teorema de Lyapunov Discreto). Todos los autovalores de la matriz A si dada cualquier matriz sim Rnn tienen magnitud menor que 1 si y solo etrica y denida T mn positiva N , o N = N N , donde N R con m < n tiene la propiedad N N A rango . = n, . . A n1 N
nmn
de Lyapunov discreta la ecuacion M AT MA = N unica tiene una solucion sim etrica y positiva denida M. que sigue pasos similares a la del caso continuo, se Un esquema de la demostracion, expl puede encontrar en Chen [1999, p.136-137]. En este caso una solucion cita M est a dada por el siguiente resultado. Teorema 5.10 (Solucion de la Ecuacion de Lyapunov Discreta). Si todos los autovalores de Lyapunov de la matriz A tienen magnitud menor que 1, entonces la ecuacion M AT MA = N unica puede expresarse en la forma tiene solucion para cada N , y la solucion M=
(5.15)
m=0
( A T )m N Am .
(5.16)
cuando A tuviera autovalores con magnitud mayor que 1, la ecuaRemarcamos que aun de Lyapunov tiene solucion si se cumple (5.14), pero no puede expresarse en la forma cion (5.16). M ATLAB lyap calcula la solucion de la ecuacion de Lyapunov continua, La funcion dlyap calcula la discreta. mientras que la funcion
5. Estabilidad
Notas de CAUT2 - 85
5.5. Estabilidad de Sistemas Inestacionarios

5.5.1. Estabilidad entrada/salida
El concepto de estabilidad BIBO para sistemas lineales inestacionarios es el mismo que vimos en el caso estacionario; si el sistema est a representado por
t
y(t) =
t0
G (t, )u( )d ,
decimos que el sistema es BIBO estable si toda entrada acotada produce una salida acotada. necesaria y suciente para estabilidad BIBO es que exista una Como antes, la condicion constante nita M tal que para todo t y todo t0 , t t0 ,
t t0
G (t, ) d M.
5.5.2.
Estabilidad interna
(t) = A(t) x(t) es estable en el sentido de Lya x Como en el caso estacionario, la ecuacion inicial genera una respuesta acotada. Como la respuesta est punov si toda condicion a gobernada por x(t) = (t, t0 ) x(t0 ), si existe una constante nita M concluimos que la respuesta es Lyapunov estable si y solo tal que para todo t y t0 , t t0 , (t, t0 ) M < . (5.17)
(t) = A(t) x(t) es asint x La ecuacion oticamente estable si la respuesta generada por toda inicial es acotada y adem condicion as tiende a cero cuando t . Las condiciones de estabilidad asintotica incluyen (5.17) y adem as (t, t0 ) 0 cuando t .
Dado que en el caso inestacionario la respuesta depende del tiempo inicial t0 , interesa caracterizar la estabilidad del sistema de como una propiedad independiente de t0 . As surgen las nociones de estabilidad uniforme y estabilidad asint otica uniforme. Denicion 5.7 (Estabilidad Uniforme). La ecuacion (t) = A(t) x(t), x x(t0 ) = x0
es uniformemente estable si existe una constante nita positiva tal que para cualquier t0 y correspondiente satisface x0 la solucion x(t) x0 , t t0 . (5.18)
(5.18) debe satisfacerse en t = t0 , la constante debe ser Notar que como la ecuacion mayor que 1. del El adjetivo uniforme se reere precisamente a que no debe depender de la eleccion tiempo inicial, como se ilustra en la Figura 5.8.
5. Estabilidad
x0

Notas de CAUT2 - 86
x0

xt

x t

t0
0 t
Figura 5.8: Estabilidad uniforme.
(t) = (4t sen t 2t) x(t), x(t0 ) = x0 puede vericarse que tiene x Ejemplo 5.7. La ecuacion la solucion 2 2 x(t) = e(4 sen t4t cos tt 4 sen t0 +4t0 cos t0 +t0 ) x0 . (5.19) Es f acil ver que para un t0 jo, existe un tal que (5.19) es acotada por x0 para todo t t0 , dado que el t ermino t2 domina en el exponente cuando t crece. de estado no es uniformemente estable. Con un estado iniSin embargo, la ecuacion cial x0 jo, consideremos la secuencia t0 = 2k , con k = 0, 1, 2, . . . , y los valores de las correspondientes soluciones evaluadas segundos m as tarde: x ( 2 ( k + 1 ) ) = e (4k +1) (4 ) x 0 . Claramente, no hay cota del factor exponencial independiente de k, o sea que va a depender forzosamente de k, y as del tiempo inicial t0 . Denicion 5.8 (Estabilidad Exponencial Uniforme (EEU)). La ecuacion (t) = A(t) x(t), x x(t0 ) = x0 (5.20)
es uniformemente exponencialmente estable si existen constantes nitas positivas , tales que correspondiente satisface para cualquier t0 y x0 la solucion x ( t ) e (tt0 ) x 0 , t t0 .
Nuevamente, 1, y el adjetivo uniforme se reere a que y son independientes de t0 , como se ilustra en la Figura 5.9.
x0

x0

xt

x t

t0
0 t
Figura 5.9: Estabilidad exponencial uniforme.
5. Estabilidad
Notas de CAUT2 - 87
Teorema 5.11 (EEU para A(t) acotada). Supongamos que existe > 0 tal que A(t) lineal (5.20) es uniformemente exponencialmente estable para todo t. Entonces la ecuacion si existe > 0 tal que si y solo
t
(t, ) d
para todo t, , t .
Demostraci on. Ver Rugh [1995, p.102-103]. el teorema anterior lleva al requerimienEn el caso estacionario, A(t) = A, la condicion to de que todos los autovalores de A tengan parte real negativa para que el sistema tenga EEU. En el caso inestacionario los autovalores de A(t) no determinan las propiedades de estabilidad del sistema, como muestra el siguiente ejemplo. Ejemplo 5.8. Sea el sistema inestacionario (t) = A(t) x(t) = x El polinomio caracter stico de A(t) es det( I A(t)) = det + 1 e2t = ( + 1)2 , 0 +1
1 e2t x(t). 0 1
(5.21)
por lo que A(t) tiene dos autovalores en = 1 para todo t. Puede vericarse que la matriz (t, 0) = satisface la condicion e t 0
1 t (e 2
e t ) e t
(t, t0 ) = A(t)(t, t0 ) t de estados del sistema (5.21). Como la entrada a12 (t) y es por lo tanto la matriz de transicion de A(t) crece en forma ilimitada con t, el sistema no puede ser asintoticamente o Lyapunov estable. A diferencia del caso estacionario, los autovalores de A(t) no son utiles para chequear estabilidad.
5.5.3.
Invariancia frente a transformaciones de equivalencia
En el caso inestacionario las propiedades de estabilidad, determinadas por los autovalores de A, son invariantes frente a transformaciones de equivalencia. En el caso inestacionario sabemos que esta propiedad no se conserva, ya es posible llevar la matriz A(t) a una mediante una transformacion de equivalencia inestacionaria matriz constante arbitraria A P(t). No obstante, para ciertas P(t), es posible hacer que las propiedades de estabilidad sean tambi en invariantes en el caso inestacionario. Denicion 5.9 (Transformacion de Lyapunov). Una matriz n n P(t) que es continuamente diferenciable e invertible en cada t se llama transformaci on de Lyapunov si existen constantes y tales que para todo t P(t) ,
| det P(t)| .
(5.22)
5. Estabilidad
Notas de CAUT2 - 88
equivalente a la (5.22) es la existencia de una constante tal que para Una condicion todo t P(t) , P 1 ( t ) . Teorema 5.12 (Equivalencia y Estabilidad en Sistemas Inestacionarios). Supongamos que de Lyapunov. Entonces la ecuacion lineal (5.20) es uniformeP(t) es una transformacion si la ecuacion de estado mente (exponencialmente) estable si y solo (t)] z(t) ( t ) = [ P 1 ( t ) A ( t ) P ( t ) P 1 ( t ) P z es uniformemente (exponencialmente) estable.
5.6. Resumen
Hemos introducido los primeros conceptos de estabilidad de sistemas estacionarios, comenzando por la estabilidad externa BIBO: entrada-acotada/salida-acotada. si Vimos que un sistema es BIBO estable si y solo su respuesta al impulso es absolutamente integrable (sumable, para sistemas discretos), o (s) (en discreto g ( z)) es racional y propia, todos los transferencia g si su funcion (s) tienen parte real negativa (los polos de g ( z) tienen magnitud menor polos de g que 1). si todos los subsistemas SISO que Los sistemas MIMO son BIBO estables si y solo conectan las diferentes entradas y salidas son BIBO estables. La respuesta en r egimen permanente de un sistema BIBO a una entrada sinusoidal de frecuencia 0 es sinusoidal de la misma frecuencia, y con magnitud y fase dadas transferencia del sistema evaluada en s = j0 por el la magnitud y fase de la funcion ( z = e j0 en sistemas discretos. Denimos estabilidad interna para un sistema con entradas nulas. Denimos estabilidad segun Lyapunov, y estabilidad asint otica. necesaria y suciente para estabilidad segun Lyapunov es que la matriz La condicion = Ax no tenga autovalores con parte real positiva, y para aquellos autovalores A en x mayor con parte real nula, que no est en asociados a un bloque de Jordan de dimension que 1. necesaria y suciente para estabilidad asintotica La condicion es que todos los autovalores de A tengan para real negativa (Hurwitz). Presentamos un m etodo alternativo de chequear si la matriz A es Hurwitz (tiene to de dos sus autovalores con parte real negativa), mediante la existencia de solucion de Lyapunov.. una ecuacion Vimos el teorema de Lyapunov para sistemas discretos, que vincula la existencia de de la ecuacion M AT MA = N con la propiedad de que A tenga todos sus solucion autovalores dentro del c rculo unitario.
5. Estabilidad
Notas de CAUT2 - 89
Vimos las nociones de estabilidad para sistemas lineales inestacionarios, incluyendo estabilidad uniforme y estabilidad exponencial uniforme. Una nota importante es que los autovalores de A(t) en general no determinan la estabilidad en sistemas lineales inestacionarios.
5.7. Ejercicios
si Ejercicio 5.1. Probar que las funciones e pt y te pt son absolutamente integrables si y solo 2 pC . (s) = transferencia g Ejercicio 5.2. Es el sistema con funcion
e2s s+1
BIBO estable?
Ejercicio 5.3. Cu ales son las respuestas en r egimen permanente de un sistema con funcion s2 (s) = s+1 excitado por u1 (t) = 3 y u2 (t) = sen 2t para t 0? transferencia g Ejercicio 5.4. Probar los Teoremas 5.4 y 5.2 para sistemas discretos. Ejercicio 5.5. Analizar la estabilidad de los siguientes sistemas 1 0 1 (t) = 0 0 0 x(t) x 0 0 0 1 0 1 (t) = 0 0 1 x(t) x 0 0 0 0,9 0 1 x[k + 1] = 0 1 0 x[k] 0 0 1 0,9 0 1 x[k+] = 0 1 1 x[k] 0 0 1 Ejercicio 5.6. Probar que todos los autovalores de A tienen parte real menor que < 0 si si para cualquier matriz sim y solo etrica y positiva denida N dada, la ecuacion AT M + MA + 2 M = N unica tiene una solucion sim etrica y positiva denida M. Ejercicio 5.7. Probar que todos los autovalores de A tienen magnitud menor que si y solo si para cualquier matriz sim etrica y positiva denida N dada, la ecuacion 2 M AT MA = 2 N unica tiene una solucion sim etrica y positiva denida M. Ejercicio 5.8. Es el sistema con respuesta al impulso g(t, ) = e2|t|| | para t BIBO estable? Qu e hay de g(t, ) = e(t ) sen t cos ?
2
C = {s C : Re s > 0}.
5. Estabilidad
2
Notas de CAUT2 - 90
(t) = 2tx(t) + u(t), y(t) = et x(t) BIBO estable? Estable en Ejercicio 5.9. Es el sistema x el sentido de Lyapunov? Asintoticamente estable? del problema anterior puede transformarse, usando Ejercicio 5.10. Mostrar que la ecuacion t2 (t) = P(t) x(t) con P(t) = e , en x ( t ) = e t u ( t ) , y ( t ) = x (t). x Es el sistema transformado BIBO estable? Estable en el sentido de Lyapunov? Asintotica de Lyapunov? mente estable? Es P(t) una transformacion
2
Bibliograf a
193
Cap tulo 6 Controlabilidad y Observabilidad

En este cap tulo introducimos los conceptos de controlabilidad y observabilidad. Estos entre el mundo externo (entradas y salidas) y las vaconceptos describen la interaccion riables internas del sistema (estados). La controlabilidad es la propiedad que indica si el comportamiento de un sistema puede ser controlado por medio de sus entradas, mientras que la observabilidad es la propiedad que indica si el comportamiento interno del sistema puede detectarse en sus salidas.
6.1. Controlabilidad
6.1.1. Deniciones y tests fundamentales
= Ax + Bu, x (6.1) Consideremos el sistema de n estados y p entradas
con las matrices constantes A Rnn y B Rn p . Como la controlabilidad relaciona las de salida es irrelevante. entradas y los estados del sistema, la ecuacion de estados (6.1), o el par ( A, B), se dice conDenicion 6.1 (Controlabilidad). La ecuacion trolable si para cualquier estado inicial x(0) = x0 Rn y cualquier estado nal x1 Rn , existe una entrada que transere el estado x de x0 a x1 en tiempo nito. En caso contrario, (6.1), o el par ( A, B), se dice no controlable. la ecuacion La controlabilidad tiene que ver con la posibilidad de llevar al sistema de cualquier estado inicial al cualquier estado nal en tiempo nito, no importando qu e trayectoria se siga, o qu e entrada se use. Ejemplo 6.1 (Sistemas no controlables). Consideremos el sistema el ectrico de la izquierda en el en la Figura 6.1. El sistema es de primer orden con variable de estado x, la tension capacitor. Si la carga inicial del capacitor es nula, x(0) = 0, entonces x(t) = 0 para todo u de entrada aplicada, debido a la simetr t 0 independientemente de la tension a de que describe el sistema es no controlable. Veamos ahora el sistema de la red. La ecuacion la derecha en la misma gura. Este tiene dos variables de estado, las tensiones en los dos capacitores, x1 y x2 . La entrada puede llevar x1 o x2 a cualquier valor, pero no puede llevar x1 y x2 a distintos valores. Por ejemplo, si x1 (0) = x2 (0) entonces x1 (t) = x2 (t) para todo aplicada en u. Tambi que t 0 independientemente de la tension en aqu , la ecuacion describe el sistema es no controlable. 91
6. Controlabilidad y Observabilidad
Notas de CAUT2 - 92
1F x1 x2
1 x

1F
x1
1F
x2
yu 1 1
Figura 6.1: Sistemas el ectricos no controlables
Teorema 6.1 (Tests de Controlabilidad). La siguientes armaciones son equivalentes: 1. El par ( A, B), A Rnn , B Rn p , es controlable. 2. La matriz de controlabilidad,
C = B AB A2 B An1 B ,
es de rango n (rango la pleno). 3. La matriz n n
t
C Rnnp ,
(6.2)
Wc (t) =
e A BBT e A d =
0
e A(t ) BBT e A
T ( t )
(6.3)
es no singular para todo t > 0. Demostraci on. (12) Consideremos dos vectores cualesquiera x0 y x1 Rn y un intervalo nito de tiempo t1 cualquiera. Como el sistema es controlable, sabemos que existe alguna entrada u(t) que transere el estado de x(0) = x0 al estado nal x(t1 ) = x1 en el tiempo t1 . de los par Usando la formula de variacion ametros, tenemos entonces que se satisface la ecuacion x1 = x(t1 ) = e At1 x0 + Llamemos z al vector z
t1 0
e A(t1 ) Bu( )d , x1 e
At1
t1 0
e A(t1 ) Bu( )d = x1 e At1 x0 . (6.4)
x0 .
matricial de una maRecordemos de 3.6.4 la propiedad que dice que toda funcion triz n n se puede expresar como un polinomio matricial de orden n 1; entonces podemos escribir e A(t1 ) como un polinomio en A (con coecientes dependientes de ), e A(t1 ) = e At1 e A
n1
k =0
k ( ) Ak
(6.5)
= 0 ( ) I + 1 ( ) A + + n1 ( ) An1
6. Controlabilidad y Observabilidad Reemplazando (6.5) en (6.4) obtenemos

t1
Notas de CAUT2 - 93
z=
0 t1
e A(t1 ) Bu( )d 0 ( ) I + 1 ( ) A + + n1 ( ) An1 Bu( )d
=
0 t1
B0 ( )u( ) + ABu( )1 ( ) + + An1 Bn1 ( )u( ) d 0 0 ( )u( ) t1 1 ( )u( ) d B AB A2 B . . . An1 B = ... 0 n1 ( )u( ) t1 0 0 ( ) u ( ) d t1 1 ( )u( )d 2 n1 0 = Cr = B AB A B . . . A B ... t1 0 n1 ( ) u ( ) d
(6.6)
donde hemos denido como r el vector de la derecha en la l nea anterior a (6.6), y C es la matriz de controlabilidad de (6.2). As , en otras palabras, la controlabilidad del par lineal algebraica z = C r siempre tiene solucion, para z ( A, B) implica que la ecuacion n si la matriz C es y r en R arbitrarios. Del Teorema 3.1, sigue que esto sucede si y solo de rango la pleno, es decir, n. Hemos mostrado que 1 2. por contradiccion. Supongamos que la matriz C tiene (2 3) Mostramos esta implicacion t > 0 tal que Wc (t) es singular. Por la forma del rango la pleno pero que existe algun integrando en (6.3), la matriz Wc (t) es siempre semidenida positiva, y que sea singu vector no nulo v Rn tal que vT Wc (t)v = 0, lar es equivalente a decir que existe algun es decir, 0 = vT Wc (t)v
t
=
0
vT e A BBT e A vd =
0
vT e A B 2 d
que es equivalente a decir que vT e A B = 0 para todo [0, t]. Escribiendo la exponencial e A en forma polinomial, similar a (6.5), tenemos 0 ( ) I p 1 ( ) I p . 0 = vT e A B = vT B AB . . . An1 B (6.7) ... n1 ( ) I p Como e A B = 0 si B = 0, la unica posibilidad de que se d e (6.7) para todo es que vT C = 0, que implicar a que el rango la de C es menor que n, lo cual es una y prueba que 2 3. contradiccion, (3 1) Sean x0 y x1 dos vectores cualesquiera de Rn , y t1 > 0 arbitrario. Si Wc (t) es no singular para cualquier t > 0, entonces podemos construirnos la entrada u(t) = BT e A
T (t 1 t)
Wc1 (t1 )(e At1 x0 x1 ).
(6.8)
Notas de CAUT2 - 94
Veamos que esta entrada transere el estado del sistema de x0 a x1 en el tiempo t1 . de los par Efectivamente, reemplazando u(t) de (6.8) en la formula de variacion ametros para x(t1 ) tenemos x(t1 ) = e At1 x0
t1 0
e A(t1 ) BBT e A
T ( t )
Wc1 (t1 ) e At1 x0 x1
= e At1 x0 Wc (t1 )Wc1 (t1 ) e At1 x0 x1 = x1 .

Como x0 , x1 , y t1 > 0 son arbitrarios, hemos mostrado que el sistema es controlable.
de un p Ejemplo 6.2. En el Ejemplo 2.4 vimos la linealizacion endulo invertido. La ecuacion de estados lineal de un p endulo dado es 0 1 0 1 0 0 0 1 0 1 = x 0 0 0 1 x + 0 u (6.9) 0 0 5 0 2 y = 1 0 0 0 x. Calculamos la matriz de controlabilidad 0 1 0 0 1 0 2 0 . C = B AB A2 B A3 B = 0 2 0 10 2 0 10 0 Puede mostrarse que esta matriz tiene rango 4; por lo que el sistema es controlable. Por lo ngulo x3 = se desviara ligeramente de cero, existe un control u que lo retorna tanto, si el a a cero en tiempo nito. De hecho, la controlabilidad nos garantiza que existe un control u del carro, x1 = y, el a ngulo x3 = , y sus derivadas a cero. Este capaz de llevar la posicion sobre la palma de una hecho es consistente con la experiencia de balancear un escobillon mano. Cabe notar que si bien esto es estrictamente cierto, en la pr actica el control necesario puede ser imposible de implementar; por ejemplo si se exceden los l mites admisibles de corriente del motor que mueve el carro.
6.1.2.
Control de m nima energ a y gramiano de controlabilidad
La ley de control u(t) de (6.8) tiene una propiedad interesante: es el control que gasta m nima energ a en llevar al sistema del estado x0 al estado x1 en el tiempo t1 , en el sentido (t) que haga la misma transferencia siempre se cumple que de que para otro control u
t1 0
( ) 2 d u
t1 0
u( ) 2 d
T (t 1)
T A = ( x0 e
T x1 )Wc1 (t1 )
t1 0
e A(t1 ) BBT e A
T (t
1 )
Wc1 (t1 )(e A(t1 )x0 x1 )
T A T (t1 ) ( x0 e
1 2
T x1 )Wc1 (t1 )(e A(t1 ) x0
x1 )
(6.10)
= Wc (t1 )(e A(t1 ) x0 x1 ) 2 .
Notas de CAUT2 - 95
Vemos de (6.10) que la m nima energ a de control es mayor cuanto mayor sea la distancia entre x0 y x1 , y cuanto menor el tiempo de transferencia t1 (ya que Wc (t1 ) es m as cercano a ser singular). Si la matriz A es Hurwitz, la integral Wc (t) (6.3) converge para t = . En ese caso notamos simplemente Wc (t) = Wc , y se llama gramiano de controlabilidad. Si el par ( A, B) es controlable, entonces por el Teorema 6.1.2 la matriz de controlabilidad (transpuesta) BT BT A CT = ... B T A n1 si la matriz A es Hurwitz, es de rango n. Vimos en el Teorema 5.8 en 5.4 que esta condicion, y positiva denida, de la ecuacion garantiza que Wc es la unica solucion, AWc + Wc AT = BBT . (6.11)
Las funciones M ATLAB Cc=ctrb(A,B) y W=gram(A,B) calculan respectivamente la matriz de controlabilidad C y el gramiano de controlabilidad Wc . Para saber si un sistema es controlable podemos chequear el rango de C o Wc . Para calcular el control de m nima energ a (6.8) necesitamos la matriz Wc (t1 ), que podemos calcular usando el Teorema 4.1 (ver) implementando A BB T t 0n T Wc (t) = In 0n e 0n A , T eA t En M ATLAB: O=zeros(n,n); I=eye(n); Wt=[I,O]*expm([A,B*B{T};O,-A{T}]*t)*[O;expm(A{T}*t)]; Ejemplo 6.3. La Figura 6.2 ilustra una plataforma de las usadas para estudiar sistemas para automoviles. de suspension El sistema consiste de una plataforma cuyos extremos la sustentan al piso mediante sistemas independientes de resortes y amortiguadores de viscosa. Asumiendo la masa de la plataforma cero, cada sistema de amortiguacion friccion en los extremos recibe la mitad de la fuerza aplicada a la plataforma. Las constantes de los viscosa 2 y 1 respectivamente. Tomando resortes se asumen 1 y los coecientes de friccion de equilibrio de los extremos de la plataforma como los desplazamientos de la posicion de estados describe este sistema variables de estado, tenemos que la siguiente ecuacion = x
0,5 0 0,5 x+ u. 0 1 1
Si los desplazamientos iniciales son distintos de cero, y si no hay fuerza aplicada, la pla de equilibrio exponencialmente (los autovalores de la taforma va a volver a su posicion matriz A del sistema son 0,5 y 1, por lo que el sistema es asintoticamente estable). En de equilibrio. Nos planteor a el sistema tomar a un tiempo innito en alcanzar su posicion teamos el siguiente problema: si x( 0) = 10 y x2 (0) = 1, podemos aplicar una fuerza que de equilibrio en 2 segundos? La respuesta no parece obvia lleve la plataforma a su posicion pues la misma fuerza se aplica a los dos sistemas de amortiguacion.
2u
Notas de CAUT2 - 96
x1
x2
Figura 6.2: Sistema plataforma
Calculamos el rango de la matriz de controlabilidad rango B AB = rango 0,5 0,25 = 2. 1 1
Vemos que el sistema es controlable y, para cualquier x(0), existe una entrada que transera de equilibrio en 2 segundos. Calculamos la matriz al sistema de x(0) a su posicion
2
Wc (2) =
e0,5 0 0 e
0,5 1
0,5 1
e0,5 0 0 e
=
As la fuerza
0,2162 0,3167 . 0,3167 0,4908 e 1 0 e0,5(2t) 0 1 (2t) Wc ( 2 ) 0 e 2 0 e 10 1
u2 (t) = 0,5 1
= 58,82e0,5t + 27,96et
para t [0, 2] lleva al estado del sistema de x(0) = [10, 1]T a [0, 0]T en 2 segundos, como se ve en la Figura 6.3. Si recalculamos la fuerza necesaria para transferir el estado de x0 al equilibrio pero ahora en 4 segundos, obtenemos Wc (4) = 0,2454 0,3325 0,3325 0,4998 (6.12)
u4 (t) = 3,81e0,5t + 0,69et
Notar que el control que hace la misma tranferencia pero en un tiempo mayor es signi (usa menos energ cativamente m as pequeno a). Cu al ser a la fuerza necesaria si t ? Ejemplo 6.4. Consideramos de nuevo el sistema plataforma de la Figura 6.2, pero esta vez viscosa son todos asumiendo que las constantes de los resortes y los coecientes de friccion de estados del sistema deviene iguales a 1. La ecuacion = x Esta vez tenemos que rango C = rango 1 1 =1 1 1
1 0 1 + u. 0 1 1
y el sistema no es controlable. Si x1 (0) = x2 (0) no existe entrada que pueda transferir el sistema a cero en tiempo nito.
140 40
Notas de CAUT2 - 97
120 30 100
80
20
60 10 40
20
0 10 20
40
0.5
1.5
2.5
20
0.5
1.5
2.5
y Variacion de los Estados Figura 6.3: Actuacion
6.1.3.
Tests PBH de controlabilidad
Los tests de Popov-Belevitch-Hautus (PBH) no son tan comunes como los presentados en el Teorema 6.1, pero tienen interpretaciones geom etricas interesantes y nos van a servir para analizar controlabilidad en forma de Jordan. Hay dos tipos de tests PBH, de autovectores, y de rango. si existe un Lema 6.1 (Test PBH de autovectores). El par ( A, B) es no controlable si y solo autovector izquierdo v R1n de A, tal que vB = 0. Demostraci on.
() Supongamos que existe un autovector izquierdo v de A,

vA = v, (6.13)
tal que vB = 0. Multiplicando por derecha ambos lados de (6.13) por B obtenemos vAB = vB = 0. Multiplicando por derecha ambos lados de (6.13) por AB obtenemos vA2 B = vAB = 2 vB = 0. As , multiplicando (6.13) por A2 B, A3 B, . . . , seguimos la secuencia hasta mostrar que vC = v B AB An1 B = 0, que implica que el rango la de la matriz de controlabilidad es menor que n, rango C < n. Por el Teorema 6.1, el par ( A, B) es no controlable.
() Ejercicio.
Notas de CAUT2 - 98
si Lema 6.2 (Test PBH de rango). El par ( A, B) es controlable si y solo rango sI A B = n Demostraci on. vector no nulo v tal que () Si rango[sI A B] = n para todo s, no puede existir ningun v[sI A B] = [v(sI A) vB] = 0. Por lo tanto, no puede haber ningun vector que cumpla simult aneamente vs = vA y vB = 0. Por el test PBH de autovectores, el sistema es controlable. para todo s.
() Ejercicio.
6.1.4.
Controlabilidad y transformaciones de semejanza
Teorema 6.2 (Invariancia de la controlabilidad respecto a cambio de coordenadas). La controlabilidad es una propiedad invariante con respecto a transformaciones de equivalencia (cambios de coordenadas). Demostraci on. Consideremos el par ( A, B) con matriz de controlabilidad
C = B AB An1 B
, B = PAP1 y B ), donde A = PB, y P es una matriz no singular. La y su par equivalente ( A matriz de controlabilidad del par ( A, B) es = C = = = B n1 B A A B PB PAP1 PB PAn1 P1 PB P B AB An1 B PC .
. Como P es no singular, tenemos que rango C = rango C
6.2. Observabilidad
6.2.1. Deniciones y tests fundamentales
El concepto de observabilidad es dual al de controlabilidad, e investiga la posibilidad de estimar el estado del sistema a partir del conocimiento de la salida. Consideramos el sistema lineal estacionario = Ax + Bu x y = Cx + Du A Rn n , B Rn p , C Rq n , D Rq p . (6.14)
de estado (6.14) es observable si para cualDenicion 6.2 (Observabilidad). La ecuacion quier estado inicial x(0) (desconocido), existe un tiempo nito t1 tal que el conocimiento de la entrada u y la salida y sobre el intervalo [0, t1 ] es suciente para determinar en forma unica el estado inicial x(0). En caso contrario el sistema no observable.
Notas de CAUT2 - 99
Ejemplo 6.5 (Sistemas no observables). En el circuito de la izquierda en la Figura 6.4, si en el capacitor, la entrada es nula, la salida es id enticamente nula para cualquier tension debido a la simetr a de las resistencias. Sabemos que la entrada y la salida son ambas nulas, inicial en el capacitor (el estado) puede no serlo y no podemos determinarla. pero la tension Este sistema es no observable.
1 2
1 1H x x2
1H x x1
1 1F 2 u y
x1
u 1 1
1F
1 x2 y
Figura 6.4: Sistemas el ectricos no observables
El circuito de la derecha en la Figura 6.4 tiene dos variables de estado, la corriente por en el capacitor x2 . La entrada u es una fuente de corriente. Si la inductancia, x1 , y la tension inicial en el capacitor es nula, x2 (0) = 0, la salida es nula independienu = 0 y la tension temente de la corriente en la inductancia, que no necesariamente es nula. El estado inicial x1 (0) no puede ser determinado del conocimiento de u e y, y el sistema es no observable. Dado un estado inicial x(0) y una entrada u(t), la salida del sistema est a dada por la formula y(t) = Ce At x(0) + C
0 t
e A(t ) Bu( )d + Du(t).
(6.15)
Para estudiar observabilidad, la salida del sistema y(t) y la entrada u(t) se suponen cono cidas, siendo el estado inicial x(0) la unica incognita. As , de (6.15) podemos escribir (t) Ce At x(0) = y
t
y(t) C
e A(t ) Bu( )d + Du(t),
(6.16)
(t) es una funcion conocida. donde la variable y para un tiempo jo Como ( t )? Observacion resolvemos (6.16) para obtener x(0) de y At (t) un vector q 1 Para un tiempo t jo, Ce es una matrix q n real y constante, e y At (t) est y constante. Por su denicion, a siempre en la imagen de Ce , por lo que siempre x(0). La cuestion es si existe una solucion unica. existe una solucion En general, dado que hay menos variables medibles que el numero de estados del sistema, tenemos que q < n. En este caso la matriz Ce At tiene rango a lo sumo q, y por lo tanto los resultados de 3.3, si q < n la tiene un espacio nulo no trivial. En consecuencia, segun no es unica, solucion y no podemos hallar un unico valor x(0) de (6.16) para un t jo dado. Para poder determinar x(0) en forma unica de (6.16) es necesario utilizar el conocimiento de y(t) y u(t) sobre un intervalo de tiempo de longitud no nula, como mostramos en el siguiente teorema.
Notas de CAUT2 - 100
de estados (6.14) es observable si y Teorema 6.3 (Test Wo de observabilidad). La ecuacion nn si la matriz Wo (t) R solo
t
Wo (t) = es no singular para todo t > 0.
e A C T Ce A d
(6.17)
Demostraci on. Multiplicamos por izquierda ambos lados de (6.16) por e A t C T y luego integramos sobre [0, t1 ], lo que da
t1 0
e A t C T Ce At dt x(0) =
0
t1
(t)dt. e A t CT y
Si Wo (t1 ) es no singular, entonces

1 x(0) = Wo (t1 )
t1 0
(t)dt, e A t CT y
(6.18)
x(0). As que da una unica solucion hemos mostrado que si Wo (t) es no singular entonces el sistema es observable. Wo (t1 ) es Para mostrar la reversa supongamos que Wo (t1 ) es singular. Por su denicion, semi-denida positiva, o sea que existe un vector constante v Rn1 tal que vT Wo (t1 )v =
t1 0 t1
vT e A t C T Ce At vdt Ce At v 2 dt = 0.
=
0
Pero, por la propiedad de la norma, esto implica que Ce At v 0, para todo t [0, t1 ]. (6.19)
Si u(t) 0 entonces, en particular, las condiciones iniciales x(0) = v = 0 y x(0) = 0 dan ambas la misma salida y(t) = Ce At x(0) 0 y por lo tanto no pueden diferenciarse. Esto muestra que si Wo (t) es singular el sistema es inobservable, completando la prueba del teorema. de la matriz Wo (t) vemos que la observabilidad solo depende de las De la denicion matrices A y C. As , la observabilidad es una propiedad del par ( A, C ), e independiente de las matrices B y D. Teorema 6.4 (Dualidad entre controlabilidad y observabilidad). El par ( A, C ) es observa si el par ( AT , C T ) es controlable. ble si y solo Demostraci on. Ejercicio; es inmediata de las deniciones de Wc (t) y Wo (t). de tests de observabilidad El teorema de dualidad hace inmediata la demostracion an alogos a los de controlabilidad del Teorema 6.1. Teorema 6.5 (Tests de Observabilidad). La siguientes armaciones son equivalentes: 1. El par ( A, C ), A Rnn , C Rqn , es observable.
6. Controlabilidad y Observabilidad 2. La matriz de observabilidad, C CA 2 CA O= , CAn1 es de rango n (rango columna pleno). 3. La matriz n n
t
O Rnqn ,
(6.20)
Wo (t) =
e A C T Ce A d =
0
eA
T ( t )
C T Ce A(t ) d
(6.21)
es no singular para todo t > 0. a traves de diferenciacion Observacion Una forma alternativa de resolver (6.16) es a (t) en t = 0 (que equivale a la diferenciacion repetida de y repetitrav es de la diferenciacion (0) = Cx(0), y (0) = CAx(0), . . . , y (n1) ( 0 ) = da de la entrada y la salida). Es f acil vericar que y n1 CA x(0), por lo que podemos escribir (0) y C CA (0) x(0) = y ( 0 ). (6.22) , es decir, O x(0) = y CAn1 (n1) ( 0 ) y (0) est Por construcci on, y a en la imagen de O , y si el sistema es observable, el rango co unica lumna de O es pleno, rango O = n. Entonces, por el Teorema 3.2, existe una solucion del sistema de ecuaciones (6.22), dada por (0). x ( 0 ) = [ O T O ]1 O T y (6.23)
(t) en un entorno de t = 0 para seguimos necesitando conocimiento de y Notar que aun (0), . . . , y ( n 1 ) ( 0 ). poder determinar y mediante este m en Si bien es factible implementar observacion etodo de diferenciacion, de y(t) va a incluir casi siempre ruido la pr actica no es recomendable, ya que la medicion (t) amplica el ruido, aumentando los errores de y de alta frecuencia. La diferenciacion en el c alculo de x(0). tiene el efecto de ltrar ruido de alta frecuencia, es Por otro lado, como la integracion mucho mejor implementar el c alculo de x(0) a trav es de la formula (6.18).
6.2.2.
Gramiano de observabilidad
Si la matriz A es Hurwitz, la integral Wo (t) de (6.17) converge para t = . En ese caso notamos simplemente Wo (t) = Wo , y se llama gramiano de observabilidad. Si el par ( A, C ) es observable, entonces la matriz de observabilidad C CA O= ... CAn1
si la matriz A es Hurwitz, es de rango n. Vimos en el Teorema 5.8 en 5.4 que esta condicion, y positiva denida, de la ecuacion garantiza que Wo es la unica solucion, Wo A + AT Wo = C T C . (6.24)
Las funciones M ATLAB Ob=obsv(A,C) y Wo=gram(A,C) calculan respectivamente la matriz de observabilidad O y el gramiano de observabilidad Wo . Chequeando el rango de O o Wo determinamos si un sistema es observable.
6.2.3.
Tests PBH de observabilidad
La dualidad nos permite tambi en extender los tests PBH al caso de observabilidad. si existe un Lema 6.3 (Test PBH de autovectores). El par ( A, C ) es no observable si y solo n1 autovector derecho v R de A, tal que Cv = 0. si Lema 6.4 (Test PBH de rango). El par ( A, C ) es observable si y solo rango sI A =n C para todo s.
6.2.4.
Observabilidad y transformaciones de semejanza
Teorema 6.6 (Invariancia de la observabilidad respecto a cambio de coordenadas). La observabilidad es una propiedad invariante con respecto a transformaciones de equivalencia (cambios de coordenadas). Ejemplo 6.6 (Controlabilidad y observabilidad de un circuito RLC Bay [1999]). Analizamos controlabilidad y observabilidad del circuito RLC de la Figura 6.5. Las ecuaciones de en el capacitor vc y la corriente en la inductancia i L como variables estado usando la tension de alimentacion vs como entrada, y la tension sobre la inductancia v x de estado, la tension como salida, son
2 RC C v = 1 iL L 1 C
vC + iL vC + vs . iL
1 RC 1 L
vs (6.25)
v x = 1 0
El sistema es de segundo orden, n = 2, con una entrada y una salida, p = 1 = q. Construimos la matriz de controlabilidad C ,
C = B AB =
1 RC 1 L
R22C2 + 1 RLC
1 LC
El rango de C puede chequearse mediante el determinante, det C = det

1 RC 1 L
R22C2 + 1 RLC
1 LC
= =
1 R2 LC 2 1
2 R2 LC 2
1 L2 C
R2 LC 2
1 L2 C
R C
iL

vs
vc
vx
Figura 6.5: Circuito RLC
para que este determinante sea cero es La condicion Por otro lado, la matriz de observabilidad O es
1 R2 LC 2
1 L2 C
= 0, que da R =
L/C.
C=
1 0 C = 2 , 1 CA C RC
el sistema es siempre observable, pero que es siempre de rango completo. En conclusion, puede llegar a ser no controlable si R = L/C. Veamos como aparece la posibilidad de p erdida de controlabilidad desde el punto de transferencia. La calculamos de (6.25) con la formula vista externo; analizamos la funcion conocida, (s) = C (sI A)1 B + D G
1
= 1 0
s+
1 L
2 RC
1 C s
1 RC 1 L
+1
s
1 C 2 RC 1 RC 1 L
1 1 0 = s(s + 2/ RC ) + 1/ LC 1 = 2 2 s + RC s +
1 LC 1 1 RC s + LC 2 1 s2 + RC s + LC 1 s s + RC 2 1 s2 + RC s + LC
1 L s+
+1
s +1
1 C
1 RC 1 L
+1
= =
Calculamos la ra ces del polinomio denominador (el polinomio caracter stico de la matriz A) resolviendo la forma cuadr atica, obteniendo 1 1 1 2 2 RC R C LC Vemos que ambas ra ces tienen parte real negativa, por lo que podemos concluir que el sistema ser a asintoticamente (y por ende, BIBO) estable para todo valor de R, L y C. En particular, si R = L/C (valor de R para el cual el sistema deviene no controlable) tenemos s1,2 = s1,2 = 1 RC 1 1 1 = LC LC RC
transferencia queda es decir, dos ra ces iguales. Para este valor de R la funcion (s) = G s s+ s+
1 RC 1 2 RC
s , 1 s + RC
que es ahora un sistema de primer orden. Lo que sucede para este particular valor de R es que los elementos almacenadores de energ a combinan sus efectos de tal manera que el sistema se comporta, desde el punto de vista externo, como un sistema de primer orden. La p erdida de un par polo-cero en la funcion transferencia para de controlabilidad y la cancelacion siguiente, este particular valor de R no es una coincidencia; como veremos en la seccion transferencia si el sistema es no necesariamente debe haber cancelaciones en la funcion controlable o no observable.
6.3.
Descomposiciones Canonicas
presentamos formas canonicas En esta seccion de las ecuaciones de estado que descomponen al sistema en sus partes controlables y no controlables y observables y no obser entre controlabilidad y obvables. Estas descomposiciones permiten establecer la relacion transferencia, generalizando las observaciones que hici servabilidad y funcion eramos en el en espacio Ejemplo 6.6. Estas descomposiciones muestran tambi en cu ando una realizacion de estados es m nima. Consideramos el sistema lineal y estacionario en ecuaciones de estado = Ax + Bu x y = Cx + Du donde A Rn n , B Rn p , C R p n , D Rq p . (6.26)
= Px, donde P es una matriz no singular, P Rnn . Entonces la ecuacion de estados Sea x x =A + Bu x x + Du y=C donde = PAP1 , B = PB, A = CP1 , D = D, C (6.27)
es equivalente a (6.26). Todas las propiedades de (6.26), incluyendo estabilidad, controlabilidad, y observabilidad, se preservan en (6.27). Adem as, como es f acil comprobar, tenemos que = PC , = O P 1 . C O El siguiente resultado muestra que si el sistema (6.26) no es completamente controlable, transferencia (es decir, es posible denir un sistema de orden reducido con igual funcion equivalente a estado cero) y controlable. Teorema 6.7 (Descomposicion controlable/no-controlable). Sea el sistema (6.26) con matriz de controlabilidad C tal que rango C = rango B AB An1 B = n1 < n. Sea la matriz n n de cambio de coordenadas P 1 = q 1 q 2 . . . q n1 . . . q n
donde las primeras n1 columnas son n1 columnas linealmente independientes de la matriz C , y las restantes columnas se eligen arbitrariamente de forma que P sea no singular. = Px o x = P1 x lleva (6.26) a la forma de equivalencia x Entonces la transformacion C A 12 C x A = C C x 0 A C C C y= C C x B + C u C x 0 C x + Du, C x
(6.28)
C R(nn1 )(nn1 ) y la ecuacion C Rn 1 n 1 y A de estados de orden n1 donde A Cx C u C = A C + B x C x =C C + Du y transferencia que (6.26). es controlable y tiene la misma funcion es la representacion de Aqi en la base Demostraci on. Por lo visto en 3.4, la columna i de A {q1 , . . . , qn1 , . . . , qn }. Pero los vectores Aqi , para i = 1, 2, . . . , n1 son linealmente dependientes del conjunto {q1 , . . . , qn1 }, y linealmente independientes del conjunto {qn1 +1 , . . . , qn }. tiene la forma mostrada en (6.28). As la matriz A son la representacion de las columnas de B con respecto a {q1 , . . . , qn }. Las columnas de B tiene la Ahora, las columnas de B dependen solamente del conjunto {q1 , . . . , qn1 }, as que B forma dada en (6.28). es la matriz de controlabilidad de (6.28), entonces rango C = rango C = n1 . Es f Si C acil vericar que = BC AC BC C 0 0 A n1 B C C C = C 0 0 n1 B n1 A C C AC BC 0 0 n1 B C A C , 0 (6.29)
C = [ B C, B C ). Puesto que las CB n1 1 B C A C A C ] es la matriz de controlabilidad de ( A donde C C k B columnas de A C C para k n1 son linealmente dependientes de las columnas de CC , la rango C = n1 implica rango CC = n1 . As (6.29) es controlable. condicion , la ecuacion Finalmente, mostramos que (6.29) tiene la misma matriz transferencia que (6.26), que es la misma que la de (6.28), pues (6.26) y (6.28) son algebraicamente equivalentes. No es dif cil vericar que C A 12 sI A C 0 s( A
1
C )1 (sI A M C )1 0 (s( A
C )1 A 12 (sI A C )1 . As donde M = (sI A , la matriz tranferencia de (6.28) es C CC C C A 12 sI A C 0 s( A

1
C B +D 0 C )1 (sI A M C )1 0 (s( A C (sI A C )1 B C + D, =C C CC = C C B +D 0
que no es otra que la matriz traferencia de (6.29), completando la demostracion.
= Px, el espacio de estados se descompone en de equivalencia x En la transformacion dos subespacios fundamentales: de la forma el subespacio controlable, generado por todos los vectores en x
C x 0
,y
0 C x
de la forma el subespacio no controlable, generado por todos los vectores en x
C desde cualquier Dado que (6.29) es controlable, la entrada u puede transferir el estado x C , porestado inicial a cualquier otro estado. Sin embargo, la entrada no puede controlar a x C nio directamente, ni indeirectamente a trav que, como se ve de (6.28), u no afecta a x es del C . Eliminando los estado no controlables obtenemos una ecuacion controlable de estado x menor (n1 ) que es equivalente a estado cero a las ecuaciones de estado originadimension les. del sistema en su partes controlables y no controlables puede hacerLa descomposicion ctrbf(A,B,C). se en M ATLAB con la funcion Ejemplo 6.7 (Descomposicion de un sistema no controlable). Consideremos el sistema de tercer orden 1 1 0 0 1 = 0 1 0 x + 1 0 u x (6.30) 0 1 1 0 1 y= 1 1 1 x Calculamos el rango de la matriz de controlabilidad del sistema, 0 1 1 1 2 1 rango C = rango B AB A2 B = rango 1 0 1 0 1 0 = 2 < 3, 0 1 1 1 2 1 por lo que (6.30) no es controlable. Elegimos como matriz de cambio de coordenadas las primeras dos columnas de C , y la restante la elegimos linealmente independiente a estas dos, 0 1 1 P 1 = Q 1 0 0 . 0 1 0 = Px obtenemos el sistema equivalente Haciendo x 1 0 0 1 0 1 1 0 1 0 = x u x+ . . . . . . . . . . . . . . . . . . . . 0 0 . 1 0 0 . . y= 1 2 . 1 x y el sistema reducido controlable = 1 0 x+ 1 0 u x 1 1 0 1 y= 1 2 x . . . . . .
(6.31)
El sistema reducido (6.31) tiene la misma matriz transferencia que (6.30), (s) = G s2 s+1 2s + 1 2 . s1
del sistema en sus partes obserEn forma dual obtenemos la siguiente descomposicion vables y no-observables. Teorema 6.8 (Descomposicion observable/no-observable). Sea el sistema (6.26) con matriz de observabilidad O tal que C CA rango O = rango . = n2 < n. . . CAn1 Sea la matriz n n de cambio de coordenadas P 1 p1 p2 . . . = p n2 . . . pn
donde las primeras n2 las son n2 las linealmente independientes de la matriz O , y las restantes las se eligen arbitrariamente de forma que P sea no singular. Entonces la trans = Px o x = P1 x lleva (6.26) a la forma de equivalencia x formacion O 0 O A x = O 21 A O x A O 0 y= C O x B + O u C x 0
O x + Du, O x
(6.32)
O Rn 2 n 2 y A O R(nn2 )(nn2 ) y la ecuacion de estados de orden n2 donde A Ox Ou O = A O + B x O x O + Du =C y transferencia que (6.26). es observable y tiene la misma funcion = Px el espacio de estados de orden n se divide en dos subespa x En la transformacion cios. El subespacio observable, de orden n2 , consiste de todos los vectores de la forma O x ; 0 el otro subespacio, de orden n n2 , es el subsepacio inobservable, que consiste de todos los vectores de la forma 0 . O x O puede detectarse desde la salida, pero no as O El estado x el x , como puede verse en (6.32). Eliminando los estados inobservables obtenemos el sistema (6.33) de orden n2 , que transferencia). es equivalente a estado cero al original (tiene la misma funcion (6.33)
en variable de estados (6.26) Teorema 6.9 (Descomposicion de Kalman). Toda ecuacion de equivalencia, a la forma canonica puede llevarse, mediante una transformacion 13 CO CO ACO 0 A 0 CO x x B A 23 A 24 x x A C O = 21 AC O C O + BC O CO x 0 0 u CO CO 0 A 0 x (6.34) CO x x 0 0 0 A43 ACO CO CO 0 C CO + Du, y= C 0 x donde CO x C O x C O x CO x : : : : estados controlables y observables estados controlables pero no observables estados no controlables pero observables estados no controlables ni observables.
de estados (6.26) es equivalente a estado cero a la ecuacion controlable Adem as, la ecuacion y observable CO x CO u CO = A CO + B x CO x CO + Du =C y y tiene la matriz transferencia (s) = C CO (sI A CO )1 B CO + D . G (6.35)
de Kalman Figura 6.6: Descomposicion
Este teorema puede ilustrarse gr acamente como se muestra en la Figura 6.6. La ecua (6.26) se descompone primero usando el Teorema 6.7 en sus partes controlables y no cion obtenida usando el Teorema 6.8 en controlables. Luego descomponemos cada subecuacion sus partes observables y no observables.
la parte controlable y observable del sistema est Vemos en la Figura 6.6 que solo a conec tada tanto a las entradas como a las salidas. Esta es la unica parte del sistema que determi de por qu en matriz na la matriz transferencia, lo que muestra la razon e la representacion en espacio de tranferencia (externa) no es necesariamente equivalente a la representacion CO estados (interna). Los autovalores de las submatrices A , A , A no aparecer an como O CO C polos de la matriz transferencia. de la matriz transferencia del sistema, es El sistema (6.35), tomado como realizacion de orden menor con una realizaci on m nima, puesto que no puede obtenerse otra realizacion m la misma matriz tranferencia. Toda realizacion nima es controlable y observable y del minreal. mismo orden. En M ATLAB puede calcularse con la funcion Ejemplo 6.8. Tomemos el circuito de la Figura 6.7. El circuito tiene cuatro almacenadores en ecuaciones de estados de orden de energ a, por lo que podemos esperar una realizacion 4. Analicemos primero el sistema desde el punto de vista f sico. Dado que la entrada es una fuente de corriente, respuestas debidas a condiciones iniciales en L1 o C1 no aparecer an a la salida, por lo que las variables de estado asociadas x1 y x2 ser an no observables (no de la entrada y la podemos determinar sus condiciones iniciales a partir de observacion salida). De la forma similar, la variable de estado asociada a L2 ser a no controlable. Debido
x2
L1
C1
+
2
-
x1
1 C2
L2 2 1
1
+
x4 y
x3 1
Figura 6.7: Circuito no controlable ni observable
a la simetr a de los resistores de 1 en el puente, la variable de estado asociada al capacitor de salida se reduce a y = C2 no ser a ni controlable ni observable. Como vemos, la tension (s) = transferencia del sistema es entonces una ganancia est 2(u/2) = u. La funcion atica g 1. Veamos ahora al circuito analizando sus ecuaciones de estado. Asignando las variables el circuito puede describirse por de estado como se indico, 0 0,5 0 0 0,5 1 0 0 0 0 x+ u = x 0 0 0 0,5 0 0 0 0 1 0 y = 0 0 0 1 x+u ya se encuentra en la forma canonica Puesto que la ecuacion (6.28), el sistema puede redu-
6. Controlabilidad y Observabilidad controlable cirse a la realizacion C = x 0 0,5 0,5 xC + u 1 0 0
y = 0 0 xC + u. puede reducirse a La salida es independiente de xC ; as la ecuacion y = u, que coincide con lo que ya hab amos visto en el an alisis f sico del circuito.
6.4. Condiciones en Ecuaciones en Forma Modal

La controlabilidad y la observabilidad son invariantes respecto a transformaciones de equivalencia. En particular, si transformamos el sistema a su forma can onica modal, es decir, est aquella en la que la matriz A a en su forma de Jordan, las condiciones para chequear controlabilidad y observabilidad se vuelven bastante simples. Consideremos las ecuaciones de estado = Jx + Bu x y = Cx, (6.36)
del resultado, donde la matriz J est a en forma de Jordan. Para simplicar la formulacion dos autovalores distintos, 1 y 2 , y que puede escribirse en supongamos que J tiene solo la forma J11 0 0 0 J12 0 0 J1 0 , 0 0 J13 J= = (6.37) 0 J2 J21 0 0 0 J22 donde las matrices J11 , J12 y J13 son tres bloques de Jordan asociados al autovalor 1 , y las matrices J21 y J22 son dos bloques de Jordan asociados al autovalor 2 . Notacion: Denotamos la la de B correspondiente a la ultima la de Ji j como bui j , y la columna de C correspondiente a la primera columna de Ji j como c pi j . Teorema 6.10 (Descomposicion en forma modal). de estados (6.36) es controlable si y solo si los tres vectores la {bu11 , bu12 , bu13 } 1. La ecuacion son linealmente independientes y los dos vectores la {bu21 , bu22 } son linealmente independientes. de estados (6.36) es observable si y solo si los tres vectores columna 2. La ecuacion {cu11 , c p12 , c p13 } son linealmente independientes y los dos vectores columna {c p21 , c p22 } son linealmente independientes.
Antes de probar el Teorema 6.10, discutimos sus implicaciones y lo ilustramos con un ejemplo. de estados est Si una ecuacion a en forma canonica modal, entonces la controlabilidad de las variables de estado asociadas a un mismo autovalor pueden chequearse por separado de las dem as variables de estado, asociadas a otros autovalores. La controlabilidad de variables de estado asociadas a un mismo autovalor dependen solamente de las las de la matriz B correspondientes a las ultimas las de los bloques de Jordan asociados a ese autovalor. Todas las dem as las de B son irrelevantes a la controlabilidad de esos modos. se aplica a la observabilidad de los estados asociados De forma similar, esta observacion a un mismo autovalor, con la salvedad de que son las columnas de C correspondientes a las primeras columnas de los bloques de Jordan asociados al autovalor. Ilustramos con un ejemplo. Ejemplo 6.9 (Descomposicion en forma modal). 1 1 0 0 0 0 0 1 0 0 0 0 0 0 [1 ] 0 0 0 = 0 0 0 [ ] x 1 0 0 0 0 0 0 2 1 0 0 0 2 0 0 0 0 0 0 0 0 1 1 2 0 0 2 y = 1 0 1 2 0 1 1 0 2 3 0 2 Sea el sistema en forma canonica modal 0 0 0 0 0 1 0 0 0 1 0 0 0 x + 1 1 1 u 1 2 3 0 (6.38) 0 1 0 1 2 1 1 1 1 1 x. 0
La matriz J tiene dos autovalores distintos, 1 y 2. El autovalor 1 tiene tres bloques de Jordan asociados, de ordenes 2, 1, 1. Las las de B correspondientes a las ultimas las de estos bloques son 1 0 0 , 0 1 0 , 1 1 1 . Las tres las son linealmente independientes. un bloque de Jordan, de orden 3. La la de B correspondiente Asociado con 2 hay solo a la ultima la del bloque es 1 1 1 , que es no nulo, y por lo tanto linealmente independiente (la unica forma que un conjunto de un solo vector sea linealmente dependiente es que sea nulo). Por el Teorema 6.10 concluimos que el sistema es controlable. Las condiciones de observabilidad para (6.38) son que las tres columnas 1 2 0 1 , 1 , 2 1 2 3 sean linealmente independientes, que lo son, y que la columna 0 0 0 sea linealmente independiente, que no lo es. Concluimos que el sistema (en particular el ultimo modo 2 ) no es observable.
del Teorema 6.10 sobre el sistema (6.38) del Vamos a dar una idea de la demostracion veamos qu ejemplo anterior. Antes de ir a la demostracion, e forma tiene el diagrama de bloques del sistema (6.38). Por la simplicidad de los bloques de Jordan, la inversa (sI J ) en (6.38) puede escribirse directamente (la antitransformada Laplace de e Jt ) como 1 1 0 0 0 0 0 2 s (s1 ) 01 1 0 0 0 0 0 s1 1 0 0 0 0 0 0 s 1 1 1 . 0 0 0 0 0 (sI J ) = (6.39) 0 s1 1 1 1 0 0 0 0 s (s2 )2 (s2 )3 02 1 1 0 0 0 0 s2 (s2 )2 1 0 0 0 0 0 0 s2 Usando (6.39) podemos dibujar el diagrama de bloques de la Figura 6.8. Cada cadena de bloques corresponde a un bloque en (6.39); como hay cuatro bloques de Jordan, tenemos cuatro cadenas en el diagrama de bloques de la Figura 6.8.
u u u u
b111
1 s 1

y cu11 xu11 xu12 c p12 xu13 c p13 u xu21
x111 c p11
bu11 bu12 bu13 u
1 s 1
y y
1 s 1
1 s 1
b221
1 s 2
b121
1 s 2
u bu21
x221
1 s 2
x121 c p21 y
cu21
c221
Figura 6.8: Diagrama de Bloques La salida de cada bloque mos en la Figura 6.9.
1 s i
puede asignarse como variable de estados, como mostra-
1 s
1 s
Figura 6.9: Estructura interna de
1 1 i
Consideremos la ultima cadena de la Figura 6.8. Si bu21 = 0, la variable de estados xu21 no est a conectada a la entrada y por lo tanto no es controlable, independientemente de los valores de b221 y b121 . Por otro lado, si bu21 = 0, entonces todas las variables de estado en la cadena son controlables. Si hay dos o m as cadenas asociadas con el mismo autovalor, entonces requerimos la independencia lineal de los primeros vectores ganancia de esas cadenas. Las cadenas asociadas a distintos autovalores se pueden chequear por separado. Las mismas observaciones se aplican a la observabilidad, excepto que son los vectores columna c pi j los que juegan el rol de los vectores la bui j . Idea de la demostraci on del Teorema 6.10. Mostramos el resultado sobre el sistema (6.38) usando el Test PBH de rango 6.2, que dice que ( A, B) es controlable sii la matriz [sI AB] tiene rango pleno para cada autovalor de A. O sea que tenemos s 1 1 0 0 0 0 0 b111 0 s 1 0 0 0 0 0 bu11 0 0 s 0 0 0 0 b 1 u 12 sI J B = 0 0 0 s 1 0 0 0 bu13 . 0 0 0 0 s 2 1 0 b121 0 0 0 0 0 s 2 1 b221 0 0 0 0 0 0 s 2 bu21 (6.40) La matriz J tiene dos autovalores distintos, 1 y 2 , con tres y un bloques de Jordan asociados. Evaluando s = 1 obtenemos 0 1 0 0 0 0 0 b111 0 0 0 0 0 0 0 bu11 0 0 0 0 0 0 0 bu12 1 I J B = 0 0 0 0 0 0 0 b (6.41) u 13 0 0 0 0 1 2 1 0 b 121 0 0 0 0 0 1 2 1 b221 0 0 0 0 0 0 1 2 bu21 El rango de la matriz no cambia por operaciones elementales entre columnas o las. Suma mos el producto de la segunda columna de (6.41) por b111 a la ultima columna de la matriz,
6. Controlabilidad y Observabilidad que da 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 2 1 0 0 0 1 2 1 0 0 0 1 2 0
bu11 bu12 bu13 . b121 b221 bu21
Como 1 y 2 son distintos, 1 2 = 0. Sumamos el producto de la s eptima columna por bu21 /(1 2 ) a la ultima columna. En forma similar, usamos la sexta, y luego la quinta columna para cerear los tres ultimos elementos de la ultima columna, obteniendo 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 bu11 0 0 0 0 0 0 0 bu12 0 0 0 0 . 0 0 0 b (6.42) u 13 0 0 0 0 1 2 1 0 0 0 0 0 0 0 1 2 1 0 0 0 0 0 0 0 1 2 0 Es claro de (6.42) que la matriz tiene rango pleno sii las las bu11 , bu12 y bu13 son linealmente independientes. Procediendo de igual forma para cada autovalor distinto podemos demostrar el teorema. Ejemplo 6.10. Consideremos las ecuaciones de estado en forma modal 0 1 0 0 10 0 0 1 0 9 = x 0 0 0 0 x + 0 0 0 0 2 1 y = 1 0 0 2 x. Hay dos bloques de Jordan, uno de orden 3 asociado al autovalor 0, y otro de orden 1 aso ciado al autovalor 2. La entrada de B correspondiente a la ultima la del primer bloque de estado no es controlable. Las dos entradas de C corresponde Jordan es 0; la ecuacion dientes a las primeras columnas de los dos bloques de Jordan son no nulas; el sistema es observable.
6.5.
Ecuaciones de Estado Discretas
Los conceptos y tests de controlabilidad y observabilidad para sistemas en tiempo discreto son an alogos a los de tiempo continuo. Existen sin embargo dos diferencias importantes: 1. Si un sistema en tiempo continuo es controlable, existe una entrada que transere el estado del sistema entre dos estados cualesquiera en un intervalo de tiempo nito este intervalo de tiempo sea. En el caso de tiemarbitrario, no importa cuan pequeno po discreto, este intervalo de tiempo no es arbitrario; existe un tiempo m nimo , tal que toda transferencia de estados debe necesariamente hacerse en un tiempo mayor o igual a .
2. Para sistemas en tiempo continuo, si se puede llevar el estado al origen desde cualquier otro estado, siempre se puede hacer lo contrario: llevar el estado desde el origen a cualquier otro estado. En sistemas discretos esto no se cumple si la matriz A es singular. Volveremos estas dos diferencias con un poco m as de detalle en un momento. Resumimos primero las deniciones y principales tests de controlabilidad y observabilidad para sistemas en tiempo discreto. Consideramos el sistema x[k + 1] = Ax[k] + Bu[k] y[k] = Cx[k], con A Rnn , B Rn p y C Rqn . de estados Denicion 6.3 (Controlabilidad de sistemas en tiempo discreto). La ecuacion en tiempo discreto (6.43), o el par ( A, B), se dice controlable si para cualquier estado inicial x[0] = x0 Rn y cualquier estado nal x1 Rn , existe una secuencia de entrada de lon (6.1), o el par gitud nita que transere el estado x de x0 a x1 . En caso contrario, la ecuacion ( A, B), se dice no controlable. Teorema 6.11 (Tests de Controlabilidad). La siguientes armaciones son equivalentes: 1. El par ( A, B), A Rnn , B Rn p , es controlable. 2. La matriz de controlabilidad, (6.43)
C = B AB A2 B An1 B ,
es de rango n (rango la pleno). 3. La matriz n n Wdc [n 1] = es no singular.
n1
C Rnnp ,
(6.44)
m=0
( A)m BBT ( AT )m
(6.45)
4. La matriz [ A I B] Rn(n+ p) tiene rango la pleno para cada autovalor de A. de estado Denicion 6.4 (Observabilidad de sistemas en tiempo discreto). La ecuacion (6.43) es observable si para cualquier estado inicial x[0] (desconocido), existe numero entero k1 > 0 tal que el conocimiento de la entrada u y la salida y desde k = 0 a k1 es suciente para determinar en forma unica el estado inicial x[0]. En caso contrario el sistema no observable. Teorema 6.12 (Tests de Observabilidad). La siguientes armaciones son equivalentes: 1. El par ( A, C ), A Rnn , C Rqn , es observable. 2. La matriz de observabilidad, C CA 2 O= CA , CAn1 es de rango n (rango columna pleno).
O Rnqn ,
(6.46)
6. Controlabilidad y Observabilidad 3. La matriz n n Wdo [n 1] = es no singular.
n1
m=0
( A T )m C T C ( A)m
(6.47)
(n+q)n I 4. La matriz [ A tiene rango columna pleno para cada autovalor de A. C ] R
6.5.1. Indices de Controlabilidad y Observabilidad

Sean A Rnn y B R[ n p] tales que el par ( A, B) es controlable. En consecuencia, la matriz C = [ B AB . . . An1 B] tiene rango n. Claramente, sobran columnas en C , ya que hay np; esto se debe a que hay m as de una entrada y por lo tanto B tiene p columnas. de si todas las columnas de B son necesarias, o bien, si todas Surge entonces la cuestion nos lleva al concepto de aportan a la controlabilidad del sistema. Esta cuestion ndices de f controlabilidad, que en el caso de tiempo discreto tiene una interpretacion sica importante. Para introducir los ndices de controlabilidad del par ( A, B), veamos una forma eciente y natural de seleccionar n columnas linealmente independientes de la matriz C . Si B = [b1 b2 . . . b p ], escribimos C en forma expl cita como . . . n1 C = b1 b p . . A b 1 A n1 b p . Ab1 Ab p . . . Busquemos columnas LI en C de izquierda a derecha. Por construcci on, si durante la busqueda Ai bm resultara LD de las columnas a su izquierda, todas las columnas asociadas a bm que siguen en C (o sea, Ai+1 bm , Ai+2 bm , etc.) ser an tambi en LD de las columnas de C ya seleccio nadas. Sea m el numero de columnas LI en C aportadas por la columna bm de B; es decir, las columnas bm , Abm , . . . , Am 1 bm son LI en C y Am +i bm es LD para i = 0, 1, . . . Si C tiene rango n, necesariamente debe cumplirse que 1 + 2 + + p = n. Denicion 6.5 (Indices de Controlabilidad). Los numeros {1 , 2 , . . . , p } son los ndices de controlabilidad asociados al par ( A, B). El numero = ma x(1 , 2 , . . . , p ) es el ndice de controlabilidad asociado al par ( A, B). No es dif cil comprobar que los ndices de controlabilidad son invariantes frente a reordenamientos de las columnas de B o frente a cambios de coordenadas. Para sistemas en tiempo discreto, el ndice de controlabilidad representa el tiempo m nimo en que se puede realizar cualquier transferencia de estados en un sistema controlable. No es posible transferir cualquier estado a otro con una secuencia de control de longitud menor a . dual, los Una denicion ndices de observabilidad, 1 , 2 , . . . , q , surge de seleccionar las columnas LI en la matriz de observabilidad O asociadas a las las de C. Sea m el numero de las LI en O asociadas a la la cm de C. Se cumple que 1 + 2 + + q = n.
Denicion 6.6 (Indices de Observabilidad). Los numeros {1 , 2 , . . . , q } son los ndices de observabilidad asociados al par ( A, C ). El numero = ma x(1 , 2 , . . . , q ) es el ndice de observabilidad asociado al par ( A, C ). Como puede esperarse, los ndices de observabilidad son tambi en invariantes respecto a reordenamientos de las las de C y respecto a cambio de coordenadas. En sistemas discretos, el ndice de observabilidad asociado al par ( A, C ) representa la longitud m as corta de secuencias de entradas y salidas necesarias para determinar en forma un voca el estado inicial del sistema. Los tests de controlabilidad y observabilidad en formas canonicas y modal de sistemas en tiempo discreto son exactamente iguales a los de sistemas en tiempo continuo.
6.5.2.
Controlabilidad al Origen y Alcanzabilidad
Existen en realidad tres deniciones aceptadas para controlabilidad, asociadas con la posibilidad de 1. tranferir cualquier estado a cualquier estado (la que hemos presentado) 2. tranferir cualquier estado al origen, llamada controlabilidad al origen, y 3. tranferir el estado desde el origen a cualquier estado, llamada controlabilidad desde el origen, o alcanzabilidad. Para sistemas lineales, estacionarios, y en tiempo continuo, las tres deniciones son equi la primera. Para sistemas lineales, estacionarios, y en tiempo valentes por eso vimos solo discreto, si la matriz A es no singular, de nuevo, las tres deniciones son equivalentes. sin 1, pero controlable embargo, si A es singular, el sistema puede ser no controlable segun 2. Por ejemplo, tomemos el sistema segun x[k + 1] = La matriz de controlabilidad 2 1 1 x[k] + u[k]. 0 0 0 (6.48)
C=
1 2 0 0
tiene rango 1, por lo que (6.48) es no controlable. Sin embargo, para cualquier x[0] = [ ], la entrada u[0] = 2 + transere x[0] a x[1] = 0, en un paso. Notar que A en (6.48) es singular.
6.6.
Controlabilidad, Observabilidad y Muestreo
La mayor a de los sistemas de control se implementan en forma digital, para lo cual casi siempre se necesita disponer de un modelo en tiempo discreto del sistema. En 4.2.2 vimos una forma de obtener un modelo en EE discreto exacto en los instantes de muestreo.
Cabe entonces preguntarse si las propiedades de controlabilidad y observabilidad se con vemos una condicion suciente para servar an en el modelo discretizado. En esta seccion que esto suceda. Sea el sistema en tiempo continuo (t) = Ax(t) + Bu(t) x y(t) = Cx(t). Si la entrada es seccionalmente constante a intervalos regulares T , u(t) = u(kT ) u[k], para t [kT, (k + 1) T ), (6.49)
entonces, como vimos en 4.2.2, el estado en el instante (k + 1) T puede expresarse como x[k + 1] x((k + 1) T ) = Ad x[k] + Bd u[k], y[k] = Cx[k] donde Ad e AT , Bd
0 T
(6.50)
e A d
B.
(6.51)
Si el sistema en tiempo continuo (6.49) es controlable (observable), la controlabilidad (observabilidad) del sistema discretizado (6.50), (6.51)depende del per odo de muestreo T y de los autovalores i de la matriz A. Teorema 6.13 (Muestreo no patologico). Supongamos que el sistema (6.49) es controlable (observable). El sistema discretizado (6.50), (6.51) con per odo de muestreo T es controlable (observable) si, dados dos autovalores cualesquiera i , j de A tales que Re[i j ] = 0, se de muestreo no patologico satisface la condicion Im[i j ] = 2 m , T con m = 1, 2, . . . . (6.52)
(6.52) es tambi Si el sistema (6.49) es de una entrada, la condicion en necesaria para controlabilidad (observabilidad) del sistema (6.50), (6.51). suciente para garantizar que el sistema discretizado sea El teorema da una condicion solo afecta a autovalores comcontrolable (observable) si el continuo lo es. Esta condicion tiene autovalores reales, entonces el sistema discretizado plejos conjugados de A; si A solo es siempre controlable (observable) para todo T > 0 si el sistema continuo lo es. Si A tiene autovalores complejos conjugados j, entonces si el per odo de muestreo T es tal que no sea multiplo de /, el sistema discreto es controlable (observable) si el continuo lo es. entero m, entonces el sistema discreto puede no ser controlable Si T = m / para algun (observable). Ejemplo 6.11. Consideremos el sistema de una entrada (t) = Ax(t) + Bu(t) x y supongamos que la matriz C = [ B AB . . . An1 B] es invertible (o sea, el sistema es con de controlabilidad para el sistema discretizado es que la matriz trolable). La condicion
T
Cd =
e A d B e AT
Bd
e A d B e(n1) AT
Ad Bd
1 An Bd d
e A d B
(6.53)
sea invertible. Es claro que si existieran dos numeros enteros q y r tales que eqAT = erAT , entonces (6.53) no podr a ser invertible. Por ejemplo, tomemos (t) = x Obtenemos el sistema discreto x[k + 1] = cos T sen T 1 cos T x[k ] + sen T cos T sen T. (6.54) 0 1 0 x(t) + u(t). 1 0 1
Puede comprobarse f acilmente que si T = m , con m = 1, 2, . . . , entonces el sistema discreto (6.54) ser a no controlable. si agregamos la salida y(t) = 1 0 x(t), para los mismos valores de T se pierde observabilidad en el sistema discretizado. Ejemplo 6.12. Consideremos el sistema hidr aulico de la Figura 6.10. Es obvio que u(t) no puede afectar a x2 (t), por lo que es intuitivamente evidente que el sistema es no controlable. Un modelo en EE linealizado de este sistema, con par ametros unitarios [Rugh, 1995,
ut

x1 t
x2 t

yt
Figura 6.10: Sistema de tanques desconectados Ejemplo6.18], es
1 0 1 x(t) + u(t) 0 0 0 y(t) = 1 0 x(t)

(t) = x y muestra que es no controlable (est a en forma canonica modal). Ejemplo 6.13. El sistema hidr aulico de la Figura 6.11 no es tan obvio como el de la Figura 6.10, aunque puede verse que x1 (t) y x3 (t) no pueden ser afectadas en forma indepen de estados linealizada, con par diente por u(t). La ecuacion ametros unitarios, es 1 1 0 0 (t) = 1 3 1 x(t) + 1 u(t) x 0 1 1 0 y(t) = 0 1 0 x(t) y da la matriz de controlabilidad 0 1 4 C = 1 3 11 0 1 4
ut

x1 t
x2 t
x3 t
yt
Figura 6.11: Sistema de tanques en paralelo
que tiene rango 2. Por otro lado, si la entrada se aplicara en el primer tanque, como se muestra en la Figura 6.12, el sistema se vuelve controlable; la matriz de controlabilidad con B = 1 1 2 C = 0 1 4 , 0 0 1 que tiene rango 3.
1 0 0
deviene
ut

x1 t
x2 t
x3 t

yt
Figura 6.12: Sistema controlable de tanques en paralelo
6.7. Sistemas Inestacionarios

Consideramos el sistema de n estados, p entradas y q salidas = A(t) x + B(t)u x y = C (t) x. (6.55)
de estados (6.55) es controlable en t0 si existe un tiempo nito t1 > t0 tal que La ecuacion para cualquier x(t0 ) = x0 y cualquier x1 , existe una entrada que transere x0 a x1 en tiempo t1 . De los contrario el sistema es no controlable en t0 . de estados es controlable, entonces es controPara sistemas estacionarios, si la ecuacion de t0 y lable en todo t0 y para cualquier t1 > t0 . En el caso inestacionario la especicacion t1 es crucial.
Teorema 6.14 (Controlabilidad de sistemas inestacionarios). El par ( A(t), B(t)) es contro si existe un tiempo nito t1 > t0 tal que la matriz lable en un tiempo t0 si y solo
t1
Wc (t0 , t1 ) =
t0
(t1 , ) B( ) BT ( )T (t1 , )d ,
Wc (t0 , t1 ) Rnn ,
(6.56)
= A(t) x, es no singular. de estados de x donde (t, ) es la matriz de transicion de estados (t, ), Para aplicar el Teorema 6.14 necesitamos la matriz de transicion que podemos no conocer. Es deseable entonces tener algun test de controlabilidad que no dependa del conocimiento de (t, ). Esto es posible si pedimos m as condiciones en las matrices A(t) y B(t). Supongamos que A(t) y B(t) son continuamente diferenciables (n 1) veces. Denimos entonces la siguiente secuencia de matrices M0 (t) = B(t) Mm+1 (t) = A(t) Mm (t) + d Mm (t), dt m = 0, 1, . . . , n 1. (6.57)
Teorema 6.15 (Condicion suciente para controlabilidad de sistemas inestacionarios). Sean A(t) y B(t) continuamente diferenciables (n 1) veces. Entonces el par ( A(t), B(t)) es controlable en un tiempo t0 si existe un tiempo nito t1 > t0 tal que rango M0 (t1 ) M1 (t1 ) . . . Mn1 (t1 ) = n. (6.58)
Demostraci on. Mostramos que si vale (6.58) entonces la matriz Wc (t0 , t) es no singular para del Teorema 6.14. Supongamos que Wc (t0 , t) todo t t1 , con lo cual se cumple la condicion t2 t1 . Entonces existe un es sigular, es decir que es semidenida positiva para algun n vector constante v R tal que vT Wc (t0 , t2 )v =
t2 t0 t2 t0
vT (t2 , ) B( ) BT ( )T (t2 , )vd BT ( )T (t2 , )v 2 d = 0, (6.59)
lo cual implica que BT ( )T (t2 , )v 0, o bien, vT (t2 , ) B( ) 0 para todo [t0 , t2 ]. (6.60)
en (6.57), M0 (t) verica Notemos que, por su denicion (t2 , t) B(t) = (t2 , t) M0 (t). Usando la propiedad vemos que (t2 , t) = (t2 , t) A(t) t
d ((t2 , t) B(t)) = (t2 , t) A(t) M0 (t) + M0 (t) t dt = (t2 , t) M1 (t).
6. Controlabilidad y Observabilidad podemos mostrar que Siguiendo con la diferenciacion, m (t2 , t) B(t) = (t@ , t) Mm (t). tm
(6.61)
Volviendo a (6.59), diferenciamos vT (t2 , ) B( ) 0 con respecto a , y usando (6.61), obtenemos vT (t2 , ) Mm ( ) 0, para m = 0, 1, . . . , n 1 (6.62)
y para todo [t0 , t2 ], en particular en = t1 . Podemos reescribir (6.62) evaluada en = t1 como vT (t2 , t1 ) M0 (t1 ) M1 (t1 ) . . . Mn1 (t1 ) = 0. (6.63) Como (t2 , t1 ) es no singular, vT (t2 , t1 ) = 0. As (6.63) contradice (6.58), lo cual demuestra el teorema. Ejemplo 6.14. Consideremos el sistema t 1 0 0 = 0 t t x + 1 u. x 0 0 t 1 Como A(t) y B(t) son continuamente diferenciables todas las veces que se quiera, calculamos 0 M0 (t) = 1 1 1 d M1 (t) = A(t) M0 (t) + M0 (t) = 0 dt t t d M2 (t) = A(t) M1 (t) + M1 (t) = t2 . dt t2 1 El determinante de la matriz M0 M1 M2 0 1 t t2 = 1 0 1 t t2 1
es t2 + 1, que es distinto de cero para todo t. As el sistema es controlable en todo t. de estados Vayamos ahora a la observabilidad de sistemas inestacionarios. La ecuacion (6.55) es observable en t0 si existe un tiempo nito t1 tal que para cualquier estado x(t0 ) = x0 el conocimiento de la entrada y la salida sobre el intervalo de tiempo [t0 , t1 ] es suciente para determinar unicamente el estado inicial x0 . De lo contrario el sistema es no observable en t0 . Teorema 6.16 (Observabilidad de sistemas inestacionarios). El par ( A(t), C (t)) es obser si existe un tiempo nito t1 > t0 tal que la matriz vable en un tiempo t0 si y solo
t1
Wo (t0 , t1 ) =
t0
T ( , t0 )C T ( )C ( )( , t0 )d ,
Wo (t0 , t1 ) Rnn ,
(6.64)
= A(t) x, es no singular. de estados de x donde (t, ) es la matriz de transicion
suciente para observabilidad que prescinde del conociLa siguiente es una condicion de estados (t, ). miento de la matriz de transicion Teorema 6.17 (Condicion suciente para observabilidad de sistemas inestacionarios). Sean A(t) y C (t) continuamente diferenciables (n 1) veces. Entonces el par ( A(t), C (t)) es observable en un tiempo t0 si existe un tiempo nito t1 > t0 tal que N0 (t1 ) N1 (t1 ) rango (6.65) . . . = n, Nn1 (t1 ) donde N0 = C (t) Nm+1 = Nm (t) A(t) + d Nm (t), dt m = 0, 1, . . . , n 1.
Nota: La dualidad entre controlabilidad y observabilidad que tenemos en sistemas lineales estacionarios (Teorema 6.4) no se aplica a sistemas inestacionarios. Debe usarse la siguiente forma alterada. Teorema 6.18 (Dualidad controlabilidad-observabilidad en sistemas inestacionarios). El si el par ( AT (t), BT (t)) es observable en t0 . par ( A(t), B(t)) es controlable en t0 si y solo Demostraci on. Ejercicio.
6.8. Ejercicios
Ejercicio 6.1. Terminar la prueba del Lema 6.1. Ejercicio 6.2. Terminar la prueba del Lema 6.2. Ejercicio 6.3. Determinar si cada uno de los siguientes sistemas es controlable y/o observable x[k + 1] = 1 0 1 x[k] + u[k] 1/2 1/2 1 y[k] = 5 1 x[k] 7 2 6 1 1 = 2 3 2 x + 1 1 u x 2 2 1 1 0 A= 2 5 4 0 B= 1 1 C= 1 1 (a)
(b)
(c)
0 1 0 x+ u 4 4 1 y= 1 1 x = x
(d)
6. Controlabilidad y Observabilidad Ejercicio 6.4. Para qu e valores de la EE 1 1 1 (t) = 0 1 0 x(t) + 1 u(t) x 0 0 0 1 y(t) = es controlable? Y observable? 0 1 0 x(t) 0 2 1
Ejercicio 6.5. Es cierto que el rango de [ B AB . . . An1 B] es igual al rango de [ AB A2 B . . . An B]? Sino, bajo qu e condiciones es verdad? de estados Ejercicio 6.6. Reducir la ecuacion
1 4 1 x(t) + u(t) 4 1 1 y(t) = 1 1 x(t)

(t) = x reducida observable? a una EE controlable. Es la ecuacion Ejercicio 6.7. Reducir la EE 1 1 0 0 0 0 0 1 1 0 0 1 (t) = x 0 0 1 0 0 x(t) + 0 u(t) 0 0 0 2 1 0 0 0 0 0 2 1 y(t) = 0 1 1 0 1 x(t) a una EE controlable y observable. siguiente en forma de Jordan controlable y observable? Ejercicio 6.8. Es la ecuacion 2 1 0 0 0 0 0 2 1 0 0 2 0 0 0 0 0 2 1 1 0 0 2 0 0 0 0 1 1 1 (t) = x 0 0 0 2 0 0 0 x(t) + 3 2 1 u(t) 0 0 0 0 1 1 0 1 0 1 0 0 0 0 0 1 0 1 0 1 0 0 0 0 1 0 1 1 0 0 2 2 1 3 1 1 1 y(t) = 1 1 1 2 0 0 0 x(t). 0 1 1 1 1 1 0 Ejercicio 6.9. Chequear controlabilidad y observabilidad de los siguientes sistemas = x 0 1 0 x+ u 0 t 1 (a)
y= 0 1 x = x 0 0 1 x + t u 0 1 e
t
(b)
y= 0 e Ejercicio 6.10. Probar el Teorema 6.18.
Bibliograf a
193
Cap tulo 7 Especicaciones y Limitaciones de Diseno

El objetivo de este cap tulo es presentar conceptos generales (no solamente conectados del sistema de control, es con el enfoque en variable de estados) relativos al desempeno decir, al comportamiento deseado del sistema m as all a de los requerimientos b asicos de generalmente se reere a la forma en que el sistema responde estabilidad. Este desempeno a ciertas senales en el lazo de control, por ejemplo: respuesta r apida y con una ganancia determinada a las senales de referencia (escalones, rampas, sinusoides de baja frecuencia), rechazo, o respuesta despreciable, a senales espureas (perturbaciones de entrada, rui do de medicion). especicado para un sistema, cuando el sistema se representa mediante un El desempeno del sistema modelo matem atico, se llama nominal. En la realidad, en general, el desempeno real diferir a del nominal, ya que es imposible obtener un modelo matem atico que describa al sistema f con absoluta precision sico real. Cuando el controlador disenado para el sistema sobre el sistema real, se dice que es robusto. Desempeno y nominal conserva su desempeno robustez son las caracter sticas principales en un sistema de control. En este cap tulo introducimos las funciones de sensibilidad, que permiten cuanticar en y la robustez de sistemas de control. Como aplicacion, veremos forma precisa el desempeno de un como cuanticar limitaciones fundamentales en la respuesta temporal al escalon sistema de control simple. Como referencias generales a los temas de este cap tulo pueden consultarse Goodwin etal. [2000, 5] para las deniciones de funciones de sensibilidad y arquitecturas de reali Doyle etal. [1992] y S [1992] para los resultados relativos a robusmentacion, anchez Pena tez, y Seron etal. [1997, 1] para los resultados relativos a limitaciones en la respuesta al escalon.
7.1. Sensibilidad y Robustez

de la FiguUno de los esquemas de control m as simples es el lazo en realimentacion ra 7.1.
125
7. Especicaciones y Limitaciones de Diseno i (s) e d (s) r

e- j - K (s) 6
Notas de CAUT2 - 126 o (s) e d

? - j -e
(s) ? u (s) - j - G
j 6 m (s) ed
(s) y
Figura 7.1: Lazo de control de un grado de libertad.
En el lazo de la Figura 7.1 las senales representan (s) : salida y (s) : control u o (s) : perturbacion de salida d (s) : referencia r i (s) : perturbacion de entrada d m (s) : perturbacion de medicion d
pr La implementacion actica de un sistema de control se ve afectada en su desempeno de dos principales fuentes de error: 1. senales espureas (perturbaciones) en el lazo de control, ( s ). 2. incertidumbre en el modelo de la planta G de control debe tolerar satisfactoriamente tanto perturbaciones como Un buen diseno de las propiedades del sistema de control incertidumbres en el modelado. La especicacion con respecto a rechazo de perturbaciones e incertidumbre denen los objetivos de desem peno (en ingl es: performance) del diseno.
7.1.1.
Perturbaciones
Las senales espureas representan perturbaciones que bajo condiciones ideales deber an ser nulas, pero que est an presentes, en mayor o menor medida en todo sistema real. Ejemplo 7.1. El control de corriente de armadura de un motor de corriente continua se de ancho de pulsuele implementar mediante inversores que trabajan por modulacion so (PWM: pulse width modulation), i (t). La componente continua de la senal, i0 (t), es de entrada di (t), i (t) = el control efectivo; las armonicas representan una perturbacion i0 (t) + di (t) (Figura 7.2).
6 u(t)
v
- t
Figura 7.2: Actuador PWM
7. Especicaciones y Limitaciones de Diseno
nomiDenicion 7.1 (Sensibilidad). Cuando un sistema de control retiene su desempeno nal frente a perturbaciones se dice que tiene buenas propiedades de rechazo, o baja sensibilidad, a perturbaciones.
7.1.2.
Incertidumbre
La incertidumbre en el modelado surge de que es imposible conocer con exactitud el el controlador (nominal) es una modelo de un sistema. As , el modelo con el que se disena al verdadero sistema sobre el cual este actuar aproximacion a. Por ejemplo, si disenamos noun controlador basados en el modelo linealizado alrededor de un punto de operacion minal de un sistema no lineal, las alinealidades se presentar an como incertidumbres de modelado. Ejemplo 7.2. Sea el sistema no lineal (t) = x(t) + x3 (t) + u(t) x
= (1 + x2 (t)) x(t) + u(t).

(t) = x(t) + u(t), y as El modelo linealizado alrededor del origen es x el control u(t) = 2 x(t) estabiliza asintoticamente el sistema linealizado. Sin embargo, este control aplicado al sistema real da el lazo cerrado (t) = x(t) + x3 (t) x
= (1 x2 (t)) x(t).
alcanza estabilidad asintotica que solo para un conjunto acotado de condiciones iniciales: { x : | x | < 1 }. del controlador es nePara tener en cuenta la incertidumbre del modelo en el diseno de la incertidumbre con alguna cota conocida. Por cesario contar con una representacion ejemplo, es habitual representar la incertidumbre con un modelo lineal multiplicativo (Figura) (s) = G 0 (s) ( I + (s)) , G (7.1) (s) representa la funcion 0 (s) la funcion transferencia real, G transferencia nominal donde G transferencia desconocida salvo por (el modelo utilizado para diseno), y (s) una funcion alguna cota del tipo ( j) (), con () conocida.
(s) u
e -
0 ( S) G
(s)
?
(s) y
-e
(s) G
Figura 7.3: Incertidumbre multiplicativa
7. Especicaciones y Limitaciones de Diseno Ejemplo 7.3. Supongamos que tenemos el sistema (s) = G K , s + 1
del polo, = 0 + , donde 0 es el valor donde existe incertidumbre en la posicion de esta incertidumbre en el modelo multiplicativo (7.1) es nominal. La representacion (s) = G K (0 + )s + 1 K 0 s + 1 = 0 s + 1 0 s + s + 1 K s = 1 0 s + 1 0 s + s + 1 0 (s)(1 + (s)). =G
Denicion 7.2 (Robustez). Un sistema de control que retiene sus propiedades de estabili frente a incertidumbres de modelo en la planta se dice robusto. dad y desempeno No siempre es posible alcanzar buen rechazo de perturbaciones conjuntamente con ro Para alcanzar soluciones bustez, y as deben adoptarse soluciones de compromiso en el diseno. de compromiso adecuadas a las condiciones de perturbaciones e incertidumbre existentes disponer de indicadores que de alguna forma midan en el sistema considerado, es util las propiedades de sensibilidad y robustez de un controlador dado. Dos indicadores tradicionalmente utilizados son las funciones de sensibilidad del lazo.
7.2.
7.2.1.
Funciones de Sensibilidad
Funciones de transferencia en lazo cerrado
Volvamos al sistema de control de la Figura 7.1, que supondremos SISO por simplicidad. La respuesta del sistema a condiciones iniciales nulas est a dada por o (s) + G i (s) (s)u (s)d (s) = G (s) + d y m (s), ( s )r (s) y (s)d (s) = K (s) K (s) K u m (s) G o (s) G i (s) , (s)u (s)d (s) r (s) d (s) d =K de donde resolvemos (s) = u (s) K m (s) d o (s) G i (s) (s)d (s) d r (s)K (s) 1+G 1 m (s) + d o (s) + G i (s) . (s)K (s)d (s) r (s) = (s) d y G 1 + G (s)K (s)
La arquitectura del esquema de la Figura 7.1 se llama de un grado de libertad. Este existe un grado de libertad para denir las funciones nombre reeja el hecho de que solo m (s) a y i (s) y d o (s) a y (s) y d ( s ), y d ( s ). transferencias de lazo cerrado que mapean r
(s) se disena para obtener una particular respuesta a la senal de referencia, As , si K (s)K (s) (s) y G , = (s)K (s) (s) r 1+G de salida, se induce al mismo tiempo una unica respuesta a la perturbacion (s) y 1 = . (s) 1 + G (s)K do (s) A menudo, es deseable ajustar las respuestas a referencia y perturbaciones en forma independiente. Esto puede lograrse con una arquitectura de dos grados de libertad, como la de la Figura 7.4. La salida en este caso esta dada por (s) = y (s)K (s) (s) H (s) G 1 G o (s) + i (s) G (s)K (s) d (s). (s) + r d d (s)K (s)K (s)K (s)K (s) (s) (s) (s) m 1+G 1+G 1+G 1+G i (s) e d (s) r
e- H (s) - j - K (s) 6
o (s) e d
? - j -e
(s) ? u (s) - j - G
j 6 m (s) ed
(s) y
Figura 7.4: Lazo de control de dos grados de libertad. (s) puede usarse para ajustar la respuesta a la perturbacion (que tiene la misma Ahora K (s) puede usarse para transferencia que en la arquitectura de un grado de libertad), y H ajustar la respuesta a la referencia independientemente, dada por (s)K (s) H (s) (s) y G = . (s)K (s) (s) r 1+G en la arquitectura de dos grados de libertad quedan funciones No obstante, notar que aun (s) transferencias cuya din amica no puede ajustarse independientemente; el controlador K i (s), d o (s) o d m (s), pero una vez d puede usarse para ajustar la respuesta a una perturbacion elegido, las restantes respuestas quedan determinadas. La salida del controlador en el esquema de la Figura 7.4 est a dada por (s) = u (s) H (s) (s) (s) K K K o (s) G (s)K (s) d i (s) (s). (s) r d d (s)K (s)K (s)K (s)K (s) (s) (s) (s) m 1+G 1+G 1+G 1+G
La respuesta a lazo cerrado del sistema de la Figura 7.4 est a entonces gobernada por cuatro funciones transferencia, colectivamente llamadas funciones de sensibilidad, (s) T i (s) S (s)K (s) G (s)K (s) 1+G (s) G (s)K (s) 1+G (s) S u (s) S 1 (s)K (s) 1+G (s) K (s)K (s) 1+G (7.2) (7.3)
7. Especicaciones y Limitaciones de Diseno e individualmente (s) : Sensibilidad complementaria T (s) : Sensibilidad S i (s) : Sensibilidad de entrada S u (s) : Sensibilidad de control S
La funciones de sensibilidad est an algebraicamente relacionadas, y estas relaciones son unas de las manifestaciones de las restricciones inherentes al lazo de control en realimenta No es dif cion. cil ver que (s) + T (s) = 1 S i (s) = S (s) G (s) = T (s) S (s) K u (s) = S (s)K (s) = T (s) . S (s) G
7.2.2.
Especicaciones de la Respuesta en Frecuencia
En resumen, las funciones de sensibilidad permiten denir la respuesta en r egimen per manente del sistema a la senales m as t picas en el lazo de control. As , podemos especicar (s) y T ( s ). la respuesta del sistema especicando ganancia, ceros y polos de S Claramente, como el requerimiento b asico para para la existencia de respuesta en r egi para S(s) y men permanente es la estabilidad BIBO, tenemos que la primer especicacion (s) es que deben tener todos sus polos con parte real negativa. T (s) y T (s) puede asignarse de forma de satisfacer de ceros y polos de S La distribucion Por ejemplo, como normalmente la senal de referencia otros requerimientos de desempeno. ( j) posee un espectro de bajas frecuencias, T ( j) se especica como ltro pasa-bajos, y r normalmente de alta frecuencia. as rechazar al mismo tiempo el ruido de medicion, ( j) La Figura 7.5 muestra especicaciones t picas de la respuesta en frecuencia para T y S( j) (recordemos que T (s) y S(s) no pueden elegirse en forma independiente ya que (s) = 1s C). Es decir, (s) + S T ( j)| |S ( j)| |T 1, 1,
[0, 1 ] , [2 , ) ,
para un ciertos 1 , 2 tales que 2 > 1 .
7.3.
7.3.1.
Robustez
Estabilidad Robusta
( j) ( j) y S Adem as de especicar la respuesta del sistema a senales, las funciones T sirven para especicar las propiedades de robustez del sistema. Supongamos que representamos la incertidumbre en el modelo (s) con estructura multiplicativa (s) = G 0 (s)(1 + (s)), G (7.4)

seg ruido
|T(j)|
|S(j)|
W1
0.5
0.5
0 2 10
10
10
10
10
0 2 10
10
10
10
10
pert
( j)|. ( j)| and | S Figura 7.5: Formas t picas para | T
y que se conoce la cota de incertidumbre ( j)| W2 (). | (7.5)
creciente de la frecuencia (el modelo es m T picamente, W2 () es una funcion as incierto a frecuencias mayores). Como se obtiene la cota W2 () en la pr actica? El siguiente ejemplo ilustra una forma. Ejemplo 7.4 (Incertidumbre de modelado). Supongamos que la planta es estable y se obtu 0 (s) mediante experimentos de respuesta en frecuen transferencia nominal G vo su funcion cia: La magnitud y fase de la salida se miden para m sinusoides de referencia de distintas n veces. frecuencias i , i = 1, . . . , m . El experimento se repitio Denotamos el par (magnitud,fase) para la frecuencia i y el experimento k como ( Mik , ik ). 0 ( j) a estas mediciones, por ejemplo, El modelo nominal se puede obtener ajustando G minimizando el error cuadr atico medio total (t pico en Identicaci on de Sistemas). 0 (s), se puede obtener W2 () eli transferencia nominal G Una vez obtenida la funcion gi endola de forma tal que Mik e jik 1 W2 (), 0 ( ji ) G i = 1, . . . , m; k = 1, . . . n.
Existen distintos criterios para ajustar W2 (). La Figura 7.6 muestra los resultados de un experimento real en un sistema intercambiador de calor experimental (n = 3). El siguiente es un importante resultado que da condiciones necesarias y sucientes para estabilidad robusta con incertidumbre multiplicativa en los lazos de control de la Figura 7.1, 7.4. Teorema 7.1 (Estabilidad robusta con incertidumbre multiplicativa). Sea la planta nomi 0 (s) con incertidumbre de modelo (s) estable y dada por (7.4) y (7.5). Entonces, si los nal G 0 (s), ser lazos de control de la Figura 7.1, 7.4 son estables con la planta nominal G an estables (s) si y solo si con la planta real G 0 ( j)| < |T 1 ( j)| < 1, |W2 () T W2 () para todo , (7.6)

Diagrama de Nyquist Nyquist nominal Mediciones Incertidumbre
10
1

Diagrama de Bode
0.5
Parte Imaginaria
10
0.5
Magnitud
10
1
1.5
Estimated model Point Estimate 70% confidence cloud

10
2
2 1
0.5
0.5
1.5
10
10
10
10
10
Parte Real
Frecuencia
Figura 7.6: Mediciones, modelo nominal e incertidumbre
(s) = G 0 (s)). 0 ( j) es la sensibilidad complementaria nominal (de (7.2) con G donde T [1992, 2] o Doyle etal. [1992, 4]. Demostraci on. Ver por ejemplo S anchez Pena Este resultado nos dice que si existe mucha incertidumbre de modelo a una determinada 0 (s) debe disenarse (s)) para tener valores bajos a esa frecuencia, frecuencia, T (a trav es de K o la estabilidad nominal del sistema puede llegar a perderse en la planta real. La condicion gr de estabilidad robusta (7.6) tiene la siguiente interpretacion aca: Puesto que ( j)| < |T 0 ( j) ( j) G 1 W2 ()K < 1, 0 ( j) ( j) G W2 () 1+K 0 ( j)| < |1 + K 0 ( j)|, ( j) G ( j) G |W2 ()K
entonces, para cada frecuencia el punto cr tico 1 se encuentra fuera del disco de centro K ( j) G ( j) y radio |W2 ()K ( j) G0 ( j)|.
imag
real
G K 0
G W2 K 0
Figura 7.7: Estabilidad robusta gr acamente
7.3.2.
robusto Desempeno
( j)| nominal del sistema puede especicarse deniendo la forma de | S El desempeno de peso dada W1 () requiriendo que con una funcion ( j)| < |S 1 ( j)| < 1, |W1 () S W1 ()
(7.7)
Si (7.7) se preserva de la planta nominal a la planta real, y adem as se preserva la estabilidad, robusto. decimos que el sistema tiene desempeno robusto, como intuitivamente puede esperarse, requiere la estabilidad El desempeno necesaria. El siguiente resultado establece una condicion nerobusta (7.6) como condicion robusto de los sistemas de la Figura 7.1, 7.4. cesaria y suciente para el desempeno Teorema 7.2 (Desempeno robusto con incertidumbre multiplicativa). Sea la planta nomi (s) estable y dada por (7.4) y (7.5). Entonces, si los nal G0 (s) con incertidumbre de modelo lazos de control de la Figura 7.1, 7.4 son estables, y se cumple (7.7) con la planta nominal 0 (s), el sistema tiene desempeno robusto si y solo si G 0 ( j)| + |W2 () T 0 ( j)| < 1, |W1 () S para todo , (7.8)
0 ( j) y T 0 ( j) son la sensibilidad y sensibilidad complementaria nominales (de donde S 0 (s)). (7.2) con G (s) = G [1992, 2] o Doyle etal. [1992, 4]. Demostraci on. Ver S anchez Pena de desempeno robusto tambi gr La condicion en admite una buena interpretacion aca:
imag
real
W1 G K 0
G W2 K 0
robusto gr Figura 7.8: Desempeno acamente
7.4. Limitaciones de Diseno

de las secciones anteriores, se pueden especicar las propiedades del Como conclusion y robustez, especicando la forma de las sistema de control a lazo cerrado, desempeno de lo respuestas en frecuencia S( j) y T ( j). Estas especicaciones se hacen en funcion que se pretende del sistema dentro del particular problema de control considerado. (s) y T (s). Como veremos en esta Sin embargo, no hay libertad absoluta para elegir S hay factores inherentes al problema de control que limitan el desempeno y/o la seccion, robustez alcanzables por el sistema.
7.4.1.
(s) y T (s) Restricciones algebraicas en S
(s) y T (s) para ciertos valores Existen restricciones en los valores que pueden tomar S de s C. Estas restricciones se transladan a su vez como restricciones sobre los valores en ( j) y T ( j). el eje j, S m de complementariedad La restriccion as obvia es la relacion (s) + T (s) = 1 S
s C.
Otras restricciones surgen en los ceros y polos a lazo abierto debido al requerimiento de estabilidad del lazo cerrado. (s) no tiene canLema 7.1 (Restricciones de Interpolacion). Si el sistema a lazo abierto L celaciones polo-cero inestables, entonces, para cualquier control que estabilice al sistema a (s) y T (s) deben satisfacer las siguientes condiciones lazo cerrado, S (s) (Re p 0) 1. si p es un polo inestable de L ( p) = 0 S y ( p) = 1. T
(s) (Re q 0) 2. si q es un cero de fase no m nima de L (q) = 1 S y (q) = 0. T
Demostraci on. Por el requerimiento de estabilidad del lazo cerrado, ceros y polos con parte real positiva de la planta o el controlador no pueden cancelarse, por lo que permanecer an (s) y (s). Las condiciones de interpolacion siguen directamente de las deniciones de S en L ( s ). T Sea cual fuera el controlador elegido, las funciones de sensibilidad deber an satisfacer estas restricciones en los polos y ceros de parte real no negativa del lazo abierto.
7.4.2.
en la respuesta temporal Especicaciones de diseno
de la respuesta en frecuencia, la especicacion del Alternativamente a la especicacion del sistema a lazo cerrado suele hacerse sobre la respuesta temporal del sistedesempeno de la respuesta temporal es m ma. La especicacion as directa respecto de lo que se pretende del sistema, pero entonces es m as dif cil traducir estas especicaciones a condiciones para las funciones transferencia del lazo cerrado. son Los par ametros t picos para la respuesta al escalon sobrevalor ysob subvalor ysub tiempo de crecimiento tc tiempo de establecimiento te sobre el sistema de la Figura 7.1, y Denimos los par ametros de la respuesta al escalon denimos el error de seguimiento e(t) = r(t) y(t).

2
yt
ysob
0 ysub tc te
Figura 7.9: Especicaciones en la respuesta temporal
sobrevalor: es el m aximo valor en que la respuesta del sistema excede su valor de r egimen permanente, ysob ma x{e(t)}.
t
subvalor: es m aximo pico negativo de la salida del sistema, ysub ma x{ y(t)}.

t
tiempo de crecimiento: cuantica aproximadamente el tiempo m nimo que toma la salida en alcanzar el nuevo punto de operacion, tc ma x { : y(t) t/
para todo t en el intervalo [0, ]}
tiempo de establecimiento: cuantica el tiempo que tardan los transitorios en decaer permanentemente por debajo de un determinado nivel , usualmente entre el 1 y 10 % del valor de r egimen permanente, te m n { : |e(t)|
para todo t en el intervalo [ , )}
7.4.3.
Restricciones en la respuesta al escalon
Como vimos, los polos y ceros en el semiplano derecho del plano complejo imponen restricciones algebraicas en las funciones de sensibilidad del sistema, no importa cual sea el controlador usado. Veremos ahora como estas restricciones algebraicas se traducen en alcanzable en la respuesta al escalon del sistema a lazo cerestricciones en el desempeno rrado. de transformada Usaremos el siguiente resultado preliminar, que surge de la denicion Laplace. (s) una funcion transferencia estrictamente propia cuyos polos se encuenLema 7.2. Sea h numero tran en el semiplano {s C : Re s }, para algun real nito > 0. Sea h(t)
(s). Entonces para cualquier numero la antitransformada Laplace de h s0 {s C : Re s > } (s). es0 t h(t)dt = l m h
0 ss0
de la Transformada de Laplace, para todo s en la regi Demostraci on. De la denicion on de convergencia de la transformada, Re s > , se cumple que (s) = h
0
est h(t)dt.
de convergencia, queda probado el resultado. Como s0 est a en la region del sistema de la Figura 7.1 La salida y el error de seguimiento en la respuesta al escalon satisfacen las siguientes condiciones integrales. (s) tiene un Teorema 7.3 (Polos inestables). Supongamos que el sistema a lazo abierto L polo en p, con Re p > 0. Entonces si el lazo cerrado es asintoticamente estable
0 0
e pt e(t)dt = 0 e pt y(t)dt = 1 p
(7.9) (7.10)
Demostraci on. Al ser el sistema asintoticamente estable es BIBO, y entonces el error e(t) producido por una entrada acotada es acotado, digamos |e(t)| M, t. As , la transformada (s) no tendr de Laplace del error, e a singularidades en {s C : Re s > 0}. En efecto, (s)| |e
est e(t) dt
e Re st dt =
M < Re s
para todo s : Re s > 0.
(7.9) sigue de Entonces, por el Lema 7.2, la ecuacion
( p) = e pt e(t)dt = e
( p) S = 0, p
( s )r (s) = S (s), el hecho de que la referencia es un escalon, e donde usamos la relacion (s) = 1/s, y la restriccion de interpolacion de S(s) en los polos inestables de L(s). r (7.10) sigue de (7.9) y el hecho de que r(t) = 1 para todo t, La ecuacion
e pt y(t)dt =
0
e pt (r(t) e(t))dt e pt dt = 1 . p
=
0
Un resultado dual existe para plantas con ceros de fase no m nima.
(s) Teorema 7.4 (Ceros de fase no m nima). Supongamos que el sistema a lazo abierto L tiene un cero en q, con Re q > 0. Entonces si el lazo cerrado es estable
0 0
eqt e(t)dt =
1 q
(7.11) (7.12)
eqt y(t)dt = 0.
Demostraci on. Ejercicio. Estos teoremas muestran que si la planta tiene ceros o polos en el semiplano derecho deben satisfacer del plano complejo, entonces el error y la salida a una entrada escalon relaciones integrales independientemente del controlador usado para estabilizar el sistema. de estas integrales en t Damos ahora interpretaciones de diseno erminos de los par ametros de la respuesta al escalon. Corolario 7.1 (Polos inestables reales y sobrevalor). Si la planta tiene un polo inestable tiene forzosamente sobrevalor. M si tc es el real en p > 0, su respuesta al escalon as aun, tiempo de crecimiento del sistema a lazo cerrado, entonces se cumple que ysob
( ptc 1)e ptc + 1 ptc ptc . 2
(7.13)
Demostraci on. Necesariamente el error deber a cambiar de signo para que la integral (7.9) sea nula a menos que sea id enticamente nulo. As , la salida deber a superar a la referencia momento sobrevalor. en algun de tc tenemos que y(t) t/tc para t tc , o sea que e(t) 1 t/tc . De la denicion Usando esta cota en la integral (7.9) tenemos que
tc
0=
0
e pt e(t)dt +
tr
e pt e(t)dt
tc 0
e pt 1
tc
t tc t tc
dt +
tr
e pt e(t)dt (7.14)
tr
e pt (e(t))dt
e pt 1
dt.
de sobrevalor tenemos que De (7.14) y la denicion ysob e ptc = ysob p
tr
e pt dt t 1 tc
tr
e pt (e(t))dt
de donde surge (7.13).
tc
e
0
pt
( ptc 1) + e ptc dt = , p2 tc
Sigue del Corolario 7.1 que si la planta tiene un polo inestable: necesariamente hay sobrevalor en la respuesta al escalon el sobrevalor ser a mayor cuanto mayor sea el tiempo de respuesta del lazo cerrado.
de control r (meLos polos inestables demandar an accion apida para un mejor desempeno nor sobrevalor). Cuanto mayores (m as r apidos) sean los polos inestables, mayor ser a esta demanda. Ejemplo 7.5. Supongamos que nuestra planta a lazo abierto tiene un polo en p = 2. Enton del lazo cerrado (estable) ces tenemos que la cota en sobrevalor en la respuesta al escalon es ysob tc . Si disenamos el controlador para obtener un tiempo de crecimiento tr = 1s, el sobrevalor ser a mayor al 100 %! Para una respuesta razonable deber amos elegir al menos tc 0,2s. Corolario 7.2 (Ceros de fase no m nima y subvalor). Si la planta tiene un cero de fase no tiene forzosamente subvalor. M si te m nima real en q > 0, su respuesta al escalon as aun, es el tiempo de establecimiento a un nivel del sistema a lazo cerrado, entonces se cumple que 1 ysub qte . e 1 Demostraci on. Similar a la del Corolario 7.1. Ejercicio. del Corolario 7.2 es que si la planta tiene un cero real de fase no m La interpretacion nima, necesariamente hay subvalor en la respuesta al escalon el pico del subvalor ser a mayor cuanto menor sea el tiempo de establecimiento del lazo cerrado. de control lenta para un mejor desempeno Los ceros de fase no m nima demandar an accion (menor subvalor). Cuanto menores (m as lentos) sean los ceros de fase no m nima, mayor ser a esta demanda. podemos extraer las siguientes reglas pr b En conclusion acticas de diseno asicas para evitar sobrevalor o subvalor excesivos: 1. El polo dominante a lazo cerrado deber mayor (en magnitud) que cualquier polo inestable a lazo abierto del sistema. 2. El polo dominante a lazo cerrado deber menor (en magnitud) que el menor cero no m nima fase del sistema. Vemos que entre las plantas inestables y no m nima fase, aquellas que posean polos a lazo abierto a la derecha de sus ceros en C+ ser an m as dif ciles, ya que no podremos satisfacer ambas reglas simult aneamente, y habr a un compromiso inevitable entre reducir sobrevalor o subvalor. El siguiente resultado considera este caso. Corolario 7.3 (Plantas inestables y no m nima fase). Consideremos el esquema de control (s) (s) = K (s) G unitaria. Supongamos que L de un grado de libertad con realimentacion tiene un cero real q > 0 y un polo real p > 0, con p = q. Entonces

6j 6j e
x
-
Figura 7.10: Caso manejable
Figura 7.11: Caso dif cil
1. si p < q el sobrevalor satisface ysob 2. si q < p el subvalor satisface ysub
p , qp q . pq
(7.15)
(7.16)
Demostraci on. Para el caso 1, combinando las relaciones integrales de los Teoremas 7.3 y 7.4 sobre polos inestables y ceros de fase no m nima obtenemos
1 (e pt eqt )(e(t))dt) = . q
de sobrevalor entonces sigue De la denicion 1 ysob q
(e pt eqt )dt
(7.17)
= ysob
qp . pq
(7.15) sale inmediatamente de (7.17) pues q > p. De la misma Finalmente, la relacion manera se prueba 2 usando las restantes relaciones integrales y usando el hecho de que p > q. Ejemplo 7.6. Consideremos el sistema de p endulo invertido de la Figura 7.12. El modelo linealizado alrededor del origen de este transferencia entre la fuerza sistema tiene la siguiente funcion del carro y: u y la posicion (s) y (s q)(s + q) = (s) u M(s2 (s p)(s + p)
m mg
y donde q = g/ y p = q 1 + m/ M. Vemos que el sistema satisface las condiciones del corolario anterior. Si normalizaFigura 7.12: P endulo invermos para que q = 1 y consideramos m = M, obtenemos que tido p = 2. Entonces el corolario anterior predice un subvalor La Figura 7.13 muessuperior a 2 en la respuesta al escalon! tra los resultados de simulaciones del lazo cerrado controlado con distintas velocidades de respuesta. Vemos que el subvalor es en todos los casos mucho mayor que la cota inferior de 2.
y(t) 14.20 10.76 7.32 3.88 0.44 -3.00 -6.44 -9.88 -13.32 -16.76 -20.20 0.00 2.86 5.71 8.57 11.43 14.29 17.14 20.00
Figura 7.13: Respuesta a lazo cerrado del p endulo invertido
7.5. Resumen
pr La implementacion actica de un sistema de control est a afectado de perturbaciones e apart incertidumbres de modelado que afectar an su desempeno, andolo de las especica Algunas de estas perturbaciones e incertidumbres ciones idealizadas en la etapa de diseno. si se lleva a cabo un diseno robusto. pueden tenerse en cuenta de cierta forma en el diseno Distinguimos las propiedades de robustez en 1. Estabilidad robusta: el sistema real preserva las caracter sticas de estabilidad (Lyapu1 nov, BIBO, etc.) del sistema nominal. robusto: el sistema real preserva las caracter 2. Desempeno sticas de respuesta a referencias y rechazo de perturbaciones del sistema nominal. El an alisis de las propiedades de robustez y rechazo de perturbaciones Estabilidad nominal nominal Desempeno Estabilidad robusta robusto Desempeno del sistema de control puede hacerse a priori, sin embargo, mediante las funciones de sensibilidad, que capturan funciones transferencia cruciales en el lazo de control. Los ceros y polos a lazo abierto en el semiplano derecho C+ imponen restricciones fundamentales en la respuesta del sistema. Estas restricciones valen para todo controlador estabilizante.
1
En lo que sigue, con estabilidad nos referiremos a estabilidad interna asintotica.
compromiso velocidad/sobrevalor si la planta tiene un polo real instable, necesariamen Cuanto m el lazo te existir a sobrevalor en la respuesta al escalon. as lento se disene cerrado, mayor ser a el sobrevalor. compromiso velocidad/subvalor si la planta tiene un cero real no m nima fase, necesaria Cuanto m el lazo mente existir a subvalor en la respuesta al escalon. as r apido se disene cerrado, mayor ser a el subvalor. aceptable, los polos inestables requieEstos compromisos indican que para un desempeno ren un lazo cerrado r apido, mientras que los ceros no m nima fase uno lento.
7.6.
Ejercicios
(s) = de una planta con modelo G Ejercicio 7.1. Considerar el control en realimentacion 1 . Suponiendo que el controlador es tal que la sensibilidad complementaria es (s+1)2 (s) = T 4 , (s + 2)2
( s ), transferencia del controlador K 1. calcular la funcion calcular la respuesta en r 2. si la referencia es un escalon, egimen permanente de la senal de entrada de la planta. 3. calcular el m aximo error instant aneo en la salida siguiendo a esta referencia. 0 (s) = 1/s2 . Un Ejercicio 7.2. El modelo nominal de una planta es un doble integrador G modelo m as detallado (que tomamos como la planta real) incluye un retardo, de for se sabe que pertenece al intervalo [0, 0,1]. Expresar esta ma que G (s) = e s /s2 , y solo W2 () tal que incertidumbre como multiplicativa y obtener una funcion ( j) G 1 W2 (), 0 ( j) G
, .
transferencia de una planta est Ejercicio 7.3. La funcion a dada por 0 (s) = G k , s2
donde la ganancia k es incierta pero se sabe que pertenece al intervalo [0,1, 10]. Representar la familia de plantas posibles con un modelo de incertidumbre multiplicativa, eligiendo peso W2 () tales que una planta nominal y una funcion ( j) G 1 W2 (), 0 ( j) G
, k.
0 (s) = 1/s2 , el requerimienEjercicio 7.4. Para el modelo nominal de un doble integrador G es que la salida de la planta siga referencias en el intervalo de frecuencias to de desempeno peso de desempeno W1 () puede elegirse como la magnitud de un ltro [0, 1]. La funcion pasa-bajos de magnitud constante en este rango de frecuencias, y que decae a frecuencias
mayores, como por ejemplo un ltro Butterworth. Elegir un ltro Butterworth de tercer orden para W1 () con frecuencia de corte 1rad/s. Tomar el peso W2 () como W2 () = j . 0,1 j + 1
(s) para obtener estabilidad nominal del lazo de con un controlador propio K 1. Disenar trol. 0 ( j)| < 1. Si no se satisface, de estabilidad robusta |W2 () T 2. Chequear la condicion K (s) hasta conseguirlo. No es necesario obtener buen desempeno. redisenar de estabilidad robusta se satisface, el m 3. Si la condicion nimo nivel de desempeno robusto es el valor 0 ( j) W1 () S sup . 0 ( j)| 1 |W2 () T Cu al es el valor de alcanzado por el controlador elegido? de Ejercicio 7.5. Obtener los par ametros de la respuesta al escalon (s) = G
s (3 1)(s 1) s ( 4 + 1)(s2 + s + 1)
Ejercicio 7.6. Probar el Teorema 7.4 y el Corolario 7.2. Ejercicio 7.7. Dado el sistema (s) = G 1 (2s 1)
(s) = k1 + k2 , para obtener error est un controlador PI, K disenar atico nulo y un tiempo s de crecimiento tc 1s. Estimar el sobrevalor en la respuesta usando (7.13). Cu al es el sobrevalor efectivo en el sistema? Ejercicio 7.8. El modelo nominal de una planta es (s) = G 5(s 1) . (s + 1)(s 5)
de un grado de libertad. Esta planta debe controlarse con un lazo en realimentacion 1. Determinar las restricciones en la respuesta al escalon. 2. Por qu e es el control de esta planta especialmente dif cil? Discutir. Ejercicio 7.9. Considerar la planta dada por (s) = G s zp . s(s p p )
1. Obtener expresiones para los par ametros kc , zc , pc del controlador (s) = kc s zc K s pc de forma tal que los polos de lazo cerrado est en todos en s = 1.
2. Tabular los par ametros del controlador y cotas para el sobrevalor y el subvalor2 de la del sistema a lazo cerrado para los siguientes casos: respuesta al escalon Caso 1 0.5 -0.5 Caso 2 0.5 0.2 Caso 3 0.2 0.5
zp pp kc zc pc ysob ysub
3. Con los valores calculados simular el sistema a lazo cerrado y medir los valores efec tivos de sobrevalor y subvalor obtenidos. Comparar con las cotas teoricas. Caso 1 ysob = ysub = Caso 2 Caso 3
Tomar un tiempo de establecimiento te al = 3 % de aproximadamente te = 7s.
Bibliograf a
193
Cap tulo 8 de Estados y Realimentacion Observadores

La teor a de sistemas lineales que vimos da la base para la teor a de control lineal. En este cap tulo introducimos los conceptos y t ecnicas de control en sistemas descriptos por consideraremos sistemas estacionarios. variables de estado. Solo del comportamiento de un sistema La teor a de control lineal involucra la modicacion de m entradas, p salidas y n estados (t) = Ax(t) + Bu(t) x y(t) = Cx(t), (8.1)
de una que llamamos la planta o ecuaci on de estados en lazo abierto, mediante la aplicacion lineal de estados de la forma realimentacion u(t) = Nr(t) Kx(t), (8.2)
de entrada. La matriz K es la ganancia de donde r(t) es el nuevo nombre para la senal realimentaci on de estados y N la ganancia de precompensaci on. de (8.2) en (8.1) da la ecuaci La substitucion on de estados en lazo cerrado (t) = ( A BK ) x(t) + BNr(t) x y(t) = Cx(t). (8.3)
Es obvio que el sistema a lazo cerrado tambi en es lineal y estacionario. La Figura 8.1 re de estados para un sistema SISO. El presenta el esquema de control por realimentacion de valores presentes de los estados x y la referencia control es est atico, pues u depende solo r. Cuando los estados del sistema no pueden medirse, se recurre a estimarlos mediante un de observador de estados, que reconstruye x a partir de mediciones de y y u. La combinacion de estados es un controlador din un observador y realimentacion amico por realimentacion de salida, esquematizado en la Figura 8.2. En este cap tulo veremos de K para t ecnicas de diseno (ubicacion de polos), estabilizacion y seguimiento (desempeno y robustez), esquemas de regulacion 144
de Estados y Observadores 8. Realimentacion
c - N
- j - B 6
- j6
- C
-c
A K de estados Figura 8.1: Realimentacion
b - j - B 6
- j6
- C
-b
A x
Observador
K
de salida con observador Figura 8.2: Realimentacion
de observadores. t ecnicas de diseno La meta a alcanzar: un sistema de control lineal por realimentacion saber disenar de estados + observador) para sade salida (v a realimentacion y tisfacer especicaciones deseadas de estabilidad, desempeno robustez. En la primera mitad del cap tulo introducimos las t ecnicas para sistemas SISO. En la segunda, presentamos una t ecnica para sistemas MIMO. Veremos otra t ecnica (optima) para sistemas MIMO en el cap tulo que sigue.
8.1.
de Estados Realimentacion
Comenzamos con sistemas SISO y el esquema de control de la Figura 8.1, suponiendo por el momento el precompensador N = 1 para simplicar la notacion. de estados es la de Una propiedad de sistemas lineales esencial en la realimentacion importante es que controlabilidad. Nuestra primer observacion La controlabilidad de un sistema es invariante con respecto de estados. a realimentacion Teorema 8.1 (Invariancia de la controlabilidad respecto a realimentacion). El par ( A 1n si el par ( A, B) es controlable. BK , B), para cualquier vector K , es controlable si y solo
Demostraci on. La matriz de controlabilidad del sistema a lazo abierto (8.1) es
C = [ B, AB, A2 B, . . . , An1 B],

y la matriz de controlabilidad del sistema a lazo cerrado (8.3) es
CK = [ B, ( A BK ) B, ( A BK )2 B, . . . , ( A BK )n1 B].
No es dif cil chequear que C y CK est an relacionadas de la forma 1 KB K ( A BK ) B . . . K ( A BK )n2 B 0 1 KB . . . K ( A BK )n3 B 0 0 1 . . . K ( A BK )n4 B CK = C . . . . . . . . . . . . . . . 0 0 0 ... 1 nn Notar que como K es 1 n y B es n 1, todas las entradas de la matriz que multiplica a C son escalares. Como esta matriz es no singular, el rango de C es igual al rango de CK . si (8.3) es controlable. As (8.1) es controlable si y solo de estados, la Aunque la controlabilidad es invariante con respecto a la realimentacion observabilidad no lo es, como se ve en el siguiente ejemplo. Ejemplo 8.1. El sistema (t) = x 1 2 0 x(t) + u(t) 3 1 1
(8.4)
y(t) = 1 2 x(t)
2 es controlable y observable, ya que las matrices de controlabilidad C = [ B AB ] = [ 0 1 1 ], y C 2 observabilidad O = [ CA ] = [1 7 4 ], son no singulares. de estados u(t) = r(t) [ 3 1 ] x(t) en (8.4) lleva al sistema El control por realimentacion a lazo cerrado
(t) = x
1 2 0 x(t) + u(t) 0 0 1
(8.5)
y(t) = 1 2 x(t).
2 La matriz de controlabilidad de (8.5) es CK = [ 0 1 0 ], que es no singular y comprueba que el sistema realimentado es controlable. Sin embargo, la matriz de observabilidad de (8.5) es 2 no es observable. O = [1 1 2 ], que es singular, por lo que el sistema con esta realimentacion
La observabilidad de un sistema no es invariante con res de estados. pecto a realimentacion El siguiente ejemplo ilustra lo que puede conseguirse con realimentacion. Ejemplo 8.2. La planta (t) = x 1 3 1 x(t) + u(t) 3 1 0
de Estados y Observadores 8. Realimentacion con polinomio caracter tiene una matriz de evolucion stico
(s) = (s 1)2 9 = s2 2s 8 = (s 4)(s + 2), y, como se ve, autovalores 4 y 2, por lo que es inestable. Consideremos un control u = r [k1 k2 ] x. El sistema a lazo cerrado queda = x 1 3 k k 1 2 3 1 0 0 x+ 1 r 0
1 k1 3 k2 1 x+ r. 3 1 0
tiene el polinomio caracter La nueva matriz de evolucion stico K (s) = (s 1 + k1 )(s 1) 3(3 k2 )
= s2 + (k1 2)s + (3k2 k1 8).

Est a claro que las ra ces de K (s) o, equivalentemente, los autovalores del sistema a lazo mediante una eleccion adecuada de k1 y k2 . cerrado pueden ubicarse en cualquier posicion Por ejemplo, si los dos autovalores se ubican en 1 j2, el polinomio caracter stico deseado es (s + 1 j2)(s + 1 + j2) = s2 + 2s + 5. Igualando k1 1 = 2 y 3k2 k1 8 = 5 da K = [4 17/3] mover k1 = 4 y k2 = 17/3. As la ganancia de realimentacion a los autovalores de 4, 2 a 1 j2. de estados permite ubicar los autovalores del El ejemplo muestra que la realimentacion y que la ganancia de realimentacion K puede sistema realimentado en cualquier posicion, directa. Sin embargo, el m calcularse por substitucion etodo del ejemplo no es pr actico para no queda claro que rol jugo la controlabilidad en esta asigmayores dimensiones. M as aun, de autovalores. Para formular un resultado general de ubicacion de autovalores renacion currimos a la forma can onica del controlador, vista en el Cap tulo 4: Si C = [ B, AB, . . . , An1 B] es no singular, el sistema (8.1) puede llevarse a la forma 0 1 0 0 0 0 0 1 0 0 . . . .. (t) = . . . . . . (t) . x x u(t) . . . . . . (8.6) 0 0 0 0 1 n n1 n2 1 1 (t), y ( t ) = n n1 n2 1 x = Px, donde mediante el cambio de coordenadas x n1 n2 n2 n3 . . . . . P1 = B AB A2 B . . . An1 B . 2 1 1 1 1 0 (s) queda dada por transferencia G La funcion (s) = G 1 s n1 + 2 s n2 + + n s n + 1 s n1 + 2 s n2 + + n (8.8) 1 0 . . . . 0 0 0
. . . 2 1 . . . 1 1 . . . ... . . . ... 0 0 ... 0 0 ... 0 0
(8.7)
Teorema 8.2 (Asignacion de autovalores). Si la EE (8.1) es controlable, entonces mediante de estados u = r Kx, donde K es un vector real constante 1 n, los la realimentacion autovalores de A BK pueden ser asignados arbitrariamente, siempre que los autovalores complejos conjugados se asignen en pares. yB Demostraci on. Si (8.1) es controlable puede llevarse a la forma (8.6). Denotemos con A 1 = PAP y B = PB. Puede verse tambi las matrices en (8.6). As tenemos que A en que C B n1 B , A , . . . , A ] = P[ B, AB, . . . , An1 B] = PC , [B (8.9)
1 y la matriz de la extrema derecha en (8.7) es C . por lo que P1 = C C = Px en la realimentacion de x de estados da La substitucion u = r Kx = r KP1 x x , rK
B B = KP1 . Puesto que A K = P( A BK ) P1 , vemos que A BK y A K donde K tienen los mismos autovalores. Ahora, de cualquier conjunto de n autovalores deseados podemos formar el polinomio caracter stico deseado K (s) = sn + 1 s n1 + + n. (8.10) = [ Si elegimos K n n , . . . , 2 2 , 1 1 ], viene (en las nuevas coordenadas) 0 1 0 0 0 1 . . . (t) = . . . x . . . 0 0 0 n n1 n2 de estado de lazo cerrado dela ecuacion 0 0 0 0 . . .. . (t) . x u(t) . . . 1 0 1 1
(t). y ( t ) = n n1 n2 1 x B K ), y consecuentemenPor estar en forma companion, el polinomio caracter stico de ( A te el de ( A BK ), es (8.10). As el sistema realimentado tiene los autovalores deseados. en las coordenadas originales es, usando (8.9), Finalmente, la ganancia de realimentacion 1 . =K CC K = KP
transferencia del sistema cambia de (8.8) a En lazo cerrado, la funcion K (s) = G 1 s n1 + 2 s n2 + + n , sn + 1 s n1 + 2 s n2 + + n (8.11)
lo que muestra que si bien hemos movido los polos del sistema, sus ceros han quedado invariantes. Esta es una propiedad general: de estados puede mover los polos de una La realimentacion efecto sobre los ceros. planta pero no tiene ningun
de estados puede alterar la propiedad Esta propiedad explica por qu e la realimentacion para de observabilidad, ya que uno o m as polos pueden ubicarse mediante realimentacion cancelar ceros del sistema, lo que vuelve esos modos inobservables. Resumimos los pasos para calcular K en el siguiente procedimiento: Procedimiento para asignacion de autovalores (via forma canonica) 1. Obtener los coecientes 1 , 2 , . . . , n del polinomio caracter stico (s) del sistema a lazo abierto. 2. Formar las matrices de controlabilidad C = [ B, AB, . . . , An1 B] y
n1 n2 ... 2 1 1 n2 n3 ... 1 1 0
= . . C .
2 1 1
1 1 0
. . .
... . . . . . . ... 0 0 0 ... 0 0 0 ... 0 0 0
. . .
1 .
3. Elegir los coecientes 1, 2, . . . , n del polinomio caracter stico deseado K (s) y de en coordenadas de x terminar la ganancia de realimentacion = [ K n n , . . . , 2 2 , . . . , 1 1 ]. en coordenadas originales 4. Determinar la ganancia de realimentacion 1 . CC K=K
8.1.1.
Otra receta para calcular K
de una ecuacion de LyapuUn m etodo alternativo para calcular K involucra la solucion M ATLAB lyap, por ejemplo). Este m nov (mediante la funcion etodo, sin embargo, tiene la de que los autovalores deseados no pueden ser ninguno de los autovalores de restriccion A. Una ventaja del m etodo es que se extiende directamente al caso MIMO. Procedimiento para asignacion de autovalores (via Lyapunov) Considerar un par ( A, B) controlable, donde A es n n y B n 1. Encontrar un vector real 1 n K tal que ( A BK ) tenga cualquier conjunto de autovalores deseados que no contenga autovalores de A. 1. Elegir una matriz n n cualquiera F que tenga los autovalores deseados. tal que ( F, K ) sea observable. 2. Elegir un vector 1 n cualquiera K . unica de Lyapunov AT TF = BK 3. Calcular solucion T de la ecuacion 1 . K = KT 4. Calcular la ganancia de realimentacion K = place(A,B,P) que calcula K para ubiConvenientemente, M ATLAB tiene la funcion car los autovalores en los valores dados en el vector P. Restricci on: no permite repetir autovalores.
8.2. Estabilizacion
de estado es controlable, sus autovalores pueden asignarse arbitrariaSi una ecuacion de estados. Veamos qu mente mediante realimentacion e se puede hacer cuando la ecuacion de estado no es controlable. de estado incontrolable puede llevarse a la forma Toda ecuacion c A 12 c x A = c c 0 A c x B + c u c x 0 (8.12)
c, B c ) es controlable. Como la matriz de evolucion en (8.12) es block triangular, los donde ( A de los autovalores de autovalores de la matriz en las coordenadas originales son la union de estados Ac y Ac. La realimentacion 1 k 2 x = r k u = r Kx = r K lleva al sistema a lazo cerrado c B 12 B c K1 A cK 2 c x A = c c 0 A c x B + c r. c x 0 (8.13) c x c x
c no son afectados por la realimentacion, y por Vemos de (8.13) que los autovalores de A de controlabilidad de ( A, B) no lo tanto no pueden modicarse. Por lo tanto, la condicion es suciente sino tambi solo en necesaria para asignar todos los autovalores de ( A BK ) en posiciones deseadas. c es Hurwitz1 y el Denicion 8.1 (Estabilizabilidad). El sistema (8.12) es estabilizable si A c, B c ) es controlable. par ( A m La propiedad de estabilizabilidad es una condicion as d ebil que la de controlabilidad para alcanzar estabilidad a lazo cerrado. Es equivalente a pedir que los autovalores no controlables sean estables.
8.3.
y Seguimiento Regulacion
El problema de regulaci on se da cuando la referencia es nula r = 0; se pretende b asica mente que el sistema sea asintoticamente estable y que la respuesta a condiciones iniciales producidas por perturbaciones tienda a cero. El problema de seguimiento (o del servomecanismo) se da cuando se pretende que la salida que la referencia sea reproduzca asintoticamente (que tienda a) la referencia r(t). Es comun es un caso particular del de un valor constante r(t) = a, t 0. El problema de regulacion seguimiento con a = 0. Si el sistema es controlable, sabemos que podemos asignar los autovalores del lazo ce A BK. La respuesta del sistema rrado calculando K para obtener la matriz de evolucion realimentado entonces est a dada por y(t) = Ce( ABK)t x(0) + C
0
1
e( ABK)(t ) Br( ) d .
Tiene todos sus autovalores con parte real negativa.
(r(t) 0) queda resuelto si K se calcula para que A BK As , el problema de regulacion sea Hurwitz, ya que entonces y(t) = Ce( ABK)t x(0) 0
t
inicial x(0). para toda condicion
Para el problema de seguimiento de referencia constante r(t) = a = 0, adem as de que en la ganancia de precompensaci A BK sea Hurwitz, requerimos una condicion on N , para t que y(t) a, y(t) = Ce( ABK)t x(0) + NC
0 t
e( ABK)(t ) Bd
a a
0
Ce( ABK) Bd = 1
N
0
NC (sI A + BK )1 B s=0 = 1 1 N= C ( A BK )1 B
(8.14)
transferencia a lazo cerrado Como C (sI A + BK )1 B es la funcion K (s) = G 1 s n1 + + n sn + 1 s n1 + + n
(8.14) es equivalente a N = necesaria que la condicion n /n . Obviamente, es condicion n = 0. Regulacion: Es necesario que ( A, B) sea controlable. Se requiere entonces K para que todos los autovalores de A BK tengan parte real negativa. disenar Seguimiento de referencias constantes: Necesitamos l ms0 C (sI A)1 B = 0. Se requiere entonces N = 1/C ( A BK )1 B. disenar de controlabilidad del par ( A, B) puede relajarse a la de estabilizabilidad. La condicion estar La restriccion a en que no habr a entonces control total de la velocidad de convergencia del error. Si hubiera modos no controlables muy cercanos al eje j, la respuesta podr a ser y seguimiento satisfactorios. demasiado lenta u oscilatoria para considerar la regulacion Ejemplo 8.3 (Seguimiento de referencia constante). En el Ejemplo 8.2 calculamos la ga K = [4, 17/3] que asigna los autovalores a lazo cerrado del sistenancia de realimentacion ma 1 3 1 1 (t) = k1 k2 x(t) + x r(t) 0 3 1 0 en 1 j2. Supongamos que el sistema tiene la salida y(t) = [1, 0] x(t), que se pretende transferencia del sistema a lazo que siga asintoticamente referencias constantes. La funcion cerrado resulta s1 K (s) = G 2 s + 2s + 5
( A, B) controlable y n
K para que todos los autovalores de A BK tengan parte real negativa, disenar
K (0) = 1/5 = 1, y(t) tender Como G a a a/5 para una referencia constante r(t) = a. redisenando Incorporamos precompensacion u(t) = Nr(t) Kx(t), con N = 5. unitaLa Figuras 8.3 y 8.4 muestran la respuesta del sistema a lazo cerrado a un escalon La funcion transferencia del sistema a lazo cerrado rio en r(t) sin y con precompensacion. con precompensador resulta K (s) = 5s + 5 , G s2 + 2s + 5
t K (0) = 1 y(t) G a.
0.2 1.4
0.1
1.0
0.6
0.2 -0.1
-0.2 -0.2 -0.6
-0.3 0 1 2 3 4 5 6 7 8 9 10 -1.0 0 1 2 3 4 5 6 7 8 9 10
Figura 8.3: Respuesta sin precompensa cion
Figura 8.4: Respuesta precompensada
Ejemplo 8.4 (Efecto de incertidumbres en el modelo). Retomemos el sistema anterior, pero de control y la planta supongamos que existe un error en el modelo usado para el diseno real tiene una matriz de evolucion A = A0 + A = 1 3 0 0,5 + 3 1 0,5 0
La transferencia desde w a y no estar a precompensada, y por lo tanto se originar a un error est atico proporcional al valor de n w/ n . Otra vez, se conserva la estabilidad pero se pierde el seguimiento. es decir que los autovalores a lazo abierto est an en [4,464, 2,464], transferencia del sistema real compensado con la ganancias K en vez de [4, 2]. La funcion y N calculadas en base al modelo nominal es ahora K (s) = G
5s + 5 s2 + 2s + 8,0833
y, aunque la estabilidad se ha conservado, la propiedad de seguimiento se ha perdido. Este robusto; requiere conocer la planta con exactitud. esquema de control no tiene desempeno Ejemplo 8.5 (Efecto de perturbaciones a la entrada de la planta). Sea ahora el mismo sis constante w = 0,5 a la entrada de tema, con el modelo correcto, pero con una perturbacion la planta, como se muestra en la Figura 8.7. La Figura 8.6 muestra la respuesta del sistema perturbado.
1.1 0.9
1.5
1.1 0.7 0.5 0.3 0.1 -0.1 -0.1 -0.3 -0.5 -0.7 -0.9 0 1 2 3 4 5 6 7 8 9 10 -0.9 0 1 2 3 4 5 6 7 8 9 10 0.3
0.7
-0.5
Figura 8.5: Respuesta del sistema con incertidumbre
Figura 8.6: Respuesta del sistema con de entrada. perturbacion
w c
c - N
u ? - j - j - B - 6
- j6
- C
y- c
A K a la entrada Figura 8.7: Sistema con perturbacion
8.3.1.
Integral Seguimiento Robusto: Accion
Introducimos un esquema robusto de seguimiento de referencias constantes con propiedades de rechazo de perturbaciones de entrada constantes. El esquema se basa en aumentar la planta agregando un nuevo estado xi que integra el error de seguimiento, i = r y = r Cx, x como se muestra en la Figura 8.8. w c
c - j -
i A xki
u ? - j - j - B 6
- j6
- C
y- c
A K
Figura 8.8: Esquema de seguimiento robusto de entrada es La EE del sistema original con perturbacion = Ax + Bu + Bw x y = Cx. de modo que el sistema aumentado a lazo abierto queda x A 0 = i x C 0 y= C 0 x B 0 + (u + w) + r xi 0 1 x . xi
x de estados u = [ K ki ] [ x La realimentacion i ] da el sistema a lazo cerrado de la Figura 8.8
x A BK Bki = i x C 0 y= C 0 x . xi
x B 0 + w+ r xi 0 1
(8.15)
A BK Bki [K , ki ] para que la matriz de evolucion La idea entonces es disenar en (8.15) C 0 de xi impl sea Hurwitz. En particular, la estabilizacion citamente produce el seguimiento deseado, ya que i (t) = 0 l l m x m y(t) = r. t t
Cabe preguntarse si el sistema aumentado ser a controlable. . .
Teorema 8.3 (Controlabilidad de la planta aumentada con un integrador). Si ( A, B) es (s) = C (sI A)1 B no tiene ceros en s = 0, los autovalores de la matriz controlable y si G BK Bki aumentada A de evolucion en (8.15) pueden asignarse arbitrariamente seleccioC 0 [ K , k i ]. nando la matriz de realimentacion Demostraci on. Ver Chen [1999, p. 244-245]. en En t erminos de polos y ceros: si la planta tuviera un cero en s = 0, su conexion polo-cero inestable y har cascada con el integrador de xi producir a una cancelacion a que la planta aumentada sea no controlable. Propiedades de seguimiento y rechazo de perturbaciones. Intercambiando el orden de los sumadores donde entran w y Kx en la Figura 8.8 obtenemos el diagrama de bloques de la Figura 8.9, donde (s) = N (s) C (sI A + BK )1 B, G (s) D (s) = det(sI A + BK ). La respuesta del sistema en dominio s es entonces: con D (s) = y
(s) ki N (s) sD (s) N + ksiD (s) (s) N (s) D (s) N + ksiD (s)
(s) + r
(s) w
(s) (s) ki N sN (s). r ( s ) + ( s ) + ki N (s) ( s ) + ki N (s) w sD sD w c
c - j -
ki s
? - j -
y- c
Figura 8.9: DB equivalente. de entrada son constantes, r(t) = a, w(t) = b, entonces Si la referencia y la perturbacion (s) = a/s y w (s) = b/s, y la salida del sistema a lazo cerrado es r (s) (s) ki N a N (s) = y + (s) s s D ( s ) + ki N (s) b. s D ( s ) + ki N Finalmente, usando el Teorema del valor nal, v alido pues el lazo cerrado es estable, y la (0) = 0, obtenemos que hipotesis de que N
t
(s) l m y(t) = l m s y
s0
(0) (0) 0N ki N a + ( 0 ) + ki N (0) ( 0 ) + ki N (0) b. 0D 0D = 1 a + 0 b = a.
El sistema rechazar a perturbaciones constantes y seguir a referencias constantes ambas frente a incertidumbres de modelado de la de valor no necesariamente conocido aun planta, siempre que el lazo cerrado permanezca estable.
8.4. Observadores
de estados asume la disponibilidad de las variables de esEl control con realimentacion tado. Este puede no ser el caso en la pr actica, ya sea porque ciertos estados no son medibles, de estados, eno es muy dif cil o muy caro medirlos. Para implementar una realimentacion un dispositivo din tonces, debemos disenar amico, llamado observador o estimador de estados, introducimos observadocuya salida sea una estima del vector de estados. En esta seccion res de orden completo, donde el observador tiene el mismo orden que la planta es decir, (t) a la estima de x(t). estimamos todo el vector de estados. Denotamos con x Consideramos entonces el sistema (t) = Ax(t) + Bu(t) x y(t) = Cx(t), (8.16)
donde A, B y C son conocidas, y la entrada u(t) y salida y(t) son medibles, aunque no el estado x(t). El problema es estimar x(t) de esta informacion.
8.4.1.
Observador a lazo abierto Una primer solucion:
de estados original construyendo el Conociendo A y B, podemos duplicar la ecuacion sistema (t) = A x (t) + Bu(t). x (8.17) Este sistema podr a construirse en forma electronica con amplicadores operacionales, o, discretizado, mediante un programa en una computadora y una placa de entradas/salidas, como podr a ser un PLC moderno. es un observador a lazo abierto (Figura 8.10). Si los sistemas (8.16) y (8.17) Esta duplicacion tuvieran las mismas condiciones iniciales, entonces para toda entrada u(t) tendr amos que (t) = x(t), t 0. x
c - B
- j6
- C
-c
A
- B - j6
x
-
A Figura 8.10: Observador en lazo abierto El problema se reduce entonces a estimar el estado inicial. Si el sistema es observable, su estado inicial x(0) puede computarse a partir de u(t) e y(t) sobre cualquier intervalo, di (t2 ) = x(t2 ) y obtenemos gamos [0, t1 ]. Con x(0) calculamos x(t2 ), t2 t1 , y as poniendo x (t) = x(t)t t2 . x si el sistema es observable podemos usar un observador en lazo abierEn conclusion: to para estimar el vector de estados. Sin embargo, el observador en lazo abierto tiene las siguientes importantes desventajas:
1. Hay que calcular el estado inicial cada vez que usemos el estimador. 2. Si la matriz A tuviera autovalores con parte real positiva, entonces la menor diferencia (t0 ) para algun (t) (t) t0 har x entre x(t0 ) y x a que el error de estimacion x(t) x crezca con el tiempo.
8.4.2.
mejor: Observador a lazo cerrado Una solucion
hemos usado la informaNotemos que aunque ambas u(t) e y(t) est an disponibles, solo de u(t) para construir el observador a lazo abierto. Usamos entonces y(t) para mejorar cion anterior introduciendo una correccion proporcional al error de estimacion en la el diseno salida (t) = C ( x(t) x (t)). y (t)), donde L es una anterior la senal de correccion L( y(t) C x Inyectamos en el diseno
c - B
- j6
- C
-c
A
L j 6 C - B
?x - j6
Ax
x
-
A Figura 8.11: Observador en lazo cerrado pero si hay matriz n 1 de ganancia constante. As , si no hay error, no se hace correccion, apropiado de L podr tienda asintotica error, un diseno a hacer que el error de estimacion mente a cero. El esquema obtenido (Figura 8.11) se llama observador a lazo cerrado, observador asint otico, o simplemente observador. La Figura 8.12 muestra el mismo esquema en forma simplicada. De la Figura 8.11, las ecuaciones del observador son (t) = A x (t) + Bu(t) + L( y(t) c x (t)) x (t) + Bu(t) + Ly(t). = ( A LC ) x Denamos el error de estimacion (t) = x(t) x (t). x
(8.18)

c - B
Notas de CAUT2 - 158 x

- C -c
- j6
A
?
B x

? x x j
A - A LC 6
L
Figura 8.12: Observador en lazo cerrado
(t) tienda asintoticamente Veamos qu e condiciones debe cumplir L para que x a cero. Deri (t) y substituyendo (8.16) y (8.18), obtenemos vando x (t) = x = = = (t) (t) x x (t) Bu(t) LCx(t) Ax(t) + Bu(t) ( A LC ) x (t) ( A LC ) x(t) ( A LC ) x (t). ( A LC ) x
(8.19)
(8.19) gobierna la din Si todos los autovalores La ecuacion amica del error de estimacion. de ( A LC ) se pudieran asignar de forma que tengan parte real menor que, digamos, , en todos los estados decrecer con > 0, entonces el error de estimacion a a una velocidad t mayor o igual a e . As , aunque hubiera un error grande en los estados iniciales, el estado (t) podr estimado x a aproximarse al estado real x(t) r apidamente. Teorema 8.4 (Asignacion de Autovalores en Observadores). Dado el par ( A, C ), todos los autovalores de ( A LC ) pueden asignarse arbitrariamente seleccionando un vector real L si ( A, C ) es observable. si y solo el par ( A, C ) es observable Demostraci on. Recurriendo a la dualidad control/observacion, si ( AT , C T ) es controlable. Si ( AT , C T ) es controlable todos los autovalores de si y solo adecuada de K. La ( AT C T K ) pueden asignarse arbitrariamente mediante una eleccion transpuesta de ( AT C T K ) es ( A K T C ) y por lo tanto L = K T . de As , los mismos procedimientos usados para calcular la matriz de realimentacion estados K sirven para calcular la matriz L del observador. Resumimos el procedimiento de Sylvester. Consideramos el sistema n-dimensional SISO dual al de la ecuacion (t) = Ax(t) + Bu(t) x y(t) = Cx(t). (8.20)
de Estados y Observadores 8. Realimentacion Procedimiento de diseno de observador
con 1. Elegir una matriz Hurwitz n n cualquiera F que no tenga autovalores en comun los de A. 2. Elegir un vector n 1 cualquiera L tal que ( F, L) sea controlable. unica de Sylvester TA FT = LC. 3. Calcular la solucion T , no singular, de la ecuacion de estados 4. Entonces la ecuacion (t) = Fz(t) + TBu(t) + Ly(t) z (t) = T z(t) x genera una estima asintotica de x(t). = z Tx. As Denamos el error como x , de TA = FT + LC obtenemos (t) = z (t) T x (t) = Fz(t) + TBu(t) + LCx(t) TAx(t) TBu(t) x (t). = Fz(t) + LCx(t) ( FT + LC ) x(t) = F ( z Tx(t)) = F x Como F es Hurwitz, el error debe tender asintoticamente a cero.
1
(8.21)
8.4.3.
Observador de orden reducido
Si el par ( A, C ) es observable, usando la matriz no singular C CA O= . . . CAn1 como cambio de base llevamos la matriz A a una forma companion donde 0 1 ... 0 0 . . . . .. . . . . . . . . . 1 A = O AO = 0 0 ... 1 0 0 0 ... 0 1 n n1 . . . 2 1 = C O 1 = 1 0 . . . 0 0 . C
(8.22)
En estas coordenadas la salida queda como el primer estado, y as , no es necesario construir un observador para estimar todo el estado, sino solamente los n 1 restantes. Este observador es de orden reducido.
de Estados y Observadores 8. Realimentacion Procedimiento de diseno de observador de orden reducido
1. Elegir una matriz Hurwitz (n 1) (n 1) cualquiera F que no tenga autovalores con los de A. en comun 2. Elegir un vector (n 1) 1 cualquiera L tal que ( F, L) sea controlable. unica de Sylvester TA FT = LC. 3. Calcular la solucion T , no singular, de la ecuacion Notar que T es una matriz (n 1) n. de estados de orden n 1 4. Entonces la ecuacion (t) = Fz(t) + TBu(t) + Ly(t) z C (t) = x T genera una estima asintotica de x(t). de observadores via la resolucion de la ecuacion de Sylvester es conveniente El diseno porque el mismo procedimiento sirve para observadores completos y reducidos y, como veremos, tambi en para sistemas MIMO.
1
y z
8.5.
de estados estimados Realimentacion

(t) = Ax(t) + Bu(t) x y(t) = Cx(t).
Consideremos nuevamente la planta
de estados u = r Kx asignar Si ( A, B) es controlable, la realimentacion a los autovalores deseada. Si las variables de estado no est de ( A BK ) en cualquier posicion an disponibles pero ( A, C ) es observable, podemos construir un observador de para la realimentacion el caso de orden completo o reducido con autovalores arbitrarios. Discutimos aqu solo observador completo (t) = ( A LC ) x (t) + Bu(t) + Ly(t). x (t) se aproximar La estima x a asintoticamente a x(t) a una velocidad determinada por la de L. eleccion (t) converge a x(t), es natural aplicar la realimentacion de estados a la estima Como x (t) x (t), u(t) = r(t) K x controlador-observador, es efectivamente como se muestra en la Figura 8.13. La conexion un controlador din amico que realimenta la salida. controlador-observador: Tres dudas b asicas surgen frente a la conexion 1. Los autovalores de A BK se obtienen de u = r Kx. Seguiremos teniendo los ? mismos autovalores con u = r K x a los autovalores del observador? 2. Afectar a la conexion

c - j
Notas de CAUT2 - 161 x x

- C -c
u-
- j6
A
?
B x K ? x x j
A - A LC 6
L
de estados estimados Figura 8.13: Realimentacion
transferencia a lazo cerrado? 3. Cu al ser a el efecto del observador en la funcion Para contestar a estas preguntas recurrimos a las EE que describe el sistema completo (jun): tando las del sistema y las del observador y con u = r K x x A BK = LC A LC BK x y= C 0 x . x x B + r x B
de equivalencia Consideremos la transformacion x x I 0 = = x xx I I x x P x . x (8.23)
(8.23) lleva al sistema controlador-observador a Notemos que P1 = P. La transformacion la forma x A BK BK = x 0 A LC y= C 0 x . x x B + r x 0
es block-triangular, los autovalores del sistema completo son Como la matriz de evolucion de los autovalores de A BK y A LC. Esto implica que el estimador no afecta la la union de estados original; tampoco son afectados los autovalores del observador realimentacion de estados. por la realimentacion del conPropiedad de separacion de control y observacion: Los disenos de estados y el observador pueden realizarse en trol por realimentacion forma independiente.
de Estados y Observadores 8. Realimentacion Finalmente, notemos que la EE x A BK BK = x 0 A LC y= C 0 x x x B + r x 0
evidencia los modos controlables y los no controlables. As , vemos que los modos del error (t) son no controlables, por lo que no aparecer x transfede estimacion an en la funcion de estados de orden rencia del sistema completo, que queda determinada por la ecuacion reducido = ( A BK ) x + Br x (s) = C (sI A + BK )1 B. , es decir: G y = Cx,
8.5.1.
Notas Historicas
Rudolph E. Kalman, considerado uno de los investigadores m as inuyentes en teor a de control, fue el l der en el desarrollo de una teor a rigurosa de sistemas de control durante 1960s. Sus contribuciones incluyen las nociones de los anos variable de estados, controlabilidad, observabilidad, control de estados, y el principio de superposipor realimentacion de control y observacion. cion junto a Richard Bucy, el esDurante 1960-1961, desarrollo, R.E. Kalman (1930-) timador optimo hoy conocido como ltro de Kalman, am radares, y sopliamente usado en sistemas de navegacion, nares, y tambi en en campos tan diversos como procesamiento de datos s smicos, plantas nucleares, instrumentaci on y econometr a. en el MIT, Nacido en Budapest, Hungr a, Kalman estudio su doctorado de la Columbia University (1957). Hoy y recibio es profesor em erito de estudios de postgrado de la University of Florida, y ad personam chair del Swiss Federal Institute of Technology en Zurich, Suiza.2 El concepto de observadores puede atribuirse a David G. como resultado de su tesis docLuenberger, que lo desarrollo toral (Stanford University, 1963). Su trabajo inclu a los aspectos b asicos de observadores, incluyendo observadores de orD.G. Luenberger den reducido y transformaciones canonicas. Actualmente, David Luenberger es profesor en el departa operacional de la Universidad mento de sistemas economicos, de ingenier a e investigacion de Stanford.
8.6.
de estados caso MIMO Realimentacion

= Ax + Bu x y = Cx
Si el sistema considerado
Nota historica extra da de un art culo de Eduardo Sontag en el SIAM News, 6/94.
de estados K en u = Kx tiene p n eletiene p entradas, la ganancia de realimentacion necesitamentos; es decir, hay un exceso de grados de libertad, ya que en principio solo mos n ganancias para asignar n autovalores a lazo cerrado del sistema. K para una dada conguracion En el caso de una sola entrada, existe una unica solucion de autovalores a lazo cerrado elegida. En el caso multi-entrada la ganancia K que da los autovalores a lazo cerrado elegidos no es unica Cu al elegir entonces? Este exceso de grados de libertad puede llegar a ser un problema si no est a claro como aprovecharlo. de K en el caso multi-entrada, Existen varias formas de atacar el problema de eleccion entre ellas: 1. Diseno c clico. Reduce el problema a uno de una entrada y aplica las t ecnicas conocidas. de Sylvester a multi2. Diseno v a ecuaci on de Sylvester. Extiende el m etodo de la ecuacion entrada. 3. Diseno can onico. Extiende la formula de Bass-Gura usando la forma canonica multientrada del controlador. 4. Diseno o ptimo. Calcula la matriz K en forma optima. optimo, Desarrollaremos los tres primeros. El diseno que es una forma sistem atica de utilizar todos los grados de libertad disponibles, lo trataremos en el cap tulo siguiente. K = place(A,B,P) es v M ATLAB la funcion alida en el caso multi-entrada, y permi te asignar los autovalores especicados en P, inclusive repitiendo autovalores un numero m aximo de veces igual al numero de entradas. vale remarcar que los resultados de controlaAntes de entrar en los m etodos de diseno, bilidad y asignabilidad de autovalores se extienden al caso multivariable. Los resumimos en los siguiente teoremas; las pruebas siguen de cerca el caso SISO y no las repetimos. Teorema 8.5 (Controlabilidad y realimentacion MIMO). El par ( A BK , B), para cual si ( A, B) es controlable. quier matriz real p n K, es controlable si y solo Teorema 8.6 (Asignabilidad de autovalores MIMO). Todos los autovalores de ( A BK ) pueden asignarse arbitrariamente (siempre y cuando los autovalores complejos conjugados si ( A, B) es controlable. se asignen en pares) eligiendo la matriz constante real K si y solo
C 8.6.1. Diseno clico

En este m etodo transformamos el problema multi-entrada en uno de una entrada y de autovalores del caso SISO. despu es aplicamos los m etodos de asignacion Denicion 8.2 (Matriz C clica). Una matriz A se dice c clica si su polinomio caracter stico es igual a su polinomio m nimo. Recordemos: Toda matriz A satisface su polinomio caracter stico ( ) = det( I A) = 0, por el Teorema de Cayley-Hamilton.
El polinomio m nimo de una matriz A es el polinomio de m nimo orden ( ) para el que ( A) = 0. si hay un y El polinomio m nimo de una matriz A es igual al caracter stico si y solo un bloque de Jordan asociado a cada autovalor distinto de A. solo Ejemplo 8.6. 1 0 0 0 0 2 1 0 A1 = 0 0 2 1 0 0 0 2 1 0 0 0 0 2 1 0 A2 = 0 0 2 0 0 0 0 2
un bloque de Jordan de orden 1 y 2 solo uno de orden La matriz A1 es c clica: 1 tiene solo 3. La matriz A2 no es c clica: 1 tiene un bloque de Jordan de orden 1 pero 2 tiene dos, uno de orden 2 y uno de orden 1. Teorema 8.7 (Controlabilidad con p entradas controlabilidad con 1 entrada). Si el sistema de orden n con p entradas ( A, B) es controlable y si A es c clica, entonces para casi cualquier vector p 1 V , el sistema de 1 entrada ( A, BV ) es controlable. No probamos formalmente este resultado pero mostramos su validez intuitivamente. de coordenadas, asumimos A Como la controlabilidad es invariante bajo transformacion en forma de Jordan. Para ver la idea b asica consideremos el ejemplo siguiente: 2 1 0 0 0 0 1 0 2 1 0 0 0 0 v 1 0 A= (8.24) 0 0 2 0 B = 1 2 BV = B v2 = . 0 0 0 1 1 4 3 0 0 0 0 1 1 0 un bloque de Jordan asociado a cada autovalor; por lo tanto A es c Hay solo clica. La con para que ( A, B) sea controlable en estas coordenadas es que la tercera y ultima dicion la de B sean distintas de cero. Las condiciones necesarias y sucientes para que el par de una entrada ( A, BV ) sea controlable son = y = 0 en (8.24). Como = v1 + 2v2 , y = v1 si v1 = 0 o v1 /v2 = 2. As entonces o es cero si y solo , cualquier V que no tenga v1 = 0 o v1 = 2v2 va a hacer ( A, BV ) controlable. de las dos El vector V R2 puede asumir cualquier valor en R2 que no est e en la union l neas mostradas en la Figura 8.14. La probabilidad de que un V elegido aleatoriamente caiga sobre estas l neas es nula, y por lo tanto, para casi todo V el par ( A, BV ) ser a controlable. de que A sea c La condicion clica es esencial. Por ejemplo, el par A=
2 1 0 0 2 0 0 0 2
B=
2 1 0 2 1 0
es controlable, puesto que las las 2 y 3 de B son linealmente independientes. Sin embargo, V tal que ( A, BV ) sea controlable (dos bloques de Jordan asociados al mismo no hay ningun autovalor y una sola entrada). un bloque de Jordan Si todos los autovalores de A son distintos, entonces hay solo asociado a cada uno, y por lo tanto la matriz es c clica.

6v
2
2
H H HH 1 H HH 1 HH HH H
1 -
HH v1 H
= 2v2
v1 = 0 Figura 8.14: R2
Teorema 8.8 (C clica por realimentacion). Si ( A, B) es controlable, entonces para casi toda matriz p n real constante K, la matriz ( A BK ) tiene autovalores distintos y, por lo tanto, es c clica. No es dif cil ver que la probabilidad de que, eligiendo K al azar, los autovalores de A y ( A BK ) coincidan es nula. Este resultado, junto con el anterior, nos da el procedimiento para asignar los autovalores de ( A BK ) en los lugares deseados. Procedimiento de asignacion de autovalores por diseno c clico 1. Si A no es c clica, introducir u = w K1 x tal que A A BK1 sea c clica. Como , B ). ( A, B) es controlable, tambi en lo es ( A , BV ) sea controlable. 2. Elegir una V R p1 tal que ( A BVK2 3. Introducir w = r VK2 x, donde K2 R1n sea tal que los autovalores de A sean los deseados. nal es u = r (K1 + VK2 ) x. 4. La realimentacion En M ATLAB, partiendo de matrices A,B y autovalores a lazo cerrado deseados en el vector P: >> >> >> >> >> (n,p) = size(B); K1 = rand(p,n); V = rand(p,1); K2 = place(A-B*K1,BV,P); K = K1 + V*K2;
8.6.2.
via Ecuacion de Sylvester Diseno
via la solucion de una ecuacion de Sylvester se extiende al caso El m etodo de diseno multi-entrada. Sea un sistema controlable de orden n y p entradas ( A, B). El problema es encontrar una matriz p n real constante K tal que ( A BK ) tenga cualquier conjunto de autovalor de A. autovalores deseados siempre que no contenga ningun

c - j- j - B 6 6
Notas de CAUT2 - 166 x x

- C -c
- j6
A K1 VK2 por diseno c Figura 8.15: Realimentacion clico
Procedimiento de asignacion de autovalores por diseno v a ecuacion de Sylvester 1. Elegir una matriz n n F con el conjunto de autovalores deseados que no contenga ninguno de A. tal que ( F, K ) sea observable. 2. Elegir una matriz p n arbitraria K . T en la ecuacion de Sylvester AT TF = BK 3. Hallar la unica solucion distinta y repetir el proceso. Si T es no singular, K = 4. Si T es singular, elegir una K 1 KT , y ( A BK ) tiene el conjunto de autovalores deseados. implican de Sylvester y KT = K Si T es no singular, la ecuacion
( A BK ) T = TF o
A BK = TFT 1
y as A BK y F son similares y tienen los mismos autovalores. A diferencia del caso SISO, cuando ( A, B) donde T es siempre no singular, en el caso MIMO T puede ser singular aun es controlable y ( F, K ) observable.
8.6.3.
Canonico Diseno
extiende a MIMO el procedimiento que seguimos para derivar la formula Este diseno de es complicada, pero como realmente muestra la esencia Bass-Gura en SISO. La derivacion de estados, lo presentamos para un ejemplo. de la realimentacion La idea es llevar al sistema a la forma canonica multientrada del controlador. Supongamos que tenemos un sistema de orden 6, 2 entradas y 2 salidas, es decir, A R66 , B R6 2 , y C R2 6 . Primero buscamos columnas linealmente independientes en
C = [ B, AB, . . . , A5 B]
en orden de izquierda a derecha. Supongamos que los ndices de controlabilidad son 1 = 4 3 y 2 = 2.
3
Es decir, en las n columnas LI de C hay 4 de la entrada 1, y 2 de la entrada 2.
= Px Entonces existe una matriz no singular P tal que el cambio de coordenadas x transformar a el sistema a la forma canonica multi-entrada del controlador 111 112 113 114 121 122 1 b12 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 x = x 0 0 1 0 0 0 + 0 0 u 221 222 0 1 211 212 213 214 0 0 0 0 1 0 0 0 y= 111 112 113 114 121 122 x 211 212 213 214 221 222
Ahora, de cualquier conjunto de 6 autovalores deseados podemos formar el polinomio K (s) = (s4 + 111 s3 + 112 s2 + 113 s + 114 )(s2 + 221 s + 222 ). como Eligiendo K = 1 b12 K 0 1
1
111 111 112 112 113 113 114 114 121 122 211 211 212 212 213 213 214 214 221 221 222 222
se puede vericar f acilmente que 111 112 113 114 1 0 0 0 0 1 0 0 B K = A 0 0 1 0 211 212 213 214 0 0 0 0
0 0 0 0
0 0 0 0
221 222 1 0
B K ) es triangular en bloques, para cualesquiera Como ( A 21i , i = 1, 2, 3, 4, su polinomio caracter stico es igual al producto de los polinomios caracter sticos de los bloques diagonales de ordenes 4 y 2. Como estos bloques est an en forma companion, el polinomio B K ) es igual al deseado. Finalmente K = KP ubica los autovalores caracter stico de ( A de A BK en las posiciones deseadas.
8.7. Observadores MIMO

Todo lo que discutimos sobre observadores en el caso SISO vale para el caso MIMO; para el sistema de n estados, p entradas y q salidas = Ax + Bu x y = Cx consiste en usar la entrada u y la salida medida y para obteel problema de observacion del estado del sistema x. Como en el caso SISO, el observador ner una estima asintotica x est a dado por las ecuaciones = ( A LC ) x + Bu + Ly. x
como en el Este es un observador de orden completo. Deniendo el error de estimacion caso SISO, (t) x(t) x (t), x llegamos a que la din amica del error est a dada por = ( A LC ) x . x Si el par ( A, C ) es observable, entonces los autovalores de ( A LC ) pueden asignarse ar adecuada de L. As bitrariamente por medio de una eleccion , la velocidad de convergencia al estado actual x puede hacerse tan r de la estima x apida como se quiera.4 Los mismos m etodos vistos para calcular K y asignar los autovalores de A BK pueden usarse para calcular L y asignar los autovalores de A LC. Por ejemplo, en M ATLAB, dados los autovalores deseados en el vector P, usamos >> L = place(A,C,P);
8.7.1.
Observador MIMO de orden reducido
de Sylvester. Presentamos el procedimiento de Chen [1999] via ecuacion Procedimiento de diseno de observador MIMO de orden reducido Sea el par ( A, C ) observable, donde A Rnn y C Rqn . Asumimos que el rango de C es q (es decir, todas las salidas son l.i.). 1. Elegir una matriz Hurwitz cualquiera F R(nq)(nq) que no tenga autovalores en con los de A. comun 2. Elegir una matriz cualquiera L R(nq)q tal que ( F, L) sea controlable. unica TA FT = LC. 3. Calcular la solucion T R(nq)n de la ecuacion
nn 4. Si la matriz P = [ C es singular, volver al paso 2 y repetir el proceso. Si P es T] R no singular, entonces la EE
(t) = Fz(t) + TBu(t) + Ly(t) z (t) = x C T

1
y z
genera una estima asintotica de x(t).
8.8.
Consideraciones de diseno
de estados, Sabiendo ya como asignar autovalores a lazo cerrado por realimentacion un observador en caso de que no todos los estados sean medibles, resta y como disenar decidir donde colocar estos autovalores. Damos ahora algunas pautas a tener en cuenta en Recordemos que dado el polinomio caracter esta eleccion. stico deseado K (s) = sn + 1 s n1 + + n 1.
Sin embargo, esto no necesariamente implica que el error pueda reducirse arbitrariamente. Puede mos a la m trarse que ceros y polos de la planta con parte real positiva imponen una limitacion nima energ a T (t) x (t)dt, lograble eligiendo L. Hay casos en que no puede reducirse a cero. del error, 0 x
4
de Estados y Observadores 8. Realimentacion (SISO) la formula de Bass-Gura daba la ganancia de realimentacion T n1 n2 n n n2 n3 . . . . . . . . K= . 2 2 1 2 1 1 1 1 1 0 . . . 2 1 . . . 1 1 . . . ... . . . ... 0 0 ... 0 0 ... 0 0
1 1 0 . . . C 1 , 0 0 0
(8.25)
donde C = [ B, AB, . . . , A1 B] es la matriz de controlabilidad del sistema. Notamos de (8.25) que K ser a mayor en magnitud (norma): cuanto m as se desplacen los autovalores respecto de las posiciones de lazo abierto (mayores diferencias entre i y i ), cuanto m as cerca de ser singular est e C (cuanto menos controlable sea el sistema, mayor esfuerzo llevar a controlarlo).
8.8.1.
de ganancia elevada Dicultades de la realimentacion
Si se desea estabilizar el sistema, habr a necesariamente que mover autovalores al lado izquierdo del plano complejo. Sin embargo, moverlos excesivamente a la izquierda implicar a usar una K elevada. Una K elevada tender a a hacer saturar los actuadores, trayendo del sistema. efectos indeseados en el desempeno no es el unico; Es claro que si bien la estabilidad es un punto esencial en el diseno, existen tambi en requerimientos de velocidad de respuesta, sobrevalor, etc. Como discuti eramos anteriormente, la velocidad del sistema queda denida por su ancho de banda, denido como la frecuencia a partir de la cual la magnitud de la respuesta en frecuencia del sistema comienza a decaer signicativamente (3 dB). En t erminos de autovalores, el ancho de banda queda determinado por los autovalores dominantes, es decir, aquellos cuya parte real es m as cercana al origen (los de transitorios de decaimiento m as lento). As , el mover los autovalores excesivamente a la izquierda implica tambi en un lazo cerrado de gran ancho de banda, que puede amplicar incertidumbres en el modelo y perturbaciones de alta frecuencia. Remarcamos que adem as, si los autova lores a lazo cerrado se situan a distancias desparejas del origen, el esfuerzo de control no ser a ecientemente distribuido, lo que implica desperdicio de energ a. razonable de los autovalores: Resumiendo, para una eleccion Elegir el ancho de banda sucientemente grande como para alcanzar los requerimientos de velocidad de respuesta deseados. No excederse en el ancho de banda ojo a los efectos de ceros de fase no m nima (subvalor excesivo), y el ruido y la incertidumbre de modelado en alta frecuencia. Ubicar los autovalores a distancias aproximadamente uniformes del origen para un uso eciente del esfuerzo de control. de autovalores comun que satisface estos lineamientos es la de ButUna conguracion Butterworth se dene por 2 terworth, originaria de teor a de ltrado. La conguracion
de los autovalores quepar ametros: la frecuencia de corte 0 y el orden k. La ubicacion da denida por las ra ces de la ecuacion s 0
2k
= ( 1 )k +1 .
j
4

j
6
j
8
de polos Butterworth para k = 1, 2, 3, 4. Figura 8.16: Conguracion Butterworth son los polinomios de Los polinomios cuyos ceros tienen la conguracion Butterworth. Los primeros 4 son: B1 (s) = s + 1 B2 (s) = s2 + 2s + 1 B3 (s) = s3 + 2s2 + 2s + 1 B4 (s) = s4 + 2,613s3 + (2 +
2)s2 + 2,613s + 1.
Los ltros de Butterworth, cuyos denominadores son los polinomios de Butterworth, se pueden calcular en M ATLAB con la funcion >> [Num,Den] = butter(N,W0,s) Butterworth tiene proComo veremos en detalle en el ultimo cap tulo, la conguracion piedades de optimalidad.
8.8.2.
Resumen del proceso de diseno
8.9.
Resumen
de estados K para asigVimos dos m etodos para calcular la ganancia de realimentacion A BK del lazo cerrado en las ra nar los autovalores de la matriz de evolucion ces de un polinomio caracter stico deseado: K (s) = sn + 1 s n1 + + n 1.

Arquitectura de Control ? Especicaciones ? Modelo Matem atico ? Ganancias de Control ? Observador
? Chequeo y Robustez ? Z Z no OK Z Z Z Z si ? Simulacion ? Construcci on y Ensayo
Figura 8.17: Proceso de diseno
El primer metodo
usa la formula T n1 n2 n n n2 n3 . . . . . . . . K= . 2 2 1 2 1 1 1 1 1 0 . . . 2 1 . . . 1 1 . . . ... . . . ... 0 0 ... 0 0 ... 0 0 1 1 0 . . . C 1 0 0 0
que se conoce como F ormula de Bass-Gura, donde 1 , 2 , . . . , n son los coecientes del polinomio caracter stico de A, y C = [ B, AB, . . . , An1 B] es la matriz de controlabilidad del sistema a lazo abierto. Funciones utiles en M ATLAB pol=poly(A) calcula los coecientes pol=[1, 1 , 2 , . . . , n ] del polinomio caracter stico de la matriz A. CC=ctrb(A,B) calcula la matriz de controlabilidad C . lop=fliplr(pol) invierte el orden de los coecientes en el vector pol; o sea lop=[ n , . . . , 1 , 1]. R=hankel(fliplr(pol(1:n-1))) arma la matriz ... 1 n.2 n.3 . . R= .2 .1
1 1 1 0
n1
n2
... 1 1 0
... . . . . . . ... 0 0 0 ... 0 0 0 ... 0 0 0
. . .
La siguiente secuencia en M ATLAB calcula K en la formula de Bass-Gura, de A,B y polK= [1, 1, . . . , n ] (polinomio deseado):
de Estados y Observadores 8. Realimentacion >> >> >> >> pol n = R = K =
= poly(A); length(pol); hankel(fliplr(pol(1:n-1))); fliplr(polK(2:n-1) - pol(2:n-1))*inv(R)*inv(ctrb(A,B)); de Lyapunov generalizada (tambi resuelve la ecuacion en llamada , AT TF = BK
El segundo metodo de Sylvester)
donde F es una matriz cualquiera con los autovalores a lazo cerrado deseados (distintos de un vector la arbitrario tal que ( F, K ) sea observable. Entonces los de A) y K 1 . K = KT En M ATLAB >> T = lyap(A,-F,-B*Kbar); >> K = Kbar*inv(T); Tarea de estudio 239-41]. del segundo m Ver la justicacion etodo en Chen [1999, 8.2.1, p aginas
8.10.
Ejercicios
de estados u = r Kx para estabilizar Ejercicio 8.1. Calcular un control por realimentacion el sistema del p endulo invertido dado por las EE 0 1 0 0 0 1 0 0 1 0 = x 0 0 0 1 x + 0 0 0 5 0 2 y= 1 0 0 0 x ubicando los autovalores del lazo cerrado en 1,5 j0,5 y 1 j. Utilizar los dos proce obtenidas. dimientos dados y comparar las ganancias de realimentacion unitario en la referencia. Simular la respuesta del sistema realimentado a un escalon Calcular la cota inferior teorica para el subvalor en la respuesta y comparar con los valo Cu si se quisiera hacer la res observados en la simulacion. al es el compromiso de diseno respuesta a lazo cerrado m as r apida? Como se altera la respuesta si se recalcula una K para ubicar uno de los autovalores a lazo cerrado sobre el cero estable del sistema? el controlador para el sistema del Ejemplo 8.3 incorporando accion Ejercicio 8.2. Redisenar el esquema de la Figura 8.8. Vericar por simulacion las propiedades de integral segun robustez y rechazo de perturbaciones del lazo cerrado introduciendo incertidumbres de modelado y perturbaciones de entrada.
de transferencia a lazo abierto Ejercicio 8.3. Es posible cambiar la funcion (s) = G

(s1)(s+2) (s+1)(s2)(s+3)
a la de lazo cerrado
k (s) = G
s1 (s+2)(s+3)
de estados? Ser mediante realimentacion a el sistema resultante BIBO estable? Y asintoticamente estable? Qu e puede decirse para (s) = G
(s1)(s+2) (s+1)(s2)(s+3)
al lazo cerrado
k (s) = G
1 (s+3) ?
Ejercicio 8.4. Encontrar la ganancia K en u = r Kx para asignar en 1 y 2 los autovalores a lazo cerrado del sistema = x 2 1 1 x+ u 1 1 2
y = 1 1 x. un observador de orden completo y uno de orden reducido para Ejercicio 8.5. Disenar estimar los estados del sistema del Ejercicio 8.4. Elegir los autovalores de los estimadores dentro del conjunto {3, 2 j2}. transferencia de r a y del sistema a lazo cerrado del EjerciEjercicio 8.6. Calcular la funcion se aplica al estado estimado con el observador cio 8.4. Repetir el c alculo si la realimentacion de orden completo disenado en el Ejercicio 8.5. Repetir pero ahora con la estima obtenida del observador de orden reducido. Son las tres funciones transferencia la misma? del control de posicion del motor de corriente continua Ejercicio 8.7. Considerar el diseno del ejemplo tutorial en Matlab. 1. Implementar el sistema con controlador en S IMULINK. Simular la respuesta a un es en r, y a un escalon de torque de perturbacion aplicado 0,1 segundos m calon as tarde. un observador de orden reducido. Asignar los autovalores del observador de 2. Disenar modo que no afecten la respuesta especicada para el sistema. 3. Incorporar el observador al modelo S IMULINK y aumentar el valor del momento de de la reinercia del motor en un 20 %. Repetir el ensayo de respuesta a un escalon de torque. Se conserva el desempeno? Cu ferencia y perturbacion al es la m axima admisible? perturbacion Ejercicio 8.8. Para el sistema dado por 0 1 0 0 A= 3 1 2 1
0 1 2 0
0 0 3 0
0 0 B= 1 0
0 0 2 2
encontrar 2 matrices K tales que los autovalores de A BK sean 4 j3 y 5 j4.
Bibliograf a
193
Cap tulo 9 al Control Optimo Introduccion

9.1. Introduccion
combinado de observador y realimentacion de estados que vimos El m etodo de diseno en el cap tulo pasado es una herramienta fundamental en el control de sistemas en variable de estados. Sin embargo, no es siempre el m etodo m as util ; tres dicultades obvias: de especicaciones de diseno a ubicacion de polos no es directa, espe1. La traduccion de polos para especialmente en sistemas complejos; cu al es la mejor conguracion cicaciones dadas? en sistemas MIMO no son unicas; 2. Las ganancias de realimentacion cu al es la mejor de polos dada? ganancia para una conguracion 3. Los autovalores del observador deben elegirse m as r apidos que los del controlador, criterio adicional para preferir una conguracion a otra? pero, tenemos algun stas preguntas. VereLos m etodos que introduciremos en este cap tulo dan respuestas a e de estados y del observador pueden elegirse de mos que las ganancias de realimentacion dado. forma que minimicen un criterio de optimizacion El criterio particular que veremos es un funcional cuadr atico del estado y la entrada de control,
T
J ( x(t), u(t)) =
t
xT ( ) Qx( ) + uT ( ) Ru( ) d ,
donde Q y R son matrices constantes (aunque no necesariamente) semi-denida y denida positivas respectivamente. El control que se obtiene de minimizar este criterio es lineal. Como el criterio se basa en funcionales cuadr aticos, el m etodo se conoce como lineal-cuadr atico (LQ: linear-quadratic), del que se obtiene el regulador lineal cuadr atico (LQR). se siguen para el diseno de observadores, solo que el Criterios similares de optimizacion y se basa en una caracterizacion estad funcional depende del error de estimacion, stica de los ruidos que afectan al sistema. Este estimador optimo lineal-cuadr atico se conoce como el ltro de Kalman. de estados LQ con el ltro de KalCuando se combinan la ganancia de realimentacion man, obtenemos lo que se conoce como un controlador lineal-cuadr atico-gaussiano (LQG). (Lo estad de gaussiano viene de la caracterizacion stica del ruido empleada.) Como material de estudio para este cap tulo recomendamos Bay [1999, Cap tulo 11] y Friedland [1986, Cap tulos 9, 10 y 11]. 174
al Control Optimo 9. Introduccion
9.1.1.
El Principio de Optimalidad
en variable de estados, la introducirePara entender la idea de criterio de optimizacion mos con sistemas de tiempo discreto, que son m as simples. El estado de un sistema discreto describe una trayectoria haciendo transiciones discretas de un estado a otro bajo el efecto de una entrada tambi en aplicada en tiempo discreto. al sistema, cada transicion de estado tiene Cuando se asocia un criterio de optimizacion asociado un costo o penalidad. Por ejemplo, pueden penalizarse las transiciones de estado que se alejan demasiado del estado nal deseado, o las acciones de control de valores demasiado elevados. A medida que el sistema evoluciona de estado en estado, los costos se suman hasta acumular un costo total asociado a la trayectoria. Ilustramos el concepto con el grafo de la Figura 9.1, que representa 8 estados de un sistema discreto con sus transiciones posibles. El estado inicial es el 1, y el nal el 8. El sistema pasa de un estado a otro en cada tiempo k determinado por la entrada u[k] y las ecuaciones x[k + 1] = Ax[k] + Bu[k]. Las transiciones posibles se representan por los arcos que conectan el estado inicial al nal a trav es de los estados intermedios. El costo asociado a 4 se representa con la lecada transicion 2 7 tra J ; por ejemplo, el costo de moverse 8 1 del estado 3 al 5 es J35 . 5 Asumiendo que los costos se acuJ13 6 J68 3 mulan en forma aditiva, vemos que la J35 J56 trayectoria marcada en rojo, por ejemplo, tiene un costo total J13 + J35 + J56 + J68 . Como hay varias rutas alternativas del estado 1 al 8, el costo total depenFigura 9.1: Posibles trayectorias de 1 al 8. der a de la trayectoria elegida. La senal de control u [k] que determina la trayectoria de menor costo es la estrategia o ptima. Como ya veremos, en sistemas de tiempo de costos se representa mediante integracion, en vez de suma. continuo, la acumulacion La herramienta matem atica que usaremos para determinar la estrategia optima es el principio de optimalidad de Bellman. En cualquier punto intermedio xi en una trayectoria optima entre x0 y x f , la estrategia desde xi al punto nal x f debe ser en s una estrategia optima. Este obvio principio nos permitir a resolver en forma cerrada nuestros problemas de control optimo. Tambi en se usa en el computo recursivo de las soluciones optimas en un procedimiento llamado programaci on din amica.
9.1.2.
Nota Historica
El nacimiento del control optimo se atribuye al problema del braquistocrono, propuesto por el matem atico suizo Johann Bernoulli en 1696. El problema consist a en determinar
cu al, entre todas las trayectorias posibles, era la que llevaba a una part cula (sin rozamiento) en el menor tiempo posible, desde un punto A a un punto B en el mismo plano vertical, a la accion de la gravedad. sujeta solo
M
Braquistocrono Johann Bernoulli (1667-1748)
matem Una formulacion atica moderna del problema del braquistocrono es la siguiente: control encontrar la senal
u(t) v(t)
que lleve al sistema (t) = u(t) x (t) = v(t) y y(t) y(t)
xB A u2 + v2 = 1. nimo tiempo, sujeto a la restriccion desde el punto [ x y A ] al punto [ y B ] en m T pico problema de control optimo.
9.2.
Control LQ discreto
xk+1 = Axk + Buk , x Rn , u R p . (9.1)
Consideremos el sistema en tiempo discreto denido por1
El problema de control que queremos resolver es: Encontrar la secuencia de control uk que inicial xi = x0 al estado nal x N = x f , minimizando el lleve al sistema (9.1) de la condicion funcional cuadr atico Ji, N =
1 T x Sx N 2 N
1 2
N 1 k =i
xkT Qxk + ukT Ruk .
(9.2)
de xi a x N y, en El funcional (9.2) puede interpretarse como el costo total de la transicion T particular, el t ermino x N Sx N penaliza el error en alcanzar el estado nal deseado. Las matrices de peso S, Q y R pueden seleccionarse para penalizar ciertos estados/entradas m as que otros. Como veremos, las matrices S y Q deben ser semi-denidas positivas, y la R denida positiva.
1
discreta x[k] a xk . Para abreviar las expresiones, cambiamos la habitual notacion
9.2.1.
[N 1] [N] Transicion
Para encontrar el control a aplicar al sistema de forma que se minimice (9.2), suponga mos que estamos en el paso N 1 de la trayectoria optima. As , el costo (9.2) de la transicion de N 1 a N es T T 1 JN 1, N = 2 xT (9.3) N Sx N + x N 1 Qx N 1 + u N 1 Ru N 1 de u N 1 , lo que da Usando (9.1), substituimos x N como una funcion JN 1, N =
1 2 T T ( Ax N 1 + Bu N 1 ) S ( Ax N 1 + Bu N 1 ) + xT N 1 Qx N 1 + u N 1 Ru N 1 .
Como J es cuadr atico en u, podemos minimizarlo diferenciando 0= T JN 1, N u N 1 = BT S Ax N 1 + Bu N 1 + Ru N 1
= R + BT SB u N 1 + BT SAx N 1 .
De (9.4) obtenemos el ultimo elemento de la secuencia de control optima
T u N 1 = R + B SB
(9.4)
BT SAx N 1 ,
(9.5)
que resulta ser un m nimo, ya que 2 JN 1, N = R + BT SB > 0. u2 N 1 de estados de la forma habitual Como vemos, (9.5) es un control lineal por realimentacion u N 1 = KN 1 x N 1 , donde KN 1 R + BT SB
1
BT SA.
(9.6)
El valor del costo m nimo JN 1, N obtenido con u N 1 es JN 1, N =

1 2
Ax N 1 BKN 1 x N 1 A BKN 1
T
T T S Ax N 1 BKN 1 x N 1 + xT N 1 Qx N 1 + x N 1 KN 1 RKN 1 x N 1
=1 xT 2 N 1
T S A BKN 1 + Q + KN 1 RKN 1 x N 1
1 T x S x , 2 N 1 N 1 N 1 T
(9.7)
T de donde denimos S N 1 A BKN 1 S A BKN 1 + Q + KN 1 RKN 1 . La eleccion S N 1 en (9.7) surge de que si estamos en el paso nal N , no hay ninguna accion la notacion 1 T de control que tomar y JN , N = JN , N = 2 x N Sx N , es decir,
SN = S KN = R + B T S N B S N 1 = A BKN 1
1
T
BT S N A
T S N A BKN 1 + Q + KN 1 RKN 1 .
9.2.2.
[N 2] [N] Transicion
Tomamos otro paso para atr as en el computo del control optimo y consideremos ahora que estamos en el paso N 2. Notemos primero de (9.2) que JN 2, N = JN 2, N 1 + JN 1, N . Por lo tanto, para calcular la estrategia optima para ir del estado en N 2 al estado nal en N , usamos el principio de optimalidad para deducir que
JN 2, N = JN 2, N 1 + JN 1, N ,
y as reducimos el problema al de calcular la estrategia optima para ir de N 2 a N 1 (la de N 1 a N ya la obtuvimos). As , ahora el paso N 1 es el nal, y podemos usar la (9.3) pero con N 1 en vez de N , y N 2 en vez de N 1. Obtenemos misma ecuacion JN 2, N 1 =
1 2 T T xT N 1 S N 1 x N 1 + x N 2 Qx N 2 + u N 2 Ru N 2
Igual que antes, podemos minimizar JN 2, N 1 sobre todos los posibles u N 2 , y es f acil ver que las expresiones son las mismas pero con N 1 en vez de N , y N 2 en vez de N 1, u N 2 = KN 2 x N 2 , donde KN 2 R + B T S N 1 B
1
B T S N 1 A .
9.2.3.
[k] [N] Transicion
Retrocediendo en los pasos N 2, N 3, . . . , k, se generan la siguientes expresiones recursivas para el control optimo u k = Kk x k Kk = ( R + BT Sk+1 B)1 BT Sk+1 A Sk = ( A BKk ) Sk+1 ( A BKk ) + Q +
T T Kk RKk .
(9.8) (9.9) (9.10)
en diferencias (9.10) de Sk se resuelve para atr Notar que la ecuacion as, comenzando en 1 T S N = S. El costo optimo de k a N es Jk, N = 2 xk Sk xk . El conjunto de ecuaciones (9.8), (9.9) y (9.10) representa el controlador LQ completo para en diferencias el sistema discreto (9.1), que resulta, en general, inestacionario. La ecuacion (9.10) se conoce como la ecuaci on matricial en diferencias de Riccati. El hecho de que se resuelva para atr as en el tiempo le da a Kk la peculiaridad de que los transitorios aparecen al nal del intervalo [k, T ], en vez de al principio. Ejemplo 9.1 (Control LQ en tiempo discreto). Simulamos el sistema x k +1 = 2 1 0 x + u, 1 1 k 1 k x(0) = 2 3
con el controlador LQ optimo que minimiza el costo xT J=1 2 10 5 0 x + 0 5 10

1 2
k=1
xkT
2 0 x + 2u2 k. 0 0,1 k
Las siguientes l neas de codigo M ATLAB computan Kk y xk en lazo cerrado.

% Costo Q=[2 0;0 0.1];R=2;S=diag([5,5]); k=10; % Sistema A=[2 1;-1 1];B=[0;1];x0=[2;-3]; % Solucion de la ecuacion de Riccati while k>=1 K(k,:)=inv(R+B*S*B)*B*S*A; S=(A-B*K(k,:))*S*(A-B*K(k,:))+Q+K(k,:)*R*K(k,:); k=k-1; end % Simulacion del sistema realimentado x(:,1)=x0; for k=1:10 x(:,k+1) = A*x(:,k)-B*K(k,:)*x(:,k); end
Kk debe calcularse en tiempo invertido y almacenarse para La matriz de realimentacion ser aplicada posteriormente al sistema en tiempo normal.
2 line 1 line 2
-1
-2
-3 0 2 4 t 6 8 10
del estado en lazo cerrado: line 1: x1 [k], line 2: x2 [k] Figura 9.2: Evolucion Aunque la planta a lazo abierto es inestable (autovalores en 3 23 ), vemos que el estado 2 es estabilizado asintoticamente por u k . Notar que la planta a lazo cerrado es inestacionaria, ya que el control lo es. de las ganancias de control. Podemos comprobar La Figura 9.2 muestra la evolucion que sus valores cambian m as sobre el nal del intervalo, m as que al comienzo, donde permanecen casi constantes.

2.5

line 1 line 2
1.5
0.5
-0.5
-1 0 1 2 3 4 t 5 6 7 8 9
de las ganancias K [k] = [k1 [k], k2 [k]] (line 1 y line 2). Figura 9.3: Evolucion
9.3. Control LQ en tiempo continuo

del control optimo La deduccion LQ para el sistema en tiempo continuo, (t) = Ax(t) + Bu(t), x (9.11) que las transiciones se reducen a sigue los mismos pasos que el de tiempo discreto, solo incrementos innitesimales. El costo es ahora
1 T x (t f ) Sx(t f ) + J ( x(t0 ), u(t0 ), t0 ) = 2 1 2 tf t0
xT (t) Qx(t) + uT (t) Ru(t) dt.
Haciendo tender los incrementos a cero se obtienen los equivalentes de tiempo continuo de las ecuaciones (9.8), (9.9) y (9.10), que denen el control optimo LQ en este caso (ver detalles en Bay [1999, 11.1.2]), u (t) = K (t) x(t) K ( t ) = R 1 B T P ( t ) x ( t ) (t) = P(t) BR1 BT P(t) Q P(t) A AT P(t). P (9.12) (9.13) (9.14)
(9.14) es la famosa ecuaci La ecuacion on diferencial matricial de Riccati, que, como en el caso discreto, tambi en debe resolverse hacia atr as en el tiempo, con condiciones iniciales P(t f ) = S. Como en el caso discreto: lineal de estados, aunque inestacionaria. El control optimo LQ es una realimentacion Los transitorios en P(t) y K (t) ocurrir an sobre el nal del intervalo [t0 , t f ]. diferencial (9.14) es en general de dif Aun, haci Pero, la ecuacion cil solucion. endolo num ericamente, como pueden guardarse los (innitos) valores de P(t) calculados en tiem po invertido para ser aplicados luego al sistema? Esta dicultad lleva a buscar una solucion optima estacionaria, K (t) = K, que surge de considerar el caso de horizonte innito t f .
9.4. Control LQ de Horizonte Innito

La Figura 9.3 del ejemplo sugiere que si hacemos tender el tiempo nal a las solucio de Riccati permanecer nes de la ecuacion an constantes en el valor del instante inicial. Bajo (t) = 0, que lleva la ecuacion P(t) es constante y P (9.14) a la forma que se esta suposicion, 2 conoce como la ecuaci on algebraica de Riccati (ARE) PA + AT P + Q PBR1 BT P = 0, con el correspondiente control optimo LQ (ahora estacionario) u (t) = Kx(t) = R1 BT Px(t). En el caso discreto tenemos Sk = S, k, que da, de (9.10), (9.9) S = AT SA AT SB R + BT SB K = R + BT SB
1 1
(CARE)
(9.15)
BT SA + Q
(DARE)
BT SA.
(DARE) es la ecuaci La ecuacion on algebraica dicreta de Riccati. si estas soluciones constantes de r En rigor, sin embargo, no sabemos aun egimen per manente resuelven los correspondientes problemas optimos de horizonte innito. Anali zamos este punto a continuacion. del problema de horizonte innito. Solucion Queremos controlar el sistema
(t) = Ax(t) + Bu(t) x est con una realimentacion atica de estados u(t) = Kx(t) tal que se minimice el funcional de costo J= xT (t) Qx(t) + uT (t) Ru(t) dt.
0
el sistema a lazo cerrado queda Con la realimentacion, (t) = ( A BK ) x(t) x incurriendo en un costo
(9.16)
J=
0
xT (t) Qx(t) + xT (t)KRKx(t) dt.
de (9.16) es x(t) = e( ABK)t x0 , la reemplazamos en la expreComo sabemos que la solucion del costo, y obtenemos sion
T J = x0
e( ABK)
Tt
Q + K T RK e( ABK)t dt x0 (9.17)
T x0 Px0 ,
donde hemos denido la matriz P

2
( A BK )T t 0 e
Q + K T RK e( ABK)t dt.
Algebraic Riccati Equation.
= Recordando el Teorema de Lyapunov, que vi eramos en 5.4, sabemos que el sistema x si la matriz P denida en (9.17) es la unica ( A BK ) x es asintoticamente estable si y solo denida positiva de la ecuacion de Lyapunov solucion
( A BK )T P + P( A BK ) + Q + K T RK = 0.
(9.18)
Por lo tanto, para cualquier ganancia K que estabilice asintoticamente el sistema, la matriz de (9.18) dar P solucion a un costo nito. Supongamos que consideramos en particular la ganancia K = R1 BT P, correspondiente al candidato a control optimo LQ (9.15). Substituyendo esta K en (9.18) obtenemos 0 = ( A BR1 BT P)T P + P( A BR1 BT P) + Q + PBR1 BT P
= AT P PBR1 BT P + PA PBR1 BT P + Q + PBR1 BT P = AT P + PA + Q PBR1 BT P,

algebraica de Riccati (CARE). Por lo tanto, la solucion del que es exactamente la ecuacion de la ecuaproblema de control optimo LQ con horizonte innito est a dado por la solucion (CARE), cuando e sta existe. El mismo resultado vale en el caso discreto. cion Esto no quiere decir que las soluciones de las ecuaciones (CARE) o (DARE) ser an unicas. unica Si existe una solucion que estabilice al sistema, entonces es la optima. Cabe entonces de las ecuaciones algebraicas de Riccati, y bajo la pregunta: Cu ando existir a una solucion qu e condiciones ser a unica? La respuesta la dan los siguientes resultados: Teorema 9.1. Si ( A, B) es estabilizable, entonces, independientemente del peso S, existe una est diferencial (diferencia) de Riccati (9.14) ( (9.10)). solucion atica nita P ( S) de la ecuacion ser de la ecuacion algebraica de Riccati correspondienEsta solucion a tambi en una solucion optima te, y ser a la solucion en el caso de horizonte innito. Teorema 9.2. Si la matriz de peso Q puede factorearse en la forma Q = T T T , entonces la est diferencial (diferencia) de Riccati es la unica solucion atica P ( S) de la ecuacion solucion algebraica si y solo si ( A, T ) es detectable. denida positiva de la correspondiente ecuacion si ( A, B) es estabilizable y ( A, T ) detectable, existe una solucion unica En conclusion, de Con M ATLAB, K se puede (CARE) ( (DARE)) que da la ganancia optima de realimentacion. calcular con K = lqr(A,B,Q,R) (continuo) y K = dlqr(A,B,Q,R) (discreto).
9.5.
Estimadores Optimos
de sistemas de control, a menudo Uno de los factores m as importantes en el desempeno no tenido en cuenta, es el efecto de perturbaciones y ruido. Todos los sistemas est an sujetos a ruido, sea en la forma de alinealidades de entrada no modeladas, din amica no modelada, o senales de entrada no deseadas.
trataremos algunos modelos simples de ruido y determinaremos formas de En esta seccion de observadores y realimentacion de estados. tenerlos en cuenta en el diseno del estado de un sistema. Consideraremos primero ruido perturbando la observacion Con un modelo en ecuaciones de estado que incluye ruido, generaremos el mejor observador posible, es decir, el que mejor rechaza el efecto del ruido. Estos observadores suelen llamarse estimadores, y el particular que desarrollaremos es el estimador conocido como el ltro de Kalman.
9.5.1.
Modelos de sistemas con ruido

xk+1 = Axk + Buk + Gvk yk = Cxk + wk .
Consideramos el sistema en tiempo discreto (9.19)
Las nuevas senales de entrada vk y wk que aparecen en este modelo son procesos aleatorios, consistentes en ruido blanco estacionario, con media cero, y no correlacionados entre s . Esto quiere decir que tienen las siguientes propiedades:
T E vk vk = V T E vk v j = 0, T E wk wk = W T E wk w j = 0,
cuando k = j
E vk = 0 E vT j w k = 0, para todo j, k.
E wk = 0
E[] denota la media estad a procesos aleatorios La funcion stica [para una breve introduccion ver por ejemplo Friedland, 1986, 10]. Consideraremos adem as que el estado inicial x0 del sistema (9.19) es en tambi en una variable aleatoria ya que raramente podemos conocerlo con exactitud. Consideramos que es ruido blanco, con varianza E x0 E[ x0 ] x0 E[ x0 ]
T
S0 .
Asumimos que x0 no est a correlacionado con vk y wk . a la salida, La entrada vk se llama ruido de planta, o de proceso, y la entrada wk , que actua ruido de medici on. El ruido de planta modela el efecto de entradas ruidosas que actuan en modela efectos tales como ruido en los estados mismos, mientras que el ruido de medicion los sensores. La entrada uk es la habitual entrada de control, considerada determin stica.
9.5.2.
Filtro de Kalman discreto
anterior del observador, esta vez tomando en cuenReconsideramos nuestra derivacion de la matriz de ganancia L. Esta matriz deber ta los efectos de ruido en la seleccion a elegirse de forma de dar la mejor estima del estado del sistema rechazando al mismo tiempo cual que haremos dene el observador optimo quier inuencia de los ruidos vk y wk . La eleccion conocido como ltro de Kalman. Hay varias formas de derivar el ltro de Kalman. Vamos a presentar una variante basa da en un observador modicado, llamado observador actual, que permite una simplicacion en las derivaciones (por alternativas ver, por ejemplo, Goodwin etal. [2000, 22], Friedland [1986], o Goodwin and Sin [1984]).
al Control Optimo 9. Introduccion Observador actual
Recordemos las ecuaciones del observador de orden completo, en este caso, dicreto, k +1 = A x k + Buk + L( yk C x k ). x Suponiendo por el momento que no hay ruidos (vk = 0 = wk ), modicamos el observador en dos etapas: con una ligera variante: separamos el proceso de observacion 1. predicci on del estado estimado en k + 1 en base a datos en k (estima anterior + entrada actual), k +1 = A x k + Buk x (9.20) 2. correcci on de la estima en k + 1 con los datos medidos en k + 1. k+1 = x k+1 + L y k +1 C x k +1 x (9.21)
La diferencia con el observador convencional es que ahora corregimos la estima con la k+1 ) en vez de utilizar la medicion k ). Este obser actual ( yk+1 y vieja ( yk y medicion vador modicado se conoce como observador actual Bay [1999]. De (9.20) y (9.21), las ecuaciones del observador actual son k +1 = A x k + Buk + L yk+1 C ( A x k + Buk ) x k + ( B LCB)uk + Lyk+1 . = ( A LCA) x (9.22)
El observador actual ser a conveniente para derivar el ltro de Kalman discreto, pues permite considerar los efectos de los ruidos vk y wk por separado. del observador (9.22) diere signicativamente de la que presenNotar que la ecuacion tamos anteriormente con sistemas continuos: (t) = ( A LC ) x (t) + Bu(t) + Ly(t). x Para el observador actual la din amica del error est a dada por k+1 = ( A LCA) x k , x por lo que los autovalores para el observador son los de la matriz ( A LCA), en vez de los de ( A LC ) como vimos antes. En este caso, la observabilidad del par ( A, C ) no garantiza que se puedan asignar los autovalores de ( A LCA) arbitrariamente. Sin embargo, si la matriz A es de rango completo, el rango de CA es el mismo que el de C, y podemos considerar ) como de C CA como una nueva matriz de salida y asignar los autovalores de ( A LC costumbre. Estructura del observador Siguiendo a Bay [1999, 11], usamos la variante del observador actual para derivar el ltro de Kalman. La mejor predicci on del estado que podemos hacer cuando hay ruido es el valor esperado k +1 = E A x k + Buk + Gvk x k + Buk , = Ax dado que E[vk ] = 0.
Esta suele denominarse la estima a priori, porque se hace antes de medir la salida (o sea que Una vez disponible la salida en el instante k + 1, terminamos de armar no tiene correccion). el observador actualizando la estima obteniendo la, a menudo llamada, estima a posteriori: k +1 = x k +1 + L k +1 [ y k +1 C x k +1 ] . x (9.23)
L variante en el tiempo, lo que, como Notar que usamos una ganancia de observacion veremos, es necesario. En observadores determin sticos, L se seleccionaba para asignar la En este caso, adem din amica del error de estimacion. as, trataremos de minimizar el efecto de los ruidos. Criterio de optimizacion El ltro de Kalman es optimo en el sentido de que da la mejor estima del estado y al surge de minimizar el error mismo tiempo minimiza el efecto de los ruidos. Su derivacion a posteriori de estimacion k . ek = xk x Como ek est a afectado por ruido, y por lo tanto depende de variables aleatorias, su valor Buscaen un instante dado puede no ser representativo de las bondades de la estimacion. mos entonces tratar de minimizar su valor en promedio para todo el conjunto de ruidos posibles. Denimos entonces la covarianza a posteriori Sk
T E[ek ek ].
Cuanto menor sea la norma de la matriz Sk , menor ser a la variabilidad del error de estima debida a ruidos, y mejor el rechazo de e stos. cion
1 line 1 1 line 1
0.8
0.8
0.6
0.6
0.4
0.4
0.2
0.2
-0.2 0 50 100 150 200 250 300 350
-0.2 0 50 100 150 200 250 300 350
Figura 9.4: Dos senales ruidosas con mayor (iz.) y menor (der.) variabilidad. Pretendemos determinar Lk+1 para minimizar la variabilidad del error de estimacion. m n E [ e k +1 ]
Lk+1 2 T = m n E ek +1 e k +1 Lk+1 Lk+1 Lk+1 T = m n E tr(ek+1 ek +1 ) T = m n tr E ek+1 ek n tr Sk+1 . +1 = m Lk +1
(9.24)
para Sk+1 , derivamos la din Para obtener una expresion amica del error:
k +1 e k +1 = x k +1 x k Buk Lk+1 [Cxk+1 + wk+1 C x k +1 ] = Axk + Buk + Gvk A x k + Gvk Lk+1 C [ Axk + Buk + Gvk ] + wk+1 C [ A x k + Buk ] = Axk A x = [ A Lk+1 CA]ek + [ G Lk+1 CG ]vk Lk+1 wk+1 = [ I Lk+1 C ][ Aek + Gvk ] Lk+1 wk+1 . de ek+1 obtenemos Usando esta expresion Sk+1 = E ( I Lk+1 C )( Aek + Gvk ) Lk+1 wk+1 ( I Lk+1 C )( Aek + Gvk ) Lk+1 wk+1
T
= E ( I Lk+1 C )( Aek + Gvk )( Aek + Gvk )T ( I Lk+1 C )T

T T T T T T 2 L k +1 w k+1 e k A + vk G ( I L k +1 C ) T + L k +1 w k+1 w k +1 L k +1 .
(9.25)
De las hipotesis sobre las propiedades estad sticas de los ruidos vistas en 9.5.1, tenemos que
T E vk vk = V, T E wk +1 w k+1 = W, T E w k+1 v k = 0.
(9.26)
Adem as, no es dif cil ver que

T k )T E w k +1 e k = E w k +1 ( x k x
(9.27)
=E
T w k +1 x k
T k w k +1 x
= 0,
k no est ya que xk y x an correlacionadas con wk+1 . Y por otro lado,

T k )T E vk ek = E vk ( xk x
(9.28)
=E
T vk xk
T k vk x
= 0,
k tampoco est ya que xk y x an correlacionadas con vk . 3 Usando (9.26), (9.27) y (9.28) en (9.25), llegamos a la expresion S k +1 = I L k+1 C
T
ASk AT + GVG T
I L k +1 C
T + Lk+1 WLk +1
(9.29)
recursiva (9.29) representa la din La expresion amica de la covarianza del error de estima Esta expresion, sin embargo, no es enteramente util, cion. pues todav a no conocemos Lk+1 , que determinaremos en lo que sigue. de la ganancia de observacion optima Determinacion Para determinar el valor de la ganancia Lk+1 que minimiza el criterio de optimizacion (9.24), expandimos tr Sk+1 de (9.29) en
T tr Sk+1 = tr[ ASk AT ] + tr[ GVG T ] + tr Lk+1 C [ ASk AT + GVG T ]C T Lk +1
(9.30)
2 tr Lk+1 C [ ASk A + GVG ] +

3
T tr[ Lk+1 WLk +1 ] .
Aunque s lo est an xk+1 y vk , dado que xk+1 = Axk + Buk + Gvk .
Ahora derivamos (9.30) con respecto a Lk+1 . Los dos primeros t erminos dan cero, pues no dependen de Lk+1 . Para los siguientes t erminos usamos las siguientes propiedades de la derivada de la traza de una matriz [ver Bay, 1999, Ap endice A], tr[ XYX T ] = 2 XY, X As obtenemos de (9.30) tr[YXZ ] = Y T Z T . X
0=
tr Sk+1 L k+1 = 2 Lk+1 C ASk AT + GVG T C T 2 ASk AT + GVG T C T + 2 Lk+1 W,
que tiene como solucion

1
Lk+1 = ASk A + GVG C
C ASk A + GVG C + W
(9.31)
(9.23), y se conoce como Esta es la ganancia optima para el estimador dado por la ecuacion la ganancia de Kalman. Como supusimos, es inestacionaria, ya que depende de Sk , que se en diferencias (9.29). obtiene resolviendo la ecuacion Procedimiento para computar el ltro de Kalman discreto Resumimos los pasos necesarios para programar el ltro de Kalman. Partimos del conocimiento de las propiedades estad sticas, valor esperado y varianza, de los ruidos vk y inicial x0 . wk , y la condicion 1. Calculamos la estima a priori del estado (prediccion) k +1 = A x k + Buk x inicializada con la estima inicial xk0 = E[ x0 ]. 2. Calculamos la ganancia de Kalman de (9.31),
1
(9.32)
Lk+1 = ASk A + GVG C
C ASk A + GVG C + W
(9.33)
T que inicializamos con la covarianza original Sk0 = E[ x0 x0 ] = S0 .
3. Calculamos la estima a posteriori, corregida con la salida medida yk+1 mediante (9.23), que puede simplicarse a k+1 = x k+1 + L k +1 [ y k+1 C x k+1 ] . x 4. Calculamos, de (9.29), la matriz de covarianza para la proxima iteracion,
T Sk+1 = [ I Lk+1 C ]T [ ASk AT + GVG T ][ I Lk+1 C ]T + Lk+1 WLk +1 .
(9.34)
(9.35)
y el proceso se repite el siguiente paso.
Ejemplo 9.2 (Filtro de Kalman discreto). Consideremos el sistema en tiempo discreto x k +1 = 0,8146405 0,0817367 0,0021886 0,0430570 x + u + v 0,0817367 0,8146405 k 0,0452456 k 0,0474342 k y = 1 0 xk + wk ,
(9.36)
donde el t ermino de ruido v tiene media cero y covarianza V = 0,09. El ruido de medicion exacta, se asume de media cero y covarianza W = 0,25. El sistema (9.36) es la discretizacion con per odo de muestreo T = 0,05s, del sistema de tiempo continuo
4 2 0 1 x+ u+ v 2 4 1 1 y = 1 0 x + w.
= x del estado del sisConstruimos un ltro de Kalman discreto para estimar la evolucion tema (9.36) cuando se le aplica la entrada u = sen kT , con per odo de muestreo T = 0,05s, y sobre el intervalo kT [0, 10]s. Las ecuaciones del ltro de Kalman, (9.32), (9.33), (9.34) y (9.35), no no son dif ciles de programar en M ATLAB, por ejemplo de la siguiente manera:
% Ejemplo filtro de Kalman discreto % Sistema en tiempo continuo Ac=[-4,2;-2,-4]; Bc=[0;1]; Gc=[1;-1]; C=[1,0]; % Discretizacion exacta - Sistema en tiempo discreto T=0.05; % tiempo de muestreo A=expm(Ac*T); B=inv(Ac)*(A-eye(2,2))*Bc; G=inv(Ac)*(A-eye(2,2))*Gc; % Covarianzas de Ruidos V=0.09; % ruido de proceso W=0.025; % ruido de medicion % Condiciones iniciales del sistema (para simular) t=0:T:10; u=sin(t); x0=[0;0]; x=x0; y=C*x0; % Conjetura de xh=[0.5;-0.5]; xp=xh; S=eye(2,2); condiciones iniciales para el filtro de kalman % xh(0) % xp(0) % S0
% Simulacion for k=1:length(t)-1 % sistema
x(:,k+1)=A*x(:,k)+B*u(k)+G*sqrt(V)*randn; y(k+1)=C*x(:,k+1)+sqrt(W)*randn; % filtro de Kalman inestacionario xp(:,k+1)=A*xh(:,k)+B*u(k); % estima a priori L=(A*S*A+G*V*G)*C*inv(C*(A*S*A+G*V*G)*C+W); xh(:,k+1)=xp(:,k+1)+L*(y(k+1)-C*xp(:,k+1)); % estima S=(eye(2,2)-L*C)*(A*S*A+G*V*G)*(eye(2,2)-L*C)+L*W*L; end
Corriendo este programa simulamos el sistema discreto y al mismo tiempo vamos cal de los estados del sistema culando la estima del estado. La Figura 9.5 muestra la evolucion y los estados estimados por el ltro de Kalman inestacionario. Puede verse como las varia bles ruidosas son ltradas por el estimador, dando versiones ((suavizadas)) de la evolucion de los estados luego de un breve transitorio de aproximadamente 0.5 s.
0.6
0.4
2 (t) x x2 (t)
0.2
x1 (t)
0.2
1 (t) x
0.4
0.6 0 1 2 3 4 5 6 7 8 9 10
t[s]
Figura 9.5: Estados verdaderos y estados estimados para el sistema (9.32)
9.6. Notas
diferencia de Riccati (9.29) que determina la matriz de covarianza Sk se La ecuacion calcula para adelante en el tiempo, a diferencia del dual caso de control optimo LQ. Esto implica que el ltro de Kalman puede implementarse en su forma inestacionaria en tiempo real.
El ltro de Kalman derivado es el mejor estimador si los ruidos de proceso y medicion son Gausianos. Para otras distribuciones probabil sticas, el ltro de Kalman es el mejor estimador lineal. El ltro de Kalman puede obtenerse tambi en en tiempo continuo, aunque es raramente usado en la pr actica, ya que casi siempre se implementa en una computadora discreta es m de las ecuaciones digital, para la que la version as natural. La derivacion diferencial de Riccati, dual al caso es similar al caso continuo, y lleva a una ecuacion de control LQ [ver Bay, 1999, 11.2.3]. Como en el caso de control optimo LQ, tambi en en el caso del ltro de Kalman pue diferencia (diferencial) de Ricden calcularse soluciones estacionarias de la ecuacion ser cati que determina la matriz de covarianza. Esta solucion a aproximadamente si ( AT , C T ) es estabilizarle, y ( AT , T T ) detectable, donde optima, y unica si y solo GCG T = TT T . kalman computa el ltro de Kalman estacionario (continuo o En M ATLAB, la funcion discreto). Naturalmente, el ltro de Kalman puede combinarse con cualquier control por reali de estados. Cuando el controlador elegido es el optimo mentacion LQ, la combinacion da lo que se conoce como controlador lineal cuadr atico gausiano (LQG). de un regulador LQG mediante agregado de accion integral es La robusticacion de polos y se aplica de la misma manera exactamente igual al caso visto en asignacion integral es parte del diseno de la arquitectura de control, y no del control en (la accion s ). Pueden verse algunas aplicaciones industriales del ltro de Kalman en Goodwin etal. [2000] (hay una copia disponible en IACI). Utiles en M ATLAB de regulador lineal cuadr DLQR Diseno atico para sistemas de tiempo discreto. [K,S] = de estados K tal que el lqr(A,B,Q,R) calcula la ganancia optima de realimentacion control u = Kx minimiza el costo J=
k =0
(xkT Qxk + ukT Ruk )dt
y estabiliza asintoticamente el sistema de tiempo discreto xk+1 = Axk + Buk . algebraica de Riccati discreta La matriz S resuelve la ecuacion AT SA S ( AT SB)( R + BT SB)1 ( BT SA) + Q = 0. de regulador lineal cuadr LQR Diseno atico para sistemas de tiempo continuo. [K,P] = de estados K tal que el lqr(A,B,Q,R) calcula la ganancia optima de realimentacion control u = Kx minimiza el costo
J=
0
( xT Qx + uT Ru)dt
al Control Optimo 9. Introduccion y estabiliza asintoticamente el sistema de tiempo continuo = Ax + Bu. x algebraica de Riccati La matriz P resuelve la ecuacion PA + AT P ( PB) R1 ( BT P) + Q = 0.
de ltro de Kalman para sistemas discretos. La funcion L = dlqe(A,G,C,Q,R) DLQE Diseno calcula la ganancia L del ltro de Kalman estacionario k +1 = A x k + Buk x k +1 = x k +1 + L ( y k+1 C x k Duk ) x para estimar el estado x del sistema en tiempo discreto xk+1 = Axk + Buk + Gwk yk = Cxk + Duk + vk respectivamente, de media nula y donde w y v son ruidos de proceso y de medicion, con covarianzas EwwT = Q, EvvT = R, EwvT = 0. Notar que si w y v son no correlacionados (como generalmente se asume), entonces N = 0. de ltro de Kalman para sistemas continuos. La funcion L = lqe(A,G,C,Q,R,N) LQE Diseno calcula la ganancia L del ltro de Kalman estacionario = Ax + Bu + L( y C x Du) x para estimar el estado x del sistema en tiempo continuo = Ax + Bu + Gw x y = Cx + Du + v respectivamente, de media nula y donde w y v son ruido de proceso y de medicion, con covarianzas EwwT = Q, EvvT = R, EwvT = N . Notar que si w y v son no correlacionados (como generalmente se asume), entonces N = 0.
9.7.
Ejercicios
0,6 0,3 0,03 xk + uk 0,1 0,8 0,1
Ejercicio 9.1. Para el sistema discreto x k+1 =
encontrar la secuencia de control que minimiza el funcional de costo J=

1 2
k =1
xkT
19
5 0 x + u2 k 0 1 k
al Control Optimo 9. Introduccion Ejercicio 9.2. Para el sistema discreto x k +1 = 0 1 1 1 0 u, 1 k x0 = 1 1
de estados que minimiza el criterio determinar el control por realimentacion J= Ejercicio 9.3. Para el sistema x k +1 = 0 1 0 xk + u 0,5 1 1 k
1 2
i =1
xiT
1 0 x + ui2 . 0 0 i
yk = 0,5 1 xk una realimentacion de estados para ubicar los autovalores a lazo cerrado en z = disenar un observador de orden completo est 0,25 0,25 j. Disenar andar, y uno actual. Programar mediante simulacion. ambos en M ATLAB y comparar sus desempenos ruidosa en tiempo discreto de una constante desconocida saEjercicio 9.4. La medicion tisface el modelo yk = + vk , donde vk es ruido blanco de varianza 2 . 1. Determinar un ltro optimo para estimar . 2. Construir un esquema S IMULINK para evaluar el ltro anterior en r egimen permanente. en tiempo discreto de una senoide de Ejercicio 9.5. Considerar el problema de medicion frecuencia conocida pero amplitud y fase desconocidas, es decir: yk = A sen(0 k + ) + vk , donde vk es ruido blanco de varianza 2 . 1. Contruir un modelo para generar la senoide. 2. Determinar un ltro optimo para estimar A y . 3. Construir un esquema S IMULINK para evaluar el ltro en r egimen permanente.
Bibliograf a
193
Indice general
1. Introduccion a Control Autom 1.1. Introduccion atico 2 Externa . . . 1.1.1. Representacion Interna . . . . 1.1.2. Representacion 1.1.3. Sistemas Estacionarios . . . . 1.1.4. Panorama de la Materia . . . 1.2. Bibliograf a y Material de Estudio . . 1.3. P agina de CAUT2 en Internet . . . . . . . . . . . 1.4. R egimen de Aprobacion 1.5. Calendario . . . . . . . . . . . . . . . 1 1 1 2 2 2 4 4 4 5 7 7 8 9 9 10 11 11 15 15 16 17 17 19 19 20 22 22 23 25 26 26 27 28 31 31
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2. Descripcion Matem atica de Sistemas 2.1. Una taxonom a de sistemas . . . . . . . . . . . . . . . . 2.2. Sistemas Lineales . . . . . . . . . . . . . . . . . . . . . . 2.3. Sistemas lineales estacionarios . . . . . . . . . . . . . . . entrada-salida . . . . . . . . . . 2.3.1. Representacion en Espacio de Estados . . . . . . 2.3.2. Representacion en diagrama de bloques . . . . . . . . . 2.4. Representacion . . . . . . . . . . . . . . . . . . . . . . . . . 2.5. Linealizacion 2.6. Sistemas discretos . . . . . . . . . . . . . . . . . . . . . . entrada-salida de sistemas discretos 2.6.1. Descripcion en Espacio de Estados . . . . . . 2.6.2. Representacion 2.7. Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.8. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . 3. Herramientas de Algebra Lineal 3.1. Vectores y Matrices . . . . . . . . . . . . . . 3.2. Bases y Ortonormalizacion 3.2.1. Norma de vectores . . . . . . . . . . 3.2.2. Ortonormalizacion 3.3. Ecuaciones Lineales Algebraicas . 3.4. Transformaciones de Semejanza . . 3.5. Forma Diagonal y Forma de Jordan 3.5.1. Autovalores y autovectores 3.5.2. Forma Companion . . . . . 3.5.3. Forma de Jordan . . . . . . 3.6. Funciones de Matrices Cuadradas 3.6.1. Polinomios . . . . . . . . . . . . . . . . . . . . .
I
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
Indice general
Notas de CAUT2 - II . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 32 33 35 35 36 36 37 38 39 40 42 43 45 45 46 47 48 50 51 52 52 53 53 54 54 58 59 59 60 64 64 66 67 67 70 70 71 71 75 75 76 77 81 82 82
3.7. 3.8. 3.9. 3.10. 3.11. 3.12.
3.6.2. Polinomio m nimo . . . . . . . . . . . . . . . . . . . . . de funciones matriciales . . . . . . . . . . . 3.6.3. Evaluacion 3.6.4. Funciones matriciales no necesariamente polinomiales 3.6.5. Series de Potencias . . . . . . . . . . . . . . . . . . . . . e Integracion Matricial . . . . . . . . . . 3.6.6. Diferenciacion 3.6.7. La Exponencial Matricial . . . . . . . . . . . . . . . . . de Lyapunov . . . . . . . . . . . . . . . . . . . . . . . Ecuacion Formas Cuadr aticas . . . . . . . . . . . . . . . . . . . . . . . . . 3.8.1. Matrices denidas y semi-denidas positivas . . . . . . en Valores Singulares (SVD) . . . . . . . . La Descomposicion Normas de Matrices . . . . . . . . . . . . . . . . . . . . . . . . Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4. Solucion de la Ecuacion de Estado y Realizaciones 4.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . de Ecuaciones de Estado Estacionarias . . . . . . . . . . 4.2. Solucion 4.2.1. Comportamiento asintotico de la respuesta a entrada nula . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2.2. Discretizacion 4.3. Ecuaciones de Estado Equivalentes . . . . . . . . . . . . . . . . . . 4.3.1. Equivalencia a estado cero . . . . . . . . . . . . . . . . . . . 4.3.2. Par ametros de Markov . . . . . . . . . . . . . . . . . . . . . 4.4. Formas Canonicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.4.1. Forma canonica modal . . . . . . . . . . . . . . . . . . . . . 4.4.2. Forma canonica controlable . . . . . . . . . . . . . . . . . . 4.4.3. Forma canonica del controlador . . . . . . . . . . . . . . . 4.5. Realizaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . M 4.5.1. Realizacion nima . . . . . . . . . . . . . . . . . . . . . . 4.5.2. Sistemas Discretos . . . . . . . . . . . . . . . . . . . . . . . de Ecuaciones de Estado Inestacionarias . . . . . . . . . 4.6. Solucion 4.6.1. Matriz Fundamental . . . . . . . . . . . . . . . . . . . . . . 4.6.2. Caso Discreto . . . . . . . . . . . . . . . . . . . . . . . . . . 4.7. Ecuaciones Inestacionarias Equivalentes . . . . . . . . . . . . . . . 4.8. Realizaciones de Sistemas Inestacionarios . . . . . . . . . . . . . . 4.9. Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.10. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5. Estabilidad . . . . . . . . . . . . . . . . . . . . . . . . 5.1. Introduccion 5.2. Estabilidad Externa de Sistemas Estacionarios . . . . externa . . . . . . . . . . . . . 5.2.1. Representacion 5.2.2. Caso MIMO . . . . . . . . . . . . . . . . . . . . interna . . . . . . . . . . . . . . 5.2.3. Representacion 5.2.4. Caso discreto . . . . . . . . . . . . . . . . . . . 5.3. Estabilidad Interna de Sistemas Estacionarios . . . . . 5.3.1. Relaciones entre Estabilidad Externa e Interna 5.3.2. Sistemas discretos . . . . . . . . . . . . . . . . 5.4. El Teorema de Lyapunov . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Indice general
Notas de CAUT2 - III . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84 85 85 85 87 88 89 91 91 91 94 97 98 98 98 101 102 102 104 110 114 116 117 117 120 123 125 125 126 127 128 128 130 130 130 133 133 134 134 135 139 142 142
5.4.1. Estabilidad Interna de Sistemas Discretos . . . . . . . 5.5. Estabilidad de Sistemas Inestacionarios . . . . . . . . . . . . 5.5.1. Estabilidad entrada/salida . . . . . . . . . . . . . . . 5.5.2. Estabilidad interna . . . . . . . . . . . . . . . . . . . . 5.5.3. Invariancia frente a transformaciones de equivalencia 5.6. Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.7. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6. Controlabilidad y Observabilidad 6.1. Controlabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.1.1. Deniciones y tests fundamentales . . . . . . . . . . . . . . 6.1.2. Control de m nima energ a y gramiano de controlabilidad 6.1.3. Tests PBH de controlabilidad . . . . . . . . . . . . . . . . . 6.1.4. Controlabilidad y transformaciones de semejanza . . . . . 6.2. Observabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.2.1. Deniciones y tests fundamentales . . . . . . . . . . . . . . 6.2.2. Gramiano de observabilidad . . . . . . . . . . . . . . . . . 6.2.3. Tests PBH de observabilidad . . . . . . . . . . . . . . . . . 6.2.4. Observabilidad y transformaciones de semejanza . . . . . 6.3. Descomposiciones Canonicas . . . . . . . . . . . . . . . . . . . . . 6.4. Condiciones en Ecuaciones en Forma Modal . . . . . . . . . . . . 6.5. Ecuaciones de Estado Discretas . . . . . . . . . . . . . . . . . . . . 6.5.1. Indices de Controlabilidad y Observabilidad . . . . . . . . 6.5.2. Controlabilidad al Origen y Alcanzabilidad . . . . . . . . . 6.6. Controlabilidad, Observabilidad y Muestreo . . . . . . . . . . . . 6.7. Sistemas Inestacionarios . . . . . . . . . . . . . . . . . . . . . . . . 6.8. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7. Especicaciones y Limitaciones de Diseno 7.1. Sensibilidad y Robustez . . . . . . . . . . . . . . . . . . . . 7.1.1. Perturbaciones . . . . . . . . . . . . . . . . . . . . . 7.1.2. Incertidumbre . . . . . . . . . . . . . . . . . . . . . . 7.2. Funciones de Sensibilidad . . . . . . . . . . . . . . . . . . . 7.2.1. Funciones de transferencia en lazo cerrado . . . . . 7.2.2. Especicaciones de la Respuesta en Frecuencia . . . 7.3. Robustez . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.3.1. Estabilidad Robusta . . . . . . . . . . . . . . . . . . robusto . . . . . . . . . . . . . . . . . . 7.3.2. Desempeno . . . . . . . . . . . . . . . . . . . . . 7.4. Limitaciones de Diseno (s) y T (s) . . . . . . . 7.4.1. Restricciones algebraicas en S en la respuesta temporal 7.4.2. Especicaciones de diseno 7.4.3. Restricciones en la respuesta al escalon . . . . . . . 7.4.4. Efecto de ceros y polos en el eje imaginario . . . . . 7.5. Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.6. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Indice general
Notas de CAUT2 - IV 145 147 151 151 152 155 157 157 158 161 161 163 164 165 167 168 169 169 170 170 172 172 174 176 176 177 177 178 178 180 180 182 183 184 185 185 190 192 193
8. Realimentacion de Estados y Observadores de Estados . . . . . . . . . . . . . . . . . . . . . 8.1. Realimentacion 8.1.1. Otra receta para calcular K . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.2. Estabilizacion y Seguimiento . . . . . . . . . . . . . . . . . . . . . 8.3. Regulacion Integral . . . . . . . . . . 8.3.1. Seguimiento Robusto: Accion 8.4. Observadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . Observador a lazo abierto . . . . 8.4.1. Una primer solucion: mejor: Observador a lazo cerrado . . . . 8.4.2. Una solucion 8.4.3. Observador de orden reducido . . . . . . . . . . . . . . de estados estimados . . . . . . . . . . . . . . 8.5. Realimentacion 8.5.1. Notas Historicas . . . . . . . . . . . . . . . . . . . . . . de estados caso MIMO . . . . . . . . . . . . 8.6. Realimentacion C 8.6.1. Diseno clico . . . . . . . . . . . . . . . . . . . . . . . . via Ecuacion de Sylvester . . . . . . . . . . . . . 8.6.2. Diseno Canonico 8.6.3. Diseno . . . . . . . . . . . . . . . . . . . . . . 8.7. Observadores MIMO . . . . . . . . . . . . . . . . . . . . . . 8.7.1. Observador MIMO de orden reducido . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.8. Consideraciones de diseno de ganancia elevada 8.8.1. Dicultades de la realimentacion . . . . . . . . . . . . . . 8.8.2. Resumen del proceso de diseno 8.9. Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.10. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9. Introduccion al Control Optimo . . . . . . . . . . . . . . . 9.1. Introduccion 9.1.1. El Principio de Optimalidad . . 9.1.2. Nota Historica . . . . . . . . . 9.2. Control LQ discreto . . . . . . . . . . . [N 1] [N] . . . 9.2.1. Transicion [N 2] [N] . . . 9.2.2. Transicion [k] [N] . . . . . . 9.2.3. Transicion 9.3. Control LQ en tiempo continuo . . . . 9.4. Control LQ de Horizonte Innito . . . 9.5. Estimadores Optimos . . . . . . . . . . 9.5.1. Modelos de sistemas con ruido 9.5.2. Filtro de Kalman discreto . . . 9.6. Notas . . . . . . . . . . . . . . . . . . . 9.7. Ejercicios . . . . . . . . . . . . . . . . . Bibliograf a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Indice de guras
2.1. 2.2. 2.3. 2.4. 2.5. 2.6. P endulo . . . . . . . . . . . . . . . . . . . Amplicador . . . . . . . . . . . . . . . . . Cohete . . . . . . . . . . . . . . . . . . . . DB del sistema (2.10) . . . . . . . . . . . . y aproximacion Trayectoria de operacion P endulo invertido. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 7 11 12 12 14
3.1. Cambio de coordenadas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 3.2. Bola unitaria en R2 en normas 1, 2 e . . . . . . . . . . . . . . . . . . . . . . . 22 3.3. Hiper-elipsoide E en R3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 4.1. Circuito RLC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 5.1. 5.2. 5.3. 5.4. 5.5. 5.6. 5.7. 5.8. 5.9. absolutamente integrable que no tiende a 0. . . . . . . . Funcion de estabilidad externa para polos de sistemas continuos Region Sistema realimentado con retardo. . . . . . . . . . . . . . . . . . de estabilidad externa para polos de sistemas discretos . Region Retrato de fase del sistema (5.4) . . . . . . . . . . . . . . . . . . . Espacio de estados (unidimensional) del sistema (5.5) . . . . . . Relaciones entre estabilidad externa y estabilidad interna . . . . Estabilidad uniforme. . . . . . . . . . . . . . . . . . . . . . . . . . Estabilidad exponencial uniforme. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72 74 75 77 78 78 81 86 87 92 96 97 99 103 108 109 112 113 119 120 120 126 127 129 131
6.1. Sistemas el ectricos no controlables . . . . . 6.2. Sistema plataforma . . . . . . . . . . . . . . y Variacion de los Estados . . . . 6.3. Actuacion 6.4. Sistemas el ectricos no observables . . . . . 6.5. Circuito RLC . . . . . . . . . . . . . . . . . . de Kalman . . . . . . . . . 6.6. Descomposicion 6.7. Circuito no controlable ni observable . . . 6.8. Diagrama de Bloques . . . . . . . . . . . . . 1 6.9. Estructura interna de 1 . . . . . . . . . . i 6.10. Sistema de tanques desconectados . . . . . 6.11. Sistema de tanques en paralelo . . . . . . . 6.12. Sistema controlable de tanques en paralelo 7.1. 7.2. 7.3. 7.4. Lazo de control de un grado de libertad. . Incertidumbre multiplicativa . . . . . . . Lazo de control de dos grados de libertad. ( j)|. ( j)| and | S Formas t picas para | T
V
. . . .
Indice de guras 7.5. Mediciones, modelo nominal e incertidumbre . 7.6. Estabilidad robusta gr acamente . . . . . . . . robusto gr 7.7. Desempeno acamente . . . . . . . . 7.8. Especicaciones en la respuesta temporal . . . 7.9. Caso manejable . . . . . . . . . . . . . . . . . . 7.10. Caso dif cil . . . . . . . . . . . . . . . . . . . . . 7.11. P endulo invertido . . . . . . . . . . . . . . . . . 7.12. Respuesta a lazo cerrado del p endulo invertido 8.1. 8.2. 8.3. 8.4. 8.5. 8.6. 8.7. 8.8. 8.9. 8.10. 8.11. 8.12. 8.13. 8.14. 8.15. 8.16. 8.17. 9.1. 9.2. 9.3. 9.4. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Notas de CAUT2 - VI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132 132 133 135 138 138 139 140 146 146 154 154 154 154 155 155 157 158 159 159 162 166 167 171 172 177 181 182 187
de estados . . . . . . . . . . . . . . . . . Realimentacion de salida con observador . . . . . . . . Realimentacion . . . . . . . . . . . . . . Respuesta sin precompensacion Respuesta precompensada . . . . . . . . . . . . . . . . . Respuesta del sistema con incertidumbre . . . . . . . . de entrada. . . Respuesta del sistema con perturbacion a la entrada . . . . . . . . . . Sistema con perturbacion Esquema de seguimiento robusto . . . . . . . . . . . . . DB equivalente. . . . . . . . . . . . . . . . . . . . . . . . Observador en lazo abierto . . . . . . . . . . . . . . . . Observador en lazo cerrado . . . . . . . . . . . . . . . . Observador en lazo cerrado . . . . . . . . . . . . . . . . de estados estimados . . . . . . . . . . Realimentacion R2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . por diseno c Realimentacion clico . . . . . . . . . . . . . Conguracion de polos Butterworth para k = 1, 2, 3, 4. . . . . . . . . . . . . . . . . . . . . . . Proceso de diseno
Posibles trayectorias de 1 al 8. . . . . . . . . . . . . . . . . . . . . . del estado en lazo cerrado . . . . . . . . . . . . . . . . . Evolucion de las ganancias K [k] = [k1 [k], k2 [k]]. . . . . . . . . . . . Evolucion Dos senales ruidosas con mayor (iz.) y menor (der.) variabilidad.
Cap tulo 1 Introduccion

1.1. a Control Automatico Introduccion 2
Esta asignatura es un curso avanzado en sistemas lineales y t ecnicas de control. Intro y el diseno de sistemas en dominio temporal, en contraste con las duce la representacion transferencia, dominio frecuencial, como las vistas en t ecnicas cl asicas basadas en funcion Control Autom atico 1. en profundidad a los conceptos fundaEl objetivo del curso es brindar una introduccion mentales de la teor a de sistemas lineales descriptos por ecuaciones en variables de estado, de sistemas lineales de control en variable de y a las principales t ecnicas de an alisis y diseno estado. Los sistemas a los que nos referiremos a lo largo de la materia son representaciones ma considerada son las ecuaciones difetem aticas de sistemas f sicos, y el tipo de representacion renciales en variable de estado. Como veremos, estas representaciones matem aticas pueden clasicarse como representaciones externas representaciones internas En general, vamos a asumir que el modelo del sistema f sico est a disponible. Es decir, de este modelo, que puede hacerse utilizando no vamos a profundizar en la obtencion t ecnicas de modelado a partir de leyes f sicas (como en Procesos y M aquinas), o a trav es de param estimacion etrica (como en Identicacion).
1.1.1.
Externa Representacion
A partir de la propiedad de linealidad, un sistema puede describirse mediante la ecua integral cion
t
y(t) =
t0
G (t, )u( ) d
(1.1)
(1.1) describe la relacion entre la senal de entrada u y la senal de salida y, La ecuacion ambas funciones, en general vectoriales, de la variable real t, el tiempo.
1. Introduccion
Notas de CAUT2 - 2
es entrada-salida o externa, y el sistema en s Este tipo de representacion est a descripto u en y, como un operador, denot emoslo G , que mapea la funcion
G:uy y = Gu
t
y(t) =
t0
G (t, )u( ) d .
de entrada u, el operador G computa la salida y a trav Para cada posible senal es de la G, intr integral (1.1), que est a denida por la funcion nseca al sistema.
1.1.2.
Interna Representacion
externa (1.1) vale para sistemas a par La descripcion ametros distribuidos (como las l neas de energ de transmision a el ectrica). Cuando el sistema es a par ametros concentrados, entonces tambi en puede describirse por ecuaciones del tipo (t) = A(t) x(t) + B(t)u(t) x y(t) = C (t) x(t) + D (t)u(t) . (1.2) (1.3)
(1.2) es un sistema de ecuaciones diferenciales de primer orden, Notar que la ecuacion (1.3) es un sistema de ecuaciones algebraicas. Conforman lo que mientras que la ecuacion interna de sistemas lineales. se conoce como representacion Como el vector x se denomina el estado del sistema, el conjunto de ecuaciones (1.2), (1.3) en espacio de estados, o simplemente, ecuacion de estado. se denominan ecuacion
1.1.3.
Sistemas Estacionarios
Si el sistema es lineal, adem as de ser a par ametros concentrados, estacionario, entonces las ecuaciones (1.1), (1.2) y (1.3) se reducen a
t
y(t) =
0
G (t )u( ) d
(1.4) (1.5) (1.6)
(t) = Ax(t) + Bu(t) x y(t) = Cx(t) + Du(t) .
Para los sistemas lineales estacionarios es posible aplicar la transformada de Laplace, que (Control Autom es una herramienta importante en an alisis y diseno atico 1). Aplicando la transformada de Laplace a (1.4) obtenemos la familiar representacion (s)u (s) = G (s) y (1.7)
(s) = L{ G (t)} es la funci G donde la funcion on o matriz transferencia del sistema. Ambas (1.4) y (1.7) son representaciones externas; (1.4) en el dominio temporal, y (1.7) en el dominio frecuencial.
1.1.4.
Panorama de la Materia
1. Introduccion
1. 2. Introduccion Matem Descripcion atica de Sistemas a) b) c) d) e) 3. Una taxonom a de sistemas Sistemas lineales Sistemas lineales estacionarios Linealizacion Sistemas discretos e) f) g) a) b) c) d) e) f) g) h) i) j) k) 4. Vectores y matrices Bases y ortonormalizacion Ecuaciones lineales algebraicas Transformaciones de similitud Forma diagonal y forma de Jordan Funciones matriciales de Lyapunov Ecuacion Algunas formulas utiles Formas cuadr aticas y matrices denidas positivas en valores singulaDescomposicion res Normas de matrices 8. d) 7. 6.
Notas de CAUT2 - 3
Controlabilidad y Observabilidad a) b) c) d) Controlabilidad Observabilidad Descomposiciones canonicas Condiciones en ecuaciones en forma de Jordan Ecuaciones de estado discretas Controlabilidad y muestreo Sistemas inestacionarios
Herramientas de Algebra Lineal
Especicaciones y Limitaciones de Diseno a) b) c) Funciones de sensibilidad Especicaciones de diseno Limitaciones en la respuesta temporal Limitaciones en la respuesta frecuencial
de Estados y ObservadoRealimentacion res a) b) c) d) e) f) g) de estados Realimentacion y seguimiento Regulacion Observadores de estados estimados Realimentacion de estados Caso Realimentacion MIMO Observadores Caso MIMO de estados estimados Realimentacion Caso MIMO
de la Ecuacion de Estado y RealiSolucion zaciones a) b) c) d) de ecuaciones de estado esSolucion tacionarias Cambio de coordenadas Realizaciones Sistemas lineales inestacionarios 9.
5.
Estabilidad a) b) c) d) Estabilidad entrada-salida Estabilidad interna Teorema de Lyapunov Estabilidad de sistemas inestacionarios
al Control Optimo Introduccion a) b) c) d) El principio de optimalidad Regulador optimo cuadr atico Estimador optimo cuadr atico Control optimo cuadr atico Gaussiano
1. Introduccion
Notas de CAUT2 - 4
1.2. Bibliograf a y Material de Estudio

Para los cap tulos 1 a 6 y 8, el programa sigue muy de cerca el libro de texto (en ingl es, sorry!) Chi-Tsong Chen. Linear System Theory and Design. Oxford University Press, 3rd edition, 1999. Para el cap tulo 7 puede consultarse M.M. Seron, J.H. Braslavsky, G.C. Goodwin. Fundamental Limitations in Filtering and Control. Springer-Verlag, 1997. Para el cap tulo 9, John S. Bay. Fundamentals of Linear State Space Systems. WCB/McGraw-Hill, 1999. Otros libros recomendados: Wilson J. Rugh. Linear System Theory. Prentice Hall, 2nd edition, 1995. T. Kailath. Linear Systems. Prentice Hall, Englewood Cliffs, NJ, 1980. E.D. Sontag. Mathematical control theory. Deterministic nite dimensional systems. SpringerVerlag, 2nd edition, 1998.
1.3. Pagina de CAUT2 en Internet

Todo material dado en clase (y m as) est a disponible en forma electronica de las p aginas www de CAUT2: http://www.unq.edu.ar Carreras IACI sobre la carrera M as informacion Educacion Nucleo b asico Control Autom atico 2 Tambi en se publicar an aqu resultados de parciales, ejercicios, ex amenes anteriores, etc.
1.4.
Regimen de Aprobacion
la Resolucion del Consejo Superior de la UNQ del 20 de junio de 2000, las asignaSegun turas podr an aprobarse mediante un r egimen de regularidad, o mediante ex amenes libres. Todas las asignaturas podr an ser rendidas de forma libre en las fechas jadas por el calendario acad emico. En Control Autom atico 2 aprobar signica obtener un rendimiento no inferior al 60 %. de la nota nal en cada r es la siguiente: La conformacion egimen de aprobacion Aprobacion mediante R egimen de Regularidad:
1. Introduccion Ex amenes Parciales (2): Trabajos Pr acticos (3): Pr actica Integradora: Coloquio Integrador: 40 % 10 % 25 % 25 %
Notas de CAUT2 - 5
Los ex amenes parciales deben aprobarse para pasar a rendir la pr actica integradora. La nota de uno o ambos ex amenes parciales podr a recuperarse en un unico examen parcial adicional hacia el n del curso. El primer parcial cubre los cap tulos 1 a 5 del programa. El segundo parcial cubre los cap tulos 6 y 7 completos, y las secciones 8.1 a 8.4 del 8. La pr actica integradora incluye las secciones 8.5 a 8.7 del cap tulo 8, y el 9 completo. La pr actica integradora debe aprobarse para pasar al coloquio integrador. Aprobacion mediante Examen Libre: Pr actica A: 50 % Pr actica B: 25 % Coloquio Final: 25 % y la pr La pr actica A cubre el temario de los dos parciales de regularizacion, actica B el sta para de la pr actica integradora. La pr actica A debe aprobarse para pasar a la B, y e pasar al coloquio nal.
1.5.
Ago 6 1 13 2 20 3 27 3 Sep 3 4 10 4 17 5 24 6
Calendario
L UNES Clase 1 7 M ARTES 8 2 15 3 22 3 29 4 5 4 12 5 19 5 26 6 RCOLES MIE Clase 2 9 J UEVES 10 V IERNES
Clase 3
14
Clase 4
16
17
Clase 5
21
Clase 6
23
24
Clase 7
28
Clase 8
30
31
Clase 9
Clase 10
Clase 11
11
Clase 12
13
14
Clase 13
18
Clase 14
20
21
Clase 15
25
Clase 16
27
28
1. Introduccion
L UNES Clase 17 M ARTES 2 RCOLES MIE 3 Primer parcial 10 7 17 7 24 8 31 8 7 8 14 9 Clase 19 J UEVES 4
Notas de CAUT2 - 6
V IERNES 5
Oct 1 6 8 6 15 7 22 7 29 8 5 8 12 9 19 9 26 9
Clase 18
11
12
Clase 20
16
Clase 21
18
19
Clase 22
23
Clase 23
25
26
Clase 24
30
Clase 25
Nov 1
Clase 26
Clase 27
Clase 28
13
Clase 29
15
16
Clase 30
20
21 Segundo parcial 28 9 5 Clase 32
22
23
Clase 31
27
29
30
Dic 3 Recuperatorio parcial 10 Clase 34
Clase 33
11
12
Clase 35
13
14
Bibliograf a
193

UN Quilmes Espacio de Estados

Загружено:

Сведения о документе

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

UN Quilmes Espacio de Estados

Загружено:

Авторское право:

Доступные форматы

Control Autom atico 2

( (Cubo) ) por M.C. Escher

Cap tulo 2 Matematica Descripcion de Sistemas

Matem 2. Descripcion atica de Sistemas

Matem 2. Descripcion atica de Sistemas

Sistemas lineales estacionarios

Matem 2. Descripcion atica de Sistemas

en Espacio de Estados Representacion

Matem 2. Descripcion atica de Sistemas

Figura 2.3: Cohete

2, e inestacionario. El sistema es lineal, de dimension

en diagrama de bloques Representacion

tiene el diagrama de bloques de la Figura 2.4.

Este tipo de sistemas se trata en detalle en la asignatura Sistemas No Lineales.

Matem 2. Descripcion atica de Sistemas

Figura 2.4: DB del sistema (2.10)

fi fi , u , t) x1 + + , u , t) xn (x (x x1 xn fi fi , u , t)u1 + + , u , t)um (2.12) + (x (x u1 um

representa el Jacobiano, o Matriz Jacobiana, del campo vectorial f con f1

Matem 2. Descripcion atica de Sistemas

Figura 2.6: P endulo invertido.

Por simplicidad no escribimos la dependencia temporal de x y u.

Los Jacobianos necesarios son 0 1 0 f , ( x, u) = 0 0 ve u/ x2 3 x 0 0 0

entrada-salida de sistemas discretos 2.6.1. Descripcion

Es decir, ponerse en correspondencia con los numeros naturales.

Matem 2. Descripcion atica de Sistemas

(por homogeneidad) (por aditividad) .

[k , m]u[m] g[k , m]u[m]

g[k m]u[m] = g[m]u[k m] .

en Espacio de Estados Representacion

Matem 2. Descripcion atica de Sistemas

Tipo de sistema dim. innita lineal dim. nita, lineal

Representacion externa y(t) =

= A(t) x + B(t)u x y = C (t) x + D (t)u

dim. inf., lineal, est.

(s)u (s) = G (s) y dim. n., lineal, est. = Ax + Bu x y = Cx + Du y(t) =

(s)u (s) = G (s) y

de transformada de Laplace de y(t) Ejercicio 2.1. A partir de la denicion (s) = y

( z) = g ( z)u ( z ). probar que para un sistema lineal estacionario discreto y

Cap tulo 3 Herramientas de Algebra Lineal

( R US1 V )1 = R1 + R1 U ( S VR1 U )1 VR1 .

3. Herramientas de Algebra Lineal

3. Herramientas de Algebra Lineal

Figura 3.1: Cambio de coordenadas.

Figura 3.2: Bola unitaria en R2 en normas 1, 2 e .

norma-1 in=1 | xi |2 norma-2 o eucl dea norma-

3. Herramientas de Algebra Lineal

3.3. Ecuaciones Lineales Algebraicas

3. Herramientas de Algebra Lineal

3. Herramientas de Algebra Lineal

Una matriz cuadrada A mapea vectores de Rn en Rn ,

1 a 2 . . . a n A q1 q2 . . . qn = Q a 1 Qa 2 . . . Qa n Aq1 Aq2 . . . Aqn = Q a

es la representacion de Aqi en la base {q1 , q2 , . . . , qn }. concluimos que la columna i de A

3. Herramientas de Algebra Lineal Ejemplo 3.4. Consideremos la matriz 3 2 1 A = 2 1 0 4 3 1 Calculamos

Podemos comprobar, por ejemplo, que el vector, digamos z = Aq1 = A 1 = Q z = Qa la ecuacion

1 es la representacion del vector z en la base , es decir que a

Forma Diagonal y Forma de Jordan

Camille Jordan (1838-1922)

3. Herramientas de Algebra Lineal

3. Herramientas de Algebra Lineal

3. Herramientas de Algebra Lineal con autovectores

( A I )v4 = ( A I )v ( A I )v3 = ( A I )2 v ( A I )v2 = ( A I )3 v .

3. Herramientas de Algebra Lineal

A partir de estas relaciones, la representacion resulta 1 0 J= 0 0 0 0

3. Herramientas de Algebra Lineal