Laboratorio7 - LQR

UNIVERSIDAD NACIONAL DE INGENIERIA Control Moderno y Óptimo
FACULTAD DE INGENIERIA MECANICA P.A.2015

DAIA
Laboratorios No 6 Control Óptimo – LQR (Parte I)
Objetivo
 Derivar el regulador cuadrático lineal (LQR) y describir cómo diseñar un controlador

basado en LQR.
 El uso de la retroalimentación con efecto integral para eliminar el error del estado
estacionario.
Problema de Regulación en el horizonte infinito
Regulador cuadrático lineal
 x(t) Q x(t)  u 

1
J 
T
Funcional de costo (t) R u(t) dt
2 o
Q0 R>0 (1)
Restricción: x (t )  A x(t )  B u(t )
y (t )  C x (t ) ,
Condiciones: x(0)  x o
x ( )  0 .
Solución: u  u x(t ) tal que
J  Min !
u( x )
Observar el factor de 1/2 que esta fuera de la integral, pero lo incluimos aquí para
simplificar la derivación.
Si la matriz Q de orden n es una matriz diagonal positiva con elementos(qii> 0), la forma
cuadrática xT(t)Qx(t) es la suma pesada de las variables de estado
Rosa Garrido Juárez MT227-A Página 1

DAIA
n
x (t ) Q x(t )   qii xi2 (t ),
T
(2)
i 1
q11 
 q 
 22 
  
Q 
  
  
 
 qun 
 
J1  x (t ) Q x (t )dt   q11 x12 (t )      q un x n2 (t ) dt
T
(3)
o o
La Matriz R es también diagonal dominante con elementos positivo en la diagonal rii > 0.
La forma cuadrática:
m
uT (t )  R  u(t )   rii ui2 (t )
i 1
(4)
r11 
 r 
 22 
  
R  
  
  
 
 rmm 
Solucionar vía el principio del máximo:
Para la optimización del problema con restricciones, se usara primero el principio del
máximo con la función de Hamilton-Jacobi-Bellman,:
int egrandode J
    restricción de (1)
 
2

H  x,  , u  x Q x  u R u    A x  B u
1 T T T
 (5)
El vector (t) se llama parámetros de Lagrange
1 (t ) 
 (t ) 
 2 
  
 (t )   
  
  
 
n (t )
La solución consiste en encontrar las derivadas parciales de H con respecto a las variables
x, , y u.

DAIA
  H
x (6)

H
   (7 )
x
A las ecuaciones (6) y (7) se les llama Ecuaciones diferenciales canónicas y la ecuación de
control
H
 0. (8)
u
Para las derivadas parciales de H, se requiere conocer las siguientes reglas de cálculo para
la diferenciación:


 
T A x  A x

x
 
 T A x  AT 


 
T Bu  Bu

x
 
x Q x  2Q x
T

u
 
 T B u  BT 

u

u Ru  2Ru
T
 (9)
Quedando las ecuaciones diferenciales canónicas:

H
x   AxBu (10)

H
     AT   Q x (11)
x
Y para la ecuación de control

H
 BT   R u  0. (12)
u
La ecuación de control (12) puede ser resuelta:

u   R 1 BT  . (13)
Reemplazando (13) en (10) las ecuaciones diferenciales canónicas resultan:
  A x  BR 1 B T 
x (14)
   Q x  AT  . (15)
Estas ecuaciones se pueden colocar en forma matricial quedando:

DAIA
 x   A  BR 1 B T   x 
     (16)
   Q  AT   
Las ecuaciones de Hamilton son ecuaciones diferenciales lineales para x y , tal que puede
asumirse que la solución tendría esta forma:
 (t) = P x(t), (17)
Donde P es una matriz de orden n, luego reemplazando (17) en (13) nos daría:
u = - R-1 BT Px = - Kopt x , (18)
La ecuación (18) nos da u optimo que minimiza J (función de costo).

Para encontrar P se reemplaza (18) en las E.D. canónicas (14 y 15)
x  A x  B R 1 B T P x (19)
 P x  Q x  A P x .
T
(20)
Insertar (19) en (20)
- P A x + P BR-1 BT P x = Q x + AT P x
(P B R-1 BT P - PA - AT P – Q) x = 0 .
Arreglando:
AT P + P A -P B R-1 BT P +Q = 0 (21 )
Esto es conocida como la ecuación algebraica de Riccati cuya solución es la matriz P de
orden n, la cual es simétrica y definida positiva.
Donde:
(A,B) es estabilizable ( no necesariamente completamente controlable pero si estable)
 
x  A  BR 1 BT P x , x(0)  x o
Es estable
 
e i A  BR 1 BT P  0 i  1, 2,    , n ,

DAIA
Pasos a seguir en el diseño
1. Comprobar si (A,B) es estabilizable (Es preferible que sea completamente controlable)

2. Seleccionar las matrices de ponderación
Q  diag qii qii  0 i  1, 2    , n
R  diag rii rii  0 i  1, 2,    , m .
Q y R son definidas positivas. Al variar los valores qii y rii afectan la conducta de xi(t), e
ui (t) hacia la conducta deseada.
Calcular la matriz P a partir de la ecuación de Riccati.

AT P + P A -P B R-1 BT P +Q = 0
En Matlab, [Kopt,P] = lqr (A, B, Q, R).
3. Cálculo de la ganancia matricial optima de retroalimentación

Kopt = R-1 BTP
4. Cálculo de Jmin para el vector de estados inicial xo
1
Jmin = x To P x o .
2
5. Calculo de la matriz del sistema de lazo cerrado
Acl = A - B R BT P-1
y la simulación del sistema a partir de xo
x (t )  Acl x (t ) , x (0)  x o
:  x (t )
incluyendo la ley de control

u (t) = - Kopt x (t)
y para la evaluación y control calcular los valores propios en lazo cerrado

:  i (Acl) i = 1, 2,    , n .
La parte real debe ser menor que cero.
Las condiciones suficientes que garantizan que el sistema en lazo cerrado sea estable
son: Q> 0, R> 0, y (A, B) estabilizable.
Ejemplo 1
Un sistema de primer orden es descrito por la ecuación de estado:

x (t )  x(t )  u(t )
a) Encontrar el control no restringido, en forma de lazo cerrado, el cual minimiza la
función de costo:

DAIA
 1.5 x (t )  0.5u 2 (t ) dt

T
J 2
0
T es fijo, y x(T) es libre.
b) Demostrar que cuando T la ley de control optima es de la forma: u(t)=kx(t), donde k
es una constante. Encontrar k.
Solución
 3 x (t )  u 2 (t ) dt
T
Por comodidad para derivar: J  1
2
2
Ec. del hamiltoneano: H  3 x (t )  u 2 (t )   (t )( x(t )  u(t ))

1
2
2
H
 u(t )   (t )  0  u(t )   (t )
u
H
 x (t )  u(t )  x (t )

H
   (t )  3 x (t )   (t )
x
Arreglando las ecuaciones canónicas:
x (t )  x (t )   ( t )
 (t )  3 x(t )   (t )
 x (t )  1  1  x (t )
 (t )    3  1  (t )
    
Cuya solución:
 x (t )  s 1 1  
1
1     x (0) 
 (t )     3 
s  1   (0)

  
 


 x (t )  14 3e 2 t  e 2 t 1
4 e
2 t

 e 2 t   x (0) 
 (t )  1
   4 3e 
2t
 3e 2 t 1

4 e
2t
 
 3e  2 t   (0)
 
O también


 x (T )  14 3e 2(T  t )  e 2(T  t ) 1
4 e 
2 ( T  t )
 
 e 2 (T  t )   x ( t ) 
 (T )  1
   4 3e 
 2 (T  t )
 3e 2(T  t ) 1
4 e 
2 (T  t )
 

 3e  2 (T  t )   (t )

 (T )  0 Condición del problema.
e 2 ( T  t )  e 2 ( T  t )
 (t )  3 x (t )
e 2(T  t )  3e  2(T  t )
e 2(T  t )  e 2(T  t )
u(t )  3 2(T  t ) x (t )
e  3e  2(T  t )
b ) cuando T-> u(t )  3 x(t )  k= 3

DAIA
Ejemplo 2
Control de un doble integrador
Para el sistema:
0 1 0
x    x(t )   u (t )
0 0 1
y(t )  1 0x(t )
En lazo cerrado
a) Se desea encontrar las ganancias k1 y k2 para minimizar el índice de comportamiento

cuadrático de horizonte infinito.
1 
J   ( y 2 (t )  u 2 (t ))dt
2 0
Se asume que se tiene acceso directo a la medida de x1 y x2
b) Considere el caso particular cuando =1, diseñe el controlador óptimo y simule en
Matlab y /o simulink.
c) Considere el modelo con perturbaciones y ruido
Diseñar un observador según:

Si se conocen las matrices de ponderación para el observador:

DAIA
Solución
Test de controlabilidad
Co= [B AB]
0 1 
Co=  
1 0
Rank(Co)=n=2  Completamente controlable
0 1  0  1 0
A=   ; B  1 C  1 0 Q  CtC    R=
0 0    0 0 
La ecuación de Riccati (ARE)
At P  PA  PBRB t P  Q  0
0 0  p1 p2  p1 p2 0 1  p1 p2 0 1  p1 p 2   1 0  0 0 

 1 0  p 2   [  ]0 1  
  p3  p2 p3 0 0  p2   
p3 1  p2 p3 0 0 0 0
0 p1   p22 p 2 p3  1 0
p 2p    1
    0
 1 2  p 2 p3 p32   0
   1 p22 p1   1 p2 p3  1 0
 1 2 
 
 p1   p2 p3 2 p2   p3 
1
0 0
p22    p2  
1
 p 2 p3  p 1
1
 p1  2  4
3
p32  2 p2  2 4
 2 4  
1
P 3  , simétrica y definida positiva..

  2  4 
Ley de Control Óptima
1 t
u  
RB
 Px
K
1 1
1 1
u(t )  [ 2   4 ] x (t ) K [ 2   4 ]  Matriz de retroalimentación

 
Usando el controlador de estados, el sistema en lazo cerrado sería:

0 1  0 1 1
x    x ( t )  1 [ 2  4
] x (t )
 0 0   

DAIA
 0 1 

x   1  4  x (t )
1
 2  

 
Acl
Los valores propios del sistema en lazo cerrado:

1 1
det(sI  Acl )  s 2  2  4 s  0

1  1 1 
s   4  j 
 2 2
1
Este controlador óptimo tiene un factor de amortiguamiento = , independiente del
2
valor de  .
b) En el caso particular
u   x1  2x2
Verificación de polos en lazo cerrado
sI  A  BK  s2+ 2s  1 =0
s   22 (1  j ) Polos estables.
Usando Matlab:
A=[0 1; 0 0];
B=[0;1];
C=[1 0];
D=0;
Q=[1 0; 0 0];
R=1;
[K,P]=lqr(A,B,Q,R)
K =
1.0000 1.4142
>> P

DAIA
P =
1.4142 1.0000
1.0000 1.4142
Probando la respuesta al escalón unitario del sistema mas controlador.

s1=ss(A-B*K,B,C,D0)
step(s1)
Step Response
1.4
1.2
0.8
Amplitude
0.6
0.4
0.2
0
0 1 2 3 4 5 6 7 8
Time (sec)
c) Modelo del Integrador doble con ruido

0 1 0  w (t ) 
x    x(t )   u (t )   1 
0 0 1 w2 (t )
 x (t ) 
y (t )  1 0 1   v(t )
 x2 (t )
Las señales v , w1 e w2 son señales estocásticas independientes cuyas características

estadísticas son usadas para ajustar la ganancia de lazo (Próximo laboratorio serán
utilizadas). Considerando w1  0 y w2 =0.
Diagrama de bloques del doble integrador con ruido:

DAIA
k1,k2 calculados con el concepto de LQR

y
L1,L2 calculados de acuerdo al
dimensionamiento del
Problema Dual – para el caso del

Observador:
z  AT z  C T s
y ob  Iz
Matrices de Ponderación:
Qo  0
R0  0
Ecuación de Riccati para el observador de estados completos:
A  AT  Qo  C t R01C  0
Solución de la ecuación anterior es:
 3 1
 
1 3
Ganancia optima del filtro (observador)

 3
L  C T R01   
1
Función de transferencia del compensador LQG
GCLQG  K LQ ( SI  A  BK LQ  LC ) 1 L
3.14( s  0.31)
GCLQG 
s  1.57  j1.4
 3 j
Polos del filtro:
2

DAIA
Ejercicio 1 – Control Optimo - Efecto Integral
A menudo es necesario mantener los niveles de líquidos en ciertas plantas. Un modelo
simplificado de una conexión de dos tanques es mostrado en la Fig 1. Se asume que bajo
condiciones de operación normales, los flujos de entrada y salida todos son iguales a Q y
los niveles de l[líquidos son iguales a H1 y H2. Sea u una perturbación del primer tanque,
el cual causara variaciones en el nivel de liquido x1 y el flujo de salida y1 como se muestra.
Estas variaciones causaran variaciones en el nivel x2 y variación del flujo de salida y en el
segundo tanque. Asuma que
x  x2 x
y1  1 y y2  2
R1 R2
Donde Ri -> resistencia al flujo y depende de las alturas H1 y H2
Balance de masa : E-S=Acumulado
 Primer tanque:
dx1
 (Q  u )   (Q  y1 )  A1
dt
dx
u  y1  A1 1
dt
 Segundo tanque:
dx
 (Q  y1 )   (Q  y)  A2 2
dt
dx 2
y1  y  A1
dt
Donde Ai son las secciones transversales de los tanques. A partir de estas ecuaciones,
podemos fácilmente obtener
u ( x1  x 2 )

x1  A1 A1 R1
x 2  ( x1  x 2 ) x
 2
A2 R1 A2 R2
De este modo la descripción en Espacio-Estado del sistema es dado por:
 1 1 
   x   1 
 x1 
 A1 R1 A1 R1
 x      1    A u
 2  1  1 1   x 2   1 
    0
 AR 
 2 1  A2 R1 A2 R2 
Fig 1 Tanques hidráulicos
Q+u
H1+x1
H2+x2
A1 R2
R1 A2
Q+y1 Q+y

DAIA
Donde : A1=3/2 mt , A2=1 mt, R1=5/4 , R2=10
La función de transferencia puede ser calculada como

1
gˆ ( s) 
A1 A2 R1 R2 s  ( A1 R1  A1 R2  A2 R2 ) s  1
2
Considere en el diseño Control con acción integral más observador

Sistema de los dos tanques de agua más celulosa.
Variables de estado: x1=  h1 y x2=  h2
salida: x2=  h2
Se considera un tercer peso en Q que corresponde a la variable de la integral del error.
Entrada:
Caso 1: Q=diag([40 40 40]) R=1
Caso 2: Q=diag( [1 40 100]) R=1
Caso 3: Q=diag([40 40 100]) R=10
Caso 4: Q=diag( [1 1 100]) R=1 , R=10
Estudiar todos estos casos y describa para cada caso como se comporta el
transitorio y la señal de control.
Ejercicio 2
Considere el modelo de estados de un control de posición (con motor DC):
Sol
a) Complete el desarrollo
% Definimos el sistema
a = 4.6; %alfa
k = 0.787;
A = [0 1;0 -a];
B = [0;k];
C = [1 0];
Q= R=
P= K

DAIA
u=
% Diseño utilizando control óptimo para distintos valores de rho

rho = 2e-5
Q = [K1,S,E1] = lqr(A,B,Q,rho);
disp(sprintf('Autovalores para rho=2e-5: [%-4.3f;%-4.3f]',E1(1),E1(2)));
% Respuesta temporal
xo = [0;0.1]; % condición inicial
sys1 = ss(A-B*K1,B,K1,0);
tf = 0.5;
[y1,t1,x1] = initial(sys1,xo,tf);
Tarea:Podría intentar con otros valores de rho=0.2 y 0.02 y observar los resultados
b)
% Gráfico de los autovalores en función de rho
r = logspace(-4,5,100);
a = 4.6;
k = 0.787;
p1 = 0.5*(-sqrt(a^2+2*k./sqrt(r))+sqrt(a^2-2*k./sqrt(r)));
p2 = 0.5*(-sqrt(a^2+2*k./sqrt(r))-sqrt(a^2-2*k./sqrt(r)));
plot(real(p1),imag(p1),'r*',real(p2),imag(p2),'b*')
title('Autovalores de lazo cerrado para distintos valores de \rho')
xlabel('Real');
ylabel('Imaginario');
Autovalores de lazo cerrado para distintos valores de 

6
2
Imaginario
-2
-4
-6
-7 -6 -5 -4 -3 -2 -1 0
Real

DAIA
Anexo:
Control con Efecto Integral
Usando la notación k i  k n1
Sistema Aumentado

DAIA
Problema a resolver en Aula

El control de altura de un helicóptero se obtiene por accionamiento de los rotores, de los
cuales está equipado el helicóptero. El rotor de cola sirve principalmente para impartir un
par de torsión alrededor del eje de guiñada del helicóptero (y luego baja combinado con una
ligera inclinación hacia el lado del rotor principal, para equilibrar el par originado por la
reacción de la rotación del rotor principal), mientras que el rotor principal desarrolla una
fuerza que, además de poseer un componente vertical sirve principalmente para
contrarrestar el peso de la fuerza, también tiene un componente horizontal que, se describe
mediante el control del paso apropiado. Este puede ser orientado arbitrariamente en el
plano horizontal para asegurar la traslación. En la figura 1 se muestra un esquema útil para
el estudio de la dinámica de traslación.
figura 1 Dinámica de un helicóptero
Sea h la línea vertical que pasa por un punto de referencia del helicóptero, y e el eje de
guiñada del helicóptero, s el eje virtual (es decir, el eje a lo largo del cual se dirige la fuerza
producida por el rotor principal, no coincide necesariamente con el eje del cuerpo del
rotor), O es el punto en el suelo verticalmente desde donde el helicóptero despega. (t) el
ángulo de paso del helicóptero, z(t) la distancia vertical h desde el punto de despegue, v(t)
= z(t ) es la velocidad del helicóptero, con (t) el ángulo de inclinación del eje del rotor
virtual al eje del rotor físico.
Con p(t)= (t) la velocidad angular de cabeceo, el modelo de la dinámica puede definirse
como:
Donde g es la aceleración de la gravedad y y n son constantes que dependen

de la aeronave considerada.
La inclinación del rotor virtual es independiente de la variable manipulada.
Considerando:

DAIA
1. Definir las matrices A,B, C del sistema en el espacio – estado , tomando como salida
a la variable z(t).
2. Estudiar la estabilidad del sistema y la propiedad de controlabilidad/observabilidad.
3. Diseñe un control de retroalimentación óptimo que minimiza un índice de costo:
Donde, asumir, zo=2, 0=5. Intente con otros valores de zo y 0. Note que z(t) es la salida del
sistema y la variable de control. Simule la conducta del sistema regulado (duración de la
T
simulación 15 s.), considerando las condiciones iniciales =[0 0 0 1] y
grafique en un gráfico la salida y(t) y el esfuerzo de control u(t) .(use subplot).
4. El diseño del controlador en el paso anterior, mas una entrada de referencia yd (t) = 3u(t - 5),
donde u(t) representan la función step, y simularemos de nuevo el sistema de control
considerado las mismas condiciones iniciales. (15 s.). Graficar en una figura la respuesta de
color azul y la respuesta a la referencia en color rojo con el icono (‘:’), y el error e(t)= yd(t)-y(t)
(use subplot).
5. Diseñe un estimador de estados e inclúyalo en la retroalimentación, de tal forma que use la
estimación de los estados en lugar del estado verdadero. De nuevo simular la respuesta del
sistema considerando las condiciones en los ítems anteriores. Grafique una figura con la
respuesta y(t) de color azul, la referencia de color (‘ r: ‘), y el error e(t)= yd(t)-y(t) (use
subplot).
Sugerencia: Use los polos del estimador iguales a 4 veces la parte real de los polos dominantes
del controlador.
Referencia:
Teoria dei sistemi e del controllo
Prof. Roberto Zanasi, Ing. Luigi Biagiotti
La Profesora

Laboratorio7 - LQR

Загружено:

Сведения о документе

Оригинальное название

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

Laboratorio7 - LQR

Загружено:

Авторское право:

Доступные форматы

UNIVERSIDAD NACIONAL DE INGENIERIA Control Moderno y Óptimo

FACULTAD DE INGENIERIA MECANICA P.A.2015

 Derivar el regulador cuadrático lineal (LQR) y describir cómo diseñar un controlador

Problema de Regulación en el horizonte infinito

Regulador cuadrático lineal

Q0 R>0 (1)

Restricción: x (t )  A x(t )  B u(t )

Solución: u  u x(t ) tal que

Rosa Garrido Juárez MT227-A Página 1

Solucionar vía el principio del máximo:

Rosa Garrido Juárez MT227-A Página 2

Quedando las ecuaciones diferenciales canónicas:

Y para la ecuación de control

La ecuación de control (12) puede ser resuelta:

Rosa Garrido Juárez MT227-A Página 3

La ecuación (18) nos da u optimo que minimiza J (función de costo).

Rosa Garrido Juárez MT227-A Página 4

1. Comprobar si (A,B) es estabilizable (Es preferible que sea completamente controlable)

Calcular la matriz P a partir de la ecuación de Riccati.

En Matlab, [Kopt,P] = lqr (A, B, Q, R).

3. Cálculo de la ganancia matricial optima de retroalimentación

incluyendo la ley de control

y para la evaluación y control calcular los valores propios en lazo cerrado

La parte real debe ser menor que cero.

Un sistema de primer orden es descrito por la ecuación de estado:

Rosa Garrido Juárez MT227-A Página 5

 1.5 x (t )  0.5u 2 (t ) dt

Ec. del hamiltoneano: H  3 x (t )  u 2 (t )   (t )( x(t )  u(t ))

Rosa Garrido Juárez MT227-A Página 6

Control de un doble integrador

a) Se desea encontrar las ganancias k1 y k2 para minimizar el índice de comportamiento

Diseñar un observador según:

Rosa Garrido Juárez MT227-A Página 7

0 0  p1 p2  p1 p2 0 1  p1 p2 0 1  p1 p 2   1 0  0 0 

P 3  , simétrica y definida positiva..

Ley de Control Óptima

u(t )  [ 2   4 ] x (t ) K [ 2   4 ]  Matriz de retroalimentación

Usando el controlador de estados, el sistema en lazo cerrado sería:

Rosa Garrido Juárez MT227-A Página 8

Los valores propios del sistema en lazo cerrado:

Rosa Garrido Juárez MT227-A Página 9

Probando la respuesta al escalón unitario del sistema mas controlador.

c) Modelo del Integrador doble con ruido

Las señales v , w1 e w2 son señales estocásticas independientes cuyas características

Diagrama de bloques del doble integrador con ruido:

Rosa Garrido Juárez MT227-A Página 10

k1,k2 calculados con el concepto de LQR

Problema Dual – para el caso del

Solución de la ecuación anterior es:

Ganancia optima del filtro (observador)

Rosa Garrido Juárez MT227-A Página 11

Rosa Garrido Juárez MT227-A Página 12

La función de transferencia puede ser calculada como

Considere en el diseño Control con acción integral más observador

Rosa Garrido Juárez MT227-A Página 13

% Diseño utilizando control óptimo para distintos valores de rho

Autovalores de lazo cerrado para distintos valores de 

Rosa Garrido Juárez MT227-A Página 14

Usando la notación k i  k n1

Rosa Garrido Juárez MT227-A Página 15

Problema a resolver en Aula

figura 1 Dinámica de un helicóptero

Donde g es la aceleración de la gravedad y y n son constantes que dependen