Академический Документы
Профессиональный Документы
Культура Документы
Objetivo
x(t) Q x(t) u
1
J
T
Funcional de costo (t) R u(t) dt
2 o
y (t ) C x (t ) ,
Condiciones: x(0) x o
x ( ) 0 .
J Min !
u( x )
Observar el factor de 1/2 que esta fuera de la integral, pero lo incluimos aquí para
simplificar la derivación.
Si la matriz Q de orden n es una matriz diagonal positiva con elementos(qii> 0), la forma
cuadrática xT(t)Qx(t) es la suma pesada de las variables de estado
q11
q
22
Q
qun
J1 x (t ) Q x (t )dt q11 x12 (t ) q un x n2 (t ) dt
T
(3)
o o
La Matriz R es también diagonal dominante con elementos positivo en la diagonal rii > 0.
La forma cuadrática:
m
uT (t ) R u(t ) rii ui2 (t )
i 1
(4)
r11
r
22
R
rmm
Para la optimización del problema con restricciones, se usara primero el principio del
máximo con la función de Hamilton-Jacobi-Bellman,:
int egrandode J
restricción de (1)
2
H x, , u x Q x u R u A x B u
1 T T T
(5)
El vector (t) se llama parámetros de Lagrange
1 (t )
(t )
2
(t )
n (t )
La solución consiste en encontrar las derivadas parciales de H con respecto a las variables
x, , y u.
H
x (6)
H
(7 )
x
A las ecuaciones (6) y (7) se les llama Ecuaciones diferenciales canónicas y la ecuación de
control
H
0. (8)
u
Para las derivadas parciales de H, se requiere conocer las siguientes reglas de cálculo para
la diferenciación:
T A x A x
x
T A x AT
T Bu Bu
x
x Q x 2Q x
T
u
T B u BT
u
u Ru 2Ru
T
(9)
x A BR 1 B T x
(16)
Q AT
Las ecuaciones de Hamilton son ecuaciones diferenciales lineales para x y , tal que puede
asumirse que la solución tendría esta forma:
(t) = P x(t), (17)
Donde P es una matriz de orden n, luego reemplazando (17) en (13) nos daría:
u = - R-1 BT Px = - Kopt x , (18)
Donde:
(A,B) es estabilizable ( no necesariamente completamente controlable pero si estable)
x A BR 1 BT P x , x(0) x o
Es estable
e i A BR 1 BT P 0 i 1, 2, , n ,
Q y R son definidas positivas. Al variar los valores qii y rii afectan la conducta de xi(t), e
ui (t) hacia la conducta deseada.
x (t ) Acl x (t ) , x (0) x o
: x (t )
Las condiciones suficientes que garantizan que el sistema en lazo cerrado sea estable
son: Q> 0, R> 0, y (A, B) estabilizable.
Ejemplo 1
0
T es fijo, y x(T) es libre.
b) Demostrar que cuando T la ley de control optima es de la forma: u(t)=kx(t), donde k
es una constante. Encontrar k.
Solución
3 x (t ) u 2 (t ) dt
T
Por comodidad para derivar: J 1
2
2
H
u(t ) (t ) 0 u(t ) (t )
u
H
x (t ) u(t ) x (t )
H
(t ) 3 x (t ) (t )
x
Arreglando las ecuaciones canónicas:
x (t ) x (t ) ( t )
(t ) 3 x(t ) (t )
x (t ) 1 1 x (t )
(t ) 3 1 (t )
Cuya solución:
x (t ) s 1 1
1
1 x (0)
(t ) 3
s 1 (0)
x (t ) 14 3e 2 t e 2 t 1
4 e
2 t
e 2 t x (0)
(t ) 1
4 3e
2t
3e 2 t 1
4 e
2t
3e 2 t (0)
O también
x (T ) 14 3e 2(T t ) e 2(T t ) 1
4 e
2 ( T t )
e 2 (T t ) x ( t )
(T ) 1
4 3e
2 (T t )
3e 2(T t ) 1
4 e
2 (T t )
3e 2 (T t ) (t )
(T ) 0 Condición del problema.
e 2 ( T t ) e 2 ( T t )
(t ) 3 x (t )
e 2(T t ) 3e 2(T t )
e 2(T t ) e 2(T t )
u(t ) 3 2(T t ) x (t )
e 3e 2(T t )
b ) cuando T-> u(t ) 3 x(t ) k= 3
Para el sistema:
0 1 0
x x(t ) u (t )
0 0 1
y(t ) 1 0x(t )
En lazo cerrado
Co= [B AB]
0 1
Co=
1 0
Rank(Co)=n=2 Completamente controlable
0 1 0 1 0
A= ; B 1 C 1 0 Q CtC R=
0 0 0 0
La ecuación de Riccati (ARE)
At P PA PBRB t P Q 0
0 p1 p22 p 2 p3 1 0
p 2p 1
0
1 2 p 2 p3 p32 0
1 p22 p1 1 p2 p3 1 0
1 2
p1 p2 p3 2 p2 p3
1
0 0
p22 p2
1
p 2 p3 p 1
1
p1 2 4
3
p32 2 p2 2 4
2 4
1
1 t
u
RB
Px
K
1 1
1 1
x x ( t ) 1 [ 2 4
] x (t )
0 0
0 1
x 1 4 x (t )
1
2
Acl
1
Este controlador óptimo tiene un factor de amortiguamiento = , independiente del
2
valor de .
b) En el caso particular
u x1 2x2
Verificación de polos en lazo cerrado
sI A BK s2+ 2s 1 =0
s 22 (1 j ) Polos estables.
Usando Matlab:
A=[0 1; 0 0];
B=[0;1];
C=[1 0];
D=0;
Q=[1 0; 0 0];
R=1;
[K,P]=lqr(A,B,Q,R)
K =
1.0000 1.4142
>> P
P =
1.4142 1.0000
1.0000 1.4142
Step Response
1.4
1.2
0.8
Amplitude
0.6
0.4
0.2
0
0 1 2 3 4 5 6 7 8
Time (sec)
Matrices de Ponderación:
Qo 0
R0 0
Ecuación de Riccati para el observador de estados completos:
A AT Qo C t R01C 0
3 1
1 3
Q+u
H1+x1
H2+x2
A1 R2
R1 A2
Q+y1 Q+y
Estudiar todos estos casos y describa para cada caso como se comporta el
transitorio y la señal de control.
Ejercicio 2
Considere el modelo de estados de un control de posición (con motor DC):
Sol
a) Complete el desarrollo
% Definimos el sistema
a = 4.6; %alfa
k = 0.787;
A = [0 1;0 -a];
B = [0;k];
C = [1 0];
Q= R=
P= K
% Respuesta temporal
xo = [0;0.1]; % condición inicial
sys1 = ss(A-B*K1,B,K1,0);
tf = 0.5;
[y1,t1,x1] = initial(sys1,xo,tf);
Tarea:Podría intentar con otros valores de rho=0.2 y 0.02 y observar los resultados
b)
% Gráfico de los autovalores en función de rho
r = logspace(-4,5,100);
a = 4.6;
k = 0.787;
p1 = 0.5*(-sqrt(a^2+2*k./sqrt(r))+sqrt(a^2-2*k./sqrt(r)));
p2 = 0.5*(-sqrt(a^2+2*k./sqrt(r))-sqrt(a^2-2*k./sqrt(r)));
plot(real(p1),imag(p1),'r*',real(p2),imag(p2),'b*')
title('Autovalores de lazo cerrado para distintos valores de \rho')
xlabel('Real');
ylabel('Imaginario');
2
Imaginario
-2
-4
-6
-7 -6 -5 -4 -3 -2 -1 0
Real
Anexo:
Control con Efecto Integral
Sistema Aumentado
Sea h la línea vertical que pasa por un punto de referencia del helicóptero, y e el eje de
guiñada del helicóptero, s el eje virtual (es decir, el eje a lo largo del cual se dirige la fuerza
producida por el rotor principal, no coincide necesariamente con el eje del cuerpo del
rotor), O es el punto en el suelo verticalmente desde donde el helicóptero despega. (t) el
ángulo de paso del helicóptero, z(t) la distancia vertical h desde el punto de despegue, v(t)
= z(t ) es la velocidad del helicóptero, con (t) el ángulo de inclinación del eje del rotor
virtual al eje del rotor físico.
Con p(t)= (t) la velocidad angular de cabeceo, el modelo de la dinámica puede definirse
como:
Donde, asumir, zo=2, 0=5. Intente con otros valores de zo y 0. Note que z(t) es la salida del
sistema y la variable de control. Simule la conducta del sistema regulado (duración de la
T
simulación 15 s.), considerando las condiciones iniciales =[0 0 0 1] y
grafique en un gráfico la salida y(t) y el esfuerzo de control u(t) .(use subplot).
4. El diseño del controlador en el paso anterior, mas una entrada de referencia yd (t) = 3u(t - 5),
donde u(t) representan la función step, y simularemos de nuevo el sistema de control
considerado las mismas condiciones iniciales. (15 s.). Graficar en una figura la respuesta de
color azul y la respuesta a la referencia en color rojo con el icono (‘:’), y el error e(t)= yd(t)-y(t)
(use subplot).
5. Diseñe un estimador de estados e inclúyalo en la retroalimentación, de tal forma que use la
estimación de los estados en lugar del estado verdadero. De nuevo simular la respuesta del
sistema considerando las condiciones en los ítems anteriores. Grafique una figura con la
respuesta y(t) de color azul, la referencia de color (‘ r: ‘), y el error e(t)= yd(t)-y(t) (use
subplot).
Sugerencia: Use los polos del estimador iguales a 4 veces la parte real de los polos dominantes
del controlador.
Referencia:
Teoria dei sistemi e del controllo
Prof. Roberto Zanasi, Ing. Luigi Biagiotti
La Profesora