Paper Fina 3

Rendimiento de controladores PID, LQG y MPC
aplicados al péndulo invertido

Diana Karina Solórzano Byron Ricardo Zapata Carlos German Pillajo
Universidad Politécnica Salesiana Universidad Politécnica Salesiana Universidad Politécnica Salesiana
Quito, Ecuador Quito, Ecuador Quito, Ecuador
dsolorzanop@est.ups.edu.ec bzapata@ups.edu.ec cpillajo@ups.edu.ec
Resumen—Los sistemas en configuración de péndulo invertido cuadrado del error (ISE) y demostrar que controladores es más
son utilizados para el estudio de diversas técnicas de control, óptimo.
debido a que estos sistemas son multivariable, inestables y no En la segunda sección se describe la planta utilizada de la
lineales, además estos sistemas ha sido base para la creación de
medios de movilización como el Segway, que es un dispositivo cual se obtendrá el modelo dinámico en espacio de estados,
en configuración de péndulo invertido sobre dos ruedas. Este en la tercera seccin se diseña y describe los tres controladores
trabajo se basa en la optimización de la estabilidad de un utilizados y la función de costo sobre la cual se evaluar el
sistema en configuración de péndulo invertido sobre dos ruedas rendimiento del controlador, al final se presentan los resulta-
mediante la aplicación de controladores PID, LQG y MPC. Con dos obtenidos mediante tablas comparativas obtenido de las
la aplicación de los controladores, se realiza una comparativa del
comportamiento del sistema mediante la utilización de ı́ndices de simulaciones de los controladores, evaluados en el sistema.
rendimiento, como último se concluirá con la presentación de los
resultados obtenidos. Este trabajo pretende ser una referencia pa- II. DESCRIPCI ÓN DEL P ÉNDULO INVERTIDO
ra los investigadores y sobre todo para los ingenieros que buscan SOBRE DOS RUEDAS
realizar aplicaciones en el campo de control implementando estos
mtodos de control a sistemas multivariables de comportamiento El péndulo invertido sobre dos ruedas (TWIP) se encuentra
no lineal. construido mediante el set de Lego Mindstorms EV3, el cual
Index Terms—Ángulo,Posición,Controlador, LQG, PID, MPC, consta de 1 sensor giroscopio para medir la inclinación del
TWIP, Índices de rendimiento, Estabilidad robot, también posee 2 encoders de tipo incremental acoplados
a 2 motores dc que permiten medir la posición angular del
I. I NTRODUCCI ÓN sistema.
El TWIP es un sistema multivariable en el cual se considera
El péndulo invertido es uno de los sistemas más conocidos
dos entradas de voltaje (u1 (t)) y (u2 (t)), y como salidas se
en la robótica, dentro de la industria cada vez tomando más
considera los estados que representan el ángulo de inclinación
importancia por su grado de flexibilidad y eficiencia en la
psi (ψ) con su tasa de cambio (ψ̇), y la posición (θ) con su
supervisión, inspección y transporte. En [1] se implementa
tasa de cambio (θ̇), como se representa en la Fig.1.
varias técnicas de control lo cual se han implementado en
un péndulo invertido en donde se describe el sistema lineal
y no lineal utilizado para la estabilizacin del sistema. En la
actualidad existen varios trabajos que han surguido de la teorı́a
del péndulo que han servido como base para la investigación
en las cuales se tiene, el carro deslizante sobre una riel en
donde se busca tener una barra en equilibrio [2], también existe
un péndulo invertido tripulado por personas conocido como
Segway; para este trabajo se implementa sobre el equipo Lego
Mindstorms un sistema móvil sobre dos ruedas en el que se
puede aplicar controladores que permitan estabilizarse en un Figura 1. Representación multivariable del sistema.
punto de equilibrio; se aplica el control óptimo LQG (Lineal
Cuadrtico Gaussiano) en el que se emplea el controlador LQR
y el Filtro de Kalman como observador; se realiza también II-A. Modelo dinámico del sistema
el control MPC (Control Predictivo del Modelo) el cual se Para modelar el sistema se emplean principios fı́sicos
basa en los hechos pasados para predecir salidas futuras. y matemáticos que permiten capturar el comportamiento
Mediante la realización de pruebas de la aplicación de los dinámico del sistema, para obtener el modelo se parte del
controladores se podrá obtener los resultados para cada uno diagrama de cuerpo libre presentado en la Fig.2. [3]
de los controladores, contrastando mediante los ı́ndices de
rendimiento, Integral Absoluto del error (IAE) e integral del
Evaluando (1) y (2), se obtiene las ecuaciones de fuerza
generalizadas:
Fθ = [(2m + M )R2 + 2Jw + 2n2 Jm ]θ̈ +

(M LR cos ψ − 22 Jm )ψ̈ − M LRψ̇ 2 sin ψ (3)
Fψ = [M LR cos ψ − 2n2 Jm ]θ̈ +

+(M L2 + Jw + 2n2 Jm )ψ̈ − M gL sin ψ (4)
Agregando a las ecuaciones de fuerzas del torque producido
por los motores de corriente continua Fl yFr y las fuerzas de
fricción se obtiene:
Fθ = Fl + Fr (5)
Figura 2. Diagrama de cuerpo libre del péndulo invertido. Fψ = Fψ (6)
Donde:
El TWIP posee un movimiento de inclinación asociado a
un sensor de giroscopio que permite determinar la variación Fl = nKt il + fm (ψ̇ − θ˙l ) − fw θ˙l (7)
del ángulo psi (ψ) asociado al movimiento Pitch, para el
Fr = nKt ir + fm (ψ̇ − θ˙r ) − fw θ˙r (8)
movimiento de desplazamiento se emplea encoders de tipo
incremental acoplados a la ruedas que permite determinar la Fψ = −nKt il − nKt ir + fm (ψ̇ − θ˙l ) − fm θ˙r (9)
posición angular mediante la variación del ángulo theta (θ).
Donde la corriente il y ir de las ecuaciones de fuerza se
Los parámetros y valores utilizados en el diseño del TWIP
obtiene del circuito eléctrico del motor-dc, en el cual se tiene
que interviene en el modelamiento del sistema se presenta en
como entrada vl y vr que representan el voltaje de los motores.
la Tabla.1.
vl,r + Kb (ψ̇ + θ̇l,r )
Tabla I il,r = (10)
PAR ÁMETROS LEGO MINDSTORMS *0
LmRm

Parámetros y Valores del sistema Reemplazando (7), (8) y (10) en (5) se obtiene:
Descripción Parámetro
Gravedad g =9.8 [m/sec2 ]
Peso de las ruedas m =0.0127 [kg]
nKt nKt Kb
Fθ = (vl + vr ) − 2θ̇ + fm + fw +
Radio de las ruedas R =0.028 [m] Rm Rm
Momento de inercia de las ruedas Jw mR2 /2 [kgm2 ]
nKt Kb

Peso del cuerpo M = 0.9 [kg] +2ψ̇ + fm (11)
Ancho del cuerpo W = 0.183 [m] Rm
Profundidad del cuerpo D 0.05 [m]
Altura del cuerpo H = 0.26 [m]
Reemplazando (9) y (10) en (6) se obtiene:
Distancia del centro de la masa del eje de L = H/2 [m]
la rueda

nKt nKt Kb
Momento de inercia la inclinacin (pitch) del Jψ = M L2 /2 [kgm2 ] Fψ = − (vl + vr ) + 2θ̇ + fm +
cuerpo Rm Rm
Jm = 1x10−5 [kgm2 ]

Momento de inercia del motor dc nKt Kb
Resistencia del motor dc Rm = 6.69 [Ω] +2ψ̇ + fm (12)
Constante de velocidad motor dc Kb = 0.468 [V sec/rad]
Rm
Constante de torque motor dc Kt = 0.317 [N m/A]
Igualando (4) con (12) y (3) con (11) y despejando ψ̈,θ̈ se
Relación de transmisión n = 1 [V sec/rad]
Coeficiente de fricción entre el cuerpo y el fm = 0.0022 obtiene:
motor
Coeficiente de fricción entre la rueda y el fw = 0
suelo As
ψ̈ = [α(vl +vr )−2θ̇(β+fw )+2β ψ̇+M LRψ̇ 2 sin(ψ)]−
Bs
Las ecuaciones de Lagrange se definen por: Cs
− [M gL sin ψ − α(vl + vr ) + 2β θ̇ − 2β ψ̇]
Bs

d ∂L ∂L
Fθ = − (1) As
dt ∂ θ̇ ∂θ θ̈ = [M gL sin ψ − α(vl + vr ) + 2β θ̇ − 2β ψ̇]−
Bs
d

∂L

∂L Ds
Fψ = − (2) − [M LRψ̇ 2 − α(vl + vr ) − 2θ̇(β + fw ) + 2β ψ̇] (13)
dt ∂ ψ̇ ∂ψ Bs
Donde:
∆ẋ(t) = A∆x(t) + B∆u(t)
∆y(t) = C∆x(t) + D∆u(t) (20)
As = M LR cos ψ − 2n2 Jm
Discretizando el modelo en espacio de estados se obtiene:
Bs = (As) − [(2m + M )R2 + 2Jw + 2n2 Jm ](Ds)
[5]
Ds = M L2 + Jψ + 2n2 Jm
nKt
α= x(k + 1) = Ad x(k) + Bd u(k)
Rm
nKt Kb y(k) = Cd x(k) + Dd u(k) (21)
β= + fm
Rm Discretizando las matrices de espacio de estado con un
(14) tiempo de muestreo T0 = 0.1s se obtiene:
II-B. Modelo en espacio de estados
1 0.2192 0.0279

0.0793

18.1926

18.1926
La representación del modelo en espacio de estados emplea 0 1.2204 0.0279 0.0794 18.1381 18.1381

Ad = , Bd =
0 4.5463 0.3170 0.9022 376.0998 376.0998

las ecuaciones del comportamiento dinámico del sistema. 0 4.5602 0.3173 0.9031 375.6939 375.6939
Donde las entradas y salidas del sistema se representan
mediante (15).

1 0 0 0 0 0
Cd = ,D = (22)
T
X = ψ ψ̇ θ θ̇ = x1 x2 x3
T
x4 0 0 1 0 d 0 0
T T
U = vl vr = u1 u2 (15)
III. C ONTROLADORES
Realizando el reemplazo de variables se obtiene (13): En esta sección se describe el diseño y desarrollo de las tres
estrategias de control empleadas para la estabilización del sistema
en un punto de referencia, se parte con el diseño del control PID,
ẋ1 = x2 luego se realiza el control óptimo lineal cuadrático gaussiano (LQG)
y el control predictivo basado en el modelo (MPC), támbien se
introduce en los controladores LQG y MPC un filtro de Kalman
As
ẋ2 = [α(u1 +u2 )−2x4 (β+fw )+2βx2 +M LRx22 sin(x1 )]−como observador, por último se realiza una comparativa entre los
Bs resultados obtenidos de los tres controladores.
Cs
− [M gL sin x1 − α(u1 + u2 ) + 2βx4 − 2βx2 ] III-A. Control PID
Bs
Para la implementación del control PID se parte de la función
ẋ3 = x4 de transferencia presentado en (23) que permite calcular la señal de
control U (t).
As U (t) Ki
ẋ4 = [M gL sin x1 − α(u1 + u2 ) + 2βx4 − 2βx2 ]− Gc (s) = = Kp + Kd s + (23)
Bs E(t) s
Ds Donde:
− [M LRx22 − α(u1 + u2 ) − 2x4 (β + fw ) + 2βx2 ]
Bs Kp : Ganancia proporcional.
(16) Ki : Ganancia integral.
Kd : Ganancia derivativa.
Tomando en cuenta que la variable As es:
As = M LR cos x1 − 2n2 Jm (17) Aplicando el método de Tustin en (23) se obtiene la transformada
de z presentada en (24). [5]
Para la lineazación del sistema se emplea el método de U (z)

T0 (z + 1)

z−1

series de Taylor sobre un punto de referencia presentado en = Kp + Kd + Ki (24)
E(z) 2(z − 1) Ts z
(18) para la ecuación de estados y (19) para la ecuación de
Ampliando (24) se obtiene:
salida. [4]

Kd 2Kd Kd
U (z) Kp + Ki T20 + z 2 + −Kp + Ki T2s − z+
∂f (x, u) ∂f (x, u) =
Ts Ts Ts
∆ẋ = ∆x + ∆u (18) E(z) z2 − z
∂x ∂u

x0 ,u0 x0 ,u0
(25)
∂h(x, u) ∂h(x, u) Las propiedades Time shifting se presentan en:(26)

∆y = ∆x + ∆u (19)
∂x ∂u

x0 ,u0 x0 ,u0
La representación en espacio de estados para un sistema lineal Z{x(k − n)} = z − nX(z)

invariante en el tiempo se encuentra definido por: Z{x(k)} = X(z) (26)
Aplicando (26) en (25) se obtiene: Donde:
x̂: Señal predicha.
u(k) = u(k + 1) + ae(k) + be(k − 1) + ce(k − 1) (27) La señal de control u(k) se define mediante:
Donde:

T0 Kd T0 2Kd u(k) = −K(k)x̂(k) + r(k) (33)
a= Kp + Ki + + −Kp + Ki −
2 T0 2 T0
Donde:
L(k): Ganancia del filtro de Kalman.
Ts 2Kd K(k): Ganancia del control LQG.
b= −Kp + Ki −
2 T0 r(k): Referencia.
La ganancia de Kalman L(k) se obtiene mediante:
Kd
c= (28)
Ts L(k) = P − (k)CdT (Cd P − (k)CdT + Rk )−1 (34)
Y: Donde:
e(k) = xref (k) − x(k) (29) P − (k) : Covarianza del error a priori.
Qk : Covarianza de los ruidos de la medida.
Los términos de (29) representa: Rk : Covarianza de los ruidos del proceso.
La covarianza del error se define por:
xref (k): Referencia para los estados ψ and θ.
P − (k + 1) = Ad P (k)ATd + Fd Qk FdT (35)
x(k): Estados ψ y θ obtenidos de la salida del sistema.
Donde:
Del diseño el controlador PID para el control de ángulo ψ y para el P (k): Covarianza del error a posteriori.
control de posición θ se obtiene los valores presentados en la Tabla.2. La ganancia K(k) se obtiene resolviendo la ecuación (31) de
donde se obtiene el principio óptimo:
Tabla II K(k) = (R + BdT S(k + 1)Bd )−1 BdT S(k + 1)Ad (36)
PAR ÁMETROS DEL DISE ÑO DEL CONTROLADOR PID
Donde:
Parámetros PID
Kp Ki Kd
ψ 40 12 0.005
θ −15 −6 2
S(k) = Q + ATd [S(k + 1)−
− S(k + 1)Bd (BdT S(k + 1)Bd + R)−1 BdT S(k + 1)]Ad (37)
Implementando las ecuaciones descritas del control LQG para el
III-B. Control lineal quadrático gaussiano (LQG) sistema de péndulo invertido se emplea un algoritmo de simulación
El control óptimo Lineal Cuadrático Gaussiano (LQG) es un secuencial automática para obtener los valores de Q y R, presentados
sistema lineal en lazo cerrado el cual permite considerar el ruido en(38) estos valores permiten minimizar el error en estado estable
estocástico que se genera en todo sistema dinámico,puede aplicarse e(k) y el tiempo de asentamiento T s.
también sistemas lineales o no lineales, para el control del TWIP se
considera como sistema MIMO en tiempo discreto,el diseño responde
2 0 0

0
a la combinación del controlador LQR y el filtro de Kalman como

0 0.1 0 0 1 0

observador de estados. En (30) se presenta el sistema estócastico en Q= , R = (38)
0 0 2 0 0 1

espacio de estados considerado los ruidos gaussianos: [6] [7] 0 0 0 0.1
Los valores de las ganancias L(k) y K(k) obtenidos del diseño
x(k + 1) = Ad x(k) + Bd u(k) + v(k) como resultado para el controlador se presenta en (39)
y(k) = Cd x(k) + Dd u(k) + w(k) (30)

625 0

624.96

0.03
−1 2.06 0.61 0.41
La función de costo que permite minimizar el error se encuentra L(k) = , K = (39)
definida por: [8] 0 625 −1 2.06 0.7 0.38
447.76 −219.61
Z tf III-C. Control predictivo basado en el modelo (MPC)
J= xT (k)Qx(k) + uT (k)Ru(k)dt (31)
t0 El control predictivo basado en el modelo MPC es un controlador
avanzado que permite ser aplicado a una gran variedad del sistemas
Donde: sean estos lineales, no lineales, sistemas SISO, sistemas MIMO donde
Q: Matriz de pesos asociado a los estados siendo Q ≥ 0. no es necesario aplicar técnicas de desacoplamiento.
R: Matriz de pesos asociado al esfuerzo de control siendo R ≥ El control MPC utiliza el modelo del sistema para predecir la
0. salida y(k + i|k) del sistema en un horizonte de predicción (Np ),a
Implementando el observador en espacio de estados se obtiene: partir de las entradas y salidas pasadas, y de la señal de control futura
[9] (u = (k + i|k)).
Para el control MPC se emplea (40) que representa un modelo en
variables de estado con integrador embebido, que permita garantiza
˙ + 1) = Ad x̂(k) + Bd u(k) + L(k)(y(k) − Cd (k)x̂(k)) (32)
x̂(k que el error en estado estacionario sea nulo. [10]
R: Matriz de ponderación de peso para la señal de control.
X(k+1) Ae X(k) Be Rs : Matriz de ponderación de peso para la salida.
z }| { z }| { z }| { z }| { La ley de control se obtiene mediante la derivada parcial de la
∆x(k + 1) Ad
= OdT ∆x(k) Bd función de costo e igualando está a 0, de donde se obtiene:

y(k + 1) Cd Ad + ∆u(k)
1 y(k) Cd Bd
∆U = (ΦT Φ + R)−1 (ΦRs − ΦF X(ki )) (47)
X(k) Tomando en cuenta los incrementos de control, la referencia y
Ce
considerando únicamente el primer término de la ley de control
z }| {
{
∆x(k)
z }|
y(k) = Od 1
(40) ∆U ya que los demás términos de la ley de control se conocen,
y(k) se representa la ley de control como:
La predicciones para la matriz de estados en un instante ki, en un
horizonte de predicción Np y en un horizonte de control Nc parten Nc
z }| {
de: ∆u(ki ) = 1 0 ··· 0(ΦT Φ + R)−1 (ΦRs r(ki ) − ΦF X(ki ))
(48)
N N −1 Donde:
X(k + Np |ki ) = Ae p X(ki ) + Ae p Be ∆u(ki)+
r(ki ): Referencia para el sistema.
N −2
+ Ae p Be ∆u(ki + 1) + · · · + Rescribiendo la ley de control en términos de ganancia se obtiene:
N −N c
+ Ae p Be ∆u(ki + 1 + Nc − 1) (41)
∆u(ki ) = Ky r(ki ) − KM P C X(ki ) (49)
Para las predicciones de la salida se emplea la ecuación de salida Para la introdución del filtro de Kalman al modelo del sistema con
y las predicciones de los estados, con lo que se obtiene: integrador embebido se parte por la proyección de la covarianza del
error hacia adelante como se presenta en (50).
N N −1
y(k + Np |ki ) = Ce p X(ki ) + Ce Ae p Be ∆u(ki)+ P − (k + 1) = Ad P (k)ATd + Fd Qk FdT (50)
N −2
+ Ce Ae p Be ∆u(ki + 1) + · · · + La ganancia de Kalman L(k) se obtiene mediante:
N −N c
+ Ce Ae p Be ∆u(ki + 1 + Nc − 1) (42)
L(k) = P − (k)CdT (Cd P − (k)CdT + Rk )−1 (51)
Representando matricialmente las predicciones de la salida y el
La actualización de los estados y de la covarianza del error se
incremento de control futuro se obtiene: [11]
T presenta en (52) y (53) respectivamente.
Y = y(k + 1|ki ) y(k + 2|ki ) · · · y(k + Np |ki )
X̂(k) = X̂ − (k) + L(k)(y(k) − Cd X̂ − (k) − Dd u(k))
T
(52)

∆U = ∆u(k + 1|ki ) ∆u(k + 2|ki ) · · · ∆u(k + Nc − 1|ki )
(43)
P (k) = (I − L(k)Cd )P − (k) (53)
Agrupando los productos de las predicciones de los estados y de Para el diseño del control MPC del ángulo de inclinación y
las salidas se obtiene: la posición del péndulo invertido sobre dos ruedas se utiliza los
siguientes párametros:

Ce Ae
2 Tabla III
Ce Ae
PAR ÁMETROS Y VALORES PARA EL DISE ÑO DEL CONTROL DE ÁNGULO Y
C A3

F = e e POSICI ÓN
..
. Parámetros y valores para el control de ángulo y posición
Ce AN

p
e Párametro Valor
Np 10
Np 8
R 1
···

Ce Be 0 0 Np
Ce Ae Be Ce Be ··· 0

z }| {
Ce A2e Be Ce Ae Be ··· 0 Rs 1 1 · 1

Φ = (44)

.. .. .. ..
. . . .
Ce AN
p −1 N −2 N −N
Se emplea los valores de Rk = 102 y Qk = 0.52 , para el diseño
e Be Ce Ae p Be ··· Ce Ae p c Be
del filtro de Kalman.
Redefiniendo la salida predicha se obtiene: Con los párametros definidos se óbtiene los valores presentados
en (54) del control MPC multvariable para el TWIP:
Y = F X(ki ) + Φ∆U (45)

Para la optimización se emplea la función de costo cuadrática 0.0041 0.0011
(J) sin restricciones del controlador MPC como se presenta en la −0.2582 0.2614

L(k) =
ecuación: [12] −0.9959 1.0011

−0.9989 1.0040
J = (Rs − Y )T (Rs − Y ) + ∆U T R∆U (46)

0.51 0.60 0.05 0.14 0.09 0.09
KM P C = (54)
Donde: 0.51 −0.2 0.02 0.05 0.09 0.09
Tabla IV
VALORES DE LA RESPUESTA DEL CONTROL DE ÁNGULO
IV. R ESULTADOS Ts [s] e(k) [rad] IAE ISE

P ID 20 −7.65e − 04 2.011 1.986
Para las pruebas y resultados se toma r(k) = 0 con
un referencia LQG 10 −5.722e − 04 1.085 0.3441
valores iniciales de los estados x0 = 1 1 0 0 con un tiempo
MP C 8 −6.8315e − 04 1.7174 1.4266
de ejecución de 50-seg.
En la Fig.3 y Fig.4 se presenta los resultados de la aplicación del
controlador para del ángulo de inclinación y para el control de
Tabla V
posición del TWIP respectivamente.
VALORES DE LA RESPUESTA DEL CONTROL DE POSICI ÓN
Ts [s] e(k) [rad] IAE ISE

P ID 12 10.089e − 05 2.9743 3.861
LQG 4 7.022e − 05 1.272 2.9004
MP C 6 8.773e − 05 2.0742 3.3414
V. C ONCLUSIONES
El control LQG cumple de mejor manera los ı́ndices de
rendimiento con respecto a los controladores MPC y PID, de tal
manera se ha comprobado la robustez del controlador LQG, mientras
que el control MPC tiene menor tiempo de establecimiento que el
control LQG, debido a que el controlador MPC necesita que el
modelo capture de mejor manera la dinámica del sistema.
El filtro de Kalman se emplea como estimador de estados en el

control LQG, y como predictor de la salida futura en el control
MPC,la aplicación del filtro de Kalman permite también mejorar las
señales adquiridas de la entrada del sistema.
El algoritmo implementado en el control LQG de minimización

de error en estado estacionario y tiempo de establecimiento, permite
obtener un valor óptimo de la función de costo J, con lo cual se
reduce los ı́ndices de rendimiento.
Figura 3. Respuesta del sistema para el control de ángulo.
R EFERENCIAS
[1] J. Villacrés, M. Viscaı́no,M. Herrera and O. Camacho, Çontrollers
Comparision to stabilize a Two-wheeled Inverted Pendulum: PID, LQR
and Sliding Mode Control”,Ecuador. Quito,January 2016.
[2] M. Herrera, Modelado Discreto y Control ptimo de Sistemas No
Lineales Multivariables y su Aplicacin a un Pndulo Invertido utilizando
Lego Mindstorms, Master of Science Thesis, Universidad Politcnica de
Madrid, Espaa 2014.
[3] Y. Yamamoto, Nottaway-GS Model Based Design Control of self-
balancing two-wheeled robot built with LEGO Mindstorms NXT,
http://www.mathworks.com/matlabcentral/fileexchange/loadFile.do? ob-
jectId=13399&objectType=file, 2008
[4] L. William, Distillation decoupling, AIChE Journal, vol. 16, pp. 198-
203, 1970.
[5] Y. Okuyama, Discrete Control System. London: Springer, 2014, pp. 109-
130.
[6] R. Eide,P.Magne,A.Stamso,H. Reza,”LQG Control Design for Balancing
an Inverted Pendulum”, University of Agder,Grimstad,Norway, May
2011.
[7] L. Chrif y Z. Meguenni Kadda, Aircraft Control System Using LQG and
LQR Controller with Optimal Estimation-Kalman Filter Desing, Algeria:
Science Direct, 2014.
[8] Z.Zhuo,”LQG Controller Design of the Mobile Inverted Pendu-
lum”,University of California, San Diego, 2017.
[9] J.Tornero, L. Armesto,ÇONTROL ÓPTIMO”,Universidad Politécnica de
Valencia, pp. 159-172
Figura 4. Respuesta del sistema para el control de posición. [10] L. Wang, Model predictive control system design and implementation
using MATLAB. London: Springer, 2010, pp. 4-18.
En la Tabla.4 y Tabla.5 se presenta el tiempo de establecimiento [11] E. Camacho and C. Bordons, Model predictive control. London: Sprin-
Ts, error en estado estable e(k),y los ı́ndices de rendimiento, Integral ger, 2007, pp. 1-16.
del error absoluto IAE e Integral del cuadrado del error ISE; para el [12] J. Rossiter,”MODEL-BASED PREDICTIVE CONTROL”,New
York,2000,pp. 1-41.
control de ángulo y de posición respectivamente.

Paper Fina 3

Загружено:

Сведения о документе

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

Paper Fina 3

Загружено:

Авторское право:

Доступные форматы

Rendimiento de controladores PID, LQG y MPC

aplicados al péndulo invertido

Fθ = [(2m + M )R2 + 2Jw + 2n2 Jm ]θ̈ +

Fψ = [M LR cos ψ − 2n2 Jm ]θ̈ +

∂h(x, u) ∂h(x, u) Las propiedades Time shifting se presentan en:(26)

La representación en espacio de estados para un sistema lineal Z{x(k − n)} = z − nX(z)

y(k) = Cd x(k) + Dd u(k) + w(k) (30)

IV. R ESULTADOS Ts [s] e(k) [rad] IAE ISE

Ts [s] e(k) [rad] IAE ISE

El filtro de Kalman se emplea como estimador de estados en el

El algoritmo implementado en el control LQG de minimización

Вам также может понравиться