Академический Документы
Профессиональный Документы
Культура Документы
Resumen—Los sistemas en configuración de péndulo invertido cuadrado del error (ISE) y demostrar que controladores es más
son utilizados para el estudio de diversas técnicas de control, óptimo.
debido a que estos sistemas son multivariable, inestables y no En la segunda sección se describe la planta utilizada de la
lineales, además estos sistemas ha sido base para la creación de
medios de movilización como el Segway, que es un dispositivo cual se obtendrá el modelo dinámico en espacio de estados,
en configuración de péndulo invertido sobre dos ruedas. Este en la tercera seccin se diseña y describe los tres controladores
trabajo se basa en la optimización de la estabilidad de un utilizados y la función de costo sobre la cual se evaluar el
sistema en configuración de péndulo invertido sobre dos ruedas rendimiento del controlador, al final se presentan los resulta-
mediante la aplicación de controladores PID, LQG y MPC. Con dos obtenidos mediante tablas comparativas obtenido de las
la aplicación de los controladores, se realiza una comparativa del
comportamiento del sistema mediante la utilización de ı́ndices de simulaciones de los controladores, evaluados en el sistema.
rendimiento, como último se concluirá con la presentación de los
resultados obtenidos. Este trabajo pretende ser una referencia pa- II. DESCRIPCI ÓN DEL P ÉNDULO INVERTIDO
ra los investigadores y sobre todo para los ingenieros que buscan SOBRE DOS RUEDAS
realizar aplicaciones en el campo de control implementando estos
mtodos de control a sistemas multivariables de comportamiento El péndulo invertido sobre dos ruedas (TWIP) se encuentra
no lineal. construido mediante el set de Lego Mindstorms EV3, el cual
Index Terms—Ángulo,Posición,Controlador, LQG, PID, MPC, consta de 1 sensor giroscopio para medir la inclinación del
TWIP, Índices de rendimiento, Estabilidad robot, también posee 2 encoders de tipo incremental acoplados
a 2 motores dc que permiten medir la posición angular del
I. I NTRODUCCI ÓN sistema.
El TWIP es un sistema multivariable en el cual se considera
El péndulo invertido es uno de los sistemas más conocidos
dos entradas de voltaje (u1 (t)) y (u2 (t)), y como salidas se
en la robótica, dentro de la industria cada vez tomando más
considera los estados que representan el ángulo de inclinación
importancia por su grado de flexibilidad y eficiencia en la
psi (ψ) con su tasa de cambio (ψ̇), y la posición (θ) con su
supervisión, inspección y transporte. En [1] se implementa
tasa de cambio (θ̇), como se representa en la Fig.1.
varias técnicas de control lo cual se han implementado en
un péndulo invertido en donde se describe el sistema lineal
y no lineal utilizado para la estabilizacin del sistema. En la
actualidad existen varios trabajos que han surguido de la teorı́a
del péndulo que han servido como base para la investigación
en las cuales se tiene, el carro deslizante sobre una riel en
donde se busca tener una barra en equilibrio [2], también existe
un péndulo invertido tripulado por personas conocido como
Segway; para este trabajo se implementa sobre el equipo Lego
Mindstorms un sistema móvil sobre dos ruedas en el que se
puede aplicar controladores que permitan estabilizarse en un Figura 1. Representación multivariable del sistema.
punto de equilibrio; se aplica el control óptimo LQG (Lineal
Cuadrtico Gaussiano) en el que se emplea el controlador LQR
y el Filtro de Kalman como observador; se realiza también II-A. Modelo dinámico del sistema
el control MPC (Control Predictivo del Modelo) el cual se Para modelar el sistema se emplean principios fı́sicos
basa en los hechos pasados para predecir salidas futuras. y matemáticos que permiten capturar el comportamiento
Mediante la realización de pruebas de la aplicación de los dinámico del sistema, para obtener el modelo se parte del
controladores se podrá obtener los resultados para cada uno diagrama de cuerpo libre presentado en la Fig.2. [3]
de los controladores, contrastando mediante los ı́ndices de
rendimiento, Integral Absoluto del error (IAE) e integral del
Evaluando (1) y (2), se obtiene las ecuaciones de fuerza
generalizadas:
Fθ = Fl + Fr (5)
Figura 2. Diagrama de cuerpo libre del péndulo invertido. Fψ = Fψ (6)
Donde:
El TWIP posee un movimiento de inclinación asociado a
un sensor de giroscopio que permite determinar la variación Fl = nKt il + fm (ψ̇ − θ˙l ) − fw θ˙l (7)
del ángulo psi (ψ) asociado al movimiento Pitch, para el
Fr = nKt ir + fm (ψ̇ − θ˙r ) − fw θ˙r (8)
movimiento de desplazamiento se emplea encoders de tipo
incremental acoplados a la ruedas que permite determinar la Fψ = −nKt il − nKt ir + fm (ψ̇ − θ˙l ) − fm θ˙r (9)
posición angular mediante la variación del ángulo theta (θ).
Donde la corriente il y ir de las ecuaciones de fuerza se
Los parámetros y valores utilizados en el diseño del TWIP
obtiene del circuito eléctrico del motor-dc, en el cual se tiene
que interviene en el modelamiento del sistema se presenta en
como entrada vl y vr que representan el voltaje de los motores.
la Tabla.1.
vl,r + Kb (ψ̇ + θ̇l,r )
Tabla I il,r = (10)
PAR ÁMETROS LEGO MINDSTORMS *0
LmRm
Parámetros y Valores del sistema Reemplazando (7), (8) y (10) en (5) se obtiene:
Descripción Parámetro
Gravedad g =9.8 [m/sec2 ]
Peso de las ruedas m =0.0127 [kg]
nKt nKt Kb
Fθ = (vl + vr ) − 2θ̇ + fm + fw +
Radio de las ruedas R =0.028 [m] Rm Rm
Momento de inercia de las ruedas Jw mR2 /2 [kgm2 ]
nKt Kb
Peso del cuerpo M = 0.9 [kg] +2ψ̇ + fm (11)
Ancho del cuerpo W = 0.183 [m] Rm
Profundidad del cuerpo D 0.05 [m]
Altura del cuerpo H = 0.26 [m]
Reemplazando (9) y (10) en (6) se obtiene:
Distancia del centro de la masa del eje de L = H/2 [m]
la rueda
nKt nKt Kb
Momento de inercia la inclinacin (pitch) del Jψ = M L2 /2 [kgm2 ] Fψ = − (vl + vr ) + 2θ̇ + fm +
cuerpo Rm Rm
Jm = 1x10−5 [kgm2 ]
Momento de inercia del motor dc nKt Kb
Resistencia del motor dc Rm = 6.69 [Ω] +2ψ̇ + fm (12)
Constante de velocidad motor dc Kb = 0.468 [V sec/rad]
Rm
Constante de torque motor dc Kt = 0.317 [N m/A]
Igualando (4) con (12) y (3) con (11) y despejando ψ̈,θ̈ se
Relación de transmisión n = 1 [V sec/rad]
Coeficiente de fricción entre el cuerpo y el fm = 0.0022 obtiene:
motor
Coeficiente de fricción entre la rueda y el fw = 0
suelo As
ψ̈ = [α(vl +vr )−2θ̇(β+fw )+2β ψ̇+M LRψ̇ 2 sin(ψ)]−
Bs
Las ecuaciones de Lagrange se definen por: Cs
− [M gL sin ψ − α(vl + vr ) + 2β θ̇ − 2β ψ̇]
Bs
d ∂L ∂L
Fθ = − (1) As
dt ∂ θ̇ ∂θ θ̈ = [M gL sin ψ − α(vl + vr ) + 2β θ̇ − 2β ψ̇]−
Bs
d
∂L
∂L Ds
Fψ = − (2) − [M LRψ̇ 2 − α(vl + vr ) − 2θ̇(β + fw ) + 2β ψ̇] (13)
dt ∂ ψ̇ ∂ψ Bs
Donde:
∆ẋ(t) = A∆x(t) + B∆u(t)
∆y(t) = C∆x(t) + D∆u(t) (20)
As = M LR cos ψ − 2n2 Jm
Discretizando el modelo en espacio de estados se obtiene:
Bs = (As) − [(2m + M )R2 + 2Jw + 2n2 Jm ](Ds)
[5]
Ds = M L2 + Jψ + 2n2 Jm
nKt
α= x(k + 1) = Ad x(k) + Bd u(k)
Rm
nKt Kb y(k) = Cd x(k) + Dd u(k) (21)
β= + fm
Rm Discretizando las matrices de espacio de estado con un
(14) tiempo de muestreo T0 = 0.1s se obtiene:
II-B. Modelo en espacio de estados
1 0.2192 0.0279
0.0793
18.1926
18.1926
La representación del modelo en espacio de estados emplea 0 1.2204 0.0279 0.0794 18.1381 18.1381
Ad = , Bd =
0 4.5463 0.3170 0.9022 376.0998 376.0998
las ecuaciones del comportamiento dinámico del sistema. 0 4.5602 0.3173 0.9031 375.6939 375.6939
Donde las entradas y salidas del sistema se representan
mediante (15).
1 0 0 0 0 0
Cd = ,D = (22)
T
X = ψ ψ̇ θ θ̇ = x1 x2 x3
T
x4 0 0 1 0 d 0 0
T T
U = vl vr = u1 u2 (15)
III. C ONTROLADORES
Realizando el reemplazo de variables se obtiene (13): En esta sección se describe el diseño y desarrollo de las tres
estrategias de control empleadas para la estabilización del sistema
en un punto de referencia, se parte con el diseño del control PID,
ẋ1 = x2 luego se realiza el control óptimo lineal cuadrático gaussiano (LQG)
y el control predictivo basado en el modelo (MPC), támbien se
introduce en los controladores LQG y MPC un filtro de Kalman
As
ẋ2 = [α(u1 +u2 )−2x4 (β+fw )+2βx2 +M LRx22 sin(x1 )]−como observador, por último se realiza una comparativa entre los
Bs resultados obtenidos de los tres controladores.
Cs
− [M gL sin x1 − α(u1 + u2 ) + 2βx4 − 2βx2 ] III-A. Control PID
Bs
Para la implementación del control PID se parte de la función
ẋ3 = x4 de transferencia presentado en (23) que permite calcular la señal de
control U (t).
As U (t) Ki
ẋ4 = [M gL sin x1 − α(u1 + u2 ) + 2βx4 − 2βx2 ]− Gc (s) = = Kp + Kd s + (23)
Bs E(t) s
Ds Donde:
− [M LRx22 − α(u1 + u2 ) − 2x4 (β + fw ) + 2βx2 ]
Bs Kp : Ganancia proporcional.
(16) Ki : Ganancia integral.
Kd : Ganancia derivativa.
Tomando en cuenta que la variable As es:
As = M LR cos x1 − 2n2 Jm (17) Aplicando el método de Tustin en (23) se obtiene la transformada
de z presentada en (24). [5]
Para la lineazación del sistema se emplea el método de U (z)
T0 (z + 1)
z−1
series de Taylor sobre un punto de referencia presentado en = Kp + Kd + Ki (24)
E(z) 2(z − 1) Ts z
(18) para la ecuación de estados y (19) para la ecuación de
Ampliando (24) se obtiene:
salida. [4]
Kd 2Kd Kd
U (z) Kp + Ki T20 + z 2 + −Kp + Ki T2s − z+
∂f (x, u) ∂f (x, u) =
Ts Ts Ts
∆ẋ = ∆x + ∆u (18) E(z) z2 − z
∂x ∂u
x0 ,u0 x0 ,u0
(25)
V. C ONCLUSIONES
El control LQG cumple de mejor manera los ı́ndices de
rendimiento con respecto a los controladores MPC y PID, de tal
manera se ha comprobado la robustez del controlador LQG, mientras
que el control MPC tiene menor tiempo de establecimiento que el
control LQG, debido a que el controlador MPC necesita que el
modelo capture de mejor manera la dinámica del sistema.
R EFERENCIAS
[1] J. Villacrés, M. Viscaı́no,M. Herrera and O. Camacho, Çontrollers
Comparision to stabilize a Two-wheeled Inverted Pendulum: PID, LQR
and Sliding Mode Control”,Ecuador. Quito,January 2016.
[2] M. Herrera, Modelado Discreto y Control ptimo de Sistemas No
Lineales Multivariables y su Aplicacin a un Pndulo Invertido utilizando
Lego Mindstorms, Master of Science Thesis, Universidad Politcnica de
Madrid, Espaa 2014.
[3] Y. Yamamoto, Nottaway-GS Model Based Design Control of self-
balancing two-wheeled robot built with LEGO Mindstorms NXT,
http://www.mathworks.com/matlabcentral/fileexchange/loadFile.do? ob-
jectId=13399&objectType=file, 2008
[4] L. William, Distillation decoupling, AIChE Journal, vol. 16, pp. 198-
203, 1970.
[5] Y. Okuyama, Discrete Control System. London: Springer, 2014, pp. 109-
130.
[6] R. Eide,P.Magne,A.Stamso,H. Reza,”LQG Control Design for Balancing
an Inverted Pendulum”, University of Agder,Grimstad,Norway, May
2011.
[7] L. Chrif y Z. Meguenni Kadda, Aircraft Control System Using LQG and
LQR Controller with Optimal Estimation-Kalman Filter Desing, Algeria:
Science Direct, 2014.
[8] Z.Zhuo,”LQG Controller Design of the Mobile Inverted Pendu-
lum”,University of California, San Diego, 2017.
[9] J.Tornero, L. Armesto,ÇONTROL ÓPTIMO”,Universidad Politécnica de
Valencia, pp. 159-172
Figura 4. Respuesta del sistema para el control de posición. [10] L. Wang, Model predictive control system design and implementation
using MATLAB. London: Springer, 2010, pp. 4-18.
En la Tabla.4 y Tabla.5 se presenta el tiempo de establecimiento [11] E. Camacho and C. Bordons, Model predictive control. London: Sprin-
Ts, error en estado estable e(k),y los ı́ndices de rendimiento, Integral ger, 2007, pp. 1-16.
del error absoluto IAE e Integral del cuadrado del error ISE; para el [12] J. Rossiter,”MODEL-BASED PREDICTIVE CONTROL”,New
York,2000,pp. 1-41.
control de ángulo y de posición respectivamente.