You are on page 1of 25

MODELAMIENTO, DISEÑO Y SIMULACIÓN DE UN

SISTEMA DE CONTROL PARA UN SISTEMA DE PÉNDULO


DOBLE INVERTIDO

OBJETIVOS:
Con este trabajo la aplicación de los conocimientos adquiridos en los diversos estudios
correspondientes al estudio en ingeniería electrónica, en lo que se refiere a análisis y
diseño de sistemas de control, por ello elegimos como sistema de estudio un sistema de
péndulo doble invertido (SPDI).

El SPDI representa un problema muy interesante desde el punto de vista de control ya


que permite involucrarnos en varias de las dificultades asociadas con los problemas de
control de los sistemas dinámicos, a su vez presenta particular interés académico, porque
permite la aplicación de diversas técnicas de control e ilustrar su comportamiento.

Objetivos específicos:

1. Reconocer el estado del arte del problema en el control de un péndulo doble


invertido.
2. Realizar el modelamiento matemático del péndulo doble invertido.
3. Especificar requerimientos de diseño.
4. Proponer un método de control por optimización cuadrática para el péndulo doble
invertido
5. Validar el modelo matemático y sistema de control por medio de simulación.
RESUMEN

En este artículo se presenta el modelamiento matemático, el diseño y simulación de un


sistema de control para un sistema de péndulo doble invertido, (SPDI), de modo que
pueda mantenerse en la posición vertical invertida ante posibles perturbaciones, de
acuerdo con la propuesta de proyecto de tesis de maestría en ingeniería electrónica.

El modelamiento matemático se fundamenta en las ecuaciones de Euler-Lagrange


encontradas especificando el lagrangiano como la diferencia de la energía cinética y la
energía potencial del sistema de péndulo doble invertido montado en un carrito que se
desplaza en un riel horizontal, obteniendo un sistemas de tres ecuaciones diferenciales de
segundo orden, que se transforman a un formato de seis ecuaciones diferenciales
ordinarias de primer orden.

La estrategia de control seguida ha sido la de un sistema de control óptimo que minimiza


un funcional de costo cuadrático probando un regulador lineal cuadrático (LQR). La
simulación presenta un adecuado desempeño para el sistema de LQR, alrededor del punto
de operación del sistema: posición vertical invertida del péndulo doble; ante desviaciones
de dicha posición.
INTRODUCCION

Desde su desarrollo a mediados del siglo XX, la teoría de control moderna ha estado
presente en muchos ámbitos de la actividad humana, sus aplicaciones son tan variadas
que se pueden encontrar infinidad de ejemplos en áreas tan distantes entre sí como lo son
la ingeniería aeroespacial y la ingeniería de manufactura y fabricación. En el ámbito
académico es común que la teoría de control moderna se utilice para controlar
mecanismos sencillos como muestra de una aplicación práctica a sistemas inestables.
Entre estos mecanismos está el péndulo invertido.

El péndulo invertido es un sistema mecánico ampliamente utilizado porque es muy útil


para la demostración de conceptos de control, tanto lineal y como no lineal. Existen
distintas configuraciones del péndulo invertido, la más común está constituida por un
brazo articulado a un carro que se mueve libremente en dirección horizontal sobre un riel.
Sin embargo, también hay doblemente, etc.

En este trabajo se tratará la configuración denominada péndulo doble, la cual consiste en


dos brazos articulados entre sí, uno al extremo del otro; ambos brazos pueden girar
libremente, sin embargo, uno de ellos está acoplado por un extremo a un motor de
corriente directa, el cual permite su actuación.

Este sistema mecánico, inherentemente presenta cuatro puntos de equilibrio, uno estable
y tres inestables. El punto de equilibrio estable corresponde al estado en que ambos brazos
se sitúan en posición vertical hacia abajo; en ausencia de cualquier fuerza el sistema
regresará naturalmente a este estado. Uno de los puntos de equilibrio inestable
corresponde al estado en que los dos brazos se sitúan en posición vertical hacia arriba,
para mantener esta posición se requiere la aplicación de fuerzas externas sobre el sistema.
Siendo esta última configuración la más atractiva para fines de control y es la que se elige
como punto de operación.

El objetivo de control para el sistema péndulo doble es mantener la posición de equilibrio


inestable cuando el sistema se inicializa en la posición vertical hacia arriba, asi que en
este documento se presenta el modelamiento y simulación del péndulo doble invertido
mediante el control de espacio de estados.
Modelado del sistema Péndulo Doble

En primer lugar describiremos el procedimiento empleado para obtener el modelo


matemático no lineal del sistema denominado péndulo doble, el cual está basado en el
método de Euler-LaGrange. Asi como también un modelo linealizado del sistema en un
punto de equilibrio inestable y la descripción en variables de estado de ambos modelos.
Modelo matemático

Descripción general

El péndulo doble es un mecanismo de dos grados de libertad, compuesto básicamente por


dos péndulos simples acoplados entre sí a través de una articulación. Como se muestra en
la Figura2.1, el primer péndulo está acoplado a un actuador el cual permite controlar los
movimientos de dicho elemento, el segundo péndulo está unido al extremo del primero
mediante una articulación rotacional, es por esto que este segundo componente del
sistema sólo puede ser controlado mediante la acción de control que se aplica al primer
péndulo. El actuador de este sistema mecánico es un motor de corriente directa y los dos
sensores que registran las posiciones angulares de cada péndulo son dos decodificadores
ópticos (encoder) de tipo incremental.

En adelante se usará la palabra eslabón en vez de péndulo para nombrar a los elementos
que conforman el péndulo doble con el fin de utilizar la palabra sólo en referencia al
nombre del sistema y no a los componentes del mismo. En la Figura 2.2 se presenta un
esquema con los componentes que conforman al sistema péndulo doble y enseguida una
tabla con la descripción de dichos elementos.

Figura 2.1: Sistema péndulo doble.


Figura 2.2: Componentes del sistema péndulo doble.
Ecuaciones dinámicas

Considere un mecanismo de dos grados de libertad como el mostrado en la Figura 2.3, el


mecanismo está formado por dos cuerpos rígidos (articulados en 1 y en 2) de longitudes
l1 y l2; y masas m1 y m2 respectivamente. Los grados de libertad están asociados a los
ángulos θ1 y θ2 que se miden desde la posición vertical hacia abajo, siendo ambos
positivos en sentido contrario al movimiento de las manecillas del reloj. Las
articulaciones 1 y 2 son rotacionales simples, por tanto, los desplazamientos del péndulo
se llevarán a cabo en el plano x - y mostrado en la Figura 2.3.

Figura 2.3: Esquema del péndulo doble.

Las componentes de posición del centro de masa del eslabón 1 expresadas en el plano x-
y mostrado son:

El vector velocidad v1 del centro de masa de dicho eslabón tiene en consecuencia las
Componentes:

Por lo tanto, la rapidez al cuadrado del centro de masa resulta ser:


Empleando la identidad trigonométrica sin ø + cos ø = 1 se obtiene finalmente:

Por otro lado, las coordenadas del centro de masa del eslabón 2 expresadas en el plano x-
y son:

El vector velocidad v2 del centro de masa de dicho eslabón tiene en consecuencia las
componentes:

Por lo tanto, empleando las identidades trigonométricas sin ø + cos ø = 1 y


cos(𝛼 ± 𝛽) = cos 𝛼 cos 𝛽 ∓ sin 𝛼 sin 𝛽 , se obtiene finalmente la rapidez al cuadrado del
centro de masa del eslabón 2

La energía cinética para este mecanismo puede descomponerse en la suma de dos partes
𝑇 = 𝑇 + 𝑇 , donde 𝑇 𝑦 𝑇 , son las energías cinéticas asociadas a las masas m1 y m2
respectivamente.
La energía cinética correspondiente al movimiento del eslabón 1 es 𝑇 = 𝑚 𝑣 y la
energía cinética que corresponde al movimiento del segundo eslabón es 𝑇 = 𝑚 𝑣 ,
de tal forma que:
De forma similar, la energía potencial puede descomponerse como la suma de dos partes,
𝑉 = 𝑉 + 𝑉 donde 𝑉 𝑦 𝑉 son las energías potenciales asociadas a las masas m1 y m2
respectivamente.
Se tiene entonces que 𝑉 = 𝑚 𝑔𝑦 𝑦 𝑉 = 𝑚 𝑔𝑦 , por lo tanto la energía potencial del
sistema queda definida por lo siguiente:

Si se define la ecuación Lagrangiana o Lagrangiano L como: L = T – V, donde


T = Energía cinética
V = Energía potencial
Y se toman en cuenta las ecuaciones (2.3) y (2.4) se tiene que:

Teniendo definido el Lagrangiano, las ecuaciones dinámicas que modelan el péndulo


doble se obtienen aplicando las ecuaciones de Euler-Lagrange (2.6):

Dónde:
𝑞 : Son las coordenadas generalizadas del sistema mecánico.
L : Lagrangiano.
𝑄 : Fuerzas externas.
𝐷 : Función de disipación de Rayleigh.

La función de disipación 𝐷 involucra las fuerzas amortiguadoras o de rozamiento, las


cuales absorben la energía del sistema durante el movimiento. Dichas fuerzas
amortiguantes son proporcionales a las velocidades. La función de disipación 𝐷 es
definida como sigue 𝐷 = 𝑏 𝑞̇ ; donde 𝑞̇ es la velocidad generalizada, es decir, la
derivada respecto al tiempo de las coordenadas generalizadas y 𝑏 es una constante de
disipación.

Para este caso existen dos grados de libertad y por tanto las coordenadas generalizadas 𝑞
y 𝑞 corresponden a 𝜃 y 𝜃 , mientras que la fuerza externa 𝑄 esta representada por Ƭ
que es el par aplicado al primer eslabón por el actuador y para 𝑄 no se tiene componente
ya que el segundo eslabón no recibe un par externo (no está accionado por ningún motor).
Las constantes de disipación son representados por 𝑏 y 𝑏 , que son los coeficientes de
fricción viscosa correspondientes al primer y segundo eslabón respectivamente. En
resumen:

Por lo tanto, para 𝜃 la ecuación de Euler-Lagrange queda definida por:

Desarrollando los términos de la ecuación (2.7) se obtiene lo siguiente:

Finalmente, sustituyendo los términos arriba desarrollados, ecuaciones (2.8), (2.9) y


(2.10) en (2.7) se obtiene:

El desarrollo para la coordenada restante 𝜃 se hace de manera homóloga a lo hecho para


𝜃 teniendo presente que el término 𝑄 de la ecuación (2.6) vale cero; por lo tanto para
𝜃 la ecuación de Euler-Lagrange queda como a continuación se muestra:

Desarrollando los términos en (2.12) se llega a la ecuación (2.13).


Las ecuaciones (2.11) y (2.13) son las ecuaciones dinámicas del sistema, las cuales son
un conjunto de ecuaciones diferenciales no lineales simultáneas para las coordenadas
generalizadas 𝜃 y 𝜃 .

Descripción del modelo en variables de estado

Entre las formas de representar el modelo matemático de un sistema se encuentra la


representación en variables de estado. Un modelo matemático se puede considerar una
relación matemática entre las salidas y las entradas del sistema. En particular, la
representación en variables de estado relaciona matemáticamente las salidas con las
entradas a través de las variables de estado como paso intermedio.

La forma general de representación por variable de estado de un sistema continuo está


dada por dos ecuaciones; la primera que define los cambios de las variables de estado en
función de estas mismas variables, las entradas y el tiempo; y la segunda que define la
salida en función de las variables de estado, las entradas y el tiempo. Así se tiene:

Aquí se considera que x, y además u son vectores de n, p y m componentes


respectivamente. Esta forma de representación es válida para los sistemas continuos no
lineales y variantes en el tiempo en forma general.

Si el sistema es invariante en el tiempo, las funciones f y g dejan de depender


explícitamente del tiempo

Si el sistema representado por las ecuaciones (2.14) y (2.15), es un sistema lineal, la


dependencia de x_ e y pasa a ser lineal y se tiene entonces:
Donde A es una matriz de dimensión n x n, B es una matriz de dimensión n x m, C es una
matriz de dimensión p x n, y D una matriz de dimensión p x m.

Así la ecuación general en variables de estado para un sistema dinámico lineal e invariante
en el tiempo descrito por un conjunto de ecuaciones diferenciales de n-ésimo orden, con
una sola entrada (m=1), está dado por:

Donde para la ecuación (2.18) n es el número de variables de estado y x1, x2, ... , 𝑋
representa el conjunto de éstas que definen el vector de estados, 𝑎 y 𝑏 son los
coeficientes constantes de las matrices A y B respectivamente y u es la señal de entrada.
Por otro lado, en la ecuación (2.19) p es el número de salidas del sistema y los coeficientes
𝑐 y 𝑑 son los coeficientes constantes que conforman las matrices C y D,
respectivamente.

Para obtener la descripción del sistema péndulo doble en variables de estado a partir de
las ecuaciones de movimiento obtenidas anteriormente, se tienen que realizar algunos
reacomodos de los términos presentes en dichas ecuaciones. Así se tiene lo siguiente:

Si se despeja 𝜃 de la ecuación (2.13) se obtiene la ecuación que a continuación se


muestra:

Sustituyendo ahora la ecuación (2.20) en (2.11) y despejando de ésta última a la variable


𝜃 se obtiene:
Ahora si se despeja 𝜃 de la ecuación (2.11) se llega a:

Por último, sustituyendo la ecuación (2.22) en (2.13) y despejando la variable 𝜃 de la


ecuación se obtiene:

Se ha transformado el sistema (2.11) y (2.13) en las ecuaciones (2.21) y (2.23), de manera


tal que se han expresado las segundas derivadas de la posición de los eslabones que
conforman el sistema en términos de las coordenadas generalizadas y de sus primeras
derivadas. Con base en estas expresiones se puede construir el modelo de estados
definiendo el vector de estados como:

X1 = 𝜃 ; Posición angular del eslabón 1


X2 = 𝜃 ; Velocidad angular del eslabón 1
X3 = 𝜃 ; Posición angular del eslabón 2
X4 = 𝜃 ; Velocidad angular del eslabón 2.

Si definimos al torque aplicado por el actuador como la entrada u del sistema se tiene
entonces que u = Ƭ.

Por lo que se obtiene a partir de las ecuaciones (2.21) y (2.23) la siguiente representación:
Como se mencionó anteriormente la entrada u del sistema corresponde al torque aplicado
por el motor al primer eslabón del péndulo doble, conocer el torque que se necesita
entregar al sistema para cambiar la posición de los eslabones es muy útil, sin embargo,
para este caso resulta de mayor utilidad saber cuál es el voltaje que se necesita suministrar
al motor para que éste aplique dicho torque al sistema, es por lo anterior que se requiere
en este punto agregar al modelo del sistema péndulo doble el modelo del motor, el cual
se muestra enseguida:

Donde:
𝑘 = Constante de par, relaciona el par del motor y la corriente.
𝑘 = Constante de velocidad, relaciona la FCEM y la velocidad angular.
R = Resistencia
u͂ = Voltaje aplicado
ω = Velocidad angular.

Para este caso, debido a que el acoplamiento entre el motor y el primer eslabón del sistema
es un acoplamiento directo, es decir, no hay elementos mecánicos adicionales para la
transmisión de potencia del motor al sistema, la velocidad del motor será igual a la
velocidad del primer eslabón, en otras palabras, ω = X2. Teniendo esto presente, es
posible reescribir el modelo del motor de la siguiente forma:

Ahora es posible cambiar la entrada al sistema de torque a voltaje simplemente


sustituyendo el modelo del motor, ecuación (2.25), en las ecuaciones (2.24). Con esto, la
representación en variables de estado del modelo no lineal del péndulo doble con una
señal de voltaje como entrada es la siguiente:

Una de las limitaciones de la teoría clásica de sistemas de control es el hecho de que no


puede manejar fácilmente los sistemas con no linealidades fuertes, sobre todo en el caso
de incertidumbres en los parámetros del modelo. Sin embargo, en el caso del modelo del
péndulo doble, ecuaciones (2.24), dado que las no linealidades son del tipo suave, sen(x);
cos(x); cos2(x); 𝑥 , es posible linealizar el modelo para emplearlo en el diseño de la ley
de control del sistema. Por lo tanto en la siguiente sección se presenta la técnica empleada
para obtener un modelo lineal aproximado sobre un punto de funcionamiento del sistema
(2.24).

Linealización del modelo

Si se considera que el sistema opera con pequeñas variaciones cerca de un punto de


funcionamiento, entonces es posible obtener un modelo lineal en donde las desviaciones
del estado con respecto al punto de operación son ahora las que definen el vector de
estados; para ello las ecuaciones se desarrollarán alrededor de un punto de operación (x0;
u0) por medio de una serie de Taylor truncada después del término de primer grado. En
particular, debido a que el objetivo del control es lograr que la posición de los dos
eslabones del péndulo doble se mantenga en posición vertical hacia arriba, se selecciona
el siguiente punto de operación:

El cual se toma como base para las variaciones Δx y Δu.


Para pequeñas desviaciones del sistema se tiene que la ecuación (2.24) se aproxima
mediante:
Dónde:

De las funciones que componen h, las únicas dos que no son lineales son ℎ y ℎ , por lo
tanto la ecuación (2.27) para estas dos funciones queda definida por lo siguiente:

Donde ℎ y ℎ corresponden a los modelos linealizados de ℎ y ℎ en torno al punto de


operación (𝑥 ; 𝑢 ).

El desarrollo de las ecuaciones anteriores es:

Calculando las derivadas indicadas para obtener ℎ yℎ se tiene:


Sustituyendo ahora dichas derivadas, se llega finalmente a:

Si ahora se definen cuatro nuevas variables como sigue:

x͂1 = x1 - π
x͂2 = x2
x͂3 = x3 - π
x͂4 = x4

y se sustituyen en las ecuaciones (2.31) y (2.32) se tendrá entonces la siguiente


representación:
Considerando la ecuación (2.25), reagrupando términos y teniendo en consideración que
x͂2 = x2 estas últimas ecuaciones se convierten en:

Con esto se obtiene el modelo linealizado del sistema péndulo doble teniendo como
entrada el voltaje aplicado al motor y no el torque como se definió al inicio de este
desarrollo.

Ahora la ecuación (2.28) para este nuevo sistema de ecuaciones queda definida de la
siguiente manera:

Donde:
El modelo de estados propiamente dicho, no considera cuáles señales o variables del
proceso son las que se pueden medir. Esta información viene dada por medio de la
ecuación de salida. Como las posiciones angulares de ambos eslabones son las únicas
variables de las que se tendrá información continua (registros que se realizan con ayuda
de dos decodificadores de posición o encoders), éstas son las únicas salidas del sistema,
por lo tanto la ecuación de salida resulta ser

Con la matriz C dada por:

Con esto la descripción lineal en variables de estado se reduce a:

Este modelo linealizado servirá posteriormente para el diseño del sistema de control para
el péndulo doble.
SISTEMA LINEAL DE VARIABLES DE ESTADO. LAZO ABIERTO

Parámetros para el ejercicio de simulación del sistema de péndulo doble invertido.

La simulación inicialmente se realizó tomando valores comunes para la fricción de


coulomb y la viscosidad y luego a modo de prueba y por comparación se realizó la
simulación considerando las fricciones despreciables. Los valores escogidos para estas
fricciones fueron:

𝝁𝟎 = 𝟎. 𝟏𝟓.

𝜷𝟎 = 𝟎. 𝟐𝑵. 𝒔/𝒎

Relación entre los parámetros del sistema. Para la selección de los valores de parámetros
más adecuados para la simulación y validación del sistema de péndulo doble invertido,
se hicieron varias pruebas con diferentes valores para tales parámetros, al realizar estas
pruebas encontramos algunas relaciones interesantes entre ellos.

 Para el adecuado desempeño de la simulación del sistema de péndulo doble


invertido se requiere que siempre sea la masa del primer péndulo (m1) mayor que
la masa del segundo péndulo (m2).

 Aunque no necesariamente de manera simultánea se requiere para el adecuado


desempeño de la simulación del sistema, que la longitud del primer péndulo (L1)
sea menor que la longitud del segundo péndulo (L2).
Los valores numéricos de las matrices del sistema son:

0 0 0 0 0 0
0 0 0 0 0 0
⎛0 0 0 0 0 0 ⎞
𝐴=⎜
⎜0 −4.3377 0.4820 0 0.9836 −0.2459 ⎟⎟
0 96.3934 −43.3770 0 −13.5246 22.1311
⎝0 −115.6721 110.8525 0 1.2295 −56.5574 ⎠

0
0
⎛ 0 ⎞
𝐵 = ⎜ 0.9016 ⎟
−6.1475
⎝ 7.3770 ⎠

1 0 0 0 0 0
𝐶= 0 1 0 0 0 0
0 1 1 0 0 0

0
𝐷= 0
0

CONTROL ÓPTIMO

Para obtener la ley de control, las ecuaciones de Euler-Lagrangese reformularon en un


sistema de seis ecuaciones diferenciales ordinarias de primer orden. El diseño de control
óptimo para sistemas no lineales como es el caso del SPDI, requiere por lo general una
solución numérica [4] que llega a ser prohibitiva computacionalmente.
Regulador Linear Cuadrático

El diseño de control óptimo se dirige a estabilizar el SPDI minimizando un funcional de


costo cuadrático:

en donde L(x, u) es una función cuadrática o una función hermitiana de x y u, y producirá


la ley de control lineal:

Donde K es una matriz de p x n:

y el índice de desempeño cuadrático se obtiene mediante:

en donde Q es una matriz hermitiana o simétrica real definida positiva (o semidefinida


positiva), R es una matriz hermitiana o simétrica real definida positiva y u no está
restringida.

El diseño de los sistemas de control óptimo y los sistemas reguladores óptimos basados
en tales índices de desempeño cuadráticos se reducen a la determinación de los elementos
de la matriz K. Una ventaja de usar el esquema de control óptimo cuadrático es que el
sistema diseñado será estable, excepto en el caso que el sistema no sea controlable.

El sistema de control óptimo se basa en minimizar el índice de desempeño, que para los
sistemas con vectores reales y matrices reales, se presenta que:

El regulador cuadrático lineal produce una solución óptima cuando la dinámica del
sistema es lineal. Como ya vimos el SPDI no es lineal, pero su linealización alrededor del
punto de operación escogido, hace posible derivar una solución lineal aproximada para el
problema de control óptimo.

La solución continua del LQR se obtiene por: donde: , en donde P es la solución de estado
estable de la ecuación diferencial de Riccati.
Determinación de las matrices de ponderación

No existe ciertamente una guía para la selección de las matrices de ponderación Q y R,


excepto determinarlas por intuición y experiencia. En este sentido se realizaron diferentes
pruebas con distintos valores para tales matrices, siendo la mejor selección encontrada, la
siguiente:

𝑄 = 𝑑𝑖𝑎𝑔[400 1000 500 0 0 50]

R=2

En todos los casos, las variables ponderadas con valores diferentes de cero son justamente
la posición del carrito y la posición del primer y segundo péndulo. Con la selección
encontrada obtuvimos por simulación en matlab, la matriz de ganancias siguiente:

𝑘 = [14.1421 338.6128 650.9943 31.9772 28.4131 23.1808]

y las raíces en lazo cerrado, siguientes:

𝜆 = [−1.74 ± 𝑗1.48 −1.78 −5.49 −13.9 −70.6]

La mayor frecuencia encontrada para el sistema es de 70.6 (rad/s).


RESULTADOS

Modelo lineal en lazo abierto. La simulación del sistema linealizado en lazo abierto,
figura, presenta un sistema inestable, siendo evidente después de aproximadamente 800
milisegundos
Modelo no lineal en lazo cerrado. Ahora veamos el sistema en lazo cerrado. La figura
nos presenta la simulación del comportamiento de las trayectorias del carrito y de cada
uno de los péndulos, el inferior y superior, una vez se aplica al sistema no lineal la matriz
de ganancias K obtenida en la estabilización optima del sistema.

Para la simulación se aplicó un pulso de duración 10 segundos como el mostrado en la


figura y a los integradores para cada una de las variables de estado se les dieron
condiciones iniciales diferentes de cero, así:

𝑥 = (0.1 0.1 0.1 0.1 0.1 0.1)


Modelo lineal en lazo cerrado. La simulación del sistema lineal en lazo cerrado, la figura
presenta un similar comportamiento que en caso del sistema no lineal.