Вы находитесь на странице: 1из 7

Comparaci on de estrategias de Control Inteligente para el control de un p endulo invertido

Alan Mariano Cabello Ortega


Maestr a en Automatizaci on y Control ITESM MTY Email: A00393940@itesm.mx

Sergio David Torres Cabral


Maestr a en Automatizaci on y Control ITESM MTY Email: A00814183@itesm.mx (1) Neuronas son las unidades elementales en un sistema o donde el procesamiento de la informaci on ocurre. (2) La informaci on de entrada esta dada en la forma de se nales que son transportadas entre las neuronas a trav es de conexiones. (3) Cada conexi on tiene un peso caracter stico que multiplica la se nal transmitida. (4) Cada neurona tiene una acci on interna, resultando en una funci on de activaci on aplicada a la suma de las se nales ponderadas para producir una se nal de salida. Las redes Neuronales Articiales (ANN), requieren de aprendizaje o ser entrenadas por parte de un ejemplo antes de ser utilizadas. Esto lo hace mediante la correcci on del error, lo cual es simple: Un cambio de pesos debe o no hacerse dependiendo de la comparaci on de la salida actual y la salida deseada, mediante el principio de minimizaci on de riesgo emp rico en un algoritmo de propagaci on hacia atr as. Esto nos permite simular cualquier conjunto de entradas salidas que se desee, mediante la minimizaci on del error cuadr atico medio. En este caso particular se utilizo un modelo Difuso, para el entrenamiento de la red neuronal, siendo este primeramente sintonizado para obtener buenos par ametros de desempe no. I-C. ANFIS

ResumenEn el presente documento se hace una comparaci on entre 3 diferentes clase de control inteligente, controlador difuso, neuronal y ANFIS para el servocontrol y regulaci on de un p endulo invertido. Se realizaron pruebas tanto de perturbaciones tiempo de externas e internas midiendo los ndices de desempeno, elevaci on, sobreimpulso y tiempo de estabilizaci on entre otros.

I.

I NTRODUCCI ON

En el presente documento se presenta la simulaci on del control de un p endulo invertido usando las t ecnicas de control Difuzo (Fuzzy), controlador Neuronal Articial (ANN ) y Sistema de inferencias adaptativo Neuro-Difuzo (ANFIS) I-A. Control Difuso

Los controladores difusos realizan la misma funci on de los controladores convencionales, pero se diferencian por resolver problemas a trav es de de reglas heur sticas y modelos matem aticos denidos con l ogicas difusa. Esto resulta conveniente cuando el proceso a ser controlado tienen un model o no lineal o no se cuenta con alg un modelo del proceso. La implementaci on de un controlador difuso trata de emular leyes de control usadas por humanos. El dise no estos controladores esta basado en el conocimiento del proceso m as que en ecuaciones diferenciales que describan la planta, [1]. Para emular el comportamiento de un humano tratando de controlar un proceso se usan tres etapas, en la primera etapa, llamada fusicaci on, se representan la magnitud de la variable del proceso usando variables ling u sticas, como mucho y poco y para representar la pertenencia de la variable a cada una de estas variables se utilizan funciones de membres a, ya que no se puede tener una pertenec a absoluta a estas variables; la segunda est a es llamada maquina de inferencias donde se trata de imitar el razonamiento humano usando reglas IFTHEN para que a partir de la entrada se pueda decidir una salida, dado que la salida de este razonamiento es tambi en una variable difusa es necesario convertirla a un valor puntual, a esta etapa se le llama defusicaci on.

Esta estructura tambi en conocida como Sistema de inferencia adaptativo neuro-difuso, fue propuesta primeramente por [3]. Esta estructura esta basada en la exportaci on de las reglas difusas a las redes neuronales, para esto es necesario modicar la estructura est andar de las neuronas apropiadamente. Para realizar esto se considera la representaci on gr aca del modelo Sugeno-Takagi y su aplicaci on. Dividiendo la red neuronal en 5 capaz incluyendo la capa 0 como se muestra en la gura 1 donde: La capa 0 se encarga de presentar las entradas a la capa 1 donde se procesan las funciones de membres a de entrada, La capa 2 consiste en el operador de agregaci on, siendo normalmente normas-t, la capa 3 es de normalizaci on y la capa 4 es la capa de salida que calcula la acci on de control. I-D. Model o del P endulo

I-B.

Control Neuronal

Estrictamente hablando una red neuronal es un conjunto de neuronas articiales, donde una neurona articial es un modelo matem atico de una neurona biol ogica en su forma mas simple. El modelo matem atico de una neurona articial [2] esta basado en los siguientes principios.

La din amica del modelo p endulo invertido montado en un carro, Figura 2 esta dada por (1) y (2). cos mL 2 sin = u (M + m) x + bx + mL

(1)

II-B.

Modelo del controlador difuso

En la gura 4 se muestra la implementaci on en Simulink del sistema con controlador difuso, siendo el bloque Fuzzy Logic Controller. el controlador y Subsystem el modelo de la planta. Como se muestra en la gura 5 la estructura del modelo difuso utiliza 3 entradas y una de salida, con 3 fusiones de membres a triangulares para el error en x, gura 6, con rango 0.5, 6 funciones de membres a para el valor de , gura 7 en (gura 8) en el el rango 1 y de igual manera para el valor de rango 2 con 8 funciones de membres a para la manipulaci on u (gura 9)con un rango de 0.2. Dadas las funciones de membres a de entrada, se requiere de 108 reglas IF-THEN para activar las 8 diferentes funciones de la salida. Como se puede observar en la gura (gura 10) las 108 reglas se han dividido en 3 diferentes tablas, ya que cada una representa la combinaci on de las funciones de membres a en el error de x. II-C. Modelo del controlador neuronal

Figura 1. Modelo Sugeno difuso de primer orden con 2 reglas.

m,I u

x
Figura 2. Modelo del p endulo invertido en un carro.

El controlador neuronal se implemento con una red conformada por una capa de entrada, una capa oculta y una capa de salida, con 3 neuronas en la entrada, 60 en la capa oculta

+ mgL sin = mLx (mL2 + I ) cos

(2)

Donde M = 0.5 kg es la masa del carro, m = 0.2 kg la masa del p endulo, b = 0.1 N/m/s es la fuerza de fricci on de resistencia al movimiento del carro, L = 0.3 m es la longitud del p endulo a su centro de masa, I = 0.006 kg m2 es la inercia del p endulo, u(t) es la fuerza aplicada al carro, x es ngulo del p la posici on del carro en el plano, es el a endulo medido desde la vertical, y g = 9.8 m/s2 es la aceleraci on debida a la gravedad. II. II-A. S IMULACI ON

Figura 3. Implementaci on en Simulink del modelo del p endulo invertido.

Implementaci on del modelo del pendulo

Para la implementaci on de la simulaci on del modelo se usaron (3) y (4) obtenidas a partir de (1) y (2) cos d3 2 sin + d4 u x = d1 x + d2 = d5 sin + d6 x cos + p(t) (3)
Figura 4. Modelo de sistema con controlador difuso.

(4)

Donde d15 son constantes del sistema y p(t) es una perturbaci on externa. En la gura 3 se muestra la implementaci on en Simulink del modelo, el bloque f(u) X2p tiene la ecuaci on (3) para calcular x y el bloque f(u) Teta2p la (4) para calcular y a partir de bloques integradores se obtienen x y , el , x, . La sistema tiene como entrada a u, como salidas a x, y variable de p(t) es una perturbaci on interna en el modelo que simula con un pulso de corta duraci on.

Figura 5. Estructura del controlador difuso.

y una neurona de salida; Se utilizo la funci on sigmoidal como funci on de activaci on para cada una de las neuronas. Los datos de entrenamiento de la red neuronal provienen de una simulaci on con el controlador difuso, descrito anteriormente. La prueba para la generaci on de estos datos consisti o en un cambio de referencia. Para la conguraci on y entrenamiento de la red neuronal de control del p endulo invertido se utilizo el siguiente c odigo:

clear ; close all ; clc ; % Se c a r g a n l o s v a l o r e s de l a s i m u l a c i o n de un e s c a l o n d e l s i s t e m a de c o n t r o l N e u r o n a l . l o a d ( f i l t . mat ) ; % Se c r e a n l a s m a t r i c e s de e n t r a d a y s a l i d a p a r a e l e n t r e n a m i e n t o de l a r e d . p l a n t i n = [ x ; te ; dte ] ; plantout = u ; % Se i n i c i a l i z a l a r e d % 3 N e u r o n a s en l a p r i m e r a capa . % 60 n e u r o n a s en l a capa e s c o n d i d a . % 1 para l a s a l i d a n e t = n e w f f ( minmax ( p l a n t i n ) , [ 3 60 1 ] , { t a n s i g t a n s i g p u r e l i n } , t r a i n b f g , l e a r n g d , mse ) ; net = i n i t ( net ) ; n e t . iw { 1 , 1 } ; n e t . b {1}; % Se c o n f i g u r a n l o s p a r a m e t r o s de e n t r e n a m i e n t o % 1000 i t e r a c i o n e s como maximo % con un v a l o r de e r r o r de 1 e 5 net . trainParam . epochs = 1000; net . trainParam . goal = 0.00001; % Se e n t r e n a l a Red con l a f u n c i o n t r a i n . net = t r a i n ( net , p l a n t i n , p l a n t o u t ) ;

Figura 6. Funciones de membres a para el error en x.

La simulaci on del entrenamiento se muestra en la gura 11 donde se muestra la manipulaci on del control difuso y la aproximaci on a esta mediante la red neuronal . Para lograr un buen comportamiento fue necesario ltrar las entradas

DTNB DTNM DTNS DTPS DTPM DTPB TNB UNRB UNRB UNRB UNB TNM UNRB UNRB TNS UNRB TPS UNB UNB UNB UNM UNM UNS UNS UPS UPM UNM UNS UNS UPS UPM UPM UNS UNS UPS UPM UPM UPM

UNM UNM UNS UPS

TPM UNM UNM TPB UNM UNS

Figura 7. Fusiones de membres a en teta.

EN
DTNB DTNM DTNS DTPS DTPM DTPB TNB UNB UNB UNB UNM UNS UNS UPS UNB UNM UNM UNS UNS UPS UPM UNS UPS UPS UPM UPB UNS UPS UPS UPM UPB UPB UPS UPS UPM UPB UPB UPB

TNM UNB TNS TPS TPM TPB UNB UNM UNS UNS

EZ
Figura 8. Fusiones de membres a en teta punto.
DTNB DTNM DTNS DTPS DTPM DTPB TNB UNM UNM UNM TNM UNM UNM TNS UNM TPS TPM TPB UNS UPS UPS UNS UPS UPS UPM UNS UPS UPS UPM UPB UNS UPS UPM UPM UPB UPS UPM UPM UPB UPM UPM UPB UPRB

UPRB UPRB

UPRB UPRB UPRB

EP
Figura 9. Fusiones de membres a de la manipulaci on. Figura 10. Reglas IF-THEN del controlador difuso.

, ya que las oscilaciones en estas variables agregan y inestabilidad a la red degradando el sistema de control, se uso un ltro Savitzky-Golay de tercer orden ya que este no introduce retrasos y conserva la forma original de la onda, permitiendo una mejor aproximaci on.

la planta una perturbaci on en la aceleraci on p(t) con magnitud 2, durante 50 segundos despu es de este mismo tiempo de iniciada la simulaci on, forzando al sistema a equilibrarse en una referencia diferente de , por ultimo la prueba de robustez la cual esta dise nada mediante el cambio de las variables del modelo, espec camente la masa (m) y la longitud del p endulo (l), en un factor de 2. III-A. Pruebas de cambio de Referencia

En la gura 14 se muestra la respuesta a la primer prueba del control difuso, como se observa en el Cuadro I se obtuvo un tiempo de estabilizaci on de 43.2 segundos, con un sobre impulso de 20.01 % , de igual manera, se logra un buen control en el angulo del p endulo, ya que las oscilaciones no se incrementan mas de 0.03 radianes y una vez alcanzada la . referencia, tarda 28 segundos en estabilizar y La prueba de cambio de referencia con el control neuronal mostrada en la gura 15 obtuvo un buen desempe no, mostrado en el Cuadro I , ya que el sobre impulso es del 2.87 % , con un tiempo de estabilizaci on de 41 segundos. Sin embargo hubo , ya que un cambio signicativo en el comportamiento de y no termina de estabilizarse y se mantiene oscilando dentro de un peque no angulo.

Figura 11. Simulaci on del entrenamiento de las neuronas.

Para la Simulaci on del sistema de control Neuronal se utilizo el diagrama en Simulink de la gura 11, donde el bloque Custom Neuronal Network 1 es el controlador del p endulo invertido.

Figura 12. Modelo de sistema con controlador neuronal.

II-D.

Modelo del controlador ANFIS


Figura 13. Relaci on entradas salidas del sistema ANFIS.
0.05 Derivada de Theta 0 20 40 60 80 100 0.1 0.05 0 0.05 0.1

Se deni o el controlador ANFIS con 6 funciones de membres a del tipo Campana de Gauss para cada una de las entradas, para el entrenamiento de la red se utilizaron los mismos datos con los que se entreno el controlador neuronal simple, sin embargo se redujeron el numero de muestras para que el enterramiento fuera m as r apido. Se conguro una meta de 0.001 y se programaron 100 EPOCH. La gura 13 muestra la supercie de la relaci on de las entradas y la salida del controlador difuso resultante del entrenamiento. La implementaci on del controlador ANFIS es igual al del controlador difuso, gura 4, ya que el producto del entrenamiento es un controlador difuso. III. R ESULTADOS

Theta

0.05

20

40

60

80

100

0.1 4 Manipulacion "U" 0 20 40 60 80 100 0.05 0 0.05 0.1 Error en X

Se realizaron 3 Pruebas diferentes a los controladores mencionados, la primera prueba consiste en un escal on de magnitud 0.5 y se utilizo una simulaci on con duraci on de 100 segundos, para observar mejor el comportamiento din amico de las diferentes variables a controlar, en la segunda se incluyo en

20

40

60

80

100

Figura 14. Prueba de cambio de referencia del modelo difuso.

Por ultimo el control difuso entrenado mediante ANFIS, ante cambios de referencia se observa en la gura 16, en x se muestra un sobre impulso de 16 % con un tiempo de estabilizaci on de 32.7, como indica el Cuadro I, mostrando ngulo de oscilaci un cambio mayor en el a on antes de la estabilizaci on, sin embargo una vez llegando a la estabilidad se vuelven cr ngulo de y de la referencia el a ticamente estables. III-B. Pruebas de perturbaci on

tiene un impulso instant el pulso crece y aneo de magnitud 0.1 radianes por segundo. El controlador ANFIS se mantienen estable durante la perturbaci on, gura 19, sin embargo tienen un error de estado estable en x de 0.27 metros que se mantiene durante la oscila perturbaci on, oscila en el rango [0, 1.78] radianes, en el rango de 0.5 radianes por segundo. III-C. Pruebas de robustez

La gura 17 muestra el resultado de la simulaci on del la prueba de perturbaci on interna usando el sistema con controlador difuso, se puede que el efecto en el error en x de 0.011 m mientras que en durante la perturbaci on hay un desfasamiento de -0.9 radianes y le toma 25 segundos hay oscilaciones con una amplitud de estabilizarse, en 0.5 radianes por segundo que se estabilizan tambi en en 25 segundos. Con el controlador neuronal el sistema se volvi o inestable, todas las variables tendieron a innito, la gura 18 muestra el resultado de una prueba donde el tiempo del puso de perturbaci on se acorto a 1 segundo para poder observar la din amica del sistema, se observa que el error en x tuvo una desviaci on de 1.52 metros, se mantiene oscilando, durante
0.05 Derivada de Theta 0.1 0.05

En la prueba de robustez, el controlador difuso, se comporto de manera similar, con un tiempo de estabilizaci on de 55.3 segundos y un sobre impulso del 23.49 % mostrados en el Cuadro I, adem as se muestra una disminuci on en la amplitud de las oscilaciones en del 8 %. El control neuronal mostr o un buen desempe no al un mostrar sobre impulso del 0.36 % y llegar a la estabilizaci on en 47 segundos Cuadro I, adem as mostr o una oscilaci on en de magnitud 0.12 con una frecuencia menor. Por ultimo el desempe no del controlador ANFIS, fue el que mostr o un mejor desempe no, ya que se logra estabilizar totalmente el sistema, despu es de 21 segundos de llegar a la referencia deseada en x, se muestra un sobre impulso del
0.2 Derivada de Theta 0 50 100 150 0.5

0.1 Theta

Theta

0 0.05 0.1

0.05

0.1
0 20 40 60 80 100

0.5

20

40

60

80

100

50

100

150

0.1 4 Manipulacion "U" Error en X 0.05 0 0.05 0.1

0.3 0.4 0.2 Error en X 0.1 0 0.1


0 20 40 60 80 100

Manipulacion "U" 0 50 100 150

0.2

0.2

20

40

60

80

100

50

100

150

Figura 15. Prueba de cambio de referencia del modelo neuronal.


0.05 Derivada de Theta 0.1 0.05 0 0.05 0.1

Figura 17. Prueba de perturbaci on del modelo difuso.


0.05 Derivada de Theta 0 50 100 150 0.1 0.05 0 0.05 0.1

Theta

Theta 0 20 40 60 80 100

0.05

20

40

60

80

100

0.05

50

100

150

0.1 4 Manipulacion "U" 0.05 Error en X 0 0.05 0.1 2 Error en X 4 Manipulacion "U" 0 50 100 150

0.1 0.05 0 0.05 0.1

20

40

60

80

100

20

40

60

80

100

50

100

150

Figura 16. Prueba de cambio de referencia del modelo ANFIS.

Figura 18. Prueba de perturbaci on del modelo neuronal.

16.03 %, con un tiempo de estabilizaci on de 38.2 segundos ngulo es de 0.085 y la Cuadro I, la amplitud m axima del a oscilaci on es m nima. En el Cuadro I se presentan el desempe no de las pruebas de Cambio de Referencia y Prueba de robustas para las tres estrategias de control, los par ametros medidos son: Porcentaje
0.2 Derivada de Theta 0.5

de sobre-impulso ( %M P ), Tiempo pico (tp ), Tiempo de elevaci on (ts ) y Tiempo de estabilizaci on (ts ). Para cada par ametro se resalto el mejor desempe no. Para la Prueba de Robustes del controlador Neuronal no hay sobre-impulso por lo que no se considero el tp .
Prueba Cambio de Referencia Difuso Prueba Robustez Difuso Cambio de Referencia Neuro Prueba Robustez Neuro Cambio de Referencia ANFIS Prueba Robustez ANFIS %M P 20.01 23.49 2.87 0.36 14.71 16.03 tp 19.3 21.9 36.2 19.8 21.9 tr 14.9 16.2 34.5 51.0 15.9 17.5 ts 43.2 55.3 41.0 47.6 32.7 38.2

0.1 Theta

Cuadro I.

DE LAS PRUEBA PAR AMETROS DE DESEMPE NO

0.1

50

100

150

0.5

50

100

150

IV.

C ONCLUSIONES

0.3 0.4 0.2 Error en X 0.1 0 0.1 Manipulacion "U"

0.2

En este documento se compararon tres estrategias de Control Inteligente para tratar de resolver el problema de estabilidad de un p endulo invertido y se hicieron pruebas de seguimiento de referencia, de perturbaciones y de robustez. La primera diferencia que se observo entre ellas fue la sintonizaci on, para el controlador Difuso fue necesario decidir las entradas y la cantidad de funciones de mebres a adecuadas, adem as se tuvo que ajustar los rangos de las funciones, se observo que entre m as funciones es m as f acil sintonizar el sistema ptima. En cambio con los para que se estabilice de manera o otros controladores (Neuronal y ANFIS) la conguraci on es xito de estos controladores depende m m as sencilla, el e as del dise no de las pruebas para el entrenamiento y de que los datos sean adecuadamente acondicionados. En cuanto al desempe no se observa que el ANFIS exhibe el mejor comportamiento ante cambios de referencia , a pesar de haber sido entrenado a partir del Difuso, y tambi en es el m as robusto de los tres, sin embargo se vuelve inestable ante perturbaciones, debido a que en sus entradas de entrenamiento ). ngulo ( no se considero la aceleraci on del a El controlador Difuso presento un desempe no aceptable en las tres diferentes pruebas realizadas, tiene muchas exibilidad en cuanto a su sintonizaci on, sin embargo esto tambi en lo hace laborioso de sintonizar debido a la gran cantidad de par ametros los cuales deben ser deducidos de manera intuitiva.
0.05 Derivada de Theta 0 20 40 60 80 100 0.1 0.05 0 0.05 0.1

50

100

150

0.2

50

100

150

Figura 19. Prueba de perturbaci on del modelo ANFIS.


0.05 Derivada de Theta 0 20 40 60 80 100 0.1 0.05 0 0.05 0.1

Theta

0.05

20

40

60

80

100

0.1 4 Manipulacion "U" 0 20 40 60 80 100 0.05 0 0.05 0.1 Error en X

20

40

60

80

100

Figura 20. Prueba de robustez del modelo difuso.


0.05 Derivada de Theta 0.1 0.05 0 0.05 0.1

Theta

Theta 0 20 40 60 80 100

0.05

20

40

60

80

100

0.05

20

40

60

80

100

0.1 4 Manipulacion "U" 0.05 Error en X 0 0.05 0.1 2 Error en X 4 Manipulacion "U" 0 20 40 60 80 100

0.1 0.05 0 0.05 0.1

20

40

60

80

100

20

40

60

80

100

20

40

60

80

100

Figura 21. Prueba de robustez del modelo neuronal.

Figura 22. Prueba de robustez del modelo ANFIS.

El controlador Neuronal usado, presento un desempe no pobre, en las tres pruebas se observo mucha oscilaci on en sus variables incluso se volvi o inestable y le toma m as tiempo alcanzar la referencia que los dem as controladores debido a estas misma oscilaci on ya que se enfoca m as en mantener el equilibrio que en llegar a la referencia. R EFERENCIAS
[1] [2] H. T. Nguyen, E. Walker, C. Walker, and N. Prasad, A rst course in fuzzy and neural control. 2003. W. S. McCulloch and W. Pitts, A logical calculus of the ideas immanent in nervous activity, The Bulletin of Mathematical Biophysics, vol. 5, no. 4, pp. 115133, 1943. J.-S. Jang, Ans: adaptive-network-based fuzzy inference system, Systems, Man and Cybernetics, IEEE Transactions on, vol. 23, no. 3, pp. 665685, 1993.

[3]

Вам также может понравиться