Академический Документы
Профессиональный Документы
Культура Документы
espacio de estado"
Clasificacin de Neurocontroladores.
Introduccin.
Este capitulo es un resumen introductorio de las propiedades del aprendizaje
utilizando redes neuronales artificiales, haciendo nfasis en las ideas y
mtodos ms relevantes aplicados al control de sistemas dinmicos. Esta
perspectiva hace un anlisis en retrospectiva desde los inicios de las redes
neuronales aplicadas al control dando continuidad hasta las actuales
investigaciones en este campo, denominado por Barto [1] investigacin
conexionista, as como su estrecha relacin con los espacios tradicionales de
investigacin como son el control automtico, el procesamiento de seales y la
clasificacin de patrones.
Relacionar los mtodos de aprendizaje conexionista con la teora existente es
muy importante para aquellos interesados en elementos de control con
aprendizaje y adaptivos, ya que la teora de control es un campo ampliamente
desarrollado con mucha literatura, donde muchos de los mtodos de
aprendizaje estn muy relacionados con mtodos clsicos bien estructurados
por los tericos del control adaptivo.
Por otro lado, dada la tendencia que los conexionistas estn tomando para el
desarrollo de estos mtodos neuronales, se han generado nuevas
caractersticas que estn ausentes de los elementos tradicionales en la
ingeniera de control. Algunas de estas caractersticas se discuten en este
capitulo.
Este capitulo no intenta ser una revisin exhaustiva de todas las
investigaciones en el campo del aprendizaje conexionista, y por el contrario
trata de proveer referencias tiles de la literatura en este campo.
Existe una revisin hecha por Hilton [2] que cubre un amplio sector de los
mtodos de aprendizaje, aunque no focaliza en el campo del control. Existen
muchas publicaciones que cuidadosamente han elaborado marcos de
referencia. En este captulo se presentan con mayor detalle las caractersticas
concernientes al aprendizaje supervisado y reforzado. Es importante sealar
que se asume que el lector conoce los elementos bsicos sobre los algoritmos
de aprendizaje conexionista o neuronal.
Adems, por motivos de la tendencia final de esta tesis, no se discute sobre las
investigaciones de la implementacin en hardware de los algoritmos
conexionistas ms all de algunos pequeos sealamientos. Tampoco se
menciona nada acerca de las relaciones que han surgido entre la teora del
aprendizaje conexionista y las neurociencias biolgicas, tambin un campo en
pleno auge de desarrollo.
Historia.
En la fig. 5.1 se esquematiza en modelo propuesto por Barto [1] acerca de la
historia de la investigacin del aprendizaje conexionista aplicacin de las
redes neuronales artificiales en control, as como su relacin con la Inteligencia
Artificial (AI). Esta representacin representa diferentes caractersticas
importantes de la investigacin conexionista.
El primer evento relevante en la fig. 5.1 es la divergencia entre los campos de
las lneas etiquetadas como "mtodos de ingeniera", y los "mtodos de
manipulacin secuencial de smbolos", aunque esas lneas separadas de
investigacin no emergen tan sbitamente como se representa en el grfico. El
la parte central del grfico leemos "periodo romntico", se ha denominado con
este nombre al perodo donde de desarrollaron los primeros esquemas de
clculo basados en modelos biolgicos [9]. A manera de resumen podemos
denominar al campo de la izquierda como "vectores caractersticos de los
sistemas" y "representaciones articuladas de los sistemas" al de la derecha.
El roll que juega la red neuronal en la funcin objetivo se convierte en una pista
para distinguir entre las distintas estructuras de los neurocontroladores. Para
hacer ms interesante este capitulo, la formulacin de la ecuacin 5.1 tomar
diferentes formas acordes a la discusin que se sigue. Los aspectos de
optimizacin de los neurocontroladores son discutidos principalmente en este
capitulo, tomando como base la formulacin de una funcin objetivo. Los
problemas de optimizacin presentados no son precisos pero estn formulados
conceptualmente para propsitos de discusin.
Esta seccin presenta algunos aspectos importantes para el diseo de un
neurocontrolador. Aunque existen otros caminos para clasificarlos [4] este
capitulo adopta una estructura similar a la teora de control adaptivo [1]:
A. Arquitecturas para el modelado de sistemas.
B. Neurocontroladores Indirectos.
C. Neurocontroladores Directos.
Neurocontrol robusto.
Su arquitectura bsica es muy simple (Fig. 5.2), tanto la seal de control como
los estados de la planta son muestreados y conforman el vector de entrada a la
red. La salida de la red se calcula y se compara con las mediciones de la salida
de la planta. La diferencia entre esas dos cantidades es usada para ajustar el
vector de ajuste de pesos tendiente a reducir el error de la red.
Modelado directo inverso de la planta.
El objetivo con este modelado (Fig.5.3) es formular un controlador tal, que junto
con la arquitectura de la planta se conforme una sola funcin de transferencia.
Inevitablemente los errores del modelado perturban dicha funcin, por lo que se
recurre al uso de un precompensador en adicin del controlador lineal, lo cual
Este tipo de modelado (Fig. 5.4) utiliza una estructura similar al modelado
inverso, donde existe una funcin de transferencia nica, solo que el mtodo
propuesto es diferente [7,8]. Un modelo de la planta bsico es construido como
primer paso, la diferencia entre la respuesta de la planta y la salida deseada es
usada para generar la seal de error la cual es pasada hacia atras desde el
modelo bsico con el objeto de ajustar los parmetros del nuevo modelo
inverso.
Modelado de Operador.
Sintetizar un controlador por aprendizaje a partir de un experto tiene
aplicaciones potenciales en el campo de la AI [9,10,11]. El algoritmo de
aprendizaje esta ejecutndose en paralelo con una planta conducida por un
operador experto y sus respuestas forman la salida deseada de la red. (Fig.
5.5) Estas seales de entrenamiento tpicamente contienen altas cantidades de
ruido dado que el operador usa diferentes acciones para entradas similares,
por lo que la seal deber filtrarse [18] antes de que los algoritmos
convencionales de aprendizaje para la red sean aplicados.
Neurocontroladores Indirectos.
Control neuronal basado en modelo completo.
La aplicacin ms popular de los sistemas de control basados en redes
neuronales es utilizar una red como modelo de entrada y salida del proceso.
Estos elementos utilizan aprendizajes manejados por lo datos supervisados
como por ejemplo una red neuronal tratando de imitar un proceso existente a
partir de la exposicin a datos de dicho proceso (Fig. 5.6). La estructura de
modelo ms comnmente adoptada para este propsito es la Autoregresiva No
Lineal de Promedio del Movimiento con Entradas Exgenas conocida como
NARMAX su denominacin ms simple NARX [13, 14]. Esta familia de
modelos Narmax es una funcin de transferencia no lineal discreta en el tiempo
[15]. Alternativamente, uno puede elegir identificar modelos continuos en el
tiempo con una red neuronal como una red recurrente [16]. Esto conduce a una
estructura del modelo y a una estrategia de control, que en trminos del diseo
del neurocontrolador puede ser conceptualmente sealada como sigue:
Donde ym es la salida predecida del modelo, son los parmetros del proceso,
la informacin estructural del modelo y otros elementos requeridos para
completar el modelo.
Ntese la pequea diferencia entre la ecuacin 5.4 y la ecuacin
5.2, ym reemplaza a yn. Esto significa que es idntico al modelo de una red
neuronal dentro de una caja negra excepto porque la red neuronal no imita
directamente el comportamiento del proceso.
Control neuronal por modelo inverso.
Una red neuronal puede ser entrenada para desarrollar un modelo inverso de la
planta. La entrada a la red es la salida del proceso, y la salida de la red es la
correspondiente entrada al proceso (ver fig. XX) en general el problema de
optimizacin puede ser formulado como:
Donde u*p-1 son las entradas del proceso. Tpicamente el modelo inverso es
una estructura de estado estable, la cual puede ser usada para control. Dado
un punto de operacin deseadoy*, la seal apropiada de control u* en estado
estable para este punto de operacin debe de ser inmediatamente conocida
como:
Donde
denota los parmetros del controlador deseados y NN significa los
valores que la red neuronal predice. La entrada a la red puede comprimir datos
del proceso muestreado caractersticas extradas de este. Sin embargo esos
parmetros h no pueden determinarse nicamente desde las caractersticas del
proceso. Dependen tambin de las caractersticas del sistema deseado para el
son
Desarrollos de este concepto son discutidos por Swiniarski [29] y Ruano [30].
En el primero la red es entrenada usando un mtodo clsico para determinar
las ganancias de PID. Durante la operacin, la entrada a la red son 128
muestras del proceso en lazo abierto. Tambin el auto-ajustador resultante
requiere la operacin del proceso en lazo abierto. En contraste, Ruano describe
un mtodo para el auto ajuste de lazo abierto lazo cerrado, acompaado por
un preproceso de datos de entrada y de salida. Las ganancias ptimas para el
PID en el proceso de entrenamiento son calculadas con un algoritmo de
optimizacin de Newton, inicializado con valeres determinsticos. El criterio de
optimizacin es la minimizacin de la integral del tiempo multiplicada por el
error absoluto (ITAE). Los autores demuestran como un auto-ajustador de lazo
cerrado puede efectivamente adaptar los parmetros del PID en lnea, en
respuesta a cambios en el punto de operacin para el lazo de control.
Neurocontroladores Directos.
Modelado del controlador.
De los cuatro esquemas de neurocontrol directo que se presentan, l ms
simple de ellos consiste en usar una red neuronal para modelar un controlador
existente (ver figura 5.8). La entrada al controlador existente es la entrada de
entrenamiento de la red y la salida del controlador sirve como la salida deseada
para dicha red neuronal. Este elemento es similar al modelado de la red
neuronal discutido en la seccin Control Neuronal basado en modelo
completo excepto por que en aquel caso los valores deseados a la salida de la
red no eran los valores del controlador. Este diseo de neurocontrol puede ser
formulado como sigue:
Fig. 2.10: Arquitectura de aprendizaje reforzado planteada por Barto, utilizando el concepto de ACE y ASE.
Fig. 5.11: Un modelo reemplaza a la planta en el sistema de aprendizaje durante la fase de diseo del controlador.