FORMACIN DEL CONJUNTO DE ENTRENAMIENTO Arequipa, Mayo 2000 Proyecto de Redes Neurales APLICACIN ESPECFICA RED NEURAL ARTIFICIAL reconocer y clasificar padrones predecir y generalizar informaciones Arequipa, Mayo 2000 Frente a un proyecto de red neuronal no puede pensarse en trminos de: Procedimientos Reglas o frmulas algortmicas de procesamiento de datos Tipos de datos de entrada Tipos de datos de salida Tratamiento de datos Arequipa, Mayo 2000 Existen dos etapas de explicitacin del conocimiento: 1. Aprendizaje: proceso de ajuste los pesos de las conexiones en respuesta la cantidad de errores generada por la red. (La red posee la propiedad de modificarse en funcin a la necesidad de aprender la informacin que le fue presentada anteriormente). Si la salida es errnea Efectuar reajuste de pesos Arequipa, Mayo 2000 Tipo de Barco reconocido Existen dos etapas de explicitacin del conocimiento: 2. Utilizacin: es la manera por la cual la red responde a un estmulo de entrada Arequipa, Mayo 2000 Definicin de la R. N. Mantenimiento de la R. N. Utilizacin de la R. N. Entrenamiento de la R. N. Arequipa, Mayo 2000 CONCEPCIN Validar la Propuesta y seleccionar el paradigma neural Definir necesidades especficas del proyecto Arequipa, Mayo 2000 Anlisis profundo para evitar eventos inesperados posteriormente. Arequipa, Mayo 2000 Definicin de las necesidades especficas del proyecto Captulo 4 Restricciones de equipo Equipo Costo Tiempo
Arequipa, Mayo 2000 Obtencin de Datos Tipo Precisin Tiempo Costo Definicin de las necesidades especficas del proyecto Captulo 4 Arequipa, Mayo 2000 Necesidades de Solucin Precisin Consistencia Tiempo Disponible Para el proyecto Para el entrenamiento Para las pruebas Definicin de las necesidades especficas del proyecto Arequipa, Mayo 2000 Seleccin del modelo de red a utilizar. Seleccin de las variables significativas. Remover las variables no relacionadas con el problema o las no confiables para el proceso, o cuyo uso sea inconveniente por razones tcnicas o econmicas. Tamao de la red. Tipo de problema a resolver: La seleccin del paradigma neural debe llevar en consideracin: Clasificacin: Hace el mapeamiento de la entrada en categoras discretas. Tipicamente un neuronio de salida, con solamente uno activo en cada momento de presentacin de una entrada cualquiera. Padronizacin: en este tipo de salida, los neuronios mltiples potencialmente activos forman un padrn de respuestas a las entradas presentadas. Optimizacin: es un padrn especial interpretado como un conjunto de decisiones. La salida deber representar una entrada, con menos neuronios, o sea hubo una compactacin. Arequipa, Mayo 2000 Tipo de Asociacin: Memoria auto-asociativa (aprendizaje no-supervisionado): mapea parte de los datos relacionados a ellos mismos, memorizando informaciones especficas mas relevantes. Es utilizado en la reconstruccin de padrones parciales o ruidosos para su forma original, tipo de reconocedores en general. Memoria hetero-asociativa (aprendizaje supervisionado): mapea un conjunto de padrones (entradas) relaciondas a otros (salidas). Es tpico para casos en que una determinada entrada ya sea asociada a una determinada salida deseada. Arequipa, Mayo 2000 Es preciso indicar los valores de las condiciones iniciales para el paradigma seleccionado Tipo de entrada Integracin de Entradas Funcin de Transferencia Neuronas Red Neural Entrenamiento Nmero de capas Nmero y tipo de neuronas de entrada, salida y hidden Tipo de Conectividad Algoritmo de Aprendizaje Parmetros de Aprendizaje Arequipa, Mayo 2000 Supervisado: requiere para el entrenamiento, pares de datos constituidos de un padron de entrada y un padron de salida (valor deseado en la salida) No Supervisado: clasifica padrones de entrada internamente. No exige la identificacin de valores deseados en la salida. Arequipa, Mayo 2000 e1 e2 eN Entrada [1,1] MODELO SUPERVISADO Entrada [1,2] Entrada [1,N] Vector de Entrada Vector de Salida s1 s2 s3 . . . salida [1,1] salida [1,2] salida [1,N] . . . Arequipa, Mayo 2000 e1 e2 eN Entrada [1,1] MODELO NO SUPERVISADO Entrada [1,2] Entrada [1,N] Vector de Entradas . . . Arequipa, Mayo 2000 Problema Definido Seleccionar los datos a presentar a la red neural Entrenar a la red neural Ha sido entrenada con xito? No Testear la red neural Si Ha sido entrenada con xito? No Fase de Ejecucin Si Captulo 4 Arequipa, Mayo 2000 Calidad Representativa de los Datos Tipo de Datos a ser recolectados Cantidad de Datos Preparacin de Datos Debe considerarse estos aspectos Buen Conjunto de Entrenamiento Red bien entrenada = Buen Dimensionamiento de la Red + Captulo 4 Arequipa, Mayo 2000 Captulo 4 Fuentes importantes para la obtencion del conjunto de entrenamiento: Datos histricos. Datos del test. Estudio de casos. Lectura por instrumentacin en campo. Simulaciones. Hiptesis. Arequipa, Mayo 2000 Problema Definido Escoger los datos a presentar a la red neural Entrenar a la red neural Ha sido entrenada con xito? No Si Fase de Testeo Captulo 4 FLUJOGRAMA COMBINANDO LA FASE DE ENTRENAMIENTO Y TESTS Arequipa, Mayo 2000 Captulo 4 Arequipa, Mayo 2000 Soporte Reentrenamiento Las redes son entrenadas para solucionar problemas dinmicos. Es necesaria una evaluacin contnua. Con el tiempo pueden surgir nuevos conjuntos de datos reales desconocidos, que obliga a nuevo aprendizaje. Si los tests indican errores significativos, el proyectista de la red resolvera el problema en el proceso de entrenamiento. Arequipa, Mayo 2000 Constituido por los datos utilizados durante el entrenamiento de la red. Todo lo que una red neural es capaz de hacer depende de lo que fue capaz de aprender. La fuente de aprendizaje de una red neural es el conjunto de entrenamiento que haya tenido. El conjunto de entrenamiento esta compuesto de datos reales (obtencin de mejores respuestas). Los datos ficticios deben ser descartados a menos que sean justificable.
Arequipa, Mayo 2000 Para que una red neural funcione no basta con proporcionarle los datos y que instantneamente los almacena y entienda. Las redes neurales artificiales se caracterizan por su gran capacidad de abstraccin(de un objeto real a un modelo de datos) y generalizacin de los datos. Objetivos del Tratamiento de Datos
Adecuar cuantitativamente los datos proporcionados a la red, eliminando los redundantes y los no relevantes, manteniendo la necesaria amplitud de todas las situaciones a ser aprendidas. Incrementar cualitativamente la representacin de la informacin, contribuyendo para la eficacia de proceso de entrenamiento. Arequipa, Mayo 2000 Es un medio de recibir y transferir la informacin recibida para a la capa de neuronas de entrada. La necesidad de una interfase adecuada es incuestionable. A B C D Arequipa, Mayo 2000 Prerequisitos: Los datos deben estar interrelacionados. Eliminacin de datos irrelevantes. Excluir los datos msticos. Mantener la objetividad de los datos. Evitar la ambigedad de los datos. Arequipa, Mayo 2000 Ejemplo: con datos no significativos para dolencias respiratorias: Color preferido? ( ) Verde ( ) Rojo ( ) Amarillo Toma caf en la tarde? ( ) S ( ) No Pasea en carro? ( ) S ( ) No Ejemplo: con datos significativos para dolencias respiratorias: Edad? ( ) hasta 10 aos ( ) de 11 a 20 ( ) de 21 a 40 ( ) de 41 a 60 ( ) mas de 60 Fumador? ( ) No ( ) Hasta 5 cigarros ( ) hasta 10 cigarros ( ) Hasta 15 cigarros ( ) hasta 20 cigarros ( ) Mas de una caja Arequipa, Mayo 2000 Constituye la organizacin apropiada de los datos. La arquitectura de una red neural esta relacionada con el tipo de problemas a resolver: El nmero de neuronas de la camada de entrada est definida en funcin de los datos de entrada. La respuesta esperada de la red indicar cuantas neuronas tenemos en la camada de salida.
Arequipa, Mayo 2000 Ejemplo: REPRESENTACIN SINTOMAS/DOLENCIAS Sntomas Enfermedad Camada de Entrada Camada de Salida Dolor de Cabeza Dolor de Garganta Fiebre Alta Fiebre Media Fiebre Baja Cansancio Gripe Amigdalitis Hidden Arequipa, Mayo 2000 Para otros tipos de datos de entrada debe haber otros tipos de tratamiento y representacin. Por Ejemplo: una imagen puede ser proporcionada a una red neural solo si es que ha sido digitalizada. Para reducir las entradas en el sistema de cada 4 puntos digitalizados se escoge uno representativo.
Arequipa, Mayo 2000 TRANSFERENCIA DE LA IMAGEN PARA UN SISTEMA DIGITAL (SCANNER) FOTO Monitor SVGA 800 x 600 = 480.000 pixels Arequipa, Mayo 2000 Es conveniente reducir mas el nmero de neuronas, dependiendo del tipo de problema, llegando a la optimizacin sin llegar a la perdida de informacin. EJEMPLO: OPTIMIZACION DE 4 PUNTOS PARA 1 Arequipa, Mayo 2000 SONIDOS UNA PALABRA PUEDE SER CARACTERIZADA POR EL NMERO DE DECIBELES (VOLUMEN) Y SU VARIACION A LO LARGO DEL TIEMPO (FRECUENCIA). LA DIGITALIZACIN DEL SONIDO INVOLUCRA UNA DISCRETIZACIN EN DOS DIMENSIONES AMPLITUD Y TIEMPO (FRECUENCIA). LA DISCRETIZACIN DE LA AMPLITUD ES USUALMENTE DEFINIDA EN TERMINOS DEL NMERO DE BITS. UNA CONVERSIN DE 8 bits REPRESENTA 2 Bits = 256 ESTADOS. 8 CADA UNO DE LOS ESTADOS ESTAR REPRESENTANDO (MAPEANDO) UNA FAJA DE VALORES DE LA AMPLITUD. Arequipa, Mayo 2000 Valores contnuos Amplitud maxima Amplitud minima 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 1 1 Valores discretos 256 3 2 1 SONIDOS: MAPEAMIENTO EN 8 BITS . . . . . Arequipa, Mayo 2000 Para entrenar a una Red Neural, se le presenta hechos, a partir de ah la red deber ser capaz de generalizar las situaciones o clases. Esto quiere decir que despus del entrenamiento, cuando se presente un hecho desconocido a la red, esta sea capaz de clasificarlo en la clase a la que pertenece. Mayor tiempo necesario para el aprendizaje A mayor tamao del conjunto de entrenamiento Arequipa, Mayo 2000 Cuadro clinico 1 Sintoma 1 CONJUNTO DE ENTRENAMIENTO - DIAGNOSTICO Sintoma 2 Sintoma n . . . . . Gripe Amigdalitis Cuadro clinico N Sintoma 1 Sintoma 5 Sintoma n . . n . . n . . 1 Cuadros clinicos (hechos) Dolencias a dignosticar (clase) 1 Arequipa, Mayo 2000 Al menos un representante de cada clase debe estar representado en el conjunto de entrenamiento y la red debe tener la capacidad de representar todas las clases, a travs de una cantidad adecuada de neuronas y camadas. Para cada una de las clases, se debe buscar que los hechos deben ser representativos del mayor nmero posible de situaciones correspondientes a esa clase. Una red que tenga una gran capacidad de representacin (gran nmero de neuronas) , tambin debe presentar una gran capacidad para recordar hechos, en lugar de generalizarlos. Arequipa, Mayo 2000 Una red con muchas neuronas habr sido dimensionada, en general para un problema tambin de grandes proporciones, o sea con una gran variacin de entradas posibles para cada clase. Si buscamos la orientacin de la diversificacin de los hechos para cada clase, posiblemente estaremos evitando que nuestra red recuerde hechos en lugar de generalizarlos.
Arequipa, Mayo 2000 Nmero de Hechos Nmero de Conexiones entre neuronas = 2 X Regla General para el dimensionamiento del conjunto de entrenamiento Mnimo Tamao confortable Nmero de Hechos = 2 X 2 Nmero de Conexiones entre neuronas Arequipa, Mayo 2000 Es beneficioso examinar los hechos que la red tiene dificultades en entrenar. Evtese en lo posible datos que estn fuera de la fajas de los lmites usuales del problema. Captulo 5 Arequipa, Mayo 2000 El conjunto de entrenamiento debe representar una cierta distribucin de probabilidades de ocurrencia de situaciones. Un cierto nivel de anormalidad es normal, ninguna distribucin es perfectamente normal. Debe ejemplificar por completo todas las posibilidades inherentes a la distribucin de datos. Antes de rechazar un determinado dato por considerarlo incorrecto, se debe buscar una explicacin. Para muchos casos y resolucin de dificultades de aprender algunos hechos, la solucin puede consistir en incrementar neuronas o inclusive camadas hiden.