AA - Guía de Estudio

GUADEESTUDIODELAASIGNATURA
GRADO
APRENDIZAJEAUTOMTICO
2PARTE|PLANDETRABAJOYORIENTACIONESPARASUDESARROLLO
20162017
EnriqueJ.CarmonaSurez, JosR.lvarezSnchez
GRADOENINGENIERAINFORMTICA
UNIVERSIDAD NACIONAL DE EDUCACIN A DISTANCIA
APRENDIZAJE AUTOMTICO
1.- PLAN DE TRABAJO

La presente seccin describe el plan de trabajo propuesto para esta asignatura. La secuencia concreta de
actividades previstas se presenta ms en detalle en secciones posteriores.
Tal y como se indica en la Gua de Estudio (1 parte), el texto base recomendado para el estudio de la
asignatura es:
D. Borrajo, J. Gonzlez y P. Isasi. Aprendizaje Automtico. Sanz y Torres, 2006.
En primer lugar, dado que el contenido del texto base no se corresponde exactamente con el temario de la
asignatura, se ofrece a continuacin la correspondencia entre este ltimo y los captulos y/o secciones del
texto base:
PARTE I. INTRODUCCIN Y FUNDAMENTOS
- Tema 1. Introduccin. Captulo 1.
- Tema 2. Fundamentos en Aprendizaje Automtico. Captulo 2.
PARTE II. APRENDIZAJE SUPERVISADO
-
Tema 3. Aprendizaje de Conceptos y de Reglas. Captulo 3 y Seccin 5.3.

Tema 4. rboles de Decisin y de Regresin. Secciones 6.1 y 6.2.
Tema 5. Aprendizaje basado en Instancias. Seccin 6.3.
Tema 6. Clasificadores Bayesianos. Seccin 6.4.
Tema 7. Redes de Neuronas Artificiales. Seccin 9.1.
Tema 8. Mquinas de Vectores Soporte. Tutorial disponible en el curso virtual.
PARTE III. APRENDIZAJE NO SUPERVISADO

- Tema 9. Agrupamiento (Clustering). Secciones 8.1 y 8.2 del captulo 8.
- Tema 10. Mapas Auto-organizados. Seccin 9.2 del captulo 9.
PARTE IV. OTROS TIPOS DE APRENDIZAJE
- Tema 11. Aprendizaje por refuerzo. Captulo 10.
La equivalencia entre temario y texto base descrita anteriormente se puede expresar tambin a la inversa, es
decir, mencionando las partes del texto base que sern objeto de estudio:
-
Captulo 1 (completo)
Captulo 4 (no es objeto de estudio)
Captulo 5 (slo seccin 5.3)
Captulo 7 (no es objeto de estudio)

Captulo 8 (slo secciones 8.1 y 8.2)
Captulo 9 (slo secciones 9.1 y 9.2)
Captulo 11 (lectura recomendada)
GUA DE ESTUDIO
El equipo docente pondr a disposicin de los alumnos, en el curso virtual de la asignatura, ejercicios y
actividades de autoevaluacin sobre cada bloque. La realizacin de estos ejercicios/actividades es voluntaria
y no repercute en la evaluacin final de la asignatura. La finalidad de todo este material es la de servir de
complemento al estudio de la asignatura.
SEMANA
P LA N D E T RA BA JO
Estudio y realizacin de actividades de Parte I
10-11
12
Tema 2
R1
72
Tema 3
24
Tema 4
16
Tema 5
Tema 6
Tema 7
Tema 8
Actividad Evaluable I (PEC-1)
10
Estudio y realizacin de actividades de Parte III
24
Tema 9
12
Tema 10
12
Actividad Evaluable II (PEC-2)
10
Estudio y realizacin de actividades de Parte IV
12
13
R4, R5 y R6
R4, R6 y R7
R4, R5 y R6
R4, R6 y R7
R4, R5 y R6
Tema 11
14
RE S U LTAD OS DE
A PR E ND IZ AJE
10
Tema 1
Estudio y realizacin de actividades de Parte II
2-8
HORA S DE
T RA BA JO
12
Repaso y preparacin de la Prueba Presencial
12
R4, R5, R6 y R7
Tabla 1. Plan de trabajo de la asignatura
En la tabla 1, se presenta una planificacin semanal orientativa del trabajo que debera realizar el alumno
para abordar de una forma adecuada el estudio de la asignatura. En dicha tabla se muestran diferentes
acrnimos relacionados con los resultados de aprendizaje alcanzados tras cada plan parcial de trabajo.
Dichas siglas se corresponden con las definiciones de resultados de aprendizaje realizadas en la Gua de
estudio (Parte I), y conservan tambin la misma notacin utilizada en la memoria de verificacin del ttulo
para describir los resultados de aprendizaje relacionados con la materia a la que pertenece esta asignatura
(Sistemas Inteligentes).
2.- ORIENTACIONES PARA EL ESTUDIO DE LOS CONTENIDOS

Esta seccin de la gua contiene un conjunto de orientaciones de inters para el alumno, diseadas para
establecer una breve descripcin de los contenidos de cada una de las cuatro partes en la que se divide la
asignatura y para ayudarle a estudiar los contenidos de la asignatura.
2.1 Parte I: Introduccin y Fundamentos
Abarca los dos primeros temas del curso:
Tema 1. Introduccin.
Tema 2. Fundamentos en Aprendizaje Automtico
Objetivos
El principal objetivo de esta parte del temario es presentar una introduccin al Aprendizaje Automtico (AA),
as como una serie de conceptos o fundamentos bsicos que son comunes a todas las tcnicas de AA que
se estudiarn durante el curso.
Tema 1. Introduccin
Este tema ser estudiado a partir del captulo 1 del texto base y abarca los siguientes aspectos del
Aprendizaje Automtico:
Motivaciones (Seccin 1.1)

Concepto de Aprendizaje (Seccin 1.2 y 1.3)
Perspectivas del Aprendizaje (Seccin 1.4)
Revisin histrica (Seccin 1.5)
Objetivos
El principal objetivo de este tema es presentar una introduccin al aprendizaje automtico.
Breve Introduccin
Antes de estudiar una disciplina, resulta importante conocer cules son las motivaciones por las que se
considera til el estudio y utilizacin de las tcnicas pertenecientes a dicha disciplina. Aqu, las motivaciones
que hacen interesante el estudio del aprendizaje automtico se presentarn desde distintos puntos de vista:
tcnico (desarrolladores de software), comercial (tendencias del mercado) y cientfico.
Para poder definir qu es el aprendizaje automtico es preciso conocer antes el concepto genrico de
Aprendizaje. Son varias las definiciones existentes en la literatura relacionada con el tema. Sin embargo,
dado que no se conocen, con la profundidad suficiente, los mecanismos que controlan el aprendizaje
humano, la mayora de las definiciones existentes se centran ms en la funcionalidad del aprendizaje que en
los procesos internos asociados a dicha capacidad. Por tanto, el alumno debera familiarizarse con estas
definiciones, para poder inferir el conjunto de caractersticas relacionadas con la capacidad de aprender y, de
esta forma, ser capaz de valorar si un sistema dado posee o no alguna aptitud para aprender.
GUA DE ESTUDIO
Por otro lado, a la hora de acercarse, analizar y entender el aprendizaje automtico no

perspectiva nica. Aqu, mencionamos tres perspectivas del aprendizaje. La primera, la
biolgica, se centra en los mecanismos de adaptacin de los seres vivos. La segunda, la
computacional, concibe el AA como una nueva forma de programacin. Y la tercera, la
inferencial, se centra en qu tipo de inferencia se realiza para poder aprender.
existe una
perspectiva
perspectiva
perspectiva
Como en cualquier otra rama del saber, tambin en el aprendizaje automtico existen multitud de
circunstancias a lo largo de la historia que han conducido a la situacin actual del campo. Por tanto, el
alumno debera conocer las diferentes etapas de esta evolucin histrica, as como las tendencias y
relaciones con otras disciplinas, en especial con la inteligencia artificial, que han marcado y caracterizado
cada una de dichas etapas.
Orientaciones para el estudio
Dado el carcter introductorio de este tema, ser suficiente realizar una lectura atenta de los contenidos
relacionados con dicho tema.
Actividades recomendadas
Dado el carcter introductorio de este tema, no se propone la realizacin de actividades.
Tema 2. Fundamentos en Aprendizaje Automtico
Este tema ser estudiado a partir del captulo 2 del texto base y abarca los siguientes aspectos:
Objetivos de la tarea de Aprendizaje (Secciones 2.1 y 2.2)

Conceptos bsicos (Seccin 2.3)
Diseo de experimentos (Seccin 2.4)
El aprendizaje como una tarea de bsqueda (Seccin 2.5)
Subtareas relacionadas con la tarea de aprendizaje (Seccin 2.6)
Evaluacin del modelo aprendido (Seccin 2.7)
Objetivos
El objetivo bsico de este tema es presentar una serie de conceptos y procedimientos bsicos en
aprendizaje automtico que son comunes a todas las tcnicas que se estudiarn en la asignatura.
Breve introduccin
En primer lugar se realizar una formalizacin del concepto del aprendizaje en trminos de tarea,
definiendo as cules son sus objetivos, sus entradas y salidas, y los diferentes componentes y relaciones
entre ellos. A continuacin, se analizarn los principales elementos y conceptos bsicos utilizados en los
sistemas de aprendizaje. La descripcin se centrar en introducir dichos conceptos de forma genrica de
modo que puedan ser particularizados, posteriormente, a lo largo de los restantes temas de la asignatura.
Seguidamente, se describirn y analizarn las etapas bsicas relacionadas con el diseo de cualquier
experimento de aprendizaje:
Determinacin de la funcin objetivo

Recopilacin de casos
Eleccin de atributos predictivos
Codificacin de los valores de atributo
Seleccin de instancias de entrenamiento y de test
Un aspecto importante a la hora de abordar la tarea de aprendizaje es plantearla como un problema de

bsqueda. Esto permitir crear un marco comn, independiente del problema a resolver, formado por un
conjunto de estados (conjunto de todas las configuraciones posibles de situaciones que pueden darse en el
problema) y un conjunto de operadores (que representan las transiciones entre estados). A su vez, estos dos
conjuntos permitirn formalizar el espacio del problema de bsqueda en forma de grafo en el que los nodos
representan estados y los arcos representan operadores. Por tanto, un problema concreto se definir por un
estado inicial y un estado final (solucin), y la resolucin del problema consistir en encontrar un camino que
permita pasar desde el estado inicial hasta el estado final.
Tambin se ver que la tarea de aprendizaje se puede descomponer en un conjunto de subtareas
representativas: clasificacin, agrupacin y caracterizacin. Por tanto, se har una descripcin de las
caractersticas que definen cada una de estas subtareas. Pinsese que, a la hora de resolver un problema
de aprendizaje, resulta til identificar cules son las tareas que implican aprendizaje y, adems, clasificar
cada una de ellas de acuerdo a la subtarea que pertenece. Esto facilitar la eleccin de la tcnica de
aprendizaje ms adecuada en virtud del tipo de subtarea.
El resultado final de resolver un problema de aprendizaje es la creacin de un modelo que permite resolver
dicho problema. Sin embargo, resulta esencial evaluar las prestaciones del modelo para poder establecer
la validez del mismo. Adems, el resultado de dicha evaluacin facilitar la comparacin con otros modelos.
Por tanto, en este captulo, tambin se describirn diferentes formas de evaluar los modelos aprendidos:
matemtica, experimental y psicolgica.
A pesar del carcter introductorio de este tema, es importante que:
(1) El alumno aprenda y retenga la mayora de los conceptos que aqu se definen (especial inters al
concepto de bias). Esto es as porque muchos de estos conceptos volvern a aparecer en los
siguientes temas y, por tanto, en diferentes contextos.
(2) Muy interesante resulta tambin el apartado dedicado a describir la tarea de aprendizaje como un
problema de bsqueda. Esto es as porque, en el resto de temas, dedicados a abordar las distintas
tcnicas de aprendizaje, el problema que resuelve cada una de estas tcnicas se estructura y
describe como si de un problema de bsqueda se tratara.
(3) Finalmente, desde un punto de vista prctico, tambin es importante que el alumno comprenda y
aprenda cules son las diferentes etapas implicadas en el diseo de un experimento de
aprendizaje y, adems, sepa cmo evaluar el modelo resultante de resolver el problema. Esto le
resultar de gran ayuda a la hora de abordar las actividades prcticas de la asignatura. Por tanto, el
alumno deber tener siempre en cuenta que el resolver un problema de aprendizaje no slo consiste
en elegir y aplicar la tcnica de aprendizaje ms adecuada sino que, tambin, existe un conjunto de
etapas previas y posteriores que son necesarias implementar para completar el proceso con xito.
Dado el carcter introductorio de este tema, no se propone la realizacin de actividades.
GUA DE ESTUDIO
2.2 Parte II: Aprendizaje Supervisado

El estudio de esta parte abarca los siguientes siete temas del curso:
Tema 3. Aprendizaje de Conceptos y de Reglas

Tema 4. rboles de Decisin y de Regresin
Tema 5. Aprendizaje basado en Instancias
Tema 6. Clasificadores Bayesianos
Tema 7. Redes de Neuronas Artificiales
Tema 8. Mquinas de Vectores Soporte
Objetivos
El principal objetivo de esta parte del temario es presentar y describir un conjunto de tcnicas pertenecientes
a una categora de aprendizaje conocida con el nombre de aprendizaje supervisado. Este tipo de
paradigma abarca un conjunto de tcnicas que permiten inducir un modelo a partir de un conjunto de datos o
ejemplos de entrenamiento. Cada ejemplo de entrenamiento consiste en un conjunto de pares de objetos
atributo-valor ms un atributo adicional que representa la clase o salida de dicho ejemplo. La salida del
modelo aprendido puede ser un concepto (problemas de aprendizaje de conceptos), una etiqueta de clase
(problemas de clasificacin) o un valor numrico (problemas de regresin). El objetivo ltimo del aprendizaje
supervisado es el de crear un modelo capaz de predecir el valor correspondiente a cualquier ejemplo de
entrada no visto, es decir, que no haya sido utilizado en el conjunto de entrenamiento.
Temas 3. Aprendizaje de Conceptos y de Reglas
Este tema ser estudiado a partir del captulo 3 y la seccin 5.3 del texto base e incluye los siguientes
aspectos:
Introduccin (Seccin 3.1)

Espacio de Versiones (Seccin 3.2)
Algoritmo AQ (Seccin 3.3)
Programacin Lgica Inductiva (ILP): Algoritmo FOIL (Seccin 5.3)
Objetivos
El principal objetivo de este tema es presentar un conjunto de tcnicas de aprendizaje relacionadas con el
aprendizaje de conceptos. Tradicionalmente, se ha denominado concepto objetivo a aquel concepto que
puede ser expresado mediante un conjunto de caractersticas. Por tanto, el principal objetivo de las tcnicas
de aprendizaje que se describirn en este tema es encontrar, a partir de un conjunto de ejemplos y
contraejemplos expresados en trminos de un conjunto de caractersticas, una descripcin del concepto a
aprender que explique todos los ejemplos positivos y que excluya todos los negativos
(contraejemplos). La descripcin final del concepto aprendido (modelo) vendr expresada en forma de regla
o conjunto de reglas. La diferencia principal entre las tcnicas que aqu se presentan radica en la
expresividad utilizada para formular tanto los ejemplos positivos y negativos como el conjunto de reglas
aprendido. As, en el caso del Espacio de Versiones y AQ dicha expresividad vendr limitada por la de la
propia lgica de proposiciones (reglas y ejemplos descritos en trminos de atributo-valor). En cambio, en el
caso de la programacin lgica inductiva (ILP, del ingls Inductive Logic Programming), el grado de
expresividad del modelo aprendido ser mayor al venir formulado en trminos de lgica de predicados
(reglas y ejemplos descritos en trminos de predicados y relaciones).
Breve introduccin
Partiendo de la idea del problema de aprendizaje como un problema de bsqueda, la estrategia del Espacio
de Versiones (EV) es obtener un grupo reducido de hiptesis que permita explicar adecuadamente todos los
ejemplos, tanto positivos como negativos. Los ejemplos son procesados de uno en uno, de tal forma, que en
cada iteracin, se reduce el grupo de hiptesis que explican, no slo el ejemplo considerado en la iteracin,
sino tambin todos los procesados hasta el momento. Si el conjunto de ejemplos est bien diseado, existir
un momento en el que el tamao del conjunto de hiptesis se reducir a una nica hiptesis. Se dice
entonces que el algoritmo converge y que la hiptesis resultante representa el concepto aprendido.
De otro lado, no hay que olvidar que uno de los primeros intentos de programar mecanismo de aprendizaje
en mquinas fue debido a Michalski en los setenta. El resultado fue la creacin de una metodologa
denominada estrella de la que se han derivado numerosas variantes. Todos los posibles algoritmos que se
pueden generar a partir del mtodo estrella sern presentados en el presente tema con el nombre genrico
de algoritmo AQ.
Podra decirse que si las dos tcnicas anteriores permiten la aplicacin de tcnicas de aprendizaje inductivo
sobre la lgica proposicional, la programacin lgica inductiva (PLI) permite la aplicacin de tcnicas de
aprendizaje inductivo sobre la lgica de predicados de primer orden. Por tanto, dado que este tipo de
tcnicas permite recibir como entradas descripciones en lgica de predicados, no slo acepta ejemplos
descritos en esa representacin, sino tambin incluye una teora del dominio. Con esto se consigue cubrir las
deficiencias de los mtodos inductivos y deductivos, utilizando ideas de ambos. As, por una parte, los
mtodos de aprendizaje inductivo no utilizan conocimiento del dominio y, por otra parte, los mtodos
deductivos no son capaces de generalizar ms all de la descripcin del dominio disponible y de un ejemplo
de entrenamiento. Por tanto, podra decirse que la PLI realiza una induccin ayudada por el conocimiento del
dominio. La programacin lgica inductiva tiene su origen en los aos setenta, en los primeros sistemas que
aprendan conceptos expresados de forma relacional. Desde entonces ha sido mucho el trabajo realizado en
esta rea. Aqu se estudiar el algoritmo FOIL por ser uno de los ms representativos.
Una de las desventajas de los tres tipos de algoritmos bsicos presentados en este tema es que no son
tolerantes al ruido en las entradas (existencia de ejemplos mal etiquetados), lo que supone una
caracterstica bastante restrictiva para ser aplicados en problemas del mundo real donde, normalmente, las
entradas contienen ruido. Existen, no obstante, versiones de todos ellos que permiten soslayar este
problema. Sin embargo, su estudio est fuera del alcance de este curso.
Para el estudio del algoritmo de Espacio de Versiones, se recomienda focalizar en los siguientes
aspectos:
(1) En primer lugar, es crucial entender los conceptos de conjunto de hiptesis mximamente
generales (G) y conjunto de hiptesis mximamente especficas (S). Esto es as porque la
hiptesis de dichos conjuntos son las que delimitarn el espacio de versiones, es decir, el espacio
global de hiptesis consistentes con los ejemplos de entrenamiento. Es decir, el espacio de
versiones estar formado por todas las hiptesis de los conjuntos G y S, y por todas aquellas que,
simultneamente, son ms especficas que G y ms generales que S. El caso ideal es aquel en el
que G=S y, entonces, se dice que existe una nica hiptesis capaz de explicar todos los ejemplos.
(2) Es preciso resaltar tambin que, aunque el algoritmo hace uso de dos procedimientos bsicos,
especializar-g y generalizar-s, implementados de forma secuencial, el orden en que se aplican es
diferente en funcin de si el ejemplo que se est procesando es positivo o negativo.
GUA DE ESTUDIO
(3) Las variantes del algoritmo, descritas en pp. 128-133 del texto base, no sern objeto de examen.
Se recomienda slo una lectura atenta.
Por otro lado, para el estudio del algoritmo AQ, se recomienda focalizar en los siguientes aspectos:
(1) Es importante comprender los conceptos de funcin LEF, selector, complejo y recubrimiento.
(2) En relacin al funcionamiento del algoritmo, es importante tener en cuenta que se basa en la
realizacin de dos bsquedas anidadas. En la ms externa, denominada mtodo estrella, se busca
un conjunto de reglas que clasifiquen correctamente a todos los ejemplos. En la ms interna, por
cada ejemplo positivo, se busca una regla que describa a dicho ejemplo y no descrina a ninguno
negativo. Precisamente, en cmo se realiza esta segunda bsqueda es en lo que difieren,
fundamentalmente, los diferentes variantes de este algoritmo.
(3) Las variantes del algoritmo, descritas en pp. 149-153 del texto base, no sern objeto de examen.
Se recomienda slo una lectura atenta.
Finalmente, para el estudio del algoritmo FOIL, se recomienda focalizar en los siguientes aspectos:
(1) La salida del algoritmo es un conjunto de reglas y stas vienen expresadas en forma de reglas de
Horn. Por tanto, el alumno deber familiarizarse con este tipo de formato.
(2) El procedimiento clave en la dinmica del algoritmo es el denominado literal-mximaganancia. Se encarga de elegir el mejor literal para aadir al cuerpo de la clusula. De todos los
posibles literales que se pueden formar con los predicados del dominio, este procedimiento
selecciona uno en cada iteracin, de acuerdo a un criterio de mxima ganancia, parecido al que se
ver ms adelante para el algoritmo ID3. Es muy importante que el alumno entienda cada uno de las
variables y funciones que aparecen en la frmula de la ganancia, G(L), y que sea capaz de evaluar
cada una de ellas para, de esta forma, poder evaluar correctamente el valor de la ganancia y poder
as elegir el literal que determine una mayor ganancia.
(3) Igualmente es muy importante entender y saber aplicar las reglas que permiten generar los
distintos tipos de literales que se pueden formar (pp. 257-258).
Se recomienda la realizacin de las siguientes actividades:
(1) El alumno debera analizar con detenimiento los ejemplos ilustrativos del texto base, dedicado al
estudio del espacio de versiones, el algoritmo AQ y algoritmo FOIL. Seguidamente, debera
intentar abordar por su cuenta cada uno de ellos, es decir, sin ayuda de la solucin. De cara al
examen, la formulacin y resolucin de un caso prctico relacionado con estos algoritmos podra ser
muy similar a lo planteado en el texto base. Dado que, de forma progresiva, se ir incorporando
nuevo material al curso virtual, el alumno puede chequear si existen otros ejercicios resueltos
relacionados con este algoritmo.
(2) Finalmente, el alumno interesado podra ampliar conocimientos, consultando algunas de las
referencias bibliogrficas que aparecen en el texto base y que estn relacionadas con los contenidos
de este tema.
Tema 4. rboles de Decisin y de Regresin

rboles de Decisin: Algoritmo ID3-C4.5 (Seccin 6.1)
rboles de Regresin Algoritmo M5 (Seccin 6.2)
Objetivos
El principal objetivo de este tema es presentar dos de las tcnicas de aprendizaje quizs ms conocidas y
utilizadas en aprendizaje automtico: los rboles de decisin y los rboles de regresin. Ms
concretamente, en el primer caso, se abordarn los aspectos ms relevantes del algoritmo ID3 y su sucesor
C4.5 y, en el segundo caso, se describirn las caractersticas del algoritmo M5.
Breve introduccin
En el tema anterior se ha estudiado tcnicas de aprendizaje supervisado que abordaban problemas de
clasificacin binarios, es decir, un ejemplo pertenece o no a una determinada clase (concepto objetivo).
Adems, dichas tcnicas no eran tolerantes al ruido en las entradas, lo que dificulta su aplicacin en
problemas del mundo real. Estas dos limitaciones desaparecen en las tcnicas de aprendizaje descritas en
este tema. As, los denominados rboles de decisin abordarn problemas de clasificacin en los que la
salida del modelo aprendido puede discriminar entre dos o ms clases y, adems, es tolerante al ruido
en las entradas. Incluso, se puede dar un paso ms y, en lugar de predecir valores de clase, el objetivo
podra ser el de predecir valores continuos. Esta ltima ser la tarea abordada por los denominados rboles
de regresin.
La clave, a la hora de construir un rbol de decisin, radica en elegir en cada nodo de decisin aquel
atributo que tenga mayor capacidad de discriminacin sobre los ejemplos asociados al nodo. Es decir, aqul
que para cada valor del atributo genera una particin de ejemplos en la que se maximiza la homogeneidad
de ejemplos con respecto a los valores de clase. Para ello, se utiliza una funcin bsica de la teora de la
informacin, denominada entropa, que mide el grado de desorden o impureza de las particiones generadas.
As, dada una particin de ejemplos, si sta estuviera formada por ejemplos de una nica clase, su entropa
sera mnima y, al contrario, si estuviera formado por la misma cantidad de ejemplos pertenecientes a cada
una de las clases posibles, la entropa sera mxima. Por tanto, a lo largo del proceso recursivo de
construccin del rbol se elegir, en cada nodo de decisin, el atributo que mayor ganancia de informacin
aporte. La ganancia de informacin se medir como la diferencia de entropa existente en el conjunto de
ejemplos asociados al nodo y el sumatorio de entropas de cada una de las particiones asociadas a cada
valor del atributo seleccionado.
En el caso de los ejemplos de entrenamiento usados para construir un rbol de regresin, hay que tener en
cuenta que, ahora, los valores de clase de cada ejemplo no corresponden a valores discretos sino a valores
continuos. Sin embargo, al igual que ocurra con los rboles de decisin, el procedimiento recursivo de elegir
el atributo ms discriminante en cada nodo de decisin consistir tambin en maximizar la homogeneidad de
todas y cada una de las particiones que produce. Aqu, en cambio, y dado el carcter continuo de los valores
de clase, el clculo de la medida de homogeneidad ya no se realizar mediante la entropa sino usando el
concepto de desviacin estndar. As, dada una particin de ejemplos, si sta estuviera formada por
ejemplos con valores de clase muy parecidos u homogneos, su desviacin estndar sera mnima y, al
contrario, si estuviera formada por valores muy dispersos, la desviacin estndar sera mxima. En definitiva,
el criterio para elegir el atributo ms adecuado en cada nodo de decisin de un rbol de regresin ser aqul
que maximice la reduccin del error, medido ste como la diferencia entre la desviacin estndar del
10
GUA DE ESTUDIO
conjunto de ejemplos asociados al nodo antes de la particin y el sumatorio de desviaciones estndar de

cada una de las particiones generadas por la seleccin de un determinado atributo
Para el estudio de los rboles de Decisin, se recomienda focalizar en los siguientes aspectos:
(1) Es muy importante que el alumno comprenda, aprenda y maneje con soltura los conceptos de
entropa y ganancia de informacin.
(2) Obsrvese que la tarea de maximizar la ganancia de informacin del atributo a seleccionar en cada
nodo es equivalente a la de minimizar la suma de entropas de cada una de las particiones
resultantes de aplicar dicho atributo (dado que la entropa asociada a los ejemplos de un nodo es
siempre constante). De esta forma, se simplificar el clculo de la ganancia de informacin al no
ser necesario el clculo de la entropa de los ejemplos asociado a un nodo antes de su particin.
(3) Resulta muy interesante el estudio de las variantes del algoritmo, descritas en pp. 288-293 del
texto base. Todas ellos surgieron como mejoras del algoritmo bsico ID3 y la recopilacin de todas
ellas dio lugar al algoritmo C4.5.
Para el estudio de los rboles de Regresin, se recomienda focalizar en los siguientes aspectos:
(1) Dado que la desviacin estndar asociada a los ejemplos de un nodo es siempre constante, el
criterio de maximizacin de la minimizacin del error es equivalente al de minimizar la suma de
desviaciones estndar de cada una de las particiones resultantes de seleccionar un atributo. De esta
forma, se simplificar el clculo del error al no ser necesario el clculo de la desviacin estndar
de los ejemplos asociado a un nodo antes de su particin. Es ms, dado que la desviacin estndar
se obtiene como la raz cuadrada de la varianza, se podra reducir an ms el clculo del error
calculando la suma de varianzas de cada una de las particiones resultantes.
(2) Al estudiar al algoritmo asociado a la construccin de rboles de regresin, el alumno comprobar
que adems de construir el rbol como resultado de aplicar recursivamente el criterio de
maximizacin de la reduccin del error, ser necesario la construccin y simplificacin de modelos
de regresin lineal en cada uno de los nodos de rbol. Sin embargo, queda fuera del alcance del
temario de esta asignatura la construccin de modelos de regresin lineales. Por tanto, de
cara al examen, la resolucin de un problema de este tipo no implicara el clculo del modelo de
regresin asociado a cada uno de los nodos del rbol. Como aproximacin, se podra sustituir el
modelo de regresin de cada uno de los nodos hoja por el valor medio de los valores de clase de
cada uno de ejemplos pertenecientes a cada uno de dichos nodo hoja.
(3) Si el alumno consulta otros textos, es posible que encuentre este tipo de rboles bajo el nombre de
rboles de modelo (del ingls, model trees). Es el nombre que Quinlan, el creador del algoritmo M5,
utiliz para designar lo que aqu llamamos rboles de regresin.
(1) El alumno debera analizar con detenimiento los ejemplos ilustrativos del texto base, dedicados al
algoritmo ID3 y al algoritmo M5. Seguidamente, debera intentar abordarlo por su cuenta, es decir,
sin ayuda de las soluciones. De cara al examen, la formulacin y resolucin de un caso prctico
relacionado con estos algoritmos podra ser muy similar al planteado en el texto base. Dado que, de
11
forma progresiva, se ir incorporando nuevo material al curso virtual, el alumno puede chequear si
existen otros ejercicios resueltos relacionados con este algoritmo.
(2) Finalmente, el alumno interesado podra ampliar conocimientos, consultando algunas de las
de este tema.
Tema 5. Aprendizaje basado en Instancias
Este tema ser estudiado a partir de la seccin 6.3 del texto base y abarca los siguientes aspectos:
Algoritmo k-NN (Seccin 6.3)
Objetivos
El objetivo de este tema es presentar tcnicas que permiten realizar tareas de clasificacin a partir de un
conjunto de ejemplos de entrada, sin necesidad de crear un modelo como, por ejemplo, s hacen las tcnicas
que se han presentado hasta ahora. Concretamente, se estidiar el algoritmo ms representativo de este tipo
de tcnicas, el algoritmo de los k vecinos ms cercanos (k-nn, del ingls k-nearest neighbors)
Breve introduccin
De forma genrica, las tcnicas aqu presentadas reciben el nombre de tcnicas de aprendizaje basadas
en instancias (IBL, del ingls Instance Based Learning) o tcnicas de aprendizaje vago (del ingls, lazy
learning). Esta ltima denominacin hace referencia a que, precisamente, este tipo de tcnicas implican muy
poco esfuerzo computacional a la hora de aprender, reflejado en el hecho de que no generan modelos de
aprendizaje a partir de los ejemplos. Simplemente, se limitan a almacenar dichos ejemplos de tal forma que,
a la hora de clasificar un ejemplo no visto, el algoritmo utiliza como entrada todos los ejemplos almacenados.
Dado que el algoritmo k-nn, a la hora de clasificar un ejemplo no visto, utiliza todo el conjunto de ejemplos
como entrada y no dispone de modelo aprendido, el alumno debe incidir principalmente en el apartado
dedicado a la Utilizacin de lo aprendido. Es aqu donde reside la esencia de la operativa del algoritmo.
(1) El alumno debera analizar con detenimiento el ejemplo ilustrativo, dedicado al algoritmo k-nn,
presentado en la coleccin de problemas resueltos del curso virtual. Seguidamente, debera intentar
abordarlo por su cuenta, es decir, sin ayuda de la solucin. De cara al examen, la formulacin y
resolucin de un caso prctico relacionado con este algoritmo podra ser muy similar a la aqu
planteada. Dado que, de forma progresiva, se ir incorporando nuevo material al curso virtual, el
alumno puede chequear si existen otros ejercicios resueltos relacionados con este algoritmo.
(2) Tambin, el alumno interesado podra ampliar conocimientos, consultando algunas de las
de este tema.
12
GUA DE ESTUDIO
Tema 6. Clasificadores Bayesianos

Este tema ser estudiado a partir de la seccin 6.4 del texto base y abarca el estudio del siguiente algoritmo:
Algoritmo Naive-Bayes (Seccin 6.4)
Objetivos
El principal objetivo de este tema es realizar un acercamiento al mundo de los denominados clasificadores
bayesianos. Para ello, describiremos la versin ms simple de este tipo de algoritmos: el algoritmo NaiveBayes.
Breve introduccin
El objetivo de los clasificadores bayesianos, al igual que los rboles de decisin, es el de crear un modelo, a
partir de un conjunto de entrenamiento, que sea capaz de clasificar ejemplos no vistos. Como hablamos de
clasificador, esto presupondr que la clase de los ejemplos de entrenamiento viene dada por valores
discretos o etiquetas. Este tipo de clasificadores se basan en estimar la probabilidad de pertenencia a una
clase mediante la estimacin de las probabilidades condicionadas, utilizando para ello el teorema de Bayes.
Hay que tener en cuenta que el algoritmo Naive-Bayes asume independencia estadstica, es decir, asume
que el valor de los atributos es independiente dada la clase. Sin embargo, esta propiedad puede no
cumplirse en algunos problemas. Por tanto, antes de aplicar este algoritmo, es siempre conveniente
chequear si, para el problema de clasificacin que se est abordando, es razonable o no esta asuncin.
Para el estudio del algoritmo Naive-Bayes se recomienda focalizar en los siguientes aspectos:
(1) La aplicacin de algoritmo Naive-Bayes implica la utilizacin del teorema de Bayes. Por tanto, se
recomienda que todo alumno que no est familiarizado con este teorema estudie atentamente la
formulacin de este teorema (pp. 319-321 del texto base).
(2) Tambin se recomienda repasar los conceptos de probabilidad a priori, probabilidad
condicionada y distribucin normal.
(3) Finalmente, para la determinacin de los parmetros del modelo, el alumno deber distinguir entre si
el atributo es discreto o continuo para realizar el clculo de las probabilidades condicionadas. En
el primer caso (atributo discreto) la estimacin dichas probabilidades se basar en la frecuencia de
aparicin del valor del atributo en el conjunto de ejemplos de entrenamiento y, en el segundo caso
(atributo continuo), el clculo las probabilidades implicar la asuncin de un tipo de distribucin
asociada el atributo (normalmente, se considerar una distribucin normal).
(1) El alumno debera analizar con detenimiento el ejemplo ilustrativo del texto base, dedicado al
algoritmo Naive-Bayes, y, seguidamente, debera intentar abordarlo por su cuenta, es decir, sin
ayuda de la solucin. De cara al examen, la formulacin y resolucin de un caso prctico relacionado
con este algoritmo podra ser muy similar a la aqu planteada. Dado que, de forma progresiva, se ir
incorporando nuevo material al curso virtual, el alumno puede chequear si existen otros ejercicios
resueltos relacionados con este algoritmo.
13
de este tema.
Tema 7. Redes de Neuronas Artificiales (RNA)
Aprendizaje de RNAs por retro-propagacin del error (Seccin 9.1)
Objetivos
El objetivo principal de este tema es introducir las denominadas redes neuronales artificiales, un nuevo
paradigma de aprendizaje supervisado inspirado en la forma en que funciona el sistema nervioso de los
animales. Bsicamente, una red neuronal consiste en una red de elementos de proceso interconectados,
denominadas neuronas, que permiten aprender la informacin subyacente en un conjunto de ejemplos de
entrenamiento. Dicha informacin es almacenada de forma implcita en la topologa de la red y en los pesos
asociados a cada conexin. Aunque existen diferentes tipos de redes neuronales, aqu nos centraremos en
el perceptrn multicapa y su algoritmo de aprendizaje estrella, denominado mtodo de retropropagacin
del error o en ingls backpropagation.
Breve introduccin
Los primeros modelos de redes neuronales datan de 1943 por los neurlogos McCulloch y Pitts. Aos ms
tarde, en 1949, Donald Hebb desarroll sus ideas sobre el aprendizaje neuronal, quedando reflejado en la
"regla de Hebb". En 1958, Rosemblatt desarroll el perceptrn simple, y en 1960, Widrow y Hoff
desarrollaron el ADALINE. En los aos siguientes, se redujo la investigacin, debido a la falta de modelos de
aprendizaje y el estudio de Minsky y Papert sobre las limitaciones del perceptrn. Sin embargo, en los aos
80, volvieron a resurgir las RNA gracias al desarrollo de la red de Hopfield, y en especial, al algoritmo de
aprendizaje de retropropagacin ideado por Rumelhart y McLellan en 1986 que fue aplicado en el desarrollo
de los perceptrones multicapa.
Las caractersticas de las RNA las hacen bastante apropiadas para aplicaciones en las que no se dispone a
priori de un modelo identificable que pueda ser programado, pero se dispone de un conjunto bsico de
ejemplos de entrada. Asimismo, son altamente robustas tanto al ruido como a la disfuncin de elementos
concretos y son fcilmente paralelizables. Por el contrario, los modelos generados (la propia red) son
difcilmente interpretables.
Para el estudio de este tema, se recomienda focalizar en los siguientes aspectos:
(1) En primer lugar, el alumno debe ser consciente que el mtodo de aprendizaje de
retropropagacin del error no es aplicable a cualquier topologa de RNA sino que slo es
aplicable a un determinado tipo de redes (perceptrn multicapa) que se estudian en este tema. As,
existir siempre una capa de entrada, otra de salida y una o ms capas ocultas. Adems, las salidas
de la neurona de una determinada capa, slo pueden conectarse a las entradas de neuronas
situadas en una capa inmediatamente posterior, es decir, no se permitirn conexiones entre
neuronas de una misma capa, ni entre neuronas de una capa y las de una capa anterior, ni entre
neuronas de capas no consecutivas.
14
GUA DE ESTUDIO
(2) Para entender, tanto el mecanismo de propagacin de la informacin de entrada hasta la salida
como el mecanismo de aprendizaje de retropropagacin, es muy importante que el alumno
comprenda y se familiarice con la notacin empleada.
(3) Es importante resear que una red neuronal es un excelente aproximador de funciones no
lineales. En el caso que se sospeche que la funcin a aproximar sea lineal, existen un gran nmero
de mtodos estadsticos que permiten resolver este tipo de problemas, como los denominados
mtodos de regresin lineal, y que, por tanto, no requeriran explcitamente el uso de una RNA.
(4) Para facilitar la deduccin de las frmulas que permiten el clculo de la actualizacin del error,
jk, el alumno tiene que partir de la idea de que lo que se quiere minimizar es el error dado por la
ecuacin (9.6) del texto base. Bastar entonces derivar dicha expresin y el resultado igualarlo a
cero. Este proceso se complica un poco debido a que la salida de cada neurona no es simplemente
la suma ponderada de cada una de sus entradas, sino que esta suma ponderada se aplica,
finalmente, a una funcin no lineal, denominada funcin de activacin, constituyendo este valor la
salida de la neurona. Sin embargo, eligiendo convenientemente esta funcin, se puede an
simplificar el clculo de la derivada. Por ltimo, hay que tener en cuenta tambin que el clculo de
dicha derivada se simplifica para las clulas que estn en la capa de salida porque el error obtenido
por dichas neuronas es calculable directamente al ser conocido el valor deseado de salida. Sin
embargo, para las neuronas de las capas ocultas, no se dispone del valor deseado, es decir, el error
ha de ser calculado mediante la propagacin hacia atrs de de los valores de los incrementos en
cada neurona de cada capa.
(1) El alumno debera analizar con detenimiento el ejemplo ilustrativo del texto base. Dado que, de
(2) Se propone al alumno que resuelva el mismo problema del ejemplo ilustrativo del texto base
utilizando la herramienta Weka (ver Seccin 3 de esta gua).
de este tema.
Tema 8. Mquinas de Vectores Soporte
Este tema ser estudiado a partir de un tutorial disponible en el curso virtual y abarca los siguientes
aspectos:
Mquinas de Vectores Soporte: Clasificacin binaria y regresin (Tutorial descargable desde el curso
virtual)
Objetivos
Este tema presentar una nueva tcnica de aprendizaje supervisado, denominada mquinas de vectores
soporte (SVM, del ingls Support Vector Machines). Sin embargo, tiene slo carcter introductorio y, por
tanto, slo constituye una primera aproximacin a este paradigma de aprendizaje.
15
Breve introduccin
Las mquinas de vectores soporte fueron introducidas por Vapnik a mediados de los 90. Los mtodos
basados en este paradigma permiten resolver tanto tareas de clasificacin como de regresin. Dentro de la
tarea de clasificacin, las SVMs pertenecen a la categora de los clasificadores lineales, puesto que
inducen separadores lineales o hiperplanos, ya sea en el espacio original de los ejemplos de entrada, si
stos son separables o cuasi-separables (ruido), o en un espacio transformado (espacio de
caractersticas), si los ejemplos no son separables linealmente en el espacio original. La bsqueda del
hiperplano de separacin en estos espacios transformados se har de forma implcita utilizando las
denominadas funciones kernel.
Para el estudio de este tema, se recomienda focalizar en los siguientes aspectos:
(1) En primer lugar, hay que sealar que, aunque las SVMs se disearon inicialmente para resolver
problemas de clasificacin binaria, en la actualidad se han extendido a tareas de multiclasificacin,
regresin, agrupamiento e, incluso, se empiezan aplicar a problemas que requieren de salidas ms
complejas y estructuradas, como puede ser un grafo o un rbol. No obstante, en el estudio de este
tema nos centraremos en la aplicacin de las SVM a problemas de clasificacin binaria y de
regresin.
(2) Mientras todos los mtodos de aprendizaje vistos hasta ahora se centran en minimizar los errores
cometidos por el modelo generado a partir de los ejemplos de entrenamiento (error emprico), el
sesgo inductivo asociado a las SVMs radica en la minimizacin del denominado riesgo estructural.
La idea es seleccionar un hiperplano de separacin que equidista de los ejemplos ms cercanos de
cada clase para, de esta forma, conseguir lo que se denomina un margen mximo a cada lado del
hiperplano. Adems, a la hora de definir el hiperplano, slo se consideran los ejemplos de
entrenamiento de cada clase que caen justo en la frontera de dichos mrgenes. Estos ejemplos
reciben el nombre de vectores soporte.
(3) Las denominadas funciones kernel juegan un papel importante en la operativa de las SVM y, por
tanto, el alumno deber poner un especial inters en el estudio de este tipo de funciones.
(4) Desde un punto de vista algortmico, el problema de optimizacin del margen geomtrico
representa un problema de optimizacin cuadrtico con restricciones lineales que puede ser
resuelto mediante tcnicas estndar de programacin cuadrtica. Dado que el estudio de este tipo
de tcnicas queda fuera del alcance de este temario, el principal objetivo de este tema radica en que
el alumno estudie y comprenda cmo se formaliza el problema abordado por las SVMs (ya sea de
clasificacin o de regresin) hasta llegar a transformarlo, finalmente, en un problema de optimizacin
cuadrtico.
Existe un nmero importante de repositorios web y paquetes software de libre distribucin dedicados a la
implementacin de SVMs y muchas de sus variantes. As, por ejemplo, la librera LIBSVM es un paquete
software pensado para resolver problemas de clasificacin y regresin mediante mquinas de vectores
soporte. En su pgina web (http://www.csie.ntu.edu.tw/~cjlin/libsvm/) dispone de un applet para implementar
sencillos problemas de clasificacin y de regresin en dos dimensiones. Se recomienda al alumno el uso de
este applet como primera toma de contacto en el uso de las SVM.
16
GUA DE ESTUDIO
2.3 Parte III: Aprendizaje No Supervisado

El estudio de esta parte abarca los siguientes temas del curso:
Tema 9. Agrupamiento (Clustering)
Tema 10. Mapas Auto-organizados
Objetivos
En todas las tcnicas presentadas en la Parte II de la asignatura, el proceso de induccin utilizado para
aprender el modelo parta de la suposicin de que los ejemplos utilizados para entrenar el sistema estn
etiquetados con la clase a la que pertenecen (aprendizaje supervisado). Sin embargo, esta suposicin no es
vlida en aquellos dominios en los que no se conoce la clase a la que pertenece cada ejemplo de
entrenamiento e, incluso, tampoco se conoce el nmero de clases. Por tanto, el objetivo principal de esta
parte del temario es presentar un conjunto de tcnicas que abordan este tipo de problemas y que, de forma
genrica, reciben el nombre de tcnicas de agrupacin (del ingls, clustering) o, tambin, tcnicas de
aprendizaje no supervisado.
Tema 9. Agrupamiento (Clustering)
Este tema ser estudiado a partir de las secciones 8.1 y 8.2 del texto base y abarca los siguientes aspectos:
Estrategia Aglomerativa (seccin 8.1)
Algoritmo k-medias (seccin 8.2)
Objetivos
El principal objetivo de este tema es presentar dos tcnicas de agrupamiento, muy utilizadas por la
estadstica, como son la estrategia aglomerativa y la agrupacin en k-medias. Ambas tcnicas tienen la
particularidad de que trabajan con conjuntos de entrenamiento con atributos numricos. No obstante, existen
otras tcnicas de agrupamiento que manejan atributos discretos, pero quedan fuera del temario de esta
asignatura.
Breve introduccin
La estrategia aglomerativa fue introducida a principio de los 80 por Everitt. Bsicamente, consiste en, dado
un conjunto de ejemplos sin etiquetar descrito por valores de atributos, obtener una jerarqua de clases que
incluya, cada una de ellas, a un subconjunto del conjunto de ejemplos. A estas jerarquas se les denomina
dendogramas. En ellas, cada nodo representa una clase de observaciones.
Por otro lado, la agrupacin basada en el algoritmo k-medias no se basa en un proceso de jerarquizacin
de clases. En este caso, los ejemplos del conjunto de entrenamiento se agrupan en subconjuntos formados
por ejemplos parecidos entre s. Es decir, el objetivo es obtener una particin del conjunto de ejemplos que
maximice la similitud entre los ejemplos de cada particin (clase) y minimice la similitud entre diferentes
particiones (clases). Tiene la peculiaridad de que el nmero de clases debe ser proporcionado a priori por el
usuario
Para el estudio de la estrategia aglomerativa, se recomienda focalizar en los siguientes aspectos:
(1) Adems de estudiar el proceso algortmico que subyace en este tipo de tcnica de aprendizaje,
resulta tambin til comprender cmo se realiza la utilizacin de lo aprendido, es decir, cmo se
clasifica un ejemplo no visto, utilizando el modelo aprendido.
17
Para el estudio del algoritmo k-medias, se recomienda focalizar en los siguientes aspectos:
(1) Es importante sealar que este algoritmo es dependiente de los centroides iniciales, normalmente
elegidos de forma aleatoria. Una mala eleccin de dichos centroides puede provocar la no
convergencia del algoritmo.
(2) Tambin es dependiente de los rangos de variacin de los dominios de definicin de cada uno de los
atributos de los ejemplos. Por ello, antes de usar el algoritmo, se requiere una fase de preprocesamiento para normalizar todos los atributos.
(3) Finalmente, puede ocurrir que, aunque se desconozca el valor de clase de cada ejemplo, se
conozca el nmero de clases que representa al conjunto de ejemplos. Sin embargo, en la
mayora de las ocasiones esta informacin no es conocida. Dado que el nmero de clases es un
parmetro de entrada al algoritmo, en aquellos casos en los que esta informacin sea desconocida,
supondr un conjunto de pruebas de ensayo y error para determinar el mejor valor.
(1) El alumno debera analizar con detenimiento los ejemplos ilustrativos del texto base, dedicados a la
Estrategia Aglomerativa y al algoritmo k-medias. Seguidamente, debera intentar abordarlos por
su cuenta, es decir, sin ayuda de la solucin. De cara al examen, la formulacin y resolucin de un
caso prctico relacionado con estos algoritmos podra ser muy similar a los planteados en el texto
base. Dado que, de forma progresiva, se ir incorporando nuevo material al curso virtual, el alumno
puede chequear si existen otros ejercicios resueltos relacionados con este algoritmo.
de este tema.
Tema 10. Mapas Auto-organizados
Redes Neuronales auto-organizadas (Seccin 9.2)
Objetivos
En la Parte II, se presentaron las redes neuronales artificiales (RNAs) como uno de los paradigmas del
aprendizaje supervisado. Sin embargo, el principal objetivo de este tema es mostrar que existen
determinados tipo de RNAs que pueden utilizarse para realizar aprendizaje no supervisado. Son las
denominadas redes neuronales auto-organizadas.
Breve introduccin
Tal vez los modelos ms caractersticos de redes no supervisadas sean los de Kohonen, llamadas as en
honor al cientfico finlands que las cre, siendo tambin los ms utilizados en casos prcticos. El objetivo de
una RNA auto-organizada es descubrir por s sola caractersticas, regularidades, correlaciones, o categoras
en los ejemplos de entrada, y mostrarlas de forma codificada en la salida. Es por esto que se dice que la red
muestra cierto grado de auto-organizacin, y reciben este nombre.
18
GUA DE ESTUDIO

Para el estudio de las redes neuronales auto-organizadas, se recomienda focalizar en los siguientes
aspectos:
(1) Es importante estudiar y comprender la denominada regla de Hebb. Esta regla de inspiracin
biolgica es interesante, no slo porque permite comprender cmo una RNA auto-organizada es
capaz de dirigir el aprendizaje de la red, sino tambin porque permite implementar diferentes
variantes de esta regla, es decir, no existe una nica implementacin de la regla de Hebb, sino
diferentes versiones de reglas tipo Hebb.
(2) El alumno deber prestar especial atencin al concepto de mapa de caractersticas. Es el concepto
clave en el que se basan las RNAs auto-organizadas de Kohonen.
(3) Tal y como se dice en el apartado de variantes, al final de la seccin 9.2, las RNAs autoorganizadas de Kohonen pueden convertirse en modelos supervisados, introduciendo algunas
modificaciones. Sin embargo, este tipo de variaciones quedan fuera del alcance de este curso y slo
se recomienda una lectura atenta de esta nueva variante.
(1) El alumno debera analizar con detenimiento el ejemplo ilustrativo del texto base. Dado que, de
de este tema.
2.4 Parte IV: Otros tipos de Aprendizaje
El estudio de esta parte abarca los siguientes temas del curso:
Tema 11. Aprendizaje por refuerzo
Objetivos
Las tcnicas de aprendizaje presentadas hasta aqu han sido de dos tipos: supervisadas (cada ejemplo de
entrenamiento incorpora la clase a la que pertenece) o no supervisadas (los ejemplos no disponen de la
informacin de clase). Sin embargo, existe un conjunto de problemas en los que a los ejemplos se le asocia
una especie de informacin retardada en el tiempo y que, de alguna manera, puede entenderse desde la
perspectiva de las dems tcnicas de aprendizaje como un valor de clase, delimitado por slo dos valores
posibles (recompensa o castigo). Las tcnicas que abordan este tipo de problemas son conocidas, de forma
genrica, con el nombre de tcnicas de aprendizaje por refuerzo. El principal objetivo de esta ltima parte
del temario ser presentar uno de los algoritmos ms representativos de este tipo de tcnicas, el
denominado algoritmo Q-learning.
19
Tema 11. Aprendizaje por refuerzo

Algoritmo Q-learning (Captulo 10)
Objetivos
El principal objetivo del presente tema es introducir el algoritmo Q-learning, uno de los algoritmos ms
representativos de las denominadas tcnicas de aprendizaje por refuerzo. Desde un punto de vista ms
general, tambin se presentarn las caractersticas comunes de este tipo de tcnicas.
Breve introduccin
La meta de las tcnicas de aprendizaje por refuerzo es adquirir conocimiento, normalmente denominado
poltica de accin, que permita determinar, una vez adquirido, la mejor accin a realizar desde un estado
dado. La accin a elegir ser siempre aquella que maximice el refuerzo (recompensa) esperado.
Bsicamente, la forma de adquirir este conocimiento (modelo) es la siguiente: se ir construyendo
progresivamente una tabla en la que se relaciona cada estado posible si con cada accin posible aj,
aprendiendo cul es el refuerzo esperado al realizar la accin aj cuando el sistema se encuentra en el estado
si. Algunos ejemplos de problemas abordados por este tipo de tcnicas son el control de un robot mvil, la
optimizacin de las operaciones a realizar en cadenas de montaje de una fbrica, o el aprendizaje de la
mejor estrategia para jugar juegos de tablero (damas, ajedrez, etc.)
En este tema se va a presentar una tcnica propuesta por Watkins, algoritmo Q-learning, que est
encuadrada dentro de los denominados problemas de decisin de Markov, es decir, aquellos en los que la
poltica de accin (qu accin realizar en cada estado) se basa slo en el conocimiento del estado actual, y
no en la historia previa (secuencia de estados y acciones previas).
Para el estudio del algoritmo Q-learning se recomienda focalizar en los siguientes aspectos:
(1) Para abordar el aprendizaje de este algoritmo es clave entender y saber manejar la frmula de
actualizacin de cada estado, Qt(s,a).
(2) Tambin deber centrarse en cmo hacer uso del modelo aprendido, es decir, cul es la mejor
accin a elegir cuando el sistema se encuentra en un estado dado.
(1) El alumno debera analizar con detenimiento el ejemplo ilustrativo del texto base, dedicado al
algoritmo Q-learning y, seguidamente, debera intentar abordarlo por su cuenta, es decir, sin ayuda
de la solucin. De cara al examen, la formulacin y resolucin de un caso prctico relacionado con
este algoritmo podra ser muy similar a la aqu planteada. Dado que, de forma progresiva, se ir
incorporando nuevo material al curso virtual, el alumno puede chequear si existen otros ejercicios
resueltos relacionados con este algoritmo.
20
GUA DE ESTUDIO
de este tema.
3.- ORIENTACIONES
ACTIVIDADES
PARA
LA
REALIZACIN
DEL
PLAN
DE
En esta seccin de la Gua se describen los diferentes tipos de actividades propuestas en esta asignatura.
Bsicamente, se puede hablar de dos tipos de actividades: actividades recomendadas y actividades
evaluables.
3.1 Actividades recomendadas
A lo largo de la seccin 2, y para cada uno de los temas que componen el temario de la asignatura, se ha
propuesto al alumno una serie de actividades, orientadas bsicamente a trabajar los aspectos prcticos
relacionados con cada tema. La caracterstica comn de todas estas actividades es que no son obligatorias
ni evaluables, es decir, se deja su realizacin a criterio del alumno. De esta forma, el alumno podr trabajar
aquellos aspectos que considere ms oportunos en funcin del tiempo disponible y de las dificultades que
haya podido tener en el estudio de cada tema.
3.2 Actividades evaluables (PECs)
En esta seccin se proponen dos actividades evaluables y que corresponden a lo que, normalmente, se
denominan pruebas de evaluacin continua (PEC). La particularidad de estas actividades es que no son
obligatorias pero s son evaluables, y su calificacin repercute en la nota final de la asignatura. As, la
calificacin de estas dos actividades representar un 10% de la nota final de la asignatura. La calificacin del
examen representar el 90% restante. Esto significa que aquel alumno que decida no realizarlas, seguir
teniendo la opcin de presentarse al examen y, por tanto, de poder aprobar la asignatura. No obstante, la
calificacin de la nota final de la asignatura de un alumno que no hay realizado las PECs vendr dada slo y
exclusivamente por la nota de examen y, por consiguiente, nunca podr ser superior a 9.
La realizacin de las prcticas no implica la asistencia del alumno al Centro Asociado, su entrega se har a
travs del curso virtual y sern corregidas por los profesores tutores. Por tanto, todo el proceso podr ser
realizado desde casa, necesitando tan slo para ello de un ordenador y del software Weka (Waikato
Environment for Knowledge Analysis), descargable desde el siguiente link:
http://www.cs.waikato.ac.nz/ml/weka/
Weka es una plataforma de software que implementa una gran cantidad de algoritmos de aprendizaje
automtico y de minera de datos, est codificada en Java y ha sido desarrollada en la Universidad de
Waikato (Nueva Zelanda). Weka es un software libre distribuido bajo licencia GNU-GPL. En el citado link,
adems de poder descargar este software, el alumno tendr acceso a otros recursos, tales como
documentacin, FAQs y conjuntos de ejemplo de entrenamiento, entre otras cosas. El alumno tambin
dispondr en el curso virtual de la asignatura de un tutorial de Weka (escrito en castellano).
Las dos actividades propuestas correspondern a alguno de los contenidos de los dos partes ms extensas
de la asignatura, Parte II y III, y cada una de ellas consistir en el diseo de distintos experimentos de
aprendizaje. As, la primera actividad estar relacionada con tcnicas de aprendizaje supervisado y la
21
segunda con tcnicas de aprendizaje no supervisado. Los guiones que describen los objetivos de cada
prctica, el (los) problema-s a resolver, as como las orientaciones para su realizacin se podrn descargar
desde el curso virtual de la asignatura. No obstante, a continuacin se mostrar informacin de carcter
general de cada una de ellas.
A 1. Diseo de experimentos con tcnicas de aprendizaje supervisado

Objetivo: Resolver un problema que implique el uso de tcnicas de aprendizaje supervisado.
Orientaciones acerca de su realizacin: descritas en el guin de la prctica, descargable desde el
curso virtual.
Orientaciones sobre el uso de los medios y recursos para llevarla a cabo: slo se necesitar un
ordenador y el software Weka.
Tiempo estimado de realizacin: Una semana (10 horas)
Plazo mximo de entrega: se indicar en el curso virtual (alrededor de la semana 9 del primer
cuatrimestre).
Criterios de evaluacin: descritos en el guin de la prctica, descargable desde el curso virtual.
A 1. Diseo de experimentos con tcnicas de aprendizaje no supervisado
Objetivo: Resolver un problema que implique el uso de tcnicas de aprendizaje no supervisado.
Orientaciones acerca de su realizacin: descritas en el guin de la prctica, descargable desde el
curso virtual.
Orientaciones sobre el uso de los medios y recursos para llevarla a cabo: slo se necesitar un
ordenador y el software Weka.
Tiempo estimado de realizacin: Una semana (10 horas)
Plazo mximo de entrega: se indicar en el curso virtual (alrededor de la semana 12 del primer
cuatrimestre).
Criterios de evaluacin: descritos en el guin de la prctica, descargable desde el curso virtual.
22
GUA DE ESTUDIO
4.- GLOSARIO
A continuacin se ofrece una serie de enlaces que el alumno puede consultar como glosario de trminos
relacionado con los contenidos de la asignatura:
- The Machine Learning Dictionary:
http://www.cse.unsw.edu.au/~billw/mldict.html.
- Special Issue on Applications of Machine Learning and the Knowledge Discovery Process:
http://robotics.stanford.edu/~ronnyk/glossary.html.
23

AA - Guía de Estudio

Загружено:

Сведения о документе

Оригинальное название

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

AA - Guía de Estudio

Загружено:

Авторское право:

Доступные форматы

GUADEESTUDIODELAASIGNATURA

UNIVERSIDAD NACIONAL DE EDUCACIN A DISTANCIA

1.- PLAN DE TRABAJO

Tema 3. Aprendizaje de Conceptos y de Reglas. Captulo 3 y Seccin 5.3.

PARTE III. APRENDIZAJE NO SUPERVISADO

Captulo 7 (no es objeto de estudio)

UNIVERSIDAD NACIONAL DE EDUCACIN A DISTANCIA

Actividad Evaluable I (PEC-1)

Estudio y realizacin de actividades de Parte III

Actividad Evaluable II (PEC-2)

Estudio y realizacin de actividades de Parte IV

Estudio y realizacin de actividades de Parte II

Repaso y preparacin de la Prueba Presencial

Tabla 1. Plan de trabajo de la asignatura

UNIVERSIDAD NACIONAL DE EDUCACIN A DISTANCIA

2.- ORIENTACIONES PARA EL ESTUDIO DE LOS CONTENIDOS

Motivaciones (Seccin 1.1)

UNIVERSIDAD NACIONAL DE EDUCACIN A DISTANCIA

Por otro lado, a la hora de acercarse, analizar y entender el aprendizaje automtico no

Objetivos de la tarea de Aprendizaje (Secciones 2.1 y 2.2)

Determinacin de la funcin objetivo

UNIVERSIDAD NACIONAL DE EDUCACIN A DISTANCIA

Un aspecto importante a la hora de abordar la tarea de aprendizaje es plantearla como un problema de

UNIVERSIDAD NACIONAL DE EDUCACIN A DISTANCIA

2.2 Parte II: Aprendizaje Supervisado

Tema 3. Aprendizaje de Conceptos y de Reglas

Introduccin (Seccin 3.1)

UNIVERSIDAD NACIONAL DE EDUCACIN A DISTANCIA

UNIVERSIDAD NACIONAL DE EDUCACIN A DISTANCIA

UNIVERSIDAD NACIONAL DE EDUCACIN A DISTANCIA

Tema 4. rboles de Decisin y de Regresin

UNIVERSIDAD NACIONAL DE EDUCACIN A DISTANCIA

conjunto de ejemplos asociados al nodo antes de la particin y el sumatorio de desviaciones estndar de

UNIVERSIDAD NACIONAL DE EDUCACIN A DISTANCIA

UNIVERSIDAD NACIONAL DE EDUCACIN A DISTANCIA

Tema 6. Clasificadores Bayesianos

UNIVERSIDAD NACIONAL DE EDUCACIN A DISTANCIA

UNIVERSIDAD NACIONAL DE EDUCACIN A DISTANCIA

UNIVERSIDAD NACIONAL DE EDUCACIN A DISTANCIA

UNIVERSIDAD NACIONAL DE EDUCACIN A DISTANCIA

2.3 Parte III: Aprendizaje No Supervisado

UNIVERSIDAD NACIONAL DE EDUCACIN A DISTANCIA

Orientaciones para el estudio

UNIVERSIDAD NACIONAL DE EDUCACIN A DISTANCIA

Tema 11. Aprendizaje por refuerzo

UNIVERSIDAD NACIONAL DE EDUCACIN A DISTANCIA

UNIVERSIDAD NACIONAL DE EDUCACIN A DISTANCIA

A 1. Diseo de experimentos con tcnicas de aprendizaje supervisado

UNIVERSIDAD NACIONAL DE EDUCACIN A DISTANCIA

UNIVERSIDAD NACIONAL DE EDUCACIN A DISTANCIA

Вам также может понравиться