Академический Документы
Профессиональный Документы
Культура Документы
UNIVERSIDAD
NACIONAL
DE LOJA
Area
de la Energa las Industrias y los Recursos Naturales No Renovables
FUNCIONES DE
APRENDIZAJE
MODULO IX B
Autores:
SORAYA ISAMAR LARA TAPIA
Docente:
ING. HENRY PAZ
Fecha:
22 DE OCTUBRE 2014
Loja-Ecuador
Septiembre 2014 - Julio 2015
1
Indice
1. FUNCIONES DE APRENDIZAJE
1.1. Tipos de Aprendizaje . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2. Reglas de Aprendizaje . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
4
4
2. Aprendizaje supervisado
2.1. Algoritmos con Aprendizaje Supervisado
2.2. Aprendizaje por correccion de error. . . .
2.3. Aprendizaje por refuerzo . . . . . . . . .
2.4. Aprendizaje estocastico . . . . . . . . . .
.
.
.
.
4
5
5
6
7
3. Aprendizaje no supervisado
3.1. Algoritmo de Aprendizaje No Supervisado . . . . . . . . . . . . . . . . . .
3.2. Aprendizaje hebbiano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.3. Aprendizaje competitivo y comparativo . . . . . . . . . . . . . . . . . . . .
8
8
8
9
Por Refuerzo
. . . . . . . .
. . . . . . . .
. . . . . . . .
5. BIBLIOGRAFIA
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
9
. 9
. 10
. 10
. 10
11
1.
FUNCIONES DE APRENDIZAJE
Se ha visto que los datos de entrada se procesan a traves de la red neuronal con el
proposito de lograr una salida. Tambien se dijo que las redes neuronales extraen generalizaciones desde un conjunto determinado de ejemplos anteriores de tales problemas de
decision. Una red neuronal debe aprender a calcular la salida correcta para cada constelacion (arreglo o vector) de entrada en el conjunto de ejemplos. Este proceso de aprendizaje
se denomina: proceso de entrenamiento o acondicionamiento. El conjunto de datos (o conjunto de ejemplos) sobre el cual este proceso se basa es, por ende, llamado: conjunto de
datos de entrenamiento.
Si la topologa de la red y las diferentes funciones de cada neurona (entrada, activacion
y salida) no pueden cambiar durante el aprendizaje, mientras que los pesos sobre cada
una de las conexiones si pueden hacerlo; el aprendizaje de una red neuronal significa:
adaptacion de los pesos.
En otras palabras el aprendizaje es el proceso por el cual una red neuronal modifica
sus pesos en respuesta a una informacion de entrada. Los cambios que se producen durante el mismo se reducen a la destruccion, modificacion y creacion de conexiones entre
las neuronas. En los sistemas biologicos existe una continua destruccion y creacion de
conexiones entre las neuronas. En los modelos de redes neuronales artificiales, la creacion
de una nueva conexion implica que el peso de la misma pasa a tener un valor distinto de
cero. De la misma manera, una conexion se destruye cuando su peso pasa a ser cero.
Durante el proceso de aprendizaje, los pesos de las conexiones de la red sufren modificaciones, por lo tanto, se puede afirmar que este proceso ha terminado (la red ha
aprendido) cuando los valores de los pesos permanecen estables (dwij/dt = 0).
Un aspecto importante respecto al aprendizaje de las redes neuronales es el conocer
como se modifican los valores de los pesos, es decir, cuales son los criterios que se siguen
para cambiar el valor asignado a las conexiones cuando se pretende que la red aprenda
una nueva informacion.
Hay dos metodos de aprendizaje importantes que pueden distinguirse:
Aprendizaje supervisado.
Aprendizaje no supervisado.
Otro criterio que se puede utilizar para diferenciar las reglas de aprendizaje se basa en
considerar si la red puede aprender durante su funcionamiento habitual o si el aprendizaje
supone la desconexion de la red, es decir, su inhabilitacion hasta que el proceso termine.
En el primer caso, se tratara de un aprendizaje on line, mientras que el segundo es lo que
se conoce como off line.
Cuando el aprendizaje es off line, se distingue entre una fase de aprendizaje o entrenamiento y una fase de operacion o funcionamiento, existiendo un conjunto de datos
3
1.1.
Tipos de Aprendizaje
Aprendizaje Supervisado entrada, salida, objeto
Aprendizaje No Supervisado entrada, salida
Aprendizaje por Refuerzo Recompensa/castigo
1.2.
Reglas de Aprendizaje
Aprendizaje Supervisado: A la red se le proporciona un conjunto de ejemplos
del comportamiento propio de la red (inputs/targets)
Aprendizaje por Reforzamiento: A la red se proporciona un grado de desempe
no
de la misma.
Aprendizaje No supervisado: Las entradas son las unicas disponibles para el
aprendizaje, el algoritmo de la red aprende a categorizar las entradas (clustering)
2.
Aprendizaje supervisado
2.1.
2.2.
2.3.
2.4.
Aprendizaje estoc
astico
Consiste basicamente en realizar cambios aleatorios en los valores de los pesos de las
conexiones de la red y evaluar su efecto a partir del objetivo deseado y de distribuciones
de probabilidad.
En el aprendizaje estocastico se suele hacer una analoga en terminos termodinamicos,
asociando a la red neuronal con un solido fsico que tiene cierto estado energetico. En
el caso de la red, la energa de la misma representara el grado de estabilidad de la red,
de tal forma que el estado de mnima energa correspondera a una situacion en la que
los pesos de las conexiones consiguen que su funcionamiento sea el que mas se ajusta al
objetivo deseado.
Seg
un lo anterior, el aprendizaje consistira en realizar un cambio aleatorio de los
valores de los pesos y determinar la energa de la red (habitualmente la funcion energa
es una funcion de Liapunov). Si la energa es menor despues del cambio, es decir, si el
comportamiento de la red se acerca al deseado, se acepta el cambio; si, por el contrario, la
energa no es menor, se aceptara el cambio en funcion de una determinada y preestablecida
distribucion de probabilidades.
3.
Aprendizaje no supervisado
3.1.
3.2.
Aprendizaje hebbiano
Esta regla de aprendizaje es la base de muchas otras, la cual pretende medir la familiaridad o extraer caractersticas de los datos de entrada. El fundamento es una suposicion
bastante simple: si dos neuronas NI y Nj toman el mismo estado simultaneamente (ambas
activas o ambas inactivas), el peso de la conexion entre ambas se incrementa.
Las entradas y salidas permitidas a la neurona son: {1, 1} o {0, 1} (neuronas binarias). Esto puede explicarse porque la regla de aprendizaje de Hebb se origino a partir de
la neurona biologica clasica, que solamente puede tener dos estados: activa o inactiva.
Wij = Yi Yj
Ejemplos de redes: Red de Hopfield, Additive Grossberg, Shunting Grossberg, Learning Matrix, BAM, TAM, LAM.
Variantes del Aprendizaje Hebbiano
Drive - Reinforcement (Sejnowski)
8
3.3.
4.
4.1.
4.2.
INMEDIATO
En este refuerzo se obtiene una crtica para cada accion efectuada justo despues de su
realizacion. La informacion que aporta el refuerzo inmediato es local a cada accion tomada.
Debe aprenderse una accion a realizar en cada situacion para obtener un refuerzo positivo
despues de su ejecucion.
4.3.
RETARDADO
Este refuerzo es mas complicado ya que no tenemos una crtica para cada accion sino
una estimacion global del comportamiento. Se presenta cuando no se completa la secuencia de acciones empleadas para resolver el problema.
Al ejecutar una accion el refuerzo no solo depende de ella sino tambien de las realizadas
anteriormente.
4.4.
PASIVO
Solo tenemos una estimacion global del comportamiento y no una crtica para cada
accion realizada, con lo cual el problema se complica. El esfuerzo obtenido al ejecutar una
accion no depende u
nicamente de ella sino tambien de las realizadas anteriormente. El
entorno genera las transiciones y el agente las percibe.[3]
10
5.
BIBLIOGRAFIA
Referencias
[1] Damian Jorge Matich.Universidad Tecnologica Nacional Redes Neuronales:
Conceptos Basicos y Aplicaciones. Disponible en: http://www.frro.utn.
edu.ar/repositorio/catedras/quimica/5_anio/orientadora1/monograias/
matich-redesneuronales.pdf
[2] ESCOM
REDES
NEURONALES
Algoritmos
de
Aprendizaje,
2009.
Disponible
en:
http://es.slideshare.net/mentelibre/
redes-neuronales-algoritmos-de-aprendizaje
[3] BAARAUJO Basilo, Aprendizaje Automatico: Conceptos Basicos y Avanzados
,2006
11