Вы находитесь на странице: 1из 29

ENCUENTRO CIENTÍFICO

INTERNACIONAL 2019 DE VERANO

ALGORITMO BACKPROPAGATION PARA


DETERMINAR NIVELES DE MOROSIDAD EN
ESTUDIANTES DE UNIVERSIDADES PRIVADAS

Dr. SORIA QUIJAITE JUAN JESÚS


Email: jesussoria@upeu.edu.pe
NOCIONES DE REDES NEURONALES
La neurona es la unidad funcional y estructural del sistema nervioso que
produce y transmite el impulso nervioso. Se encuentra formada por tres
partes: el cuerpo neuronal o soma; una prolongación larga y poco
ramificada llamada axón, y otras prolongaciones muy ramificadas alrededor
del soma llamadas dendritas.

1
MODELO NEURONAL DE McCULLOCH-PITTS
El primer modelo Matemático de una neurona artificial
creado con el fin de llevar a cabo tareas simples, fue
presentado en el año 1943 en un trabajo conjunto entre
el psiquiatra y neuroanatomista Warren McCulloch y el
matemático Walter Pitts.

2
MODELO NEURONAL DE McCULLOCH-PITTS
La siguiente figura muestra un ejemplo de modelo neuronal con n entradas que consta:
Un conjunto de entradas x1, x2, … , xn.
Los pesos sinápticos w1, w2, … ,wn, correspondientes a cada entrada.
Una función de agregación, ∑.
Una función de activación, f.
Una salida Y.
Las entradas son el estímulo que la neurona artificial recibe del entorno que la rodea, y
la salida es la respuesta a tal estímulo. La neurona puede adaptarse al medio
circundante y aprender de él modificando el valor de sus pesos sinápticos, y por ello
son conocidos como los parámetros libres del modelo, ya que pueden ser modificados
y adaptados para realizar una tarea determinada. En este modelo, la salida neuronal Y
esta dada por Y  f    i x i 
n

 i 1 

3
FUNCIONES DE ACTIVACIÓN
La función de activación se elige de acuerdo a la tarea realizada por
la neurona. Entre las más comunes dentro del campo de las RANAs
podemos destacar:

4
FUNCIONES DE ACTIVACIÓN

5
FUNCIONES DE ACTIVACIÓN

1) Redes con conexiones hacia adelante(feedforward)


 Perceptrón
 Adaline
 Madaline
 Linear Adaptive Memory (LAM)
 Backpropagation
Estas redes son útiles en aplicaciones de reconocimiento
clasificación de patrones.
2) Redes con conexiones hacia adelante y hacia atrás
(feedforward/feedback)
 ART (Adaptative Resonance theory)
 BAM (Bidirectional Associative Memory) 6
 Neocognitron
ARQUITECTURA BACKPROPAGATION

a  f  . x  b 

Las funciones de transferencia deben de ser continuas. Además se buscan 7


funciones cuya derivada dependa de la función sin derivar.
Algoritmo Backpropagation

Tipo de Red de aprendizaje supervisado que se basa en un algoritmo de


gradiente descendiente (LMS Algorithm Widrow-Hoff).
El patrón de entrada se propaga por la red hasta generar la salida, después
se calcula el error; éstas salidas de error se propagan hacia las neuronas
de la capa anterior. Cada neurona solo tiene una contribución del error total
8
ALGORITMO DE RETRO PROPAGACIÓN

9
INTRODUCCIÓN
En la actualidad, en la mayoría de las instituciones financieras
los ejecutivos de cuenta evalúan solicitudes de crédito utilizando
su propia experiencia y guías publicadas y divulgadas por la
institución. Según Salinas, J. (2009) este método tiene las
siguientes dificultades:
 Pobre desempeño, puesto que la experiencia de la mayoría de
los ejecutivos de cuenta es limitada, lo cual significa generar
decisiones no muy precisas.
 Inflexibilidad, porque se requiere experiencia de varios años
antes que los ejecutivos se desempeñen bien. Por lo tanto, este
método reacciona lento a los cambios en la población de
solicitantes de créditos.
 Inconsistencia, puesto que, diferentes ejecutivos poseen
estándares diferentes.
 Baja eficiencia al evaluar solicitudes, esto consume tiempo e
involucra también a personal experimentado de jerarquía
superior.
10
INTRODUCCIÓN
Los bancos se están centrando en desarrollar métodos de
evaluación de préstamos para reducir el riesgo y acortar el
largo proceso de evaluación de créditos de clientes sin empleo
formal e ingresos irregulares que se ven obligados a ofrecer
garantías convencionales.
Así mismo en el área de finanzas de la Universidad Peruana
Unión la asignación de crédito, es realizada por los analistas
financieros haciendo uso de su propia experiencia y lógica. Es
por ello la necesidad de contar con una herramienta que nos
ayude a clasificar a los alumnos deudores según su nivel de
morosidad, para luego poder analizar la asignación del crédito
en sus pensiones de pago por derecho de enseñanza
universitaria.
La presente Investigación tuvo como objetivo la construcción
de un modelo de redes neuronales usando el algoritmo
backpropagation para determinar los niveles de morosidad en
los alumnos de la Universidad Peruana Unión de la sede
central de Lima.
11
INTRODUCCIÓN
Para cumplir con el objetivo planteado, se siguió una
metodología de minería de datos, desglosada en cinco
fases.
 En la primera fase de comprensión del negocio se
comprende los objetivos y requisitos del proyecto
desde una perspectiva empresarial.
 En la siguiente fase se comprenden los datos,
estableciendo un primer contacto.
 Luego en la fase de preparación de los datos se
seleccionan los datos que van a intervenir en la
creación del modelo de redes neuronales
backpropagation.
 En la fase de modelado se lleva a cabo la creación del
modelo redes neuronales, y
 finalmente en la última se evalúa el modelo teniendo
en cuenta el cumplimiento de los criterios de éxito del
problema. 12
INTRODUCCIÓN
Con esta investigación, el área de finanzas de la universidad
Peruana Unión pudo identificar y clasificar a los alumnos según su
nivel de morosidad, para luego tomar las acciones preventivas en
sus cobranzas universitarias y dar las facilidades de pagos y otras
estrategias de cobranzas como las ventas de sus productos Unión .
Además permitió que la gerencia de finanzas tenga un control
eficiente sobre el riesgo crediticio al otorgar un crédito a los
alumnos de la Universidad.

13
RED BACK PROPAGATION
La red Neuronal Back
Propagation es un tipo de red de
aprendizaje supervisado, que
emplea un ciclo propagación –
adaptación de dos fases. Una vez
que se ha aplicado un patrón a la
entrada de la red como estímulo,
este se propaga desde la primera
capa a través de las capas
superiores de la red, hasta generar
una salida. La señal de salida se
compara con la salida deseada y
se calcula una señal de error para
cada una de las salidas.

14
RED BACK PROPAGATION

Las salidas de error se propagan hacia atrás, partiendo de la capa de


salida, hacia todas las neuronas de la capa oculta que contribuyen
directamente a la salida. Sin embargo las neuronas de la capa oculta

M solo reciben una fracción de la señal total del error basándose


1
E p  .  pk
2 aproximadamente en la contribución relativa que haya aportado cada

2 i 1 neurona a la salida original. Este proceso se repite, capa por capa,


hasta que todas las neuronas de la red hayan recibido una señal de
error que describa su contribución relativa al error total. Basándose en
la señal de error percibida, se actualizan los pesos de conexión de cada
neurona, para hacer que la red converja hacia un estado que permita
clasificar correctamente todos los patrones de entrenamiento. (Garcia
Martinez, Servente, & Pasquín, 2003).
15
FUNCIONES DE TRANSFERENCIA
La importancia de este proceso consiste en que, a
medida que se entrena la red, las neuronas de las capas
intermedias se organizan a sí mismas de tal modo que las
distintas neuronas aprenden a reconocer distintas
características del espacio total de entrada. Después del
entrenamiento, cuando se les presente un patrón
arbitrario de entrada que contenga ruido o que esté
incompleto, las neuronas de la capa oculta de la red
responderán con una salida activa si la nueva entrada
contiene un patrón que se asemeje a aquella
característica que las neuronas individuales hayan
aprendido a reconocer durante su entrenamiento. Y a la
inversa, las unidades de las capas ocultas tienen una
tendencia a inhibir su salida si el patrón de entrada no
contiene la característica para reconocer, para la cual han
sido entrenadas. Para la función de transferencia, se
utilizó la función tangente sigmoidea, la salida de esta
función siempre será continua en el rango entre cero y
uno. La función está definida por la regla de
correspondencia es:
1
 ( )  16
1  e  a
METODOLOGÍA CRSP-DM
La metodología usada para la construcción del modelo
fue CRISP-DM el cual ayudó a la fase de comprensión
del problema en la que se realizaron reuniones con la
parte administrativa de finanzas, para poder entender el
problema que presenta dicha área. Uno de los problemas
encontrados fue la falta de clasificación de alumnos
según su morosidad. El poder clasificarlos ayudó a
tomar medidas respectivas con respecto a cada nivel.
Luego en la fase de comprensión de los datos realizando
un instrumento para recoger la información de una
muestra de 220 estudiantes de la universidad peruana
Unión. En la fase de preparación de los datos se los
recogió en una archivo Excel para luego transportarlo a
SQL-Server. Las encuestas de dividieron en 140 para el
entrenamiento de la red (70%) y 60 encuestas para el
proceso de prueba (30%). Las preguntas del
instrumento, apuntaron hacia la obtención de
información básicamente de dos tipos, cualitativa y
cuantitativa, el cual todas las variables fueron
convertidas a tipo de intervalo. 17
ETAPAS BACKPROPAGATION
Se determinó las entradas netas para las neuronas ocultas
procedentes de las neuronas de entrada m
N pj   w hji x pi  bih
h

i 1

Se aplicó la función de activación a cada una de las entradas de la


neurona oculta para obtener su respectiva salida
 h m
h
y pj  f  N pj   w ji x pi  bi 
j
h h

 i 1 
Se realizaron los mismos cálculos para obtener las respectivas
salidas de las neuronas de la capa de salida
 0 0
m
  w x pj  b
m
 f  N pk   w kj x pj  bk 
0 0 0
N pk kj k y pk k
0 0

i 1  i 1 

18
ETAPAS BACKPROPAGATION
Se determinaron los cálculos de error (salida deseada-salida
obtenida) e  d  y
pk pk

Obtención de la delta (producto del error con la derivada de la


función de activación con respecto a los pesos de la red).
 0
pk e f k
0
N 
0
pk

Actualización de los pesos. Se emplea el algoritmo recursivo del


gradiente descendente, comenzando por las neuronas de salida y
trabajando hacia atrás hasta llegar a la capa de entrada. Para los
pesos de las neuronas de la capa de salida

w kj0 ( t  1)  w kj0 ( t )  w kj0 ( t  1) w kj0 ( t  1)  min  pk


0
y pj

19
ETAPAS BACPROPAGATION
Para los pesos de las neuronas de la capa oculta
w hji ( t  1)  w hji ( t )  w hji ( t  1) w hji ( t  1)  min  pjh x pi
Se cumple la condición de paro. El proceso se repite hasta que el
término de error resulta aceptablemente pequeño para cada uno de
los patrones aprendidos. (Garcia Martinez, Servente, & Pasquín,
2003) E  1 . M  2
p
2

i 1
pk

20
MODELO DE RED NEURONAL DEL ESTUDIO

21
ESTRUCTURA DE LOS DATOS
La estructura de la minería de datos se muestra en la figura

22
CONCLUSIONES
En la investigación se logró construir el modelo de
Backpropagation que nos permitió identificar los niveles de
morosidad de los alumnos de la Universidad Peruana Unión
clasificándolos en:
 No moroso,
 Poco moroso,
 Semi moroso y
 Moroso.
Las pruebas de predicción de la clasificación resultaron
satisfactorias. La conclusión global de este estudio indica que el
pronóstico a un alumno moroso en la Universidad peruana Unión
con una asertividad del 99,03 % .

23
CONCLUSIONES
Con el modelo de Backpropagation se ha conseguido detectar las
variables que más influyen sobre los niveles de morosidad del
alumno de la Universidad Peruana Unión. Estas variables son:
Tiempo de la deuda, Monto de la deuda Ingreso de los
responsables financieros, Situación del responsable financiero.
Después de haber realizado la recolección de los datos, siendo estos
tratados y analizados llegamos a concluir que los niveles de
morosidad que presentan los alumnos de la Universidad Peruana
Unión son bajos, resultados que se ven reflejados en los resultados
estadísticos en donde arrojaron que: el nivel no moroso de la
población representa un 56%, el nivel poco moroso un 16.50%,
luego tomando un poco más de peso, el nivel Semi moroso
representado por un 23.50% y finalmente bajando en el nivel más
alto refiriéndonos al nivel Moroso representado por un 4% de la
población.
24
CONCLUSIONES

Los resultados de la investigación se producen bajo el alero de un


modelo de red neuronal y muy aconsejable según el experto Juan
Bekios, lo que hace creer en que el modelo es aconsejable para la
clasificación de morosidad en empresas como la UPeU, empresas
afines y/o empresas en general debido a que la morosidad se
presenta en varios y distintos giros de negocios.
El modelo de la RNA Backpropagation que se construyó con la
herramienta SQL Server se validó con la herramienta SPSS 23.0,
la cual tuvo resultados semejantes en lo que se refiere a la relación
de las variables independientes con la variable dependiente.
25
CONCLUSIONES

26

Вам также может понравиться