Вы находитесь на странице: 1из 7

Anlisis probabilstico que tiene un estudiante para aprobar un mdulo

Johana Carpio Elivar Largo Edgar Tuza


UNL CIS-loja UNL CIS-loja UNL CIS-loja
Aliation
En el presente artculo vamos a obtener las probabilidades que un estudiante tiene para aprobar
un mdulo en funcin de parmetros como la asistencia y materias que cursa, para ello
utilizaremos las redes bayesianas, el programa Elvira que nos permitir modelar el problema y
por ltimo presentaremos algunos de los datos principales de la red utilizando java.
Palabras Clave: Redes bayesianas, Sistemas Expertos, Teorema de Bayes, Probabilidad,
Inferencia, Aprendizaje
Redes Bayesianas
Introduccin
Desarrolladas a nales de los 70, se convirtieron durante
los 90 en un esquema general de representacin de la incer-
tidumbre. Codica incertidumbre asociada a cada variable
por medio de probabilidades y gracias al teorema de Bayes,
esta incertidumbre es susceptible de ser modicada con base
en observaciones (o evidencias) sobre el modelo(Doldan,
2007).
Las redes bayesianas (tambin conocidas como redes
causales probabilsticas, redes causales, sistemas expertos
bayesianos, redes de creencia, sistemas expertos probabilsti-
cas o diagramas de inuencia) son herramientas estadsticas
que representan un conjunto de incertidumbres asociadas
sobre la base de las relaciones de independencia condicional
que se establecen entre ellas.(Jimenez, 2003) El obtener una
red, bayesiana a partir de datos, es un proceso de aprendizaje
que se divide en dos etapas: el aprendizaje estructural y el
aprendizaje paramtrico.
Denicin. Una Red Bayensiana es un grafo dirigido en
el que cada nodo contiene informacin probabilstica.
La topologa o estructura de la red nos da informacin
sobre las dependencias probabilsticas entre las variables
pero tambin sobre las independencias condicionales de una
variable (o conjunto de variables) dada otra u otras vari-
ables, dichas independencias, simplican la representacin
del conocimiento (menos parmetros) y el razonamiento
(propagacin de las probabilidades)(Fernndez, n.d.).
Tambin son una representacin grca de dependencias
para razonamiento probabilstico en sistemas expertos, en la
cual los nodos y arcos representan:
Nodo: Variable proposicional.
Arcos: Dependencia probabilstica.
. Se componen ademas de dos partes:
La parte cualitativa, es una estructura grca(grafo),
que describe las posibles entidades o tambien llamadas
variables y la dependencia entre estas.
Figure 1. Estructura Grca Cualitativa
La parte cuantitativa que esta compuesta por probabil-
idades condicioneadas que representan la incertidum-
bre del problema, es decir las creencias de las rela-
ciones causa efecto entre los nodos.(Rum, 2003)
Figure 2. Estructura Grca Cuantitativa
Carpio Johana-Largo Elivar-Tuza Edgar Tutor: Ing. Henry Paz
Probabilidad incondicional Es la probabilidad de que
una variable aleatoria pueda o no ocurrir se conoce como
probabilidad incondicional o a priori
p(A): probabilidad incondicional o a priori
Probabilidad condicional Es la probabilidad de que una
variable aleatoria pueda o no ocurrir, dadas ciertas eviden-
cias, se conoce como probabilidad condicional;
p(A|E): probabilidad condicional, probabilidad
de que se d A dado que ha ocurrido E
Tipos de redes bayesianas. Las redes bayesianas se
pueden clasicar segn en funcin del tipo de variables uti-
lizadas.
Redes Bayesianas Continuas: tienen un nmero in-
nito de posibles valores. La mayora de las variables
reales son de carcter continuo como por ejemplo la
variacin de la temperatura.
Redes Bayesianas Dinmicas: consienten en la exposi-
cin de procesos que contienen una variable aleatoria
en cada intervalo de tiempo.
El estado de las variables se representa en un lapso de
tiempo para poder representar los procesos dinmicos
conocidos dentro de la red bayesiana.
Dimensiones
Dentro de las redes Bayesianas podemos identicar dos
dimensiones, las cuales son:
Dimensin Cualitativa. En esta dimensin tenemos un
grafo acclico dirigido en el que cada nodo corresponde a
un atributo (variable), y arcos dirigidos implicando que toda
variable es condicionalmente independiente de todos sus no
descendientes en la red siempre que se conozcan los valores
de sus inmediatos predecesores.
Dimensin Cuantitativa. En esta dimensin cada nodo
tiene asociada la distribucin de probabilidad de esa variable
teniendo en cuenta sus padres en el grafo. Existen tres ele-
mentos que caracterizan la dimensin cuantitativa de una red
bayesiana:
El concepto de probabilidad como un grado de creen-
cia subjetiva relativa a la ocurrencia de un evento.
Un conjunto de funciones de probabilidad condi-
cionada que denen a cada variable en el modelo
El teorema de Bayes como herramienta bsica para ac-
tualizar probabilidades con base en experiencia.
Teorema de Bayes. En la teora de la probabilidad el
teorema de Bayes es un resultado enunciado por Thomas
Bayes en 1763, que expresa la probabilidad condicional de
un evento aleatorio A dado B en trminos de la distribucin
de probabilidad condicional del evento B dado A y la
distribucin de probabilidad marginal de slo A.
Frmula de Bayes
Frmula de Bayes
Construccin de una Red bayesiana
El primer paso es denir el dominio del problema, es decir
donde se especica el propsito de la R.B, luego se procede a
identicar las variables o nodos importantes para el dominio
del problema, lo siguienete es la interrelacin entre nodos o
variables en forma grca, el modelado resulta ser vlidado
por los expertos del tema.
Los ltimos pasos consisten en:
1. Incorporar la opinin de los expertos.
2. Crear escenarios factibles con la red.
3. Puesta a punto de las estimaciones en el tiempo.
Aprendizaje de redes bayesianas. El aprendizaje es
una de las caractersticas que denen a los sistemas basados
en inteligencia articia l porque siendo estrictos se puede
armar que sin aprendizaje no hay inteligencia; es dif-
cil denir el trmino aprendizaje, pero la mayora de las
autoridades en el campo coinciden en que es una de las
caractersticas de los sistemas adaptativos que son capaces
de mejorar su comportamiento en funcin de su experi-
encia pasada, por ejemplo al resolver problemas similares
(FELGAER, 2005).
El aprendizaje en la redes bayesianas consiste en denir la
red probabilstica a partir de datos almacenados en bases
de datos. Este tipo de aprendizaje ofrece la posibilidad de
denir la estructura grca de la red a partir de los datos
observados o de la base de datos y de denir las relaciones
entre los nodos basndose tambin en dichos casos; dentro
del aprendizaje de las Redes bayesianas se han denido dos
fases:
Tpicamente, este problema se divide en dos partes:
Aprendizaje estructural : que consiste en obtener la
estructura de la red, estos algoritmos son capaces de
aprender enlaces.
Existen 2 tipos de aprendizaje de estructural:
Carpio Johana-Largo Elivar-Tuza Edgar Tutor: Ing. Henry Paz
Basados en tests de independencia (algoritmos
PC,NPC...).
Puntuacin y bsqueda (Score Search).
Aprendizaje parmetrico : conocida la estructura del
grafo se obtiene las probabilidad correspondiente a
cada nodo. Existen distintos algoritmos de apren-
dizaje, entre ellos:
EM (Expansin-Maximizacin): No necesita
datos completos para el aprendizaje.
ML (Maximum Likelihood): Necesita de datos
completos para poder aprender.
Inferencia Bayesiana
La incertidumbre es natural en el proceso de razonamiento
donde se pueden establecer reglas para inferir de manera
deductiva una proposicin determinada que puede ser ver-
dadera o falsa, segn sea el lmite de esta estimacin.
Dentro de los mtodos de razonamiento se encuentran los
Modelos Bayesianos, que simulan diferentes condiciones de
incertidumbre cuando no se conoce si es verdadera o falsa la
hiptesis enunciada en un rango de variacin.
Cuando se utilizan evidencias y observaciones para es-
tablecer que una suposicin sea cierta, es lo que se denomina
como Inferencia Bayesiana.
La inferencia bayesiana observa la evidencia y calcula un
valor estimado segn el grado de creencia planteado en la
hiptesis.
La ventaja fundamental del uso de la inferencia bayesiana
radica en la utilidad que se le da para la toma de deci-
siones, actualmente su uso es frecuente por que se ob-
tienen resultados ms acertados en el contexto de parmetros
desconocidos.(Zellner, 1987)
Entrenamiento de una Red Bayesiana
De acuerdo a lo antedicho, las BN pueden utilizarse para
calcular nuevas creencias o Posterior Belief en base a in-
formacin que progresivamente se agrega a los nodos de la
red (evidencias).
Una evidencia es un valor determinado que toma un Nodo
en cierto momento. La evidencia puede tener un valor cert-
ero, por ejemplo: Tiene alucinaciones=True. O bien un
valor no certero, en donde comienza a juega lo que en BN
se denomina: porcentaje de creencia: Hay un 30% de
probabilidades que haya tomado alcohol recientemente. Es
precisamente en este punto en donde pueden utilizarse los
conocimientos previos epidemiolgicos en todos aquellos
nodos en donde no se disponga de informacin suciente
como para considerarlos evidencia. Esto producira una
especie de generalizacin de los elementos no certeros de
acuerdo a una preponderancia epidemiolgica independiente
de la existencia de una afeccin.
El manejo de estos agujeros de incerteza en base a un
cuadro de probabilidades ajustado localmente es uno de los
elementos que hace de la BN un instrumento tan poderoso.
Ya que an en donde no hay informacin, el conocimiento de
la disciplina puede permitir otorgar un cierto valor relativo a
ese factor que ni siquiera es conocido para el caso .
En una BN para diagnstico, es imprescindible contar con
este conocimiento previo a la recopilacin de toda evidencia.
Este tipo de conocimiento previo se denomina Prior Belief
o Creencia previa y suele generarse a partir de estudios
epidemiolgicos de campo o bien operacionalizando factores
tericos relevantes extrados de la bibliografa existente. Por
ejemplo: De acuerdo a estudios previos, la probabilidad de
que un paciente que viene a consultar sea un paranoico es del
2%; En esta comunidad especca la probabilidad de que
un sujeto consuma marihuana es del 30 %
Amedida de que a esta informacin de base se van agregando
evidencias del caso concreto, las probabilidades relativas cor-
respondientes a los diferentes cuadros se va modicando.
Este tipo de lazos causales se establece a partir del
conocimiento previo del especialista para operacionalizar las
evidencias a rastrear, su relacin causal con el cuadro, y el
porcentaje de condicionamiento de cada nodo sobre el sigu-
iente se realiza en direccin a los arcos establecidos.
Un modo de utilizacin de estas redes que erizara a ms de
un terico es su capacidad de, mediante ciertos algoritmos
particulares, aprender de datos aparentemente sin ningn
formato y sin realizar ninguna asuncin previa (Prior Belief).
Esta es una poderosa caracterstica digna de una pelcula de
ciencia ccin, en donde sin otorgar probabilidades diferen-
ciales previas a cada uno de los nodos, y alimentando la red
con una suciente cantidad de datos de caso, con el nico
formato de la red causal previa, se han denido algoritmos
que son capaces de aislar y detectar tendencias all en donde
en una primera aproximacin a los mismos solo haba caos
e indeterminacin. Pero este tema ser objeto de un trabajo
posterior.
Aplicaciones
Las redes bayesianas son un tipo de modelos de minera
de datos que pueden ser utilizados en cualquiera de las sigu-
ientes actividades de negocio:
Prevencin del fraude.
Prevencin del abandono de clientes.
Marketing personalizado.
Mantenimiento preventivo.
Scoring de clientes.
Carpio Johana-Largo Elivar-Tuza Edgar Tutor: Ing. Henry Paz
Aplicaciones en empresas(Reina, n.d.)
Microsoft: Answer Wizard (Oce), diagnostico de
problemas de impresora.
Intel: Diagnostico de fallos de procesadores
HP: Diagnostico de problemas de impresora
Nasa: Ayuda a la decisin de misiones espaciales
El uso de las redes bayesianas permiten aprender sobre rela-
ciones de dependencia y combinar conocimiento con nuevos
datos.
Programa Elvira
Figure 3. Pantalla principal de Elvira
Este programa esta destinado a la edicin y evalu-
acin de modelos grcos probabilistas, concretamente redes
bayesianas y diagramas de inferencia.
Elvira cuenta con:
Formato propio para la codicacin de los modelos.
Un lector-intrprete para los modelos codicados.
Una interfaz grca para la construccin de redes, con
opciones especcas para modelos cannicos (puertas
OR, AND, MAX, etc.).
Algoritmos exactos y aproximados (estocsticos) de
razonamiento tanto para variables discretas como con-
tinuas.
Metodos de explicacion del razonamiento.
Algoritmos de toma de decisiones.
aprendizaje de modelos a partir de bases de datos.
Fusion de redes, etc
Elvira est escrito y compilado en Java, lo cual permite
que pueda funcionar en diferentes plataformas y sistemas
operativos (linux, MS-DOS/Windows, Solaris, etc.).
Obtencin de redes bayesianas a travs de Elvira
Primero se debe de contar con el programa Elvira al cual
se lo puede descargar a travs de: http://leo.ugr.es/
elvira. Ademas se debe de contar con La Mquina Vir-
tual de Java,que ser la encargada de interpretar el pro-
grama; dentro de la carpeta Elvira aparecer un archivo
Elvira.jar el cual se ejecutar con solo hacerle doble clic .
Se debe recordar que Elvira permite el ingreso de las redes
Bayesianas de dos formas:
1. Ingreso manual, donde el usuario dibuja la red
bayesiana en la pantalla y carga los valores de prob-
abilidad asociados a cada nodo.
2. Mediante la importacin de archivos de casos.
Prctica
Como ejemplo tenemos obtener la probabilidad que tiene
un estudiante de aprobar un semestre, para el cual se tomo
datos como las materias que cursa y lo parmetros que son
considerados para la acreditacin de estas.
Estructura de la Red
Semestre: Este nodo contiene valores SI-NO, este
nodo toma valores de los nodos Asistencia y Semestre,
los valores que se le ha dado es de 15% por cada nodo
del que recibe informacin, si todos las combinaciones
devuelven SI obtiene el 1% que sera el total, dismin-
uye en 15% por cada combinacin en la cual un nodo
este marcado como NO, un valor arriba del 49% quiere
decir que el semestre es aprobado, un valor de 0 a 49%
es de reprobado.(Ver imagen 4)
Figure 4. Relacin Semestre y las materias
Asistencia: Este nodo reeja la asistencia contiene
valores de ASISTENCIA e INASISTENCIA en los
Carpio Johana-Largo Elivar-Tuza Edgar Tutor: Ing. Henry Paz
cuales se asigna un porcentaje para el valor ASISTEN-
CIA el valor uctua entre 80% y 1% y para la INASIS-
TENCIA es de 0% y 79% .
IA:Este nodo maneja la aprobacin de la materia, tiene
los valores de SI-NO, estos valores se manejan en fun-
cin de los valores recibidos de de los nodos: Leccin
que equivale a 15%, Examen que equivale a 70% y
Trabajos que equivale a 15% sumados todos nos dan
un total de 100%, ahora los valores de la relacin es-
tn estabelecidos de la siguiente manera, est denido
en dos tablas puesto que la materia de Anteproyectos
no maneja los mismos parmetros de calicacin,(Ver
tabla 1 y 2):
Table 1
Valores iniciales para obtener las probabilidades de pasar
en una Materia
Examen Lecciones Trabajo
Alto =70 Alto =15 Alto =15
Medio =35 Medio =7 Medio =7
Bajo =15 Bajo =1 Bajo =1
Table 2
Valores para la Materia de Anteproyectos
Avances Exposicin
Final
Alto =60 Alto =40
Medio =30 Medio =20
Bajo =15 Bajo =10
Por lo tanto y segn los valores vistos en las tablas
1 y 2 el para que el parmetro SI tome un valor ten-
dramos que sumar todos los parmetros de cada una
de las posibles combinaciones por ejemplo si en una
combinacin tendriamos todos los valores en Alto nos
dara las suma de: 70+15+15, (ver imagen 5) y poste-
riormente ira disminuyendo de acuerdo a su possibles
combinaciones en el primer caso nos dara un total de
100% lo mismo haramos para la materia Anteproyec-
tos adaptndonos a sus parmetros.
Valores Relacin Nodo IA
Los nodos padre son Leccin, Examen y Trabajos es-
tos nodos tienen valores de alto, medio, bajo y su valor
uctan entre 0% y 1%. a diferencia de Anteproyectos
que debido a que tiene otros parmetros de calicacin
tiene otros padres que son Avances que equivale a 60%
y Exposicion que equivale a 40%
Figure 5. Relacin Nodo IA
Modelo de la Red
Figure 6. Estructura de la Red Bayesiana
Tablas de Inferencia
Figure 7. Estructura Tabla de Inferencia
Carpio Johana-Largo Elivar-Tuza Edgar Tutor: Ing. Henry Paz
Pantalla de la aplicacin en Netbeans
Figure 8. Pantalla Principal de la Aplicacin
Obtencin de los Datos de la Red Bayesiana desde Net-
beans
Figure 9. Cdigo que obtiene los datos de la Red Bayesiana
En esta parte del cdigo cargamos el archivo red-
examenes.pgmx y obtenemos la informacin de la red junto
con sus respectivos nodos, para luego presentarlos en la ven-
tana principal de la aplicacin.
Pantalla de Salida
Figure 10. Descripcin de Nodos
Conclusiones
Las Redes Bayesianas se basan en utilizar la nocin de
independencia para generar una representacin com-
pacta y modular de la distribucin probabilstica de las
variables.
Las redes bayesianas modelan los fenmeno mediante
un conjunto de variables y las relaciones de dependen-
cia entre estas.
La generacin de explicaciones en redes bayesianas
genera mayor aceptacin de las mismas.
Las redes bayesianas permiten denir modelos y uti-
lizarlos tanto para hacer razonamiento de diagnstico ,
como para hacer razonamiento predictivo.
Las redes bayesianas estan basadas en ecientes al-
goritmos de propagacin de evidencias que actualizan
dinmicamente el modelo de datos actuales.
Elvira, un software nuevo para edicin y proce-
samiento de redes Bayesianas, contiene facilidades
para generar explicaciones estticas y dinmicas.
References
Doldan, F. (2007). REDES BAYESIANAS Y RIESGO OP-
ERACIONAL. (German) [On universidad de a corua]. Re-
vista Galega de Economa, 16(nm. extraord). doi: http://
www.usc.es/econo/RGE/Vol16_ex/Castelan/art1c.pdf
Carpio Johana-Largo Elivar-Tuza Edgar Tutor: Ing. Henry Paz
FELGAER, P. E. (2005). OPTIMIZACIN DE REDES
BAYESIANAS BASADO EN TCNICAS DE APRENDIZAJE
POR INDUCCIN.
doi: http://laboratorios..uba.ar/lsi/felgaer
-tesisingenieriainformatica.pdf
Fernndez, E. (n.d.). Anlisis de Clasicadores Bayesianos.
doi: http://157.92.49.120/materias/7550/clasicadores
-bayesianos.pdf
Jimenez, J. L. (2003). BayesN: Un Algoritmo para Aprender Re-
des Bayesianas Clasicadoras a partir de datos. (German) [On
universidad veracruzana].
doi: http://www.dynamics.unam.edu/users/jjimenez/les/
TesisJL.pdf
Reina, J. L. R. (n.d.). Introduccin a las Redes Bayesianas.
doi: http://www.cs.us.es/cursos/ia2-2005/temas/tema-08.pdf
Rum, R. (2003). Modelos de redes bayesianas con variables disc-
retas y continuas.
Zellner, A. (1987). Introduccin a la inferencia bayesiana en

Вам также может понравиться