Anlisis probabilstico que tiene un estudiante para aprobar un mdulo
Johana Carpio Elivar Largo Edgar Tuza
UNL CIS-loja UNL CIS-loja UNL CIS-loja Aliation En el presente artculo vamos a obtener las probabilidades que un estudiante tiene para aprobar un mdulo en funcin de parmetros como la asistencia y materias que cursa, para ello utilizaremos las redes bayesianas, el programa Elvira que nos permitir modelar el problema y por ltimo presentaremos algunos de los datos principales de la red utilizando java. Palabras Clave: Redes bayesianas, Sistemas Expertos, Teorema de Bayes, Probabilidad, Inferencia, Aprendizaje Redes Bayesianas Introduccin Desarrolladas a nales de los 70, se convirtieron durante los 90 en un esquema general de representacin de la incer- tidumbre. Codica incertidumbre asociada a cada variable por medio de probabilidades y gracias al teorema de Bayes, esta incertidumbre es susceptible de ser modicada con base en observaciones (o evidencias) sobre el modelo(Doldan, 2007). Las redes bayesianas (tambin conocidas como redes causales probabilsticas, redes causales, sistemas expertos bayesianos, redes de creencia, sistemas expertos probabilsti- cas o diagramas de inuencia) son herramientas estadsticas que representan un conjunto de incertidumbres asociadas sobre la base de las relaciones de independencia condicional que se establecen entre ellas.(Jimenez, 2003) El obtener una red, bayesiana a partir de datos, es un proceso de aprendizaje que se divide en dos etapas: el aprendizaje estructural y el aprendizaje paramtrico. Denicin. Una Red Bayensiana es un grafo dirigido en el que cada nodo contiene informacin probabilstica. La topologa o estructura de la red nos da informacin sobre las dependencias probabilsticas entre las variables pero tambin sobre las independencias condicionales de una variable (o conjunto de variables) dada otra u otras vari- ables, dichas independencias, simplican la representacin del conocimiento (menos parmetros) y el razonamiento (propagacin de las probabilidades)(Fernndez, n.d.). Tambin son una representacin grca de dependencias para razonamiento probabilstico en sistemas expertos, en la cual los nodos y arcos representan: Nodo: Variable proposicional. Arcos: Dependencia probabilstica. . Se componen ademas de dos partes: La parte cualitativa, es una estructura grca(grafo), que describe las posibles entidades o tambien llamadas variables y la dependencia entre estas. Figure 1. Estructura Grca Cualitativa La parte cuantitativa que esta compuesta por probabil- idades condicioneadas que representan la incertidum- bre del problema, es decir las creencias de las rela- ciones causa efecto entre los nodos.(Rum, 2003) Figure 2. Estructura Grca Cuantitativa Carpio Johana-Largo Elivar-Tuza Edgar Tutor: Ing. Henry Paz Probabilidad incondicional Es la probabilidad de que una variable aleatoria pueda o no ocurrir se conoce como probabilidad incondicional o a priori p(A): probabilidad incondicional o a priori Probabilidad condicional Es la probabilidad de que una variable aleatoria pueda o no ocurrir, dadas ciertas eviden- cias, se conoce como probabilidad condicional; p(A|E): probabilidad condicional, probabilidad de que se d A dado que ha ocurrido E Tipos de redes bayesianas. Las redes bayesianas se pueden clasicar segn en funcin del tipo de variables uti- lizadas. Redes Bayesianas Continuas: tienen un nmero in- nito de posibles valores. La mayora de las variables reales son de carcter continuo como por ejemplo la variacin de la temperatura. Redes Bayesianas Dinmicas: consienten en la exposi- cin de procesos que contienen una variable aleatoria en cada intervalo de tiempo. El estado de las variables se representa en un lapso de tiempo para poder representar los procesos dinmicos conocidos dentro de la red bayesiana. Dimensiones Dentro de las redes Bayesianas podemos identicar dos dimensiones, las cuales son: Dimensin Cualitativa. En esta dimensin tenemos un grafo acclico dirigido en el que cada nodo corresponde a un atributo (variable), y arcos dirigidos implicando que toda variable es condicionalmente independiente de todos sus no descendientes en la red siempre que se conozcan los valores de sus inmediatos predecesores. Dimensin Cuantitativa. En esta dimensin cada nodo tiene asociada la distribucin de probabilidad de esa variable teniendo en cuenta sus padres en el grafo. Existen tres ele- mentos que caracterizan la dimensin cuantitativa de una red bayesiana: El concepto de probabilidad como un grado de creen- cia subjetiva relativa a la ocurrencia de un evento. Un conjunto de funciones de probabilidad condi- cionada que denen a cada variable en el modelo El teorema de Bayes como herramienta bsica para ac- tualizar probabilidades con base en experiencia. Teorema de Bayes. En la teora de la probabilidad el teorema de Bayes es un resultado enunciado por Thomas Bayes en 1763, que expresa la probabilidad condicional de un evento aleatorio A dado B en trminos de la distribucin de probabilidad condicional del evento B dado A y la distribucin de probabilidad marginal de slo A. Frmula de Bayes Frmula de Bayes Construccin de una Red bayesiana El primer paso es denir el dominio del problema, es decir donde se especica el propsito de la R.B, luego se procede a identicar las variables o nodos importantes para el dominio del problema, lo siguienete es la interrelacin entre nodos o variables en forma grca, el modelado resulta ser vlidado por los expertos del tema. Los ltimos pasos consisten en: 1. Incorporar la opinin de los expertos. 2. Crear escenarios factibles con la red. 3. Puesta a punto de las estimaciones en el tiempo. Aprendizaje de redes bayesianas. El aprendizaje es una de las caractersticas que denen a los sistemas basados en inteligencia articia l porque siendo estrictos se puede armar que sin aprendizaje no hay inteligencia; es dif- cil denir el trmino aprendizaje, pero la mayora de las autoridades en el campo coinciden en que es una de las caractersticas de los sistemas adaptativos que son capaces de mejorar su comportamiento en funcin de su experi- encia pasada, por ejemplo al resolver problemas similares (FELGAER, 2005). El aprendizaje en la redes bayesianas consiste en denir la red probabilstica a partir de datos almacenados en bases de datos. Este tipo de aprendizaje ofrece la posibilidad de denir la estructura grca de la red a partir de los datos observados o de la base de datos y de denir las relaciones entre los nodos basndose tambin en dichos casos; dentro del aprendizaje de las Redes bayesianas se han denido dos fases: Tpicamente, este problema se divide en dos partes: Aprendizaje estructural : que consiste en obtener la estructura de la red, estos algoritmos son capaces de aprender enlaces. Existen 2 tipos de aprendizaje de estructural: Carpio Johana-Largo Elivar-Tuza Edgar Tutor: Ing. Henry Paz Basados en tests de independencia (algoritmos PC,NPC...). Puntuacin y bsqueda (Score Search). Aprendizaje parmetrico : conocida la estructura del grafo se obtiene las probabilidad correspondiente a cada nodo. Existen distintos algoritmos de apren- dizaje, entre ellos: EM (Expansin-Maximizacin): No necesita datos completos para el aprendizaje. ML (Maximum Likelihood): Necesita de datos completos para poder aprender. Inferencia Bayesiana La incertidumbre es natural en el proceso de razonamiento donde se pueden establecer reglas para inferir de manera deductiva una proposicin determinada que puede ser ver- dadera o falsa, segn sea el lmite de esta estimacin. Dentro de los mtodos de razonamiento se encuentran los Modelos Bayesianos, que simulan diferentes condiciones de incertidumbre cuando no se conoce si es verdadera o falsa la hiptesis enunciada en un rango de variacin. Cuando se utilizan evidencias y observaciones para es- tablecer que una suposicin sea cierta, es lo que se denomina como Inferencia Bayesiana. La inferencia bayesiana observa la evidencia y calcula un valor estimado segn el grado de creencia planteado en la hiptesis. La ventaja fundamental del uso de la inferencia bayesiana radica en la utilidad que se le da para la toma de deci- siones, actualmente su uso es frecuente por que se ob- tienen resultados ms acertados en el contexto de parmetros desconocidos.(Zellner, 1987) Entrenamiento de una Red Bayesiana De acuerdo a lo antedicho, las BN pueden utilizarse para calcular nuevas creencias o Posterior Belief en base a in- formacin que progresivamente se agrega a los nodos de la red (evidencias). Una evidencia es un valor determinado que toma un Nodo en cierto momento. La evidencia puede tener un valor cert- ero, por ejemplo: Tiene alucinaciones=True. O bien un valor no certero, en donde comienza a juega lo que en BN se denomina: porcentaje de creencia: Hay un 30% de probabilidades que haya tomado alcohol recientemente. Es precisamente en este punto en donde pueden utilizarse los conocimientos previos epidemiolgicos en todos aquellos nodos en donde no se disponga de informacin suciente como para considerarlos evidencia. Esto producira una especie de generalizacin de los elementos no certeros de acuerdo a una preponderancia epidemiolgica independiente de la existencia de una afeccin. El manejo de estos agujeros de incerteza en base a un cuadro de probabilidades ajustado localmente es uno de los elementos que hace de la BN un instrumento tan poderoso. Ya que an en donde no hay informacin, el conocimiento de la disciplina puede permitir otorgar un cierto valor relativo a ese factor que ni siquiera es conocido para el caso . En una BN para diagnstico, es imprescindible contar con este conocimiento previo a la recopilacin de toda evidencia. Este tipo de conocimiento previo se denomina Prior Belief o Creencia previa y suele generarse a partir de estudios epidemiolgicos de campo o bien operacionalizando factores tericos relevantes extrados de la bibliografa existente. Por ejemplo: De acuerdo a estudios previos, la probabilidad de que un paciente que viene a consultar sea un paranoico es del 2%; En esta comunidad especca la probabilidad de que un sujeto consuma marihuana es del 30 % Amedida de que a esta informacin de base se van agregando evidencias del caso concreto, las probabilidades relativas cor- respondientes a los diferentes cuadros se va modicando. Este tipo de lazos causales se establece a partir del conocimiento previo del especialista para operacionalizar las evidencias a rastrear, su relacin causal con el cuadro, y el porcentaje de condicionamiento de cada nodo sobre el sigu- iente se realiza en direccin a los arcos establecidos. Un modo de utilizacin de estas redes que erizara a ms de un terico es su capacidad de, mediante ciertos algoritmos particulares, aprender de datos aparentemente sin ningn formato y sin realizar ninguna asuncin previa (Prior Belief). Esta es una poderosa caracterstica digna de una pelcula de ciencia ccin, en donde sin otorgar probabilidades diferen- ciales previas a cada uno de los nodos, y alimentando la red con una suciente cantidad de datos de caso, con el nico formato de la red causal previa, se han denido algoritmos que son capaces de aislar y detectar tendencias all en donde en una primera aproximacin a los mismos solo haba caos e indeterminacin. Pero este tema ser objeto de un trabajo posterior. Aplicaciones Las redes bayesianas son un tipo de modelos de minera de datos que pueden ser utilizados en cualquiera de las sigu- ientes actividades de negocio: Prevencin del fraude. Prevencin del abandono de clientes. Marketing personalizado. Mantenimiento preventivo. Scoring de clientes. Carpio Johana-Largo Elivar-Tuza Edgar Tutor: Ing. Henry Paz Aplicaciones en empresas(Reina, n.d.) Microsoft: Answer Wizard (Oce), diagnostico de problemas de impresora. Intel: Diagnostico de fallos de procesadores HP: Diagnostico de problemas de impresora Nasa: Ayuda a la decisin de misiones espaciales El uso de las redes bayesianas permiten aprender sobre rela- ciones de dependencia y combinar conocimiento con nuevos datos. Programa Elvira Figure 3. Pantalla principal de Elvira Este programa esta destinado a la edicin y evalu- acin de modelos grcos probabilistas, concretamente redes bayesianas y diagramas de inferencia. Elvira cuenta con: Formato propio para la codicacin de los modelos. Un lector-intrprete para los modelos codicados. Una interfaz grca para la construccin de redes, con opciones especcas para modelos cannicos (puertas OR, AND, MAX, etc.). Algoritmos exactos y aproximados (estocsticos) de razonamiento tanto para variables discretas como con- tinuas. Metodos de explicacion del razonamiento. Algoritmos de toma de decisiones. aprendizaje de modelos a partir de bases de datos. Fusion de redes, etc Elvira est escrito y compilado en Java, lo cual permite que pueda funcionar en diferentes plataformas y sistemas operativos (linux, MS-DOS/Windows, Solaris, etc.). Obtencin de redes bayesianas a travs de Elvira Primero se debe de contar con el programa Elvira al cual se lo puede descargar a travs de: http://leo.ugr.es/ elvira. Ademas se debe de contar con La Mquina Vir- tual de Java,que ser la encargada de interpretar el pro- grama; dentro de la carpeta Elvira aparecer un archivo Elvira.jar el cual se ejecutar con solo hacerle doble clic . Se debe recordar que Elvira permite el ingreso de las redes Bayesianas de dos formas: 1. Ingreso manual, donde el usuario dibuja la red bayesiana en la pantalla y carga los valores de prob- abilidad asociados a cada nodo. 2. Mediante la importacin de archivos de casos. Prctica Como ejemplo tenemos obtener la probabilidad que tiene un estudiante de aprobar un semestre, para el cual se tomo datos como las materias que cursa y lo parmetros que son considerados para la acreditacin de estas. Estructura de la Red Semestre: Este nodo contiene valores SI-NO, este nodo toma valores de los nodos Asistencia y Semestre, los valores que se le ha dado es de 15% por cada nodo del que recibe informacin, si todos las combinaciones devuelven SI obtiene el 1% que sera el total, dismin- uye en 15% por cada combinacin en la cual un nodo este marcado como NO, un valor arriba del 49% quiere decir que el semestre es aprobado, un valor de 0 a 49% es de reprobado.(Ver imagen 4) Figure 4. Relacin Semestre y las materias Asistencia: Este nodo reeja la asistencia contiene valores de ASISTENCIA e INASISTENCIA en los Carpio Johana-Largo Elivar-Tuza Edgar Tutor: Ing. Henry Paz cuales se asigna un porcentaje para el valor ASISTEN- CIA el valor uctua entre 80% y 1% y para la INASIS- TENCIA es de 0% y 79% . IA:Este nodo maneja la aprobacin de la materia, tiene los valores de SI-NO, estos valores se manejan en fun- cin de los valores recibidos de de los nodos: Leccin que equivale a 15%, Examen que equivale a 70% y Trabajos que equivale a 15% sumados todos nos dan un total de 100%, ahora los valores de la relacin es- tn estabelecidos de la siguiente manera, est denido en dos tablas puesto que la materia de Anteproyectos no maneja los mismos parmetros de calicacin,(Ver tabla 1 y 2): Table 1 Valores iniciales para obtener las probabilidades de pasar en una Materia Examen Lecciones Trabajo Alto =70 Alto =15 Alto =15 Medio =35 Medio =7 Medio =7 Bajo =15 Bajo =1 Bajo =1 Table 2 Valores para la Materia de Anteproyectos Avances Exposicin Final Alto =60 Alto =40 Medio =30 Medio =20 Bajo =15 Bajo =10 Por lo tanto y segn los valores vistos en las tablas 1 y 2 el para que el parmetro SI tome un valor ten- dramos que sumar todos los parmetros de cada una de las posibles combinaciones por ejemplo si en una combinacin tendriamos todos los valores en Alto nos dara las suma de: 70+15+15, (ver imagen 5) y poste- riormente ira disminuyendo de acuerdo a su possibles combinaciones en el primer caso nos dara un total de 100% lo mismo haramos para la materia Anteproyec- tos adaptndonos a sus parmetros. Valores Relacin Nodo IA Los nodos padre son Leccin, Examen y Trabajos es- tos nodos tienen valores de alto, medio, bajo y su valor uctan entre 0% y 1%. a diferencia de Anteproyectos que debido a que tiene otros parmetros de calicacin tiene otros padres que son Avances que equivale a 60% y Exposicion que equivale a 40% Figure 5. Relacin Nodo IA Modelo de la Red Figure 6. Estructura de la Red Bayesiana Tablas de Inferencia Figure 7. Estructura Tabla de Inferencia Carpio Johana-Largo Elivar-Tuza Edgar Tutor: Ing. Henry Paz Pantalla de la aplicacin en Netbeans Figure 8. Pantalla Principal de la Aplicacin Obtencin de los Datos de la Red Bayesiana desde Net- beans Figure 9. Cdigo que obtiene los datos de la Red Bayesiana En esta parte del cdigo cargamos el archivo red- examenes.pgmx y obtenemos la informacin de la red junto con sus respectivos nodos, para luego presentarlos en la ven- tana principal de la aplicacin. Pantalla de Salida Figure 10. Descripcin de Nodos Conclusiones Las Redes Bayesianas se basan en utilizar la nocin de independencia para generar una representacin com- pacta y modular de la distribucin probabilstica de las variables. Las redes bayesianas modelan los fenmeno mediante un conjunto de variables y las relaciones de dependen- cia entre estas. La generacin de explicaciones en redes bayesianas genera mayor aceptacin de las mismas. Las redes bayesianas permiten denir modelos y uti- lizarlos tanto para hacer razonamiento de diagnstico , como para hacer razonamiento predictivo. Las redes bayesianas estan basadas en ecientes al- goritmos de propagacin de evidencias que actualizan dinmicamente el modelo de datos actuales. Elvira, un software nuevo para edicin y proce- samiento de redes Bayesianas, contiene facilidades para generar explicaciones estticas y dinmicas. References Doldan, F. (2007). REDES BAYESIANAS Y RIESGO OP- ERACIONAL. (German) [On universidad de a corua]. Re- vista Galega de Economa, 16(nm. extraord). doi: http:// www.usc.es/econo/RGE/Vol16_ex/Castelan/art1c.pdf Carpio Johana-Largo Elivar-Tuza Edgar Tutor: Ing. Henry Paz FELGAER, P. E. (2005). OPTIMIZACIN DE REDES BAYESIANAS BASADO EN TCNICAS DE APRENDIZAJE POR INDUCCIN. doi: http://laboratorios..uba.ar/lsi/felgaer -tesisingenieriainformatica.pdf Fernndez, E. (n.d.). Anlisis de Clasicadores Bayesianos. doi: http://157.92.49.120/materias/7550/clasicadores -bayesianos.pdf Jimenez, J. L. (2003). BayesN: Un Algoritmo para Aprender Re- des Bayesianas Clasicadoras a partir de datos. (German) [On universidad veracruzana]. doi: http://www.dynamics.unam.edu/users/jjimenez/les/ TesisJL.pdf Reina, J. L. R. (n.d.). Introduccin a las Redes Bayesianas. doi: http://www.cs.us.es/cursos/ia2-2005/temas/tema-08.pdf Rum, R. (2003). Modelos de redes bayesianas con variables disc- retas y continuas. Zellner, A. (1987). Introduccin a la inferencia bayesiana en