Вы находитесь на странице: 1из 5

Evaluacin del clasificador Nave Bayes como

herramienta de diagnstico en Unidades de


Cuidado Intensivo
Javier A. Chaparro1, Beatriz Giraldo 2, Susana Rodn3

la veracidad de la informacin suministrada por el paciente,


Abstract En el proceso de diagnstico mdico se busca entre otros factores [3].
identificar el estado de salud de un paciente. Sin embargo, la La incertidumbre en el diagnstico en la prctica mdica
complejidad fisiolgica del ser humano genera una amplia gama causa estrs en pacientes y mdicos. Los factores que
de condiciones difciles de establecer por el personal mdico en
contribuyen a esta incluyen la variabilidad biolgica de los
pacientes patolgicos. En las unidades de cuidado intensivo,
donde habitualmente se utiliza la ventilacin asistida, se presenta pacientes, error en la interpretacin de la prueba, diferentes
un alto grado de incertidumbre a la hora de identificar el valores y opiniones de pacientes y mdicos, y la incertidumbre
momento adecuado de retirar el ventilador mecnico. Teniendo en torno a la toma de decisiones. A pesar de que la
en cuenta esta problemtica, presentamos el diseo y evaluacin incertidumbre en la prctica no puede ser completamente
de una herramienta basada en inferencia bayesiana que brinda eliminada, numerosas estrategias que pueden adoptarse para
informacin al mdico sobre la viabilidad de tener una
reducirla y aumentar la confianza de los pacientes. Estas
extubacin exitosa. Para su diseo y validacin se utiliz una base
de datos con seales de flujo respiratorio compuesta por 98 incluyen la aplicacin de la mejor informacin disponible
pacientes exitosamente extubados, y 38 que fracasaron. Las basada en la evidencia, junto con la observancia de las
seales fueron caracterizadas inicialmente con un grupo de series prcticas clnicas bsicas, incluyendo la historia minuciosa,
temporales, y posteriormente, el patrn respiratorio en los dos tomando con exclusin de diagnsticos preocupantes, y la
grupos de estudio fue analizado con tcnicas estadsticas y de participacin en la toma de decisiones compartida [4].
modelado autorregresivo. De este ltimo proceso de derivo un
La inferencia bayesiana, basada en la aplicacin sistmica
grupo de variables con las cuales se dise un clasificador tipo
Naive Bayes. Los resultados fueron medidos en funcin de la del teorema de Bayes, permite desarrollar sistemas apoyo al
exactidud, sensibilidad y especificidad del clasificador, logando diagnstico clnico que brindan informacin cuantitativa al
un 78% en la primera medida y un 75% y 74% en las dos personal mdico y mitigan la incertidumbre en este proceso.
segundas. Actualmente, la teora bayesiana est demostrando ser de gran
utilidad en ciertas estimaciones basadas en el conocimiento
Index Terms flujo respiratorio, diagnstico clnico, subjetivo a priori, adems, el hecho de permitir hacer una
extubacin de pacientes, clasificador bayesiano.
revisin de esas estimaciones en funcin de la evidencia
emprica, est abriendo nuevas formas de hacer conocimiento.
I. INTRODUCCIN Una aplicacin de esto son los clasificadores bayesianos que
son frecuentemente usados en medicina [5].
E L diagnstico mdico es el proceso de identificar las
enfermedades o condiciones que tiene el paciente, y
descartar otras que no tiene, mediante evaluacin de los
En este trabajo se presenta el diseo y evaluacin de un
clasificador bayesiano, tipo Naive. El propsito de este
clasificador es analizar y clasificar la informacin de seales
signos, sntomas, y resultados de varias pruebas diagnsticas respiratorias de pacientes ingresados en Unidades de Cuidado
[1]. La precisin de estas pruebas es la capacidad de Intensivo (UCI), y estimar la viabilidad de una extubacin
discriminar entre las diferentes alternativas de estados de salud exitosa. La problemtica que se aborda es el alto riesgo para la
[2]. Una buena calidad de la prueba, medida en trminos de salud del paciente que se presenta a la hora de iniciar la
especificidad (probabilidad que un sujeto sano tenga un extubacin; se ha reportado que hasta un 25% de los pacientes
resultado negativo) y sensibilidad (probabilidad que un sujeto requieren reintubacin y por lo tanto un aumento en el
enfermo tenga un resultado positivo), permite reducir la probabilidad de muerte [6][7][8]. Para llegar a este diseo se
incertidumbre que se origina, no solamente por el resultado de utiliz una base de datos formada por seales de flujo
la prueba, sino tambin por experiencia del personal mdico y respiratorio de 94 pacientes satisfactoriamente extubados y 38
que no.
Articulo recibido el 4 de enero de 2013. Esta investigacin fue financiada
por la Escuela Colombiana de Ingeniera Julio Garavito, Bogota, Colombia. Las seales de flujo respiratorio fueron caracterizadas con
Javier A. Chaparro, es profesor de la Decanatura de Ingeneira Electrnica un grupo de series temporales, posteriormente estas series
de la Escuela Colombiana de Ingenieria Julio Garavito. Bogota, Colombia. fueron analizadas con mtodos estadsticos y de modelado
(email: javier.chaparro@escuelaing.edu.co).
Beatriz Giraldo esta adscrita a la Escuela Universitaria de Ingeniera
autorregresivo AR y ARMA. Dicho anlisis permiti
Tcnica Industrial de Barcelona (EUETIB), Universidad Politcnica de identificar un grupo de variables utilizadas para disear el
Cataluya, Barcelona, Espaa (email: beatriz.giraldo@upc.edu). clasificador tipo Naive Bayes. El resultado mostro un
Susana Rondon es profesora del Departamento de Matemticas de la
Escuela Colombiana de Ingeniera Julio Garavito, Bogot, Colombia (email:
clasificador con una exactitud del 78%, una sensibilidad y
susana.rondon@escuelaing.edu.co) especificidad 75% y 74% respectivamente, con el hecho
.
particular de utilizar nicamente la informacin relacionada el criterio de Akaike [10], a1,,ap y b1,,bq son los
con el tiempo de espiracin. coeficientes reales del proceso [9]. En este trabajo se utiliz
los rdenes p y q, adems del error final de prediccin, para
II. MATERIALES Y MTODOS caracterizar las series temporales.
A. Pacientes C. Inferencia bayesiana
El estudio se realiz con la base de datos denominada Los mtodos de clasificacin bayesiana se basan
WEANDB, formada por seales respiratorias de pacientes principalmente en el Teorema de Bayes, a continuacin se
conectados al ventilador mecnico mediante un tubo expone este teorema y el clasificador de nave bayes.
endotraqueal. A partir del resultado del test de tubo en T, los
pacientes fueron clasificados en dos grupos: grupo xito con Teorema de Bayes. Este se refiere al clculo de la
94 pacientes que superaron satisfactoriamente la prueba y probabilidad condicional del evento A dado que ha ocurrido
recuperaron la respiracin espontnea, y grupo fracaso, con 38 el evento B, su forma general es: Si A1, A2,,An son eventos
pacientes que no superaron el test y fueron reconectados al exhaustivos y exclusivos tales que P(Ai) 0, i = 1,2 ,..., n,
ventilador. Estos pacientes fueron registrados en los sea B un evento cualquiera del que se conocen las
Departamentos de Cuidados Intensivos del Hospital de la probabilidades condicionales P(B|Ai), la probabilidad P(Ai|B)
Santa Creu i Sant Pau, Barcelona,y del Hospital de Getafe, viene dada por la expresin (3) [11].
Espaa, de acuerdo con los protocolos aprobados por sus
comits ticos. p( Ai , B) p( Ai) p( B | Ai) p( Ai) p( B | Ai)
Con esta base de datos se elaboraron las siguientes series p( Ai | B) (3)
p ( B) p ( B) n P ( B | A ) P( A )
k k
temporales: tiempo de inspiracin (TI), tiempo de espiracin k 1
(TE), duracin del ciclo respiratorio (T Tot), volumen tidal (VT),
fraccin inspiratoria (TI/TTot), flujo inspirado medio (VT/TI), y Clasificador Naive Bayes. Los clasificadores bayesianos
el ndice de respiracin superficial (f/VT), siendo f la son modelos particulares de las redes Bayesianas que se
frecuencia respiratoria. Una descripcin ms detallada de estas aplican en la tarea de clasificacin supervisada con datos
series se encuentra en [8]. discretos. Se han propuesto diferentes tipos dependiendo de
las relaciones de dependencia de las variables contempladas
entre variables predictoras, entre ellos se tienen: nave bayes,
B. Caracterizacin del patrn respiratorio nave bayes selectivo, semi nave Bayes, k-dependiente, y
A continuacin se exponen los fundamentos de las tcnicas nave bayes aumentado a rbol (TAN) [12].
de modelado utilizadas para analizar las series temporales en
este trabajo: El clasificador de nave bayes es el modelo de clasificacin
construido asumiendo que todas las variables predictoras
Modelo Autorregresivo (AR). Este modelo de la seal (variables de los sntomas) son independientes dada la variable
permite establecer la muestra x(n) en funcin del historial de de clase C (variable a diagnosticar). La bsqueda del
la misma ms un componente de error e(n) de la forma diagnstico ms probable a posteriori, c*, una vez conocidos
descrita en (1). los sntomas de un paciente X=(X1,,Xn) puede platearse
como la bsqueda del estado de la variable C con la mayor
xn axn 1 a xn p en (1) probabilidad a posteriori como se muestra en (4).
1 p
c* arg max p(C c | X 1,...,X n) (4)
donde p es el orden del modelo, a1,,ap son sus coeficientes c
reales, y e(n) es un proceso aleatorio gausiano con media cero
y varianza 2. Se asume que la secuencia x(n) es de media y Este clculo puede hacerse con el Teorema de Bayes de la
varianza ergdica. En este trabajo se utiliz el orden del forma que aparece en (5).
modelo, el primer coeficiente y el error final de prediccin del
mismo (FPE) para caracterizar las series temporales. Ms
p(C c) p( X 1,...,X n | C c)
informacin sobre este modelo se puede obtener en [9]. p(C c | X 1,...,X n) (5)
p( X 1,...,X n)
Modelo Autorregresivo de Promedio Mvil (ARMA). El
modelo AR con un componente mvil se convierte en un En la prctica el denominador es constante, por este motivo
modelo ARMA que se pueden describir de acuerdo con la se puede despreciar y as estudiar el numerador como una
ecuacin (2). distribucin de la forma descrita en (6).

xn a1x n 1 apx n p p(C c | X 1,...,X n) p(C c) p( X 1,...,X n | C c) (6)


(2)
en b1e n 1 bq e n q

siendo p y q son los rdenes del proceso estimado mediante El factor p(X1,,Xn|C=c) se puede simplificar utilizando la
regla de la cadena (7). identific un grupo que permiti obtener la mejor exactitud
sensibilidad y especificidad:
p( X 1 | X 2 ,...,X n , C c) p( X 2 | X 3 ,...,X n , C c) p( X n | C c) (7)
X1 = Promedio de la serie TE
Si las variables Xi son independientes para todo i j, se X2 = Rango intercuartil serie TE
puede llegar a (8). X3 = Orden del modelo AR serie TE
X4 = Primer coeficiente del modelo AR serie TE
p( X i | C c, X j ) p( X i | C c) (8) X5 = Error final de prediccin modelo AR serie TE
X6 = Error final de prediccin modelo ARMA serie TE
Por lo tanto, la probabilidad compuesta p(C=c|X1,,Xn)
Variable de la clase de salida (C). El clasificador debe
puede expresarse finalmente como aparece en (9).
predecir, a partir del grupo de variables Xi, un xito o un
fracaso en la extubacin: es decir, C={xito, fracaso}.
p(C c) p ( X 1 | C c) p ( X 2 | C c),..., p( X n | C c)
n (9) Diseo del clasificador nave bayes. Las funciones de
p(C c) p( X i | C c)
i 1 densidad de probabilidad de P(Xi|C=c), para i=1,,6 y
C={xito, fracaso}, fueron ajustadas a variables aleatorias
La expresin p(Xi|C=c) denota la funcin densidad de la normales con media y varianza . Las caractersticas de
variable Xi condicionada a que el valor del diagnstico sea c. cada una de estas funciones se presentan en la Tabla I.
Esta funcin puede ser ajustada a una normal, gamma,
TABLA I
lognormal ente otras. Lo ms acostumbrado es utilizar una FUNCIONES DE PROBABILIDAD P(XI|C=C)
variable aleatoria normal para modelar el comportamiento de P(Xi|C=xito), P(Xi|C=fracaso)
la variable Xi para cada valor de C. De esta forma finalmente Xi
el clasificador se reduce a la siguiente expresin [13]: X1 1.698 0.527 1.260 0.355
X2 0.380 0.236 0.264 0.145
X3 40.085 38.531 23.947 39.634
n
c* arg max p(C c) p( X i | C c) X4 0.360 0.162 0.632 0.289
(10)
c X5 1.016 7.016 0.276 0.491
i 1
X6 0.994 6.738 0.2122 0.368

Para efectuar el entrenamiento y la validacin se utiliz la


A continuacin se presentan, a modo de ejemplo, las
tcnica de validacin cruzada. La calidad del clasificador
grficas de las funciones de distribuciones para X1 (Figura 1) y
bayesiano se evalu con el grupo de entrenamiento en funcin
X2 (Figura 2).
de tres medidas: la exactitud (Acc) (11), la sensibilidad (Sn)
(12) y la especificidad (Sp) (13). Estas medidas se construyen
a partirde los siguientes resultados de clasificacin: Vp
verdaderos positivos, Fp falsos positivos, Vn verdaderos
negativos, y Fn falsos negativos [14].
Probabilidad

Vp Vn
Acc (11)
Vp Fp Vn Fn
Vp
Sn (12)
Vp Fn
Vn
Sp (13)
Vn Vp

III. RESULTADOS
El objetivo del clasificador es establecer, si dadas las
condiciones de un grupo de variables predictoras en un Fig. 1. Funcin de distribucin de P(X1|C=xito)
instante determinado, es posible tener un xito o un fracaso en Valor promedio del tiempo de
el proceso de retirada del ventilador mecnico de los pacientes
en UCI. De acuerdo a esto, se definieron las siguientes
variables:
Variables predictoras (X). Despus de evaluar el
desempeo de las variables obtenidas de los modelos AR y
ARMA, en el diseo de clasificadores tipo Naive Bayes, se
El anlisis de las series temporales, con tcnicas estadsticas
y de modelado autorregresivo, permiti obtener un grupo de
variables para analizar los grupos de xito y fracaso en la
extubacin. Desde el punto de vista estadstico, se obtuvieron
Probabilidad

los valores promedio y el rango intercuartil. Para el modelado


autorregresivo se estableci el orden, el primer coeficiente y el
error final de prediccin de cada modelo. Se estimaron siete
variables por cada serie temporal, para un total de cuarenta y
nueve variables que fueron reducidas a seis (X1,,X6),
mediante la identificacin de aquellas que mostraron las
mejores diferencias estadsticas entre los grupos de xito y
fracaso.
Las funciones de probabilidad para P(Xi| C=xito) y P(Xi|
Fig. 2. Funcin de distribucin de P(X2|C=xito) C=fracaso), para i=1,,6, fueron estimadas aproximndolas a
Rango intercuartil del tiempo de espiracin
una distribucin normal. Durante el trabajo se evaluaron el
ajuste a distribuciones de probabilidad tipo Gamma,
Los valores de P(C=xito) y P(C=fracaso) son de 94/132 = Lognormal y Weibull sin obtener mejores resultados.
0.71 y 32/132= 0.29 respectivamente. Teniendo completos los Los modelos autorregresivos puros (AR) y de media mvil
elementos de la ecuacin (10), que corresponden al (ARMA) permitieron analizar las series temporales que
clasificador de nave bayes, se procede a su validacin. Los caracterizaron los grupos de pacientes de xito y fracaso en el
resultados mostraron una exactitud (Acc) del 78%, una proceso de retirada del ventilador mecnico. Esta
sensibilidad (sn) de 75% y una especificidad (sp) de 74%. A informacin, complementada con estadsticos de tipo
continuacin se hace la prueba del clasificador con los datos promedio y rango intercuartil, facilit la elaboracin de un
de la Tabla II para verificar su funcionamiento. grupo de variables utilizadas en el diseo del clasificador.
El clasificador nave bayes presento una exactitud del 78%,
TABLA II una sensibilidad de 75% y una especificidad de 74%, estos
EJEMPLO DE APLICACIN DEL CLASIFICADOR NAVE BAYES resultados son aceptables pero se pueden evaluar los otros
Variable
Valor de Xi P(Xi|c=xito) P(Xi|c=fracaso)
tipos de clasificadores bayesianos buscando mejorar estos
(Xi) resultados. Tambin se pudo demostrar, al final de este
X1 2 0.457 0.037 trabajo, la sencillez de disear e implementar un clasificador
X2 0.5 1.06 0.214
X3 50 0.007 0.002 nave bayes para aplicaciones biomdicas.
X4 0.5 1.212 0.357
X5 0.1 0.034 0.001
X6 0.1 0.035 0.001
V. REFERENCIAS
[1] Xiao-Hua Zhou, Nancy A. Obuchowski, Donna K. McClish. Statistical
Segn la ecuacin (10), la probabilidad que C=xito, es de Methods in Diagnostic Medicine. Wiley, 2011
[2] Zweing, M. H., Campbell, Reciever-Operating Characteristic Plots: a
0.71* 0.457 *1.06 * 0.007 *1.212 * 0.034 * 0.035 fundamental evaluation tool in clinical medicine. 1993, Clinical
(14) Chemistry, pp. 1272-1276.
3.472 *10 6 [3] Bermejo Fraile B. Epidemiologa clnica aplicada a la toma de
decisiones en medicina. Departamento de Salud. Gobierno de Navarra;
2001
Y el resultado para el caso que C=fracaso es de: [4] Ghosh A.K. Understanding Medical Uncertainty: A Primer for
Physicians. Septiembre 2004, Journal of the Association of Physicians
0.29 * 0.37 * 0.214 * 0.002 * 0.357 * 0.001* 0.001 of India, Vol. 52.
(15) [5] Silva L., Muoz A. Debate sobre mtodos frecuentistas vs bayesianos.
1.634 * 10 6 Santiago de Compostela : s.n., 2000. XVII Reunin Cientfica SEE. pp.
482-494.
[6] M.J. Tobin, Advances in mechanical ventilator", N. Engl. J. Med.,
De acuerdo a estos resultados, la clasificacin del paciente Vol. 344, N. 26, pp.1986-1996, 2001.
segn los valores utilizados en la Tabla II, ser de xito en al [7] Bruce, E. Bruce, Measures of Respiratory Pattern Variability,
terminar el proceso de extubacin. Bioengineering Approaches to Pulmonary Physiology and Medicine, pp.
149-159. 1996.
[8] Chaparro, Javier y Giraldo, Beatriz, Anlisis y clasificacin del patrn
IV. CONCLUSIONES respiratorio de pacientes en proceso de retirada del ventilador
mecnico,Revista de Ingeniera Biomdica, Vol. 10, pp. 42-48, 2010.
La etapa de caracterizacin de las seales de flujo [9] Box G., Jenkins G., Reinsel G. Time Series Analysis, Forescasting and
respiratorio permiti tener un grupo de series temporales Control. s.l. : Prentice Hall International Inc., 1994.
utilizado en la fase posterior de diseo del clasificador nave [10] Daniel Pea y Gonzalo Arniz, Criterios de selccin de modelos
ARIMA, Trabajos de Estadstica y de Investigacin Operativa, Vol. 32,
bayes. A pesar de contar con un grupo de sietes series, Num 1.pp 70 93, 1981.
nicamente las variables correspondiente a la serie tiempo de [11] Fernndez, E Anlisis de clasificadores bayesianos. Trabajo Final de
espiracin fueron utilizadas en el clasificador. Especialidad en Ingeniera de Sistemas Expertos. Escuela de Postgrado.
Instituto Tecnolgico de Buenos Aires. 2004.
[12] Vega, D. A., Clasificadores Bayesianos en la Seleccin Embrionaria en (UNAL) y Maestra en Tecnologa Educativa del Instituto tecnolgico de
Tratamientos de Reproduccin. San Sebastian, Espaa: Universidad del Monterrey Mxico
Pas Vasco. 2008. Email: susana.rondon@escuelaing.edu.co
[13] Barrientos R., Cruz N., Acosta H., et al, Evaluacin del Potencial de AK.45 No.205-59 (Autopista Norte)
Redes Bayesianas en la Clasificacin de Datos Mdicos, Revista
Mdica de la Universidad de Veraxruzana. Vol. 1 Num. 8. 2008.
[14] Chaparro J., Giraldo B., Performance of Respiratory Pattern in
Classifiers for Predict Weaning Process, Memorias 34th Conferencia
Annual de la Sociedad EMB-IEEE. San Diego California. 2012.

Javier A. Chaparro Ph.D. Profesor Asociado de la Escuela Colombiana de


Ingeniera Julio Garavito en el Decanatura de Ingeniera Electrnica.
Ingeniero Electrnico y Especialista en Automatizacin Industrial de la
Universidad Pedaggica y Tecnolgica de Colombia UPTC, Magister en
Ingeniera Electrnica de la Universidad de los Andes y Doctor en Ingeniera
Biomdica de la Universidad Politcnica de Catalunya - Espaa. Ha sido
profesor de la Universidad de la Sabana, Nacional y Distrital. Ha desarrollado
diversas investigaciones en el rea de procesamiento de seales biomdicas
relacionadas principalmente con el sistema respiratorio de pacientes en
Cuidado Intensivo.
Email: javier.chaparro@escuelaing,edu.co
AK.45 No.205-59 (Autopista Norte)

Dr. Beatriz F. Giraldo, Profesora Agregadade la Universidad Politcnica de


Catalua (UPC), Departamento de Ingeniera de Sistemas, Automtica e
Informtica Industrial (ESAII), Barcelona, Espaa. Ingeniero Elctrico,
Universidad Tecnolgica de Pereira (UTP), Risaralda, Colombia (1983),
Postgrado en Ingeniera Biomdica, UPC (1989), Mster en Ingeniera
Biomdica, UPC (1990), Doctora en Ingeniera Biomdica por la UPC (1996).
Actualmente es miembro del grupo de investigacin de procesado de seales
biomdicas e interpretacin, del Instituto de Bioingeniera de Catalua (IBEC)
y del Centro de Investigacin Biomdica en Red de Bioingeniera,
Biomateriales y Nanomedicina (CIBER-BBN). Desde 2006 hasta 2011 fue
Directora del programa de Bioingeniera de la Fundacin Politcnica de
Catalua. Sus principales reas de investigacin son el procesado y modelado
de seales biomdicas y anlisis estadstico, aplicado a seales cardacas y
respiratorias, procesado de seal multimodal en interaccin
cardiorrespiratoria, mtodos para el anlisis de la insuficiencia cardaca, y del
destete de la ventilacin mecnica.

Susana Rondn. Profesor Asistente de la Escuela Colombiana de Ingeniera


Julio Garavito en el Departamento de Matemticas. Licenciada en
matemticas y fsica Universidad del Tolima. Especialista en estadstica

Вам также может понравиться