Вы находитесь на странице: 1из 8

Artculo Original

Estimacin del Valor Predictivo Positivo de la Colangiopancreatografa Magntica


utilizando metodos de Bayes.
Luis Bravo-Melo1, Rafael Tovar-Cuevas2, Jorge Achcar3.
1
Escuela de Estadstica, Universidad del Valle Santiago de Cali, Colombia
2
Estadstico, PhD, Escuela de Estadstica, Universidad del Valle, Santiago de Cali, Colombia
3
Departamento de saude coletiva, Faculdade de Saude de Ribero Preto, Universidade de So Paulo

Fecha de Recepcin: 30/06/2015


Fecha de Solicitud de Correcciones: 30/09/2015
Fecha de Aceptacin: 15/10/2015
Resumen

Objetivo: este artculo presenta la manera de calcular, dentro de una prueba Cholangiopancreatography using Bayes methods
de diagnstico clnico, la probabilidad de que un individuo, cuyo resultado
para la prueba de tamizaje es positivo, est realmente enfermo sabiendo que
no se tiene su resultado con la prueba patrn de oro; probabilidad denominada Abstract
Valor Predictivo Positivo (VPP). Mtodo: se asumi el VPP como una Objetive: In this article we present different alternative to compute the
cantidad desconocida para la que se puede construir una distribucin de Positive Predictive Value (PPV) for a diagnostic test. Method: we assumedthe
probabilidad. Dentro del paradigma Bayesiano de la estadstica, se utiliz el VPP as a continuous and unknown quantity whose natural performance
mtodo propuesto por Winkler and Smith para calcular VPP utilizando un is susceptible of model using a distribution of probability. We use the
conjunto de registros sobre coledocolitiaisis en pacientes con pancreatitis method propose as Winkler and Smith to estimate the VPP using Bayesian
aguda. Resultados: los mtodos bayesianos permitieron obtener regiones de procedure. We illustrate our methodology with a data set of patients with
credibilidad ms estrechas que los intervalos de confianza clsicos. Discusin: acute pranceatitis taken the Magnetic Cholangiopancreatogrphy as test to
el uso de mtodos Bayesianos es una excelente alternativa para obtener screening of Choledocoletise Results: The Bayesian approach allows to have
estimaciones ms precisas del VPP. Estimar los valores predictivos utilizando a best estimates and the credibility regions were narrower than the confidence
los datos de la tabla 2X2 conlleva a errores cuando el tamao de la muestra no intervals.Discussion:thje use of Bayesian methods is an excellent choise to
es tan grande como para asumirla cercana a la poblacin. obtain more accute estimates. To estimateVPPs using the observed data in
Palabras Clave: VPP, Sensibilidad, Especificidad, Prevalencia, Elicitacin. table 2X2 implies mistakes when the sample size is not large enough as to think
that the sample close the population size.
Estimation of the Positive Predictive Value of the Magnetic resonance
Keywords. PPV, Sensitivity, Specificity, Prevalence, Elicitation.

Introduccin

Tanto en la atencin clnica de las personas como en la implementacin de programas de salud pblica se utilizan criterios o pruebas diagnsticas
con el fin de separar a aquellos individuos o poblaciones que tienen el evento de inters en salud de aquellos que no lo tienen. Al decidir qu
criterios o pruebas diagnsticas se van a utilizar en el entorno clnico o de salud pblica, el mdico y el tomador de decisiones deben considerar las
caractersticas propias de desempeo de los clasificadores como tambin la capacidad predictiva de los mismos una vez puestos en uso. Tanto a nivel
estadstico como en las ciencias de la salud, existe una vasta literatura acerca de los estudios para validar pruebas para diagnstico, sin embargo,
un buen libro que podra ser usado como referencia es el de Sullivan[1]. El Valor Predictivo Positivo (VPP) y el Valor Predictivo Negativo (VPN)
como sus nombres lo dicen, son probabilidades predictivas es decir, son las proporciones esperadas (no observadas directamente) de individuos
realmente enfermos o no enfermos dentro de las respectivas poblaciones de personas con la prueba de tamiz positiva o negativa. En palabras
simples, el VPP es la probabilidad de que un individuo cuyo resultado para la prueba tamiz es positivo est realmente enfermo sabiendo que no
tenemos su resultado con la prueba patrn de oro, situacin comn cuando se aplica la prueba tamiz de manera masiva despus de ser validada.
En muchos estudios el tamao de muestra no es tan grande como para considerar que se est cerca de la poblacin de sujetos, lo que conlleva a
que la prevalencia del evento de inters no pueda ser directamente estimada usando la tabla de 2X2 en la que se resumen los resultados del estudio.
En esas situaciones, se asume la prevalencia como informacin externa a los datos obtenidos en campo que puede estar publicada en alguna otra
fuente, razn por la que puede ser interpretada como una informacin a priori que es actualizada por la informacin contenida en los datos. En
el caso discreto (el trazo o biomarcador est o no presente en el individuo con el evento de inters), el VPP y el VPN toman un valor puntual de
probabilidad puesto que se est estimando a partir de valores puntuales de las caractersticas de la prueba en evaluacin. En el caso continuo, lo que
se asume es que el valor predictivo es una variable aleatoria que puede tomar cualquier valor entre los muchos posibles en el intervalo (0,1) y que
su distribucin en la naturaleza puede ajustarse a una distribucin de probabilidad susceptible de ser aproximada de alguna manera. El artculo de
Winkler and Smith [2] hace un estudio detallado acerca de esta situacin. Existe en la literatura trabajos que presentan estratgias para obtener las
estimaciones de los valores predictivos. Smith et al.[3], calculan un VPP estndar con estimaciones aproximadas de la prevalencia, la sensibilidad y
especificidad, pero adems, analizan el clculo del VPP con el problema de tener numerador cero, esto bajo el enfoque beyesiano. Otros trabajos
que merecen ser citados por su aporte al clculo y la importancia del los valores predictivos en estudios de validacin de pruebas para diagnstico
clnico, son los de Plumb et al.[4], Meck et al.[5] y Naiditch et al. [6].

19 Rev. Md. Risaralda 2016; 22 (1): 19-26


En este artculo, se aborda el asunto de estimar los valores predictivos aleatoria cuyo valor es incierto y cuya distribucin de probabilidad se
(especficamente el VPP), considerando diferentes escenarios puede aproximar usando simulacin estocstica sencilla.
posibles en el procedimiento de estimacin que incluyen mtodos
bayesianos y clsicos de la estadstica, y se hace la comparacin de los
Metodologa de Winkler y Smith distribuciones para VPPs
resultados obtenidos. Se utiliza un conjunto de datos de individuos
con pancreatitis aguda de origen biliar (PAB) para iliustrar los
resultados al asumir la Colangiopancreatografa Magntica (CRM) En su artculo, Winkler y Smith hacen sus estimaciones asumiendo
como una prueba de clasificacin inicial y la colangiopancreatografa que despus de terminado el estudio de tamizaje y validada la prueba
endoscpica retrograda (CPRE) como patrn de oro. se le aplica a un individuo cualquiera de la poblacin de inters si el
resutado es positivo, entonces se requiere saber cual es la probabilidad
de que el paciente presente realmente el evento de inters. En
Datos
general, la idea de los autores consiste en pensar en el VPP como una
En Mogolln et al.[7] se establecen las caractersticas de desempeo cantidad incierta que refleja la incertidumbre en la prevalencia (p),
diagnstico de la colangiopancreatografa magntica (CRM) la sensibilidad (s) y la especificidad (t), por lo que se puede pensar
temprana en individuos con pancreatitis aguda de origen biliar entonces en construir una distribucin de probabilidad para los
(PAB) leve para la deteccin de coledocolitiasis, considerando la VPPs. As, mediante la generacin de muestras aleatorias de (p,s,t)y
colangiopancreatografa endoscpica retrgrada (CPRE) -mtodo calculando
invasivo para el diagnstico de PAB- como el mtodo de referencia
para la evaluacin. Las caractersticas diagnsticas de la CRM en
este estudio fueron evaluadas mediante los registros histricos de q P (D +, p,s,t) (1)
pacientes de los que se tena informacin de haberles realizado CRM donde,
y CPRE. De esta manera los autores contaron con 154 historias
clnicas de pacientes con PAB leve llevados a CRM, de los cuales 86 P (D +, p,s,t) = (2) ps
ps + (1-p) (1-t)
contaban con resultado de CPRE y CRM, cantidad que finalmente fue
considerada la muestra de estudio. para cada muestra se puede construir dicha distribucin. Donde
D es una variable binaria que representa que el verdadero estado
En un trabajo previo, Tovar[8], obtuvo las estimaciones de la
del individuo (enfermo o sano), y el signo (+) simboliza un
sensibilidad y la especificidad de la CRM utilizando metodologa
resultado positivo en la prueba tamiz aplicada para evaluar la
bayesiana de anlisis de datos. Para obtener sus estimaciones, asumi
presencia de dicha enfermedad. Es posible entonces, calcular
que los dos parmetros son variables aleatorias continuas cuyo
la distribucin para el VPP usando simulacin y a travs de la
comportamiento en la naturaleza puede ser modelado usando una
ecuacin . En la prctica,
distribucin de probabilidades terica (distribucin a priori). Se
simular distribucines de probabilidad es sencillo si se representa
asumi entonces que el comportamiento de cada uno de los parmetros
la distribucin condicional como una mezcla (mixtura)
puede ser modelado usando una distribucin Beta de probabilidades
de otras dos distribuciones condicionales, las cuales se pueden tener
caracterizada por dos hiperparmetros (cantidades que caracterizan
si se sabe que el paciente tiene el evento D o no lo tiene (D) .Las
la forma de la distribucin). Dado que la distribucin a priori expresa
probabilidades de mezcla son P (D +) y P (D +) :
la informacin sobre los parmetros de inters que no est contenida
en los datos obtenidos al realizar el estudio de validacin en campo
(razn por la que se asume que es externa al experimento), entonces
se procede a combinar dicha informacin con la contenida en las
observaciones (verosimilitud) para obtener lo que se denomina la Para muestrear desde , primero se obtiene usando
distribucin a posteriori, la cual no es ms que la distribucin de la ecuacin
probabilidades del parmetro despus de combinar la informacin
contenida en el experimento con la informacin externa al mismo.
La distribucin a posteriori permite hacer el proceso de estimacin a
travs de alguna de sus medidas de tendencia central y sus percentiles.
Existen situaciones en las que no es posible contar con informacin
externa al experimento, como tambin puede ocurrir que existan
diferentes fuentes. Entre las fuentes externas ms comunmente
Donde E (p), E (t) y E (s) son las cantidades promedio o esperadas
consideradas estn los especialistas en el tema que pueden tener
para la prevalencia, la especificidad y la sensibilidad respectivamente
diferentes niveles de experiencia y exposicin al evento de inters,
(se obtienen despues de simular grandes cantidades de valores y
resultados de estudios publicados en la literatura, registros mdicos
obtener la media de las mismas). Para cada repeticin de la simulacin
de centros de salud, etc. En el caso del estudio de las caractersticas
se obtiene P (D|+) el cual es un valor entre cero y uno, y luego se
de la CRM, se cont con el conocimiento de una medica especialista
simula un nmero aleatorio uniforme en el intervalo [0,1], de modo
en ciruga de vas biliares y con artculos publicados previamente en
que, si el nmero aleatorio es menor o igual a P (D|+) entonces se
los que se haba evaluado el poder clasificador de la CRM para casos
asume el resultado positivo del individuo como el de un verdadero
de coledocolitiasis. El autor, obtiene las estimaciones bayesianas de la
caso y extraer (p,s,t) desde (p,s,t|D,+); de lo contrario, se asume que
sensibilidad y la especificidad, adems del VPP y el VPN para el caso
el individuo con resultado positivo responde a un falso positivo y se
discreto. Ver Tovar[8].
extrae (p,s,t) desde (p,s,t|D,+). Se obtienen entonces
Winkler and Smith[2] desarrollaron un mtodo para calcular el valor de (p,s,t) mediante la ecuacin (1) y se repite el proceso un gran
predictivo positivo (VPP) para un paciente en particular despus de nmero de veces para construir la distribucin de q. Finalmente, el
conocer el resultado de la prueba validada como tamiz pero sin haber valor estimado del VPP ser el promedio aritmtico de la cadena de
aplicado el patrn de oro, asumiendo que el VPP es una cantidad valores de q obtenida.

Rev. Md. Risaralda 2016; 22 (1): 19-26 20


Formas de calcular del VPP a partir de los datos de conteo
Lo ms comn en los libros de epidemiologa y bioestadstica
que abordan el tema de los estudios de validacin de pruebas para
diagnstico, es encontrar mtodos de estimacin de los valores
Si se sabe que P(D=1)=prevalencia; P(T=1|D=1)=sensibilidad y
predictivos usando las cantidades de sujetos que presentaron las
P(T=0|D=0)=Especificidad , entonces, podemos escribir el VPP como:
combinaciones de resultados de la prueba bajo estudio y la considerada
patrn de oro. El estimador se calcula o bien sea usando los datos
de la Tabla 2X2 directamente (mtodo que generalmente arroja prevalencia*sensibilidad
resultados sesgados) o utilizando la frmula de Bayes asumiendo VPP=
prevalencia*sensibilidad + (1-prevalencia)* (1-especificidad)
conocido el valor de la prevalencia y tomando las estimaciones de
Revisando los textos de epidemiologa y bioestadstica, se tiene que
la sensibilidad y la especificidad puntuales calculadas a partir de los
la ecuacin (1) es la expresin de la frmula de Bayes, la cual asume
datos del cuadro. Los procedimientos convencionales para obtener las
que la prevalencia es una probabilidad externa que no puede ser
estimaciones no tienen en cuenta el carcter continuo del indicador
calculada a partir de la tabla 2X2 que resume los conteos y debe ser
y adems consideran que el VPP es una probabilidad predictiva de
establecida a travs de alguna fuente diferente al experimento. Cuando
tener el verdadero estado en el caso de que se aplicara la prueba tamiz,
se utiliza este mtodo para obtener el estimador, podemos decir que la
es decir, se asume que aun no se sabe el resultado de la prueba tamiz
prevalencia es una informacin a priori que se tiene antes de recabar
en el sujeto.
los datos en campo y que debe ser actualizada usando los resultados
de los individuos participantes en la investigacin (la sensibilidad y la
Para calcular el VPP se pueden considerar diferentes situaciones, una especificidad estimadas).
es que se tienen los resultados de la tabla 2X2 y se calcula directamente
de la misma, es decir; sea D la variable aleatoria que identifica el
Clculo del VPP asumiendo continuidad
resultado de la prueba patrn de oro en el individuo de modo que D
En los casos ms comunes encontrados en los libros de texto, las
toma el valor de uno cuando el individuo tiene un resultado positivo a
frmulas de clculo del VPP emplean los valores observados en la
esa prueba y toma el valor de cero en el otro caso. Se asume tambin la
tabla de 2X2 y asumen un valor puntual para la prevalencia del evento
variable binaria T que identifica el resultado de la prueba usada para
de inters. Sin embargo, es posible asumir que el VPP es una variable
tamiz y que esta bajo validacin, los resultados obtenidos despus de
aleatoria que toma valores en el intervalo [0,1] cuyo comportamiento
aplicarle las pruebas a una muestra de sujetos se pueden resumir en
en la naturaleza puede ser modelado usando una distribucin de
una tabla de 2X2 as:
probabilidades. Una distribucin adecuada para modelar dicho
comportamiento es la distribucin de probabilidades Beta con
Cuadro 1: Arreglo de datos producto de un estudio de validacin de parmetros y . La familia de distribucines Beta es bastante
prueba para diagnstico clnico flexible e incluye un amplio rango de posibles comportamientos al
variar sus parmetros dentro de los nmeros reales positivos. Esta
D=1 D=0 Total
forma de asumir la situacin es propia de la inferencia Bayesiana, la
T=1 a b a+b cual asume que las cantidades que comunmente llamamos parmetros
T=0 c d c+d en el mbito de la inferencia clsica o frecuentista de la estadstica,
Total a+c b+d n los cuales son asumidos como valores fijos pero desconocidos y
propios de la poblacin, en realidad son cantidades aleatorias con un
Donde a es la cantidad de individuos que presentaron resultado comportamiento probabilstico modelable a travs de una distribucin
positivo en ambas pruebas, b es la cantidad de sujetos con resultado terica.
positivo en la prueba bajo validacin y resultado negativo en la prueba Dado que el VPP es una funcin matemtica de otras cantidades
patrn de oro (falsos positivos), c es la cantidad de sujetos que tienen estimadas como la prevalencia, la sensibilidad y la especificidad,
resultado positivo en la prueba patrn de oro y resultado negativo entonces es posible asumir que dichas cantidades tambin son
en la prueba tamiz y d es el nmero de personas que comparten un aleatorias y su comportamiento es susceptible de ser modelado.
resultado negativo en ambas pruebas. Claramente, tanto el VPP como la sensibilidad, la especificidad y la
prevalencia, son proporciones que en el mbito poblacional pueden
Una forma de clculo del estimador del VPP, observada en cursos
ser vistas como probabilidades as que todos son indicadores que
introductorios de bioestadstica o epidemiologa es:
toman valores en el intervalo [0,1].Siendo as, se puede asumir que
el comportamiento natural de las cuatro cantidades puede modelarse
usando distribucines Beta con parmetros y diferentes para
Esta forma de obtencin del estimador presenta problemas cuando cada una de acuerdo con las caractersticas contextuales en las que se
el tamao de la muestra no es lo suficientemente grande como realiza el estudio para validacin.
para asumir que tenemos una cantidad de sujetos muy cercana a la En trminos bayesianos, asumimos que tenenos informacin externa
poblacin, lo que nos permitira tener una estimacin bastante buena que nos permite obtener valores para y en cada caso, de modo que
de la prevalencia del evento. podemos plantear el siguiente modelo para el estudio de validacin de
De otro lado, bajo el supuesto de que llega un sujeto que no particip una prueba para diagnstico que dio origen a la ecuacin (1) usando
en la etapa experimental, se le aplica la prueba de tamizaje y se observa la misma notacin de Winkler y Smith.
un resultado (aun no se ha observado, se asume que eso pasara), se Sea , sea , y sea
hace necesario estimar la probabilidad condicional en el resultado , la prevalencia, sensibilidad y especificidad, de modo que
observado de que el sujeto en cuestin tenga o no realmente el evento. . Si asumimos que el comportamiento
Para el caso de un resultado positivo, se tendra que calcular el VPP de cada cantidad aleatoria puede ser modelado usando una
que puede escribirse en trminos de probabilidades como (ecuacin 1): distribucin Beta entonces tenemos que:

21 Rev. Md. Risaralda 2016; 22 (1): 19-26


, Situacin 3: estimacin del VPP mediante la formula de Bayes
usando el valor puntual de la prevalencia y estimaciones bajo
Donde es una constante llamada de normalizacin que continuidad de la sensibilidad y la especificidad.
permite que la integral de la funcin sea igual a uno. La funcin de Tovar[8] en su artculo utiliz tres modelos de estimacin para
probabilidad para modelar el comportamiento de la sensibilidad y la cada uno de los parmetros de desempeo de la CRM. Primero
especificidad tendrn la misma forma con la diferencia de que y estim asumiendo a priori que todos los valores de las cantidades
son nicos para cada una de las cantidades aleatorias. En el artculo en el intervalo (0,1) tenan la misma probabilidad de ocurrir, es
de Tovar[8] se presenta en forma detallada el procedimiento para decir, utiliz una distribucin de probabilidad Uniforme (0,1)
obtener las estimaciones de la sensibilidad y la especificidad, mediante como expresin de la informacin previa a los datos del estudio,
mtodos bayesianos y asumiendo una distribucin Beta para modelar de modo que los resultados reportados y el VPP estimado son:
la informacin a priori o externa. s = 0.958 y t =0.44 y . En un segundo caso,
expres la informacin a priori contenida en artculos cientficos
En el proceso de estimacin usando metodologa bayesiana, puede publicados previamente sobre el asunto a travs de una distribucin
ocurrir que se tengan diferentes fuentes externas para obtener Beta con parmetros y para la sensibilidad y
informacin sobre la cantidad aleatoria de inters. Es posible contar para la especificidad. Asumiendo la prevalencia
con personas consideradas especialistas en el tema que pueden del 20%, los resultados observados fueron: ,
brindar informacin desde su conocimiento y exposicin al evento y . En el caso tres, las estimaciones se
de inters, o puede ser que se cuente con documentos publicados hicieron tomando informacin subjetiva entregada por la especialista
como artculos cientficos o reportes tcnicos, entre otras posibles y usando distribucines Beta para modelar la misma. En este caso,
opciones. Cuando se tiene este tipo de situaciones, se tendrn tantos los valores de los hiperparmetros y de las estimaciones fueron:
modelos como posibles fuentes de informacin, caso en el que se hace para la sensibilidad, para la
necesario escoger entre las diferentes alternativas la que mejor se ajuste especificidad, , y
a la situacin real. Existen diferentes estrategias tericas creadas para
seleccionar el modelo que mejor explique el fenmeno real, entre ellas Situacin 4: estimacin del VPP mediante la frmula de Bayes
el factor de Bayes. En el artculo de Tovar[8] se puede encontrar una asumiendo continuidad en los parmetros de desempeo y la
explicacin ms detallada sobre los mtodos de seleccin de modelos. prevalencia
Dado que Tovar[8] no estim la prevalencia de forma continua y
Estimacin del valor predictivo de la Colangiopancreatografa para sus estimaciones de la sensibilidad y la especificidad utiliz el
magntica (CRM) valor entregado por la especialista (20%), en esta parte del trabajo,
Usando la Colangiopancreatografa endoscpica retrgrada (CPRE) se asumi que, de acuerdo con la naturaleza de este indicador, su
como prueba patrn de oro, se estim el VPP de la CRM utilizando comportamiento puede ser modelado usando una distribucin Beta
los datos de conteo y la frmula de Bayes para el caso discreto y de probabilidades y para obtener los parmetros de la distribucin
utilizando la metodologa desarrollada por Winkler y Smith para el a priori (hiperparmetros) se aplic el procedimiento desarrollado
caso continuo. por Tovar[9], definiendo a priori que hay probabilidad de 0.95
de que la prevalencia tome valores entre 0.10 y 0.30 dentro del
Situacin 1: Estimacin a partir de la tabla de 2X2 intervalo (0,1). Siendo as, se tendra una probabilidad de 0,05 de
Para llevar a cabo el procedimiento de estimacin se contaba con encontrar valores de prevalencia fuera de ese rango. Dado que solo
una muestra de 86 individuos diagnosticados con pancreatitis aguda se tiene un intervalo en el que se puede encontrar el valor real del
leve y tratados en un hospital pblico de Colombia. De acuerdo con indicador, se utiliz el teorema de Chebychev para obtener una
los resultados reportados por Mogolln et al.[7], en ese estudio, los varianza aproximada del comportamiento de la cantidad aleatoria (la
valores de los conteos en la tabla cruzada fueron: y prevalencia) dentro del intervalo establecido y empleando un sistema
de modo que la estimacin del VPP usando unicamente los datos simple de dos ecuaciones con dos incognitas se obtuvo el valor de
de la Tabla 1 sera lo que implicara que la prevalencia los hiperparmetros. La distribucin posterior de la prevalencia ser
estimada para la coledocolitiasis sera de entonces una as que la estimacin de la prevalencia
ser . Tomando ese valor junto con las estimaciones
Situacin 2: estimacin usando la frmula de Bayes de los parmetros de desempeo utilizados en la situacin tres,
En este caso, se consult a la especialista quien report que de acuerdo se obtuviern las siguientes estimaciones para el VPP de la CRM:
con los estudios y los datos reportados por el ministerio de salud de
Colombia, la prevalencia de coledocolitiasis entre individuos con
pancreatitis aguda leve es del 20%. Usando este dato y los valores de Situacin 5: estimacin del VPP usando mtodo de Winkler y Smith
prevalencia estimados con la Tabla 2X2 se tiene que: asumiendo una distribucin a priori de referencia para el VPP, las
estimaciones bayesianas de la sensibilidad y la especificidad y la
prevalencia obtenida con los conteos de la tabla 2X2.

Dado que los datos en las celdas de la Tabla 1, corresponden a


cantidades de sujetos con resultados de las pruebas de clasificacin,
se puede aproximar el modelo de probabilidad general para todas
las observaciones de la tabla con una distribucin multinomial. Sin
embargo, cuando se van a calcular las estimaciones de la sensibilidad
y la especificidad, se puede partir del supuesto de que se tiene primero
el resultado de la prueba patrn de oro y luego se sabe el resultado
de la prueba para validacin. Partiendo de esta suposicin se puede
asumir que la distribucin de los resultados de la prueba se ajusta

Rev. Md. Risaralda 2016; 22 (1): 19-26 22


a una distribucin binomial de probabilidades con parmetros Figura 1: Distribucin de los valores del VPP para CRM asumiendo
y siendo y las cantidades de sujetos distribucines a priori uniformes para la prevalencia, la sensibilidad y
observadas en la Tabla 1. De igual manera para la especificidad, se la especificidad. Elaboracin propia en software R.
tendra que la distribucin del nmero de individuos con resultado
negativo en la prueba tamiz, se distribuye binomial con parmetros
y . De igual forma, la cantidad de sujetos
con patrn de oro positivo entre todos los individuos examinados,
se puede ajusar a una distribucin binomial de probabilidades con
parmetros y . Volviendo a la
estimacin de los parmetros de la CRM, se obtuvo la distribucin
posterior para la prevalencia asumiendo que todos los valores posibles
de la cantidad aleatoria tienen la misma probabilidad de ocurrir en el
intervalo (0,1), es decir, se asume que la distribucin a priori de la
prevalencia es una Uniforme (0,1) que es lo mismo que una Beta(a=1,
b=1). Entonces se puede escribir la funcin de verosimilitud de los
datos para la prevalencia como:

Dado que se asumi una distribucin a priori uniforme, entonces


se tiene que la distribucin posterior ser una . Usando
las estimaciones de la sensibilidad y la especificidad, se aplica el
procedimiento de Winkler y Smith y se tiene que la distribucin de
probabilidad conjunta es un producto de tres densidades Con miras a resumir la informacin contenida en la distribucin
Beta: hallada, se puede obtener valores de ciertos indicadores como la
media de las estimaciones de los VPPs, su error estndar (desviacin
estndar de las estimaciones) y un intervalo de credibilidad dentro
del cual se espera que se encuentre el 95% de los valores del VPP si
De modo que: se le aplicara la CRM a una poblacin de individuos que no fueron
evaluados con la CPRE. Los resultados obtenidos son:
; ;
.
Con lo cual, haciendo uso de la ecuacin (4) en el proceso de Winkler
and Smith se puede calcular la probabilidad para un individuo, esto Situacin 6: estimacin del VPP de la CRM asumiendo que se
es . As, observando una lectura positiva en la prueba, tiene una prevalencia del 20% y las estimaciones Bayesianas de los
pero sin saber si el individuo padece coledocolitiasis, la distribucin parmetros de desempeo obtenidas con distribucines uniformes
de probabilidad conjunta , es una mezcla de dos densidades para expresar la informacin a priori
de la forma:
Para este caso, asumimos que la prevalencia de coledocolitiasis en la
poblacin de individuos con pancreatitis aguda leve es del 20% como
lo report la especialista, de modo que si se tienen 86 individuos en la
muestra se esperara que 17 de ellos tuvieran coledocolitiasis. Tomando
En donde el primer trmino de la expresin considera la posibilidad este dato se aplica de nuevo el procedimiento realizado en la situacin
que el individuo tenga coledocolitiasis, por lo que incrementa la anterior y se tiene que la distribucin posterior de la prevalencia
cuenta para la prevalencia (de 71 casos de coledocolitiasis pasa a despus de asumir un comportamiento previo uniforme, es una
72), y de igual forma para la sensibilidad (de 69 casos correctamente . Despus de usar los valores de los hiperparmetros usados
identificados pasa a 70). Asimismo, el segundo trmino corresponde por Tovar[8], se tiene que de
a considerar que el individuo no tiene coledocolitiasis, con lo cual se modo que:
aumenta la cuenta de los pacientes que no padecen esta enfermedad
(de 17 pasa a 18), y aumenta el nmero de pacientes sin coledocolitiasis
que han sido categorizados incorrectamente (de 10 pasa a 11).
Utilizando los valores obtenidos es posible obtener la probabilidad
Continuando con el proceso, se simulan100.000 valores de de que un individuo tenga coledocolitiasis dado que se observ un
y se obtiene el valor de para cada uno de los valores resultado positivo en la CRM, esto es As, contando
simulados, lo que permite obtener la forma de la densidad emprica con un resultado positivo de la CRM sin saber si el individuo padece
(con datos y no una ecuacin) del VPP. Ver Figura1. coledocolitiasis, la distribucin de probabilidad conjunta ,
es una mezcla de dos densidades:

Despus de realizar 100.000 simulaciones de la distribucin


encontrada y se obtiene igual cantidad de valores de lo que permite

23 Rev. Md. Risaralda 2016; 22 (1): 19-26


establecer la distribucin del VPP de la CRM bajo las condiciones Figura 3: Distribucin de los valores del VPP para CRM asumiendo
dadas. Figura 2 las condiciones establecidas para la situacin siete. Elaboracin propia
en software R.
Figura 2: Distribucin de los valores del VPP para CRM asumiendo
las condiciones establecidas para la condicin cinco Elaboracin
propia en software R.

En este caso, las estimaciones obtenidas son: ;


y

Situacin 8: estimacin del VPP de la CRM asumiendo las


estimaciones bayesianas basadas en distribucines a priori
construidas a partir de informacin suministrada por un
especialista en el tema
Las estimaciones obtenidas en este caso son: ;
y El procedimiento se repiti de nuevo, pero esta vez cambiando las
distribucines Beta a priori que expresaban los conocimientos previos
Situacin 7: estimacin del VPP de la CRM asumiendo las acerca de la distribucin natural de la sensibilidad y la especificidad,
estimaciones bayesianas basadas en distribucines a priori asumidas ambas como cantidades con un comportamiento aleatorio
construidas a partir de informacin publicada en artculos en la naturaleza (Ver Tovar[8] para detalles). La prevalencia fue
cientficos estimada de forma continua asumiendo que la misma se mueve en un
rango de (0.1, 0.3) con una probabilidad de 0.95 y que la probabilidad
Se aplic el procedimiento de estimacin de nuevo, pero esta vez, de encontrar valores fuera de ese rango es de 0.05. Se tiene entonces
tomando los valores de la sensibilidad y la especificidad obtenidos a que:
travs de la combinacin de los conteos con la informacin contenida
en estudios para validacin de la CRM realizados en otros pases y
la estimacin de la prevalencia considerada en la situacin cuatro.
Con base en el intervalo establecido a priori para la prevalencia (0.1, As que:
0.3) se obtuvo despus de usar el procedimiento de Tovar[9] una
distribucin a priori de modo que al combinarla con
la informacin contenida en los conteos de la tabla de 2X2 se obtuvo
una distribucin posterior . Por tanto;
Con lo que, la probabilidad para un individuo es y
la distribucin de probabilidad conjunta para las tres cantidades de
Lo que conlleva a que: inters despus de haber observado un resutado positivo en la CRM
es:

Se obtuvo la probabilidad , . para obtener luego, la


distribucin de probabilidad conjunta , como una mezcla
de dos densidades as: Despus de simular 100.000 valores de , y encontrar los
respectivos valores de se tiene que la forma de la densidad para los
VPPs es la que aparece en la Figura 4.

Despus de hacer 100.000 simulaciones, se obtiene la distribucin


para los VPPs. Figura 3.

Rev. Md. Risaralda 2016; 22 (1): 19-26 24


Figura 4: Distribucin de los valores del VPP de la CRM asumiendo 1. Calcular el VPP a partir de los datos del areglo 2X2 obtenido
las condiciones establecidas para la situacin ocho. Elaboracin despus de hacer los conteos. Esta estrategia presenta bastantes
propia en software R. problemas desde el punto de vista estadstico que conllevan a
fuertes problemas desde el punto de vista de la salud pblica. Si
se asume que la cantidad de personas incluidas en la evaluacin
de la prueba en campo es lo suficientemente grande como para
acercarse a la poblacin, entonces se puede estimar la prevalencia
del evento de inters a travs de los conteos en la tabla 2X2,
siempre y cuando los datos en campo se hayan colectado bajo un
diseo de cohorte. Sin embargo, el contar con miles de individuos
solo es posible cuando se realizan tamizajes poblacionales y antes
de llegar a estos, se supone que la prueba ha sido validada con
un grupo menor de sujetos. En la realidad, es difcil asumir que
se pueden realizar estudios de evaluacin de pruebas en los que
participan cientos o miles de personas debido a las condiciones
logsticas para desarrollarlos y especficamente a los costos
que tales estudios implican. El diseo de estudio de cohorte,
exige contar con una prueba considerada patrn de oro que sea
aplicada simultneamente a los sujetos junto con la prueba en
evaluacin, lo cual garantiza aleatoriedad en los cuatro totales
de la tabla 2X2 de modo que el nico total fijo, o conocido de
antemano, es la cantidad total de sujetos participantes. Cuando
Finamente, para este modelo, se tienen las siguientes los datos son colectados bajo este diseo, es posible estimar la
estimaciones: ; y prevalencia del evento de inters a partir del cociente entre el total
marginal de la columna con patrn de oro positivo y la cantidad
total de participantes en el estudio. Es importante aclarar que
Discusin lo deseable es tener una muestra de individuos participantes lo
suficientemente grande como para obtener una estimacin de la
El Valor predictivo de una prueba para clasificacin clnica, es una prevalencia a la que le apliquen las caractersticas propias de un
caracterstica muy importante que permite estimar la probabilidad buen estimador.
condicional del verdadero estado de un individuo despus de conocer 2. Calcular el VPP usando la formula de Bayes. Esta estratgia
el resultado clasificador de la prueba. De acuerdo con Sullivan[1] los metodolgica implica que la prevalencia del evento de inters
valores predictivos (positivo y negativo) cuantifican el valor clnico de puede ser obtenida en alguna fuente secundaria externa a los datos
la prueba de tamizaje. De otro lado, segn Silva[10], la sensibilidad y de los conteos. Algunos diseos para obtener los datos en campo,
la especificidad son medidas de la eficiencia del citerio clasificador que como el de tener un grupo de individuos con la caracterstica de
expresan la calidad del comportamiento del mismo ante la presencia inters (grupo de enfermos por ejemplo) y un grupo de individuos
o ausencia del evento de inters pero no necesariamente de su utilidad sin la misma o con otras caractersticas que comparten rasgos de
para pronunciarse en enclaves prcticos reales sobre si un sujeto est o similaridad con la de inters pero que no son exactamente sta.
no enfermo. El individuo susceptible de ser clasificado (generalmente En esos estudios los totales de sujetos son fijos o conocidos por
un paciente) y el profesional de la salud, pueden estar ms interesados el investigador antes de obtener los datos de conteo, as que, para
en la probabilidad de tener el evento de inters dado que el resultado calcular el VPP necesariamente se debe consultar otras fuentes
de la prueban tamiz fue positivo. Un aspecto importante es que el que permitan tener un valor para la prevalencia.
valor predictivo de la prueba depende de la cantidad de individuos
que presentan el evento de inters en la poblacin de estudio, mientras Generalmente, los valores predictivos son calculados a partir de los
que la sensibilidad y la especificidad son caractersticas inherentes a datos discretos y con base en la frmula de Bayes que actualiza la
la estructura de la prueba y su capacidad clasificadora. Es posible probabilidad a priori (prevalencia) con la informacin contenida en
entonces, tener una prueba para tamizaje con una alta sensibilidad, los datos colectados en campo. Aun cuando este es un procedimiento
pero si la cantidad de individuos enfermos o infectados en la poblacin vlido y legtimo, es claro que en su aplicacin se puede estar perdiendo
es muy baja (prevalencia tendiente a cero) el valor predictivo de esa informacin importante acerca de los indicadores puesto que se est
prueba ser muy bajo tambin pues muchos de los individuos que trabajando con valores puntuales. Asumir continuidad, fortalece el
sean positivos a la misma sern falsos positivos dada la dificultad de proceso de estimacin, pues, al hacer esto, se est considerando todo
encontrar verdaderos casos en la poblacin. el rango de posibles valores que puede llegar a tomar el indicador el
cual es resumido a travs de su media aritmtica. De acuerdo con los
Generalmente, en los estudios de validacin de pruebas para resultados obtenidos en el presente trabajo, es posible concluir que
clasificacin diagnstica, se calcula el valor predictivo a partir de los calcular el VPP a partir de los datos de la tabla, puede sobre estimar
datos discretos obtenidos luego de los conteos conseguidos despus el indicador independiente de que el procedimiento de estimacin
de aplicar el nuevo criterio clasificador entre individuos que se saben se haga solo con datos discretos o considerando la continuidad. Es
tienen la caracterstica de inters, o entre individuos a los que se les importante tener en cuenta que, los desarrollos y procesos expuestos
aplica un procedimiento clasificador que se asume libre de error. Para en este trabajo no son exclusivos para obtener el valor predictivo
hacer la estimacin a travs de los datos discretos, se emplean dos positivo (VPP) ya que, los mismos, tambin aplican de manera
estrategias: anloga, para obtener los valores predictivos negativos (VPN).

25 Rev. Md. Risaralda 2016; 22 (1): 19-26


Agradecimientos:
Los autores agradecen al editor y los evaluadores por sus valiosos
comentarios que permitieron mejorar el texto.
Este artculo es parte del trabajo de Maestra en Estadstica del primer
autor. La participacin del segundo y tercer autor fue parcialmente
financiada por la Coordenao de aperfeioamento de pessoal de
nivel superior (CAPES) de Brasil.

Conflicto de intereses:
Los autores declaran que no tienen conflicto de intereses.

Referencias
1. Sullivan M. The statistical evaluation of medical tests for
classification and prediction. Oxford University Press. 2003; pp.
22-25.

2. Winkler R, Smith J. On uncertainty in medical testing. Medical


Decision Making. 2004; 24: 654-658.

3. Smith J, Winkler R,Fryback D. The First Positive: Computing


Positive Predictive Value at the Extremes. American Society of
Internal Medicine. 2000; 132:804-809.

4. Plumb A, Taylor S, Halligan S. Effect of faecal occult blood


positivity on detection rates and positive predictive value of CT
colonography when screening for colorectal neoplasia. Clinical
Radiology. 2015May 28; ISSN: 0009-9260.

5. Meck, J.M. et al. Research: Noninvasive prenatal screening for


aneuploidy: positive predictive values based on cytogenetic
findings. American Journal of Obstetrics and Gynecology.
2015Apr. 1; ISSN: 0002-9378.

6. Naiditch, J.A, Barsness, K.A. The positive and negative predictive


value of transabdominal color Doppler ultrasound for diagnosing
ovarian torsion in pediatric patients.Journal of Pediatric Surgery.
2013 June 1; 48, 1283-1287, ISSN: 0022-3468.

7. Mogolln G, Sefair C, Upegui D, Tovar J. Colangiopancreatografa


magntica: valor diagnstivo para detectar coledocolitiasis
en pacientes con pancreatitis aguda leve. Revista Cubana de
Ciruga. 2014; 53(1), pp. 41-51.

8. Tovar J. Inferencia Bayesiana e Investigacin en salud: un caso


de aplicacin en diagnstico clnico. Rev. Md. Risaralda. 2015;
21(1), pp.9-16.

9. Tovar J. Eliciting Beta prior distributions for binomial sampling.


Rev. Bras. Biom. 2012; v.30, n.1, p.159-172.

10. Silva L. Cultura estadistica e investigacion cientifica en el campo


de la salud: una mirada crtica. Editorial Diaz de Santos S.A.
1997; pp. 250-257.

Rev. Md. Risaralda 2016; 22 (1): 19-26 26