Вы находитесь на странице: 1из 38

101

3
Teora de probabilidades
y resolucin de problemas
En el Captulo 2, hemos examinado la interpretacin de las probabilidades y algunos mtodos
elementales para determinarlas. En este captulo, continuamos nuestro estudio con la explica-
cin de alguno de los teoremas tiles en la resolucin de problemas para casos ms complejos
que los expuestos en el Captulo 2.
3.1. DIAGRAMAS DE VENN Y LOS AXIOMAS DE PROBABILIDAD (OPCIONAL)
Diagramas de Venn
Antes de comenzar a desarrollar las reglas bsicas que rigen el comportamiento de las proba-
bilidades, presentaremos un diagrama que resulta til para organizar las probabilidades. El
diagrama, llamado diagrama de Venn, se denomina as en honor de John Venn (1834-1923).
En este diagrama representamos el conjunto de posibilidades para un experimento mediante
un rectngulo. A este conjunto le llamamos espacio muestral y lo representamos con la letra
mayscula S (Fig. 3.1a). Un suceso de inters se representa mediante una curva cerrada
dentro del rectngulo y se indica mediante una letra mayscula distinta de S. En la Figu-
ra 3.1b se ha representado el suceso A. El suceso que no se produzca A, se indica mediante
A y se representa en la regin del rectngulo que queda fuera de A (Fig. 3.1c). El suceso A se
denomina suceso complementario de A. Cuando dos sucesos A
1
y A
2
estn relacionados en el
mismo experimento, dividen el rectngulo en cuatro reas separadas. Cada rea representa
una forma exclusiva de combinar los dos sucesos. stas se muestran en la Figura 3.1d a g. En
el ejemplo, ilustraremos esta idea.
Ejemplo 3.1.1. Se disea un estudio para investigar el peso y el hbito de fumar de los
pacientes con hipertensin. Aqu S representa a todos los pacientes con hipertensin. Esta-
blezcamos que A
1
representa a los pacientes con sobrepeso y A
2
a los fumadores. La Figu-
ra 3.1d representa a los pacientes con sobrepeso que no fuman; la Figura 3.1e representa a los
( ) a
( ) d
( ) b
( ) e
( ) g
( ) c
( ) f
S
S
S
S
S
S
S
A
A
A
1
A
1
A
1
A
1 A
2
A
2
A
2
A
2
Figura 3.1. (a) El espacio muestral se representa mediante un rectngulo; (b) el suceso A se repre-
senta mediante una curva cerrada dentro del rectngulo; (c) el suceso A es el suceso de que A no
ocurra; (d) ocurre A
1
pero no A
2
; (e) ocurre A
2
pero no A
1
; (f ) ocurren tanto A
1
como A
2
; (g) no ocurre
ni A
1
ni A
2
.
que fuman pero que no tienen sobrepeso. La Figura 3.1f muestra a los pacientes con sobrepe-
so y fumadores, mientras que los que ni fuman ni tienen sobrepeso estn representados en la
Figura 3.1g.
La palabra castellana o tiene dos significados diferentes. Cuando se utiliza con sentido
de inclusin, significa lo uno o lo otro o quiz ambos; en el sentido de exclusin signifi-
ca o uno u otro pero no ambos. En este texto, la palabra o se utiliza en sentido de
inclusin, salvo que se especifique lo contrario. Por ejemplo, si decimos que un paciente que
sufre hipertensin tiene sobrepeso o fuma, queremos decir que el paciente presenta, al menos,
una de estas caractersticas. l o ella tiene (1) sobrepeso pero no fuma o (2) fuma pero no
tiene sobrepeso o (3) fuma y tiene sobrepeso. En la Figura 3.2 se muestra el diagrama de
Venn para los sucesos A
1
o A
2
.
Axiomas de probabilidad
Comenzamos considerando tres axiomas de probabilidad. Estos axiomas, que se admiten
como ciertos y que no requieren demostracin, son de origen intuitivo. Mucha gente los
aplica de forma bastante natural sin tener la menor idea de lo que est haciendo.
Antes de establecer los axiomas, desarrollaremos una definicin. Considrense los dos
sucesos, A
1
: el paciente A se recupera de una operacin de corazn, y A
2
: el paciente A fallece
en la mesa de operaciones. Es evidente que estos sucesos no pueden producirse simultnea-
mente. El hecho de que se produzca uno excluye que sea posible el otro. Cuando esto ocurre,
decimos que los sucesos A
1
y A
2
son mutuamente excluyentes. En la Figura 3.3a se muestra la
representacin del diagrama de Venn de dos sucesos mutuamente excluyentes. Obsrvese
que, en este caso especial, las curvas que representan los dos sucesos no se superponen. La
idea se extiende a un conjunto de sucesos mutuamente excluyentes en la Figura 3.3b.
102 Estadstica para Biologa y Ciencias de la Salud
Todos los pacientes
con hipertensin
Todos los
pacientes con
sobrepeso
Todos los
pacientes
que fuman
Figura 3.2. Pacientes que fuman o con so-
brepeso.
Para sentar las bases de los teoremas bsicos de resolucin de los problemas de este
captulo se utilizan tres axiomas. Son los siguientes:
Axiomas de probabilidad
1. Sea S el espacio muestral de un experimento. Entonces P[S] = 1.
2. P[A] n 0 para todo suceso A.
3. Sea A
1
, A
2
, A
3
, ... un conjunto finito o infinito de sucesos mutuamente excluyentes.
Entonces P[A
1
o A
2
o A
3
o ] = P[A
1
] + P[A
2
] + P[A
3
] + .
El Axioma 1 alude a un hecho que a la mayora de las personas le parecer obvio, es decir,
la probabilidad asignada al suceso seguro, al suceso cierto, es 1. El Axioma 2 afirma que la
probabilidad nunca puede ser negativa. El Axioma 3 garantiza que cuando se tiene una serie
de sucesos mutuamente excluyentes, la probabilidad de que ocurra uno u otro de los sucesos
puede calcularse sumando las probabilidades individuales. Estos axiomas conducen fcil-
mente al Teorema 3.1.1.
Teorema 3.1.1. P[] = 0.
El teorema establece que la probabilidad asociada al suceso imposible, , es 0. Puesto
que el suceso imposible corresponde al suceso fsico que no puede ocurrir, recurriremos a
nuestros axiomas para asignar a tales sucesos la probabilidad 0. Por ejemplo, consideremos el
experimento consistente en tirar un nico dado corriente de seis caras. Las caras del dado
contienen los nmeros del 1 al 6. Si preguntamos cul es la probabilidad de obtener 8 en una
A
1
A
1
A
3
A
2
A
2
A
n
( ) a ( ) b
Figura 3.3. (a) Los sucesos A
1
y A
2
son mutuamente excluyentes. Si ocurre uno, el otro es imposi-
ble. (b) Un conjunto de n sucesos mutuamente excluyentes.
Teora de probabilidades y resolucin de problemas 103
sola tirada, la respuesta es 0. El suceso descrito es fsicamente imposible. La demostracin
del teorema se indica en el Ejercicio 13 de esta seccin.
El Axioma 3 es especialmente importante porque nos proporciona la capacidad de calcu-
lar la probabilidad de un suceso cuando los puntos del espacio muestral del experimento no
son equiprobables. Para comprender esta idea, consideremos el Ejemplo 3.1.2.
Ejemplo 3.1.2. La distribucin de tipos de sangre en Estados Unidos entre los individuos
de raza blanca es aproximadamente la siguiente:
A: 40 % AB: 4 %
B: 11 % O: 45 %
Tras un accidente de automvil, un individuo de raza blanca es conducido a una clnica de
urgencia. Se le hace un anlisis de sangre para establecer el grupo al que pertenece. Cul es
la probabilidad de que sea del tipo A, o del B, o del AB? Para hallar la probabilidad deseada se
puede utilizar el Axioma 3. Vamos a denominar A
1
, A
2
y A
3
a los sucesos relativos a que el
paciente sea del grupo sanguneo A, B y AB, respectivamente. Vamos a calcular P[A
1
o A
2
o A
3
]. Dado que es imposible que un individuo tenga dos grupos sanguneos diferentes, estos
sucesos son mutuamente excluyentes. Por el Axioma 3,
P[A
1
o A
2
o A
3
] = P[A
1
] + P[A
2
] + P[A
3
]
= 0.40 + 0.11 + 0.04
= 0.55
Hay un 55 % de posibilidades de que el paciente tenga uno de los tres grupos sanguneos
mencionados. (Basado en la informacin del Technical Manual, American Association of
Blood Banks, 1985.)
Supongamos que conocemos la probabilidad de que se produzca el suceso A, y deseamos
hallar la probabilidad de que A no se produzca. Podemos hacerlo fcilmente restando de 1.
Por ejemplo, basndonos en una investigacin realizada recientemente, estimaremos que la
probabilidad de curar la leucemia infantil es de
1
3
. (Curar significa que el nio se libra de
la enfermedad durante al menos 4 aos una vez finalizado el tratamiento.) Por lo tanto, la
probabilidad de que la enfermedad no est curada es 1
1
3
=
2
3
.
Esta idea, que parece evidente, se justifica con el Teorema 3.1.2, cuya demostracin se
presenta en el Ejercicio 14 de esta seccin. Recuerde que A indica el suceso de que A no ocurra.
Teorema 3.1.2. P[A] = 1 P[A].
Obsrvese que este teorema proporciona una forma de hallar la probabilidad del suceso com-
plementario del suceso A.
EJERCICIOS 3.1
1. Sea L el suceso que un paciente tiene leucemia y W el suceso que el recuento de leucoci-
tos es alto. Considrense los diagramas de Venn de la Figura 3.4. Describir, en cada
caso, los pacientes representados por la regin sombreada.
2. Sea H el suceso que un rbol est situado en un lugar muy alto y G el suceso que el
crecimiento de los rboles es deficiente. Considrense los diagramas de Venn de la
Figura 3.5. Describir, en cada caso, los rboles representados por la regin sombreada.
3. En un estudio de vacunacin realizado con nios en edad preescolar, el inters se centr
en las vacunas contra la parotiditis y contra el sarampin. P representa el suceso de
104 Estadstica para Biologa y Ciencias de la Salud
( ) a ( ) b
( ) c ( ) d
L
L
L
L
W
W
W
W
Figura 3.4
que un nio haya recibido la vacuna contra la parotiditis y M el suceso de que un nio
haya recibido la vacuna contra el sarampin.
a) Describir a los nios del suceso P y M.
b) Dibujar un diagrama de Venn para representar al conjunto de nios que han recibi-
do la vacuna contra el sarampin, pero no la vacuna contra la parotiditis.
c) Dibujar un diagrama de Venn para representar al conjunto de nios que no han
recibido ninguna vacuna.
( ) a ( ) b
( ) c ( ) d
H
H
H
H
G
G
G
G
Figura 3.5
Teora de probabilidades y resolucin de problemas 105
d) Dibujar un diagrama de Venn para representar al conjunto de nios que han recibi-
do la vacuna contra la parotiditis o contra el sarampin.
e) Dibujar un diagrama de Venn para representar al conjunto de nios que han recibi-
do la vacuna contra la parotiditis o el sarampin, pero que no han recibido ambas.
4. En un estudio sobre el efecto que produce el dixido de azufre en los rboles a lo largo
de las autopistas principales de los Smokies, se han identificado dos sucesos. Estos son:
L, el rbol tiene las hojas daadas, y T, el rbol ha crecido poco.
a) Dibujar un diagrama de Venn para representar el conjunto de rboles que no han
crecido poco.
b) Dibujar un diagrama de Venn para representar el conjunto de rboles que han creci-
do poco, pero que no tienen las hojas daadas.
c) Dibujar un diagrama de Venn para representar el conjunto de rboles que no pre-
sentan ninguna de estas caractersticas.
d) Dibujar un diagrama de Venn para representar el conjunto de rboles que han creci-
do poco o que tienen las hojas daadas.
e) Dibujar un diagrama de Venn para representar el conjunto de rboles que han creci-
do poco o que tienen las hojas daadas, pero que no tienen ambos problemas.
5. Cules de los siguientes pares de sucesos son mutuamente excluyentes?
a) A: El hijo de Jane tiene hemofilia.
B: La hija de Jane es portadora de hemofilia.
b) A: El 65 % de las semillas de guisante que han sido plantadas germinar.
B: El 50 % de las semillas de guisante que han sido plantadas no llegar a germinar.
c) A: Jos sufre hipotermia.
B: La temperatura de Jos es de 39 C.
d) A: El pH de una muestra de superficie de terreno es igual a 7.0.
B: La muestra de superficie de terreno es alcalina.
e) A: Un paciente tiene SIDA.
B: El paciente ha recibido una transfusin de sangre.
f ) A: El animal es un mamfero.
B: El animal es un delfn.
C: El animal est cubierto de pelo.
g) A: El rbol es de hoja perenne.
B: El rbol es un encino.
C: El rbol es un cornejo.
h) A: El bosque es una extensin virgen.
B: El bosque fue talado hace 10 aos.
6. Tratando a bebs prematuros, la cantidad de oxgeno recibido puede afectar a su vi-
sin. Se puede categorizar a cada nio tratado como de visin normal, de lesin me-
dia, de lesin moderada, de lesin grave o ciego. Un estudio muestra que la probabili-
dad de que ocurra cada uno de estos sucesos es de 0.80, 0.10, 0.06, 0.02 y 0.02,
respectivamente.
a) Determinar la probabilidad de que un nio nazca con visin defectuosa.
b) Determinar la probabilidad de que un nio nazca con visin normal.
7. Un determinado anlisis qumico tiene un alcance ms bien limitado. Generalmente, el
15 % de las muestras estn demasiado concentradas para que puedan contrastarse sin
llevar a cabo una dilucin previa, el 20 % estn contaminadas con algn material obsta-
culizante que deber ser eliminado antes de llevar a cabo el anlisis. El resto puede ser
analizado sin pretratamiento. Supongamos que las muestras no estn en ningn caso
concentradas y contaminadas a la vez. Cul es la probabilidad de que una muestra
seleccionada aleatoriamente pueda ser contrastada sin pretratamiento?
106 Estadstica para Biologa y Ciencias de la Salud
8. La diabetes constituye un problema delicado durante el embarazo, tanto para la salud de
la madre como para la del hijo. Entre las embarazadas diabticas se presentan toxemias
en un 25 % de los casos, hidroamnios en un 21 % y deterioro fetal en un 15 %. En un 6 %
de los casos se dan otras complicaciones. Supongamos que no fuera posible que dos de
estas complicaciones pudiesen presentarse simultneamente en un mismo embarazo.
Cul es la probabilidad de que, seleccionando aleatoriamente a una embarazada diab-
tica, demos con un embarazo normal? Cul es la probabilidad de que exista algn tipo
de complicacin?
9. El ndice de contaminacin atmosfrica elaborado por una central meteorolgica clasi-
fica los das como: extremadamente buenos, buenos, tolerables, malos o extremada-
mente malos. La experiencia anterior indica que el 50 % de los das se clasifican como
extremadamente buenos, el 22 % como buenos, el 18 % como tolerables, el 8 % como
malos y el 2 % como extremadamente malos. Se emite un pronstico de los das clasifi-
cados como malos o extremadamente malos. Cul es la probabilidad de que un deter-
minado da, elegido aleatoriamente, est incluido en ese pronstico?
10. Estudios sobre la depresin muestran que la aplicacin de un determinado tratamiento
mejora el estado del 72 % de aquellas personas sobre las que se aplica, no produce
efecto alguno en un 10 %, y empeora el estado del resto. Se trata a un paciente que sufre
de depresin, por estos medios, cul es la probabilidad de que empeore? Cul es la
probabilidad de que el tratamiento no vaya en detrimento de su estado?
11. Los rboles de Mount Mitchell y otras zonas del sur de los Apalaches se han visto
afectados por la polucin. Supongamos que en una zona concreta el 40 % de los rboles
de hoja perenne presentan daos leves, el 15 % daos moderados, el 10 % estn muy
afectados, el 8 % estn muertos y el resto no estn afectados. Si se selecciona aleatoria-
mente un rbol para un estudio, cul es la probabilidad de que est:
a) No afectado.
b) Muy poco afectado.
c) Gravemente afectado o muerto.
d) Ni gravemente afectado ni muerto.
12. La distribucin del grupo sanguneo de los individuos de raza negra de Estados Unidos es
0: 49 % B: 20 %
A: 27 % AB: 4 %
Si se lleva a una mujer de raza negra a una clnica de urgencias, cul es la probabilidad
de que sea del tipo A, B o AB? (Basado en la informacin de Technical Manual, Ameri-
can Association of Blood Banks, 1985.)
13. Demostrar el Teorema 3.1.1. Sugerencia: Obsrvese que S = S o y que S y son
mutuamente excluyentes. Aplicar los Axiomas 3 y 1.
14. Demostrar el Teorema 3.1.2. Sugerencia: Obsrvese que S = A o A y que A y A son
mutuamente excluyentes. Aplicar los Axiomas 1 y 3.
15. Sean A y B dos sucesos tales que A est contenido en B (vase la Fig. 3.6). Obsrvese que
B = A o (B pero NO A)
y que los sucesos de la parte derecha de la igualdad son mutuamente excluyentes.
a) Utilizar la informacin y los teoremas y axiomas desarrollados en esta seccin para
probar que
P[A] m P[B]
Teora de probabilidades y resolucin de problemas 107
A
B
Figura 3.6. Diagrama de Venn mostrando el suceso A con-
tenido en el suceso B.
b) Sea C un suceso cualquiera. Probar que P[C] m 1 utilizando el apartado a y los
teoremas y axiomas estudiados. Se puede comprobar as la afirmacin hecha en el
Captulo 2 acerca de que las probabilidades no pueden exceder de 1.
3.2. REGLA GENERAL DE LA ADICIN
En la Seccin 3.1, vimos cmo tratar cuestiones relativas a la probabilidad de que se produzca
uno u otro de dos sucesos mutuamente excluyentes. En esta seccin, vamos a examinar la
regla general de la adicin. Su propsito es permitir el manejo del caso ms general, calcular
la probabilidad de que ocurra al menos uno de dos sucesos que no es necesario que sean
mutuamente excluyentes.
Comenzaremos por observar el diagrama de Venn de la Figura 3.7. Obsrvese que A
1
y A
2
no son mutuamente excluyentes. Por tanto, la regin sombreada no es una regin vaca. Si
calculamos P[A
1
o A
2
] como en la Seccin 3.1, concluiremos que
P[A
1
o A
2
] = P[A
1
] + P[A
2
]
No obstante, dado que la regin sombreada est contenida en A
1
y A
2
, incluimos P[A
1
y A
2
]
dos veces en el clculo anterior. Para corregirlo, debemos restar P[A
1
y A
2
] del miembro de la
derecha de la ecuacin. La expresin resultante es la regla general de la adicin.
Teorema 3.2.1. Regla general de la adicin. Sean los sucesos A
1
y A
2
. Entonces
P[A
1
o A
2
] = P[A
1
] + P[A
2
] P[A
1
y A
2
]
La palabra clave para, dado un determinado problema, saber si puede aplicarse en l la
regla general de la adicin, es la palabra o. Por el tercer axioma de la probabilidad y la
regla general de la adicin, se puede decir con seguridad que si en un problema de probabili-
A
1
A
2
S
Figura 3.7. A
1
y A
2
no son mutuamente excluyentes.
La zona sombreada no es una zona vaca.
108 Estadstica para Biologa y Ciencias de la Salud
dad aparece la palabra o, la adicin est casi siempre involucrada. En las Secciones 3.5 y 3.6
se ver que la palabra y es un indicativo de que se multiplicarn los nmeros para resolver
el problema de que se trate. El empleo de esta regla se explica en el Ejemplo 3.2.1.
Ejemplo 3.2.1. Se estima que el 30 % de los habitantes de Estados Unidos son obesos (A
1
)
y que el 3 % sufre diabetes (A
2
). El 2 % es obeso y padece de diabetes. Cul es la probabili-
dad de que una persona aleatoriamente elegida sea obesa o sufra diabetes? Se nos da
P[A
1
] = 0.3, P[A
2
] = 0.03 y P[A
1
y A
2
] = 0.02. Hemos de hallar P[A
1
o A
2
]. Aplicando la regla
general de la adicin, obtenemos:
P[A
1
o A
2
] = P[A
1
] + P[A
2
] P[A
1
y A
2
]
= 0.30 + 0.03 0.02
= 0.31
La regla general de la adicin no slo es til para calcular P[A
1
o A
2
], sino que, disponien-
do de la informacin adecuada, podemos utilizarla para hallar P[A
1
y A
2
]. El Ejemplo 3.2.2
ilustra cmo se hace.
Ejemplo 3.2.2. Se sabe por informes recientes que el 18 % de los estudiantes de segunda
enseanza sufre depresin en algn perodo de su escolarizacin (A
1
), que el 2 % piensa en el
suicidio (A
2
) y que el 19 % padece depresin o piensa en el suicidio. Cul es la probabilidad
de que un estudiante de secundaria elegido aleatoriamente sufra depresin y piense en el
suicidio? Cul es la probabilidad de que un estudiante de secundaria elegido aleatoriamente
sufra depresin pero no piense en el suicidio?
Sabemos que P[A
1
] = 0.18, P[A
2
] = 0.02 y P[A
1
o A
2
] = 0.19. Hemos de hallar, primero,
P[A
l
y A
2
]. Aplicando la regla general de la adicin, obtenemos
P[A
1
o A
2
] = P[A
1
] + P[A
2
] P[A
1
y A
2
]
o bien
P[A
1
y A
2
] = P[A
1
] + P[A
2
] P[A
1
o A
2
]
= 0.18 + 0.02 0.19
= 0.01
Para resolver la segunda cuestin propuesta, utilizamos la informacin dada por el diagra-
ma de Venn. Puesto que P[A
1
y A
2
] = 0.01, sabemos que el 1 % del rea total del diagrama
corresponde a la regin representada por A
l
y A
2
, como muestra la Figura 3.8a. Puesto que
P[A
1
] = 0.18, del rea total, el 18 % corresponde a la regin marcada por A
1
; dado que (A
1
y
A
2
) est contenido en A
1
, el 17 % del rea corresponde a la regin sombreada de la Figu-
ra 3.8b. Anlogamente, puesto que P[A
2
] = 0.02 y (A
1
y A
2
) est contenido en A
2
, el 1 % del
rea corresponde a la regin sombreada de la Figura 3.8c. Ya que P[S] = 1 y que tenemos ya
contabilizado el 17 + 1 + 1 = 19 % del rea, el 81 % restante corresponde a la regin sin
sombrear de la Figura 3.8d. Ahora podemos resolver la segunda cuestin buscando la regin
apropiada en el diagrama de Venn, es decir, A
1
y A
2
. Puede verse que la probabilidad asociada
a esta regin es 0.17. Por lo tanto, la probabilidad de que un estudiante de segunda enseanza
sufra depresin pero no haya pensado en el suicidio es 0.17.
Obsrvese que, si los porcentajes registrados en problemas como stos estn basados en
los datos de poblacin, las probabilidades calculadas utilizando la regla general de la adicin
son exactas. Sin embargo, si los porcentajes estn basados en muestras extradas de una
poblacin mayor, las probabilidades calculadas son frecuencias relativas. Son aproximacio-
nes a la probabilidad real de que se produzca el suceso en cuestin. Dado que muchos porcen-
Teora de probabilidades y resolucin de problemas 109
A
1
A
1
A
1
A
1
A
2
A
2
A
2
A
2
S
S
S
S (1)
0.01 0.01
0.17
0.01 0.01 0.17
0.17
0.81
0.01
0.01
( ) a
( ) c
( ) b
( ) d
Figura 3.8. Clculo de probabilidades mediante los diagramas de Venn. (a) P[A
1
y A
2
] = 0.01;
(b) P[A
1
] = 0.18; (c) P[A
2
] = 0.02; (d) P[A
1
o A
2
] = 0.19, lo cual implica que P[(A
1
o A
2
)] = 0.81.
tajes de los registrados en la bibliografa se basan en muestras, la mayora se interpreta co-
rrectamente como frecuencias relativas. Utilizamos la palabra probabilidad, pero entendien-
do que las probabilidades dadas y calculadas utilizando los teoremas de este captulo son, en
muchos de los casos, slo aproximaciones.
EJERCICIOS 3.2
1. Supongamos que P[A
1
y A
2
] = 0.04, P[A
1
] = 0.06, P[A
2
] = 0.10. Hallar
a) P[A
1
o A
2
]
b) P[A
1
y A
2
]
c) P[A
1
y A
2
]
d) P[A
1
y A
2
]
e) Disear un diagrama de Venn para visualizar la descomposicin de las probabilida-
des dentro del espacio muestral, segn se ha descrito en la Figura 3.8.
2. Supongamos que P[A
1
o A
2
] = 0.30, P[A
1
] = 0.15, P[A
2
] = 0.20. Hallar
a) P[A
1
y A
2
]
b) P[A
1
y A
2
]
c) P[A
1
y A
2
]
d) P[A
1
o A
2
]
e) P[(A
1
o A
2
)]
f ) Disear un diagrama de Venn para visualizar la descomposicin de las probabilida-
des dentro del espacio muestral, segn se ha descrito en la Figura 3.8.
3. Para satisfacer la demanda de los granjeros de utilizar pinos blancos jvenes como pro-
teccin contra el viento, los empleados del servicio forestal tomaron muestras de los
granjeros del estado. Hallaron que el 30 % haba adquirido rboles del servicio forestal en
aos anteriores, el 40 % haba anticipado el pedido de rboles para el ao siguiente, el
10 % haba adquirido rboles en el pasado y anticipado el pedido de rboles para el ao
siguiente. Cul es la probabilidad de que un granjero seleccionado aleatoriamente haya
adquirido rboles en el pasado o haya anticipado el pedido para el ao siguiente? Cul
110 Estadstica para Biologa y Ciencias de la Salud
es la probabilidad de que un granjero seleccionado aleatoriamente haya adquirido rboles
en el pasado pero no haya realizado ningn pedido por adelantado para el ao siguiente?
Si a cada granjero que solicita rboles se le conceden como mximo 100 y hay 5000
granjeros en el estado, hallar una aproximacin del nmero mximo de rboles necesa-
rios para completar todas las peticiones para el ao siguiente.
4. Los datos recogidos en un banco de sangre concreto indican que el 0.1 % de todos los
donantes da positivo en el test para el virus de inmunodeficiencia humana (VIH) y el 1 %
da positivo para el test del herpes. Si el 1.05 % da positivo para uno u otro de estos
problemas, cul es la probabilidad de que un donante seleccionado aleatoriamente no
tenga ninguno de estos problemas? Le sorprendera hallar un donante con ambos pro-
blemas? Explquelo basndose en la probabilidad estimada de que suceda.
5. Se ha determinado que el 62 % de todos los servicios sanitarios est financiado por fun-
daciones privadas, que el 70 % se financia por medio de cooperativas de empresarios y
trabajadores, y que el 50 % se financia tanto por fundaciones privadas como por medio de
cooperativas de empresarios y trabajadores. Cul es la probabilidad de que un paciente
elegido al azar sea atendido por unos servicios sanitarios que dependan financieramente
de una fundacin privada o de una cooperativa de empresarios y trabajadores? Cul es
la probabilidad de que un paciente elegido al azar sea atendido por unos servicios sanita-
rios financieramente dependientes de una cooperativa de empresarios y trabajadores,
pero no de una fundacin privada?
6. Ciertos estudios muestran que un 12 % de las personas tratadas por mdicos es atendido en
el hospital. De ellas el 1% sufre alguna alergia a medicamentos, y el 12.4 % recibe aten-
cin en un hospital o es alrgico a los medicamentos. Cul es la probabilidad de que un
paciente elegido al azar reciba atencin en un hospital y sea alrgico a los medicamentos?
Cul es la probabilidad de que un paciente elegido al azar sea ingresado en un hospital
pero no sufra alergia a medicamentos? Cul es la probabilidad de que un paciente elegido
al azar sea alrgico a los medicamentos pero no reciba atencin en un hospital?
7. Un qumico analiza muestras de agua de mar para detectar la presencia de dos metales
pesados: plomo y mercurio. Encuentra que el 38 % de las muestras tomadas en las proxi-
midades de la desembocadura de un ro en cuyas orillas se localizan numerosas plantas
industriales tiene niveles txicos de plomo o de mercurio, y que el 32 % tiene nivel txico
de plomo. De estas muestras, el 10 % contiene un nivel alto de ambos metales. Cul es
la probabilidad de que una muestra dada contenga un alto nivel de mercurio? Cul es la
probabilidad de que una muestra dada contenga solamente plomo?
8. Si a ratones de una cierta raza suiza se les suministra 1 mg de compuesto A por kg de peso,
muere el 50% de los animales (una dosis que mata a un 50% de los animales puestos a
prueba se conoce como la LD
50
del frmaco o veneno) y el 40 % de los animales tratados,
supervivientes o no, presenta cianosis (es decir, su piel tiene un tono azulado que indica
una inadecuada oxigenacin en la sangre). Una cuarta parte de los animales muere y mues-
tra una evidente cianosis. Cul es la probabilidad de que un animal al que se le ha admi-
nistrado el compuesto A (la dosis LD
50
) muera o est ciantico? Cul es la probabilidad de
que un animal al que se le ha administrado el compuesto A viva y est ciantico?
3.3. PROBABILIDAD CONDICIONADA
En esta seccin introducimos la nocin de probabilidad condicionada. El nombre es, en s
mismo, significativo de lo que vamos a hacer. Pretendemos determinar la probabilidad de que
ocurra un suceso A
2
condicionado por el hecho de que algn otro suceso A
1
haya ocurrido
ya. Las palabras clave a las que debe prestarse atencin para identificar una probabilidad
Teora de probabilidades y resolucin de problemas 111
condicionada son si y dado que. Utilizaremos la notacin P[A
2
| A
1
] para designar la probabi-
lidad del suceso A
2
condicionada por el hecho de que haya sucedido previamente A
1
. Obsr-
vese que, a pesar de que en esta expresin intervienen dos sucesos, se alude nicamente a una
probabilidad. El primero de los sucesos reseados es aquel que no sabemos si ocurrir o no; la
barra se lee dado que; el segundo suceso es el que se supone que ha ocurrido ya.
Ejemplo 3.3.1. Una mujer tiene tres hijos. Cul es la probabilidad de que los dos primeros
sean chicos (A
1
)? Cul es la probabilidad de que exactamente dos sean chicos (A
2
)? Cul es
la probabilidad de que se satisfagan ambas condiciones?
Estas son preguntas no condicionadas y fciles de contestar utilizando un diagrama en
rbol (vase Fig. 3.9). Si suponemos que cada hijo tiene la misma posibilidad de ser chico que
chica, entonces los ocho puntos muestrales representados en el diagrama son igualmente pro-
bables. Por esta razn, puede usarse la aproximacin clsica para calcular las probabilidades
deseadas. En particular
P[A
1
] =
2
8
P[A
2
] =
3
8
P[A
1
y A
2
] =
1
8
Supongamos que ya sabemos que los dos primeros hijos son chicos. Ahora, cul es la proba-
bilidad de que haya exactamente dos chicos en la familia? Esto es, cul es P[A
2
| A
1
]? Puesto
que sabemos que los dos primeros hijos son chicos, el espacio muestral para el experimento
lgicamente no estar constituido por los ocho puntos, sino que, de hecho, ahora contendr
solamente los dos puntos MMM y MMF. El resto de los puntos no son consistentes con la
informacin que tenemos. La pregunta condicionada planteada se resuelve mediante este nue-
vo espacio muestral formado por dos puntos. Ya que estos dos puntos son igualmente proba-
bles, y slo uno de ellos corresponde a tener exactamente dos chicos en la familia,
P[A
2
| A
1
] = P[exactamente dos chicos | los dos primeros son chicos] =
1
2
En este caso observamos que
1
2
= P[A
2
| A
1
] | P[A
2
] =
3
8
. La nueva informacin afecta a la
probabilidad asignada al suceso de que exactamente dos de los nios sean varones.
El Ejemplo 3.3.1 es una simplificacin del problema general. La mayor parte de las pre-
guntas que se plantean sobre probabilidad condicionada se refiere a situaciones en las que no
es conveniente trabajar directamente con un espacio muestral restringido explcitamente. As
que es necesario desarrollar una frmula para la probabilidad condicionada que, en esencia,
M
M
M
M
M
M
F
F
F
F
F
M
F
F
Primer
hijo
Segundo
hijo
Tercer
hijo
Figura 3.9. Orden de nacimiento en el rbol
filial de la familia.
112 Estadstica para Biologa y Ciencias de la Salud
reduzca automticamente el espacio muestral hasta hacerlo coherente con la informacin
dada, y que permita calcular la probabilidad pedida relativa a este espacio muestral reducido.
Para encontrar esta frmula slo necesitamos mirar el modelo del Ejemplo 3.3.1. Con ello es
ms que suficiente. Obsrvese que
P[A
2
| A
1
] =
1
2
=
1
8
2
8
=
P[A
1
y A
2
]
P[A
1
]
Esta relacin no es exclusiva de este problema. Se trata en realidad de la definicin
general de la probabilidad condicionada del suceso A
2
, dado A
l
.
Definicin 3.3.1. Probabilidad condicionada. Sean A
1
y A
2
dos sucesos tales que
P[A
1
] | 0. La probabilidad condicionada de A
2
dado A
1
, denotada P[A
2
| A
1
] se define por
P[A
2
| A
1
] =
P[A
1
y A
2
]
P[A
1
]
En la prctica, la condicin P[A
1
] |0 no es restrictiva. Si A
1
ya ha ocurrido, ha de tener
originalmente una probabilidad no nula. La Definicin 3.3.1 se recuerda fcilmente del modo
siguiente:
Probabilidad condicionada =
P[ambos sucesos]
P[suceso dado]
Ejemplo 3.3.2. Se estima que el 15 % de la poblacin adulta padece hipertensin, pero que
el 75 % de todos los adultos cree no tener este problema. Se estima tambin que el 6 % de la
poblacin tiene hipertensin pero no es consciente de padecer dicha enfermedad. Si un pa-
ciente adulto opina que no es hipertenso, cul es la probabilidad de que la enfermedad, de
hecho, exista?
Siendo A
1
el suceso el paciente no cree tener la enfermedad y A
2
el suceso la enfermedad
existe, se nos ha dado que P[A
1
] = 0.75, P[A
2
] = 0.15 y P[A
1
y A
2
] = 0.06. Pretendemos hallar
P[A
2
| A
1
].
Por la Definicin 3.3.1,
P[A
2
| A
1
] =
P[ambos]
P[dado]
=
P[A
1
y A
2
]
P[A
1
]
=
0.06
0.75
= 0.08
Hay un 8 % de posibilidades de que un paciente que opine que no tiene problemas de hiperten-
sin padezca, de hecho, la enfermedad. Del mismo modo podemos preguntar: si la enfer-
medad existe, cul es la probabilidad de que el paciente lo sospeche? Es decir, cul es
P[A
1
| A
2
]? Antes de aplicar la Definicin 3.3.1, organicemos los datos por medio de un
diagrama de Venn, como se muestra en la Figura 3.10. Por la Definicin 3.3.1,
P[A
1
| A
2
] =
P[ambos]
P[dado]
=
P[A
1
y A
2
]
P[A
2
]
Teora de probabilidades y resolucin de problemas 113
A
1
A
2
S
0.69 0.06
0.09
0.16
Figura 3.10. A
1
= No creen que exista la enfermedad.
A
2
= La enfermedad existe.
Observando el diagrama de Venn, tenemos
P[A
1
y A
2
]
P[A
2
]
=
0.09
0.15
= 0.60
Es decir, si el paciente opina que tiene hipertensin, existe un 60 % de probabilidad de que
est en lo cierto.
EJERCICIOS 3.3
1. Supongamos que una familia tiene cuatro hijos.
a) Hallar la probabilidad de que exactamente dos sean varones.
b) Cul es la probabilidad de que exactamente dos sean varones si el nacido en primer
lugar es varn?
c) Hallar la probabilidad de que el ltimo hijo nazca varn.
d) Cul es la probabilidad de que el ltimo hijo nazca varn si los tres primeros son
mujeres?
2. Supongamos que una plaga afecta al 50 % de todos los cornejos de un rea dada. Se toma
una muestra de tres rboles y cada uno se clasifica como afectado por la plaga (s) o no
afectado (n). Dado que P[afectado] = P[no afectado], cada uno de los ocho resultados
posibles del experimento tiene la misma probabilidad.
a) Dibujar un rbol para representar los ocho elementos muestrales.
b) Hallar P[al menos dos estn afectados].
c) Hallar P[al menos dos estn afectados | el primero est afectado].
d) Hallar P[exactamente dos estn afectados | el primero est afectado].
3. Un estudio indica que el 10 % de la poblacin de Estados Unidos tiene 65 o ms aos, y
que el 1 % de la poblacin total padece insuficiencia cardaca moderada. Adems, el
10.4 % de la poblacin tiene 65 o ms aos o padece insuficiencia cardaca moderada.
Eligiendo a un individuo al azar:
a) Hallar la probabilidad de que el individuo tenga 65 o ms aos y padezca de insufi-
ciencia cardaca moderada.
b) Utilizar la solucin del apartado a para organizar los datos en un diagrama de Venn.
c) Si un individuo tiene 65 o ms, cul es la probabilidad de que padezca de insufi-
ciencia cardaca moderada?
d) Si un individuo es menor de 65 aos, cul es la probabilidad de que padezca de
insuficiencia cardaca moderada?
4. En un estudio sobre alcohlicos se informa de que el 40 % de los mismos tiene padre
alcohlico y el 6 %, madre alcohlica. El 42 % tiene al menos uno de los padres alcohli-
cos. Cul es la posibilidad de que elegido uno al azar
a) Tenga ambos padres alcohlicos?
114 Estadstica para Biologa y Ciencias de la Salud
b) Tenga una madre alcohlica si lo es el padre?
c) Tenga una madre alcohlica pero no un padre alcohlico?
d) Tenga una madre alcohlica si el padre no lo es?
5. En un estudio sobre sensibilidad, se practican necropsias en encfalos de pacientes afec-
tados de demencia senil o degeneracin arteriosclertica cerebral. Se informa de que el
35 % tiene alteraciones asociadas principalmente con la demencia senil, el 45 % tiene
alteraciones asociadas con la degeneracin arteriosclertica cerebral, y el 20 % muestra
signos de ambas. Basndose en esta informacin cul es la probabilidad de que un
paciente con el cerebro daado a consecuencia de una degeneracin arteriosclertica
tenga tambin alteraciones cerebrales caractersticas de la demencia senil? Cul es la
probabilidad de que un paciente que no tiene alteraciones debidas a la demencia senil
padezca degeneracin arteriosclertica cerebral?
6. En un estudio de aguas localizadas en las proximidades de centrales elctricas y de otras
plantas industriales que vierten sus desages en el hidrosistema, se ha llegado a la con-
clusin de que el 5 % muestra signos de contaminacin qumica y trmica, el 40 % de
contaminacin qumica y el 35 % de contaminacin trmica. Suponiendo que los resulta-
dos del estudio reflejen correctamente la situacin general, cul es la probabilidad de
que un arroyo que muestra cierta contaminacin trmica presente tambin signos de
contaminacin qumica? Cul es la probabilidad de que un arroyo que muestra cierta
contaminacin qumica no presente signos de contaminacin trmica?
Algn da
esta instalacin
ser un
segura
99 %
sta es la %
99
100
1
100
Desgraciadamente
que no lo ser
Stayskal
80 Chicago
Tribune
Planta de
energa nuclear
(? Copyright 1980. Chicago Tribune Company. Todos los derechos reservados. Reproducido con
autorizacin.)
7. Unos estudios muestran que los ejemplares de una cierta raza de liebres de alta montaa
(liebre esquiadora) mueren antes de lo normal, aun en ausencia de depredadores o de
enfermedad conocida alguna. Dos de las causas de muerte identificadas son: baja canti-
dad de azcar en sangre y convulsiones. Se estima que el 7 % de los animales presenta
ambos sntomas, el 40 % tiene bajo nivel de azcar en sangre, y el 25 % sufre convulsio-
nes, cul es el porcentaje de muertes producidas por causas que no sean las que hemos
mencionado? Cul es la probabilidad de que un animal elegido aleatoriamente que tiene
bajo nivel de azcar en sangre sufra tambin convulsiones?
Teora de probabilidades y resolucin de problemas 115
8. Utilizar los datos del Ejercicio 3 de la Seccin 3.2 para hallar la probabilidad de que un
granjero pida rboles para el ao que viene dado que ya ha pedido rboles en el pasado.
Hallar la probabilidad de que un granjero no efecte ningn pedido de rboles para el ao
que viene dado que ya ha adquirido rboles en el pasado. Cul es la relacin matemtica
entre las dos respuestas? Explicar por qu ha sucedido esto.
9. Utilizar los datos del Ejercicio 4 de la Seccin 3.2 para hallar la probabilidad de que un
donante seleccionado aleatoriamente sea negativo para el test del VIH. Hallar la probabi-
lidad de que un donante seleccionado aleatoriamente sea negativo para el test del VIH
dado que da negativo en el test del herpes.
3.4. TESTS DE DIAGNSTICO Y RIESGO RELATIVO
Una de las aplicaciones ms tiles de las probabilidades en el campo mdico o biolgico est en
el rea de los tests de diagnstico. Un test de diagnstico es un test para detectar la presencia de
alguna condicin especfica en una unidad experimental. En el campo mdico, generalmente
intentamos detectar la presencia de una enfermedad, un factor gentico o alguna otra condicin
especfica en un ser humano. Sera deseable que estos tests fueran seguros en el sentido de que
siempre detectaran la condicin cuando de hecho est presente y nunca la indicaran cuando el
individuo no tiene dicha condicin. Desgraciadamente, esto no es as. Slo podemos esperar
que los tests existentes actualmente no den resultados errneos muy a menudo.
En un test de diagnstico, o bien cada sujeto es realmente positivo, lo que significa que la
condicin para la que est diseado el test est presente, o bien el sujeto en realidad es
negativo. El test, en s mismo, puede dar positivo, lo que significa que se ha detectado la
presencia de la condicin, o no darlo. Esto garantiza que cada sujeto entrar exactamente en
una de entre cuatro categoras. stas son:
1. La condicin est presente y el test detecta su presencia. Es decir, un sujeto realmente
positivo da positivo. En este caso no se ha cometido ningn error.
2. La condicin est presente pero el test no detecta su presencia. Cuando un sujeto
realmente positivo da negativo, decimos que hemos obtenido un resultado falso ne-
gativo. En este caso se ha cometido un error.
3. La condicin no est presente pero el test detecta su presencia. Cuando un sujeto
realmente negativo da positivo, decimos que se ha obtenido un resultado falso positi-
vo. Se ha cometido un error.
4. La condicin no est presente y el test no indica su presencia. Un sujeto realmente
negativo da negativo. No se ha cometido ningn error.
Obsrvese que es posible cometer dos tipos de errores. Esperamos no cometer ninguno
pero cualquiera de ellos es posible. Un test ideal es aquel en el que la probabilidad de cometer
cualquier error es pequea. A continuacin se definen estas probabilidades, llamadas coefi-
cientes de error.
Definicin 3.4.1. Coeficiente de falsos positivos. El coeficiente de falsos positivos de un
test se denota por a (alfa) y viene dado por
a = P[el test resulta positivo | el sujeto es realmente negativo]
Definicin 3.4.2. Coeficiente de falsos negativos. El coeficiente de falsos negativos de un
test se denota por b (beta) y viene dado por
b = P[el test resulta negativo | el sujeto es realmente positivo]
La Tabla 3.1 resume la terminologa introducida hasta ahora.
116 Estadstica para Biologa y Ciencias de la Salud
Tabla 3.1. Terminologa asociada con las pruebas de diagnstico
Estado real
Condicin ausente () Condicin presente (+)
Resultados
del test
Condicin encontrada (+) Realidad pero test +
Falso positivo
P[falso positivo] = a
Realidad + y test +
No hay error
Condicin no encontrada () Realidad y test
No hay error
Realidad + pero test
Falso negativo
P[falso negativo] = b
Al realizar un test para detectar una enfermedad, un error causado por un alto coeficiente
de falsos positivos puede ocasionar inconvenientes y gastos a la persona implicada. A sta se le
detecta una enfermedad que no est presente y como resultado probablemente busque un trata-
miento para un problema inexistente. Un error resultante de un alto coeficiente de falsos negati-
vos es potencialmente peligroso. En este caso, el sujeto desconoce una condicin existente y, por
lo tanto, no buscar el tratamiento que necesita. Con una tabla de frecuencias pueden hallarse las
aproximaciones de estos coeficientes mediante la tcnica descrita en el Ejemplo 3.4.1.
Ejemplo 3.4.1. El suero de una mujer embarazada puede ser analizado por medio de un
procedimiento llamado electroforesis en gel de almidn. Este procedimiento permite detectar
la presencia de una zona protenica llamada zona de embarazo, la cual se supone que es un
indicador de que el nio es una hembra. Para investigar las propiedades de este test se selec-
cionaron 300 mujeres para su estudio. En la Tabla 3.2 se dan los resultados del test y los sexos
de los nios nacidos. Obsrvese que, en este caso, el nico valor de la tabla predeterminado o
fijado por el experimentador es el tamao total de la muestra. Todos los otros son aleatorios,
los totales por filas, los totales por columnas y las frecuencias de las celdas. Por definicin el
coeficiente de falsos positivos es
a = P[test + | realidad ]
Para estimar esta probabilidad condicionada debemos estimar P[realidad ] y P[test + y
realidad ]. Utilizando el mtodo de la frecuencia relativa para hallar la probabilidad, P[reali-
dad ] ^147/300 y P[test + y realidad ] ^51/300. La definicin de la probabilidad condi-
cionada nos conduce a
a X
51/300
147/300
=
51
147
= 0.3469
Tabla 3.2
Sexo
Zona de embarazo Varn (realidad ) Mujer (realidad +)
Presente (test +) 51 (aleatorio) 78 (aleatorio) 129 (aleatorio)
Ausente (test ) 96 (aleatorio) 75 (aleatorio) 171 (aleatorio)
147 (aleatorio) 153 (aleatorio) 300 (fijo)
Teora de probabilidades y resolucin de problemas 117
Este resultado puede obtenerse por observacin directa de la Tabla 3.2 considerando que, una
vez que sabemos que el sujeto es realmente negativo, la atencin deber centrarse inmediata-
mente en los 147 casos de la columna 1. De stos, 51 dieron positivo. Por tanto, el sentido
comn apunta a 51/147 como el coeficiente de falsos positivos estimado. Para calcular b,
obsrvese que de los 153 sujetos realmente positivos, 75 dieron negativo. Por lo tanto
b X
75
153
= 0.4902
Dado que son coeficientes de error estimados, el test no parece ser efectivo para determinar el
sexo de un nio. (Basado en datos registrados en Human Heredity, vol. 20, 1970, pg. 530.)
Tambin pueden considerarse otros dos coeficientes, la especificidad y la sensibilidad.
Estos coeficientes dan la probabilidad de tomar las decisiones correctas en la elaboracin de
un diagnstico. Se definen en los Ejercicios 5 y 6 de esta seccin.
La tcnica descrita en el Ejemplo 3.4.1 puede emplearse para estimar las probabilidades
condicionadas en temas distintos de los tests de diagnstico. Sin embargo, es preciso hacer
una llamada de atencin. Si todos los totales por filas y columnas son aleatorios, puede
hallarse la aproximacin de cualquier probabilidad condicionada. De lo contrario, las nicas
aproximaciones de probabilidades que pueden hallarse son aquellas en las que el investigador
fija los tamaos de la muestra para los sucesos dados. La razn se explica en el Ejemplo 3.4.2.
Ejemplo 3.4.2. Supongamos que se ha desarrollado un nuevo test domstico para detectar
el embarazo. Se realiza un experimento para hallar la aproximacin de los coeficientes de falsos
positivos y de falsos negativos del test. Para participar en el estudio se seleccionaron cinco
mujeres que se saba que estaban embarazadas y 10 mujeres no embarazadas. Se efectu el
nuevo test en cada una de ellas y el resultado se indica en la Tabla 3.3 (los datos son ficticios).
A partir de estos datos, es posible hallar una aproximacin fiable de algunas probabilida-
des condicionadas mientras que para otras, no. Por ejemplo, en el caso de
P[est embarazada | test indica embarazo]
no puede hallarse la aproximacin, pero para
P[test indica embarazo | est embarazada]
s es posible. Cul es la diferencia entre ambos? Simplemente sta: en la primera, se debe
hallar la aproximacin de la probabilidad de que una persona seleccionada aleatoriamente
est embarazada y el test indique embarazo a partir de los datos. Dado que el experimentador
ha fijado en cinco el nmero de mujeres embarazadas en el experimento, la probabilidad
aproximada de este suceso ha sido forzada a ser como mximo de
5
15
. Debido a esta limitacin
artificial, la probabilidad de que una persona cuyo test ha dado como resultado que est
Tabla 3.3
Estado real
No embarazadas
(realidad )
Embarazadas
(realidad +)
Embarazadas (+) 5 (fijo) 1 (fido) 6 (aleatorio)
No embarazadas () 5 (fijo) 4 (fijo) 9 (aleatorio)
10 (fijo) 5 (fijo) 15 (fijo)
118 Estadstica para Biologa y Ciencias de la Salud
embarazada, lo est realmente, no puede aproximarse a partir de este experimento. Sin embargo,
para hallar la ltima, las cinco mujeres embarazadas seleccionadas aleatoriamente por el experi-
mentador pueden entenderse como una muestra aleatoria de la poblacin de todas las mujeres
embarazadas. Por lo tanto, podemos utilizar el mtodo de la frecuencia relativa para encontrar que
la aproximacin de la probabilidad de que una mujer embarazada d positivo en el test es de
1
5
.
Hemos visto que los coeficientes de falsos positivos y de falsos negativos para un test de
diagnstico pueden aproximarse a partir de una tabla con los totales de todas las filas y
columnas, los cuales pueden variar. El Ejemplo 3.4.2 muestra que tambin pueden aproxi-
marse cuando los totales de las filas (o columnas) son fijos siempre que los totales fijos se
refieran al nmero de sujetos realmente positivos y realmente negativos del estudio.
Riesgo relativo
Algunos estudios se disean para investigar un factor que el investigador cree que puede estar
asociado con el desarrollo de una enfermedad o condicin especfica. Este factor se denomina
factor de riesgo. Para realizar el estudio se seleccionan dos muestras. Una muestra, represen-
tada mediante E, consiste en sujetos que han estado expuestos al factor de riesgo; los dems,
representados mediante E, no han estado expuestos al factor de riesgo.
En un momento dado, se clasifica cada sujeto segn tenga la enfermedad, D, o no la
tenga, D. Hay dos probabilidades condicionadas de inters. Estas son: la probabilidad de que
la enfermedad est presente dado que el sujeto estuvo expuesto al riesgo, P[D | E], y la
probabilidad de que la enfermedad est presente aunque el sujeto no estuvo expuesto al riesgo
P[D | E]. Puesto que los tamaos muestrales para los sucesos E y E son fijos, puede hacerse
un clculo aproximado de cada una de estas probabilidades utilizando la idea demostrada en
el Ejemplo 3.4.2. Puede realizarse un clculo aproximado de una medida del impacto del
factor de riesgo a partir de estas probabilidades condicionadas. Esta medida, denominada
riesgo relativo (RR), se calcula mediante:
RR X
P[D | E]
P[D | E]
Recurdese que, dado que las probabilidades utilizadas en el clculo son aproximadas, el
riesgo obtenido slo es una estimacin del riesgo relativo verdadero. Si RR = 1, significa que
no existe asociacin entre el factor de riesgo y el desarrollo de la enfermedad. Si RR > 1, se
supone que un individuo expuesto al riesgo tiene ms probabilidades de desarrollar la enfer-
medad que uno que no est expuesto al riesgo. Un valor de RR < 1 significa que un individuo
expuesto al riesgo es menos probable que desarrolle la enfermedad que uno no expuesto al
riesgo. El Ejemplo 3.4.3 muestra esta idea.
Ejemplo 3.4.3. Se ha realizado un estudio sobre la edad de la madre en el momento del
nacimiento de su hijo como factor de riesgo en el desarrollo del sndrome de la muerte sbita
del lactante (SMSL). Se seleccionaron para el estudio un total de 7330 mujeres que estaban
por debajo de los 25 aos en el momento del nacimiento del nio. De ellas, 29 tuvieron nios
afectados de SMSL. De las 11 256 mujeres seleccionadas para el estudio que tenan 25 aos o
ms en el momento del nacimiento de sus hijos, 15 tuvieron nios con SMSL. Estos datos se
muestran en la Tabla 3.4. Partiendo de esta tabla podemos observar que
P[D | E] =
29
7330
y P[D | E] =
15
11 256
Teora de probabilidades y resolucin de problemas 119
Tabla 3.4. La edad como factor de riesgo del desarrollo de SMSL
SMSL
S No
Edad
Menos de 25 aos 29 7 301 7 330 (fijo)
25 aos o ms 15 11 241 11 256 (fijo)
El riesgo relativo estimado es
RR X
P[D | E]
P[D | E]
=
29/7330
15/11 256
= 2.96
Podemos sacar la conclusin de que un nio de una madre joven (menos de 25 aos) tiene
aproximadamente 2.96 veces ms probabilidades de sufrir un SMSL que uno nacido de una
madre de ms edad. (Basado en los datos registrados por Norman Lewak, Bea van der Berg y
Bruce Beckwith, en Sudden Infant Death Syndrome Risk Factors: Prospective Data Re-
view, Clinical Pediatrics, vol. 18, 1979, pgs. 404-411.)
Dado que se puede hacer un clculo aproximado de P[D | E] y P[D | E] a partir de los
datos de las tablas, ya que todos los totales por filas y columnas son aleatorios, puede hacerse
un clculo aproximado del riesgo relativo a partir de dichas tablas. El Ejercicio 14 de esta
seccin es un ejemplo de ello.
EJERCICIOS 3.4
1. En un estudio de 300 pares de gemelos se planteaba la cuestin de si eran realmente
idnticos. Se consideraban indicadores tales como los grupos sanguneos AB0, MN o el
factor Rh. Basndose en estos indicadores, los gemelos se clasificaban en idnticos (+)
o no idnticos (). La ltima clasificacin realizada se consideraba correcta. El propsi-
to del estudio es averiguar la capacidad de los gemelos para autoclasificarse. Los resul-
tados se muestran en la Tabla 3.5. Los datos marginales se obtienen por medio de un
proceso aleatorio. Calcular aproximadamente los coeficientes de falsos positivos y de
falsos negativos del procedimiento de autoclasificacin.
2. Se proyecta un estudio para conocer la asociacin entre color y olor en azaleas silvestres
de los montes Great Smoky. Se selecciona un rea de 5 acres de terreno y se encuentra
que contiene 200 brotes de esta planta. Cada uno de ellos se clasifica en funcin de que
tenga o no color y presencia o ausencia de olor. Los resultados se muestran en la Ta-
bla 3.6. Haciendo uso de estos datos, aproximar, si es posible, cada una de las siguientes
Tabla 3.5
Clasificacin verdadera
Autoclasificacin No idnticos () Idnticos (+)
+ 12 54
130 4
200
120 Estadstica para Biologa y Ciencias de la Salud
Tabla 3.6
Color
S No
Fragancia S 12 118
No 50 20
200
probabilidades. Si no fuera posible aproximar a partir de estos datos alguna probabili-
dad en particular, explicar por qu.
a) P[una azalea seleccionada aleatoriamente tenga olor].
b) P[una azalea seleccionada aleatoriamente tenga color].
c) P[una azalea seleccionada aleatoriamente tenga color y olor].
d) P[una azalea seleccionada aleatoriamente tenga color dado que tiene olor].
e) P[una azalea seleccionada aleatoriamente tenga olor dado que tiene color].
3. Los resultados descritos en la Tabla 3.7 se obtuvieron en un estudio diseado para
averiguar la capacidad de un cirujano anatomopatlogo para codificar correctamente
biopsias quirrgicas en malignas o benignas. Aproximar a y b a partir de estos datos.
4. Se ha realizado un estudio para poner a prueba un procedimiento de deteccin de enfer-
medades renales en pacientes con hipertensin. Aplicando el nuevo procedimiento, los
experimentadores detectan 137 pacientes hipertensos. A continuacin se determin de
nuevo la presencia o ausencia de enfermedad renal por otro mtodo. Los datos obteni-
dos se recogen en la Tabla 3.8. Utilizando estos datos, aproximar los coeficientes de
falsos positivos y de falsos negativos del test.
5. Definicin: La especificidad de un test es la probabilidad de que el resultado del test sea
negativo supuesto que el sujeto sea ciertamente negativo. Aproximar la especificidad
del test del Ejercicio 1. En general, es de desear que la especificidad de un test sea alta,
o baja? Explicarlo.
Tabla 3.7
Estado real
Informe del anatomopatlogo Benigno () Maligno (+)
+ 7 79
395 19
500
Tabla 3.8
Estado real
Enfermedad detectada Enfermedad ausente () Enfermedad presente (+)
S (+) 23 44
No () 60 10
137
Teora de probabilidades y resolucin de problemas 121
6. Definicin: La sensibilidad de un test es la probabilidad de que dicho test conduzca a un
resultado positivo supuesto que el sujeto sea efectivamente positivo. Aproximar la sen-
sibilidad del test del Ejercicio 1. En general, es de desear que la sensibilidad de un test
sea alta, o baja? Explquese.
7. Se someti a 100 pacientes y 75 sujetos normales a un test de diagnstico de la orina. En
un 60 % de los casos, el diagnstico fue positivo. Hubo tambin ocho falsos negativos.
Cul es el coeficiente de falsos positivos aproximado?
8. Aproximar la especificidad y la sensibilidad del test del Ejemplo 3.4.1. En general, qu
relacin existe entre la especificidad y el coeficiente de falsos positivos? Qu relacin
existe entre la sensibilidad y el coeficiente de falsos negativos?
9. Se ha realizado un estudio de una tcnica de inmunoensayo de enlace de enzimas (EIA)
para examinar a donantes de sangre con el fin de detectar anticuerpos frente al VIH. Los
sujetos se someten a la tcnica EIA, y la presencia o ausencia de anticuerpos se confir-
ma en una fecha posterior. En la Tabla 3.9 se proporcionan los datos.
a) Estimar el coeficiente de falsos positivos del test. Utilizarlo para hallar la especifi-
cidad de la prueba.
b) Estimar el coeficiente de falsos negativos del test. Utilizarlo para hallar la sensibili-
dad del test. (Basado en la informacin hallada en Richard Eisenstaedt y Thomas
Getzen, Screening Blood Donors for HIV Antibody: Cost Benefit Analysis,
American Journal of Public Health, vol. 78, nm. 4, abril de 1988, pgs. 450-454.)
10. El valor predictivo positivo de un test se define como la probabilidad de que un indivi-
duo sea realmente positivo dado que el resultado del test ha sido positivo. Puede hallar-
se el valor aproximado a partir de una tabla en la que todos los totales por filas y
columnas sean susceptibles de variar. Hallar la aproximacin del valor predictivo posi-
tivo del test de autoclasificacin del Ejercicio 1.
11. El valor predictivo negativo de un test se define como la probabilidad de que un indivi-
duo sea realmente negativo dado que el resultado del test ha sido negativo. Puede hallar-
se el valor aproximado a partir de una tabla en el que todos los totales por filas y
columnas sean susceptibles de variar. Hallar la aproximacin del valor predictivo nega-
tivo del test de autoclasificacin del Ejercicio 1.
12. Hallar la aproximacin de los valores predictivos positivo y negativo del test para la
enfermedad renal del Ejercicio 4.
13. Se ha realizado un estudio para determinar los sntomas clnicos que ayudan a la identi-
ficacin de la tos ferina. Un sntoma investigado es la tos aguda de cualquier duracin.
Los datos obtenidos sobre 233 nios estudiados se muestran en la Tabla 3.10. Hallar la
aproximacin del coeficiente de falsos positivos y el valor real positivo del test. Puede
parecer que slo la presencia de tos aguda es un buen indicador de la presencia de la tos
ferina? Explicarlo. (Basado en la informacin hallada en Peter Patriaca et al., Sensiti-
Tabla 3.9
Estado real
Test EIA Anticuerpos ausentes () Anticuerpos presentes (+)
+ 1 000 30
98 969 1
100 000
122 Estadstica para Biologa y Ciencias de la Salud
Tabla 3.10
Estado real
Tos presente Tos ferina
ausente ()
Tos ferina
presente (+)
S (+) 83 116
No () 32 2
233
vity and Specifity of Clinical Case Definition of Pertussis, American Journal of Public
Health, vol. 78, nm. 7, julio de 1988, pgs. 833-835.)
14. En 1985, muchas familias estadounidenses adoptaron a nios asiticos. Algunos de
estos nios haban estado expuestos al virus de la hepatitis B y eran hipotticos transmi-
sores del virus a otros. En un estudio del riesgo implicado, se obtuvieron los datos de la
Tabla 3.11. Los valores de las celdas representan el nmero de familiares cercanos a los
que se les ha detectado el virus y todos los totales por filas y columnas son aleatorios.
Hallar la aproximacin del riesgo relativo. (Basado en la informacin hallada en An-
drew Friede et al., Transmission of Hepatitis B Virus from Adopted Asian Children to
Their American Families, American Journal of Public Health, vol. 78, nm. 1, enero
de 1988, pgs. 26-29.)
15. Se sabe que los pacientes con SIDA a menudo presentan tuberculosis. Se llev a cabo
un estudio de los factores de riesgo asociados con el desarrollo de esta enfermedad en
los pacientes. Uno de los factores considerados fue la adiccin a drogas intravenosas.
De los 1992 pacientes del estudio, 307 haban abusado de las drogas por va intraveno-
sa. Cuarenta y seis de los pacientes tenan tuberculosis y, de ellos, 11 eran adictos a
drogas por va intravenosa. (Basado en los datos registrados en Timothy Cote et al.,
The present and the Future of AIDS and Tuberculosis in Illinois, American Journal of
Public Health, vol. 80, nm. 8, agosto de 1990, pgs. 950-953.)
a) Construir una tabla de 2 2 para visualizar estos datos.
b) Hallar e interpretar el riesgo relativo.
16. En un estudio sobre la relacin entre el uso regular de tinte para el cabello y el desarro-
llo de la leucemia, fueron seleccionados 577 pacientes con leucemia y 1245 personas
sin la enfermedad (controles) y fueron consultados en relacin con el uso de dicho tinte.
Cuarenta y tres pacientes y 55 controles dijeron haber estado bastante expuestos al tinte.
(Basado en la informacin hallada en Kenneth Cantor et al., Hair Dye Use and Risk of
Leukemia and Lymphoma, American Journal of Public Health, vol. 78, nm. 5, mayo
de 1988, pgs. 570-571.)
a) Completar la Tabla 3.12.
Tabla 3.11
Virus presente
S No
Expuesto al riesgo
S
No
7
4
70
228
Teora de probabilidades y resolucin de problemas 123
Tabla 3.12
Leucemia presente
S No
Utiliza tinte para cabello
S
No
43 (fijos) 55 (fijos)
577 (fijos) 1245 (fijos)
b) En este caso, es posible hallar la aproximacin del riesgo relativo usando la defi-
nicin dada en esta seccin? Explicarlo.
c) Es posible hacerse una idea de la repercusin del uso de tinte para cabello, conside-
rando el cociente
P[E | D]
P[E | D]
donde E es el suceso de que el individuo estuvo expuesto al riesgo y D es el suceso
de que la leucemia est presente. Puede estimarse cada una de las probabilidades
condicionadas implicadas en este cociente? Si es as, evaluarlo e interpretarlo.
3.5. INDEPENDENCIA
Pueden existir, fundamentalmente, dos relaciones entre sucesos. La primera, ser mutuamente
excluyentes, ha sido tratada en la Seccin 3.1; la segunda, ser independientes, se expone en
sta. El trmino matemtico tiene prcticamente el mismo significado que el lingstico.
Webster define objetos independientes como objetos que actan con independencia el uno
del otro. De este modo, dos sucesos son independientes si uno puede producirse con inde-
pendencia del otro. Es decir, la realizacin o no realizacin de uno no tiene efecto alguno
sobre la realizacin o no del otro. En numerosos casos, podemos determinar sobre una base
puramente intuitiva, si dos sucesos son independientes. Por ejemplo, los sucesos A
1
, el pa-
ciente tiene sinovitis, y A
2
, el paciente tiene apendicitis, son intuitivamente independientes. El
hecho de que el paciente tenga apendicitis nada tiene que ver con que padezca o no sinovitis,
y viceversa.
En algunos casos, no obstante, la delimitacin no es tan evidente. Necesitamos entonces
una definicin matemtica precisa del concepto, para poder determinar sin la menor duda si
dos sucesos son, de hecho, independientes. La definicin es fcil de justificar. Por ejemplo,
supongamos que, basndonos en los sntomas descritos, podamos admitir que la probabilidad
de que un paciente tenga apendicitis sea de 0.9 (A
2
). Supongamos que se nos d ahora la
informacin adicional de que el paciente tiene sinovitis (A
1
). Cul es la probabilidad de que
el paciente tenga apendicitis? Obviamente, la respuesta sigue siendo 0.9! Dado que A
1
y A
2
son independientes, la nueva informacin es irrelevante y no afecta para nada a la probabili-
dad original. De este modo la independencia entre dos sucesos A
1
y A
2
implica que la probabi-
lidad condicionada P[A
1
| A
2
] ha de ser igual a la asignada originalmente a A
2
. Esta caracteri-
zacin se adopta como definicin del trmino sucesos independientes.
Definicin 3.5.1. Sucesos independientes. Sean A
1
y A
2
dos sucesos tales que P[A
1
] |0.
Estos sucesos son independientes si y slo si
P[A
2
| A
1
] = P[A
2
]
124 Estadstica para Biologa y Ciencias de la Salud
Ejemplo 3.5.1. Se estima que entre la poblacin total de Estados Unidos, el 55 % padece
obesidad (A
1
), el 20 % es hipertenso (A
2
) y el 60 % es obeso o hipertenso. Es, de hecho,
independiente el que una persona sea obesa de que padezca hipertensin? La respuesta a esta
pregunta no es obvia. Haciendo uso del principio general de la adicin, se tiene
P[A
1
y A
2
] = P[A
1
] + P[A
2
] P[A
1
o A
2
]
En este caso
P[A
1
y A
2
] = 0.55 + 0.20 0.60 = 0.15
As que
P[A
2
| A
1
] =
P[A
1
y A
2
]
P[A
1
]
=
0.15
0.55
=
15
55
= 0.27
Puesto que P[A
2
| A
1
] = 0.27 |0.20 = P[A
2
], puede concluirse que los sucesos no son inde-
pendientes. Hablando en trminos prcticos, el hecho de que una persona tenga exceso de
peso aumenta la probabilidad de que tenga hipertensin.
Obsrvese que estamos suponiendo que las probabilidades del Ejemplo 3.5.1 se basan en
datos de la poblacin y, por lo tanto, son exactas. Aqu puede utilizarse esta Definicin 3.5.1
para probar la independencia de dos sucesos. En la prctica, esta situacin surge muy raras
veces. En cambio, habitualmente estaremos tratando con probabilidades de frecuencias relati-
vas obtenidas de muestras extradas de la poblacin. En este caso, no puede utilizarse la
Definicin 3.5.1 para probar la independencia. No obstante, en el Captulo 12 se desarrollar
un test apropiado para las muestras.
La Definicin 3.5.1 es lgica y fcil de comprender. No obstante, no es la que normal-
mente se emplea para el trmino sucesos independientes. La definicin usual puede derivarse
de lo siguiente:
P[A
2
| A
1
] =
P[A
1
y A
2
]
P[A
1
]
es siempre cierta en tanto que P[A
1
] | 0
P[A
2
| A
1
] = P[A
2
] si P[A
1
] | 0 y los sucesos son independientes.
As que, si A
1
y A
2
son independientes, ambas ecuaciones se verifican simultneamente. Te-
nemos pues para P[A
2
| A
1
], dos expresiones que conducen a
P[A
1
y A
2
]
P[A
1
]
= P[A
2
]
Multiplicando ambos miembros de la ecuacin obtenida por P[A
1
], obtenemos: P[A
1
y A
2
] =
= P[A
1
]P[A
2
], que es la definicin usual del trmino sucesos independientes.
Definicin 3.5.2. Sucesos independientes. Sean A
1
y A
2
dos sucesos. A
1
y A
2
son indepen-
dientes si y slo si P[A
1
y A
2
] = P[A
1
] P[A
2
].
Obsrvese que cuando los sucesos son independientes la probabilidad de que ambos ocu-
rran simultneamente se obtiene por multiplicacin. As, como se indic en la Seccin 3.2, la
palabra y es la clave de que las probabilidades se deben multiplicar.
Teora de probabilidades y resolucin de problemas 125
Ejemplo 3.5.2. Estudios de gentica de poblaciones indican que el 39 % de los genes que
gobiernan la informacin del factor Rh determinan que ste sea negativo. Basndose en ello,
cul es la probabilidad de que un individuo seleccionado aleatoriamente tenga Rh negativo?
El factor Rh negativo se presenta si, y slo si, el individuo implicado posee dos genes determi-
nativos de informacin negativa. Dado que cada gen se hereda de uno de los padres, puede
suponerse que el tipo de cada uno de los genes es independiente del otro. Por lo tanto, la
probabilidad de que un individuo tenga dos genes negativos es (0.39)(0.39) X0.15. (Basado
en la informacin de William Keeton y Carol McFadden, Elements of Biological Science,
W.W. Norton, Nueva York, 1983.)
La idea de independencia puede extenderse a ms de dos sucesos. Un conjunto de sucesos
se dice que es independiente siempre que cualquier subconjunto de sucesos satisfaga la propie-
dad de que la probabilidad de la aparicin simultnea sea igual al producto de las probabilida-
des individuales de cada suceso. El Ejemplo 3.5.3 demuestra esta idea en el contexto de un
problema que utiliza un diagrama en rbol. Obsrvese que ahora estamos en disposicin de
calcular probabilidades de trayectorias en el caso de que stas no sean equiprobables.
Ejemplo 3.5.3. A lo largo de un da, se pone a prueba un determinado diagnstico con tres
pacientes que no guardan relacin alguna entre ellos. El diagnstico es fiable en un 90 % de
los casos tanto cuando se da como cuando no se da la condicin para cuya deteccin se ha
diseado la prueba. Cul es la probabilidad de que exactamente dos de los tres resultados de
la prueba sean errneos?
Un diagrama de rbol nos ayudar a resolver la cuestin. En l, C representa una decisin
correcta, y E un error. En la Figura 3.11 aparecen las probabilidades correspondientes a cada
alternativa. Las ramas representan alternativas interesantes. Cada trayectoria completa repre-
senta la realizacin simultnea de tres sucesos diferentes. Por ejemplo, la trayectoria EEC
representa que se dieron simultneamente, un error con el primer paciente (E
1
), un error con el
segundo (E
2
) y una decisin correcta con el tercero (C
3
). Puesto que las pruebas se llevan a
cabo sobre pacientes diferentes y con independencia las unas de las otras, podemos suponer
que los resultados son independientes. De acuerdo con la Definicin 3.5.2, la probabilidad a
lo largo de cada trayectoria se calcular multiplicando las probabilidades que aparecen en el
recorrido. As, en este caso, se tendr P[E
1
y E
2
y C
3
] = P[E
1
]P[E
2
]P[C
3
] = (0.1)(0.1)(0.9) =
= 0.009. Dado que hay tres trayectorias en las que aparecen exactamente dos errores, la
probabilidad de obtener exactamente dos errores en cualquier orden es 3(0.009) = 0.027.
La Definicin 3.5.2 debe utilizarse con cuidado. Se debe estar seguro de que es razonable
suponer que los sucesos son independientes antes de aplicar la definicin para calcular la
probabilidad de que se produzca una serie de sucesos. En el Ejemplo 3.5.4 se ilustra el peligro
de una independencia errneamente supuesta.
0.1
0.1
0.1
0.1
0.1
0.9
0.9
0.9
0.9
0.01
0.9
0.9
0.1
0.9
E
E
E
E*
E
E*
E
C
C
C*
C
C
C
C
Figura 3.11. Resultados de una prueba de
diagnstico (tres pacientes).
126 Estadstica para Biologa y Ciencias de la Salud
Ejemplo 3.5.4. Un estudio del Comit de Energa Atmica, WASH 1400, inform de que
la probabilidad de que se produzca un accidente nuclear, parecido al que ocurri en Three
Mile Island en marzo de 1978, es de 1 en 10 millones. No obstante, el accidente se produjo.
Segn Mark Stephens, la metodologa del WASH 1400 utiliz rboles de sucesos, secuen-
cias de acciones que eran necesarias para que se produjera el accidente. Estos rboles de
sucesos no suponan ninguna interrelacin entre sucesos, que podan haber sido causados por
el mismo error de juicio o como parte de la misma accin equivocada. Los profesionales de la
estadstica que asignaron las probabilidades al proyecto WASH 1400 dijeron, por ejemplo,
que exista un riesgo del 1 por 1000 de que una de las vlvulas auxiliares de control de entrada
de agua (de las doce) estuviera cerrada. Y si existe una probabilidad de que dos vlvulas estn
cerradas, es una milsima parte de sta, es decir, de una en un milln. Pero las doce fueron
cerradas por la misma persona el 26 de marzo y una nunca fue cerrada con la otra. Los
sucesos A
1
: la primera vlvula est cerrada, y A
2
: la segunda vlvula est cerrada, no eran
independientes. Sin embargo, fueron tratados como tales al calcular la probabilidad de un
accidente. Esto, entre otras cosas, llev a una subestimacin del potencial de accidentalidad
(de Three Mile Island de Mark Stephens, Random House, 1980).
EJERCICIOS 3.5
1. Cules de los siguientes pares de sucesos cree usted que son independientes? Cules
son mutuamente excluyentes?
A
1
: Una madre padece rubola durante los tres primeros meses de embarazo.
B
1
: Un hijo nace muerto o deforme.
A
2
: Un hombre es estril.
B
2
: Un hombre padece parotiditis en la edad adulta.
A
3
: Una rata hembra y una rata macho son enjauladas juntas.
B
3
: La rata hembra es estril.
A
4
: Un nio es miope.
B
4
: Un nio es hipermtrope.
A
5
: Un terreno ha sido drenado.
B
5
: El terreno experimenta frecuentes inundaciones.
A
6
: Un conejo es inoculado con virus de poliomielitis.
B
6
: La sangre del conejo contiene anticuerpos de poliomielitis.
A
7
: Un conejo es inoculado con virus de poliomielitis.
B
7
: La sangre del conejo contiene anticuerpos de sarampin.
2. Argumentar, de forma intuitiva, que si dos sucesos que no son imposibles son mutua-
mente excluyentes, no pueden ser independientes. Probarlo matemticamente. Sugeren-
cia: demostrar que, con estas condiciones, no se puede satisfacer la Definicin 3.5.2.
3. Los contaminantes ms comunes de las aguas son de origen orgnico. Puesto que la
mayor parte de los materiales orgnicos se descompone por accin de bacterias que
requieren oxgeno, un exceso de materia orgnica puede significar una disminucin en
la cantidad de oxgeno disponible. Ello afecta eventualmente a otros organismos pre-
sentes en el agua. La demanda de oxgeno por parte de una bacteria se llama demanda
biolgica de oxgeno (DBO). Un estudio de las corrientes acuticas que circulan en las
proximidades de un complejo industrial revela que el 35 % tiene una alta DBO, el 10 %
muestra una acidez elevada y un 4 % presenta ambas caractersticas. Son independien-
tes los sucesos la corriente tiene una alta DBO y la corriente posee una acidez
elevada? Calcular la probabilidad de que la corriente tenga una acidez elevada, dado
que presenta una alta DBO.
4. El 50 % de la poblacin aproximadamente corresponde a varones, el 68 % bebe con
cierto exceso, y el 38.5 % bebe y es varn. Dado que una determinada persona aleatoria-
Teora de probabilidades y resolucin de problemas 127
mente seleccionada es varn, hallar la probabilidad de que beba. Es la condicin de
bebedor independiente del sexo?
5. La probabilidad de contraer hepatitis a partir de una unidad de sangre, es de 0.01. Un
paciente recibe dos unidades de sangre durante su estancia en un hospital. Cul es
la probabilidad de que no contraiga hepatitis como consecuencia de ello?
6. Aunque el ttanos es infrecuente en Estados Unidos, es mortal en el 70 % de los
casos. Si tres personas contraen el ttanos en el perodo de un ao, cul es la proba-
bilidad de que mueran al menos dos de los tres? (Sugerencia: sese un diagrama de
rbol.)
7. Considere el diagrama de rbol del Ejercicio 5, Seccin 2.2. Supongamos que las proba-
bilidades de que un paciente tenga dolor de cabeza, fiebre, malestar corporal o dolor
muscular son de 0.7, 0.8, 0.1 y 0.2, respectivamente. Supongamos tambin que las
apariciones de estos sntomas son independientes entre s.
a) Determinar la probabilidad para cada una de las 16 trayectorias del rbol.
b) Determinar la probabilidad de que el diagnstico pueda ser alergia sistmica a los
alimentos.
c) Determinar la probabilidad de que el diagnstico pueda ser gripe.
d) Determinar la probabilidad de que el diagnstico no pueda ser ni alergia a los
alimentos ni gripe.
8. Principio de Hardy-Weinberg. El principio de Hardy-Weinberg, en gentica de pobla-
ciones, recibi este nombre de G. H. Hardy, un matemtico ingls, y de G. Weinberg,
un mdico alemn. Este principio establece bsicamente que una poblacin es genti-
camente estable en las sucesivas generaciones. Los fundamentos matemticos de este
principio se apoyan sobre la nocin de independencia en dos aspectos: apareamiento
independiente y herencia independiente por parte de los hijos del gen de cada padre.
Consideremos la distribucin de un simple par de genes A y a. Cada miembro de la
poblacin portar dos de estos genes. Tendremos, pues, tres genotipos diferentes: AA,
Aa y aa. Supongamos que estos genotipos estn presentes en la poblacin en las pro-
porciones
1
4
AA,
1
2
Aa,
1
4
aa. Si admitimos que los miembros de la poblacin se aparean
aleatoriamente, habra nueve posibles tipos de cruzamiento, que son los que aparecen
en la Tabla 3.13. Cada tipo de cruzamiento induce uno o ms genotipos en la descen-
dencia. Dada la independencia, las primeras filas son como aparece en la tabla. Com-
pletar la tabla. Una vez hecho, comprobar que un cuarto de la descendencia es de
genotipo AA, la mitad de Aa y un cuarto de aa, tal como asegura el principio de
Hardy-Weinberg.
9. Algunos caracteres en animales se dice que estn sexualmente influenciados. Por ejem-
plo, la aparicin de cornamenta en la oveja est gobernada por un par de alelos, H y h.
El alelo H para la presencia de cornamenta es dominante en los machos, pero recesivo
en las hembras. El alelo h para la ausencia de cornamenta es dominante en las hembras,
pero recesivo en los machos. Por tanto, dados un macho y una hembra heterocigotos
(Hh), el macho tendr cornamenta y la hembra no. Supongamos que tales animales se
aparean.
a) Dibujar un diagrama de rbol para representar los posibles genotipos relativos a la
aparicin de cornamenta.
b) Supongamos que cada cra de este cruce tenga exactamente la misma posibilidad
de ser macho que de ser hembra. Calcular la probabilidad de que dada una cra, sea
macho y tenga cornamenta. Calcular la probabilidad de que dada una cra, sea
hembra y tenga cornamenta.
c) Hallar la probabilidad de que una cra dada tenga cornamenta. Demostrar que el
suceso A, la cra es macho y B, la cra tiene cornamenta, no son independientes.
128 Estadstica para Biologa y Ciencias de la Salud
Tabla 3.13
Tipo de apareamiento Probabilidad Genotipo Genotipo Probabilidad
de filial filial de la
Varn Mujer cruzamiento posible probable trayectoria
AA AA
1
4

1
4
AA 1
1
16
AA Aa
1
4

1
2
AA
1
2
1
16
Aa
1
2
1
16
AA aa
1
4

1
4
Aa 1
1
16
Aa AA
Aa Aa
Aa aa
aa AA
aa Aa
aa aa
10. Verificar que la probabilidad de que un individuo, seleccionado aleatoriamente, sea
homocigoto Rh positivo (++), es aproximadamente 0.37 y que la probabilidad de que
sea heterocigoto Rh positivo (+ o +) es aproximadamente 0.48.
11. El grupo sanguneo de un individuo (A, B, AB, 0) es independiente del factor Rh.
a) Determinar la probabilidad de que un individuo seleccionado aleatoriamente sea
del grupo AB negativo dado que dicho individuo es un norteamericano de raza
blanca (vanse los Ejemplos 3.5.2 y 3.1.2).
b) Determinar la probabilidad de que un individuo seleccionado aleatoriamente sea
del grupo AB negativo dado que dicho individuo es un norteamericano de raza
negra (vase el Ejemplo 3.5.2 y el Ejercicio 12 de la Seccin 3.1).
c) El hecho de tener sangre del grupo AB negativo es independiente del grupo racial,
blanco o negro, al que pertenece el individuo? Explicarlo.
d) El hecho de tener sangre del grupo A negativo es independiente del grupo racial,
blanco o negro, al que pertenece el individuo? Explicarlo.
12. Considerar el riesgo relativo definido en la Seccin 3.4. Probar que si RR = 1, los
sucesos D, la enfermedad est presente, y E, el paciente est expuesto a riesgo, son
independientes. Sugerencia: Establezcamos que P[D | E] es igual a P[D | E] y aplique-
mos la definicin de probabilidad condicionada a cada lado de la ecuacin. Recordemos
que P[E] = 1 P[E]. Demostrar que P[D y E] = P[D]P[E].
13. Un mdico solicita 10 pruebas de diagnstico independientes para que sean realizadas
en un mismo paciente. El coeficiente de falsos positivos de cada test es 0.05. Cul es la
probabilidad de que al menos se obtenga un resultado positivo errneo?
14. Si el coeficiente de falsos positivos de cada test de un grupo de tests es 0.05, cuntos
tests independientes pueden incluirse en el grupo si deseamos que la probabilidad de
obtener al menos un resultado falso positivo sea como mximo 0.20?
3.6. LA REGLA DE LA MULTIPLICACIN
Podemos ahora calcular P[A
1
y A
2
], si los sucesos son independientes. Adems, si la informa-
cin de que disponemos lo permite, es posible hacerlo mediante la regla general de la adicin.
Teora de probabilidades y resolucin de problemas 129
Existe algn otro procedimiento para hallar la probabilidad de que dos sucesos se produzcan
simultneamente, si stos no son independientes? La respuesta es afirmativa, y el mtodo
utilizado es fcil de deducir. Sabemos que
P[A
2
| A
1
] =
P[A
1
y A
2
]
P[A
1
]
al margen de que los sucesos sean o no independientes. Multiplicando cada miembro de la
igualdad por P[A
1
] obtenemos la frmula siguiente, llamada regla de multiplicacin:
P[A
1
y A
2
] = P[A
2
| A
1
]P[A
1
] regla de la multiplicacin
Su utilizacin se describe en el Ejemplo 3.6.1.
Ejemplo 3.6.1. La denominada prospeccin geobotnica se basa en el estudio de las plan-
tas que aparecen en depsitos de minerales. Una pequea planta de menta con una flor de
color malva es un indicador del cobre. Supongamos que, en una regin dada, existe un 30 %
de probabilidad de que el suelo tenga un alto contenido de cobre y un 23 % de que la menta
est presente en ese lugar. Si el contenido de cobre es alto, existe un 70 % de probabilidad de
que la menta est presente. Cul es la probabilidad de que el contenido de cobre sea alto y de
que est presente la menta? Si representamos con A
1
el suceso de que el contenido de cobre
sea alto y con A
2
el suceso de que la menta est presente deberemos determinar P[A
1
y A
2
].
Tenemos que P[A
1
] = 0.30, P[A
2
] = 0.23, y P[A
2
| A
1
] = 0.70. Mediante la regla de la multipli-
cacin
P[A
1
y A
2
] = P[A
2
| A
1
]P[A
1
]
= 0.70(0.30)
= 0.21
En el Ejemplo 3.6.2 se ilustra el uso de la regla de la multiplicacin en gentica.
Ejemplo 3.6.2. Si una madre es Rh negativo y su hijo es Rh positivo, existe una incompati-
bilidad sangunea que puede conducir a una eritroblastosis fetal, consistente en que la madre
crea un anticuerpo contra el Rh del feto que conduce a la destruccin de los hemates del feto.
Cul es la probabilidad de que un nio seleccionado aleatoriamente corra este riesgo?
Una forma de que el nio tenga este problema es que el padre sea heterocigoto Rh
positivo (+ o +) y pase un gen positivo al nio mientras que la madre sea Rh negativo.
Para determinar la probabilidad de esta combinacin de sucesos, debemos hallar P[(A
1
y A
2
)
y A
3
] donde A
1
representa que el padre sea heterocigoto Rh positivo, A
2
que el padre trans-
mita un gen positivo al nio y A
3
que la madre sea Rh negativo. Obsrvese que los sucesos
A
1
y A
2
no son independientes. El hecho de que el padre sea heterocigoto Rh positivo est
presente en la posibilidad de que el nio obtenga un gen positivo de esta fuente. A travs de
la regla de la multiplicacin,
P[A
1
y A
2
] = P[A
2
| A
1
]P[A
1
]
Por el Ejercicio 10 de la Seccin 3.5, sabemos que P[A
1
] X0.48. Dado que un gen se hereda
aleatoriamente del padre, P[A
2
| A
1
] = 0.5. Por lo tanto
P[A
1
y A
2
] X 0.5(0.48) = 0.24
130 Estadstica para Biologa y Ciencias de la Salud
Puesto que el genotipo de la madre no tiene efecto sobre el padre o sobre su capacidad de
transferir un gen positivo al nio, A
3
es independiente de A
1
y A
2
. Por el Ejemplo 3.5.2
sabemos que P[A
3
] ^ 0.15. As pues, por la definicin de independencia,
P[(A
1
y A
2
) y A
3
] X 0.24(0.15) = 0.0360
Existen otras formas de que est presente la condicin. El Ejercicio 1 lo seala y permite
calcular la probabilidad de que un nio contraiga el problema de cualquier procedencia.
EJERCICIOS 3.6
1. Un nio tendr eritroblastosis fetal si la madre es Rh negativo y el padre es homocigo-
to Rh positivo (++). Utilizar la informacin del Ejercicio 10 de la Seccin 3.5 para
hallar la probabilidad de que esto ocurra. Determinar la probabilidad de que un nio
seleccionado aleatoriamente tenga la condicin, combinando este resultado con el
obtenido en el Ejemplo 3.6.2.
2. Ciertos estudios indican que el 82 % de los profesionales varones bebe. De los que
beben, el 18 % corresponde a grandes bebedores. Cul es la probabilidad de que,
seleccionando aleatoriamente a un profesional, beba y sea un gran bebedor?
3. De todos los pacientes de cncer, en el 52 % son mujeres. El 40 % de los pacientes
sobrevive al menos cinco aos desde el momento del diagnstico. No obstante, esta
tasa de supervivencia es vlida solamente para el 35 % de las mujeres. Cul es la
probabilidad de que un paciente de cncer seleccionado aleatoriamente sea mujer y
sobreviva, al menos, cinco aos?
4. La probabilidad de que una unidad de sangre proceda de un donante remunerado es
0.67. Si el donante es remunerado, la probabilidad de que la unidad contenga el suero
de la hepatitis es 0.0144. Si el donante es desinteresado, esta probabilidad es 0.0012.
Un paciente recibe una unidad de sangre. Cul es la probabilidad de que contraiga
hepatitis como consecuencia de ello?
5. El 2 % de la poblacin en general padece diabetes. De ellos, solamente la mitad lo
sabe. Si se selecciona aleatoriamente a un individuo. Cul es la probabilidad de que
padezca diabetes pero no sea consciente de padecerla?
6. Se sabe que el coeficiente de falsos positivos de un test para una determinada enfer-
medad es del 4 % y que el coeficiente de falsos negativos es del 6 %. El test mues-
tra que el 15 % de las personas da positivo. Cul es la probabilidad de que un indivi-
duo aleatoriamente seleccionado tenga efectivamente la enfermedad? Sugerencia:
Sea x = P[realmente positivo] y 1 x = P[realmente negativo]. Obsrvese que
P[test positivo] = P[test positivo y realmente positivo]
+ P[test positivo y realmente negativo]
7. En la replicacin del DNA, a veces se presentan errores que pueden dar lugar a muta-
ciones observables en el organismo. En ocasiones, tales errores estn inducidos qu-
micamente. Se expone un cultivo de bacterias a la presencia de un producto qumico
que tiene un 0.4 de probabilidad de inducir a error. Sin embargo, el 65 % de los errores
es silencioso, en el sentido de que no dan lugar a una mutacin observable. Cul es
la probabilidad de que se observe una colonia mutada? Sugerencia: Hallar P[error y
observable].
8. En la ciencia es importante la capacidad de observar y recordar datos. Desgraciada-
mente, el poder de la sugestin puede distorsionar la memoria. Se realiz un estudio
Teora de probabilidades y resolucin de problemas 131
sobre los recuerdos: a los sujetos se les muestra una pelcula en la que un coche pasa
por una carretera. En la pelcula no sale ningn granero. A continuacin, se les formu-
la una serie de preguntas relacionadas con la pelcula a los sujetos. A la mitad se les
pregunt: Con qu velocidad se mueve el coche cuando pasa por el granero? A la
otra mitad de los sujetos no se les hizo esta pregunta. Ms tarde, se le pregunt a cada
uno de ellos: Sale algn granero en la pelcula? Entre los que se les formul la
primera pregunta concerniente al granero, el 17 % respondi s; slo el 3 % de los
restantes respondi s. Cul es la probabilidad de que un participante en este estu-
dio, seleccionado aleatoriamente, haya dicho ver el granero inexistente? Decir que
se ha visto el granero es independiente de que se le haya formulado la primera pregun-
ta sobre el mismo? Sugerencia:
P[s] = P[s y se le ha preguntado acerca del granero]
+ P[s y no se le ha preguntado acerca del granero]
(Basado en un estudio registrado en McGraw-Hill Yearbook of Science and Techno-
logy, 1981, pgs. 249-251.)
9. Mtodo aleatorizado de respuesta para obtener respuestas honestas a preguntas com-
prometidas. Es un mtodo que se utiliza para garantizar que un individuo que respon-
de a cuestiones comprometidas mantenga el anonimato, animndole as a dar una
respuesta verdadera. Funciona de la forma siguiente: se plantean dos preguntas A y B,
una de las cuales es referente a temas comprometidos y la otra no. Debe conocerse la
probabilidad de recibir un s como respuesta a la pregunta no comprometida. Por
ejemplo, se podra preguntar
A: Su nmero de la Seguridad Social termina en un dgito impar? (No compro-
metida)
B: Alguna vez ha cursado intencionadamente una reclamacin de seguro fraudu-
lenta? (Comprometida)
Sabemos que P[responde s | ha respondido a A] =
1
2
. Deseamos hallar la aproximacin
de P[responde s | ha respondido a B]. Se le pide al sujeto que tire una moneda y
responda a A si en la moneda sale cara y a B si sale cruz. De esta forma, el entrevistador
no sabe a qu pregunta est respondiendo el sujeto. As, una respuesta afirmativa no es
incriminativa. No existe forma alguna de que el entrevistador sepa si el sujeto est
diciendo S, mi nmero de la Seguridad Social termina en un dgito impar o S, he
cursado intencionadamente una reclamacin fraudulenta. El porcentaje de sujetos del
grupo de individuos que han respondido s, se utiliza para calcular P[responde s].
a) Utilizar el hecho de que el suceso responde s es el suceso responde s y ha
respondido a A o responde s y ha respondido a B para demostrar que P[respon-
de s | ha respondido a B] es igual a
P[responde s] P[responde s | ha respondido a A] P[ha respondido a A]
P[ha respondido a B]
b) Si se prueba esta tcnica en 100 sujetos y 60 responden s, hallar la probabilidad
aproximada de que una persona del grupo, seleccionada aleatoriamente, haya cur-
sado intencionalmente una reclamacin fraudulenta.
10. En un estudio sobre estudiantes de bachillerato, a cada sujeto se le pide que tire un dado
y luego una moneda. Si en la moneda sale cara, el sujeto debe responder a la pregunta A,
de lo contrario, a la pregunta B.
132 Estadstica para Biologa y Ciencias de la Salud
A: El dado ha sacado un nmero par?
B: Ha fumado alguna vez marihuana?
En un grupo de 50 sujetos, 35 respondieron s. Utilizar esta informacin para hallar la
aproximacin de la probabilidad de que un estudiante de este grupo seleccionado alea-
toriamente haya fumado marihuana.
3.7. TEOREMA DE BAYES
El objeto de esta seccin es el teorema formulado por el reverendo Thomas Bayes (1761).
Est relacionado con la probabilidad condicionada. El teorema de Bayes se utiliza para hallar
P[A | B] cuando la informacin de que se dispone no es directamente compatible con la que se
requera en la Definicin 3.3.1. Es decir, se utiliza para hallar P[A | B] cuando P[A y B] y P[B]
no se conocen de inmediato.
Los problemas de Bayes pueden resolverse con la ayuda de un diagrama de rbol. Ilustra-
remos la idea antes de formular formalmente el teorema.
Ejemplo 3.7.1. Se ha desarrollado un procedimiento para detectar un tipo particular de
artritis en individuos de alrededor de cincuenta aos de edad. A partir de una investigacin
realizada a nivel nacional, se sabe que, aproximadamente, el 10 % de los individuos de esta
edad sufre esta forma de artritis. Se aplica el procedimiento propuesto a individuos con enfer-
medad artrtica confirmada, y su resultado es correcto en el 85 % de los casos. Cuando el
procedimiento se pone a prueba con individuos de la misma edad que, se sabe, estn libres de
la enfermedad, se obtiene un coeficiente de falsos positivos del 4 %.
Para que este test sea utilizado como detector de la artritis es necesario que sea un fuerte
indicador de que la enfermedad est presente. Sea D el suceso que denote la presencia de la
enfermedad y T+ el suceso que alude al resultado positivo para el test. Pretendemos hallar
P[D | T+] y que sea alta. Puesto que esta probabilidad es condicionada, lo primero que se nos
ocurrira hacer sera aplicar la Definicin 3.3.1. Sin embargo, no tenemos P[D y T+], la
probabilidad de que exista la enfermedad y el test d positivo, ni tampoco P[T+], la probabili-
dad de resultado positivo para el test. As que la Definicin 3.3.1 no puede emplearse directa-
mente; se necesita otro mtodo para calcular la probabilidad deseada.
Para resolver el problema, obsrvese que se dan las probabilidades (T denota el hecho de
que el resultado del test sea negativo):
P[D] = 0.10 P[T+ | D] = 0.85 P[T+ | D] = 0.04
P[D] = 0.90 P[T | D] = 0.15 P[T | D] = 0.96
Dado que conocemos P[D] y P[D], empezamos el rbol enumerando estos sucesos junto
con sus probabilidades correspondientes. Si la enfermedad est presente, podemos asignar
0.1
0.85
0.04
0.9
0.15
0.96
D
T+
T+
D
T
T
(0.1) (0.85) = 0.085 = [ y +] P D T
(0.1) (0.15) = 0.015 = [ y ] P D T
(0.9) (0.04) = 0.036 = [ y +] P D T
(0.9) (0.96) = 0.864 = [ y ] P D T
Probabilidad de la trayectoria
Figura 3.12. Trayectorias y probabilidades de las trayectorias.
Teora de probabilidades y resolucin de problemas 133
probabilidades de 0.85 y 0.15 a los sucesos T+, el resultado del test es positivo, y T, el
resultado del test es negativo, respectivamente. Si la enfermedad no est presente, estas pro-
babilidades condicionadas son, respectivamente, 0.04 y 0.96. Todas estas probabilidades se
muestran en la Figura 3.12. Obsrvese que la probabilidad de la primera trayectoria es P[D]
P[T+ | D] lo que, mediante la regla de la multiplicacin, nos da P[D y T+].
Para hallar P[D | T+], el coeficiente predictivo positivo, aplicamos la Definicin 3.3.1
para obtener
P[D | T+] =
P[D y T+]
P[T+]
En el rbol, vemos que P[D y T+] = 0.085. El suceso T+ se representa mediante las trayecto-
rias 1 y 3, y, por lo tanto, P[T+] = 0.085 + 0.036 = 0.121. Mediante sustitucin obtendremos
P[D | T+] =
0.085
0.121
= 0.70
Esto es, si el test es positivo, hay un 70 % de posibilidades de que, en efecto, la enfermedad
exista.
Resolviendo el Ejemplo 3.7.1 con un diagrama de rbol, estamos aplicando de forma
completamente natural el teorema de Bayes. En s mismo, el teorema es una afirmacin
formal de la tcnica empleada al utilizar un rbol. Supongamos que existe un conjunto de
sucesos mutuamente excluyentes A
1
, A
2
, ..., A
n
, tales que P[A
1
], P[A
2
], ..., P[A
n
] son conocidas
y ;
n
i =1
P[A
i
] = 1. Dicho conjunto se denomina una particin del espacio muestral. Estos
sucesos producen la primera ramificacin del diagrama de rbol. Supongamos que se produce
otro suceso B y que conocemos P[B | A
i
] para cada i. Este suceso produce la ramificacin de
la segunda etapa del rbol. Queremos hallar la probabilidad de que ocurra un suceso especfi-
co de la particin A
j
dado que ha ocurrido B. Por la Definicin 3.3.1,
P[A
j
| B] =
P[A
j
y B]
P[B]
En la formulacin del teorema de Bayes, el numerador y el denominador se expresan en
forma alternativa aplicando a cada uno de ellos la regla de la multiplicacin. El numerador
corresponde a la probabilidad de la trayectoria j-sima; el denominador es la suma de las
probabilidades de las trayectorias que corresponden al suceso B. La formulacin formal del
teorema se da en el Teorema 3.7.1. Su demostracin est indicada en el Ejercicio 6.
Teorema 3.7.1. Teorema de Bayes. Sea A
1
, A
2
, A
3
,..., A
n
una coleccin de sucesos que
forman una particin de S. Sea B un suceso tal que P[B] |0. Entonces, cualquiera que sea el
suceso A
j
, j = 1, 2, 3, ..., n,
P[A
j
| B] =
P[B | A
j
]P[A
j
]
n
;
i =1
P[B | A
i
]P[A
i
]
El teorema de Bayes es mucho ms fcil de manejar en la prctica que de establecer
formalmente. Para verlo vamos a reconsiderar el Ejemplo 3.7.1 y a resolverlo sin utilizar el
diagrama de rbol.
134 Estadstica para Biologa y Ciencias de la Salud
Ejemplo 3.7.2. En el Ejemplo 3.7.1, hemos calculado P[D | T+], donde D es el suceso que
significa tenga artritis y T+ es el suceso representativo del hecho de que el test sea positivo.
Los sucesos D y D forman una particin de S. (Un individuo o tiene o no tiene artritis.) El
suceso T+ tiene asociada una probabilidad distinta de cero. Se nos da
P[D] = 0.10 P[T+ | D] = 0.85 P[T+ | D] = 0.04
P[D] = 0.90 P[T | D] = 0.15 P[T | D] = 0.96
Aplicando el teorema de Bayes, obtenemos
P[D | T+] =
P[T+ | D]P[D]
P[T] | D]P[D] + P[T+ | D]P[D]
=
(0.85)(0.10)
(0.85)(0.10) + (0.04)(0.90)
X 0.70
Obsrvese que el resultado es el mismo que el obtenido por medio del diagrama de rbol.
El Ejemplo 3.7.3 nos muestra el manejo del teorema de Bayes cuando S est dividido por
una particin de ms de dos sucesos.
Ejemplo 3.7.3. Se cree que la distribucin de los grupos sanguneos en Estados Unidos en
la Segunda Guerra Mundial era: tipo A, 41 %; tipo B, 9 %; tipo AB, 4 %; y tipo 0, 46 %. Se
estima que en esa poca, el 4 % de las personas pertenecientes al tipo 0 fue clasificado como
del tipo A; el 88 % de los del tipo A fue correctamente clasificado; el 4 % de los del tipo B se
clasific como del tipo A, y el 10 % de los del tipo AB fue, igualmente, clasificado como del
tipo A. Un soldado fue herido y conducido a la enfermera. Se le clasific como del tipo A.
Cul es la probabilidad de que tal grupo sea ciertamente el suyo?
Sean los sucesos:
A
1
: Es del tipo A.
A
2
: Es del tipo B.
A
3
: Es del tipo AB.
A
4
: Es del tipo 0.
B: Es clasificado como del tipo A.
Deseamos calcular P[A
1
| B]. Los datos de que disponemos son:
P[A
1
] = 0.41 P[B | A
1
] = 0.88
P[A
2
] = 0.09 P[B | A
2
] = 0.04
P[A
3
] = 0.04 P[B | A
3
] = 0.10
P[A
4
] = 0.46 P[B | A
4
] = 0.04
En la Figura 3.13 se muestra el diagrama de rbol utilizado para responder a esta pre-
gunta. Obsrvese que, segn la Definicin 3.3.1, P[A
1
| B] = P[A
1
y B]/P[B]. El numerador
de esta probabilidad es la probabilidad de la trayectoria 1, es decir, 0.3608. El denominador
es la suma de las probabilidades de las trayectorias 1, 3, 5 y 7, es decir, 0.3868. Por tanto,
P[A
1
| B] = 0.3608/0.3868 X 0.93. Por el teorema de Bayes,
P[A
1
| B] =
P[B | A
1
]P[A
1
]
4
;
i =1
P[B | A
i
]P[A
i
]
=
(0.88)(0.41)
(0.88)(0.41) + (0.04)(0.09) + (0.10)(0.04) + (0.04)(0.46)
X 0.93
Teora de probabilidades y resolucin de problemas 135
0.41
0.09
0.04
0.88
0.10
0.04
0.04
0.46
0.12
0.90
0.96
0.96
B
B
B
B
B
B
B
B
(0.41) (0.88) = 0.3608 = [ y ] P A B
1
(0.09) (0.04) = 0.0036 = [ y ] P A B
2
(0.04) (0.10) = 0.004 = [ y ] P B A
3
(0.46) (0.04) = 0.0184 = [ y ] P B A
4
A
1
A
2
A
3
A
4
Figura 3.13. P[A
1
y B] = 0.3608; P[B] = 0.3608 + 0.0036 + 0.004 + 0.0184 = 0.3868; P[A
1
| B] =
= 0.3608/0.3868 X 0.93
En la prctica, esto significa que hay un 93 % de posibilidades de que, si se le clasific como
del tipo A, su grupo sanguneo sea efectivamente el A. Hay un 7 % de posibilidades de que,
habiendo sido clasificado como del tipo A, pertenezca en realidad a otro.
EJERCICIOS 3.7
1. Las estadsticas indican que en Estados Unidos la probabilidad de que una madre muera
durante el parto es 0.00022. Si no es de raza negra, la probabilidad de muerte es 0.00017,
mientras que si lo es, esta probabilidad aumenta a 0.00064. Supongamos que el 10 % de
los partos corresponde a mujeres negras.
a) Dibujar un diagrama de rbol describiendo las probabilidades dadas, y hallar las pro-
babilidades correspondientes a las trayectorias en cada uno de los cuatro casos. (Sea D
el suceso que denota que la madre muere y B el que alude a que es de raza negra.)
b) Utilizar el rbol del apartado a para calcular la probabilidad de que una madre que
muere en el parto sea de raza negra.
c) Haciendo uso del teorema de Bayes, hallar la probabilidad de que una madre que muere
en el parto sea de raza negra, y comparar el resultado con el obtenido en el apartado b.
2. Un test diseado para diagnosticar el cncer de cuello uterino tiene un coeficiente de
falsos negativos y falsos positivos de 0.05, cada uno. De una cierta poblacin de mujeres,
el 4 % est afectado por este tipo de cncer. Cul es la probabilidad de que una mujer de
la poblacin elegida aleatoriamente tenga cncer de cuello uterino, dado que su resultado
con el test es positivo?
3. Un paciente de cncer est siendo tratado con una combinacin de tres frmacos. Se
observa que, cuando se utilizan simultneamente, a menudo dos de los tres frmacos se
inhibirn de forma que, de hecho, slo uno ser activo frente al tumor. Suponga que
cuando esto ocurra, la probabilidad de que el frmaco A acte solo es la misma que la del
frmaco B y la del C, es decir
1
3
. La efectividad de cada frmaco, con respecto a producir
136 Estadstica para Biologa y Ciencias de la Salud
una remisin del tumor, es diferente. El frmaco A se ha mostrado efectivo en un 50 % de
los casos; el frmaco B, en un 75 %, y el frmaco C, en un 60 % . La enfermedad remite
en el paciente. Cul es la probabilidad de que el responsable de ello sea el frmaco B?
4. La distrofia muscular de Duchenne es una enfermedad de los msculos que afecta a los
jvenes. La naturaleza de esta enfermedad es tal que no se transmite desde los varones
afectados, sino que se propaga a partir de mujeres portadoras que rara vez exhiben snto-
ma alguno de tener la enfermedad. Considrese una mujer que es hija de una portadora
detectada de la enfermedad. sta tiene tres hijos completamente normales. Emplear el
teorema de Bayes para hallar la probabilidad de que la mujer sea portadora. Es decir,
calcular P[portadora | tres hijos normales].
5. Se nos dice que el valor predictivo positivo de un test est ms influenciado por la
especificidad que por la sensibilidad. (Vanse Ejercicios 5, 6 y 10 de la Seccin 3.4.)
Para demostrarlo, calcular el valor predictivo positivo de cada uno de los conjuntos dados
en los apartados a, b, d y e:
a) Sensibilidad = 0.95
Prevalencia (P[realidad +]) = 0.10
Especificidad = 1.00
b) Sensibilidad = 0.95
Prevalencia = 0.10
Especificidad = 0.50
c) Cul es la diferencia entre los coeficientes predictivos positivos a medida que la
especificidad disminuye de 1.0 a 0.5?
d) Especificidad = 0.95
Prevalencia = 0.10
Sensibilidad = 1.00
e) Especificidad = 0.95
Prevalencia = 0.10
Sensibilidad = 0.50
f ) Cul es la diferencia entre los coeficientes predictivos positivos a medida que la
sensibilidad disminuye de 1.00 a 0.5?
(Basado en la informacin hallada en Victoria Wells, William Halperin y Michael
Thun, Estimated Predictive Value of Screening for Illicit Drugs in the Workplace,
American Journal of Public Health, vol. 78, n.
o
7, julio de 1988, pgs. 817-823.)
6. Para deducir el teorema de Bayes, consideremos la Figura 3.14.
a) Determinar la expresin para P[B].
b) Utilizar la regla de la multiplicacin para hallar las expresiones para P[A
1
y B], P[A
2
y B], ..., P[A
n
y B] en las cuales A
1
, A
2
, ..., A
n
son los sucesos dados.
A
2
A
n
A
1
A B
1
y
A B
2
y
A B
n
y
S
B (sombreado)
Figura 3.14. Sucesos A
1
, A
2
, ..., A
n
, particin de S.
Teora de probabilidades y resolucin de problemas 137
c) Utilizar el apartado b para hallar una expresin alternativa de P[B].
d) Aplicar la Definicin 3.3.1 para hallar una expresin de P[A
j
| B].
e) Efectuar una sustitucin en la expresin del apartado d para obtener el teorema de
Bayes.
138 Estadstica para Biologa y Ciencias de la Salud

Вам также может понравиться