Вы находитесь на странице: 1из 60

,

CAPITULO CUATRO
.........................................................
Variables aleatorias discretas
Objetivo
Explicar qu significa el trmino variable
aleatoria discreta; conocer la distribucin de
probabilidad y las correspondientes medidas
descriptivas numricas de las variables aleatorias
discretas; presentar algunas distribuciones de
probabilidad discreta tiles y mostrar cmo
pueden utilizarse estas distribuciones para
resolver problemas prcticos
Contenido
4.1 Variables aleatorias discretas
4.2 La distribucin de probabilidad para una
variable aleatoria discreta
4.3 El valor esperado de una variable aleatoria y
o una funcin g(y) de y
4.4 Algunos teoremas tiles de la esperanza
4.5 Pruebas de Bernoulli
4.6 La distribucin de probabilidad binomial
4.7 La distribucin de probabilidad multinomial
4.8 Las distribuciones de probabilidad binomial
negativa y geomtrica
4.9 La distribucin de probabilidad hiper-
geomtrica
4.10 La distribucin de probabilidad de Poisson
4.11 Momentos y funciones que generan
momentos (opcional)
4.12 Resumen

143
4.1 Variables aleatorias discretas
...................................................................
Como sealamos en el captulo 1, los eventos experimentales de mayor inters
con frecuencia son numricos, es decir, realizamos un experimento y observa-
mos el valor numrico de alguna variable. Si repetimos el experimento n veces,
obtenemos una muestra de datos cuantitativos. Como ilustracin, supongamos
que un producto fabricado (por ejemplo, un componente mecnico) se vende
en lotes de 20 cajas, cada una de las cuales contiene 12 artculos. A fin de
verificar la calidad del producto, un ingeniero de control de proceso selecciona
al azar cuatro de entre los 240 artculos de un lote y determina si los artculos
estn defectuosos o no. Si ms de uno de los artculos muestreados resulta
defectuoso, se rechazar todo el lote.
La seleccin de cuatro artculos fabricados de entre 240 produce un espacio
de muestra S que contiene [2:0 Jeventos simples, cada uno. de los cuales co-
rresponde a una posible combinacin de cuatro artculos que podran seleccio-
narse del lote. Aunque una descripcin de un evento simple especfico identi-
ficara los cuatro artculos adquiridos en una muestra en particular, el evento
de inters para el ingeniero de control de procesos es una observacin de la
variable y, el nmero de artculos defectuosos entre los cuatro que se prueban.
A cada evento simple en S corresponde uno y slo un valor de la variable y.
Por tanto, existe una relacin funcional entre los eventos simples de S y los
valores que y puede asumir. El evento y = Oes la coleccin de todos los eventos
simples que no contienen artculos defectuosos. De forma similar, el evento
y = 1 es la coleccin de todos los eventos simples en los que se observa un
artculo defectuoso. Puesto que el valor que y puede asumir es un evento nu-
mrico (es decir, un evento definido por un nmero que vara de forma alea-
toria de una repeticin del experimento a otra), se dice que y es una variable
aleatoria.
El nmero y de artculos defectuosos en una seleccin de cuatro artculos
de entre 240 es un ejemplo de variable aleatoria discreta, que puede asumir
una cantidad de valores que se puede contar. En nuestro ejemplo, la variable
aleatoria y puede asumir cualquiera de los cinco valores y = O, 1, 2, 3 o 4.
Como ejemplo adicional, el nmero y de trabajos recibidos por un centro de
cmputo en un da tambin es una variable aleatoria discreta que, en teora,
podra asumir un valor de tal magnitud que rebase cualquier lmite. Los posi-
bles valores de esta variable aleatoria discreta corresponden a los enteros no
negativos, y = O, 1, 2, 3, ... , 00, y el nmero de tales valores se puede contar.
Las variables aleatorias que se observan en la naturaleza a menudo poseen
caractersticas similares y por ende se pueden clasificar segn su tipo. En este
captulo estudiaremos siete tipos distintos de variables aleatorias discretas y
aplicaremos los mtodos del captulo 3 para deducir las probabilidades asocia-
das a sus posibles valores. Tambin comenzaremos a desarrollar ciertas ideas
intuitivas acerca de la forma de aprovechar las probabilidades de los datos de
muestra observados para hacer inferencias estadsticas.
4.2 la distribucin de probabilidad para una variable aleatoria discreta
11
Puesto que los valores que puede asumir una variable aleatoria y son eventos
numricos, querremos calcular sus probabilidades. Una tabla, frmula o grfica
que proporcione tales probabilidades ser una distribucin de probabilidad
para la variable aleatoria y. Ilustraremos el concepto con un sencillo ejemplo
de lanzamiento de una moneda.
,.'11 1 1 " " ,.1,
EJEMPLO 4.1
Solucin
Se lanza dos veces una moneda balanceada y se observa el nmero y de caras.
Calcule la distribucin de probabilidad para y.
Denotemos con C y X la observacin de una cara y una cruz, respectivamente,
en el i-simo lanzamiento, para i = 1, 2. Los cuatro eventos simples y los
correspondientes valores de y se muestran en la tabla 4.1.
Evento simple Descripcin
P(E) Nmero de caras
y
El CC
z
1
2
4
E
z
CX
z
1
1
4
E
3
XC
z
1
1
4
E
4
XX
z
1
O
4
El evento y = Oes la coleccin de todos los eventos simples que producen
un valor de y = O, a saber, el evento simple nico E
4
Por tanto, la probabilidad
de que y asuma el valor O es
1
P(y = O) = p(O) = P(E
4
) = "4
El evento y = 1 contiene dos eventos simples, E
z
YE
3
. Por tanto,
1 1 1
P(y = 1) = P(l) = P(E
z
) + P(E3) = "4 + "4 = "2
Por ltimo,
1
P(y = 2) = p(2) = P(E) = 4
La distribucin de probabilidad p(y) se muestra en forma tabular en la tabla
4.2 y como grfica en la figura 4.1. Observe que en la figura las probabilidades
asociadas a y se ilustran con lneas verticales; la altura de la lnea es proporcional
al valor de p(y). En la seccin 4.6 demostraremos que esta distribucin de pro-
babilidad tambin puede calcularse con la frmula
p(y) = G)
4
donde
( ~ ) 1
p(O) = 4 = 4
~ I ) Jp ~ ~ ~ 4
P
(2) = (D = l
4 4
Podemos usar cualquiera de estas tcnicas -tabla, grfica o frmula- para
describir la distribucin de probabilidad de una variable aleatoria discreta y.
..........................
y
o
1
2
LP(y)=
y
p(y)
1
4
1
Z
1
4
FIGURA 4.1 ~
Distribucin de probabilidad para
y,el nmero de caras en dos
lanzamientos de una moneda
p(y)
1
2
1

L-_----JL-__L..-__L..-__ y
o 2
La distribucin de probabilidad p(y) para una variable aleatoria discre-
ta debe satisfacer dos propiedades. Primero, dado que p(y) es una probabilidad,
debe asumir un valor en el intervalo O~ p(y) ~ l. Segundo, la suma de los valores
de p(y) para todos los valores de y debe ser igual a l. Esto es as porque asig-
namos uno y slo un valor de y a cada uno de los eventos simples de S. De
esto se desprende que los valores que y puede asumir representan diferentes
conjuntos de eventos simples y son, por tanto, eventos mutuamente exclusivos.
Entonces, la sumatoria de p(y) para todos los posibles valores de y equivale a
la sumatoria de las probabilidades de todos los eventos simples de S, y por la
seccin 3.2 sabemos que P(S) es igual a l.
Para concluir esta seccin, analizaremos la relacin entre la distribucin
de probabilidad de una variable aleatoria discreta y la distribucin de frecuencia
relativa de los datos (que vimos en la seccin 2.2). Suponga que lanza dos mo-
nedas una y otra vez un nmero muy grande de veces y registra el nmero y
de caras observadas en cada lanzamiento. Un histograma de frecuencia relativa para
la coleccin de valores O, 1 y 2 tendra barras con alturas aproximadas de ,
t y , respectivamente. De hecho,' si fuera posible repetir el experimento un
nmero infinitamente grande de veces, la distribucin se vera como la de la
figura 4.2 (pgina 148). Por tanto, el histograma de probabilidad de la figura
4.2 constituye un modelo para una poblacin conceptual de valores de y: los valores
de y que se observaran si el experimento se repitiera un nmero infinito de veces.
.
148 Captulo 4/ Variables aleatorias discretas
FIGURA 4.2 ~
Histograma de frecuencia relativa
terica para y,el nmero de caras
en dos lanzamientos de una moneda
. ~ .50
'"
~
ee
g
....25
::l
~
'"-
o 2
y
A partir de la seccion 4.5, introduciremos varios modelos para variables
aleatorias discretas que ocurren en las ciencias fsicas, biolgicas, sociales y de
la informacin.
EJERCICIOS
...................................................................
j 4.1
El director de mercadeo de una fbrica pequea de computadoras personales (PC) cree que la
distribucin de probabilidad discreta que se muestra en la siguiente figura caracteriza a y, el nmero
de PC nuevas que la empresa arrendar el siguiente ao.
p(y)
y
13 12 11 10 9 8 7
f-
.
II 1
//
.15
. 10
.20
a. Es sta una distribucin de probabilidad vlida? Explique.
b. Muestre la distribucin de probabilidad en forma tabular.
c. Qu probabilidad hay de que se arrendarn exactamente 9 PC?
d. Qu probabilidad hay de que se arrendarn menos de 12 PC?
4.2 Considere el segmento de circuito elctrico con tres relevadores que se muestra en seguida. La
corriente fluye de A a B si hay por 10 menos un camino cerrado cuando se cierra el interruptor.
Cada uno de los tres relevadores tiene la misma probabilidad de permanecer abierto o cerrado
cuando se cierra el interruptor. Representemos con y el nmero de relevadores que se cierran cuando
se cierra el interruptor.
a. Calcule la distribucin de probabilidad para y y mustrela en forma tabular.
b. Qu probabilidad hay de que fluya corriente de A a B?
4.3 Refirase al estudio publicado en el [ournal ofApplied Ecology (1993) de los rascones terrestres cantores
en peligro de extincin (ejercicio 2.2). Un censo revel que 12 rascones habitan en las tierras bajas de
Escocia. Suponga que se capturan dos de estos rascones escoceses con objeto de aparearlos. Sea y el
nmero de estos rascones capturados capaces de aparearse. Si exactamente cuatro de los 12 rascones
originales que habitan en Escocia son estriles ypor tanto incapaces de aparearse, calcule la distribucin
de probabilidad para y.
4.4 Refirase al estudio publicado en Metal Progress (mayo de 1986) de la utilizacin de lmina de
acero en la Mazda Motor Corporation que presentamos en el ejercicio 3.10. Reproducimos aqu la
tabla que indica los ocho tipos de acero y los porcentajes utilizados en produccin. Suponga que
se escogen al azar tres lminas de acero (sin reemplazo) de entre las que se utilizan en la produccin
de automviles Mazda 626. Calcule y grafique la distribucin de probabilidad de y, el nmero de
lminas rodadas en fro en la muestra.
Tipo delminadeacero Porcentaje utilizado
Rolada en fro, resistencia normal, no chapeada 27
Rolada en fro, alta resistencia, no chapeada 12
Rolada en fro, resistencia normal, chapeada 30
Rolada en fro, alta resistencia, chapeada 15
Rolada en caliente, resistencia normal, no chapeada 8
Rolada en caliente, alta resistencia, no chapeada 5
Rolada en caliente, resistencia normal, chapeada 3
Rolada en caliente, alta resistencia, chapeada O
TOTAL 100
Fuente: Chandler, H. E., "MaterialsTrends at Mazda Motor Corporation", Metal Progress, vol.
129, nm. 6, mayo de 1986, pg. 57 (figura 3).
4.5 Un ingeniero de control de calidad muestrea cinco piezas de un lote grande de percutores fabricados
y determina si tienen defectos. Aunque el inspector no lo sabe, tres de los cinco percutores mues-
treados tienen defectos. El ingeniero prueba los cinco percutores en un orden escogido al azar hasta
que observa un percutor defectuoso (en cuyo caso se rechazar todo el lote). Sea y el nmero de
percutores que debe probar el ingeniero de control de calidad. Calcule y grafique la distribucin
de probabilidad de y.
150 Captulo 4/ Variables aleatorias discretas
4.6 Refirase al estudio publicado en el [ournal of Engineering [or Industry (agosto de 1993) de una
mquina taladradora automatizada (ejercicio 3.43). Reproducimos aqu las ocho condiciones de ma-
quinado que se emplearon en el estudio.
Material Tamao taladro Velo taladro Velo alimentacin
Experimento
del trabajo in. rpm ior
1 Hierro colado .25 1,250 .011
2 Hierro colado .25 1,800 .005
3 Acero .25 3,750 .003
4 Acero .25 2,500 .003
5 Acero .25 2,500 .008
6 Acero .125 4,000 .0065
7 Acero .125 4,000 .009
8 Acero .125 3,000 .010
Suponga que dos de las condiciones de maquinado enumeradas pueden detectar una falla en el
sistema automatizado. Defina y como el nmero de las tres condiciones de maquinado con material
de acero y taladro de .25 pulgadas que detectan la falla. Antes de realizar el experimento, calcule
la distribucin de probabilidad para y. [Sugerencia: Enumere todos los posibles pares de condi-
ciones de maquinado que detectan la falla.]
EJERCICIO OPCIONAL
4.7 Los ingenieros ambientales clasifican a los consumidores en una de cinco categoras (vase en el
ejercicio 3.1 una descripcin de cada grupo). Las probabilidades asociadas a los grupos se indican
en la siguiente tabla.
Marrones bsicos .28
Verdes leales .11
Verdes billete .11
Retoos .26
Refunfuadores .24
Fuente: The O;angeCountyRegister,
7 de agosto de 1990.
Sea y el nmero de consumidores que es preciso muestrear hasta encontrar el primer ecologista.
[Nota: Recuerde (ejercicio 3.1) que un ecologista es un verde fiel, un verde billete o un retoo.]
a. Especifique la distribucin de probabilidad para y en forma de tabla.
b. Cite una frmula para calcular la distribucin de probabilidad de y. (Examinaremos esta variable
aleatoria en la seccin 4.8.)
4.3 El valor esperado de una variable aleatoria y
ouna funcin g(y) de y
Los datos que analizamos en ingeniera y ciencias a menudo se obtienen de la
observacin de un proceso. Por ejemplo, en control de calidad se vigila un
proceso y se registra el nmero de piezas defectuosas producidas por hora.
4.3 / El valor esperado de una variable aleatoria ouna funcin 151
Como se apunt antes, una distribucin de probabilidad para una variable
aleatoria y es un modelo de la distribucin de frecuencia relativa de una po-
blacin, es decir, un modelo de los datos producidos por un proceso. En con-
secuencia, podemos describir los datos de proceso con medidas descriptivas
numricas, como su media y su desviacin estndar, y podemos utilizar la Regla
Emprica para identificar valores poco probables de y.
El valor esperado (o medio) de una variable aleatoria y, denotado por el
smbolo E(y), se define como sigue:
111 111 11 111.11 """'1'
EJEMPLO 4.2
Solucin
Refirase al experimento de lanzar monedas del ejemplo 4.1 y a la distribucin
de probabilidad para la variable aleatoria y que se muestra en la tabla 4.1.
Demuestre que la frmula para E(y) produce la media de la distribucin de
probabilidad para la variable aleatoria discreta y.
Si repitiramos el experimento de lanzar monedas un nmero muy grande de
veces -digamos, 400,000 veces- esperaramos observar y = caras aproxi-
madamente 100,000 veces, y = 1 cara aproximadamente 200,000 veces, y y = 2
caras aproximadamente 100,000 veces. Si calculamos la media de estos 400,000
valores de y obtenemos
2: y 100,000(0) + 200,000(1) + 100,000(2)
,." = -n- = 400,000
= 0(100,000) 1(200,000) 2(100,000)
400,000 + 400,000 + 400,000
= O ( ~ ) + l(i) + 2 ( ~ ) = 2: yp(y)
today
..........................
Si y es una variable aleatoria, tambin lo es cualquier funcin g(y) de y.
El valor esperado de g(y) se define como sigue:
152 Captulo 41 Variables aleatorias discretas
Una de las funciones ms importantes de una variable aleatoria discreta y
es su varianza, es decir, el valor esperado, elevado al cuadrado, de la desviacin
de y respecto de su media f.l.
...............................................................
EJEMPLO 4.3
Solucin
Refirase al experimento de lanzar monedas del ejemplo 4.1 y a la distribucin
de probabilidad de y que se muestra en la tabla 4.1. Calcule la varianza y
la desviacin estndar de y.
En el ejemplo 4.2 vimos que el valor medio de y es f.l = l. Entonces,
y
2
0'2 = E[(y - pi] = L (y - pip(y)
y=o
= (O - l ) 2 ( ~ ) + (l - 1?G) + (2 - l ) 2 ( ~ )
a = y;z = {i = .707
1
"2
..........................
11'1'1'"
EJEMPLO 4.4
Solucin
Refirase al ejemplo 4.3 y calcule la probabilidad de que y caiga en el intervalo
f.l 20'.
Por los ejemplos 4.2 y 4.3 sabemos que zz = 1 YO' = .707. Entonces, el intervalo
f.l 20' es -.414 a 2.414. Puesto que y debe asumir uno de slo tres valores,
y = 0, 1 Y2, todos los cuales caen en el intervalo calculado, la probabilidad
de que y caiga en el intervalo f.l 20' es 1.0. Es obvio que la Regla Emprica
(que utilizamos en el captulo 2 para describir la variacin de un conjunto
finito de datos y la dispersin de su histograma de frecuencia relativa) propor-
ciona una descripcin adecuada de la dispersin o variacin de la distribucin de
probabilidad de la figura 4.2.
. .
4.3 I El valor esperado de una variable aleatoria ouna funcin 153
11 11 11 11
EJEMPLO 4.5
Un grupo de ingenieros meteorlogos y civiles que estudian planes de evacua-
cin de emergencia para la Costa del Golfo de Florida en caso de un huracn
estim que se requeriran entre 13 y 18 horas para evacuar a las personas que
viven en tierras bajas con las probabilidades que se muestran en la tabla 4.3
Tiempo para evacuar Probabilidad
hora ms cercana
13
14
15
16
17
18
.04
.25
.40
.18
.10
.03
Solucin
a. Calcule la media y la desviacin estndar de la distribucin de probabilidad
de los tiempos de evacuacin.
b. Dentro de qu intervalo esperara usted que cayera el tiempo de evacua-
cin?
a. Representemos con y el tiempo requerido para evacuar a las personas que
viven en terrenos bajos. Con base en las definiciones 4.4 y 4.6, calculamos
J-L = E(y) = L: yp(y) = 13(.04) + 14(.25) + 15(.40) + 16(.18) + 17(.10) + 18(.03)
= 15.14 horas
;2" = E[(y - J-L)Z] = L: (y - J-LJZP(y)
= (13 - 15.14)2(.04) + (14 - 15.14)2(.25) + ... + (18 - 15.14)2(.03)
= 1.2404
a = .y;z = Y1.2404 = 1.11horas
b. Segn la Regla Emprica, esperaramos que cerca de! 95% de los tiempos
de evacuacin (y) cayeran dentro de! intervalo .L 20", donde
J-L 2fT = 15.14 2(1.11) = 15.14 2.22 = (12.92, 17.36)
En consecuencia, esperaramos que e! tiempo para evacuar estuviera entre
12.92 horas y 17.36 horas. Con base en la distribucin de probabilidad es-
timada de la tabla 4.3, la probabilidad real de que y caiga entre 12.92 y
17.36 es
P(12.92::5 y::5 17.36) = p(13) + p(14) + P(15) + p(16) + p(17)
= .04 + .25 + .40 + .18 + .10
= .97
154 Captulo 4/ Variables aleatorias discretas
Una vez ms, la Regla Emprica proporciona una buena aproximacin de
la probabilidad de que una variable aleatoria y caiga en el intervalo f1 20-.
EJERCICIOS
...................................................................
v/ 4.8
l 4.9
.1 4.10
/4.11
Calcule la media yla varianza de la distribucin de probabilidad del ejercicio 4.1.
Calcule la media yla varianza de la distribucin de probabilidad del ejercicio 4.2.
Calcule la media yla varianza de la distribucin de probabilidad del ejercicio 4.3.
Refirase al estudio de exploracin petrolera que se estudi en el ejercicio 3.23. Kinchen (1986)
cita un ejemplo en el que un presupuesto de exploracin de 50,000 dlares se asigna a un solo
prospecto. El resultado puede ser un pozo seco, 50,000 barriles (bbl), 100,000 bbl, 500,000 bbl o
1,000,000 bbl, con las probabilidades y resultados monetarios que se muestran en la tabla. Sea y
el valor monetario de un solo prospecto petrolero. Calcule E(y) y 0-
2
.
Posibles Resultado
resultados monetario Probabilidad
bbl $
Pozo seco -50,000 .60
50,000 -20,000 .10
100,000 30,000 .15
500,000 430,000 .10
1,000,000 950,000 .05
Fuente: Kinchen, A. L., "Projected outcomes of exploration programs
based on current program status and the impact of prospects under consi-
deration", [ournalofPetroleum Technology, vol. 38, nm. 4, abril de 1986,
pg. 462 (tabla 1).
4.12 Calcule la media ~ la varianza de la distribucin de probabilidad del ejercicio 4.4.
4.13 Refirase al ejemplo 4.5. Reproducimos aqu la distribucin de probabilidad del tiempo necesario
para evacuar en caso de huracn (tabla 4.3). Los pronosticadores del clima dicen que no pueden
predecir con exactitud la hora en que un huracn tocar tierra con ms de 12 horas de anticipacin.
Si el Departamento de Ingeniera Civil de la Costa del Golfo espera hasta la advertencia de 14
horas antes de iniciar la evacuacin, qu probabilidad hay de que todos los residentes de reas
bajas sean evacuados sin peligro (es decir, antes de que el huracn azote la Costa del Golfo)?
Tiempo para evacuar Probabilidad
hora ms cercana
13 .04
14 .25
15 .40
16 .18
17 .10
18 .03
4.14 Refirase al ejercicio 4.5. Suponga que el costo de probar un solo percutor es de 200 dlares.
a. Cul es el costo esperado de inspeccionar el lote?
4.4 / Algunos teoremas tiles de la esperanza 155
b. Cul es la varianza?
c. En qu intervalo esperara usted que estuviera el costo de la inspeccin?
4.4 Algunos teoremas tiles de la esperanza
...................................................................
A continuacin presentamos tres teoremas que resultan especialmente tiles
para calcular el valor esperado de una funcin de una variable aleatoria. Deja-
remos las demostraciones de estos teoremas como ejercicios opcionales.
Los teoremas 4.1-4.3 pueden servir para deducir una sencilla frmula que
nos permite calcular la varianza de una variable aleatoria, frmula que est
dada por el teorema 4.4.
156 Captulo 4/ Variables aleatorias discretas
DEMOSTRACiN DEL TEOREMA 4.4 Por la definicin 4.6, tenemos la siguiente expresin
para d:
0'2 = E[(y - JLf] = E(y2 - 2JLY + JL2)
La aplicacin del teorema 4.3 produce
Ahora aplicamos los teoremas 4.1 y 4.2 para obtener
0'2 = E(y2) - 2JLE(y) + JL2 = E(y2) - 2JL(JL) + JL2
= E(l) - 2JL2 + JL2
= E(l) - JL2
Utilizaremos e! teorema 4.4 para derivar las varianzas de algunas de las
variables aleatorias discretas que se presentarn en las siguientes secciones. El
mtodo se demuestra en el ejemplo 4.6.
11.11 111 11 11 11 ' 1.1.1
EJEMPLO 4.6
Solucin
EJERCICIOS
Utilice el teorema 4.4 para calcular la varianza de la variable aleatoria y del
ejemplo 4.1.
En el ejemplo 4.3 calculamos la varianza de y, e! nmero de caras que se
observan al lanzar dos monedas, calculando el- = E[ (y - ,u)2] directamente.
Como esto puede ser un procedimiento tedioso, casi siempre es ms fcil calcu-
lar E(/) y luego aplicar el teorema 4.4 para calcular d. En nuestro ejemplo,
E(l) = t o ~ y lp(y) = (WG) + (l)ZG) + ( 2 ) 2 ( ~ ) = 1.5
Si sustituimos el valor zz = 1 (que obtuvimos en e! ejemplo 4.2) en e! enun-
ciado de! teorema 4.4, tenemos
0'2 = E(y2) - JL2
= 1. 5 - (l)2 = .5
Observe que ste es el valor de d que obtuvimos en el ejemplo 4.3.
En las secciones 4.6-4.1 Opresentaremos varios modelos tiles de distribu-
ciones de probabilidad discretas y expresaremos sin demostracin la media, la
varianza y la desviacin estndar para cada uno. Algunas de estas cantidades
se deducirn en ejemplos opcionales; otras deducciones se dejarn como ejer-
cicios opcionales.
...................................................................
4.15 Refirase a los ejercicios 4.1 y4.8. El fabricante arrienda PC nuevas con un costo de 15,000 dlares al ao.
Calcule la media yla varianza de la cantidad total que la compaa ganar el prximo ao por concepto
de arrendamiento de PC.
4.5 / Pruebas de Bernoulli 157
4.16 Utilice el teorema 4.4 para calcular la varianza de la distribucin de probabilidad del ejercicio 4.2. Veri-
fique que su resultado concuerde con el del ejercicio 4.9.
4.17 Utilice el teorema 4.4 para calcular la varianza de la distribucin de probabilidad del ejercicio 4.3. Veri-
fique que su resultado concuerde con el del ejercicio 4.10.
4.18 Refirase al ejercicio 4.5, donde y es el nmero de percutores que se prueban en una muestra de
cinco seleccionada de un lote grande. Suponga que el costo de inspeccionar un solo percutor es
de 300 dlares si el percutor est defectuoso y de 100 dlares .si no 10 est. Entonces, el costo total de
la inspeccin C (en dlares) est dado por la ecuacin C = 200 + 100y. Calcule la media y la
varianza de C.
EJERCICIOS OPCIONALES
4.19 Demuestre el teorema 4.1. [Sugerencia: Aproveche el hecho de que Ltoda yp(y) =1.]
4.20 Demuestre el teorema 4.2. [Sugerencia: La demostracin es consecuencia directa de la definicin 4.5.]
4.21 Demuestre el teorema 4.3.
4.5 Pruebas de Bernoulli
...................................................................
Varias de las distribuciones de probabilidad discretas que veremos en este ca-
ptulo se basan en experimentos o procesos en los que se realiza una secuencia
de pruebas llamadas pruebas de Bernoulli.
Una prueba de Bernoulli tiene uno de dos resultados mutuamente exclu-
sivos, que por lo regular se denotan con S (xito) y F (fracaso). Por ejemplo,
el lanzamiento de una moneda es una prueba de Bernoulli porque slo puede
ocurrir uno de dos resultados distintos, cara (C) o cruz (X).
Las caractersticas de una prueba de Bernoulli se resumen en el recuadro.
Una variable aleatoria de Bernoulli y se define como el resultado numrico
de una prueba de Bernoulli, donde y = I si hay xito y y = O si se fracasa.
En consecuencia, la distribucin de probabilidad para y se muestra en la tabla
4.4 y en el siguiente recuadro.
158 Captulo 4/ Variables aleatorias discretas
Resultado y p(y)
S 1 P
F O q
En el experimento de Bernoulli de lanzar una moneda, definimos e como
un xito y X como un fracaso. Entonces, y = 1 si e ocurre y y = Osi X ocurre.
Puesto que P(C) = P(X) = .5 si la moneda est balanceada, la distribucin
de probabilidad para y es
P(l) = P = .5
p(O) = q = .5
11, ".1111.11 11
EJEMPLO 4.7
Solucin
Demuestre que para una variable aleatoria de Bernoulli y, /1 = p y a = --r;;.
Sabemos que P(y = 1) = p(l) = p y P(y = O) = p(O) = q. Entonces, por la
definicin 4.4,
J.L = E(y) = L yP(y) = (l)p(l) + (O)p(O) = P(l) = p
Tambin, por la definicin 4.5 y el teorema 4.4,
u
2
= E(y
2)
- J.L2 = L y
2p(y)
- J.L2 = (1)2p(l ) + (0)2p(0) - J.L2
= P(l) - J.L2 = P- p2 = P(l - p) = pq
4.6 / ladistribucin de probabilidad binomial 159
En consecuencia, a = ...[(i'f = -v;q.
. .
Una variable aleatoria de Bernoulli, por s sola, tiene poco inters en las
aplicaciones de ingeniera y ciencias. En cambio, la realizacin de una serie de
pruebas de Bernoulli conduce a varias distribuciones de probabilidad discretas
bien conocidas y tiles. Una de ellas se describe en la siguiente seccin.
4.6 La distribucin de probabilidad binomial
11
Muchos experimentos de la vida real consisten en efectuar una serie de pruebas
de Bernoulli y son anlogos al lanzamiento de una moneda no balanceada un
nmero n de veces. Suponga que 30% de los pozos privados que suministran
agua potable a un rea metropolitana contiene la impureza A. En este caso,
seleccionar una muestra aleatoria de 10 pozos y analizar el agua para determinar
si contiene la impureza A sera anlogo a lanzar una moneda no balanceada
10 veces, siendo la probabilidad de obtener una cara (detectar la impureza A)
en una sola prueba igual a JO. Las encuestas de opinin pblica o preferencias
de los consumidores que generan una de dos respuestas -s o no, aprueba
o desaprueba, etc.- tambin son anlogas al experimento de lanzar una mo-
neda no balanceada si el nmero N de la poblacin es grande y el tamao de
la muestra n es relativamente pequeo, digamos .10N o menos. Todos estos
experimentos son ejemplos particulares de un experimento binomial. Este tipo
de experimentos y las variables aleatorias que resultan poseen las caractersticas
que se enumeran en el recuadro.
La distribucin de probabilidad binomial, su media y su varianza se mues-
tran en el recuadro que sigue. En la figura 4.3 aparecen los histogramas de
frecuencia relativa de distribuciones binomiales para una muestra de n = 10
Y diferentes valores de p. Observe que la distribucin de probabilidad est
sesgada hacia la derecha si el valor de pes pequeo, est sesgada a la izquierda
si el valor de p es grande y es simtrica si p = .5.
160 Captulo 4/ Variables aleatorias discretas
FIGURA 4.1 ...
Distribuciones de probabilidad
binomiales paran =10,p =.1,
.1, .5, .7,.9
p(y)
.4
.3
.2
.1 ....... 1
012345678910
p(y)
.4
.3
.2
.1
012345678910
p(y)
.4
.3
.2
.1
012345678910
a.p= .1 b.p= .3 C.p= .5
y
012345678910
.1
.3
.2
y
p(y)
.4
012345678910
.3
.2
.1
p(y)
.4
d.p=.7 e.p= .9
4.6 / ladistribucin de probabilidad binomial 161
La distribucin de probabilidad binomial se deduce como sigue. Un evento
simple de un experimento binomial que consiste en n pruebas de Bernoulli se
puede representar con el smbolo
SFSFFFSSSF ... SFS
donde la letra que est en la i-sima posicin de izquierda a derecha denota
el resultado de la i-sima prueba. Puesto que queremos calcular la probabilidad
p(y) de observar y xitos en las n pruebas, necesitaremos sumar las probabili-
dades de todos los eventos simples que contengan y xitos (S) y (n - y) fracasos
(F). Tales eventos simples apareceran simblicamente como
y (n - y)
SSSS ... S FF ... F
o algn arreglo distinto de estos smbolos.
Dado que las pruebas son independientes, la probabilidad de que un evento
simple en particular implique y xitos es
y (n - y)
,.---'"------" , ,
P(SSS ... S FF ... F) = pYqn-
y
El nmero de estos eventos simples equiprobables es igual al nmero de formas
en que podemos disponer las y S Ylas (n - y) F en n posiciones que corres-
ponden a las n pruebas. Dicho nmero es igual al nmero de formas de selec-
cionar y posiciones (pruebas para las y S de un total de n posiciones. Este
nmero, dado por el teorema 3.4, es
(
n) n!
y = y!(n - y)!
Hemos determinado la probabilidad de cada evento simple que produce y
xitos, y tambin el nmero de tales eventos. Ahora sumamos las probabi-
lidades de estos eventos simples para obtener
(
Nmerode eventos ) (probabilidad de unode)
p(y) = simples~ u ~ implican estoseventossimples
y xitos equiprobables
o bien
... , "., .
EJEMPLO 4.8 Los ingenieros elctricos saben que una corriente neutral elevada en los siste-
mas de alimentacin de computadoras son un problema potencial. Un estudio
reciente de las corrientes de carga en sistemas de alimentacin de compu-
tadoras en instalaciones estadounidenses revel que 10% de las instalaciones
tenan razones de corriente neutral a corriente de carga total altas (IEEE Trans-
actions on Industry Applications, julio/agosto de 1990). Si se escoge una muestra
aleatoria de cinco sistemas de alimentacin de computadora del gran nmero
de instalaciones del pas, qu probabilidad hay de que
a. Exactamente tres tengan una relacin de corriente neutral a corriente de
carga total alta?
162 Captulo 4/ Variables aleatorias discretas
b. Por lo menos tres tengan una relacin alta?
c. Menos de tres tengan una relacin alta?
Solucin
El primer paso es confirmar que este experimento posee las caractersticas de
un experimento binomial. El experimento consiste en n = 5 pruebas de Ber-
noulli, cada una de las cuales corresponde a una instalacin elegida al azar.
Cada prueba produce una S (la instalacin tiene un sistema de alimentacin
de computadora con una relacin de corriente neutral a corriente de carga total
alta) o una F (el sistema no tiene una relacin alta). Puesto que el nmero
total de instalaciones con sistemas de alimentacin de computadora en el pas
es grande, la probabilidad de escoger una sola instalacin y encontrar que tiene
una relacin de corriente neutral a corriente de carga total alta es de .1, Yesta
probabilidad se mantendr aproximadamente constante (para todos los prop-
sitos prcticos) en cada una de las instalaciones escogidas. Es ms, como el
muestreo fue aleatorio, suponemos que el resultado en cualquier instalacin
no afecta el resultado en ninguna otra y que las pruebas son independientes.
Por ltimo, nos interesa el nmero y de instalaciones en la muestra de n = 5
que tienen razones de corriente neutral a corriente de carga total altas. Por
tanto, el procedimiento de muestreo representa un experimento binomial con
n = 5 YP = .1.
a. La probabilidad de escoger exactamente y = 3 instalaciones con una rela-
cin alta es
donde n = 5, P = .1 YY = 3. Entonces,
- ~ 3 2_
p(3) - 3!2,(.1) (.9) - .0081
b. La probabilidad de observar al menos tres instalaciones con razones altas es
P(y :::: 3) = p(3) + p(4) + p(5)
donde
_ 5! 4 1_
p(4) - 4!l!(.1) (.9) - .00045
_ ~ 5 0_
p(5) - 5!0,(.1) (.9) - .00001
Puesto que ya obtuvimos p(3) en el inciso a, tenemos
P(y:::: 3) = p(3) + p(4) + p(5)
= .0081 + .00045 + :00001 = .00856
c. Aunque P(y < 3) = p(O) + P(l) + p(2), podemos evitar calcular estas
probabilidades utilizando la relacin complementaria y el hecho de que
L;= p(y) = 1.
4.6/ ladistribucin de probabilidad binomial 163
Por tanto,
P(y < 3) = 1 - P(y ~ 3) = 1 - .00856 = .99144
..........................
En la tabla 1 del apndice II se presentan tablas de sumas parciales de la
forma
k
: p(y)
y=o
para probabilidades binomiales, para n = 5, 10, 15, 20 Y25. Por ejemplo, el
lector encontrar que la suma parcial dada en la tabla para n = 5, en la fila
correspondiente a k = 2 Yla columna correspondiente a p = .1, es
2
: p(y) = p(O) + pO) + p(2) = .991
y=o
Esta respuesta, correcta hasta tres posiciones decimales, concuerda con nuestra
respuesta al inciso e del ejemplo 4.8.
11 111 111.' 1 11 1.111
EJEMPLO 4.9
Solucin
Calcule la media, la varianza y la desviacin estndar de una variable aleatoria
binomial con n = 20 YP= .6. Construya el intervalo u 20' y calcule P(..L -
20' < y < f..l + 20').
Si aplicamos las frmulas proporcionadas anteriormente tenemos
JL = np = 20(.6) = 12
0'2 = npq = 20(.6)(.4) = 4.8
u=V4.8=2.19
La distribucin de probabilidad binomial para n = 20 y P= .6 y el intervalo
f..l 20', o sea, 7.62 a 16.38, se muestran en la figura 4.4. Los valores de y que
caen en el intervalo f..l Za son 8, 9, ... , 16. Por tanto,
P(j1 - 20' < y < f..l + 20') = P(y = 8, 9, 10, ... , o 16)
16 7
= : p(y) - : p(y)
y=O y=O
Obtenemos los valores de estas sumas parciales de la tabla 1 del apn-
dice 11:
16 7
P(JL - 20' < y < JL + 20') = : p(y) - : p(y)
y=o y=o
= .984 - .021 = 963
164 Captulo 4/ Variables aleatorias discretas
.20
p(y)
FIGURA 4.4 ~
Distribucin de probabilidad
binomial parayen el ejemplo4.9
(n= 20, P= .6)
.15
.10
.05
o 1 2 345 6 7 11 12
I
11
-1-
Puede verse que este resultado se acerca al valor de .95 especificado por la
Regla Emprica que vimos en el captulo 2.
11 11 111 11 11 1 11.' ' '1
EJEMPLO 4.10
(OPCIONAL)
Solucin
Deduzca la frmula para el valor esperado de la variable aleatoria binomial.
Por la definicin 4.4,
n 1
f.L = E(y) = 2: yp(y) = 2: y n. pYqn-
y
today y= y!(n - y)!
La forma ms fcil de sumar estos trminos es convertirlos en probabilidades
binomiales y luego aprovechar el hecho de que :r.;= p(y) = 1. Si tomamos nota
del hecho de que el primer trmino de la sumatoria es igual a O (puesto que
y = O), tenemos
n
~ n!
f.L = LJ Y pYqn-
y
y=l [y(y - 1) ... 3 . 2 l](n - y)!
i n!
= y=l (y - 1)!(n _ y)!pyqn-
y
Como n y p son constantes, podemos utilizar el teorema 4.2 para sacar np de
la sumatoria por factorizacin:
_ p i (n - 1)! y-l n-y
f.L - n y=l (y - 1)!(n - y)!p q
4.6/ ladistribucin de probabilidad binomial 165
Sea z = (y - 1). Entonces, cuando y = 1, z = OYcuando y = n, Z = (n - 1);
entonces,
_ .. (n - 1)! y-l n-y
1-' - np f=l (y - l)!(n - y)!p q
n-l
= n (n - 1)! zqr1)-z
p z=o z![(n - 1) - z]! P
La cantidad dentro del signo de sumatoria es p(z), donde z es una variable
aleatoria binomial basada en (n - 1) pruebas de Bernoulli. Por tanto,
n-l
p(z) = 1
z=o
y
n-l
1-' = np p(z) = np(l) = np
z=o
EJERCICIOS
...................................................................
4.22 Utilice la frmula de la distribucin de probabilidad binomial para calcular las probabilidades con n = 4,
p=.5yy=0,1,2,3y4.
4.23 Utilice las probabilidades binomiales de la tabla 1 del apndice 11 para calcular p(y) con n = 10 Y
a. p =.1 b. P =.5 c. P = .9
d. Construya grficas (similares a la figura 4.2) de las tres distribuciones de probabilidad de los
incisos a-c. Observe la simetra de la distribucin para p = .5 y el sesgo para p = .1 y P = .9.
4.24 La Fundacin Nacional de las Ciencias de Estados Unidos informa que 70% de los estudiantes de
posgrado que obtienen grados de doctorado en ingeniera en ese pas son ciudadanos de otros pases
(Science, 24 de. sept. de 1993). Considere el nmero de estudiantes extranjeros en una muestra
aleatoria de 25 estudiantes de ingeniera que recientemente obtuvieron su doctorado.
a. Calcule P(y = 10).
b. Calcule P(y s 5).
c. Calcule la media Ji y la desviacin estndar a de y.
d. Interprete los resultados del inciso c.
4.25 En el Occupational Outlook Quarterly (primavera de 1993) se inform que 1%de todos los instaladores
de pared seca empleados en la industria de la construccin son mujeres. En una muestra aleatoria de 10
instaladores de pared seca, calcule la probabilidad de que, cuando ms, uno de ellos sea mujer.
4.26 Los zologos han descubierto que los animales pasan mucho tiempo descansando, aunque este
tiempo de reposo puede tener importancia funcional (por ejemplo, los depredadores que acechan
a su presa). Descontando el tiempo que pasan en sueo profundo, un investigador de la University
of Vermont estim el porcentaje del tiempo que diversas especies pasan descansando (National
Wildlife, agosto-septiembre de 1993). Por ejemplo, la probabilidad de que una lagartija hembra
est descansando en un momento dado es de aproximadamente .95.
a. En una muestra al azar de 20 lagartijas hembra, qu probabilidad hay de que por lo menos
15 estn descansando en un momento dado?
166 Captulo 4/ Variables aleatorias discretas
b. En una muestra al azar de 20 lagartijas hembra, qu probabilidad hay de que menos de 10
estn descansando en un momento dado?
c. En una muestra al azar de 200 lagartijas hembra, esperara usted observar menos de 190
descansando en un momento dado? Explique.
4.27 En un estudio reciente, Consumer Reports (febrero de 1992) encontr un gran nmero de casos de
contaminacin y errores de etiquetacin de mariscos en supermercados de las ciudades de Nueva
York y Chicago. El estudio revel una estadstica alarmante: 40% de los trozos de pez espada
disponibles para la venta tena un nivel de mercurio superior al lmite inferior establecido por la
Administracin de Alimentos y Medicinas (FDA) de Estados Unidos. Para una muestra aleatoria
de tres trozos de pez espada, calcule la probabilidad de que:
a. Los tres trozos de pez espada tengan niveles de mercurio por encima del mnimo de la FDA.
b. Exactamente un trozo de pez espada tenga un nivel de mercurio por encima del mnimo de
la FDA.
c. Cuando ms, un trozo de pez espada tenga un nivel de mercurio por encima del mnimo de la FDA.
4.28 Un estudio de las tendencias a lo largo de cinco aos en los sistemas de informacin logstica de
las industrias revel que los mayores avances en la computarizacin tuvieron lugar en el transporte
(Industrial Engineering, julio de 1990). Actualmente, 90% de todas las industrias contiene archivos
de pedidos abiertos de embarque en su base de datos computarizada. En una muestra aleatoria de
10 industrias, sea y el nmero de ellas que incluyen archivos de pedidos abiertos de embarque en
su base de datos computarizada.
a. Verifique que la distribucin de probabilidad de y se puede modelar utilizando la distribucin
binomial.
b. Calcule P(y = 7).
c. Calcule P(y > 5).
d. Calcule la media y la varianza de y. Interprete los resultados.
4.29 Refirase al estudio (aparecido en el IEEE Computer Applications in Power) de un sistema de
vigilancia automtico para exteriores diseado para detectar intrusos (ejercicio 3.13). En condiciones
de clima nevoso, el sistema detect 7 de 10 intrusos; por tanto, los investigadores estimaron que
la probabilidad de deteccin de intrusos del sistema cuando est nevando es de .70.
a. Suponiendo que la probabilidad de detectar intrusos cuando est nevando es de slo .50, calcule
la probabilidad de que el sistema automtico detecte por lo menos 7 de 10 intrusos.
b. Con base en eJ resultado del inciso a, comente sobre la confiabilidad de la estimacin que hicieron
los investigadores respecto a la probabilidad de deteccin del sistema en condiciones nevosas.
4.30 Refirase al problema de transporte de partculas neutrales descrito en el ejercicio 3.25. Recuerde
que las partculas liberadas en un ducto evacuado chocan con la pared interior del ducto y se
dispersan (reflejan) con probabilidad de .16 o bien se absorben con probabilidad de .84 (Nuclear
Science and Engineering, mayo de 1986).
a. Si se liberan cuatro partculas en el dueto, zqu probabilidad hay de que las cuatro sean ab-
sorbidas por la pared interior del ducto? y exactamente tres de las cuatro?
b. Si se liberan 20 partculas en el dueto, qu probabilidad hay de que por lo menos 10 sern
reflejadas por la pared interior del ducto? y exactamente lO?
4.31 Durante la dcada de 1950se realizaron varias pruebas de armas nucleares en el desierto en Nevada.
Desde entonces, las estimaciones de exposicin a la radiacin de poblaciones fuera del sitio de las
pruebas, sobre todo en Utah, han sido objeto de un gran esfuerzo de investigacin cientfica. El
Registro de Vigilancia, Epidemiologa y Resultados Finales (SEER) recab datos acerca de la inci-
dencia de cncer de la tiroides entre los residentes de Utah durante el periodo de 1973 a 1977. El
SEER averigu que la tasa de incidencia de cncer de la tiroides entre hombres de 50 aos de
edad es de 3.89 en una poblacin de 100,000. Esto implica que la probabilidad de que un hombre
de Utah de 50 aos de edad desarrolle cncer de la tiroides es de .0000389. En una muestra al
4.7 / ladistribucin de probabilidad multinomial 167
azar de 1,000 hombres de Utah de 50 aos de edad, sea y el nmero de los que desarrollaron cncer
de la tiroides.
a. Calcule la media y la varianza de y.
b. Esperara usted observar por lo menos un hombre de 50 aos con cncer de la tiroides entre
los 1,000?
4.32 La revista Organic Gardening realiz una encuesta para averiguar si los consumidores preferiran
frutas y verduras cultivadas orgnicamente a las cultivadas con fertilizantes y plaguicidas (New York
Times, 21 de marzo de 1989). Si los costos de los dos tipos de alimentos fueran los mismos, 85%
dijo que preferira la comida orgnica. Sorprendentemente, 50% dijo que preferira la comida or-
gnica incluso si tuviera que pagar ms por ella. Considere las preferencias de una muestra aleatoria
de n = 25 consumidores.
a. Suponiendo que los porcentajes de la encuesta reflejan las preferencias de la poblacin, calcule
la probabilidad de que por lo menos 20 de los 25 consumidores prefieran los alimentos culti-
vados orgnicamente, si los costos fueran iguales.
b. Suponiendo que los porcentajes de la encuesta reflejan las preferencias de la poblacin, calcule
la probabilidad de que por lo menos 20 de los 25 consumidores prefieran los alimentos culti-
vados orgnicamente, incluso si los costos fueran mayores que los de los alimentos cultivados
con fertilizantes y pesticidas.
EJERCICIOS OPCIONALES
4.33 Para la distribucin de probabilidad binomial p(y), demuestre que p(y) = 1. [Sugerencia: El
teorema binomial, que se refiere a la expansin de (a + b)n, dice que
(a + b)n = + (7)a
n- 1b
+ + ... +
Sea a =q y b =p.]
4.34 Demuestre que, para una variable aleatoria binomial,
E[y(y - I)J = npq + 1J-2 - IJ-
[Sugerencia: Escriba el valor esperado como una suma, saque por factorizacin y(y-l) yluego factorice
trminos hasta ,que cada trmino de la suma sea una probabilidad binomial. Aproveche el hecho de que
LyP(Y) = 1para sumar la serie.J
4.35 Utilice los resultados del ejercicio 4.34 y el hecho de que
E[y(y - I)J = E(y2 - y) = E(i) - E(y) = E(i) - IJ-
para calcular E(i) para una variable aleatoria binomial.
4.36 Utilice los resultados de los ejercicios 4.34 y 4.35, junto con el teorema 4.4, para demostrar que
cr = npq para una variable aleatoria binomial.
4.7 la distribucin de probabilidad multinomial
...................................................................
Muchos tipos de experimentos producen observaciones de una variable cuali-
tativa con ms de dos posibles resultados. Por ejemplo, suponga que cierta
computadora personal (PC) se fabrica en una de cinco lneas de produccin
distintas, A, B, C, D o E. A fin de comparar las proporciones de PC defectuosas
que se pueden atribuir a las cinco lneas de produccin, todas las computadoras
168 Captulo 4/ Variables aleatorias discretas
Lnea de produccin
A B
15 27
C
31
D
19
E
11
defectuosas detectadas por los ingenieros de control de calidad se clasifican
diariamente segn la lnea en que se produjeron. Cada PC es una unidad ex-
perimental y la observacin es una letra que identifica la lnea de produccin
en la que se produjo. La lnea de produccin es evidentemente una variable
cualitativa.
Suponga que n = 103 computadoras se producen con defectos en una
semana dada. Las n = 103 observaciones cualitativas, cada una de las cuales
es una A, B, C, O o E, producen cuentas que indican los nmeros de mquinas
defectuosas que salen de las cinco lneas de produccin. Por ejemplo, si hubiera
Yl = 15 resultados A, Yz = 27 resultados B, Y3 = 31 resultados C, Y4 = 19
resultados O y Y5 = 11 resultados E, los datos clasificados se veran como
aparecen en la tabla 4.5, que muestra las cuentas en cada categora de la cla-
sificacin. Observe que la suma de los nmeros de PC defectuosas producidas
por las cinco lneas debe ser igual al nmero total de mquinas defectuosas.
n = y + yz + Y3 + Y4 + Y5 = 15 + 27 + 31 + 19 + 11 = 103
El experimento de clasificacin que acabamos de describir se denomina
experimento multinomial y representa una extensin del experimento binomial
que estudiamos en la seccin 4.6. Un experimento as consiste en n pruebas
idnticas, es decir, observaciones de n unidades experimentales. Cada prue-
ba debe producir uno y slo uno de k resultados, las k categoras de clasificacin
(para el experimento binomial, k = 2). La probabilidad de que el resultado de
una sola prueba caiga en la categora i es Pi (i = 1, 2, ... , k). Por ltimo, las
pruebas son independientes y nos interesan los nmeros de observaciones, y,
Yz, ... , Yb que caen en las k categoras de clasificacin.
La distribucin multinomial, su media y su vananza se muestran en el
siguiente recuadro.
4.7 / ladistribucin de probabilidad multinomial 169
El procedimiento para derivar la distribucin de probabilidad multinomial
p(y, Y:z, , Yk) para las cuentas de categora nI. nz, ... , ni; es idntico al
que se sigue en un experimento binomial. A fin de simplificar nuestra notacin,
ilustraremos el procedimiento para k = 3 categoras. La deduccin de p(y, Yz,
... , Yk) para k categoras es similar.
Denotemos con A, B YC los tres resultados que corresponden a las k = 3
categoras, con sus respectivas probabilidades de categora PI, pz y p,. Entonces,
cualquier observacin del resultado de n pruebas dar pie a un evento simple
del tipo que se muestra en la tabla 4.6. El resultado de cada prueba se indica
con la letra que se observ. As, el evento simple de la tabla 4.6 es el que da
como resultado C en la primera prueba, A en la segunda, A en la tercera, ... ,
y B en la ltima.
Prueba
e
2
A
3
A
4
B
5
A
6
e
n
B
Consideremos ahora un evento simple que produzca y, resultados A, yz
resultados B y y, resultados C, donde y + yz + y, = n. Uno de estos eventos
simples se muestra en la figura 4.5. La probabilidad del evento simple de la
figura, que produce y, resultados A, yz resultados B y y, resultados C, es
AAA ... A' 'BBB ... B eee ... e
FIGURA 4.5 ~
Evento simple que contiene YI
resultados A, Y2 BYYl (
Yl Y2 YJ
Cuntos eventos simples habr en el espacio de muestra S que impliquen
y resultados A, yz resultados B y y, resultados C? Esta cantidad es igual al
nmero de formas diferentes en que podemos acomodar los y resultados A,
170 Captulo 4/ Variables aleatorias discretas
Yl resultados B y Y3 resultados C en las n posiciones distintas de la figura 4.5.
El nmero de formas en que asignaramos YI posiciones a A, Yl posiciones a B
y Y3 posiciones a C est dado por el teorema 3.3, y es
n!
Y !Yl!Y3!
Por tanto, hay n!/(YI!YZ!Y3!) eventos simples que producen YI resultados A, Yz
resultados B y y3 resultados C, cada uno con probabilidad (p)YI, (pz)Y y (P3)Y'
En consecuencia, la probabilidad de observar Y resultados A, Yl resultados B y
Y3 resultados C en n pruebas es igual a la suma de las probabilidades de estos
eventos simples:
nI
p(y, Yl, Y3) = (P)Yl(Pl)Yz(P3)Y3
Y!Yl!Y3!
El lector puede comprobar que sta es la expresin que se obtiene al sustituir
k = 3 en la frmula para la distribucin de probabilidad multinomial mostrada
en el recuadro.
El valor esperado, o medio del nmero de cuentas para una categora es-
pecfica, digamos la categora i, se puede obtener directamente de nuestro
conocimiento de las propiedades de una variable aleatoria binomial. Si combi-
namos todas las categoras distintas de la categora i en una sola categora, la
clasificacin multinomial se convierte en una clasificacin binomial con Y ob-
servaciones en la categora i y (n - Y) observaciones en la categora combinada.
Entonces a partir de lo que sabemos acerca del valor esperado y la varianza de
una variable aleatoria binomial, deducimos que
E(Yi) = np
V(y) = np(1 - Pi)
11111 1111 11 '1 '11." ,',
EJEMPLO 4.11
Solucin
Refirase al estudio de razones de corriente neutral a corriente de carga total
en sistemas de alimentacin de computadoras (ejemplo 4.8). Suponga que los
ingenieros elctricos determinaron que 10% de los sistemas tiene razones altas,
30% tiene razones moderadas y 60% tiene razones bajas. Considere una muestra
aleatoria de n = 40 instalaciones con sistemas de alimentacin para compu-
tadoras.
a. Calcule la probabilidad de que 10 instalaciones tengan razones de corriente
neutral a corriente de carga total altas, 10 instalaciones tengan razones mo-
deradas y 20 tengan razones bajas.
b. Calcule la media y la varianza del nmero de instalaciones que tienen ra-
zones de corriente neutral a corriente de carga total altas. Utilice esta in-
formacin para estimar el nmero de instalaciones en la muestra de 40 que
tendrn razones altas.
En la solucin del ejemplo 4.8 verificamos que se satisfacen las propiedades
de un experimento binomial. Este ejemplo no es ms que una extensin del
experimento binomial a uno que puede tener k = 3 posibles resultados -re-
lacin alta, moderada o baja- en cada instalacin. Por tanto, se satisfacen las
propiedades de un experimento multinomial y podemos aplicar las frmulas
que se presentaron en el recuadro.
a. Defina lo siguiente:
4.7 / ladistribucin de probabilidad multinomial 171
y = Nmero de instalaciones con razones altas
Yl = Nmero de instalaciones con razones moderadas
Y3 = Nmero de instalaciones con razones bajas
PI = Probabilidad de que una instalacin tenga una relacin alta
Pl = Probabilidad de que una instalacin tenga una relacin moderada
P3 = Probabilidad de que una instalacin tenga una relacin baja
Entonces lo que queremos es calcular la probabilidad, P(YI = 10, Yl = 10,
Y3 = 30), utilizando la frmula
n!
p(y, Yl, Y3) = (p)Yl(Pl)Y2(P3)Y3
Y !Yl!Y3!
donde n = 40 Ynuestras estimaciones de P" Pl YP3 son .1, .3 Y.6, respec-
tivamente. Si sustituimos estos valores, obtenemos
b. Queremos calcular la media y la varianza de y" el nmero de instalaciones
con razones de corriente neutral a corriente de carga total altas. Por la
frmula del recuadro, tenemos
JL = np, = 40(.1) = 4
y
cr = np(l - PI) = 40(.1)(.9) = 3.6
Con base en la Regla Emprica, esperamos que y" el nmero de insta-
laciones de la muestra que tienen razones altas, se encuentre a menos de
2 desviaciones estndar de su media, esto es, entre
JL - 2cr = 4 - 2v'3.6 = .21
y
JL + 2cr = 4 + 2v'3.6 = 7.79
Puesto que y slo puede adoptar valores enteros, O, 1, 2, ... , esperaremos
que el nmero de instalaciones con razones altas est entre 1 y 7.
..........................
EJERCICIOS
...................................................................
4.37 Para la distribucin multinomial con n = 5, k = 3, PI = .2, Pl = ,5 YP3 = .3, calcule las siguientes
probabilidades:
a. p(3, 1, 1) b. p(O, 5, O) c. p(l, 3, 1)
172 Captulo 4/ Variables aleatorias discretas
4.38 Refirase a la distribucin multinomial del ejercicio 4.37. Calcule la media yla varianza para cada una de
las tres variabIes aleatorias, YI> Yz YY3-
4.39 A fin de compensar la desorientacin que se experimenta en ausencia de gravedad, los astronautas
se apoyan mucho en la informacin visual para establecer una orientacin vertical de arriba hacia
abajo. El potencial para utilizar la brillantez de color como indicio de la orientacin de un cuerpo
se estudi en Human Factors (diciembre de 1988). Noventa estudiantes universitarios, recostados
boca arriba en la oscuridad, se sometieron a desorientacin colocndoseles en una plataforma ro-
tatoria bajo un disco que giraba lentamente y bloqueaba su campo de visin. Se les pidi a los
estudiantes que dijeran "alto" cuando sintieran que estaban viendo hacia arriba. En ese momento
se registr la posicin del patrn de brillantez del disco en relacin con la orientacin del cuerpo
del estudiante. Los sujetos seleccionaron slo tres patrones de brillantez del disco como indicios
subjetivos de verticalidad: (1) lado ms iluminado hacia arriba, (2) lado ms oscuro hacia arriba y (3)
lados iluminado y oscuro alineados a ambos lados de la cabeza del sujeto. Con base en los resultados
del estudio, las probabilidades de que los sujetos seleccionen las tres orientaciones del disco son
.65, .15 y .20, respectivamente. Suponga que n = 8 sujetos realizan un experimento similar.
a. Qu probabilidad hay de que los ocho sujetos escojan la orientacin de lado ms iluminado
hacia arriba?
b. Qu probabilidad hay de que cuatro sujetos escojan la orientacin de lado ms iluminado
hacia arriba, tres escojan la orientacin de lado ms oscuro hacia arriba y uno escoja la orien-
tacin alineada?
c. En promedio, cuntos de los ocho sujetos escogern la orientacin de lado ms iluminado
hacia arriba?
4.40 La piratera de software para computadora muy utilizado, como Lotus y WordStar, se est exten-
diendo con una rapidez fenomenal. Decisiones judiciales recientes han determinado como respon-
sables a las compaas por los empleados que copian sin autorizacin el software adquirido por
aqullas, incluso aunque la propia compaa se d cuenta del hecho. Estn adoptando las com-
paas polticas ms estrictas respecto al copiado de software, y estn obligando a su cumplimiento?
A fin de responder a esta pregunta, un investigador encuest 121 compaas industriales incluidas
entre las Fortune 500 (las 500 compaas ms grandes segn la revista Fortune) y que utilizan
computadoras personales (PC) en el trabajo (Journal of Systems Management, julio de 1989). Un
aspecto de particular inters fue el de los mtodos que utilizan las compaas para obligar el cum-
plimiento de las. polticas. Las respuestas para las 121 compaas se resumen en la tabla.
Mtodopara hacercumplirpolticas
l. No se emprende accin alguna
2. Auditoras internas
3. Sistema de honor
4. Auditoras gerenciales/revisiones aleatorias
5. Otros
TOTAL
Nmerodecompaas
10
49
28
12
22
121
Fuente: Athey, S. A., "Softwarecopyingpoliciesof the Fortune500",[ournalofSystems Ma-
nagement, juliode 1989, pg. 33 (tabla 6).
a. Verifique si este estudio satisface las propiedades de un experimento multimodal.
b. Un investigador ha propuesto la teora de que las compaas estn igualmente divididas en
cuanto al mtodo de obligacin utilizado. Si as fuera, asigne valores a las probabilidades PI,
Pz, P3' P4 YPs del experimento multinomial.
c. Utilice las probabilidades del inciso b para calcular la probabilidad de observar los resultados
que se muestran en la tabla.
4.7 / La distribucin de probabilidad multinomial 173
4.41 Una corriente elctrica que viaja a travs de un resistor puede tomar uno de tres caminos diferentes,
con probabilidades PI = .25, pz = .30 YP3 = .45, respectivamente. Suponga que determinamos el
camino tomado en n = 10 ensayos consecutivos.
a. Calcule la probabilidad de que la corriente elctrica viajar por la primera trayectoria y, = 2
veces, por la segunda yz = 4 veces y por la tercera Y3 = 4 veces.
b. Calcule E(yz) y V(yz). Interprete los resultados.
4.42 Los trabajos presentados a un centro de cmputo universitario pueden ejecutarse en una de cuatro
diferentes clases de prioridad: urgente, prioridad normal, baja prioridad y espera. El centro de cm-
puto estima que 10% de los trabajos se presentan como urgentes, 50% con prioridad normal, 20%
con baja prioridad y 20% en fila de espera. Suponga que se presentan simultneamente n = 20
trabajos.
a. Calcule la probabilidad de que dos trabajos se presentarn como urgentes, 12 con prioridad
normal, 5 con prioridad baja y 1 en fila de espera.
b. Calcule el nmero esperado de trabajos de baja prioridad en la muestra.
c. Dentro de qu intervalo esperara usted que cayera el nmero de trabajos de baja prioridad
de la muestra?
4.43 Se selecciona una muestra de tamao n de un lote grande de brocas para taladro de corte. Suponga
que una proporcin PI contiene exactamente un defecto y una proporcin pz contiene ms de un
defecto (con PI + pz < 1). El costo de reemplazar o reparar las brocas defectuosas es de C = 4y,
+ Yz, donde YI denota el nmero de brocas con un defecto y yz denota el nmero de brocas con
dos o ms defectos. Calcule el valor esperado de C.
4.44 En marzo de 1981 ocurri un brote de gastroenteritis no bacterial de contagio a travs del agua
en Colorado como resultado de una deficiencia prolongada y mal funcionamiento de los filtros en
una planta de tratamiento de aguas de albaal. Se realiz un estudio para determinar si la incidencia
de enfermedades gastrointestinales durante la epidemia estaba relacionada con el consumo de agua
(American Water Works Journal, enero de 1986). Una encuesta telefnica de los hogares produjo
la informacin que se presenta en seguida sobre el consumo diario de vasos de agua de 8 onzas
para una muestra de 40 residentes que presentaron sntomas de gastroenteritis durante la epidemia.
Consumo diario de vasos de agua
de 8 onzas
O 1-2 3-4 5oms Total
Nmero d.e respondedores con sntomas 6 11 13 10 40
Fuente: Hopkins, R. S. etal., "Gastroenteritis: Case studyofa Colorado outbreak".JournalAmerican Water Works
Association, vol. 78, nm. 1, enero de 1986, pg. 42, tabla 1. Copyright I986, American Water WorksAssociation.
Reproduccin autorizada.
a. Si el nmero de respondedores con sntomas no depende de la cantidad de agua consumida
diariamente, asigne probabilidades a las cuatro categoras que se muestran en la tabla.
b. Utilice la informacin del inciso a para calcular la probabilidad de observar el resultado de
muestreo que se presenta en la tabla.
EJERCICIO OPCIONAL
4.45 Para una distribucin multinomial con k = 3 y n = 2, verifique que
L P(YI, Yz, Y3) = 1
y, Yz, Y3
[Sugerencia: Utilice el teorema binomial (vea el ejercicio opcional 4.33) para expandir la suma
[a + (b + c)j2, luego sustituya la expansin binomial de (b + c)Z en la expresin resultante. Por
ltimo, sustituya a = p, b = pz y c = pd
174 Captulo 4/ Variables aleatorias discretas
4.8 las distribuciones de probabilidad
binomial negativa ygeomtrica
...................................................................
En muchos casos nos interesar medir el tiempo transcurrido antes de que
ocurra un evento; por ejemplo, el tiempo que un cliente debe esperar en una
fila antes de ser atendido, o el tiempo que tarda en fallar un equipo.
Para esta aplicacin, consideramos cada unidad de tiempo como una prue-
ba de Bernoulli que puede tener como resultado un xito (5) o un fracaso (F
y estudiamos una serie de pruebas idnticas a las que describimos para el ex-
perimento binomial (seccin 4.6). A diferencia de los experimentos binomiales
en los que y es el nmero total de xitos, la variable aleatoria de inters aqu
es y, el nmero de pruebas (unidades de tiempo) hasta que se observa el T-simo
xito.
La distribucin de probabilidad para la variable aleatoria y se conoce como
distribucin binomial negativa. La frmula de esta distribucin se presenta en
el siguiente recuadro, junto con la media y la varianza de una variable aleatoria
binomial negativa.
Por el recuadro podemos ver que la distribucin de probabilidad binomial
negativa es una funcin de dos parmetros, p y T. Para el caso especial en que
r = 1, la distribucin de probabilidad de y se denomina distribucin de proba-
bilidad geomtrica.
4.8 / Las distribuciones de probabilidad binomial negativa ygeomtrica 175
Para deducir la distribucin de probabilidad binomial negativa, observe que
cada evento simple que resulte en y pruebas hasta el r-simo xito contendr
(y - r) resultados F y r resultados S, como se muestra aqu:
(y- r) resultados Fy (r-l) resultados S r-simo S
, ,,.....-"-,
F F S F F ... S F S
El nmero de eventos simples diferentes que resultan en (y - r) resultados F
antes del r-simo resultado S es el nmero de formas en que podemos acomo-
dar los (r - 1) resultados S y los (y - r) resultados F, a saber,
(
( y - r) + (r - 1)) = (y - 1)
r-l r-l
Entonces, dado que la probabilidad asociada a cada uno de estos eventos sim-
ples es prqr--r, tenemos
p(y) = (y - l)prqy-r
r - 1
Los ejemplos 4.12 y 4.13 demuestran la aplicacin de las distribuciones de
probabilidad binomial negativa y geomtrica, respectivamente.
,., ".,1,.,1111,
EJEMPLO 4.12
Solucin
Para instalar el alojamiento de un motor, un ensamblador de lnea de produc-
cin debe utilizar una herramienta manual elctrica para colocar y apretar cua-
tro pernos. Suponga que la probabilidad de colocar y apretar un perno en
cualquier intervalo de tiempo de 1 segundo es p = .8. Si el ensamblador falla
en el primer segundo, la probabilidad de xito durante el segundo intervalo de
1 segundo es .8, y as sucesivamente.
a. Calcule la distribucin de probabilidad de y, el tiempo que transcurre antes
de instalarse un alojamiento completo.
b. Calcule p(6).
c. Calcule la media y la varianza de y.
a. Puesto que el alojamiento contiene r = 4 pernos, utilizaremos la frmula
para la distribucin de probabilidad binomial negativa. Si sustituimos p = .8
Yr = 4 en la frmula de p(y) obtenemos
p(y) = ( ~ =t)prqy-r = (y ~ 1)(.8)4(.2)Y-4
176 Captulo 4/ Variables aleatorias discretas
b. Para calcular la probabilidad de que la operacin de ensamblado completa
requiera y = 6 segundos, sustituimos y = 6 en la frmula que obtuvimos
en el inciso a y vemos que
p(y) = G)(.8)\2)2 = (10)(.4096)(.04) = .16384
c. Para esta distribucin binomial negativa,
r 4 d
JL = - = - = 5 segun os
p .8
y
2 _ rq _ 4(.2) - 1 25
(T - p2 - (.8)2 - .
11 ,1, "
EJEMPLO 4.13
Solucin
Un fabricante utiliza fusibles elctricos en un sistema electrnico. Los fusibles
se compran en lotes grandes y se prueban secuencialmente hasta que se observa
el primer fusible defectuoso. Suponga que el lote contiene 10% de fusibles
defectuosos.
a. Qu probabilidad hay de que el primer fusible defectuoso sea uno de los
primeros cinco fusibles probados?
b. Calcule la media, la varianza y la desviacin estndar de y, el nmero de
fusibles probados hasta observarse el primer fusible defectuoso.
a. El nmero y de fusibles probados hasta observarse el primer fusible defec-
tuoso es una variable aleatoria geomtrica con
p =.1 (probabilidad de que un solo fusible sea defectuoso)
q = 1 - P = .9
y
p(y) = pqy-I (y = 1, 2, ... )
= (.1)(.9)r1
La probabilidad de que el primer fusible defectuoso sea uno de los primeros
cinco fusibles probados es
P(y:5 5) = p(l) + p(2) + ... + p(5)
= (.1)(.9) + (.1)(.9)1 + ... + (.1)(.9)4 = .41
b. La media, la varianza y la desviacin estndar de esta variable aleatoria
geomtrica son
1 1
p.=-=-=1O
P .1
(T2 = !L = ~ = 90
p2 (.1)2
(T = y;;:z = v'9O = 9.49
4.8 / Las distribuciones de probabilidad binomial negativa ygeomtrica 177
EJERCICIOS
...................................................................
4.46 Suponga que y es una variable aleatoria binomial negativa. Calcule p(y) para cada una de las siguien-
tes situaciones:
a. p= .2, T =2, Y =3 b. P=.5, T = 3, Y= 5 c. P=.8, T =3, Y =5
4.47 Suponga que y puede modelarse mediante una distribucin de probabilidad binomial negativa con
p = .6 YT = 3.
a. Calcule p(y) para y = 6, 7, 8 Y9.
b. Construya un histograma de probabilidad para p(y).
c. Calcule u y u para la distribucin de probabilidad.
d. Localice los puntos u + 2s y f.1 - 2u en el eje y de la grfica del inciso b. Calcule P(.L - 2u
s y ~ f.1 + Zer).
4.48 Sea y una variable aleatoria geomtrica con p = .7.
a. Calcule p(y) para y = 1, 2, ... , 5.
b. Construya un histograma de probabilidad para p(y).
c. Calcule f.1 y 2u para la distribucin de probabilidad geomtrica.
d. Localice los puntos f.1 + Zcr y f.1 - 2u en el eje y de la grfica del inciso b. Calcule P(.L - Za
~ y ~ f.1 + Zcr).
4.49 Se utiliz la distribucin binomial negativa para modelar la distribucin de parsitos (solitarias)
encontrados en varias especies de peces del Mediterrneo (Journal of Fish Biology, agosto de 1990).
Suponga que el evento de inters es el hallazgo de un parsito en el sistema digestivo de rodaballos,
y sea y el nmero de rodaballos que es preciso muestrear hasta encontrar una infeccin por parsitos.
Los investigadores estiman la probabilidad de observar un pez infectado en .544. Utilice esta in-
formacin para estimar las siguientes probabilidades:
a. P(y = 3) b. P(y s 2) c. P(y > 2)
4.50 La Administracin Nacional de Aeronutica y el Espacio (NASA) de Estados Unidos estima que la
probabilidad de que falle un "componente crtico" dentro del motor principal de un transbordador
espacial es de aproximadamente 1 en 63 (Tampa Tribune, 3 de diciembre de 1993). La falla de un
componente crtico durante el vuelo conducir directamente a una catstrofe del transbordador.
a. En promedio, cuntas misiones del transbordador volarn antes de que ocurra una falla de
componente crtico?
b. Cul es la desviacin estndar del nmero de misiones antes de que ocurra una falla de
componente crtico?
c. Especifique un intervalo que capture el nmero de misiones antes de que ocurra una falla de
componente crtico con una probabilidad de aproximadamente .95.
4.51 Los ingenieros ambientales clasifican a los consumidores en una de cinco categoras (vase el ejer-
cicio 3.1 para una descripcin de cada grupo). Las probabilidades asociadas a cada grupo son:
Marrones bsicos .28
Verdes leales . 11
Verdes billete .11
Retoos .26
Refunfuadores .24
Fuente: The Orange County Register,
7 de agosto de 1990.
Sea y el nmero de consumidores que es preciso muestrear antes de encontrar al primer ecologista.
[Nota; Segn se explica en el ejercicio 3.1, un ecologista es un verde leal, un verde billete o un
retoo.]
178 Captulo 4/ Variables aleatorias discretas
....................................................
a. Calcule ..t y O; la media y la desviacin estndar de y.
b. Utilice la informacin del inciso a para establecer un intervalo con una probabilidad elevada
de incluir a y.
4.52 Refirase al estudio publicado en Nuclear ScienceandEngineering (ejercicio-l.Hl). Si seliberan partculas
neutrales una por una en el dueto evacuado, calcule la probabilidad de que se tengan que liberar ms de
cinco partculas antes de que observemos dos partculas reflejadas por la pared interior del dueto.
4.53 Suponga que el hecho de encontrar petrleo en un sitio de perforacin es independiente de en-
contrarlo en otro y que, en una regin determinada, la probabilidad de xito en un sitio individual
es de .3.
a. Qu probabilidad hay de que un perforador encuentre petrleo en su tercera perforacin, o
antes?
b. Si Y es el nmero de perforaciones hasta que ocurre el primer xito, calcule la media y la
desviacin estndar de y.
c. Es probable que y sea mayor que lO? Explique.
d. Suponga que la compaa perforadora cree que una serie de exploracin ser rentable si el
nmero de pozos perforados hasta que ocurra el segundo xito es menor o igual que 7. Calcule
la probabilidad de que la exploracin tendr xito.
4.54 Refirase al ejercicio 4.31. Sea y el nmero de hombres de 50 aos residentes en Utah que se
examinan hasta que se detecta la primera incidencia de cncer de la tiroides.
a. Calcule P(y = 1,000)
b. Calcule la media y la varianza de y.
c. Es verosmil que y exceder 100,000? Explique.
EjERCl(lO OP(lONAl
4.55 Sea y una variable aleatoria binomial negativa con parmetros r y p. Es posible demostrar que
w = y - r tambin es una variable aleatoria binomial negativa, donde w representa el nmero de
fracasos antes de observarse el r-simo xito. Aproveche el hecho de que
r
E(y) = -
p
y
para demostrar que
E(w) = rq y (T2 = rq
p W p2
[Sugerencia: Utilice los teoremas 4.1, 4.2 y 4.3.]
4.9 la distribucin de probabilidad hipergeomtrica
...................................................................
Cuando se muestrea de una poblacin finita de xitos y fracasos (como sera
una poblacin finita de respuestas relativas a las preferencias de los consumi-
dores o una coleccin finita de observaciones en un embarque que contiene
productos fabricados con y sin defectos), los supuestos de un experimento bi.-
nomial se satisfacen con exactitud slo si el resultado de cada prueba se observa
y luego se reincorpora a la poblacin antes de hacerse la siguiente observacin.
Este mtodo de muestreo se denomina muestreo con reemplazo. Sin embargo,
en la prctica lo usual es utilizar muestreo sin reemplazo, es decir, selecciona-
4.9/ ladistribucin de probabilidad hipergeomtrica 179
mas al azar n elementos diferentes de entre los N elementos de la poblacin.
Como se apunt en la seccin 4.6, cuando N es grande y n/N es pequeo
(digamos, menor que .05), la probabilidad de observar un S se mantiene apro-
ximadamente constante de una prueba a la siguiente, las pruebas son (en esen-
cia) independientes y la distribucin de probabilidad del nmero de xitos, y,
es aproximadamente una distribucin de probabilidad binomial. Sin embargo,
cuando N es pequeo o n/N es grande (digamos, mayor que .05), seguramente
querremos utilizar la distribucin de probabilidad exacta de y. Esta distribucin,
denominada distribucin de probabilidad hipergeomtrica, es el tema de esta
seccin. Las cractersticas que definen una variable aleatoria hipergeomtrica,
y su distribucin de probabilidad, se resumen en los recuadros.
180 Captulo 4I Variables aleatorias discretas
Para derivar la distribucin de probabilidad hipergeomtrica, primero ob-
servamos que el nmero total de eventos simples en el espacio de muestra es
el nmero de formas de seleccionar n elementos de N, a saber ( ~ J ' Un evento
simple que implica y xitos es una seleccin de n elementos en los que y son
S y (n - y) son F. Puesto que hay r resultados S de los cuales escoger, el nmero
de formas diferentes de seleccionar y de ellos es a = ~ J. De forma similar, el
nmero de formas de seleccionar (n - y) resultados F del total de (N - r) es
b = (N - rJ. Ahora aplicamos el teorema 3.1 para determinar el nmero de
n-y
formas de seleccionar y resultados S y (n - y) resultados F, es decir, el nmero
de eventos simples que implican y xitos:
Por ltimo, puesto que la seleccin de cualquier conjunto de n elementos es
tan probable como la de cualquier otro, todos los eventos simples son equi-
probables y, por tanto,
P(y)
= Nmero de eventos simples que implican y xitos =
Nmero de eventos simples
" " " "." 111, ,
EJEMPLO 4.14
Solucin
- Se realiza un experimento para seleccionar un catalizador apropiado para la
produccin comercial de etilendiamina (EDA), un producto que se utiliza en
jabones. Suponga que un ingeniero qumico selecciona al azar tres catalizadores
para probarlos de entre un grupo de 10 catalizadores, seis de los cuales tienen
baja acidez y cuatro de los cuales son muy cidos.
a. Calcule la probabilidad de que no se escoger un catalizador muy cido.
b. Calcule la probabilidad de que se escoja exactamente un catalizador muy
cido.
Sea y el nmero de catalizadores de alta acidez seleccionados. Entonces, y es
una variable aleatoria hipergeomtrica con N = 10, n = 3, r = 4 y
4.9 I La distribucin de probabilidad hipergeomtrica 181
b (1) = (i)(n = (4)(15) = l
. p e ~ ) 120 2
..........................
11 11 1111 , 1
EJEMPLO 4.15
Solucin
Refirase al experimento con EDA, ejemplo 4.14.
a. Calcule 11, a
2
y a para la variable aleatoria y.
b. Calcule P{jl - 2a < y < 11 + 20}. Compare este resultado con la Regla
Emprica.
a. Puesto que y es una variable aleatoria hipergeomtrica con N = 10, n = 3
Yr = 4, la media y la varianza son
= nr = (3)(4) = 1 2
JL N 10 .
2 _ r(N - r)n(N - n) _ 4(10 - 4)3(10 - 3)
u - N2(N - 1) - (10)2(10 - 1)
= (4)(6)(3)(7) = 56
(100)(9) .
La desviacin estndar es
u = \f56 = .75
b. La distribucin de probabilidad y el intervalo 11 20; es decir -.3 a 2.7, se
muestran en la figura 4.6. El nico valor posible de y que cae fuera del
intervalo es y = 3. Por tanto,
. G ) ( ~ )
P(JL - La < y < JL + 2u) = 1 - P(3) = 1 - en
4
= 1 - 120 = .967
182 Captulo 4/ Variables aleatorias discretas
.40
.50
.20
_lL
y
o 1 I 2 I 3
- 2 0 " ~ 1 - 2 0 " ~
p(y)
.30
.10
FIGURA 4.6 ~
Distribucin de probabilidad paray
en el ejemplo 4.15
Segn la Regla Emprica, esperaramos que alrededor de 95% de las y ob-
servadas cayeran en este intervalo. Por tanto, la Regla Emprica proporciona
una estimacin aceptable de esta probabilidad.
. .
11 11 11.11.11 1
EJEMPLO 4.16 Refirase al ejemplo 4.14. Calcule la media, 11, de la variable aleatoria y.
Solucin Por la definicin 4.4,
". ~ E(y) ~ yp(y) ~ y(;)\;0: ,)
today y=o
Si utilizamos los valores de p(y) que calculamos en los ejemplos 4.14 y 4.15, y
P(2) = (1) (n = (6)(6) = ~
120 120 10
obtenemos la sustitucin:
..L = OP(O) + lp(l) + 2P(2) + 3p(3)
= O+ 1G) + 2({0) + 3(3
10)=
1.2
Observe que ste es el valor que obtuvimos en el ejemplo 4.15 aplicando la
frmula dada en el recuadro anterior.
..........................
4.9 / La distribucin de probabilidad hipergeomtrica 183
EJERCICIOS
...................................................................
4.56 Suponga que y es una variable aleatoria hipergeomtrica con N = 12, n = 8 Yr = 7.
a. Presente la distribucin de probabilidad para y en forma tabular.
b. Calcule P(y < 3).
c. Calcule P(y ~ 5).
d. Calcule 11 y a para y.
e. Grafique p(y) y localice 11 y el intervalo 11 La en la grfica.
f. Qu probabilidad hay de que y caiga en el intervalo 11 2a?
4.57 Suponga que y es una variable aleatoria hipergeomtrica. Calcule p(y) para cada uno de los siguientes casos:
a. N = 5, n = 3, r = 4, Y = 1 b. N = 10, n = 5, r = 3, Y = 3
c. N = 3, n = 2, r = 2, Y = 2 d. N = 4, n = 2, r = 2, Y = O
4.58 Los "puntos clidos" son reas geogrficas ricas en especies (vase el ejercicio 3.7). Un estudio
publicado en Nature (septiembre de 1993) estim en .70 la probabilidad de que una especie de
ave en Gran Bretaa habite en un punto clido de mariposas. Considere una muestra aleatoria de 4
especies de ave britnicas seleccionadas de un total de 10 especies marcadas. Suponga que 7 de
las 10 especies marcadas habitan en un punto clido de mariposas.
a. Qu probabilidad hay de que exactamente la mitad de las 4 especies de ave muestreadas
habiten en un punto clido de mariposas?
b. Qu probabilidad hay de que al menos una de las 4 especies de ave muestreadas habiten en
un punto clido de mariposas?
4.59 Con base en datos suministrados por el Departamento de Salud y Recursos Humanos de Estados
Unidos, U.S. News & World Report (28 de septiembre de 1992) estima que uno de cada cinco tras-
plantes de rin falla en menos de un ao. Suponga que exactamente 3 de los siguientes 15 trasplantes
de rin fallarn en menos de un ao. Considere una muestra aleatoria de tres de estos 15 pacientes.
a. Calcule la probabilidad de que los tres trasplantes muestreados fallen en menos de un ao.
b. Calcule la probabilidad de que por lo menos uno de los tres trasplantes muestreados fallen en
menos de un ao.
4.60 Refirase al ejercicio 4.29. Segn se inform en IEEEComputerApplicationsin Power (abril de 1990), un
sistema de vigilancia de vdeo computarizado automtico detect 7 de 10 intrusos cuando estaba nevan-
do. Suponga que dos de los intrusos tenan intenciones criminales. Qu probabilidad hay de que ambos
intrusos hayan Sido detectados por el sistema?
4.61 Suponga que va a comprar lotes pequeos de tubos de rayos catdicos (CRT) para terminales de
computadora. Puesto que el costo de probar un CRT es muy elevado, puede ser deseable probar
una muestra de CRT del lote en lugar de todos los CRT del lote. Un plan de muestreo semejante
se basara en una distribucin de probabilidad hipergeomtrica. Por ejemplo, suponga que cada
lote contiene siete CRT. Usted decide muestrear tres CRT de cada lote y rechazar el lote si observa
uno o ms CRT defectuosos en la muestra.
a. Si el lote contiene un CRT defectuoso, qu probabilidad hay de que usted acepte el lot?
b. Qu probabilidad hay de que usted acepte el lote si contiene tres CRT defectuosos?
4.62 Un equipo de trabajo establecido por la Agencia de Proteccin Ambiental de Estados Unidos pro-
gram visitas a 20 empresas industriales para investigar la posibilidad de violaciones a los regla-,
mentas para el control de la contaminacin. Sin embargo, los recortes presupuestales han reducido
drsticamente el tamao del equipo de trabajo, por lo que slo podrn investigar tres de las 20
empresas. Si se sabe que cinco de las firmas estn operando realmente sin cumplir con los regla-
mentos, calcule la probabilidad de que:
a. En ninguna de las tres empresas muestreadas se encuentren violaciones a los reglamentos.
b. En las tres empresas investigadas se encuentren violaciones a los reglamentos.
184 Captulo 4/ Variables aleatorias discretas
c. Al menos una de las tres empresas estar operando en contravencin de los reglamentos para
el control de la contaminacin.
4.63 Un artculo en The American Siatistician (mayo de 1991) describi el empleo de la probabilidad
en una operacin para atrapar a traficantes de cocana. Agentes de la polica de una ciudad de
Florida de mediano tamao haban confiscado 496 paquetes envueltos en papel metlico durante
la captura de ciertos traficantes de drogas. A fin de probar la culpabilidad de los traficantes, la
polica tena que demostrar que los paquetes contenan cocana pura. En consecuencia, el labora-
torio de polica seleccion al azar y analiz qumicamente cuatro de los paquetes. Los cuatro dieron
resultados positivos para cocana. Este resultado condujo a que se declarara culpables a los trafi-
cantes.
a. De los 496 paquetes confiscados, suponga que 331 contenan cocana pura y 165 contenan un
polvo inerte (legal). Calcule la probabilidad de que cuatro paquetes escogidos al azar den
resultados positivos en un ensayo de cocana.
b. La polica utiliz los 492 paquetes restantes (es decir, los que no se ensayaron) en una operacin
para atrapar a los involucrados. Se seleccionaron al azar dos de los 492 paquetes, mismos que
agentes disfrazados vendieron a un comprador. Sin embargo, entre la venta y el arresto el
comprador logr deshacerse de las pruebas. Dado que cuatro de los 496 paquetes originales
dieron resultados positivos en un ensayo de cocana, qu probabilidad hay de que los dos
paquetes vendidos en la operacin de captura no hayan contenido cocana? Suponga que la
informacin proporcionada en el inciso a es correcta.
c. El artculo de The American Statistician demuestra que la probabilidad condicional del inciso
b se maximiza cuando de los 496 paquetes originales 331 contienen cocana pura y 165 con-
tienen polvo inerte. Vuelva a calcular la probabilidad del inciso b suponiendo que 400 de los
496 paquetes originales contienen cocana.
nr( r - 1) (N - 1 - (r - 1))
N Y - 1 n - 1 - (y - 1)
(
N- 1)
n - 1
OPCIONAL
4.64 Demuestre que la media de una variable aleatoria hipergeomtrica es .L = nr/N. [Sugerencia:
muestre que

---'-'--'----7--;--'-"- =

y luego utilice el hecho de que
De-
(
r - 1) (N - 1- (r - 1))
y - 1 n - 1 - (y - 1)
n
es la distribucin de probabilidad hipergeomtrica para z = (y - 1), donde z es el nmero de
resultados S en (n - 1) pruebas, con un total de (r - 1) resultados S en (N - 1) elementos.]
4.10 La distribucin de probabilidad de Poisson
...................................................................
La distribucin de probabilidad de Poisson, as llamada en honor del mate-
mtico francs S. D. Poisson (1781-1840), proporciona un modelo para la fre-
cuencia relativa del nmero de "eventos poco comunes" que ocurren en una
unidad de tiempo, rea, volumen, etc. El nmero de trabajos nuevos presen-
4.10/ La distribucin de probabilidad de Poisson 185
tados a una computadora en un minuto dado, el nmero de accidentes fatales
por mes en una planta de fabricacin y el nmero de defectos visibles en un
diamante son variables cuyas distribuciones de frecuencia relativas se pueden
aproximar bien con distribuciones de probabilidad de Poisson. Las caracters-
ticas de una variable aleatoria de Poisson se enumeran en el recuadro.
Las frmulas para la distribucin de probabilidad, la media y la varianza
de una variable aleatoria de Poisson se muestran en el siguiente recuadro. El
lector observar que en la frmula interviene la cantidad e = 2.71828 ... , la
base de los logaritmos naturales. En la tabla 2 del apndice 11 se dan valores
de e-Y, que son necesarios para calcular los valores de p(y).
La forma de la distribucin de Poisson cambia conforme cambia su meda,
)1,. Este hecho se ilustra en la figura 4.7, que muestra histogramas de frecuencia
relativa para una distribucin de Poisson con ).l = 1, 2, 3 y 4.
186 Captulo 4/ Variables aleatorias discretas
....................................................
FIGURA 4.7 ~
p(y)
.36
Histogramas para la distribucin .33
de Poisson con f1. = 1,2,3 Y4
'"
.30
.:::
.27
';j
.24
1!
.21
. ~
.18
~
.15
.12
e
.09
.06
.03
Y
o 2 3 4 5 6 7 8 9 10 II 12
a.JI =1
p(y)
.26
.24
.22
'"
.20
.:::
.18 ';j
1!
.16
'"
.14
'0
<:: .12
8
.10
e .08
~
.06
.04
.02
9
Y
b.JI =2
o 2 3 4 5 6 7 8 10 II 12
p(y)
.22
'"
.20
.>
.18
1i
.16
1!
.14
'"
"g
.12
~
.10
.08
~ .06
.04
.02
2 4 8 9 II
Y
e.JI =3
o 3 5 6 7 10 12
p(y)
.18
'"
.16
>
1i
.14
1! .12
.;
.10
.08
.06
e .04
~
.02
2 3 8 10 12
Y
O 4 5 6 7 9 II
d.JI =4
4.10 / La distribucin de probabilidad de Poisson 187
111 11 11 11 , 1
EJEMPLO 4.17 Suponga que el nmero y de grietas por espcimen de concreto con cierto tipo
de mezcla de cemento tiene una distribucin de probabilidad de Poisson apro-
ximada. Adems, suponga que el nmero medio de grietas por espcimen es
de 2.5.
a.
b.
c.
d.
Solucin a.
Calcule la media y la desviacin estndar de y, el nmero de grietas por
espcimen de concreto.
Calcule la probabilidad de que un espcimen de concreto escogido al azar
tenga exactamente cinco grietas.
Calcule la probabilidad de que un espcimen de concreto escogido al azar
tenga dos o ms grietas.
Calcule P(,u - 20" < y < Jl + 2a). El resultado concuerda con la Regla
Emprica?
Tanto la media como la varianza de una variable aleatoria de Poisson son
iguales a A. Por tanto, en este ejemplo,
.L = A = 2.5 0'2 = A= 2.5
Entonces, la desviacin estndar es
O' = v'T5 = 1.58
b. Queremos conocer la probabilidad de que un espcimen de concreto tenga
exactamente cinco grietas. La distribucin de probabilidad de y es
AYe-A.
p(y) = T
Entonces, dado que A = 2.5, y = 5 Y e-
2
.5 = .082085 (de la tabla 2 del
apndice 11),
(5) = (2. 5)5e- 2. 5 = (2.5)\ 082085) = 067
p 5! 5 . 4 . 3 2 1 .
c. Para determinar la probabilidad de que un espcimen de concreto tenga
dos o ms grietas necesitamos calcular
P(y 2: 2) = p(2) + P(3) + p(4) + ... = L p(y)
y=2
Si queremos calcular la probabilidad de este evento, es preciso considerar
el evento complementario. As,
P(y 2: 2) = 1 - P(y :s; 1) = 1 - [p(O) + P(l)]
(2.5)Oe-
2
.
5
(2.5)i
e
- 2. 5
= 1 - 01 - 11
= 1 _ 1(.082085) _ 2.5(.082085)
1 . 1
= 1 - .287 = .713
Segn nuestro modelo de Poisson, la probabilidad de que un espcimen de
.dos n 3. ...
r - -- -
188 Captulo 4/ Variables aleatorias discretas
fiGURA 4.8
Distribucin de probabilidad de
Poisson parayen el ejemplo 4.17
p(y)
.30
9 8
.20
-,--l--I:::I::::J:::::::I:=:L.-l- Y
-11 O 1 2 Ji 3 4 5 1
6

d. La distribucin de probabilidad de y se muestra en la figura 4.8 para valores
de y entre Oy 9. Se indican la media 11 = 2.5 Yel intervalo 11 Za, o sea
-.7 a 5.7. En consecuencia, P(.u - 2a < y < 11 + Zcr) = P(y 5). Esta
probabilidad est sombreada en la figura 4.8.
Las probabilidades p(O), p(1), ... , p(5) se pueden calcular y sumar
igual que en el inciso c. Sin embargo, utilizaremos una tabla de probabilida-
des de Poisson acumulativas para obtener la suma. La tabla 3 del apndice 11
proporciona la sumatoria parcial, = o P(y), para diferentes valores de la
media de Poisson A. Para A = 2.5, la sumatoria P(y), = p(O) + p(l)
+ ... + p(5) es .9581 segn la tabla. Entonces, P(y 5) = .9581; observe
que esta probabilidad concuerda con la aproximacin de la Regla Emprica
de .95.
. .
La distribucin de probabilidad de Poisson est relacionada con una dis-
tribucin de probabilidad binomial cuando n es grande y 11 = np es pequea,
digamos np 7, Y puede utilizarse como aproximacin. La demostracin de
este hecho rebasa el alcance del presente texto, pero se puede encontrar en
Feller (1968) .
.... ' .. , " .
EJEMPLO 4.18 Sea y una variable aleatoria binomial con n = 25 YP= .1.
a. Utilice la tabla 1 del apndice 11 p<lra determinar el valor exacto de P(y 1).
b. Obtenga la aproximacin de Poisson a P(y a 1). [Nota: Aunque preferira-
mos comparar la aproximacin de Poisson a probabilidades binomiales para
valores ms grandes de n, estamos restringidos en este ejemplo por las li-
mitaciones de la tabla 1.]
Solucin
4.10 / La distribucin de probabilidad de Poisson 189
a. De la tabla 3 del apndice 11, con n = 25 YP = .1, tenemos
I
P(y:5 1) == L p(y) == .271
y=o
b. Puesto que n = 25 YP= .1, aproximaremos p(y) utilizando una distribucin
de probabilidad de Poisson con media de
A == np == (25)(.1) == 2.5
Localizamos A = 2.5 en la tabla 3 del apndice 11 y obtenemos la sumatoria
parcial
I
P(y:5 1) == L p(y) == .2873
y=o
Esta aproximacin, .2873, al valor exacto de P(y :S 1) = .271 es razonable-
mente buena si consideramos que el procedimiento de aproximacin por
lo comn se aplica a distribuciones de probabilidad binomiales en las que
n es mucho mayor que 25.
. .
11 11 111
EJEMPLO 4.19
Solucin
EJERCICIOS
Demuestre que el valor esperado de una variable aleatoria de Poisson es A.
Por la definicin 4.4, tenemos
00 Ay-
E(y) == L yp(y) == L Y_y e,
toda)' y=o
El primer trmino de esta serie es igual a Oporque y = O. Por tanto,
~ yAYe-

~ AYe-

~ A' Ay-le-
E(y) == L.J --== L.J == L.J
y=o y! yw l (y - 1)! y=1 (y - 1)!
Si sacamos la constante A de la sumatoria por factorizacin y hacemos
z = (y - 1), obtenemos
00 AZ - 00
E(y) == A L _e_, == A L p(z)
z=o z. z=o
donde z es una variable aleatoria de Poisson con una media de A. Entonces,
E(y) == A L p(z) == A(l) == A
z=o
...................................................................
4.65 Suponga que y es una variable aleatoria para la cual una distribucin de probabilidad de Poisson
con A = 5.5 constituye una buena caracterizacin.
a. Grafique p(y) para y = O, 1, 2, ... , 9, 10.
b. Calcule J.1 y O- para la variable aleatoria y y localice J.1 y el intervalo J.1 20- en la grfica del inciso a.
c. Qu probabilidad hay de que y caiga dentro del intervalo J.1 20-?
190 Captulo 4/ Variables aleatorias discretas
4.66 Suponga que y es una variable aleatoria para la cual una distribucin de probabilidad de Poisson
constituye una buena caracterizacin. Calcule lo siguiente:
a. P(y ~ 2), cuando A = 2 b. P(y = 1), cuando A = 5
c. P(y ~ 1), cuando A = 3 d. P(y = O), cuando A = 9
4.67 Refirase al estudio publicado en Science (abril de 1993) relativo a las propiedades espectroscpicas
de los asteroides de la franja principal (ejercicio 2.1O). Las investigaciones revelaron que, en pro-
medio, se observan 2.5 exposiciones de imagen espectral independientes por asteroide.
a. Suponiendo una distribucin de Poisson, calcule la probabilidad de observar exactamente una
exposicin de imagen espectral independiente durante la observacin de un asteroide de la
franja principal.
b. Suponiendo una distribucin de Poisson, calcule la probabilidad de observar cuando ms dos
exposiciones de imagen espectral independientes durante la observacin de un asteroide de la
franja principal.
c. Esperara usted observar siete o ms exposiciones de imagen espectral independientes durante
la observacin de un asteroide de la franja principal? Explique.
4.68 Un estudio reciente de movimientos naturales del talud rocoso en las Rocallosas canadienses durante
los ltimos 5,000 aos revel que el nmero de avalanchas importantes por cada 100 kilmetros
cuadrados tena un valor esperado de 1.57 (Canadian Geotechnical [outnal, noviembre de 1985).
a. Calcule la media y la desviacin estndar de y, el nmero de avalanchas importantes por cada
100 kilmetros cuadrados en las Rocallosas canadienses durante un periodo de 5,000 aos.
b. Qu probabilidad hay de observar tres o ms avalanchas importantes en un rea de 100 kil-
metros cuadrados durante un periodo de 5,000 aos?
4.69 La variable aleatoria y, el nmero de automviles que llegan a una interseccin durante un periodo
especfico, a menudo posee una distribucin de probabilidad de Poisson (aproximada). Si se conoce
la tasa media de llegada A, la distribucin de probabilidad de Poisson puede servir para ayudar a
un ingeniero de trnsito a disear un sistema de control del trfico. Suponga que estima en un
automvil por minuto el nmero medio de llegadas a la interseccin.
a. Qu probabilidad hay de que en un minuto dado el nmero de llegadas sea de tres o ms?
b. Puede usted asegurar al ingenieroque el nmero de llegadas casi nunca ser mayor que tres por minuto?
4.70 La Agencia de Proteccin Ambiental de Estados Unidos (EPA) ha establecido normas nacionales
para la calidad del aire en un esfuerzo por controlar la contaminacin de ste. Actualmente, el
lmite de la EPh .para los niveles de ozono en el aire es de 12 partes por cien millones (pphm).
Un estudio de 1990examin la tendencia a largo plazo en los niveles de ozono en Houston, Texas. *
Una de las variables de inters es y, el nmero de das en un ao en los que el nivel de ozono
excede el umbral de 12 pphm de la EPA. Se estima que el nmero total de rebases del umbral en
un ao es de 18. Suponga que la distribucin de probabilidad de y se puede modelar con la dis-
tribucin de Poisson.
a. Calcule P(y ~ 20).
b. Calcule P(5 ~ Y s 10).
c. Estime la desviacin estndar de y. Dentro de qu intervalo esperara usted que estuviera y
en un ao dado?
d. El estudio revel una tendencia decreciente en el nmero de rebases del nivel de umbral de
la EPA en los ltimos aos. Los valores observados de y para los ltimos 6 aos fueron 24, 22,
20,15,14 y 16. Explique por qu esta tendencia pone en entredicho la validez de la distribucin
de Poisson como modelo para y. [Sugerencia: Considere la caracterstica #3 de las variables
aleatorias de Poisson.]
Shively, Thomas S., HAn Analysis of the Trend in Ozone Using Nonhomogeneous Poisson Processes". Artculo
presentado en la reunin anual de la American Statistical Association, Anaheim, Calif., agosto de 1990.
4.10 I La distribucin de probabilidad de Poisson 191
4.71 La industria nuclear ha hecho un esfuerzo concertado por reducir significativamente el nmero de
desactivaciones rpidas de emergencia no planeadas de los reactores nucleares, llamadas scrams.
Hace una dcada, el nmero anual medio de scrams no planeados en reactores nucleares estadou-
nidenses fue de cuatro (vase el ejercicio 2.47). Suponga que el nmero anual de scrams no pla-
neados que ocurren en un reactor nuclear sigue, aproximadamente, una distribucin de Poisson.
a. Si la media no ha cambiado, calcule la probabilidad de que un reactor nuclear experimente 10
o ms scrams no planeados este ao.
b. Suponga que un reactor nuclear escogido al azar en realidad experimenta 10 o ms scrams no
planeados este ao. Qu puede usted inferir acerca del nmero anual medio real de scrams
no planeados? Explique.
4.72 Refirase al informe del American [ournal of Public Health (AJPH) sobre muertes por accidentes
de trnsito en autopistas interestatales rurales (ejercicio 3.29). Un ao antes del informe del AJPH,
la Asociacin Estadounidense de Automviles (AAA) patrocin un anlisis del efecto del lmite de
65 mph en el estado de Indiana. El estudio de la AAA revel que en ese estado hubo en promedio
90 decesos al ao en autopistas interestatales rurales. Para un ao dado, Zen qu intervalo esperara
usted que cayera el nmero de muertes por accidentes en autopistas interestatales rurales en 19-
diana?
4.73 Se utiliza la tasa de descarga (o respuesta) de las fibras nerviosas auditivas [registrada como el
nmero de picos por 200 milisegundos (ms) de una rfaga de ruido] para medir el efecto de
estmulos acsticos sobre el nervio auditivo. Un estudio emprico de las tasas de respuesta del
nervio auditivo en gatos arroj una media de 15 picos/ms (Joumal of the Acoustical Society f
America, febrero de 1986). Sea y la tasa de respuesta de las fibras del nervio auditivo de un gato
escogido al azar entre los que intervinieron en el estudio.
a. Si y es aproximadamente una variable aleatoria de Poisson, calcule la media y la desviacin
estndar de y.
b. Suponiendo que y es Poisson, qu probabilidad aproximada hay de que y exceda 27 picos/ms?
c. En el estudio se determin que la varianza de y era "considerablemente menor" que 15 picos/ms.
Es razonable esperar que y siga un proceso de Poisson? Cmo afectar esto la probabilidad calcu-
lada en el inciso b?
4.74 El benceno, un disolvente comnmente utilizado para sintetizar plsticos y que se encuentra en
productos de consumo como removedores de pintura y gasolina de alto octano sin plomo, ha sido
clasificado por, los cientficos como agente causante de leucemia. Sea y el nivel (en partes por
milln) de benceno en el aire en una planta petroqumica. Entonces y puede adoptar los valores
O, 1,2, 3, ... , 1,000,000 y aproximarse mediante una distribucin de probabilidad de Poisson. En
1978, el gobierno federal de Estados Unidos baj el nivel mximo permisible de benceno en el aire
de los lugares de trabajo de 10 partes por milln (ppm) a 1 ppm. Cualquier industria que viole
estas normas gubernamentales est sujeta a castigos severos, incluida la implementacin de medidas
costosas para reducir el nivel de benceno.
a. Suponga que el nivel medio de benceno en el aire en las plantas petroqumicas es de /l = 5
ppm. Calcule la probabilidad de que una planta petroqumica exceda la norma gubernamental
de 1 ppm.
b. Repita el inciso a, suponiendo que /l = 2.5 ppm.
c. En el Florida Times-Union (2 de abril de 1984) se inform de un estudio de la Gulf Oil que
revel que 88% de las industrias que utilizan benceno exponen a sus trabajadores a 1 ppm o
menos del disolvente. Suponga que muestrea al azar 55 de las industrias que utilizan benceno
en el pas y determin y, el nmero de las que violan las normas gubernamentales. Utilice la
aproximacin de la distribucin de Poisson a la distribucin binomial para calcular la proba-
bilidad de que ninguna de las industrias muestreadas est violando las normas gubernamentales.
Compare esta probabilidad con la probabilidad exacta calculada empleando la distribucin de
probabilidad binomial. (Puede calcular la probabilidad binomial con una calculadora de bolsillo.)
192 Captulo 4/ Variables aleatorias discretas
d. Refirase al inciso c. Utilice el hecho de que 88% de las industrias que utilizan benceno exponen
a sus trabajadores a 1 ppm o menos de benceno para aproximar 11, el nivel medio de benceno
en el aire en dichas industrias. [Sugerencia: Busque en la tabla 4 del apndice II el valor de 11
que produzca el valor de P(y s 1) ms cercano a .88.]
EJERCICIOS OPCIONALES
4.75 Demuestre que para una variable aleatoria de Poisson y,
a. O:s p(y) :s 1
b. 00
2: p(y) = 1
y=o
c. E( y2) = A
2
+ A
[Sugerencia: Deduzca primero el resultado E[y(y - 1)] = ,1.2 del hecho de que
00 AY -A 00 Ay-2 -A 00 Az-A
E[y(y - 1)] = ~ o y(y - 1)+ = A
2
Y ~ 2 (y _e2)! = A
2
t:o +
Luego aplique el resultado E[y(y - 1)] = E(y2) - E(y).]
4.76 Demuestre que para una variable aleatoria de Poisson, y, dl =,1.. [Sugerencia: Utilice el resultado del
ejercicio 4.75 yel teorema 4.4.]
4.11 Momentos yfunciones que generan momentos (opcional)
...................................................................
Los momentos de una variable aleatoria pueden servir para describir totalmente
su distribucin de probabilidad.
El lector ya conoci dos momentos importantes de las variables aleatorias.
La media de una variable aleatoria es JI = 11 Yla varianza es 112 = d. Podemos
utilizar otros momentos alrededor del origen o alrededor de la media para medir
la falta de simetra o la tendencia de una distribucin a tener un pico grande
cerca del centro. De hecho, si existen todos los momentos de una variable
aleatoria discreta, definen totalmente su distribucin de probabilidad. Este he-
4.11 / Momentos yfunciones que generan momentos (opcional) 193
cho a menudo se utiliza para demostrar que dos variables aleatorias tienen las
mismas distribuciones de probabilidad. Por ejemplo, si dos variables aleatorias
discretas, x y y, poseen momentos alrededor del origen, P'Ix, ... y
P;y, ... , respectivamente, y si todos los momentos correspondientes
son iguales, es decir, P;x = P;y> P;x = P;y> etc., entonces las dos distribuciones de
probabilidad discretas, p(x) y p(y), son idnticas.
Los momentos de una variable aleatoria discreta se pueden calcular direc-
tamente utilizando la definicin 4.7, pero como indican los ejemplos 4.10 y
4.19, sumar las series necesarias para obtener E(y), E(/), etc., puede ser tedioso.
En algunos casos se puede facilitar el clculo de los momentos de una variable
aleatoria utilizando la funcin generadora de momentos de dicha variable.
La funcin generadora de momentos de una variable aleatoria discreta no
es ms que una expresin matemtica que condensa todos los momentos en
una sola frmula. Para extraer momentos especficos de ella, primero observa-
mos que, por la definicin 4.9,
E(e
ty)
= L etyp( y)
toda y
donde
Entonces, si p', es finita para i = 1, 2, 3, 4, ... ,
m(t) = E(e
ty)
= etyp(y) = L [1 + ty + (t
y:
z
+ (t
y:
3
+ .. ']P(y)
toda)' toda)' 2. 3.
+ typ(y) + + + ...]
Ahora aplicamos los teoremas 4.2 y 4.3 para obtener
'" '" t Z
m(t) = + t + 2! + ...
Sin embargo, por la definicin 4.7, L ykP(y) = Por tanto,
todo y
( ) l
i t Z I t
3
I
m t = + tILI + 2! ILz + 3! IL3 + ...
194 Captulo 4/ Variables aleatorias discretas
Esto indica que si contamos con la funcin generadora de momentos de una
variable aleatoria y podemos expandirla a una serie de potencias en t, es decir,
m(t) = 1 + at + a2t2 + a3t3 + ...
entonces se sigue que el coeficiente de t ser p; =u, el coeficiente de t
2
ser
/1; / 2! y, en general, el coeficiente de t
k
ser / 1 ~ / k!
Si no resulta fcil expandir m(t) a una serie de potencias en t, podemos
obtener los momentos de y diferenciando m(t) respecto a t y haciendo luego
t = O. As,
dm(t) d(l I t
2
I t
3
I )
-- = - + t!J- + -!J-2 + -!J-3 + ...
dt dt 2! 3!
(O
I 2t I 3t
2
I )
= + !J- + 2!!J-2 + l!!J-3 + ...
Haciendo t = O, obtenemos
dm(t)] (' O O ) I
-- =!J- + + +... =!J- = !J-
dt t=O
Si sacamos la segunda derivada de m(t) respecto a t obtenemos
d
2
m(t) (O I 3! I )
---z = + !J-2 + 3!t!J-3 + ...
Si despus hacemos t = O, queda
d
2
m(t)] (' O O ) I
--2- =!J-2 + + +... =!J-2
dt t=O
El teorema 4.5 describe la forma de extraer / 1 ~ de la funcin generadora de
momentos m(t).
A fin de ilustrar el empleo de la funcin generadora de momentos, consi-
deremos los siguientes ejemplos.
EJEMPLO 4.20
Solucin
Deduzca la funcin generadora de momentos para una variable aleatoria bino-
mial.
La funcin generadora de momentos est dada por
m(t) = E(e
ty)
= i etyp(y) = i ety(n)pYqn-
y
= i (n)(pet)Yqn-
y
y=o y=o Y y=o Y
4.11 / Momentos yfunciones que generan momentos (opcional) 195
Recordemos ahora el teorema binomial (vase el ejercicio opcional 4.33):
(a + b)n = (n)aYb
n- y
y=o y
Si hacemos a = pe! y b = q, obtenemos el resultado deseado:
m(t) = (pet + q)n
..........................
11 " ,1, ,1, "
EJEMPLO 4.21
Solucin
EJEMPLO 4.22
Solucin
Utilice el teorema 4.5 para deducir .t'l = J.l Y J.lz para la variable aleatoria bino-
mial.
Por el teorema 4.5,
JL\ = JL = dm(t)] = n(pe
t
+ q)n-I(pe
t)]
dt t=O t=O
= n(pe
O
+ q)n-l(pe
O)
Pero eO = l. Por tanto,
JL\ = JL = n(p + q)n-Ip = n(1)n-Ip = nb
De forma similar,
d
2m(t)]
d _ ]
JLz =-2- = np-[et(pe
t
+ q)n 1]
dt t=O dt t=O
= np[et(n - l)(pe
t
+ q)n-Zpe
t
+ (pe
t
+ q)n-Iet]l=o
= np[(l)(n - l)(l)p + (1)(1)] = np[(n - l)p + 1]
= np(np - p + 1) = np(np + q) = nZpz + npq
Utilice los resultados del ejemplo 4.21, junto con el teorema 4.4, para deducir
la varianza de una variable aleatoria binomial.
Por el teorema 4.4,
0'2 = E( yZ) - JLz = JLz - (JLD
2
Si sustituimos los valores de pz y PI =J.l del ejemplo 4.21, tenemos
0'2 = n
2p2
+ nbq - (np)Z = npq
..........................
196 Captulo 4/ Variables aleatorias discretas
Variable aleatoria p(y)
f.L
a
2
m(t)
Bemoulli p(y) = pYql-Y
P
pq pe
t
+ q
donde q = 1 - p, y = 0, 1
Binomial p(y) = np npq (pe! + q)n
donde q = 1 - P
y = 0, 1, ... , n

nr r(N - r)n(N - n)
Hipergeomtrica
p(y) =

N NZ(N - 1) Noseda
Poisson
,\.l'e-
A

eA(e'-l)
P(Y)=T
y = 0, 1, 2, ...
Geomtrica p(y) = P(l - W-
1
1 1 - P
pet
-
----;z 1 - (1 - p)e/
Y= 1,2, ...
p
p(y) = (y - l)pr(l - W-r
r r(l - p)
( pe! )'
Binomial
-
pZ
1 - (l - p)e/
negativa
r - 1
P
Y= r, r + 1, ...
Multinomial
n'
np(l - Pi) P(YI' yz, ... , ) = -,-'-,-, (p)Yl(pZ)Y2 ... (Pk)Y' np, Noseda
YI-Yz.Y3
Como se demostr' en los ejemplos 4.21 y 4.22, es ms fcil utilizar la
funcin generadora de momentos para obtener P'I yP; de una variable aleatoria
binomial gue calcular P'I = E(y) YP; = E(y2) por separado. Basta con obtener
la sumatoria de una sola serie para calcular m(t). ste tambin es el mejor
mtodo para calcular i
l
y P; de muchas otras variables aleatorias, pero no de
. todas.
Las distribuciones de probabilidad, medias, varianzas y funciones genera-
doras de momentos para algunas variables aleatorias discretas tiles se resumen
en la tabla 4.7.
EJERCICIOS
4.77 Deduzca la funcin generadora de momentos para la variable aleatoria de Poisson. [Sugerencia:
Escriba
Ejercicios suplementarios 197
Despus, observe que la cantidad que se est sumando es una probabilidad de Poisson con parmetro
Ae
t
. ]
4.78 Utilice el resultado del ejercicio 4.77 para deducir la media yla varianza de la distribucin de Poisson.
4.79 Utilice la funcin generadora de momentos dada en la tabla 4.7 para deducir la media y la varianza
de una variable aleatoria geomtrica.
4.12 Resumen
...................................................................
En este captulo presentamos los conceptos de eventos numricos y variables
aleatorias discretas. Una variable aleatoria es una regla que asigna uno y slo
un valor de una variable y a cada evento simple del espacio de muestra. Se
dice que una variable aleatoria es discreta si puede asumir slo una cantidad
de valores susceptible de ser contada.
La distribucin de probabilidad de una variable aleatoria discreta es una
tabla, grfica o frmula que proporciona la probabilidad asociada a cada valor
de y. El valor esperado E(y) = f..l es la media de esta distribucin de proba-
bilidad y E[(y - f..l )2] = d es su varianza.
Se presentaron siete variables aleatorias discretas -la de Bernoulli, la
binomial, la multinomial, la binomial negativa, la geomtrica, la hipergeom-
trica y la de Poisson- junto con sus distribuciones de probabilidad. Seala-
mos las caractersticas fsicas de los experimentos que generan estas variables
aleatorias e identificamos algunas situaciones de muestreo prcticas que se
ajustan, con un grado de aproximacin razonable, a estas condiciones experi-
mentales. Presentamos la media y la varianza de cada una de las variables
aleatorias, vimos cmo f..l y (5 proporcionan medidas de la ubicacin y variacin
de las distribuciones de probabilidad y, en algunos casos, dedujimos estas can-
tidades. Por ltimo, mostramos cmo puede utilizarse la distribucin de pro-
babilidad para calcular probabilidades y, con ellas, evaluar la verosimilitud de
la ocurrencia de ciertos eventos numricos.
EJERCICIOS SUPLEMENTARIOS
...................................................................
4.80 Un laboratorio de desarrollo en ingeniera realiz un experimento para investigar las caractersticas
de duracin de un nuevo panel de calentamiento solar, diseado con el objetivo de que tenga una
vida til de por lo menos cinco aos con una probabilidad p = .95. Se escogi una muestra al azar
de 20 de estos paneles solares y se registr la vida til de cada uno.
a. Qu probabilidad hay de que exactamente 18 tengan una vida til de por lo menos cinco
aos?
b. Qu probabilidad hay de que cuando ms 10 tengan una vida til de por lo menos cmca
aos?
c. Si slo 10 de los 20 paneles solares tienen una vida til de por lo menos cinco aos, qu
inferira usted acerca del verdadero valor de p?
4.81 Los riesgos econmicos que corren las empresas del ramo de la ingeniera se pueden clasificar como
riesgos puros o bien riesgos especulativos. Se enfrenta un riesgo puro cuando existe la posibilidad
de incurrir en una prdida econmica pero no hay oportunidad de beneficio. Se enfrenta un riesgo
especulativo cuando hay la posibilidad de un beneficio adems de una posibilidad de prdida. En
198 Captulo 4/ Variables aleatorias discretas
ocasiones el riesgo se mide calculando la varianza o la desviacin estndar de la distribucin de
probabilidad que describe los beneficios o prdidas potenciales de la empresa. Las dos distribuciones
de probabilidad discretas que se dan en la tabla se desarrollaron a partir de datos histricos: des-
criben las prdidas potenciales totales en el prximo ao por daos fsicos a los robots computari-
zados que operan en dos empresas de ingeniera distintas. Ambas empresas tienen 10 robots indus-
triales, y ambas tienen la misma prdida esperada para el ao prximo.
EmpresaA
Prdida prximo ao Probabilidad
$ O .01
500 .01
1,000 .01
1,500 .02
2,000 .35
2,500 .30
3,000 .25
3,500 .02
4,000 .01
4,500 .01
5,000 .01
EmpresaB
Prdida prximo ao Probabilidad
$ O .00
200 .01
700 .02
1,200 .02
1,700 .15
2,200 .30
2,700 .30
3,200 .15
3,700 .02
4,200 .02
4,700 .01
a. Verifique que ambas empresas tienen la misma prdida total esperada por daos fsicos.
b. Calcule la desviacin estndar de ambas distribuciones de probabilidad y determine cul em-
presa enfrenta el mayor riesgo de daos fsicos a sus robots industriales el prximo ao.
e.. El inciso b tiene que ver con medir riesgo especulativo o riesgo puro? Explique.
4.82 La Agencia de Proteccin Ambiental (EPA) emite normas sobre contaminacin del aire y el agua
que afectan de forma crucial la seguridad de los consumidores y las operaciones de la industria.
Por ejemplo, la EPA seala que los fabricantes de cloruro de vinilo y compuestos similares deben
limitar la cantidad de estos compuestos en las emisiones de aire de las plantas a 10 partes por
milln (ppm). Suponga que usted representa uno de los fabricantes y sabe que la emisin media
de cloruro de vinilo de su planta es de 4 ppm. Sea y la emisin de cloruro de vinilo (en ppm) para
una muestra de aire especfica de su planta; suponga que la probabilidad de que una muestra de
aire est contaminada con el compuesto es constante.
a. Cul es la desviacin estndar de y para su planta?
b. Si la concentracin media en partes por milln para su planta es en realidad igual a 4, es
probable que una muestra produzca un valor de y que excede los lmites de la EPA? Explique.
4.83 Refirase al ejercicio 4.82. Los ejecutivos de la industria qumica aseguran que slo 5% de todas
las plantas qumicas de Estados Unidos descargan ms de la cantidad mxima de desechos txicos
sugerida por la EPA hacia el aire y el agua. Suponga que la EPA muestrea al azar 20 del enorme
nmero de plantas qumicas con el fin de inspeccionarlas. Si la aseveracin de los ejecutivos es
cierta, qu probabilidad hay de que el nmero y de plantas que violan la norma de la EPA sea:
a. Menor que l? b. Menor o igual que 1? c. Menor que 2? d. Mayor que l?
e. Qu inferira usted acerca de la aseveracin de los ejecutivos si el valor observado de y es 3?
4.84 Dos de los cinco ingenieros mecnicos empleados por el departamento de higiene del condado
tienen experiencia en el diseo de plantas de energa elctrica de turbinas de vapor. Se le ha pedido
a usted escoger al azar dos de los cinco ingenieros para que trabajen en un proyecto de una nueva
planta de energa.
Ejercicios suplementaros 199
a. Qu probabilidad hay de que usted escoja los dos ingenieros que tienen experiencia en el
diseo de plantas de energa elctrica de turbinas de vapor?
b. Qu probabilidad hay de que usted escoger al menos uno de los ingenieros que tienen tal
experiencia?
4.85 Engineering News-Record (23 de diciembre de 1982) inform sobre una encuesta acerca de si se
deba exigir a la industria instalar la mejor tecnologa disponible (BAT, best available technology)
para el control de la contaminacin. Cerca de 50% de los encuestados dijeron que preferiran so-
portar cierres de fbricas y prdida de empleos que permitir exenciones de las normas de BAT.
Suponga que se escogen 10 personas al azar y se les pide que opinen acerca del control de la
contaminacin mediante BAT. Calcule la probabilidad de que:
a. Ninguna de ellas preferir los cierres de fbricas y la prdida de empleos a las exenciones de
las normas de BAT.
b. Al menos cinco preferiran los cierres de fbricas y la prdida de empleos a las exenciones de
las normas de BAT.
c. Al menos una preferira los cierres de fbricas y la prdida de empleos a las exenciones de las
normas de BAT.
4.86 Cierto sistema de un vehculo espacial debe funcionar correctamente para que la nave pueda rein-
gresar en la atmsfera terrestre. Un componente del sistema opera sin problemas slo 85%del tiempo.
A fin de aumentar la confiabilidad del sistema, cuatro de estos componentes se instalarn de modo
tal que el sistema opere sin problemas si por 10 menos uno de los componentes est funcionando sin
problemas.
a. Qu probabilidad hay de que falle el sistema? Suponga que los componentes operan de forma
independiente.
b. Si el sistema falla, zqu inferira usted acerca de la tasa de xito de 85% que se dice tiene un
solo componente?
4.87 Los pases menos desarrollados que experimentan un crecimiento rpido de la poblacin a menudo
enfrentan graves problemas de control del trnsito en sus grandes ciudades. Los ingenieros de
trnsito han determinado que los sistemas de trenes elevados pueden ofrecer una solucin viable
a estos problemas de trfico. Los estudios indican que el nmero de cierres relacionados con el
mantenimiento del sistema de trenes elevados en cierto pas tiene una media igual a 6.5 por mes.
a. Calcule la probabilidad de que por lo menos cinco cierres del sistema de trenes elevados ocu-
rrirn el prximo mes en el pas.
b. Calcule la probabilidad de que ocurran exactamente cuatro cierres el prximo mes.
.
4.88 El manganeso, n metal escaso e indispensable, se ha encontrado en abundancia en ndulos sobre el
piso ocenico profundo (American Scientist, septiembre-octubre de 1976). A fin de investigar la relacin
entre la edad magntica de la corteza terrestre en el piso de los ocanos y la abundancia de manganeso,
se recolectaron varios cientos de ndulos de manganeso y se determin la posicin (edad magn-
tica) de cada ndulo. Los datos, convertidos en probabilidades, se muestran en la siguiente tabla.
Edad Probabilidad
Oligoceno .20
Eoceno .15
Paleoceno .20
Cretcico .30
Jursico .10
Otro .05
Total 1.00
a. En una muestra de 10 ndulos de manganeso hallados en el piso ocenico, calcule la proba-
bilidad de que uno provenga del oligoceno, dos del eoceno, dos del paleoceno, cuatro del ere-
tcico, uno del jursico y ninguno de las otras divisiones del tiempo geolgico.
200 Captulo 4/ Variables aleatorias discretas
b. En una muestra futura de 100 ndulos de manganeso hallados en el piso ocenico, calcule la
media y la varianza del nmero de especmenes provenientes del eoceno. Dentro de qu in-
tervalo esperara usted que est ese nmero?
4.89 Refirase al ejercicio 4.11. Suponga que un presupuesto para exploracin de 100,000 dlares se
divide equitativamente entre dos prospectos de yacimiento petrolfero idnticos e independientes, con
las probabilidades y resultados monetarios que se muestran en la tabla dada en el ejercicio 4.11.
a. Sea x la suma de los valores monetarios de los dos prospectos. Calcule la distribucin de probabi-
lidad para x.
b. Calcule E(x) y d. Compare estos valores con sus resultados del inciso a.
c. Qu probabilidad hay de duplicar la inversin de 100,000 dlares en los dos prospectos de
yacimiento? Compre1a con la probabilidad de duplicar la inversin de 50,000 dlares en un
solo prospecto que se calcul en el ejercicio 4.11.
d. Qu probabilidad hay de una "ruina de tahr" (es decir, dos pozos secos) en los dos prospectos
de yacimiento? Comprela con la probabilidad de una "ruina de tahr" en un solo prospecto
que se calcul en el ejercicio 4.11.
4.90 Refirase al estudio (Mining Engineering, abril de 1986) sobre la seguridad en las minas subterrneas
de carbn que se analiz en el ejercicio 2.51. Las investigaciones revelaron que las "lesiones inter-
medias", es decir, lesiones incapacitantes que resultan de derrumbes del techo y avalanchas, trans-
porte, maquinaria y accidentes explosivos, constituyen 41% de todas las lesiones incapacitantes y
98% de todas las lesiones fatales en las minas subterrneas de carbn.
a. Calcule la probabilidad de que, en una muestra aleatoria de cinco lesiones incapacitantes, exacta-
mente tres hayan sido lesiones intermedias.
b. Calcule la probabilidad de que por lo menos dos de las cinco lesiones incapacitantes hayan
sido lesiones intermedias.
c. En una muestra al azar de cinco lesiones fatales, calcule la probabilidad de que por 10 menos
dos hayan sido lesiones intermedias.
4.91. El fabricante de un lector ptico de precios asegura que la probabilidad de que su aparato lea mal
el precio de cualquier producto al interpretar mal el "cdigo de barras" de la etiqueta es de .001.
En el momento en que uno de los lectores se instal en un supermercado, el gerente de la tienda
prob su desempeo. Sea y el nmero de pruebas (es decir, el nmero de precios ledos por el
aparato) hasta que se observa el primer error en la lectura de un precio.
a. Si la aseveracin del fabricante es correcta, calcule la distribucin de probabilidad para y. (Su-
ponga que las- pruebas representan eventos independientes.)
b. Si 10 que dice el fabricante es cierto, qu probabilidad hay de que el lector leer bien por lo
menos los primeros cinco precios?
c. Si de hecho se lee mal el tercer precio, qu inferencia hara usted acerca de 10 que el fabricante
asegura? Explique.
4.92 Cuando se introdujo por primera vez el radar durante la Segunda Guerra Mundial, era muy difcil
para un operador a cargo de la pantalla distinguir una seal de interferencia esttica de una seal
causada por un avin enemigo real. Aunque el operador no quisiera sonar la alarma innecesaria-
mente, la omisin de poner sobre aviso a las defensas podra tener consecuencias graves. Los registros
indican que 60% de todas las seales observadas representaban aviones enemigos. Suponga que
durante cierto sitio se detectaron cinco seales en la pantalla en diferentes momentos y que el.
operador del radar puso sobre aviso a las defensas en cada ocasin. Suponga que los eventos son
independientes y calcule la probabilidad de cada uno de los siguientes eventos:
a. El operador del radar tom la decisin correcta en las cinco ocasiones.
b. El operador del radar tom la decisin correcta en por 10 menos tres ocasiones.
c. El operador del radar se equivoc las cinco veces (y por tanto hizo sonar cinco falsas alarmas).
4.93 Un estudio de las caractersticas de flujo de vehculos en los carriles de aceleracin (es decir, rampas
de incorporacin) eIT una autopista importante de Israel revel que uno de cada seis vehculos
Ejerciciolluplementarios 201
utiliza menos de un tercio del carril de aceleracin antes de incorporarse al trfico (Journal of
Transportation Engineering, noviembre de 1985). Suponga que se registra la posicin de la incor-
poracin para los siguientes cinco vehculos que entran en el carril de aceleracin.
a. Qu probabilidad hay de que ninguno de los vehculos utilizar menos de un tercio del carril
de aceleracin?
b. Qu probabilidad hay de que exactamente dos de los vehculos utilicen menos de un tercio
del carril de aceleracin?
4.94 Refirase al ejercicio 4.93. Suponga que el nmero de vehculos que utilizan el carril de aceleracin
cada minuto tiene una media igual a 1.1.
a. Qu probabilidad hay de que ms de dos vehculos utilicen el carril de aceleracin en el
siguiente minuto?
b. Qu probabilidad hay de que exactamente tres vehculos utilicen el carril de aceleracin en
el siguiente minuto?
4.95 Hoy da, la mayor parte de los robots industriales se programan para operar mediante microproce-
sadores. La probabilidad de que un robot computarizado de este tipo se descomponga durante un
turno de ocho horas es de .2. Calcule la probabilidad de que el robot operar durante cuando ms
cinco turnos antes de descomponerse dos veces.
4.96 "La continuacin suficientemente prolongada de una probabilidad baja hace que un resultado dado
sea inevitable", escribi A. J. Coale en Population and Development Review (septiembre de 1985).
El evento "inevitable" al que Coale se refera especficamente es una guerra nuclear. Los expertos
coinciden en que la probabilidad de que ocurra una guerra nuclear en un ao dado es pequea,
pero no cero. Segn Coale, entonces, "a lo largo de cientos de aos esto hace que la guerra nuclear
sea virtualmente una certeza". Suponga que la probabilidad de que ocurra una guerra nuclear en
cualquier ao dado es de slo .01.
a. Qu probabilidad hay de que ocurra una guerra nuclear en los prximos cinco aos?
b. Qu probabilidad hay de que ocurra una guerra nuclear en los prximos 10 aos?
e. Qu probabilidad hay de que ocurra una guerra nuclear en los prximos 15 aos?
d. Qu probabilidad hay de que ocurra una guerra nuclear en los prximos 20 aos?
e. Qu suposicin debe hacerse para contestar los incisos a-d? Qu tan probable es que este
supuesto se cumpla?
4.97 Una compaa que fabrica latas informa que el nmero medio de descomposturas por turno de
ocho horas en su lnea de ensamble operada por mquinas es de 1.5. Suponga que la probabilidad
de una descompostura es constante para todos los turnos.
a. Qu probabilidad hay de que ocurran exactamente dos descomposturas durante el turno de
la medianoche?
b. Qu probabilidad hay de que ocurran menos de dos descomposturas durante el turno de la
tarde?
c. Qu probabilidad hay de que no ocurran descomposturas durante tres turnos consecutivos de
ocho horas cada uno? (Suponga que la mquina opera independientemente de un turno al
siguiente. )
EJERCICIOS SUPLEMENTARIOS OPCIONALES
4.98 Suponga que la variable aleatoria y tiene una funcin generadora de momentos dada por
1 2 2
m(t) = "5et + "5e2t + "5e3t
a. Calcule la media de y.
b. Calcule la varianza de y.
202 Captulo 4/ Variables aleatorias discretas
4.99 Sea y una variable aleatoria geomtrica con la distribucin de probabilidad que se da en la tabla
4.7. Demuestre que E(y) = l/p. [Sugerencia: Escriba
E(y) = P 2: yqy-l donde q = 1 - P
y=l
Ytome nota de que
dqY
_ = yqy-l
dq
Entonces,
00 d '"
E(y) = P 2: yqy-l = P-
d
(L qr)
y= 1 q
Luego utilice el hecho de que
00
2: qy = -q-
y=l 1 - q
(La suma de esta serie infinita se da en la mayor parte de los manuales de matemticas.)]
4.\00 La funcin generadora de probabilidades P(t) para una variable aleatoria discreta y se define como
P(t) = E(tY) = Po + Plt + Pzt
Z
+ ...
donde Pi = P(y = i).
a. Calcule P(t) para la distribucin de Poisson. [Sugerencia: Escriba
E(tY) = i (At)Ye-
A
= eA(t-l) i (At)Ye-
At
y=o y! y=o y!
y observe que la cantidad que se suma es una probabilidad de Poisson cuya media es li.]
b. Aproveche el hecho de que
E(y) = Y E[y(y - 1)] =
para deducir media y la varianza de una variable aleatoria de Poisson.
Referencias
'.
Feller, W. An Introduction to Probability Theory and Its
Applications, Vol. 1, 3a. ed. New York: Wiley, 1968.
Hogg, R. v., y Craig, A T. Introduction to Mathematical
Statistics,4a. ed. NewYork: Macmillan, 1978.
Mendenhall, W., Scheaffer, R. L. YWackerly, D. Mathe-
matical Statistics with Applications, 4a. ed. Boston:
Duxbury Press, 1989.
Mood, A M., Craybill, F. A, YBoes, D. C. Introduction to
the Theory of Statistics, 3a. ed. New York: McCraw-
Hill, 1963.
Mosteller, F., Rourke, R. E. K., yThomas, C. B. Probability
with Statistical Applications, 2a. ed. Reading Mass.:
Addison-Wesley, 1970.
Parzen, E. Modern Probability Theory andIts Applications.
NewYork: Wiley, 1964.
Parzen, E. Stochastic Processes. San Francisco: Holden-
Day,1962.
StandardMathematical Tables, 17a. ed. Cleveland: Che-
mical Rubber Company, 1969.