Вы находитесь на странице: 1из 45

40

  
2
1
2
1
3 4 x4 x5 1 3
E[X ] = x 6 x (1 − x) dx = 6 (x − x ) dx = 6 −  0 = .
0 0 4 5 10
Finalmente,
 2
2 3 2 1 1
V ar[X] = E[X ] − (E[X]) = − = .
10 2 20

Algunas Distribuciones de Probabilidad


Discretas
Algunas de las distribuciones de probabilidad discretas más usadas, se basan
en un tipo especial de experimento aleatorio. Este experimento es conocido
como Ensayo Bernoulli. Un experimento Bernoulli se caracteriza por tener
solo dos posibles resultados (usualmente llamados ’ÉXITO’ o ’FRACASO’).
El éxito representa un evento en el cual estamos interesados. Por ejemplo al
lanzar una moneda se tienen dos posibles resultados ’Cara’ o ’Sello’; en una
encuesta de opinión, el encuestado puede responder ’SI’ o ’NO’ a la pregunta
formulada por el encuestador; el resultado de un tratamiento aplicado a un
paciente puede ser favorable o no, etc.
La probabilidad de que ocurra el evento de interés es usualmente denotada p y
la de fracaso 1 − p. La variable aleatoria de interés en este caso es X : Número
de éxitos obtenidos. Claramente el rango de X será AX = 0, 1.
Para calcular la distribución de probabilidad de X, se debe calcular la pro-
babilidad asociada a cada valor de X.

p(0) = P (X = 0) = 1 − p y p(1) = P (X = 1) = p .

Ası́,
p(x) = px (1 − p)1−x ; x = 0, 1 .
Esta distribución se conoce como Bernoulli y es usualmente denotada
X ∼ Ber(p). Es fácil mostrar que:

E[X] = p y V ar[X] = p (1 − p) .
41

Ejemplo
En el lanzamiento de una moneda no cargada, sea X: número de caras ob-
tenido. Esta variable
1 aleatoria tiene una distribución Bernoulli, con p = 12 .
Ası́, X ∼ Ber 2 .

Considere ahora un experimento aleatorio que consiste en repetir un ensa-


yo bernoulli n veces, donde cada repetición es independiente de las demás
repeticiones o ensayos. Defina la variable X: número de éxitos en los n en-
sayos. Dependiendo del supuesto que se tenga para la probabilidad de éxito,
se obtendrán diferentes tipos de experimentos, de los cuales se deriva una
distribución de probabilidad diferente.

Distribución Binomial
Proceso Binomial
Un experimento aleatorio es llamado Binomial si cumple las siguientes ca-
racterı́sticas:

1. Consta de n pruebas idénticas e independientes.

2. Cada prueba tiene dos posibles resultados ’Éxito’ o ’Fracaso’.

3. La probabilidad de Éxito es constante en las n pruebas y se denota por


p.

4. La v.a de interés es X: # éxitos en los n ensayos.

En este caso el rango de X está dado por AX = {0, 1, · · · , n}. Se puede


mostrar que la p.m.f. de X está dada por:
 
n
p(x) = px (1 − p)n−x ; x = 0 , 1 , 2 , · · · , n .
x

Por notación se escribe X ∼ bin (n , p).


Tambien se tiene que:

(n − x) p
E[X] = n p , V ar[X] = n p (1 − p) y p(x + 1) = p(x) .
(x + 1)(1 − p)
42

Ejemplo
Suponga que la probabilidad de tener una unidad defectuosa en una lı́nea de
ensamble es de 0.05.

a) ¿Cuál es la probabilidad de que entre 20 unidades seleccionadas al azar,


dos sean defectuosas?

b) ¿Cuál es la probabilidad de que a lo más dos de las 20 unidades estén


defectuosas?

c) ¿Cuál es la probabilidad de que por lo menos 2 unidades estén defec-


tuosas?

Solución
Sea X: el # de unidades defectuosas de las 20 unidades seleccionadas. Este
experimento cumple con todas las condiciones para ser un ensayo Binomial.
Ası́, X ∼ bin (20 , 0.05) , donde
 
20
p(x) = (0.05) x (0.95) 20 − x ; x = 0 , 1 , · · · , 20 .
x

En la figura 8 se muestra el respectivo gráfico de p(x).

Fig. 8: Distribución Binomial n = 20, p = 0.2


43

a)  
20
P (X = 2) = p(2) = (0.05) 2 (0.95) 18 = 0.1887 .
2

b)

P (X ≤ 2) = p(0) + p(1) + p(2) = 0.3585 + 0.3774 + 0.1887 = 0.9246 .

c)
P (X ≥ 2) = 1 − P (X < 2) = 1 − P (X ≤ 1) = 0.2641 .

Ejemplo
Un examen de opción múltiple contiene 10 preguntas. Cada pregunta tiene
cuatro opciones de las cuáles sólo una es la correcta. El examen se aprueba si
se responden correctamente al menos seis preguntas. Si el estudiante adivina
las respuestas, conteste las siguientes preguntas:

a) ¿Cuál es la probabilidad de aprobar el examen?.

b) Si el estudiante adivina al menos tres de las preguntas, ¿Cuál es la


probabilidad de reprobar el examen?.

c) Halle E [X] y V ar [X]

Solución
Sea X: # preguntas con respuesta correcta de las 10 contestadas. Entonces
1
X ∼ bin (10 , p) , con p = .
4
Ası́,
   x  10−x
10 1 3
p(x) = ; x = 0 , 1 , · · · , 10 .
x 4 4

a) Se pide


5    x  10−x
10 1 3
P (X ≥ 6) = 1 − P (X ≤ 5) = 1 − = 0.01973 .
x=0
x 4 4
44

b)
P (3 ≤ X < 6) P (3 ≤ X ≤ 5)
P (X < 6 | X ≥ 3) = =
P (X ≥ 3) 1 − P (X < 3)
5   
10 1 x 3 10−x
x 4 4 0.4547
x=3
P (X < 6 | X ≥ 3) = = = 0.9585 .
1 − P (X ≤ 2) 1 − 0.5256

c)     
1 1 3 15
E [X] = 10 = 2.5 ; V ar [X] = 10 = .
4 4 4 8

Distribución de probabilidad Hipergeométrica


Suponga que una población finita tiene N elementos, cada uno de los cuales
tiene una de dos caracterı́sticas diferentes (por ejemplo, K elementos tienen
la caracterı́stica de interés y N − K no la tienen). Se toman al azar y sin
reemplazo n de estos elementos. Sea X : la variable aleatoria que representa
el número de elementos que tienen la caracterı́stica de interés en los
n seleccionados. Los valores que toma esta variable aleatoria son
x = 0, 1, 2, · · · , min(n, K). En este experimento se puede observar:
 
N
Formas distintas de seleccionar n objetos de N .
n
 
K
Formas distintas de seleccionar x elementos de los K
x
 
N −K
Formas distintas de seleccionar n − x de los N − K
n−x
Entonces,
K N −K
x
p(x) = P (X = x) = Nn−x
; x = 0, 1, 2, · · · , min(n, K) .
n

Esta función de probabilidad se conoce como Distribución Hipergeométri-


ca. Se denotará X ∼ Hiper(N, K, n) .
45

Nota: Sea X ∼ Hiper(N, K, n) entonces:

K
E [X] = n
N  
(N − n) K K
V [X] = n 1− .
(N − 1) N N

(N − n)
El término se conoce con el nombre de factor de corrección por
(N − 1)
población finita. Observe que si el tamaño de la muestra n es muy pequeño
comparado con el tamaño de la población, entonces el factor de corrección por
población finita tiende a uno y por lo tanto la varianza de la hipergeométrica
se asemeja a la varianza de la binomial; además garantiza que la condición
de independiencia se cumpla aproximadamente.

Fig. 9: Distribución Hipergeométrica, N = 20, K = 6, n = 5

Ejemplo
Un lote con 25 arandelas contiene tres en las que la variabilidad en el espesor
alrededor de la circunferencia es inaceptable. Se toma una muestra al azar
de tres arandelas.

a) ¿Cuál es la probabilidad de que ninguna de las arandelas inaceptables


se encuentren en la muestra?
46

b) ¿Cuál es la probabilidad de que al menos una de las arandelas inacep-


tables se encuentren en la muestra?

c) ¿Cuál es la probabilidad de que exactamente una de las arandelas


inaceptables se encuentre en la muestra?

Solución
Sea X: # de arandelas inaceptables en la muestra. La p.m.f. de X es de la
forma: 3  22
x
P (X) = 253−x
; x = 0, 1, 2, 3 .
3

a) 22
3 1540
P (X = 0) = p(0) = 25 = = 0.66957 .
3
2300

b)
38
P (X ≥ 1) = 1 − P (X < 1) = 1 − p(0) = = 0.33043 .
115
c) 3 22
1 693
P (X = 1) = p(1) = 25 2 = = 0.30130 .
3
2300

Ejemplo
Un geólogo ha recolectado 10 especimenes de roca basáltica y 10 de granito.
Se instruye a un asistente de laboratorio para que seleccione al azar 6 de los
especimenes para analizarlos.

a) ¿Cuál es la p.m.f. para el número de especimenes de basalto seleccio-


nados para analizarlos?

b) ¿Cuál es la probabilidad de que todos los especimenes de la muestra


sean de una de los dos tipos de roca seleccionados para análisis?

c) ¿Cuál es la probabilidad de que la cantidad de especimenes de granito


seleccionados para su análisis esté a menos de una desviación estándar
de la media?
47

Solución
Sea X: # de especimenes de basalto en la muestra para análisis.

a) 10  10
x
p(x) = 206−x
; x = 0, 1, 2, 3, 4, 5, 6 .
6

b)

P (X = 6 ∨ X = 0) = P (X = 0) + P (X = 6) = p(0) + p(6)
10 10
6 6 210 + 210
= 20 + 20 = = 0.01084 .
6 6
38760

c)
       
10 20 − 6 10 10
E [X] = 6 =3 V ar [X] = 6 1−
20 20 − 1 20 20
  
6 21
14 21
V ar [X] = = = 1.10526 y σ = .
4 19
19 19

21 21
P (|X − μx | ≤ σ) = P − <X −3< = P (1.95 < X < 4.05) .
19 19
Ası́,

P (|X − μx | ≤ σ) = P (2 ≤ X ≤ 4) = p(2) + p(3) + p(4) .


9450 14400 9450
P (|X − μx | ≤ σ) = + + = 0.85913 .
38760 38760 38750
Ejemplo
En el ejercicio anterior suponga que las cantidades de especı́menes de ro-
cas basáltica y de granito son respectivamente 500 y 500 y que se toma
una muestra aleatoria de tamaño 5. La variable aleatoria de interés es X: #
de especimenes de basalto en la muestra para análisis. Defina los siguien-
tes eventos: Ai : la i-ésima roca extraı́da es de basalto con i = 1, 2, 3, 4, 5.
Observe que:
500 1
P (La primer roca seleccionada es de basalto) = P (A1 ) = = .
1000 2
48

P (La segunda roca es de basalto | La primera es de basalto)


499
= P (A2 | A1 ) = = 0.4995 ;
999
498
P (A3 | A1 ∩ A2 ) = = 0.4990 ;
998
497
P (A4 | A1 ∩ A2 ∩ A3 ) = = 0.4985 ;
997
496
P (A5 | A1 ∩ A2 ∩ A3 ∩ A4 ) = = 0.4980 .
996
Observe que en este caso la probabilidad de seleccionar una roca de basalto
en cada repetición es casi constante (la mayor diferencia es de 0.001505).
Esto se debe a que N es muy grande comparado con n.
(N − n) (1000 − 5)
Además note que = = 0.995996 ≈ 0.996. Es decir, la
(N − 1) (1000 − 1)
probabilidad de éxito es aproximadamente constante y
(N − n)
≈ 1, con lo cual el cálculo de probabilidades en este caso puede ser
(N − 1)
aproximado usando la distribución Binomial.

Proposición
Sea X una variable aleatoria tal que X ∼ Hiper(N, K, n).
(N − n)
Si ≈ 1, entonces:
(N − 1)
K N −K  
x n−x n K
N ≈ px (1 − p)n−x ; donde p = .
N
x N
Este resultado se conoce como Aproximación Binomial de la Hipergeométrica.

Para el ejemplo anterior, si se desea calcular P (X = 5 ∨ X = 0) , se tiene


que: 500 500 500 500
5
P (X = 5 ∨ X = 0) = 1000 0 + 0
1000 5 = 0.061875 .
5 5
Usando la aproximación se tiene que:
   5     5
5 1 5 1 1
P (X = 5 ∨ X = 0) ≈ + = = 0.0625 .
5 2 0 2 16
La aproximación es muy buena.
50

Distribución Poisson
Considere los siguientes eventos o experimentos: Establecer el número de ac-
cidentes en un cruce por hora, número de errores ortográficos por página,
número de llamadas telefónicas a una central por minuto, número de imper-
fecciones en un material por cm 2 , número de huecos en una carretera por
kilómetro, etc.

Algunos de estos experimentos tienen caracterı́sticas similares:

1. El experimento consiste en contar el número de veces que ocurre un


cierto evento de interés por unidad de tiempo o espacio.

2. En cada unidad establecida, el número de eventos que ocurren es inde-


pendiente de los que ocurren en otras unidades.

3. Es posible asumir que la probabilidad de que un evento ocurra en una


cierta unidad es la misma para todas las unidades de su tipo.

Experimento Poisson
Dado un intervalo real, suponga que el conteo de ocurrencias es aleatorio
en dicho intervalo. Si este intervalo puede sub-dividirse en sub-intervalos
suficientemente pequeños tales que:

1. La probabilidad de más de una ocurrencia en cada subintervalo es des-


preciable.

2. La probabilidad de ocurrencia en un subintervalo es la misma para to-


dos los subintevalos de la misma longitud y es proporcional a la longitud
de dicho subintervalo.

3. El conteo de ocurrencias en cada subintervalo es independiente del con-


teo de ocurrencias en los demás subintervalos.

Si un experimento cumple estas condiciones, es llamado Experimento Pois-


son. La v.a. de interés será X: # de ocurrencias en el intervalo real. Se dice
que X tiene una distribución Poisson con parámetro λ, donde λ: representa
el número promedio de ocurrencias por unidad de tiempo o espacio.
51

Teorema Aproximación Poisson de la Binomial


Sea X ∼ b(n, p), con n grande y p pequeño, entonces X ∼ P oisson(λ)
donde λ = n p.
Demostración
Sea p = nλ ; observe que
     x  
n x n−x n λ λ n−x
p (1 − p) = 1−
x x n n
   
n (n − 1) (n − 2) · · · (n − x + 1) (n − x)! λ x λ n−x
= 1−
x! (n − x)! n n
x
 n−x
n (n − 1) (n − 2) · · · (n − x + 1) λ λ
= x
1−
x! n n

Organizando términos se tiene:


     
n x λx λ −x n (n − 1) (n − 2) · · · (n − x + 1) λ n
p (1 − p)n−x = 1− 1−
x x! n n n ··· n n
     
n x n−x λx λ −x n n − 1 n−x+1 λ n
p (1 − p) = 1− ··· 1− .
x x! n n n n n
         
n x n−x λx λ −x 1 (x − 1) λ n
p (1 − p) = 1− 1− ··· 1 − 1− .
x x! n n n n
Ası́,
        
n x n−x λx λ −x 1 (x − 1) λ n
lı́m p (1 − p) = lı́m 1 − 1− ··· 1 − 1−
n→∞ x x! n→∞ n n n n
Como    
1 (x − 1)
lı́m 1 − = · · · = lı́m 1 − =1,
n→∞ n n→∞ n
   
λ −x λ n
lı́m 1 − =1 y lı́m 1 − = e− λ .
n→∞ n n→∞ n
Entonces:
 
n x e−λ λx
lı́m p (1 − p)n−x = ; x = 0, 1, 2, · · ·
n→∞ x x!

Dado que este teorema se refiere a un resultado en el lı́mite, se espera una


buena aproximación a partir de n ≥ 100 y p < 0.1.
52

Nota: Si X ∼ P oisson(λ) entonces:

E [X] = λ y V [X] = λ .

Para probar esto observe que:



λx −λ
E [X] = x e
x=0
x!


λx
= x e−λ
x=1
(x − 1)!  x
∞
λx λ−1 λ −λ
= e
x=1
(x − 1)!


λx−1
= λ e−λ
x=1
(x − 1)!

Ası́,

∞
λy −λ
E [X] = λ × e ; con y = x − 1
y=0
(y)!
  
es igual a 1
= λ

Para la varianza proceda ası́



λx −λ
E [X(X − 1)] = x (x − 1) e
x=0
x!


λx
=  x (x  −1) e−λ
x=2
(x − 2)!(x  −1)  x
∞
λ2 λx−2 −λ
= e
x=2
(x − 2)!
53

Ası́,
∞
λy −λ
E [X(X − 1)] = λ2 e
y=0
(y)!
∞
λy −λ
= λ2 × e ; con y = x − 2
y=0
(y)!
  
es igual a 1
= λ2
Entonces,

E X 2 = λ2 + E [X] = λ2 + λ .

Como Var [X] = E [X 2 ] − (E [X])2 se tiene que,


Var [X] = λ2 + λ − λ2 = λ .

Fig. 8: Distribución Poisson, λ = 3

Ejemplo
Suponga que a una central telefónica llegan en promedio 10 llamadas por
minuto.
54

a) ¿Qué tan probable en que en el siguiente minuto lleguen al menos 2


llamadas?

b) ¿Cuál es la probabilidad de que en el siguiente minuto lleguen exacta-


mente 15 llamadas?

c) ¿Cuál es la probabilidad de tener que esperar más de un minuto para


la siguiente llamada?

Solución
Sea X: # llamadas que llegan a la central por minuto. Este experimento
cumple con todas las condiciones para ser un experimento Poisson, siempre
y cuando se pueda garantizar que el número promedio de llamadas por minuto
se mantiene constante para cada intervalo de 1 min. Si se asume que esto es
ciero, se tiene que X ∼ p(10). Ası́:

e − 10 10 x
p(x) = ; x = 0, 1, 2, ··· .
x!

a)
P (X ≥ 2) = 1 − P (X ≤ 1) = 1 − p(0) − p(1) = 0.9995

b)
e − 15 10 15
P (X = 15) = p(15) = = 0.034718 .
15!
c)
P (X = 0) = p(0) = e − 10 = 0.0000454 .

Algunas veces, bajo ciertas condiciones, es posible aproximar una v.a Bino-
mial a una v.a Poisson; esto se puede hacer siempre que n → ∞ y p → 0 y
haciendo el parámetro de la Poisson λ = np.

Ejemplo
Estudios recientes han mostrado que la probabilidad de morir a causa de
cierto medicamento contra la gripe es 0.00002. Si se administra dicho medi-
camento a 100.000 personas. ¿Cuál es la probabilidad de que no más de dos
personas mueran?
55

Solución
Sea X: # de personas que mueren a causa del medicamento.
X ∼ bin (100000,̇ 0.00002). Se pide calcular P (X ≤ 2).
Usando la distribución binomial se tiene que:
2  
100000
P (X ≤ 2) = 0.00002 x (0.99998) 100000−x = 0.676676 .
x=0
x

Sea Y : # personas que mueren por cada 100.000 habitantes . Entonces


Y ∼ p (λ) . Si λ ≈ n p = 2 ⇒
2
e −2 2 y 5
P (X ≤ 2) ≈ P (Y ≤ 2) = = 2 = 0.67668 .
y=0
y! e

La aproximación es excelente, se tiene un error inferior a 5 × 10−6 .

Ejemplo
El número de baches en una sección de una carretera puede modelarse con
una Poisson con λ = 2baches×milla. ¿Cuál es la probabilidad de que no haya
baches que reparar en un tramo de 5 millas?

Solución
Sea X : número de baches en una sección de una milla. Se tiene que X ∼
p(λ = 2) , para x = 0, 1, 2, · · ·
Sea Y : número de baches en una sección de cinco millas. Y ∼ p(λ1 ) , para
y = 0, 1, 2, 3, · · ·

Usando una regla de tres se tiene:


1 milla −→ λ = 2
5 millas −→ λ1 =? ⇒ λ∗ = 10

Ası́ Y ∼ p(10). La probabilidad pedida se calcula como:


100 e−10
P (Y = 0) = = 0.0000454 .
0!
56

Ejemplo
El número de llamadas que llegan a una oficina es una v.a Poisson con
parámetro λ = 4llamadas×hora.

a) ¿Cuál es la probabilidad de que durante tres horas se reciban al menos


dos llamadas?

b) Encuentre el intervalo de tiempo dado por L (en horas) para que la


probabilidad de que se reciba al menos una llamada en dicho intervalo
de tiempo sea de 0.9.

Solución

a) Defina la siguiente v.a: Y : número de llamadas que llegan a la oficina


en tres horas. Y ∼ p(λ∗ ), con y = 0, 1, 2, · · · . Ahora, para hallar el valor
de λ∗ , observe que:

1 hora −→ λ = 4
3 horas −→ λ∗ =? ⇒ λ∗ = 12

Ası́ Y ∼ p(12) . La probabilidad pedida es:

P (Y ≥ 2) = 1 − P (Y ≤ 1)
= 1 − P (Y = 0) − P (Y = 1)
120 e−12 12e−12
= 1− −
0! 1!
= 0.99992

b) Defina la siguiente v.a, Y : número de llamadas que llegan a la oficina


en L horas. Entonces Y ∼ p(λL ) , para y = 0, 1, 2, · · · . Para hallar λL ,
observe que:

1 hora −→ λ = 4
L horas −→ λL =? ⇒ λL = 4L

Ası́ Y ∼ p(4 L). Se pide el valor de L tal que:

P (Y ≥ 1) = 0.9
57

Entonces,
P (Y ≥ 1) = 1 − P (Y = 0)
(4L)0 e−4L
= 1− = 0.9
0!
De esta última igualdad, se tiene que
e−4L = 0.1 .
Aplicando logaritmo a ambos lados, se tiene que:
−4L = ln(0.1) .
Entonces,
ln(0.1)
L= = 0.57565 horas
−4
En el 90 % de las veces se recibe al menos una llamada en un rango de 0.58
horas.

Ejemplo
Una secretaria comete en promedio 2 errores por página en la transcripción
de un manuscrito.

a) ¿Cuál es la probabilidad de que en una página determinada cometa


menos de tres errores?
b) Si se examinan 15 páginas del manuscrito ¿Cuál es la probabilidad de
que se encuentren al menos cinco con menos de tres errores? Asuma
independencia.
c) ¿Cuál es la probabilidad de que se tengan que examinar exactamente
10 páginas hasta encontrar la primera con menos de tres errores?

Solución (Preste especial atención a los valores de las v.a)

a) Sea X : número de errores por página. Entonces X ∼ p(2) , con x =


0, 1, 2, · · ·
La probabilidad pedida es:
2
e− 2 2 x
P (X < 3) = P (X ≤ 2) = = 0.676 .
x=0
x!
58

b) Sea Y : número de páginas con menos de tres errores entre las 15


examinadas. Claramente X ∼ b (15, p) , con y = 0, 1, 2, · · · , 15 . p
representa la probabilidad de éxito. El éxito es cuando se encuentre
una página con menos de tres errores. Del ı́tem anterior se tiene que
p = P (X < 3) = 0.676 . Luego, X ∼ b (15, 0.676) . Ası́, la probabilidad
pedida es:

P (Y ≥ 5) = 1 − P (Y ≤ 4)
4  
15
= 1− (0.676) x (1 − 0.676) 15−x = 0.99861 .
x
y=0

O sea que es muy posible que se de este evento.

c) Sea Z : número de páginas ha revisar hasta encontrar la primera con


menos de tres errores. z = 1, 2, · · · . Observe que se tiene la repe-
tición de eventos Bernoulli independientes con probabilidad de éxito
p = 0.676 . La probabilidad pedida es:

P (Z = 10) = (1 − 0.676)9 (0.676) = 0.00000266 .

Es un evento poco probable.

Distribución Uniforme
Sea X una v.a continua definida en el intervalo (a , b) tal que ∀I ⊂ (a, b) P (X ∈ I)
es proporcional a la longitud de I. Entonces se dice que X tiene una dis-
tribución uniforme en el intervalo (a, b). Para hallar la p.d.f. de X, como la
probabilidad de que X pertenezca a cualquier subintervalo de (a, b) es propor-
cional a su longitud, necesariamente la p.d.f. de X es una función constante;
es decir:
k ; a<x<b
f (x) = .
0 ; en otro caso
Para que f (x) sea una p.d.f. se verifica que:

1
P (X ∈ (a , b)) = k (b − a) = 1 ⇒ k= .
b − a
59

De esta manera, la p.d.f. de la variable aleatoria X es de la forma:


1
b−a
; a<x<b
f (x) = .
0 ; en otro caso
Por notación se escribe X ∼ U (a , b).
X ∼ U (a , b), entonces
a + b (b − a) 2
E [X] = y V [X] = .
2 12
La cdf para X está dada por


⎨ x−0 ; x<a
a
F (x) = ; a≤x≤b .

⎩ b−a
1 ; x>b

Fig. 9: Distribución U (a, b) y su respectiva c.d.f.

Ejemplo
La longitud de una bisagra para puertas es un v.a X, distribuida uniforme-
mente en el intervalo (74.6 , 75.4).

a) Calcule P (X < 74.8)


b) ¿Qué proporción de bisagras miden més de 75.0 mm?
c) ¿Cuál es la probabilidad de que la bisagra mida menos de 74.9 mm?

Solución
La p.d.f para la variable aleatoria X está dada por:

1.25 ; 74.6 < x < 75.4
f (x) = .
0 ; en otro caso
De esta manera se tiene que:
60

a)
74.8
P (X < 74.8) = 1.25 dx = 1.25 (74.8 − 74.6) = 0.25 .
74.6

b)
75.4
P (X > 75) = 1.25 dx = 1.25 (75.4 − 75) = 0.5 .
75

c)
P (X < 74.9) = 1.25 (74.9 − 74.6) = 0.375 .

Ejemplo
El tiempo de ida de vuelta de unos camiones que transportan concreto hacia
una construcción en una carretera es una v.a distribuida uniformemente en
el intervalo de 50 a 70 minutos? ¿Cuál es la probabilidad de que la duración
del viaje sea mayor a 65 minutos si cada camión tarda más de 55 minutos en
el recorrido?
Solución
Sea X: Duración del viaje (en minutos). Se sabe que X ∼ U (50, 70). Se pide
hallar:
P (X ≥ 65 ∧ X ≥ 55)
P (X ≥ 65 | X ≥ 55) =
P (X ≥ 55)
P (X ≥ 65)
=
P (X ≥ 55)
70  1 
20
dx
65 1
= = .
70  1
 3
20
dx
55
61

Distribución Normal
Esta distribución juega un papel clave en el desarrollo de la inferencia es-
tadı́stica, pues muchas de las herramientas usadas en la toma de decisiones
o en el modelamiento estadı́stico, tienen su fundamento en ésta distribución.
Un gran número de estudios pueden ser aproximados usando una distribución
normal. Algunas variables fı́sicas, datos meteorológicos (temperatura, preci-
pitaciones, presión atmosférica, etc), mediciones en organismos vivos, notas
o puntajes en pruebas de admisión o de aptitud, errores en instrumentación,
proporciones de errores en diversos procesos, etc.
Definición
Sea X una variable aleatoria continua; se dice que X tiene una distribución
normal, si su p.d.f es de la forma

1 1 (x − μ) 2 −∞ < x < ∞
f (x) = √ e− 2 σ2 ; .
2π σ μ∈R , σ>0

Por notación se escribe X ∼ n(μ, σ 2 ). A las cantidades μ y σ 2 se les conoce


como parámetros de localización y de escala, respectivamente.

Cuando μ = 0 y σ 2 = 1, se obtiene una distribución normal especial, conocida


como Normal Estándar y usualmente denotada con la letra Z. Se escribe
Z ∼ n(0, 1).
Nota
Sea X una variable aleatoria tal que que X ∼ n(μ, σ 2 ). Las siguientes
afirmaciones se cumplen para la variable aleatoria X.

El área abajo de curva normal comprendida entre (−∞, ∞) es igual a


1.

La normal es simétrica respecto a μ. Como consecuencia de esto, el


área bajo de la curva en el intervalo [μ, ∞) es igual a 0.5.

La distribución normal tiene forma de campana.

La normal queda completamente caracterizada con el conocimiento de


sus parámetros de localización y de escala.

En la práctica la normalidad se alcanza de manera aproximada.


62

E [X] = μ y V ar [X] = σ 2 . Esta afirmación se prueba más adelante.

Cuanto más grande es el parámetro σ 2 el gráfico de la función es mas


’achatada’ y de colas más largas.

A continuación se ilustran algunas normales con el mismo valor de μ y dife-


rentes valores de σ 2

Fig. 10

Se mostrará que en efecto:

E [X] = μ y V ar [X] = σ 2 .

∞
1 (x−μ)2
E [X] = x√ e− 2 σ2 dx .
2πσ
−∞
63

x−μ
Haga el siguiente cambio de variable z = σ
; con lo que dx = σdz. Ası́,
∞
1 z2
E [X] = √ (μ + σ z) e− 2 dz

−∞
∞ ∞
1 2
− z2 σ z2
= μ√ e dz + √ z e− 2 dz
2π 2π
−∞ −∞

En esta última expresión el primer miembro de la derecha es μ veces el área


bajo una curva normal con μ = 0 y σ 2 = 1 y el segundo miembro es una
integral que da cero; por lo tanto,

E [X] = μ .

Ahora, como V ar [X] = E [(X − μ)2 ], entonces


∞
  1 (x−μ)2
E (X − μ) 2
= (x − μ)2 √ e− 2 σ2 dx .
2π σ
−∞

x−μ
Haga el siguiente cambio de variable z = ; con lo que dx = σ dz. Ası́
σ
∞
 2
 σ2 z2
E (X − μ) =√ z 2 e− 2 dz .

−∞

z2 z2
− −
Integrando por partes con u = z, dv = z e 2 , du = dz y v = −e 2 se tiene
que,
⎛ 2

 ∞ z
  σ2 ⎜ 2 ∞
−z 
− ⎟
E (X − μ)2 = √ ⎝ −z e 2  + e 2 dz ⎠
2π −∞
−∞

= σ 2 (0 + 1) = σ 2 .

Suponga que X ∼ n (μ, σ 2 ) y que se quiere hallar P (x1 < X < x2 ). Observe
64

que para hallar esta probabilidad debe resolverse la siguiente integral:

 x2
(x − μ)2
1 −
P (x1 < X < x2 ) = √ e 2σ 2 dx .
x1 2πσ
Esta integral no puede ser resuelta de manera explı́cita; se requiere de méto-
dos numéricos para aproximarla. Además, cada vez que se modifique alguno
de los parámetros μ o σ 2 , se debe calcular de nuevo dicha integral.
Para evitar este problema, se utiliza el cambio de variable Z = X−μσ
. Del cual
se obtiene que dz = σ1 dx. Con esto se tiene que:
x2
1 (x−μ)2
P (x1 < X < x2 ) = √ e− 2 σ2 dx
2πσ
x1
x2 −μ
 σ
1 z2
= √ e− 2 dz

x1 −μ
σ

= P (z1 < Z < z2 ) ,

donde z1 = x1σ−μ y z2 = x2σ−μ . Esto indica que cualquier cálculo de proba-


bilidades para una variable aleatoria N (μ, σ 2 ) puede reducirse al cálculo de
probabilidades con una variable aleatoria N (0, 1). El proceso de transformar
una v.a normal en una normal estándar se conoce como Estandarización o
Normalización.

Para el cálculo de probabilidades con una variable N (0, 1), la c.d.f. estará
dada por:
z
1 z2
φ(z) = P (Z ≤ z) = √ e− 2 dz .

−∞

De esta manera se tiene que:

P (x1 < X < x2 ) = P (z1 < Z < z2 ) = φ (z2 ) − φ (z1 ) .

La función φ(z) se encuentra tabulada en casi todos los textos de estadı́stica.


Una tabla tı́pica se muestra en la figura 11.
65

Una manera de obtener dichos valores es usando una aproximación de Taylor


alrededor de z = 0.

⎪ ∞ (−1)n z 2n+1


1
+ √ ; z≥0

⎨ 2 n=0 2 π (2n + 1) 2n n!
φ(z) = .

⎪ ∞ n 2n+1

⎪ (−1) z
⎩ 12 − √ ; z<0
n=0 2 π (2n + 1) 2n n!

Sea Z una variable aleatoria tal que Z ∼ N (0 , 1):

P (Z < −z) = P (Z > z) .

P (Z − z) = P (Z ≤ z) .

P (−z < Z < 0) = P (0 < Z < z) .


1
P (Z < 0) = P (Z > 0) = 2
.

P (−z1 < Z < −z2 ) = P (z2 < Z < z1 ) .

Fig. 11: Cálculo de probabilidades en una Normal Estándar


66

Ejemplo
Suponga que Z es una variable aleatoria tal que Z ∼ n (0 , 1). Calcule las
siguientes probabilidades:

a) P (Z < 1.32)

b) P (Z < 3)

c) P (Z > 1.45)

d) P (Z > 2.15)

e) P (1.76 < Z < 2.34)

f) P (−1 < Z < 1)

Solución

a) P (Z < 1.32) = 0.9066

b) P (Z < 3) = 0.9987

c) P (Z > 1.45) = 1 − P (Z ≤ 1.45) = 1 − 09265 = 0.0735

d) P (Z > 2.15) = 1 − P (Z ≤ 2.15) = 1 − 0.9842 = 0.0158

e) P (1.76 < Z < 2.34) = P (Z < 2.34) − P (Z < 1.76)


P (1.76 < Z < 2.34) = 0.9904 − 0.8608 = 0.0296

f) P (−1 < Z < 1) = P (Z < 1) − P (Z < −1) = P (Z < 1) − P (Z > 1)


P (−1 < Z < 1) = 2 P (Z < 1) − 1 = 2 (0.8413) − 1 = 0.6826

Ejemplo
Suponga que Z es una variable aleatoria tal que Z ∼ n (0 , 1). Determine
el valor de a para el cuál se cumple:

a) P (Z < a) = 0.9

b) P (Z > a) = 0.05

c) P (−1.24 < Z < a) = 0.8


67

Solución
a) P (Z < a) = 0.9 −→ a = 1.28
b) P (Z > a) = 0.05 ⇐⇒ P (Z < a) = 0.95 −→ a = 1.64
c) P (−1.24 < Z < a) = 0.8 . Es claro que a debe ser positico, ya que si
no lo fuera, el área a la izquierda de a serı́a inferior a 0.5. Con esto
claro se tiene que:

P (−1.24 < Z < a) = 0.8 ⇐⇒ P (Z < a) − P (Z < −1.24) = 0.8 .


Esto implica que:
P (Z < a) = 0.8+0.1075 ⇐⇒ P (Z < a) = 0.9075 −→ a = 1.33 .
.
Ejemplo
La nota promedio obtenida por un estudiante de cierto curso tienen una
distribución aproximadamente normal con una nota promedio de 3.3 y una
desviación estándar de 0.4. Si se desea que solo el 5 % de todos los estudiantes
de dicho curso re-prueben, ¿Cuál debe ser la nota mı́nima para que esto sea
posible?
Solución
Sea X: nota obtenida por un estudiante. Del enunciado se tiene que X ∼
N (3.3 , 0.16). Antes de resolver la pregunta, observe que:
 
X − 3.3 3 − 3.3
P (X < 3) = P < = P (Z < −0.75) = 1−P (Z ≤ 0.75) = 0.2266 .
0.4 0.4
Es decir, se espera que el 22.66 % de los estudiantes pierdan el curso.
Sea K la nota mı́nima aprobatoria que satisface P (X < K) = 0.05 ; (es decir,
el 5 % de los estudiantes tienen notas inferiores a K y reprobarán el curso).
 
X − 3.3 K − 3.3
P (X < K) = 0.05 ⇔ P < = 0.05
0.4 0.4
K − 3.3
⇔ P (Z < z) = 0.05 , con z =
0.4
La ecuación anterior equivale a encontar el valor de z que deja un área a la
izquierda de 0.05. Este valor será negativo (por la forma de la distribución).
Por la simetrı́a de esta distribución se tiene que:
0.05 = P (Z < z) = P (Z > −z) = 1 − P (Z ≤ −z) .
68

es decir,
P (Z ≤ −z) = 0.95 .

Usando la tabla de la normal se encuentra que

−z = 1.645 ⇔ z = −1.645 .

Finalmente,
K − 3.3
−1.645 = ⇔ K = 2.64 .
0.4
Ası́, la nota mı́nima aprobatoria será 2.6, para que solo el 5 % pierda la ma-
teria. En otras palabras, se ajusta la nota de todos sumando 0.4 para que
solo pierda el 5 %.

Ejemplo
El diámetro de un cable eléctrico esté distribuido normalmente con un diáme-
tro medio de 0.8 plg y una desviación esténdar de 0.02.

a) ¿Qué proporción de cables tiene un diámetro superior a 0.81 plg?

b) Un cable es defectuoso si su diámetro difiere del promedio en más de


0.025 plg. ¿Qué proporción de cables son defectuosos?

Solución
Sea X la variable aleatoria que representa el diámetro del cable. Se tiene que
X ∼ n (0.8 , 0.0004).

a)
 
X −μ 0.81 − 0.8
P (X > 0.81) = 1 − P (X ≤ 0.81) = 1 − P ≤
σ 0.02

= 1 − P (Z ≤ 0.5) = 1 − 0.6915 = 0.3085


69

b)
P (|X − 0.8| > 0.025) = 1 − P (|X − 0.8| ≤ 0.025)

= 1 − P (− 0.025 ≤ X − 0.8 ≤ 0.025)


 
− 0.025 X − 0.8 0.025
=1 − P ≤ ≤
0.02 0.02 0.02

= 1 − P (−1.25 ≤ Z ≤ 1.25)

= 1 − Φ (1.25) + Φ (1.25)

= 1 − 0.8944 + 0.1056 = 0.2112

Nota: Percentiles en una normal estándar.


Sea 0 < α < 1 y suponga que Z ∼ n (0 , 1). El valor de Z que deja un área
α a la derecha se denota z α . Es decir,

P (Z > Z α ) = α .

Z α es llamado percentil 100(1 − α) % de la distribución de Z.

Fig. 12: Percentil superior de una Normal Estándar

Aproximación Normal de la Binomial


Suponga que X es un v.a Binomial X ∼ bin (n , p). Si n es grande, entonces
las probabilidades para esta v.a pueden ser aproximadas usando la distribu-
ción normal. Esta aproximación implica el uso de un factor de corrección,
70

ya que el rango de una variable Binomial es un subconjunto de los enteros


no-negativos. Debido a eso, las probabilidades de valores no enteros con una
distribución Binomial, son calculados al redondear
 al entero más cercano,
según el caso. Por ejemplo, suponga que X ∼ bin 10, 12 . Observe que

P (X ≤ 2.2) = P (Z ≤ 2) = p(0) + p(1) + p(2) ; P (X > 2.2) = P (Z ≥ 3) .

P (X ≤ 2) = P (X < 2.5) ; P (X ≥ 3) = P (X > 3.5) .


El factor de correción más usado es 12 . Ahora suponga que X ∼ bin(n, p). Si
n1 ∈ {0, 1, 2, · · · , n}, entonces se verifica que:
 
1 1
P (X = n1 ) = P n1 − < X < n1 + .
2 2
Si n1 , n2 ∈ AX , con n1 < n2 , se verifica que:
 
1 1
P (n1 ≤ X ≤ n2 ) = P n1 − < X < n2 + .
2 2

Sea X una variable aleatoria tal que X ∼ bin (n , p). Entonces si n es grande,
se tiene que:
   
1 x + 21 − n p
P (X ≤ x) = P X < x + ≈P Z ≤  .
2 n p (1 − p)

En la práctica estas aproximaciones son buenas cuando: n p ≥ 10 y


n (1 − p) ≥ 10. De igual manera se tiene que:
   
1 x − 12 − n p
P (X < x) = P X < x − ≈P Z ≤  .
2 n p (1 − p)

Ejemplo
Un proceso de fabricación produce un 2 % de chips defectuosos. Suponga
que la determinación de ésta caracterı́stica es independiente para cada chip
y 1000 de ellos son seleccionados. Calcule la probabilidad de que este lote
contenga más de 25 chips defectuosos, usando la aproximación normal.
Solución
Sea X: # de chips defectuosos en los 1000 seleccionados. Entonces
71

X ∼ bin (1000 , 0.02). Como n p = 1000(0.02) = 20 > 10 y


n (1 − p) = 1000(0.98) = 980 > 10, entonces:

P (X > 25)= 1 − P (X ≤ 25)


 = 1 − P (X < 25.5)
25.5 − 20 .
≈1−P Z ≤ √ = 1 − P (Z ≤ 1.24) = 1 − 0.8925 = 0.1075
19.6
Donde, E [X] = np = 20 y Var [X] = n p (1 − p) = 19.6 .

Ejemplo
Los alambres que se utilizan en una cierta computadora deben tener una
resistencia entre 0.12 y 0.14 ohms. Por experiencia se sabe que dichas resis-
tencias se distribuyen normalmente, con media de 0.13 ohms y desviación
estándar de 0.005 ohms.

a) ¿Cuál es la probabilidad de que un alambre seleccionado al azar de la


producción de la compañia satisfaga las especificaciones?

b) Si se utilizan cuatro de estos alambres de la compañia en el sistema,


¿Cuál es la probabilidad de que los cuatro satisfagan las especificacio-
nes? Asuma independencia en las fallas de los alambres.

Solución

a) Sea X : resistencia de un alambre de computadora de la compañia.


Por el enunciado se tiene que X ∼ n(0.13, (0.005)2 ). La probabilidad
pedida es:
 
0.12 − 0.13 0.14 − 0.13
P (0.12 ≤ X ≤ 0.14) = P ≤Z≤
0.005 0.005
= P (−2 ≤ Z ≤ 2)
= 2 P (Z ≤ 2) − 1 = 0.9544998 .

La calidad de los alambres se puede considerar óptima.

b) Sea Y : número de alambres de la compañı́a que funcionan entre los 4


seleccionados. Esta variable toma los valores y = 0, 1, 2, 3, 4.
éxito : cuando un alambre funciona.
72

Por el numeral anterior se sabe que P (éxito) = 0.9544998. Como se


asume independencia, se puede decir que Y ∼ b(4, 0.9544998). La pro-
babilidad pedida es:
 
4
P (Y = 4) = (0.9544998)4 (1 − 0.9544998)0 = 0.83005 .
4

Osea que la probabilidad de que todos los alambres funcionen en el


sistema se puede considerar alta.
72

Distribución Exponencial
Sea X una v.a continua. Diremos que X tiene una distribución Exponencial,
si la p.d.f. para X es de la forma

λ e −λ x , x > 0
f (x) = .
0 , otro caso

Por notación se escribe X ∼ Exp (λ).


Teorema
Si X ∼ Exp (λ), entonces:

1 1
E [X] = y Var [X] = .
λ λ2
La c.d.f. de X es

1 − e −λ x , x ≥ 0
F (x) = .
0 , x<0

1
Fig. 13: Distribución exponencial para λ = 2

Ejemplo
Sea X el tiempo entre las detecciones de una partı́cula rara por un
contador Geiger; Supóngase que éste tiempo tiene una distribución ex-
ponencial con un tiempo medio de 1.4 minutos. ¿Cuál es la probabilidad
de detectar una partı́cula durante el lapso de 30 segundos desde que se
73

enciende el contador?

Solución
1 1
Como E[X] = = 1.4, entonces λ = 1.4
λ
. De esta manera la p.d.f. de
x
1 − ( 1.4 )
X está dada por: f (x) = 1.4 exp , x > 0 . Se pide calcular:

⎛ ⎞

0.5 x  −⎝
0.5

1 −
P (X < 0.5) = exp 1.4 dx = 1 − exp 1.4 = 0.300327 .
1.4
0

O usando la c.d.f. de X:

⎛ ⎞
0.5
−⎝ ⎠
P (X < 0.5) = P (X ≤ 0.5) = F (0.5) = 1 − exp 1.4 = 0.300327 .

Suponga que transcurren 3 minutos sin que el contador detecte partı́cu-


la alguna. ¿Cuál es la probabilidad de detectar una partı́cula en los 30
segundos siguientes?
74

P (3 < X < 3.5)


P (X < 3.5|X > 3.0) =
P (X > 3)

−x 

3.5
1

exp 1.4
1.4
3
= 
−x 

+∞
1

exp 1.4
1.4
3
⎛ 3.5 ⎞ ⎛
⎞ ⎛ ⎛
3 ⎞

−⎝ ⎠ −⎝ ⎠
⎜ 1.4 ⎟ ⎜ 1.4 ⎟
⎝1 − exp ⎠ − ⎝1 − exp ⎠

= ⎛ ⎞
3
−⎝ ⎠
exp 1.4
⎛ ⎞
3.5
−⎝ ⎠
exp 1.4
= 1− ⎛ ⎞
3
−⎝ ⎠
exp 1.4
⎛ ⎞
0.5
−⎝ ⎠
= 1 − exp 1.4 = 0.300327 .

Relación entre la distribución exponencial y el proceso de


Poisson
Suponga que el número de eventos que ocurren en un intervalo de tiem-
po de longitud t, tiene una distribución de Poisson con parámetro α
y que el número de ocurrencias en intervalos que no se translapan son
independientes entre sı́. Entonces, la distribución del tiempo transcu-
rrido entre la presentación de 2 eventos sucesivos es exponencial con
parámetro λ = α. en otras palabras, Suponga que X ∼ p(λ) donde
λ es el número promedio de ocurrencias por unidad de tiempo. Sea T
la variable aleatoria que representa el tiempo entre ocurrencias de este
proceso Poisson. Entonces T ∼ Exp(λ).
Prueba
75

Para mostrar este resultado, se hallará la c.d.f de T , es decir, se cal-


culará F (t) = P (T ≤ t). Por facilidad se calculará primero P (T > t).
Para ello se define la variable aleatoria Y : número de ocurrencias en
un intervalo de longitud t. Entonces Y ∼ p(λ∗ ). En este caso λ∗ = λ t.
Ası́, Y ∼ p(λ t). De esta manera,

F (t) = 1 − P (T > t) = 1 − P (Y = 0) = 1 − exp −λ t .

La cual corresponde a la acumulada de una exponencial con parámetro


λ, que es lo que se querı́a probar.

Propiedad de carencia de memoria


Suponga que X es una variable aleatoria tal que X ∼ Exp(λ). Sean
t1 y t2 reales positivos. Entonces:

P (X < t1 + t2 | X ≥ t1 ) = P (X < t2 ) .

En la figura 14 se ilustra esta propiedad.

Fig. 14: Carencia de memoria en la Distribución exponencial

Ejemplo
El tiempo entre arribos de los taxis a un cruce muy concurrido tiene
una distribución exponencial con media 10 minutos.

a) ¿Cuál es la probabilidad de que una persona que esté en el cruce


tenga que esperar mas de una hora por un taxi?
76

b) Suponga que una persona ya esperó una hora, ¿Cuál es la proba-


bilidad de que llegue un taxi en los siguientes 10 minutos?
c) ¿Cuál es la probabilidad de que lleguen 2 taxis en una hora?

Solución

a) X: el tiempo transcurrido en minutos entre la llegada de 2 taxis.


Ası́, X ∼ Exp(0.1)

60

P (X > 60) = 1 − 0.1 exp−0.1 x dx = 1 − exp−0.1 x |60
0
0

P (X > 60) = 1 − (exp−6 +1) = exp−6 ≈ 0.0025 .

b)
10
P (X ≤ 70 | X ≥ 60) = P (X ≤ 10) = 0.1 exp−0.1 x dx
0


P (X ≤ 70 | X ≥ 60) = 1 − exp−0.1 x |10
0 = 0.6321 .

c) Sea Y : el # de taxis que llegan en 1 hora . Y ∼ p (λ) λ = 6


Y ∼ P oisson(6)

exp−6 62
P (Y = 2) = ≈ 0.04461 .
2!
Ejemplo
El tiempo que transcurre entre las llamadas que recibe una oficina tiene
una distribución exponencial con una media de 10 minutos.

a) ¿Cuál es la probabilidad de recibir más de tres llamadas en un


lapso de media hora?
b) Determine el valor de x de modo tal que la probabilidad de no
recibir llamada alguna en el intervalo [0, x] horas sea 0.01

Solución
77

a) Sea X: Tiempo entre llamadas. E [X] = 10 minutos.


Sea Y : número de llamadas que llegan en 30 minutos. y = 0, 1, 2,.
Ası́, Y ∼ p(λ∗ ) , con λ∗ : número promedio de llamadas en 30
minutos. Como el tiempo promedio para recibir una llamada es
10 min, se tiene que se recibe una llamada en promedio cada 10
min. Ası́:
10 minuto −→ 1
.
30 minutos −→ λ∗ =? ⇒ λ∗ = 3

Es decir, Y ∼ p(3) . Luego,

3
e−3 3y
P (Y > 3) = 1 − P (Y ≤ 3) = 1 − = 1 − 0.647 = 0.353 .
y=0
y!

b) Sea Y : número de llamadas que llegan en x horas. Y ∼ p(λ2 ).

10 minuto −→ 1
.
60 x minutos −→ λ2 =? ⇒ λ2 = 6 x

Ası́, Y ∼ p(6 x). Finalmente

(6x)0 e−6x
P (Y = 0) = 0.01 ⇔ = 0.01
0!

⇔ −6x = ln(0.01)

ln(0.01)
⇔ x= = 0.7675 ,
−6
aproximadamente 46.05 min.
78

Ejemplo El tiempo de duración de un chip para computadora es una


v.a exponencial con media de 20000 horas. Dado que el chip ya fun-
cionó adecuadamente durante 15000 horas ¿Cuál es la probabilidad de
que dure 1000 horas más?
Solución

Sea X : vida útil del chip.


1
Se sabe que X ∼ Exp( 20000 ). Entonces
⎧ 1 x
⎨ 20000
e− 20000 , x≥0
f (x) = .

0 En otro caso

Se pide,
P (X > 15000 + 1000|X > 15000) .
Como una v.a exponencial tiene la propiedad de falta de memoria, la
probabilidad pedida es equivalente a calcular,
 +∞
1 x
P (X > 1000) = e− 20000 dx
1000 20000

= 0.9512

Distribución Lognormal
Una variable aleatoria X, no negativa, tiene una p.d.f
Lognormal si Y = ln (X) es una v.a con p.d.f normal. Haciendo μ =
E [Y ] y σ 2 = V ar [Y ], la p.d.f de X es de la forma

1 (ln x − μ) 2
1 −
f (x) = √ e 2 σ2 ; x>0.
2π x σ

μ y σ 2 NO son la media y varianza de X. Son la media y varianza de


ln(X). Se puede demostrar que:
2  2 
μ+ σ2 2μ+σ 2 σ
E [X] = e y V ar [X] = e ∗ e − 1 .
79

El célculo de probabilidades con una p.d.f Lognormal es algo com-


plicado. Pero debido al hecho de que el logaritmo natural de un v.a
Lognormal es una v.a normal, podemos usar las tablas para una nor-
mal esténdar para calcular dichas probabilidades. Como ln(X) es una
función estrictamente creciente, entonces
 
ln X − μ ln a − μ
P (X ≤ a) = P (ln X ≤ ln a) = P ≤
   σ  σ
ln a − μ ln a − μ
=P Z≤ =Φ
σ σ
Ası́, la c.d.f de X es de la forma
 
ln x − μ
F (x) = P (X ≤ x) = Φ ; ∀x > 0 .
σ

Ejemplo
El articulo ”The statistics of phytotoxic air pollutants”(Journal Royal
Stat Soc., 1989, pp.183-198) sugiere que la concentración de SO 2 sobre
cierto bosque tiene un distribución aproximadamente Lognormal con
μ = 1.9 y σ = 0.9.

a) Si X: es la concentración de SO 2 en este bosque. Calcule la con-


centración media de SO 2 y la desviación esténdar para X?
b) ¿Cuál es la probabilidad de que la concentración de SO 2 sea a lo
sumo 10? ¿Esté entre 5 y 10?
c) Calcule la mediana para X.

Solución

a)
σ2 0.92
E [X] = e μ + 2 = e 1.9 + 2 = e 2.305 = 10.024 .
2
 2  2
 2

V ar [X] = e 2μ + σ ∗ e σ − 1 = e 2 (1.9)+ 0.9 ∗ e 0.9 − 1 = 125.395 .

b)
 
ln x − μ ln 10 − 1.9
P (X ≤ 10) = P (ln X ≤ ln 10) = P ≤
σ 0.9
80

P (X ≤ 10) = P (Z ≤ 0.45) = 0.6736


 
ln 5 − 1.9 ln 10 − 1.9
P (5 < X < 10) = P ≤Z≤
0.9 0.9
= P(−0.32 ≤ Z ≤ 0.45) = Φ (0.45) − Φ (−0.32) = 0.2991 .

c) Hallemos el valor de x̃ tal que P (X ≤ x̃) = 0.5.

P (X ≤ x̃) = 0.5 ⇔ P (ln X ≤ ln x̃) = 0.5


 
ln x − μ ln x̃ − 1.9
⇔P ≤ = 0.5 ⇔ P (Z ≤ z) = 0.5 ,
σ 0.9
ln x̃ − 1.9
donde z = . Ası́, z = 0, con lo que se obtiene ln(x̃) = 1.9, lo
0.9
que equivale a que x̃ = e1.9 = 6.686 .

En general, para una variable aleatoria Lognormal, con parámetros μ y σ 2 ,


el percentil 100p, denotado xp , se calcula como:

x p = e μ + σ zp ; donde zp es tal que P (Z > zp ) = p , Z ∼ n(0, 1) .

Ejercicios propuestos

1. Suponga que X tiene una distribución normal con media 10 y desviación


estándar 2. Calcule lo siguiente:
a) P (X < 13)
b) P (X > 9)
c) P (6 < X < 14)
d) P (2 < X < 4)
e) P (−2 < X < 8)
2. Suponga que X tiene una distribución normal con media 5 y desviación
estándar 4. Obtenga el valor de x que resuelve cada una de las siguientes
probabilidades:
a) P (X > x) = 0.5
b) P (X > x) = 0.95
c) P (x < X > 9) = 0.2
81

d) P (3 < X > x) = 0.95


e) P (−x < X < x) = 0.99
3. La resistencia a la compresión de una serie de muestras de cemento pue-
de modelarse con una distribución normal con media 6000 kilogramos
por centı́metro cuadrado, y una desviación estándar de 100 kilogramos
por centı́metro cuadrado.
a) ¿cuál es la probabilidad de que la resistencia de una muestra sea
menor que 6250 kg/cm 2 ?
b) ¿cuál es la probabilidad de que la resistencia de una muestra se
encuentre entre 5800 y 5900 kg/cm 2 ?
c) ¿cuál es el valor de resistencia que excede el 95 % de las muestras?
4. El volumen de una méquina de llenado automético deposita en latas de
una bebida gaseosa tiene una distribución normal con media 12.4 onzas
de lı́quido y desviación estándar de 0.1 onzas de lı́quido.
a) ¿cuál es la probabilidad de que el volumen depositado sea menor
que 12 onzas de lı́quido?
b) Si se desechan todas las latas que tienen menos de 12.1 o más de
12.6 onzas de lı́quido, ¿cuál es la proporción de latas desechadas?
c) Calcule especificaciones que sean simétricas alrededor de la media,
de modo que se incluya al 99 % de todas las latas.
5. La media de la operación de llenado puede ajustarse con facilidad, pe-
ro la desviación estándar sigue teniendo el mismo valor, 0.1 onzas de
lı́quido.
a) ¿Qué valor debe darse al media para que el 99.9 % de todas las latas
contengan más de 12 onzas de lı́quido?
b) ¿Qué valor debe darse al media para que el 99.9 % de todas las
latas contengan más de 12 onzas de lı́quido si la desviación estándar
puede reducirse a 0.05 onzas de lı́quido?
6. La longitud de un estuche moldeado por inyección para una cinta magnéti-
ca tiene una distribución normal con una media de 90.2 milı́metros y
desviación estándar de 0.1 milı́metros.
a) ¿cuál es la probabilidad de que la longitud de una pieza sea mayor
que 90.3 milı́metros o menor que 89.7 milı́metros?
b) ¿A que valor debe ajustarse la media del proceso para que el mayor
némero de partes tenga una longitud entre 89.7 y 90.3 milı́metros?
82

c) Si se desechan los estuches cuya longitud no esté entre 89.7 y 90.3


milı́metros, ¿cuál es el rendimiento del proceso para el valor de la
media determinado en el inciso b)?
7. Suponga que el proceso se ajusta de modo que la media y la desviación
estándar queden en 90 y 0.1 milı́metros, respectivamente. Suponga que
se mide la longitud de 10 estuches y que las mediciones son indepen-
dientes.
a) ¿cuál es la probabilidad de que la longitud de los 10 estuches esté en-
tre 89.7 y 90.3 milı́metros?
b) ¿cuál es el numero esperado de los 10 estuches cuya longitud esté en-
tre 89.7 y 90.3?
8. El tiempo que transcurre entre las llamadas a una empresa de artı́culos
para plomerı́a tiene una distribución exponencial con un tiempo prome-
dio entre llamadas de 15 minutos.
a) ¿cuál es la probabilidad de que no haya llamadas en un lapso de 30
minutos?
b) ¿cuál es la probabilidad de recibir al menos una llamada en un
intervalo de 10 minutos?
c) ¿cuál es la probabilidad de recibir la primera llamada entre cinco y
10 minutos después de haber abierto la empresa?
d) Calcule la dimensión de un intervalo de tiempo, de modo tal que la
probabilidad de recibir al menos una llamada en ese lapso sea 0.90.
9. El tiempo de vida de los reguladores de voltaje de los automóviles tiene
una distribución exponencial con un tiempo de vida medio de seis años.
Una persona compra un automóvil que tiene una antigüedad de seis
años, con un regulador en funcionamiento, y planea tenerlo por espacio
de seis años.
a) ¿cuál es la probabilidad de que el regulador de voltaje falle en ese
lapso de seis años?
b) Si el regulador falla después de tres años de haber efectuado la
compra del automóvil y se reemplaza, ¿cuál es el tiempo promedio
que transcurriré hasta que el regulador vuelva a fallar?
10. El tiempo entre llegadas de mensajes electrónicos a una computadora
tiene una distribución exponencial con media de dos horas.
83

a) ¿cuál es la probabilidad de que la computadora no reciba mensajes


en un periodo de dos horas?
b) Si la computadora no ha recibido ningén mensaje en las éltimas
cuatro horas, ¿cuál es la probabilidad de recibir un mensaje en las
dos horas siguientes?
c) ¿cuál es el tiempo esperado entre el quinto y el sexto mensaje?
11. El tiempo entre arribos de los taxis a un cruce muy concurrido tiene
una distribución exponencial con media de 10 minutos.
a) ¿cuál es la probabilidad de que una persona que esté en el cruce
tenga que esperar más de una hora para tomar un taxi?
b) Suponga que la persona ya esperó una hora; ¿cuál es la probabilidad
de que llegue uno en los siguientes 10 minutos?
c) Determine x, de modo tal que la probabilidad de que la persona
espere más de x minutos para tomar un taxi sea 0.10.
d) Calcule x, de modo tal que la probabilidad de que la persona tenga
que esperar menos de x minutos para tomar un taxi sea 0.90.
e) Determine x, de modo que la probabilidad de que la persona tenga
que esperar menos de x minutos para tomar un taxi sea 0.50.
12. El tiempo de duración de un ensamble mecénico en una prueba de vi-
bración tiene una distribución exponencial con media de 400 horas.
a) ¿cuál es la probabilidad de que el ensamble falle durante la prueba
en menos de 100 horas?
b) ¿cuál es la probabilidad de que el ensamble trabaje durante más de
500 horas antes de que falle?
c) Si el ensamble se ha probado durante 400 horas sin falla alguna,
¿cuál es la probabilidad de que falle en las siguientes 100 horas?
d) Si se prueban 10 ensambles, ¿cuál es la probabilidad de que falle
al menos uno de ellos en menos que 100 horas? Suponga que los
ensambles fallan de manera independiente.
e) Si se prueban 10 ensambles, ¿cuál es la probabilidad de que todos
hayan fallado después de 800 horas? Suponga que los ensambles
fallan de manera independiente.
13. El tiempo entre las llegadas de avionetas a un aeropuerto tiene una
distribución exponencial con una media de 1 hora.
84

a) ¿cuál es la probabilidad aterricen más de tres avionetas en una


hora?
b) Si se escogen 30 intervalos de una hora, ¿cuál es la probabilidad de
que en ninguno de ellos hayan aterrizado más de tres avionetas?
c) Determine la duración de un intervalo (en horas), de modo tal que
la probabilidad de que no aterrice ninguna avioneta en ese tiempo
sea 0.10.
14. Si la variable aleatoria X tiene una distribución exponencial con media
θ, calcule lo siguiente:
a) P (X > θ)
b) P (X > 2θ)
c) P (X > 3θ)

Вам также может понравиться