Вы находитесь на странице: 1из 217

Ejercicios Resueltos y Propuestos

Cursos EYP2214 y EYP2216


Primera Edici
on

Trabajo de Recopilacion, Organizacion y Elaboracion


Patricia Jimenez P. & Ricardo Olea O.
Departamento de Estadstica - Facultad de Matematicas
Pontificia Universidad Catolica de Chile
Santiago, Diciembre 2004

Prefacio
Con la intencion de apoyar la labor docente que desarrolla el Departamento de Estadstica
de la Facultad de Matematicas de la Pontificia Universidad Catolica de Chile, se ha realizado
un trabajo de recopilacion y elaboracion de ejercicios resueltos y propuestos para los curso
EYP2216 y EYP2214, algunos de los cuales fueron desarrollados en ayudantas y han sido
parte de interrogaciones en semestre anteriores.
Queremos agradecer muy en especial a FONDEDOC, por haber confiado en este proyecto
y habernos entregado todo su apoyo para poder ver realizada esta necesidad tanto para el
Departamento de Estadstica, como para todos los alumnos y alumnas que son beneficiados
de los cursos de servicio que ofrece el mismo.
Este trabajo ha sido fruto de la labor que desarrollaron docentes y ayudantes que dictaron
el curso entre los a
nos 2001 y 2004.
Especficamente deseamos agradecer a los profesores
Claudio Beltran
Rolando de la Cruz
Hector Gomez
Patricia Jimenez
Ricardo Olea
Alexis Rojas
Ademas quisieramos agradecer el aporte de Jorge Gonzalez y Mario Tagle, tanto por el
material donado, como por la revision de este libro.
Atentamente.
Direccion
Departamento de Estadstica
Facultad de Matematicas
Santiago, Diciembre 2004
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

II

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

Indice general
1. An
alisis Descriptivo
1.1. Ejercicios Resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2. Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1
1
18

2. Probabilidad
2.1. Ejercicios Resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2. Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

27
27
42

3. Variables Aleatorias Discretas


3.1. Ejercicios Resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2. Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

45
45
54

4. Variables Aleatorias Continuas


4.1. Ejercicios Resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.2. Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

59
59
70

5. Sensibilidad y Especificidad
5.1. Ejercicios Resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.2. Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

73
73
77

6. Estimaci
on
79
6.1. Ejercicios Resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
6.2. Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
7. Intervalos de Confianza y Test de Hip
otesis
105
7.1. Ejercicios Resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
7.2. Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124
8. Test de Homogeneidad, Independencia y Bondad de Ajuste
131
8.1. Ejercicios Resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
8.2. Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148
9. An
alisis de Regresi
on
151
9.1. Ejercicios Resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
9.2. Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

INDICE GENERAL

IV

A. Formulario de Distribuciones

B. Formulario de An
alisis de Regresi
on Simple
C. Tablas de distribuci
on
C.1. Distribucion t de Student .
C.2. Distribucion 2 . . . . . .
C.3. Distribucion F ( = 0,05)
C.4. Distribucion Normal . . .

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

III

.
.
.
.

.
.
.
.

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

VII
VII
VIII
IX
XI

Captulo 1
An
alisis Descriptivo
1.1.

Ejercicios Resueltos

EJERCICIO 1
Unos transductores de temperatura de cierto tipo se embarcan en lotes de 50. Se selecciono una muestra de 60 lotes y se determino la cantidad de transductores en cada lote que
no se apegaban a las especificaciones de dise
no y resultaron los siguientes datos:
2
0
5

1 2
4 2
0 2

4 0
1 3
3 2

1
1
1

3 2
1 3
0 6

0 5
4 1
4 2

3
2
1

3 1
3 2
6 0

3 2
2 8
3 3

4
4
3

7 0
5 1
6 1

2 3
3 1
2 3

(a) Diga que tipo de datos son estos.


(b) Construya una tabla de distribucion de frecuencias adecuada para los valores de
x: cantidad de transductores defectuosos en un lote.
(c) Que proporcion de lotes en la muestra tienen cuando mas cinco transductores defectuosos?
(d) Que proporcion tienen cuando menos cinco unidades defectuosas?
(e) Trace un histograma de los datos con la frecuencia relativa en el eje vertical y comente
sus propiedades.
(f) Calcule e interprete la media aritmetica a partir de la tabla de frecuencias.
(g) Obtenga e interprete la mediana por medio de la tabla de frecuencias.

SOLUCION

(a) Datos Discretos.


Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

Captulo 1. An
alisis Descriptivo
(b) Tabla de distribucion de frecuencias: Considerando que son datos discretos, la forma
correcta de hacer esta tabla es dejando una clase por n
umero de transductores que no
se apegaban a las especificaciones. Resultando la siguiente:
Clase
0
1
2
3
4
5
6
7
8

Frec.
7
12
13
14
6
3
3
1
1

Frec. Relativa
0.12
0.20
0.21
0.23
0.10
0.05
0.05
0.02
0.02

Frec. Acumulada
7
19
32
46
52
55
58
59
60

Frec. Relativa Acumulada


0.12
0.32
0.53
0.76
0.86
0.91
0.96
0.98
1.0

(c) Aqu debemos considerar todos aquellos lotes que tenan 0, 1, 2, 3, 4, o 5 transductores
defectuosos
55
= 0,917
60
(d) Analogamente a la parte (c), aqu debemos considerar todos aquellos lotes que tenan
5, 6, 7 o 8 transductores defectuosos
52
8
=1
= 1 0,867 = 0,133
60
60
(e) El Histograma tiene una asimetra positiva apreciable. Se dispersa bastante respecto a
su centro.

Figura 1.1: Histograma

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

1.1 Ejercicios Resueltos

(f) La media es:


m

X=

1X
xi fi
n i=1

Donde m es el n
umero de clases, xi el valor de la clase i, y fi frecuencia de la clase i.
8

X=

1X
152
2,5
xi fi =
8 i=1
60

Aunque esta no es una medida de posicion adecuada para este caso, en promedio hay
2.5 traductores que no se apegaban a las especificaciones del dise
no.
(g) El calculo de la mediana para este caso es obvio por la composicion de las clases, ya
que cada clase esta compuesta de un solo valor, es decir, lo mas simple sera ver en
que frecuencia acumulada se encuentra el valor n2 = 60
= 30 y a que clase corresponde,
2
para este caso el valor 30 se encuentra en la frecuencia acumulada de la clase 2, por lo
que la M e = 2.
De una manera mas formal sera por el procedimiento para el caso de datos tabulados
y discretos, siendo este como sigue:
i. Observemos en la tabla de la parte (a) la columna de las Frecuencias acumuladas
(menor que).
ii. Se determina la menor frecuencia acumulada Nj que supera a n2 .
Es decir
n
< Nj
2
En esta situacion puede ocurrir que

n
2

Nj1 . O sea que se puede tener

Nj1
1. Cuando

n
2

n
< Nj
2

> Nj1 , entonces la mediana es:


M e = yj

2. Cuando n2 = Nj1 , en esta situacion se acostumbra a tomar como valor de la


mediana:
yj1 + yj
Me =
2
Como n2 = 30, N2 = 32 tenemos que
M e = y2 = 2
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

Captulo 1. An
alisis Descriptivo
EJERCICIO 2
Un Constructor Civil visita 25 villas en una ciudad y en cada una anoto el n
umero de casas
que han sufrido da
nos ocasionados por un terremoto, de lo cual resultaron los datos:
15
16
18
19
19

20
17
18
16
18

25
18
19
17
19

15
20
16
17
18

18
18
17
17
15

(a) Diga que tipo de datos son estos.


(b) Construya una tabla de distribucion de frecuencias adecuadas a este conjunto de datos.
(c) Cuantas villas tienen a lo mas 20 casas que han sufrido da
nos?
(d) Que proporcion de villas tienen por lo menos 17 casas que han sufrido da
nos?
(e) Que proporcion de villas tienen 18 casas que han sufrido da
nos?
(f) Que proporcion y que porcentaje de villas tienen 18 o menos casas que han sufrido
da
nos?
(g) Calcular e interpretar la media aritmetica de los datos a partir de la tabla que construyo
en la parte (b)
(h) Obtenga e interprete la mediana de los datos agrupados a partir de la tabla que construyo en la parte (b)
(i) Construya un grafico adecuado y haga comentarios.

SOLUCION
(a) Discretos.
(b) Como son datos discretos, la tabla de frecuencias presentara una clase por cada valor
en los datos, resultando la siguiente tabla
Clase
15
16
17
18
19
20
25

Frecuencia Frecuencia Acumulada


3
3
3
6
5
11
7
18
4
22
2
24
1
25

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

1.1 Ejercicios Resueltos

(c) Considerando la frecuencia acumulada hasta 20, tenemos que el n


umero de villas que
tienen a lo mas 20 casa con da
nos es 24.
(d) Para contestar esto, nos sirven todas las villas que tuvieron 17 casa o mas con da
nos
5+7+4+2+1
= 0,76 76 %
25
(e) De la tabla de frecuencias rescatamos que son 7 de un total de 25, esto es
7
= 0,28 28 %
25
(f) Para contestar esto, nos sirven todas las villas que tuvieron 18 casa o menos con da
nos
18
= 0,72 72 %
25
(g) La media es:
5
X

X=

xi fi

i=1
5
X

445
15 3 + 16 3 + 17 5 + 18 7 + 19 4 + 20 2 + 25 1
=
= 17,8
25
25

fi

i=1

(h) Del Ejercicio 1, tenemos que n2 = 12,5, entonces la clase que contiene a Nj (La frecuencia acumulada que supera a n2 ) es la 4, es decir N4 = 7.
como

n
2

= 12,5 > N3 = 11 tenemos que


M e = y4 = 18

(i) Del Histograma de la figura siguiente se aprecia que lo que se dio con mayor frecuencia
en las villas, fueron 18 casas con da
nos, seguidas por 17 y 19, manteniendose las otras
clases relativamente semejantes.

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

Captulo 1. An
alisis Descriptivo

Figura 1.2: Histograma


EJERCICIO 3
La siguiente distribucion de frecuencias es el resultado de registros sobre la duracion de 220
lamparas (o focos) de 60 watts.
Lmites de Clase
[500 600)
[600 700)
[700 800)
[800 900)
[900 1000)
[1000 1100)
[1100 1200)
[1200 1300)
[1300 1400)
[1400 1500]

Frecuencia
3
7
14
28
64
57
23
13
7
4

(a) Construya un histograma para estos datos, cuyo eje vertical corresponda a las frecuencias relativas.
(b) Obtenga la duracion media.
(c) Obtenga la desviacion estandar.
(d) Encuentre e interprete un intervalo que contenga el 60 % central de los datos.
(e) Mas o menos, Cual es la mediana de la duracion de las ampolletas?

SOLUCION

(a) tenemos la siguiente tabla tabulada:


Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

1.1 Ejercicios Resueltos


Clase
[500 600)
[600 700)
[700 800)
[800 900)
[900 1000)
[1000 1100)
[1100 1200)
[1200 1300)
[1300 1400)
[1400 1500]

7
Frecuencia Frecuencia Relativa
3
0.014
7
0.032
14
0.064
28
0.127
64
0.291
57
0.259
23
0.105
13
0.059
7
0.032
4
0.018

Frecuencia Acumulada
3
10
24
52
116
173
196
209
216
220

luego el histograma queda de la siguiente forma

Figura 1.3: Histograma

(b) La media es:


10
X

X=

yi fi

i=1
10
X

219100
= 995,91
220

fi

i=1

donde yi es la marca de clase o punto medio de la i-esima clase y fi la frecuencia


absoluta de la misma clase.
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

Captulo 1. An
alisis Descriptivo
(c) La varianza para datos tabulados se calcula de la siguiente manera:
n
X

S2 =

fi (yi X)2

i=1

n1

en este caso
S 2 = 28613,325
La desviacion estandar es:
S=

S2 =

28613,325 = 169,15

(d) El intervalo pedido es:


[P20 P80 ]
P20 : En que clase esta?:

np
220 20
=
= 44
100
100

es decir, esta en la 4a clase.


P80 : En que clase esta?:

np
220 80
=
= 176
100
100

es decir, esta en la 7a clase.


La formula para calcular el percentil en datos tabulados es:

 np
Nj1
100
Pp = LI + cj
Nj Nj1
donde:
i. LI: Limite Inferior de la clase que contiene a Pi .
ii. cj : Amplitud de la clase que contiene a Pi .
iii. Nj : Frecuencia acumulada en la clase que contiene Pi .
Reemplazando tenemos lo siguiente:



44 24
P20 = 800 + 99
= 870,71
52 24


176 173
P80 = 1100 + 99
= 1112,91
196 173
Por lo tanto el intervalo que contiene al 60 % de los datos es:
(870,71; 1112,91)
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

1.1 Ejercicios Resueltos

(e) Para el calculo de la Mediana en datos tabulados y continuos, el procedimiento es el


siguiente:
Se observa la columna de las frecuencias acumuladas y se determina la menos frecuencia
acumulada Nj tal que
n
Nj >
2
En esta situacion puede ocurrir que

n
2

Nj1 . Es decir, se puede tener

Nj1
i. Si ocurre que

n
2

n
< Nj
2

= Nj1 , la mediana esta dada por:


M e = yj1

donde yj1 es el lmite inferior de la clases mediana.


ii. Si ocurre que

n
2

> Nj1 , la mediana esta dada por:



 n
Nj1
2
M e = yj1 + cj
Nj Nj1

Dado esto tenemos que n2 = 220


= 110, lo que indica que Nj = N5 = 116 y como
2
n
=
110
>
N
=
N
=
52
tenemos
que la mediana es:
j1
4
2



110 52
M e = 900 + 99
= 989,718
116 52
EJERCICIO 4
Los tiempos de CPU que se indican en la tabla de frecuencias representan el tiempo (en
segundos) que 25 trabajos estuvieron en control de la unidad de proceso (CPU) de una
computadora mainframe grande.
Intervalo de Clase Frecuencia de Clase
[0.015-0.715)
5
[0.715-1.415)
9
4
[1.415-2.115)
[2.115-2.815)
3
[2.815-3.515)
1
[3.515-4.215)
2
[4.215-4.915]
1
(a) Calcule el tiempo promedio de CPU.
(b) Calcule e interprete la desviacion estandar.
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

10

Captulo 1. An
alisis Descriptivo
(c) Construya e interprete un histograma de frecuencia.
(d) Encuentre e interprete el intervalo intercuartil.

SOLUCION
A continuacion la tabla de frecuencias completa
Intervalo de Clase
[0.015-0.715)
[0.715-1.415)
[1.415-2.115)
[2.115-2.815)
[2.815-3.515)
[3.515-4.215)
[4.215-4.915]

f
5
9
4
3
1
2
1

F
5
14
18
21
22
24
25

fr
0,2
0,36
0,16
0,12
0,04
0,08
0,04

Fr
0,2
0,56
0,72
0,84
0,88
0,96
1

yi
0,35
1,065
1,765
2,465
3,165
3,865
4,565

donde
N = 25
yi : punto medio de la clases i-esima
fi : frecuencia absoluta de la clases i-esima
(a) El tiempo promedio de CPU es:

x=

7
1 X
fi yi
N i=1

1
(0,365 5 + 1,065 9 + 1,765 4 + 2,465 3 + 3,165 1 + 3,865 2 + 4,565 1)
25

41,325
25

= 1,653
(b) La desviacion estandar es la siguiente:

S2 =

1 X
fi (yi x)2
N 1 i=1

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

1.1 Ejercicios Resueltos

S2 =

11

1 
5 (1,288)2 + 9 (0,588)2 + 4 (0,122)2
24
+3 (0,812)2 + 1 (1,512)2 + 2 (2,212)2 + 1 (2,912)2

33,9864
24

= 1,4161
S=

1,4161

= 1,19
La desviacion estandar es una medida de dispersion de los datos con respecto a la media.
En este caso S = 1,19 seg., es alta, lo cual indica la presencia de datos extremos.
(c) El histograma de frecuencia se muestra en la figura siguiente.

Figura 1.4: Histograma


Se aprecia que el histograma es asimetrico, que mas de la mitad de los tiempos de la
unidad de proceso fueron menores que 1.415 seg., se aprecia que casi tres cuartas partes
fueron menores que 2.115 seg. y aproximadamente un cuarto de las CPU tardan mas
de 2.815 seg.
(d) El intervalo intercuartil es el siguiente
(Q1 , Q3 )
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

12

Captulo 1. An
alisis Descriptivo
este rango indica que en el se ubica el 50 % central de los datos, donde Q1 = P25 y
Q3 = P75 .
De la tabla de frecuencias tenemos que Q1 Clase 2 y Q3 Clase 4.
Luego los percentiles son
P25 = 0,715 + 0,7

6,255
145

P75 = 2,115 + 0,7

18,7518
2118

= 0,812


= 2,290

Se tiene que el 50 % de los 25 trabajos estuvieron en control de la CPU entre 0.812 y


2.290 seg.
EJERCICIO 5
El n
umero de divorcio en una ciudad, de acuerdo con al duracion de casados, esta representada por la siguiente tabla.
A
nos de casados No de divorcio
[0-6)
2800
1400
[6-12)
600
[12-18)
[18-24)
150
50
[24-30]
(a) Cual es la duracion media de los casamientos?
(b) Encuentre la desviacion estandar de la duracion de los casamientos.
(c) Construya un histograma.
(d) Encuentre el intervalo intercuantil.

SOLUCION

(a) La duracion media de los casamientos es


Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

1.1 Ejercicios Resueltos

13

6
1 X
x=
fi yi
N i=1

1
(2800 3 + 1400 9 + 600 15 + 150 21 + 50 27)
5000

34500
5000

= 6,9
Los matrimonios duran en promedio 6.9 a
nos.
(b) La desviacion estandar de la duracion de los casamientos es:
S2 =

138150
= 27,64 S = 5,3 a
nos
4999

(c) Histograma de No de divorcio vs Clase de A


nos de casados.

Figura 1.5: Histograma


La mayora de los matrimonios se separan en los primeros 6 a
nos. Solo el 10 % de los
matrimonios dura entre los 24 y 30 a
nos.
(d) El intervalo intercuantil es
I = (P25 ; P75 ) = (Q1 ; Q3 )
tenemos que
n
5000
=
= 1250 < N1 la clase del percentil 25 es 0 6
4
4
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

14

Captulo 1. An
alisis Descriptivo
luego

Q1 = P25 = 0 + 6


1250 0
= 2,7
2800

3n
3 5000
=
= 1250 < N2 la clase del percentil 75 es 6 12
4
4
luego

Q3 = P75 = 6 + 6


3750 2800
= 10,1
1400

As tenemos
I = (2,7; 10,1)
El 50 % central de los matrimonios dura entre los 2.7 a
nos y 10.1 a
nos.
EJERCICIO 6
La siguiente informacion corresponde al ingreso neto (X) como porcentaje de sus activos,
para las 20 compa
nas exitosas:
17 23 22 18 8 7 12 2 49 14
14 36 16 7 3 8 10 11 20 21
De los ingresos netos como porcentajes de las ventas (Y), informados por 250 Compa
nas
regularmente exitosas se sabe que:
250
X
i=1

yi = 2125

250
X

yi2 = 18625

i=1

(a) Compare el coeficiente de variacion del ingreso neto como porcentaje de la activos, con
la del ingreso neto como porcentaje de las ventas, para las Compa
nas exitosas y las
regularmente exitosas, respectivamente. Cual ingreso neto es mas homogeneo?
(b) Si en las Compa
nas regularmente exitosas, se eliminan dos valores extremos 0.8 y 14.5,
cual es la desviacion estandar del ingreso neto como porcentaje de las ventas, para
las 248 Compa
nas restantes? (Utilice 3 decimales)

SOLUCION
(a) el Coeficiente de variacion (C.V) se calcula como:
C.V =

S
X

2
Se puede calcular considerando Sn1
(varianza muestral) o Sn2 (varianza poblacional).
En la siguiente tabla se entrega el resumen de ambos casos

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

1.1 Ejercicios Resueltos

15

X
Y

2
X
Sn1
C.V
Sn2
C.V
15.9 124.199 0.700 130.735 0.719
8.5
2.259 0.176
2.250 0.176

Como C.V (Y ) < C.V (X), se puede concluir que el ingreso neto como porcentaje de
las ventas es mas homogeneo que el ingreso neto como porcentaje de la activos.
(b) Si consideramos varianza poblacional tenemos que dado lo siguiente:
248
X

yi = 2125 0,8 14,5

= 2109,7

Y = 8,506

i=1
248
X

yi2 = 18625 0,82 14,52 = 18414,11 Y 2 = 74,250

i=1

la desviacion estandar es
q
Sn =

Y2Y =

74,250 8,5062 = 1,377

EJERCICIO 7
Actualmente existe un reglamento con respecto de la obligacion de las construcciones por
cumplir normas mnimas de seguridad, entre ellas se encuentra la resistencia al fuego de los
elementos de una construccion. Un sistema de proteccion consiste en utilizar una pintura
que permite aislar el elemento, llamada pintura ntumescente.
Antes de la construccion de un edificio se realizaron ensayos en pilares de acero que fueron
expuestos al fuego por sus 4 caras, los cuales fueron pintados con diferentes espesores de esta
pintura, en micrones y se midio su resistencia al fuego, en minutos, hasta que se comenzaba
a deteriorar. La informacion se presenta a continuacion.
ESPESOR DE LA
PINTURA (micrones)
[0 335)
[335 670)
[670 1005)
[1005 1340)
[1340 1675]

RESISTENCIA AL FUEGO (minutos)


Menos de 22 22 - 52 52 - 82 82 y mas
10
6
1
0
5
8
2
0
1
3
3
1
0
1
7
10
0
0
10
15

(a) Seg
un el tiempo de exposicion al fuego antes de ser da
nado el pilar, la resistencia al
fuego se clasifica como clases F30, si este tuvo una duracion entre 30 y 59 minutos.
Que porcentaje de los pilares no se clasificaran como clase F30?
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

16

Captulo 1. An
alisis Descriptivo
(b) Cual distribucion es mas homogenea en relacion al espesor de la pintura ntumescente, la de los pilares que mostraron una resistencia al fuego de menos de 52 minutos
o la de los pilares con resistencia igual o superior a 52 minutos?
(c) Si consideramos solo los pilares que fueron pintados con un espesor entre 670 y 1005
micrones. Grafique la distribucion de estos pilares seg
un sea su resistencia al fuego.

SOLUCION
(a) Considerando solo la resistencia al fuego tenemos las siguiente tabla de frecuencias y
con la cual podremos obtener el porcentaje de de pilares que no se clasifican como F30.
Resistencia
< 22
[22 52)
[52 82)
82

f
16
18
23
26

F
16
34
57
83

Fr
0.19
0.41
0.69
1.00

Se calcula el percentil a que corresponde 30 y 59 en resistencia al fuego.


P = 30 = 22 + 30

P = 59 = 52 + 30

83
100


16
= 25,06
18

83
100


34
= 47,43
23

luego = 22,37 %, es decir, el 22.37 % de los pilares se clasifica como F30, por
ende el 73.63 % no corresponde a esa categora.
(b) La idea es calcular los coeficientes de variacion, para los dos grupos de resistencia, para
ello reconstruimos la tabla de frecuencias como sigue:
Espesor
[000 335)
[335 670)
[670 1005)
[1005 1340)
[1340 1675)

R < 52 R 52
mi
16
1
167.5
13
2
502.5
4
4
837.5
1
17
1172.5
0
25
1507.5

luego los coeficienes de variacion son los siguientes:


C.V (Espesor|R < 52) =

263,6446
0,6526
403,970

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

1.1 Ejercicios Resueltos

17

C.V (Espesor|R 52) =

310,1497
0,2446
1268,2142

la distribucion es mas homogenea en relacion al espesor de la pintura en la correspondiente a los pilares con resistencia igual o superior a 52 minutos.
(c) Considerando solo el grupo de Espesor entre 670 y 1005 la tabla de frecuencias obtenida
es la siguiente:
Resistencia
< 22
[22 52)
[52 82)
82

frecuencia
1
3
3
1

Graficamente la distribucion es la siguiente:

Figura 1.6: Histograma

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

18

Captulo 1. An
alisis Descriptivo

1.2.

Ejercicios Propuestos

1. La resistencia del concreto depende del procedimiento que se utilice para curarlo. Dos
metodos distintos de curado mostraron los siguientes resultados en ensayos independientes.
Se considera que el concreto queda con resistencia optima, cuando es superior a 3220
libras/pulgadas2 .
Resistencia Metodo 1 Metodo 2
[2500-2740)
3
2
[2740-2980)
4
3
[2980-3220)
5
7
[3220-3460)
5
5
6
4
[3460-3820]
a) Que porcentaje de los ensayos con el metodo 1 de curado, resultan con concreto
de resistencia optima?
b) Que porcentaje de los ensayos con el metodo 2 de curado, resultan con concreto
de resistencia optima?
c) Construya un grafico adecuado que muestre la distribucion de los ensayos con el
metodo 1 seg
un resistencia de concreto y ubique en dicho grafico el valor numerico
de su resistencia media.
d ) Construya un grafico adecuado que muestre la distribucion de los ensayos con el
metodo 2 seg
un resistencia de concreto y ubique en dicho grafico el valor numerico
de su resistencia media.
2. Denote por X n y Sn2 la media y la varianza para la muestra X1 , . . . , Xn , y denote por
2
X n+1 y Sn+1
estas cantidades cuando una observacion adicional Xn+1 se a
nade a la
muestra.
a) Demuestre como X n+1 se puede calcular de X n y Xn+1 .
b) Muestre que
2
= (n 1)Sn2 +
nSn+1

n
(Xn+1 X n )2
n+1

2
de modo que Sn+1
se puede calcular de Xn+1 , X n y Sn2 .

c) Suponga que una muestra de 15 hebras de hilo de pa


no dio como resultado una
media muestral de elongacion de 12.58 mm y una desviacion estandar muestral de
0.512 mm. Una decima sexta hebra da un valor de elongacion de 11.8. Cuales
son los valores de la media muestral y de la desviacion estandar muestral para las
16 observaciones de elongacion?
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

1.2 Ejercicios Propuestos

19

3. Las longitudes de las rutas de transporte en determinada lnea suelen variar entre s. En
el artculo Planning of City Bus Routes(J. of the Institution of Engineers, 1995, pp.
211-215) aparece la siguiente informacion sobre las longitudes (en km) de determinada
lnea:
Longitud Frecuencia
[6 8)
6
[8 10)
23
[10 12)
30
[12 14)
35
[14 16)
32
[16 18)
48
[18 20)
42
[20 22)
40
[22 24)
28
[24 26)
27
[26 28)
26
[28 30)
14
[30 35)
27
[35 40)
11
[40 45]
2
a) Trace el histograma para estas frecuencias.
b) Que proporcion de las rutas tienen una longitud menor que 20? Que proporcion
de estas rutas tienen longitudes de cuando menos 30?
c) Mas o menos, cual es el valor del 90 percentil de la distribucion de longitudes
de ruta?
d ) Mas o menos, cual es la mediana de la longitud de las rutas?
4. El artculo C
an We really Walk Straight(Amer. J. of Physical Anthropology, 1992 pp.
19-27) reporto un experimento en el que se pidio, a cada uno de 20 hombres sanos, que
caminaran en lnea recta tan derecho como fuera posible hacia un blanco situado a 60
m a velocidad normal. Considere las siguientes observaciones sobre cadencia (n
umeros
de pasos por segundo):
0.95 0.85 0.92 0.95 0.93 0.86 1.00 0.92 0.85 0.81
0.78 0.93 0.93 1.05 0.93 1.06 1.06 0.96 0.81 0.96
Utilice los metodos desarrollados en el captulo 1 para resumir la informacion; incluya
una interpretacion o discusion, siempre que sea apropiado. (Nota: el autor del artculo
utilizo una analisis estadstico de gran complejidad para analizar estos datos).
5. Para cada una de las siguientes afirmaciones indique si ella es verdadera ( V ) o falsa
( F ). Justifique
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

20

Captulo 1. An
alisis Descriptivo
a) M e = (Q1 + Q3 )/2 , siendo Me = Mediana, Qi = i - esimo cuartil ( i = 1, 3 )
b) Si el valor maximo entre ( X1 , X2 , . . . , Xk ) = 18 , entonces , Moda = 18.
c) Si una variable es de nivel de medicion nominal , entonces la medida de tendencia
central mas adecuada es la mediana.
6. Responda brevemente :
a) De dos definiciones de tipos de muestreo
b) Diga cuando una variable es del tipo discreta y cuando es del tipo continua
c) Diga que se entiende por : No depende de la unidad de medida se
nale por
lo menos dos medidas que cumplan y dos medidas que no cumplan con lo antes
se
nalado.
2

d ) Describa en que consiste el percentil p ( Pp )


e) Que porcentaje de la muestra esta contenido en el Rango-Intercuartil ?
7. La exposicion aguda al cadmio produce dolores respiratorios, da
nos en los ri
nones,
hgado y puede ocasionar la muerte. Por esta razon se controla el nivel de polvo de
cadmio y de humo de oxido de cadmio en el aire. Este nivel se mide en miligramos de
cadmio por metro c
ubico de aire. Una muestra de treinta y cinco lecturas arroja estos
datos : (Basado en un informe de Environmental Management , Septiembre de 1981,
pag. 414)
0.044
0.049
0.050
0.070
0.054

0.030
0.030
0.056
0.061
0.042

0.052
0.040
0.061
0.061
0.051

0.044
0.045
0.042
0.058

0.046
0.039
0.055
0.053

0.020
0.039
0.037
0.060

0.066
0.039
0.062
0.047

0.052
0.057
0.062
0.051

a) Construya una tabla de Frecuencias utilizando la formula de Sturges para el


n
umero de intervalos.
Sturges: N.I : 1 + [ 3,3 log10 n] , donde [x] := Es la parte entera de x.
Amplitud : A = ( Xmax Xmin ) / N.I.
b) Construya el histograma utilizando las frecuencias absolutas. Parece razonable
pensar que el nivel de cadmio del aire posee una distribucion en forma de campana
?
c) Calcular las medidas de tendencia central utilizando los datos originales y utilizando la tabla construida en el apartado ( b ).
d ) Compare sus resultados en relacion a la simetra de los datos, los puntos ( c ) y (
d ).
8. La Avcola El Super Pollopreocupada por los recientes reclamos de clientes con
respecto al peso de los pollos, decidio estudiar la distribucion de los pesos de 1000
pollos, con los siguientes resultados:
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

1.2 Ejercicios Propuestos

21
Peso (gramos) Frecuencia
[960 980)
60
160
[980 1000)
[1000 1020)
280
260
[1020 1040)
[1040 1060)
160
80
[1060 1080]
Total
1000

a) Cual es el peso medio?


b) Construya el histograma.
c) Construya la ojiva y la poligonal de frecuencias
d ) Interesa dividir los pollos en cuatro categoras, con respecto al peso, de modo que:
i)
ii)
iii)
iv)

El
El
El
El

20 %
30 %
30 %
20 %

de
de
de
de

los
los
los
los

pollos
pollos
pollos
pollos

mas livianos sean clasificados en categora D


que siguen en peso sean clasificados en categora C
que siguen en peso sean clasificados en categora B
restantes sean clasificados en categora A.

Cuales son los lmites de peso en cada categora?


9. Que ocurre con la mediana, media y desviacion estandar de una serie de datos, cuando:
a) cada observacion es multiplicada por 2
b) se le suma 10 a cada observacion
c) se le resta la media a cada observacion
d ) a cada observacion se le resta la media y se divide por la desviacion estandar.
10. La distribucion de los 20.000 empleados de la empresa alfa, seg
un antig
uedad (X)
y sueldo mensual (Y) se muestra en la siguiente tabla de proporciones (frecuencias
relativas) conjuntas:
X
(en a
nos)
Menos de 4 a
nos
4 a 8 a
nos
Mas de 8 a
nos

[50 90)
0,12
0,08
0,00

Y (en miles de $)
[90 130) [130 170)
0,08
0,04
0,12
0,10
0,12
0,18

[170 250]
0,00
0,05
0,11

(a) Clasifique las variables del problema seg


un si son cualitativas o cuantitativas y
diga si son nominal u ordinal y continua discreta.
(b) Grafique la distribucion de los empleados seg
un sueldo mensual.
(c) En que grupo son mas homogeneos los sueldos de la empresa, en el de los empleados mas nuevos o en el de los mas antiguos? Justifique su respuesta.
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

22

Captulo 1. An
alisis Descriptivo
(d) Si para las fiestas patrias la empresa otorgo un aguinaldo de $25.000 a los empleados cuyo sueldo era inferior a los $120.000, mientras que para aquellos cuyo sueldo
era superior a esa cifra el aguinaldo fue de $15.500, cuantos de los empleados
que tienen mas de 8 a
nos de antig
uedad en la empresa recibieron un aguinaldo de
$15.500?
11. Una empresa que se dedica a la fabricacion de mallas de acero para hormigon armado,
ha tomado una muestra de las mallas que compro una constructora en un mes determinado, registrando por cada unidad el peso de la malla (en Kg) X, el tipo de malla Y
(con borde C y sin bordo S) y el diametro de las barras (en mm) Z. Los resultados
obtenidos fueron los siguientes:

Z
Y
Menos de 5 C
S
[5 7]
C
S
Mas de 7
C
S

(15-28] (28-41]
10
6
8
4
2
8
2
6
0
4
0
2

X
(41-54]
4
2
3
5
4
5

(54-67] Mas de 67
2
0
0
0
11
4
11
0
20
7
15
5

(a) Clasifique las variables seg


un escala de medicion y tama
no de recorrido.
(b) Encuentre la medida de posicion mas adecuada para el peso de la malla.
(c) Que porcentaje de las mallas con bordes tienen un diametro de barras superiores
a 5.5 mm?
(d) Cual es la variabilidad del peso de las mallas sin bordes que tienen diametros de
barras menores de 5.0 mm?
12. Los siguientes datos corresponden a las cantidades maximas de emision diaria de oxido
de azufre (en toneladas) registrada seg
un planta de emision, en cierta zona industrial.
Cantidad de oxido (ton)
[05 10)
[10 15)
[15 20)
[20 25)
[25 30]

Planta A
50
30
60
20
40

Planta B
40
30
0
10
20

Planta C
20
40
70
15
5

(a) Indique la unidad de informacion y clasifique las variables seg


un escala de medicion
y tama
no de recorrido
(b) Entre las plantas B y C, cual presenta mayor variabilidad relativa su promedio
de oxido de azufre emitido?
(c) Que porcentaje de las emisiones producidas por la planta C, supera las 28
toneladas?
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

1.2 Ejercicios Propuestos

23

13. En una empresa constructora se ha registrado informacion respecto: ingreso mensual


(Y), especialidad (X) y permanencia (Z) en la empresa (en que A = antiguo, N =
recien ingresado), de sus trabajadores, obteniendo lo siguiente:

Especialidad
Alba
nil
A
N
Carpintero A
N
Electricista A
N
Pintor
A
N

Ingreso mensual, en miles de pesos


[100 150) [150 200) [200 300] Mas
6
9
5
9
11
1
1
6
7
1
2
3
3
5
8
1
5
4
2
20
2
1
10
5

de 300
0
0
9
3
1
0
0
0

(a) Clasifique las variables involucradas seg


un nivel de medicion. Calcule la medida
de posicion mas adecuada en cada caso. Indique unidad de informacion.
(b) Construya un grafico que permita mostrar la distribucion de los trabajadores
seg
un especialidad.
(c) Construya un grafico que permita compara los ingresos de los pintores seg
un
permanencia en la empresa.
(d) Si entre carpinteros y electricistas tienen un sueldo promedio de $225.000 Cual
es el sueldo promedio de los trabajadores de la empresa?
(e) Si la empresa decide mejorar los sueldos de los trabajadores con ingresos inferiores
a $180.000 Que % de los trabajadores se beneficiara con esta medida?
(f) Si a los alba
niles se les otorga una bonificacion de $20.000. Compare la dispersion
de los ingresos de los alba
niles despues de la bonificacion con la de los ingresos de
los pintores.
14. Una empresa constructora de parques y plazas, ha ganado una propuesta para construir
areas verdes en plazas de una determinada region. Las superficies sembradas, en metros
cuadrados, en 80 plazas y la mezcla de semilla de pasto utilizadas, se resumen en la
siguiente tabla:

Superficie Sembrada
Mezcla
[200 1180) [1180 3140) [3140 5100) [5100 6080]
Manquehue
7
4
6
2
Estadios
3
6
8
4
Ray-grass
0
7
9
5
Lon grass trevol
2
5
4
1
Total
12
22
27
12
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

Mas de 6080
0
3
4
0
7

24

Captulo 1. An
alisis Descriptivo
(a) Clasifique las variables involucradas seg
un nivel de medicion y tama
no de recorrido.
(b) Calcule las medidas marginales de posicion mas adecuadas para cada variable e
indique las correspondientes medidas de dispersion.
(c) Construya un grafico que muestre la distribucion de las plazas sembradas seg
un
mezcla de semilla utilizada.
(d) Compare la dispersion de las superficies sembradas con mezcla de manquehue con
la dispersion de las superficies sembradas con mezcla Long grass trebol.
(e) Si un kilo de mezcla manquehue sirve para plantar una superficie de 13 metros
cuadrados. Que porcentaje de las superficies plantadas en que se utilizo esta
mezcla, ocupara mas de 284 kilos?
15. El n
umero de llamadas telefonicas de larga distancia nacional registrada por una empresa distribuidora durante una hora de un da determinado, se realizara en horarios
normales y se consideraron llamadas de a lo mas 3 minutos de duracion.

Carrier
188

171

123

Valor de la llamada (U.M)


Region [5-6] (6-8] (8-10] (10-20]
II
3
8
10
4
IV
7
9
10
4
X
3
7
5
5
II
4
3
9
6
IV
5
5
8
3
X
2
4
7
7
II
3
4
7
8
IV
7
4
4
5
X
6
7
4
3
Total
40
51
64
45

Total
25
30
20
22
21
20
22
20
20
200

(a) Clasifique las variables involucradas seg


un nivel de medicion y tama
no de recorrido
e indique la medida marginal de tendencia central mas adecuadas para el valor
de la llamada y para el carrier en la IV region.
(b) Que porcentaje son tales que superan al valor promedio de las llamadas realizadas
a traves del carrier 171?
(c) Al mes siguiente de haber efectuado este estudio, el valor de la llamada de larga
distancia del carrier 123, aumento en un 2 % mas de U.M por cada 3 minutos de
duracion. En que porcentaje disminuye (aumenta) la variabilidad del valor de la
llamada al mes siguientes?
16. Una empresa constructora con varias obras en el pas desea efectuar un estudio sobre
las ca
neras hidraulicas, de una pulgada, adquiridas por la empresa. Para ello, se selecciono una muestra de las compras efectuadas durante un mes, anotando el precio de la
tira de ca
neras, la cantidad de tiras, y el tipo de material de fabricacion.
La informacion obtenida se presenta en la siguiente tabla:
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

1.2 Ejercicios Propuestos


Material
P.V.C
Fierro
Cobre
P.V.C
Fierro
Cobre
P.V.C
Fierro
Cobre

Cantidad
de tiras
2300-3000
0,08
0-10
0,02
0,00
0,10
10-20
0,02
0,00
0,07
20 y mas
0,01
0,00
Total
0,30

25
Precios (pesos)
3000-4500 4500-6000 6000 y mas Total
0,04
0,01
0,00
0,13
0,07
0,02
0,00
0,11
0,00
0,09
0,04
0,13
0,02
0,00
0,00
0,12
0,08
0,01
0,00
0,11
0,02
0,06
0,12
0,20
0,01
0,00
0,00
0,08
0,03
0,01
0,00
0,05
0,00
0,03
0,04
0,07
0,27
0,23
0,20
1,00

(a) Clasifique las variables involucradas seg


un nivel de medicion y tama
no de recorrido. Indique las medidas marginales de posicion y dispersion mas adecuadas.
(b) que porcentaje de las compras, en las que se requieren menos de 20 tiras de
ca
nera, tienen un precio entre 3.000 y 6.000 pesos?
(c) Construya un grafico que muestre la distribucion de frecuencias de las compras
de ca
neras de P.V.C, seg
un precio.

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

26

Captulo 1. An
alisis Descriptivo

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

Captulo 2
Probabilidad
2.1.

Ejercicios Resueltos

EJERCICIO 1
Las tres opciones preferidas en cierto tipo de departamento nuevo, son con resistencia antissmica (A), calefaccion central (B) y con excelentes terminaciones (C). Si 70 % de los
compradores piden A, 80 % B, 75 % C, 85 % A o B, 90 % A o C, 95 % B o C y 98 % A, B o
C, calcule las probabilidades de los siguientes eventos:
(a) El siguiente comprador selecciona, por lo menos, una de las tres opciones.
(b) El siguiente comprador esta interesado en otras opciones.
(c) El siguiente comprador solo selecciona que tenga resistencia antissmica y ninguna de
las otras dos opciones.
(d) El siguiente comprador selecciona exactamente una de las tres opciones.

SOLUCION
Reescribamos la informacion que nos entregan:
P (A) = 0,7
P (B) = 0,8
P (C) = 0,75
P (A B) = 0,85
P (A C) = 0,9

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

28

Captulo 2. Probabilidad
P (B C) = 0,95
P (A B C) = 0,98
Luego:
(a) P (A B C) = 0,98
(b) 1 P (A B C) = 0,02
(c) P (A B C) P (B C) = 0,98 0,95 = 0,03
(d) P (A B C) P (B C) + P (A B C) P (A C) + P (A B C) P (A B)
= 3P (A B C) P (B C) P (A C) P (A B)
= 3 0,98 0,95 0,9 0,85
= 0,24
EJERCICIO 2
Se toman muestras de una pieza fundida de aluminio y se clasifican de acuerdo con el acabado
de la superficie (en micropulgadas) y con las mediciones de longitud. A continuacion se
resumen los resultados obtenidos con 100 muestras.

Acabado de la
Superficie

Excelente
Bueno

Longitud
Excelente Bueno
75
7
10
8

Sean A: el evento donde la muestra tiene un acabado excelente, y B: el evento donde la


muestra tiene una longitud excelente. Determine el n
umero de muestras en Ac B, B c , y
A B. Dibuje un diagrama de Venn que represente estos datos. Determine las siguientes
probabilidades.
(a) P (A)
(b) P (B)
(c) P (Ac )
(d) P (A B)
(e) P (A B)
(f) P (Ac B)

SOLUCION:
Sean los eventos A: Acabado Excelente y B: Longitud Excelente, y respectivamente Ac :
Acabado bueno y B c : Longitud Buena, entonces:
Ac B = 10;

B c = 15;

A B = 75 + 7 + 10

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

2.1 Ejercicios Resueltos

29

Figura 2.1: Diagrama de Venn


(a) P (A) = P (A B) + P (A B c ) =

75+7
100

(b) P (B) = P (B A) + P (B Ac ) =

75+10
100

(c) P (Ac ) = P (Ac B) + P (Ac B c ) =


(d) P (A B) =

82
100

10+8
100

85
100

18
100

75
100

(e) P (A B) = P (A) + P (B) P (A B) =

92
100

(f) P (Ac B) = P (Ac ) + P (B) P (Ac B) =

93
100

EJERCICIO 3
A continuacion se ofrece un resumen de varias ordenes de compra de dispositivos de alumbrado, de acuerdo con las caractersticas opcionales solicitadas para estos.
Proporci
on de
o
rdenes de compra
Sin caractersticas opcionales
0.3
Una caracterstica opcional
0.5
Mas de una caracterstica opcional
0.2
(a) Cual es la probabilidad de que en una orden se solicite al menos una caracterstica
opcional?
(b) Cual es la probabilidad de que en una orden no se pida mas de una caracterstica
opcional?

SOLUCION:
Sean los eventos:
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

30

Captulo 2. Probabilidad
S: Sin caractersticas opcionales.
U: Una caractersticas opcional.
M: Mas de una caractersticas opcional.
Entonces
(a) P (al menos una caracterstica) = P (U ) + P (M ) = 0,5 + 0,2 = 0,7
(b) P (no mas de una caracterstica) = P (S) + P (U ) = 0,3 + 0,5 = 0,8
EJERCICIO 4
La tabla siguiente presenta un resumen del analisis realizado a las flechas de un compresor
para determinar el grado con que estas satisfacen ciertos requerimientos.

el acabado superficial cumple


con los requerimientos

la curva cumple
con los requerimientos
s
no
s 345
5
no 12
8

(a) Si se toma una flecha al azar, cual es la probabilidad de que cumpla con los requerimientos de acabado superficial?
(b) Cual es la probabilidad de que la flecha seleccionada cumpla con los requisitos de
acabado o con los de curvatura?
(c) Cual es la probabilidad de que la flecha seleccionada cumpla con los requisitos de
acabado o que no cumpla con los de curvatura?
(d) Cual es la probabilidad de que la flecha seleccionada cumpla con los requisitos de
acabado y curvatura?

SOLUCION:
Sean los eventos A: Cumple con acabado superficial, Ac : No cumple con acabado superficial,
C: Cumple con curvatura, C c : No cumple con curvatura.
(a) P (A) = P (A C) + P (A C c ) =

345+5
370

(b) P (A C) = P (A) + P (C) P (A C) =

350
370
350+357345
370

362
370

350+135
370

358
370

350+357362
370

345
370

(c) P (A C c ) = P (A) + P (C c ) P (A C c ) =
(d) P (A C) = P (A) + P (C) P (A C) =

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

2.1 Ejercicios Resueltos

31

EJERCICIO 5
Continuacion del ejercicio anterior. Las flechas se clasifican, ademas, en terminos de la
maquina herramienta utilizada en su fabricacion.
Maquina Herramienta 1

el acabado superficial cumple


con los requerimientos

la curva cumple
con los requerimientos
s
no
s 200
1
no 4
2

Maquina Herramienta 2

el acabado superficial cumple


con los requerimientos

la curva cumple
con los requerimientos
s
no
s 145
4
no 8
6

(a) Si se elige una flecha al azar, cual es la probabilidad de que cumpla con los requerimientos de acabado o con los de curvatura, o que provenga de la maquina herramienta
1?
(b) Si se escoge una flecha al azar, cual es la probabilidad de que cumpla con los requerimientos de acabado o que cumpla con los de curvatura o que provenga de la maquina
herramienta 2?
(c) Si se elige una flecha al azar, cual es la probabilidad de que cumpla con los requisitos
de acabado y curvatura o que provenga de la maquina herramienta 2?
(d) Si se toma una flecha al azar, cual es la probabilidad de que cumpla con los requisitos
de acabado o que provenga de la maquina herramienta 2?

SOLUCION:
Agregaremos a los eventos definidos en el ejercicio anterior, M1: maquina 1 y M2: maquina
2.
(a) P (A C M 1)
= P (A) + P (C) + P (M 1) P (A C) P (A M 1) P (C M 1) + P (A C M 1)
=

350+357+207345201204+200
370

364
370

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

32

Captulo 2. Probabilidad
(b) P (A C M 2)
= P (A) + P (C) + P (M 2) P (A C) P (A M 2) P (C M 2) + P (A C M 2)
=

350+357+163345149153+145
370

368
370

(c) P ((A C) M 2) = P (A C) + P (M 2) P (A C M 2) =
(d) P (A M 2) = P (A) + P (M 2) P (A M 2) =

350+163149
370

345+163145
370

363
370

364
370

EJERCICIO 6
En cierta gasolinera, 40 % de los clientes utilizan gasolina regular sin plomo (A1 ), 35 %
gasolina extra sin plomo (A2 ) y 25 % gasolina premium sin plomo (A3 ). De los clientes que
consumen gasolina regular, solo 30 % llenan sus tanques (evento B). De los que consumen
gasolina extra, 60 % llenan sus tanques, mientras que, de los que usan premium, 50 % llenan
sus tanques.
(a) Cual es la probabilidad de que el siguiente cliente pida gasolina extra sin plomo y
llene su tanque?.
(b) Cual es la probabilidad de que el siguiente cliente llene el tanque?.
(c) Si el siguiente cliente llena el tanque, Cual es la probabilidad de que pida gasolina
regular?, extra? y premium?.

SOLUCION
Sean los siguientes eventos:
A1 : Gasolina regular sin plomo
A2 : Gasolina extra sin plomo
A3 : Gasolina Premium sin plomo
B: Llena el tanque
Reescribiendo la informacion entregada obtenemos:
P (A1 ) = 0,4
P (A2 ) = 0,35
P (A3 ) = 0,25

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

2.1 Ejercicios Resueltos

33

P (B|A1 ) = 0,3
P (B|A2 ) = 0,6
P (B|A3 ) = 0,5

(a) P (A2 B) = P (B|A2 )P (A2 ) = 0,6 0,35 = 0,21


(b) P (B) = P (B|A1 )P (A1 ) + P (B|A2 )P (A2 ) + P (B|A3 )P (A3 )
= 0,3 0,4 + 0,6 0,35 + 0,5 0,25 = 0,455
(c) P (A1 |B) =

P (A1 B)
P (B)

P (B|A1 )P (A1 )
P (B)

0,30,4
0,455

P (A2 |B) =

P (A2 B)
P (B)

P (B|A2 )P (A2 )
P (B)

0,60,35
0,455

= 0,4615

P (A3 |B) =

P (A3 B)
P (B)

P (B|A3 )P (A3 )
P (B)

0,50,25
0,455

= 0,2747

= 0,2637

EJERCICIO 7
En relacion al ejercicio anterior, considere la siguiente informacion adicional sobre el uso de
las tarjetas de credito:
70 % de los clientes que consumen gasolina regular y llenan su tanque usan una tarjeta
de credito.
50 % de todos los clientes que consumen gasolina regular y no llenan su tanque usan
tarjeta de credito.
60 % de todos los clientes que consumen gasolina extra y llenan su tanque usan tarjeta
de credito.
50 % de todos los clientes que consumen gasolina extra y no llenan su tanque usan
tarjeta de credito.
50 % de todos los clientes que consumen gasolina premium y llenan su tanque usan
tarjeta de credito.
40 % de todos los clientes que consumen gasolina premium y no llenan su tanque usan
tarjeta de credito.
Calcule la probabilidad de cada uno de los siguientes eventos para el siguiente cliente que
llegue:
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

34

Captulo 2. Probabilidad
(a) {extra,llena el tanque y usa tarjeta de credito}.
(b) {premium, no llena el tanque y usa tarjeta de credito}.
(c) {premium y usa tarjeta de credito}
(d) {usa tarjeta de credito}, (un diagrama de arbol puede ser u
til).

SOLUCION:
A los eventos definidos en el ejercicio anterior, agregaremos C: Usa tarjeta de credito.
Reescribiendo nuevamente la informacion entregada en esta parte, obtenemos:
P (C|A1 B) = 0,7
P (C|A1 B c ) = 0,5
P (C|A2 B) = 0,6
P (C|A2 B c ) = 0,5
P (C|A3 B) = 0,5
P (C|A3 B c ) = 0,4
(a)
P (A2 B C) =P (C|A2 B) P (A2 B)
=P (C|A2 B)P (B|A2 )P (A2 )
=0,6 0,6 0,35 = 0,126

(b)
P (A3 B c C) =P (C|A3 B c )P (A3 B c )
=P (C|A3 B c )P (B c |A3 )P (A3 )
=0,4 0,5 0,25 = 0,05

(c)
P (A3 C) =P (A3 C B) + P (A3 C B c )
=P (C|A3 B)P (A3 B) + P (C|A3 B c )P (A3 B c )
=P (C|A3 B)P (B|A3 )P (A3 ) + P (C|A3 B c )P (B c |A3 )P (A3 )
=0,5 0,5 0,25 + 0,4 0,5 0,25 = 0,1125

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

2.1 Ejercicios Resueltos

35

(d) P (C) = P (A1 B C) + P (A1 B c C) + P (A2 B C) + P (A2 B c C) + P (A3


B C) + P (A3 B c C)
= P (C|A1 B)P (A1 B) + P (C|A1 B c )P (A1 B c ) + P (C|A2 B)P (A2 B) +
P (C|A2 B c )P (A2 B c ) + P (C|A3 B)P (A3 B) + P (C|A3 B c )P (A3 B c )
= P (C|A1 B)P (B|A1 )P (A1 )+P (C|A1 B c )P (B c |A1 )P (A1 )+P (C|A2 B)P (B|A2 )P (A2 )+
P (C|A2 B c )P (B c |A2 )P (A2 )+P (C|A3 B)P (B|A3 )P (A3 )+P (C|A3 B c )P (B c |A3 )P (A3 )
= 0,7 0,3 0,4 + 0,5 0,7 0,4 + 0,6 0,6 0,35 + 0,5 0,4 0,35 + 0,5 0,5 0,25 + 0,4 0,5 0,25
= 0,5325

Figura 2.2: Arbol


EJERCICIO 8
En la empresa Coca-Cola el llenado de las botellas con bebida es realizado automaticamente
por una maquina que funciona a distintas velocidades. La probabilidad de que el volumen
de llenado sea incorrecto es de 0.001 cuando el proceso se realiza a baja velocidad. Cuando
el proceso de llenado se realiza a alta velocidad, la probabilidad de llenado incorrecto es de
0.01.
Suponga que el 25 % de las botellas son llenadas cuando el proceso se realiza a alta velocidad,
mientras que el resto de botellas son llenadas a una baja velocidad.
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

36

Captulo 2. Probabilidad
(a) Cual es la probabilidad de encontrar una botella con un volumen incorrecto en su
interior?
(b) Cual es la probabilidad de encontrar un botella llena con un volumen incorrecto y que
haya sido llenado cuando el proceso se realiza a baja velocidad?
(c) Cual es la probabilidad de que el proceso de llenado de las botellas haya sido a baja
velocidad, si se sabe que la botella esta efectivamente con un volumen correcto?
(d) Si se encuentra una botella llenada con un volumen incorrecto, cual es la probabilidad
de que haya sido llenado cuando el proceso se realiza a alta velocidad?

SOLUCION:
Se definen los siguientes eventos:
A: Llenado a alta velocidad.
B: Llenado a baja velocidad.
C: Volumen llenado correcto
I: Volumen llenado incorrecto

Figura 2.3: Arbol

(a) P (I) = P (A I) + P (B I) = P (I|A)P (A) + P (I|B)P (B)


= 0,25 0,01 + 0,75 0,001 = 0,00325
(b) P (I B) = P (I|B)P (B) = 0,00075
(c) P (B|C) =
(d) P (A|I) =

P (BC)
P (C)
P (AI)
P (I)

0,750,999
0,750,999+0,250,99

0,250,01
0,250,01+0,750,001

= 0,7516

= 0,7692

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

2.1 Ejercicios Resueltos

37

EJERCICIO 9
ES ESTO!. Un jugador A, comienza
Un juego para dos jugadores se denomina QUE
lanzando un dado numerado en cinco de sus caras: 1, 2, 3, 4 y 6; y en la sexta cara tiene escrita
ES ESTO!. Las caras numeradas son las puntuaciones que va obteniendo
la frase QUE
ES ESTO!. Entonces, el turno
cada vez. El jugador A sigue jugando hasta que saque QUE
pasa al jugador B que lanza un segundo dado. Este dado indica en cuatro de sus caras que
el turno de lanzar el dado numerado pasa al jugador B y otras dos caras que indican que el
jugador A contin
ua con el dado numerado.
(a) Cual es la probabilidad de que el jugador A saque un total de 4 ptos. en dos tiradas,
ES ESTO!?
sin que haya salido QUE
(b) Cual es la probabilidad de que, despues de lanzar el dado el jugador A, lance el jugador
B y el jugador A pierda su turno?
(c) Cual es la probabilidad de que el jugador A le toque lanzar en la tercera tirada?

SOLUCION:
Sea definen los siguientes eventos:
Ak : resultado en el k-esimo lanzamiento del dado numerado por el jugador A.
Ak : Turno k-esimo de jugar el dado numerado corresponde al jugador A; con k = 2, 3, . . ..
B k : Turno k-esimo de jugar el dado numerado corresponde al jugador B; con k = 2, 3, . . ..

Figura 2.4: Arbol


(a)
P ((A1 = 1 A2 = 3) (A1 = 2 A2 = 2) (A1 = 3 A2 = 1)) =

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

1 1 1 1 1 1
+ +
6 6 6 6 6 6

3
36

1
12

38

Captulo 2. Probabilidad
(b)
P (B 2 B 3 ) = P (B 2 )P (B 3 )

1 4

6 6

4
36

1
9

(c)
P ((A2 A3 ) (B 2 A3 )) = P (A2 A3 ) + P (B 2 A3 )
= P (A2 )P (A3 ) + P (B 2 )P (A3 )

5 5 1 2
+
6 6 6 6

27
36

3
4

EJERCICIO 10
Un aficionado usa el siguiente sistema para pronosticar el tiempo atmosferico. Clasifica un
da como seco o mojado y supone que la probabilidad de que un da dado sea igual al anterior
esta dado por p (0 p 1). En base a ciertos registros se sabe que el primer da de Enero
tiene probabilidad (0 1) de ser seco.
Si n = P (n-esimo da del a
no es seco), obtenga una expresion para 2 y 3 en funcion de
y p.
(Hind: Puede ser u
til aplicar probabilidad totales)

SOLUCION:
Definamos como:
Di : El da i-esimo del a
no es seco;

i = 1, 2, . . . , n.

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

2.1 Ejercicios Resueltos

39

c
P (Di | Di1 ) = p = P (Dic | Di1
)

P (D1 ) =
luego tenemos que
2 = P (D2 ) = P (D2 D1 ) + P (D2 D1c )
2 = P (D2 | D1 )P (D1 ) + P (D2 | D1c )P (D1c )
2 = p P (D1 ) + (1 p) P (D1c )
2 = p + (1 p) (1 )
2 = (2p 1) + (1 p)
Ahora se obtiene de la misma manera 3
3 = P (D3 ) = P (D3 D2 ) + P (D3 D2c )
3 = P (D3 | D2 )P (D2 ) + P (D3 | D2c )P (D2c )
3 = p P (D2 ) + (1 p) P (D2c )
3 = p P (D2 ) + (1 p) (1 P (D2 ))
3 = (2p 1) P (D2 ) + (1 p)
3 = (2p 1) 2 + (1 p)
3 = (2p 1) {(2p 1) + (1 p)} + (1 p)
3 = (2p 1)2 + (2p 1)(1 p) + (1 p)
EJERCICIO 11
En la serie mundial de beisbol, dos equipos A y B juegan una serie de partidos uno contra
otro y el primer equipo que gana un total de tres partidos es el ganador de la serie mundial.
Si la probabilidad de que el equipo A gane un partido contra el equipo B es 31 .
(a) Describa el espacio muestral de este experimento.
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

40

Captulo 2. Probabilidad
(b) Cual es la probabilidad de que el equipo A gane la serie mundial?
(c) Si la probabilidad de que el equipo A gane cualquier partido es p (0 < p < 1). Cual
es la probabilidad de que sea necesario jugar los 5 partidos para determinar al ganador
de la serie?
(d) Si la serie termina en el cuarto juego, cual es la probabilidad de que el ganador sea el
equipo B?

SOLUCION

(a) El espacio graficamente sera:

Figura 2.5: Arbol


o de la misma manera todas las combinaciones que estan en el arbol como sigue:
= {AAA, AABA, AABBA, AABBB, . . . , BBB}
donde # = 20.
(b) Sea S: A gana el mundial
P (S) = P ({AAA} {AABA} {AABBA} {ABAA} {ABABA} {ABBAA}
{BAAA} {BAABA} {BABAA} {BBAAA})
 3
 3
 3   2
1
1 2
1
2
=
+3
+6
3
3 3
3
3
(c) T : Es necesario jugar 5 partido para determinar el ganador de la serie mundial
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

2.1 Ejercicios Resueltos

P (T ) = P ({AABBB} {ABABA} {ABABB} {BAABA}


{BAABB} {BABAA} {BABAB} {BBAAA} {BBAAB})
= 6p3 (1 p)2 + 6p2 (1 p)3
= 6p2 (1 p)2 (p + 1 p)
= 6p2 (1 p)2
(d) Sea C: La serie termina en el cuarto juego.

P (S c |C) =

P (S c C)
P (C)

P (ABBB BABB BBAB)


P (AABA ABAA ABBB BAAA BABB BBAB)

3p(1 p)3
3p(1 p)3 + 3p3 (1 p)

3p(1 p)3
3p(1 p){(1 p)2 + p2 }

(1 p)2
p2 + (1 p)2

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

41

42

Captulo 2. Probabilidad

2.2.

Ejercicios Propuestos

1. Una costura hecha en un avion necesita 25 remaches. La costura tendra que volver a
realizarse si cualquiera de los remaches esta defectuoso. Suponga que los remaches estan
defectuosos independientemente unos de otros, cada uno con la misma probabilidad.
a) Si 14 % de todas las costuras necesitan volver a efectuarse, cual es la probabilidad
de que un remache este defectuoso?
b) Que tan peque
na debe ser la probabilidad de un remache defectuoso para asegurar que solo 10 % de todas las costuras necesiten volver a ejecutarse?
2. Dos bombas conectadas en paralelo fallan independientemente una de la otra en un
da dado. La probabilidad de que la bomba mas vieja falle es 0.10 y la probabilidad de
que solo la bomba mas nueva falle es 0.05. Cual es la probabilidad de que el sistema
de bombeo falle en cualquier da dado (lo que sucedera si ambas bombas fallan)?
3. Se tienen 5 aspirantes (Juan, Dario, Mara, Susana y Natalia) para dos trabajos identicos. Un supervisor selecciona dos aspirantes para ocupar esos puestos.
a) Hacer un lista de los modos posibles en que se pueden ocupar los puestos. Es decir,
hacer una lista de todas las selecciones posibles de dos de los cincos aspirantes.
b) Sea A el conjunto de selecciones que contienen por lo menos un hombre. Cuantos
elementos tiene A?
c) Sea B el conjunto de selecciones que contienen exactamente un hombre. Cuantos
elementos tiene B?
d ) Escribir el conjunto que contiene dos mujeres, en terminos de A y B.
e) Hacer una lista de los elementos en A, AB, A B, y AB.
4. Una compa
na manufacturera tiene dos expendios al menudeo. Se sabe que el 30 % de
los clientes potenciales compran productos solo en la tienda I, el 50 % compra en la
tienda II, el 10 % compra en la tienda I y II, y el 10 % de los consumidores no compra
en ninguna de las dos. Sea A el evento en el que un cliente potencial, seleccionado al
azar, compra en I y B el evento el evento en el que compra en II. Calcular las siguientes
probabilidades:
a) P (A)
b) P (B)
c) P (A B)
d ) P (AB)

e) P (AB)
f ) P (A B)
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

2.2 Ejercicios Propuestos


5. De las personas que llegan a un aeropuerto peque
no, el 60 % vuela en aeroplanos privados y el 10 % vuela en aeroplanos comerciales que no pertenecen a una aerolnea. De
las personas que llegan por aerolneas principales, el 50 % viaja por negocios, mientras
que esa cifra es de 60 % para los que llegan en aeroplanos privados y de 90 % para los
que llegan en otros aviones comerciales. Para una persona que se selecciona al azar de
entre un grupo de llegadas, calcular la probabilidad de que
a) la persona este en viaje de negocios.
b) la persona este en viaje de negocios y llegue en un aeroplano privado.
c) la persona este en viaje de negocios, y se sabe que llego en un aeroplano comercial.
d ) la persona haya llegado en un aeroplano privado, dado que viaja por negocios.
6. Supongase que las calles de una ciudad se trazan en una red que va de norte a sur y de
oriente a poniente. Considerese el planteamiento siguiente para patrullar una zona de
16 por 16 manzanas. Un patrullero comienza a caminar en el cruce central de la zona.
En la esquina de cada cuadra elige al azar dirigirse al norte, al sur, al este o al oeste.
a) Cuales es la probabilidad de que alcance el lmite de su zona de patrullaje para
cuando haya caminado seis cuadras?
b) Cuales es la probabilidad de que regrese a su punto de partida despues de haber
caminado exactamente cuatro cuadras?
7. Se tienen dos eventos mutuamente excluyentes, A y B, tales que P (A) > 0 y P (B) > 0.
Son independientes A y B? Demuestre su respuesta.
8. Un armador de ventiladores electricos usa motores de dos proveedores. La compa
na
A le suministra el 90 % y la compa
na B el otro 10 % de los motores. Supongase que
se sabe que el 5 % de los motores que suministra la compa
na A son defectuosos y
que el 3 % de los que suministra la compa
na B tambien lo son. Se encuentra que un
ventilador ya armado tiene un motor defectuoso. Cual es la probabilidad de que ese
motor haya sido suministrado por la compa
na B?

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

43

44

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

Captulo 2. Probabilidad

Captulo 3
Variables Aleatorias Discretas
3.1.

Ejercicios Resueltos

EJERCICIO 1
Fernando y Nicolas juegan un partido de tenis al mejor de tres sets (esto es, el que gana dos
sets gana el partido). Suponga que la probabilidad de que Fernando gane el primer set es 0,5.
Para los siguientes sets, la probabilidad de que Fernando gane es: 0,5 + (1)Y (0,1)(k 1) ,
k = 2, 3 donde

1, si Fernando perdio el set anterior
Y =
0, si Fernando gano el set anterior
(a) Sea X: N de sets que Fernando perdio. Encuentre la funcion de distribucion de X
(esto es, la tabla).
(b) Calcule la probabilidad de que Fernando gane el partido.
(c) Suponga que la empresa ABCDE le paga a Fernando mil dolares por el encuentro,
pero por cada set que este pierde se le descuentan 100 dolares. Sea G: ganancia obtenida
por Fernando. Encuentre E(G).
Sugerencia: Puede ser u
til para este problema hacer el diagrama de arbol.

SOLUCION
Las posibles secuencia del partido se aprecian en el arbol siguiente:

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

46

Captulo 3. Variables Aleatorias Discretas

Figura 3.1: Arbol

(a) Definimos X: no set que Fernando perdio con X {0, 1, 2}. Luego las probabilidades
para todos los casos son:
P (X = 0) = P (GG) = 0,5 0,6 = 0,3
P (X = 1) = P (GP G P GG) = 0,5 0,4 0,3 + 0,5 0,4 0,7 = 0,2
P (X = 2) = 1 P (X = 0) P (X = 1) = 1 0,3 0,2 = 0,5
Luego la funcion de distribucion de x es:
X
0
1
2
P (X) 0.3 0.2 0.5
(b) P (Fernando gane el partido) = P (X = 0) + P (X = 1) = 0,3 + 0,2 = 0,5
(c) Sea H:ganancia obtenida por Fernando, por lo tanto H {800, 900, 1000}.
Luego las probabilidades para las ganancias son:
P (H = 800) = P (x = 2) = 0,5
P (H = 900) = P (x = 1) = 0,2
P (H = 1000) = P (x = 0) = 0,3
E(H) =

h P (H = h) = 800 0,5 + 900 0,2 + 1000 0,3 = 880

Rec H

EJERCICIO 2
Sea X: n
umero de neumaticos de un automovil seleccionado al azar, que tengan baja la presion.

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

3.1 Ejercicios Resueltos

47

(a) Cual de las siguientes tres funciones p(x) es una pmf legtima para x, y por que no se
permiten las otras dos?
x
0
1
2
p(x) 0.3 0.2 0.1
p(x) 0.4 0.1 0.1
p(x) 0.4 0.1 0.2

3
4
0.05 0.05
0.1 0.3
0.1 0.3

(b) Para la pmf legtima de la parte (a), calcule P (2 X 4), P (X 2) y P (X 6= 0).


(c) Si p(x) = c(5 x), para x = 0, 1, 2, 3, 4. Cual es el valor de c?.

SOLUCION

(a) Recordemos que para que una pmf sea legtima debe cumplir con que la suma de ella,
sobre todo el recorrido, resulte 1, y 0 p(x) 1. Luego observando las tres pmf propuestas, podemos observar que las tres tiene valores entre 0 y 1, pero solo la segunda
suma 1.

0,4, x=0;

0,1, x=1;

0,1, x=2;
p(x) =
0,1, x=3;

0,3, x=4;

0,0, e.o.c.
(b) P (2 X 4) = 0,1 + 0,1 + 0,3 = 0,5
P (X 2) = 0,4 + 0,1 + 0,1
P (X 6= 0) = 0,1 + 0,1 + 0,1 + 0,3 = 0,6
(c) Si p(x) es la nueva pmf, debe cumplir que la suma sobre todo su recorrido de 1.

4
X

c(5 x) = 1 c

x=0

4
X

(5 x) = 1 c(5 + 4 + 3 + 2 + 1) = 1 15c = 1 c =

x=0

1
.
15

EJERCICIO 3
Si el 90 % de todos los solicitantes para cierto tipo de hipoteca no llenan correctamente el
formato de solicitud en la primera remision, Cual es la probabilidad de que entre 15 de
estos solicitantes seleccionados al azar:
(a) Por lo menos 12 no la llenen a la primera remision?
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

48

Captulo 3. Variables Aleatorias Discretas


(b) Entre 10 y 13 inclusive no la llenen a la primera remision?
(c) A lo sumo 2 llenen correctamente sus formatos en la primera remision?

SOLUCION
(a) Sea X: n
umero de personas que rellenan erroneamente la solicitud. Luego
X Bin(15, 0,9)

x = 0, 1, 2, ...

Por lo tanto lo que nos piden es:


P (X 12) = P (X = 12) + P (X = 13) + P (X = 14) + P (X = 15)
=

15  
X
15
x=12

0,9x (1 0,9)15x = 0,9444

(b)
P (10 X 13) = P (X = 10) + P (X = 11) + P (X = 12) + P (X = 13)
13  
X
15
=
0,9x (1 0,9)15x = 0,4488
x
x=10
(c) Sea Y: n
umero de personas que llenan correctamente sus formatos. Luego
Y Bin(15, 0,1)

y = 0, 1, 2, ...

Por lo tanto lo que nos piden es:


P (Y 2) = P (Y = 0) + P (Y = 1) + P (Y = 2) =

2  
X
15
y=0

0,1y (1 0,1)15y = 0,8159

EJERCICIO 4
El voltaje de una batera nueva puede ser aceptable (A) o no aceptable (B). Cierta linterna de
mano necesita dos bateras, as que estas han de seleccionarse y probarse independientemente
hasta encontrar dos aceptables. Supongamos que el 80 % de todas las bateras tienen voltaje
aceptable y denotemos por Y el n
umero de bateras que deben ser probadas.
(a) Cuanto vale p(2), es decir, P (Y = 2)?
(b) Cuanto vale p(3) ?
(c) Para tener Y=5. Que debe ser cierto de la quinta batera seleccionada?. (Hint: Haga
una lista de los casos favorables de Y=5 y luego determine p(5)).
(d) Utilice el lector del modelo de sus respuestas para las partes (a) a la (c) para obtener
una formula general para p(y).
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

3.1 Ejercicios Resueltos

49

SOLUCION
Considerando que una batera es aceptable con probabilidad 0.8 y por ende no aceptable con
probabilidad 0.2:
(a)
P (Y = 2) = P (A A) = 0,8 0,8 = 0,64
(b) En este caso hay dos formas de obtener Y=3:
P (Y = 3) = P (A B A) + P (B A A) = 0,8 0,2 0,8 + 0,2 0,8 0,8 = 0,256
(c) Como se revisa hasta encontrar 2 buenas en voltaje, entonces la quinta obligadamente
debe ser Aceptable (A). La lista de los posibles resultados son:
ABBBA
BABBA
BBABA
BBBAA
Luego calculamos lo pedido:
P (Y = 5) = 0,82 0,23 4 = 0,204
(d) Si observamos la relacion que tienen (a), (b) y (c), podemos rescatar que
P (Y = y) = (y 1)0,82 0,2y2 , y 2

P (Y = y) =


y1
0,82 0,2y2 , y 2
21

Y la forma que tiene esta pmf, corresponde a la conocida Binomial Negativa.


Y BN (r, p)
donde r corresponde a los exitos que se quieren obtener, en este caso 2 y p es la
probabilidad del exito, en este caso 0.8.
EJERCICIO 5
Un director tecnico de tenis tiene una canasta de 25 pelotas; 15 de estas son pelotas Penn y
las otras 10 son Wilson. Cada uno de cuatro jugadores seleccionan 3 pelotas para un juego.
(a) Cual es la probabilidad de que exactamente 8 de las pelotas seleccionadas sean Penn?
(b) Cual es la probabilidad de que todas las pelotas seleccionadas sean Wilson?
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

50

Captulo 3. Variables Aleatorias Discretas

SOLUCION
Resumiendo los datos entregados, tenemos lo siguiente:
N:25 pelotas
P:15 Penn
W:10 Wilson
n:12 tama
no muestra
Sea X: n
umero de pelotas de las que me sirven, en la muestra sin reposicion, en este caso
pelotas Penn. Luego
 N P 
P
X Hiper(15, 10, 12) P (X = x) =

nx

N
n

(a)
P (X = 8) =

15
8

10
4

25
12


= 0,2599

(b)
P (X = 0) =

15
0

10
12

25
12


=0


Pues 10
no esta definido, es decir no existe, ya que es ilogico sacar mas pelotas de un
12
tipo de las que tengo, luego es un evento imposible.
EJERCICIO 6
Un artculo de Los Angeles Times (3 de Dic. de 1993) reporta que de cada 200 personas,
una lleva el gene defectuoso que ocasiona cancer de colon hereditario. En una muestra de
1000 personas Cual es la distribucion aproximada del n
umero de quienes llevan este gene?.
Utilice esta distribucion para calcular la probabilidad aproximada de que:
(a) Entre 4 y 7 inclusive, personas lleven el gene.
(b) Por lo menos 8 lleven el gene.

SOLUCION
Por las caractersticas del problema, con X= n
umero de personas con el gene.
X P oisson(5)
(a)
P (4 X 7) = P (X = 4) + P (X = 5) + P (X = 6) + P (X = 7)
=

54 e5 55 e5 56 e5 57 e5
+
+
+
= 0,602
4!
5!
6!
7!

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

3.1 Ejercicios Resueltos

51

(b)
P (X 8) =

X
5x e5
x=8

=1

7
X
5x e5
x=0

x!

x!

= 0,133

EJERCICIO 7
Una compa
na telefonica emplea cinco operadoras de informacion que reciben solicitudes de
informacion independientemente una de otra, cada una seg
un un proceso de Poisson con tasa
= 2 minuto.
(a) Cual es la probabilidad de que durante un periodo dado de un minuto, la primera
operadora no reciba solicitudes?
(b) Cual es la probabilidad de que durante un periodo dado de un minuto, exactamente
4 de las 5 operadoras no reciban solicitudes?
(c) Escriba una expresion para la probabilidad de que durante un periodo dado de un
minuto, todas las operadoras reciban exactamente el mismo n
umero de solicitudes.

SOLUCION
Es importante tener presente que las operadoras atienden solicitudes independientemente
una de otra. Luego
Sea X: n
umero de llamadas en un minuto de la operadora x. Por lo tanto
X P oisson(2)
P (X = 0) =

e2 20
= e2 = 0,1353
0!

(b) En este caso tenemos un experimento incluido en el otro, ya que cuando contamos el
n
umero de operadoras que cumplen con algo de entre un total, estamos hablando de
un experimento Binomial, en el cual, la probabilidad del exito esta modelada por la
distribucion Poisson. Luego
Y: n
umero de operadoras que reciben cero llamadas entre las 5
Y Bin(5, P (X = 0)), recuerde que X P oisson(2)
 
5
P (Y = 4) =
0,13534 (1 0,1353)54 = 0,001451
4
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

52

Captulo 3. Variables Aleatorias Discretas


(c) Como las operadoras son independientes una de las otras y las 5 tienen exactamente la
misma distribucion, basta considerar la de una operadora y potenciarla a las 5. Luego
la expresion para tal calculo sera:

[P (X = x)]5

x=0

EJERCICIO 8
Para promocionar sus helados de paleta, una fabrica pone cada 15 helados una etiqueta que
dice vale otro. Cualquiera persona que compre un helado y le salga vale otro obtiene
un helado gratis. Estos helados cuestan 100 pesos cada uno. Si Ud. decide comprar estos
helados hasta obtener uno gratis cuanto esperara gastar?

SOLUCION
Sea X: no helados comprados hasta obtener el primero gratis.
De lo anterior de deduce que la variable X tiene distribucion geometrica
X Geometrica(p)

p = P (Salga gratis) =

1
15

Sea G = 100X, luego la que uno esperara gastar sera la E(G).


1
E(G) = 100E(X) = 100 = 100 15 = 1500
p
lo que se esperara gastar si se compran helados hasta obtener uno gratis seran $1500.
EJERCICIO 9
Un examen consta de n preguntas con k alternativas cada una. Suponga que cierto alumno
responde cada pregunta de acuerdo al siguiente procedimiento: si conoce la alternativa correcta, entonces la escoge con probabilidad 1; si no la sabe, entonces escoge una alternativa
al azar. Suponga que la probabilidad de que el alumno conozca la alternativa correcta es p
(0 < p < 1), igual para todas las preguntas y que las distintas preguntas se responden en
forma independiente.
(a) Sea X el n
umero de preguntas respondidas correctamente. Encuentre la funcion de
probabilidad o cuanta de X.
(b) Si una de estas preguntas fue respondida correctamente, cual es la probabilidad de
que el alumno haya sabido la alternativa correcta?

SOLUCION

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

3.1 Ejercicios Resueltos

53

(a) Sean los eventos:


S: Saber la respuesta.
C: respuesta correcta.
Entonces, por probabilidad total.

P (C) = P (C|S)P (S) + P (C|S 0 )P (S 0 )

=1p+

=p+

1
(1 p)
k

(1 p)
k

como las respuestas a cada pre4gunta son independientes y p = P (C), la probabilidad


de responder correctamente una pregunta, es constante para cada pregunta, se tiene
que:
X Bin(n, p)
con p = p +

1p
.
k

Luego
 
n
p(x) = P (X = x) =
(p)x (1 p)nx ,
x

x = 0, 1, 2, 3, . . . , n.

(b)
Bayes

P (S|C) =

P (C|S)P (S)
P (C)
1p

p+

(1p)
k

kp
(k + 1)p + 1

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

54

Captulo 3. Variables Aleatorias Discretas

3.2.

Ejercicios Propuestos

1. Suponga que cada una de las llamadas que hace una persona a una estacion de radio
muy popular tiene una probabilidad de 0.02 de que la lnea no este ocupada. Suponga
que las llamadas son independientes.
a) Cual es la probabilidad de que la primera llamada que entre sea la decima que
realiza la persona?
b) Cual es la probabilidad de que sea necesario llamar mas de cinco veces para
hallar desocupada la lnea?
c) Cual es le n
umero promedio de llamadas que deben hacerse para hallar desocupada la lnea?
2. Un negocio de computadores que atiende pedidos por correo tiene seis lneas telefonicas.
Simbolicemos con correo X el n
umero de lneas con uso en un momento especfico.
Supongamos que la pmf de X estas dada en la tabla siguiente.
x
0
1
2
3
4
5
6
p(x) 0.1 0.15 0.20 0.25 0.20 0.06 0.04
Calcule la probabilidad de cada uno de los siguientes eventos:
a) A lo sumo 3 lneas estan en uso
b) Menos de 3 lneas estan en uso
c) Por lo menos 3 lneas estan en uso
d ) Entre 2 y 5 lneas estan en uso
e) Entre 2 y 4 lneas no estan en uso
f ) Por lo menos 4 lneas no estan en uso
3. Una compa
na de seguros ofrece a sus tenedores de polizas varias opciones diferentes
para el pago de primas. Para un tenedor seleccionado al azar, sea X=n
umero de meses
entre pagos sucesivos. La cdf de X es como sigue:

0,30

0,40
F (x) =
0,45

0,60

si
si
si
si
si
si

x<1
1x<3
3x<4
4x<6
6 x < 12
12 x

a) Cual es la pmf de X?
b) Solo con el uso de la cdf, calcule P (3 X 6) y P (4 X)
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

3.2 Ejercicios Propuestos

55

4. La pmf para X=n


umero de defectos importantes que tiene un electrodomestico de un
cierto tipo, seleccionado al azar, es
x
0
1
2
3
4
p(x) 0.08 0.15 0.45 0.27 0.05
Calcule lo siguiente:
a) E(X).
b) V (X) directamente de la definicion.
c) La desviacion estandar de X.
d ) V (X) usando la formula abreviada.
5. Un distribuidor de aparatos electrodomesticos vende tres modelos diferentes de congeladores verticales con capacidad de 13.5, 15.9 y 19.1 pies c
ubicos de espacio de almacenaje. Sea X=cantidad de espacio de almacenaje de un congelador comprado por el
siguiente cliente. Supongamos que X tiene pmf
x
13.5 15.9 19.1
p(x) 0.2 0.5 0.3
a) Calcule E(X), E(X 2 ) y V (X).
b) Si el precio de un congelador con capacidad de X pies c
ubicos es 25X 8,5, cual
es el precio esperado por el cliente que va a comprar un congelador?
c) Cual es la varianza del precio 25X 8,5 pagado por el cliente?
d ) Supongamos que mientras la capacidad nominal de un congelador es X, la capacidad real es h(X) = X 0,01X 2 . Cual es la capacidad real esperada del
congelador comprado por el siguiente cliente?
6. Un equipo tiene 5 componentes, de las cuales 2 son defectuosas. Se inspeccionan las
componentes en un orden aleatorio.
a) Si X es el n
umero de componentes que deben examinarse antes de encontrar una
defectuosa calcule E(X).
b) Si Y es el n
umero de componentes que deben examinarse para encontrar las dos
defectuosas, calcule E(Y ).
7. Sea X una variable aleatoria que sigue una de las siguientes distribuciones.
a) Binomial(n, p).
b) Poisson().
c) Geometrica con parametro p.
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

56

Captulo 3. Variables Aleatorias Discretas


Para cada distribucion calcule:
a) E(X).
b) E(X(X 1)).
c) E(X 2 ).
d ) V ar(X).
8. Una variable aleatoria puede tomar cada uno de los siete valores 3, 2, 1, 0, 1, 2, 3
con la misma probabilidad. Determinar fY (y) donde Y = X 2 X.
9. Para cada uno de los siguientes, establezca si es razonable o no, utilizar la distribucion
binomial como modelo de variable aleatoria y por que. Indique todas las suposiciones
que tenga que hacer, seg
un sea el caso.
a) Un proceso produce miles de transductores de temperatura. Sea X el n
umero de
transductores que no cumplen con los requisitos de dise
no de una muestra de 30
tomada al azar del proceso.
b) De un lote de 50 transductores de temperatura, se toma una muestra de 30 sin
reemplazo. Sea X el n
umero de transductores de la muestra que no cumplen con
los requisitos de dise
no.
c) Cuatro componentes electronicos identicos estan conectados a un controlador que
puede conmutar de un componente que falla a otro de los que quedan como
repuesto. Sea X el n
umero de componentes que han fallado despues de cierto
tiempo de operacion.
d ) Sea X el n
umero de accidentes que ocurren en las carreteras federales de cierto
estado durante un mes.
e) Sea X el n
umero de respuestas correctas de un estudiante que resolvio un examen
de opcion m
ultiple, en las que pudo eliminar, en algunas preguntas, varias de las
opciones porque eran incorrectas, y en otras, todas las opciones incorrectas.
f ) Los defectos sobre la superficie de un chip semiconductor aparecen al azar. Sin
embargo, solo el 80 % de los defectos pueden detectarse mediante pruebas. Se
toma una muestra de 40 chips que tienen un defecto y se someten a prueba. Sea
X el n
umero de chips en los que la prueba encuentra un defecto.
g) Considere de nuevo la situacion presentada en f). Suponga ahora que la muestra
de 40 chips esta formada por chips que tienen uno o cero defectos.
h) En una operacion de llenado se intenta llenar paquetes de detergentes, de modo
que tengan el peso se
nalado en publicidad. Sea X el n
umero de paquetes de
detergente que pesan menos que lo indicado en la publicidad.
i ) Los errores en un canal de comunicacion digital se presentan en rachas que afectan
de manera severa a varios bits consecutivos. Sea X el n
umero de bits transmitidos
erroneamente en el envo de 100000 bits.

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

3.2 Ejercicios Propuestos


j ) Sea X el n
umero de grietas superficiales de una bobina grande de acero galvanizado.
10. Este ejercicio ilustra el impacto que la baja calidad puede tener sobre planes y costos.
Un proceso de fabricacion tiene 100 pedidos en espera de ser surtidos. Cada pedido
necesita un componente que se compra a otro proveedor. Sin embargo, lo com
un es
identificar 2 % de estos componentes como defectuosos; por otra parte, puede suponerse que el estado de cada componente es independiente del de los demas.
a) Si el inventario del fabricante es de 100 componentes, Cual es la probabilidad de
que se puedan surtir los 100 pedidos sin tener que pedir mas componentes?
b) Si el inventario del fabricante es de 102 componentes, Cual es la probabilidad de
que se puedan surtir los 100 pedidos sin tener que pedir mas componentes?
c) Si el inventario del fabricante es de 105 componentes, Cual es la probabilidad de
que se puedan surtir los 100 pedidos sin tener que pedir mas componentes?
11. Las tarjetas de circuito impreso se envan a una prueba de funcionamiento despues de
haber montado en ellas todos los chips. Un lote contiene 140 tarjetas y se toman 20
sin reemplazo para hacerles la prueba de funcionamiento.
a) Si 20 tarjetas estan defectuosas, Cual es la probabilidad de que al menos una de
ellas se encuentre en la muestra?
b) Si 5 tarjetas estan defectuosas, Cual es la probabilidad de que al menos una de
ellas aparezca en la muestra?
12. Los empleados de una empresa que fabrica aisladores son examinados para detectar
la presencia de asbesto en sus pulmones. La empresa debe enviar tres empleados con
pruebas positivas de asbesto a un centro medico para realizarles mas examenes. Si el
40 % de los empleados tienen pruebas positivas de asbesto en sus pulmones;
a) Cual es la probabilidad de que se tengan que examinar k empleados hasta encontrar tres con asbesto en sus pulmones ?
b) Si cada prueba cuesta $20.000, cual es el costo total esperado de las pruebas
necesarias hasta encontrar 3 empleados con examen positivo ?

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

57

58

Captulo 3. Variables Aleatorias Discretas

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

Captulo 4
Variables Aleatorias Continuas
4.1.

Ejercicios Resueltos

EJERCICIO 1
La dureza Rockwell de un metal se determina al golpear con un punto acerado (herramienta)la superficie del metal y despues medir la profundidad de penetracion del punto. Suponga
que la dureza Rockwell de cierta aleacion esta normalmente distribuida con media de 70 y
desviacion estandar de 3.
(a) Si un especimen es aceptable solo si su dureza esta entre 67 y 75, Cual es la probabilidad de que un especimen seleccionado al azar tenga una dureza aceptable?
(b) Si la escala aceptable de dureza es (70 c, 70 + c), para que calor de c tendra una
dureza aceptable, 95 % de todos los especmenes?
(c) Si la escala aceptable es como el inciso (a) y la dureza de cada diez especmenes
seleccionados al azar se determina independientemente, cual es el n
umero esperado
de especmenes aceptables entre los diez?
(d) Cual es la probabilidad de que a lo sumo ocho de diez especmenes seleccionados
independientemente, tengan una dureza menor a 73.84?

SOLUCION
Sea X: Dureza Rockwell, donde
X N(0, 1)
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

60

Captulo 4. Variables Aleatorias Continuas


(a)

P (67 X 75) = P

67 70
75 70
Z
3
3

 
5
(1)
=
3
= (1,666) (1)
= 0,9522 0,158
= 0,7935
(b)
P (70 c X 70 + c) = 0,95
P (X 70 + c) P (X < 70 c) = 0,95

P

70 + c 70
Z
3


P

70 c 70
Z<
3

c
3

c
3


= 0,95


= 0,95

c

h
 c i
1
= 0,95
3
3
2

c
3

1 = 0,95

c
3
c
3

= 1,95

1,95
= 0,975
2

c
= 1,96
3

c = 1,96 3 = 5,88
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

4.1 Ejercicios Resueltos

61

(c) Sea Y: no de especmenes con dureza aceptable de entre 10, siendo para este caso su
distribucion como sigue:
Y Bin(10, 0,7935)
Luego nos piden
E(Y ) = n p = 10 0,7935 = 7,9
(d)

P (X < 73,84) = P

73,84 70
Z<
3


=

3,84
3


= 0,8997

Luego
Y Bin(10, 0,8997)
8  
X
10
P (Y 8) =
0,8997i (1 0,8997)10i = 0,265
i
i=0
EJERCICIO 2
La resistencia a la compresion de una serie de muestras de cemento puede modelarse con una
distribucion normal con media 6000 Kg/cm2 y una desviacion estandar de 100 Kg/cm2 .
(a) Cual es la probabilidad de que la resistencia de una muestra sea menor que 6250
Kg/cm2 ?
(b) Cual es la probabilidad de que la resistencia de una muestra se encuentre entre 5800
y 5900 Kg/cm2 ?
(c) Cual es el valor de resistencia que excede el 95 % de las muestras?

SOLUCION
Sea X: Resistencia a la compresion. Luego
X N(6000, 1002 )
(a)

P (X < 6250) = P

6250 6000
Z<
100


=

250
100


= 0,9938

(b)


5800 6000
5900 6000
Z
100
100

5900 6000
100

P (5800 < X < 5900) = P

5800 6000
100

= (1) (2) = 0,1359


Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

62

Captulo 4. Variables Aleatorias Continuas


(c)
P (X < x) = 0,95

P

X 6000
x 6000
<
100
100

X 6000
100

X 6000
100

= 0,95

= 0,95

= 1,64

X = 164 + 6000 = 6164


Luego x > 6164 la probabilidad excedera el 95 %.
EJERCICIO 3
La funcion de densidad de probabilidad del tiempo necesario para terminar una operacion
de ensamblado es:

0,1, 30 < x < 40
fX (x) =
0,
e.o.c.
(a) Calcule la proporcion de ensambles que requieren mas de 35 segundos para concluir la
operacion.
(b) Que tiempo de armado es el que excede el 90 % de los ensambles?
(c) Cual es el tiempo esperado de ensamblado y que tan variante es?

SOLUCION
(a)
40

Z
P (X > 35) =

40

0,1dx = 0,1 40 0,1 35 = 0,5

f (x)dx =
35

35

(b)
Z
P (X < x) =

P (X < x) = 0,9
Z x
x
f (x)dx =
0,1dx = 0,1 x 0,1 30 = 0,9

30

30

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

4.1 Ejercicios Resueltos

63
0,1 x 0,1 30 = 0,9
0,1 x = 3,9
3,9
x=
0,1
x = 39

Luego el tipo de armado que excede al 90 % de los ensambles es el que se demora mas
de 39 segundos en este.
(c) Lo que nos piden es la Esperanza y varianza de la variable tiempo de ensamble.
Entonces calculemos
Z 40
Z
xf (x)dx =
E(X) =
30

40

30

0,1x2 40 0,1 402 0,12


0,1xdx =

= 35
=
2 30
2
2

el tiempo medio o esperado de ensamble es 35 segundos.


Ahora calculemos su variabilidad con la V ar(X),
Por definicion tenemos
V ar(X) = E(X 2 ) E 2 (X)
tenemos que calcular E(X 2 ).
Z
Z 40
2
2
x f (x)dx =
E(X ) ==
30

40

30

0,1x3 40 0,1 403 0,13


0,1x dx =

= 1233,33
=
3 30
3
3
2

V ar(X) = 1233,33 352


Desv. Standar = 2,88

es decir, 2.88 segundos es el tiempo en promedio que encuentran del valor esperado (35
segundos) los tiempos de ensamble.
EJERCICIO 4
El tiempo X (minutos) para que un asistente de laboratorio prepare el equipo para un
experimento tiene una distribucion Uniforme(25,35).
(a) Escriba la pdf de X y trace su grafica.
(b) Cual es la probabilidad de que el tiempo de preparacion exceda de 33 min.?
(c) Cual es la probabilidad de que el tiempo de preparacion se encuentre a una distancia
a lo mas de 2 min. del tiempo esperado?
(d) Para cualquier a tal que 25 < a < a+2 < 35, Cual es la probabilidad de que el tiempo
de preparacion este entre a y a + 2 minutos?
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

64

Captulo 4. Variables Aleatorias Continuas

SOLUCION
X: tiempo para preparar equipo;
X U (25, 35)
(a)
f (X) =

1
,
3525

25 < X < 35

0,

e.o.c.

Figura 4.1: Grafica de la pdf de X

(b)
Z

35

35

0,1dx = 0,1 35 0,1 33 = 0,2

f (x)dx =

P (X > 33) =
33

33

(c) Se necesita el tiempo esperado.


Z

35

E(X) =

35

xf (x)dx =
25

25

0,1x2 35 0,1 352 0,1 252


0,1xdx =

= 30
=
2 25
2
2

Como sabemos que el tiempo esperado es de 30, la probabilidad que se pide es la


siguiente:
Z 32
Z 32
P (28 < X < 32) =
f (x)dx =
0,1dx = 0,1 32 0,1 28 = 0,4
28

28

(d) La condicion de que 25 < a < a + 2 < 35, es para poder utilizar la f (x) de la Uniforme
sin salirnos del rango.

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

4.1 Ejercicios Resueltos

65

Entonces tenemos lo siguiente


Z
Z a+2
f (x)dx =
P (a < X < a + 2) =

a+2

0,1dx = 0,1 (a + 2) 0,1 a = 0,1 2 = 0,2

EJERCICIO 5
Sea X la distancia en metros que un animal se mueve desde su lugar de nacimiento hasta el
primer territorio vacante que encuentra. Suponga que para las ratas canguro, X tiene una
distribucion exponencial con parametro = 0,01386 (como lo sugiere el artculo Competition and Dispersal from Multiples Nest, Ecology, 1997, pp. 873-883).
(a) Cual es la probabilidad de que la distancia sea a lo sumo 100 metros?, Entre 100 y
200 metros?
(b) Cual es la probabilidad de que la distancia sea mayor que la distancia promedio en
mas de 2 desviaciones estandar?
(c) Cual es el valor de la mediana de la distancia?

SOLUCION
Tenemos que X exp() con = 0,01386. De esto de puede obtener:
FX (x) = P (X x) = 1 ex
y por ende
P (X > x) = ex
ademas tenemos que
E(X) = X =

2
Var(X) = X
=

1
2

(a) Que la probabilidad sea a lo sumo 100 metros es


P (X 100) = 1 e100 = 1 e0,01386100 = 0,4799
y que este entre 100 y 200 metros es
P (100 < X < 200) = P (X < 200) P (X < 100)
= 1 e200 1 e200
= e100 e200
= 0,1875
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

66

Captulo 4. Variables Aleatorias Continuas


(b) La probabilidad pedida se puede escribir como
P (X > E(X) + 2X ) = P (X > 3X )

=P

3
X>
0,01386

= P (X > 216,450)
= e216,450
= 0,049 0,05
(c) Se pide la mediana, sabemos que esta se encuentra en el percentil 50.
Luego se tiene que
Z

mediana

fX (x)dx = 0,5 FX (mediana) = 0,5


0

Al reemplazar por la funcion de distribucion acumulada de la exponencial se logra la


siguiente igualdad
1 emediana = 0,5

1 0,5 = emediana

ln(0,5) = mediana

ln(0,5)
0,01386

= mediana

50,01 = mediana

EJERCICIO 6
La presion del aire de un neumatico seleccionado al azar, instalado en un automovil nuevo,
esta normalmente distribuida con valor medio de 31 lb/pulg2 y desviacion estandar de 0.2
lb/pulg2 .
(a) Cual es la probabilidad de que la presion de un neumatico, seleccionado al azar, exceda
de 30.5 lb/pulg2 ?
(b) Cual es la probabilidad de que la presion de un neumatico, seleccionado al azar, se
encuentre entre 30.5 y 31.5 lb/pulg2 ?
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

4.1 Ejercicios Resueltos

67

(c) Suponga que un neumatico se considera con presion baja si esta debajo de 30.4 lb/pulg2 .
Cual es la probabilidad de que al menos uno de los cuatro neumaticos de un automovil
se encuentre con presion baja?

SOLUCION
Sea X la presion de aire, luego tenemos que
X N (31, 0,22 )

(a) P (X > 30,5) = P (Z >

30,531
)
0,2

= P (Z > 2,5) = P (Z < 2,5) = 0,9938

(b)
P (30,5 < X < 31,5) = P (X < 31,5) P (X < 30,5)

=P

31,5 31
Z<
0,2


P

30,5 31
Z<
0,2

= P (Z < 2,5) P (Z < 2,5)


= 0,9938 (1 0,9938)
= 0,9876

(c) Sea Y : no de neumaticos con presion baja. Se puede deducir que Y Bin(4, p), donde
p = P (X < 30,4).
Luego calculando tenemos que

p = P (X < 30,4) = P

30,4 31
Z<
0,2


= P (Z < 3) = 0,0013

Y Bin(4, 0,0013)

Se pide
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

68

Captulo 4. Variables Aleatorias Continuas

P (Y 1) = 1 P (Y < 1)
= 1 [P (Y = 0)]
 
4 0
=1
p (1 p)4
0
= 1 [1 0,0013]4
= 0,005189
EJERCICIO 7
Suponga que el n
umero de horas X que funcionara una maquina antes de fallar es una variable aleatoria con distribucion Normal de parametros = 720 y 2 = 482 .
Suponga que en el momento en que la maquina comienza a funcionar Ud. debe decidir
cuando el inspector regresara a revisarla. Si el vuelve antes de que la maquina falle, se
ocasiona un costo de a dolares por haber desperdiciado una inspeccion. Si vuelve despues de
que la maquina haya fallado, se ocasiona un costo de b dolares por el no funcionamiento de
la maquina.
(a) Determine una expresion para el costo esperado, considerando que el tiempo hasta que
el inspector vuelve a inspeccionar la maquina es de t horas.
(b) Suponga que el inspector decide volver en un tiempo de t = 816hrs. Calcule la probabilidad de que el inspector llegue tarde a la inspeccion, es decir, la maquina ya ha
dejado de funcionar.
(c) Se observa este proceso durante 15 perodos. Determine de que el inspector llegue tarde
mas de 12 veces.

SOLUCION
Sea X : Tiempo de funcionamiento de una maquina hasta que falle.
X N (720, 482 )
(a) Tenemos que
Costo =

a X>t

b X<t

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

4.1 Ejercicios Resueltos

69

luego el costo esperado es


E(Costo) = aP (X > t) + bP (X < t)
= a aP (X < t) + bP (X < t)
= a + P (X < t){b a}

= a + (b a)FZ

t 720
48

(b)


X 720
816 720
<
48
48

96
Z<
48

P (X < 816) = P

=P

= P (Z < 2)
= 0,9772499
(c) Sea X : N
umero de veces que el inspector llega tarde.
X Bin(15, 0,9772499)
entonces
P (X > 12) =

15  
X
15
x=13

(0,9772499)x (1 0,9772499)15x

= 0,9956363

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

70

Captulo 4. Variables Aleatorias Continuas

4.2.

Ejercicios Propuestos

1. Si Y U [0, 5] Cual es la probabilidad de que las races de la ecuacion


4x2 + 4xY + Y + 2 = 0
sean ambas reales?
2. Las calificaciones X de un examen del curso EYP* siguen una distribucion normal de
media 4.2 y desviacion estandar 0.6. El profesor sospecha que el examen fue difcil. De
acuerdo a lo anterior ajusta las calificaciones en la forma Y = aX + b, a > 0,
a) Que valores deben asignarse a las constantes a y b de manera que las nuevas
calificaciones tengan un promedio de 5.3 y una desviacion estandar de 0.3?
b) Encuentre c [0; 7] para que, con probabilidad igual a 0.9, las calificaciones
ajustadas superen a c.
3. El tiempo que transcurre entre las llamadas a una empresa de artculos para plomera tiene una distribucion exponencial con un tiempo promedio entre llamadas de 15
minutos.
(a) Cual es la probabilidad de que no haya llamadas en un lapso de 30 minutos?
(b) Cual es la probabilidad de recibir al menos una llamada en un intervalo de 10
minutos?
(c) Cual es la probabilidad de recibir la primera llamada en un intervalo entre 5 y
10 minutos despues de haber abierto la empresa?
(d) Calcule la dimension de un intervalo de tiempo, de modo tal que la probabilidad
de recibir al menos una llamada en ese lapso sea 0.9.
4. La funcion de densidad de probabilidad del tiempo de falla (en horas) de un componente
x/1000
electronico de una copiadora es fX (x) = e 1000 para x > 0. Calcule la probabilidad
de que:
a) El componente tarde mas de 3000 horas en fallar.
b) El componente falle en el lapso comprendido entre 1000 y 2000 horas.
c) El componente falle antes de 1000 horas.
d ) Calcule el n
umero de horas en las que fallaran el 10 % de todos los componentes.
5. El peso regular de apoyo de una pastilla de estereo, que actualmente esta puesta a 3
gr. en un tocadiscos, puede considerarse como una v.a. X continua con pdf:

k[1 (x 3)2 ], 2 x 4;
f (x) =
0,
e.o.c.
a) Dibuje la grafica de f (x).
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

4.2 Ejercicios Propuestos

71

b) Encuentre el valor k.
c) Cual es la probabilidad de que el peso de apoyo sea mayor que el peso especificado?
d ) Cual es la probabilidad de que el peso difiera del peso especificado en mas de .5
gr.?
6. El artculo The Prediction of Corrosion by Statistical Analysis of Corrosion Profiles
sugiere la siguiente cdf, para la profundidad X de la picadura mas profunda en un
experimento donde interviene la exposicion de acero al manganeso carbono a agua de
mar acidulada:
(x)/

F (x; , ) = ee

< x <

Los autores proponen los valores = 150, = 90. Suponga que este es el modelo
correcto.
a) Cual es la probabilidad de que la profundidad de la picadura mas profunda sea
a lo sumo 150? A lo sumo 300? Entre 150 y 300?
b) Cual es la funcion de densidad de X?
c) Se puede demostrar que E(X) ,5772 + . Cual es la media para los valores
dados y , y como se compara con la mediana?
7. El tiempo en minutos en ir de un hotel al aeropuerto por la ruta A se distribuye
N (27, 25). Mientras que por la ruta B se distribuye N (30, 4).Que ruta conviene utilizar
si se dispone de:
a) 30 minutos?
b) 34 minutos?
8. Si X tiene una distribucion exponencial con parametro , derive una expresion general
para el (100p) avo percentil de la distribucion. Luego especifique como obtener la
mediana.

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

72

Captulo 4. Variables Aleatorias Continuas

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

Captulo 5
Sensibilidad y Especificidad
5.1.

Ejercicios Resueltos

EJERCICIO 1
En una investigacion sobre el factor de crecimiento de carcinoma mamario (FCCM), el estudio piloto revelo que estaba elevado en los pacientes con carcinomas de mama confirmados.
Se hizo un estudio clnico que incluyo a 1600 pacientes donde por biopsia se determino carcinoma en 600 y 1000 estaban sanos. Se considero como positivo al FCCM un resultado mayor
o igual a 150 unidades por litro. La tabla obtenida fue la siguiente:
Con carcinoma de mama
FCCM (+)
570
FCCM (-)
30
Total
600

Sin carcinoma de mama Total


150
720
850
880
1000
1600

(a) Explique e identifique para este ejemplo:


i. Verdaderos Positivos.
ii. Falsos Positivos.
iii. Verdaderos Negativos.
iv. Falsos Negativos.
(b) Que es la Prevalencia? Calc
ulela.
(c) Cual es la probabilidad de que un sujeto enfermo sea clasificado como positivo?, cual
es el nombre tecnico de esta probabilidad y como podra aumentarla?
(d) Cual es la probabilidad de que un sujeto sano sea clasificado como negativo?, cual
es el nombre tecnico de esta probabilidad y como podra aumentarla?
(e) Cual es la probabilidad de que el individuo tenga carcinoma de mama si la prueba
FCCM es positivo?, cual es la probabilidad de que no la padezca si la prueba FCCM
es negativa?, tecnicamente que se esta pidiendo?
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

74

Captulo 5. Sensibilidad y Especificidad

SOLUCION

(a) Identificacion en la tabla

Con carcinoma de mama


FCCM (+)
570 (VP)
30 (FN)
FCCM (-)
Total
600

Sin carcinoma de mama Total


150 (FP)
720
850 (VN)
880
1000
1600

i. Verdaderos Positivos (V P ): Son los individuos que realmente tienen la enfermedad


(con carcinoma de mama) y su test salio positivo (FCCM (+)).
ii. Falsos Positivos (F P ): Son los individuos que realmente no tienen la enfermedad
(sin carcinoma de mama) y su test salio positivo (FCCM (+)).
iii. Verdaderos Negativos (V N ): Son los individuos que realmente no tienen la enfermedad (sin carcinoma de mama) y su test salio negativo (FCCM (-)).
iv. Falsos Negativos (F N ): Son los individuos que realmente tienen la enfermedad
(con carcinoma de mama) y su test salio negativo (FCCM (-)).
(b) La prevalencia es la proporcion de individuos que estan realmenete enfermos (Prevalencia Real) con respecto al total.
P revalencia =

VP
570
# de realmente enf ermos
=
=
= 0,35625
# total de individuos
T otal
1600

(c) La probabilidad pedida se llama Sensibilidad (Sp ).


Sp =

570
570
VP
=
=
= 0,95
V P + FN
570 + 30
600

La Probabilidad de que un individuo obtenga positivo en el test (FCCM(+)), dado


que esta realmente enfermo es de 95 %.
La manera de poder aumentar la Sp es disminuyendo los Falsos Negativos (FN).
(d) La probabilidad pedida se llama Especificidad (Ep ).
Ep =

VN
850
850
=
=
= 0,85
V N + FP
850 + 150
1000

La Probabilidad de que un individuo obtenga negativo en el test (FCCM(-)), dado


que esta realmente no esta enfermo es de 85 %.
La manera de poder aumentar la Ep es disminuyendo los Falsos Positivos (FP).
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

5.1 Ejercicios Resueltos

75

(e) Lo que estan pidiendo tecnicamente es el valor predictivo positivo y negativo.

V PP =

V PN =

570
570
VP
=
=
= 0,79167
V P + FP
570 + 150
720
850
850
VN
=
=
= 0,9659
V N + FN
850 + 30
880

La Probabilidad de que un individuo este enfermo (con carcinoma de mama) dado


que el test salio positivo (FCCM(+)) es de 79 % y la probabilidad de que el individuo
no tenga carcinoma de mama dado que el test salio negativo (FCCM(-)) es de 96.6 %.
EJERCICIO 2
La mastitis es una enfermedad que afecta a las vacas que estan produciendo leche. Para un
productor de leche es muy importante detectar una enfermedad tempranamente. Un grupo
de investigadores desarrollo un examen para este efecto con una confiabilidad del 90 %, es
decir, de 100 vacas con la enfermedad el examen detecta 90 vacas enfermas. De las vacas
libres de mastitis un 99 % de los examenes se consideran libres de la enfermedad y un 1 % se
diagnostican como mostrando mastitis, se seleccionan al azar una y se le somete al examen
que arroja como resultado que s posee la enfermedad. Cual es la probabilidad que la vaca
tenga realmente mastitis?

SOLUCION
Sean
E : Vaca enferma
S : vaca sin enfermedad
+ : Examen positivo
: Examen negativo
donde las probabilidades son:
P (E) = 0,001
P (S) = 0,999
P (+|E) = 0,9
P (|S) = 0,01
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

76

Captulo 5. Sensibilidad y Especificidad


lo que se pide es lo siguiente:
P (E|+) =

P (+|E)P (E)
P (+|S)P (S) + P (+|E)P (E)
0,01 0,999
0,9 0,001 + 0,9 0,001

= 0,0826446
A esta probabilidad se le llama usualmente la valor predictivo positivo

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

5.2 Ejercicios Propuestos

5.2.

Ejercicios Propuestos

1. Se quiere estudiar la utilidad de la reaccion en cadena de la polimerasa (PCR) en el


diagnostico de la meningitis meningococica. Se estudian 115 lquidos cefalorraqudeos
procedentes de otros tantos pacientes con sospecha de meningitis. Los resultados que
se obtienen se recogen en la siguiente tabla:

Prueba (+)
Prueba (-)
Total

Meningitis meningococica Meningitis no meningococica Total


34
1
35
5
75
80
39
76
115

donde
En 34 personas con meningitis meningococica la PCR fue positiva (Verdaderos
Positivos).
En 5 personas con meningitis meningococica la PCR fue negativa (Falsos Negativos).
En 75 personas sin meningitis meningococica la PCR fue negativa (Verdaderos
Negativos).
En 1 persona sin meningitis meningococica la PCR fue positiva (Falsos Positivos).
Responda lo siguiente:
a) Que es la Prevalencia? Calc
ulela.
b) Cual es la probabilidad de que un sujeto enfermo sea clasificado como positivo?,
Como se podra aumentar esta probabilidad?
c) Cual es la probabilidad de que un sujeto sano sea clasificado como negativo?,
Como se podra aumentar esta probabilidad?
d ) Cual es la probabilidad de que el individuo tenga meningitis meningococica si la
prueba es positivo?, cual es la probabilidad de que no la padezca si la prueba es
negativa?
2. Con el objeto de diagnosticar la colelietasis se usan los ultrasonidos. Tal tecnica tiene
una sensibilidad del 91 % y una especificidad del 98 %. En la poblacion que nos preocupa, la probabilidad de colelietasis es de 0,2.
a) Si a un individuo de tal poblacion se le aplican los ultrasonidos y dan positivos,
cual es la probabilidad de que sufra la colelietasis?
b) Si el resultado fuese negativo, cual sera la probabilidad de que no tenga la
enfermedad?

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

77

78

Captulo 5. Sensibilidad y Especificidad


3. Dadas las siguientes tablas:

Tabla A
Enfermos
Examen Si No Total
(+)
58 4
62
(-)
12 28
40
Total
70 32
102
Tabla B
Enfermos
Examen Si No Total
(+)
58 40
98
(-)
12 280 292
Total
70 320 390
a) Calcule y comente para cada una de ellas su Prevalencia, Sensibilidad y Especificidad.
b) Para la Tabla A conociendo la sensibilidad y la especificidad del examen diagnostico calcule aplicando el Teorema de Bayes: VPPP (valor predictivo de la prueba
positiva) y VPPN (valor predictivo de la prueba negativa), comente.

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

Captulo 6
Estimaci
on
6.1.

Ejercicios Resueltos

EJERCICIO 1
Suponga que se tiene una m.a. de tama
no 2n tomada de una poblacion X, con E(X) = y
V ar(X) = 2 . Sean:
2n
n
1 X
1X
X1 =
xi y X 2 =
xi
2n i=1
n i=1
dos estimadores de . Cual es el mejor estimador de ? Explique su eleccion.

SOLUCION
El mejor estimador sera aquel que tenga menor error cuadratico medio E.C.M.. Primero
veamos si son insesgados los estimadores.
!
2n
2n
X
1 X
1
1
E
xi =
2n =
E(X 1 ) =
E(xi ) =
2n
2n
2n
i=1
i=1
!
n
n
X
1
1X
1
E(X 2 ) = E
xi =
E(xi ) = n =
n
n i=1
n
i=1
Luego ambos estimadores son insesgados, por lo tanto el mejor estimador de entre los dos,
sera aquel que tenga menor varianza.
!
2n
2n
X
1
1 X
1
2
V ar(X 1 ) = 2 V ar
xi = 2
V ar(xi ) = 2 2n 2 =
4n
4n i=1
4n
2n
i=1
!
n
n
X
1
1 X
1
2
2
V ar(X 2 ) = 2 V ar
xi = 2
V ar(xi ) = 2 n =
n
n i=1
n
n
i=1
Luego, como el que tiene menor varianza es X 1 , escogemos este, pues es el que produce un
menor E.C.M.
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

80

Captulo 6. Estimaci
on
EJERCICIO 2
1 y
2 son estimadores insesgados del parametro . Se sabe que V ar(
1 ) = 10
Suponga que

y V ar(2 ) = 4. Cual es el mejor y en que sentido lo es?

SOLUCION
Como ambos son insesgados, el mejor estimador sera aquel que tenga menor varianza, lo
2 tiene
que, en este caso, conlleva a tener un menor E.C.M.. Luego observando, vemos que
1 , por lo tanto escogemos
2 como mejor estimador de .
menor varianza que
EJERCICIO 3
1 y
2 son estimadores del parametro . Se sabe que E(
1 ) = , E(
2) = ,
Suponga que
2
1 ) = 10 y V ar(
2 ) = 4. Cual es el mejor y en que sentido lo es?
V ar(

SOLUCION
1 es insesgado para pero que
2 no lo es.
Si observamos cuidadosamente, vemos que
Ahora la mejor forma de ver cual es mejor es comparando los E.C.M. de cada uno, ya que
esta medida considera el sesgo producido por cada estimador y la varianza que tienen.
1 ) = V ar(
1 ) + Sesgo2 (
1 ) = 10 + 02 = 10
E.C.M.(
2
 2


=4+
E.C.M.(2 ) = V ar(2 ) + Sesgo (2 ) = 4 +
2
2
Como se puede ver, el E.C.M. de 2 depende del verdadero valor que tiene , luego debemos
2 sera mejor que
1.
hacer un analisis mas detallado, para saber cuando
Cuando ocurre:
1 ) E.C.M.(
2)
E.C.M.(
 2

10 4 +
2
16 + 2
10
4
40 16 + 2
2 40 16
2 24
2 sera mejor estimador de que
1 cuando el verdadero valor de sea:
Es decir,

24 o cuando 24
1 sera mejor estimador de que
2 cuando
Equivalentemente,

24 < < 24

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

6.1 Ejercicios Resueltos

81

EJERCICIO 4
Sea X1 , . . . , Xn una muestra aleatoria de tama
no n, de una poblacion N (, 2 ).
2

(a) Demuestre que X es un estimador sesgado de 2 .


(b) Determine la magnitud del sesgo en el estimador.
(c) Que sucede con el sesgo a medida que aumenta el tama
no n de la muestra?

SOLUCION
N (, 2 ), luego si queremos demostrar
(a) Como X N (, 2 ) entonces se sabe que X
n
2 es sesgado para 2 ocupamos la siguiente relacion:
que X
2

V ar(X) = E(X ) E 2 (X)


2
2
= E(X ) 2
n
Luego despejando lo que necesitamos, obtenemos:
2

E(X ) =

2
+ 2
n

Lo cual es distinto de 2 , que es el caso donde habra sido insesgado el estimador.


(b) La magnitud del sesgo, no es mas que el tama
no de este, es decir, su valor.
2

Sesgo(X ) = E(X ) 2
2

Sesgo(X ) =

2
2
+ 2 2 =
n
n

(c) A medida que el tama


no de muestra aumenta, el sesgo
es asintoticamente (cuando n ) insesgado.

2
n

0, es decir, el estimador

EJERCICIO 5
Una maquina produce artculos defectuosos con probabilidad . En la inspeccion de artculos
se define la v.a.


Yi =

1, si el artculo i es defectuoso;
0, si el artculo i no es defectuoso.

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

82

Captulo 6. Estimaci
on
En una muestra de tama
no 5 se observan dos artculos defectuosos. Proponga un modelo
apropiado para el problema y estime la proporcion de artculos defectuosos usando el metodo
de maxima verosimilitud.

SOLUCION
Dada la definicion del problema y la estructura de la variable aleatoria, Y tiene una distribucion Bernoulli
Y Ber(p) P (Y = y) = py (1 p)1y
donde el parametro p, que es la probabilidad del exito, es desconocida, por lo que la estimaremos por maxima verosimilitud.
L(y|p) =
L(y|p) = p

5
Y

i=1
P5
i=1

pyi (1 p)1yi

yi

(1 p)5

P5

i=1

yi

Aplicando logaritmo natural, obtenemos:


X



5
5
X
`(y|p) =
yi ln(p) + 5
yi ln(1 p)
i=1

i=1

Luego, para maximizar la funcion de verosimilitud, derivamos con respecto al parametro p,


que es el que estamos buscando e igualamos a cero para despejar p.
!
5
5
X
X
yi
yi 5
`
i=1
i=1
=
+
=0
p
p
1p
5
X

p =

yi

i=1

5
Pero como nos dicen que se observaron dos artculos defectuosos, es decir solo dos de los yi
son 1, la suma de estos es 2,
2
p =
5
EJERCICIO 6
El n
umero de conexiones mal soldadas por microcircuito integrado en una operacion de
manufactura electronica sigue una distribucion Binomial(20,p) con p desconocida. El costo
de corregir los errores, por microcircuito, es:
C = 3X + X 2
En base a una muestra aleatoria X1 , X2 , ..., Xn encuentre el EMV del costo esperado de
corregir los errores de estos n microcircuitos observados.

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

6.1 Ejercicios Resueltos

83

SOLUCION
Considerando que el parametro p es desconocido, debemos estimarlo, lo que haremos por el
metodo de Maxima Verosimilitud.
L(x|p) =

n  
Y
20
i=1

L(x|p) = p

Pn

i=1 xi

xi

pxi (1 p)20xi

20n

(1 p)

Pn

i=1 xi

n  
Y
20
i=1

xi

Aplicando logaritmo natural, obtenemos:


`(x|p) =

X
n

xi ln(p) + 20n

i=1

n
X


xi ln(1 p) +

i=1

n
X
i=1

 
20
ln
xi

Luego, para maximizar la funcion de verosimilitud, derivamos con respecto al parametro p,


que es el que estamos buscando e igualamos a cero para despejar p.
!
n
n
X
X
xi
yi 20n
`
i=1
i=1
=
+
=0
p
p
1p
n
X

p =

xi

i=1

20n
Ya teniendo este estimador, lo que sigue es calcular el EMV del costo.
E(C) = 3E(X) + E(X 2 )
= 3np + np(1 p) + (np)2
= 3np + np np2 + n2 p2
= 4np + np2 (n 1)
[ = 4nb
Luego el E.M.V. de E(C) es E(C)
p + nb
p2 (n 1) por invarianza del E.M.V.
EJERCICIO 7
En encuestas, es difcil obtener respuestas precisas a preguntas delicadas tales como Has
usado alguna vez herona? o Has hecho trampa alguna vez en un examen?. Warner introdujo
el metodo de respuestas aleatorizadas para tratar tales situaciones. El encuestado hace girar
una flecha en una rueda o extrae una bola desde una urna que contiene dos bolas de dos
colores para determinar cual de las dos afirmaciones contestara: (1)Tengo la caracterstica
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

84

Captulo 6. Estimaci
on
A, o (2)No tengo la caracterstica A. El encuestador no conoce cual afirmacion sera contestada pero solamente anotara un s o un no. Se cree que es mas probable que el encuestado
responda verazmente si el o ella saben que el encuestador no conoce cual afirmacion sera contestada. Sea R la proporcion de una muestra que contesta S. Sea p la probabilidad que la
afirmacion 1 sea contestada (p es conocido desde la estructura del metodo aleatorizado), y
sea q la proporcion de la poblacion que tiene la caracterstica A. Sea r la probabilidad que
un encuestado responda s.
(a) Muestre que r = (2p 1)q + (1 p)
(b) Si r es conocida, Como podra determinarse q?

SOLUCION
Definamos como:
R: Proporcion de la muestra que contesta s.
p: Probabilidad que la afirmacion 1 sea contestada.
q: Probabilidad de la poblacion que tiene la caracterstica A.
r: Probabilidad que un encuestado responda si.
(a)
r = P (responda s)
= P (responda s | contesta afirmacion 1)P (contesta afirmacion 1)
+ P (responda s | no contesta afirmacion 1)P (no contesta afirmacion 1)
= pq + (1 p)(1 q)
= pq + 1 p q + pq
= 2pq + 1 p q
= (2pq + 1)q + (1 p)
(b) Sera cosa de despejar q, es decir,
r (1 p) = (2p 1)q
luego
q=

r+p1
2p 1

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

6.1 Ejercicios Resueltos

85

EJERCICIO 8
Supongase que X1 , X2 , ..., Xn constituyen una m.a. de una distribucion cuya funcion densidad
es la siguiente
 1
x , 0 < x < 1;
f (x|) =
0,
e.o.c.
Ademas, supongase que el valor de es desconocido ( > 0).
(a) Determine el EMV de .
(b) Determine el EMV de E(X).

SOLUCION

(a)
L(x1 , . . . , xn , ) =

n
Y

x1
i

i=1
n
Y

= n

!1
xi

/ ln

i=1

`(x1 , . . . , xn , ) = n ln + ( 1)

n
X

ln xi

i=1

`(x1 ,...,xn ,)

n
X

ln xi

i=1

bEM V

n
= X
n
ln xi
i=1

(b)
Z
E(X) =

xx
0

\=
Luego E(X)

+1

1
1

Z
dx =

x dx =

x+1 1
=
0 +1

por la invarianza del E.M.V.

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

86

Captulo 6. Estimaci
on
EJERCICIO 9
Sean X1 , X2 , . . . , Xn variables aleatorias i.i.d. con funcion densidad dada por

( + 1)x ;0 < x < 1
fX (x) =
0
;e.o.c.
(a) Encuentre el estimador de por el metodo de momentos.
(b) Encuentre el estimador de por el metodo de maxima verosimilitud.
(c) Eval
ue ambos estimadores usando los siguientes datos:
X
0.1 - 0.3 0.3 - 0.6 0.6 - 0.7 0.7 - 0.9
Frecuencia
3
1
2
3

SOLUCION

(a) El metodo de momentos consiste en igualar el momento muestral con el momento


poblacional.
Para el caso k = 1 tenemos la siguiente igualdad
E(X) = X
Necesitamos calcular E(X):
Z
E(X) =

Z
xfX (x)dx =

x ( + 1)x dx

Rec X

Rec X

Z
= ( + 1)

x+1 dx

= ( + 1)

+1
+2

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

x+2 1

+2 0

6.1 Ejercicios Resueltos

87

Luego

E(X) = X

+1
=X
+2

+ 1 = X + 2X
(1 X) = 2X 1

M M =

2X 1
1X

(b)
L(x, ) =

n
Y

n
n
Y
Y
f (xi ) =
( + 1)xi = ( + 1)n
xi

i=1

i=1

`(x, ) =n ln( + 1) +

i=1

n
X

ln(xi )

i=1

X
n
`
=
+
ln(xi ) = 0
+ 1 i=1
n

X
n

=
ln(xi )
+1
i=1
+1=

n
n
X

ln(xi )

i=1

M V

=
+
1
n

ln(xi )
i=1

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

!
\ ln

88

Captulo 6. Estimaci
on
(c) Para evaluar los estimadores necesitamos convertir los datos tabulados a un set de
datos compuestos por las marcas de cada clases
(0.2)
(0.45)
(0.65)
(0.8)
0.1 - 0.3 0.3 - 0.6 0.6 - 0.7 0.7 - 0.9
X
Frecuencia
3
1
2
3
Se puede representar el conjunto de valores para X como:
[X : 0,2; 0,2; 0,2; 0,45; 0,65; 0,65; 0,8; 0,8; 0,8]
Calculando ahora lo necesario para poder evaluar los estimadores con estos datos tabulados
k

1X
1
X=
mi fi = (0,2 3 + 0,45 1 + 0,65 2 + 0,8 3) = 0,5277
n i=1
9
n
X

ln(xi ) = ln

i=1

n
Y

!
= ln(0,000778752) = 7,15781

xi

i=1

Luego al evaluar estos resultados en los estimadores, estos toman los siguientes valores:

M M =

M V

2X 1
2 0,52777 1
= 0,117612
=
1 0,52777
1X




9
n

= n
+ 1 =
+ 1 = 0,257367
7,15781
X

ln(xi )
i=1

EJERCICIO 10
Sean X1 , ..., Xn , Y1 , ..., Yn v.a. independientes con Xi Exp( 1 ) e Yj Exp( 1 ), con
i = 1, ..., n; j = 1, ..., n. Se define el parametro = (1 , 2 ) por 1 = y 2 = .
(a) Determine los EMV (estimador maximo verosmil) para 1 y 2
(b) Encuentre el sesgo y el ECM (error cuadratico medio) de 1

SOLUCION
(a) Dada la independencia existente entre las variables, tenemos que la densidad conjunta
yi
xi
es fXi ,Yj (xi , yj ) = 1 e 1 e , luego la verosimilitud conjunta es la siguiente:
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

6.1 Ejercicios Resueltos

89

L() =

xi

1
e
n n

`() =

xi

yi

yi

\ ln

n ln() n ln() \

= 0
= x = 1

= 0 = y

xi
2

yi
2

Tenemos que por la invarianza de los EMVs, 2 = , luego reemplazando queda que 2 = xy .

(b) Por formula el ECM (1 ) = V ar(1 ) + Sesgo2 (1 ), donde el Sesgo(1 ) = E(1 ) 1 .


Luego veremos primero si tiene sesgo (sesgado):

n
X

xi

n
n
i=1 1 X
1X

E(1 ) = E
E(xi ) =
=
=
n i=1
n n i=1
Luego como es insesgado (recuerde que 1 = ), el Sesgo(1 ) = 0.
Por lo tanto para calcular el ECM (1 ) basta calcular su varianza.

n
X

!
xi

n
X
i=1
1

V ar(1 ) = V ar
xi
n = n2 V ar

i=1
ind

Por lo tanto ECM (1 ) =

2
n

n
n
1 X
1 X 2 2
V
ar(x
)
=
=
i
n2 i=1
n2 i=1
n
n

el cual 0.

EJERCICIO 11
Sean X1 , ..., Xn iid con densidad e

x 0,

n 2. Sea Sn =

n
X
i=1

que Z = Sn tiene densidad:


fZ (z) =

z n1 ez
,
(n 1)!

=
Utilice esto para calcular el sesgo y el ECM de

z0
n1
.
Sn

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

Xi . Es bien conocido

90

Captulo 6. Estimaci
on

SOLUCION

Nesecitamos calcular la esperanza y varianza de .

n1
1

=E
= (n 1)E
= (n 1)E

E()
n
n
n

X
X
X

xi
xi

xi
i=1

i=1

i=1

 
 
1

= (n 1)E
= (n 1)E
Z
Z
= (n 1)E(Z 1 )

Z
= (n 1)

1 z

e
dz = (n 1)
(n 1)!

(n 1)
=
n1

Z
0

n1 z

Z
0

z n2 ez
dz
(n 1)!

z n2 ez
dz =
(n 2)!

es un estimador insesgado, es decir, Sesgo()


= 0. Luego queda que:
Por lo tanto

= V ar()
= E(
2 ) E 2 ()

ECM ()

=E

n1
Sn

2 !

2
Z2

= (n 1) E

= 2 (n 1)2 E(Z 2 ) 2

= (n 1)

z 2

z n1 ez
dz 2
(n 1)!

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

6.1 Ejercicios Resueltos

91
2 (n 1)2
=
(n 1)(n 2)

=
Por lo tanto el ECM ()

2 (n 1)
2
(n 2)

2
n2

2 n

n2

Z
0

z n3 ez
dz 2
(n 3)!

0.

EJERCICIO 12
iid

Sean Y1 , ..., Yn U (0, ). Sea T = M ax(Y1 , ..., Yn ) y considere los estimadores de de la


forma cT, c 0.
(a) Para que valor de c, cT es insesgado?
(b) Para que valor de c, el ECM (cT ) es mnimo?

SOLUCION
Si T corresponde al Maximo, entonces su funcion densidad es de la forma fT (t) = n[FY (t)]n1 fY (t),
donde fY (t) = 1 y FY (t) = t .
(a) Calcularemos la esperanza para determinar el insesgamiento.
E(cT ) = cE(T )

Z
=c

tn
0

cn
= n

=
Luego si c =

n+1
,
n

Z
0

tn1 1
dt
n1

tn dt =

cn tn+1

n n + 1 0

cn n+1
cn
=
n
n+1
n+1

cT es insesgado.

(b) En primer lugar calcularemos lo necesario para obtener el ECM y as despues encontrar
el c que lo minimice.
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

92

Captulo 6. Estimaci
on

E(2 ) = E((cT )2 ) = c2 E(T 2 )

=c

tn1 1
c2 n
t n n1 dt = n

c2 n
= n

tn+2

n+2 0


=

tn+1 dt

c2 n2
n+2

Ahora calculemos V ar():


2
2
2 2 2
= c n c n
V ar()
n + 2 (n + 1)2

= c n

= c n

= c n

n
1

n + 2 (n + 1)2

(n + 1)2 n(n + 2)
(n + 1)2 (n + 2)

1
(n + 1)2 (n + 2)

Por lo tanto el sesgo queda de la siguiente forma:


= cn =
Sesgo()
n+1

cn n 1
n+1

y as obtenemos el ECM , resultando:


=
ECM ()

c2 n2
+ 2
(n + 1)2 (n + 2)

(cn n 1)2
(n + 1)2

Ahora utilizando los metodos matematicos (1a Derivada) para minimizar, encontraremos el
c correspondiente.

ECM ()
2cn2
22 n(cn n 1)
=
+
=0
c
(n + 1)2 (n + 2)
(n + 1)2
n+2
n+1
Para verificar si realmente es mnimo, se calcula la segunda derivada.
c =

2 ECM ()
2n2
=
c2
n+2
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

6.1 Ejercicios Resueltos

93

la cual es positiva n > 0, luego cuando c =

n+2
,
n+1

se minimiza.
el ECM ()

EJERCICIO 13
Suponga que X sigue una distribucion de Pareto, su funcion de densidad esta dada por:

f (x|, ) = x1 , x y

Asuma que > 0 es conocido y que X1 , . . . , Xn son v.a. iid.


(a) Encuentre un estimador de momentos para .
(b) Determine el EMV de .

SOLUCION
Como los Xi siguen distribucion de Pareto, se tiene que su esperanza y varianza son conocidas:

E(X) =

,
1

>1

V ar(X) =

2
,
( 1)2 ( 2)

>2

(a) Igualando el momento poblacional con el muestral, se obtiene el estimador de momentos:


n

1X

=
Xi
1
n i=1

=X
1
X = X

X
X

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

94

Captulo 6. Estimaci
on
(b) Teniendo que las observaciones distribuyen Pareto, la funcion de verosimilitud es la
siguiente:

L(, ) =

n
Y

(+1)

xi

i=1

= n n

n
Y

!(+1)
\ ln

xi

i=1

`(, ) = n ln() + n ln() ( + 1)

n
X

ln(xi ) \

i=1

+ n ln()

n
X

ln(xi ) = 0

i=1

n ln()

n
X

ln(xi )

i=1

EJERCICIO 14
Sea Y1 , ..., Yn una muestra aleatoria proveniente de una poblacion N (, ), con > 0 y desconocido. A partir de una muestra aleatoria correspondiente a 25 pesos de circuitos, con
n
n
X
X
Yi = 1264 y con
Yi2 = 5240, determine la estimacion maximo verosimil de .
i=1

i=1

SOLUCION

L() =

n
Y
i=1

exp
2

1
(yi )2
2

(
n
2

= (2)

1
exp 2

n
X

)
(yi )2

i=1

`() = n2 ln(2)

n
2

ln()

1
2

n
X
i=1

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

(yi )2

\ ln

6.1 Ejercicios Resueltos

n2

95

ln(2)

n
2

ln()

1
2

n
X

(yi2 2yi + 2 )

i=1

= n2 ln(2)

n
2

ln()

1
2

n
X

yi2 +

i=1

n
2

1
22

n
X

yi2

i=i

n +

yi2

2
n
X

n
X

yi

i=1

n2
\
2

n
=0
2

n=0

\ 2

yi2 n2 = 0

\ n1

i=1

n
X

yi2 /n + 2 = 0

i=1

2 + y 2 = 0

1+4y 2
2

EJERCICIO 15
Ingenieros electricos japoneses han inventado un sistema de radar llamado detector de blancos
moviles (MTD, moving target detector), dise
nado para rechazar los ecos parasitos provocados por el terreno, la lluvia, las aves y otras fuentes de interferencia.
Los investigadores han demostrado que la magnitud X de la frecuencia Doppler de una se
nal
recibida por radar se puede modelar por una distribucion Weibull, con parametro = 2 y
> 0, tal que:


1 2
2x
exp x
f (x) =

x>0

En base a una muestra aleatoria de tama


no n,determine el estimador maximo
mil de
P50 veros
2
y obtenga su estimacion con las siguientes magnitudes de frecuencias si i=1 xi = 51,9.

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

96

Captulo 6. Estimaci
on

SOLUCION

L() =

n
Y
2xi

i=1

2n
n


exp

1 2
x
i

n
Y

n
1X 2
xi exp
xi

i=1
i=1

`() = n ln(2) n ln() +

n
X

ln(xi )

i=1
n
X
`

= n +
n
X

n
1X 2
x \
i=1 i

x2i

i=1
2

=0

x2i

i=1
n
n
X

\ ln

x2i

i=1
n

Reemplazando por los valores dados en el inicio, queda que


= 1,038
EJERCICIO 16
En una fabrica se seleccionan diariamente motores y se inspeccionan hasta encontrar el
primer motor defectuoso. Sea (X1 , . . . , Xn ) una m.a. de X distribuida geometricamente con
p desconocido.
(a) Determine el estimador de momentos para p.
(b) Determine el estimador maximo verosmil de p.
(c) De los registros de 100 das se obtuvo la siguiente informacion del n
umero de motores
inspeccionados.
N o de motores inspeccionados 1 2 3 4 5
N o de das
8 10 15 25 42
Estime la probabilidad de que en un da cualquiera se deban inspeccionar mas de dos
motores para encontrar uno defectuoso.
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

6.1 Ejercicios Resueltos

97

SOLUCION
Dado que Xi Geom(p) tenemos que:
P (X = x) = p(1 p)x1 ;

E(X) =

1
p

V ar(X) =

(a) Igualando momento poblacional con el muestral, queda:


n
X

1
=
p

p =

xi

i=1

n
n
n
X

=
xi

1
x

i=1

(b) Encontremos ahora los estimadores M.V.

L(p) =

n
Y

p(1 p)xi 1

i=1

n
X
n

= p (1

(xi 1)

p) i=1
n
X

xi n

= p (1 p) i=1
n
X
`(p) = n ln(p) + (
xi n) ln(1 p)
i=1

= n ln(p) +

n
X

xi ln(1 p) n ln(1 p)

i=1

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

1
p2

98

Captulo 6. Estimaci
on

n
X

xi
n
n
`
i=1
=
+
=0
p
p
1p
1p
n
X

n
=
p

xi n

i=1

1p
n
X

n(1 p) = p

!
xi n

i=1

p =

n
n
X

xi

i=1

(c) Recordando la propiedad de invarianza que tienen los estimadores maximo verosmiles,
lo que se pide, se puede traducir estadsticamente en:
P (X > 2) = 1 P (X 2)
= 1 P (X = 1) P (X = 2)
= 1 p(1 p)11 p(1 p)21 = 1 p p(1 p)
= (1 p)2 = 0,261

EJERCICIO 17
Sean X1 , . . . , Xn i.i.d. U (1 , 2 ). Es decir, la densidad de Xi es:
f (x) =

1
2 1

1 x 2

(a) Encuentre el estimador de momentos para los parametros de esta distribucion.


(b) Encuentre el estimador maximo verosmil para 1 y 2 .

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

6.1 Ejercicios Resueltos

99

SOLUCION

(a) Se necesita encontrar los estimadores de 1 y 2 , luego por ser dos parametros, utilizaremos el primer y segundo momento para armar un sistema de ecuaciones.
Momentos poblacionales:
E(X) =

1 + 2
2
Z

E(X ) =
1

x2

1
dx
2 1

22 + 2 1 + 12
=
3
Igualando momentos poblacionales con muestrales, queda el siguiente sistema de ecuaciones:
1 + 2
=x
2

(1)

22 + 2 1 + 12
= x2
3

(2)

Despejando tenemos de (1) que 1 = 2x 2 y reemplazando en la segunda ecuacion


se obtiene:

(2x 2 ) + (2x 2 )2 +

4x 4x2 +

22

+ 2x2

22

22

22

x2i
n

P
=3

x2i
n

P
=3

22 2x2 + 4x2 3x2 = 0


Resolviendo esta ecuacion de segundo grado con los metodos usuales, se obtiene:
p

4x2 16x2 + 12x2


= x 3x2 3x2 = x 3S 2
2

Luego reemplazando 2 en (1) se tiene que 1 = 1 2 = 1 x 3S 2 .


2 =

2x

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

100

Captulo 6. Estimaci
on
(b) En el caso de aquellas distribuciones en que su dominio depende de los parametros a
estimar (en este caso la distribucion es valida cuando 1 x 2 ), el procedimiento de
estimacion debe considerar un muy peque
no detalle como se muestra a continuacion:

L(1 , 2 ) =

1
I( , ) (x1 ) . . . I(1 ,2 ) (xn )
(2 1 )n 1 2

n
Y
1
I( , ) (xi )
=
(1 , 2 )n i=1 1 2

n
Y
1
=
I(x > ) (xi )I(xi <2 ) (xi )
(1 , 2 )n i=1 i 1

n
Y
1
I(min(xi )>1 ) (xi )I(max(xi )<2 ) (xi )
=
(1 , 2 )n i=1

Como se muestra a continuacion tanto el mnimo como el maximo de los xi son el


estimador maximo verosmil de 1 y 2 respectivamente.

Figura 6.1: Estimacion Theta 1

Figura 6.2: Estimacion Theta 2

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

6.2 Ejercicios Propuestos

6.2.

101

Ejercicios Propuestos

1. Considere las siguientes observaciones efectuadas en un flujo de corriente (miles de


acres pies) registradas en una estacion en Colorado para el perodo del 1o de Abril
al 31 de Agosto, durante el perodo de 31 a
nos (de un artculo del volumen de 1974,
W ater Resources Research).
127,96
285,37
200,19
125,86
117,64
204,91
94,33

210,07
100,85
66,24
114,79
302,74
311,13

203,24
89,59
247,11
109,11
280,55
150,58

108,91
185,36
299,87
330,33
145,11
262,09

178,21
126,94
109,64
85,54
95,36
477,08

Una grafica apropiada de probabilidad apoya el uso de la distribucion log-normal como


un modelo razonable para un flujo de corriente.
a) Estime los parametros de la distribucion. (Sugerencia: recuerde que X tiene una
distribucion log-normal con parametros y 2 si ln(X) esta normalmente distribuida con media y varianza 2 .)
b) Utilice las estimaciones del inciso a) para calcular una estimacion del valor esperado del caudal. (Sugerencia: cual es E(X)? )
2.

a) Se selecciona una muestra aleatoria de 10 casas de una zona en particular, cada


una tiene calefaccion con gas natural, y se determina la cantidad de gas (ternias,
es decir, 25200 caloras) empleada durante el mes de Enero para cada casa. Las
observaciones resultantes son 103, 156, 118, 89, 125, 147, 122, 109, 138, 99. Represente con el consumo promedio de gas durante enero por todas las casas de
la zona. Calcule una estimacion puntual para .
b) Suponga que 10000 casas de esta zona utilizan gas natural para la calefaccion.
Represente por la cantidad total de gas empleada por todas estas casas durante
Enero. Estime mediante los datos del inciso a). Cual estimador utilizo en el
calculo de su estimacion?
c) Utilice los datos del inciso a) para estimar p, la proporcion de todas las casas que
utilizaron por lo menos 100 ternias.
d ) De una estimacion puntual de la media de la poblacion del consumo (el valor
medio de la poblacion de todas las casas) con base en la muestra del inciso a).
Cual estimador utilizo?

3. Se examina cada pieza de 150 recien fabricadas y se registra el n


umero de ara
nazos
por pieza (se supone que las piezas no deben tener ara
nazos) y resultan los siguientes
datos:
N
umero de ara
nazos por pieza 0 1 2 3 4 5 6 7
Frecuencia observada
18 37 42 30 13 7 2 1
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

102

Captulo 6. Estimaci
on
Sea X = n
umero de ara
nazos en una pieza seleccionada al azar y suponga que X tiene
una distribucion de Poisson con parametro .
a) Encuentre un estimador de y calcule la estimacion para los datos anteriores.
(Sugerencia: E(X) = para X P ois(), por lo que E(X) =?)
b) Cual es la desviacion estandar (error estandar) de su estimador? Calcule el error
estandar estimado. (Sugerencia: X = para X P ois() .)
4. De n1 fumadores (hombres) seleccionados al azar, X1 fumaron cigarrillos con filtro,
mientras que de n2 fumadoras seleccionadas al azar, X2 fumaron cigarrillos con filtro.
Represente por p1 y p2 las probabilidades de que un hombre y una mujer seleccionados
al azar, respectivamente, fumaron cigarrillos con filtro.
a) Demuestre que (X1 /n1 )(X2 /n2 ) es un estimador insesgado para p1 p2 . (Sugerencia:
E(X) = ni pi . para i = 1, 2.)
b) Cual es el error estandar del estimador en el inciso a)?
c) Como se utilizaran los valores observados x1 y x2 para estimar el error estandar
de su estimador?
d ) Si n1 = n2 = 200, x1 = 127 y x2 = 176, utilice el estimador del inciso a) para
obtener una estimacion de p1 p2 .
e) Utilice el resultado del inciso c) y los datos del inciso d) para estimar el error
estandar del estimador.
5. Considere una muestra aleatoria X1 , . . . , Xn de la pdf
f (x; ) = 0,5(1 + x)

1 x 1

donde 1 1 (esta distribucion aparece en fsica de partculas). Demuestre que


b = 3X es un estimador insesgado de . (Sugerencia: primero determine = E(X) =
E(X).)
6. Una muestra de n aviones caza Pandemonium capturados da como resultado n
umeros
de serie x1 , . . . , xn . La CIA sabe que las naves fueron numeradas en forma consecutiva
en la fabrica, comenzando por y terminando por , as que el n
umero total de
aviones construido es + 1 (es decir, si = 17 y = 29, entonces se fabricaron
29 17 + 1 = 13 aviones con n
umeros de serie 17, 18, ..., 28, 29). pero la CIA desconoce
los valores de o . Un experto en estadstica de la CIA sugiere usar el estimador
max(Xi ) min(Xi ) + 1 para estimar el n
umero total de aviones fabricados.
a) Si n= 5, x1 = 237, x2 = 375, x3 = 202, x4 = 525 y x5 = 418, cual es la estimacion
correspondiente?
b) Bajo que condiciones de la muestra, el valor de la estimacion sera exactamente
igual al n
umero verdadero de aviones? Sera la estimacion alguna vez mayor que
el total verdadero? Piensa que el estimador es insesgado para estimar + 1?
Explique con una o dos oraciones.
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

6.2 Ejercicios Propuestos

103

7. Represente por X1 , . . . , Xn una muestra aleatoria de una distribucion de Rayleigh con


pdf
f (x; ) =

x x2 /(2)
e

;x > 0

a) Se puede demostrar que E(X 2 ) = 2. Utilice este hecho para construir un estimador insesgado de con base en Xi2 y use las reglas para demostrar que es
insesgado.
b) Estime de las siguientes n = 10 observaciones sobre el esfuerzo vibratorio de
una paleta de turbina bajo condiciones especficas:
16,88 14,23
10,23 19,87
4,59 9,40
6,66 6,51
13,68 10,95
8. Suponga que el verdadero valor promedio de crecimiento de un tipo de planta, durante un periodo de un a
no, es identico al de un segundo tipo, pero la varianza de
crecimiento para el primer tipo es 2 , mientras que para el segundo tipo la varianza es 4 2 . Sean X1 , . . . , Xm las m observaciones independientes de crecimiento en el
primer tipo (entonces, E(Xi ) = , V (Xi ) = 2 ).Sean Y1 , . . . , Yn las n observaciones
independientes de crecimiento en el segundo tipo (E(Yi ) = , V (Yi ) = 4 2 ).
a) Demuestre que para cualquier entre 0 y 1, el estimador
b = X + (1 )Y es
insesgado para .
b) Para m y n fijas, calcule V (b
) y luego encuentre el valor de que reduzca V (b
)
al mnimo. (Sugerencia: derive V (b
) con respecto a .)
9. Se selecciona una muestra aleatoria de n cascos para ciclistas, fabricados por cierta
compa
na. Sea X = n
umero entre los n que tienen defectos y p = P(con defectos).
Suponga que solo se observa X, en lugar de las secuencia de las S y las F .
a) Obtenga el estimador de maxima verosimilitud de p. Si n = 20 y x = 3, cual es
la estimacion?
b) Es insesgado el estimador del inciso a)?
c) Si n = 20 y x = 3, cual es el EMV de la probabilidad (1 p)5 de que ninguno
de los siguientes cinco cascos que se examinen tengan defectos?
10. Se observan dos sistemas diferentes de computadora durante un total de n semanas.
Represente con Xi el n
umero de descomposturas del primer sistema durante la i-esima
semana y suponga que las Xi son independientes y obtenidas de una distribucion de
Poisson con parametro 1 . De forma similar, represente con Yi el n
umero de descomposturas del segundo sistema durante la i-esima semana y suponga independencia en cada
Yi de Poisson, con parametro 2 . Obtenga los EMV de 1 , 2 y 1 2 . (Sugerencia:
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

104

Captulo 6. Estimaci
on
mediante el uso de independencia, escriba la pdf conjunta (verosimilitud) de las Xi , y
Yi juntas.)
11. Se determina la resistencia al corte de cada una de diez soldaduras electricas por puntos
de prueba, obteniendose los siguientes datos (lb/pulg 2 ):
392 376 401 367 389 362 409 415 358 375
a) Si se supone que la resistencia al corte esta normalmente distribuida, estime el
verdadero promedio de resistencia al corte y su desviacion estandar con el metodo
de maxima verosimilitud.
b) Otra vez, suponiendo una distribucion normal, estime el valor de resistencia abajo
del cual 95 % de todas las soldaduras tendran sus resistencias. (Sugerencia: cual
es el percentil 95 en terminos de y ? Ahora utilice el principio de invarianza.)
12. Consulte el ejercicio anterior. Suponga que decidimos examinar otra soldadura por
puntos de prueba. Sea X = resistencia al corte de la soldadura. Utilice la informacion
dada para obtener el EMV de P (X 400). (Sugerencia: P (X 400) = ((400
)/).)
13. Represente por X1 , . . . , Xn una muestra aleatoria de la distribucion de Rayleigh con la
funcion de densidad dada en el ejercicio 7. Determine:
a) El estimador de maxima verosimilitud de y despues calcule la estimacion para
los datos de esfuerzo vibratorio proporcionados en ese ejercicio. Es este estimador
el mismo que el insesgado sugerido en el ejercicio 7?
b) El EMV de la mediana de la distribucion del esfuerzo vibratorio. (Sugerencia:
primero exprese la mediana en terminos de .)
14. En el tiempo t = 0 se ponen a prueba 20 componentes identicos. La distribucion de
duracion de cada uno es exponencial con parametro . El experimentador sale entonces
de la planta de prueba, la cual queda sin vigilancia, y a su regreso, 24 horas despues,
termina de inmediato la prueba, despues de observar que y = 15 de los 20 componentes
todava estan en operacion (es decir, 5 fallaron). Obtenga el EMV de . (Sugerencia:
sea Y = n
umero que resistio 24 horas. Entonces, Y Bin(n, p). Cual es el EMV de
p? Ahora observe que p = P (X 24) donde Xi esta distribuida exponencialmente.
Esto relaciona con p, de modo que la primera se puede estimar una vez que la u
ltima
se haya estimado.)
15. Sea X1 , X2 , . . . , Xn una muestra aleatoria tomada de una distribucion gamma con
parametros r y .
a) Encuentre la funcion y el log de la verosimilitud.
b) Encuentre las ecuaciones de definen los estimadores de maxima verosimilitud para
r y . Pueden resolverse de manera explcita?
c) Demuestre que el estimador de maxima verosimilitud de =

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

es
= X.

Captulo 7
Intervalos de Confianza y Test de
Hip
otesis
7.1.

Ejercicios Resueltos

EJERCICIO 1
Una compa
na de taxis esta tratando de decidir si compra la marca A o la marca B de
neumaticos para su flota de automoviles. Para estimar la diferencia entre las dos marcas,
se lleva a cabo un experimento con 12 neumaticos de cada marca. Los n
umeros se utilizan
hasta que se gastan. Los resultados son:
Marca Media (Km)
A
36.300
B
38.100

Desv. Stand. (Km)


5.000
6.100

(a) Calcule un intervalo de confianza para 1 2 , suponiendo que las poblaciones tienen
distribucion normal con varianzas iguales.
(b) Encuentre un intervalo de confianza para 1 2 , si se asigna un neumatico de cada
compa
na en forma aleatoria a las ruedas traseras de ocho taxis y se registran, en
kilometros las siguientes distancias:
Taxi Marca A Marca B
1
34.400
36.700
2
45.500
46.800
3
36.700
37.700
4
32.000
31.100
5
48.400
47.800
6
32.800
36.400
7
38.100
38.900
8
30.100
31.500
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

106

Captulo 7. Intervalos de Confianza y Test de Hip


otesis
Asuma que las diferencias de las distancias estan distribuidas aproximadamente en
forma normal.
(c) Determine un intervalo de confianza de 90 % para 22 /12 . Que puede concluir?

SOLUCION
Tenemos que nA = nB = 12.

(a) I.C para 1 2 suponiendo varianzas iguales y desconocidas es el siguiente:

r
(XY )Sp

1
1
+
t(n +n 2,1 2 ) 1 2 (XY )+Sp
n1 n2 1 2

1
1
+
t(n +n 2,1 2 )
n1 n2 1 2

Luego necesitamos
Sp2 =

De aqu obtenemos Sp =

(n1 1)S22 +(n2 1)S12


n1 +n22

(121)50002 +(121)61002
12+122

684310000
22

31105000

31105000 = 5577,18.

el I.C. queda
r
(3630038100)5577,18

1
1
+
t
1 2 (3630038100)+5577,18
12 12 (22;0,975)

1
1
+
t
12 12 (22;0,975)

Reemplazando t(22;0,975) = 2,0738, el I.C. al 95 % de Confianza para 1 2 es:


6521,94 1 2 2921,94
(b) Lo que nos piden es un I.C. para datos pareados.
Primero que todo tenemos que calcular las diferencias para cada par de datos como
sigue:
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

7.1 Ejercicios Resueltos

107
Taxi Marca A Marca B
1
34.400
36.700
2
45.500
46.800
3
36.700
37.700
4
32.000
31.100
5
48.400
47.800
6
32.800
36.400
7
38.100
38.900
8
30.100
31.500

di
-2300
-1300
-1000
900
600
-3600
-800
-1400

Un I.C. para 1 2 esta definido como:


SD
SD
d t(n1;1 2 ) 1 2 d + t(n1;1 2 )
n
n
donde,
d = X A X B = 37250 38362,5 = 1112,5

2
SD

Pn
=

d)2
n1

i=1 (di

luego
2
SD
=

14808750
= 2115535,71428
7
SD = 1454,488127

Ocupando un = 0,05 el valor para t(n1;1 2 ) es t(7;0,975) = 2,3646.


Reemplazando el I.C. para 1 2 queda:
111,5

1454,4881
1454,4881

2,3646 1 2 111,5 +
2,3646
8
8

es decir, un I.C. al 95 % para 1 2 es


2328,47 1 2 103,47
(c) Un I.C. para 22 /12 al 90 % esta determinado por:
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

108

Captulo 7. Intervalos de Confianza y Test de Hip


otesis

S22

F
S12 n1 1;n2 1; 2

22
12

S22

F
S12 n1 1;n2 1;1 2

61002
F
50002 11;11;0,05

22
12

61002
F
50002 11;11;0,95

61002
50002

22
12

22
12

0,3548

0,528

61002
50002

2,82

4,1973

Como el 1 se encuentra en el I.C. no se rechaza que 12 = 22 .


EJERCICIO 2
Dos tipos diferentes de aleacion, A y B, se han utilizado para fabricar especmenes experimentales de un peque
no eslabon de tension, empleado en cierta aplicacion de ingeniera. Se
determino la resistencia maxima (en ksi) de cada especimen y los resultados se resumen en
la siguiente tabla de distribucion de frecuencia.

26-30
30-34
34-38
38-42

A B
6 4
12 9
15 19
7 10
40 42

Calcule un intervalo de confianza de 95 % para la diferencia entre las proporciones reales


de todos los especmenes de aleaciones A y B que tengan una resistencia maxima de por lo
menos 34 ksi.

SOLUCION
Un I.C para las diferencias de proporciones esta definido por:
s
(b
pA b
pB )

pbA (1 pbA ) pbB (1 pbB )


+
Z1 2 pA pB (b
pA b
pB )+
n1
n2

pbA (1 pbA ) pbB (1 pbB )


+
Z1 2
n1
n2

Mirando en la tabla los rangos, sumamos las frecuencias de los rangos que cumplen tener
una resistencia mayor de 34 ksi, luego reemplazando pbA = 22
, pbB = 29
y Z0,975 = 1,96.
40
42
el I.C. al 95 % para pA pB es:
0,348 pA pB 0,067
Como el 0 al Intervalo, se puede decir con un 95 % de confianza que pA = pB .

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

7.1 Ejercicios Resueltos

109

EJERCICIO 3
Una firma decide estudiar una muestra aleatoria de 20 proyectos que envio para ser evaluados,
tanto a consultores externos, como a su propio departamento de proyectos. Las variables
medidas fueron
X: no de das que demoro la evaluacion.
Y : no de variables consideradas en la evaluacion.
Z: Consultor al que se le envio el proyecto

1 ; Depto. de Evaluacion
0
; Robani Consultores
Z=

1
; Tanaka Ltda.
W : Costo de la evaluacion (en U.F.)
Los resultados de este muestreo son:
No
X
Y
Z
W

1
4
3
-1
40

2
1
-1
30.5

8
6
0
80.3

4
10
8
0
68.5

1
3
0
24.7

3
2
0
40.5

8
6
1
90.6

3
2
0
38.5

2
1
0
50.4

10
2
1
1
50.2

11
4
4
-1
60.1

12
4
4
-1
60.8

13
5
4
0
70.9

14
6
7
1
80

15
7
10
1
90

16
2
3
-1
30

17
1
2
-1
27

18
3
4
0
40

19
4
5
1
50

20
9
10
-1
40

Explicitando los supuestos necesarios:


(a) Estime con un 90 % de confianza el costo medio de los proyectos.
(b) Estime con un 90 % de confianza la proporcion de proyectos cuyo costo fue inferior a 50
U.F. dado que no involucraron mas de 6 variables y que fueron resueltos en un tiempo
superior a 2 das.
(c) El Depto. de control afirma que el costo medio de enviar los proyectos a asesores
externos es significativamente mayor que el de evaluarlos all mismo. Que concluye
usando = 0,05?
(d) Tanaka Ltda. Afirma que la proporcion de proyectos que ellos eval
uan, que toman
mas tiempo de mas de 4 das, no es superior a la proporcion de proyectos que eval
ua
Robani Consultores, que toman un tiempo mas de 4 das, no es superior a la proporcion
de proyectos que eval
ua Robani Consultores, que toman un tiempo mas de 4 das.
Concluya si la afirmacion de Tanaka Ltda. es correcta. (Use = 0,01)

SOLUCION

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

110

Captulo 7. Intervalos de Confianza y Test de Hip


otesis
(a) IC(W ) = W tn1;1 2 SWn , donde = 5 % = 0,05 t201;1 0,05 = t19;0,975 = 2,093
2

Luego con
2
W
SW
SW
n
53,15 20,948 438,828 20

tenemos que el IC(W ) es:


20,978
IC(W ) = 53,15 2,093
20
W (43,346; 62,953)
(b) IC(p) = p Z1 2

pq
,
n

donde = 10 % = 0,1 Z1 0,1 = Z0,95 = 1,645


2

luego con
p q n
1
1
8
2
2
tenemos que el IC(p) es:
IC(p) =

0,5 0,5
1
1,645
2
8

p (0,209; 0,790)
(c) Definamos primero:
E: Asesores externos
L: Asesores locales (internos)
Luego tenemos la siguiente tabla resumen
n
X
S
S2
E 13 59,584 21,629 467,838
L 7
41,2 14,058 197,636
Sea
E : costo medio asesores externos
L : costo medio asesores locales (internos)
Las hipotesis son
H0 : E = L

vs

H 1 : E > L

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

7.1 Ejercicios Resueltos

111

primero haremos un test de varianzas para determinar como son estas y as saber como
testamos las medias. Las hipotesis son:
H0 :

E2
=1
L2

vs

H1 :

E2
6= 1
L2

las cuales se dociman mediante el estadstico F:


F =

SE2
= 2,367
SL2

Y se rechaza H0 si:
F > F1 F < F2
donde F1 y F2 considerando = 0,05 son:
F1 = FnE 1;nL 1;1 2 = F12;6;0,975 = 5,37
F2 = FnE 1;nL 1; 2 = F12;6;0,025 =

1
F6;12;0,975

1
= 0,268
3,73

Como F (2.367) no es mayor que F1 ni menor que F2 , no existe suficiente evidencia


bajo un 95 % de confianza para rechazar H0 , es decir, se pueden considerar las varianzas
desconocidas pero iguales.
Ahora hacemos un test de diferencias de medias, donde el estadstico Tc es:
Tc =

XE XL
q
Sp n1E + n1L

donde

Sp2 =

(nE 1)SE2 + (nL 1)SL2


nE + nL 2
12 467,8382 + 6 197,6362
18

= 158934,925

Sp = 398,666
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

112

Captulo 7. Intervalos de Confianza y Test de Hip


otesis
Reemplazando el estadstico queda:
Tc =

59,584 41,2
q
1
398,666 13
+

= 0,098
1
7

Luego se rechaza H0 si Tc > t,1 .


donde t,1 es:
t,1 = tnE +nL 2,1 = t18;0,95 = 1,734
como Tc no es mayor que t,1 , no existe suficiente evidencia para rechazar H0 , luego
la opinion del Depto. no es correcta.
(d) La hipotesis para este caso es la siguiente:
H0 : p T p R

vs

H1 : pT > p R

necesitaremos la siguiente informacion


pT pR nT nR qT qR
0,8 0,25 5 8 0,2 0,75
El estadistico Zc es
Zc = q

pT pR
pT
qT
nT

pR
qT
nR

=q

0,8 0,25
0,80,2
5

= 2,335

0,250,75
8

Se rechaza H0 si Zc > Z1 .
Z1 = Z10,01 = Z0,99 = 2,325
Como Zc > Z0,99 , se rechaza H0 , por lo tanto Tanaka Ltda tiene razon.
EJERCICIO 4
La consejala de la Juventud de un Ayuntamiento maneja el dato de que la edad a la que
los hijos se independizan de sus padres es una variable aleatoria normal con media 29 a
nos.
Aunque la desviacion estandar no plantea dudas, se sospecha que la media ha aumentado,
sobre todo por el poco apoyo a la poltica de ayuda al empleo que ha llevado a cabo el
Ayuntamiento. As de un estudio reciente sobre 100 jovenes que se acaban de independizar,
se ha obtenido una media de 30.7 a
nos de edad y una desviacion estandar de 3 a
nos.
(a) Con un nivel de significancia del 1 %, es correcta la sospecha que se tiene, acerca de
la edad media en que se independizan los jovenes?
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

7.1 Ejercicios Resueltos

113

(b) Se sabe que el porcentaje de personas que corresponden al sexo femenino y se independizan antes de los 29 a
nos, no supera el 45 %. Si en la muestra, 60 jovenes son mujeres,
y 35 de ellas cumplen con las caractersticas antes expuestas, Que se puede concluir
con un nivel de significancia del 5 %?.

SOLUCION
Rescatemos que n = 100, x = 30,7 y s = 3
(a) La hipotesis adecuada para esta conjetura es:

H0 : 29

H1 : < 29

Debemos hacer una prueba para la media, con 2 desconocido, ocupando el estadstico :

T =

30,7 29
x 0
=

= 5,66
s/ n
3/ 100

Ahora, por las caractersticas de la hipotesis, rechazamos H0 , si


T < tn1,1
donde el tn1,1 se obtiene buscando en una tabla t-Student t99,0,99 ( = 0,01) el
cual resulta -2.36.
Por lo tanto, como:
5,66 2,36
No existe evidencia suficiente en los datos para rechazar H0 , es decir, la edad media
de independencia en los jovenes ha aumentado.
(b) Rescatando, tenemos que las mujeres que se independizan antes de los 29 a
nos no superan el 45 %, lo cual puede reescribirse en la hipotesis, de la siguiente manera:

H0 : p 0,45

H1 : p > 0,45

Lo cual corresponde a un test de hipotesis para la proporcion, en donde se ocupa el


estadstico :

p p0

Z=p

p0 (1 p0 )/n

Pero nos dicen que de 60 mujeres, 35 cumplen con que se independizan antes de los 29
35
a
nos, luego p = 60
= 0,5833.
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

114

Captulo 7. Intervalos de Confianza y Test de Hip


otesis
Por lo tanto, queda que el estadstico es:

Z=p

0,5833 0,45
0,45(1 0,45)/60

= 2,07

Ahora, por las caractersticas de la hipotesis, rechazamos H0 , si


Z > Z1
donde el Z1 se obtiene buscando en una tabla Normal Z0,95 ( = 0,05) el cual resulta
1.64.
Por lo tanto, como:
2,07 > 1,64
existe evidencia suficiente en los datos para rechazar H0 , es decir, la proporcion de
mujeres que se independiza antes de los 29 a
nos, supera el 45 %.

EJERCICIO 5
En un estudio sobre habitos de alimentacion en pelcanos, se marcan 25 hembras y 11 machos,
y se les rastrea por radio. La variable de interes es la distancia (en mts.) que recorren volando
en una pasada, en busca de alimento. Se obtuvieron estos resultados:
Hembras: Distancia Media 205 mts.
Desv. Estandar 100 mts.
Machos: Distancia Media 135 mts.
Desv. Estandar 90 mts.
Puede afirmarse que el comportamiento es diferente, respecto a la distancia media recorrida?

SOLUCION
Resumiendo tenemos:
nh = 25 xh = 205 sh = 100
nm = 11 xm = 135 sm = 90
Para contestar la pregunta, debemos hacer un test de hipotesis para la diferencia de medias,
es decir:
H0 : h m = 0 H1 : h m 6= 0
Pero para esto necesitamos saber el comportamiento de las varianzas en ambas poblaciones.
Luego debemos probar si son iguales o no.
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

7.1 Ejercicios Resueltos

115

H0 :

h2
=1
2
m

H1 :

h2
6= 1
2
m

Esta hipotesis, la rechazamos si:


s2h
> Fnh 1,nm 1,1 2
s2m

s2h
< Fnh 1,nm 1, 2
s2m

con = 0,05, luego reemplazando nos preguntamos:


1002
> F24,10,0,975 ?
902

1002
< F24,10,0,025 ?
902

1
donde F24,10,0,975 = 3,36 y F24,10,0,025 = F10,24,0,975
= 0,3788, luego comparando, observamos
que las desigualdades no se dan, por lo tanto no existe evidencia en los datos para rechazar
que las varianzas de ambas poblaciones son iguales.

Luego ahora docimamos nuestra hipotesis original, ya sabiendo que las varianzas poblaciones
son iguales pero desconocidas, con el estadstico :
T =
donde

s
Sp =

x xm
qh
Sp n1h + n1m

(nh 1)s2h + (nm 1)s2m


= 97,165
nh + nm 2

Luego reemplazando en el estadstico, tenemos que:


T =

205 135
q
1
97,165 25
+

= 1,99
1
11

Ahora, H0 la rechazamos si:


x xm
qh
> t,1 2
Sp n1h + n1m

x xm
qh
< t,1 2
Sp n1h + n1m

con = nh + nm 2, luego t,1 2 = t34,0,975 = 2,03. Luego haciendo las comparaciones


respectivas, concluimos que no existe evidencia en los datos para rechazar H0 , es decir, las
distancias medias recorridas para ambos sexos, en los pelicanos no difieren significativamente.
EJERCICIO 6
Se investiga el diametro de las varillas de acero fabricadas por dos maquinas diferentes
de extrusion. Para ello se toman dos muestras aleatorias de tama
no n1 = 15 y n2 = 18;
2
las medias y las varianzas muestrales son x = 8,73, S1 = 0,35, x2 = 8,68 y S22 = 0,4,
respectivamente.
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

116

Captulo 7. Intervalos de Confianza y Test de Hip


otesis
(a) Suponga que 12 = 22 . Construya un intervalo de confianza bilateral del 95 % para la
diferencia en el diametro promedio de la varilla.
(b) Construya un intervalo de confianza bilateral del 95 % para el cuociente de las varianzas
2
poblacionales 12 . Parece razonable concluir que las varianzas son iguales?
2

(c) Pruebe la hipotesis H0 : 1 = 2 versus H1 : 1 6= 2 . Utilice = 0,05 y obtenga


conclusiones.
(d) Calcule el valor p aproximado para esta prueba.

SOLUCION
(a) Para el caso dado, tenemos el siguiente pivote:
(
x y) (1 2 )
q
tn1 +n2 2
Sp n11 + n12
donde

(n1 1)S12 + (n2 1)S22


n1 + n2 2
Por lo tanto reemplazando los datos entregados, en el pivote y en Sp2 correctamente, se tiene
que Sp2 = 0,38, t15+182,1 2 = 2,042 y
r
p
1
1
IC(1 2 ) = 8,73 8,68 0,38
+
2,042
15 18
Luego se obtiene que con un 95 % de confianza la diferencia de los diametros promedios de
las varillas se encuentra en
Sp2 =

1 2 [0,39, 0,49]
Note que el 0 al intervalo, luego esto quiere decir que las medias se pueden considerar
iguales con un 95 % de confianza.
(b) Para el caso dado, tenemos el siguiente pivote:
S12 /12
Fn1 1,n2 1
S22 /22
Luego el intervalo queda de la forma

 2  2
S2
S22
2
IC
=
Fn 1,n2 1,/2 , 2 Fn1 1,n2 1,1/2
12
S12 1
S1
Luego reemplazando se tiene
22
[0,393, 3,109]
12
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

7.1 Ejercicios Resueltos

117

Note que el 1 pertenece al intervalo, luego con un 95 % de confianza, se puede decir que las
varianzas son iguales.
(c) Para tal test de hipotesis y considerando los resultados de las letra (b), el estadstico de
prueba es

T =

x y
q
Sp n11 +

1
n2

tn1 +n2 2

El cual rechaza la hipotesis nula si T > tn1 +n2 2,1/2 o bien T < tn1 +n2 2,1/2 .
Luego reemplazando y evaluando se tiene que

T =

x y
q
Sp n11 +

1
n2

8,73 8,63
q
1
1
0,38 15
+ 18

= 0,23

Luego como T 2,039 y T 2,039, no existe evidencia presente en los datos para rechazar
H0 .
(d) El V alorp = P (Z > 0,23) = 0,492 y como este es mayor que 0.05 (), no se rechaza H0 .
EJERCICIO 7
Los siguientes datos fueron recabados en un experimento dise
nado para verificar si existe
diferencia sistematica en los pesos obtenidos con dos balanzas diferentes.

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

118

Captulo 7. Intervalos de Confianza y Test de Hip


otesis
Peso en Gramos
Roca Balanza 1 Balanza 2
1
11.23
11.27
2
14.36
14.41
3
8.33
8.35
4
10.50
10.52
5
23.42
23.41
6
9.15
9.17
7
13.47
13.52
8
6.47
6.46
9
12.40
12.45
10
19.38
19.35

Pruebe si la diferencia de las medias de los pesos obtenidos con las balanzas es significativa.

SOLUCION
En este caso lo que tenemos son muestras pareadas y lo que se pide es testear las siguientes
hipotesis
H 0 : x = y

vs H1 : x 6= y

Cuyo estadstico de prueba es

T =

n
X

donde

2
SD

X Y
tn1
SD / n
n
X

2
(di d)

i=1
n1

, di = Xi Yi y d =

di

i=1
n

el cual rechaza H0 si T > tn1,1/2 o bien si T < tn1,1/2


Luego tenemos que
1
2
3
4
5
6
7
8
9
10
i
Xi Yi 0,04 0,05 0,02 0,02 0,01 0,02 0,05 0,01 0,05 0,03
2
de donde se obtiene que d = 0,02 y SD
= 0,028672
Luego el estadstico queda

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

7.1 Ejercicios Resueltos

119

T =

X Y

SD / n
12,871 12,891

0,0286/ 10

= 2,2114

Por lo tanto, como T 2,26 = t9,0,975 y T 2,26 = t9,0,975 , no existe evidencia en los
datos para rechazar H0 .
EJERCICIO 8
De dos procesos de produccion de plastico se seleccionaron de cada 10 especmenes en forma
independiente. Las mediciones de resistencia fueron:

Plastico A 3.03 5.53 5.6 9.3 9.92 12.51 12.95 15.21 16.04 16.84
Plastico B 3.19 4.26 4.47 4.53 4.67 4.69 12.87 6.79 9.37 12.75

Utilice la teora normal para testear la hipotesis que no existe diferencia entre los procesos
de produccion.

SOLUCION
Bajo la teora de Normalidad tenemos:
H 0 : A = B

vs H1 : A 6= B

lo cual se testea con el estadstico


T =

XA XB
q
tnA +nB 2
Sp n1A + n1B

el cual rechaza H0 si T > tnA +nB 2,1/2 o bien si T < tnA +nB 2,1/2 .

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

120

Captulo 7. Intervalos de Confianza y Test de Hip


otesis
Luego reemplazando tenemos que Sp =

T =

18,096 = 4,25 y por lo tanto

XA XB
q
Sp n1A + n1B
10,693 6,75
p
4,25 2/10

= 2,075

Finalmente como T = 2,075 2,10 = t0,975,18 y T = 2,075 2,10 = t0,975,18 , no existe


evidencia presente en los datos para rechazar H0 , es decir, con un 95 % de confianza, no
existe diferencia entre los procesos.
EJERCICIO 9
Los siguientes datos se refieren a los efectos de un farmaco en la presion sangunea de pacientes hipertensos. Los valores corresponden a la presion sistolica de los pacientes despues
del perodo placebo y despues del tratamiento con la droga (se realizo una prueba cruzada,
actuando cada paciente como su propio control).
Placebo 211 210 210 191 196 190 191 177 173 170 156
Droga 181 172 196 203 167 161 178 160 149 119 163
Sugieren estos datos que la nueva droga reduce significativamente el sistolico de la presion
sangunea?. Use = 0,05.

SOLUCION
Bajo la teora de normalidad tenemos que las hipotesis a testear son:
H 0 : P D

vs H1 : P > D

Considerando que tenemos observaciones pareadas, es decir, dos observaciones a cada individuo (antes y despues). Por lo tanto el estadstico a utilizar es:

T =

donde d = X A X B y

2
SD

Pn

i=1 (di d)

n1

xP xD
tn1
SD / n

= 340,77, el cual rechaza H0 , si T > tn1,1 .

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

7.1 Ejercicios Resueltos

121

T =

xP xD

SD / n
188,6 168,1

18,46/ 11

= 3,68

Por lo tanto como T = 3,68 > 1,812 = t10,0,95 , se rechaza H0 , es decir, con un 95 % de
confianza la nueva droga reduce la presion.
EJERCICIO 10
Un instructor de perros esta entrenando a 27 animales para que obedezcan cierto mandato.
El instructor utiliza dos tecnicas de entrenamiento diferentes, una en la que recompensa y
alimenta (I), y otra en la que no se da recompensa alguna (II). La tabla siguiente muestra
el n
umero de sesiones de obediencia que fueron necesarias antes de que un can obedeciera
el mandato. Tiene el instructor la evidencia suficiente para aseverar que el metodo de la
recompensa requerira, en promedio, menos tiempo de entrenamiento?. Plantee las hipotesis,
llegue a conclusiones utilizando un nivel de significancia de = 0,05.
Entrenamiento I
Entrenamiento II

29 27 32
40 44 33

25
26

27
31

28 23 31
29 34 31

37
38

28
33

22
42

24 28 31
35

34

SOLUCION
Tenemos que son dos muestras independientes, y por simplicidad asumiremos que las varianzas poblacionales de cada una de las muestras son iguales. Luego las hipotesis quedan:
H0 : I II

vs H1 : I < II

Las cuales se testean con el estadstico

T =

2
(n 1)S 2 +(n 1)SII

I
II
I
donde Sp =
nI +nII 2
en este caso tenemos

X I X II
q
tnI +nII 2
Sp n1I + n1II

= 5, el cual rechaza H0 cuando T < tnI +nII 2,1 . Luego

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

122

Captulo 7. Intervalos de Confianza y Test de Hip


otesis

T =

X I X II
q
Sp n1I + n1II

28,4 34,7
= q
1
1
5 15
+ 12
= 3,25
Por lo tanto como T = 3,25 < 1,7 = t25,0,05 se rechaza H0 , es decir, el instructor tiene
evidencia para aseverar que el metodo de la recompensa, requiere menos sesiones de entrenamiento.
EJERCICIO 11
En un proceso de ba
no qumico utilizado para grabar tarjetas de circuito impreso, se estan
comparando dos diferentes catalizadores para determinar si requieren diferentes tiempos de
inmersion para remover cantidades identicas de material fotorresistente. Se efectuaron 12
ba
nos con el catalizador 1, resultando un tiempo de inmersion medio de x1 = 24,6 min. y
una desviacion estandar de s1 = 0,85 min.. Con el catalizador 2 se efectuaron 15 ba
nos, siendo el tiempo de inmersion medio de x2 = 22,1 min. y una desviacion estandar de s2 = 0,98
min. Se desea determinar si hay diferencia significativa en los tiempos de inmersion al utilizar
un catalizador en especial. Para responder esto construya un intervalo de confianza al 95 %
de confianza. Considere que no se conoce el comportamiento de las varianzas poblacionales.

SOLUCION
Primero se debe concluir el comportamiento de las varianzas para decidir que tipo de intervalo hacer. Para ello se construira un intervalo de confianza para el cuociente de varianzas
al 95 % de confianza.
s22
22
s22
F

F11,14,0,975
11,14,0,025
s21
12
s21
0,982
12
0,982
0,2977 2
3,094
0,852
2
0,852
12
4,112
22
Luego con un 95 % de confianza, puesto que el intervalo incluye la unidad, podramos no requerir que las varianzas de los tiempos de inmersion para los dos catalizadores sean diferentes.
0,395

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

7.1 Ejercicios Resueltos

123

Luego debemos hacer un intervalo de confianza para diferencia de medias, con varianzas
desconocidas pero iguales. Usando Minitab:

Two-Sample T-Test and CI


Sample
1
2

N
12
15

Mean
24,600
22,100

StDev
0,850
0,980

SE Mean
0,25
0,25

Difference = mu (1) - mu (2)


Estimate for difference: 2,50000
95% CI for difference: (1,76213; 3,23787)
T-Test of difference = 0 (vs not =): T-Value = 6,98
Both use Pooled StDev = 0,9251

P-Value = 0,000

DF = 25

De aqu concluimos con 95 % de confianza que el catalizador 1 requiere un tiempo de inmersion, que esta entre 1.76 min. y 3.24 min., mas largo que el requerido por el catalizador 2.

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

124

Captulo 7. Intervalos de Confianza y Test de Hip


otesis

7.2.

Ejercicios Propuestos

1. Un fabricante produce anillos para los pistones de un motor de automovil. Se sabe que
el diametro del anillo esta distribuido aproximadamente de manera normal, y que tiene
una desviacion estandar = 0,001 mm. Una muestra aleatoria de 15 anillos tiene un
diametro promedio de X = 74,036 mm.
a) Construya un IC bilateral del 99 % para el diametro promedio del anillo.
b) Construya un lmite inferior de confianza del 95 % para el diametro promedio del
anillo.
2. Se utilizan dos maquinas para llenar botellas de plastico con detergente para maquinas
lavaplatos. Se sabe que las desviaciones estandar del volumen de llenado son 1 = 0,10
onzas de lquido y 2 = 0,15 onzas de lquido para las dos maquinas, respectivamente.
Se toman dos muestras aleatorias, n1 = 12 botellas de la maquina 1 y n2 = 10 botellas
de la maquina 2. Los vol
umenes promedio de llenado son x1 = 30,87 onzas de lquido
y x2 = 30,68 onzas de lquido.
a) Construya un IC bilateral del 90 % para la diferencia entre las medias del volumen
de llenado.
b) Construya un IC bilateral del 95 % para la diferencia entre las medias del volumen
de llenado. Compare el ancho de este intervalo con el ancho del calculo en el inciso
a).
c) Construya un IC superior del 95 % para la diferencia de medias del volumen del
llenado.
3. Se prueban dos formulas diferentes de un combustible oxigenado para motor en cuanto
al octanaje. La varianza del octanaje para la formula 1 es 12 = 1,5, mientras que para
la formula 2 es 22 = 1,2. Se prueban dos muestras aleatorias del tama
no n1 = 15 y
n2 = 20. Los octanajes promedios observados son x1 = 89,6 y x2 = 92,5. Construya un
IC bilateral del 95 % para la diferencia en el octanaje promedio.
4. Considere la situacion sobre pruebas de octanaje descrita en el ejercicio anterior.
Que tama
no de muestra se requiere para cada poblacion si se desea tener una confianza del 95 % de que el error al estimar la diferencia entre las medias de octanaje sea
menor que 1?
5. Se piensa que la concentracion del ingrediente activo de un detergente lquido para
ropa, es afectada por el tipo de catalizador utilizado en el proceso de fabricacion. Se
sabe que la desviacion estandar de la concentracion activa es de 3g/l sin importar el
tipo de catalizador utilizado. Se realizan diez observaciones con cada catalizador, y se
obtiene los datos siguientes:
Catalizador1 : 57,9 66,2 65,4 65,4 65,2 62,6 67,6 63,7 67,2 71,0
Catalizador2 : 66,4 71,7 70,3 69,3 64,8 69,6 68,6 69,4 65,3 68,8

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

7.2 Ejercicios Propuestos

125

a) Encuentre un IC del 95 % para la diferencia entre las medias de las concentraciones


activas para los dos catalizadores.
b) Existe alguna evidencia que indique que las concentraciones activas medias dependen del catalizador utilizado?
6. Un ingeniero civil hace pruebas con la resistencia a la comprension del concreto. Para
ello elimina 12 especmenes y obtiene los siguientes datos
2216 2237 2249 2204
2225 2301 2281 2263
2318 2255 2275 2295
a) Construya un IC bilateral del 95 % para la resistencia promedio.
b) Construya un IC inferior del 95 % para la resistencia promedio.
7. La pintura para autopistas se surte en dos colores: blanco y amarillo. El interes se centra
en el tiempo de secado de la pintura; se sospecha que la pintura de color amarillo se
seca mas rapidamente que la blanca. Se obtienen mediciones de ambos tipos de pintura.
Los tiempos de secado (en minutos) son los siguientes:
Blanca : 120 132 123 122 140 110 120 107
Amarilla : 126 124 116 125 109 130 125 117 129 120
a) Encuentre un IC del 95 % para la diferencia entre los tiempos de secado promedio,
suponiendo que las desviaciones estandar de estos son iguales. Suponga que el
tiempo de secado esta distribuido de manera normal.
b) Existe alguna evidencia que indique que la pintura amarilla se seca mas rapidamente que la blanca?
8. Considere los datos del ejercicio 6). Construya lo siguiente.
a) Un IC bilateral de 99 % para 2 .
b) Un IC inferior del 99 % para 2 .
c) Un IC superior del 99 % para 2 .
9. Considere los datos del ejercicio 5). Encuentre un IC del 95 % para el cuociente de las
dos varianzas 12 /22 . Parece razonable concluir que las dos varianzas son iguales?
10. Se toma una muestra de 50 cascos de suspension utilizados por los corredores de motocicleta y los conductores de automoviles de carrera, y se sujetan a una prueba de
impacto. En 18 de los cascos se observa cierto da
no.
a) Encuentre un IC bilateral del 95 % para la verdadera proporcion de cascos de este
tipo que demostraran da
no como resultado de la prueba.
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

126

Captulo 7. Intervalos de Confianza y Test de Hip


otesis
b) Al utilizar la estimacion puntual de p obtenida a partir de la muestra preliminar
de 50 cascos, cuantos cascos deben probarse para tener una confianza del 95 %
que el error al estimar el verdadero valor de p sea menor que 0.02?
c) De que tama
no debe ser la muestra si se desea tener una confianza de al menos
95 % de que el error al estimar p sea menor que 0.02, sin importar el valor verdadero de p?
11. Se analiza la fraccion de productos defectuosos producidos por dos lneas de produccion.
Una muestra aleatoria de 100 unidades provenientes de la lnea 1 contiene 10 que son
defectuosos, mientras que una muestra aleatoria de 120 unidades de la lnea 2 tiene
25 que son defectuosas. Encuentre un IC del 99 % para la diferencia en fracciones de
productos defectuosos producidos por las dos lneas.
12. Un fabricante de gasolinas mide el octanaje de sus productos. A continuacion se presentan los datos obtenidos de 30 muestras tomadas del proceso de produccion. Encuentre
un intervalo de tolerancia del 95 % que contenga al menos el 95 % de los valores de
octanaje para la gasolina producida por ese proceso.
86,98
87,10
87,10
86,94
86,91

86,90
87,13
86,91
86,92
86,83

86,94
86,92
87,03
87,16
87,19

87,11
87,04
86,91
87,08
86,81

86,80
86,92
87,05
87,13
86,98

87,02
87,13
86,95
86,84
86,97

13. Supongase que conocemos que un saco podra contener 1 bola roja y 4 bolas blancas o,
alternativamente, 4 bolas rojas y 1 blanca. Una bola es extrada, y la hipotesis que una
bola es roja y 4 bolas son blancas puede ser no rechazada si y solo s la bola extrada
es blanca.
(a) Encontrar y
(b) Cuales son los valores de y si la alternativa es 3 bolas rojas y 2 bolas blancas
14. Supongase que sabemos que un saco podra contener 2 bolas rojas y 3 blancas (la
hipotesis a ser testeada) o 3 bolas rojas y 2 blancas (la alternativa). Dos bolas son
extradas sin reemplazo, y la hipotesis es rechazada si y solo si ambas bolas extradas
son rojas. Hallar y
15. Una caja contiene 10 bolas, y queremos testear la hipotesis que 2 bolas son rojas y 8
son blancas frente a la alternativa que mas de 2 bolas son rojas. Extraemos 2 bolas
sin reemplazo y rechazamos la hipotesis si y solo si ambas bolas extradas son rojas. a)
Hallar a b) Hallar b(q) y graficar la funcion potencia
(a) Hallar
(b) Hallar () y graficar la funcion potencia
16. Si una moneda es tirada 5 veces y sale 5 veces cara, podemos concluir que la moneda
no es honesta?
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

7.2 Ejercicios Propuestos

127

17. Considere el siguiente caso no matematico como una prueba de hipotesis. En la escena
de un accidente grave, un medico contrasta la hipotesis nula esta vctima esta viva.
(a) Establezca cuidadosamente el significado de los cuatro resultados posibles indicados en la tabla 1.
(b) Decida sobre la gravedad de los errores posibles.
(c) Si y pudiesen ser controlados estadsticamente, que conjunto de probabilidades seran preferibles para la vctima?
I. =0.001 y =0.10
II. =0.05 y =0.05
III. =0.10 y =0.001
Tabla 1
Hipotesis Nula
Decision
Verdadera
Falsa
No se rechaza Ho Decision correcta Error tipo II
Se rechaza Ho
Error tipo I
Decision correcta
18. Un fabricante de fibras textiles esta investigando una nueva fibra para tapicera, la cual
tiene una elongacion media por hilo de 12 kg. con una desviacion estandar de 0.5 kg.
La compa
na desea probar la hipotesis H0 : < 12, utilizando para ello una muestra
aleatoria de 4 especmenes.
19. Un consumidor de cierto producto acusa al fabricante diciendo que mas del 20 % de
las unidades producidas eran defectuosas. Para confirmar su acusacion se utilizo una
muestra de tama
no 50 donde el 27 % de los artculos eran defectuosos Que concluye
usted?
20. Una fabrica de hamburguesas inicio un proceso de revision de los estandares de calidad
de sus productos. Dichos estandares establecen ciertas dimensiones para el diametro
de sus hamburguesas, el diametro medio es de 13.9 cm con una desviacion estandar
estimada de 0.9 cm. Un estandar de calidad establece que el diametro medio de las
hamburguesas debe ser de 14.5 cm. Hay alguna evidencia en los datos que las hamburguesas tienen un diametro incorrecto? Que supuesto utilizo?
21. Se utilizan dos maquinas para llenar botellas de plastico con un volumen neto de
16.0 onzas. Las distribuciones de los vol
umenes de llenado pueden suponerse normales,
con desviaciones estandar 1 = 0,020 y 2 = 0,025 onzas. Un miembro del grupo de
ingeniera de calidad sospecha que el volumen neto de llenado de ambas maquinas es el
mismo, sin importar si este es o no de 16 onzas. De cada maquina se toma una muestra
aleatoria de 10 botellas.
Maquina 1: 16,03 16,04 16,05 16,05 16,02 16,01 15,96 15,98 16,02 15,99
Maquina 2: 16,02 15,97 15,96 16,01 15,99 16,03 16,04 16,02 16,01 16,00

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

128

Captulo 7. Intervalos de Confianza y Test de Hip


otesis
a) Se encuentra el ingeniero en lo correcto? Utilice = 0,05.
b) Cual es el valor-p de esta prueba?
c) Si se supone que el tama
no de las muestras es el mismo, que tama
no de muestra
debe utilizarse para asegurar que = 0,05 si la diferencia verdadera entre las
medias es 0.08? Suponga que = 0,05.
d ) Cual es la potencia de la prueba del inciso a) si la diferencia verdadera entre las
medidas es 0.08?
22. Existen dos tipos de plasticos apropiados para su uso por un fabricante de componentes
electronicos. La tension de ruptura de este plastico es un parametro importante. Se
sabe que 1 = 2 = 1,0 psi. De una muestra aleatoria de tama
no n1 = 10 y n2 = 12, se
tiene que x1 = 162,5 y x2 = 155,0. La compa
na no adoptara el plastico 1 a menos que
la tension de ruptura de este exceda a la del plastico 2 al menos por 10 psi. Con base
a la informacion contenida en la muestra, La compa
na debera utilizar el plastico 1?
Utilice = 0,05 para llegar a una decision.
23. En una industria se desea verificar si la productividad media de los operarios del perodo
diurno es igual a la productividad media de los operarios del perodo nocturno. Se
supone que las productividades de los operarios de los diferentes perodos son independientes y normalmente distribuidas. Se seleccionan muestran de igual tama
no para
cada uno de los perodos obteniendose los siguientes resultados:
Perodo No de operarios
Diurno
15
Nocturno
15

Media Varianza
12
35.71
10
36.43

a) Verifique igualdad de varianzas con nivel = 0,1


b) Verifique si las productividades medias son iguales con nivel = 0,05.
c) Determine la probabilidad de aceptar la igualdad de medias en (b), si la realidad
es que la diferencia entre las productividades medias es de una unidad. Aproxime
los valores t1 por z1 .
24. Para alcanzar la maxima eficiencia en una operacion de ensamblaje en una fabrica los
obreros nuevos requieren alrededor de un mes de capacitacion. Se sugiere un nuevo
metodo de capacitacion y se realiza una prueba para compararlo con el tradicional.
Para este fin se capacitan dos grupos de nueve obreros durante un perodo de tres
semanas; uno de los grupos aplica el nuevo metodo y el otro el tradicional. Al final
de las tres semanas de capacitacion se mide el tiempo (en minutos) que le toma a
cada obrero ensamblar el dispositivo. Los resultados obtenidos de las muestras son los
siguientes (asuma normalidad de los datos)
Estadstico
n
Promedio
Varianza

Metodo
Tradicional Nuevo
9
9
35
31
25
20

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

7.2 Ejercicios Propuestos

129

Hay suficiente evidencia que indique que las medias de los tiempos reales son diferentes
con los dos metodos? Realice una prueba con el nivel = 5 %. Determine el valor-p de
la prueba. (sea explcito, de hipotesis, test y conclusion).
25. El contenido de nicotina de dos marcas de cigarros, medidas en miligramos, es la
siguiente:
A
B

2.1 4.0 6.3 5.4 4.8 3.7 6.1 3.3


4.1 0.6 3.1 2.5 4.0 6.2 1.6 2.2 1.9 5.4

Los contenidos de nicotina de las dos marcas seran diferentes?. Considere = 5 %.


26. Un experimento quiere determinar la eficacia de un nuevo elemento versus la dieta
actual (control) para reducir la cantidad de grasa en los cerdos. Los datos se encuentran
en la siguiente tabla:
Nuevo
Control

676 206 230 256 280 433


88 570 605 617 653 2913

337 466 497


924 286 1098

512 794
982 2346

428 452 512


321 615 519

Utilice la teora normal para testear la hipotesis de que existe diferencia entre los dos
tipos de produccion.
27. Para la elaboracion de un neumatico se utilizan dos metodos. A dichos neumaticos se
les mide el desgaste. Se seleccionan 12 neumaticos de cada tipo y siendo sus mediciones
de desgaste, las siguientes:
Proceso 1 329 436 457 463 477 479 1297 1319 1340 1385 1398 1440
Proceso 2 313 563 670 940 1002 1261 1305 1531 1614 1694 1701 1708
Utilice la teora de normalidad para testear la hipotesis de que no existe diferencia
entre los metodos de elaboracion.
28. Se efect
ua una prueba de impacto Izod sobre 20 muestras de tubera PVC. El estandar
ASTM para este material requiere que la resistencia al impacto Izod sea mayor que
1.0 ft-lb/in. El promedio y la desviacion estandar muestrales son x = 1,25 y s = 0,25,
respectivamente. Pruebe H0 : = 1,0 contra H1 : > 1,0 utilizando = 0,01. Obtenga
conclusiones.
29. En la fabricacion de semiconductores, a menudo se utiliza una sustancia qumica para
quitar el silicio de la parte trasera de las obleas antes de la metalizacion. En este
proceso es importante la rapidez con la que act
ua la sustancia. Se han comparado dos
soluciones qumicas, utilizando para ello dos muestras aleatorias de 10 obleas para cada
solucion. La rapidez de accion observada es la siguiente (en mils/min):
Solucion 1: 9,9 9,4 9,3 9,6 10,2 10,6 10,3 10,0 10,3 10,1
Solucion 2: 10,2 10,6 10,7 10,4 10,5 10,0 10,2 10,7 10,4 10,3

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

130

Captulo 7. Intervalos de Confianza y Test de Hip


otesis
a) Los datos apoyan la informacion que la rapidez promedio de accion es la misma
para ambas soluciones? Para obtener sus conclusiones, utilice = 0,05 y suponga
que las varianzas de ambas poblaciones son iguales.
b) Calcule el valor-p para la prueba del inciso (a).
c) Construya diagramas de caja para las dos muestras. Estas graficas apoyan la
hipotesis de que las varianzas son iguales? Escriba una interpretacion practica de
estas graficas.
30. El sistema de enfriamiento de un submarino nuclear esta formado por un ensamble
de tuberas soldadas por donde circula un lquido refrigerante. Las especificaciones
requieren que la resistencia de la soldadura sea mayor o igual que 150 psi.
a) Suponga que los ingenieros del dise
no deciden probar la hipotesis H0 : = 150
contra H1 : > 150. Explique por que esta eleccion de hipotesis alternativa es
mejor que H1 : < 150.
b) Al tomar una muestra aleatoria de 20 soldaduras se tiene que x = 153,7 psi. y
s = 11,3 psi. Que conclusiones pueden obtenerse con respecto a la hipotesis del
inciso a)? Utilice = 0,05.

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

Captulo 8
Test de Homogeneidad,
Independencia y Bondad de Ajuste
8.1.

Ejercicios Resueltos

EJERCICIO 1
Un ginecologo analiza la posible relacion entre la edad de la menarqua y la aparicion de
cancer de mama. Con el fin de estudiarlo clasifica a las mujeres que acuden a su consulta en
dos grupos, aquellas que tuvieron la menarqua antes de los 12 a
nos (a las que distingue con
el valor cero), y aquellas que la tuvieron despues de esta edad ( a las que distingue con el
valor 1). Se presentan a continuacion los resultados obtenidos:
Cancer de
Edad de la Menarqua
S
0
64
47
1

Mama
No
53
139

Determine si existe relacion o no entre estas variables.

SOLUCION
Para medir si existe relacion entre la edad de la menarquia y el cancer de mama, realizamos
un test de independencia.
H0 : n i j =

ni nj
n

H1 : no existe independencia

Para tal hipotesis, ocupamos el estadstico 2 .


2

X (obs esp)2
i,j

esp

en donde los observados son los valores que aparecen en la tabla y los esperados los calculamos mediante H0 , por ejemplo, el esperado para la casilla
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

132

Captulo 8. Test de Homogeneidad, Independencia y Bondad de Ajuste

n11 =

117 111
n1 n1
=
= 42,8613
n
303

Luego para cada casilla, los esperados seran los que se muestran a continuacion:
Cancer
Si
No
64
53
42,86
74,14

0
Edad
1

Total
117

47
68,14

139
117,86

186

111

192

303

Total

Luego el estadstico nos queda de la siguiente manera:


2 =

(64 42,86)2 (53 74,14)2 (47 68,17)2 (139 117,86)2


+
+
+
42,86
74,14
68,14
117,86

= 10,425 + 6,027 + 6,558 + 3,791


= 26,801
Ahora, rechazamos H0 si 2 > 2(f ilas1)(columnas1),1 donde filas en este caso tenemos 2 y
columnas 2 y el lo escogemos como 0.05. Por lo tanto tenemos 21,0,95 = 3,84 buscado en
una tabla de la distribucion Chi-Cuadrado.
Luego, como 2 = 26,801 > 21,0,95 = 3,84 se rechaza la hipotesis de que ambas variables
sean independientes con un 95 % de confianza.
EJERCICIO 2
De un proceso de fabricacion, se seleccionan 100 ampolletas de 75 watts y se lleva a cabo
una prueba para determinar la vida u
til de estas ampolletas. El resultado de esta prueba, en
miles de horas, se resume en la siguiente tabla:
Tiempo de Duracion
N o de Ampolletas

0 - 0.2 0.2 - 0.4 0.4 - 0.6 0.6 - 0.8 0.8 - 1 1 - 1.1


29
20
15
9
12
15

Se puede concluir al nivel de significancia del 5 %, que la vida u


til de todas las ampolletas
se distribuye exponencial?

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

8.1 Ejercicios Resueltos

133

SOLUCION
En este caso debemos hacer un test de Bondad de Ajuste, para una distribucion exponencial
de los datos.
Para esto debemos sacar las frecuencias esperadas para cada uno de los rangos, bajo la
hipotesis de una distribucion exponencial, luego primero debemos estimar el parametro de
la exponencial.
Sabemos que la E(X) = 1 cuando X Exp(), luego ocupemos el estimador de la media:
P
x =

M C fi
1
P
= 0,4865 =
fi

La media la calculamos as por tener los datos en una tabla de frecuencias.


Luego, obtenemos que:
=

1
= 2,055
0,4865

Posteriormente, calculamos las probabilidades de estar en cada uno de las clases de la tabla
de frecuencias, para despues calcular la frecuencia esperada.
0,2

2,055e2,055x dx = 0,337

P (0 < X < 0,2) =


0
0,4

2,055e2,055x dx = 0,2234

P (0,2 < X < 0,4) =


0,2
0,6

2,055e2,055x dx = 0,1481

P (0,4 < X < 0,6) =


0,4
0,8

2,055e2,055x dx = 0,0982

P (0,6 < X < 0,8) =


0,6

2,055e2,055x dx =

P (0,8 < X < 1,0) =

0,0651

0,8

Z
P (1,0 < X < 1,1) =

1,1

2,055e2,055x dx = 0,0237

Como tenemos un total de 100 observaciones, las frecuencias esperadas las obtenemos multiplicando la probabilidad de estar en la clase por 100, es decir:
fesperada [0 0,2] = P (0 < X < 0,2) 100 = 33,7
Luego haciendo el calculo para cada celda, queda:
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

134

Captulo 8. Test de Homogeneidad, Independencia y Bondad de Ajuste


Tiempo de Duracion 0 - 0.2 0.2 - 0.4 0.4 - 0.6 0.6 - 0.8 0.8 - 1 1 - 1.1
N o de Ampolletas
29
20
15
9
12
15
o
N de Amp. Esperado 33.7
22.34
14.81
9.82
6.51
2.37
Finalmente para testear nuestra hipotesis
H0 : Los datos distribuyen Exponencial v/s H1 : No distribuyen exponencial
Ocupamos el estadstico
2 =

X (obsi espi )2
i

espi

(29 33,7)2 (20 22,34)2 (15 14,81)2 (9 9,82)2 (12 6,51)2 (15 2,37)2
+
+
+
+
+
33,7
22,34
14,81
9,82
6,51
2,37

= 72,9
umero de clases y p
Luego rechazamos H0 si 2 > 21,kp1 = 20,95,611 = 9,48 con k el n
el n
umero de parametros de la distribucion.
Por lo tanto, como 72,9 > 9,48 se rechaza la postura de una distribucion exponencial en los
datos del tiempo de vida de las ampolletas.
EJERCICIO 3
Un mecanico analiza la posible relacion entre la edad de la maquina y la aparicion de una
falla grave. Con el fin de estudiarlo clasifica a las maquinas en dos grupos, aquellas que
tuvieron una falla grave antes de los 12 a
nos (a las que distingue con el valor 0), y aquellas
que la tuvieron despues de esta edad (a las que distingue con el valor 1). Se presentan a
continuacion los resultados obtenidos:
Falla
Si
Edad Maquina 0 64
1 47

Grave
No
53
139

(a) Calcule el Test 2 de Pearson.


(b) Determine si existe relacion o no entre la variables

SOLUCION
Completamos la tabla dada con los valores esperados
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

8.1 Ejercicios Resueltos

135
Falla Grave
Si
No
0
64
53
42,861 74,139

Total
117

Edad Maquina
1

Total

47
68,139

139
117,861

186

111

192

303

(a) Dada la tabla completa con los los valores esperados calculamos el estadstico como
sigue:
r X
c
X
(Oij Eij )2
=
Eij
i=1 j=1
2

2 X
2
X
(Oij Eij )2
=
Eij
i=1 j=1

(64 42,8613)2 (53 74,138)2 (47 68,138)2 (139 117,861)2


+
+
+
42,8613
74,138
68,138
117,861

= 10,425 + 6,027 + 6,558 + 3,791


= 26,801
(b) Se rechaza H0 : independencia entre la edad de la maquina y si la falla es grave si
2 > (1;(f 1)(c1))
Como
2 = 26,801 > 3,841459 = 0,95;1
Se rechaza la hipotesis de independencia entre las fallas graves y la edad de las maquinas.
EJERCICIO 4
Suponga que cierto artculo puede presentar hasta 4 defectos diferentes. Una muestra aleatoria de 625 de estos artculos es clasificado de acuerdo al n
umero de defectos, obteniendose lo
siguiente:
# de defectos
# de casos

0
1
82 185

2
182

3
110

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

4
66

136

Captulo 8. Test de Homogeneidad, Independencia y Bondad de Ajuste


Un ingeniero afirma que el n
umero de defectos X es una variable aleatoria con distribucion
de probabilidad
 1 2x
x = 1, 2, 3, 4
7 x!
P (X = x) =
0
e.o.c
Que podra concluir, en base a los datos de la muestra, con = 0,05, respecto de lo firmado
por el ingeniero?

SOLUCION
Necesitamos calcular las frecuencia esperadas, mediante las probabilidades.
P (X = 0) =

1 20
7 0!

= 0,1428

P (X = 1) =

1 21
7 1!

= 0,2857

P (X = 2) =

1 22
7 2!

= 0,2857

P (X = 3) =

1 23
7 3!

= 0,1904

P (X = 4) =

1 24
7 3!

= 0,0952

luego el n
umero de casos esperados sera
Ei = P (X = i) 625 = no de defectos igual a i
una vez calculados estos valores tenemos lo siguiente
# de defectos (i)
0
1
2
3
4
# de casos observado (Oi )
82
185
182
110 66
# de casos esperados (Ei ) 89.25 178.56 178.56 119 59.5
Para la hipotesis H0 : los datos distribuyen con la funcion de probabilidad dada.
Se rechaza H0 si
2 =

5
X
(Oi Ei )2
i=1

Ei

> 21;kp1

donde k: n de clases y p: n de parametros.


Luego
2 = 2,2782 20,95;501 = 9,4877
por lo tanto no existe evidencia suficiente bajo un 95 % de confianza para rechazar H0 , es
decir, los datos pueden ser modelados por la distribucion dada.

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

8.1 Ejercicios Resueltos

137

EJERCICIO 5
Una empresa empaca determinado producto de latas de tres tama
nos distintos, cada uno en
distinta lnea de produccion. La mayor parte de las latas se apegan a las especificaciones,
pero un ingeniero de control de calidad ha identificado los siguientes defectos:
Mancha en la lata.
Grieta en la lata.
Ubicacion incorrecta del anillo de apertura.
Falta del anillo de apertura.
Otras.
Se selecciona una muestra de unidades defectuosas de cada una de las tres lneas, y cada
unidad se clasifica seg
un el defecto, la siguiente tabla de contingencia incluye esos datos:
Defecto
Mancha Grieta Ubicacion
Lnea
1
34
65
17
de
2
23
52
25
Produccion
3
32
28
16
Total
89
145
58

Falta
21
19
14
54

Otras
13
6
10
29

Tama
no de la muestra
150
125
100
375

Los datos sugieren desigualdad en las proporciones que caen en las distintas categoras de
las tres lneas?

SOLUCION
Los parametros de interes son las diversas proporciones y las hipotesis relevantes son:
H0 : Las lneas de produccion son homogeneas con respecto a las 5 categoras que no cumplen
las especificaciones.
H1 : Las lneas de produccion no son homogeneas con respecto a las 5 categoras que no
cumplen las especificaciones.
Ahora se presenta una tabla resumen con los valores esperados y el valor de (Obs.
Esp.)2 /Esp.
1

C1
34
35,60
0,072

C2
65
58,00
0,845

C3
17
23,20
1,657

C4
21
21,60
0,017

C5
13
11,60
0,169

Total
150

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

138

Captulo 8. Test de Homogeneidad, Independencia y Bondad de Ajuste


2

23
29,67
1,498

52
48,33
0,278

25
19,33
1,661

19
18,00
0,056

6
9,67
1,391

125

32
23,73
2,879

28
38,67
2,943

16
15,47
0,018

14
14,40
0,011

10
7,73
0,664

100

Total

89

145

58

54

29

375

luego, bajo un 95 % de confianza


2 = 14,159 15,50731 = 20,95;(31)(51)
lo que indica que no existe suficiente evidencia para rechazar H0 , es decir las lneas de produccion seran homogeneas con respecto a las 5 categoras que no cumplen las especificaciones.
Si disminuimos la confianza a un 90 % tenemos que
2 = 14,159 > 13,36157 = 20,90;(31)(51)
luego, ahora s existira evidencia bajo este nivel de significancia para rechazar H0 .
EJERCICIO 6
Un estudio de la relacion entre las condiciones de las instalaciones en gasolineras y la agresividad en el precio de la gasolina reporta los siguientes datos basados en una muestra de
n = 144 gasolineras.
Agresividad
Anticuada
24
52
Estandar
Moderna
58
n.j
134

Neutral
15
73
86
174

No agresiva ni.
17
56
80
205
36
180
133
441

En el nivel 0.01, la informacion sugiere que las condiciones de instalaciones y las polticas
de precios son independientes entre si?

SOLUCION
La hipotesis a docimar es:
H0 : Las condiciones de las instalaciones con la poltica de precios son independientes.
vs
H1 : No existe independencia.
La siguiente tabla resumen entrega la informacion necesaria para calcular el estadstico 2 .
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

8.1 Ejercicios Resueltos


C1
24
17,02
2,867

C2
15
22,10
2,278

C3
17
16,89
0,001

Total
56

52
62,29
1,700

73
80,88
0,769

80
61,83
5,343

205

58
54,69
0,200

86
71,02
3,159

36
54,29
6,159

180

Total

134

174

133

441

139

luego, bajo un 99 % de confianza


2 = 22,476 > 13,2767 = 20,99;(31)(31)
lo que indica que existe suficiente evidencia con este nivel de confianza para rechazar H0 ,
es decir el conocimiento de la poltica de precios de una gasolinera proporciona informacion
acerca de la condicion de las instalaciones de la gasolinera.
EJERCICIO 7
Se obtuvo una muestra aleatoria de individuos que viajan solos en automovil al trabajo, en
una gran zona metropolitana, y cada individuo fue clasificado de acuerdo con el tama
no de
su automovil y la distancia de recorrido citadino. La siguiente informacion sugiere que dicha
distancia y el tama
no del automovil estan relacionados en la poblacion a la cual se hizo el
muestreo? Exprese las hipotesis pertinentes y utilice una prueba Chi-cuadrado con un nivel
0.05.

Subcompacto
Tama
no de Compacto
Automovil Mediano
Grande

Distancia de Recorrido
[0, 10) [10, 20) [20, . . .)
6
27
19
8
36
17
21
45
33
14
18
6

SOLUCION
La hipotesis a docimar es:
H0 : Existe independencia entre la distancia de recorrido y el tama
no del automovil.
vs
H1 : No existe independencia.
La siguiente tabla resumen entrega la informacion necesaria para calcular el estadstico 2 .
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

140

Captulo 8. Test de Homogeneidad, Independencia y Bondad de Ajuste


C1
6
10,19
1,724

C2
27
26,21
0,024

C3
19
15,60
0,741

Total
52

8
11,96
1,309

36
30,74
0,899

17
18,30
0,092

61

21
19,40
0,131

45
49,90
0,480

33
29,70
0,367

99

14
7,45
5,764

18
19,15
0,069

6
11,40
2,558

38

Total

49

126

75

250

luego, bajo un 95 % de confianza


2 = 14, 158 > 12,59159 = 20,95;(41)(31)
lo que indica que existe suficiente evidencia con este nivel de confianza para rechazar H0 , es
decir, la distancia de recorrido proporciona informacion acerca el tama
no del automovil.
EJERCICIO 8
Una empresa quiere contratar a cierta cantidad de personas y de los postulantes que se
presentan se hace una preseleccion de 24 hombres y 24 mujeres de entre los cuales el jefe de
personal decide quien sera contratado y quien no. Despues de que el jefe de personal hizo la
seleccion de los contratados los resultados fueron los siguientes,
Hombre
Contratado
21
No contratado
3

Mujer
14
10

Alguien acusa al empleador de tener un sesgo de seleccion a favor de los hombres ya que 21 de
24 hombres fueron contratados y solo 14 de 24 mujeres tambien lo fueron. Existira discriminacion por parte del jefe de personal?. Plantee las hipotesis con palabras y parametricamente,
llegue a conclusiones utilizando un nivel de significancia de = 0,05.

SOLUCION
Hipotesis:
H0 : No existe discriminacion (Homogeneidad)
vs
H1 : Existe discriminacion (No Homogeneidad)
Equivalentemente
H0 : p1j = p2j j = 1, 2 vs H1 : p1j 6= p2j para alg
un j
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

8.1 Ejercicios Resueltos

141

Para testear tales hipotesis, se ocupa el estadstico


n X
m
X
(oij eij )2
=
eij
i=1 j=1
2

donde eij =

ni nj
,
n

el cual rechaza H0 cuando 2 21,(I1)(J1) .

Luego la tabla de valores esperados es:


Hombre M ujer T otal ni
Contratado
17,5
17,5
35
N o contratado
6,5
6,5
13
T otal nj
24
24
48

Por lo tanto el estadstico de prueba queda

2 =

(21 17,5)2 (14 17,5)2 (3 6,5)2 (10 6,5)2


+
+
+
= 5,1692
17,5
17,5
6,5
6,5

Como 2 = 5,1692 > 3,84 = 20,95,1 , se rechaza H0 , es decir, con un 95 % de confianza existe
discriminacion hacia la mujer por parte del jefe de personal.
EJERCICIO 9
De cada una de tres comunidades se saco una muestra de jovenes casados. A cada pareja se le
pidio que especificara la cantidad mnima de educacion que esperaba que sus hijos recibieran.
La siguiente tabla muestra los resultados que se observaron en la muestra:

Nivel Mnimo
Colegio
Educ. comercial
Universitario
Total

Comunidad
A
B
C Total
30 28 24
82
30 19 46
95
90 78 130 298
150 125 200 475

Que se puede concluir respecto a la homogeneidad de las aspiraciones en la educacion de


los hijos?

SOLUCION
Las hipotesis son:

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

142

Captulo 8. Test de Homogeneidad, Independencia y Bondad de Ajuste


H0 : Las 3 poblaciones son homogeneas respecto de las aspiraciones de educacion para sus
hijos. (p11 = p12 = p13 ).
H1 : Las 3 poblaciones no son homogeneas (Por lo menos 2 proporciones de una misma fila
no son iguales entre si.)
Para testear tales hipotesis, se ocupa el estadstico
I X
J
X
(oij eij )2
=
eij
i=1 j=1
2

donde eij =

ni nj
,
n

el cual rechaza H0 cuando 2 21,(I1)(J1) .

Luego la tabla de valores esperados es:

Nivel Mnimo
Colegio
Educ. comercial
Universitario
Total

Comunidad
A
B
C
25.89 21.58 34.53
30.00 25.00 40.00
94.11 78.42 125.5
150
125
200

Total
82
95
298
475

Por lo tanto el estadstico de prueba queda

2 =

(30 25,89)2 (28 21,58)2 (24 34,53)2 (30 30)2 (19 25)2 (46 40)2
+
+
+
+
+
25,89
21,58
34,53
30
25
40
(90 94,11)2 (78 78,42)2 (130 125,5)2
+
+
94,11
78,42
125,5

= 8,455

Como 2 = 8,455 < 9,488 = 20,95,4 , no existe evidencia en los datos para rechazar H0 , es
decir, con un 95 % de confianza existe homogeneidad entre las comunidades.
EJERCICIO 10
Se selecciono una muestra al azar de 275 alumnos de u
ltimo a
no de colegio de cada uno
de los siguientes tres grupos de rendimiento atletico: alto, medio y bajo. Los muchachos se
clasificaron de acuerdo con la inteligencia tal como aparece en la tabla. Indican estos datos
una diferencia en la distribucion de la inteligencia entre los tres grupos?

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

8.1 Ejercicios Resueltos

143

Rendimiento
Inteligencia Alto Medio Bajo
Alta
45
60
68
Media
10
15
25
Baja
5
15
32
Total
60
90
125

Total
173
50
52
100

SOLUCION
Las hipotesis son:
H0 : Los 3 niveles de inteligencia son homogeneos respecto del rendimiento. (p1j = p2j = p3j ).
H1 : Los 3 niveles de inteligencia no son homogeneos respecto del rendimiento (Por lo menos
2 proporciones de una misma columna no son iguales entre si.)
Para testear tales hipotesis, se ocupa el estadstico
2 =

donde eij =

ni nj
,
n

I X
J
X
(oij eij )2
eij
i=1 j=1

el cual rechaza H0 cuando 2 21,(I1)(J1) .

Luego la tabla de valores esperados es:


Rendimiento
Inteligencia Alto Medio Bajo Total
Alta
37.77 56.62 78.64 173
Media
10.91 16.36 36.36
50
Baja
11.35 17.02 23.64
52
Total
60
90
125
100
Por lo tanto el estadstico de prueba queda

2 =

(45 37,77)2 (60 56,62)2 (68 78,64)2 (10 10,91)2 (15 16,36)2 (25 36,36)2
+
+
+
+
+
37,77
56,62
78,64
10,91
16,36
36,36
(5 11,35)2 (15 17,02)2 (32 23,64)2
+
+
11,5
17,02
23,64

= 10,199

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

144

Captulo 8. Test de Homogeneidad, Independencia y Bondad de Ajuste


Como 2 = 10,199 > 9,488 = 20,95,4 , se rechaza H0 , es decir, con un 95 % de confianza no
existe homogeneidad entre los niveles intelectuales.
EJERCICIO 11
Un investigador desea saber si es posible concluir que hay relacion entre el grado de liberalismo y la posicion en la universidad en una poblacion de estudiantes universitarios. Para
estos efectos se selecciono una muestra de 500 estudiantes. La tabla siguiente muestra la
clasificacion de los datos seg
un sus respuestas:
Grado de Liberalismo
Clase
Ligero Moderado Alto Total
1er. a
no
30
83
37
150
2o. a
no
19
56
50
125
3er. a
no
16
46
63
125
4o. a
no
10
38
52
100
Total
75
223
202
500
Que se puede concluir respecto al problema del investigador?

SOLUCION
Las hipotesis son:
H0 : Existe independencia entre el grado de liberalismo y el a
no universitario. (nij =

ni nj
).
nij

H1 : No existe independencia entre el grado de liberalismo y el a


no universitario.(nij 6=

ni nj
).
nij

Para testear tales hipotesis, se ocupa el estadstico


2 =

donde eij =

ni nj
,
n

I X
J
X
(oij eij )2
eij
i=1 j=1

el cual rechaza H0 cuando 2 21,(I1)(J1) .

Luego la tabla de valores esperados es:


Grado de Liberalismo
Clase
Ligero Moderado Alto Total
1er. a
no 22.50
66.90
60.60 150
2o. a
no
18.75
55.75
50.50 125
3er. a
no 18.75
55.75
50.50 125
4o. a
no
15.00
44.60
40.40 100
Total
75
223
202
500
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

8.1 Ejercicios Resueltos

145

Por lo tanto el estadstico de prueba queda

2 =

(30 22,5)2 (83 66,9)2 (37 60,6)2 (19 18,75)2 (56 55,75)2 (50 50,5)2
+
+
+
+
+
22,5
66,9
60,6
18,75
55,75
50,5
(16 18,75)2 (46 55,75)2 (63 50,5)2 (10 15)2 (38 44,6)2 (52 40,4)2
+
+
+
+
+
18,75
55,75
50,5
15
44,6
40,4

= 26,751

Como 2 = 26,751 > 12,592 = 20,95,6 , se rechaza H0 , es decir, con un 95 % de confianza el


grado de liberalismo en los estudiantes universitarios no es independiente del a
no que cursa
el alumno.
EJERCICIO 12
Una muestra de 500 personas responde dos preguntas: filiacion poltica y actitud hacia una
reforma de impuestos, los resultados son los siguientes:

Filiacion
Democrata
Republicano
Total

Actitud hacia Reforma


A favor Indiferente En contra Total
138
83
64
285
64
67
84
215
202
150
148
500

Existe relacion entre la tendencia poltica y la actitud hacia la reforma de impuestos?.


Plantee la hipotesis necesaria y concluya.

SOLUCION
Las hipotesis son:
H0 : Existe independencia entre la tendencia poltica y la actitud hacia la reforma. (nij =
ni nj
).
nij
H1 : Existe asociacion entre la tendencia poltica y la actitud hacia la reforma.(nij 6=
Para testear tales hipotesis, se ocupa el estadstico
2 =

I X
J
X
(oij eij )2
eij
i=1 j=1

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

ni nj
).
nij

146

Captulo 8. Test de Homogeneidad, Independencia y Bondad de Ajuste


donde eij =

ni nj
,
n

el cual rechaza H0 cuando 2 21,(I1)(J1) .

Luego la tabla de valores esperados es:

Filiacion
Democrata
Republicano
Total

Actitud hacia Reforma


A favor Indiferente En contra Total
115.14
85.5
84.36
285
86.86
64.5
63.64
215
202
150
148
500

Por lo tanto el estadstico de prueba queda

2 =

(138 115,14)2 (83 85,5)2 (64 84,36)2 (64 86,86)2 (67 64,5)2 (84 63,64)2
+
+
+
+
+
115,14
85,5
84,36
86,86
64,5
63,64

= 22,51

Como 2 = 22,51 > 5,99 = 20,95,2 , se rechaza H0 , es decir, con un 95 % de confianza la


tendencia poltica influye en la actitud hacia la reforma.
EJERCICIO 13
En una muestra aleatoria de 100 universitarios se clasifico cada uno de ellos seg
un si haba
consumido alguna vez droga o no y el promedio de notas. A partir de los datos tabulados
en la tabla, proporcionan estos datos evidencia suficiente como para concluir que hay una
relacion entre las dos variables? Use = 0,05.

Promedio notas
4,0
> 4,0
Total

Ha consumido Drogas?
Si
No
Total
10
29
39
20
41
61
30
70
100

SOLUCION
Las hipotesis son:
H0 : Existe independencia entre el consumo de drogas y el promedio de notas (nij =
H1 : Existe asociacion entre el consumo de drogas y el promedio de notas.(nij 6=

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

ni nj
).
nij

ni nj
).
nij

8.1 Ejercicios Resueltos

147

Para testear tales hipotesis, se ocupa el estadstico


2 =
donde eij =

ni nj
,
n

I X
J
X
(oij eij )2
eij
i=1 j=1

el cual rechaza H0 cuando 2 21,(I1)(J1) .

Luego la tabla de valores esperados es:


Ha consumido Drogas?
Promedio notas Si
No
Total
4,0
11,7
27,3
39
> 4,0
18,3
42,7
61
Total
30
70
100
Por lo tanto el estadstico de prueba queda

2 =

(10 11,7)2 (29 27,3)2 (20 18,3)2 (41 42,7)2


+
+
+
11,7
27,3
18,3
42,7

= 0,578

Como 2 = 0,578 < 3,841 = 20,95,1 , no se rechaza H0 , es decir, con un 95 % de confianza el


consumo de droga no influye en el promedio de notas de los estudiantes.

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

148

Captulo 8. Test de Homogeneidad, Independencia y Bondad de Ajuste

8.2.

Ejercicios Propuestos

1. (a) Se observo la duracion en horas de 100 pilas de una determinada marca, obteniendose
los siguientes resultados:
< 20 20 40 40 60 60 80 80
Horas
Frecuencia
5
26
34
22
13
Hay evidencia suficiente para rechazar la hipotesis de que los datos siguen una
distribucion normal de parametros = 50 y = 20?
(b) Las ampolletas pueden clasificarse seg
un su potencia (watts) y se piensa que de
alguna forma existe una relacion entre la duracion y la potencia. Para verificar lo
anterior se tabulan los datos, obteniendose lo siguiente:
Duracion superior
a 200 horas
Si
No
Potencia < 100W 30
20
100W 20
30
2. (a) El n
umero de accidentes sufridos por operadores de maquina de herramientas
en determinada industria se registro durante cierto periodo con los resultados
siguientes:
Accidentes por Operador 0
1 2 3 4 5 6 7 8
N
umero de Operadores
296 74 26 8 4 4 1 0 1
Con el nivel de significancia del 5 %, probar la hipotesis de que los datos provienen
de una distribucion Poisson.
(b) Una muestra aleatoria de 200 hombres casados, todos retirados, se clasifico de
acuerdo a la educacion y el n
umero de hijos de cada uno de ellos:
Cantidad de hijos
0 1 2 3 mas de 3
Primaria
14
37
32
Educacion Secundaria
19
42
17
Bachillerato
12
17
10
Pruebe la hipotesis, con un nivel de significancia del 5 %, que el tama
no de una
familia es independiente del nivel de educacion del padre.
3. Cada uno de 325 individuos que participan en cierto programa de medicamentos, se
clasifico con respecto a la presencia o ausencia de hipoglucemia y con respecto a la dosis
media diaria de insulina. Apoyan los datos siguientes lo dicho de que la presencia o
ausencia de hipoglucemia es independiente de las dosis de insulina? Pruebe usando
= 0,05.
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

8.2 Ejercicios Propuestos

149

Condicion de Presente
Hipoglucemia Ausente

Dosis diaria de insulina


< 0,25 0,25 0,49 0,5 0,74 0,75 0,99 > 1,0
4
21
28
15
12
40
74
59
26
46

4. Los siguientes datos corresponden a combinaciones de sexo de los recombinantes que


resultan de seis diferentes genotipos masculinos. Soportan los datos la hipotesis de
que la distribucion de frecuencia entre las tres combinaciones de sexo es homogenea
con respecto a los diferentes genotipos? Defina los parametros de interes, exprese H0 y
H1 pertinentes, y realice el analisis.

1
2
Genotipo 3
Masculino 4
5
6

Combinacion de sexo
M/M M/F F/F
35
80
39
41
84
45
33
87
31
8
26
8
5
11
6
30
65
20

5. Una muestra aleatoria de 200 hombres casados, todos retirados, se clasifico de acuerdo
a la educacion y el n
umero de hijos de cada uno de ellos:
Cantidad de hijos
0 1 2 3 mas de 3
Primaria
14
37
32
Educacion Secundaria
19
42
17
Bachillerato
12
17
10
Pruebe la hipotesis, con un nivel de significancia del 5 %, que el tama
no de una familia
es independiente del nivel de educacion del padre.
6. Una compa
na opera cuatro maquinas, tres turnos al da. De los registros de produccion,
se obtuvieron los siguientes datos sobre el n
umero de fallas:

Turno
1
2
3

A
41
31
15

Maquinas
B
C
20
12
11
9
17
16

D
16
14
10

Pruebe la hipotesis (con = 0,05) de que el n


umero de fallas es independiente del
turno. Encuentre el valor-p de esta prueba.
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

150

Captulo 8. Test de Homogeneidad, Independencia y Bondad de Ajuste


7. Un artculo publicado en el Journal of M arketing Ressearch (1970, pag. 36-42) contiene un estudio de la relacion entre las condiciones de las instalaciones de la gasolineras y la dinamica de la poltica de mercadotecnia seguida por ellas. Para ello se
investigo una muestra de 441 gasolineras, y se obtuvieron los resultados siguientes.
Condicion
Poltica
Subestandar Estandar
Dinamica
24
52
Neutral
15
73
No dinamica
17
80

Moderna
58
86
36

Existe evidencia de que la poltica de mercadotecnia y las condiciones de la gasolinera


son independientes? Utilice = 0,05.
8. Se dise
na un generador de n
umeros seudoaleatorios de modo que los enteros 0 a 9
tengan la misma probabilidad de ocurrencia. Los primeros 10 mil n
umeros son:
1
2
3
4
5
6
7
8
9
0
967 1008 975 1022 1003 989 1001 981 1043 1011
a) El generador trabajo de manera apropiada? Utilice = 0,01.
b) Calcule el valor-p de esta prueba.
9. Se toma una muestra aleatoria de 50 observaciones sobre el diametro de puntos de
soldadura y el valor correspondiente de la resistencia al esfuerzo cortante.
a) Dado que r = 0,62 , pruebe la hipotesis de que = 0 utilizando = 0,01. Cual
es el valor-p de esta prueba?
b) Encuentre un intervalo de confianza del 99 % para .
c) Con base en el intervalo de confianza del inciso b), puede concluirse que = 0,5
con un nivel de significancia de 0.01?

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

Captulo 9
An
alisis de Regresi
on
9.1.

Ejercicios Resueltos

EJERCICIO 1
Suponga que se tiene interes en ajustar un modelo de regresion lineal simple
Yi = 0 + 1 xi + i ,

i = 1, ..., n

donde
i N (0, 2 )
y 0 y 2 son conocidos.
(a) Encuentre el estimador de mnimos cuadrados de 1 .
(b) Cual es la varianza del estimador encontrado en el inciso (a)?
(c) Encuentre una expresion para el intervalo de confianza del 100(1 ) % para la pendiente 1 . Este intervalo es mayor que el intervalo correspondiente al caso donde tanto
0 como 1 son desconocidos?

SOLUCION
(a) Estimador de mnimos cuadrados para 1
n
X

2i =

i=1

n
X

(yi o 1 xi )2

i=1

luego derivando con respecto al parametro tenemos

n
X
i=1

2i
= 2

n
X

(yi 0 1 xi ) xi = 0

i=1

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

152

Captulo 9. An
alisis de Regresi
on

n
X

(yi 0 1 xi ) xi = 0

i=1

n
X

(xi yi 0 xi 1 x2i ) = 0

i=1

n
X

xi yi 0

n
X

xi 1

i=1

i=1

n
X

x2i = 0

i=1

luego despejando y recordando que 0 es conocido, nos queda


n
X

1 =

xi yi 0

n
X

i=1

xi

i=1
n
X

x2i

i=1

(b) Se pide calcular la V ar(1 ).

n
X

xi yi 0

i=1
V ar(1 ) = V ar
n

x2i

n
X
i=1

xi

i=1

1
n
X

!2 V ar

x2i

n
X

xi yi 0

i=1

i=1

i=1

1
n
X

!2 V ar

x2i

n
X

!
xi yi

i=1

i=1
ind

n
X

1
n
X

!2
x2i

n
X

x2i V ar(yi )

i=1

i=1

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

!
xi

9.1 Ejercicios Resueltos

153

n
X

1
n
X

!2
x2i

x2i 2

i=1

i=1

n
X

= 2

x2i

i=1
n
X

!2
x2i

i=1

2
n
X
x2i
i=1

(c) Cuando ambos parametros son desconocidos el intervalo para 1 es de la siguiente


forma:
i
h

1 1 t(n2),1 2 s.e(1 )
donde
v
u 2
u

s.e(1 ) = u n
uX
t
x2
i

i=1

considerando 2 conocido.
EJERCICIO 2
Suponga que se especifica un modelo lineal simple sin intercepto
yi = xi + i ,

i = 1, . . . , n

i N (0, 2 )
(a) Encuentre el estimador de mnimos cuadrados de ,
y de 2 ,
2.
(b) Calcule E(
) y V ar(
).
(c) Estime la ecuacion de regresion a partir del siguiente conjunto de datos
x 2 2 3 4 4
y 5 6 9 11 13
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

154

Captulo 9. An
alisis de Regresi
on

SOLUCION
(a) Estimador de mnimos cuadrados para
n
X

2i

n
X

i=1

(yi xi )2

i=1

luego derivando con respecto al parametro tenemos

n
X
i=1

2i
= 2

n
X

(yi xi ) xi = 0

i=1

n
X

(yi xi ) xi = 0

i=1

n
X

(xi yi x2i ) = 0

i=1

n
X

xi yi

i=1

n
X
i=1

luego despejando nos queda


n
X

xi yi

i=1
n
X

x2i

i=1

Ahora para 2 tenemos que el estimador es

2 =

SSE
n2
n
X

2i

i=1

n2

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

x2i = 0

9.1 Ejercicios Resueltos

155
n
X

i=1

n2
n
X

(yi
xi )2

yi2

i=1

n
X

xi yi +

n
X

x2i

i=1

i=1

n2

n
X

2
yi2

i=1

!2

n
X

n
X

xi yi

i=1
n
X

!2
xi yi

i=1

n
X

x2i

i=1
i=1

n2
n
X
n
X

yi2

i=1

xi yi

i=1
n
X

x2i

i=1

n2
n
X

!2

n
X

yi2

i=1

n2

!2
xi yi

i=1

(n 2)

n
X

!
x2i

i=1

(b)
1
E(
) = n
X

E
x2i

n
X

!
xi yi

i=1

i=1

1
= n
X

n
X

xi E (yi )

x2i i=1

i=1

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

,
n
X
x2i

i=1

!2

x2i

156

Captulo 9. An
alisis de Regresi
on

1
n
X

n
X

x2i

xi xi

i=1

i=1

,
n
X
1
= n,
x2i
X
i=1
x2i
i=1

=

es un estimador insesgado.
(c) Para estimar la recta debemos solo calcular
en base a los datos
n
X

xi yi

i=1
n
X

=
x2i

10 + 12 + 27 + 44 + 52
= 2,959
4 + 4 + 9 + 16 + 16

i=1

luego la recta pedida es de la forma:


y = 2,959 xi
EJERCICIO 3
Se presentan los siguientes datos sobre x = % de absorcion de luz a 5800A e y = pico de
fotovoltaje:
x
y

4.0
0.12

8.7 12.7 19.1 21.4 24.6 28.9 29.8 30.5


0.28 0.55 0.68 0.85 1.02 1.15 1.34 1.29

(a) Construya una grafica de dispersion de estos datos. Que sugiere?


(b) Obtenga la ecuacion de la recta de regresion estimada suponiendo que el modelo de
regresion lineal simple es apropiado.
(c) Que proporcion de la variacion observada en pico de fotovoltaje se puede explicar por
el modelo de regresion?
(d) Pronostique el pico de fotovoltaje cuando el % de absorcion sea 19.1 y calcule el valor
del residuo correspondiente.
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

9.1 Ejercicios Resueltos

157

(e) Se piensa que hay una regresion lineal u


til entre % de absorcion y pico de fotovoltaje.
Esta de acuerdo?. Realice una prueba formal.

SOLUCION
(a) Observando el grafico de dispersion siguiente se sugiere que hay una asociacion lineal
entre el % de absorcion de luz y el pico de fotovoltaje

Figura 9.1: Grafico de dispersion


(b) La ecuacion de la recta estimada es la siguiente:
y = 0 + 1 x
con
0 = y 1 x

Sxy
1 =
Sxx

de los datos obtenemos que


y = 0,8088889

x = 19,96667

ademas se obtienen tambien

Sxx =

9
X

(xi x)2

= 746,4

(yi y)2

= 1,514089

i=1

Syy =

9
X
i=1

Sxy =

9
X

(xi x)(yi y) = 33,32567

i=1
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

158

Captulo 9. An
alisis de Regresi
on
luego, reemplazando tenemos que
0 = 0,08259353

1 = 0,04464854

quedando la ecuacion de la recta estimada como sigue


yi = 0,08259353 + 0,04464854 xi
(c) Lo que se pide corresponde a la definicion de R2
R2 =

SSE
SSR
=1
Syy
Syy

donde

SSE = Syy 1 Sxy


= 1,514089 0,04464854 33,32567
= 0,02614669
reemplazando tenemos que

R2 = 1

0,02614669
1,514089

= 0,9827311
98,27 %
Luego, el modelo explica el 98.27 % de variabilidad presente en los datos, lo que se
considera muy bueno.
(d) El pronostico cuando el % de absorcion es de 19.1 es

y = 0,08259353 + 0,04464854 19,1


= 0,7701936
El residuo sera la diferencia entre el verdadero valor observado para x = 19,1 y el
calculado por medio de la recta de estimacion
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

9.1 Ejercicios Resueltos

159

x
y
y
19,1 0,68 0,7701936
luego el residuo es
e = 0,68 0,7701936 = 0,0901936
(e) Dado que se pide una verificacion para la regresion lineal, tenemos que probar si el
coeficiente 1 es significativo, es decir distinto de cero.
La hipotesis a docimar es la siguiente:
H0 : 1 = 0

H1 : 1 6= 0

vs

El estadstico de prueba es
tc =

1 0
s.e(1 )

Se rechaza H0 si |tc | > t(n2),1 2


Tenemos que
s
s.e(1 ) =

2
Sxx

2 =

SSE
n2
0,02614669
7

= 0,003735241
luego el estadstico Tc queda
Tc =

0,04464854 0
q
= 19,95877
0,003735241
746,4

al comparar tenemos que |Tc | = 19,95877 > t7,1 2 = 2,364624.

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

160

Captulo 9. An
alisis de Regresi
on
Existe suficiente evidencia para rechazar H0 con un 95 % de confianza, es decir, hay
una relacion lineal u
til entre el % de absorcion de luz y el pico de fotovoltaje.
EJERCICIO 4
En el cultivo de tejidos in vitro se ha observado que si se colocan dos n
ucleos, a esto se
llama un campo de atraccion, los campos de atraccion se forman con mayor frecuencia si los
n
ucleos estan cercanos. En un experimento se colocaron 20 n
ucleos a distancias diferentes
y se midio la incidencia de campos de atraccion (Y ) para las diferencias distancias (X).
Lamentablemente se borro parte del analisis de regresion y se le solicita completarlo.
(a) Completa la tabla ANOVA que se entrega a continuacion:
Tabla ANOVA
Fuente
g.l
SS
MS
Regresion
1 2.0559
Error
Total

F
301.08

(b) Que porcentaje de la variable total esta siendo explicada por el modelo?
(c) Utilizando la siguiente informacion realice test de hipotesis para los parametros del
modelo. Concluya.
Ecuaci{\o}n de regresi{\o}n Y = 1.18 - 0.278 X
Predictor Coef
Stdev
t-ratio
Const
1.176232 0.03839 30.64
Distancia -0.278010 0.01602 -17.35

SOLUCION

(a) La tabla ANOVA esta compuesta de los siguientes elementos.

Fuente
Regresion
Error
Total

Tabla ANOVA
g.l
SS
MS
F
p
SSR
SSR /p
M SR /M SE
n 1 p SSE SSE /(n 1 p)
n1
SST

luego la tabla queda


Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

9.1 Ejercicios Resueltos

161

Fuente
Regresion
Error
Total

Tabla ANOVA
g.l
SS
MS
F
1 2.0559 301.08 0.1229
18 0.1229 0.0068
19 2.1788

(b) Lo que se pide es el R2 .


R2 =

SSE
SSR
=1
Syy
Syy

reemplazando tenemos que

R2 = 1

0,1229
2,1788

= 0,9435928
94,36 %
luego, el modelo explica el 94.36 % de variabilidad presente en los datos.
(c) Mediante el test T docimaremos las siguientes hipotesis:
Ho : 0 = 0

vs

H1 : 0 6= 0

Ho : 1 = 0

vs

H1 : 1 6= 0

y
donde la region de rechazo para este caso esta definida por


R : |Tc | > tn2;1 2
Como t7,0,975 = 2,365 tenemos que |T0 | = 30,64 > t7,0,975 y |T1 | = 17,35 > t7,0,975 , en
ambos casos se rechaza H0 con un 95 %, es decir, los parametros son significativos.
EJERCICIO 5
Se ha comprobado que las aleaciones amorfas tienen una excelente resistencia a la corrosion.
En Corrosion Science(Septiembre de 1993) se informo de la resistividad de una aleacion
amorfa de hierro, boro y silicio despues de la cristalizacion. Se reconocieron cinco especmenes
de la aleacion a 700o C, cada uno durante un intervalo de tiempo distinto. Despues se midio el
potencial de pasivacion -una medida de la resistividad de la aleacion cristalizada- para cada
especmenes. Los datos experimentales son los siguientes:
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

162

Captulo 9. An
alisis de Regresi
on
Tiempo de Recorrido Potencial de Pasivacion
(minutos)
(m V)
y
x
10
-408
-400
20
45
-392
-379
90
120
-385
(a) Construya un diagrama de dispersion para los datos.
(b) Suponiendo que la mejor forma de describir la relacion entre las variables es con una
lnea recta, utilice el metodo de mnimos cuadrados para estimar la ordenada al origen
y la pendiente de la lnea recta. Interprete estos valores.
(c) Trace la lnea de mnimos cuadrados sobre el diagrama de dispersion.
(d) Seg
un la lnea de mnimos cuadrados. Cual es el potencial de pasivacion esperado y,
cuando el tiempo de recocido es de x = 30 minutos?.
(e) Calcule el R2 para este modelo. Proporcione una interpretacion de esta cantidad.
(f) Realice los test individuales con = 0,05, H0 : i = 0 vs H1 : i 6= 0, i = 0, 1.

SOLUCION

(a) En la figura se muestra el grafico de dispersion de los datos.

Figura 9.2: Grafico de Dispersion


(b) Lo estimadores de mnimos cuadrados para la ordenada de origen (0 ) y la pendiente
de la lnea recta (1 ) son:
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

9.1 Ejercicios Resueltos

163

Sxy
1 =
Sxx

0 = y 1 x

Para poder estimarlos necesitamos

Sxx =

5
X

(xi x)2

= 8780

(yi y)2

= 534,8

i=1

Syy =

5
X
i=1

Sxy =

5
X

(xi x)(yi y) = 1918

i=1

ademas
y = 392,8

x = 57

reemplazando tenemos que


1 = 0,218451

0 = 405,2517

luego la recta es de la forma


y = 405,2517 + 0,218451 x
(c) Ahora sobre el grafico de dispersion se construye la recta de regresion.

Figura 9.3: Recta de regresion

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

164

Captulo 9. An
alisis de Regresi
on
(d) El potencial de pasivacion esperado y, cuando el tiempo de recorrido es de x = 30
minutos es
y = 405,2517 + 0,218451 30 = 398,6982
(e) Para poder calcular el R2 necesitamos
SSE = Syy 1 Sxx = 534,8 0,218451 1918 = 115,811
luego reemplazando tenemos

R2 =

SSR
Syy

=1

SSE
Syy

=1

115,811
534,8

= 0,78345
78,35 %
(f) Se pide docimar hipotesis para 0 = 0 y 1 = 1.
Docimemos primero la siguiente:
H0 : 0 = 0

vs

H1 : 0 6= 0

el estadstico de prueba es
0 0,0
tc = q

V ar()
0 0,0
=r n
o
2

n1 + Sxxx

=r

0 0,0
n
o
SSE
1
x2

+
n2
n
Sxx

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

9.1 Ejercicios Resueltos

165

=q

405,2517 0


115,811
572
15 + 8780
52

= 86,38847
La region de rechazo esta dada por
|tc | > t(n(k+1)),1 2 ,

donde k es el no de variables explicativas

considerando un = 0,05 (95 % de confianza), se tiene que:


t(n(k+1)),1 2 = t(52),0,975 = 3,182446
Como |tc | = 86,38847 > t3,0,975 = 3,182446, existe evidencia suficiente bajo un 95 % de
confianza para rechazar H0 , es decir, el parametro 0 es significativo considerandose
como distinto a cero.
Ahora docimemos la siguiente hipotesis
H0 : = 1

H1 : 6= 1

vs

el estadstico de prueba es
1 1,0
tc = q
V ar(1 )

1 1,0
q

Sxx

0,218451 0
q 115,811
52

8780

= 3,294481
La region de rechazo al igual que el caso anterior esta dada por
|tc | > t(n(k+1)),1 2 ,

donde k es el no de variables explicativas

considerando nuevamente = 0,05 (95 % de confianza)


t(n(k+1)),1 2 = t3,0,975 = 3,182446
Como |tc | = 3,294481 > t3,0,975 = 3,182446, existe evidencia suficiente bajo un 95 %
de confianza para rechazar H0 , es decir, el parametro 1 es significativo y se puede
considerar como distinto a cero.
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

166

Captulo 9. An
alisis de Regresi
on
EJERCICIO 6
La presencia de carburos duros en aleaciones de hierro blanco con alto cromo da como
resultado una excelente resistencia a la abrasion, por lo mismo son adecuados para el manejo
de materiales en la industria minera. Los datos de y = perdida por desgaste abrasivo (mm3 ) y
x = contenido de austenita retenida ( %), en pruebas de desgaste de pernos con granete como
abrasivo, fueron analizados con un modelo de regresion lineal simple. Utilice el resultado que
se presenta de MINITAB para contestar las siguientes preguntas:
Cual es la ecuacion de la recta de regresion estimada?
Complete la tabla de analisis de varianza (tabla ANOVA).
Que proporcion de la variacion observada de perdida de desgaste se puede atribuir al
modelo de regresion lineal simple para esa relacion?
Pruebe la utilidad del modelo de regresion lineal simple, use = 0,01.
Estime la perdida real promedio por desgaste cuando el contenido es 50 % ofreciendo
informacion acerca de la confiabilidad y la precision.
Que valor de perdida por desgaste pronosticara cuando el contenido es 30 %, y cual
es el valor del residuo correspondiente, sabiendo que el valor observado fue de 0.80?
Otros datos relevantes:
n
X

x2i = 41574,84

x = 42,32941

i=1

Regression Analysis: y versus x


Predictor Coef
Constant 0.787218
x
0.007570

SE Coef
0.09525879
0.00192626

T
8.264
3.930

P
0.0001
0.0013

Analysis of Variance (tabla ANOVA)


Source
Regression
Residual Error
Total

DF

SS
0.63690

MS

15
1.25551

SOLUCION
(a) Con los datos entregados por la salida de Minitab la recta de regresion estimada es:
y = 0,787218 + 0,007570x
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

9.1 Ejercicios Resueltos

167

(b) La tabla Anova queda como sigue:

Fuente
Regresion
Error
Total

Tabla ANOVA
g.l
SS
MS
F
1 0.6369 0.6369 15.443
15 0.6186 0.04124
16 1.2555

(c) Se pide el R2 .

R2 =

SSR
Syy
0,6369
1,255

= 0,5072
50,72 %
luego, el modelo explica un 50.72 % de variabilidad presente en los datos.
(d) Observando el valor-p de x, tenemos que
valor-p = 0,0013 < 0,01 =
Por lo tanto se rechaza la hipotesis H0 : 1 = 0.
(e) La estimacion para la perdida real promedio por desgaste cuando el contenido es 50 %
es:
y = 0,787218 + 0,00757 50 = 1,165718
(f) El valor de perdida por desgaste que pronosticara cuando el contenido es 30 % es:
y = 0,787218 + 0,00757 30 = 1,014318
Sabiendo que le verdadero valor observado fue 0.8, el residuo es
e = y y = 0,8 1,014318 = 0,214318
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

168

Captulo 9. An
alisis de Regresi
on
EJERCICIO 7
Se ha observado que para predecir la demanda (consumo) de combustible para la calefaccion,
resulta ser mas preciso el pronostico a largo plazo de las temperaturas y el uso de la relacion
temperatura-consumo que el tratar de pronosticar directamente analizando las ventas de
combustible. Un distribuidor de combustible mantiene un registro de ventas mensuales de
combustible y de temperaturas maximas en esos meses. A continuacion aparecen los datos
de nueve de estos meses seleccionados al azar.
Ventas (y)
26.2
Temperaturas (x) 46.5

17.4
54.6

7.8 12.3
65.2 62.3

35.9
41.9

42.1
38.6

26.4 19.0
43.7 52.0

10.1
59.8

(a) Encuentre la recta de mnimos cuadrados para estos datos.


(b) Grafique los puntos y la recta como una verificacion de sus calculos.
(c) Utilice la ecuacion de la recta ajustada para predecir la venta observada cuando la
temperatura es de 50o F.
(d) Estime 2 .
(e) Pruebe la significancia de la regresion con = 0,5. A que conclusiones puede llegarse?
(f) Encuentre un intervalo de confianza del 90 % para las ventas mensuales esperadas
(medias) en aquellos meses en que el promedio de la temperatura maxima sea de 45o
F.
(g) Calcule e interprete el R2 .

SOLUCION

(a) Para poder calcular los estimadores de la recta de regresion, necesitamos los siguientes
resultados:

Total

x
y
x2
y2
xy
46.5 26.2 2162.25 686.44 1218.30
54.6 17.4 2981.16 302.76 950.04
65.2
7.8 4251.04
60.84 508.56
62.3 12.3 3881.29 151.29 766.29
41.9 35.9 1755.61 1288.81 1504.21
38.6 42.1 1489.96 1772.41 1625.06
43.7 26.4 1909.69 696.96 1153.68
52.0 19.0 2704.00 361.00 988.00
59.8 10.1 3576.04 102.01 603.98
464.6 197.2 24711.04 5422.52 9318.12

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

9.1 Ejercicios Resueltos

169

de la tabla anterior se extraen los siguientes resultados:


9
X

xi

464,6 X = 51,62

yi

197,6 Y = 21,91

x2i

= 24711,04

yi2

5422,52

xi yi =

9318,12

i=1
9
X
i=1
9
X
i=1
9
X
i=1
9
X
i=1

Con esto podemos calcular

Sxx =

9
X

= 24711,04 9 (51,62)2

729,4204

= 5422,52 9 (21,91)2

1102,0871

x2i 9X

i=1

Syy =

9
X

yi2 9Y

i=1

Sxy =

9
X

xi yi 9X Y

= 9318,12 9 (51,62)(21,91) = 860,8278

i=1

Luego
Sxy
860,8278
1 =
=
= 1,180
Sxx
729,4204
0 = Y 1 X = 21,91 + 1,180 51,62 = 82,822
Donde la recta de regresion es:
y = 82,822 1,180x
(b) El grafico de los puntos y la recta de regresion se presenta a continuacion
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

170

Captulo 9. An
alisis de Regresi
on

Figura 9.4: Recta de regresion


(c) La prediccion de las ventas para una temperatura de 50o F es:
y = 82,822 1,180 50 = 23,822
(d) Tenemos que

2 =

SSE
n2

SSE = Syy 1 Sxy

Con los resultados obtenidos en (a) se calcula SSE.

SSE = Syy 1 Sxy


= 1102,0871 + 1,180 (860,8278)
= 86,31
Luego

2 =

86,31
= 12,33
7

(e) La hipotesis de significancia para la regresion es:


Ho : 1 = 0

vs

Se rechaza Ho si |T1 | > tn2;1 2 , donde T1 =

H1 : 1 6= 0
1
.
se(1 )

Para este caso tenemos que:


Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

9.1 Ejercicios Resueltos

171

1,180
T1 =
se(1 )
T1 =

con

se(1 ) =

12,33
= 0,13
729,4204

1,180
9,1
0,13

como t7;0,975 = 2,365 tenemos que |T1 | > t7;0,975 .


Luego rechazamos la hipotesis nula, es decir, los datos presentan suficiente evidencia
de que las ventas de combustible estan relacionadas linealmente con la temperatura.
(f) El intervalo pedido es el siguiente:
s
y/x0 tn2;1 2
IC(y/x0 ) =

1 (x0 x)2
+
n
Sxx

Reemplazando
s

IC(y/45 ) = (82,822 1,180 (45)) 1,895 12,33

1
(45 51,62)2
+
10
729,4204

= 29,72 2,66
= (27,06; 32,38)
(g) R2 = 1

SSE
Syy

=1

86,31
1102,0871

= 0,9268

Existe un 92.68 % de variacion en los datos mensuales que se explica por la temperatura
maxima promedio.

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

172

Captulo 9. An
alisis de Regresi
on
EJERCICIO 8
Los siguientes datos se refieren al flujo de cloro (X, en cm3 normales por minuto) por una
boquilla, utilizada en el mecanismo de grabado, y la rapidez de grabado (Y , en 100 A/min).
X
Y

1.5 1.5 2.0 2.5 2.5 3.0 3.5 3.5 4.0


23.0 24.5 25.0 30.0 33.5 40.0 40.5 47.0 49.0

P
P
P
P
Los estadsticos de resumen son: xi = 24,0, x2i = 70,50, yi = 312,5, yi2 = 11626,75,
P
xi yi = 902,25, 0 = 6,448718, 1 = 10,602564.
(a) El modelo de regresion lineal simple especifica una relacion u
til entre el flujo de cloro
y la rapidez de grabado?
(b) Estime el cambio real promedio de rapidez de grabado asociado con un aumento de 1
cm3 normal por minuto en el flujo, con un intervalo de confianza del 95 %, e interprete
el intervalo.
(c) Calcule el intervalo de confianza de 95 % de confianza para Y |x=3 , la rapidez real
promedio de grabado cuando el flujo es igual a 3. Se estimo con precision este promedio?
(d) Calcule el intervalo de prediccion de 95 % de confianza para una sola observacion futura
sobre la rapidez de grabado cuando el flujo es igual a 3. Es probable que la prediccion
sea exacta?
(e) Recomendara calcular un intervalo de prediccion de 95 % para un flujo de 6? Explique.

SOLUCION

(a) Hay que realizar el test:


H0 : 1 = 0

H1 : 1 6= 0

vs

El estadstico de prueba es
tc =

1
s.e(1 )

Se rechaza H0 si |tc | > t 2 (n 2)


Tenemos que
s
s.e(1 ) =

2
Sxx

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

9.1 Ejercicios Resueltos

173

Necesitamos los siguientes resultados

Sxx =

9
X

)2
= 70,5 9 ( 24
9

= 11626,75 9 ( 312,5
)2
9

= 776,06

x2i 9X

6,5

i=1

Syy =

9
X

yi2 9Y

i=1

Sxy =

9
X

= 902,25 9 ( 24
)( 312,5
) =
9
9

xi yi 9X Y

i=1

luego reemplazando obtenemos el valor de


2 como sigue:

2 =

SSE
n2

Syy 1 Sxy
n2

776,06 10602564 68,92


92

45,33
7

= 6,48
Luego
s.e(1 ) =

6,48
= 0,998
6,2

por lo tanto el estadstico de prueba queda como


tc =

10,602564
10,62
0,998

y considerando = 5 % tenemos que


t(n2),1 2 = t7,0,975 = 2,365
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

68,92

174

Captulo 9. An
alisis de Regresi
on
(a) como |tc | > 2,365 se rechaza H0
Por lo tanto el modelo de regresion lineal especifica una regresion u
til entre X e Y .
(b) Hay que encontrar un I.C. para 1 :
h
i

1 1 t(n2), 2 s.e(1 )
1 [10,602564 2,365 0,998]
1 [8,2422; 12,9628]
Con un 95 % de confianza, estimamos el cambio real promedio de rapidez de grabado
entre 8.2422 y 12.9628 asociado con un aumento de 1 cm3 normal por minuto en el
flujo.
(c) El intervalo pedido es el siguiente:
s
IC(y/x0 ) =
y/x0 tn2;1 2

1 (x0 x)2
+
n
Sxx

luego necesitamos
X=

24
= 2,67
9

ademas

y/x0 =3 = 0 + 1 x0
= 6,448718 + 10,602564 3
= 38,25641
ahora reemplazando tenemos que
"

y/x0 =3 38,25641 2,365 6,48

1 (3 2,67)2
+
9
6,5

y/x0 =3 [38,25641 2,365 0,9102]


Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

#

9.1 Ejercicios Resueltos

175

y/x0 =3 [36,10; 40,41]

Se aprecia que s se estimo con precision este promedio, ya que si observamos la tabla
de datos cuando x = 3, el valor de y es 40 y este valor pertenece al I.C.
(d) El intervalo pedido es el siguiente:
s
IC(y0 ) y0 t

n2;1
2



1 (x0 x)2
1+ +
n
Sxx

necesitamos

y0 = 0 + 1 x0
= 6,448718 + 10,602564 3
= 38,25641
Luego reemplazando
s


#
1 (3 2,67)2
y0 38,25641 2,365 6,48 1 + +
9
6,5
"

y0 [38,25641 2,365 2,70]


y0 [31,87; 44,64]

Por lo tanto es probable que la prediccion sea exacta.


(e) No cambia ya que el nivel de confianza es el mismo.
(f) Como el valor 6.0 esta muy alejado del rango en el cual vara x no sera recomendable
calcular un I.C.
EJERCICIO 9
Es difcil determinar la resistencia al corte de puntos de soldadura, mientras que es relativamente sencillo medir el diametro de soldadura de puntos. Seria ventajoso si se pudiera
predecir la resistencia al corte de una medicion del diametro de soldadura. Los datos son:
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

176

Captulo 9. An
alisis de Regresi
on
Y : Resistencia al corte (psi) X: Diametro de soldadura (0.0001 pulg)
370
400
800
780
1210
1210
1600
1560
1980
2000
2500
2450
3070
3100
3550
3600
3940
4000
4000
3950
(a) Existe evidencia para pensar que el ajuste de una regresion lineal es adecuada?
(b) Docime si la correlacion entre ambas variables es nula.
(c) Determine la recta por mnimos cuadrados.
(d) Calcule las varianzas de los parametros encontrados.
(e) Docime las hipotesis 1 = 1 y 0 = 0, usando un nivel de significacion igual a 0.01.
(f) Rectifique el punto anterior usando intervalos de confianza adecuados.

SOLUCION
(a) La evidencia se puede obtener al graficar los puntos o calcular el coeficiente de correlacion r.

Figura 9.5: Grafico de puntos


Del grafico se aprecia una fuerte asociacion lineal entre la resistencia al corte y el
diametro de la soldadura.

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

9.1 Ejercicios Resueltos

177

Calculemos ahora el coeficiente de correlacion para verificar esta apreciacion.

n
X

r=

(xi x)(yi y)

s ni=1
X

(xi x)2

i=1

n
X
i=1

n
= v
u
n
u X
u
x2i
t n
i=1

=p

(yi y)2

n
X

xi yi

i=1
n
X

n
X

xi

n
X

i=1

!2
xi

i=1

yi

i=1
n
X

yi2

n
X

i=1

!2
yi

i=1

10 68674100 23210 22860


(10 69644100 538704100) (10 67719400 522579600)

156160400
15773690 154614400

156160400
156167846

= 0,9999
Por lo tanto, como r = 0,9999 1 hay una fuerte asociacion lineal entre el diametro
de soldadura, la resistencia al corte, misma conclusion obtenida observando el grafico.
Hay evidencia emprica para pensar que el ajuste de la regresion lineal es adecuado.
(b) La hipotesis que se pide docimar es la siguiente:
Sea : correlacion
H0 : = 0

vs

H1 : > 0

esta prueba de hipotesis tiene una region de rechazo dada por:


R = {Zc > z1 }
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

178

Captulo 9. An
alisis de Regresi
on
donde
Zc =

1
2

1+r
1r

ln

21 ln

1+0
10

1
n3

1
2

1+r
1r

ln

1
n3

1
2

ln (1999)
1
7

= 10,05439
considerando = 0,05 tenemos que z10,05 = 1,64.
Luego, como Zc = 10,05439 > z1 = 1,64, existe evidencia suficiente para rechazar
H0 , esto implica que la correlacion entre ambas variables no es nula.
(c) La estimacion de la recta por mnimos cuadrados esta dada por

y =
+ x
donde
y son los estimadores de mnimos cuadrados.
n
X

(xi x)(yi y)

i=1

n
X

(xi x)2

i=1

n
=

n
X

x i yi

i=1

n
X
i=1

n
X

xi

i=1

x2i

n
X

n
X

yi

i=1

!2
xi

i=1

10 68674100 23210 2280


10 69644100 538704100

= 0,99

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

9.1 Ejercicios Resueltos

179

= y x
= 22,86 0,99 2321
= 2286 2297,79
= 11,79
As la recta es
y = 11,79 + 0,99 x
n
X

=
(d) V ar()

(xi x)2

i=1
n
X

(xi

2 V

ar(yi )

x)2

i=1

como V ar(yi ) = 2 tenemos que


=
V ar()

2
n
X

(xi x)2

i=1

ahora para

2xCov(y, )

V ar(
) = V ar(y) + x2 V ar()

2
2
+ x2 n
2x 0
X
n
2
(xi x)
i=1

1
x

= 2
+
n
n X

(xi x)2
i=1

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

180

Captulo 9. An
alisis de Regresi
on

=
n

n
X

x2i

i=1
n
X

(xi x)2

i=1

pero notese que 2 hay que estimarlo.


SCE

=
,
n1
2

donde SCE =

n
X

e2i

i=1

n
X

(yi yi )2

i=1

luego reemplazando tenemos que


10
X

ei = (14,19942)2 + (0,2016205)2 + (23,89612)2 + (12,20603)2 + (11,79177)2

i=1

+ (13,21099)2 + (12,78571)2 + (2,217046)2 + (8,21925)2 + (1,78075)2


= 1474,369
luego la estimacion de 2 es

2 =

por lo tanto, como tenemos que

1474,369
= 163,8187
10 1

10
X

(xi x)2 = 15773690 y al reemplazar en las igual-

i=1

dades obtenidas para


y se calculan las varianzas para estos parametros:

= 163,8187
V ar()
15773690
= 0,00001038557

V ar(
) =

163,8187 69644100
10 15773690
11409007637
157736900

= 72,32935
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

9.1 Ejercicios Resueltos

181

(e) Se pide docimar hipotesis para = 0 y = 1.


Docimemos primero la siguiente:
H0 : = 0

vs

H1 : 6= 0

el estadstico de prueba es

tc = p
V ar(
)
11,79 0
=
72,32935
= 1,386298
La region de rechazo esta dada por
|tc | > t(n(k+1)),1 2 ,

donde k es el no de variables explicativas

considerando un = 0,01 (99 % de confianza)


t(n(k+1)),1 2 = t(102),0,995 = 3,355387
Como |tc | = 1,386298 t8,0,995 = 3,355387, no existe evidencia suficiente bajo un 99 %
de confianza para rechazar H0 , es decir, el parametro no sera significativo y se puede
considerar como igual a cero.
Ahora docimemos la siguiente hipotesis
H0 : = 1

vs

H1 : 6= 1

el estadstico de prueba es

tc = q

V ar()

0,99 1
0,00001038557

= 3,103022
La region de rechazo, al igual que el caso anterior, esta dada por
|tc | > t(n(k+1)),1 2 ,

donde k es el no de variables explicativas

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

182

Captulo 9. An
alisis de Regresi
on
considerando nuevamente = 0,01 (99 % de confianza)
t(n(k+1)),1 2 = t8,0,995 = 3,355387
Como |tc | = 3,103022 t8,0,995 = 3,355387, no existe evidencia suficiente bajo un 99 %
de confianza para rechazar H0 , es decir, el parametro se puede considerar como igual
a uno.
(f) Haremos I.C al 99 % para los parametros y .
El I.C() esta dado por



)

t 2 (n 2) s.e(
h

11,79 3,355387

i
72,32935

[40,32645; 16,74645]
como en el I.C se encuentra el cero, se ratifica lo obtenido en (e)
El I.C() esta dado por
h

t 2 (n 2) s.e()
h

0,99 3,355387

i
0,00001038557

[0,9791867; 1,000813]
como en el I.C se encuentra el uno, tambien se ratifica lo obtenido en (e) para .
EJERCICIO 10
Demuestre que en el modelo de regresion lineal simple
yi = 0 + 1 xi + i
los estimadores 0 y 1 pueden ser escritos como combinaciones lineales de las respuestas yi .
Encuentre explcitamente las constantes en la combinacion lineal.

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

9.1 Ejercicios Resueltos

183

SOLUCION
Sabemos que al
mn

n
X

0 1

2i

i=1

se obtiene:
0 = y 1 x
n
X

1 =

(xi x)(yi y)

i=1
n
X

(xi x)2

i=1

en el caso de 1 se tiene que


n
X

(xi x)(yi y) =

n
X

(xi yi xi y xyi + xy)

i=1

i=1

n
X

(xi yi y(xi x) xyi )

i=1

n
X

yi (xi x) y(xi x)

i=1

n
X

yi (xi x) y

n
X
i=1

i=1

n
X

yi (xi x) y 0

i=1

n
X

yi (xi x)

i=1

luego
n
X

1 =

(xi x)

i=1

Sxx

yi =

n
X

di yi

i=1

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

(xi x)

184

Captulo 9. An
alisis de Regresi
on

donde di =

(xi x)
Sxx

y Sxx =

n
X

(xi x)2 .

i=1

para 0 tenemos que


n
X

0 = y

n
X
i=1

n
X

(xi x)

i=1

yi x

Sxx

1
n

(xi x)
Sxx

x yi

ci yi

i=1
n
X

con ci =

1
n

(xi x)

i=1
Sxx

EJERCICIO 11
Demuestre que
n
2 X 2

0 N (0 ,
x) y
nSxx i=1 i

con
Cov(0 , 1 ) =

2
1 N (1 ,
)
Sxx
2x
Sxx

SOLUCION
Como yi N (0 + 1 xi , 2 ) y 0 es combinacion lineal de yi entonces 0 N (, ) donde los
parametros son:

E(0 ) = E

n
X

!
ci E(yi )

i=1

n
X

ci (0 + 1 xi )

i=1

n 
X
1
i=1

(xi x)

n
Sxx x


(0 + 1 xi )

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

9.1 Ejercicios Resueltos

185

= 0

= 0

n
X

ci + 1

n
X

ci xi

i=1

i=1

n
X

n 
X
xi

ci + 1

i=1

i=1

(xi x)xi x

n
Sxx

n
x X
x
(xi x)xi
Sxx i=1

= 0 + 1



x
Sxx
= 0 + 1 x
Sxx
= 0
n
X

V ar(0 ) = V ar

!
ci yi

i=1

ind

n
X

V ar(ci yi )

i=1

n
X

c2i

i=1

"
=

n
1 X 2
x
nSxx i=1 i

para 1
E(1 ) = E

n
X

!
di yi

i=1

n
X

di (0 + 1 xi )

i=1

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

186

Captulo 9. An
alisis de Regresi
on

= 0

n
X

di + 1

n
X

i=1

di xi

i=1

n
X

(xi x)xi

= 0 + 1 i=1

Sxx

=0
n
X

V ar(1 ) = V ar

!
di yi

i=1

ind

n
X

d2i

i=1

= 2

n
X
(xi x)2

Sxx

i=1

2
Sxx

Finalmente la covarianza es
Cov(0 , 1 ) = Cov

n
X

ci yi ,

i=1

n X
n
X

n
X

!
di yi

i=1

ci dj Cov(yi , yj )

i=1 j=1

ind

n
X

ci di

i=1

n 
X
1
i=1

(xi x)
x

n
Sxx

n 
X
1 (xi x)
i=1

Sxx



(xi x)
Sxx

(xi x)2 x

2
Sxx

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

9.1 Ejercicios Resueltos

187

x
0
Sxx

2x
Sxx

EJERCICIO 12
Montgomery y Peck (1992) describen el uso de un modelo de regresion para relacionar la
cantidad de tiempo que requiere un vendedor para dar servicio a una maquina expendedora
de refrescos, con el n
umero de envases contenidos en la maquina (X1 ) y la distancia del
vehculo de servicio al sitio donde se encuentra la maquina (X2 ). Los datos se presentan a
continuacion:
Obs.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25

Y X1
9,95
2
24,45
8
31,75 11
35,00 10
25,02
8
16,86
4
14,38
2
9,60
2
24,35
9
27,50
8
17,08
4
37,00 11
41,95 12
11,66
2
21,65
4
17,89
4
69,00 20
10,30
1
34,93 10
46,59 15
44,88 15
54,12 16
56,23 17
22,13
6
21,15
5

X2
50
110
120
550
295
200
375
52
100
300
412
400
500
360
205
400
600
585
540
250
290
510
590
100
400

(a) Construya el modelo.


(b) Determine paso a paso la tabla ANOVA y concluya.

SOLUCION

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

188

Captulo 9. An
alisis de Regresi
on
(a) El modelo es el siguiente:
Y = 0 + 1 X1 + 2 X2 +
para calcular el modelo ajustado
Y = 0 + 1 X1 + 2 X2
necesitamos encontrar los estimadores de mnimos cuadrados a partir de
= (X 0 X)1 X 0 Y
luego tenemos que

25
X

25
X

Xi1
Xi2
n

i=1
i=1

25
25
25
X
X
X

0
2
(X X) =
Xi1
Xi1
Xi1 Xi2

i=1
i=1
i=1
25
25
25
X
X
X

2
Xi2
Xi1 Xi2
Xi2
i=1

i=1

25
206
8294


206 2396
77177
=

8294 77177 3531848

i=1

Invirtiendo (XX) queda

(X 0 X)1

0,2146526166 0,00749091422 3,403891e 004


0,00167076313 1,891781e 005
= 0,0074909142
0,0003403891 0,00001891781
1,495876e 006

25
X

Yi

i=1

25
X

X 0Y =
Xi1 Yi

i=1
25
X

Xi2 Yi

725,42


8001,67
=

274580,71

i=1

por lo tanto los estimadores de mnimos cuadrados son:



0
0,2146526166 0,00749091422 3,403891e 004
725,42
1 = 0,0074909142
0,00167076313 1,891781e 005 8001,67
0,0003403891 0,00001891781
1,495876e 006
274580,71
2

0
2,30920043
1 = 2,74036942
0,01243958
2
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

9.1 Ejercicios Resueltos

189

luego el modelo ajustado es


Y = 2,30920043 + 2,74036942 X1 + 0,01243958 X2
(b) La tabla ANOVA tiene la siguiente forma

Fuente
Regresion
Error
Total

Tabla ANOVA
g.l
SS
MS
F
k 1 SSR SSR /(k 1) M SR /M SE
n k SSE SSE /(n k)
n 1 SST

para rellenarla necesitamos


n
X

SST = Y 0 Y

!2
yi

i=1

= 27133,39 21049,37
= 6084,021
n
X

SSR = X Y

!2
yi

i=1

= 27018,34 21049,37
= 5968,974
SSE = SST SSR
= 115,0465
notese que
2 = S2 =

SSE
,
nk

donde k es la cantidad de parametros a estimar. Luego

2 =

115,0465
= 5,229388
25 3

Ahora la tabla rellenada queda como sigue:


Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

190

Captulo 9. An
alisis de Regresi
on

Fuente
Regresion
Error
Total

Tabla ANOVA
g.l
SS
MS
2 5968.974 2984.487
22 115.0465 5.229388
24 6084.021

F
570.7144

Para docimar la hipotesis:


H0 : 1 = 2 = 0

vs

H1 : Al menos un i 6= 0 para i = 1, 2

Se compara el FAN OV A con un Fk1;nk;1 de tabla. Si


FAN OV A > Fk1;nk;1

se rechaza H0

como
FAN OV A = 570,7144 > 3,443357 = F2;22 (0,95)
Se rechaza H0 , es decir, la regresion es significativa.
Al calcular el R2 tenemos que
R2 =

SSR
= 0,9810904
SST

luego el porcentaje de variabilidad presente en los datos es de 98.11 % aproximadamente.

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

9.2 Ejercicios Propuestos

9.2.

191

Ejercicios Propuestos

1. Un artculo publicado en Concrete Research (Near


Surface Characteristics of Concrete:
Intrinsic Permeability, vol. 41, 1989) presenta datos sobre la resistencia a la compresion x y la permeabilidad intrnsica y de varias mezclas
y tratamientos
de concreto.
P
P 2
P
El resumen
yi = 572,
yi = 23530,
xi =
P es el siguiente: n = 14,
P 2 de cantidades
xi yi = 1697,80. Suponga que las dos variables estan rela43,
xi = 157,42 y
cionadas de acuerdo con el modelo de regresion lineal simple.
a) Calcule las estimaciones de mnimos cuadrados de la pendiente y la ordenada al
origen.
b) Utilice la ecuacion de la recta ajustada para predecir la permeabilidad que sera observada cuando la resistencia a la compresion sea x = 4,3.
c) Proporcione una estimacion puntual de la permeabilidad promedio cuando la resistencia a la compresion para x = 3,7.
d ) Suponga que el valor observado de la permeabilidad para x = 3,7 es y = 46,1.
Calcule el valor del residuo correspondiente.
2. Un artculo publicado en W ear (vol. 152, 1992, pags. 171-181) presenta datos sobre
el desgaste del acero dulce y la viscosidad del aceite. A continuacion aparecen datos
representativos, con x = viscosidad del aceite y y = volumen de desgaste (104 mm3 ).
y 240
x 1.6

181 193
9.4 15.5

155 172
20.0 22.0

110
35.5

113
43.0

75
94
40.5 33.0

a) Construya una grafica de dispersion de los datos. Parece plausible el uso de un


modelo de regresion lineal simple?
b) Si parece plausible, ajuste un modelo de regresion lineal simple utilizando la tecnica de mnimos cuadrados.
c) Haga una prediccion sobre el desgaste cuando la viscosidad es x = 30.
d ) Obtenga el valor ajustado de y cuando x = 22,0 y calcule el residuo correspondiente.
3. Un artculo publicado en el Journal of Environmental Engineering (vol. 115, n
um. 3,
1989, pags. 608-619) informa los resultados de un estudio sobre la aparicion de sodio y
cloro en los arroyos de la parte central de Rhode Island. Los datos siguientes muestran
la concentracion de cloro y (en mg/l) y el area que rodea a la cuenca x (en porcentaje).
y 4.4
x 0.19
y 14.7
x 0.78

6.6
0.15
15.0
0.81

9.7
0.57
17.3
0.78

10.6
0.70
19.2
0.69

10.8 10.9 11.8 12.1


0.67 0.63 0.47 0.70
23.1 27.4 27.7 31.8
1.30 1.05 1.06 1.74

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

14.3
0.60
39.5
1.62

192

Captulo 9. An
alisis de Regresi
on
a) Dibuje un diagrama de dispersion de los datos. En este caso, parece apropiado
el uso de un modelo de regresion lineal simple?
b) Ajuste un modelo de regresion lineal simple utilizando el metodo de mnimos
cuadrados.
c) Estime la concentracion promedio de cloro para una cuenca que tiene un area que
sea el 1 % de la superficie circunvecina.
d ) Encuentre el valor ajustado que corresponde a x = 0,47 as como el residuo
correspondiente.
4. Considere los datos del ejercicio 1. para x = resistencia a la compresion y y = permeabilidad intrnseca del concreto.
a) Pruebe la significancia de la regresion utilizando = 0,05. Encuentre el valor-p
de esta prueba. Puede concluirse que el modelo especifica una relacion lineal u
til
entre las dos variables?
b) Estime 2 y la desviacion estandar de b1 .
c) En este modelo, cual es el error estandar de la ordenada al origen?
5. El ejercicio 3, contiene datos para y = concentracion de cloro y x = area que rodea la
cuenca.
a) Pruebe la hipotesis H0 : 1 = 0 contra H1 : 1 6= 0 utilizando el procedimiento
del analisis de varianza con = 0,01.
b) Encuentre el valor-p de la prueba del inciso a).
c) Estime 2 y los errores estandar de b1 y b0 .
d ) Pruebe que H0 : 0 = 0 contra H1 : 0 6= 0 con = 0,01. Que conclusiones
pueden obtenerse? Parece que el modelo ajustara mejor los datos si se eliminase
la ordenada al origen?
6. Con los datos del ejercicio 1. para x = resistencia a la compresion y y = permeabilidad
intrnseca del concreto:
a) Encuentre un intervalo de confianza del 95 % para la pendiente.
b) Encuentre un intervalo de confianza del 95 % para la ordenada al origen.
c) Encuentre un intervalo de confianza del 95 % para la permeabilidad promedio
cuando x = 2,5.
d ) Encuentre un intervalo de confianza del 95 % para la permeabilidad cuando x =
2,5. Explique por que este intervalo es mayor que el calculado en el inciso c).
7. Con respecto a los datos del ejercicio 2. sobre y = desgaste del acero dulce y x =
viscosidad del aceite:

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

9.2 Ejercicios Propuestos

193

a) Encuentre un intervalo de confianza del 95 % para la ordenada al origen.


b) Encuentre un intervalo de confianza del 95 % para la pendiente.
c) Encuentre un intervalo de confianza del 95 % para el desgaste promedio del acero
dulce cuando la viscosidad del aceite es x = 30.
8. El ejercicio 3. presenta datos sobre y = concentracion de cloro y x = area de la cuenca
en la region de la cuenca en la central de Rhode Island.
a) Encuentre un intervalo de confianza del 99 % para 1 .
b) Encuentre un intervalo de confianza del 99 % para 0 .
c) Encuentre un intervalo de confianza del 99 % para la concentracion promedio de
cloro cuando el area es x = 1,0 %.
d ) Encuentre un intervalo de prediccion del 99 % para la concentracion de cloro
cuando el area es x = 1,0 %.
9. El ejercicio 2. presenta datos sobre el volumen de desgaste y y viscosidad del aceite x.
a) Calcule R2 para este modelo. Proporcione una interpretacion de esta cantidad.
b) Haga una grafica de los residuos de este modelo contra yb y contra x. Interprete
estas graficas.
c) Prepare una grafica de probabilidad normal de los residuos. Parece ser que se
satisface la hipotesis de normalidad?
10. Con respecto al ejercicio 3:
a) Que proporcion de la variabilidad total en la concentracion de cloro esta explicada
por el modelo de regresion?
b) Utilice las observaciones repetidas en x = 70 y x = 78 para obtener una estimacion
del error puro con dos grados de libertad.
c) Utilice el error puro calculado en el inciso b) para probar la falta de ajuste del
modelo de regresion. Utilice = 0,05. Que conclusion puede obtenerse sobre lo
adecuado del modelo?
d ) Haga una grafica de los residuos contra yb y contra x. Interprete las graficas.
e) Prepare una grafica de probabilidad normal de los residuos. Parece que se satisface la hipotesis de normalidad?
11. A continuacion se proporcionan los resultados obtenidos en la prueba final y los examenes
de 20 estudiantes seleccionados al azar, que tomaron un curso de estadstica para ingenieros y otro en investigacion de operaciones. Supongase que los promedios finales
tienen una distribucion conjunta normal.
Estadstica 86 75 69 75 90 94 83 86 71 65
IO
80 81 75 81 92 95 80 81 76 72
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

194

Captulo 9. An
alisis de Regresi
on
Estadstica 84 71 62 90 83 75 71 76 84 97
IO
85 72 65 93 81 70 73 72 80 98
a) Encuentre la recta de regresion que relaciona el promedio final en estadstica con
el promedio final en IO.
b) Pruebe la significancia de la regresion con = 0,05.
c) Estime el coeficiente de correlacion.
d ) Pruebe la hipotesis de que = 0, utilizando para ello = 0,05.
e) Pruebe la hipotesis de que = 0,5 utilizando = 0,05.
f ) Construya un intervalo de confianza del 95 % para el coeficiente de correlacion.
12. Se observa y se nota la duracion de un ciclo de una maquina automatica.
Segundos 2.10
Frecuencia 16

2.11
28

2.12 2.13
41
74

2.14
149

2.15
256

2.16 2.17 2.18


137
82
40

2.19
19

2.20
11

a) La distribucion normal parece ser un modelo de probabilidad razonable para


la duracion del ciclo? Utilice la prueba ji-cuadrada de bondad del ajuste, con
= 0,005.
b) Encuentre el valor-p de esta prueba.
13. Los ingenieros civiles a menudo utilizan la ecuacion de lnea recta E(y) = b0 + b1 x para
modelar la relacion entre la resistencia de corte media E(y) de las juntas de alba
nilera
y el esfuerzo de precompresion x. Con objeto de probar esta teora, se realizo una
serie de pruebas de esfuerzo con tabiques solidos dispuestos en tripletas y unidos con
mortero (P roceedings of the Institute of Civil Engineers, marzo de 1990). Se vario el
esfuerzo de compresion para cada tripleta y se registro la carga de corte maxima justo
antes de la ruptura (llamada resistencia de corte). En la tabla se indican los resultados
de esfuerzo para 7 tripletas (medidos en N/mm2 ).
Prueba de tripleta
Resistencia al corte, y
Esfuerzo de compresion, x

1
1.00
0

2
3
4
5
6
7
2.18 2.24 2.41 2.59 2.82 3.06
.06 1.20 1.33 1.43 1.75 1.75

a) Grafique los siete puntos de datos en un diagrama de dispersion. Parece ser lineal
la relacion entre la resistencia de corte y el esfuerzo de precompresion?
b) Utilice el metodo de mnimos cuadrados para estimar los parametros del modelo
lineal.
c) Interprete los valores de b0 y b1 .
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

9.2 Ejercicios Propuestos

195

14. El artculo Some Field Experience in the Use of an Accelerated Method in Estimating
28Day Strength of Concrete(J. Amer. Concrete Institute, 1969, p. 895) considero la regresion de la resistencia estandar de curado y = 28 das (en lb/pulg2 ) contra
x = resistencia acelerada (en lb/pulg2 ). Suponga que la ecuacion de la verdadera recta
de regresion es y = 1800 + 1,3x.
(a) Cual es el valor esperado de la resistencia de 28 das cuando la resistencia acelerada = 2500?.
(b) Cuanto podemos esperar que cambie la resistencia de 28 das cuando la resistencia acelerada aumenta en 1 lb/pulg2 .
(c) Conteste el inciso (b) para un aumento de 100 lb/pulg2 .
(d) Conteste el inciso (b) para una disminucion de 100 lb/pulg2 .
15. Refierase al estudio de Vietnam expuestos al agente Naranja (y la dioxina 2,3,7,8TCDD). La tabla de datos, que se reproduce a continuacion, proporciona las cantidades
de 2,3,7,8-TCDD (medidas en partes por millon) tanto en plasma sanguneo como un
tejido graso extrados de cada uno de los 20 veteranos estudiados. Un objetivo de
los investigadores es determinar el grado de asociacion lineal entre el nivel de dioxina
observado en plasma sanguneo y en tejido graso. Si se puede establecer una asociacion
lineal entre las dos variables, los investigadores querran construir modelos para: (1)
predecir el nivel de 2,3,7,8-TCDD observado en tejido graso y (2) predecir el nivel en
tejido graso a partir del nivel en plasma sanguneo.
Veterano
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

Niveles de TCDD en plasma


2.5
3.1
2.1
3.5
3.1
1.8
6.0
3.0
36.0
4.7
6.9
3.3
4.6
1.6
7.2
1.8
20.0
2.0
2.5
4.1

Niveles de TCDD en tejido graso


4.9
5.9
4.4
6.9
7.0
4.2
10.0
5.5
41.0
4.4
7.0
2.9
4.6
1.4
7.7
1.1
11.0
2.5
2.3
2.5

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

196

Captulo 9. An
alisis de Regresi
on
a) Encuentre las ecuaciones de prediccion que necesitan los investigadores. Interprete
los resultados.
b) Pruebe la hipotesis de que el nivel en tejido graso (x) sirve para predecir linealmente el nivel en plasma sanguneo (y). Utilice = 0,05.
c) Pruebe la hipotesis de que el nivel en plasma sanguneo (x) sirve para predecir
linealmente el nivel en tejido graso (y). Utilice = 0,05.
d ) Intuitivamente, por que deben coincidir los resultados de los incisos b) y c)?
16. Se realizo un experimento con objeto de estudiar el agrietamiento por esfuerzos de
corrosion de acero inoxidable tipo 304 en un entorno simulado de reactor con agua
en ebullicion (T ransactions of the ASM E, enero de 1986). Seis especmenes de acero
inoxidable se recocieron y se sensibilizaron en agua a 289 C con oxgeno y sulfato
disueltos, sometiendolos a diversos factores de intensidad de esfuerzo (es decir, cargas).
La tabla presenta la carga maxima y la rapidez de crecimiento de grietas resultante
(en metros por segundo) para los seis especmenes.
Carga maxima
1
x, M P a m 2
Rapidez de crecimiento
de grietas y, m/s 1010

30.0

35.6 41.5

50.2

55.5

61.1

1.0

2.2

5.8

5.0

14.0

3.9

a) Hay suficientes pruebas que indiquen que la rapidez de crecimiento de grietas


aumenta linealmente con la carga maxima? Pruebe con = 0,10.
b) Estime el incremento medio en la rapidez de crecimiento de grietas por cada
incremento unitario en la carga maxima, empleando un intervalo de confianza de
90 %. Interprete el resultado.
17. Un modelo robusto y muy utilizado para el movimiento humano es la Ley de Fitts.
Seg
un esta ley, el tiempo T necesario para moverse y seleccionar un objetivo de anchura W que esta a una distancia (o amplitud) A es: T = a + b log2 (2A/W ) donde
a y b son constantes que se estiman mediante regresion lineal simple. La cantidad
log2 (2A/W ) se denomina ndice de dificultad (ID) y representa la variable independiente (medida en bits) del modelo. Ciertas investigaciones de las que se informo en
el Special Interest Group on Computer Human Interaction Bulletin (julio de 1993)
utilizaron la Ley de Fitts para modelar el tiempo (en milisegundos) necesario para
realizar cierta tarea en una computadora. Con base en datos obtenidos de n = 160
ensayos (empleando diferentes valores de A y W ). Se obtuvo la siguiente prediccion de
mnimos cuadrados: Tb = 175,4 + 133,2(ID)
a) Interprete las estimaciones, 175.4 y 133.2.
b) El coeficiente de correlacion para el analisis es r = 0,951. Interprete este valor.
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

9.2 Ejercicios Propuestos

197

c) Realice una prueba para determinar si el modelo de la Ley de Fitts es estadsticamente adecuado para predecir el tiempo de realizacion de las tareas. Utilice
= 0,05.
d ) Calcule el coeficiente de determinacion, r2 . Interprete el resultado.
18. Refierase al experimento, informado en Combustion and F lame, de difusividad del
oxgeno. Los datos para las nueve muestras de mezcla de nitrogeno y oxigeno se reproducen en la siguiente tabla.
Temperatura
x
1,000
1,100
1,200
1,300
1,400
1,500
1,600
1,700
1,800

Difusividad de oxgeno
y
1.69
1.99
2.31
2.65
3.01
3.39
3.79
4.21
4.64

a) Calcule r y r2 . Interprete sus valores.


b) Realice una prueba para determinar si la temperatura y la difusividad del oxgeno
exhiben una correlacion positiva. Utilice = 0,05.
19. La exposicion pasiva al humo de tabaco en el ambiente se ha asociado a la supresion del
crecimiento y a un incremento en la frecuencia de infecciones de las vas respiratorias
en ni
nos normales. Esta asociacion es mas pronunciada en ni
nos que padecen fibrosis
cstica? Con el fin de contestar esta pregunta, se estudiaron 43 ni
nos (18 ni
nas y 25
ni
nos) que asistieron a un campamento de verano de dos semanas para pacientes con
fibrosis cstica (N ew England Journal of M edicine, 20 de septiembre de 1990). Entre
las diversas variables que se midieron estuvieron el percentil de peso del ni
no (y) y el
n
umero de cigarrillos fumados por da en el hogar del ni
no (x).
a) Para las 18 ni
nas, el coeficiente de correlacion entre y y x se informo como r =
0,50. Interprete este resultado.
b) Refierase al inciso (a). El valor-p para probar H0 : = 0 contra H1 : 6= 0 se
informo como p = 0,03. Interprete este resultado.
c) Para los 25 ni
nos, el coeficiente de correlacion entre y y x se informo como r =
0,12. Interprete este resultado.
d ) Refierase al inciso (c). El valor-p para probar H0 : = 0 contra H1 : 6= 0 se
informo como p = 0,57. Interprete este resultado.
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

198

Captulo 9. An
alisis de Regresi
on
20. Los siguientes estadsticos de resumen se obtuvieron de un estudio que utilizo el analisis
de regresion para investigar la relacion entre la flexion de un pavimento y la temperatura superficial del pavimento de varios lugares de una carretera estatal. Aqu x =
temperatura (o F) e y = factor de ajuste de flexion (y 0):
n = 15
X

x2i = 139037,25

X
xi = 1425
yi = 10,68
X
X
xi yi = 987,645
yi2 = 7,85183

(a) Calcule 1 , 0 y la ecuacion de la recta de regresion estimada.


(b) Cual es la estimacion de cambio esperado en el factor de ajuste de flexion cuando
la temperatura aumenta 1o F?.
(c) Suponga que la temperatura se midio en
de regresion estimada?.

C en lugar de

F. Cual sera la recta

21. Es sabido que la potencia de un vehculo se relaciona directamente con el n


umero de
pistones. Sea Yi : potencia del vehculo i (miles de rpm) y Xi : n
umero de pistones del
vehculo i, se postula el modelo:
Yi = Xi + i ,

i = 1, . . . , n

Supuestos. E(i ) = 0, Var i = 2 , Cov(i , j ) = 0 i 6= j.


(a) Encuentre el estimador de mnimos cuadrados de y obtenga una expresion para
la varianza de dicho estimador.
(b) Estime la ecuacion de regresion, si una muestra de 5 vehculos entrega:
X
Y

2 2 3
5 6 9

4
11

4
13

22. El concreto sin finos, preparado con un agregado grueso clasificado uniformemente y
una pasta de cemento y agua, es bueno en zonas de lluvia excesiva por sus excelentes
propiedades de drenado. El artculo Pavement Thickness Design for No-Fines
Concrete Parking Lots. (J. of Transporting Engr., 1995, pp. 476484) describe el
empleo de un analisis de mnimos cuadrados para estudiar la forma como y = porosidad
( %) se relaciona con x = peso unitario (lb/pie3 ) en especmenes de concreto. Utilice
el resultado que se presenta del software MINITAB para contestar las siguientes preguntas:
(a) Cual es la ecuacion de la recta de regresion estimada?.
(b) Interprete el valor estimado de 1 .
(c) Construya un intervalo de confianza de 95 % para 1 . A partir del intervalo de confianza Puede concluir que la variable x es significativa en el modelo de regresion
simple?.
(d) Cual es la estimacion de ?.
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

9.2 Ejercicios Propuestos

199

(e) Cual es el valor de la variacion total que es explicada por el modelo?.


(f) Encuentre una estimacion puntual para la porosidad promedio real de todos los
especmenes, cuyo peso unitario sea 110 lb/pie3 .
Regression Analysis: y versus x
Predictor
Constant
x

Coef
118,910
-0,90473

SE
4,499
0,04109

Coef T
26,43
-22,02

P
0,000
0,000

Analysis of Variance
Source
Regression
Residual Error
Total

DF
1
13
14

SS
426,62
11,44
438,06

MS
426,62
0,88

F
484,84

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

P
0,000

200

Captulo 9. An
alisis de Regresi
on

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

Ap
endice A
Formulario de Distribuciones

X B(p)

P (X = x)

E(X)

V (X)

MX (t)

RX (x)

px (1 p)1x

pq

q + pet

0, 1

np

npq

(q + pet )n

0, 1, ..., n

1
p

q
p2

r
p

rq
p

np

n
nM
( N M
)( N
)
N
N
N 1

a+b
2

(ba)2
12

1
2

et+

(1 t)

x>0

r
2

r
( t
)

x>0

n x
p (1
x

X Bin(n, p)

pq x1

X G(p)

x1 r xr
p q
r1

X Bineg(r, p)

X H(M, N, n)

X N (, 2 )



N M

1
,
ba

0,

a<x<b
e.o.c.

ex

1
e
2 2

pet
1qet

, si qet < 1

pe
[ 1qe
]r , si qet < 1

1,2,...

r, r + 1, ...

 nx


x e
x!

X E()

M
x

N
n

X P ( = t)

X U (a, b)

p)nx

(x)2
2 2

0, 1, ..., mn(M, n)

e(e

1)

etb eat
t(ba)

,t

2 t2
2

0,1,...

0, 1, 2, ...

X Gamma(, )

X Erlang(r, )

x(1) e
()

r xr1 ex
(r1)!

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

II

Captulo A. Formulario de Distribuciones

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

Ap
endice B
Formulario de An
alisis de Regresi
on
Simple
1. Modelo de Regresi
on Estimado
y =0 + 1 x
0 =y 1 x
n
X
n
X

xi yi

i=1

i=1

n
X

x2i

yi

1 = i=1
n
X

n
X

xi

!2
xi

i=1

i=1

2. Suma de cuadrados
n
X

a) Sxx =

n
X

(xi x)2 =

i=1

n
X

x2i

b) Syy =

(yi y)2 =

i=1

yi2

i=1

i=1

n
X

xi

i=1

n
X
n
X

!2

!2
yi

i=1

.
n
X

c) Sxy =

n
X
i=1

(xi x)(yi y) =

n
X
i=1

xi yi

i=1

xi

n
X

yi

i=1

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

IV

Captulo B. Formulario de An
alisis de Regresi
on Simple
d ) SSE = Syy 1 Sxy .
e) SSR = 1 Sxy .
f ) SST = SSR + SSE = Syy
3. Varianzas y Desviaciones Est
andar
a)
2 =

SSE
n2

b) se(0 ) =
c) se(1 ) =

r 

2 n1 +
q

x2
Sxx

2
Sxx

4. Test de Hip
otesis para los coeficientes
a) H0 : 0 = 0 H1 : 0 6= 0
T0 =

0
se(0 )

T1 =

1
se(1 )

b) H0 : 1 = 0 H1 : 1 6= 0

En ambos caso se rechaza la hipotesis nula si |Ti | > tn2,1/2


5. Intervalos de Confianza
a) Intervalos de Confianza para los coeficientes
IC(0 ) =0 tn2,1/2 se(0 )
IC(1 ) =1 tn2,1/2 se(1 )

b) Intervalo de Confianza para la Prediccion y0 en el valor x0 , donde y0 = 0 + 1 x0


s
IC(y0 ) = y0 tn2,1/2



2
1
(x

x)
0

2 1 + +
n
Sxx

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

V
c) Intervalo de Confianza para la respuesta media, donde
y|x0 = 0 + 1 x0
s
IC(y|x0 ) =
y|x0 tn2,1/2

1 (x0 x)2
+
n
Sxx

6. Coeficiente de Determinaci
on R2
Sxy
SSE
R2 = 1
=1
Syy
Syy

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

VI

Captulo B. Formulario de An
alisis de Regresi
on Simple

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

Ap
endice C
Tablas de distribuci
on
C.1.

Distribuci
on t de Student
gl
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30

0.20
1.38
1.06
0.98
0.94
0.92
0.91
0.90
0.89
0.88
0.88
0.88
0.87
0.87
0.87
0.87
0.86
0.86
0.86
0.86
0.86
0.86
0.86
0.86
0.86
0.86
0.86
0.86
0.85
0.85
0.85
0.84

0.15
1.96
1.39
1.25
1.19
1.16
1.13
1.12
1.11
1.10
1.09
1.09
1.08
1.08
1.08
1.07
1.07
1.07
1.07
1.07
1.06
1.06
1.06
1.06
1.06
1.06
1.06
1.06
1.06
1.06
1.05
1.04

Magnitud de en una cola


0.10 0.05 0.025 0.01 0.005
3.08 6.31
12.71 31.82 63.66
1.89 2.92
4.30
6.96
9.92
1.64 2.35
3.18
4.54
5.84
1.53 2.13
2.78
3.75
4.60
1.48 2.02
2.57
3.36
4.03
1.44 1.94
2.45
3.14
3.71
1.41 1.89
2.36
3.00
3.50
1.40 1.86
2.31
2.90
3.36
1.38 1.83
2.26
2.82
3.25
1.37 1.81
2.23
2.76
3.17
1.36 1.80
2.20
2.72
3.11
1.36 1.78
2.18
2.68
3.05
1.35 1.77
2.16
2.65
3.01
1.35 1.76
2.14
2.62
2.98
1.34 1.75
2.13
2.60
2.95
1.34 1.75
2.12
2.58
2.92
1.33 1.74
2.11
2.57
2.90
1.33 1.73
2.10
2.55
2.88
1.33 1.73
2.09
2.54
2.86
1.33 1.72
2.09
2.53
2.85
1.32 1.72
2.08
2.52
2.83
1.32 1.72
2.07
2.51
2.82
1.32 1.71
2.07
2.50
2.81
1.32 1.71
2.06
2.49
2.80
1.32 1.71
2.06
2.49
2.79
1.31 1.71
2.06
2.48
2.78
1.31 1.70
2.05
2.47
2.77
1.31 1.70
2.05
2.47
2.76
1.31 1.70
2.05
2.46
2.76
1.31 1.70
2.04
2.46
2.75
1.28 1.64
1.96
2.33
2.58

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

0.0005
636.58
31.60
12.92
8.61
6.87
5.96
5.41
5.04
4.78
4.59
4.44
4.32
4.22
4.14
4.07
4.01
3.97
3.92
3.88
3.85
3.82
3.79
3.77
3.75
3.73
3.71
3.69
3.67
3.66
3.65
3.29

VIII

C.2.

Captulo C. Tablas de distribuci


on

Distribuci
on 2
gl
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19

gl
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19

Proporci
on del Area hasta +
0.995 0.99 0.975 0.95 0.90 0.75
0.00
0.00
0.00
0.00 0.02 0.10
0.01
0.02
0.05
0.10 0.21 0.58
0.07
0.11
0.22
0.35 0.58 1.21
0.21
0.30
0.48
0.71 1.06 1.92
0.41
0.55
0.83
1.15 1.61 2.67
0.68
0.87
1.24
1.64 2.20 3.45
0.99
1.24
1.69
2.17 2.83 4.25
1.34
1.65
2.18
2.73 3.49 5.07
1.73
2.09
2.70
3.33 4.17 5.90
2.16
2.56
3.25
3.94 4.87 6.74
2.60
3.05
3.82
4.57 5.58 7.58
3.07
3.57
4.40
5.23 6.30 8.44
3.57
4.11
5.01
5.89 7.04 9.30
4.07
4.66
5.63
6.57 7.79 10.17
4.60
5.23
6.26
7.26 8.55 11.04
5.14
5.81
6.91
7.96 9.31 11.91
5.70
6.41
7.56
8.67 10.09 12.79
6.26
7.01
8.23
9.39 10.86 13.68
6.84
7.63
8.91 10.12 11.65 14.56

0.25
1.32
2.77
4.11
5.39
6.63
7.84
9.04
10.22
11.39
12.55
13.70
14.85
15.98
17.12
18.25
19.37
20.49
21.60
22.72

Proporci
on
0.10 0.05
2.71 3.84
4.61 5.99
6.25 7.81
7.78 9.49
9.24 11.07
10.64 12.59
12.02 14.07
13.36 15.51
14.68 16.92
15.99 18.31
17.28 19.68
18.55 21.03
19.81 22.36
21.06 23.68
22.31 25.00
23.54 26.30
24.77 27.59
25.99 28.87
27.20 30.14

del Area hasta +


0.03 0.01 0.005
5.02 6.63
7.88
7.38 9.21 10.60
9.35 11.34 12.84
11.14 13.28 14.86
12.83 15.09 16.75
14.45 16.81 18.55
16.01 18.48 20.28
17.53 20.09 21.95
19.02 21.67 23.59
20.48 23.21 25.19
21.92 24.73 26.76
23.34 26.22 28.30
24.74 27.69 29.82
26.12 29.14 31.32
27.49 30.58 32.80
28.85 32.00 34.27
30.19 33.41 35.72
31.53 34.81 37.16
32.85 36.19 38.58

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

0.50
0.45
1.39
2.37
3.36
4.35
5.35
6.35
7.34
8.34
9.34
10.34
11.34
12.34
13.34
14.34
15.34
16.34
17.34
18.34

0.001
10.83
13.82
16.27
18.47
20.51
22.46
24.32
26.12
27.88
29.59
31.26
32.91
34.53
36.12
37.70
39.25
40.79
42.31
43.82

C.3 Distribuci
on F ( = 0,05)

C.3.

IX

Distribuci
on F ( = 0,05)

Grados de libertad
denominador
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
30
40
60
120

1
161
18.5
10.1
7.71
6.61
5.99
5.59
5.32
5.12
4.96
4.84
4.75
4.67
4.60
4.54
4.49
4.45
4.41
4.38
4.35
4.32
4.30
4.28
4.26
4.24
4.17
4.08
4.00
3.92
3.84

Grados
2
3
199 216
19.0 19.2
9.55 9.28
6.94 6.59
5.79 5.41
5.14 4.76
4.74 4.35
4.46 4.07
4.26 3.86
4.10 3.71
3.98 3.59
3.89 3.49
3.81 3.41
3.74 3.34
3.68 3.29
3.63 3.24
3.59 3.20
3.55 3.16
3.52 3.13
3.49 3.10
3.47 3.07
3.44 3.05
3.42 3.03
3.40 3.01
3.39 2.99
3.32 2.92
3.23 2.84
3.15 2.76
3.07 2.68
3.00 2.60

de libertad
4
5
225 230
19.2 19.3
9.12 9.01
6.39 6.26
5.19 5.05
4.53 4.39
4.12 3.97
3.84 3.69
3.63 3.48
3.48 3.33
3.36 3.20
3.26 3.11
3.18 3.03
3.11 2.96
3.06 2.90
3.01 2.85
2.96 2.81
2.93 2.77
2.90 2.74
2.87 2.71
2.84 2.68
2.82 2.66
2.80 2.64
2.78 2.62
2.76 2.60
2.69 2.53
2.61 2.45
2.53 2.37
2.45 2.29
2.37 2.21

para
6
234
19.3
8.94
6.16
4.95
4.28
3.87
3.58
3.37
3.22
3.09
3.00
2.92
2.85
2.79
2.74
2.70
2.66
2.63
2.60
2.57
2.55
2.53
2.51
2.49
2.42
2.34
2.25
2.18
2.10

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

el numerador
7
8
9
237 239 241
19.4 19.4 19.4
8.89 8.85 8.81
6.09 6.04 6.00
4.88 4.82 4.77
4.21 4.15 4.10
3.79 3.73 3.68
3.50 3.44 3.39
3.29 3.23 3.18
3.14 3.07 3.02
3.01 2.95 2.90
2.91 2.85 2.80
2.83 2.77 2.71
2.76 2.70 2.65
2.71 2.64 2.59
2.66 2.59 2.54
2.61 2.55 2.49
2.58 2.51 2.46
2.54 2.48 2.42
2.51 2.45 2.39
2.49 2.42 2.37
2.46 2.40 2.34
2.44 2.37 2.32
2.42 2.36 2.30
2.40 2.34 2.28
2.33 2.27 2.21
2.25 2.18 2.12
2.17 2.10 2.04
2.09 2.02 1.96
2.01 1.94 1.88

10
242
19.4
8.79
5.96
4.74
4.06
3.64
3.35
3.14
2.98
2.85
2.75
2.67
2.60
2.54
2.49
2.45
2.41
2.38
2.35
2.32
2.30
2.27
2.25
2.24
2.16
2.08
1.99
1.91
1.83

Captulo C. Tablas de distribuci


on
(Continuaci
on)
Grados de libertad
denominador
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
30
40
60
120

12
244
19.4
8.74
5.91
4.68
4.00
3.57
3.28
3.07
2.91
2.79
2.69
2.60
2.53
2.48
2.42
2.38
2.34
2.31
2.28
2.25
2.23
2.20
2.18
2.16
2.09
2.00
1.92
1.83
1.75

Grados de
15
20
246 248
19.4 19.4
8.70 8.66
5.86 5.80
4.62 4.56
3.94 3.87
3.51 3.44
3.22 3.15
3.01 2.94
2.85 2.77
2.72 2.65
2.62 2.54
2.53 2.46
2.46 2.39
2.40 2.33
2.35 2.28
2.31 2.23
2.27 2.19
2.23 2.16
2.20 2.12
2.18 2.10
2.15 2.07
2.13 2.05
2.11 2.03
2.09 2.01
2.01 1.93
1.92 1.84
1.84 1.75
1.75 1.66
1.67 1.57

libertad para el
24
30
40
249 250 251
19.5 19.5 19.5
8.64 8.62 8.59
5.77 5.75 5.72
4.53 4.50 4.46
3.84 3.81 3.77
3.41 3.38 3.34
3.12 3.08 3.04
2.90 2.86 2.83
2.74 2.70 2.66
2.61 2.57 2.53
2.51 2.47 2.43
2.42 2.38 2.34
2.35 2.31 2.27
2.29 2.25 2.20
2.24 2.19 2.15
2.19 2.15 2.10
2.15 2.11 2.06
2.11 2.07 2.03
2.08 2.04 1.99
2.05 2.01 1.96
2.03 1.98 1.94
2.01 1.96 1.91
1.98 1.94 1.89
1.96 1.92 1.87
1.89 1.84 1.79
1.79 1.74 1.69
1.70 1.65 1.59
1.61 1.55 1.50
1.52 1.46 1.39

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

numerador
60 120
252 253
19.5 19.5
8.57 8.55
5.69 5.66
4.43 4.40
3.74 3.70
3.30 3.27
3.01 2.97
2.79 2.75
2.62 2.58
2.49 2.45
2.38 2.34
2.30 2.25
2.22 2.18
2.16 2.11
2.11 2.06
2.06 2.01
2.02 1.97
1.98 1.93
1.95 1.90
1.92 1.87
1.89 1.84
1.86 1.81
1.84 1.79
1.82 1.77
1.74 1.68
1.64 1.58
1.53 1.47
1.43 1.35
1.32 1.22

254
19.5
8.53
5.63
4.37
3.67
3.23
2.93
2.71
2.54
2.40
2.30
2.21
2.13
2.07
2.01
1.96
1.92
1.88
1.84
1.81
1.78
1.76
1.73
1.71
1.62
1.51
1.39
1.25
1.00

C.4 Distribuci
on Normal

C.4.
z
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.0
1.1
1.2
1.3
1.4
1.5
1.6
1.7
1.8
1.9
2.0
2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8
2.9
3.0
3.1
3.2
3.3
3.4
3.5

XI

Distribuci
on Normal
0.0
0.5000
0.5398
0.5793
0.6179
0.6554
0.6915
0.7257
0.7580
0.7881
0.8159
0.8413
0.8643
0.8849
0.9032
0.9192
0.9332
0.9452
0.9554
0.9641
0.9713
0.9772
0.9821
0.9861
0.9893
0.9918
0.9938
0.9953
0.9965
0.9974
0.9981
0.9987
0.9990
0.9993
0.9995
0.9997
0.9998

0.01
0.5040
0.5438
0.5832
0.6217
0.6591
0.6950
0.7291
0.7611
0.7910
0.8186
0.8438
0.8665
0.8869
0.9049
0.9207
0.9345
0.9463
0.9564
0.9649
0.9719
0.9778
0.9826
0.9864
0.9896
0.9920
0.9940
0.9955
0.9966
0.9975
0.9982
0.9987
0.9991
0.9993
0.9995
0.9997
0.9998

0.02
0.5080
0.5478
0.5871
0.6255
0.6628
0.6985
0.7324
0.7642
0.7939
0.8212
0.8461
0.8686
0.8888
0.9066
0.9222
0.9357
0.9474
0.9573
0.9656
0.9726
0.9783
0.9830
0.9868
0.9898
0.9922
0.9941
0.9956
0.9967
0.9976
0.9982
0.9987
0.9991
0.9994
0.9995
0.9997
0.9998

Segunda cifra
0.03
0.04
0.5120 0.5160
0.5517 0.5557
0.5910 0.5948
0.6293 0.6331
0.6664 0.6700
0.7019 0.7054
0.7357 0.7389
0.7673 0.7704
0.7967 0.7995
0.8238 0.8264
0.8485 0.8508
0.8708 0.8729
0.8907 0.8925
0.9082 0.9099
0.9236 0.9251
0.9370 0.9382
0.9484 0.9495
0.9582 0.9591
0.9664 0.9671
0.9732 0.9738
0.9788 0.9793
0.9834 0.9838
0.9871 0.9875
0.9901 0.9904
0.9925 0.9927
0.9943 0.9945
0.9957 0.9959
0.9968 0.9969
0.9977 0.9977
0.9983 0.9984
0.9988 0.9988
0.9991 0.9992
0.9994 0.9994
0.9996 0.9996
0.9997 0.9997
0.9998 0.9998

decimal en z
0.05
0.06
0.5199 0.5239
0.5596 0.5636
0.5987 0.6026
0.6368 0.6406
0.6736 0.6772
0.7088 0.7123
0.7422 0.7454
0.7734 0.7764
0.8023 0.8051
0.8289 0.8315
0.8531 0.8554
0.8749 0.8770
0.8944 0.8962
0.9115 0.9131
0.9265 0.9279
0.9394 0.9406
0.9505 0.9515
0.9599 0.9608
0.9678 0.9686
0.9744 0.9750
0.9798 0.9803
0.9842 0.9846
0.9878 0.9881
0.9906 0.9909
0.9929 0.9931
0.9946 0.9948
0.9960 0.9961
0.9970 0.9971
0.9978 0.9979
0.9984 0.9985
0.9989 0.9989
0.9992 0.9992
0.9994 0.9994
0.9996 0.9996
0.9997 0.9997
0.9998 0.9998

Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.

0.07
0.5279
0.5675
0.6064
0.6443
0.6808
0.7157
0.7486
0.7794
0.8078
0.8340
0.8577
0.8790
0.8980
0.9147
0.9292
0.9418
0.9525
0.9616
0.9693
0.9756
0.9808
0.9850
0.9884
0.9911
0.9932
0.9949
0.9962
0.9972
0.9979
0.9985
0.9989
0.9992
0.9995
0.9996
0.9997
0.9998

0.08
0.5319
0.5714
0.6103
0.6480
0.6844
0.7190
0.7517
0.7823
0.8106
0.8365
0.8599
0.8810
0.8997
0.9162
0.9306
0.9429
0.9535
0.9625
0.9699
0.9761
0.9812
0.9854
0.9887
0.9913
0.9934
0.9951
0.9963
0.9973
0.9980
0.9986
0.9990
0.9993
0.9995
0.9996
0.9997
0.9998

0.09
0.5359
0.5753
0.6141
0.6517
0.6879
0.7224
0.7549
0.7852
0.8133
0.8389
0.8621
0.8830
0.9015
0.9177
0.9319
0.9441
0.9545
0.9633
0.9706
0.9767
0.9817
0.9857
0.9890
0.9916
0.9936
0.9952
0.9964
0.9974
0.9981
0.9986
0.9990
0.9993
0.9995
0.9997
0.9998
0.9998

Вам также может понравиться