Métodos estadísticos de la ingeniería (Univ. Oviedo

UNIVERSIDAD DE OVIEDO
INGENIER
IA INDUSTRIAL
M
ETODOS ESTAD
ISTICOS
DE LA INGENIER
IA
(http://enol.epsig.uniovi.es/medli)
Profesores: Jose M. Gonzalez
Susana Montes
Fermn Suarez
Programa
Tablas
Apuntes de teora
Esquemas para ejercicios
Enunciados de problemas
Soluciones de problemas
Preguntas de Test
Practicas de ordenador
Cuestionario de practicas
Examenes cursos anteriores
Febrero 2010
Indice general
PROGRAMA. 7
TABLAS. 9
TEMA 1.- INTRODUCCI
ON A LA ESTAD
ISTICA DESCRIPTIVA. 19
Apuntes de teora. 19
1.1. Introduccion. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
1.2. Conceptos fundamentales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
1.2.1. Clases de datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
1.2.2. Poblacion y muestra. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
1.2.3. Matriz de datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.2.4. Datos agrupados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.3. Distribuciones de frecuencia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
1.4. Representacion graca de las distribuciones unidimensionales de frecuencias. . . . . . . . . . . . . 24
1.5. Medidas de tendencia central. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
1.6. Medidas de dispersion. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
1.7. Medidas de asimetra y curtosis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
Enunciados de los ejercicios. 43
Soluciones de los ejercicios. 47
Preguntas de test. 51
Practica 1.1 de ordenador. 57
1.1. Introduccion de datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
1.1.1. Introduccion de datos desde el teclado. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
1.1.2. Importar datos desde archivos de Microsoft Excel. . . . . . . . . . . . . . . . . . . . . . . 59
1.1.3. Importar datos desde archivos de texto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
1.2. Formato de datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
1.3. Formulas y funciones. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
1.3.1. Insertar una formula sencilla. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
1.3.2. Insertar una funcion de Excel. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
1.4. Referencias de celda. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
1
2,

Indice Metodos Estadsticos de la Ingeniera
1.5. Introducir nombres para las variables. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
1.6. Modulos complementarios de Excel. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
1.6.1. Herramientas para analisis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
1.6.2. StatPlus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
1.1. Crear una tabla de frecuencias. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
1.2. Representaciones gracas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
1.2.1. Diagrama de barras. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
1.2.2. Diagrama de sectores. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
1.2.3. Histograma. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
1.2.4. Diagrama de tallo y hojas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
1.2.5. Diagrama de caja. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
1.2.6. Diagrama de Pareto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
1.1. Medidas de centralizacion, posicion y dispersion. . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
TEMA 2.- PROBABILIDAD. 75
2.1. Experimento aleatorio. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
2.2. Probabilidad. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
2.3. Asignacion de Probabilidad. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
2.4. Probabilidad condicionada. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
2.5. Independencia de Sucesos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
2.6. Teoremas de la Probabilidad Compuesta, Total y de Bayes. . . . . . . . . . . . . . . . . . . . . . 85
Esquema sobre conjuntos. 89
2.1. Experimento aleatorio. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
2.2. Probabilidad. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
2.3. Asignacion de probabilidad. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
2.4. Probabilidad condicionada. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
2.5. Independencia de sucesos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
Practica 2 de ordenador. 107
2.2. Probabilidad. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
Metodos Estadsticos de la Ingeniera

Indice, 3
2.3. Asignacion de Probabilidad. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
TEMA 3.- VARIABLES ALEATORIAS. 111
3.1. Introduccion. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
3.2. Clasicacion de las variables aleatorias. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
3.3. Momentos de las variables aleatorias. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
3.4. Funciones de una variable aleatoria. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
3.5. Funcion generatriz de momentos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
3.1. Introduccion. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
3.3. Momentos de las variables aleatorias. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
3.4. Funciones de una variable aleatoria. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
3.5. Funcion generatriz de momentos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124
TEMA 4.- MODELOS DE DISTRIBUCIONES M
AS COMUNES. 139
4.1. Distribucion de Bernoulli. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
4.2. Distribucion Binomial. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140
4.3. Distribucion Hipergeometrica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
4.4. Distribucion Geometrica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143
4.5. Distribucion de Poisson. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144
4.6. Distribucion Uniforme. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145
4.7. Distribucion Gamma. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147
4.8. Distribucion Normal. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149
4.1. Distribuciones discretas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153
4.6. Distribuciones continuas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154
TEMA 5.- VARIABLES ALEATORIAS BIDIMENSIONALES. 177
4,

5.1. Introduccion. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177
5.3. Distribuciones condicionadas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 180
5.4. Independencia entre variables aleatorias. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181
5.5. Funciones de variables aleatorias bidimensionales. . . . . . . . . . . . . . . . . . . . . . . . . . . . 183
5.6. Momentos de funciones de variables aleatorias bidimensionales. . . . . . . . . . . . . . . . . . . . 183
5.7. Distribuciones reproductivas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185
TEMA 6.- CONVERGENCIA DE VARIABLES ALEATORIAS. 211
6.1. Tipos de convergencias. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211
6.2. Leyes de los grandes n umeros. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212
6.3. Teorema central del lmite. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213
6.4. Tama no muestral. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 217
6.4. Tama no muestral. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 237
TEMA 7.- MUESTREO Y DISTRIBUCIONES MUESTRALES. 241
7.1. Introduccion. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 241
7.2. Muestro aleatorio simple. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 241
7.3. Estadsticos y distribuciones en el muestreo para poblaciones normales. . . . . . . . . . . . . . . 242
7.4. Teorema de Fisher y sus consecuencias. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 249
Esquema sobre distribuciones. 253
Metodos Estadsticos de la Ingeniera

Indice, 5
TEMA 8.- ESTIMACI
ON PUNTUAL Y POR INTERVALOS. 263

8.1. Estimacion puntual. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 263
8.2. Propiedades de los estimadores puntuales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 264
8.3. Metodos de obtencion de estimadores puntuales. . . . . . . . . . . . . . . . . . . . . . . . . . . . 269
8.4. Estimacion por intervalos de conanza. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 274
8.5. Metodo del pivote para construir intervalos de conanza. . . . . . . . . . . . . . . . . . . . . . . . 275
8.1. Estimacion puntual. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 283
8.4. Estimacion por intervalos de conanza. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 284
TEMA 9.- CONTRASTES DE HIP
OTESIS. 333
9.1. Conceptos basicos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 333
9.2. Test de hipotesis e intervalos de conanza. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 338
9.3. Test de hipotesis para proporciones (muestras grandes). . . . . . . . . . . . . . . . . . . . . . . . 344
9.4. Contrastes de la bondad de ajuste. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 346
9.4.1. El contraste
2
de Pearson. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 346
9.4.2. El contraste de Kolmogorov-Smirnov. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 347
Esquemas. 349
9.3. Test de hipotesis para proporciones (muestras grandes). . . . . . . . . . . . . . . . . . . . . . . . 354
6,

TEMA 10.- AN
ALISIS DE LA VARIANZA. 403

10.1. Breve introduccion al dise no de experimentos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 403
10.2. Analisis de la varianza con un factor. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 404
10.3. Analisis de la varianza de dos factores sin interaccion. . . . . . . . . . . . . . . . . . . . . . . . . 406
10.4. Analisis de la varianza de dos factores con interaccion. . . . . . . . . . . . . . . . . . . . . . . . . 409
10.2. Analisis de la varianza de un factor. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 413
10.3. Analisis de la varianza de dos factores sin interaccion. . . . . . . . . . . . . . . . . . . . . . . . . 414
10.4. Analisis de la varianza de dos factores con interaccion. . . . . . . . . . . . . . . . . . . . . . . . . 414
CUESTIONARIO DE PR
ACTICAS. 437
EX
AMENES DEL CURSO 02-03. 439

EX

EX

EX

EX

EX

EX

EX

Metodos Estadsticos de la Ingeniera Programa, 7
UNIVERSIDAD DE OVIEDO
Dpto. de Estadstica e I.O. y D.M.
Metodos estadsticos de la ingeniera
2
o
Curso Ingeniera Industrial
E.P.S. Ingeniera de Gijon
Curso 2009-2010
Profesores: Jose Manuel Gonzalez Sariego (sariego@uniovi.es),
Susana Montes Rodrguez (montes@uniovi.es),
Fermn Suarez Garca (fasuarez@uniovi.es).
PROGRAMA:
TEMA 1.- INTRODUCCI
ON A LA ESTAD
ISTICA DESCRIPTIVA.
Poblacion y muestra. Distribuciones de frecuencias. Media y varianza muestral. Presentacion de conjuntos de
datos: gracos de tallo y hojas, histogramas y diagramas de barras, gracos de frecuencias acumuladas y gracos
de caja.
TEMA 2.- PROBABILIDAD.
Espacio Muestral. Sucesos. Operaciones con sucesos. Concepto y propiedades de la probabilidad. Probabilidad
Condicionada. Independencia. Teorema de Bayes.
TEMA 3.- VARIABLES ALEATORIAS UNIDIMENSIONALES.
Concepto de variable aleatoria. Funcion de distribucion. Variables aleatorias discretas y continuas. Caractersti-
cas de una variable aleatoria. Cambio de variable. Funcion generatriz de momentos.
AS COMUNES.
Distribucion de Bernoulli. Distribucion Binomial. Distribucion Hipergeometrica. Distribucion Geometrica. Dis-
tribucion de Poisson. Distribucion Uniforme. Distribucion Gamma. Distribucion Normal.
TEMA 5.- VARIABLES ALEATORIAS BIDIMENSIONALES.
Concepto. Clasicacion (Discretas y Continuas). Funcion de Distribucion. Distribuciones Marginales y Condi-
cionadas. Independencia de Variables Aleatorias. Funciones de Variables Aleatorias. Momentos de Funciones de
Vectores Aleatorios. Distribuciones reproductivas.
TEMA 6.- CONVERGENCIA DE VARIABLES ALEATORIAS.
Tipos de Convergencias. Teorema de Chebychev. Leyes Debiles de los Grandes N umeros. Teorema Central del
Lmite.
TEMA 7.- MUESTREO Y DISTRIBUCIONES MUESTRALES.
Muestreo Aleatorio Simple. Estadsticos y Distribuciones de Muestra en Poblaciones Normales. Teorema de
Fisher.
TEMA 8.- ESTIMACI
ON PUNTUAL Y POR INTERVALOS.

Estimacion. Propiedades de los Estimadores. Obtencion de Estimadores Puntuales (Metodo de los Momentos y
Metodo de Maxima Verosimilitud). Concepto de estimacion por intervalo. Procedimiento para la obtencion de
Intervalos de Conanza (Metodo del Pivote). Intervalos de Conanza para Poblaciones Normales.
OTESIS.
Concepto de contraste de hipotesis. Errores, Potencia, Nivel de signicacion y Nivel crtico. Test Parametricos
e Intervalos de Conanza. Test Chi-Cuadrado para la Bondad de Ajuste. Test de Kolmogoro-Smirno para la
8, Programa Metodos Estadsticos de la Ingeniera
Bondad de Ajuste.
TEMA 10.- AN
ALISIS DE LA VARIANZA.
Breve introduccion al dise no de experimentos. Analisis de la Varianza de un Factor. Analisis de la Varianza de
dos Factores.
TEMA 11.- AN
ALISIS DE LA REGRESI
ON.
Introduccion. Modelos probabilsticos. Ajuste del modelo: el metodo de mnimos cuadrados. Distribucion del
error. Comprobacion de la adecuacion del modelo. Uso del modelo para la estimacion y la prediccion.
BIBLIOGRAF
IA:
Berk & Carey: Analisis de Datos con Microsoft Excel. Thomson Editores.
Cuadras: Problemas de Probabilidades y Estadstica. Vol 1: Probabilidades. Editorial PPU.
Cuadras: Problemas de Probabilidades y Estadstica. Vol 1: Inferencia Estadstica. Editorial PPU.
Devore: Probabilidad y estadstica para ingeniera y ciencias. Thomson Editores.
Gutierrez Jamez, Martnez Almecija & Rodrguez Torreblanca: Curso basico de probabilidad.
Editorial Piramide.
Hines & Mongomery: Probabilidad y Estadstica para Ingeniera y Administracion. Editorial CECSA.
Martnez Almecija, Rodrguez Torreblanca & Gutierrez Jamez: Inferencia Estadstica: Un en-
foque clasico. Editorial Piramide.
Mendenhall & Sincich: Probabilidad y Estadstica para Ingeniera y Ciencias. Editorial Prentice Hall.
Sarabia Viejo & Mate Jimenez: Problema de Probabilidad y Estadstica. Editorial CLAGSA.
Scheaer & McClave: Probabilidad y Estadstica para Ingeniera. Grupo Editorial Iberoamericano.
EVALUACI
ON:
La nota de la asignatura se calculara a partir de la nota del examen escrito realizado en las convocatorias ociales
y de la nota obtenida en las clases practicas de laboratorio. El examen escrito constara de una parte teorica
tipo test que valdra 4 puntos y una parte de problemas que valdra 5 puntos. En las practicas de laboratorio se
podra obtener como maximo un punto de la calicacion nal del curso.
P
AGINA WEB: http://enol.epsig.uniovi.es/medli

Metodos Estadsticos de la Ingeniera Tablas, 9
D
I
S
T
R
I
B
U
C
I
O
N
E
S
D
E
P
R
O
B
A
B
I
L
I
D
A
D
L
e
y
d
e
p
r
o
b
a
b
i
l
i
d
a
d
D
i
s
t
r
i
b
u
c
i
o
n
d
e
p
r
o
b
a
b
i
l
i
d
a
d
P
a
r
a
m
e
t
r
o
s
E
s
p
e
r
a
n
z
a
E
(
)
V
a
r
i
a
n
z
a
V
a
r
(
)
F
u
n
c
.
g
e
n
e
r
a
t
r
i
z
E
(
e
t
)
B
e
r
n
o
u
l
l
i
B
(
1
,
p
)
P
(
=
k
)
=
p
k
(
1
p
)
1
k
k
=
0
,
1
0
<
p
<
1
p
p
(
1
p
)
p
e
t
+
(
1
p
)
B
i
n
o
m
i
a
l
B
(
n
,
p
)
P
(
=
k
)
=
(
nk
)
p
k
(
1
p
)
n
k
k
=
0
,
1
,
2
,
.
.
.
,
n
0
<
p
<
1
n
=
1
,
2
,
.
.
.
n
p
n
(
1
p
)
(
p
e
t
+
(
1
p
)
)
n
H
i
p
e
r
g
e
o
m
e
t
r
i
c
a
H
(
N
,
D
,
n
)
P
(
=
k
)
=
(
Dk
)
(
N
D
n
k
)
(
Nn
)
k
=
m
a
x
{
0
,
n
N
+
D
}
,
.
.
.
,
m
n
{
n
,
D
}
N
=
1
,
2
,
.
.
.
D
=
1
,
2
,
.
.
.
,
N
1
n
=
1
,
2
,
.
.
.
,
N
n
DN
n
DN
N
D
N
N
n
N
1
G
e
o
m
e
t
r
i
c
a
G
(
p
)
P
(
=
k
)
=
(
1
p
)
k
1
p
k
=
1
,
2
,
.
.
.
,
0
<
p
<
1
1p
q
p
2
p
e
t
1
q
e
t
B
i
n
.
N
e
g
a
t
i
v
a
B
N
(
n
,
p
)
P
(
=
k
)
=
(
n
+
k
1
k
)
(
1
p
)
k
p
n
k
=
0
,
1
,
2
,
.
.
.
,
0

0
(
e
t
1
)
U
n
i
f
o
r
m
e
U
(
a
,
b
)
f
(
x
)
=
1
b
a
a
<
x

0
>
0
1
1
2
(
1
t
)
1
G
a
m
m
a
(
p
,
a
)
f
(
x
)
=
a
p
(
p
)
e
a
x
x
p
1
x
>
0
p
>
0
a
>
0
pa
p
a
2
(
1
ta
)
p
B
e
t
a
(
p
,
q
)
f
(
x
)
=
1
B
(
p
,
q
)
x
p
1
(
1
x
)
q
1
0
<
x
<
1
p
>
0
q
>
0
p
p
+
q
p
q
(
p
+
q
)
2
(
p
+
q
+
1
)
N
o
r
m
a
l
N
(
)
f
(
x
)
=
1
(
x
)
2
2
<
x
<
<
<
>
0
2
e
t
+
12
2
t
2
W
e
i
b
u
l
l
W
(
a
,
b
,
c
)
f
(
x
)
=
b
c
b
(
x
a
)
b
1
e
(
x
a
c
)
b
x
>
a
<
a

0
c
(
1
+
1b
)
+
a
c
2
[
(
1
+
2b
)
2
(
1
+
1b
)
]
N
o
t
a
.
-
B
(
p
,
q
)
=
(
p
)
(
q
)
(
p
+
q
)
.
10, Tablas Metodos Estadsticos de la Ingeniera
DISTRIBUCI
ON NORMAL
F(x) =
2
e
t
2
/2
dt
F(x) = 1 F(x)
f(x)
z
a
0 - +
1-a
x 00 01 02 03 04 05 06 07 08 09
0 5000 5040 5080 5120 5160 5199 5239 5279 5319 5359
1 5398 5438 5478 5517 5557 5596 5636 5675 5714 5753
2 5793 5832 5871 5910 5948 5987 6026 6064 6103 6141
3 6179 6217 6255 6293 6331 6368 6406 6443 6480 6517
4 6554 6591 6628 6664 6700 6736 6772 6808 6844 6879
5 6915 6950 6985 7019 7054 7088 7123 7157 7190 7224
6 7257 7291 7324 7357 7389 7422 7454 7486 7517 7549
7 7580 7611 7642 7673 7704 7734 7764 7794 7823 7852
8 7881 7910 7939 7967 7995 8023 8051 8078 8106 8133
9 8159 8186 8212 8238 8264 8289 8315 8340 8365 8389
10 8413 8438 8461 8485 8508 8531 8554 8577 8599 8621
11 8643 8665 8686 8708 8729 8749 8770 8790 8810 8830
12 8849 8869 8888 8907 8925 8944 8962 8980 8997 9015
13 9032 9049 9066 9082 9099 9115 9131 9147 9162 9177
14 9192 9207 9222 9236 9251 9265 9279 9292 9306 9319
15 9332 9345 9357 9370 9382 9394 9406 9418 9429 9441
16 9452 9463 9474 9484 9495 9505 9515 9525 9535 9545
17 9554 9564 9573 9582 9591 9599 9608 9616 9625 9633
18 9641 9649 9656 9664 9671 9678 9686 9693 9699 9706
19 9713 9719 9726 9732 9738 9744 9750 9756 9761 9767
20 9772 9778 9783 9788 9793 9798 9803 9808 9812 9817
21 9821 9826 9830 9834 9838 9842 9846 9850 9854 9857
22 9861 9864 9868 9871 9875 9878 9881 9884 9887 9890
23 9893 9896 9898 9901 9904 9906 9909 9911 9913 9916
24 9918 9920 9922 9925 9927 9929 9931 9932 9934 9936
25 9938 9940 9941 9943 9945 9946 9948 9949 9951 9952
26 9953 9955 9956 9957 9959 9960 9961 9962 9963 9964
27 9965 9966 9967 9968 9969 9970 9971 9972 9973 9974
28 9974 9975 9976 9977 9977 9978 9979 9979 9980 9981
29 9981 9982 9982 9983 9984 9984 9985 9985 9986 9986
30 9987 9987 9987 9988 9988 9989 9989 9989 9990 9990
31 9990 9991 9991 9991 9992 9992 9992 9992 9993 9993
32 9993 9993 9994 9994 9994 9994 9994 9995 9995 9995
33 9995 9995 9995 9996 9996 9996 9996 9996 9996 9997
34 9997 9997 9997 9997 9997 9997 9997 9997 9997 9998
x 1282 1645 1960 2326 2576 3090 3291 3891 4417
F(x) 90 95 975 99 995 999 9995 99995 999995
2[1-F(x)] 20 10 05 02 01 002 001 0001 00001
DISTRIBUCI
ON
2
c
a
2
1-a
valores de
2
1
n 0995 099 0975 095 090 075 050 025 010 005 0025 001 0005
1 788 663 502 384 271 132 455 102 0158 0039 0010 0002 0000
2 106 921 738 599 461 277 139 575 211 103 0506 0201 0100
3 128 113 935 781 625 411 237 121 584 352 216 115 072
4 149 133 111 949 778 539 336 192 106 711 484 297 207
5 167 151 128 111 924 663 435 267 161 115 831 554 412
6 185 168 144 126 106 784 535 345 220 164 124 872 676
7 203 185 160 141 120 904 635 425 283 217 169 124 989
8 220 201 175 155 134 102 734 507 349 273 218 165 134
9 236 217 190 169 147 114 834 590 417 333 270 209 173
10 252 232 205 183 160 125 934 674 487 394 325 256 216
11 268 247 219 197 173 137 103 758 558 457 382 305 260
12 283 262 233 210 185 148 113 844 630 523 440 357 307
13 298 277 247 224 198 160 123 930 704 589 501 411 357
14 313 291 261 237 211 171 133 102 779 657 563 466 407
15 328 306 275 250 223 182 143 110 855 726 626 523 460
16 343 320 288 263 235 194 153 119 931 796 691 581 514
17 357 334 302 276 248 205 163 128 101 867 756 641 570
18 372 348 315 289 260 216 173 137 109 939 823 701 626
19 386 362 329 301 272 227 183 146 117 101 891 763 684
20 400 376 342 314 284 238 193 155 124 109 959 826 743
21 414 389 355 327 296 249 203 163 132 116 103 890 803
22 428 403 368 339 308 260 213 172 140 123 110 954 864
23 442 416 381 352 320 271 223 181 148 131 117 102 926
24 456 430 394 364 332 282 233 190 157 138 124 109 989
25 469 443 406 377 344 293 243 199 165 146 131 115 105
26 483 456 419 389 356 304 253 208 173 154 138 122 112
27 496 470 432 401 367 315 263 217 181 162 146 129 118
28 510 483 445 413 379 326 273 227 189 169 153 136 125
29 523 496 457 426 391 337 283 236 198 177 160 143 131
30 537 509 470 438 403 348 293 245 206 185 168 150 138
40 668 637 593 558 518 456 393 337 291 265 244 222 207
50 795 762 714 675 632 563 493 429 377 348 324 297 280
60 920 884 833 791 744 670 593 523 465 432 405 375 355
70 1042 1004 950 905 855 776 693 617 553 517 488 454 433
80 1163 1123 1066 1019 966 881 793 711 643 604 572 535 512
90 1283 1241 1181 1131 1076 986 893 806 733 691 656 618 592
100 1402 1358 1296 1243 1185 1091 993 901 824 779 742 701 673
Para n > 30 tomese
2
=
1
2
(
z
2n 1
)
2
, donde z
es tal que P(N(0, 1) z
) = 1 .
Ej. P(
2
41
59
19) = 0
97, puesto que para n = 41 se tiene que

2
0
03
=
1
2
(1
88 + 9)
2
= 59
19.
DISTRIBUCI
ON t
F(x) = 1 F(x)
0
1-a
a
t
valores de t
1
n 0
995 0
99 0
975 0
95 0
90 0
80 0
75 0
70 0
60 0
55
1 6366 3182 1271 631 308 1376 1000 727 325 158
2 992 696 430 292 189 1061 816 617 289 142
3 584 454 318 235 164 978 765 584 277 137
4 460 375 278 213 153 941 741 569 271 134
5 403 336 257 202 148 920 727 559 267 132
6 371 314 245 194 144 906 718 553 265 131
7 350 300 236 190 141 896 711 549 263 130
8 336 290 231 186 140 889 706 546 262 130
9 325 282 226 183 138 883 703 543 261 129
10 317 276 223 181 137 879 700 542 260 129
11 311 272 220 180 136 876 697 540 260 129
12 306 268 218 178 136 873 695 539 259 128
13 301 265 216 177 135 870 694 538 259 128
14 298 262 214 176 134 868 692 537 258 128
15 295 260 213 175 134 866 691 536 258 128
16 292 258 212 175 134 865 690 535 258 128
17 290 257 211 174 133 863 689 534 257 128
18 288 255 210 173 133 862 688 534 257 127
19 286 254 209 173 133 861 688 533 257 127
20 284 253 209 172 132 860 687 533 257 127
21 283 252 208 172 132 859 686 532 257 127
22 282 251 207 172 132 858 686 532 256 127
23 281 250 207 171 132 858 685 532 256 127
24 280 249 206 171 132 857 685 531 256 127
25 279 248 206 171 132 856 684 531 256 127
26 278 248 206 171 131 856 684 531 256 127
27 277 247 205 170 131 855 684 531 256 127
28 276 247 205 170 131 855 683 530 256 127
29 276 246 204 170 131 854 683 530 256 127
30 275 246 204 170 131 854 683 530 256 127
40 270 242 202 168 130 851 681 529 255 126
60 266 239 200 167 130 848 679 527 254 126
120 262 236 198 166 129 845 677 526 254 126
258 233 196 165 128 842 674 524 253 126
DISTRIBUCI
ON F
P(F
n
m
< x) = P(F
m
n
>
1
x
)
a
1-a
f
valores de f
1 Grados de libertad del numerador

1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120
09 1 399 495 536 558 572 582 589 594 599 602 607 612 617 620 623 625 628 631 633
095 161 199 216 225 230 234 237 239 241 242 244 246 248 249 250 251 252 253 254
099 4052 4999 5403 5625 5764 5859 5928 5982 6022 6056 6106 6157 6209 6235 6261 6287 6313 6339 6366
09 2 853 900 916 924 929 933 935 937 938 939 941 942 944 945 946 947 947 948 949
095 185 1900 192 192 193 193 194 194 194 194 194 194 194 195 195 195 195 195 195
099 985 9900 992 992 993 993 994 994 994 994 994 994 994 995 995 995 995 995 995
09 3 554 546 539 534 531 528 527 525 524 523 522 520 518 518 517 516 515 514 513
095 101 955 928 912 901 894 889 885 881 879 874 870 866 864 862 859 857 855 853
099 341 308 295 287 282 279 277 275 273 272 271 269 267 266 265 264 263 262 261
09 4 454 432 419 411 405 401 398 395 394 392 390 387 384 383 382 380 379 378 376
095 771 694 659 639 626 616 609 604 600 596 591 586 580 577 575 572 569 566 563
099 212 180 167 160 155 152 150 148 147 145 144 142 140 139 138 137 137 136 135
09 5 406 378 362 352 345 340 337 334 332 330 327 324 321 319 317 316 314 312 310
095 G 661 579 541 519 505 495 488 482 477 474 468 462 456 453 450 446 443 440 436
099 r 163 133 121 114 110 107 105 103 102 101 989 972 955 947 938 929 920 911 902
a
09 d 6 378 346 329 318 311 305 301 298 296 294 290 287 284 282 280 278 276 274 272
095 o 599 514 476 453 439 428 421 415 410 406 400 394 387 384 381 377 374 370 367
099 s 137 109 978 915 875 847 826 810 798 787 772 756 740 731 723 714 706 697 688
09 d 7 359 326 307 296 288 283 278 275 272 270 267 263 259 258 256 254 251 249 247
095 e 559 474 435 412 397 387 379 373 368 364 357 351 344 341 338 334 330 327 323
099 122 955 845 785 746 719 699 684 672 662 647 631 616 607 599 591 582 574 565
l
09 i 8 346 311 292 281 273 267 262 259 256 254 250 246 242 240 238 236 234 232 229
095 b 532 446 407 384 369 358 350 344 339 335 328 322 315 312 308 304 301 297 293
099 e 113 865 759 701 663 637 618 603 591 581 567 552 536 528 520 512 503 495 486
r
09 t 9 336 301 281 269 261 255 251 247 244 242 238 234 230 228 225 223 221 218 216
095 a 512 426 386 363 348 337 329 323 318 314 307 301 294 290 286 283 279 275 271
099 d 106 802 699 642 606 580 561 547 535 526 511 496 481 473 465 457 448 440 431
09 d 10 328 292 273 261 252 246 241 238 235 232 228 224 220 218 216 213 211 208 206
095 e 496 410 371 348 333 322 314 307 302 298 291 284 277 274 270 266 262 258 254
099 l 100 756 655 599 564 539 520 506 494 485 471 456 441 433 425 417 408 400 391
09 d 11 323 286 266 254 245 239 234 230 227 225 221 217 212 210 208 205 203 200 197
095 e 484 398 359 336 320 309 301 295 290 285 279 272 265 261 257 253 249 245 240
099 n 965 721 622 567 532 507 489 474 463 454 440 425 410 402 394 386 378 369 360
o
09 m12 318 281 261 248 239 233 228 224 221 219 215 210 206 204 201 199 196 193 190
095 i 475 389 349 326 311 300 291 285 280 275 269 262 254 251 247 243 238 234 230
099 n 933 693 595 541 506 482 464 450 439 430 416 401 386 378 370 362 354 345 336
a
09 d 13 314 276 256 243 235 228 223 220 216 214 210 205 201 198 196 193 190 188 185
095 o 467 381 341 318 303 292 283 277 271 267 260 253 246 242 238 234 230 225 221
099 r 907 670 574 521 486 462 444 430 419 410 396 382 366 359 351 343 334 325 317
r
09 14 310 273 252 239 231 224 219 215 212 210 205 201 196 194 191 189 186 183 180
095 460 374 334 311 296 285 276 270 265 260 253 246 239 235 231 227 222 218 213
099 886 651 556 504 469 446 428 414 403 394 380 366 351 343 335 327 318 309 300
09 15 307 270 249 236 227 221 216 212 209 206 202 197 192 190 187 185 182 179 176
095 454 368 329 306 290 279 271 264 259 254 248 240 233 229 225 220 216 211 207
099 868 636 542 489 456 432 414 400 389 380 367 352 337 329 321 313 305 296 287
09 16 305 267 246 233 224 218 213 209 206 203 199 194 189 187 184 181 178 175 172
095 449 363 324 301 285 274 266 259 254 249 242 235 228 224 219 215 211 206 201
099 853 623 529 477 444 420 403 389 378 369 355 341 326 318 310 302 293 284 275
09 17 303 264 244 231 222 215 210 206 203 200 196 191 186 184 181 178 175 172 169
095 445 359 320 296 281 270 261 255 249 245 238 231 223 219 215 210 206 201 196
099 840 611 518 467 434 410 393 379 368 359 346 331 316 308 300 292 283 275 265
DISTRIBUCI
ON F
P(F
n
m
< x) = P(F
m
n
>
1
x
)
a
1-a
f
valores de f
1 Grados de libertad del numerador

1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120
09 18 301 262 242 229 220 213 208 204 200 198 193 189 184 181 178 175 172 169 166
095 441 355 316 293 277 266 258 251 246 241 234 227 219 215 211 206 202 197 192
099 829 601 509 458 425 401 384 371 360 351 337 323 308 300 292 284 275 266 257
09 19 299 261 240 227 218 211 206 202 198 196 191 186 181 179 176 173 170 167 163
095 438 352 313 290 274 263 254 248 242 238 231 223 216 211 207 203 198 193 188
099 818 593 501 450 417 394 377 363 352 343 330 315 300 292 284 276 267 258 249
09 20 297 259 238 225 216 209 204 200 196 194 189 184 179 177 174 171 168 164 161
095 435 349 310 287 271 260 251 245 239 235 228 220 212 208 204 199 195 190 184
099 810 585 494 443 410 387 370 356 346 337 323 309 294 286 278 269 261 252 242
09 21 296 257 236 223 214 208 202 198 195 192 187 183 178 175 172 169 166 162 159
095 432 347 307 284 268 257 249 242 237 232 225 218 210 205 201 196 192 187 181
099 802 578 487 437 404 381 364 351 340 331 317 303 288 280 272 264 255 246 236
09 22 295 256 235 222 213 206 201 197 193 190 186 181 176 173 170 167 164 160 157
095 G 430 344 305 282 266 255 246 240 234 230 223 215 207 203 198 194 189 184 178
099 r 795 572 482 431 399 376 359 345 335 326 312 298 283 275 267 258 250 240 231
a
09 d 23 294 255 234 221 211 205 199 195 192 189 184 180 174 172 169 166 162 159 155
095 o 428 342 303 280 264 253 244 237 232 227 220 213 205 201 196 191 186 181 176
099 s 788 566 476 426 394 371 354 341 330 321 307 293 278 270 262 254 245 235 226
09 d 24 293 254 233 219 210 204 198 194 191 188 183 178 173 170 167 164 161 157 153
095 e 426 340 301 278 262 251 242 236 230 225 218 211 203 198 194 189 184 179 173
099 782 561 472 422 390 367 350 336 326 317 303 289 274 266 258 249 240 231 221
l
09 i 25 292 253 232 218 209 202 197 193 189 187 182 177 172 169 166 163 159 156 152
095 b 424 339 299 276 260 249 240 234 228 224 216 209 201 196 192 187 182 177 171
099 e 777 557 468 418 385 363 346 332 322 313 299 285 270 262 254 245 236 227 217
r
09 t 26 291 252 231 217 208 201 196 192 188 186 181 176 171 168 165 161 158 154 150
095 a 423 337 298 274 259 247 239 232 227 222 215 207 199 195 190 185 180 175 169
099 d 772 553 464 414 382 359 342 329 318 309 296 281 266 258 250 242 233 223 213
09 d 27 290 251 230 217 207 200 195 191 187 185 180 175 170 167 164 160 157 153 149
095 e 421 335 296 273 257 246 237 231 225 220 213 206 197 193 188 184 179 173 167
099 l 768 549 460 411 378 356 339 326 315 306 293 278 263 255 247 238 229 220 210
09 d 28 289 250 229 216 206 200 194 190 187 184 179 174 169 166 163 159 156 152 148
095 e 420 334 295 271 256 245 236 229 224 219 212 204 196 191 187 182 177 171 165
099 n 764 545 457 407 375 353 336 323 312 303 290 275 260 252 244 235 226 217 206
o
09 m 29 289 250 228 215 206 199 193 189 186 183 178 173 168 165 162 158 155 151 147
095 i 418 333 293 270 255 243 235 228 222 218 210 203 194 190 185 181 175 170 164
099 n 760 542 454 404 373 350 333 320 309 300 287 273 257 249 241 233 223 214 203
a
09 d 30 288 249 228 214 205 198 193 188 185 182 177 172 167 164 161 157 154 150 146
095 o 417 332 292 269 253 242 233 227 221 216 209 201 193 189 184 179 174 168 162
099 r 756 539 451 402 370 347 330 317 307 298 284 270 255 247 239 230 221 211 201
r
09 40 284 244 223 209 200 193 187 183 179 176 171 166 161 157 154 151 147 142 138
095 408 323 284 261 245 234 225 218 212 208 200 192 184 179 174 169 164 158 151
099 731 518 431 383 351 329 312 299 289 280 266 252 237 229 220 211 202 192 180
09 60 279 239 218 204 195 187 182 177 174 171 166 160 154 151 148 144 140 135 129
095 400 315 276 253 237 225 217 210 204 199 192 184 175 170 165 159 153 147 139
099 708 498 413 365 334 312 295 282 272 263 250 235 220 212 203 194 184 173 160
09 120 275 235 213 199 190 182 177 172 168 165 160 155 148 145 141 137 132 126 119
095 392 307 268 245 229 218 209 202 196 191 183 175 166 161 155 150 143 135 125
099 685 479 395 348 317 296 279 266 256 247 234 219 203 195 186 176 166 153 138
09 271 230 208 194 185 177 172 167 163 160 155 149 142 138 134 130 124 117 100
095 384 300 260 237 221 210 201 194 188 183 175 167 157 152 146 139 132 122 100
099 663 461 378 332 302 280 264 251 241 232 218 204 188 179 170 159 147 132 100
DISTRIBUCIONES EN EL MUESTREO
FUNCI
ON PIVOTAL I.C. DE CONDICIONES

1. T =

n
n
N(0, 1)
N(, )
conocida
2. T =

n
S/
n
=

n
S/
n 1
t
n1

N(, )
desconocida
3. T =
(n 1)
S
2
2
=
nS
2
2

2
n1
o
2
N(, )
4. T =
(
n
m
) (
1
2
)
2
1
n
+

2
2
m
N(0, 1)
1
2
N(
1
,
1
)
N(
2
,
2
)
independencia
1
y
2
conocidas
5. T =
(
n
m
) (
1
2
)
nS
2
1
+mS
2
2
nm(n+m2)
(n +m)
t
n+m2

1
2
N(
1
,
1
)
N(
2
,
2
)
independencia
1
y
2
desconocidas
1
=
2
6.
T =
(
n
m
) (
1
2
)
S
2
1
n
+

S
2
2
m
t
f
donde f
es el entero mas proximo a
(
s
2
1
n
+
s
2
2
m
)
2
( s
2
1
/n)
2
n+1
+
( s
2
2
/m)
2
m+1
2
2
N(
1
,
1
)
N(
2
,
2
)
independencia
1
y
2
desconocidas
1
=
2
7. T =
S
2
1
/
S
2
2
2
1
/
2
2
F
n1
m1
2
o

2
1
2
2
N(
1
,
1
)
N(
2
,
2
)
independencia
1. T =

n
n
N(0, 1)
E[] = , V ar[] =
2
conocida o acot. sup.
n 30
8. T =
p p
p(1p)
n
N(0, 1) donde p =
n
p
B(1, p)
n 30
4. T =
(
n
m
) (
1
2
)
2
1
n
+

2
2
m
N(0, 1)
1
2
E[] =
1
, V ar[] =
2
1
E[] =
2
, V ar[] =
2
2
independencia
1
y
2
conocidas o acot. sup.
n, m 30
9.
T =
( p
1
p
2
) (p
1
p
2
)
p
1
(1p
1
)
n
+
p
2
(1p
2
)
m
N(0, 1)
donde p
1
=
n
y p
2
=
m
p
1
p
2
B(1, p
1
)
B(1, p
2
)
independencia
n, m 30
CONTRASTE
2
DE LA BONDAD DE AJUSTE
U =
k
i=1
(n
i
n p
i
)
2
n p
i
=
_
1
n
k
i=1
n
2
i
p
i
_
n
H
0
2
k1r
CONTRASTE DE KOLMOGOROV-SMIRNOV
D
n
= sup
x
|F
n
(x) F
0
(x)| = max
i=1,2,...,n
{|F
n
(x
i
) F
0
(x
i
)|, |F
n
(x
i
-) F
0
(x
i
)|}
TABLA DE KOLMOGOROV-SMIRNOV
(n = Tama no de la muestra)
1
n 0
8 0
9 0
95 0
98 0
99
1 0900 0950 0975 0990 0995
2 0684 0776 0842 0900 0929
3 0565 0636 0708 0785 0829
4 0493 0565 0624 0689 0734
5 0447 0509 0563 0627 0669
6 0410 0468 0519 0577 0617
7 0381 0436 0483 0538 0576
8 0359 0410 0454 0507 0542
9 0339 0387 0430 0480 0513
10 0323 0369 0409 0457 0486
11 0308 0352 0391 0437 0468
12 0296 0338 0375 0419 0449
13 0285 0325 0361 0404 0432
14 0275 0314 0349 0390 0418
15 0266 0304 0338 0377 0404
16 0258 0295 0327 0366 0392
17 0250 0286 0318 0355 0381
18 0244 0279 0309 0346 0371
19 0237 0271 0301 0337 0361
20 0232 0265 0294 0329 0352
21 0226 0259 0287 0321 0344
22 0221 0253 0281 0314 0337
23 0216 0247 0275 0307 0330
24 0212 0242 0269 0301 0323
25 0208 0238 0264 0295 0317
26 0204 0233 0259 0290 0311
27 0200 0229 0254 0284 0305
28 0197 0225 0250 0279 0300
29 0193 0221 0246 0275 0295
30 0190 0218 0242 0270 0290
35 0177 0202 0224 0251 0269
40 0165 0189 0210 0235 0252
45 0156 0179 0198 0222 0238
50 0148 0170 0188 0211 0226
55 0142 0162 0180 0201 0216
60 0136 0155 0172 0193 0207
65 0131 0149 0166 0185 0199
70 0126 0144 0160 0179 0192
75 0122 0139 0154 0173 0185
80 0118 0135 0150 0167 0179
85 0114 0131 0145 0162 0174
90 0111 0127 0141 0158 0169
95 0108 0124 0137 0154 0165
100 0106 0121 0134 0150 0161
n > 100 1
07/
n 1
22/
n 1
36/
n 1
52/
n 1
63/
n
TABLA DE LILLIEFORS
(n = Tama no de la muestra)
1
n 0
95 0
99
5 0337 0405
6 0319 0364
7 0300 0348
8 0285 0331
9 0271 0311
10 0258 0294
11 0249 0284
12 0242 0275
13 0234 0268
14 0227 0261
15 0220 0257
16 0213 0250
17 0206 0245
18 0200 0239
19 0195 0235
20 0190 0231
25 0180 0203
30 0161 0187
n > 30 0
886/
n 1031/
n
AN
ALISIS DE LA VARIANZA
DE UN FACTOR
Q =
r
i=1
n
i
j=1
(
ij
)
2
= n S
2
Q
1
=
r
i=1
n
i
(
i
)
2
= QQ
2
Q
2
=
r
i=1
n
i
j=1
(
ij

i
)
2
=
r
i=1
n
i
S
2
i
DE DOS FACTORES SIN INTERACCI
ON
Q =
r
i=1
s
j=1
(
ij
)
2
= n S
2
Q
1
= s
r
i=1
(
i
)
2
= n S
2
x
i
Q
2
= r
s
j=1
(
j
)
2
= n S
2
x
j
Q
3
=
r
i=1
s
j=1
(
ij

i
j
+)
2
= QQ
1
Q
2
DE DOS FACTORES CON INTERACCI
ON
Q =
r
i=1
s
j=1
m
k=1
(
ijk
)
2
= n S
2
Q
1
= s m
r
i=1
(
i
)
2
= n S
2
x
i
Q
2
= r m
s
j=1
(
j
)
2
= n S
2
x
j
Q
3
= m
r
i=1
s
j=1
(
ij
j
+)
2
= QQ
1
Q
2
Q
4
Q
4
=
r
i=1
s
j=1
m
k=1
(
ijk

ij
)
2
= m
r
i=1
s
j=1
S
2
ij
Apuntes de teora Tema 1, 19
TEMA 1.- INTRODUCCI
ON A LA ESTAD
ISTICA
DESCRIPTIVA. APUNTES DE TEOR
IA.
1.1. Introduccion.
Se puede pensar en la Estadstica como en una tecnologa que proporciona instrumentos para la toma de
decisiones en ambiente de incertidumbre, cuando esta incertidumbre puede medirse en terminos de probabilidad.
Por ello la estadstica se dedica a estudiar metodos de recogida y descripcion de datos as como a generar tecnicas
para el analisis de la informacion que proporcionan los datos.
Considerada como una ciencia, la estadstica se preocupa de los fenomenos o experimentos aleatorios, que son
aquellos cuyos resultados no podemos predecir.
1.2. Conceptos fundamentales.
Comenzaremos deniendo algunos conceptos propios de la terminologa de la Estadstica Descriptiva.
La concrecion de un fenomeno proporciona un dato. Al observar diferentes resultados de un fenomeno
se obtiene un conjunto de datos. Como los resultados no son previsibles, cada caracterstica ha de
tener mas de una modalidad. Las modalidades de una caracterstica deben ser a la vez incompatibles
y exhaustivas. Es decir, las diversas modalidades de una caracterstica deben cubrir todas las posibi-
lidades que esta pueda presentar y ademas deben ser disjuntas, un individuo no puede presentar a la
vez mas de una de ellas y ademas debe presentar alguna de ellas.
1.2.1. Clases de datos.
Es habitual denominar a los caracteres variables estadsticas o simplemente variables, calicandolas de cualitati-
vas o cuantitativas seg un sea el correspondiente caracter, y hablar de los valores de la variable al referirnos a sus
modalidades, aunque de hecho solamente tendremos verdaderos valores numericos cuando analicemos variables
cuantitativas.
Atendiendo a sus propiedades metricas las caractersticas pueden ser :
Nominales: Cuando no existe una relacion de orden natural entre sus diferentes modalidades. Ejemplo:
Estado Civil, Grupo Sanguneo, Sexo, Raza, Religion, etc.
Ordinales: Cuando sus modalidades no son cuanticables, pero es posible establecer alg un tipo de orden
entre ellas. Ejemplo: Nivel de Estudios (Primarios, Medios, Superiores), Capacitacion Laboral (Baja,
Media, Alta), etc.
Numericas: Son aquellas que sus modalidades llevan implcitamente asignada una magnitud numerica.
Ejemplo: Edad, Peso, Tiempo, etc.
Las dos primeras se integran en las llamadas caractersticas cualitativas, mientras que las numericas corres-
ponden a caractersticas cuantitativas.
1.2.2. Poblacion y muestra.
Poblacion es el conjunto de elementos con caractersticas comunes sobre el que se realiza el experimento
aleatorio. No siempre es posible investigar a todos los elementos de la poblacion por lo que en ocasiones se
20, Tema 1 Metodos Estadsticos de la Ingeniera
estudia un subconjunto de la poblacion que se denomina muestra. Cuando poblacion y muestra coinciden se
dice que se realiza un censo.
El n umero de datos de una muestra recibe el nombre de tama no de la muestra. Si la muestra es: (x
1
, x
2
, ..., x
n
),
el tama no es n.
1.2.3. Matriz de datos.
Habitualmente, la informacion primaria sobre los individuos, es decir, la forma mas elemental en la que se
expresan los datos es la de una matriz, en la que aparecen en la primera columna los individuos identicados de
alguna manera y en las siguientes columnas las observaciones de las diferentes caractersticas en estudio para
cada uno de los individuos, tal y como aparece en la siguiente tabla.
CARACTER
ISTICA
INDIVIDUO C
1
C
2
. . . C
p
1 . . .
2 . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
n . . .
Ejemplo 1.2.1 As, los datos correspondientes a una investigacion llevada a cabo para el estudio de una posible
contaminacion radioactiva entre los trabajadores de un determinado lugar, produjeron como resultado la matriz
de datos siguiente, en donde se recogen las observaciones de los caracteres edad, sexo, cancer, cada
anormal del cabello y profesion en los 100 individuos seleccionados en la muestra.
ESTUDIO DE LA CONTAMINACI
ON RADIOACTIVA
Edad Sexo Cancer Cada cabello Profesion
Individuo 1 32 Masculino No No Agricultor
Individuo 2 29 Femenino No No Maestra
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Individuo 100 61 Masculino S S Agricultor
1.2.4. Datos agrupados.
En ocasiones, cuando se trata de estudiar caractersticas numericas, con objeto de facilitar la toma de los datos,
el investigador los agrupa en intervalos. As por ejemplo, resulta mas sencillo averiguar cuantos individuos hay
en una muestra con una estatura, por ejemplo, entre 170 y 180 que medirlos a todos, en especial si tenemos
marcas en la pared cada 10 cm. Tambien cuando la muestra presenta un elevado n umero de datos distintos es
aconsejable agruparlos en clases o intervalos reduciendo la cantidad de informacion que ha de ser asimilada.
Previamente daremos algunas deniciones: Si los intervalos o clases, como a veces se denominan, son:
I
1
= (x
0
, x
1
], I
2
= (x
1
, x
2
], . . . , I
j
= (x
j1
, x
j
], . . . , I
k
= (x
k1
, x
k
]
llamaremos lmites de la clase j-esima, I
j
, a x
j1
y a x
j
, es decir, a los extremos del intervalo que la dene;
llamaremos amplitud de la clase j-esima, I
j
, a x
j
x
j1
, hablando de intervalos de amplitud constante o
variable seg un tengan o no todos la misma amplitud; y por ultimo, llamaremos centro o marca de la clase
j-esima clase, I
j
, al punto medio del intervalo, es decir, a: c
j
= (x
j
+x
j1
)/2.
Siempre que fuese posible se deberan intentar las siguientes normas:
1. El conjunto de posibles observaciones debe subdividirse en clases no solapadas (disjuntas) de forma que
cada dato pertenezca a una y solo una de las clases. Para conseguirlo nosotros hemos considerado que
los intervalos que denen a las clases sean semiabiertos inferiormente, aunque tambien habramos podido
considerarlos semiabiertos superiormente.
2. En general para conseguir una interpretacion mas facil es preferible que los intervalos sean de amplitud
constante, sin embargo, en ocasiones habra que descartar este principio. As, si se tienen muchas observa-
ciones en una zona relativamente estrecha mientras que otras estan muy dispersas, sera preferible dividir
en intervalos mas amplios los datos de esta zona y mas peque nos los de fuera de esta zona.
3. Es aconsejable que las marcas de clase sean representativas de los valores de la clase, pues a menudo, se
utilizan las marcas para resumir la informacion de las clases.
4. En el n umero de clases que se deben de incluir, no existe unanimidad. Si el n umero es elevado la inter-
pretacion es mas dicultosa por exceso de detalle y si es peque no se pierde mucha informacion. Algunos
autores sugieren un n umero igual a la raz del tama no muestral

n. Otros, como Sturges, proponen un
n umero igual k = 1 + 3
322log
10
(n), y la mayora recomiendan ensayar.
Una vez determinado el n umero k de intervalos a considerar, si es posible tomarlos de igual amplitud, esta sera:
a =
x
(n)
x
(1)
k
en donde x
(n)
es el dato mayor y x
(1)
el menor.
Ejemplo 1.2.2 Niveles de Colinesterasa.
Se midieron los niveles de colinestera en un recuento de eritrocitos enmol/min/ml de 34 agricultores expuestos
a insecticidas agrcolas, obteniendose los siguientes datos:
NIVELES DE COLINESTERASA
Individuo Nivel Individuo Nivel Individuo Nivel
1 106 13 122 25 118
2 125 14 108 26 127
3 111 15 165 27 114
4 92 16 150 28 93
5 115 17 103 29 86
6 99 18 124 30 85
7 119 19 91 31 101
8 116 20 78 32 124
9 149 21 113 33 111
10 125 22 123 34 102
11 125 23 97
12 123 24 120
Aplicando la formula de Sturges obtenemos:
k = 1 + 3
322log
10
(34) = 1 + 3
322 1
53148 = 6
08757,
es decir, una sugerencia de 6 intervalos. Tambien llegaramos a esa cantidad si utilizamos el criterio de la raz
del tama no muestral, en nuestro caso
34 = 5
83. Como el mayor valor es x

(34)
= 16
5 y el menor x
(1)
= 7
8,
la longitud sugerida es
a =
16
5 7
8
6
= 1
45.
Parece, por tanto, razonable tomar como amplitud 1
5, obteniendo como intervalos en los que clasicar los

datos:
(7
5, 9], (9, 10
5], (10
5, 12], (12, 13
5], (13
5, 15], (15, 16
5].
1.3. Distribuciones de frecuencia.
En este apartado consideraremos que tenemos datos de una muestra de tama no n correspondientes a una sola
caracterstica. As, llamaremos:
Frecuencia absoluta n
i
de la modalidad M
i
(valor x
i
o clase I
i
) al n umero de datos de la muestra que
presentan la modalidad M
i
(valor x
i
o clase I
i
). Si existen k modalidades posibles, se vericara
k
i=1
n
i
= n
1
+n
2
+. . . +n
k
= n.
Frecuencia relativa f
i
de la modalidad M
i
(valor x
i
o clase I
i
) al cociente f
i
= n
i
/n, vericandose:
k
i=1
f
i
= f
1
+f
2
+. . . +f
k
= 1.
Cuando los datos corresponden a caractersticas numericas que suponemos ordenados de menor a mayor por los
subndices, podemos dar las siguientes deniciones:
Frecuencia acumulada absoluta N
i
de la modalidad M
i
(valor x
i
o clase I
i
) es la suma N
i
= n
1
+
. . . +n
i
=
i
j=1
n
j
, es decir, es la suma de las frecuencias absolutas de las modalidades (clases o valores) de
la muestra anteriores o iguales a la modalidad (clase o valor) considerada. Claramente
N
k
=
k
j=1
n
j
= n.
Frecuencia acumulada relativa F
i
de la modalidad M
i
(valor x
i
o clase I
i
) es el cociente F
i
= N
i
/n,
o lo que es lo mismo, F
i
= f
1
+ . . . + f
i
=
i
j=1
f
j
, es decir, es la suma de las frecuencias relativas de las
modalidades (clases o valores) de la muestra anteriores o iguales a la modalidad (clase o valor) considerada.
Claramente
F
k
=
k
j=1
F
j
= 1.
Las siguientes relaciones entre frecuencias son evidentes y permiten conocer las frecuencias absolutas o relativas
si conocemos las correspondientes acumuladas:
N
i
N
i1
=
i
j=1
n
j

i1
j=1
n
j
= n
i
,
F
i
F
i1
=
i
j=1
f
j

i1
j=1
f
j
= f
i
.
La coleccion formada por las frecuencias absolutas (relativas, absolutas acumuladas o relativas acumuladas) de
una muestra recibe el nombre de distribucion de frecuencias absolutas (relativas, absolutas acumuladas
o relativas acumuladas, respectivamente).
Tenemos, por tanto, para cada tipo de datos, cuatro distribuciones de frecuencias, obteniendose a partir de una
cualquiera de ellas las tres restantes, supuesto que se conoce el tama no muestral.
Las cuatro distribuciones de frecuencias se expresan en tablas como las siguientes, dependiendo del tipo de datos
que sean:
1. Caracterstica cualitativa nominal:
M
i
n
i
f
i
Cualidad
1
n
1
f
1
Cualidad
2
n
2
f
2
.
.
.
.
.
.
.
.
.
Cualidad
i
n
i
f
i
.
.
.
.
.
.
.
.
.
Cualidad
k
n
k
f
k
n 1
2. Caracterstica cualitativa ordinal:
M
i
n
i
f
i
N
i
F
i
Cualidad
1
n
1
f
1
N
1
F
1
Cualidad
2
n
2
f
2
N
2
F
2
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Cualidad
i
n
i
f
i
N
i
F
i
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Cualidad
k
n
k
f
k
N
k
= n F
k
= 1
n 1
3. Caracterstica cuantitativa sin agrupar:
X
i
n
i
f
i
N
i
F
i
x
1
n
1
f
1
N
1
F
1
x
2
n
2
f
2
N
2
F
2
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
x
i
n
i
f
i
N
i
F
i
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
x
k
n
k
f
k
N
k
= n F
k
= 1
n 1
4. Caracterstica cuantitativa agrupada en intervalos:
I
i
n
i
f
i
N
i
F
i
I
1
n
1
f
1
N
1
F
1
I
2
n
2
f
2
N
2
F
2
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
I
i
n
i
f
i
N
i
F
i
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
I
k
n
k
f
k
N
k
= n F
k
= 1
n 1
Ejemplo 1.3.1 Causas de Avera.
En una lnea de envasado que sufre frecuentes paradas por avera en alguna de sus componentes, puede plantearse
la necesidad de cambiar la lnea entera, pero en muchas ocasiones esta es una inversion importante, que se va
postergando.
Despues de estudiar el problema durante seis meses se obtuvieron los datos dados por la siguiente distribucion
de frecuencias absolutas y relativas:
DISTRIBUCI
ON DE FRECUENCIAS
Causas n
i
f
i
Rotura de hilo 26 0
650
Cinta 3 0
075
Tornillo sin n 10 0
250
Otras causas 1 0
025
TOTAL 40 1
Ejemplo 1.3.2 N
de Hijos. Tras encuestar a 25 familias sobre el n umero de hijos que tenan, se obtuvieron
los siguientes datos:
N
o
de hijos (X
i
) 0 1 2 3 4
N
o
de familias (n
i
) 5 6 8 4 2
Las cuatro distribuciones de frecuencia seran:
DISTRIBUCI
ON DE FRECUENCIAS
X
i
n
i
f
i
N
i
F
i
0 5 0
20 5 0
20
1 6 0
24 11 0
44
2 8 0
32 19 0
76
3 4 0
16 23 0
92
4 2 0
08 25 1
TOTAL 25 1
Ejemplo 1.3.3 Los datos del Ejemplo 1.2.2 (pag. 21) sobre los Niveles de Colinesterasa, agrupados en los
intervalos all obtenidos, proporcionan las cuatro siguientes distribuciones de frecuencias:
DISTRIBUCI
ON DE FRECUENCIAS
I
i
n
i
f
i
N
i
F
i
7
5 9 3 0
088 3 0
088
9 10
5 8 0
236 11 0
324
10
5 12 10 0
294 21 0
618
12 13
5 10 0
294 31 0
912
13
5 15 1 0
029 32 0
941
15 16
5 2 0
059 34 1
TOTAL 34 1
1.4. Representacion graca de las distribuciones unidimensionales
de frecuencias.
La representacion graca de una distribucion de frecuencias depende del tipo de datos que la constituya.
a) Datos correspondientes a un caracter cualitativo.
La representacion graca de este tipo de datos esta basada en la proporcionalidad de las areas a las frecuen-
cias absolutas o relativas. Veremos tres tipos de representaciones:
Diagrama de sectores:
Esta representacion graca consiste en dividir un crculo en tantos sectores circulares como modalidades
presente el caracter cualitativo, asignando un angulo central a cada sector circular proporcional a la
frecuencia absoluta n
i
, consiguiendo de esta manera un sector con area proporcional tambien a n
i
.
Ejemplo 1.4.1 As, los angulos que corresponden a las cuatro modalidades de la tabla adjunta seran:
Causas N
o
de casos

Angulo (grados)
Rotura de hilo 26 234
o
Cinta 3 27
o
Tornillo sin n 10 90
o
Otras causas 1 9
o
y su representacion en un diagrama de sectores sera:
DIAGRAMA DE SECTORES
Rotura hilo
64%
Cinta
8%
Tornillo sin fin
25%
Otras causas
3%
Diagrama de Pareto: La informacion que contienen estos datos se maniesta de forma mas clara a
partir de los diagramas de Pareto.

Estos ponen de maniesto que, cuando se analizan las causas de un
problema, en general son unas pocas las responsables en su mayor parte. A estas pocas se les llama
causas fundamentales, al resto, que suelen ser muchas pero ocasionan una peque na parte del problema
se les denomina causas triviales.
Ejemplo 1.4.2 A partir de los resultados del Ejemplo 1.3.1 (pag. 23), se observa, por la gura si-
guiente, que solo dos causas (la rotura del hilo y el tornillo sin n) han ocasionado casi el 90 % del
problema. Todo el esfuerzo debe concentrarse en la eliminacion de las causas fundamentales, ignorando,
en principio las triviales que ya seran atacadas mas adelante.
CAUSAS
Otras causas
Cinta
Tornillo sin fin
Rotura de hilo
f
r
e
c
u
e
n
c
i
a
a
b
s
o
l
u
t
a
50
40
30
20
10
0
P
o
r
c
e
n
t
a
j
e
100
50
0
3
10
26
Diagrama de rectangulos:
Esta representacion graca consiste en construir tantos rectangulos como modalidades presente el
caracter cualitativo en estudio, todos ellos con base de igual amplitud. La altura se toma igual a
la frecuencia absoluta o relativa (seg un la distribucion de frecuencias que estemos representando),
consiguiendo de esta manera rectangulos con areas proporcionales a las frecuencias que se quieren
representar.
Ejemplo 1.4.3 La representacion graca de la distribucion de frecuencias absolutas del ejemplo an-
terior (datos del Ejemplo 1.3.1 (pag. 23)) sera de la forma:
26
3
10
1
0
5
10
15
20
25
30
Rotura hilo Cinta Tornillo sin fin Otras causas
b) Datos sin agrupar correspondientes a un caracter cuantitativo.
Estudiaremos varios tipos de representaciones gracas, correspondientes a distribuciones de frecuencias
(absolutas o relativas) no acumuladas y acumuladas.
Diagrama de barras:
Consiste en levantar, para cada valor de la variable, una barra cuya altura sea su frecuencia absoluta
o relativa, dependiendo de la distribucion de frecuencias que estemos representando.
Ejemplo 1.4.4 As, la representacion graca de la distribucion de frecuencias del ejemplo del n
o
de
hijos (Ejemplo 1.3.2 (pag. 24)) sera:
DIAGRAMADE BARRAS PARADATOS CUANTITATIVOS
0
2
4
6
8
10
frecuencia absoluta 5 6 8 4 2
0 1 2 3 4
Cuando la barra se sustituye por un dibujo alusivo a la caracterstica investigada, se tienen los llamados
pictogramas.
Ejemplo 1.4.5 Un pictograma adecuado para el ejemplo anterior sera:
0
2
4
6
8
10
0 1 2 3 4
Polgono de frecuencias:
Es el que resulta de unir los puntos medios de las bases superiores de los rectangulos de los diagramas
de barras.
POLIGONO DE FRECUENCIAS
0
2
4
6
8
10
0 1 2 3 4
Curva acumulativa o de distribucion:
Esta representacion graca se corresponde con la de una funcion constante entre cada dos valores de la
variable a representar, e igual en cada tramo a la frecuencia relativa acumulada (o absoluta acumulada
si se trata de representar una distribucion de frecuencias absolutas) hasta el menor de los dos valores de
la variable que construyen el tramo en el que es constante. Se pueden denir de manera mas rigurosa
como las curvas que representan gracamente a las llamadas funciones de distribucion empricas o
muestrales.
Funcion de distribucion emprica:
Si tenemos una muestra de tama no n de datos numericos, la funcion
F
n
: IR IR
x
n
o
de datos de la muestra x
n
se denomina funcion de distribucion emprica o muestral de la muestra dada.
Estas funciones son un caso particular de las funciones de distribucion que estudiaremos mas adelante.
Ejemplo 1.4.6 Considerando de nuevo el ejemplo del N
o
de Hijos (Ejemplo 1.3.2 (pag. 24)), se obtiene
una curva acumulativa o de distribucion como la del siguiente graco:
En esta representacion graca se pueden apreciar las propiedades esenciales de las funciones de distri-
bucion empricas, a saber, son: no decrecientes, continuas por la derecha y tienen lmite cero en y
uno en +.
c) Datos agrupados en intervalos correspondientes a un caracter cuantitativo.
Al igual que antes, existen tambien dos tipos de representaciones gracas dependiendo de si la distribucion
de frecuencias en estudio es de datos acumulados o de datos sin acumular.
Histograma:
Al ser esta representacion una representacion por areas, hay que distinguir si los intervalos en los que
aparecen agrupados los datos son de igual amplitud o no.
Si la amplitud de los intervalos es constante, dicha amplitud puede tomarse como unidad y al ser
Frecuencia (area) = amplitud del intervalo altura
la altura correspondiente a cada intervalo puede tomarse igual a la frecuencia.
Si los intervalos tienen diferente amplitud, se toma alguna de ellas como unidad (generalmente la
menor) y se levantan alturas para cada intervalo de forma que la ecuacion anterior se cumpla.
Ejemplo 1.4.7 En el ejemplo de los Niveles de Colinesterasa (Ejemplo 1.2.2 (pag. 21)), al tener los
intervalos igual amplitud, seg un consideremos las frecuencias absolutas o relativas, la representacion
graca sera:
15,0 - 16,5 13,5 - 15,0 12,0 - 13,5 10,5 - 12,0 9,0 - 10,5 7,5 - 9,0
12
10
8
6
4
2
0
Ejemplo 1.4.8 La distribucion de frecuencias siguiente corresponde a puntuaciones obtenidas en un
test psicologico y en ella los intervalos son de diferente amplitud:
I
i
n
i
f
i
0 20 8 8/70
20 30 9 9/70
30 40 12 12/70
40 45 10 10/70
45 50 9 9/70
50 60 10 10/70
60 80 8 8/70
80 100 4 4/70
8
i=1
n
i
= 70
8
i=1
f
i
= 1
Tomando la amplitud 5 como unidad, deberemos levantar para el primer intervalo una altura de 2/70
para que el area sea la frecuencia relativa 8/70. Procediendo de la misma manera con el resto de los
intervalos obtendramos como representacion graca la gura siguiente:
Observese que la suma de todas las areas debe ser igual a uno, tanto si los intervalos de la distribucion
de frecuencias relativas son o no de igual amplitud.
Polgono de frecuencias acumuladas:
Se utiliza para representar distribuciones de frecuencias (relativas o absolutas) acumuladas. Consiste en
representar la graca de una funcion que una por segmentos las alturas correspondientes a los extremos
superiores de cada intervalo, tengan o no todos igual amplitud, siendo dicha altura igual a la frecuencia
acumulada, dando una altura cero al extremo inferior del primer intervalo y siendo constante a partir
del extremo superior del ultimo.
Ejemplo 1.4.9 As, para el ejemplo de los Niveles de Colinesterasa (Ejemplo 1.2.2 (pag. 21)), el
polgono de frecuencias relativas acumuladas tendra una representacion graca de la forma:
Diagrama de tallo y hojas: Una forma alternativa de presentar los datos agrupados en clases es el
diagrama de tallo y hojas. En su forma mas sencilla, consiste en agrupar los datos seg un sus primeras
cifras y hacer un listado de las ultimas cifras de cada miembro de cada clase.
Ejemplo 1.4.10 Para ilustrar la idea, volvemos a considerar los 34 datos de los niveles de colinesterasa
de los agricultores (Ejemplo 1.2.2 (pag. 21)). En primer lugar, consideramos unicamente las cifras
signicativas (no decimales) y estos formaran el tallo; a la derecha anotamos las cifras nales de todos
los n umeros de cada clase. Por ejemplo hay dos valores que van desde 8 a 8
9: 8
5 y 8
6 , cinco de 9 a
9
99: 9
1, 9
2, 9
3, 9
7 y 9
9.
COLINESTERASA DIAGRAMA DE TALLO Y HOJAS
Frecuencias Tallo Hojas
1 7 . 8
2 8 . 56
5 9 . 12379
5 10 . 12368
8 11 . 11345689
10 12 . 0233445557
0 13 .
1 14 . 9
1 15 . 0
1 16 . 5
El diagrama de tallo y hojas nos transmite una impresion visual del n umero de observaciones de cada
clase, pero ademas podemos leer sus magnitudes individuales.
1.5. Medidas de tendencia central.
En esta seccion deniremos una serie de medidas o valores que tratan de representar o resumir a una distri-
bucion de frecuencias dada, las cuales pueden ademas utilizarse para realizar comparaciones entre distintas
distribuciones de frecuencias. Estas medidas reciben el nombre de promedios, medidas de posicion o medidas de
tendencia central.
a) Media aritmetica.
Llamando x
l
, . . . , x
k
a los datos distintos de un caracter en estudio, o las marcas de clase de los intervalos
en los que se han agrupado dichos datos, y n
1
, . . . , n
k
a las correspondientes frecuencias absolutas de di-
chos valores o marcas de clase, llamaremos media aritmetica o media muestral de la distribucion de
frecuencias a:
x =
k
i=1
x
i
n
i
n
donde n es el tama no muestral.
Ejemplo 1.5.1 La media aritmetica de las veinticinco familias encuestadas en el Ejemplo 1.3.2 (pag. 24)
sera:
x =
k
i=1
x
i
n
i
n
=
0 5 + 1 6 + 2 8 + 3 4 + 4 2
25
=
42
25
= 1
68,
es decir, las familias encuestadas tienen un n umero medio de hijos de 168.
Ejemplo 1.5.2 En el ejemplo sobre los niveles de colinesterasa de 34 agricultores (Ejemplo 1.2.2 (pag. 21)),
la distribucion de frecuencias y las marcas de clase eran:
Intervalo I
i
7
5 9 9 10
5 10
5 12 12 13
5 13
5 15 15 16
5
Marca de Clase x
i
8
25 9
75 11
25 12
75 14
25 15
75
Frecuencia n
i
3 8 10 10 1 2
n
i
= 25
Esto proporciona una media aritmetica de
x =
k
i=1
x
i
n
i
n
=
8
25 3 + 9
75 8 + 11
25 10 + 12
75 10 + 14
25 1 + 15
75 2
34
=
388
5
34
= 11
426.
b) Mediana.
La mediana es otra medida de posicion, la cual se dene como aquel valor de la variable tal que, supuestos
ordenados los valores de esta en orden creciente, la mitad son menores o iguales y la otra mitad mayores o
iguales.
Ejemplo 1.5.3 As, si en la siguiente distribucion de frecuencias,
x
i
n
i
N
i
0 3 3
1 2 5
2 2 7
7
ordenamos los valores en orden creciente,
0 0 0 1 1 2 2
y por lo tanto, el 1 sera el valor que cumple la denicion de mediana.
Logicamente, en cuanto el tama no de la muestra sea ligeramente mayor, el procedimiento utilizado en el
ejemplo anterior resulta inviable. Por esta razon, daremos a continuacion una formula que permita calcularla
en general. No obstante, sera necesario distinguir los casos en los que los datos vengan agrupados de aquellos
en los que vengan sin agrupar.
Datos sin agrupar:
Las gracas siguientes, correspondientes a un diagrama de frecuencias absolutas acumuladas, recogen
las dos situaciones que se pueden presentar:
Si la situacion es como la de la gura de la derecha, es decir, si
N
j1
<
n
2
< N
j
entonces la mediana sera M
e
= x
j
, valor al que corresponde la frecuencia N
j
.
Si la situacion que se presenta es como la de la gura de la izquierda, entonces cualquier valor del
intervalo [x
j1
, x
j
] es una mediana, puesto que cumple los requisitos en la denicion general de mediana
de una variable aleatoria (Denicion 3.3.7, pagina 117). No obstante, la mayor parte de autores y
programas estadsticos consideran en este caso como mediana el punto medio del intervalo [x
j1
, x
j
];
as pues, si
N
j1
=
n
2
< N
j
entonces una mediana es M
e
=
x
j1
+x
j
2
.
Ejemplo 1.5.4 La distribucion de frecuencias acumuladas del ejemplo del n umero de hijos (Ejemplo
1.3.2 (pag. 24)) era
N
o
de hijos (x
i
) 0 1 2 3 4
Frecuencias Acumuladas (N
i
) 5 11 19 23 25
Como n/2 = 12
5, se tiene que
11 < 12
5 < 19
y por tanto, la mediana sera M
e
= 2.
Datos Agrupados:
Las gracas siguientes, correspondientes a polgonos de frecuencias absolutas acumuladas, nos plantea
de nuevo dos situaciones diferentes a considerar:
Para el mas sencillo, el de la derecha, en el que existe una frecuencia absoluta acumulada N
j
tal que
n
2
= N
j
,
la mediana es M
e
= x
j
.
Si la situacion es como la que se representa en la gura de la izquierda, en la que
N
jl
<
n
2
< N
j
entonces la mediana esta en el intervalo [x
j1
, x
j
), es decir entre x
j1
y x
j
, tomandose en ese caso,
por razonamientos de proporcionalidad, como mediana el valor
M
e
= x
j1
+
n
2
N
j1
n
j
(x
j
x
j1
).
Ejemplo 1.5.5 La distribucion de frecuencias del ejemplo de los niveles de colinesterasa (Ejemplo
1.2.2 (pag. 21)) es:
Intervalo I
i
75-9 9-105 105-12 12-135 135-15 15-165
Frecuencia n
i
3 8 10 10 1 2
Frecuencia Acumulada N
i
3 11 21 31 32 34
Al ser n/2 = 17 y estar
11 < 17 < 21
la mediana estara en el intervalo [10
5, 12), y aplicando la formula anterior, sera

M
e
= 10
5 +
34
2
11
10
1
5 = 11
4.
15,0 - 16,5 13,5 - 15,0 12,0 - 13,5 10,5 - 12,0 9,0 - 10,5 7,5 - 9,0
12
10
8
6
4
2
0
La mediana cuando los datos estan agrupados se corresponde con el punto tal que la vertical trazada
sobre el divide al histograma en dos partes del mismo area.
c) Moda.
La moda se dene como aquel valor de la variable al que corresponde la maxima frecuencia (absoluta o
relativa). Para calcularla, tambien sera necesario distinguir si los datos estan o no agrupados.
Datos sin agrupar:
Para datos sin agrupar, la determinacion del valor o valores (ya que puede haber mas de uno) modales
es muy sencilla. Basta observar a que valor le corresponde una mayor n
i
. Ese sera la moda.
Ejemplo 1.5.6 As, en el ejemplo del n umero de hijos (Ejemplo 1.3.2 (pag. 24)), la simple inspeccion
de la tabla siguiente proporciona como valor para la moda el M
d
= 2.
N
o
de hijos (X
i
) 0 1 2 3 4
N
o
de familias (n
i
) 5 6 8 4 2
Datos agrupados:
Si los datos se presentan agrupados en intervalos es necesario, a su vez, distinguir si estos tienen o no
igual amplitud.
Si tienen amplitud constante, una vez identicado el intervalo modal (x
j1
, x
j
], es decir, el intervalo
al que corresponde mayor frecuencia absoluta n
j
= max{n
l
, . . . , n
k
}, la moda se dene, tambien por
razones geometricas, como
M
d
= x
j1
+
n
j+1
n
j1
+n
j+1
(x
j
x
j1
)
Ejemplo 1.5.7 Volviendo a los datos agrupados de los niveles de colinesterasa (Ejemplo 1.3.3 (pag.
24)), observamos que este ejemplo presenta un caso de distribucion bimodal, ya que tanto el intervalo
(10
5, 12] como el (12, 13
5] tienen frecuencia absoluta maxima. Deberamos aplicar, por tanto, para

cada uno de los dos intervalos la formula anterior, determinando as las dos modas de la distribucion.
No obstante, este ejemplo presenta ademas la peculiaridad adicional de ser ambos intervalos modales
contiguos. En esta situacion se considera la distribucion unimodal, eligiendo como moda el extremo
com un, M
d
= 12.
Si los intervalos tuvieran distinta amplitud, primero debemos normalizar las frecuencias absolutas n
j
,
determinando los cocientes
l
j
=
n
j
x
j
x
j1
, j = 1, . . . , k
y luego aplicar la regla denida para el caso de intervalos de amplitud constante a los l
j
. As pues,
primero tenemos que calcular el l
j
= max{l
1
, . . . , l
k
} para determinar el intervalo modal (x
j1
, x
j
] y
luego aplicar la formula
M
d
= x
j1
+
l
j+1
l
j1
+l
j+1
(x
j
x
j1
).
Ejemplo 1.5.8 Las frecuencias normalizadas correspondientes al ejemplo correspondiente a puntua-
ciones de un test psicologico (Ejemplo 1.4.8 (pag. 28)) con intervalos con distinta amplitud eran:
I
i
n
i
l
i
0 20 8 0
4
20 30 9 0
9
30 40 12 1
2
40 45 10 2
45 50 9 1
8
50 60 10 1
60 80 8 0
4
80 100 4 0
2
con lo que el intervalo modal es el 40 45 y la moda
M
d
= 40 +
1
8
1
2 + 1
8
5 = 43.
Algunos autores proponen otra forma de calcular la moda en el caso de datos agrupados, que viene
dada por la siguiente expresion:
M
d
= x
j1
+
l
j
l
j+1
(l
j
l
j+1
) + (l
j
l
j1
)
(x
j
x
j1
).
A diferencia de lo que ocurre con la media o con la mediana, s es posible determinar la moda en el caso
de datos cualitativos. As, en el ejemplo de las causas de avera puede armarse que la causa modal
por la que se produce avera en la lnea es M
d
=Rotura de hilo.
d) Cuantiles.
Los cuantiles o cuantilas son las unicas medidas de posicion que veremos. De hecho algunos autores las
incluyen dentro de las medidas de dispersion al ser medidas de posicion no centrales.
El cuantil p
r/k
, r = 1, 2, . . . , k 1 se dene como aquel valor de la variable que divide la muestra,
previamente ordenada de forma creciente, en dos partes, estando el (100 r/k) % de esta formado por valores
menores que p
r/k
.
Si k = 4 los (tres) cuantiles reciben el nombre de cuartiles. Si k = 10 los (nueve) cuantiles reciben, en este
caso, el nombre de deciles. Por ultimo, si k = 100 los (noventa y nueve) cuantiles reciben el nombre de
centiles.
Observese que siempre que r y k mantengan la misma proporcion (r/k) obtendremos el mismo valor, es
decir, por ejemplo, el primer cuartil es igual al vigesimo quinto centil. En este sentido, la mediana M
e
es el
segundo cuartil, o el quinto decil, etc.
Para el calculo de los cuantiles de nuevo hay que considerar si los datos vienen o no agrupados en intervalos.
Datos sin agrupar:
Si los datos vienen sin agrupar y es
N
j1
<
r
k
n < N
j
el r-esimo cuantil de orden k sera p
r/k
= x
j
, valor al que corresponde la frecuencia absoluta acumulada
N
j
.
Si la situacion fuera de la forma
N
j1
=
r
k
n < N
j
tomaramos, en esta situacion indeterminada,
p
r/k
=
x
j1
+x
j
2
.
Datos agrupados:
Si los datos se presentan agrupados y, para alg un j, fuera
r
k
n = N
j
el r-esimo cuantil de orden k sera p
r/k
= x
j
.
Por ultimo, si fuera
N
j1
<
r
k
n < N
j
el intervalo a considerar sera el [x
j1
, x
j
), al que corresponde frecuencia absoluta n
j
y absoluta acu-
mulada N
j
, siendo entonces el cuantil el dado por la expresion,
p
r/k
= x
j1
+
r
k
n N
j1
n
j
(x
j
x
j1
).
Si el intervalo a considerar fuera el [x
0
, x
1
), se tomara en la expresion anterior N
j1
= 0.
Ejemplo 1.5.9 Vamos a determinar el tercer cuartil del ejemplo del n umero de hijos (Ejemplo 1.3.2
(pag. 24)).
N
o
de hijos (X
i
) 0 1 2 3 4
N
o
de familias (n
i
) 5 6 8 4 2
n
i
= 25
N
o
de familias (n
i
) 5 11 19 23 25
Como es
r
k
n =
3
4
25 = 18
75
y 11 < 18
75 < 19, sera p

3/4
= 2.
Ejemplo 1.5.10 Vamos a determinar el septimo decil del ejemplo de los niveles de colinesterasa (Ejem-
plo 1.3.3 (pag. 24)).
Intervalo I
i
75-9 9-105 105-12 12-135 135-15 15-165
Frecuencia n
i
3 8 10 10 1 2
Frecuencia Acumulada N
i
3 11 21 31 32 34
Como es:
r
k
n =
7
10
34 = 23
8
y 21 < 23
8 < 31, el intervalo a considerar sera el [12, 13
5), siendo
p
7/10
= 12 +
23
8 21
10
1
5 = 12
42.
En temas posteriores consideraremos una denicion mas general dada en terminos de la funcion de
distribucion. As, (0, 1) diremos que p
es un cuantil de orden si se verican las siguientes

desigualdades:
F
n
(p
F
n
(p
)
Diagramas de caja.
El diagrama de caja o diagrama de caja y bigotes es una representacion graca de datos que muestra
varias caractersticas, como la posicion, dispersion y asimetra. Para construirlo, se traza una caja con
lmite inferior en el primer cuartil p
1/4
y lmite superior el tercer cuartil p
3/4
y en el interior de la caja
se dibuja una lnea para se nalar el lugar que ocupa la mediana. El recorrido intercuartlico p
3/4
p
1/4
,
es la longitud de la caja. Se trazan dos bigotes o rabos desde el lmite inferior de la caja hasta el valor
max{x
min
, p
1/4
1
5(p
3/4
p
1/4
)} (bigote inferior) y desde el lmite superior de la caja hasta el valor
mn{x
max
, p
3/4
+1
5(p
3/4
p
1/4
)} (bigote superior), donde x
min
representa al menor de los datos y x
max
al
mayor. Los datos cuyos puntos estan mas alla de los extremos superior o inferior de los bigotes se consideran
atpicos.
Ejemplo 1.5.11 En la siguiente tabla se recogen las tasas de inacion de doce pases de la Union Europea
en 1992:
Francia 28 Grecia 159
Alemania 45 Irlanda 30
Italia 55 Luxemburgo 32
Reino Unido 37 Holanda 37
Belgica 24 Portugal 89
Dinamarca 20 Espa na 59
Los valores de la mediana y los cuartiles se muestran en la siguiente tabla:
Mediana 37000
Percentiles 25 29000
50 37000
75 57000
El diagrama de caja es el siguiente:
TASA DE INFLACIN
0
2
4
6
8
10
12
14
16
18
GRECIA
1.6. Medidas de dispersion.
Las medidas de posicion estudiadas en la seccion anterior servan para resumir la distribucion de frecuencias
en un solo valor. Las medidas de dispersion, a las cuales dedicaremos esta seccion, tienen como proposito
estudiar lo concentrada que esta la distribucion en torno a alg un promedio.
Estudiaremos las cuatro medidas de dispersion mas utilizadas: recorrido, varianza, desviacion tpica y
coeciente de variacion de Pearson, estando denidas las tres primeras medidas en unidades concretas y
estandolo la cuarta en unidades abstractas.
a) Recorrido.
Si x
max
es el dato mayor o la ultima marca de clase, si es que los datos vienen agrupados en intervalos, y
x
min
el dato menor o primera marca de clase, llamaremos rango o recorrido a
R = x
max
x
min
.
Ejemplo 1.6.1 As, en el ejemplo de los niveles de colinesterasa (Ejemplo 1.2.2 (pag. 21)) el recorrido es
R = 15
75 8
25 = 7
5,
y en el ejemplo del n umero de hijos (Ejemplo 1.3.2 (pag. 24)) sera R = 4 0 = 4.
La principal ventaja del recorrido es la de proporcionar una medida de la dispersion de los datos facil y
rapida de calcular.
b) Recorrido intercuartlico.
Llamaremos recorrido intercuartlico a la diferencia entre el cuartil de orden 3 y el cuartil de orden 1,
es decir,
RI = p
3/4
p
1/4
.
Ejemplo 1.6.2 As, en el Ejemplo 1.5.11 (pag. 35), el recorrido intercuartlico es
RI = 5
8000 2
8500 = 2
9500.
Con la utilizacion como medida de dispersion del recorrido intercuartlico, en lugar del recorrido, se evita
la inuencia que pueden tener los valores extremos.
c) Varianza.
Denotando por x
1
, . . . , x
k
los datos o las marcas de clase, llamaremos varianza a
s
2
=
1
n
k
i=1
(x
i
x)
2
n
i
=
_
1
n
k
i=1
x
2
i
n
i
_
(x)
2
,
siendo x la media de la distribucion.
Ejemplo 1.6.3 As en el ejemplo del n umero de hijos la varianza es
s
2
= 4
24 (1
68)
2
= 1
4176,
y en ejemplo de los niveles de colinesterasa
s
2
= 133
97 (11
426)
2
= 3
42.
Al valor
s
2
=
1
n 1
k
i=1
(x
i
x)
2
n
i
=
n
n 1
s
2
,
se le denomina cuasivarianza.
d) Desviacion Tpica.
La varianza tiene un problema, y es que esta expresada en unidades al cuadrado. Esto puede producir
una falsa imagen de la dispersion de la distribucion. En su lugar suele utilizarse su raz cuadrada positiva,
denominada desviacion tpica.
Ejemplo 1.6.4 As, la desviacion tpica de la distribucion de frecuencias del ejemplo de los niveles de
colinesterasa es s = 1
1906 y la desviacion tpica del ejemplo del n umero de hijos es s = 1
85.
e) Coeciente de Variacion de Pearson.
La desviacion tpica sirve para medir de forma ecaz la dispersion de un conjunto de datos entorno a su
media. Desgraciadamente esta medida puede resultar enga nosa cuando tratamos de comparar la dispersion
de dos conjuntos de datos. As, si por ejemplo tenemos dos grupos de mujeres de 11 y 25 a nos con medias
y desviaciones tpicas dadas por la tabla siguiente:
Peso Medio Desviacion Tpica
11 a nos 40 Kgr. 2 Kgr.
25 a nos 50 Kgr. 2 Kgr.
puede parecernos, al observar en ambos grupos una desviacion tpica igual, que ambos grupos de datos
tienen la misma dispersion. No obstante, como parece logico, no es lo mismo una variacion de dos kilos en
un grupo de elefantes que en uno de conejos. El coeciente de variacion de Pearson elimina esa posible
confusion al ser una medida de la variacion de los datos pero en relacion con su media. Se dene como
V
P
=
s
x
100
siendo s y x, respectivamente, la desviacion tpica y la media de la distribucion en estudio y en donde el
factor 100 tiene como unico objetivo el evitar operar con valores decimales.
De la denicion de V
P
se deduce facilmente que aquella distribucion a la que corresponda mayor coeciente
tendra mayor dispersion.
Ejemplo 1.6.5 En el ejemplo anterior, al grupo de mujeres de 11 a nos le corresponde un coeciente de
variacion de Pearson igual a
V
P
=
2
40
100 = 5
y al grupo de las mujeres de 25 a nos
V
P
=
2
50
100 = 4,
lo que indica una mayor dispersion en el grupo de mujeres de 11 a nos.
Para el ejemplo del n umero de hijos (Ejemplo 1.3.2 (pag. 24)) V
P
toma el valor
V
P
=
1
19062
1
68
100 = 70
869,
y en el de los niveles de colinesterasa (Ejemplo 1.2.2 (pag. 21))
V
P
=
1
85
11
426
100 = 16
19.
1.7. Medidas de asimetra y curtosis.
Es frecuente que los valores de una distribucion sean similares a ambos lados de un parametro de centralizacion.
En una distribucion simetrica su mediana, y su media aritmetica coinciden.
Diremos que una distribucion es asimetrica a la derecha si las frecuencias (absolutas o relativas) descienden
mas lentamente por la derecha que por la izquierda.
Si las frecuencias descienden mas lentamente por la izquierda que por la derecha diremos que la distribucion es
asimetrica a la izquierda.
Existen varias medidas de la asimetra de una distribucion de frecuencias. Vamos a estudiar a continuacion la
mas importante.
a) Coeciente de Asimetra de Fisher.
Se dene como
A
f
=
k
i=1
(x
i
x)
3
n
i
n s
3
,
siendo x
i
los valores de la variable o las marcas de clase y s la desviacion tpica.
El coeciente de Fisher se interpreta as: si la distribucion es simetrica vale cero, siendo positivo o negativo
cuando exista asimetra a la derecha o izquierda, respectivamente.
Si A
f
< 0 Si A
f
= 0 Si A
f
> 0
Asimetra negativa a la izquierda Simetra Asimetra positiva a la derecha
100
80
90
70
60
50
40
30
20
10
0
11 25 39 53 67 81 95 109 123 137 151 165 179 193
100
80
90
70
60
50
40
30
20
10
0
11 25 39 53 67 81 95 109 123 137 151 165 179 193
100
80
90
70
60
50
40
30
20
10
0
11 25 39 53 67 81 95 109 123 137 151 165 179 193
b) Coeciente de curtosis.
La curtosis es una medida del apuntamiento de las distribuciones, dandonos una idea de la masa que tienen
las colas de las distribuciones de frecuencias. Para medir la apuntamiento se utiliza el coeciente de
curtosis:
K =
k
i=1
(x
i
x)
4
n
i
n s
4
.
La distribucion normal, que se estudiara en el tema 4, se toma como patron. Puesto que dicha distribucion
tiene un coeciente de curtosis igual a tres, para comparar los apuntamientos se usa el coeciente C = K3.
La interpretacion de este coeciente es analoga a la del coeciente de Fisher, de manera que si la distribucion
esta igual de apuntada que la normal (mesoc urtica), el coeciente C vale cero, siendo positivo o negativo
cuando el apuntamiento sea superior (leptoc urtica) o inferior (platic urtica) al de la distribucion normal.
C < 0 C = 0 C > 0
Platic urtica Mesoc urtica Leptoc urtica
Ejemplo 1.7.1 Con el proposito de resumir los principales conceptos introducidos en este tema, vamos a
considerar de nuevo los datos del Ejemplo 1.3.2 (pag. 24), relativos al n umero de hijos por familia.
Las cuatro distribuciones de frecuencia seran:
DISTRIBUCI
ON DE FRECUENCIAS
X
i
n
i
f
i
N
i
F
i
0 5 0
20 5 0
20
1 6 0
24 11 0
44
2 8 0
32 19 0
76
3 4 0
16 23 0
92
4 2 0
08 25 1
TOTAL 25 1
As, el diagrama de barras de la distribucion de frecuencias sera el representado en la Figura 1.1,
DIAGRAMADE BARRAS PARADATOS CUANTITATIVOS
0
2
4
6
8
10
frecuencia absoluta 5 6 8 4 2
0 1 2 3 4
Figura 1.1: Diagrama de barras.
y el diagrama de frecuencias acumuladas sera el representado en la Figura 1.2.
Figura 1.2: Diagrama de frecuencias acumuladas.
La media aritmetica de las veinticinco familias encuestadas sera:
x =
k
i=1
x
i
n
i
n
=
0 5 + 1 6 + 2 8 + 3 4 + 4 2
25
=
42
25
= 1
68,
es decir, las familias encuestadas tienen un n umero medio de hijos de 1
68.
Para el calculo de la mediana nos hace falta la distribucion de frecuencias acumuladas que era:
N
o
de hijos (x
i
) 0 1 2 3 4
Frecuencias Acumuladas (N
i
) 5 11 19 23 25
y como n/2 = 12
5 y en consecuencia
11 < 12
5 < 19,
la mediana sera M
e
= 2.
Para el calculo de la moda, la simple inspeccion de la tabla siguiente proporciona como valor M
d
= 2.
N
o
de hijos (X
i
) 0 1 2 3 4
N
o
de familias (n
i
) 5 6 8 4 2
Para determinar el tercer cuartil, como es
r
k
n =
3
4
25 = 18
75 y 11 < 18
75 < 19,
sera p
3/4
= 2.
El recorrido sera R = 4 0 = 4.
La varianza es:
s
2
= 4
24 (1
68)
2
= 1
4176,
y, por lo tanto, la desviacion tpica sera s = +
4176 = 1
1906.
Para este ejemplo, el coeciente de variacion de Pearson, toma el valor:
V
P
=
1
19062
1
68
100 = 70
869.
En cuanto a la simetra, el coeciente de asimetra de Fisher, es igual a:
A
f
=
k
i=1
(x
i
x)
3
n
i
n s
3
=
0
35366906
1
19062
3
= 0
209545,
con lo que la distribucion es ligeramente asimetrica a la derecha.
El coeciente de curtosis para estos datos es:
K =
k
i=1
(x
i
x)
4
n
i
n s
4
= 2
2158
y el coeciente por exceso
C = K 3 = 0
7842,
que nos dice que la distribucion es platic urtica.
Enunciados de los ejercicios Tema 1, 43
TEMA 1.- INTRODUCCI
ON A LA ESTAD
ISTICA
DESCRIPTIVA. ENUNCIADOS DE LOS EJERCICIOS.
Ejercicio 1.1 El diagrama de sectores adjunto describe el n umero de pruebas acelaradas de desgaste necesarias
para reventar los 2000 neumaticos que se sometieron a dichas pruebas.
3 pruebas
80%
4 pruebas
5%
1 prueba
5%
2 pruebas
10%
Se pide:
a) Interpretar el diagrama de sectores.
b) Cuantos millones de neumaticos reventaron en la primera prueba?, y en la tercera?
c) Obtener la tabla de frecuencias asociada a la variable n umero de pruebas necesarias para reventar el
neumatico.
d) Representar el diagrama de barras de frecuencias absolutas asociado a dicha variable.
Ejercicio 1.2 Para estudiar el funcionamiento de una determinada maquina se ha tomado nota del n umero de
averas semanales durante las ultimas 50 semanas. Se pide calcular la frecuencia absoluta de cada modalidad en
cada uno de los siguientes casos:
a) Los datos obtenidos respecto a las frecuencias relativas son:
Averas (x
i
) 2 3 4 5
Frecuencia relativa (f
i
) 056 032 010 002
b) Los datos obtenidos respecto a las frecuencias absolutas acumuladas son:
Averas (x
i
) 2 3 4 5
Frecuencia absoluta acumulada (N
i
) 20 30 43 50
c) Los datos obtenidos respecto a las frecuencias relativas acumuladas son:
Averas (x
i
) 2 3 4 5
Frecuencia relativa acumulada (F
i
) 036 054 062 1
Ejercicio 1.3 Para estudiar la inuencia de la temperatura de funcionamiento de una determinada maquina en
la aparicion de producto defectuoso, se han analizado 200 productos defectuosos y se ha anotado la temperatura
de la maquina en el momento de su fabricacion. Se pide obtener la media y la moda de la temperatura si la
distribucion de frecuencias obtenida fue:
a)
Temperatura (x
i
) 40 50 60
Frecuencia absoluta (n
i
) 100 60 40
b)
Temperatura (x
i
) 40 50 60
i
) 01 05 04
c)
Temperatura (x
i
) 40 50 60
Frecuencia absoluta acumulada (N
i
) 40 100 200
d)
Temperatura (x
i
) 40 50 60
Frecuencia relativa acumulada (F
i
) 05 09 1
Ejercicio 1.4 En un estudio sobre la calidad de la produccion de una empresa, se ha anotado el n umero de
artculos defectuosos por lote para los lotes producidos en un da. Obtener el n umero mediano de artculos
defectuosos por lote al da en cada una de los siguientes casos:
a) En un da en el que se fabricaron 5 lotes y se obtuvieron los siguientes datos relativos al n
o
de defectuosos
en los mismos: 1, 3, 7, 9, 14.
b) En un da en el que se fabricaron 4 lotes y se obtuvieron los siguientes datos relativos al n
o
de defectuosos
en los mismos: 1, 3, 7, 9.
c) En un da en el que se fabricaron 50 lotes y se obtuvieron los siguientes datos relativos al n
o
de defectuosos
en los mismos:
N
o
defectuosos (x
i
) 1 3 7 9
i
) 02 04 03 01
d) En un da en el que se fabricaron 100 lotes y se obtuvieron los siguientes datos relativos al n
o
de defectuosos
en los mismos:
N
o
defectuosos (x
i
) 1 3 7 9
i
) 20 10 20 50
Ejercicio 1.5 Se determino la cantidad de partculas contaminantes en una oblea de silicio antes de cierto
proceso de lavado, en una muestra de tama no 100, y se obtuvieron las siguientes frecuencias:
Cantidad de Partculas 0 1 2 3 4 5
Frecuencia 3 15 44 26 11 1
a) Que proporcion de las obleas muestreadas tenan al menos una partcula?, y al menos cuatro partculas?
b) Que proporcion de las obleas muestreadas tenan entre una y cuatro partculas (mas de una y menos de
cuatro)?
c) Realizar un diagrama de barras con la frecuencia relativa en el eje vertical.
d) Calcular el n umero medio de partculas contaminantes en una oblea de silicio.
e) Calcular la moda, varianza y cuasivarianza de la variable n umero de partculas contaminantes en una oblea
de silicio. En este caso la varianza es menor que la cuasivarianza, es esto cierto siempre?
f) Calcular la mediana, los cuartiles, el percentil 99 y el decil 8 de la variable anterior.
Ejercicio 1.6 Scram es el termino que utilizan los ingenieros industriales para describir una desactivacion
rapida de emergencia de un reactor nuclear. La industria nuclear ha hecho un gran esfuerzo por reducir signi-
cativamente el n umero de scrams no planeados. La siguiente tabla proporciona el n umero de scrams en cada
una de 10 unidades de reactor nuclear estadounidenses en un a no reciente.
N
o
de scrams 0 1 2 4
N
o
de reactores 2 3 4 1
Se pide:
a) Calcular el n umero medio de scrams anuales en un reactor.
b) Calcular la varianza y la desviacion tpica de la variable n umero de scrams al a no en un reactor. Cuales
son las unidades de ambas medidas?
c) Obtener la tabla de frecuencias.
d) Calcular la mediana y los cuartiles.
e) Calcular el percentil 93 y el decil 8.
Ejercicio 1.7 El artculo A Thin-Film Oxygen Uptake Test for the Evaluation of Automotive Crankcase
Lubricants (Lubric. Engr., 1984, pp. 7583) publico los datos del tiempo de oxidacion-induccion (en minutos)
de varios aceites comerciales que aparecen recogidos en el siguiente diagrama de tallo-hojas:
8 77
9 39
10 35
11 9
12 9
13 028
14 55
15 23
16 0
17
18 0
19 5
20
21 1
De acuerdo con estos datos y sabiendo que el tiempo de oxidacion-induccion esta entre 50 y 300 minutos, se
pide obtener el histograma de frecuencias relativas, agrupando los datos en los intervalos: [76, 96), [96, 116),
[116, 136), [136, 156), [156, 176), [176, 196) y [196, 216).
Ejercicio 1.8 En un estudio sobre la calidad de la produccion, se han tomado datos respecto al n umero de
piezas defectuosas por lote durante un da, obteniendose el siguiente diagrama de tallo y hojas:
1 055
2 2222558
De acuerdo con estos datos y teniendo en cuenta que un lote esta compuesto por 100 piezas, se pide:
a) Calcular el valor de la moda de la muestra.
b) Calcular los valores de la media, la varianza y la desviacion tpica muestral.
c) Calcular los valores de la mediana y los cuartiles.
d) Calcular los valores del rango y el recorrido intercuartlico.
e) Representar el diagrama de cajas asociado a estos datos.
Ejercicio 1.9 Examine las siguientes observaciones de resistencia al corte, en MPa, de una union pegada de
cierta manera (tomadas de una graca del artculo Diusion of Silicon Nitride Austenitic Stainless Steel without
Interlayers, Metallurgical Trans., 1993, pp. 18351843):
222, 404, 164, 737, 366, 2099, 300, 44, 331, 667, 815.
Se pide:
a) Determinar el valor de la media muestral y de la mediana muestral.
b) Suponga que la primera observacion fue 240 en lugar de 222 cambiaran la media y/o la mediana?
c) Cuales con los valores de los cuartiles?
d) Trazar una diagrama de caja y comentar sus caractersticas. Cuanto debe valer una observacion para
considerarse como atpica?
Soluciones de los ejercicios Tema 1, 47
TEMA 1.- INTRODUCCI
ON A LA ESTAD
ISTICA
DESCRIPTIVA. SOLUCIONES DE LOS EJERCICIOS.
Ejercicio 1.1 a) Entre los neumaticos analizados se observa como solo un 15 % revientan en la primera o
segunda prueba, pero justo en la tercera ese porcentaje pasa a ser del 80 %, con lo que es muy difcil que un
neumatico supere la tercera prueba. De hecho, solo un 5 % lo hacen y todos ellos revientan en la cuarta, no
habiendo ninguno que resista hasta una quinta prueba. Dependiendo del nivel de resistencia deseado para
los neumaticos, medido en funcion del n umero de pruebas aceleradas de desgaste que soportan, estos datos
tendran una u otra interpretacion en cuanto a la calidad de los neumaticos.
b) De los 2000 neumaticos estudiados, 100 reventaron en la primera prueba y 1600 en la tercera.
c) La tabla de frecuencias asociada a esta variable sera:
x
i
n
i
f
i
N
i
F
i
1 100 0
05 100 0
05
2 200 0
1 300 0
15
3 1600 0
8 1900 0
95
4 100 0
05 2000 1
d) El diagrama de barras de frecuencias absolutas asociado a estos datos es:
0
200
400
600
800
1000
1200
1400
1600
1800
1 2 3 4
Diagrama de barras de frecuencias absolutas
N de pruebas ( ) x
i
N

d
e

n
e
u
m
t
i
c
o
s

(
)
n
i
Ejercicio 1.2 Las frecuencias absolutas de cada modalidad son:
a)
Averas (x
i
) 2 3 4 5
i
) 28 16 5 1
b)
Averas (x
i
) 2 3 4 5
i
) 20 10 13 7
c)
Averas (x
i
) 2 3 4 5
i
) 18 9 4 19
Ejercicio 1.3 La media y la moda para cada distribucion de frecuencias son:
Media Moda
a) 47 40
b) 53 50
c) 53 60
d) 46 40
Ejercicio 1.4 En cada uno de los casos la mediana es:
a) 7.
b) Cualquier valor en el intervalo [3, 7].
c) 3.
d) Cualquier valor en el intervalo [7, 9].
Ejercicio 1.5 a) La proporcion de las obleas muestreadas que tenan al menos una partcula es 097 (97 %).
La proporcion de las que tenan al menos cuatro partculas es 012 (12 %).
b) La proporcion de las obleas muestreadas que tenan mas de una y menos de cuatro partculas es 070 (70 %).
c) Lo que nos piden es la media, con lo cual la solucion de este apartado es:
x =
1
100
100
i=1
x
i
=
1
100
(0 3 + 1 15 + 2 44 + 3 26 + 4 11 + 5 1) = 2
3 partculas.
d) La moda es el valor que se repite mas veces, es decir, el de mayor frecuencia absoluta (o relativa). En este
caso, por tanto, la moda es Mo = 2 partculas.
La varianza mide la dispersion de los datos y se calcula como sigue:
s
2
=
1
100
100
i=1
(x
i
x)
2
=
_
1
100
100
i=1
x
2
i
_
(x)
2
=
=
1
100
(0
2
3 + 1
2
15 + 2
2
44 + 3
2
26 + 4
2
11 + 5
2
1) (2
3)
2
= 0
97.
La cuasivarianza tiene practicamente la misma denicion que la varianza, pero en lugar de dividir entre n,
se divide entre n 1. As pues, en este caso:
s
2
=
1
99
100
i=1
(x
i
x)
2
=
100
99
s
2
=
100
99
0
97 = 0
98.
La varianza siempre es menor que la cuasivarianza, puesto que se divide la misma cantidad entre un n umero
mayor.
e) Para calcular los cuantiles que nos piden en este apartado, vamos a calcular el % de datos menores o iguales
que cada observacion y el % de datos mayores o iguales, puesto que esto nos facilitara los calculos posteriores.
x
i
n
i
f
i
% de obs. (100 F
i
) % de obs.
0 3 003 3 % 100 %
1 15 015 18 % 97 %
2 44 044 62 % 82 %
3 26 026 88 % 38 %
4 11 011 99 % 12 %
5 1 001 100 % 1 %
La mediana es el valor tal que al menos un 50 % de los datos son menores o iguales que el y al menos un
50 % de los datos son mayores o iguales que el. El unico valor que cumple estas dos condiciones es Me = 2.
De forma analoga, los cuartil primero (respectivamente tercero) es el valor tal que al menos un 25 % (resp.
75 %) de los datos son menores o iguales que el y al menos un 75 % (resp. 25 %) de los datos son mayores o
iguales que el. El unico valor que cumple estas dos condiciones es p
1/4
= 2 (resp. p
3/4
= 3).
El percentil 99 es el valor tal que al menos un 99 % de los datos son menores o iguales que el y al menos un
(100-99) % de los datos son mayores o iguales que el. Todos los valores entre 4 y 5 cumplen estas condiciones,
con lo cual, se tomara como percentil el valor medio de este intervalo, es decir, p
99/100
= 4
5.
El decil 8 es el valor tal que al menos un 80 % de los datos son menores o iguales que el y al menos un
(100-80) % de los datos son mayores o iguales que el. El unico valor que cumple estas dos condiciones es
p
8/10
= 3.
Ejercicio 1.6 a) El n umero medio de scrams anuales en un reactor es 15.
b) La varianza es 125 y la desviacion tpica es 112. Las unidades son scrams
2
y scrams, respectivamente.
c) La tabla de frecuencias es:
x
i
n
i
f
i
N
i
F
i
0 2 2/10 = 0
2 2 2/10 = 0
2
1 3 3/10 = 0
3 5 5/10 = 0
5
2 4 0
4 9 0
9
4 1 0
1 10 1
d) Me p
2/4
es cualquier valor en el intervalo [1, 2], como representante se puede tomar el punto medio, es
decir, 1
5; p
1/4
= 1; p
3/4
= 2.
e) p
93/100
= 4, p
8/10
= 2.
Ejercicio 1.7 El histograma pedido es:
Ejercicio 1.8 a) La moda es 22.
b) El n umero medio de piezas defectuosas es 20
6, la varianza 27
64 y la desviacion tpica es 5
26.
c) La mediana, y por tanto el segundo cuartil, es 22. El primer cuartil es p
1/4
= 15 y el tercer cuartil es
p
3/4
= 25.
d) El rango es 18 y el recorrido intercuartlico es 10.
e) El diagrama de cajas asociado es:
35
30
25
20
15
10
Ejercicio 1.9 a) El valor de la media muestral es x = 55
9 y de la mediana muestral es M
e
= 36
6.
b) La media pasa a ser 56
06, pero la mediana no cambia.

c) El primer cuartil es 22
2 y el tercero 73
7.
d) Un 25 % de las observaciones estan concentradas entre 22
2 y 36
6, y otro 25 % entre 36
6 y 73
7. Todos
los valores observados pueden considerarse como valores tpicos, menos la observacion de 209
9MPa de
resistencia al corte. Dicho valor se aleja mucho del extremo superior de normalidad. Ademas, a la vista
del graco de caja, es evidente que la concentracion de valores entre 22
2 y 36
6 es muy alta.
*
209.9
200
100
150
50
0
Para ser considerada atpica, una observacion debe ser menor que 4
4 o mayor que 150
95.
Preguntas de test Tema 1, 51
TEMA 1.- INTRODUCCI
ON A LA ESTAD
ISTICA
DESCRIPTIVA. PREGUNTAS DE TEST.
Examenes.
1. (19-06-03) El diagrama de caja siguiente representa el resumen de una muestra.
17
15
13
11
9
7
5
3
1
16
14
12
10
8
6
4
2
Se puede armar que:
a) La mediana es 15;
d) El recorrido intercuartlico es 3;
b) El percentil de orden 75 es 9;
e) Todo falso.
c) El cuartil de orden 1 es 2;
2. (19-06-03) A partir del mismo diagrama de la pregunta anterior, podemos asegurar que:
a) El percentil de orden 25 es 2;
d) La media es 37;
b) El cuartil de orden 3 es 6;
e) Todo falso.
c) 16 es un valor atpico;
3. (19-06-03) A partir de la tabla de distribucion de frecuencias siguiente,
x
i
n
i
N
i
0 3 3
1 2 5
2 2 7
podemos armar que,
a) La media de la muestra es 1;
d) La mediana de la muestra es 6/7;
b) La mediana de la muestra es 1;
e) Todo falso.
c) La media de la muestra es 6/7;
4. (09-09-03) El diagrama de barras siguiente representa la temperatura mnima en un determinado lugar
durante un mes de 30 das.
0
1
2
3
4
5
6
7
-1 0 1 2 3 4 5 6 7 8 9 10
Frecuencia absoluta
Se cumple que:
a) La mediana es 5;
d) La media es 3;
b) El rango es 4;
e) Todo falso.
c) La moda es 3;
5. (09-09-03) A partir del mismo diagrama de la pregunta anterior, podemos asegurar que,
a) El cuartil de orden uno es 2;
d) El rango es 11;
b) El cuartil de orden dos es 3;
e) Todo falso.
c) El cuartil de orden tres es 6;
6. (09-09-03) A partir de la tabla de distribucion de frecuencias acumuladas relativas siguiente,
x
i
F
i
0 1/5
1 7/10
2 1
podemos armar que,
d) La mediana de la muestra es 11;
e) Todo falso.
c) La media de la muestra es 11;
7. (09-09-03) Con los datos de la pregunta anterior se tiene que el porcentaje de observaciones del valor 2 ha
sido:
a) 20 %; b) 30 %; c) 50 %; d) 70 %; e) 100 %.
8. (17-02-04) El siguiente diagrama de tallo y hojas representa el resumen de una muestra de unidades
defectuosas. Se cumple que:
5 9
6 1225559
7 0011225
d) El tama no de la muestra es 15;
b) El rango es 75;
e) Todo falso.
9. (17-02-04) A partir del mismo diagrama de la pregunta anterior, podemos asegurar que,
d) El percentil de orden 50 es 50;
e) Todo falso.
c) El valor mnimo es 9;
10. (17-02-04) Los resultados del lanzamiento de un dado diez veces fueron (5,2,5,5,3,1,1,4,2,4), podemos
armar que,
a) La media es 35;
d) La moda es 5;
b) Una mediana es 35;
e) Todo falso.
c) La moda es 6/7;
Las preguntas 11. y 12. hacen referencia al siguiente enunciado: El histograma adjunto representa el resumen
de una muestra de consumo de 45 coches.
235 24 245 25 255 26 265
1
2
3
4
5
6
7
8
9
10
11. (21-06-04) Se cumple que:
a) Me = 1/2; b) p
2/4
= 0
5; c) p
1/4
= 0
25; d) x = 8; e) Todo falso.

12. (21-06-04) Se tiene que, aproximadamente,
a) Me = 2; b) x = 24
89; c) Mo = 2; d) x = 5; e) Todo falso.

13. (21-06-04) Una cadena de grandes almacenes tiene cinco establecimientos. Los porcentajes de incremento
de ventas respecto a las obtenidas en el a no anterior de los cinco establecimientos fueron: 31, 59, 19, 68 y 59.
De acuerdo con estos datos se tiene, para la variable porcentaje de incremento de ventas, que:
a) x = 5
9; b) Me = 5
9; c) Mo = 5
9; d) x = 4
72; e) Todo falso.

Las preguntas 14. y 15. hacen referencia al siguiente enunciado: El diagrama de caja adjunto representa el
resumen de una muestra.
10
8
6
4
2
9
7
5
3
1
0
14. (09-09-04) A partir del diagrama anterior, podemos armar siempre que:
a) Mo = 8; b) x = 3; c) Me = 0
5; d) p
1/4
= 2; e) Todo falso.
15. (09-09-04) A partir del diagrama anterior, podemos armar siempre que:
a) El valor maximo de la muestra es 5;
c) El percentil de orden 75 es 4;
e) Todo falso.
b) El recorrido intercuartlico es 4;
d) Un valor atpico es 8;
16. (09-09-04) Si la media de una muestra de tama no 10 es 50, podemos asegurar que:
a) Cinco elementos de la muestra son mayores o iguales que 50 y cinco son menores o iguales que 50;
b) Al menos un valor de la muestra es menor o igual que 50;
c) El valor mas frecuente es 50;
d) Al menos un valor de la muestra es mayor o igual que 50;
e) Todo falso.
17. (06-07-05) A partir del siguiente diagrama de caja, podemos asegurar que:
17
15
13
11
9
7
5
3
1
16
14
12
10
8
6
4
2
e) Todo falso.
18. (06-07-05) Con los mismos datos de la cuestion anterior, podemos asegurar que:
a) El cuartil de orden 3 de la muestra es 8;
c) El mayor valor de la muestra es 16;
e) Todo falso.
b) El cuartil de orden 1 de la muestra es 5;
d) 16 es un valor atpico;
19. (06-07-05) Siguiendo con los datos de las dos cuestiones anteriores, se cumple que:
a) El rango o recorrido de la muestra es 10;
c) El rango o recorrido de la muestra es 14;
e) Todo falso.
b) El rango o recorrido de la muestra es 8;
d) El recorrido intercuartlico de la muestra es 3;
Las dos preguntas siguientes hacen referencia al siguiente enunciado: Para una muestra de tama no 6, se ha
obtenido la siguiente tabla de frecuencias relativas acumuladas:
x
i
1 2 4
F
i
1/6 2/3 1
20. (07-09-05) Si denotamos por x
6
a la media de la muestra y por Me a la mediana, podemos armar que:
a) x
6
= 2
5; b) Me = 2
5; c) x
6
= 2; d) Me = 2; e) Todo falso.
21. (07-09-05) El n umero de veces que se ha obtenido el valor 2 en esta muestra es:
a) 3; b) 1; c) 2; d) 4; e) Todo falso.
Las dos preguntas siguientes hacen referencia al siguiente enunciado: Los resultados de una encuesta para
estudiar el n umero entero de horas dedicadas al estudio durante una semana se recogen en el siguiente diagrama
de tallo y hojas.
0 8888
1 0000334455555
2 0000012455558
3 4
22. (13-02-06) Para el tama no muestral n y el rango R se tiene que:
a) n = 4; b) n = 35; c) R = 26; d) n = 33; e) Todo falso.
23. (13-02-06) Para la moda Mo y el rango R se tiene que:
a) Mo = 0; b) Mo = 20; c) R = 12; d) Mo = 15; e) Todo falso.
24. (13-02-06) Se ha representado la funcion de distribucion emprica de una muestra, mediante la curva
acumulativa o de distribucion siguiente:
-2 2 3 5
1
08
05
04
02
A partir de esa representacion podemos asegurar que:
a) El cuartil de orden 1 es -2;
b) La mediana es 05;
c) La media es 3;
d) No podemos asegurar nada ya que la gura no corresponde a una funcion de distribucion emprica, por no
ser escalonada;
e) Todo falso.
El siguiente diagrama de barras, se reere a las dos cuestiones siguientes:
25. (30-06-06) A partir del diagrama anterior, podemos armar que:
a) La media es 05; b) La media es 1; c) La mediana es 0; d) La mediana es 1; e) Todo falso.
26. (30-06-06) Siguiendo con el diagrama anterior:
a) El rango es 2;
d) El 2
o
cuartil es 0;
b) La moda es 0;
e) Todo falso.
c) El 1
er
cuartil es 0;
Los datos relativos a determinada muestra han sido representados en el siguiente histograma:
27. (07-09-06) Se trata de un histograma de frecuencias:
a) Relativas;
d) Acumuladas absolutas;
b) Absolutas;
e) Todo falso.
c) Acumuladas relativas;
28. (07-09-06) Siguiendo con el histograma anterior, el tama no muestral es:
a) 4; b) 10; c) 4/9; d) No se puede saber; e) Todo falso.
29. (07-09-06) Siguiendo con el histograma anterior, la mediana es:
a) 1
375; b) 1
5; c) 2; d) 3; e) Todo falso.
Las dos preguntas siguientes hacen referencia al siguiente experimento para investigar el tiempo de duracion,
en horas, de un componente electronico: Se colocan las partes en una celda de prueba y se utilizan durante
100 horas bajo condiciones de temperatura elevada. Se prueban siete componentes, uno de los cuales sigue
funcionando al cabo de las 100 horas; para los otros seis los tiempos de fallo fueron: 75, 63, 36, 51, 45 y 80.
30. (16-02-07) La mediana de estos siete tiempos de funcionamiento es:
a) 58; b) 63; c) 70; d) 200; e) Todo falso.
31. (16-02-07) El tiempo medio de funcionamiento de estos siete componentes:
a) 58; b) 63; c) 70; d) 200; e) Todo falso.
32. (22-06-07) Dada la muestra 3, 5, 6, 6, 7, 10, 12, se tiene que:
a) Su media es 6; b) Su mediana es 6; c) Su mediana es 7; d) Su media es 7; e) Todo falso.
33. (22-06-07) Dada la muestra 3, 5, 6, 6, 7, 10, 12, se tiene que:
a) Su primer cuartil es 6;
d) Su rango es 12;
b) Su tercer cuartil es 10;
e) Todo falso.
c) Su recorrido intercuartlico es 5;
34. (07-09-07) Los datos de resistencia a la tension (en psi) de una muestra de aleacion de aluminio-litio son
92, 120, 200 y 140. Con estos datos se obtiene que 1572 es el valor de la:
a) Varianza muestral;
d) Desviacion tpica muestral;
b) Cuasivarianza muestral;
e) Todo falso.
c) Cuasidesviacion tpica muestral;
35. (07-09-07) Los datos de resistencia a la tension (en psi) de una muestra de aleacion de aluminio-litio son
92, 120, 200 y 140. Con estos datos se obtiene que una mediana de la muestra es:
a) 130; b) 127; c) 135; d) 125; e) Todo falso.
36. (18-02-08) La distribucion de frecuencias relativas acumuladas para la variable n umero de asignaturas
aprobadas es:
x
i
6 7 8 9 10 11
F
i
0
2 0
35 0
6 0
8 0
95 1
De acuerdo con estos datos se tiene que el porcentaje de gente con mas de 6 asignaturas aprobadas y menos de
10 es:
a) 80 %; b) 60 %; c) 20 %; d) 15 %; e) Todo falso.
37. (18-02-08) De acuerdo con los datos de la pregunta anterior, y teniendo en cuenta que en la clase hay 50
alumnos, el n umero de ellos que tienen mas de 8 asignaturas aprobadas es:
a) 80; b) 60; c) 20; d) 15; e) Todo falso.
Las dos preguntas siguientes hacen referencia al siguiente enunciado:
Se ha anotado la temperatura de fabricacion de 200 piezas, obteniendose los resultados del diagrama de sectores
adjunto, en el que se representan las frecuencias relativas correspondientes a cada temperatura:
Temp:40C
50%
Temp:50C
30%
Temp:60C
20%
38. (26-06-08) Con dichos datos se obtiene que una mediana de la variable en estudio es:
a) Me = 30; b) Me = 45; c) Me = 150; d) Me = 60; e) Todo falso.
39. (26-06-08) Con dichos datos se obtiene que la varianza de la temperatura es exactamente:
a) 781; b) 783; c) 61; d) 613; e) Todo falso.
Las dos preguntas siguientes hacen referencia al siguiente enunciado: Se ha anotado la temperatura de fabricacion
de 200 piezas, obteniendose la siguiente tabla de frecuencias absolutas:
Temperatura (x
i
) 40 50 60
N
o
piezas (n
i
) 100 60 40
40. (05-09-08) Con dichos datos se obtiene que la temperatura media de esta muestra es:
a) 40; b) 47; c) 50; d) 60; e) Todo falso.
41. (05-09-08) Con dichos datos se obtiene que el tercer cuartil es:
a) 40; b) 47; c) 50; d) 60; e) Todo falso.
42. (02-07-09) El diagrama de caja es una representacion graca de un conjunto de datos que siempre
muestra:
a) La media y la desviacion tpica;
d) La mediana y la varianza;
b) La media y la varianza;
e) Todo falso.
c) La mediana y el 1
er
y 3
er
cuartil;
43. (02-07-09) El recorrido intercuartlico de una variable estadstica:
a) Puede ser igual al rango de los datos;
c) Puede ser menor que el rango de los datos;
e) Todo falso.
b) Puede ser mayor que el rango de los datos;
d) Debe ser menor que el rango de los datos;
44. (16-09-09) Si para una muestra se obtiene que la media muestral es x = 6, la mediana de dicha muestra
siempre es:
a) Mayor que 6; b) Menor que 6; c) Igual a 6; d) Distinta de 6; e) Todo falso.
45. (16-09-09) Dada la muestra 2,4,4,6,6,7,8, se tiene que:
a) Su mediana es 6;
d) Su tercer cuartil es 7;
b) Su primer cuartil es 4;
e) Su rango es 6.
c) Su segundo cuartil es 6;
N
o
Solucion N
o
Solucion N
o
Solucion N
o
Solucion N
o
Solucion
1. d) 2. b), c) 3. b), c) 4. c) 5. a), b), c), d)
6. b), c) 7. b) 8. a), d) 9. a) 10. b), d)
11. e) 12. b) 13. b), c), d) 14. d) 15. c), d)
16. b), d) 17. b) 18. a), b), c), d) 19. c), d) 20. a), d)
21. a) 22. c) 23. b), d) 24. d) 25. a), c)
26. a), b), c), d) 27. b) 28. e) 29. a) 30. b)
31. e) 32. b), d) 33. b), c) 34. a) 35. a), b), c), d)
36. b) 37. c) 38. b) 39. c) 40. b)
41. c) 42. c) 43. a), c) 44. e) 45. a), b), c), d), e)
Practica 1.1 de ordenador Tema 1, 57
TEMA 1.- INTRODUCCI
ON A LA ESTAD
ISTICA
DESCRIPTIVA. PR
ACTICA 1.1 DE ORDENADOR.

(Introduccion al Excel)
1.1. Introduccion de datos.
Excel cuenta con varios metodos para introducir datos: manualmente desde el teclado o recuperarlos de un
archivo de texto, base de datos o Internet.
1.1.1. Introduccion de datos desde el teclado.
Para introducir datos manualmente se suele comenzar por la celda de la esquina superior izquierda de la tabla.
Al elegir dicha celda, se activa y ya se puede escribir en ella el valor o texto que se desea poner. Para desplazarse
entre celdas, se presiona la tecla Tab (tabulador), se avanza con las echas del teclado o se pulsa Enter para
pasar a la siguiente la de la misma columna.
Ejemplo. La siguiente tabla muestra el promedio anual de venta de gasoil y gasolina de varias gasoline-
ras/franquicias de una cadena de tiendas. Hay tres columnas: la primera contiene el n umero de identicacion
de cada gasolinera; la segunda muestra las ventas de gasoil en cada estacion de servicio, y la tercera presenta
las ventas de gasolina.
Gasolinera
(millones de C)
Gasoil
(millones de C)
Gasolina
(millones de C)
1 3415 2211
2 3499 2500
3 3831 2899
4 3587 2488
5 3719 2111
6 3001 1281
7 4567 8712
8 4218 7056
9 3215 2508
Para introducir estos datos deben seguirse los siguientes pasos:
1. Haz clic en la celda A1 para activarla.
2. Escribe Gasolinera y luego presiona Tab.
3. Teclea Gasoil en la celda B1 y pulsa Tab.
4. Escribe Gasolina en la celda C1 y oprime Enter.
Excel avanza a la celda A2, con lo cual esta se activa.
5. Con la misma tecnica, escribe las siguientes dos las de la tabla que contienen la informacion de las dos
primeras gasolineras
1
. El aspecto de la hoja de calculo debe ser similar al siguiente:
1
Tengase en cuenta que el smbolo del separador decimal en la version espa nola de Excel es la coma: ,.
La funcion Rellenar.
Si se inserta una columna o la de valores que siguen alg un modelo secuencial (por ejemplo el codigo de
identicacion de un cuestionario), se puede ahorrar tiempo con la funcion Rellenar de Excel. Esta funcion
permite llenar un grupo de valores con una serie de n umeros o fechas. Tambien se puede usar para generar
columnas que contengan valores de datos como los siguientes:
1, 2, 3, 4, . . . , 9, 10
Ene, Feb, Mar, Abr, . . . , Nov, Dic
etcetera.
Ejemplo. Podemos aprovechar esto para introducir los n umeros que representan las estaciones de servicio (de
1 a 9):
1. Selecciona el rango A2:A3.
Observa la peque na caja negra de la esquina inferior derecha del doble borde alrededor del rango seleccio-
nado. Esto se llama controlador de relleno. Para crear una secuencia sencilla de n umeros, se arrastra
este controlador sobre un rango de celdas seleccionado.
2. Mueve el raton sobre el controlador hasta que el puntero del raton cambie de la forma a la nueva forma
. Haz clic y manten presionado el boton del raton.
3. Arrastra el controlador hacia abajo a la celda A10 y suelta el boton del raton.
Observa que, a medida que se arrastra el controlador hacia abajo, aparece una pantalla que muestra el
valor que se pondra en la celda activa si se suelta el boton del raton en ese punto.
El resultado de lo anterior puede verse en la gura siguiente:
Con los n umeros de gasolinera ya introducidos, se puede agregar el resto de las cantidades de ventas para
completar el conjunto de datos, siguiendo las siguientes instrucciones:
1. Selecciona el rango B4:C10.
2. Con B4 como celda activa, empieza a escribir los valores restantes.
Observa que cuando introduces datos en un rango seleccionado, al presionar la tecla Tab al nal del rango
se avanza a la siguiente la.
3. Haz clic en la celda A1 para desmarcar seleccion.
La hoja de calculo terminada debe aparecer como se muestra en la gura siguiente:
Insertar datos nuevos.
A veces se desea agregar nuevos datos a su conjunto. Vamos a ver como se pueden insertar nuevos datos a traves
del ejemplo de las gasolineras.
Ejemplo. Si obtenemos datos de ventas de una decima gasolinera:
Gasolinera
(millones de C)
Gasoil
(millones de C)
Gasolina
(millones de C)
0 35 2
Podramos simplemente a nadir esta informacion a la tabla ya creada, cubriendo el rango de celda A11:C11. Sin
embargo, para mantener el orden secuencial de los n umeros de gasolinera, sera mejor poner esta informacion
en el rango A2:C2 y luego bajar las otras gasolineras en la hoja de calculo. Se puede lograr esto con el comando
Insertar de Excel. Vamos a ver cuales seran los pasos a seguir:
1. Selecciona el rango de celda A2:C2.
2. Haz clic con el boton derecho del raton en el rango escogido y luego en Insertar desde el men u de seleccion.
3. Elige la opcion Desplazar celdas hacia abajo de la ventana Insertar celdas.
4. Haz clic en Aceptar.
Excel baja los valores de las celdas A2:C10 a A3:C11 e inserta una nueva la en blanco en el rango A2:C2.
5. Introduce los datos para la Gasolinera 0.
1.1.2. Importar datos desde archivos de Microsoft Excel.
La forma de abrir un archivo de Microsoft Excel (extension .xls) es la habitual de cualquier programa que
trabaje en entorno Windows. As pues, los pasos a seguir son:
1. Hacer clic en el boton Abrir , o bien Archivo Abrir.
2. Seleccionar el directorio donde se encuentre el archivo de interes.
3. Hacer doble clic sobre dicho archivo.
Ejemplo. Los datos relativos a nuestro ejemplo se encuentran en el chero gasolinas.xls, que puede ser
abierto realizando los pasos anteriormente descritos.
Una vez abierto un archivo y realizados los cambios oportunos, se pueden guardar dichos cambios sin mas que
seguir un proceso paralelo al anterior, pero seleccionando, en este caso, Archivo Guardar.
1.1.3. Importar datos desde archivos de texto.
Es muy frecuente crear datos mediante aplicaciones que no son Excel. En este caso, sera necesario pasar un
proceso llamado importar para llevarlos a Excel. El programa contiene numerosas herramientas para importar
datos. Nosotros vamos a ver como introducir datos de archivos de texto, por ser la fuente mas habitual en la
industria.
Un archivo de texto solo contiene texto y n umeros, sin ninguna de las formulas, gracas, fuentes especiales o
texto formateado que se encontrara en un libro de trabajo. Puesto que no contiene codigos de formato para
darle estructura, debe haber alguna forma de hacerlo comprensible al programa. Una forma de estructurar
archivos de texto es usar un delimitador, que es un smbolo, por lo general un espacio, coma o tabulador, que
separa una columna de datos de otra. El delimitador indica al programa que recupera el archivo de texto donde
empiezan y terminan las columnas. El texto separado por los delimitadores se denomina texto delimitado.
Ademas del texto delimitado, tambien es posible organizar datos con un archivo de ancho jo, en el que
cada columna empieza en el mismo lugar en el archivo. Por ejemplo, la primera columna comienza en el primer
espacio del archivo; la segunda en el decimo, y as sucesivamente.
Cuando Excel empieza a abrir un archivo de texto, automaticamente arranca el Asistente para importar
texto a n de establecer si los datos estan en un formato de ancho jo o en un formato delimitado y, si
esta delimitado, cual delimitador usar. Si es necesario, es posible intervenir y decirle como interpretar el archivo
de texto.
Ejemplo. Para ver como funciona esta opcion, vamos a importar datos de un archivo de texto. En este
ejemplo, consideraremos los datos recogidos por D. Donoho y E. Ramos (PRIMDATA: Data Sets for Use with
PRIM-H (DRAFT), FTP stat library at Carnegie Mellon University, 1982), relativos a 392 modelos de coches.
Los datos se han guardado en un archivo de texto, cars.txt, cuyas columnas representan, respectivamente,
Modelo: Nombre del modelo
MPG: Millas por galon
Cil N umero de cilindros del motor
DesMot: Desplazamiento del motor
CV: Potencia del motor
Peso: Peso del vehculo
Acel: Aceleracion del vehculo
Year: A no de fabricacion
Origen: Pas o zona de origen.
Para empezar a importar CARS.TXT en un libro de trabajo de Excel:
1. Haz clic en el boton Abrir .
2. Abre la carpeta que contiene los archivos de practicas, haz clic en la echa de lista descendiente del
recuadro Tipo de archivo y selecciona Archivos de texto.
3. Haz doble clic en CARS.TXT.
Excel muestra el Asistente para importar texto a n de ayudarnos a seleccionar el texto que vamos
a importar.
El Asistente ha determinado automaticamente que los datos del archivo CARS.TXT estan organizados
como un archivo de texto de ancho jo. Al mover las barras de desplazamiento horizontal y vertical, se
puede ver el conjunto de datos.
Una vez que hayas iniciado el Asistente para importar texto, podras denir donde empiezan y donde terminan
las diversas columnas de datos. Tambien podras hacer que el sistema se salte columnas completas.
Para denir las columnas que pretendes importar:
1. Haz clic en el boton Siguiente.
El asistente ha puesto bordes entre las distintas columnas del archivo de texto. Es posible eliminar un
borde al hacer doble clic sobre el, agregarlo al hacer clic en un espacio vaco de la ventana Vista previa
de los datos, o moverlo al arrastrarlo a otro lugar.
2. Haz clic en el boton Siguiente.
El tercer paso del Asistente permite denir formatos de columna y excluir columnas especcas de la
importacion. El formato predeterminado que aplica el Asistente es formato General a los datos.
3. Haz clic en el boton Finalizar para cerrar el asistente.
Excel importa los datos de los coches y los pone en un nuevo libro de trabajo.
Observa que los datos de la primera columna aparecen cortados. Esto sucede porque cuando Excel importa
un archivo, da formato al nuevo libro de trabajo con un ancho estandar de columna de alrededor de nueve
caracteres, cualquiera que sea el contenido de la columna.
Para dar formato a los anchos de columna para mostrar todos los datos:
1. Selecciona todas las celdas de la hoja de calculo.
2. Mueve el puntero del raton al borde de uno de los encabezados de columna hasta que el apuntador cambie
a y haz doble clic.
Excel cambia los anchos de columna para igualarlos con el ancho de la celda mas larga de cada columna.
A continuacion es conveniente que guardes el libro de trabajo.
3. Haz clic en Archivo Guardar como de la barra de men u de Excel.
4. Escribe CARS en el recuadro Nombre de archivo y selecciona Libro de Microsoft Excel del recuadro
Guardar como tipo.
5. Haz clic en el boton Guardar.
1.2. Formato de datos.
Una vez que se han introducido los datos, es posible modicar su formato, es decir, las fuentes y los estilos que
Excel aplica a la presentacion de los datos. Los formatos se aplican a texto o a n umeros.
Para tener acceso a las opciones de formato para determinadas celdas deben seguirse los siguientes pasos:
1. Seleccionar las celdas.
2. Hacer clic en el boton derecho del raton y seleccionar Formato de celdas.
El cuadro de dialogo contiene seis hojas llamadas: N umero, Alineacion, Fuente, Bordes, Tramas y
Proteger. Cada una maneja un aspecto de la apariencia o comportamiento de la celda en el libro de
trabajo.
3. Seleccionar las opciones deseadas y hacer clic en Aceptar para cerrar el cuadro de dialogo.
4. Hacer clic en cualquier otra celda para desactivar la seleccion de celdas.
1.3. Formulas y funciones.
Otra forma de introducir datos es por medio de formulas y funciones. Una formula siempre empieza con el
signo igual (=), seguido por un nombre de funcion, n umero, texto, secuencia o referencia de celda. La mayor
parte de las funciones contienen operadores matematicos como + o . En la siguiente tabla aparece una lista
de operadores matematicos.
Operador Descripcion
+ Adicion
Resta
Multiplicacion
/ Division
Exponencial
1.3.1. Insertar una formula sencilla.
Para ver como se introduce una formula, vamos a volver a considerar el ejemplo de las gasolineras.
Ejemplo. Para agregar una nueva columna a su conjunto de datos que muestre las ventas totales de combus-
tible (gasoil + gasolina) en cada gasolinera debemos seguir los siguientes pasos:
a) Escribe Combustible en la celda D1 y presiona Enter.
b) Teclea =B2+C2 en la celda D2 y pulsa Enter.
Observa que las celdas B2 y C2 contienen las ventas de gasoil y gasolina para la gasolinera 0. El valor
mostrado en D2 es 5933, que es la suma de estos dos valores.
En este punto puedes introducir formulas para las celdas restantes del conjunto de datos, pero es mas rapido
usar la funcion Rellenar de Excel para agregarlas.
c) Haz clic en la celda D2 para activar la celda.
d) Haz clic en el control de relleno y arrastrala hasta la celda D11. Suelta el boton del raton.
Excel inserta las formulas para las celdas en el rango D3:D11. As, la formula en la celda D11 es =B11+C11
para calcular el total de ventas para la Gasolinera 9.
1.3.2. Insertar una funcion de Excel.
En el ejemplo anterior se han sumado dos n umeros, pero que pasa si se quiere hallar el total de ventas de gasoil
y gasolina para las diez gasolineras? En ese caso es mejor usar una de las funciones integradas de Excel.
Excel cuenta con una biblioteca que contiene cientos de funciones que cubren la mayor parte de las necesidades
estadsticas y matematicas.
Una funcion esta compuesta por el nombre de la funcion y una lista de argumentos, que son los valores que
requiere la funcion. As, por ejemplo, para calcular la suma de un conjunto de celdas, se podra usar la funcion
SUMA. La sintaxis de esta funcion es:
=SUMA(n umero1, n umero2, . . . )
donde n umero1 y n umero 2 son n umeros o referencias de celda. La funcion SUMA permite agrupar n umeros de
referencia de celda. As, para calcular la suma de las celdas del rango B2:B11 se puede introducir la formula
=SUMA(B2:B11)
en una celda de la hoja de calculo.
Otra funcion muy util a lo largo del curso es la funcion CONTAR que nos calcula el n umero de datos (las
casillas en blanco no se consideran) dentro de las celdas especicadas. As pues, si tecleamos en una celda
=CONTAR(B2:B11) nos devolvera el resultado 10. Si uno de los datos desaparece, por ejemplo B4, au-
tomaticamente el resultado sera 9.
A un cuando se pueden insertar las funciones directamente, es mas facil usar la opcion Insertar Funcion de
Excel, en especial para funciones cuya sintaxis desconocemos. La opcion Insertar Funcion es una serie de
cuadros de dialogo que ayuda a escoger y construir una formula.
Ejemplo. Para ver la opcion en accion, vamos a utilizarla para calcular el total de ventas de gasoil y gasolina
en todas las gasolineras.
1. Escribe Total en la celda A12 y presiona Tab.
2. Haz clic en el boton Insertar Funcion de la barra de herramientas para abrir la ventana Insertar
Funcion.
3. Haz clic en Matematicas y trigonometricas del recuadro Seleccionar una Categora.
4. Arrastra hacia abajo y haz doble clic en SUMA desde el recuadro de lista Seleccionar una funcion.
A continuacion, Excel muestra un cuadro de dialogo con los argumentos para la funcion SUMA. El
programa ya se ha insertado la referencia de celda B2:B11 en el primer argumento, pero si no es la
referencia buscada, se puede escoger otra. Veamos como:
5. Haz clic en el boton Argumentos de funcion junto al argumento N umero1.
6. Arrastra el puntero del raton sobre el rango B2:B11.
7. Haz clic en el boton .
El rango de celda B2:B11 se ha insertado en el argumento N umero1 como antes.
En la celda B12 aparece el total de ventas de gasoil. Puedes sumar con facilidad el total de ventas en gasolina
y de todo el combustible, usando la misma tecnica de copiado empleada anteriormente:
1. Selecciona la celda B12.
2. Haz clic en el controlador de relleno y arrastralo a la celda D12.
3. Suelta el boton del raton.
En el rango B12:D12 aparecen las cantidades del total de ventas.
1.4. Referencias de celda.
Cuando Excel calculo el total de ventas para las columnas C y D, inserto las siguientes formulas en C12 y D12,
respectivamente:
=SUMA(C2:C11)
=SUMA(D2:D11)
Esto es debido a que el programa, de forma automatica, copia todo excepto la referencia de la celda B12 y, en
lugar de la referencia original B2:B11, desplaza la referencia de celda una y dos columnas a la derecha. En este
caso estamos utilizando referencias relativas, es decir, el programa identica un rango de celda en base a
su posicion respecto a la celda que contiene la formula. Una ventaja de usar referencias relativas, como hemos
visto, es que se puede llenar una la o columna con una formula y las referencias de celda de las nuevas formulas
se desplazaran con la celda.
Si se quiere que esto no ocurra, es decir, que la formula siempre apunte a una celda especca en una hoja de
calculo, es necesario utilizar una referencia absoluta. En este caso, la referencia de celda se ja de antemano
con signos de dolares. Por ejemplo, la formula
=SUMA($C$2:$C$11)
es una referencia absoluta al rango C2:C11. Si se copia esta formula en otras celdas, todava considerara C2:C11
y no se desplazara.
En las ultimas versiones de Excel el tipo de referencias, por defecto, de una celda viene compuesto, como hemos
visto por una letra que representa la columna y un n umero que representa la la (por ejemplo, A1). En versiones
anteriores, por defecto las celdas eran referenciadas por el n umero de lnea y de columna que ocupaban (por
ejemplo, L1C1). No obstante, en cualquier version de este programa se puede pasar de una sistema de referencia
al otro, sin mas que activar o no la opcion Estilo de referencia L1C1 de Herramientas Opciones
General.
1.5. Introducir nombres para las variables.
Otra forma de referirse a una celda en un libro de trabajo es con un nombre de rango; esto es, el apelativo
que se da a celdas o rangos de celdas especcas. Por ejemplo, se puede denir el nombre de rango Gasoil a
n de referirse a las celdas B2:B11 de una hoja de calculo. Una vez hecho esto, para calcular el total de ventas
de gasoil se puede usar la formula
=SUMA(B2:B11)
o
=SUMA(Gasoil).
Sera mas facil analizar los datos en su conjunto de datos si se han denido nombres de rango para las columnas.
La forma mas sencilla de crear un conjunto de nombres de rango es con el comando Crear Nombres de Excel.
Ejemplo. Vamos a ver como se hara en el ejemplo de las gasolineras, creando un nombre de rango para la
columna que contiene la identicacion de cada gasolinera.
1. Selecciona el rango A1:D11 (no el rango A1:D12!!!).
2. Haz clic en Insertar Nombre Crear, con lo que se abre el cuadro de dialogo Crear Nombres.
Excel creara nombres de rango con base al lugar donde se hayan introducido las etiquetas de los datos.
En este caso, usaremos las que se introdujeron en la la superior como base para los nombres de rango.
3. Selecciona la casilla Fila Superior.
Se han creado cuatro nombres de rango: Gasolinera, Gasoil, Gasolina y Combustible.
Una vez hecho esto, si nos ponemos en la celda E2 y tecleamos
=Gasoil+Gasolina
obtenemos el mismo resultado que si hubiesemos calculado B2+C2. Desplazando esta celda hasta E11 obtenemos
de nuevo las ventas totales de combustible.
1.6. Modulos complementarios de Excel.
La capacidad de Excel se puede ampliar mediante programas especiales llamados modulos. Estos modulos se
agregan a las caractersticas especiales de Excel y casi siempre se ven como parte del programa. Con Excel
se suministran varios modulos que permiten realizar ciertas operaciones adicionales. Para utilizarlos hay que
guardar sus archivos en un directorio del ordenador y luego decirle a Excel donde hallarlos.
1.6.1. Herramientas para analisis.
Excel incluye muchas funciones estadsticas, matematicas y de ingeniera. Algunas de las funciones estadsticas
estan integradas y otras estan disponibles despues de instalar las Herramientas para analisis.
Para tener acceso a estas herramientas hay que hacer clic en Analisis de datos en el men u Herramientas. Si el
comando Analisis de datos no esta disponible, hay que cargar el programa de complementos de Herramientas
para analisis, siguiendo los siguientes pasos:
1. Hacer clic en Herramientas Complementos.
2. En Complementos disponibles seleccionar Herramientas para analisis y Herramientas para
analisis - VBA.
3. Aceptar.
En este punto, Excel puede pedir el CD de instalacion; si es as, insertar el CD en la unidad de CD-ROM
y seguir las instrucciones.
Una vez instalado el modulo de Herramientas para analisis, es posible tener acceso al mismo desde Excel. A
diferencia de lo que veremos que ocurre con StatPlus, el modulo de Herramientas para analisis no agrega un
nuevo elemento de men u a la barra de men u de Excel, sino que a nade un comando al men u de Herramientas.
1.6.2. StatPlus
Dicho modulo no viene por defecto en el software de instalacion del programa pero, a pesar de ser considerado
por muchos el mejor modulo de estadstica para Excel, es de distribucion gratuita y puede descargarse en:
http://www.duxbury.com/cgi-brookscole/
course products bc.pl?d=M20b&product isbn issn=0534407145&discipline number=17
Una vez descargado debe ser copiado en un directorio del ordenador.
En las salas de ordenadores, estos pasos ya han sido dados, previamente, y los cheros ya estan copiados en
cada uno de los ordenadores.
Para instalar dicho modulo, al no ser uno de los que vienen por defecto en Excel, primero hay que cargarlo,
siguiendo los pasos que se detallan a continuacion:
1. Hacer clic en Herramientas Complementos del men u Excel.
2. En Complementos disponibles aparecen todos los modulos disponibles. Si el modulo no esta disponible
(como es el caso con StatPlus), es necesario activarlo. Para ello, se hace clic en Examinar.
3. Una vez localizada la carpeta en la que se ha instalado StatPlus, se abre dicha carpeta y se selecciona
StatPlusV2.xla. A continuacion se hace clic en Aceptar.
4. Ahora aparece StatPlus Version 2.5 en el cuadro de dialogo Complementos. Si no esta activado, se hace
clic en la casilla y luego Aceptar.
Con esto, un nuevo elemento, StatPlus, debe haber sido agregado al men u de Excel. Los comandos de men u ofre-
cidos por StatPlus se iran estudiando a lo largo del curso, puesto que permitiran un analisis de los datos mucho
mas rapido y sencillo.
TEMA 1.- INTRODUCCI
ON A LA ESTAD
ISTICA
DESCRIPTIVA. PR

(Frecuencias y gracos)
A lo largo de esta practica vamos a trabajar con el chero cuestionario.xls. Abre dicho chero.
1.1. Crear una tabla de frecuencias.
Excel no tiene un comando integrado para crear esa tabla de frecuencias, pero se puede usar la suministrada
con el modulo de StatPlus. Si no lo tienes instalado de la practica anterior, recuerda que los pasos a seguir son:
1. Hacer clic en Herramientas Complementos del men u Excel.
2. En Complementos disponibles aparecen todos los modulos disponibles. Si el modulo no esta disponible
(como es el caso con StatPlus), es necesario activarlo. Para ello, se hace clic en Examinar.
3. Una vez abierta la carpeta donde se encuentre el chero de instalacion, se selecciona StatPlusV25.xla.
A continuacion se hace clic en Aceptar.
4. Ahora aparece StatPlus Version 2.5 en el cuadro de dialogo Complementos. Si no esta activado, se hace
clic en la casilla y luego Aceptar.
Para crear una tabla de frecuencias de la variable Edad:
1. Hacemos clic en StatPlus Descriptive Statistics Frequency Tables ... (Tabla de frecuencias)
del men u de Excel.
2. Hacemos clic en el boton Data Values (Valores de datos), luego en el boton Use Range (Usar
nombres de rango). Aqu seleccionar Edad y a continuacion el boton OK (Aceptar).
El comando Tabla de frecuencias da tres opciones para organizar la tabla. Con la opcion valores discretos
se presenta una la para cada una de las distintas modalidades o valores de la variable. Nosotros, por
defecto, no modicaremos esta seleccion.
3. Hacemos clic en el boton Output (Salida), y luego en el boton de opcion New Worksheet (Nueva
hoja de calculo) y escribimos Frecuencias en el recuadro de nombre para la nueva hoja de trabajo.
Pinchamos en OK.
4. Hacemos clic en OK para generar la tabla de frecuencias.
La tabla de frecuencias contiene cinco columnas. La primera, Edad, es una lista en orden ascendente de las
distintas edades de los alumnos encuestados. La segunda, Freq, presenta las frecuencias absolutas (n
i
) de cada
una de las modalidades. La columna siguiente, Cum. Freq., presenta las frecuencias absolutas acumuladas (N
i
).
En la cuarta columna, %, pueden verse las frecuencias relativas en tanto por ciento (100 f
i
) y en la ultima
columna, Cum. %, las frecuencias relativas acumuladas en tanto por ciento (100 F
i
).
Si en la opcion By hubiesemos seleccionado la variable Sexo, obtendramos una tabla de frecuencias para los
hombres, otra para las mujeres y otra para el conjunto de la muestra.
1.2. Representaciones gracas.
1.2.1. Diagrama de barras.
Para obtener el diagrama de barras que represente a la variable Edad debemos realizar los siguientes pasos:
1. Obtener la tabla de frecuencias siguiendo los pasos detallados en la seccion anterior y seleccionarla.
2. Pinchar en Insertar Graco del men u de Excel.
3. En tipo de graco seleccionar Columnas y pinchar en Siguiente.
4. Seleccionar Serie y quitar todas las series salvo la de las frecuencias que queramos representar (por
ejemplo, Freq.). En Rotulos del eje de categoras (X): introducir las coordenadas de las distintas
modalidades de la variable Edad. A continuacion hacer clic en Siguiente.
5. Hacer clic en Siguiente y despues en Finalizar.
1.2.2. Diagrama de sectores.
Para obtener el diagrama de sectores de la distribucion de frecuencias anterior, los pasos a seguir son muy
similares:
1. Una vez seleccionada la tabla de frecuencias, pinchar en Insertar Graco del men u de Excel.
2. En tipo de graco seleccionar Circular y pinchar en Siguiente.
3. Seleccionar Serie y quitar todas las series salvo la de las frecuencias que queramos representar (por
ejemplo, Freq.). En Rotulos del eje de categoras (X): introducir las coordenadas de las distintas
modalidades de la variable Edad. A continuacion hacer clic en Siguiente.
4. Hacer clic en Siguiente y despues en Finalizar.
1.2.3. Histograma.
Para crear un histograma de la variable Estudio (Horas semanales de estudio):
1. Regresamos al conjunto de datos de CUESTIONARIO (hoja Datos del libro de trabajo).
2. Hacemos clic en StatPlus Single Variable Charts Histograms ... (Histogramas).
3. Hacemos clic en Data Values, Use Range, seleccionamos el rango Estudio y pinchamos en OK.
4. Elegimos el tipo de frecuencias (absolutas, relativas, absolutas acumuladas o relativas acumuladas) que
queremos representar. En este ejemplo elegimos Percentages (Freq. relativas).
5. Hacemos clic en Output, y en la casilla relativa a As a new chart sheet escribimos Histograma.
6. Hacemos clic en OK y de nuevo en OK.
1.2.4. Diagrama de tallo y hojas.
Para crear un diagrama de tallo y hojas para la variable Estudio (Horas semanales de estudio):
1. Nos situamos en la hoja con los datos del CUESTIONARIO (hoja Datos del libro de trabajo).
2. Hacemos clic en StatPlus Single Variable Charts Stem and Leaf ... (Tallo y Hoja).
3. Comprobamos que esta seleccionado el boton de opcion Values in separate columns.
4. Hacemos clic en el boton Data Values, pinchamos en Use Range, seleccionamos Estudio de la lista de
nombres de rango y salimos de esta ventana haciendo clic en OK.
5. Hacemos clic en el boton Output, elegimos la opcion New Worksheet para que realice en graco en
una nueva hoja. Escribimos Tallo y Hojas y hacemos clic en OK.
6. Obtenemos el graco si pinchamos en OK en la ventana Create Stem and Leaf Plots.
1.2.5. Diagrama de caja.
Para crear un diagrama de caja para la variable Estudio (Horas semanales de estudio):
1. Nos situamos en la hoja con los datos del CUESTIONARIO (hoja Datos del libro de trabajo).
2. Hacemos clic en StatPlus Single Variable Charts Boxplots ....
4. Hacemos clic en el boton Data Values, pinchamos en Use Range, seleccionamos Estudio de la lista de
nombres de rango y salimos de esta ventana haciendo clic en OK.
5. Hacemos clic en el boton Output, elegimos la opcion As a new chart sheet para que realice en graco
en una nueva hoja. Escribimos Caja y hacemos clic en OK.
6. Obtenemos el graco si pinchamos en OK en la ventana Create Boxplots.
Si queremos comparar dos grupos, por ejemplo las horas de estudio de las mujeres y los hombres, debemos
seleccionar Use columns of category levels en lugar de Values in separate columns y seleccionar la
variable Sexo en Categories.
1.2.6. Diagrama de Pareto.
Los diagramas de Pareto son gracos muy utilizados en Control de Calidad, y por eso se encuentran en el men u de
gracos de Control de Calidad del StatPlus, en lugar de en el men u de Gracos para Variables unidimensionales.
Ejemplo. En un proceso de fabricacion de paquetes de cereales para desayuno, se controlan los pesos de 120
paquetes obtenidos de 6 maquinas distintas. Los datos se encuentran en el chero cereal.xls. Un llenado se
considera defectuoso si es superior a 17.
Para crear un diagrama de Pareto para los datos del ejemplo anterior.
1. Abrimos el chero cereal.xls.
2. Hacemos clic en StatPlus QC Charts (Gracos de Control de Calidad) Pareto Chart ...
(Diagrama de Pareto).
4. Hacemos clic en el boton Data Values, pinchamos en Use Range, seleccionamos las 6 maquinas de la
lista de nombres de rango y salimos de esta ventana haciendo clic en OK.
5. Seleccionamos Greater than (Mayor que) en Defects occur where the data value is:.
6. Escribimos 17 en la la siguiente.
7. Hacemos clic en el boton Output, elegimos la opcion As a New Chart Sheet para que realice el graco
en una nueva hoja. Escribimos Pareto y hacemos clic en OK.
8. Obtenemos el graco si pinchamos en OK en la ventana Create a Pareto Chart.
TEMA 1.- INTRODUCCI
ON A LA ESTAD
ISTICA
DESCRIPTIVA. PR

(Medidas de centralizacion y dispersion)
1.1. Medidas de centralizacion, posicion y dispersion.
Si pinchamos en StatPlus Descriptive Statistics Univariate Statistics ... (Estadstica univariada)
se abre una ventana con cinco hojas de dialogo: General, Summary, Variability, Distribution y Analysis.
General. La primera de ellas, permite obtener todas las medidas asociadas a una variable seleccionada,
es decir, hace un estudio exhaustivo de sus principales caractersticas.
Summary. Permite obtener, entre otras, el tama no de la muestra (Count), la media (Average), la
mediana (Median) y la moda (Mode) de la variable en estudio.
Variability. Permite obtener la mayora de las medidas de dispersion: recorrido o rango (Range), cua-
sidesviacion tpica (Std. Deviation) y cuasivarianza (Variance), as como el coeciente de asimetra
(Skewness) y curtosis (Kurtosis).
Distribution. Permite obtener los cuartiles, algunos percentiles de especial interes y el recorrido inter-
cuartlico.
p
5 100 /
p
95 100 /
p
75 100 /
p
25 100 /
Me
p
99 100 /
p -p
75 100 / 25 100 /
RI=
Analysis. Permite hacer contrastes de hipotesis para la media y la mediana. No obstante esta materia
no sera estudiada hasta el tema 9, con lo cual no sera objeto de esta practica.
Ejemplo. Como ejemplo de utilizacion de lo anterior, vamos a considerar la variable APROBADAS (n
o
de
asignaturas aprobadas en Ingeniera Industrial) del chero cuestionario.xls y vamos a ir respondiendo a las
siguientes cuestiones:
a) Cual es el n umero medio de asignaturas aprobadas?
b) El 50 % de los alumnos tienen aprobadas x asignaturas o menos, cuanto vale x?
c) Cual es el n umero de asignaturas aprobadas mas habitual entre los alumnos?
d) Obtener la cuasivarianza y la varianza del n umero de asignaturas aprobadas.
e) El 25 % de los alumnos tienen aprobadas x asignaturas o menos, cuanto vale x?
f) El 5 % de los alumnos tienen aprobadas x asignaturas o mas, cuanto vale x?
g) Cual es el n umero medio de asignaturas aprobadas por las mujeres?, y por los hombres?
h) Basandote en la cuasivarianza, cual de los dos grupos esta mas disperso?
En el apartado a) nos piden la media de la variable, en el b) la mediana y en el c) la moda. Para responder
al apartado d) podemos obtener directamente el valor de la cuasivarianza de las salidas del procedimiento y
transformar este valor de forma adecuada (varianza =
n1
n
cuasivarianza, donde n denota el tama no muestral)
para conseguir la varianza. En el apartado e) nos estan pidiendo el valor del primer cuartil (p
1/4
p
25/100
) y en
el f) el valor del percentil 95 (p
95/100
). En el apartado g) nos piden la media de la variable para el grupo de las
mujeres y para el grupo de los hombres, separadamente. Por ultimo, en el apartado h) nos piden que digamos
cual de los dos grupos tiene una cuasivarianza mayor.
Para resolver estos apartados realizamos el siguiente proceso:
Vamos a StatPlus Descriptive Statistics Univariate Statistics ....
En la hoja General no se nalamos nada, pues vamos a ir particularizando para obtener solo aquellas cosas
que necesitamos.
En la hoja Summary se nalamos Average, Median y Mode, para obtener media, mediana y moda.
Ademas, como seg un vimos para calcular la varianza necesitamos conocer el tama no muestral n, marcamos
tambien la opcion Count que nos proporcionara dicho valor.
En la hoja Variability seleccionamos Std. Deviation y Variance, para obtener la cuasidesviacion tpica
y la cuasivarianza.
En Distribution seleccionamos 25th Percentile y 95th Percentile, para obtener el primer cuartil y
el percentil 95.
En Analysis no se nalamos nada.
Los pasos anteriores aparecen reejados en las siguientes guras:
A continuacion,
Pinchamos en Input, se nalamos Use Range y dentro de las variables que aparecen listadas, seleccionamos
APROBADAS y hacemos clic en OK.
Pinchamos en Output, se nalamos New Worksheet y escribimos un nombre para la nueva hoja con los
resultados, por ejemplo Medidas. Una vez hecho esto, hacemos clic en OK para volver al men u principal.
En By seleccionamos Use a Range Name. De las variables posibles elegimos SEXO y pulsamos OK.
As, ademas de los resultados globales para toda la muestra, nos dara los valores de estas medidas tanto
para el grupo de los hombres, como para el grupo de las mujeres, pudiendo as responder al apartado g).
Los pasos anteriores aparecen reejados en las siguientes guras:
Una vez en el men u principal, volvemos a pulsar OK para obtener la hoja de resultados.
Lo primero que podemos observar es que muchos resultados aparecen redondeados a n umeros enteros.

Esta es
la opcion por defecto del programa, pero no la mas satisfactoria desde el punto de vista del analisis estadstico.
Para poner todos los resultados con dos decimales, por ejemplo, recordemos de la primera practica que tenemos
que seleccionar las casillas con datos (en este caso B4:D11). Una vez hecho esto, pinchamos sobre ellas con el
boton derecho del raton y elegimos la opcion Formato de celdas.... En la ventana N umero, seleccionamos
la Categora: General. Si pinchamos en Aceptar, volvemos a visualizar la ventana de resultados, pero ahora
estos aparecen con decimales en aquellos casos en los que realmente no sean n umeros enteros.
Por ultimo, recordemos que nos pedan calcular no solo la cuasivarianza, que es el valor que aqu sale en la
posicion D9, sino tambien la varianza. Para ello nos colocamos en una celda vaca cualquiera, por ejemplo E9
y tecleamos =(D4-1)/D4*D9, con lo que obtenemos el valor de la varianza.
APUNTES DE TEOR
IA.
2.1. Experimento aleatorio.
En la naturaleza hay algunos fenomenos que se desarrollan de acuerdo al siguiente esquema (determinista):
dado un conjunto K de circunstancias, necesariamente se produce un cierto suceso A. Pero, por otra parte se
encuentran tambien en la naturaleza y en la vida diaria, innumerables fenomenos que no se pueden representar
por semejantes esquemas. Se les puede describir como sigue: habiendose dado un conjunto K de circunstancias, el
suceso A puede ocurrir, pero tambien puede no ocurrir. Las pruebas que dan lugar a tales sucesos se denominan
experimentos aleatorios (e.a.) o estocasticos.
Denicion 2.1.1 Experimento determinista: Al repetirlo en analogas condiciones produce siempre el
mismo resultado.
Ejemplo 2.1.1
Tirar una piedra y medir su aceleracion en el vaco.
Observar el resultado obtenido al mezclar un acido con una base.
Denicion 2.1.2 Experimento aleatorio (e.a.): Proceso que consiste en hacer que algo ocurra, o bien en
observar que algo ocurre bajo ciertas circunstancias, conduciendo a un resultado impredecible de antemano.
Los experimentos aleatorios verican:
Son conocidos de antemano todos los resultados posibles.
El resultado de una realizacion es impredecible.
El experimento puede repetirse en las mismas condiciones tantas veces como se quiera.
En este tema trabajaremos siempre con EXPERIMENTOS ALEATORIOS y denimos:
Denicion 2.1.3 Espacio muestral de un experimento aleatorio es el conjunto de todos los posibles resul-
tados lo denotaremos por .
A cada uno de los subconjuntos de se le llama suceso aleatorio o estocastico.
Tipos:
Suceso elemental: Cada uno de los posibles resultados (son los subconjuntos de un elemento).
Suceso seguro: es el formado por todos los resultados posibles (es el propio conjunto ).
Suceso contrario de A: es aquel que ocurre si y solo si no se presenta A y se denota por A.
Suceso imposible: es el contrario al suceso seguro y lo denotamos por .
Se dice que un suceso Ase verica, cuando al realizar un experimento aleatorio obtenemos uno de los resultados
que forman A.
A pesar de la interpretacion que tiene el espacio muestral, no es mas que un conjunto abstracto de elementos,
por lo que el lenguaje, los conceptos y propiedades de la teora de conjuntos constituyen un contexto natural
en el que desarrollar el Calculo de Probabilidades.
OPERACIONES CON SUCESOS
Union: A B es el suceso que se verica cuando se verica A o se verica B.
Interseccion: A B es el suceso que se verica cuando se verican A y B simultaneamente.
Diferencia de sucesos: AB es el suceso que se verica cuando se verica A pero no B.
Denicion 2.1.4 Se dice que dos sucesos A y B son incompatibles si A B = .
PROPIEDADES DE LAS OPERACIONES
UNI
ON INTERSECCI
ON
1. Asociativa (A B) C = A (B C) (A B) C = A (B C)
2. Conmutativa A B = B A A B = B A
3. Idempotente A A = A A A = A
4. Simplicativa A (B A) = A A (B A) = A
5. Distributiva A (B C) = (A B) (A C) A (B C) = (A B) (A C)
6. El suceso contrario de A verica A A = , A A = y A = A
LEYES DE MORGAN
A B = A B El complementario de la union es la interseccion de los complementarios.
A B = A B El complementario de la interseccion es la union de los complementarios.
Ejemplo 2.1.2 Lanzar un dado y anotar el resultado de la cara superior.
= {1, 2, 3, 4, 5, 6}.
Sucesos elementales: cada posible resultado. Son seis sucesos: {1}, {2}, {3}, {4}, {5}, {6}.
Suceso seguro: sale un n umero natural entre 1 y 6 = {1, 2, 3, 4, 5, 6}.
Suceso imposible: no sale ning un n umero entre 1 e 6 = .
Ejemplos de sucesos: A = sale un n umero par = {2, 4, 6}; B = A = no sale un n umero par = {1, 3, 5};
C = sale n umero primo = {1, 2, 3, 5}; D = sale m ultiplo de 3 = {3, 6}.
Podemos escribir todos los posibles sucesos:
{1}, {2}, {3}, {4}, {5}, {6},
{1, 2}, {1, 3}, {1, 4}, {1, 5}, {1, 6}, {2, 3}, {2, 4}, {2, 5}, {2, 6}, {3, 4}, {3, 5}, {3, 6}, {4, 5}, {4, 6}, {5, 6}
{1, 2, 3}, {1, 2, 4}, {1, 2, 5}, {1, 2, 6}, {1, 3, 4}, {1, 3, 5}, {1, 3, 6}, {1, 4, 5}, {1, 4, 6}, {1, 5, 6},
{2, 3, 4}, {2, 3, 5}, {2, 3, 6}, {2, 4, 5}, {2, 4, 6}, {2, 5, 6}, {3, 4, 5}, {3, 4, 6}, {3, 5, 6}, {4, 5, 6},
{1, 2, 3, 4}, {1, 2, 3, 5}, {1, 2, 3, 6}, {1, 2, 4, 5}, {1, 2, 4, 6}, {1, 2, 5, 6}, {1, 3, 4, 5}, {1, 3, 4, 6},
{1, 3, 5, 6} {1, 4, 5, 6}{2, 3, 4, 5}, {2, 3, 4, 6}, {2, 3, 5, 6}, {2, 4, 5, 6}, {3, 4, 5, 6},
{1, 2, 3, 4, 5}, {1, 2, 3, 4, 6}, {1, 2, 3, 5, 6}, {1, 2, 4, 5, 6}, {1, 3, 4, 5, 6}, {2, 3, 4, 5, 6}, {1, 2, 3, 4, 5, 6}, .
Operaciones:
A B = sale par o no sale par = {1, 2, 3, 4, 5, 6}
A B = sale par y no sale par =
A C = sale par y primo = {2}
AD = sale par pero no m ultiplo de tres = {2, 4}
Sea A el conjunto de las partes de , es decir, el conjunto de todos los subconjuntos de . En principio, para
cualquier elemento de A, es decir, para cualquier subconjunto del espacio muestral tendremos asociada una
cierta inseguridad sobre su realizacion, por lo que trataremos de asignarle un n umero entre 0 y 1 como medida
de su incertidumbre, midiendose esta mediante la probabilidad P.
2.2. Probabilidad.
Concepto clasico.
En sus inicios, el Calculo de Probabilidades estuvo ntimamente ligado a los juegos de azar. Esta relacion
sugirio la denicion clasica:
Denicion 2.2.1 La probabilidad de un suceso A, viene dada por el cociente entre el n umero de casos favorables
al suceso A y el n umero de casos posibles, es decir:
P(A) =
n umeros de casos favorables a A
n umero de casos posibles
Esta denicion enunciada por Laplace, supone que todos los sucesos elementales de un mismo experimento
aleatorio nito han de tener la misma probabilidad.
As, en el ejemplo anterior, la probabilidad del suceso A = sale un n umero par = {2, 4, 6}, sera:
P(A) =
3
6
=
1
2
.
La denicion de Laplace presenta algunos inconvenientes:
i) Se suponen los sucesos elementales igualmente probables.
ii) No es operativa si el e.a. tiene innitos resultados posibles.
Concepto frecuentista.
Empricamente se comprobo que la frecuencia relativa de un suceso tiende a estabilizarse cuando el n umero de
repeticiones del e.a. aumenta. Surge, as el concepto frecuentista de probabilidad como un n umero al que
converge su frecuencia relativa cuando el n umero de repeticiones tiende a innito, es decir, si denotamos por
f
n
(A) la frecuencia relativa de A en n repeticiones del e.a., entonces:
P(A) = lm
n
f
n
(A)
Figura 2.3: En la gura se observa como a medida que el n
o
de ensayos en una experiencia dada la frecuencia
(fr) tiende a estabilizarse en un valor P teorico. Pero tambien se ve que por esa misma uctuacion en un n
o
determinado de ensayos (a) la frecuencia (fr) coincide con P, pero en un n
o
mayor de ensayos (b) la frecuencia
(fr) se aparta de ese valor verdadero.
El inconveniente de esta denicion radica en que al no poder repetir la experiencia innitas veces, la probabilidad
de un suceso ha de ser aproximada por su frecuencia relativa para un n sucientemente grande, pero cuan
grande debe de ser n?
Concepto subjetivo
Se basa en la idea de que la probabilidad que una persona da a un suceso debe depender de su juicio y experiencia
personal, pudiendo dar dos personas distintas probabilidades diferentes a un mismo suceso.
Estas ideas pueden formalizarse, y si las opiniones de una persona satisfacen ciertas relaciones de consistencia,
puede llegarse a denir una probabilidad para los sucesos.
El principal problema a que da lugar esta denicion es, como antes dijimos, que dos personas diferentes pueden
dar probabilidades diferentes a un mismo suceso.
Denicion axiomatica de probabilidad
Los anteriores conceptos de lo que debera ser la probabilidad de un suceso, llevaron a Kolmogorov a dar una
denicion axiomatica de probabilidad. Es decir, a introducir rigor matematico en el concepto de probabilidad,
de forma que se pudiera desarrollar una teora solida sobre el concepto denido.
Denicion 2.2.2 As, llamaremos probabilidad a una aplicacion P : A [0, 1] tal que:
Axioma 1: Para todo suceso A de A sea P(A) 0.
Axioma 2: Sea P() = 1.
Axioma 3: Para toda coleccion nita o innita numerable de sucesos incompatibles dos a dos, {A
i
} con
A
i
A
j
= , para todo i = j debe ser:
P
_
i=1
A
i
_
=
i=1
P(A
i
).
Observese que esta denicion no dice como asignar las probabilidades ni siquiera a los sucesos elementales.
Solo dice que cualquier asignacion que hagamos debe vericar estos tres axiomas para que pueda llamarse
probabilidad.
CONSECUENCIAS DE LOS AXIOMAS
Toda probabilidad cumple una serie de propiedades, las cuales se obtienen como consecuencia de los axiomas
que debe de cumplir. A continuacion vamos a demostrar las mas importantes:
1
a
La probabilidad del complementario de un suceso A es uno menos la probabilidad de A:
P(A) = 1 P(A).
En efecto: Aplicando primero el axioma 2 y luego el axioma 3 de la aditividad para el caso nito, sera:
P(A) +P(A) = P(A A) = P() = 1.
De donde se obtiene la propiedad propuesta.
2
a
Si dos sucesos son tales que A B, entonces P(A) P(B).
En efecto: B se puede poner de la forma B = (B A) (B A) con lo que, por la aditividad nita de la
probabilidad, sera: P(B) = P(A) + P(B A) y la propiedad enunciada se tendra como consecuencia de
ser P(B A) 0 por el axioma 1.
3
a
La probabilidad de todo suceso A es un n umero entre 0 y 1: 0 P(A) 1.
En efecto: De hecho, el que sea mayor que cero es una de las exigencias requeridas para que sea proba-
bilidad (axioma l).
El que sea menor que 1 se obtiene de la propiedad anterior observando que todo suceso A esta contenido
en el suceso seguro, A .
4
a
La probabilidad del suceso imposible es 0: P() = 0.
En efecto: Teniendo en cuenta que = , entonces P() = P() = 1 P() = 1 1 = 0.
5
a
Si dos sucesos no son incompatibles, la probabilidad de su union debe calcularse por la
siguiente regla: P(A B) = P(A) +P(B) P(A B).
En efecto: El suceso B se puede escribir como union de sucesos disjuntos de la forma,
B = B = B (A A) = (A B) (A B). (2.2.1)
Como (A B) (A B) = , se tiene que
P(B) = P[(A B) A B)] = P(A B) +P(A B). (2.2.2)
Por otra parte A B = A (B A) = A (B A), con A (B A) = , lo que implica que:
P(A B) = P(A) +P(B A) (2.2.3)
y de (2.2.2) y (2.2.3) se obtiene el resultado (2.2.1).
6
a
Dados dos sucesos cualesquiera A y B, se tiene que: P(B) = P(A B) +P(A B).
En efecto: Como ya comentamos al demostrar la segunda propiedad y puede verse en el graco anterior, B
se puede poner de la forma B = (BA)(BA) = (BA)(BA). As pues, P(B) = P[(BA)(BA)].
Ahora bien, como ambos sucesos son disjuntos, aplicando el tercer axioma de probabilidad se tiene que
P(B) = P(B A) +P(B A), tal como queramos demostrar.
Las siguientes propiedades tambien son consecuencia de los axiomas aunque no las demostraremos:
7
a
a) Si A
1
, A
2
, . . . , A
n
, . . . es una sucesion no decreciente de sucesos (A
k
A
k+1
, k = 1, 2, . . .) , entonces:
P
_
lm
n
A
n
_
= P
_
i=1
A
i
_
= lm
n
P(A
n
).
b) Si A
1
, A
2
, . . . , A
n
, . . . es una sucesion no creciente de sucesos (A
k
A
k+1
, k = 1, 2, . . .) , entonces:
P
_
lm
n
A
n
_
= P
_
i=1
A
i
_
= lm
n
P(A
n
).
La tripleta (, A, P) recibe el nombre de espacio probabilstico.
2.3. Asignacion de Probabilidad.
Por las propiedades demostradas en la seccion anterior, es suciente conocer la probabilidad de los sucesos
elementales, ya que, entonces, se podra determinar la de cualquier otro suceso.
As, en el Ejemplo 2.1.2 (pag. 76) del lanzamiento de un dado, si la probabilidad de obtener un 1 es, p
1
, la de
un 3, p
2
, y la de un 5, p
3
, la del suceso obtener un n umero impar, el cual corresponde a B en el conjunto de los
sucesos, sera, por el axioma 3, p
1
+p
2
+p
3
.
Es decir, el problema radica en asignar una probabilidad a los sucesos elementales: asignar un n umero entre 0
y 1 a cada uno de los sucesos elementales, de tal forma que su suma sea 1.
En principio, cualquier asignacion que cumpla los tres axiomas mencionados en la denicion de probabilidad
es valida. No obstante, el proposito del Calculo de Probabilidades, como soporte de la Estadstica, es el de
construir un esquema matematico que reeje de la forma mas exacta posible el fenomeno aleatorio real que
estemos estudiando, por lo que la asignacion de probabilidad que elijamos debe ser lo mas ajustada posible a la
realidad que estamos observando.
As, en el Ejemplo 2.1.2 (pag. 76) del lanzamiento del dado la asignacion razonable sera:
P({1}) = P({2}) = P({3}) = P({4}) = P({5}) = P({6}) =
1
6
.
En otras ocasiones, la observacion del mismo fenomeno en otra poblacion semejante a la que estamos estudiando,
o inclusive en la objeto de estudio en un tiempo anterior, permitira obtener una distribucion de frecuencias a
partir de la cual asignar una probabilidad.
Ejemplo 2.3.1 Un estudio sobre las causas de paradas en una lnea de envasado por avera en algunas com-
ponentes dio la siguiente distribucion de frecuencias relativas:
Causa f
i
Rotura de hilo 0
650
Cinta 0
075
Tornillo sin n 0
250
Otras causas 0
025
Supuesto que no consideremos ninguna otra informacion adicional, podramos considerar esta distribucion de
frecuencias como una buena aproximacion de la probabilidad y decir, por ejemplo, que la probabilidad de que
una parada se deba a problemas de la cinta o del hilo es:
P(Hilo o Cinta) = P(Hilo) +P(Cinta) = 0
650 +0
075 = 0
725.
A veces es precisamente la asignacion de la probabilidad la que determina el espacio muestral. As, si imaginamos
el experimento aleatorio consistente en extraer una bola al azar de una urna compuesta por tres bolas rojas,
dos blancas y una verde, y consideramos como espacio muestral:
2
= {
1
,
2
,
3
,
4
,
5
,
6
}
en donde era
i
= bola roja, i = 1, 2, 3,
i
= bola blanca, i = 4, 5 y
6
= bola verde, los seis sucesos elementales
pueden ser considerados como equiprobables, siendo en ese caso, P({
i
}) = 1/6, mientras que si consideramos
como espacio muestral
1
= {
1
,
2
,
3
}
en donde era
1
= bola roja,
2
= bola blanca y
3
= bola verde, los sucesos dejan ya de ser equiprobables, por
lo que, en una situacion mas compleja, la eleccion de un espacio muestral en donde los sucesos elementales sean
equiprobables puede ser mas adecuada.
Aqu, por las propiedades estudiadas en la seccion anterior, es equivalente utilizar
2
con sucesos elementales
equiprobables, que utilizar
1
con P({
1
}) = 3/6, P({
2
}) = 2/6 y P({
3
}) = 1/6.
Sin embargo, la mayora de los fenomenos aleatorios que se observan en la naturaleza admiten un esquema tan
sencillo que no sera necesario detallar esta asignacion en los sucesos elementales en la mayora de las situaciones
reales. Se podra actuar en una forma mas simple, asignando de forma global un modelo probabilstico a la
caracterstica que estemos estudiando, el cual recibe el nombre de Distribucion de Probabilidad. No obstante, en
esa modelizacion global que hagamos de la realidad, siempre sera posible descender hasta la probabilidad que
tiene asociada.
La asignacion que hagamos, tanto en un nivel elemental como en forma de distribucion modelo, podra ser
contrastada con las observaciones que hagamos de nuestro experimento aleatorio, de forma que podamos estar
razonablemente seguros de nuestras conclusiones.
Dentro de las posibles asignaciones de probabilidad existe una que destaca, tanto por ser una de las mas
utilizadas como por obtenerse de ella interesantes propiedades. Se trata del denominado Modelo Uniforme.
En esta seccion estudiaremos un caso particular muy importante, el cual se corresponde con una situacion en
la que los sucesos elementales del espacio muestral puedan ser considerados como equiprobables.
Ejemplo 2.3.2 Consideremos el experimento aleatorio consistente en lanzar una moneda al aire. En el espacio
muestral asociado, = {Cara, Cruz}, ambos sucesos elementales pueden considerarse como equiprobables.
Ejemplo 2.3.3 Si seleccionamos al azar una carta de una baraja espa nola, los cuarenta sucesos elementales
correspondientes a las cuarenta cartas, pueden ser considerados como equiprobables, estando de nuevo ante un
esquema de modelo uniforme.
Ejemplo 2.3.4 Supongamos el experimento aleatorio consistente en dividir el intervalo [0, 1] en tres trozos
eligiendo dos puntos x
1
, x
2
[0, 1] al azar. De nuevo, al ser al azar la eleccion de los puntos, estaremos ante un
modelo uniforme.
Ejemplo 2.3.5 Consideremos el experimento aleatorio consistente en lanzar al aire una moneda dos veces.
El espacio muestral que razonablemente vendra asociado sera, = {(C, C), (C, X), (X, X)}, siendo C y X,
respectivamente, la cara y la cruz de la moneda.
En este espacio muestral los sucesos no son equiprobables, aunque puede conseguirse esta simetra si considera-
mos como espacio muestral = {(C, C), (C, X), (X, C), (X, X)}.
En todos estos casos de modelos uniformes, en especial en los que el espacio muestral es nito = {
1
,
2
,
. . .,
n
}, el calculo de las probabilidades de los sucesos resulta sencillo, ya que al ser los sucesos elementales
incompatibles y equiprobables, sera: 1 = P() = P({
l
}) +. . . +P({
n
}) = n P({
i
}), con lo que P({
i
}) =
1/n, i = 1, . . . , n. Por tanto, si un suceso A es union de k sucesos elementales, sera:
P(A) =
k
n
=
casos favorables a A
casos posibles
con lo que, en denitiva, el calculo de probabilidades de sucesos en un modelo uniforme, se limita a contar
el n umero de casos favorables a dicho suceso y el n umero de casos posibles y aplicar la denicion clasica de
probabilidad (Denicion 2.2.1 (pag. 77)).
No obstante, dicho computo no resulta siempre facil por lo que es conveniente tener presente las formulas de
las variaciones, combinaciones y permutaciones, ya que estas facilitaran el calculo.
Si de un grupo de N elementos tomamos n importandonos el orden de los n elementos seleccionados, tendremos
variaciones y si no nos importa el orden, combinaciones. Ademas, si admitimos la posibilidad de que entre
estos n pueda haber elementos repetidos, hablaremos, respectivamente, de variaciones y de combinaciones con
repeticion.
Por ultimo, si solamente queremos contar el n umero posible de reordenaciones de un conjunto de elementos,
hablaremos de permutaciones con o sin repeticion dependiendo de que admitamos o no la posibilidad de que
haya elementos repetidos.
Las formulas son:
Variaciones de N elementos tomados de n en n:
V
N,n
= N (N 1)
(n
. . . . . . (N n + 1).
Variaciones con repeticion de N elementos tomados de n en n:
V R
N,n
= N
n
.
Combinaciones de N elementos tomados de n en n:
C
N,n
=
_
N
n
_
=
N!
n!(N n)!
.
Combinaciones con repeticion de N elementos tomados de n en n:
CR
N,n
=
_
N +n 1
n
_
=
_
N +n 1
N 1
_
=
(N +n 1)!
n!(N 1)!
.
Permutaciones de N elementos:
P
N
= N! = N (N 1) . . . 2 1.
Permutaciones con repeticion de N elementos, uno de los cuales se repite n
1
veces, otro n
2
veces, ..., otro n
r
veces:
PR
n
1
,...,n
r
N
=
N!
n
1
! n
2
! . . . n
r
!
.
Ejemplo 2.3.6 Una enciclopedia en seis vol umenes es colocada en una estantera de forma aleatoria. La proba-
bilidad de que resulte colocada de forma correcta, supuesto que esto signique empezar a contar por la izquierda,
sera:
P(A) =
casos favorables
casos posibles
=
1
6!
=
1
720
.
2.4. Probabilidad condicionada.
Cuando en un e.a. tenemos informacion de que un determinado suceso B ha ocurrido, esa informacion puede mo-
dicarnos las probabilidades del resto de los sucesos. Es decir, en el nuevo espacio probabilstico debera hablarse
de probabilidad condicionada por el suceso B, en el sentido de la siguiente denicion.
Denicion 2.4.1 Dado un espacio probabilstico (, A, P) y un suceso B A tal que P(B) > 0, llamaremos
probabilidad condicionada del suceso A respecto al B a:
P(A/B) =
P(A B)
P(B)
.
Es sencillo probar que, jado B, P(/B) verica los axiomas de Kolmogorov (Denicion 2.2.2), con lo que la
probabilidad condicionada satisface todas las propiedades de la pagina 78. As, por ejemplo, la primera propiedad
se traducira en poder asegurar que
P(A/B) = 1 P(A/B).
A partir de la Denicion 2.4.1 podemos tambien deducir que
P(A B) = P(A/B) P(B)
y como los sucesos A y B pueden intercambiarse en la expresion anterior, sera:
P(A B) = P(A/B) P(B) = P(B/A) P(A),
por lo que tenemos una expresion mas para calcular la probabilidad condicionada:
P(A/B) =
P(B/A) P(A)
P(B)
.
Ejemplo 2.4.1 De una urna con 9 bolas blancas y 5 negras extraemos sucesivamente, sin reemplazamiento, 2
bolas. Calcular la probabilidad de que:
a) la 1
a
bola sea blanca y la 2
a
bola sea negra;
b) una bola cualquiera sea blanca y la otra sea negra;
c) la primera bola sea blanca sabiendo que la segunda fue blanca.
Es muy util un diagrama de arbol para esquematizar los distintos casos y sus probabilidades. Denotaremos
por B
1
=sacar 1
a
bola blanca, B
2
=sacar 2
a
bola blanca, N
1
=sacar 1
a
bola negra y N
2
=sacar 2
a
bola
negra.
B
N
3
Q
Q
Q
Q
Q
Q
Qs
B
N
B
N
1
P
P
P
P
P
P
P
Pq
1
P
P
P
P
P
P
P
Pq
P(B
1
) = 9/14
P(N
1
) = 5/14
P(B
2
/B
1
) = 8/13
P(N
2
/B
1
) = 5/13
P(B
2
/N
1
) = 9/13
P(N
2
/N
1
) = 4/13
P(B
1
) P(B
2
/B
1
) = 72/182
P(B
1
) P(N
2
/B
1
) = 45/182
P(N
1
) P(B
2
/N
1
) = 45/182
P(N
1
) P(N
2
/N
1
) = 20/182
2
a
extraccion 1
a
extraccion
Todas las probabilidades del diagrama estan calculadas usando
casos favorables
casos posibles
y teniendo en cuenta que
despues de la 1
a
extraccion queda una bola menos dentro de la urna, ya que no hay reemplazamiento y los
casos posibles pasan a ser 13 en vez de los 14 iniciales. Esta bola de menos puede ser blanca o negra por lo que
tambien pueden ser menores los casos favorables a cada suceso dependiendo del resultado de la 1
a
extraccion.
a) Piden P(B
1
N
2
) = P(B
1
) P(N
2
/B
1
) =
9
14

5
13
=
45
182
, es decir, la 2
a
rama del diagrama.
b) Puede ser 1
a
blanca y 2
a
negra o 1
a
negra y 2
a
blanca, es decir piden:
P[(B
1
N
2
) (N
1
B
2
)] = P(B
1
N
2
) +P(N
1
B
2
) = P(B
1
) P(N
2
/B
1
) +P(N
1
) P(B
2
/N
1
) =
9
14

5
13
+
5
14

9
13
=
90
182
=
45
91
.
En denitiva piden la suma de la 2
a
y la 3
a
rama del diagrama.
c) Piden P(B
1
/B
2
) =
P(B
1
B
2
)
P(B
2
)
=
72
182
72
182
+
45
182
=
72
117
.
Ejemplo 2.4.2 En una empresa Hispano-Britanica hay 100 personas monoling ues, de las que 60 solo hablan
ingles y 40 solo espa nol. Casualmente dos personas se encuentran en la cafetera. Que probabilidad tienen de
entenderse?
Ingles
Espa nol
3
Q
Q
Q
Q
Q
Q
Qs
Ingles
Espa nol
Ingles
Espa nol
1
P
P
P
P
P
P
P
Pq
1
P
P
P
P
P
P
P
Pq
60
100
40
100
59
99
40
99
60
99
39
99
probabilidad
60
100

59
99
=
354
990
= 0
357
probabilidad
60
100

40
99
=
24
99
= 0
2424
probabilidad
40
100

60
99
=
24
99
= 0
2424
probabilidad
40
100

39
99
=
156
990
= 0
1575
El segundo que entra El primero que entra
Los dos se entienden si
_
los dos hablan ingles: P(2I) =
354
990
los dos hablan espa nol: P(2E) =
156
990
_
P(2I 2E) =
354
990
+
156
990
= 0
51515.
2.5. Independencia de Sucesos.
Existen situaciones en las que la informacion suministrada por el acaecimiento de un suceso B no altera para
nada el calculo de la probabilidad de otro suceso A. Son aquellas en las que el suceso A es independiente de B,
es decir, cuando P(A/B) = P(A).
Cuando A es independiente de B, por la ultima expresion de la probabilidad condicionada, se tiene que
P(B/A) =
P(A) P(B)
P(A)
= P(B) (2.5.1)
y, por tanto, se podra decir que tambien B lo es de A, con lo cual hablaremos de sucesos independientes
cuando esta situacion ocurra. Pero en la anterior igualdad (2.5.1), estamos suponiendo implcitamente que
P(A) > 0, por lo que utilizaremos otra denicion de independencia mas general, valida aunque los sucesos
tengan probabilidad nula. La denicion formal que se da a continuacion implica estas dos situaciones.
Denicion 2.5.1 Dos sucesos A y B de un mismo espacio probabilstico (, A, P) se dicen independientes
cuando:
P(A B) = P(A) P(B) (regla del producto)
Esta denicion se generaliza para n sucesos de manera inmediata como se sigue:
Denicion 2.5.2 Sean A
1
, A
2
, . . . , A
n
n sucesos de un mismo espacio probabilstico (, A, P) se dice que son
independientes cuando:
P(A
i
A
j
. . . A
k
) = P(A
i
) P(A
j
) . . . P(A
k
),
para cualquier subconjunto {i, j, . . . , k} de {1, 2, . . . , n}.
Proposicion 2.5.1 Un suceso de probabilidad cero es independiente de cualquier otro suceso.
En efecto: Si A es tal que P(A) = 0, para cualquier B, P(AB) P(A) = 0, luego 0 = P(AB) = P(A)P(B).
Proposicion 2.5.2 Si A y B son sucesos independientes, A y B tambien son sucesos independientes.
En efecto: De la igualdad 2.2.2, P(B) = P[(AB)(AB)] = P(AB)+P(AB) = P(A) P(B)+P(AB),
luego P(A B) = P(B) P(A) P(B) = P(B) [1 P(A)] = P(B) P(A).
2.6. Teoremas de la Probabilidad Compuesta, Total y de Bayes.
Teorema 2.6.1 (De la Probabilidad Compuesta)
Sean A
1
, A
2
, . . . , A
n
n sucesos de un mismo espacio probabilstico (, A, P), tales que: P(A
1
A
2
. . .A
n1
) >
0, entonces se cumple que:
P(A
1
A
2
. . . A
n
) = P(A
1
) P(A
2
/A
1
) P(A
3
/A
1
A
2
) . . . P(A
n
/A
1
A
2
. . . A
n1
). (2.6.1)
Demostracion por induccion.
La igualdad anterior es inmediata para n = 2.
Suponemos que es cierta para n = k,
P(A
1
A
2
. . . A
k
) = P(A
1
) P(A
2
/A
1
) P(A
3
/A
1
A
2
) . . . P(A
k
/A
1
A
2
. . . A
k1
)
y veamos si se cumple para n = k + 1.
En efecto, como A
1
A
2
. . . A
k+1
= (A
1
A
2
. . . A
k
)A
k+1
, por la propiedad asociativa de la interseccion,
si llamamos B = A
1
A
2
. . . A
k
, entonces A
1
A
2
. . . A
k+1
= B A
k
.
Como (2.6.1) es cierta para n = 2, se cumple que P(A
1
A
2
. . . A
k+1
) = P(B) P(A
k+1
/B) y sustituyendo
B por A
1
A
2
. . . A
k
, vemos que el teorema es cierto para n = k+1, con lo que por el Principio de Induccion
Completa, podemos asegurar que la igualdad (2.6.1) es cierta cualquiera que sea el valor de n.
La hipotesis P(A
1
A
2
. . . A
n1
) > 0, es necesaria para asegurar la existencia de las probabilidades
condicionadas que intervienen en (2.6.1).
En el calculo numerico de probabilidades tiene una gran aplicacion practica el siguiente resultado.
Teorema 2.6.2 (De la Probabilidad Total)
Sea un espacio probabilstico (, A, P) y {A
i
}
n
i=1
A una particion de sucesos de con P(A
i
) > 0, i =
1, 2, . . . , n, es decir,
n
i=1
A
i
= y A
i
A
j
= para todo i = j. Entonces, para todo suceso B A se cumple
que:
P(B) =
n
i=1
P(B/A
i
) P(A
i
).
Resultado que se puede parafrasear diciendo que la probabilidad de un suceso que se puede dar a partir de
varias hipotesis o causas, es igual a la suma de los productos de las probabilidades de este en cada una de esas
hipotesis o causas, P(B/A
i
), por las probabilidades de que se den estas hipotesis o causas, P(A
i
).
Demostracion
B = B = B
_
n
i=1
A
i
_
=
n
i=1
(B A
i
);
luego
P(B) = P
_
n
i=1
(B A
i
)
_
=
n
i=1
P(B A
i
) =
n
i=1
P(B/A
i
) P(A
i
).
Ejemplo 2.6.1 Una poblacion esta formada por tres grupos etnicos: A (un 30 %), B (un 10 %) y C (un 6O%).
Ademas una empresa de alimentacion sabe que el porcentaje de personas que compran un determinado producto
en cada una de estas poblaciones es, respectivamente, del 20 %, 40 % y 5 %. Por el teorema de la probabilidad
total , la probabilidad de que un individuo elegido al azar de esta poblacion compre el producto es:
P(compre el producto) = P(A) P(compre el producto/A) +P(B) P(compre el producto/B)+
P(C) P(compre el producto/C) = 0
3 0
2 + 0
1 0
4 + 0
6 0
05 = 0
13.
El siguiente teorema es un resultado con una gran carga losoca detras, el cual mide el cambio que se va
produciendo en las probabilidades de los sucesos a medida que vamos haciendo observaciones. Paradojicamente
a su importancia, su demostracion no es mas que la aplicacion de la denicion de probabilidad condicionada
seguida de la aplicacion del teorema de la probabilidad total.
Teorema 2.6.3 (De Bayes)
Sea un espacio probabilstico (, A, P), {A
i
}
n
i=1
A una particion de sucesos de y B A un suceso con
probabilidad estrictamente positiva. Entonces, para todo suceso A
i
se verica:
P(A
i
/B) =
P(A
i
) P(B/A
i
)
n
j=1
P(A
j
) P(B/A
j
)
.
Demostracion
Por denicion de probabilidad condicionada P(A
i
/B) =
P(BA
i
)
P(B)
=
P(A
i
)P(B/A
i
)
n
j=1
P(A
j
) P(B/A
j
)
.
Donde la igualdad de los numeradores de las ultimas fracciones es consecuencia de la denicion de probabilidad
condicionada y la de los denominadores es consecuencia del teorema anterior.
Este teorema tiene una interpretacion intuitiva muy interesante. Si las hipotesis o causas que pueden ocurrir las
tenemos clasicadas en los sucesos A
i
de los cuales conocemos sus probabilidades P(A
i
), denominadas a priori,
y se observa un suceso B, la formula de Bayes nos da las probabilidades a posteriori de esas hipotesis, ajustadas
o modicadas por la informacion que nos proporciona saber que ha ocurrido B.
Ejemplo 2.6.2 Supongamos que tenemos una urna delante de nosotros de la cual solo conocemos que o es la
urna A
1
con 3 bolas blancas y 1 negra, o es la urna A
2
con 3 bolas negras y 1 blanca.
Con objeto de obtener mas informacion acerca de cual urna tenemos delante, realizamos un experimento con-
sistente en extraer una bola de la urna desconocida. Si suponemos que la bola extrada resulto blanca 1B y a
priori ninguna de las dos urnas es mas verosmil que la otra, P(A
1
) = P(A
2
) = 1/2, entonces la formula de
Bayes nos dice que las probabilidades a posteriori de cada urna son
P(A
1
/1B) = 3/4 y P(A
2
/1B) = 1/4
habiendo alterado de esta forma nuestra creencia sobre la urna que tenemos delante: antes creamos que eran
equiprobables y ahora creemos que es tres veces mas probable que la urna desconocida sea la A
1
.
Pero, que ocurrira si extraemos otra bola? Logicamente, en la formula de Bayes deberemos tomar ahora como
probabilidades a priori las calculadas, 3/4 y 1/4, pues estas son nuestras creencias sobre la composicion de la
urna, antes de volver a realizar el experimento.
Si suponemos que la bola no fue reemplazada (se deja para el lector el caso de reemplazamiento), y sale una
bola negra 2N, la formula de Bayes nos devolvera a la incertidumbre inicial, ya que sera
P(A
1
/2N) = 1/2 y P(A
2
/2N) = 1/2.
Si hubiera salido blanca, la formula de Bayes, al igual que la logica, tambien sera concluyente,
P(A
1
/2B) = 1 y P(A
2
/2B) = 0.
El uso de la formula de Bayes, es decir, la utilizacion de distribuciones de probabilidad a posteriori como
modelos en la estimacion de parametros, al recoger esta tanto la informacion muestral, P(B/A
i
), como la
informacion a priori sobre ellos, P(A
i
), constituye una losofa inferencial en gran desarrollo en los ultimos
a nos, la cual, no obstante, tiene el inconveniente (o la ventaja) de depender de la informacion a priori, la cual
en muchas ocasiones es subjetiva y por tanto, pudiendo ser diferente de un investigador a otro.
Esquema sobre conjuntos Tema 2, 89
ESQUEMA SOBRE CONJUNTOS.
OPERACIONES ENTRE SUCESOS
Dados los sucesosos A, B, C de , se dene:
B menos A: B A = B A
Diferencia simetrica de A y B: AB = (A B) (A B)
Algunas propiedades utiles de la union e interseccion son:
Asociativa:
(A B) C = A (B C) = (A C) B = A B C
(A B) C = A (B C) = (A C) B = A B C
Conmutativa y Leyes de Morgan:
A B = B A A B = A B
A B = B A A B = A B
Elemento neutro y simetrico:
A = A A = B B =
A = A = A B B =
Distributiva:
(A B) C = (A C) (B C)
(A B) C = (A C) (B C)
Descomposicion:
A = (A B) (A B) = (A B) (AB)
Absorcion:
Si A B =
_
A B = A
A B = B
Este esquema NO se puede tener en el examen.
ENUNCIADOS DE LOS EJERCICIOS.
2.1. Experimento aleatorio.
Ejercicio 2.1 Tres componentes se conectan para formar un sistema, como indica el siguiente diagrama.
Como las componentes del subsistema 2-3 estan conectados en paralelo, ese subsistema funcionara si, por lo
menos, uno de los dos componentes funciona. Con lo cual, para que funcione todo el sistema, debera funcionar
el componente 1 y el subsistema 2-3.
El experimento consiste en determinar si cada uno de los tres componentes del sistema funciona (E) o falla
(F).
a) Determinar todos los posibles estados del sistema (conjunto de todos los posibles resultados del experimento
espacio muestral).
b) Determinar los elementos del suceso A =exactamente dos de las tres componentes funcionan correctamen-
te.
c) Determinar los elementos del suceso B =al menos dos de las componentes funcionan.
d) Determinar los elementos del suceso C =el sistema funciona.
e) Determinar los elementos de los sucesos: C, A C, A C, B C y B C.
Ejercicio 2.2 Una compa na de ingenieros constructores esta actualmente trabajando en plantas electricas
en tres lugares diferentes. Se nalaremos como A
i
el suceso la planta del lugar i se termina para la fecha del
contrato. Utilizar las operaciones de union, interseccion y complemento para describir cada uno de los siguientes
sucesos, en terminos de A
1
, A
2
y A
3
.
a) Todas las plantas se terminan para la fecha del contrato.
b) Por lo menos una planta se termina para la fecha del contrato.
c) Solo se termina la planta del lugar 1 para la fecha del contrato.
d) Exactamente una planta se termina para la fecha del contrato.
e) Se termina para la fecha del contrato la planta 1 o la planta 2, pero no las dos.
2.2. Probabilidad.
Ejercicio 2.3 Un sistema puede tener tres tipos de defectos. A
i
, i = 1, 2, 3 representa al suceso el sistema
tiene un defecto del tipo i y se sabe que:
P(A
1
) = 0
12, P(A
2
) = 0
07, P(A
3
) = 0
05
P(A
1
A
2
) = 0
13, P(A
1
A
3
) = 0
14, P(A
2
A
3
) = 0
10, P(A
1
A
2
A
3
) = 0
01.
a) Cual es la probabilidad de que el sistema no tenga el defecto tipo 1?
b) Cual es la probabilidad de que el sistema tenga defectos tipo 1 y 2 al mismo tiempo?
c) Cual es la probabilidad de que el sistema tenga defectos tipo 1 y tipo 2 al mismo tiempo, pero no tenga
defectos tipo 3?
d) Cual es la probabilidad de que el sistema tenga al menos dos de esos defectos?
Ejercicio 2.4 Unas tarjetas de circuito impreso pueden presentar dos tipos de defectos A y B. Se sabe que la
probabilidad de que tengan el defecto tipo A es 0
07, la probabilidad de que tengan el defecto tipo B es 0
08 y
la probabilidad de que tenga al menos uno de estos dos defectos es 0
12. Seleccionada una tarjeta al azar:

a) Cual es la probabilidad de que tenga los dos tipos de defectos?
b) Cual es la probabilidad de que la union seleccionada tenga el defecto tipo B, pero no el tipo A?
c) Cual es la probabilidad de que no tenga ninguno de los defectos?
2.3. Asignacion de probabilidad.
Ejercicio 2.5 Responde razonadamente a las siguientes cuestiones:
a) De cuantas maneras pueden formarse grupos de tres individuos si hay nueve?
b) De cuantas maneras pueden dividirse 6 hombres y 4 mujeres en grupos de dos hombres y tres mujeres?
c) De cuantas formas distintas pueden colocarse n bolas numeradas del 1 al n en m cajas?, y si fuera una
en cada caja?
d) De cuantos modos distintos se pueden distribuir n bolas indistinguibles en m urnas (m n) si se supone
que no puede haber mas de una bola en cada urna?, y si puede haber mas de una bola por urna?
e) Se dispone de tres urnas. De cuantas maneras distintas se pueden colocar en ellas 5 bolas indistinguibles?
f) Cuantas piezas diferentes de domino se pueden formar con los n umeros 1, 2, . . . , m, considerando que una
pieza puede ser blanca?
g) Cuantos n umeros de dos cifras pueden formarse con los dgitos 1, 2, 3, 4 y 5, suponiendo que no pueden
repetirse ninguno? Y con repeticion?
h) Cuantas palabras de 5 letras se pueden formar con las letras a, b y c si la a aparece a lo sumo dos veces, b
a lo sumo una vez y c a lo sumo tres veces?
i) Cual es el n umero de formas distintas de obtener 10 puntos al lanzar tres dados (supongase que importa el
orden, es decir, que no es lo mismo que salga 1-3-6 que 6-1-3)?
Ejercicio 2.6 En una biblioteca se utilizan 5 smbolos alfanumericos para clasicar los libros; los dos primeros
son letras (de 28 letras posibles) y los tres ultimos n umeros. Cuantas clasicaciones se podran hacer si: a)
todas las letras y n umeros se pueden utilizar sin ninguna restriccion; b) las letras no pueden repetirse?
Ejercicio 2.7 Si se descarta la posibilidad de nacimiento en un 29 de febrero, supongamos que un individuo
elegido al azar tiene igual probabilidad de nacer en cualquiera de los otros 365 das. Bajo estas suposiciones, si
en una habitacion hay 23 personas, crees que es facil que haya al menos dos con el mismo cumplea nos?
Para responder a esta pregunta de forma precisa, consideremos el experimento de seleccionar 23 personas al
azar, se pide:
a) Calcular la probabilidad de que todas tengan cumplea nos diferentes.
b) Calcular la probabilidad de que, por lo menos, dos tengan el mismo cumplea nos.
2.4. Probabilidad condicionada.
Ejercicio 2.8 Considera de nuevo los datos del Ejercicio 2.3 sobre defectos de un sistema.
a) Si el sistema tiene un defecto tipo 1, cual es la probabilidad de que tenga un defecto tipo 2?
b) Si el sistema tiene un defecto tipo 1, cual es la probabilidad de que tenga los tres tipos de defectos?
c) Si el sistema tiene los dos primeros tipos de defectos a la vez, cual es la probabilidad de que no tenga el
tercer tipo de defecto?
2.5. Independencia de sucesos.
Ejercicio 2.9 Se realiza un experimento que consiste en elegir al azar un automovil de una poblacion con
un 80 % de coches de cuatro cilindros, un 10 % de coches de seis cilindros, un 80 % de coches con pintura
metalizada, un 40 % de coches con llantas de aleacion, un 64 % de coches de cuatro cilindros con pintura
metalizada y un 50 % de coches con pintura metalizada y llantas de aleacion. Si denotamos por A=el automovil
tiene exactamente cuatro cilindros, B=el automovil tiene exactamente seis cilindros, C=el automovil tiene
pintura metalizada y D=el automovil tiene llantas de aleacion, se pide analizar si son incompatibles (o lo
que es lo mismo disjuntos) y/o independientes los siguientes sucesos:
a) A y B.
b) A y C.
c) C y D.
d) A B y C.
Nota.- Observese que no se verica ninguna implicacion entre ser incompatible y ser independiente, puesto que
las cuatro combinaciones posibles se han dado en los apartados anteriores.
Ejercicio 2.10 Un sistema consta de cuatro componentes, como se ilustra en la siguiente gura:
Todo el sistema funcionara si el subsistema 1-2 o el subsistema 3-4 funciona (porque los dos subsistemas estan
conectados en paralelo). Por otro lado, como los dos componentes de cada subsistema estan conectados en
serie, un subsistema funcionara solo si ambos componentes funcionan. Los componentes funcionan o fallan uno
independiente de otro y cada uno funciona con probabilidad 0
9.
a) Calcular la probabilidad de que todo el sistema funcione (coeciente de conabilidad del sistema).
b) Calcular la probabilidad de que el sistema funcione si fuese de la forma
c) Calcular la probabilidad de que el sistema funcione si ambos subsistemas estuviesen conectados en paralelo,
es decir,
Ejercicio 2.11 Una compa na utiliza tres lneas de produccion diferentes, A
1
, A
2
y A
3
, para fabricar un com-
ponente en particular. De los fabricados por la lnea A
1
, el 5 % necesitan ser revisados para corregir un defecto,
lo mismo sucede con un 8 % de los componentes de A
2
y con un 10 % de los de A
3
. El 50 % de todos los compo-
nentes son producidos por la lnea A
1
, el 30 % por la lnea A
2
y el 20 % por A
3
. Si un componente seleccionado
al azar necesita ser revisado, cual es la probabilidad de que provenga de la lnea A
1
?, de la lnea A
2
?, y de
la lnea A
3
?
Ejercicio 2.12 El 60 % de los aviones que desaparecen en vuelo son descubiertos posteriormente. De los aviones
descubiertas, el 60 % tiene localizador de emergencia, mientras que el 90 % de los no descubiertos no tienen ese
localizador. Suponiendo que ha desaparecido un avion,
a) Si tiene localizador de emergencia, cual es la probabilidad de que sea descubierto?
b) Si no tiene localizador de emergencia, cual es la probabilidad de que sea descubierto?
Ejercicio 2.13 Un inspector de control de calidad esta inspeccionando artculos de reciente produccion para
buscar defectos. El inspector inspecciona un artculo en una serie de etapas independientes. Si un defecto
esta presente, la probabilidad de que el defecto sea detectado durante cualquier de las etapas, y por tanto el
artculo clasicado como defectuoso, es 0
7. Cuando un artculo no se ha clasicado como defectuoso en tres

etapas, el artculo pasa la inspeccion. (Este modelo se estudia en Human perfomance in sampling inspection,
Human factors, 1979, pp.99-105.)
a) Si consideramos un artculo defectuoso, cual es la probabilidad de que pase la inspeccion?
b) Suponiendo que el 10 % de todos los artculos son defectuosos (P(un artculo escogido al azar sea defectuoso)
= 0
1), cual es la probabilidad de que un artculo seleccionado al azar pase la inspeccion (pasara automati-
camente si no es defectuoso, pero tambien puede pasar si lo es, seg un vimos en el apartado anterior)?
c) Dado que el artculo ha pasado la inspeccion, cual es la probabilidad de que, en realidad, sea defectuoso?
Ejercicio 2.14 Un metodo empleado para distinguir entre rocas granticas (G) y basalticas (B) consiste en
examinar una porcion del espectro infrarrojo de la energa solar reejada en la supercie de la roca. Sean R
1
, R
2
y R
3
las intensidades del espectro en tres diferentes longitudes de onda. Cuando se hacen mediciones remotas
(por medio de aviones) pueden aparecer varios ordenamientos de R
i
si la roca es basalto o granito. Los vuelos
sobre regiones de composicion conocida han dado la siguiente informacion:
ORDENACI
ON REGISTRADA
Ordenacion 1 (O
1
) Ordenacion 2 (O
2
) Ordenacion 3 (O
3
)
SI ES GRANITO: 60 % 25 % 15 %
SI ES BASALTO: 10 % 20 % 70 %
Suponiendo que una roca seleccionada al azar en una cierta region solo puede ser granito o basalto y que
P(granito) = 0
25, se pide:
a) Si se ha registrado la ordenacion O
1
, cual es la probabilidad de que la roca sea granito?, y de que sea
basalto? En base a lo anterior, si las mediciones fuesen O
1
, como sera mas logico clasicar la roca, como
granito o como basalto?
b) Si las mediciones diesen O
2
, como sera mas logico clasicar la roca? Contestar a la misma pregunta para
O
3
.
c) Si se utilizan las reglas de decision de los apartados a) y b), cual es la probabilidad de una clasicacion
erronea cuando se seleccione una roca de la region? (Sugerencia: una clasicacion es erronea cuando la roca
es granito y se clasica como basalto o bien cuando es basalto y se clasica como granito.)
Examenes.
Ejercicio 2.15 (09-09-04) Una maquina utilizada en el control de calidad de la produccion, determina si una
pieza debe ser recticada o no, pero puede equivocarse. La probabilidad de que una pieza buena se rectique es
0
05 y la de que se rectique una pieza que es defectuosa es 0
90. Si el 99 % de las piezas producidas son buenas

y el resto son defectuosas, se pide:
a) Cual es la probabilidad de que una pieza sea recticada?
b) Cual es la probabilidad de que una pieza que se rectica sea buena?
c) Cual es la probabilidad de que una pieza que se rectica sea defectuosa?
Ejercicio 2.16 (13-02-06) Seg un el metodo empleado en su fabricacion (metodo I, II y III) un proveedor
suministra lotes de un producto con un 2 %, 3 % y 5 % de unidades defectuosas. La probabilidad de emplear
el metodo I es 0
50, la de emplear el metodo II es 0
40 y, por consiguiente, la de emplear el metodo III es

0
10. En un lote recibido se realiza un control de calidad consistente en comprobar la calidad de tres unidades
independientes, resultando que ninguna es defectuosa. Considerando esta informacion, calcular la probabilidad
de que el lote se haya fabricado:
a) por el metodo I;
b) por el metodo II;
c) por el metodo III.
Ejercicio 2.17 (22-06-07) El 60 % de los tornillos producidos por una fabrica proceden de la maquina A y
el resto de la maquina B. Dentro del total de la produccion, la proporcion de tornillos producidos en A y no
defectuosos es 0
54. Dentro de los tornillos producidos en B, la proporcion de no defectuosos es 0
7. Con estos
datos, obtener:
a) La probabilidad de que un tornillo de dicha fabrica sea defectuoso.
b) La probabilidad de que, sabiendo que un tornillo es defectuoso, proceda de la maquina A.
Ejercicio 2.18 (26-06-08) Un sistema consta de 3 componentes tal como se ilustra en la gura adjunta.
2
3
1
Todo el sistema funcionara si el subsistema 1-2 funciona o el subsistema 1-3 funciona. Las componentes funcionan
o fallan una independiente de otra y cada una funciona con probabilidad 09.
a) Calcula la probabilidad de que el sistema funcione.
b) Si se sabe que el sistema funciona, cual es la probabilidad de que la componente 2 este funcionando?
c) Si se sabe que la componente 2 funciona, cual es la probabilidad de que el sistema funcione?
SOLUCIONES DE LOS EJERCICIOS.
Ejercicio 2.1 Denotamos por E
i
el suceso la componente i funciona y por F
i
el suceso la componente i
falla (i = 1, 2, 3).
a) = {E
1
E
2
E
3
, E
1
E
2
F
3
, E
1
F
2
E
3
, E
1
F
2
F
3
, F
1
E
2
E
3
, F
1
E
2
F
3
, F
1
F
2
E
3
, F
1
F
2
F
3
}.
b) A = {E
1
E
2
F
3
, E
1
F
2
E
3
, F
1
E
2
E
3
}.
c) B = {E
1
E
2
F
3
, E
1
F
2
E
3
, F
1
E
2
E
3
, E
1
E
2
E
3
}.
d) C = {E
1
E
2
E
3
, E
1
E
2
F
3
, E
1
F
2
E
3
}.
e) C = {E
1
F
2
F
3
, F
1
E
2
E
3
, F
1
E
2
F
3
, F
1
F
2
E
3
, F
1
F
2
F
3
};
A C = {E
1
E
2
F
3
, E
1
F
2
E
3
, F
1
E
2
E
3
, E
1
E
2
E
3
} = B;
A C = {E
1
E
2
F
3
, E
1
F
2
E
3
};
B C = {E
1
E
2
F
3
, E
1
F
2
E
3
, F
1
E
2
E
3
, E
1
E
2
E
3
} = B;
B C = {E
1
E
2
E
3
, E
1
E
2
F
3
, E
1
F
2
E
3
} = C.
Ejercicio 2.2 a) A
1
A
2
A
3
.
b) A
1
A
2
A
3
.
c) A
1
A
2
A
3
.
d) (A
1
A
2
A
3
) (A
1
A
2
A
3
) (A
1
A
2
A
3
).
e) (A
1
A
2
) (A
1
A
2
).
Ejercicio 2.3 a) 088.
b) 006.
c) 005.
d) 009.
b) 005.
c) 088.
b) 60.
c) m
n
;
m!
(mn)!
.
d) Con exclusion
_
m
n
_
y sin exclusion
_
m+n1
n
_
.
e) 21.
f)
(m+2)(m+1)
2
=
_
m+2
2
_
.
g) 20; 25.
h) 60.
i) 27.
Ejercicio 2.6 a) 28
2
1000.
b) 28 27 1000.
Ejercicio 2.7 a) Para calcular la probabilidad de que todas tengan cumplea nos diferentes, denotaremos por
A el suceso las 23 personas tienen cumplea nos diferente. Se tiene que:
P(A) =
casos favorables
casos posibles
=
365
365
364
365
363
365

365 22
365
=
365!/342!
365
23
=
V
365,23
V R
365,23
= 0
493.
b) Que por lo menos dos personas tengan el mismo cumplea nos, esto es justo lo contrario de asegurar que las
23 personas tienen cumplea nos diferentes, con lo cual la segunda pregunta nos esta pidiendo que calculemos:
P(

A) = 1 P(A) = 1 0
493 = 0
507.
As pues, con solo 23 personas, ya hay mas probabilidad de que haya alguna con el mismo cumplea nos que de
que no.
Ejercicio 2.8 a) 0
5.
b) 0
083.
c) 0
833.
Ejercicio 2.9 a) A y B son incompatibles, pero no independientes.
b) A y C son independientes, pero no incompatibles.
c) C y D no son ni independientes, ni incompatibles.
d) A B y C son independientes e incompatibles.
Ejercicio 2.10 a) 0
9639.
b) 0
859.
c) 0
995.
Ejercicio 2.11 P(A
1
/Revisado) = 0
362, P(A
2
/Revisado) = 0
348 y P(A
3
/Revisado) = 0
290.
b) 04.
Ejercicio 2.13 Si denotamos por D el suceso el artculo es defectuoso, por C
i
el suceso el artculo es
clasicado como defectuoso en la etapa i para cualquier i = 1, 2, . . . y por Pa el suceso el artculo pas a la
inspeccion, los datos que nos dan son P(C
i
/D) = 0
7 y Pa = C
1
C
2
C
3
. Con ellos se obtienen las siguientes
respuestas a los distintos apartados:
a) P(Pa/D) = P(C
1
C
2
C
3
/D)
indep.
= P(C
1
/D)P(C
2
/D)P(C
3
/D) = (10
7)(10
7)(10
7) = 0
027.
b) P(Pa) = P(Pa/D)P(D) +P(Pa/D)P(D) = 1(0
9) + 0
027(0
1) = 0
9027.
c) Aplicando la denicion de probabilidad condicionada y los resultados obtenidos en los apartados anteriores
se tiene que:
P(D/Pa) =
P(D Pa)
P(Pa)
=
P(Pa/D)P(D)
0
9027
=
0
027 0
1
0
9027
= 0
003.
Ejercicio 2.14 a) P(G/O
1
) = 0
667 > P(B/O

1
) = 0
333, donde G representa el suceso la roca es granito

y B el suceso la roca es basalto. Por tanto, si las mediciones fuesen O
1
, lo mas logico sera clasicar la
roca como granito.
b) Puesto que P(G/O
2
) = 0
294 < P(B/O

2
) = 0
706 y P(G/O
3
) = 0
067 < P(B/O

3
) = 0
933, si las
mediciones diesen O
2
o O
3
, lo mas logico sera clasicar la roca como basalto.
c) La probabilidad de una clasicacion erronea:
P(Error) = P(Error/G)P(G) +P(Error/B)P(B) = P(O
2
O
3
/G)P(G) +P(O
1
/B)P(B)
= (P(O
2
/G) +P(O
3
/G))P(G) +P(O
1
/B)P(B) = (0
25 + 0
15)(0
25) + (0
1)(0
75) = 0
175.
Ejercicio 2.15 Si denotamos por R el suceso la pieza es recticada y por D el suceso la pieza es defectuosa,
los datos que nos da el enunciado son:
P(R/D) = 0
05, P(R/D) = 0
90, P(D) = 0
99, P(D) = 0
01.
a)
P(R) = P(R D) +P(R D) = P(R/D)P(D) +P(R/D)P(D) = (0
90)(0
01) + (0
05)(0
99) = 0
0585.
b)
P(D/R) =
P(R D)
P(R)
=
P(R/D)P(D)
P(R)
=
(0
05)(0
99)
0
0585
= 0
8462.
c) Puesto que nos piden P(D/R) y P(/R) es una probabilidad, se tiene del apartado anterior que
P(D/R) = 1 P(D/R) = 1 0
8462 = 0
1538.
Ejercicio 2.16 Si denotamos por D el suceso el producto es defectuoso, por I el suceso se ha empleado el
metodo I en la elaboracion del producto y por II y III los sucesos correspondientes para los metodos II y
III, respectivamente, se tiene que
P(D/I) = 0
02 P(D/II) = 0
03 P(D/III) = 0
05
P(I) = 0
50 P(II) = 0
40 P(III) = 0
10
con cuyos datos se puede responder a los tres apartados del ejercicio, como sigue:
a) Para el metodo I se tiene que:
P(I/DDD) =
P(I DDD)
P(DDD)
=
P(DDD/I)P(I)
P(DDD/I)P(I) +P(DDD/II)P(II) +P(DDD/III)P(III)
=
(0
98)
3
(0
50)
(0
98)
3
(0
50) + (0
97)
3
(0
40) + (0
95)
3
(0
10)
= 0
511.
b) De forma analoga, para el metodo II se tiene:
P(II/DDD) =
P(II DDD)
P(DDD)
=
P(DDD/II)P(II)
P(DDD/I)P(I) +P(DDD/II)P(II) +P(DDD/III)P(III)
=
(0
97)
3
(0
40)
(0
98)
3
(0
50) + (0
97)
3
(0
40) + (0
95)
3
(0
10)
= 0
396.
c) Y por ultimo, para el metodo III se tiene:
P(III/DDD) = 1 P(III/DDD) = 1 P(I/DDD) P(II/DDD) = 1 0
511 0
396 = 0
093.
Ejercicio 2.17 Si denotamos por A el suceso el tornillo ha sido producido por la maquina A, por B el suceso
el tornillo ha sido producido por la maquina B y por D el suceso el tornillo es defectuoso, los datos del
enunciado se traducen en:
P(A) = 0
6, P(B) = 0
4, P(A D) = 0
54, P(D/B) = 0
7.
As pues,
a) La probabilidad de que un tornillo sea defectuoso es:
P(D) = P(A D) +P(B D).
Por un lado tenemos que
P(A) = P(A D) +P(A D) =P(A D) = P(A) P(A D) = 0
6 0
54 = 0
06.
Por otro lado,
P(D/B) = 0
7 P(D/B) = 0
3
P(D/B) =
P(BD)
P(B)
_
=P(B D) = P(D/B)P(B) = 0
3 0
4 = 0
12.
De todo lo anterior se deduce que
P(D) = 0
06 + 0
12 = 0
18.
b) La probabilidad pedida en este apartado es:
P(A/D) =
P(A D)
P(D)
=
0
06
0
18
= 0
33.
Ejercicio 2.18 Si denotamos por F
i
el suceso la componente i funciona, con i = 1, 2, 3, se tiene que P(F
1
) =
P(F
2
) = P(F
3
) = 0
9 y F
1
, F
2
, F
3
son sucesos independientes.
a) Si denotamos por F
s
el suceso el sistema funciona, la probabilidad pedida es:
P(F
s
) = P((F
1
F
2
) (F
1
F
3
)) = P(F
1
F
2
) +P(F
1
F
3
) P(F
1
F
2
F
3
)
indep.
= P(F
1
)P(F
2
) +P(F
1
)P(F
3
) P(F
1
)P(F
2
)P(F
3
) = (0
9)
2
+ (0
9)
2
(0
9)
3
= 0
891.
b) Como se sabe que el sistema funciona, la probabilidad pedida es:
P(F
2
/F
s
) =
P(F
2
F
s
)
P(F
s
)
=
P(F
2
((F
1
F
2
) (F
1
F
3
)))
0
891
=
P((F
1
F
2
) (F
1
F
2
F
3
))
0
891
=
P(F
1
F
2
)
0
891
=
(0
9)
2
0
891
= 0
909.
c) Como se sabe que la componente 2 funciona, la probabilidad pedida es:
P(F
s
/F
2
) =
P(F
2
F
s
)
P(F
2
)
=
(0
9)
2
0
9
= 0
9.
PREGUNTAS DE TEST.
1. Tenemos dos urnas con la misma composicion de tres bolas blancas y tres bolas negras. Se pasan dos bolas
de la primera urna a la segunda y a continuacion se extrae una bola de la segunda urna. La probabilidad de
que esta ultima bola sea blanca es
a) 3/8; b) 5/8; c) 1/2; d) 1/3; e) Todo falso.
2. Se elige al azar una moneda de una caja con dos monedas: una legal y otra con una cara en cada lado. Al
lanzar dicha moneda se obtiene una cara, cual es la probabilidad de que la moneda elegida sea la legal?
a) 5/8; b) 1/3; c) 1/2; d) 2/3; e) Todo falso.
3. Si se lanza dos veces la moneda elegida al azar, cual es la probabilidad de obtener dos caras?
a) 5/8; b) 1/3; c) 1/2; d) 2/3; e) Todo falso.
4. Tenemos dos urnas con 3 bolas blancas y 2 negras en la primera y 3 bolas blancas y 3 negras en la segunda.
Se pasa una bola de la primera urna a la segunda y a continuacion se saca una bola de la segunda urna y resulta
ser negra. La probabilidad de haber extrado una bola negra de la urna primera es
a) 3/8; b) 5/8; c) 1/2; d) 1/3; e) Todo falso.
Examenes.
5. (19-06-03) Desde cada una de las seis estaciones de una lnea de trenes, se proporciona un billete para
cualquier trayecto entre dos estaciones de la lnea. Teniendo en cuenta que es distinto el billete de ida que el de
vuelta, entonces el n umero de billetes distintos que debe de tener disponibles cada estacion es:
a) 6; b) 5; c) 30; d) 720; e) Todo falso.
6. (19-06-03) Un centro de calculo tiene tres procesadores que reciben n trabajos de forma aleatoria, con lo
que las 3
n
posibles asignaciones de los trabajos a los procesadores son igualmente verosmiles. La probabilidad
de que exactamente dos procesadores no hayan recibido ning un trabajo es:
a) 0; b) 1; c) 1/3
n1
; d) (2/3)
n
; e) Todo falso.
7. (19-06-03) Sean A, B y C tres sucesos cualesquiera de un espacio probabilstico (, A, P). Se verica
siempre que P(A B/C) es igual a:
a) P(A) +P(B) P(C);
c) P(A/B) +P(B/B) P(A B/B);
e) Todo falso.
b) P(A/C) +P(B/C) P(A B/C);
d) 0;
8. (19-06-03) Sean A y B dos sucesos independientes, con P(A) = 0
25 y P(B) < 1, entonces P(A B/B)

es igual a:
a) 1; b) 0; c) 025; d) 075; e) Todo falso.
9. (19-06-03) Una urna contiene dos bolas. Se sabe que la urna se lleno tirando una moneda al aire dos veces
y poniendo una bola blanca en la urna por cada cara y una negra por cada cruz. Entonces, la probabilidad de
que la urna contenga:
a) Dos bolas blancas es 1/3;
c) Una bola blanca y una negra es 1/3;
e) Todo falso.
b) Dos bolas negras es 2/3;
d) Dos blancas o dos negras es 2/3;
10. (19-06-03) Si se extrae una bola de la urna anterior y resulta ser blanca. La probabilidad de que la otra
bola de la urna sea tambien blanca es:
a) 1/2; b) 0; c) 1/4; d) 3/4; e) Todo falso.
11. (09-09-03) Se tienen 2 barajas espa nolas con 40 cartas cada una. La probabilidad de que al sacar una
carta de cada baraja, se obtengan dos ases de oros es:
a) 1/20; b) 2/40; c) 1/1600; d) 2/400; e) Todo falso.
12. (09-09-03) De un grupo de cuatro hombres y cinco mujeres se forma un comite de tres miembros con dos
hombres y una mujer y con la condicion de que el hombre de mayor edad, solo hay uno, debe de estar integrado
en el. El n umero de comisiones posibles es:
a) 84; b) 30; c) 15; d) 40; e) Todo falso.
13. (09-09-03) Sean A y B dos sucesos independientes, con P(A) = 1/3 y P(B) = 3/4. Se tiene que
P(A/A B) es:
a) 1; b) 0; c) 025; d) 075; e) Todo falso.
14. (09-09-03) Una urna contiene 2 bolas. Se sabe que, o bien todas las bolas son blancas o bien hay una bola
blanca y una negra. La probabilidad de que la urna contenga una bola negra es 2/3. Se realiza una extraccion
sin reemplazamiento y resulta ser una bola blanca. La probabilidad de que la segunda bola extrada sea negra
es:
a) 2/9; b) 7/9; c) 1/6; d) 1/2; e) Todo falso.
15. (17-02-04) En una empresa se han producido cuatro cortes independientes de uido electrico durante un
n de semana. Si los dos das (sabado y domingo) tienen la misma probabilidad de sufrir cortes electricos, la
probabilidad de que haya habido alg un corte los dos das del n de semana es:
a) 1; b) 7/8; c) 1/16; d) 0; e) Todo falso.
16. (21-06-04) Sean A y B dos sucesos de un espacio probabilstico (, A, P), con P(A) = 0
75 y P(B) < 1.
Entonces P(A B/B) es igual a:
a) 1; b) 0; c) 025; d) 075; e) Todo falso.
17. (21-06-04) Sean A y B dos sucesos de un espacio probabilstico (, A, P). Entonces, P(A B/B) es
siempre igual a:
a) P(A); b) P(B); c) P(A/B); d) 1; e) Todo falso.
18. (09-09-04) Una moneda perfecta se lanza hasta que por primera vez aparece dos veces seguidas el mismo
resultado. La probabilidad de que el experimento termine antes del cuarto lanzamiento es:
a) 84; b) 05; c) 0333; d) 075; e) Todo falso.
19. (09-09-04) Un conjunto electrico consta de dos componentes A y B. La probabilidad de que falle A es 0
3,
la probabilidad de que falle B es 0
2 y la probabilidad de que fallen ambos simultaneamente es 0
1. Entonces la
probabilidad de solo falle B es:
a) 0
3; b) 0
1; c) 0
06; d) 0
44; e) Todo falso.

20. (09-09-04) Sean A y B dos sucesos de un mismo espacio probabilstico (, A, P). Se cumple siempre que:
a) P(A B) P(A) +P(B) 1;
b) P(A B) = P(A) P(A B);
c) Si A y B son independientes, entonces A y B tambien lo son;
d) P(A B) = P(A) P(B);
e) Todo falso.
21. (07-09-05) Se lanza un dado cuatro veces, la probabilidad de obtener un uno en el primer lanzamiento,
un dos en el segundo, un tres en el tercero y un cuatro en el ultimo es:
a) 1/4; b) 1/15; c) 1/1296; d) 1/54; e) Todo falso.
22. (07-09-05) Una moneda perfecta se lanza hasta que por primera vez aparece dos veces seguidas el mismo
resultado. La probabilidad de que el experimento termine como mucho en el tercer lanzamiento es:
a) 84; b) 05; c) 0333; d) 075; e) Todo falso.
23. (07-09-05) Un conjunto electrico consta de dos componentes A y B. La probabilidad de que falle A es
07 y la probabilidad de que falle B es 04. Entonces la probabilidad de que fallen ambos simultaneamente es:
a) Mayor o igual que 011;
c) 028 si fallan de manera independiente;
e) Todo falso.
b) 028;
d) Menor o igual que 01;
24. (13-02-06) Dos sucesos A y B incompatibles son:
a) Siempre independientes;
c) Independientes si P(A), P(B) > 0;
e) Todo falso.
b) Nunca independientes;
d) Dependientes si P(A), P(B) > 0;
25. (13-02-06) Sean A y B dos sucesos independientes tales que la probabilidad de que ocurran ambos es
1/6 y la probabilidad de que no ocurra ninguno es 1/3. Entonces:
a) P(A) = 1, P(B) = 1/3;
d) P(A) = 1/3, P(B) = 1;
b) P(A) = 1/2, P(B) = 1/3;
e) Todo falso.
c) P(A) = 1/3, P(B) = 1/2;
26. (30-06-06) Si A y B son dos sucesos independientes, tales que P(A) > P(B), P(A B) = 1/2 y
P(A B) = 1/12, entonces:
a) P(A) = 1/3; b) P(A) = 1/4; c) P(B) = 1/4; d) P(B) = 1/3; e) Todo falso.
27. (07-09-06) Sean A, B y C tres sucesos tales que P(A) = 0
2, P(B) = 0
1 y P(C) = 0
8, A y B son
disjuntos, P(A/C) = 1/4 y P(B C) = 0
2. Entonces P(A C) es igual a:

a) 0
2; b) 0
3; c) 0
25; d) 1; e) Todo falso.

28. (07-09-06) Siguiendo con el enunciado anterior, son sucesos independientes:
a) A y B; b) A y C; c) B y C; d) A, B y C; e) Todo falso.
29. (16-02-07) El circuito adjunto trabaja solo si existe una trayectoria de dispositivos en funcionamiento,
de izquierda a derecha. La probabilidad de que cada dispositivo funcione aparece en la gura.
0'95
0'95
0'99
Supongase que los dispositivos fallan de forma independiente. La probabilidad de que el circuito trabaje es
aproximadamente:
a) 0107; b) 0893; c) 0012; d) 0988; e) Todo falso.
30. (16-02-07) En un sistema de almacenamiento en lnea magnetica, el 20 % de las operaciones de lectura
se ven atenuadas por una alineacion indebida entre la cinta magnetica y la cabeza del sistema, mientras que el
resto se realizan de manera correcta. La probabilidad de un error en la lectura por una alineacion indebida es
0
06 y 0
001 por una alineacion correcta. La probabilidad de tener un error en la lectura es:
a) 09872; b) 0061; c) 00128; d) 0939; e) Todo falso.
31. (22-06-07) Dados dos sucesos A y B tales que P(A) = 0
6, P(B/A) = 0
3 y P(A B) = 0
54, se tiene
que P(A/B) es igual a:
a) 010; b) 018; c) 003; d) 025; e) Todo falso.
32. (07-09-07) Un individuo llega a casa completamente ebrio y se encuentra con que tiene en su bolsillo 4
llaves que es incapaz de diferenciar, de las que solo una abre la puerta. Al intentar abrir, elige al azar una llave,
la prueba y si no abre, lo intenta con otra. Teniendo en cuenta que su estado es tal que no es capaz de separar
las llaves ya utilizadas, cual es la probabilidad de que tenga que realizar no mas de 2 intentos para abrir la
puerta?
a) 1/2; b) 7/16; c) 61/125; d) 3/5; e) Todo falso.
33. (07-09-07) Laura es una estudiante de 2
o
de Industriales que ademas milita en Organizaciones Sociales
y Ecologistas (OSE). Han pasado 10 a nos y los tres sucesos siguientes son posibles: A = {Laura trabaja como
Ingeniera en una Central Nuclear}, B = {Laura trabaja como Ingeniera en una Central Nuclear y sigue militando
activamente en OSE} y C = {Laura trabaja como Ingeniera en una Central Nuclear o no trabaja en ning un
sitio}. Las probabilidades de estos tres sucesos se ordenan as:
a) P(A) P(B) P(C);
d) P(B) P(A) P(C);
b) P(C) P(A) P(B);
e) Todo falso.
c) P(C) P(A) P(B);
34. (18-02-08) Un individuo llega a casa completamente ebrio y se encuentra con que tiene en su bolsillo 4
llaves que es incapaz de diferenciar. Al intentar abrir la puerta elige al azar una llave, la prueba y si no abre,
lo intenta con otra. Teniendo en cuenta que, a pesar de su estado, es capaz de separar las llaves que ya ha
utilizado, cual es la probabilidad de que tenga que realizar no mas de 2 intentos para abrir la puerta?
a) 1/2; b) 7/16; c) 61/125; d) 3/5; e) Todo falso.
35. (18-02-08) La probabilidad de que un dispositivo A falle es 0
5, la probabilidad de que falle otro dispositivo

B es 0
3 y la probabilidad de que fallen los dos es 0
2. Entonces la probabilidad de que:

a) Al menos uno falle es 0
6;
c) Ninguno de los dos falle es 0
4;
e) Falle B pero no falle A es 0
1.
b) Exactamente uno de los dos falle es 0
4;
d) Falle A pero no falle B es 0
3;
36. (18-02-08) Una sociedad con 30 miembros elige entre ellos los puestos de presidente, secretario y tesorero.
Cuantas directivas diferentes se pueden formar?
a) 3; b) 24360; c) 460; d) 90; e) Todo falso.
37. (18-02-08) Juan es uno de los miembros de la sociedad anterior. La probabilidad de que no sea elegido
para ninguno de los tres cargos es:
a) 09; b) 01; c) 03; d) 05; e) Todo falso.
38. (26-06-08) En un colectivo de 50 personas, 32 son varones, 41 son espa noles y 26 son varones espa noles.
Si se eligen al azar 10 de esas personas, la probabilidad de que exactamente 4 sean mujeres extranjeras es:
a) 0; b) 05; c) 0025; d) 075; e) Todo falso.
39. (26-06-08) En el codigo Morse cada smbolo se representa por una sucesion de puntos y rayas. El n umero
de smbolos distintos que se pueden representar por una sucesion de 5 o menos puntos y rayas, si no se considera
la posibilidad de espacios en blanco, es:
a) 64; b) 62; c) 32; d) 2; e) Todo falso.
40. (05-09-08) Consideremos el lanzamiento de dos dados y los siguientes sucesos: A=en el primer dado sale
el 3, B=en el primer dado sale par y C=en el segundo dado sale par. El suceso A B C representa:
a) En el primer dado sale 1 o 5;
b) En el primer dado sale un n
o
distinto de 3 y en el segundo sale par;
c) En el segundo dado sale par;
d) En ambos dados sale par;
e) Todo falso.
41. (05-09-08) Siguiendo con el enunciado de la pregunta anterior, la probabilidad P(A B C) es:
a) 1/6; b) 5/12; c) 12/5; d) 1/2; e) Todo falso.
42. (02-07-09) Un nuevo sistema hidraulico va a probarse en una de las dos plantas de una empresa. La
probabilidad de que se pruebe en la planta A es de 1/4 y de que sea en la planta B es de 3/4. Si se prueba en
la planta A, hay una probabilidad 0
2 de que falle; dicha probabilidad es 0
1 en caso de ser probado en la B.

Cual es la probabilidad de que dicho sistema falle en la empresa?
a) 005; b) 0125; c) 06; d) 095; e) Todo falso.
43. (02-07-09) Bajo las hipotesis de la pregunta anterior, si el sistema ha fallado, cual es la probabilidad de
que se haya probado en la planta B?
a) 005; b) 0125; c) 06; d) 095; e) Todo falso.
Las tres preguntas siguientes hacen referencia al siguiente enunciado: En una cesta hay seis pares de alpargatas
de distintos n umeros (cada par) y se extraen tres alpargatas.
44. (16-09-09) La probabilidad de que sean de distinto n umero, si se extrajo sin reemplazamiento, es:
a) 8/11; b) 5/23; c) 1/11; d) 100/231; e) Todo falso.
45. (16-09-09) La probabilidad de que sean de distinto n umero, si se extrajo con reemplazamiento, es:
a) 8/11; b) 2/9; c) 1/216; d) 5/9; e) Todo falso.
46. (16-09-09) La probabilidad de que sean de distinto n umero y todas del pie izquierdo, si se extrajo con
reemplazamiento, es:
a) 3/8; b) 1/8; c) 5/72; d) 5/9; e) Todo falso.
N
o
Solucion N
o
Solucion N
o
Solucion N
o
Solucion N
o
Solucion
1. c) 2. b) 3. a) 4. e) 5. c)
6. c) 7. b) 8. c) 9. e) 10. a)
11. c) 12. c) 13. b) 14. d) 15. b)
16. b) 17. d) 18. d) 19. b) 20. a), b), c)
21. c) 22. d) 23. c) 24. d) 25. b), c)
26. a), c) 27. a) 28. e) 29. d) 30. c)
31. d) 32. b) 33. c), d) 34. a) 35. a), b), c), d), e)
36. b) 37. a) 38. a) 39. b) 40. b)
41. b) 42. b) 43. c) 44. a) 45. d)
46. c)
Practica 2 de ordenador Tema 2, 107
PR
ACTICA 2 DE ORDENADOR.
2.2. Probabilidad.
En las clases de teora se ha comentado que la frecuencia relativa de un suceso tiende a estabilizarse cuando el
n umero de repeticiones del experimento aleatorio aumenta. Surge as el concepto frecuentista de probabilidad,
como un n umero al que converge la frecuencia relativa cuando el n umero de repeticiones tiende a innito.
As pues, si denotamos por f
n
(A) la frecuencia relativa de A en n repeticiones del experimento aleatorio,
entonces:
P(A) = lm
n
f
n
(A).
La aproximacion de la probabilidad por la frecuencia relativa no puede hacerse cuando el tama no muestral n
es peque no. Esto se hace evidente al lanzar una moneda: aunque la probabilidad de cara es 0
5, podemos tirar
cuatro veces y no haber obtenido ninguna cara. La estabilidad de f
n
(A) se obtiene para valores grandes de n.
Para comprobar esto, vamos a simular el lanzamiento de una moneda y calcular la frecuencia relativa del
resultado ser cara (n
o
de caras dividido entre n
o
de lanzamientos). Con esto, iremos observando como, a medida
que aumenta el n umero de tiradas (n), la frecuencia relativa se parece cada vez mas a 0
5.
Nos situamos en la hoja Moneda del archivo pr02.xls.
En dicha hoja, hay una primera lnea descriptiva y una segunda lnea con dos n umeros. El primero de ellos
es un 0 si el lanzamiento es una CRUZ y un 1 si es una CARA. El segundo calcula la frecuencia relativa en
esas tiradas; como en principio solo hay una, calcula la frecuencia relativa con un tama no muestral n = 1.
Se nalamos las casillas A2 y B2 y nos desplazamos hacia abajo hasta la la 21.
Con esto hemos simulado el lanzamiento de una moneda 20 veces. En la segunda columna tenemos las
frecuencias relativas al nal de cada lanzamiento.
Vamos a Insertar Graco y elegimos en Tipo de graco la opcion Lneas. Pinchamos en Siguiente.
En Serie - Valores insertamos los valores de la segunda columna, que son los correspondientes a las
frecuencias relativas y son lo que queremos representar.
Observamos como se comporta la frecuencia relativa con 1, 2, ..., 20 tiradas.
Volvemos a seleccionar las casillas A2 y B2 y movemos hasta la la 21, para generar una nueva muestra,
observando las modicaciones que se producen en el graco.
Volvemos a seleccionar las casillas A2 y B2 y movemos hasta la la 101, para generar una nueva muestra
de 100 lanzamientos. Para que el graco recoja esta modicacion, lo seleccionamos pinchando sobre el y
con el boton de la derecha del raton, elegimos la opcion Datos de origen. En Serie - Valores, en lugar
de B2:B21, escribimos B2:B101. Con esto generamos el graco para 100 lanzamientos.
Repetir el proceso para 1000 lanzamientos y observar como la frecuencia relativa ya esta mucho mas
estabilizada en torno al 0
5.
En ocasiones, lo que nos parece logico o natural no lo es tanto. Vamos a ver como ejemplo de lo anterior una
paradoja clasica.
En un concurso televisivo, un concursante ha llegado a la nal y le proponen elegir uno de los tres sobres que
el presentador le ofrece. Se sabe que en uno de ellos hay un premio muy sustancioso y en los otros dos no
hay nada. El concursante elige uno de los sobres. De los otros dos sobres restantes, el presentador (que sabe
de antemano donde esta el premio), le abre uno de los sobres donde no hay premio. Una vez hecho esto, el
presentador tienta al concursante con la opcion de que cambie la eleccion inicial o siga con ella. Que debe
hacer?. Si nos preguntamos cual es la probabilidad de ganar el premio si se mantiene en su primera eleccion y
de ganar el premio si cambia al sobre que no ha abierto el presentador, lo habitual es considerar que quedan
dos sobres, con lo cual ambas probabilidades son 1/2.
Vamos a simular a ver si es cierto lo que nos indica la intuicion. Para ello nos situamos en la hoja Concurso del
chero que tenemos abierto. En dicha hoja ya aparece simulada una nal del concurso descrito. La simulacion
es, al igual que ocurre en la vida real, distinta en cada caso, por lo que no tienen porque coincidir los valores
obtenidos con los del ejemplo que vamos a considerar en este guion.
Como puede verse en la gura siguiente, en nuestro ejemplo el premio estaba en el sobre 1 (casilla A2, el
concursante elige el sobre 2 (casilla B2) y el presentador nos abre el sobre 3 (casilla C2). As, si no cambia,
puesto que el premio estaba en el 1 y eligio el 2, no ganara, lo que viene representado por un 0 en la casilla
E2. Sin embargo, si cambia, puesto que el eligio inicialmente el 2 y el presentador le abrio el 3, cambiara al 1
(casilla D2, con lo que ganara el premio. Esto se representa mediante un 1 en la casilla F2.
Para simular 150 veces que llegamos a la nal, deberamos seleccionar las casillas A2:F2 y arrastrarlas hasta
la lnea 151. Puesto que se etiqueta con un 1 el ganar y con un 0 el perder, el n umero de unos en la columna
E coincide con el n umero de veces que ganara el premio si no cambia la eleccion inicial. De la misma forma, el
n umero de unos en la columna F corresponde con el n umero de veces que ganara el premio si cambia la eleccion
inicial. Para obtener estos valores, nos situamos en la casilla E152 y tecleamos
=SUMA(E2:E151)
con lo que obtenemos el n umero de veces, de las 150 simuladas, que ganara el premio si se mantiene en la
eleccion inicial.
Si seleccionamos la casilla E152 y la arrastramos hacia la derecha, obtenemos en la casilla F152 el n umero de
veces que ganara si cambia de eleccion.
Al realizar esta operacion, es muy posible que el n umero que apareca en la casilla E151 cambie, esto es porque
cada vez que realizamos una operacion, Excel vuelve a simular todo el experimento, es decir, al arrastrar hacia
la derecha hemos hecho que aparezcan los resultados correspondientes a otras 150 nales distintas.
Si observamos los valores de las casillas E152 y F152, vemos como distan bastante de ser parecidos, lo que pone
en entredicho la suposicion inicial de que la probabilidad de ganar si cambiaba era la misma que si no cambiaba
(1/2). En realidad esta simulacion pone de maniesto que es mucho mas conveniente cambiar que no cambiar,
a pesar de lo que deca nuestra intuicion. Esta solucion que dabamos inicialmente (la probabilidad es 1/2) es
erronea, puesto que no estamos teniendo en cuenta la informacion anterior de la existencia de 3 sobres, de los
que uno sin premio ya se ha eliminado, es decir, estamos trabajando con probabilidades sin mas y deberamos
trabajar con probabilidades condicionadas.
Vamos a ver dos formas de obtener las probabilidades de ganar sin cambiar o cambiando. La primera de ellas
es trivial y simplemente se traslada a un problema de conteo. La segunda es una resolucion mas matematica, a
traves del teorema de Bayes.
Metodo 1.
Podemos calcular ambas probabilidades dividiendo el n umero de casos favorables entre el n umero de casos
posibles, en primer lugar si no cambiamos la eleccion y en segundo lugar si la cambiamos. Supongamos,
sin perdida de generalidad que el concursante ha elegido el sobre 1 y vamos ir viendo que pasa seg un
donde este el premio.
Premio Si no cambia Si cambia
Sobre 1 Gana Pierde
Sobre 2 Pierde Gana
Sobre 3 Pierde Gana
Con lo cual, seg un lo anterior se tiene que
P(ganar si no cambia) =
1
3
y P(ganar si cambia) =
2
3
.
Metodo 2
Denamos los siguientes sucesos:
S
i
= el concursante elige inicialmente el sobre i, i = 1, 2, 3;
P
i
= el premio realmente esta en el sobre i, i = 1, 2, 3.
El espacio muestral esta formado por los 9 sucesos (S
i
P
j
), cada uno de ellos con probabilidad 1/9. Si, por
ejemplo, elegimos el sobre 1, la probabilidad de ganar es:
P(P
1
/S
1
) =
P(P
1
S
1
)
S
1
=
1/9
1/3
=
1
3
.
Supongamos ahora que el concursante ha elegido el sobre 1 (si fuese uno de los otros dos el razonamiento
es totalmente analogo). Representemos por
A
i
= el presentador abre el sobre i y muestra que no tiene premio, i = 1, 2, 3.
En este caso el espacio muestral viene dado por cuatro sucesos {A
2
P
1
, A
2
P
3
, A
3
P
1
, A
3
P
2
}, con probabili-
dades
P(A
2
P
3
) = P(P
3
) = 1/3, P(A
3
P
2
) = P(P
2
) = 1/3,
P(A
2
P
1
) = P(P
1
)P(A
2
/P
1
) =
1
3
1
2
=
1
6
, P(A
3
P
1
) = P(P
1
)P(A
3
/P
1
) =
1
3
1
2
=
1
6
.
La probabilidad de ganar si el concursante no cambia su eleccion inicial sigue siendo 1/3, puesto que
P(P
1
/A
2
) =
P(P
1
A
2
)
P(A
2
)
=
P(P
1
A
2
)
P(P
1
A
2
) +P(P
2
A
2
) +P(P
3
A
2
)
=
=
P(A
2
/P
1
)P(P
1
)
P(A
2
/P
1
)P(P
1
) +P(A
2
/P
2
)P(P
2
) +P(A
2
/P
3
)P(P
3
)
=
1/2 1/3
1/2 1/3 + 0 1/3 + 1 1/3
=
1
3
.
Analogamente se demuestra que P(P
1
/A
2
) = 1/3, es decir, si elegimos el sobre 1, nos abra el sobre que
nos abra (el 2 o el 3, claro), la probabilidad de ganar si no cambiamos nuestra eleccion es 1/3.
La probabilidad de ganar cambiando de sobre es igual a la probabilidad de que el premio este en el sobre
que no muestra el presentador. Supongamos que una vez que hemos elegido el 1, el nos muestra el 3,
entonces la probabilidad de ganar es:
P(P
2
/A
3
) =
P(P
2
A
3
)
P(A
3
)
=
P(P
2
A
3
)
P(P
1
A
3
) +P(P
2
A
3
) +P(P
3
A
3
)
=
=
P(A
3
/P
2
)P(P
2
)
P(A
3
/P
1
)P(P
1
) +P(A
3
/P
2
)P(P
2
) +P(A
3
/P
3
)P(P
3
)
=
1 1/3
1/2 1/3 + 1 1/3 + 0 1/3
=
2
3
.
Analogamente se comprueba que si nos muestra la puerta 2, entonces P(P
3
/A
2
) = 2/3.
La razon por la que es conveniente el cambio es que el sobre que abre (suceso A
i
) no es independiente
de donde esta el premio (suceso P
j
), es decir, el sobre que abre nos da informacion sobre donde esta el
premio. Para probar esto matematicamente, es suciente con demostrar que estos dos sucesos no son
independientes. Por ejemplo,
P(P
2
A
3
) = 1/3 = P(P
2
)P(A
3
) = 1/3 1/2.
Esta dependencia (informacion) hace que convenga reconsiderar la decision inicial y cambiar de sobre
siempre.
2.3. Asignacion de Probabilidad.
El Excel tiene implementadas algunas formulas importantes en la Combinatoria. Dichas funciones se encuentran
dentro de la categora Matematicas y trigonometra y son:
COMBINAT(N;n) devuelve el n umero combinatorio N sobre n, es decir, el
n umero de combinaciones sin repeticion de N elementos
tomados de n en n. Su valor es: C
N,n
=
_
N
n
_
=
N!
n!(Nn)!
.
FACT(N) devuelve el factorial de N, es decir, el n umero de
permutaciones de N elementos.
Su valor es: P
N
= N! = N(N 1)(N 2) (3)(2)(1).
MULTINOMIAL(n
1
; n
2
; . . . ; n
r
) devuelve el coeciente multinomial, es decir, el n umero
de permutaciones con repeticion de
N = n
1
+n
2
+. . . +n
r
elementos, uno de los cuales se
repite n
1
veces, otro n
2
veces, ..., y otro n
r
veces.
Su valor es: PR
n
1
,...,n
r
N
=
(n
1
+n
2
+...+n
r
)!
n
1
!n
2
!n
r
!
.
Con estas funciones, podemos resolver algunos problemas de asignacion de la probabilidad, como, por ejemplo,
analizar el resultado de un sorteo simplicado de lotera primitiva.
La lotera primitiva es un juego en el que se eligen 6 n umeros de los 49 posibles. Se obtiene premio si de estos 6
n umeros, salen al menos 3 el da del sorteo. As pues, como se sacan 6 bolas de 49, el n umero de combinaciones
distintas en este sorteo son
_
49
6
_
.
As pues, la probabilidad de tener exactamente 3 aciertos es:
P(3 aciertos) =
casos favorables
casos posibles
=
_
6
3
__
43
3
_
_
49
6
_
cuyo valor se puede obtener en Excel si nos situamos en la casilla B2 de la hoja Lotera y escribimos:
= COMBINAT(6;A2)*COMBINAT(43;6-A2)/COMBINAT(49;6)
con lo que se obtiene que la probabilidad de obtener exactamente tres aciertos es 0
0177, es decir, en media 1
77
de cada 100 veces se tienen 3 aciertos.
TEMA 3.- VARIABLES ALEATORIAS.
APUNTES DE TEOR
IA.
Cuando estaba escribiendo mi libro [Stochastic Processes] tuve una discusion con William Feller.

El aseguraba que todo
el mundo deca variable aleatoria (random variable), mientras que yo sostena que se usaba variable al azar (chance
variable). Obviamente, debamos usar el mismo nombre en nuestros libros, as que optamos por tomar la decision mediante
un procedimiento aleatorio: lanzamos una moneda y el gano. (J.L. Doob)
3.1. Introduccion.
Normalmente, los resultados posibles (espacio muestral ) de un experimento aleatorio no son valores numericos.
Por ejemplo, si el experimento consiste en lanzar de modo ordenado tres monedas al aire, para observar el n umero
de caras (C) y cruces (X) que se obtienen, el espacio muestral asociado a dicho experimento aleatorio sera:
= {CCC, CCX, CXC, CXX, XCC, XCX, XXC, XXX}
En muchas ocasiones no estamos tan interesados en conocer todos los detalles de los resultados del experimento
y nos bastara con conocer una magnitud numerica asociada al resultado. Por ejemplo, si estamos decidiendo
sobre la calidad de un lote de productos sujetos a inspeccion de calidad por atributos, y examinamos una
muestra de esos productos, lo unico que nos importa del resultado es el n umero de productos defectuosos en
la muestra. En general, resulta mas facil utilizar valores numericos en lugar de trabajar directamente con los
elementos de un espacio muestral como el anterior. As preferimos identicar los sucesos {CXX, XCX, XXC}
con el valor numerico 1 que representa el n umero de caras obtenidas al realizar el experimento. De este modo
aparece el concepto de variable aleatoria unidimensional.
Denicion 3.1.1 Toda funcion que atribuye un unico n umero real x, a cada resultado del espacio muestral
, recibe el nombre de variable aleatoria, (en lo que sigue v.a.).
: R
() = x
Ejemplo 3.1.1 En el experimento anterior consistente en lanzar tres monedas, se dene la variable aleatoria
n umero de caras del siguiente modo: : IR
(CCC) = 3; (CCX) = (CXC) = (XCC) = 2; (CXX) = (XCX) = (XXC) = 1 y (XXX) = 0.
Observaciones.
La variable aleatoria no recibe el calicativo de aleatoria por el hecho de que atribuya de modo im-
previsible un valor cualquiera a un elemento ya que este valor esta denido de forma precisa
(determinstica). Lo que es imprevisible en realidad, es que al hacer el experimento, no sabemos que ele-
mento de puede ocurrir.
La composicion de una funcion real con una variable aleatoria es tambien variable aleatoria, pues esta de-
nida sobre y a cada elemento suyo le asocia un valor real

IR
h
IR
() h[()]
PROBABILIDAD INDUCIDA
Si denotamos por P(IR) al conjunto de todos los subconjuntos de IR (conjunto de las partes de IR), una v.a.
denida sobre un espacio probabilstico (, A, P), induce una probabilidad P
sobre el espacio (IR, P(IR)).

Denicion 3.1.2 La probabilidad inducida por una v.a. , es una funcion P
denida de la siguiente manera:

P
: P(IR) IR
B P
(B) = P[
1
(B)] = P{ /() B}
Es facil comprobar que P
as determinada cumple los axiomas de Kolmogorov, con lo que tenemos el siguiente

espacio probabilstico (IR, P(IR), P
).
W
x
P(A)
P*((a,b))
R
R
b
a
A= (a,b) x
-1
(
)
Figura 3.1: Una v.a. transmite la estructura probabilstica del espacio muestral a IR.
La probabilidad inducida es una funcion de conjuntos y este tipo de funciones no es facil de manejar por lo que
introducimos una nueva denicion para tratar las probabilidades de los resultados de los experimentos aleatorios
mediante funciones reales de variable real.
Denicion 3.1.3 Sea una v.a. denida sobre un espacio probabilstico (, A, P). La funcion de distribu-
cion de es una funcion denida por:
F : IR IR
x F(x) = P{ x} = P{ /() x} = P{
1
((, x])} = P
((, x]).
Ejemplo 3.1.2 As, en el Ejemplo 3.1.1 (pag. 111), si consideramos que la moneda es equilibrada, la funcion
de distribucion de la v.a. , vendra dada por:
F(x) =
_
_
0 si x < 0
1/8 si x [0, 1)
4/8 si x [1, 2)
7/8 si x [2, 3)
1 si x 3
cuya graca representamos en (b) de la Figura 3.2.
(b) (a)
0 1 2 3 x 0 1 2 3 x
1
6/8
1/8
3/8
1
6/8
1/8
3/8
P F
Figura 3.2: (a) Distribucion de Probabilidad de . (b) Funcion de Distribucion de .
A pesar de tratarse de un ejemplo, en la anterior funcion de distribucion ya se pueden apreciar las propiedades
de estas funciones, que resumimos en la siguiente proposicion.
Proposicion 3.1.1 Cualquier funcion de distribucion F, verica:
1. F() = lm
x
F(x) = 0;
2. F(+) = lm
x+
F(x) = 1;
3. F es no decreciente, es decir, si x
1
< x
2
F(x
1
) F(x
2
);
4. F es continua por la dcha., es decir, lm
x
n
x
+
0
F(x
n
) = F(x
0
).
Las cuatro propiedades caracterizan a las funciones de distribucion, e incluso algunos autores denen una funcion
de distribucion como una funcion real de variable real que verica las propiedades de la Proposicion 3.1.1. Sin
embargo, una funcion de distribucion no tiene porque ser continua, como se aprecia en el ejemplo anterior,
donde la funcion es discontinua por la izda. en x = 0, 1, 2, 3. El conjunto de puntos de discontinuidad de una
funcion de distribucion es a lo sumo numerable. En esos puntos x
0
, F(x
0
) = lm
xx
0
F(x) = P{ < x
0
} = F(x
0
).
En general, P{ = x
0
} = F(x
0
) F(x
0
).
La relacion entre la probabilidad de que una v.a. tome valores en un intervalo y los valores de la funcion de
distribucion en los extremos se ve en la siguiente proposicion.
Proposicion 3.1.2 Para cualquier v.a. , se cumple:
a) P{a < b} = F(b) F(a);
b) P{a < < b} = F(b
) F(a);
c) P{a b} = F(b) F(a
);
d) P{a < b} = F(b
) F(a
).
Demostracion:
Demostraremos los apartados a) y b) y dejamos al alumno la demostracion de los restantes.
a) P(a < b) = P
((a, b]) = P
((, b] (, a]) = P
((, b]) P
((, a]) = F(b) F(a).

b) P(a < < b) = P
((a, b] {b}) = P
((a, b]) P
({b}) = F(b) F(a) [F(b) F(b
)].
3.2. Clasicacion de las variables aleatorias.
En esta seccion proponemos una clasicacion de las variables aleatorias a partir de sus funciones de distribucion,
precisando, que la clasicacion no constituye una particion pues existen variables que no van a poder ser incluidas
en ninguno de los dos grupos que estableceremos.
Basandonos en la funcion de distribucion de una variable, podemos clasicarla en discreta o continua del siguiente
modo:
Denicion 3.2.1 Una variable aleatoria se dice que es discreta si su funcion de distribucion es escalonada,
o de manera equivalente, si existe un subconjunto A IR nito o innito numerable tal que P{ A} = 1.
Denicion 3.2.2 Si A = {x
1
, x
2
, . . . , x
n
, . . . } y denotamos por p
i
= P{ = x
i
}, i = 1, 2, . . . , n, . . ., entonces la
coleccion {p
i
}
i=1
recibe el nombre de distribucion de probabilidad de la v.a. .
En la siguiente gura representamos la v.a. del Ejemplo 3.1.1 (pag. 111) con su probabilidad inducida.
Figura 3.3: Equivalencia entre las probabilidades calculadas directamente sobre el espacio muestral de resul-
tados del e.a., y las calculadas sobre el subconjunto {0, 1, 2, 3} IR mediante la v.a. .
Seg un la anterior denicion podemos ver que una distribucion de probabilidad es una coleccion de n umeros
reales positivos que suman uno.
A partir de la distribucion de probabilidad de una v.a. discreta podemos conocer su funcion de distribucion, ya
que: F(x) =
x
i
x
p
i
. Recprocamente, a partir de la funcion de distribucion de una v.a. discreta podemos conocer
su distribucion de probabilidad, puesto que se verica la siguiente igualdad: p
i
= P{ = x
i
} = F(x
i
) F(x
i
).
Por ultimo, la distribucion de probabilidad de una v.a. nos permite conocer la probabilidad de que la misma,
tome valores en cualquier subconjunto B de IR; en efecto: P{x
i
B} =
x
i
B
p
i
.
Los anteriores conceptos pueden visualizarse en la Figura 3.2 en la v.a. del Ejemplo 3.1.1.
Denicion 3.2.3 Una v.a. se dice que es continua o que sigue una distribucion continua si su funcion de
distribucion F es absolutamente continua, es decir, si existe una funcion f 0, tal que:
F(x) =
f(t)dt, x IR.
La funcion f, recibe el nombre de funcion de densidad es unica casi seguro, y cumple que
f(t)dt = 1.
Cualquier funcion no negativa tal que su integral sobre IR es uno, es una funcion de densidad. Por su parte
la funcion de distribucion F de una v.a. continua es continua y derivable c.s.
2
y en los puntos en los que es
derivable cumple
d
dx
F(x) = f(x), por lo que podemos caracterizar la distribucion de una v.a. continua, a traves
de su funcion de distribucion o por medio de su funcion de densidad, ya que conocida una cualquiera de ellas
conocemos la otra. Ademas, P{ B} =
B
f(t)dt analogamente al caso discreto.
2
Observacion.- En estadstica se dice que una propiedad se verica casi seguro (c.s.) si la probabilidad del conjunto en donde
esa propiedad no es cierta es cero, o de manera equivalente, si la probabilidad del conjunto en donde esa propiedad es cierta es uno.
f
F
Figura 3.4: Funcion de distribucion F, calculada a partir de la funcion de densidad f.
Observacion.
Para cualquier v.a. continua , la probabilidad de que sea igual a un punto aislado x
0
es cero, ya que por
ser F continua P{ = x
0
} = F(x
0
) F(x
0
) = 0.
La probabilidad de que una v.a. continua tome valores en un intervalo cualquiera, es igual a la diferencia
de los valores de su funcion de distribucion en los extremos del mismo, ya que, por ser continua, el lmite
de F en un punto coincide con su valor en el mismo.
a b
Figura 3.5: Probabilidad de que una v.a. este entre a y b, calculada a partir de su funcion de densidad f.
P{a b} = P{a < b} =
P{a < b} = P{a < < b} = F(b) F(a)
3.3. Momentos de las variables aleatorias.
En el estudio de la distribucion de una v.a. es esencial el estudio de algunas caractersticas numericas asocia-
das llamadas parametros. En esta seccion estudiaremos: los momentos y sus funciones y algunos parametros
ordenados.
Denicion 3.3.1 Se denomina esperanza matematica, media o valor esperado de una v.a. , al valor:
= E() =
_
x
i
P( = x
i
) si es discreta
xf
(x)dx si es continua
supuesto que las anteriores series e integrales sean absolutamente convergentes, en caso contrario se dice que la
esperanza de esa v.a. no existe.
E() tambien se denomina esperanza de la distribucion de , ya que dos variables con la misma distribucion
tienen la misma esperanza. La esperanza puede considerarse como el centro de gravedad de la distribucion de
probabilidad de una v.a. discreta, o de la funcion de densidad, si la v.a. es continua.
Esta denicion podemos considerarla un caso particular de la siguiente.
Denicion 3.3.2 Se denomina esperanza matematica, de un transformado de la v.a. , al valor:
E[g()] =
_
g(x
i
)P( = x
i
) si es discreta
g(x)f
(x)dx si es continua
supuesto que las anteriores series e integrales sean absolutamente convergentes.
Algunas propiedades de la esperanza las recogemos en la siguiente proposicion.
Proposicion 3.3.1 a) Si una v.a.
c.s.
= c, entonces E() = c.
b) E(a +b) = aE() +b.
c) E(g() +h()) = E(g()) +E(h()).
d) Si existe una constante a tal que P{ < a} = 0, entonces E() a.
e) Si existe una constante b tal que P{ > b} = 0, entonces E() b.
Demostracion:
a) La v.a. es discreta, por lo que E() = c P{ = c} = c 1 = c.
Las propiedades b), c) y d) las demostraremos suponiendo que la v.a. es continua, las demostraciones en
el caso discreto son similares. La demostracion del apartado e) es analoga a la del apartado d).
b) E(a + b) =
(ax + b)f
(x)dx =
axf
(x)dx +
bf
(x)dx = a
xf
(x)dx + b
(x)dx =
aE() +b.
c) E(g()+h()) =
(g(x)+h(x))f
(x)dx =
g(x)f
(x)dx+
h(x)f
(x)dx == E(g())+E(h()). Por

la asociatividad de la suma, esta propiedad se mantiene para la suma de un n umero nito de transformados
de una misma v.a.
d) P{ < a} =
(x)dx = 0, luego f
(x)
c.s.
= 0, x < a. Lo que implica que:
E() =

a
xf
(x)dx a

a
f
(x) = a.
Intuitivamente la media es un n umero entorno al cual oscilan los valores de la variable, pero no se puede
pretender que por si sola sea capaz de sintetizar toda la informacion sobre una variable aleatoria. De hecho, una
de las causas que mas ha contribuido al descredito de la estadstica ha sido el abuso de la media como medida
resumen del comportamiento de fenomenos aleatorios, sobre todo cuando la dispersion de la variable que los
codica es muy acusada. Por ello, se hace necesario introducir otros parametros que informen sobre la magnitud
de las oscilaciones.
Denicion 3.3.3 Se denomina varianza de una v.a. , al valor:
2
= Var() = E[ E()]
2
.
As pues, la varianza es un caso particular de E[g()] (Denicion 3.3.2 (pag. 116)), considerando en este caso
que g(x) = [x E()]
2
.
Algunas propiedades de la varianza las resumimos en la siguiente proposicion.
Proposicion 3.3.2 a) V ar() = 0 si y solo si
c.s.
= c.
b) V ar() = E(
2
) E
2
().
c) V ar(a ) = a
2
V ar().
d) V ar( +b) = V ar().
e) V ar() 0.
Demostracion
a) Demostraremos solo la condicion suciente, aunque la condicion necesaria tambien es cierta.
Si
c.s.
= c, por a) de la Proposicion 3.3.1 (pag. 116), E() = c, V ar() = [c E()]
2
P{ = c} = 0.
b) V ar() = E[ E()]
2
= E[
2
+E
2
() 2 E()] = E[
2
] +E
2
() 2E() E() = E(
2
) E
2
().
c) V ar(a ) = E[(a )
2
] [E(a )]
2
= E(a
2

2
) [a E()]
2
= a
2
E(
2
) a
2
E
2
() = a
2
[E(
2
) E
2
()] =
a
2
V ar().
d) V ar( +b) = E[( +b) E( +b)]
2
= E[ +b E() b]
2
= E[ E()]
2
= V ar().
e) Como ( E())
2
0, y por d) de la Proposicion 3.3.1, V ar() 0.
Denicion 3.3.4 Se denomina desviacion tpica de una v.a. , y se denota por , a la raz cuadrada positiva
de la varianza, es decir,
= +
V ar().
Denicion 3.3.5 Se denomina momento respecto al origen de orden k de una v.a. , al valor, si existe:
k
() = E(
k
).
(La notacion se reduce a
k
, cuando no hay posibilidad de confusion.)
Se dice que existe el momento de orden k si y solo si E(|
k
|) < .
El momento de primer orden
1
es la esperanza.
Denicion 3.3.6 Se denomina momento central de orden k, o momento respecto a la media de orden
k de una v.a. , al valor:
k
= E[ E()]
k
.
La anterior denicion es un caso particular de E[g()], cuando g(x) = [x E()]
k
.
El momento central de orden dos es la varianza, es decir:
2
=
2
.
Otros momentos de orden superior (tercero y cuarto) intervienen en los coecientes de asimetra y apuntamiento,
cuyas deniciones coinciden con las dadas en el primer tema.
La media de una v.a. es un parametro de centralizacion, otro parametro del mismo tipo es la mediana que ya
hemos denido en el tema uno para distribuciones de frecuencias, y que denimos ahora de manera mas general.
Denicion 3.3.7 Un punto M, se dice que es mediana de una v.a. , (o de la distribucion de ), si verica
que: P{ M}
1
2
y P{ M}
1
2
.
O, en terminos de la funcion de distribucion F, de : una mediana es un punto M que satisface dos requisitos:
F(M)
1
2
y F(M
)
1
2
. Evidentemente, en el caso particular que sea continua, la mediana es el punto M
tal que F(M) =
1
2
.
a b
1/2
1/2
M
1/2
M
Figura 3.6: Determinacion de las medianas a partir de la funcion de distribucion en tres casos. En el primer
caso todos los puntos del intervalo [a, b] son medianas, en los otros dos existe una unica mediana.
Seg un la denicion anterior toda distribucion debe tener al menos una mediana y para algunas distribuciones
todos los puntos de alg un intervalo pueden ser medianas.
La mediana es un caso particular de una serie de parametros, llamados parametros ordenados, que denimos a
continuacion.
Denicion 3.3.8 Para todo p (0, 1), x
p
se dice que es un cuantil de orden p de una v.a. , si verica que:
P{ x
p
} p y P{ x
p
} 1 p. O bien si F(x
p
) p y F(x
p
) p.
Al igual que en el tema uno cuando p = k/4, x
p
recibe el nombre de cuartil de orden k. Si p = k/10, x
p
recibe
el nombre de decil de orden k. Si p = k/100, x
p
recibe el nombre de centil de orden k.
Tambien de la misma manera que en el tema uno denamos la moda para una distribucion de frecuencias,
daremos la misma denicion para distribuciones de variables aleatorias.
Denicion 3.3.9 La moda de una v.a. (o de la distribucion de la v.a.) es un punto en el que la distribucion
de probabilidad alcanza su valor maximo. Si el maximo se alcanza en mas de un punto, todos esos puntos se
dice que son modas de la distribucion.
No debe extra narnos la coincidencia de las deniciones de este tema con las que habamos visto en el tema uno.
En realidad, puesto una distribucion de frecuencias relativas es una coleccion de valores positivos que suman
uno, es un caso particular de distribucion de probabilidad, todas las deniciones que acabamos de dar que se
reeren a distribuciones de probabilidad tienen como casos particulares a las dadas en el tema uno y que se
referan a distribuciones de frecuencias relativas que heredan sus propiedades.
3.4. Funciones de una variable aleatoria.
Como habamos observado al principio del tema una funcion h : IR IR transforma a una v.a. en una nueva
v.a. = h(), seg un el esquema

IR
h
IR
() h[()]
Nuestro objetivo en esta seccion, es encontrar la distribucion de en funcion de la distribucion de , lo que en
general se puede conseguir de la siguiente manera:
F
(y) = P{ y} = P{h() (, y]} = P{ h

1
((, y])} =
_
{x/h(x)y}
P( = x) si es discreta,
h
1
((,y])
f
(x)dx si es continua.
Si la v.a. es discreta y queremos calcular su distribucion de probabilidad, tenemos dos procedimientos para
hacerlo:
1. Calcular su funcion de distribucion como acabamos de ver y aplicar el resultado ya visto P{ = y} =
F
(y) F
(y
).
2. Calcular directamente la distribucion de probabilidad con un procedimiento analogo al usado anterior-
mente para el calculo de la funcion de distribucion, es decir:
P{ = y} = P{h() {y}} = P{ h
1
({y})} =
_
{x/h(x)=y}
P( = x) si es discreta,
h
1
({y})
f
(x)dx si es continua.
Si la v.a. es continua y queremos calcular su funcion de densidad, tambien tenemos dos procedimientos para
hacerlo:
1. Calcular su funcion de distribucion y denir la funcion de densidad como la derivada de la funcion de
distribucion en los reales en los que sea derivable e igualandola a cero en el resto.
2. Utilizar el siguiente teorema:
Teorema 3.4.1 Sea una variable aleatoria continua con funcion de densidad f
y sea (a, b) un intervalo

tal que P{ (a, b)} = 1. Sea g : IR IR, derivable tal que g
(x) = 0 para todo x de (a, b). Sea

(c, d) = g[(a, b)], entonces = g() es una v.a. continua con funcion de densidad:
f
(y) =
_
f
(g
1
(y)) |(g
1
)
(y)| y (c, d),

0 en otro caso.
3.5. Funcion generatriz de momentos.
Hasta ahora, para caracterizar la distribucion de una v.a. y para calcular sus momentos debamos conocer o
su funcion de distribucion o su distribucion de probabilidad en el caso discreto o su funcion de densidad en el
caso continuo. En esta seccion presentamos una funcion que constituye un nuevo instrumento para llevar a cabo
todo lo anterior.
Denicion 3.5.1 Sea una variable aleatoria. La funcion
g
(t) = E(e
t
)
es conocida como la funcion generatriz de momentos (f.g.m.) de la v.a. , si existe la esperanza en alg un
entorno del cero.
Cada vez que hagamos uso de la f.g.m. siempre supondremos que existe.
Evidentemente dos variables igualmente distribuidas tienen la misma f.g.m. y recprocamente, si dos variables
tienen la misma f.g.m. entonces estan igualmente distribuidas.
Veamos algunas propiedades de la f.g.m.
Proposicion 3.5.1 La f.g.m. de una v.a. verica:
a) g
(0) = 1.
b) g
a
(t) = g
(at), para cualquier constante a.

c) g
+b
(t) = e
tb
g
(t).
d)
d
r
dt
r
g
(t)|
t=0
=
r
().
e) g
(t) = 1 +t
1
() +
t
2
2!
2
() +. . . +
t
n
n!
n
() +. . ., si existen todos los momentos de .
Demostracion
a) Evidente ya que E(e
0
) = E(1) = 1.
b) Por las propiedades asociativa y conmutativa del producto E(e
(at)
) = E(e
t(a)
).
c) E(e
t(+b)
) = E(e
tb
e
t
) = e
tb
E(e
t
).
d) Suponemos que es continua,
d
dt
g
(t) =
d
dt
e
tx
f
(x)dx, y dado que se cumplen las condiciones

del teorema de integracion por derivacion respecto de un parametro, la anterior derivada sera igual a
d
dt
e
tx
f
(x)dx =
xe
tx
f
(x)dx.
De manera analoga, por el teorema de induccion llegamos a que
d
r
dt
r
g
(t) =
x
r
e
tx
f
(x)dx, en conse-
cuencia
d
r
dt
r
g
(t)|
t=0
=
x
r
f
(x)dx =
r
().
e) Recordando el desarrollo en serie de e
tx
=
k=0
(tx)
k
k!
, entonces:
E(e
t
) = E
_

k=0
(t)
k
k!
_
=
k=0
t
k
E(
k
)
k!
.
Para demostrar la igualdad anterior hemos supuesto que se verican unas condiciones bastante generales
que se necesitan para generalizar a una suma innita, la propiedad dada en c) de la Proposicion 3.3.1 (pag.
116) que nosotros hemos demostrado para dos sumandos y que se cumple para una suma nita cualquiera.
3.1. Introduccion.
Ejercicio 3.1 Se determina el n umero de bombas en uso en dos gasolineras, una gasolinera de seis bombas y
una de cuatro bombas. Relata los posibles valores de las siguientes variables aleatorias:
a) =n umero total de bombas en uso.
b) =diferencia, en valor absoluto, entre el n umero de bombas en uso en la primera gasolinera y en la
segunda.
c) =n umero de gasolineras que tienen exactamente dos bombas en uso.
Ejercicio 3.2 Tres automoviles se seleccionan al azar y cada uno de ellos se clasica como equipado con motor
diesel (D) o no diesel (G). Si =n umero de automoviles con motor diesel de los tres, enumera cada elemento
del espacio muestral y su correspondiente valor de .
Si la probabilidad de que un coche sea de motor diesel es 0
4, la de que no lo sea es 0
6 y los coches se seleccionan

de forma independiente, obtener la probabilidad inducida por la variable aleatoria para cada uno de los valores
posibles de la misma.
Ejercicio 3.3 Estudiar si las siguientes funciones pueden ser funcion de distribucion de una variable aleatoria
y para las que lo sean, calcular las siguientes probabilidades: P( 1), P( < 1), P( = 1), P( = 2),
P(2 < 50) y P(1 2).
a) F(x) =
_
_
_
0, si x 0
5,
2x+1
4
, si 0
5 < x 1,
1, si 1 < x.
b) F(x) =
_
_
0, si x 1,
x
2
+ 1
3
, si 1 < x 1,
1, si 1 < x.
c) F(x) =
_
_
0, si x < 0,
x/4, si 0 x < 1,
3/4, si 1 x < 4,
1, si 4 x.
Ejercicio 3.4 Sea =n umero de neumaticos con baja presion de un automovil seleccionado al azar.
a) Cual de las siguientes cuatro funciones es una funcion de probabilidad aceptable para ?, por que no se
pueden aceptar las otras tres?
0 1 2 3 4
P
1
5 0
1 0
1 0
2 0
3
P
2
4 0
1 0
2 0
1 0
3
P
3
4 0
1 0
1 0
1 0
3
P
4
3 0
2 0
1 0
05 0
05
b) Para la funcion de probabilidad aceptada en el apartado a), calcular P(2 4), P( = 2), P( 2),
P( < 2) y P( = 0).
c) Obtener la funcion de distribucion (F
(x)) de la v.a. .
Ejercicio 3.5 El tiempo de vida (en meses) de un componente electronico es una variable aleatoria continua
.
f
1
(x) =
_
x2
15
e
x/5
si x > 0,
0 en el resto.
f
2
(x) =
_
e
x/150
si x > 0,
0 en el resto.
f
3
(x) =
_
1
20
e
x/20
si x > 0,
0 en el resto.
f
4
(x) =
_
x
100
2
e
x/75
si x > 0,
0 en el resto.
a) Cual de las cuatro funciones anteriores es una funcion de densidad aceptable para ?, por que no se pueden
aceptar las otras tres?
b) Considerando la funcion de densidad aceptada en el apartado a), cual es la probabilidad de que un com-
ponente elegido al azar dure entre 1 (12 meses) y 3 a nos (36 meses)?, exactamente 3 a nos?, a lo sumo 3
a nos?, menos de 3 a nos?, por lo menos 3 a nos?
c) Obtener la funcion de distribucion (F
(x)) de la v.a. .
Ejercicio 3.6 En cada uno de los siguientes casos calcula, seg un corresponda, la funcion de probabilidad o la
funcion de densidad asociada a la variable aleatoria en estudio:
a) es una v.a. con funcion de distribucion F(x) =
_
_
_
0, si x < 1,
0
3, si 1 x < 1
5,
1, si 1
5 x.
b) es una v.a. continua con funcion de distribucion F(x) =
_
_
_
0, si x 0,
(x
2
x)/2, si 1 < x < 2,
1, si x 2.
3.3. Momentos de las variables aleatorias.
Ejercicio 3.7 Obtener la esperanza, varianza y desviacion tpica en cada uno de los siguientes casos:
a) Si la variable aleatoria es la considerada en el Ejercicio 3.4.
b) Si la variable aleatoria es la considerada en el Ejercicio 3.5.
Ejercicio 3.8 Antes de iniciar las obras, el contratista debe presentar en el departamento de planicacion del
municipio un informe con uno, dos, tres, cuatro o cinco formularios (dependiendo de la naturaleza del proyecto)
para solicitar el permiso de construccion. Sea la variable aleatoria n umero de formularios requeridos en un
informe. La probabilidad de que se requieran x formularios es proporcional a x, es decir, P( = x) = k x, x =
1, 2, . . . , 5.
a) Cual es el valor de k?
b) Cual es la probabilidad de que tenga que entregar, por lo menos, tres formularios?, y entre dos y cuatro
formularios, ambos inclusive?
c) Cual es el n umero medio de formularios requeridos en un informe?
d) Calcular la varianza y la desviacion tpica de .
e) Suponiendo que cada formulario es de 4 hojas y que aparte de estas un informe tiene otras 2 hojas jas de
encabezamiento, cual es el n umero medio de hojas por informe?
Ejercicio 3.9 Supongamos que el error al hacer cierta medicion es una v.a. continua con funcion de densidad:
f(x) =
_
k (4 x
2
) si 2 < x < 2,
0 en el resto.
a) Cual es el valor de k?
b) Cual es la probabilidad de que el error sea mayor que cero?, y el error este entre -1 y 1?
c) Cual es el error medio de medida?
e) Suponiendo que cada error de medida supone un coste adicional a la empresa de 60
2
euros, cual es el
coste adicional medio de una medicion?
Ejercicio 3.10 La duracion, en minutos, de una llamada telefonica de los usuarios de la nueva compa na
ReteAlo2 es una v.a. continua con funcion de densidad:
f(x) =
_
1
10
e
x/10
si x > 0,
0 en el resto.
a) Cual es la duracion medida de una llamada?
b) ReteAlo2 debe pagar a la compa na Telenica, due na de la lnea, 0
02 euros por llamada. Cual es el

importe medio que paga ReteAlo2 a Telenica?
c) ReteAlo2 cobra al usuario 0
2 euros si la llamada es menor de 5 minutos y cobra 0
02x + 0
1 si la llamada
es de x minutos, siendo x mayor o igual de 5. Cual es el ingreso medio por una llamada?
d) Calcular los benecios medios (ingresos - pagos) por una llamada.
3.4. Funciones de una variable aleatoria.
Ejercicio 3.11 Una empresa de electrodomesticos fabrica tres modelos diferentes de congeladores verticales
con capacidad de 350, 450 y 500 litros. Sea la v.a. que mide la capacidad de un congelador. Responde a las
siguientes cuestiones, suponiendo que tiene la siguiente funcion de probabilidad:
350 450 500
p
2 0
5 0
3
a) Si el precio de un congelador con capacidad de litros es = 0
9 10, cual es la funcion de probabilidad

de ?, cual es el precio medio de los congeladores?, cual es la varianza del precio?
b) Mientras que la capacidad nominal de un congelador es , la capacidad real es =
_
325 si 475,

2
5000
si > 475.
Cual es la funcion de probabilidad de ?
Ejercicio 3.12 El tiempo de espera (en segundos) en una estacion de servicio es una variable aleatoria con
la funcion de densidad
f
(x) =
_
1
20
e
x/20
, si x > 0,
0, en el resto.
Determinar la distribucion de la perdida economica (en euros) por cada usuario, si esta viene determinada por
a) =
_
2 si 15,
4 si > 15.
b) = e
2
.
Ejercicio 3.13 El tiempo de fabricacion de una pieza es una v.a. con funcion de densidad:
f
(x) =
_
1/2 si 10 < x < 12,
0 en el resto.
Una caracterstica de la pieza depende del tiempo seg un la relacion 2/. Hallar la funcion de densidad, la media
y la desviacion tpica de dicha caracterstica.
3.5. Funcion generatriz de momentos.
Ejercicio 3.14 Obtener la funcion generatriz de momentos de las siguientes variables aleatorias y, a partir de
ellas obtener la esperanza y la varianza de la variable.
a) con funcion de probabilidad
1 4 8
p
2 0
4 0
4
b) con funcion de densidad
f
(x) =
_
7e
7x
si x > 0,
0 si x 0.
Ejercicio 3.15 El n umero mensual de fallos de una maquina es una v.a. con distribucion:
P( = x) = e
2
2
x
x!
, x = 0, 1, 2, . . . .
Obtener la funcion generatriz de momentos de y a partir de ella obtener la esperanza y la varianza de .
Ejercicio 3.16 Dada una v.a. con funcion de densidad
f(x) =
_
b si 0 < x < a,
0 en el resto.
a) Calcular a y b para que E() = 2.
b) Calcular la funcion generatriz de momentos de .
Examenes.
Ejercicio 3.17 (17-02-04) El tiempo de fabricacion de una pieza es una v.a. con funcion de densidad:
f
(x) =
_
1/2 si 10 < x < 12,
0 en el resto.
Ejercicio 3.18 (21-06-04) El tiempo de vida, en a nos, de un tipo de generador electrico viene representado
por una variable aleatoria con funcion de densidad:
f(x) =
_
4
3
x
2
si 0 < x < 1,
0 en otro caso.
Se pide:
a) Calcular el tiempo medio de vida de un generador electrico de este tipo.
b) Calcular la probabilidad de que un generador dure mas de su media.
c) Obtener la funcion de probabilidad de la variable =
_
1 si > 5/12
0 si 5/12
.
Ejercicio 3.19 (06-07-05) Un producto farmaceutico se distribuye en envases de 100 comprimidos. Dos lneas
de produccion pueden ser utilizadas para envasar el producto con probabilidades 0
45 (lnea I) y 0
55 (lnea II).
Las dos lneas pueden fallar como mucho en dos comprimidos a la hora de llenar los envases. As en la lnea I se
observa que el n umero de comprimidos por envase es de 102, 101, 100, 99 y 98, con probabilidades respectivas
de 0
02, 0
06, 0
88, 0
03 y 0
01 y las probabilidades respectivas para la lnea II son 0
03, 0
08, 0
83, 0
04 y 0
02.
a) Calcular la probabilidad de que un envase tenga el n umero correcto de pldoras.
b) Si un envase tiene el n umero correcto de pldoras, cual es la probabilidad de que proceda de la lnea I?
c) Cual es la probabilidad de que un comprador del producto reciba menos de 100 comprimidos?
Ejercicio 3.20 (30-06-06) El tiempo de vida (en meses) de un tipo de componente es una variable aleatoria
con funcion de densidad:
f
(x) =
_
2xe
x
2
si x > 0,
0 en el resto.
Se pide:
a) Obtener la probabilidad de que un componente cualquiera dure mas de dos meses.
b) Si un componente lleva funcionando dos meses y a un sigue funcionando, calcular la probabilidad de que
falle antes del quinto mes.
c) Obtener la funcion de probabilidad de la variable aleatoria denida por
=
_
2 si 2,
4 si > 2.
d) Obtener la funcion generatriz de momentos de la v.a. .
Ejercicio 3.21 (07-09-06) El tiempo, en horas, que transcurre hasta el primer fallo de una pieza es una
variable aleatoria con funcion de densidad:
f
(x) =
_
ke
0
01x
si x > 0,
0 en el resto.
Se pide:
a) Obtener el valor de k.
b) Si la tasa de fallo asociada a una pieza en el instante x (h
(x)) se dene como:

h
(x) =
f
(x)
1 F
(x)
,
donde F
representa la funcion de distribucion de , obtener el valor de la tasa de fallo a las 25 horas.

c) Una pieza se reemplaza inmediatamente despues de un fallo o, como muy tarde, a las 150 horas de funcio-
namiento. Determinar el tiempo medio de reemplazo de la pieza.
Ejercicio 3.1 a) {0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10}.
b) {0, 1, 2, 3, 4, 5, 6}.
c) {0, 1, 2}.
Ejercicio 3.2
DDD DDG DGD GDD DGG GDG GGD GGG
3 2 2 2 1 1 1 0
3 2 1 0
p
(0
4)
3
3(0
4)
2
(0
6) 3(0
4)(0
6)
2
(0
6)
3
Ejercicio 3.3 a) No, ya que no es continua por la derecha.
b) No, ya que no es continua por la derecha, ni monotona no decreciente.
c) Si es funcion de distribucion, puesto que lm
x
F(x) = 0, lm
x
F(x) = 1, es no decreciente y continua por
la derecha. Para esta variable aleatoria se tiene que P( 1) = 3/4, P( < 1) = 1/4, P( = 1) = 1/2,
P( = 2) = 0, P(2 < 50) = 1/4 y P(1 2) = 1/2.
Ejercicio 3.4 a) La unica aceptable es la tercera, puesto que la segunda y la cuarta no suman uno, y la
primera tiene valores negativos.
b) P(2 4) = 0
5, P( = 2) = 0
1, P( 2) = 0
6, P( < 2) = 0
5 y P( = 0) = 0
6.
c) F
(x) = P( x) =
_
_
0 si x < 0,
0
4 si 0 x < 1,
0
5 si 1 x < 2,
0
6 si 2 x < 3,
0
7 si 3 x < 4,
1 si 4 x.
Ejercicio 3.5 a) La unica aceptable es la tercera, puesto que la segunda y la cuarta no integran uno, y la
primera toma valores negativos.
b) P(12 < < 36) = e
12/20
e
36/20
= 0
384, P( = 36) = 0, P( 36) = 1 e

36/20
= 0
835,
P( < 36) = 1 e
36/20
= 0
835 y P( 36) = 1 P( < 36) = e

36/20
= 0
165.
c) F
(x) = P( x) =
_
0 si x 0,
1 e
x
20
si x > 0.
Ejercicio 3.6 a) Como F es escalonada, la variable es discreta, con lo cual queda caracterizada si conocemos
su funcion de probabilidad. En este caso dicha funcion es:
1 1
5
p
3 0
7
b) Al tratarse de una v.a. continua, debemos obtener su funcion de densidad:
f(x) =
d
dx
F(x) =
_
x
1
2
si 1 < x < 2,
0 en el resto.
Ejercicio 3.7 a) Para la variable del Ejercicio 3.4 se tiene que:
Esperanza: E() =
4
x=0
x P( = x) = 0(0
4) + 1(0
1) + 2(0
1) + 3(0
1) + 4(0
3) = 1
8,
Varianza: V ar() = E(
2
) (E())
2
=
4
x=0
x
2
P( = x) (1
8)
2
=
(0
2
(0
4) + 1
2
(0
1) + 2
2
(0
1) + 3
2
(0
1) + 4
2
(0
3)) 3
24 = 6
2 3
24 = 2
96,
Desviacion tpica:
V ar() =
96 = 1
72.
b) Para la variable del Ejercicio 3.5 se tiene que:
Esperanza: E() =
xf
3
(x)dx =

0
x
1
20
e
x/20
dx = 20,
Varianza: V ar() = E(
2
) (E())
2
=
x
2
f
3
(x)dx (20)
2
=

0
x
2
1
20
e
x/20
dx 400 =
800 400 = 400,
Desviacion tpica:
V ar() =
400 = 20.
Ejercicio 3.8 La resolucion completa de los apartados b) a e) de este ejercicio se puede ver en la Practica 3,
pagina 137.
a) k = 1/15.
b) P( 3) = 4/5 = 0
8, P(2 4) = 3/5 = 0
6.
c) E[] = 11/3 = 3
67.
d)
2
V ar[] = 15 (11/3)
2
= 14/9 = 1
56, = +
14/9 = 1
25.
e) E[4 + 2] = 4 E[] + 2 = 4 3
67 + 2 = 16
68.
Ejercicio 3.9 a) k = 3/32.
b) P( > 0) = 1/2 = 0
5 y P(1 1) = 11/16 = 0
6875.
c) E[] = 0.
d)
2
V ar[] = E[
2
] (E[])
2
= 4/5 0
2
= 4/5 = 0
8, = +
8 = 0
894.
e) E[60
2
] = 60 E[
2
] = 60
4
5
= 48.
Ejercicio 3.10 a) E[] = 10.
b) Si denotamos por la v.a. cantidad pagada a telenica por ReteAlo2, se tiene que = 0
02. As pues,
la media pedida es E[] = E[0
02] = 0
02E[] = 0
02(10) = 0
2 euros.
c) Si denotamos por la v.a. cantidad ingresada por ReteAlo2, se tiene que
= g() =
_
0
2 si < 5,
0
02 + 0
1 si 5.
As pues, la media pedida es E[] = E[g()] =
g(x)f(x)dx =
(0
2)f(x)dx+
5
(0
02x+0
1)f(x)dx =
5
0
(0
2)
1
10
e
x/10
dx +
5
(0
02x + 0
1)
1
10
e
x/10
dx = 0
0787 + 0
2426 = 0
3213, puesto que

g(x) =
_
0
2 si x < 5,
0
02x + 0
1 si x 5.
d) Si denotamos por la v.a. benecios de ReteAlo2, se tiene que
= h() =
_
0
2 0
02 si < 5,
0
1 si 5.
As pues, la media pedida es E[] = E[h()] =
h(x)f(x)dx =
(0
20
02x)f(x)dx+
5
(0
1)f(x)dx =
5
0
(0
2 0
02x)
1
10
e
x/10
dx +
5
(0
1)
1
10
e
x/10
dx = 0
1213, puesto que h(x) =

_
0
2 0
02x si x < 5,
0
1 si x 5.
Ejercicio 3.11 a) E[] = 390
5 y V ar[] = E[
2
] (E[])
2
= 154697
5 (390
5)
2
= 2207
25, puesto que

305 395 440
p
2 0
5 0
3
b) La funcion de probabilidad de es
325 450
p
7 0
3
Ejercicio 3.12 a)
2 4
p
1 e
3/4
= 0
528 e
3/4
= 0
472
b) f
(y) =
_
1
40y
ln(y)
e
ln(y)/20
si y > 1,
0 en el resto.
Ejercicio 3.13 Puesto que es continua y g
(x) =
2
x
2
< 0, x (10, 12), aplicando el Teorema 3.4.1 (pag.
119) tenemos que
f
(y) =
_
f
(g
1
(y)) |(g
1
(y))
| si y g((10, 12))
0 en el resto
=
_
f
(2/y) |
2
y
2
| si y (
1
6
,
1
5
)
0 en el resto
=
_
1
y
2
si
1
6
< y <
1
5
0 en el resto
De aqu se obtiene que E[] =
1/5
1/6
y
1
y
2
dy = ln(6/5) = 0
1823 y que =
V ar[] =
1
30
(0
1823)
2
= 0
0096,
puesto que V ar[] = E[
2
] (E[])
2
=
1/5
1/6
y
2 1
y
2
dy (0
1823)
2
=
1
30
(0
1823)
2
.
Ejercicio 3.14 a) Por denicion tenemos que
g
(t) = E[e
t
] =
x
i
e
x
i
t
P( = x
i
) = e
t
0
2 +e
4t
0
4 +e
8t
0
4.
As pues,
E[] = g
(t)|
t=0
= e
t
0
2 + 4e
4t
0
4 + 8e
8t
0
4|
t=0
= 5,
E[
2
] = g
(t)|
t=0
= e
t
0
2 + 16e
4t
0
4 + 64e
8t
0
4|
t=0
= 32
2,
V ar[] = E[
2
] (E[])
2
= 32
2 5
2
= 7
2.
b) En primer lugar vamos a calcular la funcion generatriz de momentos de la v.a. continua que nos da
el enunciado. Por denicion tenemos que
g
(t) = E[e
t
] =
e
xt
f
(x)dx =

0
e
xt
7e
7x
dx = 7

0
e
x(t7)
dx = 7
e
x(t7)
t 7
_
0
=
7
7 t
,
donde hemos supuesto que |t| 7, pues en otro caso las expresiones que se van obteniendo no tendran
sentido.
Para calcular la esperanza de , no tenemos mas que calcular la derivada de la funcion generatriz en cero,
puesto que hemos visto en teora que E[
k
] = g
k)
(0).
Teniendo en cuenta que g
(t) =
7
(7t)
2
, entonces g
(0) =
7
7
2
, con lo cual se tiene que E[] =
1
7
.
Para calcular la varianza de vamos a aplicar que V ar[] = E[
2
] (E[])
2
y que E[
2
] = g
(0).
Puesto que g
(t) =
7
(7t)
2
, se tiene que g
(t) =
14
(7t)
3
y por tanto E[
2
] = g
(0) =
14
7
3
=
2
49
. As pues,
V ar[] = E[
2
] (E[])
2
=
2
49

_
1
7
_
2
=
1
49
.
Ejercicio 3.15 Puesto que es una v.a. discreta, se tiene que
g
(t) = E[e
t
] =
x
e
xt
P( = x) =
x=0
e
xt
e
2
2
x
x!
= e
2
x=0
(2e
t
)
x
x!
= e
2
e
2e
t
= e
2(e
t
1)
.
Para calcular la esperanza, simplemente debemos derivar la funcion anterior y evaluarla en cero:
g
(t)|
t=0
= e
2(e
t
1)
2e
t
|
t=0
= 2.
Puesto que V ar[] = E[
2
] (E[])
2
y E[
2
] = g
(t)|
t=0
, se tiene que
V ar[] =
_
e
2(e
t
1)
2e
t
+e
2(e
t
1)
(2e
t
)
2
|
t=0
_
(2)
2
= 2 + 4 4 = 2.
Ejercicio 3.16 a) a = 4 y b = 1/4.
b) g
(t) =
_
e
4t
1
4t
si t = 0
1 si t = 0
.
Ejercicio 3.17 Vease la solucion del Ejercicio 3.13.
Ejercicio 3.18 a) Puesto que se trata de una v.a. continua, su media o esperanza se obtiene como sigue:
E[] =
x f(x)dx =
x 0dx +
1
0
x
_
4
3
x
2
_
dx +

1
x 0dx =
= 0 +
4
3
x
2
2

x
4
4
_
1
0
+ 0 =
_
4
6

1
4
_
(0 0) =
5
12
.
b) Nos piden que calculemos P( >
5
12
). Por simplicidad en los calculos, vamos a obtener esta probabilidad a
traves de la de su complementario. As pues,
P
_
>
5
12
_
= 1 P
_

5
12
_
= 1
5/12
f(x)dx =
1
5/12
0
4
3
x
2
dx = 1
4
3
x
x
3
3
_
5/12
0
= 1 0
5314 = 0
4686.
c) es una variable aleatoria discreta que toma los valores 0 y 1 con probabilidades:
0 1
P
5314 0
4686
puesto que P( = 1) = P( > 5/12) = 0
4686, P( = 0) = P( 5/12) = 0
5314, teniendo en cuenta los

resultados obtenidos en el apartado anterior.
Ejercicio 3.19 Si denotamos por I el suceso el producto se ha envasado en la lnea I, por II el producto
se ha envasado en la lnea II y por la v.a. n umero de comprimidos en un envase, los datos del enunciados
nos proporcionan se pueden reescribir como:
P(I) = 0
45 P(II) = 0
55
102 101 100 99 98
P
/I
002 006 088 003 001
102 101 100 99 98
P
/II
003 008 083 004 002
Con estos datos podemos responder a los apartados del ejercicio:
a) La probabilidad pedida se puede obtener como sigue:
P( = 100) = P( = 100 I) +P( = 100 II) = P( = 100/I)P(I) +P( = 100/II)P(II) =
(0
88)(0
45) + (0
83)(0
55) = 0
8525.
b) Puesto que se supone como cierto que = 100, la probabilidad que nos piden es:
P(I/ = 100) =
P( = 100 I)
P( = 100)
Apto.a)
=
(0
88)(0
45)
0
8525
= 0
4645.
c) Este apartado es similar al primero, as,
P( < 100) = P( < 100 I) +P( < 100 II) = P( < 100/I)P(I) +P( < 100/II)P(II) =
(P( = 98/I) +P( = 99/I))P(I) + (P( = 98/II) +P( = 99/II))P(II) =
(0
01 + 0
03)(0
45) + (0
02 + 0
04)(0
55) = 0
051.
Ejercicio 3.20 a) La probabilidad pedida es:
P( > 2) =

2
2xe
x
2
dx = e
x
2
_
2
= 0 (e
2
2
) = e
4
0
018.
b) La probabilidad pedida es:
P( < 5/ > 2) =
P(2 < < 5)
P( > 2)
=
5
2
2xe
x
2
dx
e
4
=
e
x
2
_
5
2
e
4
=
e
4
e
25
e
4
= 1 e
21
1.
c) La funcion de probabilidad de la variable aleatoria discreta es, en funcion de la probabilidad obtenida
anteriormente,
2 4
P
982 0
018
d) En vista de la funcion de probabilidad de , se tiene que la funcion generatriz de momentos es:
g
(t) = E(e
t
) = e
2t
P( = 2) +e
4t
P( = 4) = 0
982e
2t
+ 0
018e
4t
.
Ejercicio 3.21 a) Si observamos que la funcion de densidad de sigue la forma de una exponencial, vemos
automaticamente que k = 0
01. En otro caso, podemos obtener el valor de k simplemente resolviendo la

ecuacion:
1 =
(x)dx,
con lo que
1 =

0
ke
0
01x
dx = 100ke
0
01x
_
0
= 100k k =
1
100
= 0
01.
b) La tasa de fallo en 25 es:
h
(25) =
f
(25)
1 F
(25)
=
f
(25)
1 P( 25)
=
f
(25)
P( > 25)
=
0
01e
0
25
25
0
01e
0
01x
dx
=
0
01e
0
25
e
0
25
= 0
01.
c) Si denotamos por la variable aleatoria que denota el tiempo transcurrido hasta el reemplazo de la pieza,
se tiene que = mn{, 150}, con lo que
E() = E(mn{, 150}) =
mn{x, 150}f
(x)dx =

0
mn{x, 150}0
01e
0
01x
dx
=
150
0
(x)0
01e
0
01x
dx +

150
(150)0
01e
0
01x
dx = 44
2175 + 33
4695 = 77
687 horas.
PREGUNTAS DE TEST.
Examenes.
Las preguntas 1. a 4. hacen referencia al siguiente enunciado: Supongamos que el error al hacer cierta medicion
es una v.a. con funcion de densidad:
f(x) =
_
k(1 x
2
) si 1 < x < 1
0 en otro caso
1. (19-06-03) El valor de k es:
a) -1; b) -2; c) -3; d) 0; e) Todo falso.
2. (19-06-03) El error medio de medida es:
a) -1; b) -2; c) -3; d) 0; e) Todo falso.
3. (19-06-03) La probabilidad de que el error este entre -01 y 01 es:
a) 1; b) 092; c) 01495; d) 0; e) Todo falso.
4. (19-06-03) Suponiendo que cada error de medida supone un coste adicional de 60
2
euros. El coste medio
adicional de una medicion es:
a) 1; b) 0; c) -1495; d) 120; e) Todo falso.
5. (19-06-03) Supongamos que la funcion de distribucion de una v.a. esta representada en la gura adjunta.
Entonces:
1 2 3 4 5 6
1/2
a) Se trata de una v.a. continua;
d) Una mediana de es 5;
b) Una mediana de es 1/2;
e) Todo falso.
c) Una mediana de es 05;
Las preguntas 6. y 7. hacen referencia al siguiente enunciado: Supongamos que el error al hacer cierta medicion
f(x) =
_
k(1 x)
2
si 1 < x < 1
0 en otro caso
6. (09-09-03) El valor de k es:
a) 3/8; b) -2; c) 8/3; d) 0; e) Todo falso.
7. (09-09-03) El error medio de medida es:
a) -1/2; b) -2/3; c) -4/3; d) 0; e) Todo falso.
8. (09-09-03) Si la funcion de distribucion de una v.a. viene dada por:
F(x) =
_
_
0 si x < 0
1/8 si 0 x < 1
4/8 si 1 x < 2
7/8 si 2 x < 3
1 si 3 x
entonces una mediana de es:
a) 15; b) 1; c) 05; d) 2; e) Todo falso.
9. (09-09-03) La media de la v.a. de la pregunta anterior es:
a) 05; b) 15; c) -05; d) 35; e) Todo falso.
Las preguntas 10. a 13. hacen referencia al siguiente enunciado: Supongamos que el n umero de veces que falla
un sistema informatico es una v.a. con distribucion de probabilidad:
P( = x) =
_
k
2
x
x!
si x = 0, 1, 2, . . .
0 en otro caso.
10. (17-02-04) El valor de k es:
a) -1; b) -2; c) -3; d) 0; e) Todo falso.
11. (17-02-04) El n umero medio de fallos es:
a) -1; b) -2; c) -3; d) 2; e) Todo falso.
12. (17-02-04) La probabilidad de que el n umero de fallos este entre -01 y 01 es:
a) 1; b) 092; c) e
2
; d) 0; e) Todo falso.
13. (17-02-04) Suponiendo que existe un coste adicional de
2
euros. El coste medio adicional es:
a) 1; b) 6; c) -1495; d) 120; e) Todo falso.
Las preguntas 14. y 15. hacen referencia al siguiente enunciado: Supongamos que la medida de los diametros de
los tubos fabricados en una factora es una v.a. con funcion de densidad:
f(x) =
_
k(2x 1) si 1 < x < 2
0 en otro caso.
14. (21-06-04) Se tiene que:
a) El valor de k es 2;
c) No es una funcion de densidad por ser decreciente;
e) Todo falso.
b) La mediana de es 05;
d) P( = 1
5) = 0
5;
15. (21-06-04) El diametro medio de los tubos es:
a) -1; b) -2; c) -3; d) 19/12; e) Todo falso.
16. (09-09-04) Sea una v.a. de media y varianza
2
y sea c una constante cualquiera. Entonces E[( c)
2
]
es siempre igual a:
a)
2
c
2
; b) 0, si c = 0; c) ( c)
2
; d)
2
+
2
+c
2
2c; e) Todo falso.
Las tres preguntas siguientes hacen referencia al siguiente enunciado: Se dene una v.a. como el valor obtenido
al lanzar un dado que se construyo de forma que la probabilidad de cada cara es inversamente proporcional a
su n umero, esto es, P( = i) = k/i, con i = 1, 2, . . . , 6.
17. (13-02-06) El valor de k es:
a) -100; b) -1; c) -2; d) -3; e) Todo falso.
18. (13-02-06) El valor esperado de es:
a) 33; b) -35; c) 120/49; d) 2/5; e) Todo falso.
19. (13-02-06) La varianza de es:
a) -33; b) -1114; c) -3/2; d) -2/3; e) Todo falso.
2
y sea c una constante cualquiera. Entonces V ar( c)
es siempre igual a:
a)
2
c
2
; b)
2
c
2
; c) ( c)
2
; d)
2
; e) Todo falso.
21. (07-09-06) Un dado irregular es tal que la cara 5 tiene probabilidad 05 de aparecer. Todas las demas
caras son equiprobables entre s, repartiendo la probabilidad restante 05. Sea la variable aleatoria puntuacion
en un lanzamiento. Sea F
la funcion de distribucion de . Se tiene que:

a) F
(5) = 0
5; b) F
(2) = 0
2; c) F
(1) = 0
1; d) F
(3) = 0
3; e) Todo falso.
22. (16-02-07) Se realiza un control de calidad sobre la coloracion y la reduccion del tama no en un proceso de
fabricacion de partes moldeadas en plastico. Si consideramos la v.a. que nos mide el n umero de caractersticas
conformes, dicha variable toma los valores 0, 1 y 2 con probabilidades 0
04, 0
32 y 0
64, respectivamente. Si
denotamos por F
(x) el valor de la funcion de distribucion de en el punto x, se tiene que:

a) F
(1) = 0
36; b) F
(2) = 1; c) F
(4) = 1; d) F
(0) = 0
04; e) Todo falso.

23. (16-02-07) Si es una variable aleatoria con E() = 3, V ar() = 4 y = 3 + 2, entonces:
a) V ar() = 13; b) V ar() = 48; c) V ar() = 36; d) E() = 11; e) Todo falso.
2
y sea k una constante cualquiera, entonces V ar(k )
es siempre igual a:
a) k
2
2
; b)
2
k
2
; c) ( k)
2
; d) k
2
; e) Todo falso.
25. (07-09-07) Sea una variable aleatoria con funcion de probabilidad
0 1 2
P
3 0
5 0
2
. Si F
(x) repre-
senta el valor de la funcion de distribucion de en un punto x, se tiene que:
a) F
(1) = 0
8; b) F
(2) = 0
2; c) F
(0
5) = 0
3; d) F
(3) = 1; e) Todo falso.

26. (07-09-07) Sea una variable aleatoria con funcion de probabilidad
0 2
P
3 0
7
. Si g
(t) representa
el valor de la funcion generatriz de momentos de en un punto t, se tiene que:
a) g
(0) = 1; b) g
(2) = 6
8456; c) g
(0) = 0
3245; d) g
(1) = 5
4723; e) g
(1) = 1.
27. (18-02-08) La funcion de densidad de una v.a. es f
(x) = e
x
, si x a y f
(x) = 0, en el resto. El valor

de a es:
a) 1; b) +; c) 0; d) -1; e) Todo falso.
28. (18-02-08) Siguiendo con la variable de la pregunta 27., la funcion de distribucion de es igual a:
a) f
(x), x IR; b) 1 e
x
si x > 0; c) 1 e
x
si x < 0; d) 1 +e
x
si x < 0; e) Todo falso.
29. (18-02-08) Siguiendo con la variable de la pregunta 27., su esperanza E() es igual a:
a) 1; b) 0; c) -05; d) -1; e) Todo falso.
30. (18-02-08) Siguiendo con la variable de la pregunta 27., su varianza V ar() es igual a:
a) 1; b) 0; c) -05; d) -1; e) Todo falso.
31. (26-06-08) Sea una variable aleatoria continua con funcion de densidad f
(x) = 3x
2
para todo x (0, 1)
y f
(x) = 0 en el resto. El valor de su funcion de distribucion en 0
5, F
(0
5), es igual a:
a) 1; b) 0
125; c) 0
875; d) 0
75; e) Todo falso.

32. (26-06-08) Sea una variable aleatoria continua con funcion de distribucion F
tal que F
(x) = 3x
3x
2
+x
3
para todo x (0, 1). El valor de su funcion de densidad en 0
5, f
(0
5), es igual a:
a) 1; b) 0
125; c) 0
875; d) 0
75; e) Todo falso.

33. (05-09-08) Sea una variable aleatoria con E() = 6 y V ar() = 3. Sea = 3
2
+ 1, entonces E() es
igual a:
a) 118; b) 18; c) 100; d) 11; e) Todo falso.
34. (05-09-08) Sea una variable aleatoria discreta que toma los valores 1 y 2 con probabilidades: P( =
1) = 0
6 y P( = 2) = 0
4. La funcion generatriz de es:

a) g
(t) = 0
6e
t
+ 0
4e
2t
;
d) g
(t) = 1
4;
b) g
(t) = e
0
6t
+ 2e
0
4t
;
e) Todo falso.
c) g
(t) = e
3t
;
Las tres preguntas siguientes hacen referencia al siguiente enunciado: Una caracterstica de la se nal recibida por
una antena se comporta como una v.a. con funcion de densidad f(x) = ke
|x|
para todo x (, ).
35. (02-07-09) El valor de la constante k es:
a) 0; b) 1; c) -1; d) -3; e) Todo falso.
36. (02-07-09) El valor medio de es:
a) 0; b) 1; c) -1; d) -3; e) Todo falso.
37. (02-07-09)Si consideramos una nueva v.a. denida como = || + 2, entonces el valor de la funcion de
distribucion de en el punto 1, es decir, F
(1), es aproximadamente:
a) -0345; b) 0973; c) 0234; d) 0159; e) Todo falso.
38. (16-09-09) Si la distribucion de probabilidad de la variable aleatoria =n
o
de defectos en un aparato
viene dada por
0 1 2
P
80 0
15 0
05
se tiene que:
a) La media de es 525;
d) La mediana de es 15;
b) La varianza de es -23;
e) Todo falso.
c) La desviacion tpica de es 16;
39. (16-09-09) Se puede asegurar que la funcion f(x) =
_
k x si 1 < x < 2,
0 en el resto,
es:
a) Funcion de densidad para todo k IR;
c) Funcion de densidad para alg un k IR;
e) Todo falso.
b) Funcion de distribucion para todo k IR;
d) Funcion de distribucion para alg un k IR;
N
o
Solucion N
o
Solucion N
o
Solucion N
o
Solucion N
o
Solucion
1. e) 2. d) 3. c) 4. e) 5. d)
6. a) 7. a) 8. a), b), d) 9. b) 10. e)
11. d) 12. c) 13. b) 14. e) 15. d)
16. d) 17. e) 18. c) 19. e) 20. d)
21. b), c), d) 22. a), b), c), d) 23. c), d) 24. a) 25. a), c), d)
26. a), d) 27. c) 28. e) 29. d) 30. a)
31. b) 32. d) 33. a) 34. a) 35. e)
36. a) 37. e) 38. e) 39. c)
PR
Si abrimos el chero pr03.xls tenemos los datos relativos al Ejercicio 3.8 (pag. 122) de los problemas de clase,
cuyo enunciado era:
Ejercicio 3.8. Antes de iniciar las obras, el contratista debe presentar en el departamento de planicacion del
municipio un informe con uno, dos, tres, cuatro o cinco formularios (dependiendo de la naturaleza del proyecto)
para solicitar el permiso de construccion. Sea la variable aleatoria n umero de formularios requeridos en un
informe. La probabilidad de que se requieran x formularios es proporcional a x, es decir, P( = x) = k x, x =
1, 2, . . . , 5.
b) Cual es la probabilidad de que tenga que entregar, por lo menos, tres formularios?, y entre dos y cuatro
formularios, ambos inclusive?
c) Cual es el n umero medio de formularios requeridos en un informe?
e) Suponiendo que cada formulario es de 4 hojas y que aparte de estas un informe tiene otras 2 hojas jas de
encabezamiento, cual es el n umero medio de hojas por informe?
Vamos a ir resolviendo dicho ejercicio apartado a apartado:
b) La probabilidad de que tenga que entregar, por lo menos, tres formularios es
P( 3) = P( = 3) +P( = 4) +P( = 5),
con lo cual nos podemos colocar en la casilla D12, teclear la siguiente expresion:
=SUMA(B4:B6) y obtener que la probabilidad pedida es 080.
La probabilidad de que tenga que entregar entre dos y cuatro formularios, ambos inclusive, es
P(2 4) = P( = 2) +P( = 3) +P( = 4).
Para obtener este resultado debemos sumar estas probabilidades, lo que lo conseguimos al situarnos en una
celda (por ejemplo en la celda D13) y teclear =SUMA(B3:B5). As obtenemos que dicha probabilidad
es 060.
c) El n umero medio de formularios requeridos en un informe es la media de . Puesto que es una v.a. discreta,
la media o esperanza se obtiene como sigue
E[] =
5
x=1
x P( = x) = 1 0
07 + 2 0
13 + 3 0
20 + 4 0
27 + 5 0
33.
La forma de obtener esta suma en Excel podra pasar por construir una columna formada por cada valor x
multiplicado por su probabilidad. Dicha columna es la columna C que se ha etiquetado como P
. Nos
ponemos en la casilla C2 y tecleamos =A2*B2, con lo que obtenemos el producto para el primer valor
de . Nos ponemos en la esquina inferior derecha de dicha celda, de forma que el smbolo del raton se
transforma en el smbolo y arrastramos hasta la celda C6. Con esto obtenemos los productos para todos
los valores de . Si nos situamos en la celda C7 y tecleamos =SUMA(C2:C6) obtenemos el valor medio
de formularios requeridos, que es 367.
d) La varianza de se puede calcular como V ar[] = E[
2
] (E[])
2
. Puesto que ya conocemos la media de
del apartado anterior, solo nos falta por calcular E[
2
]. Al ser una v.a. discreta se tiene que
E[
2
] =
5
x=1
x
2
P( = x) = 1
2
0
07 + 2
2
0
13 + 3
2
0
20 + 4
2
0
27 + 5
2
0
33.
Para calcular esta suma con Excel, construimos en la columna D el producto de cada valor de al cuadrado
por su probabilidad, es decir, cada valor de
2
P
. Procedemos como en el apartado anterior, en la casilla D2

tecleamos =A2
2*B2 y arrastramos hasta la casilla D6. En la celda D7 tecleamos =SUMA(D2:D6),

con lo que obtenemos que E[
2
] es 15. Nos colocamos en la celda D8 y tecleamos =D7-C7
2, es decir, la
varianza de , que resulta ser 156.
Puesto que la desviacion tpica es la raz cuadrada positiva de la varianza, podemos obtener el valor de
si nos situamos en la celda D9 y tecleamos =RAIZ(D8). As pues,
= 125.
e) Puesto que queremos calcular la media o esperanza de 4 +2, por las propiedades de la esperanza tenemos
que
E[4 + 2] = 4 E[] + 2.
Como en la casilla C7 tenemos el valor de E[], no tenemos mas que teclear =4*C7+2, con lo que
obtenemos que E[4 + 2] es 1668.
AS COMUNES.
APUNTES DE TEOR
IA.
El comportamiento probabilstico de una v.a. queda descrito por su distribucion. A menudo, las observaciones
que se generan en diferentes experimentos tienen el mismo tipo general de comportamiento. En consecuencia, las
variables aleatorias asociadas con estos experimentos se pueden describir esencialmente con la misma distribucion
y, por tanto, sus funciones de distribucion, distribuciones de probabilidad o funciones de densidad tienen la
misma representacion analtica pudiendo variar en valores concretos de algunos parametros. As por ejemplo, si
consideramos el experimento consistente en lanzar una vez una moneda, la v.a. = n umero de caras, tiene la
siguiente distribucion de probabilidad: P{ = x} = p
x
1
(1p
1
)
(1x)
con x = 0, 1 y la v.a. = n umero de veces que
sale un dos, en el experimento consistente en lanzar un dado tiene por distribucion de probabilidad: P{ = x} =
p
x
2
(1p
2
)
(1x)
con x = 0, 1. Siendo p
1
y p
2
las probabilidades de obtener una cara y un dos, en los experimentos
respectivos. Si p
1
= p
2
, las dos variables tienen la misma distribucion a pesar de, evidentemente, que no
son iguales. Por otra parte esas dos distribuciones podemos considerarlas casos particulares de la distribucion
P{ = x} = p
x
(1 p)
(1x)
con x = 0, 1.

Este sera nuestro modo de actuar, para estudiar el comportamiento
de las variables aleatorias, agrupamos sus distribuciones en clases. Dos distribuciones distintas de la misma
clase solo varan en las asignaciones de los parametros, como ocurre con las distribuciones de las variables y
anteriores. Los valores de los parametros sirven para identicar a los distintos miembros de una familia o clase
parametrica.
Comenzaremos con algunas de las principales distribuciones discretas y terminamos el tema estudiando algunas
de las distribuciones continuas mas importantes.
4.1. Distribucion de Bernoulli.
Si queremos determinar si un suceso A ha sucedido (exito) o no (fracaso) al realizar un experimento, podemos
considerar la v.a. denida como sigue:
: IR
() =
_
1 si A,
0 si / A.
Esta variable es discreta, puesto que solo puede tomar dos valores (el 0 y el 1). As pues,
P( = 1) = P(A) = p (0, 1),
P( = 0) = P(A) = 1 p = q (0, 1).
Denicion 4.1.1 Se dice que una v.a. sigue una distribucion de Bernoulli de parametro p, y se re-
presenta por B(1, p), si esta variable solo puede tomar los valores 1 y 0 con la siguiente distribucion de
probabilidad:
P( = x) =
_
p si x = 1
q si x = 0
o lo que es lo mismo
P( = x) = p
x
q
1x
, x = 0, 1 ,
donde q representa el valor 1 p.
Media.
E[] = 0 q + 1 p = p E[] = p
Varianza.
V ar[] = E[
2
] (E[])
2
= (0
2
q + 1
2
p) p
2
= p(1 p) = p q V ar[] = p q
Funcion generatriz de momentos.
g
(t) = E[e
t
] = e
0t
q +e
1t
p = q +e
t
p g
(t) = q +e
t
p
Tambien podramos haber comenzado calculando la funcion generatriz de momentos, para luego obtener la
media y la varianza a partir de ella. Observemos, por ejemplo, como
E[] = g
(t)|
t=0
= p e
t
|
t=0
= p.
4.2. Distribucion Binomial.
La variable aleatoria surge de la realizacion de forma independiente de n experiencias y el recuento del n umero
de exitos obtenidos en ellas. Puede que no aparezca ning un exito, o uno, o dos, . . . , o que las n experiencias
proporcionen exito, con lo que los valores posibles seran 0, 1, 2, . . . , n; si suponemos que los resultados son
independientes, la probabilidad de un suceso como el
A A
k)
. . . A A
nk)
. . . A
correspondiente a k exitos sera, con la notacion empleada en la seccion anterior, p
k
q
nk
; ahora bien, la variable
ha sido determinada de modo que no tiene en cuenta la posicion ocupada por los exitos, sino solo el n umero de
estos, con lo que habra
PR
k,nk
n
=
n!
k!(nk)!
=
_
n
k
_
(esto es, las permutaciones con repeticion de n elementos,
de los cuales uno de ellos se repite k veces y el otro n k veces)
sucesos formados por intersecciones de k exitos y n k fracasos, disjuntos entre s y todos ellos con la misma
probabilidad calculada anteriormente. La probabilidad de la union de todos ellos sera la que corresponda al
valor k de la variable aleatoria. Formalmente:
Una v.a. tiene distribucion binomial de parametros n y p, si toma los valores 0, 1, 2, . . . , n con probabi-
lidades dadas por
P( = k) =
_
n
k
_
p
k
q
nk
, k = 0, 1, 2, . . . , n, p (0, 1), n ZZ
+
.
El nombre de la distribucion (representada simbolicamente por B(n, p) que justica la notacion empleada para
la distribucion de Bernoulli) procede de los n umeros combinatorios que aparecen en los valores de probabilidad
y que intervienen en la expresion de las potencias de un binomio seg un la formula de Newton:
(a +b)
n
=
n
k=0
_
n
k
_
a
k
b
nk
.
0
0,05
0,1
0,15
0,2
0 2 4 6 8
1
0
1
2
0
0,05
0,1
0,15
0,2
0,25
0,3
0,35
0,4
0,45
0 1 2 3 4 5
Figura 4.1: Diagrama de barras de las distribuciones B(30, 0
2) y B(5, 0
2).
Precisamente esta formula es la que va a permitir los calculos de las caractersticas de esta distribucion; com-
probaremos en primer lugar que se trata de una autentica distribucion de probabilidad (en la seccion anterior
no se haba hecho por ser evidente) ya que, a la no negatividad de los valores de P( = k) se a nade que
n
k=0
P( = k) =
n
k=0
_
n
k
_
p
k
q
nk
= (p +q)
n
= 1.
El aspecto de la funcion de probabilidad vara, fundamentalmente con el valor del parametro n. La Figura 4.1
muestra el diagrama de barras de la distribucion asociada a dos variables B(30, 0
2) y B(5, 0
2) respectivamente.
Media o esperanza.
La esperanza de la variable binomial viene dada por:
E[] =
n
k=0
kP( = k) =
n
k=1
k
_
n
k
_
p
k
q
nk
= np
n
k=1
(n 1)!
(k 1)!(n k)!
p
k1
q
nk
= np
n
k=1
_
n 1
k 1
_
p
k1
q
nk
= np
n1
j=0
_
n 1
j
_
p
j
q
n1j
= np(p +q)
n1
= np E[] = np
Varianza.
Para la b usqueda de la varianza aplicaremos que V ar[] = E[
2
] (E[])
2
y obtendremos la esperanza del
cuadrado como sigue:
E[
2
] = E[(
2
) +] = E[( 1)] +E[] = E[( 1)] +np.
As pues, solo nos queda calcular E[( 1)]:
E[( 1)] =
n
k=0
k(k 1)P( = k) =
n
k=2
k(k 1)
n!
k!(n k)!
p
k
q
nk
= n(n 1)p
2
n
k=2
(n 2)!
(k 2)!(n k)!
p
k2
q
nk
= n(n 1)p
2
(p +q)
n2
= n(n 1)p
2
E[
2
]
= n
2
p
2
np
2
+np,
y nalmente:
V ar[] = E[
2
] (E[])
2
= n
2
p
2
np
2
+np (np)
2
= np(1 p) = npq V ar[] = npq
En cuanto a la funcion generatriz de momentos, se tiene:
g
(t) = E[e
t
] =
n
k=0
e
kt
P( = k) =
n
k=0
e
kt
_
n
k
_
p
k
q
nk
=
n
k=0
_
n
k
_
(pe
t
)
k
q
nk
= (pe
t
+q)
n
con lo que
g
(t) = (pe
t
+q)
n
4.3. Distribucion Hipergeometrica.
Supongamos que la poblacion en estudio es nita con N elementos, de los cuales D corresponden a exito y, por
lo tanto, N D corresponden a fracaso si son observados. Tambien se supone que cada individuo observado
extraemos n
sin reemplazamiento
D
N-D
Figura 4.2: Experimento que produce una v.a. hipergeometrica.
se retira de la poblacion y no puede observarse nuevamente; en esta condicion radica la diferencia entre la
distribucion binomial y la hipergeometrica que, por lo demas, se dene del mismo modo: n umero de exitos
obtenidos al efectuar n observaciones.
Si razonamos la b usqueda de la probabilidad de que tal n umero de exitos tome un valor k (cuyos lmites
sera preciso establecer) como cociente entre el n umero de casos favorables y el n umero de casos posibles, se
obtiene sin dicultad:
_
D
k
__
ND
nk
_
_
N
n
_
pues cada forma de elegir los k exitos entre los D disponibles se puede combinar con todas las formas de elegir
los fracasos (necesariamente n k) entre los N D disponibles.
Puesto que k no puede superar el valor D, ni el valor n y ademas siempre se mayor o igual que 0 y mayor o igual
que n (N D), se tiene que k ZZ y max{0, n (N D)} k mn{n, D} y se denominara distribucion
hipergeometrica de parametros N, D, n a la de la v.a. que toma tales valores k con probabilidad:
P( = k) =
(
D
k
)(
ND
nk
)
(
N
n
)
, k = max{0, n N +D}, . . . , mn{n, D},
N = 1, 2, . . . , D = 1, 2, . . . , N 1, n = 1, 2, . . . , N,
y se representara de forma simbolica por H(N, D, n).
Media o esperanza.
Teniendo en cuenta las propiedades de los n umeros combinatorios se puede demostrar que
E[] = n
D
N
Varianza.
V ar[] = n
D
N

ND
N

Nn
N1
Cuando N es grande, entonces la distribucion hipergeometrica se puede aproximar por la binomial, lo que indica
que cuando el tama no de la poblacion es grande, no existen grandes diferencias entre realizar el experimento
con reemplazamiento (binomial) o sin el (hipergeometrica). Es decir,
H(N, D, n)
N
D
N
p
B(n, p).
Para comprobarlo calcularemos el lmite de la distribucion de probabilidad de la distribucion hipergeometrica
bajo estas condiciones:
lm
N
D/N p
P( = k) = lm
N
D/N p
_
D
k
__
ND
nk
_
_
N
n
_ = lm
N
D/N p
D(D1)(Dk+1)
k!
(ND)(ND1)(NDn+k+1)
(nk)!
N(N1)(Nn+1)
n!
=
0
0,05
0,1
0,15
0,2
0,25
0,3
0,35
0,4
0,45
0 1 2 3 4 5 6
H(20,3,10)
H(2000,300,10)
B(10,0.15)
Figura 4.3: Comparacion entre las distribuciones H(20, 3, 10), H(2000, 300, 10) y B(10, 0
15).
n!
k!(n k)!
lm
N
D/N p
=
D
N
D 1
N 1

D k + 1
N k + 1
N D
N k
N D 1
N k 1

N D n +k + 1
N n + 1
=
_
n
k
_
p
k
(1 p)
nk
.
Nota: Consideraremos que se puede aplicar esta aproximacion siempre que N > 60 y ademas
n
N
< 0
1.
4.4. Distribucion Geometrica.
La variable aleatoria queda determinada como el n umero de repeticiones independientes de un experimento de
Bernoulli hasta que ocurre el exito (A) por primera vez. Puesto que el exito puede salir en la primera prueba,
en la segunda, etc, estos son los valores que toma la variable. La probabilidad de tomar una de estos valores k
ser a la de una secuencia del tipo:
A A
k1)
. . . A A
que, supuesta la independencia entre los resultados del experimento y con las notaciones habituales, es q
k1
p.
Formalmente:
Una v.a. tiene distribucion geometrica de parametro p si toma los valores 1, 2, . . . , con probabilidades
dadas por
P( = k) = q
k1
p, k = 1, 2, . . . , p (0, 1).
Se trata efectivamente de una distribucion de probabilidad, pues son n umeros positivos y se verica:
k=1
P( = k) =
k=1
q
k1
p = p
k=1
q
k1
= p
q
0
1 q
= p
1
p
= 1,
como se ve tras la aplicacion de la formula de la suma de una serie geometrica (o progresion geometrica ilimitada)
de razon q < 1. De aqu procede el nombre de la distribucion, que representaremos simbolicamente por G(p).
Media o esperanza.
E[] =
k=1
kP( = k) =
k=0
kq
k1
p = p
k=0
kq
k1
= p
k=0
d
dq
[q
k
] = p
d
dq
_

k=0
q
k
_
= p
d
dq
_
1
1 q
_
= p
1
(1 q)
2
=
p
p
2
=
1
p
E[] =
1
p
puesto que se dan las condiciones para obtener la suma de la serie derivada como derivada de la suma de la
serie geometrica de partida.
Varianza.
Aplicando de nuevo esta propiedad se obtiene:
E[( 1)] =
k=1
k(k 1)P( = k) =
k=0
k(k 1)q
k1
p = pq
k=0
k(k 1)q
k2
= pq
k=01
d
2
dq
2
[q
k
] = pq
d
2
dq
2
_

k=0
q
k
_
= pq
d
2
dq
2
_
1
1 q
_
= pq
d
dq
1
(1 q)
2
= pq
2(1 q)
(1 q)
4
=
2q
p
2
,
de donde:
E[
2
] = E[(
2
) +] = E[( 1)] +E[] =
2q
p
2
+
1
p
,
y nalmente:
V ar[] = E[
2
] (E[])
2
=
2q
p
2
+
1
p

1
p
2
=
2q +p 1
p
2
=
q + (q +p) 1
p
2
=
q
p
2
V ar[] =
q
p
2
Para la funcion generatriz de momentos, se obtiene:
g
(t) = E[e
t
] =
k=1
e
kt
P( = k) =
k=1
e
kt
q
k1
p = p
1
q
k=1
(e
t
q)
k
=
p
q
e
t
q
1 e
t
q
=
pe
t
1 e
t
q
g
(t) =
pe
t
1e
t
q
Para que la serie sea convergente se necesita que e
t
q < 1 lo cual es cierto si y solo si
e
t
<
1
q
t < ln(
1
q
) = ln(q),
as pues, la serie converge si, por ejemplo, t (ln(q), ln(q)).
4.5. Distribucion de Poisson.
La distribucion de Poisson se ajusta bien a muchos fenomenos reales, cuando se trata de determinar el n umero
de exitos que se producen en una unidad de conteo, si se supone que la probabilidad de exito muy peque na;
as sucede con la desintegracion de partculas radioactivas, las llamadas a una central telefonica o los clientes
que acuden a un servidor.
Diremos que una v.a. tiene distribucion de Poisson de parametro si toma los valores 0, 1, 2, . . . con
probabilidades dadas por
P( = k) = e

k
k!
, k = 0, 1, 2, . . . , > 0,
y se representara de forma simbolica por P().
Se trata de una autentica distribucion de probabilidad, pues (recordando el desarrollo en serie de e
x
=
k=0
x
k
k!
)
se verica:
k=0
P( = k) =
k=0
e
k
k!
= e
k=0
k
k!
= e
= 1,
y ademas, puesto que > 0 y k IN, e

k
k!
> 0.
Media o esperanza.
E[] =
k=0
kP( = k) =
k=1
ke
k
k!
= e
k=1
k1
(k 1)!
= e
j=0
j
j!
= e
= e
0
= E[] =
Varianza. Puesto que
E[( 1)] =
k=0
k(k 1)P( = k) =
k=2
k(k 1)e
k
k!
= e
k=2
k2
(k 2)!
= e
j=0
j
j!
= e
2
e
=
2
e
0
=
2
,
se tiene que:
E[
2
] = E[(
2
) +] = E[( 1)] +E[] =
2
+,
y por lo tanto:
V ar[] = E[
2
] (E[])
2
=
2
+
2
= V ar[] =
En cuanto a la funcion generatriz de momentos se obtiene:
g
(t) = E[e
t
] =
k=0
e
kt
P( = k) =
k=0
e
kt
e
k
k!
= e
k=0
(e
t
)
k
k!
= e
e
e
t
= e
(e
t
1)
g
(t) = e
(e
t
1)
La distribucion Binomial se puede aproximar, bajo ciertas condiciones, a la distribucion de Poisson:
B(n, p)
n
p 0
np
P().
Para comprobar esto, vamos a obtener el lmite de la distribucion binomial bajo estas condiciones:
lm
n
p 0
np
P( = k) = lm
n
p 0
np
_
n
k
_
p
k
(1 p)
nk
= lm
n
p 0
np
n(n 1)
k)
. . . (n k + 1)
k!
p
k
(1 p)
nk
=
1
k!
lm
n
p 0
np
np[(n 1)p][(n 2)p]
k)
[(n k + 1)p](1 p)
n
(1 p)
k
=
1
k!
k
e
1 = e
k
k!
,
puesto que lm(1 p)
n
= e
lmn(1p1)
= e
lmnp
= e
.
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0 1 2 3 4 5 6
B(2,0.85)
B(170,0.01)
P(1.7)
Figura 4.4: Comparacion entre las distribuciones B(2, 0
85), B(170, 0
01) y P(1
7).
Se considerara correcta la aproximacion de la binomial a la Poisson siempre que n > 50, p < 0
01 y np < 5.
4.6. Distribucion Uniforme.
La idea intuitiva corresponde a la construccion de una variable aleatoria que asigne la misma probabilidad
a todos los puntos de un intervalo (a, b). Precisando un poco mas, exigiremos que si el intervalo considerado
se divide en subintervalos de la misma amplitud, todos ellos tengan, en una seleccion efectuada al azar, la
misma probabilidad de contener el resultado del experimento transformado por la v.a., lo que obliga a que tal
probabilidad sea proporcional a su longitud y, en el lmite (con intervalos de amplitud innitesimal), a que la
funcion de densidad de la variable buscada tome un valor constante en el intervalo considerado, valor que se
determinara por la condicion:
b
a
kdx = 1 kx]
b
a
= k(b a) = 1 k =
1
b a
.
Formalmente, diremos que una variable aleatoria tiene distribucion uniforme en el intervalo (a, b) (en
notacion simbolica U(a, b)) si su funcion de densidad es:
f(x) =
_
1
ba
, si x (a, b);
0 en el resto.
, < a < b < .
Comprobado (al obtener k) que se trata de una autentica funcion de densidad, en este caso es posible la b usqueda
explcita de la funcion de distribucion:
F(x) = P( x) =
f(t)dt =
_
_
0 si x a,
x
a
1
b a
dt =
x a
b a
si a < x < b,
b
a
1
b a
dt = 1 si x b.
- 0.5 0.5 1 1.5
1
- 0.5 0.5 1 1.5
1
f(x) F(x)
Figura 4.5: Funcion de densidad y funcion de distribucion de la U(0, 1).
Nota: El caso particular mas interesante es cuando a = 0 y b = 1:
f(x) =
_
1, si x (0, 1),
0 en el resto,
F(x) =
_
_
_
0 si x 0,
x si 0 < x < 1,
1 si x 1.
En cuanto a las caractersticas principales se tiene:
Media o esperanza.
E[] =
b
a
x
b a
dx =
1
b a
x
2
2
_
b
a
=
b
2
a
2
2(b a)
=
a +b
2
E[] =
a+b
2
Varianza.
E[
2
] =
b
a
x
2
b a
dx =
1
b a
x
3
3
_
b
a
=
b
3
a
3
3(b a)
con lo que
V ar[] = E[
2
] (E[])
2
=
b
3
a
3
3(b a)

(a +b)
2
4
=
(b a)
2
12
V ar[] =
(ba)
2
12
g
(t) = E[e
t
] =
b
a
e
tx
b a
dx =
e
bt
e
at
t(b a)
g
(t) =
e
bt
e
at
t(ba)
4.7. Distribucion Gamma.
Se dice que una variable aleatoria tiene distribucion gamma de parametros p, a, y se representa (p, a),
si su funcion de densidad es
f(x) =
_
a
p
(p)
x
p1
e
ax
, si x > 0,
0 si x 0,
p, a IR
+
en la que (p) es la funcion gamma de Euler, es decir,
(p) =

0
x
p1
e
x
dx, para cualquier valor p > 0.
Una integracion por partes (supuesto p > 1) proporciona la relacion de recurrencia
(p) =

0
x
p1
e
x
dx =
_
x
p1
e
x
0
+

0
(p1)x
p2
e
x
dx = 0+(p1)

0
x
(p1)1
e
x
dx = (p1)(p1),
que, reiterada, permite expresar cualquier funcion (p) como un producto de factores decrecientes de unidad
en unidad por la funcion gamma de un parametro menor o igual que 1. En particular, si p ZZ
+
, se obtiene que
(p) = (p 1) (p 2) 3 2 1 = (p 1)! ya que
(1) =

0
e
x
dx = e
x
0
= 1.
Tambien se puede demostrar que (1/2) =
.
Es inmediato ver que se trata de una autentica funcion de densidad, pues es
f(x)fx =

0
a
p
(p)
x
p1
e
ax
dx
ax = t
=
1
(p)

0
t
p1
e
t
dt =
1
(p)
(p) = 1.
Para las caractersticas esenciales se tiene:
Media o esperanza.
E[] =

0
x
a
p
(p)
x
p1
e
ax
dx
ax = t
=
1
(p)

0
t
a
t
p1
e
t
dt =
1
a(p)

0
t
p
e
t
dt
=
(p+1)
a(p)
=
p(p)
a(p)
=
p
a
E[] =
p
a
Varianza.
E[
2
] =

0
x
2
a
p
(p)
x
p1
e
ax
dx
ax = t
=
1
(p)

0
_
t
a
_
2
t
p1
e
t
dt =
1
a
2
(p)

0
t
p+1
e
t
dt
=
(p+2)
a
2
(p)
=
(p+1)p(p)
a
2
(p)
=
(p+1)p
a
2
V ar[] = E[
2
] (E[])
2
=
(p+1)p
a
2

_
p
a
_
2
=
p
a
2
V ar[] =
p
a
2
g
(t) = E[e
t
] =

0
e
tx
a
p
(p)
x
p1
e
ax
dx =
a
p
(a t)
p

0
(a t)
p
(p)
x
p1
e
(at)x
dx
=
a
p
(at)
p
0
f
(p,at)
(x)dx =
_
a
at
_
p
g
(t) =
_
1
t
a
_
p
siempre que a t > 0, es decir, t < a.
Propiedad.
La siguiente propiedad de la distribucion gamma sera fundamental durante el desarrollo del resto del curso.
Proposicion 4.7.1 Sea una v.a. con distribucion (p, a) y sea k una constante tal que k IR
+
, entonces se
tiene que
= k
_
p,
a
k
_
.
Demostracion.
Puesto que
F
(y) = P( y) = P(k y) = P(
y
k
) = F
(
y
k
),
se tiene que la funcion de densidad de la v.a. transformada es
f
(y) =
d
dy
F
(y) =
d
dy
_
F
(
y
k
)
_
=
1
k
f
(
y
k
) =
_
1
k

a
p
(p)
_
y
k
_
p1
e
ay/k
=
(a/k)
p
(p)
y
p1
e
a
k
y
si
y
k
> 0,
1
k
0 = 0 si
y
k
0
o lo que es equivalente,
f
(y) =
_
(a/k)
p
(p)
y
p1
e
a
k
y
si y > 0,
0 si y 0
con lo que la funcion de densidad de coincide con la de una distribucion
_
p,
a
k
_
, como queramos demostrar.
Casos particulares.
Existen dos distribuciones muy notables que forman parte de la familia gamma, pero que su importancia historica
y practica les ha merecido un reconocimiento especial:
a) La distribucion exponencial de parametro es una variable gamma con parametros 1, , siendo un
n umero real positivo:
exp() (1, ), IR
+
Sus caractersticas principales son, por lo tanto:
E[] =
1
; V ar[] =
1
2
; g
(t) =
_
1
t
_
1
.
Esta distribucion aparece con gran frecuencia en fenomenos en los que el tiempo se considera como una
variable aleatoria (p.e. el tiempo entre dos conexiones consecutivas a un servidor), lo que hace su estudio
imprescindible.
b) La distribucion chi-cuadrado (ji-cuadrado o ji-dos) de Pearson con n grados de libertad es una
variable gamma de parametros n/2, 1/2, siendo n un n umero entero positivo:
2
n

_
n
2
,
1
2
_
, n ZZ
+
0.5 1 1.5 2
1
2
2 4 6 8
0.25
exp(2)
c
2
3
Figura 4.6: Funciones de densidad de la exp(2) y de la
2
3
.
Su importancia se vera con posterioridad en el estudio de la inferencia estadstica; sobre esta variable
volveremos en el Tema 7. Por el momento basta ver que, de acuerdo con la denicion dada, si
2
n
se
tiene
E[] = n; V ar[] = 2n; g
(t) = (1 2t)
n/2
.
4.8. Distribucion Normal.
Es con seguridad la mas frecuentemente empleada en la literatura estadstica, quiza porque todos confan en ella
como una panacea para representar fenomenos de la vida real; por ello tambien puede decirse que ha existido
un abuso en el empleo de tal distribucion que, con frecuencia, no esta justicado.
Se dice que una variable tiene una distribucion normal de parametros , , con IR y IR
+
, y se
representa por N(, ), si su funcion de densidad es
f(x) =
1
2
e
1
2
(
x
)
2
, x IR
cuya representacion graca corresponde a la llamada Campana de Gauss, simetrica respecto a , con maximo
en , puntos de inexion en y asntotas en los semiejes positivo y negativo de abscisas; aproximadamente
como muestra la Figura 4.7.
m-s m+s m
Figura 4.7: Funcion de densidad de la variable con distribucion normal N(, ).
Demostrar que se trata de una autentica funcion de densidad equivale a demostrar que la integral en todo su
dominio da uno, puesto que es evidente que es una funcion positiva. As,
f(x)dx =
2
e
1
2
(
x
)
2
dx
(x )/ = t
=
1
t
2
2
dt
(simetr.
=
2

0
e
t
2
2
dt
t
2
/2 = u
=
2

0
e
u
2
2
u
du =
1

0
u
1/2
e
u
du =
1
(1/2) =
1
= 1.
La funcion de densidad de esta distribucion no es integrable por metodos elementales (carece de primitiva), con
lo que la funcion de distribucion en cualquier punto no puede calcularse directamente y es necesario acudir a
metodos alternativos. En el caso de la distribucion N(0, 1) se encuentra tabulada, como puede verse en la tabla
de la pagina 10.
En cuanto a las caracterstica principales se tiene:
Media o esperanza.
E[] =
x
1
2
e
1
2
(
x
)
2
dx
(x )/ = t
=
1
(t +)e
t
2
2
dt
=

te
t
2
2
dt +
2
e
t
2
2
dt = 0 +
f
N(0,1)
(t)dt = 1 = E[] =
puesto que la funcion te
t
2
2
es impar en el dominio D = (, ) en el que estamos integrando y por tanto su
integral da cero.
Varianza.
V ar[] = E[( E[])
2
] = E[( )
2
] =
(x )
2
1
2
e
1
2
(
x
)
2
dx
(x )/ = t
=
1
(t)
2
e
t
2
2
dt = 2

2

0
t
2
e
t
2
2
dt
t
2
/2 = u
= 2

2

0
2ue
u
2
2
u
du =
2
2

0
u
1/2
e
u
du =
2
2
_
1
2
+ 1
_
=
2
2
1
2
_
1
2
_
=
2
2
1
2
=
2
V ar[] =
2
Quedan as identicados los parametros y que aparecan en la representacion simbolica de la distribucion:
se trata de la media y la desviacion tpica de la variable.
g
(t) = E[e
t
] =
e
xt
f(x)dx =
e
t(x)
e
t
f(x)dx = e
t
e
t(x)
1
2
e
1
2
(
x
)
2
dx
(x )/ = v
=
e
t
1
e
tv
e
v
2
2
dv = e
t
1
(vt)
2
2
e
(t)
2
2
dv
v t = u
= e
t+
(t)
2
2
2
e
u
2
2
du =
e
t+
(t)
2
2
f
N(0,1)
(u)du = e
t+
(t)
2
2
g
(t) = e
t+
(t)
2
2
Tipicacion de una v.a. normal.
La siguiente propiedad nos garantiza que cualquier transformacion afn de una v.a. normal es tambien una
normal.
Proposicion 4.8.1 Dada una v.a. N(, ), entonces = a + b con a = 0, sigue una distribucion
N(a +b, |a|). En smbolos:
N(, ) =a +b N(a +b, |a|), si a = 0
Demostracion.
Utilizaremos la funcion generatriz de momentos, pues sabemos que esta determina unvocamente la distribucion.
La f.g.m. de es:
g
(t) = E[e
t
] = E[e
t(a+b)
] = E[e
ta
e
tb
] = e
tb
g
(at) = e
tb
e
at+
2
2
(at)
2
= e
t(a+b)+
(a)
2
2
t
2
,
que coincide con la f.g.m. de una distribucion N(a +b, |a|).
Como consecuencia de este resultado, si consideramos a =
1
y b =
se tiene que
N(, ) =

N(0, 1)
Si una v.a. N(, ), al cambio de variable =

se le llama tipicacion de la variable aleatoria , pues

transforma en una variable N(0, 1). Este resultado nos permite utilizar la tabla de la pagina 10 de los valores
de la distribucion de una N(0, 1) para calcular probabilidades y cuantiles de una normal N(, ) cualquiera.
AS COMUNES.
4.1. Distribuciones discretas.
Ejercicio 4.1 Una fabrica produce fusibles electricos mediante un procedimiento automatico. Los fusibles se
empaquetan en cajas de 24 unidades. Debido a un control estadstico se sabe que el 3 % de los fusibles resultan
inservibles. Si se considera que una caja es defectuosa si tiene al menos 1 fusible inservible, se pide:
a) Calcular la probabilidad de que una caja elegida al azar sea defectuosa.
b) Si se seleccionan 4 cajas al azar, calcular la probabilidad de que:
todas sean defectuosas.
tres cualesquiera no sean defectuosas y la restante s lo sea.
c) Si la fabrica, antes de vender las cajas, decide realizar un control de calidad, calcular la probabilidad de que
la cuarta caja seleccionada sea la primera caja defectuosa.
Ejercicio 4.2 En una fabrica el 80 % de las jarras de cristal lo produce la maquina A y el 20 % la maquina B.
Se sabe que el 5 % de la produccion de la maquina A es defectuosa, mientras que solo el 1 % de la produccion
de la maquina B es defectuosa. Se pide:
a) Si se toman 10 jarras producidas por la maquina A, cual es la probabilidad de que ninguna de ellas sea
defectuosa?
b) Que porcentaje de la produccion total de jarras es defectuoso?
c) Si una jarra es defectuosa, cual es la probabilidad de que haya sido hecha por la maquina A?
d) Si se toman jarras al azar de esa fabrica hasta encontrar una sin defectos, cual es la probabilidad de que
sea necesario seleccionar 4 jarras en total?
Ejercicio 4.3 Se esta grabando en un disco de un ordenador y contabilizando el n umero de pulsos ausentes.
Supongamos que este n umero tiene una distribucion de Poisson de parametro = 0
2 (sugerido en Average
Sample Number of Semi-Curtailed Sampling Using the Poisson Distribution, J. Quality Technology, 1983, pp.
126-129).
a) Cual es la probabilidad de que un disco no tenga pulsos ausentes?
b) Cual es la probabilidad de que un disco tenga alg un pulso ausente?
c) Si dos discos se seleccionan de manera independiente, cual es la probabilidad de que ninguno tenga alg un
pulso ausente?
Ejercicio 4.4 El n umero de averas en un da de una maquina sigue una distribucion de Poisson de parametro
= 2. La maquina produce piezas de las que un tercio son defectuosas. Si el n umero de averas en un da es
menor o igual que 1, entonces no se inspecciona ninguna de las piezas producidas. Si el n umero de averas es
mayor que uno, entonces la inspeccion se lleva cabo hasta que por primera vez se encuentra una defectuosa.
Suponiendo que las piezas son independientes entre s, se pide:
a) Obtener la probabilidad de que en un da cualquiera no se inspeccione ninguna pieza de las producidas.
b) Determinar la distribucion de probabilidad de la v.a. =n umero de piezas inspeccionadas en un da.
c) Calcular el n umero medio de piezas inspeccionadas en un da.
d) Si la revision de cada pieza cuesta 0
1 euros, calcular el coste medio diario de la inspeccion de las piezas.

Ejercicio 4.5 Un contratista ha recibido un pedido de 15 cilindros de hormigon, 6 de los cuales tienen una
resistencia a la compresion por debajo del mnimo establecido. Suponiendo que se necesitan 5 cilindros para un
proyecto, que son seleccionados al azar entre los 15, se pide:
a) Calcular la probabilidad de que exactamente dos de los 5 cilindros seleccionados tengan una resistencia a
la compresion por debajo del mnimo especicado.
b) Calcular la probabilidad de que como mucho dos de los 5 cilindros seleccionados tengan una resistencia a
la compresion por debajo del mnimo especicado.
c) Calcular la probabilidad de que al menos tres de los 5 cilindros seleccionados tengan una resistencia a la
compresion por debajo del mnimo especicado.
d) Calcular el n umero medio de cilindros seleccionados para el proyecto que tienen una resistencia a la com-
presion por debajo del mnimo especicado.
e) Calcular la varianza y la desviacion tpica de la variable aleatoria que mide el n umero de cilindros, de los 5
seleccionados, que tienen una resistencia a la compresion por debajo del mnimo especicado.
4.6. Distribuciones continuas.
Ejercicio 4.6 Se sabe que una vagoneta pasa por la zona de carga cada 10 minutos. Si nos situamos en dicha
zona de carga en un momento al azar, se pide:
a) Calcular la probabilidad de que no tengamos que esperar mas de 9 minutos por la vagoneta.
b) Calcular la probabilidad de que tengamos que esperar entre 8 y 9 minutos por la vagoneta.
c) Calcular el tiempo medio de espera por la vagoneta.
Ejercicio 4.7 La demanda mensual, en toneladas, que una empresa tiene de un artculo es una variable con
distribucion uniforme entre 250 y 300 unidades.
a) Cual es la probabilidad de que en un mes cualquiera tenga una demanda inferior a 260 toneladas?
b) Cual es la probabilidad de que en un mes cualquiera tenga una demanda superior a 260 toneladas?
c) Si la citada empresa vende cada tonelada a 5 euros y el coste total de produccion es C = 100 +2, cual es
el benecio medio de la empresa con este artculo?
Ejercicio 4.8 Cuando un transistor de un determinado tipo se somete a una prueba acelerada de vida util,
la duracion (en a nos) tiene una distribucion gamma con media de 1 a nos y desviacion tpica de
2
2
a nos. Se
pide:
a) Obtener la probabilidad de que un transistor dure entre 1 y 2 a nos.
b) Obtener la probabilidad de que un transistor dure como mucho 2 a nos. Puede ser la mediana de la distri-
bucion de la duracion mayor de 2 a nos?, por que?
Ejercicio 4.9 Supongamos que el intervalo de tiempo (en minutos) de fallo de un sistema sigue una distribucion
exponencial de media 2. Se pide:
a) Si ponemos un sistema en funcionamiento en un momento dado,
cual es la probabilidad de que tengamos que esperar mas de 3 minutos hasta que falla?
y mas de 5 minutos?
b) Si, tras llevar esperando 5 minutos, aparece un segundo ingeniero de control, que se entera por el primero
de que en los ultimos cinco minutos no ha fallado, cual es la probabilidad de que el segundo ingeniero tenga
que esperar mas de 3 minutos hasta que falla el sistema?
c) Si nos proponemos realizar un estudio sobre la frecuencia de fallos, reemplazando inmediatamente el sistema
por uno nuevo en el momento en el que falla, y suponemos independencia entre los tiempos de fallo de cada
sistema,
cual es la probabilidad de que el cuarto sistema sea el primero que dure mas de 5 minutos?
Si han fallado 4 sistemas, cual es la probabilidad de que exactamente en uno de ellos el tiempo de
fallo haya sido superior a 5 minutos y en los otros tres inferior?
Ejercicio 4.10 Dadas tres variables aleatorias , y con distribuciones N(0, 1), N(5, 2) y
2
10
respectiva-
mente, obtenganse las siguientes probabilidades:
P( 0
5), P( 0
54), P( 0
56), P( 0), P( 0),

P( 0
54), P( 0
5), P( 0
54), P( 0
5), P( 3
2),
P( 5), P( 10), P( 7), P( 1000), P( = 2),
P(1 3), P(| 2| 1), P(| 1| 0
3), P( < 7), P( > 6),

P( 3), P( 13), P(3 < < 8
1), P(2 6
5), P( 0),
P( = 7
3), P( 7
492), P( 5), P( 4), P( 16),

P( < 12
5), P( = 9
34), P( = 8), P( 4
87), P(3
25 23
2).
Ejercicio 4.11 Una empresa fabrica juntas teoricas para el trasbordador espacial de la NASA, las cuales se
han dise nado para sellar conexiones y piezas en el sistema de combustible a n de impedir fugas. Un tipo de
juntas debera tener 5 centmetros de diametro para que encaje como es debido, aunque puede variar arriba
o abajo en 025 cm. sin provocar una fuga peligrosa, con lo que una junta con un diametro dentro del rango
5 0
25 se considera conforme con las especicaciones. La empresa arma que el diametro medio es de 5 cm.
con una desviacion tpica de 01 cm. Si estas cifras son correctas y se supone una distribucion normal de los
diametros, los funcionarios de la NASA desean determinar:
a) La probabilidad de que una junta seleccionada al azar sea conforme.
b) La probabilidad de que una junta seleccionada al azar sea disconforme.
c) La probabilidad de que una junta seleccionada al azar tenga un diametro superior a 525 cm.
Ejercicio 4.12 La longitud en cm. de cierta planta sigue una distribucion normal de media 60cm. y varianza
144cm
2
si es tratada con un fertilizante A y exponencial de media 70cm. y varianza 4900cm
2
si es tratada con
un fertilizante B.
En un invernadero se aplica el fertilizante A al 70 % de las plantas y el B al resto. En un determinado momento
se desea separar las plantas tratadas con B, para lo cual se utiliza el siguiente metodo: si su longitud es superior
a 80cm. se considera tratada con B y, en caso contrario, se considera que fue tratada con A. Se pide:
a) Calcular la probabilidad de que una planta sea clasicada erroneamente.
b) El n umero medio de errores al clasicar 100 plantas.
c) Si de una de las secciones del invernadero con 100 plantas se sabe que hay 65 que han recibido el fertilizante
A, cual es la probabilidad de que elegidas 5 de estas plantas, menos de 2 hayan sido fertilizadas con B?
Examenes.
Ejercicio 4.13 (09-09-03) Una fabrica A produce paquetes de un determinado producto cuyo peso, debido
a uctuaciones aleatorias en el proceso de produccion, es una variable aleatoria con distribucion normal. Se
sabe que la probabilidad de que un paquete pese menos de 160gr. es 0
02275, mientras que la probabilidad de

pesar menos de 163gr. es 0
841345.
a) Obtener la media y la varianza de la v.a. .
b) Si se eligen al azar 5 paquetes de los producidos por dicha fabrica, cual es la probabilidad de que exacta-
mente 2 pesen menos de 160gr.?
c) Un supermercado recibe un 70 % de los paquetes de dicho producto de la fabrica A, y el 30 % restante de
una fabrica B de la que se sabe que la v.a. peso del paquete sigue una distribucion uniforme U(159, 161).
Con estos datos, cual es la probabilidad de que un paquete elegido al azar entre los que se venden en ese
supermercado haya sido producido por la fabrica B, si se sabe que pesa mas de 160gr.?
Ejercicio 4.14 (21-06-04) Los das que el proceso de fabricacion esta ajustado, el 90 % de las piezas producidas
son correctas. Por motivos incontrolables, el 5 % de los das, el proceso de produccion no esta ajustado, siendo
entonces el porcentaje de piezas producidas defectuosas del 30 %.
a) Si un da cualquiera se eligen al azar 4 piezas para inspeccion, de las cuales una resulta ser defectuosa, cual
es la probabilidad de que ese da el proceso estuviese ajustado?
b) Se decide parar la produccion para revisar la cadena si de una muestra aleatoria de 4 piezas hay al menos
una defectuosa. Cual es la probabilidad de cometer un error, es decir, cual es la probabilidad de parar la
produccion y que el proceso este ajustado o de no pararla y que el proceso este desajustado?
Ejercicio 4.15 (07-09-05) Una empresa realiza un control de aceptacion para lotes. Dicho plan de control
consiste en seleccionar 45 piezas, con reemplazamiento, de cada lote y aceptar el mismo si hay, como mucho,
2 piezas defectuosas. Una pieza es defectuosa si pesa mas de 6 o menos de 5. Sabiendo que el peso de la pieza
sigue una distribucion normal de media 5
5 y desviacion tpica 0
255, se pide:
a) Calcular la probabilidad de que una pieza sea defectuosa.
b) Calcular la probabilidad de que se acepte un lote.
c) Calcular la probabilidad de que sea necesario examinar 4 lotes hasta encontrar uno que se acepta.
Ejercicio 4.16 (13-02-06) Una empresa realiza un control de calidad sobre las piezas que recibe del proveedor.
As, para cada lote de 1000 piezas que recibe, selecciona con reemplazamiento 30 piezas. Si hay como mucho
dos defectuosas, estas son reemplazadas por piezas buenas y el lote es automaticamente aceptado. Si hay mas
de dos defectuosas, se inspecciona todo el lote y se reemplazan las piezas defectuosas de todo el lote por piezas
buenas, tras lo cual se acepta el lote. Si los lotes tuviesen una proporcion de defectuosos p = 0
05, se pide:
a) Cual es la probabilidad de que no haya que inspeccionar todo el lote?
b) Obtener la distribucion de probabilidad de la variable aleatoria n umero de piezas inspeccionadas.
c) Obtener el n umero medio de piezas inspeccionadas por lote.
Ejercicio 4.17 (07-09-06) Una pieza utilizada en la fabricacion de cierto producto tiene un tiempo de vida
que sigue una distribucion exponencial de media 7 a nos, si ha sido suministrada por el proveedor I o una
distribucion gamma de media 7 a nos y varianza 14, si ha sido suministrada por el proveedor II. El 60 % de las
piezas son suministradas por el proveedor I y el 40 % restante por el II. Con estos datos, se pide:
a) Obtener la probabilidad de que una pieza elegida al azar dure mas de 12 a nos.
b) Si se sabe que una pieza dura mas de 12 a nos, cual es la probabilidad de que haya sido suministrada por
el proveedor II?
Ejercicio 4.18 (22-06-07) La cantidad de mineral, en toneladas, que se embarca diariamente en un puerto,
es una v.a. normal de media 10 y desviacion tpica 4. Suponiendo independencia entre los das, calcular:
a) El n
o
esperado de das de una semana en los que el embarque supera la media.
b) La probabilidad de que como mucho en uno de siete das elegidos al azar la cantidad embarcada haya sido
inferior a seis toneladas.
c) La probabilidad de que se necesite esperar tres o mas das hasta encontrar uno con un embarque superior
a 6 toneladas.
Ejercicio 4.19 (18-02-08) El diametro (en mm.) de un agujero taladrado en una placa de metal es una
variable aleatoria continua con funcion de distribucion:
F
(x) =
_
1 e
20(x12
5)
si x > 12
5,
0 si x 12
5.
a) Sabiendo que una pieza se deshecha si el diametro es mayor de 12
60, cual es la probabilidad de que se

desheche una pieza?
b) Cual es la probabilidad de que una pieza tenga un diametro entre 12
5 y 12
6 milmetros?
c) Obten la distribucion de la variable = 12
5?
d) Cuanto vale el diametro medio de estas piezas?
e) Obten la funcion generatriz de .
Ejercicio 4.20 (18-02-08) El n umero de puntos de oxido por placa que se producen en las placas de un
circuito sometido a un grado de humedad sigue una distribucion de Poisson con un promedio de un punto de
oxido por placa. Si se supone que las placas son independientes unas de otras, se pide:
a) Calcular la probabilidad de que una placa no tenga puntos de oxido.
b) Se considera que una placa es aceptable si tiene menos de tres puntos de oxido. Cual es la probabilidad de
que una placa sea aceptable?
c) Si un circuito tiene 8 placas, cual es la probabilidad de que al menos 7 de ellas sean aceptables?
d) Cual es la probabilidad de que tengamos que observar 4 placas para encontrar una no aceptable?
Ejercicio 4.21 (05-09-08) Un sistema dispone de dos canales de comunicacion A y B, de forma que si repre-
sentamos por la v.a. n
o
de bits transmitidos de forma erronea en la transmision de un bit la funcion de
distribucion asociada a dicha variable sera, en cada caso,
CANAL A CANAL B
F(x) =
_
_
_
0 si x < 0
0
8 si 0 x < 1
1 si 1 x
F(x) =
_
_
_
0 si x < 0
0
9 si 0 x < 1
1 si 1 x
La probabilidad de que un bit sea enviado por el canal A es 0
2 y la probabilidad de que sea enviado por el

canal B es 0
8.
a) Cual es la probabilidad de que un bit enviado por este sistema sea transmitido erroneamente?
Ayuda.- La probabilidad pedida es P( = 1).
b) Obtener la distribucion de probabilidad de .
c) Obtener la funcion generatriz de momentos de .
Ejercicio 4.22 (02-07-09) En un lote de 10 productos, 2 son disconformes y el resto son conformes. Con estos
datos se pide:
a) Si el control de calidad del lote consiste en elegir sin reemplazamiento una muestra de 3 productos del lote
y examinarlos,
Cual es la probabilidad de que encuentre al menos un producto disconforme en la muestra?
Cual es el n umero medio de productos disconformes encontrados en la muestra?
b) Otro posible control de calidad consiste en elegir productos del lote, sin reemplazamiento, hasta que aparece
el primero conforme.
Cual es la distribucion de la v.a. =n
o
de productos elegidos sin reemplazamiento para encontrar
el primero conforme?
Cual es el n umero medio de productos que deben ser elegidos para encontrar el primero conforme?
Cual es el n umero medio de productos disconformes que deben ser elegidos hasta encontrar el primero
conforme?
AS COMUNES.
b) 0072.
0231.
c) 0058.
Ejercicio 4.2 Denotemos por A el suceso la jarra ha sido fabricada por la maquina A, por B el suceso la
jarra ha sido fabricada por la maquina B y por D el suceso la jarra es defectuosa. Seg un el enunciado tenemos
que P(A) = 0
8, P(B) = 0
2, P(D/A) = 0
05 y P(D/B) = 0
01. Teniendo en cuenta todo lo anterior, estamos

en condiciones de responder a todos los apartados.
a) Vamos a denir una variable aleatoria como sigue:
= n umero de jarras defectuosas de las 10 de tipo A B(10, P(D/A)) B(10, 0
05),
que sigue una distribucion binomial de parametros 10 (n umero de jarras examinadas) y 0
05 (el exito es que

la jarra sea defectuosa).
Puesto que en este apartado nos piden simplemente que calculemos P( = 0), tenemos que
P( = 0) =
_
10
0
_
(0
05)
0
(1 0
05)
10
= 0
5987,
por lo que la probabilidad de que ninguna de las 10 jarras fabricadas en la maquina A sea
defectuosa es de 05987.
b) Puesto que nos mandan calcular el porcentaje total de jarras defectuosas de las fabricadas por ambas
maquinas, lo que nos estan pidiendo que calculemos es P(D) 100.
Aplicando el Teorema de la Probabilidad Total tenemos que
P(D) = P(D A) +P(D B) = P(D/A)P(A) +P(D/B)P(B) = 0
05(0
8) + 0
01(0
2) = 0
042,
por lo que el porcentaje total de jarras defectuosas es del 42%.
c) Nos piden la probabilidad de que una jarra haya sido fabricada por la maquina A, sabiendo que la jarra en
cuestion es defectuosa, es decir, nos estan pidiendo que calculemos la probabilidad condicionada P(A/D).
A partir de los datos del enunciado y del valor obtenido en el apartado anterior obtenemos que
P(A/D) =
P(D/A)P(A)
P(D)
=
(0
05)(0
8)
0
042
= 0
9524.
Con lo cual, la probabilidad de que una jarra defectuosa haya sido hecha por A es 09524.
d) Para contestar a esta pregunta vamos a denir una nueva variable con distribucion conocida.
Sea = n umero de jarras hasta encontrar una sin defectos G(0
958). (Es evidente que la distribucion

de es de tipo geometrica, y la probabilidad de exito es 0
958, puesto que en este caso el exito es que la

jarra no tenga defectos, es decir, P(D) = 1 P(D) = 1 0
042 = 0
958, donde hemos tenido en cuenta la

probabilidad obtenida en el apartado b).)
En consecuencia la probabilidad que nos piden en este apartado es
P( = 4) = (0
042)
3
(0
958) = 7
10 10
5
.
Ejercicio 4.3 Puesto que sigue una distribucion de Poisson de parametro = 0
2, la funcion de (masa de)

probabilidad de es
P( = x) =
e
0
2
0
2
x
x!
, para x = 0, 1, 2, . . .
a) La probabilidad buscada es P( = 0) =
e
0
2
0
2
0
0!
= e
0
2
0819.
b) La probabilidad buscada es
P( 1) = 1 P( < 1) = 1 P( = 0) = 1 0
819 = 0181.
c) Si consideramos la variable aleatoria =n umero de discos que no contienen un pulso ausente de los dos
seleccionados de forma independiente, esta variable sigue una distribucion Binomial de parametros n = 2
y p = P( = 0) = e
0
2
0
819. Por lo tanto,

P( = 2) =
_
2
2
_
(e
0
2
)
2
(1 e
0
2
)
0
= e
0
4
0670.
Ejercicio 4.4 a) P( 1) = P( = 0) +P( = 1) =
e
2
2
0
0!
+
e
2
2
1
1!
= 3e
2
0406.
b) Como la v.a. =n umero de piezas inspeccionadas en un da es discreta, su distribucion de probabilidad
queda determinada como sigue:
0 1 2 3 . . . k . . .
P
3e
2 1
3
(1 3e
2
)
_
2
3
_
1
3
(1 3e
2
)
_
2
3
_
2
1
3
(1 3e
2
) . . .
_
2
3
_
k1
1
3
(1 3e
2
) . . .
puesto que
P( = 0) = P( = 0/ 1)P( 1) +P( = 0/ > 1)P( > 1) = 1(3e
2
) + 0(1 3e
2
) = 3e
2
,
P( = k) = P( = k/ 1)P( 1) +P( = k/ > 1)P( > 1) = 0(3e
2
) +
_
2
3
_
k1
1
3
(1 3e
2
)
=
_
2
3
_
k1
1
3
(1 3e
2
), k > 0.
c) El n umero medio de piezas inspeccionadas es la media de la distribucion anterior, con lo que
E[] =
k=0
kP( = k) = 0(3e
2
) +
k=1
k
_
2
3
_
k1
1
3
(1 3e
2
) =
= 0 + (1 3e
2
)E[G(1/3)] = (1 3e
2
)3 = 3 9e
2
1782.
d) El coste diario de la inspeccion de las piezas es = 0
1, con lo cual el coste medio es

E[] = E[0
1] = 0
1E[] = 0
1(1
782) = 0178.
Ejercicio 4.5 Si denotamos por la v.a. n umero de cilindros que tienen una resistencia a la compresion por
debajo del mnimo establecido de los cinco seleccionados, se tiene que la distribucion de es hipergeometrica
H(15, 6, 5), con lo cual su funcion de probabilidad es
P( = k) =
_
6
k
__
9
5k
_
_
15
5
_ , parax = 0, 1, 2, 3, 4, 5.
a) P( = 2) =
(
6
2
)(
9
52
)
(
15
5
)
=
(15)(84)
3003
= 0420.
b) Puesto que P( 2) = P( = 0) +P( = 1) +P( = 2) y
P( = 0) =
_
6
0
__
9
50
_
_
15
5
_ =
(1)(126)
3003
= 0
042,
P( = 1) =
_
6
1
__
9
51
_
_
15
5
_ =
(6)(126)
3003
= 0
252,
entonces la probabilidad buscada es P( 2) = P( = 0) +P( = 1) +P( = 2) = 0
042 +0
252 +0
420 =
0714.
c) Utilizando el resultado obtenido en el apartado anterior, se tiene que P( 3) = 1 P( < 3) = 1 P(
2) = 1 0
714 = 0286.
d) En este apartado se nos pide que calculemos E(). Puesto que sigue una distribucion hipergeometrica de
parametros N = 15, D = 6, y n = 5, el n umero esperado o medio de cilindros es
E() = n
D
N
= 5
6
15
= 2.
e) En este caso nos piden que calculemos la varianza y la desviacion tpica de . Aplicando de nuevo que
H(15, 6, 5), se tiene que:
V ar() = n
D
N
N D
N
N n
N 1
= 5
6
15
15 6
15
15 5
15 1
=
2700
3150
= 0857,
con lo que
V ar() =
857 = 0926.
Ejercicio 4.6 a) 09;
b) 01;
c) 5 minutos.
Ejercicio 4.7 a) 02;
b) 08;
c) 725 euros.
Ejercicio 4.8 a) 0
314.
b) 0
908. No, puesto que la mediana de una v.a. continua cumple que F(Me) = 0
5, puesto que F(2) = 0
908
y F es no decreciente, entonces Me 2.
Ejercicio 4.9 a) e
3/2
. e
5/2
.
b) e
3/2
.
c) 0063. 0254.
Ejercicio 4.10 Las probabilidades pedidas pueden verse en la siguiente tabla:
06915 07054 07123 05 05
02946 06915 07054 03085 00007
0 1 1 0 0
08399 01573 08548 08413 03085
01587 1 09394 07732 00062
0 01064 05 0 09
075 0 0 09 0965
Ejercicio 4.11 Si denotamos por la v.a. diametro de la junta se tiene que:
a) P(conforme) = P(4
75 5
25) = 0
988.
b) P(no conforme) = 1 P(conforme) = 1 0
988 = 0
012.
c) P( > 5
25) = 1 P( 5
25) = 0
006.
Ejercicio 4.12 a) Si representamos por A, respectivamente B, el suceso la planta ha sido tratado por el
fertilizante A, respectivamente B, entonces
P(error) = P(error A) +P(error B) = P({ > 80} A) +P({ 80} B) =
= P( > 80/A)P(A) +P( 80/B)P(B) = (0
0479) (0
7) + (0
6811)(0
3) = 0
2379,
puesto que
Si suponemos que la planta ha sido tratada por el fertilizante A, entonces la v.a. =longitud de
la planta tiene una distribucion N(60, 12), con lo cual P( > 80/A) = P(
60
12
>
8060
12
/A) = 1
F
N(0,1)
(1
667) = 1 0
9521 = 0
0479.
Si la planta ha sido tratada por el fertilizante B, entonces exp(1/70), con lo que
P( 80/B)=
80
0
1
70
e
x/70
dx = 1 e
8/7
= 0
6811.
b) Si consideramos la v.a. =n umero de errores en 100 plantas, entonces sigue una distribucion B(100, P(error)),
y lo que nos estan pidiendo es la esperanza de , es decir, E[] = 100P(error). Con lo cual el n umero
medio de errores al clasicar 100 plantas es de 100(02379) = 2379.
c) Si tenemos 100 plantas de las cuales 65 han sido tratadas con el fertilizante A y el resto con el B, y extraemos
sin reemplazamiento 5 de ellas, lo que nos piden es P( < 2), siendo =n umero de plantas de tipo B de
las 5, que tiene en este experimento una distribucion H(100, 35, 5). As pues,
P( < 2) = P( = 0) +P( = 1) =
_
35
0
__
65
5
_
_
100
5
_ +
_
35
1
__
65
4
_
_
100
5
_ = 0
4245.
Ejercicio 4.13 a) El enunciado nos dice que
= peso de cada paquete de la fabrica A N(, ),
y ademas nos dan como datos que P( < 160) = 0
02275 y P( < 163) = 0
841345.
As pues,
P( < 160) = 0
02275 =P
_
N(0, 1) <
160
_
= 0
02275 =
160
= 2 =160 = 2
P( < 163) = 0
841345 =P
_
N(0, 1) <
163
_
= 0
841345 =
163
= 1 =163 = +
2
= 1, = 162,
con lo cual ya sabemos que N(162, 1).
b) En este apartado nos piden que calculemos la probabilidad de que de 5 paquetes, exactamente 2 pesen
menos de 160gr. Para ello vamos a denir una variable =n umero de paquetes que pesan menos de 160gr.
de los 5 paquetesB(5, p
A
), donde p
A
= P( < 160). Lo que nos piden calcular es P( = 2).
Seg un los datos del enunciado P( < 160) = 0
02275, con lo cual B(5, 0
02275), y por tanto

P( = 2) =
_
5
2
_
(0
02275)
2
(1 0
02275)
3
= 00048.
c) Ahora unos paquetes son producidos por la fabrica A y otros por la B, de hecho, P(A) = 0
7, P(B) = 0
3.
En el caso de que sea producido en A, sabemos que el peso de dichos paquetes sigue una distribucion
N(162, 1). En el caso de que los paquetes sean producidos por B, el peso del paquete sigue una distribucion
U(159, 161).
En este apartado se nos pide que calculemos P(B/ > 160), y aplicando el Teorema de Bayes tenemos que
P(B/ > 160) =
P(B { > 160})
P( > 160)
=
P(B { > 160})
P(({ > 160} A) ({ > 160} B))
=
=
P( > 160/B)P(B)
P( > 160/A)P(A) +P( > 160/B)P(B)
=
(0
5)(0
3)
(0
97725)(0
7) + (0
5)(0
3)
= 01798,
puesto que P( > 160/A) = 1 P( 160/A) = 1 0
02275 = 0
97725 y P( > 160/B) =
161
160
1
2
dx = 0
5.
Ejercicio 4.14 Si denotamos por A el suceso el proceso esta ajustado y por D la pieza es defectuosa, los
datos del enunciados nos proporcionan las siguientes probabilidades:
P(D/A) = 0
90 P(D/A) = 0
10
P(A) = 0
05 P(A) = 0
95
P(D/A) = 0
30 P(D/A) = 0
70
Con estos datos podemos responder a los dos apartados del ejercicio:
a) Si denotamos por la variable aleatoria =n umero de piezas defectuosas de las cuatro seleccionadas al
azar, sigue una distribucion binomial B(4, p), donde p representa la probabilidad de obtener una pieza
defectuosa, que depende de si se ha producido en un da en el que el proceso esta ajustado o no. As pues,
lo que nos piden que calculemos es P(A/ = 1) y, teniendo en cuenta las propiedades de la probabilidad, se
tiene que:
P(A/ = 1) =
P(A = 1)
P( = 1)
=
P(A = 1)
P(A = 1) +P(A = 1)
=
=
P( = 1/A) P(A)
P( = 1/A) P(A) +P( = 1/A) P(A)
=
=
__
4
1
_
(0
10)
1
(0
90)
3
_
(0
95)
__
4
1
_
(0
10)
1
(0
90)
3
_
(0
95) +
__
4
1
_
(0
30)
1
(0
70)
3
_
(0
05)
= 0
9308
puesto que si el proceso esta ajustado (A), sigue una distribucion binomial B(4, 0
10), y si no lo esta (A),

sigue una distribucion B(4, 0
30).
En realidad, lo que se ha hecho en este apartado es aplicar el Teorema de Bayes.
b) Considerando las notaciones del apartado anterior,
P(error) = P( 1 A) +P( = 0 A) = P( 1/A)P(A) +P( = 0/A)P(A) =
= (1 P( = 0/A))P(A) +P( = 0/A)P(A) =
=
_
1
_
4
0
_
(0
10)
0
(0
90)
4
_
(0
95) +
_
4
0
_
(0
30)
0
(0
70)
4
)(0
05) = 0
3387
Ejercicio 4.15 a) Sea la v.a. que representa el peso de una pieza, seg un el enunciado sabemos que
N(5
5, 0
255) y que la pieza es defectuosa si < 5 o > 6. As pues, la probabilidad pedida es:
P( < 5 > 6) = 1 P(5 6) = 1 (P( 6) P( < 5))
= 1
_
P(
5
5
0
255

65
5
0
255
) P(
5
5
0
255
<
55
5
0
255
)
_
= 1 (P(N(0, 1) 1
9608) P(N(0, 1) < 1
9608))
= 1 (P(N(0, 1) 1
9608) (1 P(N(0, 1) 1
9608)))
= 2 2P(N(0, 1) 1
9608)
= 2 2(0
975) = 0
05.
b) Si denotamos por la variable aleatoria n
o
de piezas defectuosas de las 45 seleccionadas con reemplaza-
miento, se tiene que B(45, 0
05), puesto que la probabilidad de que una pieza sea defectuosa es 0
05,
seg un vimos en el apartado anterior. As pues, la probabilidad de aceptar un lote es:
P(aceptar un lote) = P( 2) = P( = 0) +P( = 1) +P( = 2) =
2
k=0
_
45
k
_
(0
05)
k
(0
95)
45k
= 0
6077.
c) Si denimos la v.a. =n
o
de lotes examinados hasta encontrar el primero que se acepta, se tiene que
G(0
6077), teniendo en cuenta el resultado obtenido en el apartado anterior. La probabilidad pedida

es:
P( = 4) = (1 0
6077)
3
0
6077 = 0
0367.
Ejercicio 4.16 a) Si representamos por la v.a. n umero de piezas defectuosas de las 30, se tiene que
sigue una distribucion binomial B(30, 0
05), con lo que la probabilidad de no tener que inspeccionar todo

el lote es:
P( 2) = P( = 0) +P( = 1) +P( = 2)
=
_
30
0
_
(0
05)
0
(0
95)
30
+
_
30
1
_
(0
05)
1
(0
95)
29
+
_
30
2
_
(0
05)
2
(0
95)
28
= 0
8122.
b) Si tras la inspeccion de prueba hay como mucho dos defectuosas de las 30 seleccionadas, el lote se acepta
automaticamente, con lo cual solo se han inspeccionado 30 piezas. En otro caso, se inspecciona todo el lote,
es decir, las 1000 piezas. As pues, =n umero de piezas inspeccionadas es una v.a. discreta con funcion
de probabilidad:
30 1000
P
8122 0
1878
c) Nos estan pidiendo que calculemos E():
E() = 30(0
8122) + 1000(0
1878) = 212
166,
es decir, en media se inspeccionan unas 212 piezas por lote.
Ejercicio 4.17 Si denotamos por la variable aleatoria que nos mide el tiempo de vida, en a nos, de la pieza,
los datos que nos da el enunciado son:
/I exp() con
1
= 7 = = 1/7 = /I exp(1/7),
/II (p, a) con
p
a
= 7 y
p
a
2
= 14 = p = 7/2, a = 1/2 = /II (7/2, 1/2)
2
7
.
Con esto se tiene que:
a) La probabilidad pedida es P( > 12), con lo que
P( > 12) = P( > 12 I) +P( > 12 II) = P( > 12/I)P(I) +P( > 12/II)P(II)
= P(exp(1/7) > 12)(0
6) +P(
2
7
> 12)(0
4) =
_

12
1
7
e
x/7
dx
_
(0
6) + (0
1)(0
4)
= (e
12/7
)(0
6) + 0
04 = 0
148.
b) En este apartado se nos pide que calculemos P(II/ > 12) y, teniendo en cuenta los calculos hechos en el
apartado anterior, se tiene que
P(II/ > 12) =
P( > 12 II)
P( > 12)
=
0
04
0
148
= 0
270.
Ejercicio 4.18 Si denotamos por la v.a. toneladas de mineral embarcadas en un da, se sabe que
N(10, 4).
a) Si denotamos por la v.a. n umero de das de la semana en los que se embarcan mas de 10 toneladas, se
tiene que B(7, 0
5), puesto que P( > 10) = 0
5. Lo que nos piden en este apartado es la media de ,

es decir, E() = 7 0
5 = 3
5 das.
b) Si denotamos por la v.a. n umero de das de la semana en los que se embarcan menos de 6 toneladas, se
tiene que B(7, 0
16), puesto que P( < 6) = 0
16. Lo que nos piden en este apartado es

P( 1) = P( = 0) +P( = 1) =
_
7
0
_
(0
16)
0
(1 0
16)
7
+
_
7
1
_
(0
16)
1
(1 0
16)
6
= 0
30 + 0
39 = 0
69.
c) Si denotamos por la v.a. n umero de das para encontrar el primero con un embarque superior a 6
toneladas, se tiene que G(0
84), puesto que P( > 6) = 1 P( 6) = 1 0
16 = 0
84. Lo que nos

pidena ahora es
P( 3) = 1 P( 2) = 1 (P( = 1) +P( = 2)) = 1 (0
84 + 0
84(0
16)) = 0
03.
Ejercicio 4.19 a) La probabilidad pedida es P( > 12
6). Aplicando las propiedades de la probabilidad y la

denicion de funcion de distribucion se tiene que:
P( > 12
6) = 1 P( 12
6) = 1 F
(12
6) = 1 (1 e
20(12
612
5)
) = 1 0
8647 = 0
1353.
b) P(12
5 12
6) = P( 12
6) P( 12
5) = F
(12
6) F
(12
5) = 0
8647 0 = 0
8647.
c) Comenzamos obteniendo la funcion de densidad de a partir de la de distribucion. Como f
(x) = F
(x), se
tiene que:
f
(x) =
_
20e
20(x12
5)
si x > 12
5,
0 si x 12
5.
Puesto que para esta variable aleatoria y la funcion g(x) = x 12
5 se verican las hipotesis para utilizar

el Teorema del Jacobiano (Teorema 3.4.1):
Sopp() = (12
5, ),
g
(x) = 1 = 0, x (12
5, ),
podemos obtener la funcion de densidad de a partir de la de como sigue:
f
(y) =
_
f
(y + 12
5) |1| si y > 0,
0 en el resto.
=
_
20e
20y
si y > 0,
0 siy 0,
con lo que sigue una distribucion exponencial exp(20).
Existen otros formas de obtener dicha distribucion utilizando directamente la funcion de distribucion F
,
sin tener que calcular la de densidad f
, pero hemos optado por este metodo, por ser el que habitualmente
utilizamos en la clase.
d) E() = E( + 12
5) = E() + 12
5 =
1
20
+ 12
5 = 12
55.
e) g
(t) = E(e
t
) = E(e
(+12
5)t
) = e
12
5t
E(e
t
) = e
12
5t
g
(t) = e
12
5t
_
1
t
20
_
1
=
20e
12
5t
20t
.
Ejercicio 4.20 Si denotamos por la v.a. n
o
de puntos de oxido por placa, el enunciado nos dice que
P(1).
a) P( = 0) = e
1 1
0
0!
= 0
3679.
b) P( < 3) = P( = 0) +P( = 1) +P( = 2) = 0
3679 +e
1 1
1
1!
+e
1 1
2
2!
= 0
9197.
c) Si denotamos por la v.a. n
o
de placas aceptables de las 8 independientes, se tiene que B(8, 0
9197),
con lo que la probabilidad pedida es P( 7) = P( = 7) + P( = 8) =
_
8
7
_
(0
9197)
7
(1 0
9197)
1
+
_
8
8
_
(0
9197)
8
(1 0
9197)
0
= 0
8694.
d) Si denotamos por la v.a. n
o
de placas independientes observadas para encontrar la primera no aceptable,
se tiene que G(0
0803), con lo que la probabilidad pedida es P( = 4) = (0
9197)
3
(0
0803) = 0
0625.
Ejercicio 4.21 Si denotamos por la v.a. n
o
de bits transmitidos de forma erronea en la transmision de un
bit, en el enunciado nos dan la distribucion de en cada uno de los dos canales. As,
CANAL A CANAL B
0 1
P
8 0
2
0 1
P
9 0
1
y ademas nos dicen que P(A) = 0
2 y P(B) = 0
8.
a) La probabilidad pedida es P( = 1) que se puede calcular como sigue:
P( = 1) = P( = 1A)+P( = 1B) = P( = 1/A)P(A)+P( = 1/B)P(B) = (0
2)(0
2)+(0
1)(0
8) = 0
12.
b) Seg un lo visto en el apartado anterior, la funcion de probabilidad de es
0 1
P
88 0
12
c) Si observamos la tabla del apartado anterior, vemos como sigue una distribucion de Bernouilli de parametro
0
12, con lo que sabemos que su funcion generatriz de momentos es: g
(t) = 0
12e
t
+ 0
88.
Si no nos damos cuenta de la distribucion que sigue la variable, podemos obtener directamente dicha funcion
generatriz, sin mas que aplicar la denicion:
g
(t) = E(e
t
) =
x
e
xt
P( = x) = e
0t
0
88 +e
1t
0
12 = 0
88 + 0
12e
t
.
Ejercicio 4.22 a) Si denotamos por la v.a. n
o
de productos disconformes en los 3 obtenidos sin reem-
plazamiento del lote, se tiene que sigue una distribucion hipergeometrica H(10, 2, 3). A partir de dicha
variable, lo que nos piden que calculemos en este apartado es P( 1) y E(). As pues,
P( 1) = 1 P( = 0) = 1
(
2
0
)(
8
3
)
(
10
3
)
=
8
15
0
53,
E() = 3
2
10
=
3
5
= 0
6 (valor obtenido directamente de las tablas).

b) La v.a. puede tomar simplemente los valores 1, 2 y 3, puesto que como solo hay 2 productos disconformes
en el lote, en el peor de los casos el tercer producto seleccionado ya es conforme. Se trata de una v.a. discreta
y puesto que
P( = 1) = P(C
1
) =
8
10
= 0
8
P( = 2) = P(D
1
C
2
) = P(D
1
)P(C
2
/D
1
) =
2
10
8
9
=
8
45
0
18
P( = 3) = P(D
1
D
2
C
3
) = P(D
1
)P(D
2
/D
1
)P(C
3
/D
1
D
2
) =
2
10
1
9
8
8
=
1
45
0
02
se tiene que su funcion de probabilidad es:
1 2 3
P
8 0
18 0
02
Por lo tanto, el n umero medio de productos que deben ser seleccionados para encontrar el primero conforme
es:
E() = 1(0
8) + 2(0
18) + 3(0
02) = 1
22
con lo que el n umero medio de productos disconformes que deber ser seleccionadas hasta encontrar el primero
conforme es:
E( 1) = E() 1 = 0
22.
AS COMUNES.
PREGUNTAS DE TEST.
Examenes.
1. (19-06-03) La probabilidad de alcanzar un barco, cuando se dispone de cuatro torpedos, cada uno de los
cuales tiene la probabilidad 1/4 de hacer blanco y los disparos son independientes es aproximadamente:
a) 025; b) 03164; c) 06836; d) 075; e) Todo falso.
2. (19-06-03) Una fabrica produce un 3 % de fusibles defectuosos. En el departamento de Control de Calidad
eval uan el n
o
de fusibles observados hasta encontrar el primero defectuoso. El n umero medio de esos fusibles
observados es:
a) 3/100; b) 100/3; c) 97/3; d) 1; e) Todo falso.
3. (19-06-03) El n
o
de partculas emitidas por una fuente radioactiva durante un periodo especco es una
v.a. con distribucion de Poisson. La probabilidad de que no haya ninguna emision durante un periodo es 1/3,
entonces se tiene que:
a) El n
o
medio de partculas emitido en un periodo es ln(3);
b) La probabilidad de que haya sido emitida exactamente una partcula es ln(3)/3;
c) La varianza del n
o
de partculas emitidas por periodo es ln(3);
d) La varianza del n
o
de partculas emitidas por periodo es ln(3)/3;
e) Todo falso.
4. (19-06-03) Sea una v.a. con distribucion exponencial de parametro 1, entonces E[
2
] es:
a) 2; b) 1; c) 1/2; d) -3; e) Todo falso.
5. (19-06-03) Sea una v.a. con distribucion gamma (2, 3), entonces:
a) E[
2
] = 2/3; b) E[
2
] = 3/2; c) E[] = 3/2; d) E[] = 2/3; e) Todo falso.
6. (19-06-03) Sea una v.a. con distribucion N(, ). Se tiene que P(| | < k) es aproximadamente igual
a:
a) 0
84134, si k = 1;
d) 1
96, para cualquier valor de k;

b) 0
02275, si k = 2;
e) 0
96, para cualquier valor de k.

c) 0
9973, si k = 3;
eval uan el n
o
de fusibles buenos observados hasta encontrar el primero defectuoso. Suponiendo independencia,
la probabilidad de que se hayan observado exactamente 5 fusibles buenos es:
a) 1; b) 3/100; c) 100/3; d) 97/3; e) Todo falso.
8. (09-09-03) Sea una v.a. con distribucion N(0, ). Se tiene que P(|| > k) es aproximadamente igual a:
a) 0
3173, si k = 1;
d) 0

b) 0
0455, si k = 2;
e) 1

c) 0
9973, si k = 3;
9. (17-02-04) El n
o
de llamadas de telefono a una centralita durante un periodo especco es una v.a. con
distribucion de Poisson. Si la probabilidad de que haya al menos una llamada durante un periodo es 2/3,
entonces:
a) El n
o
medio de llamadas en un periodo es ln(3);
b) La probabilidad de que haya habido exactamente una llamada es ln(3)/3;
o
de llamadas por periodo es ln(3);
o
de llamadas por periodo es ln(3)/3;
e) Todo falso.
10. (17-02-04) Sea una v.a. con distribucion N(, ), entonces P( > ) es igual a:
a) 084134; b) 002275; c) 05; d) Depende de ; e) Todo falso.
11. (21-06-04) La probabilidad de que una v.a. con distribucion normal N(0, 1) tome un valor par es:
a) 075; b) 025; c) 05; d) 0; e) Todo falso.
12. (21-06-04) La vida de una componente sigue una distribucion exponencial. La probabilidad de que la
vida de una de esas componentes sea mas peque na que su vida media es siempre igual a:
a) 1; b) 1 e
1
; c) e
/; d) 97/3; e) Todo falso.

13. (09-09-04) Sea una v.a con distribucion chi-cuadrado
2
4
, entonces 3 sigue una distribucion:
a)
2
6
; b) (2, 3/2); c) exp(2); d) (2, 1/6); e) Todo falso.
14. (09-09-04)La vida de una componente sigue una distribucion exponencial. La probabilidad de que la vida
de una de esas componentes sea mas peque na que su vida media es siempre igual a:
a) 1; b) 1 e
1
; c) e

15. (06-07-05) En una sala de ordenadores hay diez PCs. libres, de los cuales tres no funcionan. Para trabajar
en dicha sala llegan a la vez cuatro alumnos. La probabilidad de que solo uno de los cuatro elija un ordenador
defectuoso es:
a) 6; b) 0525; c) 03333; d) 1/2; e) Todo falso.
eval uan el n umero de fusibles observados hasta encontrar el primero defectuoso. El n umero medio de esos fusibles
evaluados es:
a) 50; b) 4/100; c) 25; d) 48; e) Todo falso.
17. (06-07-05) Sea una v.a. con distribucion (2, 1), entonces 2 sigue una distribucion:
a) (2, 2); b) (2, 1/2); c) exp(2); d)
2
4
; e) Todo falso.
18. (06-07-05) Sea una v.a. con distribucion normal de media y varianza
2
. Entonces P(| | < k )
es aproximadamente igual a:
a) 1, si k = 1; b) 0
9545, si k = 2; c) 0
9973, si k = 3; d) 0, si k = 4; e) Todo falso.

19. (07-09-05) Si el n umero de coches que llegan a un taller al da sigue una distribucion de Poisson de
varianza 2, entonces la probabilidad de que en un da no llegue ning un coche al taller es:
a) 0; b) e
2
;
c) e
2
; d) 1 e
2
;
e) Todo falso.
20. (07-09-05)
0
e
x
2
/2
dx es igual a:
a) 05; b)
/2; c)

; d) 2
; e) Todo falso.
21. (07-09-05) La probabilidad de que una v.a. con distribucion
2
15
tome cualquier valor entero m ultiplo de
tres es:
a) 0; b) 025; c) 05; d) 075; e) Todo falso.
22. (13-02-06) En un lote de 15 componentes electricos hay 6 defectuosos. Si se eligen de forma simultanea
5 componentes al azar, la probabilidad de que haya al menos dos defectuosos es aproximadamente:
a) 02937; b) 05; c) 07063; d) 04; e) Todo falso.
23. (13-02-06) Se dispone de dos metodos para transmitir un mensaje. El metodo A transmite correctamente
el 70 % de los mensajes y el metodo B el 90 %. Un da se elige un metodo al azar y se transmiten con el 8 mensajes
independientes, comprobandose que los dos primeros fueron incorrectos y el resto correctos. La probabilidad de
que el metodo utilizado fuese el A es aproximadamente:
a) 0666; b) 0333; c) 05; d) 08; e) Todo falso.
24. (13-02-06) Si la v.a. altura en metros de un objeto () sigue una distribucion gamma (3, 2), la v.a. altura
en decmetros de ese objeto (10) sigue una distribucion:
a) N(0, 1); b) (30, 2); c) (3, 20); d) (0
3, 2); e) (3, 0
2).
Las tres preguntas siguientes hacen referencia al siguiente enunciado: Una caja con nueve guantes de trabajo
contiene dos guantes para la mano izquierda y siete para la mano derecha.
25. (30-06-06) Si se eligen dos guantes al azar sin reemplazamiento, la probabilidad de que ambos guantes
sean para la mano derecha es:
a) 84; b) 1/2; c) 7/12; d) 98/243; e) Todo falso.
26. (30-06-06) Si se eligen tres guantes al azar sin reemplazamiento, la probabilidad de que uno sea para la
izquierda y dos para la derecha es:
a) 84; b) 1/2; c) 7/12; d) 98/243; e) Todo falso.
27. (30-06-06) Si se eligen tres guantes al azar con reemplazamiento, la probabilidad de que uno sea para
la izquierda y dos para la derecha es:
a) 84; b) 1/2; c) 7/12; d) 98/243; e) Todo falso.
28. (30-06-06) Sea una v.a. con distribucion de Poisson de parametro 0
5, entonces P( = E()) es igual

a:
a) 1, por ser la distribucion de Poisson continua;
c) 3/2;
e) Todo falso.
b) 1/2;
d) 3/4;
29. (30-06-06) La probabilidad de que una v.a. con distribucion N(0, ) tome un valor negativo (P( < 0)
es:
a) No se puede saber; b) 025; c) 05; d) 0; e) Todo falso.
30. (07-09-06) De un lote de N televisores, que contiene 3 defectuosos, un hotel instala cinco unidades. Para
cualquier valor de N, la probabilidad de instalar al menos uno defectuoso es:
a)
_
5
1
_
3
N
(1
3
N
)
4
;
d)
_
3
1
__
N3
4
_
/
_
N
5
_
;
b) 1
_
5
0
_
(1 3/N)
5
;
e) Todo falso.
c) 1
_
3
0
__
N3
5
_
/
_
N
5
_
;
31. (07-09-06) Si es una variable aleatoria con distribucion normal N(5, 3), su funcion de densidad f
(x):
a) Tiene un maximo en x = 0;
c) Es simetrica respecto a la recta x = 5;
e) Todo falso.
b) Es simetrica respecto a la recta x = 0;
d) Tiene un maximo en x = 5;
32. (16-02-07) En un proceso de fabricacion donde se laminan varias capas ceramicas, el 1 % de los ensambles
es defectuoso. Suponiendo que los ensambles son independientes, el n umero medio de ensambles que es necesario
examinar para tener uno defectuoso es:
a) 100; b) 1; c) -2; d) 20; e) Todo falso.
33. (16-02-07) Si es una v.a. con distribucion normal N(, ), la probabilidad P( 3 < < + 3) es
aproximadamente:
a) 09974; b) 00026; c) 12345; d) 02401; e) 095.
34. (22-06-07) En unas pruebas de seleccion acuden 9 personas, 6 varones y 3 mujeres. Si todas las personas
tienen la misma probabilidad de ser seleccionados y se eligen tres, cual es la probabilidad de que, como mucho,
quede una mujer sin seleccionar?
a) 19/84; b) 7/27; c) 30; d) 1/720; e) Todo falso.
El siguiente enunciado hace referencia a las dos cuestiones siguientes: Una baraja espa nola tiene cuarenta cartas,
de las cuales cuatro son ases. Las cartas estan mezclada al azar y se extraen dos de ellas.
35. (22-06-07) Si se eligen las dos cartas sin reemplazamiento, la probabilidad de que las dos sean ases es:
a) 1/100; b) 1/16; c) 1/4; d) 1/825; e) Todo falso.
36. (22-06-07) Si se eligen las dos cartas con reemplazamiento, la probabilidad de que las dos sean ases es:
a) 1/100; b) 1/16; c) 1/4; d) 1/825; e) Todo falso.
37. (22-06-07) Si la probabilidad de que un trabajador de una fabrica sufra un accidente laboral es 001, la
probabilidad de que se produzca como mucho un accidente laboral entre los 20 trabajadores de la fabrica es
aproximadamente igual a:
a) 098; b) 05; c) 0; d) 075; e) 27.
38. (07-09-07) Si sigue una distribucion binomial B(2, 0
5), se tiene que la esperanza de

2
es igual a:
a) 15; b) 1; c) 05; d) -35; e) Todo falso.
39. (07-09-07) Si es una variable con distribucion normal N(, ), la probabilidad P(| | < 3) es
a) 19987; b) 09974; c) 00026; d) -00013; e) 27.
40. (26-06-08) Suponiendo que la demanda aleatoria de gasolina durante un cierto periodo de tiempo se
comporta con arreglo a la distribucion normal de media 150000 litros y desviacion tpica 10000 litros, la mnima
cantidad que hay que tener disponible para satisfacer la demanda con una probabilidad p es:
a) 166450 litros si p = 0
95;
d) 169 litros si p = 0
975;
b) 166 litros si p = 0
95;
e) 150 litros si p = 0
975.
c) 169600 litros si p = 0
975;
41. (26-06-08) Una urna contiene 20 bolas, de las que 8 son rojas, 3 verdes y 9 negras. Se extraen simultanea-
mente 3 bolas de la urna. La probabilidad de que
a) Las 3 sean rojas es (1/8)
3
;
d) Ninguna sea verde es 1 (1/9)
3
;
b) Al menos 1 sea verde es (1/9)
3
;
e) Todo falso.
c) Dos sean rojas es 8/95;
42. (05-09-08) Un alumno responde al azar una pregunta de un test con 5 posibles respuestas correctas de las
que sabe, por un compa nero, que exactamente 2 son ciertas. Cual es la probabilidad de que se nale exactamente
las dos correctas?
a) 1/5; b) 1/10; c) 5; d) 1/20; e) Todo falso.
43. (05-09-08) Supongamos que sigue una distribucion uniforme U(0, 1), entonces:
a) 3 U(0, 3); b) 0
5 U(0, 2); c) 3 U(0, 2); d) 0
5 U(0, 0
5); e) Todo falso.

44. (16-09-09) Si es una v.a. con distribucion binomial B(10, p), entonces la varianza de :
a) No puede ser menor que cero;
c) No puede ser mayor que cero;
e) Todo falso.
b) No puede ser mayor que uno;
d) No puede ser menor que uno;
45. (16-09-09) Si es una v.a. con distribucion de Poisson P(2), se tiene que:
a) P( = 2) > P( 1);
c) P( = 2) = P( = 1);
e) Todo falso.
b) P( = 0) = P( = 1);
d) P( = 0) P( = 1);
N
o
Solucion N
o
Solucion N
o
Solucion N
o
Solucion N
o
Solucion
1. c) 2. b) 3. a), b), c) 4. a) 5. a), d)
6. c) 7. e) 8. a), b) 9. a), b), c) 10. c)
11. d) 12. b) 13. d) 14. b) 15. d)
16. c) 17. b), d) 18. b), c) 19. b) 20. b)
21. a) 22. c) 23. a) 24. e) 25. c)
26. b) 27. d) 28. e) 29. c) 30. c)
31. c), d) 32. a) 33. a) 34. a) 35. e)
36. a) 37. a) 38. a) 39. b) 40. a), c)
41. e) 42. b) 43. a), d) 44. a) 45. c)
AS COMUNES.
PR
Excel dispone de varias funciones que permiten trabajar con los modelos de distribuciones mas comunes. Dichas
funciones se encuentran dentro de la categora Estadsticas. Ya sabemos, de la Practica 1.1, que para ver las
funciones es necesario elegir la opcion Insertar funcion del men u Insertar. Una vez hecho esto, debemos
elegir Estadsticas en el cuadro Seleccionar una categora, lo que hace que se presenten todas las funciones
de la categora elegida en el cuadro Seleccionar una funcion.
Tambien pueden utilizarse dichas funciones tecleando directamente su expresion, si esta se conoce. As pues,
vamos a presentar dos cuadros, uno para distribuciones discretas y otro para distribuciones continuas, en los
que describiremos las principales funciones relacionadas con modelos de probabilidad conocidos.
Las funciones esenciales de Excel para el trabajo con distribuciones discretas son:
FUNCI
ON DESCRIPCI
ON
DISTR.BINOM(k; n; p; 0)
Calcula el valor de la funcion de probabilidad de una v.a. Binomial
B(n, p) en el punto k, es decir, P( = k) =
_
n
k
_
p
k
(1 p)
nk
.
DISTR.BINOM(k; n; p; 1)
Calcula el valor de la funcion de distribucion de una v.a. Binomial
B(n, p) en el punto k, es decir,
F
(k) = P( k) =
x
i
k
_
n
x
i
_
p
x
i
(1 p)
nx
i
.
BINOM.CRIT(n; p; x)
Devuelve el mnimo valor x tal que F
B(n,p)
(x) a, donde
F
B(n,p)
(x) representa la funcion de distribucion de una v.a. con
distribucion Binomial B(n, p).
NEGBINOMDIST(k 1; 1; p)
Calcula el valor de la funcion de probabilidad de una v.a.
Geometrica G(p) en el punto k, es decir, P( = k) = (1 p)
k1
p.
DISTR.HIPERGEOM(k; n; D; N)
Calcula el valor de la funcion de probabilidad de una v.a. Hiper-
geometrica H(N; D; n) en el punto k, es decir,
P( = k) =
(
D
k
)(
ND
nk
)
(
N
n
)
.
POISSON(k; ; 0)
Calcula el valor de la funcion de probabilidad de una v.a. Poisson
P() en el punto k, es decir, P( = k) = e

k
k!
.
POISSON(k; ; 1)
Calcula el valor de la funcion de distribucion de una v.a. Poisson
P() en el punto k, es decir, F
(k) = P( k) =
x
i
k
e
x
i
x
i
!
.
Las funciones esenciales de Excel para el trabajo con distribuciones continuas son:
FUNCI
ON DESCRIPCI
ON
DISTR.EXP(x; ; 0)
Calcula el valor de la funcion de densidad de una v.a. Ex-
ponencial exp() en el punto x, es decir, f
(x) = e
x
.
DISTR.EXP(x; ; 1)
Calcula el valor de la funcion de distribucion de una v.a.
Exponencial exp() en el punto x, es decir,
F
(x) = P( x) =
x
0
e
t
dt.
DISTR.GAMMA(x; p;
1
a
; 0)
Calcula el valor de la funcion de densidad de una v.a. Gam-
ma (p, a) en el punto x, es decir, f
(x) =
a
p
(p)
x
p1
e
ax
.
DISTR.GAMMA(x; p;
1
a
; 1)
Gamma (p, a) en el punto x, es decir,
F
(x) = P( x) =
x
0
a
p
(p)
t
p1
e
at
dt.
DISTR.GAMMA.INV (; p;
1
a
)
Calcula el valor x tal que la funcion de distribucion de una
v.a. Gamma (p, a) en ese punto x es .
DISTR.NORM(x; ; ; 0)
Calcula el valor de la funcion de densidad de una v.a. Nor-
mal N(, ) en el punto x, es decir,
f
(x) =
1
2
e
1
2
2
(x)
2
.
DISTR.NORM(x; ; ; 1)
Normal N(, ) en el punto x, es decir,
F
(x) = P( x) =
2
e
1
2
2
(t)
2
dt.
Ejemplo 1. Tenemos un lote de 500 piezas, de las que sabemos que 20 son defectuosas y el resto son buenas.
De dicho lote se eligen 100 piezas.
extraemos 100
cuntas son D?
20 D
480B
500 planchas
Si consideramos la variable aleatoria
=n
o
de piezas defectuosas de las 100 seleccionadas
dicha variable tiene una distribucion hipergeometrica H(500, 20, 100), puesto que las piezas se eligen sin reem-
plazamiento y, por tanto, no existe independencia entre las sucesivas etapas del experimento.
Por tanto, si queremos calcular la probabilidad de que no se haya seleccionado ninguna defectuosa, es decir, la
probabilidad P( = 0) podramos obtener este resultado si tecleamos en Excel:
=DISTR.HIPERGEOM(0;100;20;500)
En la hoja Ejemplo 1 del chero prac04.xls hemos dejado la casilla B3 para colocar dicha probabilidad. El
resultado de este procedimiento es que la probabilidad de que no haya defectuosos en los 100 seleccionados es
0
010.
Si nos piden que calculemos la probabilidad de que haya alguno defectuoso, como en este caso P( > 0) =
P( 1) = 1 P( = 0), dicha probabilidad se puede obtener en la casilla C3 sin mas que teclear =1-B3. Es
evidente, que la probabilidad buscada es 0
990.
Si las 100 piezas se eligen con reemplazamiento, existira independencia entre las etapas, con lo que la distribucion
de sera binomial B(100, 20/500). Para calcular las probabilidades anteriores nos colocaramos en B4 en primer
lugar y teclearamos
=DISTR.BINOM(0;100;20/500;0)
En C4 teclearamos =1-B4. As pues, si trabajamos con reemplazamiento, la probabilidad de que ninguna sea
defectuosa es 0
017 y la de que alguna lo sea es 0
983.
Ademas del valor de la probabilidad o de la funcion de distribucion en un punto para las principales distribuciones
de probabilidad, Excel permite obtener muestras simuladas de las mismas. Esto se consigue mediante el comando
Generacion de n umeros aleatorios del men u Herramientas Analisis de datos. Al seleccionar este
comando se abre una ventana como la que sigue:
En N umero de Variables se escribe el n umero de columnas con la misma distribucion que se desea generar.
En Cantidad de n umeros aleatorios se escribe el n umero de las en cada columna que se desea generar, es
decir, el tama no de la muestra.
En Distribucion se debe hacer clic en la echa descendente para abrir una lista de siete distribuciones (entre
ellas la Bernoulli, Binomial, Poisson, Uniforme y Normal) de las cuales se puede escoger una para generar los
n umeros aleatorios y luego especicar los parametros de esa distribucion.
En Iniciar con se puede escribir un valor opcional empleado como punto inicial, llamado semilla aleatoria, para
generar una cadena de n umeros aleatorios. No es necesario escribir nada en esta casilla, y nosotros la dejaremos
vaca por defecto.
En cuanto a las Opciones de salida, los comentarios son los mismo que en cualquier otra ventana de Excel.
Si nos situamos en hoja de trabajo Simulacion del mismo chero que tenamos abierto y realizamos las
operaciones descritas anteriormente, obtenemos 200 valores de una v.a. con distribucion N(0, 23) a partir de
la celda B2. Una vez obtenido estos 200 valores, si queremos, por ejemplo, calcular la proporcion de ellos que
estan entre -12 y 12, no sera demasiado ecaz ir mirandolos uno a uno (Imaginemos si hubiesemos generado
2000 o 20000000!). Por lo tanto, nos situamos en la celda D2 y tecleamos
=SI(ABS(B2)<12;1;0)
Una vez hecho esto para la primera la de datos, arrastramos esta hasta la lnea 201, con lo que tendramos un
1 para cada valor de la normal entre -12 y 12 y un 0 para el resto.
Si queremos contar la proporcion de valores que estan en ese intervalo, nos situaramos, por ejemplo, en H6 y
escribiramos
=SUMA(D2:D201)/200
con lo que obtendramos dicha proporcion.
Este valor es una aproximacion (si es buena o mala, ya lo estudiaremos con mas precision en el Tema 8) a la
proporcion teorica de valores entre -12 y 12, es decir, a la probabilidad de que una normal N(0, 23) este entre
-12 y 12. Para obtener el valor de esta probabilidad y ver como la proporcion en la muestra de 200 valores se
aproxima al valor teorico, tenemos que tener en cuenta que el ordenador (al igual que ocurre con la calculadora
o las tablas) nos da la funcion de distribucion, es decir, la probabilidad de ser menor o igual que el punto. Ahora
bien, considerando que
P(12 < < 12) = P( < 12) P( 12)
continua
= F
N(0,23)
(12) F
N(0,23)
(12),
se puede obtener dicha probabilidad con el Excel si nos situamos en la celda H9, por ejemplo, y escribimos
=DISTR.NORM(12;0;23;1)-DISTR.NORM(-12;0;23;1)
que, en este ejemplo, toma el valor 03981.
APUNTES DE TEOR
IA.
5.1. Introduccion.
Hasta ahora, en el estudio de las variables aleatorias hemos considerado solo el caso unidimensional, es decir, el
resultado del experimento se poda consignar con un solo n umero. Sin embargo, en muchos casos, nos interesa
observar simultaneamente dos o mas caractersticas. Por ejemplo, para una pieza manufacturada de acero puede
interesarnos conocer la dureza D y la resistencia a la tension R y consideraramos el par (d, r) como un solo
resultado experimental. Podramos estudiar la altura A y el peso P de una persona determinada que dara lugar
al resultado (a, p). Finalmente podramos observar la cantidad de lluvia total LL y el promedio de temperatura
T, en cierta region durante un mes especco, que dara lugar al resultado (ll, t).
Denicion 5.1.1 Sean y dos variables aleatorias denidas sobre el espacio probabilstica (, A, P). La
aplicacion (, ) que asigna a cada resultado del e.a. un par de n umeros reales (x, y) recibe el nombre de
variable aleatoria bidimensional, (en lo que sigue v.a.b.).
(, ) : IR
2
((), ()) = (x, y)
En general, si tenemos
1
,
2
, . . . ,
n
n variables aleatorias unidimensionales, la aplicacion (
1
,
2
, . . . ,
n
) de
en IR
n
que a cada resultado del e.a. le asigna un vector (x
1
, x
2
, . . . , x
n
) con
i
() = x
i
, recibe el nombre
de variable aleatoria n-dimensional ( o vector aleatorio n-dimensional).
Para facilitar la notacion y hacer posible las representaciones gracas, consideraremos unicamente el caso bidi-
mensional. Los conceptos se extienden a cualquier n umero de dimensiones con el precio de alguna complicacion
en la notacion y de una dicultad creciente para las visualizaciones gracas.
PROBABILIDAD INDUCIDA
Si denotamos por P(IR
2
) al conjunto de todos los subconjuntos de IR
2
(conjunto de las partes de IR
2
), una
v.a.b. (, ) denida sobre un espacio probabilstico (, A, P) permite denir unvocamente una probabilidad
P
sobre el espacio (IR

2
, P(IR
2
)).
Denicion 5.1.2 La probabilidad inducida por una v.a.b. (, ), es una funcion P
denida de la siguiente
manera:
P
: P(IR
2
) IR
B P
(B) = P[(, )
1
(B)] = P{ /((), ()) B}
Es facil comprobar que P
as determinada cumple los axiomas de Kolmogorov, con lo que tenemos el siguiente

espacio probabilstico (IR
2
, P(IR
2
), P
) que es mas manejable matematicamente.

W
( ) x,h
-1
(B)
B
P* P
R
R
2
Figura 5.1: Una v.a.b. transmite la estructura probabilstica del espacio muestral a IR
2
.
Al igual que en el caso unidimensional, caracterizamos la distribucion de cualquier v.a.b. mediante la funcion
de distribucion conjunta.
Denicion 5.1.3 Sea (, ) una v.a. denida sobre un espacio probabilstico (, A, P). La funcion de distribu-
cion conjunta de (, ) es una funcion F denida por:
F : IR
2
IR
(x, y) F(x, y) = P{ x, y} = P{ /() x () y} =
P{
1
((, x])
1
((, y])} = P
{(, x] (, y]}.
Las propiedades de una funcion de distribucion conjunta las resumimos en la siguiente proposicion.
Proposicion 5.1.1 Cualquier funcion de distribucion conjunta F, verica:
1. F(, y) = lm
x
F(x, y) = F(x, ) = lm
y
F(x, y) = 0;
2. F(+, +) = lm
x +
y +
F(x, y) = 1;
3. F es no decreciente para cada variable, es decir:
si x
1
< x
2
F(x
1
, y) F(x
2
, y), y,
si y
1
< y
2
F(x
,
y
1
) F(x, y
2
), x.
4. F es continua por la dcha. respecto a cada variable, es decir, para todo y se tiene que lm
x
n
x
+
0
F(x
n
, y) =
F(x
0
, y), y para todo x se tiene que lm
y
n
y
+
0
F(x, y
n
) F(x, y
0
).
Si conocemos la funcion de distribucion conjunta de una v.a.b. podemos conocer la funcion de distribucion de
cada una de sus componentes.
Denicion 5.1.4 Dada una v.a.b. (, ) con funcion de distribucion conjunta F(x, y), se dene la funcion de
distribucion marginal para la v.a. y se denota por F
1
, la funcion dada por:
F
1
(x) = lm
y+
F(x, y).
Se comprueba que F
1
(x) = F
(x) para todo x, es decir que la funcion de distribucion marginal para y la

funcion de distribucion de son iguales.
Analogamente podemos denir:
Denicion 5.1.5 Dada una v.a.b. (, ) con funcion de distribucion conjunta F(x, y), se dene la funcion de
distribucion marginal para la v.a. y se denota por F
2
, la funcion dada por:
F
2
(y) = lm
x+
F(x, y).
Se comprueba que F
2
(y) = F
(y) para todo y, es decir que la funcion de distribucion marginal para y la

funcion de distribucion de son iguales.
Al igual que en el tema 3, en esta seccion proponemos una clasicacion de las variables aleatorias a partir de sus
funciones de distribucion, con la misma advertencia que planteabamos entonces, es decir, que la clasicacion no
constituye una particion pues existen variables aleatorias bidimensionales que no van a poder ser incluidas en
ninguno de los dos grupos que estableceremos.
Basandonos en la funcion de distribucion de una variable, podemos clasicarla en discreta o continua del siguiente
modo:
Denicion 5.2.1 Una variable aleatoria bidimensional (, ) se dice que es discreta si su funcion de distribu-
cion es escalonada, o de manera equivalente, si existe un subconjunto A IR
2
nito o innito numerable tal
que P{(, ) A} = 1.
0
0.25
0.5
0.75
1
Figura 5.2: Funcion de distribucion conjunta escalonada correspondiente a una v.a.b. discreta.
Denicion 5.2.2 Si A = {(x
1
, y
1
), . . . , (x
i
, y
j
), . . . } y denotamos por p
ij
= P{ = x
i
, = y
j
}, i = 1, 2, . . . , n,
. . . , j = 1, 2, . . . , m, . . . , entonces la coleccion {p
ij
} recibe el nombre de distribucion de probabilidad con-
junta de la v.a.b. discreta (, ).
Claramente
ij
p
ij
= 1, y como en el caso unidimensional, esta propiedad junto a la no-negatividad sirven para
caracterizar las distribuciones de probabilidad.
La funcion de distribucion conjunta de una v.a.b. discreta (, ) puede calcularse a partir de la distribucion de
probabilidad conjunta mediante la siguiente igualdad:
F(x, y) =
{(x
i
,y
j
)A/x
i
x,y
j
y}
p
ij
.
Denicion 5.2.3 Sea {p
ij
} la distribucion de probabilidad conjunta de la v.a.b. discreta (, ), entonces la
coleccion de valores {p
i
}
i=1
denidos por p
i
=
j=1
p
ij
recibe el nombre de distribucion de probabilidad
marginal de y coincide con la distribucion de probabilidad de la v.a. . Analogamente, la coleccion {p
j
}
j=1
con p
j
=
i=1
p
ij
recibe el nombre de distribucion de probabilidad marginal de y coincide con la
distribucion de probabilidad de la v.a. .
Ejemplo 5.2.1 Consideremos el e.a. consistente en lanzar una moneda tres veces. Sea = n
o
de caras en tres
tiradas, y = valor absoluto de la diferencia entre el n
o
de caras y el n
o
de cruces. En la siguiente tabla se
representan la distribucion de probabilidad conjunta, as como las marginales.
\ 0 1 2 3 p
j
1 0 3/8 3/8 0 6/8
3 1/8 0 0 1/8 2/8
p
i
1/8 3/8 3/8 1/8
Denicion 5.2.4 Una v.a.b. (, ) se dice que es continua si su funcion de distribucion conjunta F es abso-
lutamente continua, es decir, si existe una funcion f : IR
2
IR, no negativa tal que:
F(x, y) =
f(s, t)dtds, (x, y) IR

2
.
La funcion f es unica c.s. y se denomina funcion de densidad conjunta de (, ).
Claramente, por la propiedad 2 de la Proposicion 5.1.1 (pag. 178),
F(+, +) = 1 = lm
x +
y +
F(x, y) = lm
x +
y +
f(s, t)dtds =
f(s, t)dtds
y esta propiedad junto con la no-negatividad sirve para caracterizar a las funciones de densidad conjuntas, como
ocurra en el caso discreto con las distribuciones de probabilidad.
Si f es continua en (x, y), entonces:
2
F(x, y)
xy
= f(x, y)
lo que permite calcular la funcion de densidad conjunta a partir de la funcion de distribucion conjunta de una
v.a.b. continua.
Denicion 5.2.5 Sea f(x, y) la funcion de densidad conjunta de la v.a.b. continua (, ), entonces la funcion
f
1
denida por f
1
(x) =
f(x, y)dy recibe el nombre de funcion de densidad marginal de y coincide

con la funcion de densidad de la v.a. . Analogamente, la funcion f
2
denida por f
2
(y) =
f(x, y)dx recibe

el nombre de funcion de densidad marginal de y coincide con la funcion de densidad de la v.a. .
En la siguiente gura representamos la funcion de densidad conjunta de una v.a.b.
En general, si queremos calcular la probabilidad de que una v.a.b. tome valores en un subconjunto de IR
2
,
utilizaremos las siguientes expresiones:
P{(, ) B} =
_
{(x
i
,y
j
)B}
P( = x
i
, = y
j
) si (, ) es discreta,
B
f(x, y)dydx si (, ) es continua.
5.3. Distribuciones condicionadas.
0
0.05
0.1
0.15
Figura 5.3: Funcion de densidad conjunta de una v.a.b.
Denicion 5.3.1 Sea (, ) una v.a.b. discreta. Sea y
j
tal que P{ = y
j
} > 0, la funcion:
P{ = x
i
/ = y
j
} =
P{ = x
i
, = y
j
}
P{ = y
j
}
,
es la distribucion de probabilidad de , condicionada por = y
j
.
Se puede dar una denicion similar para la distribucion de probabilidad de condicionada por = x
i
supuesto que P{ = x
i
} > 0: P{ = y
j
/ = x
i
} =
P{=x
i
,=y
j
}
P{=x
i
}
.
Para el ejemplo 5.2.1 tenemos:
P{ = i/ = 1} =
_
0 i = 0, 3,
1/2 i = 1, 2;
P{ = i/ = 3} =
_
1/2 i = 0, 3,
0 i = 1, 2;
P{ = j/ = 0} =
_
0 j = 1,
1 i = 3;
etc.
Denicion 5.3.2 Sea (, ) una v.a.b. continua. Sea y tal que f
2
(y) > 0, la funcion:
f(x/y) =
f(x, y)
f
2
(y)
,
es la funcion de densidad de , condicionada por = y.
Se puede dar una denicion similar para la funcion de densidad de condicionada por = x supuesto
que f
1
(x) > 0:
f(y/x) =
f(x, y)
f
1
(x)
.
5.4. Independencia entre variables aleatorias.
En el tema 2 denimos la independencia entre sucesos, ahora deniremos la independencia entre variables
aleatorias. Intuitivamente dos variables aleatorias y son independientes si el resultado de una de ellas no
inuye en el resultado de la otra. Esta es una nocion de mucha importancia y existen muchas situaciones
practicas en las que se justica la suposicion de independencia entre variables aleatorias.
Denicion 5.4.1 Sean y dos variables aleatorias denidas sobre el mismo espacio probabilstica (, A, P),
se dice que y son independientes si dados dos subconjuntos A y B de IR, los sucesos
1
(A) y
1
(B)
son independientes, es decir:
P{
1
(A)
1
(B)} = P{
1
(A)} P{
1
(B)}.
Se puede demostrar la siguiente proposicion, que proporciona una alternativa para comprobar la independencia
entre variables aleatorias.
Proposicion 5.4.1 Sea (, ) una v.a.b con funcion de distribucion conjunta F(x, y). Las variables y son
independientes si y solo si :
F(x, y) = F
1
(x) F
2
(y) para todo par de reales (x, y),
siendo F
1
y F
2
las funciones de distribucion marginales para y respectivamente.
Demostracion
La condicion necesaria es inmediata, ya que F(x, y) = P{
1
((, x])
1
((, y])} = P{
1
((, x])}
P{
1
((, y])} = F
1
(x) F
2
(y). No demostraremos la condicion suciente, dado que requiere conocimientos
de teora de la medida.
Tambien se puede comprobar la independencia entre v.as a partir de las proposiciones siguientes.
Proposicion 5.4.2 a) La condicion necesaria y suciente para que las v.as. discretas y sean independientes
es que: P{ = x
i
, = y
j
} = P{ = x
i
} P{ = y
j
} para todos los pares (x
i
, y
j
).
b) Si f, f
1
y f
2
, son respectivamente la funcion de densidad conjunta de (, ) y las marginales de y . Las
v.as. y son independientes si y solo si: f(x, y) = f
1
(x) f
2
(y) para todo par de reales (x, y).
Corolario 5.4.1 a) La condicion necesaria y suciente para que las v.as. discretas y sean independientes
es que: P{ = x
i
/ = y
j
} = P{ = x
i
}, para todo (x
i
, y
j
) con P{ = y
j
} > 0.
b) La condicion necesaria y suciente para que las v.as. discretas y sean independientes es que:
P{ = y
j
/ = x
i
} = P{ = y
j
}, para todo (x
i
, y
j
) con P{ = x
i
} > 0.
c) Sean f, f
1
y f
2
v.as. y son independientes si y solo si: f(x/y) = f
1
(x), para todo par de reales (x, y), con f
2
(y) > 0.
d) Sean f, f
1
y f
2
v.as. y son independientes si y solo si: f(y/x) = f
2
(y), para todo par de reales (x, y), con f
1
(x) > 0.
Teorema 5.4.1 Sean y dos variables aleatorias independientes, y sean g y h dos aplicaciones reales de
variable real. Entonces las variables aleatorias g() y h() son tambien independientes.
Demostracion
En efecto, si llamamos = g() y = h(), entonces
F
(,)
(t, r) = P{ t, r} = P{g() t, h() r} = P{ g
1
((, t]), h
1
((, r])} =
P{
1
[g
1
((, t])]
1
[h
1
((, r])]} = P{
1
[g
1
((, t])]} P{
1
[h
1
((, r])]} =
P{ g
1
((, t])}P{ h
1
((, r])} = P{g() t}P{h() r} = F
(t) F
(r).
Los conceptos anteriores pueden extenderse a n variables aleatorias, se dice que
1
,
2
, . . . ,
n
son independientes
si y solo si F(x
1
, x
2
, . . . , x
n
) = F
1
(x
1
) F
2
(x
2
) . . . F
n
(x
n
), (en el caso discreto si y solo si P{
1
= x
1
,
2
=
x
2
, . . . ,
n
= x
n
} = P{
1
= x
1
}P{
2
= x
2
}. . .P{
n
= x
n
}, y en el caso continuo si y solo si f(x
1
, x
2
, . . . , x
n
) =
f
1
(x
1
) f
2
(x
2
) . . . f
n
(x
n
)), para cualquier (x
1
, x
2
, . . . , x
n
) de IR
n
.
5.5. Funciones de variables aleatorias bidimensionales.
En esta seccion consideraremos la v.a. unidimensional que resulta de transformar una v.a.b. mediante una
funcion de IR
2
en IR, es decir:
(,)
IR
2
g
IR
(x, y) g(x, y)
Si llamamos = g(, ), y queremos calcular la distribucion de en funcion de la distribucion de (, ), lo
podemos hacer de la siguiente manera:
F
(t) = P{g(, ) t} = P{(, ) g

1
((, t])} =
_
{(x
i
,y
j
)/g(x
i
,y
j
)t}
P( = x
i
, = y
j
) (, ) discreta,

g
1
((,t])
f(x, y)dxdy (, ) continua.
En particular si = g(, ) es discreta y queremos calcular su distribucion de probabilidad,
P( = t) = P{g(, ) = t} = p{(, ) g
1
({t})} =
_
{(x
i
,y
j
)/g(x
i
,y
j
)=t}
P( = x
i
, = y
j
) (, ) discreta,

g
1
({t})
Si tenemos dos transformaciones g
1
y g
2
de IR
2
en IR y llamamos
1
= g
1
(, ) y
2
= g
2
(, ), la funcion de
distribucion conjunta de (
1
,
2
) se calcula de manera analoga,
F
(
1
,
2
)
(t
1
, t
2
) = P{(
1
t
1
,
2
t
2
)} = P{g
1
(, ) t
1
, g
2
(, ) t
2
)} =
P{(, ) g
1
1
((, t
1
]) g
1
2
((, t
2
])} =
_
{(x
i
,y
j
)/g
1
(x
i
,y
j
)t
1
g
2
(x
i
,y
j
)t
2
}
P( = x
i
, = y
j
) (, ) discreta,

g
1
1
((,t
1
])g
1
2
((,t
2
])
5.6. Momentos de funciones de variables aleatorias bidimensiona-
les.
Denicion 5.6.1 Se dene la esperanza matematica de = g(, ), como
E[g(, )] =
_
i,j
g(x
i
, y
j
) P( = x
i
, = y
j
) (, ) discreta,

IR
2
g(x, y) f(x, y)dxdy (, ) continua,
si la serie o integral correspondiente es absolutamente convergente.
En el caso de distribuciones condicionadas se da la siguiente denicion
Denicion 5.6.2 Se dene la esperanza matematica de = g(, ) condicionada por = x
0
, como
E[g(, )/ = x
0
] =
_
j
g(x
0
, y
j
) P( = y
j
/ = x
0
) (, ) discreta,
g(x
0
, y) f(y/x
0
)dy (, ) continua.
Analogamente, se dene la esperanza matematica de = g(, ) condicionada por = y
0
, como
E[g(, )/ = y
0
] =
_
i
g(x
i
, y
0
) P( = x
i
/ = y
0
) (, ) discreta,
g(x, y
0
) f(x/y
0
)dx (, ) continua.
Supuesto que existen las anteriores distribuciones condicionadas, y que las series e integrales anteriores son
absolutamente convergentes.
Dos propiedades de la esperanza de transformados de vectores aleatorios, las resumimos en la siguiente propo-
sicion.
Proposicion 5.6.1 a) E( +) = E() +E().
b) Si y son independientes, entonces E( ) = E() E().
Demostracion
Aunque las anteriores propiedades son validas para todo tipo de variables aleatorias, aqu se comprueba solo
con las continuas.
a) E( +) =
(x +y)f(x, y)dxdy =
xf(x, y)dxdy +
yf(x, y)dxdy =
x
_
f(x, y)dy
_
dx +
y
_
f(x, y)dx
_
dy =
xf
1
(x)dx +
yf
2
(y)dy = E() + E(), ya
que, recordemos que f
1
f
y f
2
f
.
b) Si y son independientes, entonces f(x, y) = f
1
(x) f
2
(y) para cualquier par (x, y).
E() =
(xy)f(x, y)dxdy =
xyf
1
(x)f
2
(y)dxdy =
yf
2
(y)
_

x f
1
(x)dx
_
dy =
y f
2
(y)E()dy = E()
y f
2
(y)dy = E() E().
El recproco de b) no es cierto. Por ejemplo, sea
=
_
_
_
1 P( = 1) = 1/3
0 P( = 0) = 1/3
1 P( = 1) = 1/3
2
=
_
1 P(
2
= 1) = 2/3
0 P(
2
= 0) = 1/3

3
=
_
_
_
1 P(
3
= 1) = 1/3
0 P(
3
= 0) = 1/3
1 P(
3
= 1) = 1/3
entonces E() = E(
3
) = 0 E(
2
) = E(
3
) = 0 = E() E(
2
), a pesar de que y
2
son v.as dependientes,
ya que P{
2
= 0/ = 0} = 1 = 1/3 = P{
2
= 0}.
Denicion 5.6.3 Llamamos momento de orden (r +s) de (, ) a E[g(, )] si existe, para el caso particular
g(x, y) = x
r
y
s
, donde r y s son enteros no negativos y lo denotamos por
rs
, es decir:
rs
= E(
r

s
).
Entonces, claramente
10
= E(),
01
= E(),
20
= E(
2
),
02
= E(
2
) y
11
= E( ).
Denicion 5.6.4 Llamamos momento central de orden (r +s) de (, ) a E[g(, )] si existe, para el caso
particular g(x, y) = [x E()]
r
[y E()]
s
, donde r y s son enteros no negativos y lo denotamos por
rs
, es
decir:
rs
= E([ E()]
r
[ E()]
s
).
Entonces,
10
= 0,
01
= 0,
20
= V ar(),
02
= V ar() y
11
= E{[ E()] [ E()]}.
Denicion 5.6.5 Si existe
11
= E{[ E()] [ E()]}, recibe el nombre de covarianza entre y , y
se escribe: Cov(, ) = E{[ E()] [ E()]}.
Veamos algunas propiedades de la covarianza.
Proposicion 5.6.2 a) Cov(, ) = E( ) E() E().
b) Cov(, ) = Cov(, ).
c) Para cualquier constante k, Cov(k , ) = k Cov(, ).
d) Para cualquier constante k, Cov( +k, ) = Cov(, ).
e) Cov(
1
+
2
, ) = Cov(
1
, ) +Cov(
2
, ).
f) V ar(c
1
+c
2
) = c
2
1
V ar() +c
2
2
V ar() + 2c
1
c
2
Cov(, ).
Demostracion
a) Cov(, ) = E{[ E()] [ E()]} = E{ E() E() +E() E()} = E( ) E() E()
E() E() +E() E() = E( ) E() E().
b) Evidente por la propiedad conmutativa del producto.
c) Cov(k , ) = E(k ) E(k ) E() = k E( ) k E() E() = k [E( ) E() E()].
d) Cov[ +k, ] = E[( +k) ] E[ +k] E[] = (E[ ] +kE[]) (E[] E[] +kE[]) = E[ ] E[] E[].
e) Cov(
1
+
2
, ) = E[(
1
+
2
) ] E(
1
+
2
) E() = E(
1
+
2
) [E(
1
) + E(
2
)] E() =
E(
1
) +E(
2
) E(
1
) E() E(
2
) E() = Cov(
1
, ) +Cov(
2
, ).
f) V ar(c
1
+c
2
) = E(c
1
+c
2
)
2
E
2
(c
1
+c
2
) = E(c
2
1

2
+c
2
2

2
+ 2c
1
c
2
) [c
1
E() +
c
2
E()]
2
= c
2
1
E(
2
) + c
2
2
E(
2
) + 2c
1
c
2
E( ) c
2
1
E
2
() c
2
2
E
2
() 2c
1
c
2
E() E() =
c
2
1
V ar() +c
2
2
V ar() + 2c
1
c
2
Cov(, ).
Corolario 5.6.1 Si y son independientes, entonces V ar( +) = V ar() +V ar().
Demostracion
Por a) si y son independientes Cov(, ) = 0 y por e) se obtiene el resultado.
5.7. Distribuciones reproductivas.
Veamos una propiedad que facilita el estudio de la distribucion de la suma de v.as.
Denicion 5.7.1 Se dice que una distribucion que depende de n parametros (
1
,
2
, . . . ,
i
, . . . ,
n
) es repro-
ductiva respecto al i-esimo parametro
i
, si dadas dos v.as. independientes y con distribuciones respec-
tivas (
1
,
2
, . . . ,
i
, . . . ,
n
) y (
1
,
2
, . . . ,
i
, . . . ,
n
), + sigue una distribucion (
1
,
2
, . . . ,
i
+
i
, . . . ,
n
).
Estudiaremos la reproductividad de algunas distribuciones importantes, para ello necesitaremos la siguiente
proposicion.
Proposicion 5.7.1 Sean y independientes con funciones generatrices de momentos g
y g
respectivamente,
entonces la f.g.m. de + es el producto de las f.g.m. respectivas. Es decir :
g
+
(t) = g
(t) g
(t).
Demostracion
Si y son independientes entonces e
t
y e
t
tambien lo son por el Teorema 5.4.1 (pag. 182), luego:
g
+
(t) = E[e
t(+)
] = E[e
t
e
t
] = E[e
t
] E[e
t
] = g
(t) g
(t).
Veamos algunos ejemplos de distribuciones reproductivas.
Proposicion 5.7.2 a) La distribucion binomial es reproductiva respecto al primer parametro, es decir: Sean
y independientes con distribuciones B(n
1
, p) y B(n
2
, p) respectivamente, + sigue una distribucion
B(n
1
+n
2
, p).
b) La distribucion de Poisson es reproductiva respecto su parametro, es decir: Sean y independientes con
distribuciones P(
1
) y P(
2
) respectivamente, + sigue una distribucion P(
1
+
2
).
c) La distribucion gamma es reproductiva respecto al primer parametro, es decir: Sean y independientes
con distribuciones (p
1
, a) y (p
2
, a) respectivamente, + sigue una distribucion (p
1
+p
2
, a).
d) La distribucion normal es reproductiva
3
respecto al parametro (,
2
), es decir: Sean y independientes
con distribuciones N(
1
,
2
1
) y N(
2
,
2
2
) respectivamente, + sigue una distribucion N(
1
+
2
,
2
1
+
2
2
).
Demostracion
a) En efecto: g
+
(t) = g
(t) g
(t) = (pe
t
+q)
n
1
(pe
t
+q)
n
2
= (pe
t
+q)
n
1
+n
2
.
b) En efecto: g
+
(t) = g
(t) g
(t) = e
1
(e
t
1)
e
2
(e
t
1)
= e
(
1
+
2
)(e
t
1)
.
c) En efecto: g
+
(t) = g
(t) g
(t) =
_
a
at
_
p
1
_
a
at
_
p
2
=
_
a
at
_
p
1
+p
2
.
d) En efecto: g
+
(t) = g
(t) g
(t) = e
t
1
+
1
2
2
1
t
2
e
t
2
+
1
2
2
2
t
2
= e
t(
1
+
2
)+
1
2
(
2
1
+
2
2
)t
2
.
3
Observemos que en este punto se ha modicado la notacion habitualmente utilizada para la normal, considerando ahora como
segundo parametro la varianza, en lugar de la desviacion tpica. Esto se hace con el proposito de que los parametros de la variable
suma sean la suma de los parametros de las variables sumadas. Con la notacion habitual el resultado se convierte en: + sigue
una distribucion N(
1
+
2
,
2
1
+
2
2
)
Ejercicio 5.1 A partir de la recopilacion de datos del historial de produccion, un tecnico de control estima
que la distribucion de probabilidad conjunta de las variables =operario que ha fabricado el producto y
=n umero de defectos del producto viene dada por:
\ 0 1 2
1 0
08 0
10 0
04
2 0
04 0
10 0
04
3 0
04 0
20 0
09
4 0
02 0
15 0
10
Se pide:
a) Cual es la probabilidad de que un producto haya sido realizado por el operario 3?
Calcular la distribucion de probabilidad marginal de la variable aleatoria .
b) Cual es la probabilidad de que un producto no tenga defectos?
Calcular la distribucion de probabilidad marginal de la variable aleatoria .
c) Si se selecciona al azar un producto que no tiene defectos, cual es la probabilidad de que haya sido realizado
por el operario 1?
Calcular la distribucion de probabilidad de condicionada a que = 0 (no tiene defectos).
d) Si se selecciona al azar un producto realizado por el operario 2, cual es la probabilidad de que no tenga
ning un defecto?
Calcular la distribucion de probabilidad de condicionada a que = 2 (operario 2).
e) Es independiente el n umero de defectos del operario que ha fabricado el producto?
Ejercicio 5.2 Cierto supermercado tiene una caja normal y una caja rapida. Representamos por el n umero
de clientes que estan esperando en la caja normal y por el n umero de clientes en la caja rapida, en un momento
dado. Suponiendo que la funcion de probabilidad conjunta viene dada por:
\ 0 1 2 3
0 0
08 0
07 0
04 0
00
1 0
06 0
15 0
05 0
04
2 0
05 0
04 0
10 0
06
3 0
00 0
03 0
04 0
07
4 0
00 0
01 0
05 0
06
Se pide:
a) Calcular la probabilidad de que haya exactamente un cliente en cada caja (P( = 1, = 1)).
b) Calcular la probabilidad de que haya el mismo n umero de clientes esperando en las dos cajas (P( = )).
c) Calcular la distribucion de probabilidad marginal de y el n umero esperado de clientes de la caja normal.
d) Calcular las probabilidades P( = 4), P( = 0) y P( = 4, = 0). Son y v.a. independientes?
e) Calcular la probabilidad de que el n umero total de clientes entre ambas cajas sea exactamente 4. Obtener la
distribucion de probabilidad del n umero total de clientes en ambas cajas ( +). Obtener el n umero medio
total de clientes en ambas cajas.
f) Calcular la distribucion de probabilidad de la diferencia entre el n umero de clientes en la caja normal y en
la caja rapida ( ).
Ejercicio 5.3 Se desea llenar cada neumatico delantero de un tipo particular de automovil a un presion de
26lb/pulg
2
. La presion de aire de cada neumatico es una variable aleatoria, para el neumatico derecho e
para el izquierdo, con funcion de densidad conjunta:
f(x, y) =
_
k si 20 x 30, 20 y 30,
0 en otro caso.
Se pide:
a) Calcular el valor de k.
b) Calcular la probabilidad de que ambos neumaticos tengan menor presion que la requerida.
c) Calcular la probabilidad de que la diferencia de presion de aire entre los neumaticos sea a lo sumo de 2
lb/pulg
2
.
d) Determinar la distribucion marginal de presion de aire del neumatico derecho y la distribucion marginal de
presion de aire del neumatico izquierdo.
e) Determinar la distribucion de presion de aire del neumatico izquierdo condicionada a que el neumatico
derecho tiene la presion de aire requerida.
f) Son y independientes?
Ejercicio 5.4 Una fabrica produce laminas rectangulares cuyas dimensiones (en cm.) vienen dadas por las
variables aleatorias continuas (ancho) y (alto). La funcion de densidad conjunta de (, ) es
f(x, y) =
_
1/150, si 10 < x < 20, 25 < y < 40
0, en el resto.
a) Cual es la probabilidad de que el permetro de la lamina sea menor de 90 cm?, y mayor de 110 cm?
b) Si el ancho es mayor de 15, cual es la probabilidad de que el permetro sea mayor o igual que 110 cm?
c) Si una lamina se rechaza cuando su alto es mayor de 30 o su ancho es menor de 12, cual es la probabilidad
de que se rechace una lamina? Cual es la probabilidad de que se rechace una lamina cuyo permetro es
menor de 90 centmetros?
Ejercicio 5.5 El proceso de fabricacion de planchas de acero en una miniacera consta de dos etapas bien
diferenciadas: el calentamiento y moldeado de la plancha, y el posterior enfriamiento hasta que adquiere la
consistencia denitiva. El tiempo de calentamiento y moldeado para cada plancha, , se distribuye uniformemente
entre 10 y 20 minutos, mientras que el tiempo de enfriamiento, , depende del tiempo empleado en la primera
etapa, mediante la siguiente funcion de densidad:
f
/=x
(y) =
_
1
2
e
yx
2
si y > x,
0 en otro caso.
Se pide:
a) La proporcion de planchas en las que la diferencia de tiempo entre ambas etapas de fabricacion no supere
los 6 minutos.
b) La probabilidad de que el tiempo de fabricacion total de una plancha no supere los 27 minutos.
c) Si el tiempo de enfriamiento ha sido de 15 minutos, cual es la proporcion de planchas en las que el tiempo
de calentamiento y de moldeado es superior a 11 minutos?
Ejercicio 5.6 Si se aplican dos cargas de
1
klb y
2
klb a una viga voladiza, como se muestra en la siguiente
gura, el momento de exion en la pared debido a las cargas es a
1
1
+a
2
2
klbs-pie.
a
1
a
2
a
Ax
1
Ax
2
a) Suponiendo que
1
y
2
son v.a. independientes, con medias 2 y 4 klb, y desviaciones tpicas 0
5 y 1
0 pies,
respectivamente y que a
1
= 5 pies y a
2
= 10 pies, cual es el momento de exion esperado y cual es la
desviacion tpica del momento de exion?
b) Si
1
y
2
estan normalmente distribuidas, cual la probabilidad de que el momento de exion sea mayor
de 75 klbs-pie?
c) Suponiendo que las posiciones de las dos cargas son variables aleatorias, representamos por
1
y
2
dichas
posiciones. Sabemos que E[
1
] = 5 pies y E[
2
] = 10 pies y que la carga (
i
) es independiente de la posicion
(
i
), cual es ahora el momento de exion esperado?
Ejercicio 5.7 Una determinada empresa tiene un aparato que consta de una componente. La empresa puede
instalar hasta dos componentes de repuesto para que en caso de que se avere la componente principal entre
en funcionamiento la primera componente de repuesto y permitan al aparato seguir funcionando, y en caso de
avera de la primera componente de repuesto entre en funcionamiento la segunda. Estudiar la abilidad del
aparato (probabilidad de que el aparato tenga una duracion superior a 3
45 a nos), suponiendo que la duracion

de una componente es independiente de la duracion de las otras dos y que la duracion (en a nos) de cada una
de las tres componentes es una v.a. con distribucion
a) normal N(2, 1);
b) gamma (4, 2);
c) exponencial exp(1/2);
Examenes.
Ejercicio 5.8 (19-06-03) Una fabrica produce laminas rectangulares cuyas dimensiones (en cm) vienen dadas
por las variables aleatorias (ancho) y (alto). La funcion de densidad conjunta de (, ) es:
f(x, y) =
_
1/150 si 10 < x < 20, 25 < y < 40,
0 en el resto.
Una lamina se considera defectuosa si su area es menor de 300 o mayor de 750 cm
2
.
a) Cual es la probabilidad de que una lamina sea defectuosa?
b) Si una lamina tiene una anchura menor de 11 cm, cual es la probabilidad de que sea defectuosa?
c) Cual es la supercie media de una lamina?
Ejercicio 5.9 (09-09-03) Las longitudes de una pieza de acero rectangular se representan mediante dos va-
riables aleatorias independientes y , cada una de ellas con distribucion uniforme en (0, 2). Calcular la proba-
bilidad de que se verique simultaneamente que el producto de las longitudes de una pieza sea menor que uno
y el cociente / sea menor que dos.
Ejercicio 5.10 (09-09-04) Sean y los niveles de concentracion en ppm de dos contaminantes en una
determinada porcion de un tanque de agua. Si la funcion de densidad conjunta viene dada por:
f
(,)
(x, y) =
_
(x +y)/8000 si 0 < x < 20, 0 < y < 20,
0 en otro caso.
Se pide:
a) Obtener la probabilidad de que el nivel de concentracion total de los dos contaminantes (suma de los dos
niveles de concentracion) sea mayor de 30 ppm.
b) Obtener la funcion de densidad de condicionada a que toma el valor 10 ppm.
c) Obtener la media y la varianza de la distribucion anterior.
Ejercicio 5.11 (06-07-05) Una fabrica de televisores somete cada unidad fabricada a dos pruebas de control
de calidad A y B. Denominamos a la proporcion mensual de unidades que pasan la prueba A y a la
proporcion mensual de unidades que pasan la prueba B. La funcion de densidad conjunta de una variable
aleatoria bidimensional (, ) viene dada por:
f(x, y) =
_
k y si 0 < x < 1, 0 < y < 1,
0 en el resto.
Calcular:
a) El valor de k.
b) P( < ).
c) P(
z), siendo z un n umero real cualquiera en el intervalo (0, 1).

Ejercicio 5.12 (30-06-06) Dos componentes de un ordenador tienen la siguiente funcion de densidad conjunta
para sus tiempos de vida (, ):
f(x, y) =
_
xe
x(1+y)
si x > 0 y y > 0,
0 en caso contrario.
a) Cual es la probabilidad de que el tiempo de vida de la primera componente () sea mayor que 3?
b) Son independientes los tiempos de vida de las dos componentes?
c) Cual es la probabilidad de que el tiempo de vida de por lo menos uno de los componentes sea mayor que
3?
Ejercicio 5.13 (16-02-07) Sean y los tiempos de vida de dos componentes que operan de forma indepen-
diente. Si las funciones de densidad de las variables aleatorias y son:
f
(x) =
_
1
2
e
x1
2
si x > 1,
0 si x 1,
f
(x) =
_
1
4
e
x4
4
si x > 4,
0 si x 4,
a) Determnese la distribucion de la variable aleatoria = 1.
b) Calc ulese la probabilidad de que tome un valor mayor o igual que 7.
c) Obtengase la funcion de densidad de la variable aleatoria =

2
1. Que relacion existe entre la variable
y la variable ?
d) Calc ulese la distribucion de la variable aleatoria = +

2
3.
Ejercicio 5.14 (16-02-07) El diametro de un rodamiento tiene una distribucion normal de media 1
5 milme-
tros y desviacion tpica 0
05 milmetros.
a) Cual es la probabilidad de que un rodamiento tenga mas de 1
6 milmetros de diametro?, y la de que

tenga entre 1
4 y 1
6 milmetros de diametro?
b) Que diametro es el que exceden el 90 % de los rodamientos?
c) Si un cojinete contiene 10 de rodamientos independientes, cual es la probabilidad de que el diametro
maximo de los rodamientos en el cojinete no sea mayor de 1
6 milmetros?
Ejercicio 5.15 (07-09-07) Supongase que la variable aleatoria continua denota el ancho (en cm) de una
pieza moldeada por inyeccion, y que la variable aleatoria continua denota el alto (en cm) de la misma pieza.
Supongase ademas que la funcion de densidad conjunta es
f
(,)
(x, y) =
_
k si 4
8 < x < 5
2 y x + 4
8 < y < x + 5
3,
0 en el resto.
a) Determnese el valor de k.
b) Determnese la probabilidad de que el alto este entre 9
8 y 9
9 cm.
c) Determnese la funcion de densidad condicional de dado que = 5.
d) Determnese la probabilidad de que el alto este entre 9
8 y 9
9 cm., suponiendo que el ancho de la pieza es

de 5 cm.
Ejercicio 5.16 (26-06-08) Una pagina de descargas de Internet esta estudiando el tiempo, en minutos, que
permanece en ella un usuario cualquiera. Para ello utiliza un modelo formado por tres variables aleatorias, de
forma que =el tiempo total, =el tiempo en cola y =el tiempo de descarga , con lo que = . La
distribucion de (, ) viene dada por la siguiente funcion de densidad conjunta:
f
,
(x, y) =
_
1
2
e
kx
si 0 < x < , 0 < y < x,
0 en otro caso.
a) Obten el valor de la constante k.
b) Determina la funcion de densidad de condicionada a que = 4.
c) Si un individuo estuvo en cola 4 minutos, cual es la probabilidad de que el tiempo total sea mayor de 10
minutos?
Ejercicio 5.17 (05-09-08) En la fabricacion de aleacion de esta no-plomo para la soldadura de componentes
electronicos se quiere estudiar la relacion existente entre la proporcion de plomo en la aleacion y la cantidad de
aleacion producida por ella. Si denotamos por a la proporcion de plomo en la aleacion y por a la produccion
diaria de aleacion (en toneladas), se sabe que la funcion de densidad conjunta de las variables aleatorias y
es
f
(,)
(x, y) =
_
ky(1 + 3x
2
) si 0 < x < 1, 0 < y < 2,
0 en otro caso.
a) Calcula el valor de la constante k.
b) Obten las funciones de densidad marginales de y .
c) Estudia si las variables y son independientes.
d) Calcula la proporcion media de plomo en la aleacion, la produccion media diaria de aleacion y la esperanza
del producto .
Ejercicio 5.18 (02-07-09) Una determinada empresa multinacional consta de varias factoras. Los ingresos
anuales, en millones de euros, de una factora elegida al azar es una v.a. con funcion de densidad:
f(x) =
_
50/x
3
si x > 5,
0 si x 5.
a) Cual es la probabilidad de que una factora elegida al azar tenga unos ingresos superiores a los 10 millones
de euros?
b) Si se eligen dos factoras al azar que funcionan de forma independiente, cual es la probabilidad de que el
maximo de los ingresos de las dos sea menor de 10 millones?
c) Existe un seguro que todas las factoras contratan, por ser obligatorio, que cuesta 6000 euros anuales. La
empresa colabora con las factoras de distinta forma seg un sean sus ingresos anuales. As, a las que ingresan
mas de 10 millones anuales, les paga un 30 % del importe del seguro y al resto les paga un 50 % de dicho
importe. Cual es la cantidad media anual del seguro que paga la factora?
Ejercicio 5.19 (16-09-09) Sea (, ) una v.a. bidimensional cuya funcion de densidad conjunta es:
f(x, y) =
_
k si 0 < x < 4, x 1 < y < x + 1,
0 en otro caso.
b) Obten las funciones de densidad marginales.
c) Estudia si las variables aleatorias y son independientes.
d) Determina el valor de la esperanza E( ).
Ejercicio 5.1 a) La probabilidad de que un producto haya sido realizado por el operario 3 es:
P( = 3) = P( = 3, = 0) +P( = 3, = 1) +P( = 3, = 2) = 0
04 + 0
20 + 0
09 = 0
33(33 %).
Procediendo de forma analoga con los demas valores de la v.a. , se obtiene que la distribucion marginal de
es:
1 2 3 4
P
22 0
18 0
33 0
27
b) La probabilidad de que un producto no tenga defectos es:
P( = 0) = P( = 1, = 0) +P( = 2, = 0) +P( = 3, = 0) +P( = 4, = 0)
= 0
08 + 0
04 + 0
04 + 0
02 = 0
18(18 %).
Procediendo de forma analoga con los demas valores de la v.a. , se obtiene que la distribucion marginal de
es:
0 1 2
P
18 0
55 0
27
c) La probabilidad de que un producto sin defectos haya sido realizado por el operario 1 es:
P( = 1/ = 0) =
P( = 1, = 0)
P( = 0)
=
0
08
0
18
= 0
44.
Procediendo de forma analoga con los demas valores, se obtiene que la distribucion de condicionada a que
= 0 es:
/ = 0 1 2 3 4
P
/=0
0
44 0
22 0
22 0
11
d) La probabilidad de que un producto realizado por el operario 2 no tenga defectos es:
P( = 0/ = 2) =
P( = 2, = 0)
P( = 2)
=
0
04
0
18
= 0
22.
Procediendo de forma analoga con los demas valores, se obtiene que la distribucion de condicionada a que
= 2 es:
/ = 2 0 1 2
P
/=2
0
22 0
56 0
22
e) y no son variables aleatorias independientes, puesto que
P( = 1, = 0) = 0
08 = 0
22 0
18 = P( = 1) P( = 0).
Ejercicio 5.2 a) P( = 1, = 1) = 0
15.
b) P( = ) = 0
4.
c) La distribucion de probabilidad marginal de es:
0 1 2 3 4
P
19 0
30 0
25 0
14 0
12
El n umero esperado de clientes de la caja normal es E[] = 0 0
191 0
30 +2 0
25 +3 0
14 +4 0
12 = 1
7.
d) Como P( = 4) = 0
12, P( = 0) = 0
19 y P( = 4, = 0) = 0
00, entonces P( = 4) P( = 0) = P( =
4, = 0) y por lo tanto y no son independientes.
e) P( + = 4) = 0
17. La distribucion de probabilidad del n umero total de clientes en ambas cajas es

+ 0 1 2 3 4 5 6 7
P
+
0
08 0
13 0
24 0
09 0
17 0
11 0
12 0
06
El n umero medio total de clientes en ambas cajas es la esperanza de la distribucion anterior, es decir,
E( +) = (0)0
08 + (1)0
13 + (2)0
24 + (3)0
09 + (4)0
17 + (5)0
11 + (6)0
12 + (7)0
06 = 3
25 personas.
f) La distribucion de probabilidad de la diferencia entre el n umero de clientes en la caja normal y en la caja
rapida es
3 2 1 0 1 2 3 4
P
00 0
08 0
18 0
40 0
20 0
13 0
01 0
00
Ejercicio 5.3 a) k = 1/100.
b) P( < 26, < 26) =
26
20
26
20
1
100
dydx = 0
36.
c) P(| | 2) =
22
20
x+2
20
1
100
dydx +
28
22
x+2
x2
1
100
dydx +
30
28
30
x2
1
100
dydx = 0
36.
d) f
(x) =
30
20
1
100
dy =
_
1
10
si 20 x 30,
0 en el resto,
y f
(y) =
_
1
10
si 20 y 30,
0 en el resto.
e) f
/=26
(x, y) =
f(26,y)
f
(26)
=
f(26,y)
1/10
=
_
1
10
si 20 y 30,
0 en el resto.
f) S son independientes, puesto que
f
(x) f
(y) =
_
1
10

1
10
si 20 x 30, 20 y 30
0 en otro caso
= f(x, y), (x, y) IR
2
.
Ejercicio 5.4 a) P(permetro < 90) =
20
10
45x
25
1
150
dydx = 1/3 y
P(permetro > 110) =
20
15
40
55x
1
150
dydx = 1/12.
b) P(permetro 110/ > 15) =
P(2+2110,>15)
P(>15)
=
20
15
40
55x
1
150
dydx
20
15
40
25
1
150
dydx
=
1/12
1/2
=
1
6
.
c) La probabilidad de que se rechace una lamina es
P( > 30 < 12) =
12
10
40
25
1
150
dydx +
20
12
40
30
1
150
dydx =
1
5
+
8
15
=
11
15
0
73.
La probabilidad de que se rechace una lamina cuyo permetro es menor de 90 cm es
P( > 30 < 12/2 + 2 < 90) =
P(| > 30 < 12| { + < 45})
P( + < 45)
=
=
12
10
45x
25
1
150
dydx +
15
12
45x
30
1
150
dydx
1/3
=
3
25
+
3
100
1
3
=
9
20
0
45.
Ejercicio 5.5 Como f(x, y) = f
/=x
(y)f
(x), obtenemos que la funcion de densidad conjunta es

f(x, y) =
_
_
1
10
1
2
e
yx
2
si 10 x 20, y > x,
0 en otro caso.
a) La probabilidad de que el tiempo de ambas etapas diera mas de 6 minutos es
P(| | 6) = P(6 6) =
20
10
_
6+x
x
1
10
1
2
e
yx
2
dy
_
dx = 1 e
3
Por lo tanto, este es el porcentaje de planchas en donde se produce una diferencia de mas de seis minutos.
b) La duracion total es +, por lo que
P( + 27) =
27/2
10
_
27x
x
1
10
1
2
e
yx
2
dy
_
dx = 0
253
c) Nos preguntan por la probabilidad P( > 11| = 15), por lo que hemos de calcular la funcion de densidad
de condicionada a = 15.
f
(y) =
f(x, y) dx =
_
20
10
f(x, y) dx =
1
10
e
y/2
(e
10
e
5
), y > 20,
y
10
f(x, y) dx =
1
10
(1 e
(y10)/2
), 10 < y < 20,
0, en el resto.
La funcion de densidad condicionada es
f
/=15
(x) =
f(x, 15)
f
(15)
=
_
_
1
10
1
2
e
15x
2
1
10
(1 e
(1510)/2
)
, 10 < x < 15,
0, en otro caso.
De donde resulta P( > 11/ = 15) =
15
11
f
|=15
(x) dx = 0
94.
Ejercicio 5.6 a) E[5
1
+10
2
] = 5E[
1
]+10E[
2
] = 52+104 = 50 klbs-pie,
5
1
+10
2
=
V ar[5
1
+ 10
2
] =
25V ar[
1
] + 100V ar[
2
] =
25 0
25 + 100 1 =
106
25 = 10
31 klbs-pie.
b) Puesto que 5
1
+ 10
2
N(50, 10
31), entonces P(5

1
+ 10
2
> 75) = 0
0077.
c) Si representamos por el momento de exion, ahora tenemos que =
1
1
+
2
2
. Lo que nos piden es:
E[] = E[
1
1
+
2
2
] = E[
1
1
] +E[
2
2
].
Ahora bien, como
i
es independiente de
i
, entonces
E[] = E[
1
]E[
1
] +E[
2
]E[
2
] = 5 2 + 10 4 = 50.
Ejercicio 5.7 Si representamos por
i
la v.a que mide la duracion de cada componente (i = 1 para la principal,
i = 2 para el primer repuesto y i = 3 para el segundo), lo que nos piden es P(
1
+
2
+
3
> 6). Sabemos ademas
que
1
,
2
y
3
son v.a. independientes.
a) Si
i
N(2, 1), por la reproductividad de la normal se tiene que
1
+
2
+
3
N(6, 1
73), con lo que

P(
1
+
2
+
3
> 3
45) = 0
93.
b) Si
i
(4, 2), por la reproductividad de la gamma se tiene que
1
+
2
+
3
(12, 2), con lo que
P(
1
+
2
+
3
> 3
45) = P((12, 2) > 3
45) = P((12, 1/2) > 13
8) = P(
2
24
> 13
8) = 0
95.
c) Si
i
exp(1/2) (1,
1
2
), por la reproductividad de la gamma se tiene que
1
+
2
+
3
(3,
1
2
), con lo
que P(
1
+
2
+
3
> 3
45) = P((3, 1/2) > 3
45) = P(
2
6
> 3
45) = 0
75.
Ejercicio 5.8 a) Puesto que la lamina se considera defectuosa (D) cuando su area es menor de 300 o mayor
de 750 cm
2
, nos estan pidiendo que calculemos
P(D) = P( < 300 o > 750) =
12
10
300/x
25
1
150
dy dx +
20
18
75
40
750/x
1
150
dy dx =
= 0
0313 + 0
0106 = 00419,
teniendo en cuenta que la region en la que el area es el especicado (mayor de 750 o menor de 300) es la
que aparece sombreada en la Figura 5.4.
25
30
35
40
y=300/x ay=750/x
Figura 5.4: Piezas defectuosas.
b) En este caso nos estan pidiendo que calculemos P(D/ < 11), que es igual, aplicando la denicion de
probabilidad condicionada, a
P(D/ < 11) = P( < 300 o > 750/ < 11) =
P({ < 300 o > 750} { < 11})
P( < 11)
.
25
30
35
40
Figura 5.5: Piezas con anchura menor de 11cm.
25
30
35
40
y=300/x ay=750/x
Figura 5.6: Piezas con anchura menor de 11cm y
defectuosas.
La probabilidad del denominador, viene dada por
P( < 11) =
11
10
40
25
1
150
dy dx = 0
1
como puede verse en la Figura 5.5.
Por otro lado, la probabilidad del numerador, sin mas que tomar la interseccion de las dos guras represen-
tadas, como puede verse en la Figura 5.6, es
P({ < 300 o > 750} { < 11}) =
11
10
300/x
25
1
150
dy dx = 0
024.
As pues,
P(D/ < 11) =
0
024
0
1
= 0
24.
c) La supercie o area media de una lamina es
E[ ] =
x y f(x, y) dy dx =
20
10
40
25
x y
1
150
dy dx = 4875 cm
2
.
Ejercicio 5.9 Puesto que ambas variables son independientes, la funcion de densidad conjunta se puede calcular
como el producto de las funciones de densidad marginales. Por otro lado, puesto que ambas variables tienen
distribucion uniforme U(0, 2), se tiene que:
f
(x) =
_
1/2 si 0 < x < 2
0 en el resto
, f
(y) =
_
1/2 si 0 < y < 2
0 en el resto
,
y por tanto,
f(x, y) = f
(x) f
(y) =
_
1/4 si 0 < x < 2, 0 < y < 2,
0 en el resto.

1 2
1
2
2
y=1/x Ay=2x
Figura 5.7: Dominio de la funcion de densidad conjunta.
Nos estan pidiendo que calculemos
P( < 1 y / < 2) =

1/2
0
2x
0
1
4
dy dx +
1/2
1/x
0
1
4
dy dx =
1
8
+
3ln(2)
8
= 03849,
teniendo en cuenta que la region en la que se verican ambas condiciones es la que aparece sombreada en la
Figura 5.7.
Ejercicio 5.10 a) La probabilidad pedida es
P( + > 30) =
20
10
20
30x
x +y
8000
dydx =
20
10
1
8000
(20x 250 +
x
2
2
)dx =
5
24
= 0
21.
b) Puesto que la funcion de densidad marginal de es
f
(y) =
f(x, y)dx =
_

0
0dx +
20
0
x+y
8000
dx +
20
0dx = 0 +
1
400
(10 +y) + 0 si 0 < y < 20,
0dx = 0 en otro caso,

=
_
(10 +y)/400 si 0 < y < 20,
0 en otro caso,
se tiene que la funcion de densidad de condicionada a que = 10 es:
f
/=10
(x) =
f(x, 10)
f
(10)
=
f(x, 10)
1/20
=
_
(x+10)/8000
1/20
si 0 < x < 20,
0
1/20
en otro caso,
=
_
x+10
400
si 0 < x < 20,
0 en otro caso.
c) Teniendo en cuenta la expresion de la funcion de densidad anterior, se tiene que la esperanza de la variable
aleatoria / = 10 es:
E[/ = 10] =
xf
/=10
(x)dx =
20
0
x
x + 10
400
dx =
35
3
11
67.
Por otro lado, teniendo en cuenta que V ar[/ = 10] = E[(/ = 10)
2
] (E[/ = 10])
2
y que
E[(/ = 10)
2
] =
x
2
f
/=10
(x)dx =
20
0
x
2
x + 10
400
dx =
500
3
,
se puede concluir que
V ar[/ = 10] =
500
3

_
35
3
_
2
=
275
9
30
56.
Ejercicio 5.11 a) Puesto que f(x, y) es la funcion de densidad conjunta de la v.a. bidimensional (, ), se
tiene que:
f(x, y) 0, (x, y) IR
2
y
f(x, y)dydx = 1.
x<y
0
1
1
1
0 1
yz x
(A) (B)
As pues, a partir de la igualdad,
f(x, y)dydx =
1
0
1
0
k y dydx =
1
0
_
k
1
2
_
dx =
k
2
= 1 k = 2.
b) Nos piden que calculemos P( < ). A la vista de la representacion graca (A), se tiene que:
P( < ) =
1
0
1
x
2ydydx =
1
0
_
1 x
2
_
dx = x
x
3
3
_
1
0
=
2
3
.
c) Si z es un valor cualquiera en el intervalo (0, 1), la probabilidad pedida se corresponde con la zona marcada
en el graco (B), con lo que:
P(
z) =
1
0
zx
0
2ydydx =
1
0
z
2
x
2
dx =
z
2
3
.
Ejercicio 5.12 a) La probabilidad pedida es:
P( > 3) =

0
xe
x(1+y)
dydx =

3
xe
x
_
e
xy
x
_
y=
y=0
_
dx =

3
xe
x
1
x
dx = e
x
x=
x=3
= e
3
.
b) Puesto que las marginales son:
f
(x) =
f(x, y)dy =
_
0
xe
x
e
xy
dy = e
x
si x > 0
0dy = 0 si x 0
y
f
(y) =
f(x, y)dx =
_

0
xe
x(1+y)
dx =
1
(1+y)
2
si y > 0
0dx = 0 si y 0
se tiene que
f
(x) f
(y) =
_
e
x 1
(1+y)
2
si x > 0, y > 0
0 en caso contrario
= f(x, y),
con lo cual y no son independientes.
c) La probabilidad pedida es:
P( > 3 o > 3) =
3
0

3
xe
x(1+y)
dydx +

0
xe
x(1+y)
dydx =
_
1
4

1
4e
12
_
+e
3
= 0
3.
Ejercicio 5.13 a) Puesto que
Soporte() = (1, ) y g
(x) = 1 = 0, x (1, ),
aplicando el teorema del cambio de variable tenemos que,
f
(t) =
_
f
(g
1
(t))|
t
g
1
(t)| si t g((1, ))
0 en el resto
=
_
1
2
e
(t+1)1
2
|1| si t (0, )
0 en el resto
=
_
1
2
e
t/2
si t > 0
0 en el resto
es decir, exp(1/2) (1, 1/2)
2
2
.
b) Puesto que 1
2
2
, se tiene que
P( 7) = P( 1 6) = P(
2
2
6) = 0
05.
c) Puesto que
Soporte() = (4, ) y g
(y) =
1
2
= 0, y (4, ),
aplicando el teorema del cambio de variable tenemos que,
f
(z) =
_
f
(g
1
(z))|

z
g
1
(z)| si z g((4, ))
0 en el resto
=
_
1
4
e
(2(z+1))4
4
|2| si z (1, )
0 en el resto
=
_
1
2
e
z1
2
si z > 1
0 en el resto
con lo que, esta igualmente distribuida que .
d) Del apartado a) tenemos que 1
2
2
. En el apartado c) obtenemos que
i.d.
=

2
1, con lo que, uniendo
ambos resultados, obtenemos que

2
2
2
2
. Finalmente, al ser y variables aleatorias independientes,
por la reproductividad de la chi-cuadrado, tenemos que:
= ( 1) + (
2
2)
2
4
.
Ejercicio 5.14 Seg un el enunciado, si denotamos por la v.a. diametro, en milmetros, de un rodamiento,
se tiene que N(1
5, 0
05).
a) Las probabilidades pedidas son:
P( > 1
6) = 1 P(N(1
5, 0
05) 1
6) = 1 0
977 = 0
023,
P(1
4 < 1
6) = P( 1
6) P( 1
4) = 0
97725 0
02275 = 0
9545.
b) En este apartado nos piden que calculemos el valor x del diametro tal que P( > x) = 0
9, es decir, tal
que P( x) = 0
1. Aunque con ayuda de alguna herramienta informatica podemos obtener este valor
directamente, si no disponemos de ella y queremos utilizar la tabla de la distribucion normal, deberamos
realizar las siguientes operaciones:
P( x) = 0
1 P
_
N(0, 1)
x 1
5
0
05
_
= 0
1
x 1
5
0
05
= 1
282 x = 1
4359,
con lo cual podemos armar que el 90 % de los rodamientos tendran un diametro mayor de 1
4359 milmetros.
c) Si denotamos por el maximo de los diametros de los 10 rodamientos de un cojinete y por
i
el diametro
del rodamiento i, se tiene que = max{
1
, . . . ,
10
}, con lo que la probabilidad pedida es
P( 1
6) = P(max{
1
, . . . ,
10
} 1
6) = P(
1
1
6, . . . ,
10
1
6)
indep.
=
P(
1
1
6) . . . P(
10
1
6) = (0
99725)
10
= 0
79443.
Ejercicio 5.15 a) La funcion de densidad conjunta de (, ) toma el valor 0 fuera de la region representada
en la Figura 5.8(a) y el valor k dentro de dicha region.
48 52
96
100
105
101
48 50 51 52
96
98
105
99
(a) (b)
Figura 5.8: (a) Dominio de f
(,)
. (b) Region del dominio en la que 10 < < 10
1.
Al ser f
(,)
una funcion de densidad conjunta, sabemos que
1 =
2
4
x+5
3
x+4
8
kdydx =
2
4
8
0
5 kdx = 0
2k
con lo cual, obtenemos que k = 5.
b) La probabilidad pedida es P(9
8 < < 9
9), que corresponde con el volumen de f

(,)
(x, y) sobre la region
sombreada en la Figura 5.8(b). As pues,
P(9
8 < < 9
9) =
9
9
y4
8
4
8
5dxdy = 0
125.
c) La funcion de densidad de condicionada a que = 5 esta denida como
f
/=5
(y) =
f
(,)
(5, y)
f
(5)
.
Como
f
(,)
(5, y) =
_
5 si 9
8 < y < 10
3,
0 en el resto,
y f
(5) =
10
3
9
8
5dy = 2
5,
se tiene que
f
/=5
(y) =
_
2 si 9
8 < y < 10
3,
0 en el resto.
d) La probabilidad pedida es
P(9
8 < < 9
9/ = 5) =
9
9
8
f
/=5
(y)dy =
9
9
8
2dy = 0
2.
Ejercicio 5.16 a) Puesto que
1 =
x
0
1
2
e
kx
dydx =

0
1
2
xe
kx
dx =
1
2k
2
,
con lo que k =
2/2.
b) Como
f
(4) =
f
,
(x, 4)dx =

4
1
2
e
2x/2
dx =
1
2
e
2
2
,
entonces
f
/=4
(x) =
f
,
(x, 4)
f
(4)
=
_
_
_
1
2
e
2x/2
1
2
e
2
2
=
2
2
e
2(
x
2
2)
si 4 < x < ,
0
1
2
e
2
2
= 0 en el resto,
con lo que la funcion de densidad pedida es:
f
/=4
(x) =
_
2
2
e
2(
x
2
2)
si 4 < x < ,
0 en el resto,
c) Nos piden que calculemos P( > 10/ = 4) y como
P( > 10/ = 4) =

10
f
/=4
(x)dx,
la probabilidad pedida es:
P( > 10/ = 4) =

10
2
2
e
2(
x
2
2)
dx = e
3
2
.
Ejercicio 5.17 a) La constante k debe vericar la siguiente ecuacion 1 =
f
(,)
(x, y)dydx, con lo
que
1 =
1
0
2
0
ky(1 + 3x
2
)dydx =
1
0
k(1 + 3x
2
)2dx = 4k
y, por tanto, k = 1/4.
b) Por denicion, las dos distribuciones marginales se obtienen como sigue:
f
(x) =
f
(,)
(x, y)dy =
_

2
0
1
4
y(1 + 3x
2
)dy =
1
2
(1 + 3x
2
) si 0 < x < 1,
0dy = 0 en otro caso.

f
(y) =
f
(,)
(x, y)dx =
_

1
0
1
4
y(1 + 3x
2
)dx =
1
2
y si 0 < y < 2,
0dx = 0 en otro caso.

c) Puesto que
f
(x) f
(y) =
_
1
2
(1 + 3x
2
) si 0 < x < 1,
0 en otro caso.

_
1
2
y si 0 < y < 2,
0 en otro caso.
= f
(,)
(x, y),
se tiene que y son independientes.
d) La proporcion media de plomo en la aleacion es
E() =
xf
(x)dx =
1
0
x
1
2
(1 + 3x
2
)dx =
5
8
,
y la produccion media diaria de aleacion es
E() =
yf
(y)dy =
2
0
y
1
2
ydy =
4
3
.
En cuanto a la esperanza del producto, como y son independientes, se puede obtener inmediatamente
como sigue: E( ) = E() E() =
5
8

4
3
=
5
6
.
Otra forma de obtener la esperanza del producto sera directamente calculando la siguiente integral:
E( ) =
xyf
(,)
(x, y)dydx =
1
0
2
0
xy
1
4
y(1 + 3x
2
)dydx =
5
6
.
Ejercicio 5.18 a) P( > 10) =
10
50
x
3
dx =
1
4
= 0
25.
b) P(max{
1
,
2
} < 10) = P(
1
< 10,
2
< 10)
indep.
= P(
1
< 10)P(
2
< 10) =
3
4
3
4
=
9
16
= 0
5625.
c) Nos piden que calculemos E() con
=
_
4200 si > 10,
3000 si 10,
o lo que es lo mismo, E(g()) con
g(x) =
_
4200 si x > 10,
3000 si x 10.
As pues,
E() = E(g()) =
g(x)f
(x)dx =

5
g(x)
50
x
3
dx =
10
5
3000
50
x
3
dx +

10
4200
50
x
3
dx = 3300.
Ejercicio 5.19 Comenzamos dibujando la zona en la que esta funcion de densidad conjunta no vale cero:
1 2 3 4
0
-1
1
2
3
4
5
y=x-1
y=x+1
puesto que la determinacion de esta region sera importante para resolver los distintos apartados del ejercicio.
a) A partir de las condiciones que debe cumplir una funcion para ser funcion de densidad de una v.a. bidimen-
sional, se tiene que
1 =
4
0
x+1
x1
kdydx =
4
0
2kdx = 8k,
con lo que el valor de la constante es k = 1/8.
b) La funcion de densidad marginal de se obtiene, por denicion, como:
f
(x) =
f(x, y)dy.
Teniendo en cuenta la forma de la region en la que f(x, y) no se anula, se tiene que:
f
(x) =
_
x+1
x1
1
8
dy =
1
4
si 0 < x < 4,
0dy = 0 en el resto.
De forma analoga se obtiene que la funcion de densidad marginal de es:
f
(y) =
f(x, y)dx =
_
y+1
0
1
8
dx =
y + 1
8
si 1 < y < 1,
y+1
y1
1
8
dx =
1
4
si 1 < y < 3,
4
y1
1
8
dx =
5 y
8
si 3 < y < 5,
0dx = 0 en el resto.
As pues, las funciones de distribucion marginales son:
f
(x) =
_
_
_
1
4
si 0 < x < 4,
0 en el resto,
y f
(y) =
_
_
y+1
8
si 1 < y < 1,
1
4
si 1 < y < 3,
5y
8
si 3 < y < 5,
0 en el resto.
c) Puesto que
f
(2) f
(2) =
1
4

1
4
=
1
8
= f(2, 2),
se tiene que y no son v.a. independientes. Evidentemente, este no es el unico punto en el que no se
verica la igualdad, y cualquiera de los otros servira para demostrar la no independencia.
d) Por denicion se tiene que
E( ) =
4
0
x+1
x1
xy
1
8
dydx =
4
0
x
8
2xdx =
x
3
12
_
4
0
=
16
3
.
PREGUNTAS DE TEST.
Examenes.
Las preguntas 1. a 3. hacen referencia al siguiente enunciado: Sea (, ) una v.a. bidimensional con funcion de
densidad conjunta:
f(x, y) =
_
xe
(x+y)
si x > 0, y > 0
0 en otro caso
1. (09-09-03) Se verica que:
a) y son independientes;
d) Cov[, ] = 0;
b) y no son independientes;
e) Todo falso.
c) Cov[, ] = 0;
2. (09-09-03) Se verica que:
a) E[] = V ar[]; b) E[
2
] = V ar[]; c) E[] = V ar[]; d) E[
2
] = V ar[]; e) Todo falso.
3. (09-09-03) Se verica que:
a) E[/ = y] = V ar[/ = y];
d) E[
2
/ = x] = V ar[/ = x];
b) E[
2
/ = y] = V ar[/ = y];
e) Todo falso.
c) E[/ = x] = V ar[/ = x];
4. (17-02-04) La suma de n variables aleatorias normales es:
a) Siempre normal;
c) Siempre normal si n < 30;
e) Todo falso.
b) Normal si los sumandos son independientes;
d) Siempre gamma;
5. (17-02-04) Se eligen al azar e independientemente uno de otro dos n umeros reales del intervalo (1,3). La
probabilidad de que su producto sea inferior a 2 es:
a) 9725; b) Menor de 01; c) Mayor de 02; d) No se sabe; e) Todo falso.
6. (21-06-04) Dadas dos variables aleatorias (, ) con la siguiente funcion de densidad conjunta, se tiene que:
f
(,)
(x, y) =
_
e
(x+y)
si x > 0, y > 0,
0 en otro caso.
d) f
(y) = f
/=2
(y);
e) Todo falso.
c) f
(x) = f
/=2
(x);
7. (09-09-04) Sea (, ) la v.a. bidimensional que representa el radio () y la longitud () de una circunferencia
(Recuerda que la relacion entre el radio y la longitud de una circunferencia es: = 2). Si la varianza del radio
es
2
, la varianza de la longitud es siempre:
a)
2
/(4
2
); b) 4
2
2
; c) 2
2
; d)
2
/(2); e) Todo falso.
8. (09-09-04) Con los datos de la pregunta anterior, la covarianza entre las variables y es:
a) 0; b) 1; c) 1; d) 2
2
; e) Todo falso.
9. (07-09-05) Sea (, ) la v.a. bidimensional que representa la longitud del lado y el area de un cuadrado,
respectivamente. Si la funcion generatriz de momentos de la longitud tiene la expresion g
(t) = (1 t)
1
, la
covarianza entre las variables y es:
a) 0; b) 1; c) 2; d) 4; e) Todo falso.
10. (07-09-05) Si y son dos variables aleatorias independientes y ambas con distribucion exp(1), la
distribucion de + es:
a) exp(2); b) P(2); c) (2, 1); d) (1, 2); e) Todo falso.
Las dos preguntas siguientes hacen referencia al siguiente enunciado: Sea (, ) una variable aleatoria bidimen-
sional con funcion de densidad conjunta
f
(,)
(x, y) =
_
k(x +y) si 0 < x < k, 0 < y < k,
0 en otro caso.
11. (13-02-06) El valor de k es:
a) -1; b) 1; c) 1/2; d) -1/2; e) Todo falso.
12. (13-02-06) Las variables y son:
a) Independientes;
d) Discretas;
b) Dependientes;
e) Todo falso.
c) Igualmente distribuidas;
13. (30-06-06) Sea (, ) la v.a. bidimensional que representa el lado y el permetro de un cuadrado. Si la
varianza del lado es
2
, la covarianza entre las variables y es:
a) 0; b) 1; c) 4
2
; d) -1; e) Todo falso.
14. (07-09-06) Sean y dos variables aleatorias independientes tales que N(1, = 2) y
N(3, = 3). Entonces + tiene una distribucion:
a) No normal; b) N(4, = 5); c) N(2, =
5); d) N(4, =
5); e) Todo falso.

Las dos preguntas siguientes hacen referencia al siguiente enunciado: Se lanzan dos dados perfectos. Sea la
puntuacion obtenida en el primer dado y la obtenida en el segundo.
15. (07-09-06) Podemos asegurar (sin necesidad de hacer ning un calculo) que la covarianza Cov(, ) es:
a) Positiva; b) Negativa; c) Nula; d) Uno; e) Todo falso.
16. (07-09-06) Si se consideran las variables = 2 + y = + 2, se tiene que:
a) y tienen la misma media;
b) Cov(, ) = 0;
c) Todos los valores de estan comprendidos entre 2 y 12;
d) Todos los valores de estan comprendidos entre 3 y 18;
e) Todo falso.
17. (16-02-07) Sea (, ) una v.a. bidimensional con funcion de densidad conjunta f
(,)
(x, y) = 1 si 0 < x <
1, 0 < y < 1 y f
(,)
(x, y) = 0 en cualquier otro caso. Para las variables y se verica que:
a) Cov(, ) = 0;
d) y son independientes;
b) Cov(, ) = 0;
e) Todo falso.
c) y NO son independientes;
18. (16-02-07) Siguiendo con las variables de la pregunta anterior, la probabilidad P( 0
5 < < + 0
5)
es:
a) 1/4; b) 3/4; c) 1/2; d) 1/8; e) Todo falso.
19. (22-06-07) Sean y dos variables aleatorias, entonces la igualdad E( ) = E()E() se verica:
a) Siempre;
d) Si Cov(, ) = 0;
b) Nunca;
e) Todo falso.
c) Si y son independientes;
20. (22-06-07) Sea (, ) la v.a. bidimensional que representa las longitudes de los dos catetos de un triangulo
rectangulo. Si el valor medio de cada una de las dos longitudes es 1 y la covarianza entre las mismas es 1, la
supercie media del triangulo es (Nota.- La supercie del triangulo es

2
):
a) 0; b) 1; c) 1/2; d) -1; e) Todo falso.
21. (07-09-07) Sean
1
y
2
dos v.a. independientes e igualmente distribuidas, con distribucion gamma
(1, 1/2). Entonces la v.a.
1
+
2
sigue una distribucion:
a)
2
4
; b) (1, 1); c) (2, 1/2); d) (2, 2); e) Todo falso.
22. (07-09-07) Sean y dos variables aleatorias independientes e igualmente distribuidas, con distribucion
exponencial exp(2), entonces la covarianza Cov(2, 3) es igual a:
a) 3/2; b) 1; c) 0; d) -1; e) Todo falso.
23. (18-02-08) Sean y dos variables aleatorias independientes e igualmente distribuidas, con distribucion
exponencial exp(2), entonces la distribucion de + es:
a) exp(4); b) (1, 4); c) (2, 2); d) (2, 4); e) Todo falso.
24. (26-06-08) Sea (, ) una v.a. bidimensional con funcion de densidad conjunta f(x, y) = k si 0 < x <
3, 1 < y < 4 y f(x, y) = 0 en el resto. Entonces su funcion de distribucion conjunta F(x, y) verica que:
a) F(1, 2) = F(2, 1);
d) F(2, 2) = 1/4;
b) F(2, 2) = P( < 2, < 2) =
1
2
;
e) Todo falso.
c) F(2, 2) = 2/9;
25. (26-06-08) Considerese la siguiente cadena de razonamiento: Sea N(, ), entonces N(, ),
con lo que 0 = + () N(0,
2). Como evidentemente la v.a. constante 0 no sigue una distribucion

normal, la anterior cadena falla en que:
a) no sigue una distribucion N(, ), sin una N(, );
b) + () no sigue una distribucion N(0,
2), por no estar y igualmente distribuidas;

c) + () no sigue una distribucion N(0,
2), por no ser y independientes;

d) + () no sigue una distribucion N(0,
2), por no ser reproductiva la distribucion normal;

e) Todo falso.
26. (05-09-08) Sea una v.a. con V ar() = 3 y sea otra v.a. tal que = 2, entonces la covarianza entre
las variables y es:
a) -3; b) 3; c) 6; d) 9; e) Todo falso.
27. (05-09-08) Sean y dos variables aleatorias independientes y ambas con distribucion exponencial de
media 2, la distribucion de + es:
a)
2
1
; b)
2
4
; c) (2, 1/2); d) (2, 2); e) Todo falso.
28. (02-07-09) Dada la v.a. bidimensional (, ) con funcion de densidad conjunta
f(x, y) =
_
k x sen(y) si 0 < x < 1, 0 < y < /2,
0 en el resto,
se tiene que:
a) k = 2;
d) P(
1
2
) = 1/4;
b) y son independientes;
e) Todo falso.
c) P
_

1
2
/ >

4
_
= 1/4;
29. (16-09-09) Dadas dos variables aleatorias y con varianzas
2
y
2
, respectivamente y covarianza
.
Se tiene siempre que la varianza de la variable aleatoria , es decir, V ar( ), es igual a:
a)
2
+
2
; b)
2
; c)
2
+
2
; d)
2
+
2
+ 2
; e) Todo falso.
30. (16-09-09) Dadas dos v.a. y independientes e igualmente distribuidas con distribucion exponencial
de media 1, se tiene que:
a) f(x, y) = e
(x+y)
si x > 0, y > 0;
c) P( 1, 1) = (1 e
1
)
2
;
e) Todo falso.
b) P( 1, 1) = e
2
;
d) +
2
2
;
N
o
Solucion N
o
Solucion N
o
Solucion N
o
Solucion N
o
Solucion
1. a), c) 2. a), c) 3. a), c) 4. b) 5. b)
6. a), c), d) 7. b) 8. d) 9. d) 10. c)
11. b) 12. b), c) 13. c) 14. e) 15. c)
16. a), d) 17. a), d) 18. b) 19. c), d) 20. b)
21. a), c) 22. c) 23. c) 24. c) 25. c)
26. c) 27. b), c) 28. a), b), c), d) 29. c) 30. a), c)
PR
Para realizar esta practica no es necesario aprender nuevos comandos del Excel, sino recordar algunos que ya
conocemos, junto con ciertos conceptos de teora.
Ejercicio 1.
Para realizar el primer ejercicio es necesario recordar la denicion de distribucion marginal y distribucion
condicionada, junto con la denicion de variables aleatorias independientes, en el caso de v.a. discretas.
Sea (, ) una v.a. bidimensional discreta, que toma los valores (x
i
, y
j
) con probabilidad P( = x
i
, = y
j
) = p
ij
,
es decir,
\ y
1
y
2
y
m
x
1
p
11
p
12
p
1m
x
2
p
21
p
22
p
2m
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
x
n
p
n1
p
n2
p
nm
La distribucion marginal de viene dada por
x
1
x
2
x
n
P
p
1
p
2
p
n
donde p
i
denota la probabilidad de que tome el valor x
i
, es decir,
p
i
P( = x
i
) =
m
j=1
P( = x
i
, = y
j
) =
m
j=1
p
ij
.
Para todo x
i
tal que P( = x
i
) > 0, la distribucion de condicionada a que toma el valor x
i
viene
dada por
y
1
y
2
y
m
P
/=x
i
p
i1
p
i
p
i2
p
i

p
im
p
i
puesto que
P( = y
j
/ = x
i
) =
P( = x
i
, = y
j
)
P( = x
i
)
=
p
ij
p
i
.
y son variables aleatorias independientes si y solo si
P( = x
i
, = y
j
) = P( = x
i
) P( = y
j
)
para todos los pares (x
i
, y
j
).
Para realizar estas operaciones con el Excel simplemente debemos recordar que el comando =SUMA(C2:F2)
realiza la suma de las casillas que se encuentran entre la casilla C2 y la F2. Con los smbolos y / podemos
realizar el producto o cociente de las casillas correspondientes; por ejemplo, =C2/G2 calcula el cociente entre
la casilla C2 y la G2.
Ejercicio 2.
Para realizar el ejercicio 2 debemos recordar ciertas propiedades de la distribucion normal.
Dada una v.a. con distribucion normal N(, ), si la multiplicamos por una constante no nula a, sigue
siendo normal de parametros a y |a|, respectivamente, es decir,
N(, ) a N(a, |a|)
La distribucion normal es reproductiva respecto a la media y la varianza, es decir, dadas dos v.a.
1
,
2
independientes con distribuciones N(
1
,
1
) y N(
2
,
2
), respectivamente, entonces
1
+
2
sigue una
distribucion N(
1
+
2
,
2
1
+
2
2
). En smbolos:
1
N(
1
,
1
)
2
N(
2
,
2
)
1
y
2
independientes
_
_
_
1
+
2
N(
1
+
2
,
2
1
+
2
2
)
Combinando los dos apartados anteriores se puede concluir que si
1
y
2
son variables aleatorias indepen-
dientes con distribuciones N(
1
,
1
) y N(
2
,
2
), respectivamente, y a
1
, a
2
son dos n umeros reales (alguno
de los cuales es no nulo), entonces a
1
1
+a
2
2
sigue una distribucion N(a
1
1
+a
2
2
,
a
2
1
2
1
+a
2
2
2
2
). En
smbolos:
a
1
, a
2
IR
1
N(
1
,
1
)
2
N(
2
,
2
)
1
y
2
independientes
_
_
a
1
1
+a
2
2
N(a
1
1
+a
2
2
,
a
2
1
2
1
+a
2
2
2
2
)
En cuanto a los comandos de Excel necesarios para resolver este ejercicio, recordar que
=RAIZ(x) calcula la raz cuadrada del n umero x,
=DISTR.NORM(x;;;1) permite obtener la funcion de distribucion de una v.a. con distribucion
normal N(, ) en el punto x, es decir, P(N(, ) x).
APUNTES DE TEOR
IA.
Como osamos hablar de leyes del azar? No es, acaso, el azar la anttesis de cualquier ley?
(Bertrand Russell)
En este tema estudiaremos propiedades de convergencia de sucesiones de variables aleatorias. Los cuatro resul-
tados que estudiamos aqu, dos leyes de los grandes n umeros, el teorema de De Moivre y el teorema central del
lmite son de una considerable importancia para el estudio de la probabilidad y la estadstica. Comenzaremos
con las deniciones de dos tipos de convergencia que tienen que ver con los resultados mencionados.
6.1. Tipos de convergencias.
Denicion 6.1.1 Sea {
n
} =
1
,
2
, . . . ,
n
, . . . una sucesion de variables aleatorias. Se dice que esta sucesion
converge en probabilidad hacia la variable aleatoria , y lo representamos por:
n
p
, si y solo si para
cualquier > 0, se cumple: lm
n
p{|
n
| } = 0.
Dada la relacion que existe entre la probabilidad de un suceso y su contrario, la anterior denicion tambien se
puede dar de la siguiente forma:
n
p
si y solo si para cualquier > 0, se cumple: lm
n
P{|
n
| < } = 1.
Como {|
n
| } = { /|
n
() ()| }, esta denicion se puede interpretar como que: dada una
precision arbitraria y una probabilidad tan peque na como se quiera, siempre se puede hallar un n umero
natural n
0
, tal que a partir de el (n > n
0
) los valores de la v.a.
n
estaran dentro de los lmites ( , + )
con probabilidad 1 (tan cercana a uno como se quiera).
W
w
1
w
2
( )
| | | |
x(w )
2
x (w )
n 1
x(w )
1
x (w )
n 2
x(w )
1
-
x(w )
1
+ x(w )
2
- x(w )
2
+
)
(
Figura 6.1: Convergencia en probabilidad.
Denicion 6.1.2 Se dice que una sucesion de variables aleatorias
1
,
2
, . . . ,
n
, . . . con funciones de distribucion
respectivas F
1
, F
2
, . . . , F
n
, . . . converge en ley o en distribucion hacia la variable aleatoria , con funcion
de distribucion F, y lo escribimos
n
L
, si y solo si para todo punto x en donde F es continua, se cumple
que: lm
n
F
n
(x) = F(x).
La convergencia en ley es mas debil que la convergencia en probabilidad, se verica que:
n
p

n
L
.
En general, la implicacion en el otro sentido no es cierta a no ser que la v.a. sea casi seguro una constante.
Existen otros tipos de convergencia mas generales, como el de convergencia casi segura y convergencia en
media cuadratica que permiten enunciar las leyes fuertes de los grandes n umeros, pero, en este curso, no
profundizaremos por ese camino.
Para demostrar las leyes de los grandes n umeros necesitamos de una importante desigualdad llamada desigualdad
de Tchebychev.
Teorema 6.1.1 (Desigualdad de Tchebychev)
Sea una v.a de media y varianza
2
nitas. Se cumple que:
P{| | h}

2
h
2
, h > 0.
Demostracion
Demostraremos el teorema para variables continuas, para discretas la demostracion sera analoga, sin mas que
sustituir integrales por sumas y funciones de densidad por distribuciones de probabilidad.
2
= E{[E()]
2
} =
(x)
2
f
(x)dx =
{xIR/|x|h}
(x)
2
f
(x)dx+
{xIR/|x|<h}
(x)
2
f
(x)dx
{xIR/|x|h}
h
2
f
(x)dx +
{xIR/|x|<h}
0f
(x)dx = h
2
P{| | h},
y dividiendo en los dos terminos de la desigualdad entre h
2
se tiene: P{| | h}

2
h
2
.
En ocasiones la desigualdad de Tchebychev se presenta de la siguiente forma equivalente:
P{| | < h} 1
V ar()
h
2
, h > 0.
6.2. Leyes de los grandes n umeros.
En este curso trataremos unicamente las leyes debiles de los grandes n umeros que utilizan la nocion de conver-
gencia en probabilidad en lugar de la convergencia casi segura que es la que se emplea en las leyes fuertes de
los grandes n umeros.
La primera ley de los grandes n umeros fue demostrada por el matematico suizo Jacobo Bernoulli en su libro
Ars Conjectandi publicado en 1713. Como habitualmente sucede la demostracion de Bernoulli era mucho mas
difcil que la que presentamos aqu usando la desigualdad de Tchebychev. De hecho, nosotros no demostraremos
el Teorema de Bernoulli, si no que lo obtendremos como un corolario del Teorema de la Media.
Teorema 6.2.1 (Teorema de Bernoulli)
Si denotamos por
n
= la frecuencia relativa de un suceso A despues de n pruebas independientes,
n
converge
en probabilidad a la probabilidad p = P(A), es decir, se verica que:
n
p
p.
Veremos que el teorema anterior es un corolario del siguiente teorema.
Teorema 6.2.2 (Teorema de la Media)
Sea
1
,
2
, . . . ,
n
, . . . una sucesion de variables aleatorias independientes e igualmente distribuidas (iid), con
media y varianza
2
nitas. Entonces la sucesion
n
=

1
+
2
++
n
n
converge en probabilidad hacia cuando
n tiende hacia innito
4
, es decir:
n
p
n
.
Demostracion
Veamos que E(
n
) = y que V ar(
n
) =
2
/n.
En efecto, sin mas que aplicar las propiedades de la esperanza se tiene que:
E(
n
) = E
_
1
+
2
+ +
n
n
_
=
E(
1
) +E(
2
) + +E(
n
)
n
=
n
n
= .
An alogamente,
V ar(
n
) = V ar
_
1
+
2
+ +
n
n
_
indep.
=
V ar(
1
) +V ar(
2
) + +V ar(
n
)
n
2
=
n
2
n
2
=

2
n
.
Aplicando la desigualdad de Tchebychev a
n
, para cualquier > 0, P{|
n
| }

2
/n
2
. Como la
probabilidad de cualquier suceso es no negativa, se tiene que:
0 lm
n
P{|
n
| } lm
n
2
n
2
= 0,
es decir,
n
p
n
.
La ley de Bernoulli es un caso particular del teorema de la media ya que podemos considerar que:
k
=
_
1 si ocurre A en la k-esima prueba,
0 si no ocurre A en la k-esima prueba,
son variables aleatorias independientes con distribucion de Bernoulli (B(1, p)), con media p y varianza p q, en
consecuencia nitas. Se cumplen las hipotesis del teorema de la media por lo que podemos usar su tesis, que
aplicada a este caso dice que :
n
p
n
p, y es facil comprobar que para las variables anteriormente denidas
n
=

1
+
2
++
n
n
=
n
= frecuencia relativa del suceso A en n pruebas independientes.
6.3. Teorema central del lmite.
La distribucion normal es la mas importante de las distribuciones continuas, pues como consecuencia del teorema
central del lmite las variables aleatorias que asociamos a muchas caractersticas de la vida real siguen esta
distribucion.
La primera version del teorema central del lmite fue demostrada por Abraham De Moivre. Este teorema ha sido
objeto de un inconmensurable esfuerzo de investigacion encaminada a descubrir las condiciones mas generales
para las cuales el teorema es valido. En estos apuntes incluimos el teorema de De Moivre y una generalizacion
de el que es el teorema de Levy-Linderberg.
4
Para cada n jo,
n
recibe el nombre de media muestral de tama no n.
Teorema 6.3.1 (Teorema de De Moivre)
Sea
1
,
2
, . . . ,
n
, . . . una sucesion de variables aleatorias tales que
n
sigue una distribucion B(n, p) para cual-
quier n IN, entonces:
n
np
npq
L
N(0, 1),
es decir,
n
es asintoticamente N(np,
npq); (
n
N(np,
npq) para n grande).

Este teorema es un caso particular del siguiente.
Teorema 6.3.2 (Teorema de Levy-Lindeberg)
Sea
1
,
2
, . . . ,
n
, . . . una sucesion de variables aleatorias independientes e igualmente distribuidas (iid) con
media y varianza
2
nitas, entonces:
n
=
n
i=1
i
n
n
L
N(0, 1),
es decir,
n
es asintoticamente N
_
,

n
_
, o
n
i=1
i
es asintoticamente N(n,
n).
El teorema de De Moivre es un caso particular del anterior ya que la distribucion binomial es reproductiva y
podemos considerar que
n
=
n
i=1
i
donde las v.as.
i
son independientes y siguen todas la misma distribucion
de Bernoulli de parametro p, (B(1, p)). De manera que aplicando el teorema de Levy-Lindeberg a las v.as.
i
se obtiene el Teorema de De Moivre, ya que E(
i
) = p y V ar(
i
) = pq.
El teorema central del lmite es el eslabon necesario para unir el Calculo de Probabilidades con la Inferencia
Estadstica. Es un resultado que nos dice que la distribucion lmite es la misma, sin importar cual es la distri-
bucion com un de los sumandos siempre que la varianza de estos sea nita. Sin embargo, cuanto mas proxima
este la distribucion de los sumandos a la distribucion normal menor sera el n umero de sumandos necesario para
alcanzar la normalidad aproximada. Debido a esta dependencia del grado de aproximacion a la normalidad,
de la distribucion subyacente de los sumandos, no es facil especicar el n umero n necesario para una buena
aproximacion . Sin embargo, la mayor parte de los autores, opinan que un n mayor o igual que 30 es adecuado
para aproximaciones del orden de las centesimas.
Las siguientes guras muestran como la velocidad de convergencia hacia la distribucion normal depende de
aspectos de la distribucion subyacente como son la simetra, el apuntamiento y otras. Cuanto mas se separe la
distribucion de la poblacion de la distribucion normal en esas caractersticas, mayor sera el n necesario para
conseguir una determinada aproximacion a la distribucion normal.
0 0.5 1
5 -
0 0.5 1
5 -
0 0.5 1
5 -
Distribucion Uniforme Distribucion de la media muestral n = 2 Distribucion de la media muestral n = 4
0 0.5 1
5 -
0 0.5 1
5 -
0 0.5 1
5 -
Distribucion de la media muestral n = 8 Distribucion de la media muestral n = 16 Distribucion de la media muestral n = 32
Figura 6.2: Evolucion de la distribucion de la media muestral
n
de una poblacion Uniforme seg un los diferentes
valores de n.
0 0.5 1 0 0.5 1 0 0.5 1
Distr. Triangular Asimetrica a la dcha. Distribucion de la media muestral n = 2 Distribucion de la media muestral n = 4
0 0.5 1 0 0.5 1 0 0.5 1
n
de una poblacion beta ((2, 1)) seg un los
diferentes valores de n.
0 0.5 1 0 0.5 1 0 0.5 1
Distr. Exponencial Asimetrica a la izda. Distribucion de la media muestral n = 2 Distribucion de la media muestral n = 4
0 0.5 1 0 0.5 1 0 0.5 1
n
de una poblacion exponencial seg un los diferentes
valores de n.
0 0.5 1 0 0.5 1 0 0.5 1
Distribucion Bimodal Distribucion de la media muestral n = 2 Distribucion de la media muestral n = 4
0 0.5 1 0 0.5 1 0 0.5 1
n
de una poblacion Bimodal seg un los diferentes
valores de n.
6.4. Tama no muestral.
Uno de los usos de los resultados anteriores es el de obtener el tama no necesario para conseguir conclusiones
aproximadas con una precision y una seguridad determinadas. Es decir, si queremos estimar la media de una v.a.
de la que conocemos su desviacion tpica usando la media muestral, cual debe ser el tama no de la muestra,
para que al menos el 95 % de las ocasiones, nos equivoquemos en menos de 5 unidades?
Este problema se plantea as:
Calcular n tal que P{|
n
| < 5} 0
95. Para solucionarlo, suponemos n 30, luego
n
N(, /
n)
_
o

n
n
N(0, 1)
_
y
P{|
n
| < 5} = P{ 5 <
n
< 5} = P
_
<

n
n
<
5
_
=
F
N(0,1)
_
5
_
F
N(0,1)
_
_
= 2 F
N(0,1)
_
5
_
1 0
95,
y despejando n en la anterior inecuacion n
_
F
1
N(0,1)
(0
975)

5
_
2
=
_
1
96
5
_
2
lo que nos asegura que cualquier
tama no de la muestra mayor o igual a
_
1
96
5
_
2
nos solventa el problema. Pero, para llegar a ese resultado
tuvimos que suponer que n 30 con objeto de poder aproximar a la distribucion normal usando el teorema
central de lmite, nos podemos preguntar: que ocurre si
_
1
96
5
_
2
< 30? La respuesta es que: un tama no
n = 30 verica simultaneamente los dos requisitos (n 30 y n
_
1
96
5
_
2
). Pero podemos anar un poco mas
en nuestra respuesta, usando la desigualdad de Tchebychev, P{|
n
| < 5} 1
V ar(
n
)
5
2
= 1

2
25n
0
95
y de esta inecuacion despejamos n, n

2
25(10
95)
y utilizaremos el entero mas proximo a este cociente si es
menor de 30.
Esta claro, que en el ejemplo anterior, podemos elegir cualquier precision y cualquier seguridad, es decir nada
cambiara nuestro razonamiento si sustituimos 5, por un valor cualquiera a > 0 y 0
95 por otro cualquiera

(0, 1). La desviacion tpica o la varianza se suponen conocidas, pero si no es as, podemos usar la informacion
disponible para acotarla. As, en el caso de distribuciones de Bernoulli,
2
= p(1p) = pp
2
y el valor maximo
de esta expresion es 1/4 que se alcanza cuando p = 1/2.
Ejercicio 6.1 El diametro interior de un anillo de piston seleccionado al azar es una variable aleatoria con
valor medio de 12 cm y desviacion tpica de 004 cm.
a) Si
n
es el diametro medio de la muestra para una muestra aleatoria de tama no n anillos, cual es la media
y la desviacion tpica de la media muestral
n
?
b) Si n = 64, cuanto vale la probabilidad de que el diametro medio de la muestra este como mucho a una
distancia de 005cm del valor 12cm?
c) Contesta a la pregunta anterior si el tama no muestral fuese n = 16 anillos.
Ejercicio 6.2 La resistencia a la ruptura de un remache tiene un valor medio de 10000 lb/pulg
2
y una desviacion
tpica de 500 lb/pulg
2
.
a) Cual es la probabilidad de que la resistencia media a la ruptura de la muestra, para una muestra aleatoria
de 40 remaches, este entre 9700 y 10200?
b) Cual es la probabilidad de que la resistencia media a la ruptura de la muestra, para una muestra aleatoria
de 40 remaches, sea menor que 10200?
c) Calcular las probabilidades pedidas en los apartados anteriores si el tama no muestral hubiese sido 15 en
lugar de 40 remaches.
Ejercicio 6.3 La duracion de cierto tipo de batera es una v.a. con valor medio de 8 horas y desviacion tpica
de 1 hora. Hay n bateras independientes en un paquete. Obtener el valor de duracion, de tal modo que la
duracion total (suma de las duraciones) de todas las bateras de un paquete exceda ese valor como mucho en el
5 % de todos los paquetes, si
a) n = 40. b) n = 4.
Ejercicio 6.4 Un ingeniero redondea a milmetros los 30000 n umeros que aparecen de forma independiente en
un informe que esta realizando (por ejemplo: 46200 mm 462 mm, 46246 mm 462 mm, 46250 mm 463
mm, 46284 mm 463 mm) y posteriormente los suma. As pues, si
i
representa la diferencia entre el i-esimo
n umero y el n umero obtenido al redondearlo, se tiene que
i
U(0
5, 0
5) y que el error total cometido al

sumar los 30000 n umeros es
30000
i=1
. Cual es la probabilidad de que el error total cometido al sumar sea mayor

de 50 mm?
Ejercicio 6.5 El n umero de defectos en cada rollo de papel producido por una determinada fabrica sigue una
distribucion de Poisson. Sabiendo que el n umero medio de defectos por rollo es de 1 y que un rollo con tres o
mas defectos es disconforme, se pide:
a) Calcular la probabilidad de que un rollo sea disconforme.
b) Si se revisan 10 rollos independientes, calcular la probabilidad de que como mucho 1 sea disconforme.
c) Si se revisan 100 rollos independientes, calcular la probabilidad de que como mucho 10 sean disconformes.
d) Si se revisan 1000 rollos independientes, calcular la probabilidad de que como mucho 100 sean disconformes.
Ejercicio 6.6 Cierta pieza de una maquina se sustituye por otra igual en cuanto se produce el fallo. Cada pieza
tiene un tiempo de vida (en horas) con funcion de densidad f(x) = e
15x
, x > 15 y las piezas son independientes
entre s. Con estos dato, se pide:
a) Calcular la probabilidad de que la maquina dure mas de 1610 horas, si se dispone de 100 piezas de recambio.
b) Calcular el n umero de piezas de recambio necesarios para asegurarnos el funcionamiento de la maquina
durante un tiempo superior a 1500 horas con una probabilidad de al menos 095.
Ejercicio 6.7 Un aparato contiene un elemento electronico cuyo funcionamiento es imprescindible para el
trabajo del aparato. Si falla el elemento se sustituye el mismo inmediatamente por uno de reserva. La vida
media del elemento electronico es de 1000 horas, la varianza de la vida es de 3600 h
2
y los elementos electronicos
son independientes entre s.
a) Si se dispone de 49 elementos electronicos, obtengase la probabilidad de que el aparato deje de funcionar
antes de 48000 horas.
b) Determnese el n umero de elementos necesarios para garantizar con una probabilidad de 095 el funciona-
miento ininterrumpido del aparato durante el transcurso de 20000 horas.
Examenes.
Ejercicio 6.8 (19-06-03) El n umero de averas de una componente en un intervalo de tiempo (en a nos) de
amplitud t es una v.a.
t
con distribucion de Poisson de parametro 3t/2. Ademas el n umero de averas solo
depende de la amplitud del intervalo de tiempo y no de los extremos del intervalo.
a) Calcular la distribucion de la v.a. := Tiempo de duracion sin averas de una componente.
b) Supongase que un sistema esta formado por 100 componentes que funcionan independientemente una de
otra, y que el sistema funciona de forma optima cuando al menos 8 componentes nunca se han averiado.
Cual es la probabilidad de que el sistema funcione de forma optima despues de 2 a nos?
Ejercicio 6.9 (17-02-04) En una fabrica de vidrio se sabe que los defectos en cada plancha de vidrio aparecen
de manera independiente y por causas atribuibles al azar, por lo que la distribucion del n umero de defectos por
plancha se puede suponer de Poisson. El n umero medio de defectos por cada plancha es 1.
a) Si una plancha se rechaza cuando presenta cuatro o mas defectos, cual es la probabilidad de que una
plancha elegida al azar sea rechazada?
b) Calcular la probabilidad de que sea necesario revisar diez planchas para encontrar la primera que se rechace.
c) Si se revisan 1000 planchas independientes, cual es la probabilidad de que se rechacen como mucho 20?
Ejercicio 6.10 (09-09-04) Una empresa recibe un pedido de microcircuitos en lotes de 10 microcircuitos. Se
sabe que el 10 % de los microcircuitos son defectuosos y que se comportan de manera independiente con respecto
a la calidad.
a) Si la empresa recibe 200 lotes, cual es la probabilidad de que al menos 1800 de los microcircuitos no sean
defectuosos?
b) Suponiendo que se decide aceptar un lote si en una muestra con reemplazamiento de dos de los microcircuitos
no hay ninguno defectuoso, cual es la probabilidad de que ninguno de los diez microcircuitos de un lote
aceptado sea defectuoso?
Ejercicio 6.11 (07-09-05) Un kit esta formado por un eje y un cojinete que deben adaptarse satisfactoria-
mente para que el kit sea valido. La adaptacion es satisfactoria cuando el diametro interior del cojinete , excede
al diametro del eje , en al menos 0
004, pero no mas de 0
036 unidades.
La funcion de densidad conjunta de (,) viene dada por:
f(x, y) =
_
2500 si 0
49 < x < 0
51, 0
51 < y < 0
53,
0 en el resto.
a) Calcular la probabilidad de que un kit sea valido.
b) Calcular la probabilidad de que en un lote de 100 kits elegidos al azar, haya mas de 90 validos.
Ejercicio 6.12 (30-06-06) Un club de alpinistas desea comprar cuerdas de bra de nilon para las escaladas.
Con el n de tener las maximas garantas, se exige al fabricante que una cualquiera de estas cuerdas pueda
soportar sin romperse 1000 Kg. como mnimo. Cada bra individual tiene una resistencia media de 5 Kg. y una
desviacion tpica de 01 Kg. Sabiendo que la resistencia de la cuerda es igual a la suma de las resistencias de
las bras que la componen y que las bras son independientes entre s, cual es el n umero mnimo de bras que
debe tener cada cuerda para satisfacer las exigencias de los alpinistas con una probabilidad mayor o igual de
099?
Ejercicio 6.13 (07-09-07) Una maquina que fabrica componentes electricos dispone de un detector de artcu-
los defectuosos. Este detector detecta un componente defectuoso con probabilidad 0
99 y considera defectuoso
un componente que no lo es con probabilidad 0
02. Si la maquina produce un 5 % de componentes defectuosos,

calcular:
a) La probabilidad de que elegido un componente al azar este no sea defectuoso y el detector lo clasique como
defectuoso.
b) La probabilidad de que habiendo clasicado el detector un componente como defectuoso, este no sea defec-
tuoso.
c) La probabilidad de que habiendo clasicado el detector un componente como no-defectuoso, este sea defec-
tuoso.
d) Si el detector analiza 10000 componentes de manera independiente, cual es la probabilidad de que cometa
menos de 195 errores? Nota.- El detector comete un error si clasica como defectuoso un componente no-
defectuoso o como no-defectuoso un componente defectuoso.
Ejercicio 6.14 (18-02-08) El diametro de los agujeros resultantes al taladrar en tarjetas de circuito impreso
es una variable aleatoria con una desviacion tpica de 0
01 milmetros y media desconocida . Si se consideran

n diametros independientes
1
,
2
, . . . ,
n
, se pide:
a) Obtener la media y la varianza de la media muestral
n
.
b) Calcular de forma aproximada la probabilidad de que
n
se encuentre a no mas de 0
005 milmetros del

diametro promedio del proceso, suponiendo que n = 36.
c) Acotar inferiormente la probabilidad de que
n
005 milmetros del diametro

promedio del proceso, suponiendo que n = 20.
Ejercicio 6.15 (26-06-08) El tiempo, en minutos, que tarda en atender a un internauta un programa de
dispensacion de billetes de avion es una v.a. con funcion de densidad:
f(x) =
_
_
_
1
2
x si 0 < x < 1,
1
6
x +
2
3
si 1 < x < 4,
0 en el resto.
Si el programa tarda mas de 2 minutos, se considera una duracion excesiva, siendo aceptable en caso contrario.
a) Una compa na A comprara el programa con probabilidad 0
8 si la duracion de una prueba es aceptable y

con probabilidad 0
1 si es excesiva. Tras una ejecucion del programa, la compa na ha decidido comprarlo,

cual es la probabilidad de que la duracion haya sido excesiva?
b) La compa na B, menos conada, preere realizar 5 ejecuciones independientes del programa, comprandolo
solo si tiene una duracion aceptable en al menos 4 de ellas. Cual es la probabilidad de que compre el
programa?
c) La compa na C, a un mas desconada, decide realizar 50 ejecuciones independientes del programa y comprarlo
solo si a lo sumo en 10 ocasiones la duracion ha sido excesiva. Cual es la probabilidad de que compre el
programa la compa na C?
Ejercicio 6.16 (16-09-09) Un modelo simplicado del movimiento del n umero de llamadas que se producen
diariamente en una centralita de telefonos, supone que ese n umero aumenta cada da respecto al da anterior en
una unidad con probabilidad p y disminuye cada da respecto al da anterior en una unidad con probabilidad
1 p. Las variaciones del n umero de llamadas en das diferentes se suponen independientes. Se pide calcular:
a) La probabilidad de que pasados dos das, el n umero de llamadas del tercer da coincida con el n umero de
llamadas del primer da.
b) La probabilidad de que pasados tres das, el n umero de llamadas del cuarto da se haya incrementado en
una unidad respecto al n umero de llamadas del primer da.
c) Si al cabo de tres das el n umero de llamadas aumento en una unidad (el cuarto da hubo una llamada mas
que el primero), cual es la probabilidad de que el segundo da haya aumentado el n umero de llamadas
respecto al primero?
d) Cual es la probabilidad de que pasados 100 das, el n umero de llamadas del da 101 no supere en cinco a
las producidas el primer da? (Suponer p = 0
5.)
Ejercicio 6.1 a) Aplicando las propiedades de la esperanza y la varianza obtenemos que:
E[
n
] = E[
1
n
n
i=1
i
]
E[a] = aE[]
=
1
n
E[
n
i=1
i
]
E[
i
] =
i
E[
i
]
=
1
n
n
i=1
E[
i
] =
1
n
n
i=1
12 = 12.
V ar[
n
] = V ar[
1
n
n
i=1
i
]
V ar[a] = a
2
V ar[]
=
1
n
2
V ar[
n
i=1
i
]
V ar[
i
] =
i
V ar[
i
]
v.a. indep.
=
1
n
2
n
i=1
V ar[
i
] =
1
n
2
n
i=1
(0
04)
2
=
(0
04)
2
n
.
Con lo cual la esperanza y la desviacion tpica de
n
para una muestra de tama no n son: E[
n
] = 12 cm y
n
=
(0
04)
2
n
=
0
04
n
cm.
b) Al ser el tama no muestral n = 64 30, podemos aplicar el TCL. Siempre que esto sea posible, se utilizara el
TCL, puesto que dara lugar a una mejor aproximacion al verdadero valor de la probabilidad que el Teorema
de Chebychev. A partir del Teorema Central del Lmite se pueden obtener dos distribuciones aproximadas
que son:
Sean
1
,
2
, . . . ,
n
una sucesion de v.a. independientes y con la misma distribucion (i.i.d.) con media
E[
i
] = y varianza V ar[
i
] =
2
, i {1, 2, . . . , n}. Se tiene que
n
n 30
N(0, 1),
o, lo que es equivalente,
n
i=1
i
n
n
n 30
N(0, 1).
En nuestro caso utilizaremos la primera para obtener que
P(11
95
64
12
05)
n = 64 30
P(11
95 N(12, 0
005) 12
05) = P(N(12, 0
005) 12
05)
P(N(12, 0
005) < 11
95) = F
N(12,0
005)
(12
05) F
N(12,0
005)
(11
95) = 1 0 = 1.
c) Si el tama no muestral es n = 16, seg un lo visto en el apartado a), la esperanza de
n
contin ua siendo 12 cm
(no cambia, puesto que no depende de n), pero la desviacion tpica de
n
pasa a ser
0
04
16
= 0
01 cm.
Puesto que la probabilidad pedida es P(11
95
16
12
05) y lo unico que sabemos de la v.a. son su

media y desviacion tpica (no conocemos su distribucion), lo mismo nos ocurre con la v.a.
16
. Por otro
lado, como el tama no muestral es n = 16 < 30, no podemos aplicar el Teorema Central del Lmite (TCL)
y la unica posibilidad que nos queda es aplicar el Teorema de Chebychev. Dicho teorema tiene dos formas
equivalentes de formularse:
Para toda v.a. con media y desviacion tpica , y para todo k > 0 se tiene que
P(| | < k) 1

2
k
2
,
o, lo que es equivalente,
P(| | k)

2
k
2
.
Puesto que P(| | k) P(| | < k) y P(| | > k) P(| | k), tambien se verica que
P(| | k) 1

2
k
2
, P(| | > k)

2
k
2
,
no teniendo, por tanto, importancia si las desigualdades de dentro de la probabilidad son estrictas o no.
As pues, si lo aplicamos a nuestra variable
16
con media 12 y desviacion tpica 0
01 obtenemos que
P(11
95
16
12
05) = P(|
16
12| 0
05) 1
0
01
2
0
05
2
= 1 0
04 = 0
96,
con lo cual la probabilidad buscada es al menos 096.
Ejercicio 6.2 a) Aplicando el Teorema Central del Lmite se obtiene que P(9700 <
40
< 10200) 0
9942.
b) Aplicando el Teorema Central del Lmite se obtiene que P(
40
< 10200) 0
9943.
c) En este caso se no puede aplicar el TCL (n = 15 < 30) y hay que utilizar el Teorema de Tchebychevy. Con
esto lo mas que se obtiene es que P(9700 <
15
< 10200) es mayor o igual que 0583 y que P(
15
< 10200)
es tambien mayor o igual que 0583.
Ejercicio 6.3 a) Aplicando el TCL (n = 40 30 y por tanto se puede aplicar) se obtiene que la duracion
para la cual se puede asegurar que el 95 % de los paquetes de 40 bateras no duran mas de esa cantidad es
de aproximadamente 330
403 horas.
b) Puesto que n = 4 < 30, no se puede aplicar el TCL y debemos utilizar el Teorema de Tchebychev. Con
esto se obtiene que la duracion para la cual se puede asegurar que el 95 % de los paquetes de 4 bateras no
duran mas de esa cantidad es 40
944 horas.
Ejercicio 6.4 Lo que nos estan pidiendo es que calculemos P
_
30000
i=1
> 50
_
. Puesto que n = 30000 30,
podemos aplicar el Teorema Central del Lmite y llegamos a que
30000
i=1
i
N
_
0,
30000
12
_
, con lo que
P
_
30000
i=1
> 50
_
2
_
1 P
_
N
_
0,
30000
12
_
50
__
= 2
_
1 F
N
(
0,
30000
12
)
(50)
_
= 0
3173.
Ejercicio 6.5 Si denotamos por la v.a.a n umero de defectos por rollo, se tiene del enunciado que P()
y E() = 1, con lo que P(1).
a) Puesto que un rollo con tres defectos o mas es disconforme, la probabilidad pedida es
P( 3) = 1 P( < 3) = 1 P( = 0) P( = 1) P( = 2) = 1 e
1
e
1
1
2
e
1
= 0
08.
b) Si denotamos por la v.a. n umero de rollos disconformes de los 10 revisados, dicha variable tiene una
distribucion binomial B(10, 0
08) y la probabilidad pedida es

P( 1) = P( = 0) +P( = 1) =
_
10
0
_
(0
08)
0
(1 0
08)
10
+
_
10
1
_
(0
08)
1
(1 0
08)
9
= 0
43 + 0
38 = 0
81.
c) An alogamente, si se revisan 100 rollos, la v.a. =n umero de rollos disconformes de los 100 revisados sigue
una distribucion binomial B(100, 0
08) y la probabilidad pedida es P( 10).

Aunque puede calcularse esta probabilidad directamente, tal como se ha hecho en el apartado anterior, esto
es un trabajo bastante laborioso, puesto que tendramos que sumar once sumando con n umero combinatorios,
productos, etc. Para evitar esto, podemos utilizar un caso particular del Teorema Central del Lmite, el que
se obtiene cuando la variable sigue una distribucion binomial y que se conoce como Teorema de De Moivre.
Seg un este teorema, la distribucion de es aproximadamente normal N(1000
08,
100 0
08 (1 0
08))
N(8, 2
71), con lo que la probabilidad pedida se puede aproximar como sigue

P( 10) P(N(8, 2
71) 10) = 0
77.
d) De forma analoga al apartado anterior, si denotamos por la v.a. n umero de rollos disconformes de los
1000 revisados, se tiene que B(1000, 0
08) N(80, 8
58), con lo que la probabilidad pedida se obtiene

como sigue
P( 100) P(N(80, 8
58) 100) = 0
99.
Ejercicio 6.6 Sea
i
el tiempo de funcionamiento de la valvula i-esima, i = 1, 2, . . . , n siendo n el n umero de
piezas de recambio. Suponiendo que n es lo sucientemente grande (n 30), aplicamos el Teorema Central del
Lmite, con lo que
n
i=1
i
N(16n,
n),
puesto que E[] = 16, V ar[] = 1.
a) En el caso particular que n = 100, se tiene que
100
i=1
i
N(1600, 10),
con lo que la probabilidad pedida en este apartado es
P
_
100
i=1
i
> 1610
_
= P(N(1600, 10) > 1610) = 1 P(N(1600, 10) 1610) = 1 0
8413 = 0
1587.
b) Deseamos ahora obtener el valor n para garantizar que el tiempo total de funcionamiento sea superior a
1500 horas, es decir,
P(
n
i=1
i
> 1500) 0
95.
Aplicando de nuevo que
n
i=1
i
N(16n,
n),
se tiene que
P(
n
i=1
i
> 1500) 1 F
N(0,1)
_
1500 16n
n
_
0
95 F
N(0,1)
_
1500 16n
n
_
0
05
y calculamos el n seg un la siguiente desigualdad:
1500 16n
n
1
645 16n 1
645
n 1500 0.
Despejando

n, nos salen dos valores, 973 y -963, por lo que la desigualdad anterior se puede reescribir
como
(
n 9
73)(
n + 9
63) 0
_
_
_
n 9
73 y

n 9
63
o
n 9
73 y

n 9
63
_
_
_
Con lo cual

n 9
73, lo que implica que n 94
67, y por tanto son necesarias 95 piezas.

Ejercicio 6.7 Sea
i
el tiempo de funcionamiento del i-esimo elemento electroncio, i = 1, 2, . . . , n siendo n el
n umero de elementos de recambio.
Suponiendo que n es lo sucientemente grande (n 30), aplicamos el Teorema Central del Lmite, con lo que
n
i=1
i
N(1000n, 60
n),
puesto que E[] = 1000, V ar[] = 3600.
a) En este caso n = 49, con lo que la probabilidad pedida es
P
_
n
i=1
i
< 48000
_
= P(N(49000, 420) < 48000) = 0
0086.
b) Para obtener el valor de n que nos garantiza que el tiempo total de funcionamiento sea superior a 20000
horas, es decir, que
P(
n
i=1
i
> 20000) 0
95,
volvemos a aplicar que
n
i=1
i
N(1000n, 60
n),
con lo cual
P(
n
i=1
i
> 20000) 1 F
N(0,1)
_
20000 1000n
60
n
_
0
95 F
N(0,1)
_
20000 1000n
60
n
_
0
05
y calculamos el n seg un la siguiente desigualdad:
20000 1000n
60
n
1
645 1000n 98
n 20000 0.
Despejando

n, nos salen dos valores, 4
52 y 4
42, por lo que la desigualdad anterior se puede reescribir

como
(
n 4
52)(
n + 4
42) 0
_
_
_
n 4
52 y

n 4
42
o
n 4
52 y

n 4
42
_
_
_
Con lo cual

n 4
52, lo que implica que n 20
45, y por tanto son necesarios 30 elementos (n debe ser

mayor o igual que 30 para haber aplicado TCL).
Ejercicio 6.8 a) Seg un se ha denido se tiene que
F
(t) = P( t) = 1 P( > t) =
_
1 P(
t
= 0) = 1 e
3t/2
(3t/2)
0
)
0!
= 1 e
3t/2
si t > 0
0 si t 0
,
con lo cual, la funcion de densidad de es:
f
(t) = F
(t) =
_
3
2
e
3
2
t
si t > 0
0 si t 0
,
con lo cual la v.a. sigue una distribucion exponencial exp(3/2).
b) Si denimos la v.a. como n umero de componentes, de las 100 componentes del sistema, que no se han
averiado durante 2 a nos , esta v.a. sigue una distribucion binomial B(100, p) donde p es la probabilidad de
que la primera avera sea despues de dos a nos, es decir,
p = P( > 2) =

2
3
2
e
3
2
t
dt = e
3
= 0
05.
Lo que nos piden en este apartado es P(8 100) y aplicando el Teorema de De Moivre obtenemos que
B(100, 0
05) N(100 0
05,
100
05 (1 0
05)) N(5, 2
18), con lo cual

P(8 100) P(8 N(5, 2
18) 100) = P(
8 5
2
18
N(0, 1)
100 5
2
18
) =
= P(1
38 N(0, 1) 43
58) = P(N(0, 1) 43
58) P(N(0, 1) < 1
38) = 1 0
9162 = 00838.
Ejercicio 6.9 Puesto que la media de una distribucion de Poisson es el propio parametro de la distribucion, se
tiene que
= n
o
de defectos por plancha P(1).
a) P(rechazada) = P( 4) = 1 P( < 4) = 1 (P( = 0) + P( = 1) + P( = 2) + P( = 3)) =
1 (e
1 1
0
0!
+e
1 1
1
1!
+e
1 1
2
2!
+e
1 1
3
3!
) = 1 e
1
(1 + 1 +
1
2
+
1
6
) = 1 0
981 = 0
019.
b) Si denimos la variable = n
o
de planchas revisadas hasta encontrar la primera rechazada, dicha variable
sigue una distribucion geometrica G(0
019), puesto que la probabilidad de ser rechazada, seg un vimos en el

apartado anterior, es 0
019.
As pues, la probabilidad pedida es: P( = 10) = (1 0
019)
9
(0
019) = 0
016.
c) Si consideramos ahora la variable denida como n
o
de planchas rechazadas de 1000 seleccionadas, nos
piden que calculemos P( 20).
Puesto que B(1000, 0
019), podramos calcular directamente esta probabilidad con ayuda de alguna

herramienta informatica, con lo que obtendramos que P( 20) = 0
648. No obstante, puesto que no tene-

mos asegurada la disponibilidad de esta herramienta informatica, podramos resolver el apartado aplicando
el Teorema de Moivre (caso particular del Teorema Central del Lmite para variables Bernoulli) o, lo que
es lo mismo, la aproximacion de la binomial a la normal. Teniendo en cuenta que se dan las condiciones
necesarias, B(1000, 0
019) N(1000 0
019,
1000
(1 0
019)(0
019)) N(19, 4
32), con lo cual

P( 20) P(N(19, 4
32) 20) = P(N(0, 1)

2019
4
32
) = 0
592.
Ejercicio 6.10 a) Si denotamos por la variable aleatoria n umero de microcircuitos no-defectuosos de los
2000 recibidos (200 lotes), la probabilidad que nos piden es
P( 1800).
Teniendo en cuenta que la distribucion de es una binomial, es decir, B(2000, 0
9), y que se verican

las condiciones para aproximar esta a la normal, se tiene que B(2000, 0
9) N(1800, 13
42). As pues,
P( 1800) P(N(1800, 13
42) 1800) = 0
5.
b) Si denotamos por y las variables aleatorias
= n umero de microcircuitos no defectuosos de un lote (10 microcircuitos)
= n umero de microcircuitos no defectuosos de los dos seleccionados del lote con reemplazamiento
se tiene que
B(10, 0
9) y / = k B
_
2,
k
10
_
, k {0, 1, . . . , 10}.
Por otro lado, la probabilidad que nos piden es P( = 10/ = 2) y teniendo en cuenta los datos anteriores
se tiene que:
P( = 10/ = 2) =
P( = 10 = 2)
P( = 2)
=
P( = 10 = 2)
10
k=0
P( = k = 2)
=
P( = 2/ = 10)P( = 10)
10
k=0
P( = 2/ = k)P( = k)
=
_
_
2
2
_ _
10
10
_
2
_
0
10
_
0
__
_
10
10
_
(0
9)
10
(0
1)
0
_
10
k=0
_
_
2
2
_ _
k
10
_
2
_
10k
10
_
0
__
_
10
k
_
(0
9)
k
(0
1)
10k
_
=
(0
9)
10
1
100
10
k=0
k
2
P( = k)
=
(0
9)
10
1
100
E[
2
]
=
(0
9)
10
1
100
(V ar[] + (E[])
2
)
=
(0
9)
10
1
100
(10 0
9 0
1 + (10 0
9)
2
)
=
(0
9)
10
1
100
(0
9 + 81)
= 0
426.
Ejercicio 6.11 a) Una kit es valido si + 0
004 + 0
036, con lo cual la probabilidad pedida es

P(0
004 0
036). Gracamente se ve como esta probabilidad se corresponde con la zona sombreada,

con lo cual:
P(0
004 0
036) = 1
494
0
49
53
x+0
036
2500dydx
51
0
506
x+0
004
0
51
2500dydx = 10
020
02 = 0
96.
049 0494 0506 051
053
051
0514
0526
b) Si consideramos la v.a. =n umero de kits validos de los 100 del lote, dicha variable sigue una distribucion
binomial de parametros B(100, 0
96) y la probabilidad pedida es P( > 90). Esta probabilidad puede

obtenerse de forma exacta calculando diez veces la probabilidad de esta binomial es un punto y sumando
dichas cantidades, es decir,
P( > 90) =
100
k=91
P( = k) =
100
k=91
_
100
k
_
(0
96)
k
(1 0
96)
100k
= 0
993.
No obstante, al ser estas cuentas muy laboriosas, se puede obtener un valor aproximado de esta probabi-
lidad aplicando el Teorema de De Moivre (caso particular del Teorema Central del Lmite), por el cual la
distribucion de es aproximadamente normal. Mas concretamente, B(100, 0
96) N(96, 1
96), con
lo cual,
P( > 90) P(N(96, 1
96) > 90) = P(N(0, 1) >

90 96
1
96
) = 1 P(N(0, 1) 3
06) = 1 0
001 = 0
999.
Ejercicio 6.12 Si denotamos por
i
la resistencia de una bra cualquiera i, tenemos que E(
i
) = 5 y V ar(
i
) =
(0
1)
2
. Nos piden pues el valor mnimo de n tal que
P
_
n
i=1
i
> 1000
_
0
99.
Suponiendo que n 30, podemos aplicar el Teorema Central del Lmite y, por lo tanto, se tiene que la distri-
bucion de
n
i=1
i
es aproximadamente normal N(n 5,
n 0
1). Tipicando esta distribucion obtenemos:

0
99 P
_
n
i=1
i
> 1000
_
= P
_
_
_
_
_
_
n
i=1
i
5n
0
n
>
1000 5n
0
n
_
_
_
_
_
_
= P
_
N(0, 1) >
1000 5n
0
n
_
lo cual es equivalente a decir que
0
01 P
_
N(0, 1)
1000 5n
0
n
_
con lo que
1000 5n
0
n
2
33 5n 0
233
n 1000 0
y puesto que las soluciones de la ecuacion son

n = 14
17 y

n = 14
12, se tiene que

5n 0
233
n 1000 = (
n 14
17)(
n + 14
12) 0,
lo que es equivalente a decir que se verica
n 14
17 y

n 14
12, o
n 14
17 y

n 14
12
Como

n 0 (la desviacion tpica de la variable es 0
n), se tiene que

n 14
17, con lo que n (14
17)
2
=
200
79. As pues, el n umero mnimo de bras que debe tener cada cuerda para satisfacer las exigencias de los
alpinistas, con una probabilidad mayor o igual de 099, es n = 201.
Ejercicio 6.13 Si denotamos por D el suceso el componente es defectuoso y por CD el suceso el detector
clasica el componente como defectuoso, los datos del enunciado se pueden resumir como:
P(CD/D) = 0
99, P(CD/D) = 0
02, P(D) = 0
05.
De acuerdo con esto,
defectuoso es:
P(D CD) = P(CD/D)P(D) = P(CD/D)(1 P(D)) = (0
02)(1 0
05) = 0
019.
tuoso es:
P(D/CD) =
P(D CD)
P(CD)
=
0
019
0
0685
= 0
2628,
puesto que
P(CD) = P(D CD) +P(D CD) = P(CD/D)P(D) +P(D CD) = (0
99)(0
05) + 0
019 = 0
0685.
tuoso es:
P(D/CD) =
P(D CD)
P(CD)
=
P(CD/D)P(D)
1 P(CD)
=
(1 0
99)(0
05)
1 0
0685
=
0
0005
0
9315
= 0
00054.
d) Como la probabilidad de error es:
P(E) = P(E D) +P(E D) = P(E/D)P(D) +P(E/D)P(D)
= P(CD/D)P(D) +P(CD/D)P(D) = (0
01)(0
05) + (0
02)(0
95) = 0
0195,
si denimos la v.a. =n umero de errores en 10000 componentes, se tiene que B(10000, 0
0195).
La probabilidad pedida es P( < 195), que podra ser calculada directamente a partir de la binomial y
obtener el valor 0
49 o bien utilizar el Teorema de De Moivre para aproximar la binomial a la normal,

B(10000, 0
0195) N(195, 13
83), y obtener que P( < 195) P(N(195, 13
83) < 195) = 0
5.
Ejercicio 6.14 a) Tenemos una coleccion de variables aleatorias independientes
1
,
2
, . . . ,
n
tales que E(
i
) =
y V ar(
i
) = (0
01)
2
, i {1, 2, . . . , n}. As pues,
E(
n
) = E
_
1
n
n
i=1
i
_
=
1
n
n
i=1
E(
i
) =
1
n
n
i=1
=
y
V ar(
n
) = V ar
_
1
n
n
i=1
i
_
indep.
=
1
n
2
n
i=1
V ar(
i
) =
1
n
2
n
i=1
(0
01)
2
=
(0
01)
2
n
.
b) Si n = 36, podemos aplicar el Teorema Central del Lmite y aproximar la distribucion de
n
mediante una
normal de parametros, evidentemente, los obtenidos en el apartado anterior. As,
n
N(,
0
01
n
), con lo
que la probabilidad pedida es aproximadamente igual a
P( 0
005 <
n
< + 0
005) = P
_
( 0
005)
0
01/
n
<

n
01/
n
<
( + 0
005)
0
01/
n
_
= P(3 < N(0, 1) < 3) = 0
9974.
c) Si n = 20, no podemos aplicar el Teorema Central del Lmite y tenemos que conformarnos con acotar la
probabilidad pedida aplicando la Desigualdad de Chebychev. As,
P( 0
005 <
n
< + 0
005) = P
_
|
n
| < 0
005
_
1
(0
01)
2
/n
(0
005)
2
= 1 0
2 = 0
8.
Ejercicio 6.15 Si denotamos por E el suceso la duracion ha sido excesiva y por A el suceso la duracion
ha sido aceptable, se tiene que A = E y ademas que P(E) = P( > 2) =
4
2
_
1
6
x +
2
3
_
dx =
1
3
.
a) Si denotamos por C
A
el suceso la compa na A compra el programa, nos dicen que P(C
A
/E) = 0
8 y
P(C
A
/E) = 0
1. La probabilidad pedida es:

P(E/C
A
) =
P(E C
A
)
C
A
=
P(C
A
/E)P(E)
P(C
A
/E)P(E) +P(C
A
/E)P(E)
=
0
1
1
3
0
1
1
3
+ 0
8
2
3
= 0
059.
b) Si denotamos por la v.a. n
o
de ejecuciones con una duracion excesiva de las 5 ejecuciones independientes,
dicha variable sigue una distribucion binomial B(5, 1/3) y la probabilidad de que la compa na B compre el
programa es:
P(C
B
) = P( 1) = P( = 0) +P( = 1) =
_
5
0
__
1
3
_
0
_
2
3
_
5
+
_
5
1
__
1
3
_
1
_
2
3
_
4
= 0
46.
c) De forma analoga al apartado anterior, si denotamos por = n
o
de ejecuciones con una duracion excesiva de
las 50 ejecuciones independientesB(50, 1/3) y la probabilidad de que la empresa C compre el programa
es P(C
C
) = P( 10). Si se dispone de alg un proceso automatico para obtener dicha probabilidad, se
obtendra que la probabilidad buscada es 0
028. No obstante, obtener esta probabilidad manualmente es

un proceso muy laborioso, que puede simplicarse notablemente si, mediante el Teorema de De Moivre,
aproximamos la binomial a la normal, puesto que se dan las condiciones para aplicar dicho teorema. As,
N(50/3, 10/3) y la probabilidad buscada es:
P(C
C
) = P( 10) P(N(50/3, 10/3) 10) = 0
023.
i
el aumento de llamadas en el da i respecto al da anterior, se tiene que la
distribucion de
i
es:
+1 1
P
p 1 p
a) El suceso que nos dice el enunciado se podra reescribir como {
2
= +1,
3
= 1} {
2
= 1,
3
= +1},
puesto que si el da 1 hubo k llamadas, lo que tiene que haber ocurrido para el que da 3 haya de nuevo k
llamadas se esquematizara como sigue:
1
er
da 2
o
da 3
er
da
k

@
@
p
1 p
k + 1
k 1
1 p
p
k
k
De lo anterior se obtiene que la probabilidad pedida es P(
2
= +1,
3
= 1) + P(
2
= 1,
3
= +1) que,
por la independencia, sera igual a P(
2
= +1)P(
3
= 1) +P(
2
= 1)P(
3
= +1) = p(1 p) +(1 p)p =
2p(1 p).
Otra forma de resolver este apartado sera deniendo una v.a. que nos mida el n umero de das que han
aumentado las llamadas de los dos das considerados. Dicha variable tendra una distribucion binomial
B(2, p) y la probabilidad pedida sera P( = 1) =
_
2
1
_
p(1 p) = 2p(1 p), que coincide, evidentemente, con
el resultado obtenido por el otro metodo.
b) Por un razonamiento analogo al del apartado anterior, la probabilidad pedida se podra representar como:
P(
2
= +1,
3
= +1,
4
= 1) +P(
2
= +1,
3
= 1,
4
= +1) +P(
2
= 1,
3
= +1,
4
= +1) =
P(
2
= +1)P(
3
= +1)P(
4
= 1)+P(
2
= +1)P(
3
= 1)P(
4
= +1)+P(
2
= 1)P(
3
= +1)P(
4
= +1)
= pp(1 p) +p(1 p)p + (1 p)pp = 3p
2
(1 p).
Si en lugar de razonar as, utilizamos una v.a. =n
o
de aumentos en tres das, como B(3, p), la
probabilidad pedida es P( = 2) =
_
3
2
_
p
2
(1 p) = 3p
2
(1 p).
c) Si denotamos por B al suceso el cuarto da hubo una llamada mas que el primero, la probabilidad pedida
ahora se podra escribir como:
P(
2
= +1/B) =
P({
2
= +1} B)
P(B)
.
Ahora bien, P(B) fue justo lo calculado en el apartado anterior. Por otro lado,
P({
2
= +1} B) = P(
2
= +1,
3
= +1,
4
= 1) +P(
2
= +1,
3
= 1,
4
= +1) =
P(
2
= +1)P(
3
= +1)P(
4
= 1) +P(
2
= +1)P(
3
= 1)P(
4
= +1) =
= pp(1 p) +p(1 p)p = 2p
2
(1 p),
con lo que la probabilidad pedida es:
P(
2
= +1/B) =
2p
2
(1 p)
3p
2
(1 p)
=
2
3
.
d) Si denotamos por la v.a. n
o
de aumentos en los 100 das, tenemos que B(100, 0
5) N(50,
25) y
ademas la probabilidad pedida es P( 52) 0
66.
PREGUNTAS DE TEST.
Examenes.
1. (19-06-03) Un proceso de fabricacion produce el 10 % de artculos defectuosos. Si se seleccionan al azar
100 artculos, entonces la probabilidad de que el n umero de defectuosos exceda de 16 es:
a) Menor de 003;
d) No se puede saber;
b) Mayor de 003;
e) Todo falso.
c) 097725;
2. (09-09-03) Dada una v.a. con media 12 y varianza 9, se tiene siempre que P(6 < < 18) es mayor o
igual que:
a) 095; b) 1/4; c) 3/4; d) 1/2; e) Todo falso.
3. (09-09-03) La venta diaria de una fabrica sigue una distribucion uniforme entre 20 y 30 mil euros. Despues
de transcurridos 182 das de venta, y suponiendo las ventas diarias independientes, la probabilidad de haber
vendido mas de 55 millones de euros (5500 miles de euros) es aproximadamente:
a) 1; b) 2; c) 1/2; d) -3; e) Todo falso.
4. (09-09-03) Sean
1
,
2
, . . .
n
n v.a.i.i.d. con media y varianza
2
. La v.a. =
1
+ +
n
seguira, para
n sucientemente grande, una distribucion
a) N(n , n );
c) N(n ,
n );
e) Todo falso.
b) Aproximadamente N(n , n );
d) Aproximadamente N(n ,
n );
5. (17-02-04) El diametro interior de un anillo de piston seleccionado al azar es una v.a. con media 12 cm y
desviacion tpica 004 cm. Si

64
es el diametro medio de una muestra aleatoria de tama no n = 64, la desviacion
tpica de la media muestral

64
es:
a) 004; b) 00002; c) 0005; d) 12; e) Todo falso.
6. (21-06-04) Sean
1
,
2
, . . . ,
n
variables aleatorias independientes e igualmente distribuidas con media y
varianza nitas y sea =
1000
i=1
i
. La probabilidad de que tome un valor que diera de su media en menos que
el valor de su desviacion tpica, es decir, P(
< <
), es:
a) 0
66, por la desigualdad de Tchebychev;

c) 0
68, por el Teorema Central del Lmite;

e) Todo falso.
b) No se puede conocer;
d) > 23, por el Teorema de Bayes;
7. (21-06-04) Sea una v.a. con media y varianza
2
, nitas. Entonces P(| | < k) es mayor o igual
que:
a) 0, si k = 1; b) 3/4, si k = 2; c) 8/9, si k = 3; d) 15/16, si k = 4; e) Todo falso.
8. (09-09-04) Un proceso de fabricacion produce el 10 % de artculos defectuosos. Si se seleccionan al azar
a) No se sabe; b) Menor de 005; c) Mayor de 005; d) 095; e) Todo falso.
9. (06-07-05) Un proceso de fabricacion produce el 0
1 % de artculos defectuosos. Si se seleccionan al azar

10. (13-02-06) Dado que el a no tiene 52 semanas, estas se consideran independientes y el volumen semanal
de ventas de un producto sigue una distribucion normal, el n umero esperado de semanas al a no en las que las
ventas superan la media es:
a) 52; b) 26; c) 32; d) 62; e) Todo falso.
11. (13-02-06) Si en el enunciado anterior suprimimos la hipotesis de normalidad de la distribucion del
volumen semanal de ventas, pero seguimos suponiendo que es simetrica respecto a su media, la probabilidad de
que en un a no en mas de 26 semanas las ventas superen la venta media semanal es aproximadamente:
a) 0; b) 1; c) 15; d) 05; e) Todo falso.
12. (30-06-06) El peso medio de equipaje por viajero de avion es de 40 Kg y la desviacion tpica se desconoce.
Si hay 50 pasajeros independientes en un vuelo, la probabilidad de que el peso total del equipaje en el vuelo
supere los 2000 Kg es aproximadamente:
a) No se puede saber, por no conocer la desviacion tpica;
b) 025;
c) 05;
d) No se puede saber, por no conocer la distribucion del peso de equipaje;
e) Todo falso.
13. (07-09-06) Sea una variable aleatoria de media 3 y varianza 4. Entonces podemos asegurar que la
probabilidad P(1 < < 7) es siempre mayor o igual que:
a) 0
75; b) 0
8 ; c) 0

14. (07-09-06) Una empresa lactea sabe que el contenido de sus botellas de leche se distribuye con media
15 litros y desviacion tpica 01 litros. Cual es aproximadamente la probabilidad de que en un envo de 100
botellas independientes haya en total entre 140 y 160 litros de leche?
a) 0; b) 1; c) 05; d) 025; e) Todo falso.
15. (16-02-07) Dada una coleccion de variables (
1
, . . . ,
100
) independientes y todas ellas igualmente distri-
buidas, con distribucion uniforme U(4, 6), entonces la probabilidad de que la media muestral
100
=
1
100
i
sea mayor de 50, es decir, P(
100
> 50), es igual a:
a) 3; b) 0
2345; c) 0
9456; d) 0
1265; e) Todo falso.

16. (16-02-07) Si es una v.a. con media 6 y varianza 4, entonces podemos asegurar que la probabilidad
P(2 < < 10) es mayor o igual que:
a) 075; b) 09; c) 095; d) 099; e) Todo falso.
17. (22-06-07) Se lanza una moneda perfecta 500 veces. La probabilidad de que el n umero de caras sea menor
o igual de 250 es aproximadamente:
a) No se puede saber; b) 0
025; c) 0
63; d) 0
5; e) 263.
18. (22-06-07) El peso medio del equipaje de un viajero de avion es de 40 kg. y la desviacion tpica se
desconoce. Si hay 50 pasajeros independientes en un vuelo, la probabilidad de que el peso total del equipaje
supere los 2000 kg. es aproximadamente igual a:
a) No se puede saber por no conocer la desviacion tpica;
b) 025;
c) 05;
d) No se puede saber por no conocer la distribucion del peso de equipaje;
e) Todo falso.
19. (07-09-07) Una compa na de electronica fabrica resistores que tienen una resistencia media de 90 y una
desviacion tpica de 10. Al tomar una muestra de n = 100 resistores, podemos asegurar que la probabilidad de
que la resistencia promedio de estos resistores sea menor de 95, es decir, P(
100
< 95) es mayor o igual que:
a) 075; b) 025; c) 099; d) 002; e) 095.
20. (07-09-07) Una compa na de electronica fabrica resistores que tienen una resistencia media de 90 y una
desviacion tpica de 10. Al tomar una muestra de n = 20 resistores, podemos asegurar que la probabilidad de
que la resistencia promedio de estos resistores sea menor de 95, es decir, P(
20
a) 075; b) 025; c) 099; d) 002; e) 095.
21. (18-02-08) Se puede asegurar que la suma de 75 variables aleatorias independientes con distribucion
uniforme U(2, 2) sigue una distribucion:
a) U(150, 150);
d) Aproximadamente N(0, 10);
b) H(150, 12, 2);
e) Todo falso.
c) Aproximadamente N(0, 0
13);
22. (26-06-08) Dada una v.a. con media 12 y varianza 9, se tiene siempre que P(4 < < 18) es mayor o
igual que:
a) 095; b) 085; c) 075; d) 09; e) Todo falso.
23. (26-06-08) Los ingresos diarios se representan mediante una v.a. con media 3 y varianza 4. Si se
consideran 40 das independientes, la probabilidad de que los ingresos totales (suma de los ingresos) sean
mayores de 120 es aproximadamente:
a) 05; b) 1; c) 0; d) 095; e) Todo falso.
24. (05-09-08) Dada una v.a. con media 4 y varianza 2, se tiene siempre que P( < 7) es mayor o igual
que:
a) 17/18; b) 15/18; c) 7/9; d) 8/9; e) Todo falso.
25. (05-09-08) Sea (
1
,
2
, . . . ,
100
) una m.a.s. de tama no 100 de una poblacion uniforme U(0, 6). La distri-
bucion de la variable
100
i=1
i
es aproximadamente:
a) U(0, 600); b) N(300,
300); c) N(300, 300); d) P(100); e) Todo falso.

26. (02-07-09) El encargado de ltrar el correo electronico de una empresa establece una barrera para la
publicidad que consiste en eliminar cualquier mensaje que contenga la palabra GRATIS. Se sabe que el 40 %
de los mensajes que se reciben son publicidad, que solo el 1 % de los mensajes que no son publicidad contienen
la palabra GRATIS y que la frecuencia de la palabra GRATIS en los mensajes de publicidad se ajusta
a una distribucion de Poisson de parametro = 2. Bajo tales condiciones, la probabilidad de cometer un
error, es decir, de eliminar un mensaje que no es publicidad o de no eliminar un mensaje que es publicidad es
aproximadamente:
a) 025; b) 075; c) 042; d) 006; e) 321.
27. (02-07-09) Bajo las hipotesis de la pregunta anterior, si la empresa recibe 250 mensajes, la probabilidad
de que la menos la mitad sean publicidad es aproximadamente:
a) 0001; b) 0999; c) 095; d) 27; e) 032.
28. (16-09-09) Dada una v.a. con media 4 y varianza 2, se puede asegurar que P(2 < < 6) es mayor o
igual que:
a) 02; b) 03; c) 04; d) 05; e) Todo falso.
29. (16-09-09) Dada una v.a. con media 4 y varianza 2, se puede asegurar que P( < 6) es mayor o igual
que:
a) 08; b) 07; c) 06; d) 05; e) Todo falso.
N
o
Solucion N
o
Solucion N
o
Solucion N
o
Solucion N
o
Solucion
1. a) 2. b), c), d) 3. e) 4. d) 5. c)
6. c) 7. a), b), c), d) 8. b) 9. b) 10. b)
11. d) 12. c) 13. a) 14. b) 15. e)
16. a) 17. d) 18. c) 19. a), b), c), d), e) 20. a), b), d)
21. d) 22. c) 23. a) 24. c) 25. b)
26. d) 27. a) 28. a), b), c), d) 29. d)
PR
6.4. Tama no muestral.
En la vida laboral, un ingeniero se encuentra con muchas situaciones en las que es imposible estudiar a toda
la poblacion y lo mas que dispone es de la posibilidad de estudiar un subconjunto (muestra) de ella. A partir
de estos datos, veremos en los siguientes temas del curso como obtener conclusiones para toda la poblacion.
No obstante el primer paso es determinar cual debe ser el mnimo tama no de la muestra para que dichas
conclusiones sean realmente ables; es evidente que si la poblacion es grande y consideramos una muestra de
tama no 2, en general no vamos a poder sacar ninguna conclusion para la poblacion (recordemos el caso en el que
en un determinado estudio se conclua que el 100 % de los jovenes de Cimadevilla iban a estudiar a la biblioteca
de Pumarn, a partir de una encuesta a 2 jovenes de Cimadevilla!!!).
Las tecnicas elementales para determinar dicho tama no muestral (existen otras mas avanzadas en el caso de
poblaciones nitas que no son materia de este curso) aparecen descritas en la Seccion 6.4 (pag. 217) de los
apuntes de teora.
Vamos a ir viendo como se hace esto mediante un par de ejemplos:
Ejemplo 1. Queremos obtener el tama no muestral n necesario para aproximar el diametro medio (en cm) de
unos anillos para pistones () mediante el diametro medio de los n anillos de una muestra (
n
) con un error
menor o igual de 3cm y con una probabilidad de que la armacion anterior sea cierta de al menos 095 (95 %),
es decir, buscamos el menor n para el que se puede asegurar que
P(|
n
| 3) 0
95.
Considerando como un dato conocido que la desviacion tpica poblacional del diametro es = 10, debemos
aplicar el TCL (suponiendo n 30) que nos dice que
n
N
_
,

n
_
N
_
,
10
n
_
.
As pues,
P(|
n
| 3) = P
_
|
n
|
3
/
n
_
n 30
P
_
|N(0, 1)|
3
_
= P
_
N(0, 1)
3
_
P
_
N(0, 1) <
3
_
= P
_
N(0, 1)
3
_
1 P
_
N(0, 1)
3
__
= 2F
N(0,1)
_
3
_
1.
Esta cantidad es mayor o igual que 0
95, como buscabamos, si y solo si

3
F
1
N(0,1)
_
0
95 + 1
2
_
n
_
F
1
N(0,1)
_
0
95 + 1
2
_

3
_
2
,
con lo cual, en este caso, n debe ser mayor o igual que (1
96
10
3
)
2
= 42
68, es decir, deben seleccionarse 43

anillos.
En general, para una desviacion tpica poblacional cualquiera, tenemos que el mnimo tama no muestral
n necesario para que el error de estimacion sea menor o igual que con una probabilidad mayor o igual
que
es el primer entero mayor o igual que:

max
_
30,
_
F
1
N(0,1)
_
+ 1
2
_
_
2
_
,
puesto que el tama no muestral debe ser entero, mayor o igual que
_
F
1
N(0,1)
_
+1
2
_
_
2
y mayor o igual
que 30.
Para hacer esto con el Excel, abrimos la hoja Media del chero pr06.xls.
En la celda A2 podemos ver la desviacion tpica poblacional (en este caso 10), en B2 el error de estimacion
(3 en el ejemplo) y en C2 la probabilidad (0
95). Con esto, en la casilla D2 vamos a calcular el valor de

_
F
1
N(0,1)
_
+1
2
_
_
2
, para lo cual tecleamos
=(DISTR.NORM.ESTAND.INV((C2+1)/2)*A2/B2)
2
Este valor no es directamente el tama no necesario de la muestra, puesto que ni siquiera tiene que ser entero. Lo
aproximamos al entero inmediatamente superior en la celda E2 tecleando
=SI(ENTERO(D2)=D2;D2;ENTERO(D2)+1)
puesto que E2 sera igual a D2 si D2 es entero y sera la parte entera de D2 (entero inmediatamente inferior) mas
uno si no lo es.
Para terminar, en F2 calculamos el valor de n, que sera el maximo entre E2 y 30,
=MAX(E2;30)
para que se verique la desigualdad y ademas se pueda aplicar el Teorema Central del Lmite.
Ejemplo 2. Si queremos calcular el tama no muestral mnimo n para estimar o aproximar la proporcion de
individuos de la poblacion (p) que cumplen una determinada caracterstica mediante la proporcion de individuos
de una muestra ( p) que cumplen dicha caracterstica, de forma que el error de estimacion es menor o igual de
con una probabilidad de que esto ocurra al menos de
, debemos seguir un proceso totalmente analogo al

ejemplo anterior.
Si se considera las v.a.
i
denidas por:
i
=
_
1 si la persona i cumple la caracterstica,
0 si la persona i no cumple la caracterstica,
estas variables tienen una distribucion
i
B(1, p), con lo que E[
i
] = p y V ar[
i
] = p(1 p).
As, considerando que
n
representa la proporcion de exitos en la muestra, es decir, p, puesto que
n
=

1
+
2
+. . . +
n
n
=
n umero de exitos en la muestra
n umero de individuos en la muestra
= p,
se tiene que
n
p N
_
p,
p(1 p)
n
_
,
suponiendo que n 30 y aplicando TCL.
As pues,
P(| p p| ) = P
_
|
pp
p(1p)/
n
|

p(1p)/
n
_
n 30
= P
_
|N(0, 1)|

p(1p)
_
= P
_
N(0, 1)

p(1p)
_
P
_
N(0, 1) <

p(1p)
_
= 2F
N(0,1)
_

p(1p)
_
1.
Esta cantidad es mayor o igual que
, como buscabamos, si y solo si
p(1 p)
F
1
N(0,1)
_
+ 1
2
_
n
_
F
1
N(0,1)
_
+ 1
2
_
p(1 p)
_
2
.
Sin embargo en este caso surge un problema respecto al ejemplo anterior. Mientras que antes todos los elementos
en la inecuacion anterior eran conocidos salvo n, aqu aparece el valor p(1 p) que es desconocido (de hecho
p es el valor poblacional que queremos aproximar mediante el valor muestral p). Para solventar este problema,
nos jamos en la funcion g(x) = x(1 x) cuya representacion graca puede verse en la Figura 6.6.
Figura 6.6: Funcion g(p) = p(1 p).
As pues,
g(p) = p(1 p) g
_
1
2
_
=
1
2
_
1
1
2
_
=
1
4
,
con lo cual
_
F
1
N(0,1)
_
+ 1
2
_
p(1 p)
_
2
_
F
1
N(0,1)
_
+ 1
2
_
1/4
_
2
=
_
F
1
N(0,1)
_
+ 1
2
_
1
2
_
2
y por tanto es suciente con considerar el primer entero mayor que
_
F
1
N(0,1)
_
+1
2
_
1
2
_
2
y que 30, para obtener
un tama no muestral suciente para estimar p con las garantas requeridas.
En general, al estimar p, el mnimo tama no muestral n necesario para que el error de estimacion sea
menor o igual que con una probabilidad mayor o igual que
es el primer entero mayor o igual que:

max
_
30,
_
F
1
N(0,1)
_
+ 1
2
_
1
2
_
2
_
.
Para realizar esto con el Excel, si por ejemplo queremos resolver el apartado a) del Ejercicio 8.14 (pag. 285),
nos situamos en la hoja Probabilidad del archivo que tenemos abierto. Pueden verse en las casillas B2 y C2
el error de estimacion y la probabilidad, respectivamente.
En D2 tecleamos
=(DISTR.NORM.ESTAND.INV((C2+1)/2)*0,5/B2)
2
Para aproximar este valor al entero inmediatamente superior, en la celda E2 tecleamos lo mismo que en el
ejemplo anterior
=SI(ENTERO(D2)=D2;D2;ENTERO(D2)+1)
y para obtener el tama no muestral, calculamos el maximo entre el valor que acabamos de obtener y 30; as, en
la casilla F2 debemos teclear
=MAX(E2;30)
En este caso, el tama no muestral necesario es 9604.
APUNTES DE TEOR
IA.
Solo en Dios creo, todos los demas traigan datos.
7.1. Introduccion.
Hay ocasiones, en las investigaciones experimentales en ingeniera, en las que para caracterizar el fenomeno
de interes se necesitara de un conjunto de datos cuya obtencion es o bien fsicamente imposible o requerira
un gasto excesivo en dinero o tiempo. En tales situaciones se muestrea el conjunto de datos y se utiliza la
informacion de la muestra para inferir la naturaleza del conjunto.
Ejemplo 7.1.1 Supongamos que el fenomeno de interes es el tiempo de espera para que un trabajo de proce-
samiento de datos termine su ejecucion. Para estudiar la naturaleza general de este proceso muestreamos, es
decir, procesamos el trabajo varias veces, anotamos el tiempo de espera de cada una de ellas y luego utilizamos
esta muestra de n tiempos de espera para inferir la naturaleza del proceso general.
La rama de la estadstica que se encarga de obtener conclusiones sobre la poblacion a partir de los resultados
de la muestra es la inferencia estadstica. Al proceso de extrapolar los resultados de una muestra a toda la
poblacion se le llama inferencia inductiva. Es practicamente imposible que esta extrapolacion sea exacta, por
lo que admitiremos un determinado error, haciendo inferencias con un cierto grado de inseguridad. La medida
de esta inseguridad vendra dada aplicando el Calculo de Probabilidades (Temas 2 a 6).
Como habamos visto en el Tema 1, apartado 1.2.2 (pag. 19), entenderemos por poblacion el conjunto de ele-
mentos -que llamaremos individuos- con caractersticas comunes sobre el que se realiza el experimento aleatorio.
Puesto que no siempre es posible investigar a todos los elementos de la poblacion, en ocasiones se estudia un
subconjunto de la poblacion que se denomina muestra.
Ya que de un individuo en particular no nos interesa mas que el valor que toma en el la variable aleatoria que
asociamos a la caracterstica en estudio (no nos interesa el individuo, sino su peso, resistencia o cualquier otra
caracterstica que estemos interesados en estudiar), en lugar de trabajar con los individuos directamente (
i
),
trabajaremos con su valor para una determinada v.a. ((
i
) = x
i
).
Poblacin
Muestra
R
x
1
w
1
x
As pues, podemos entender por poblacion a la v.a. que asociamos a la caracterstica que queremos estudiar.
La distribucion de esta variable aleatoria sera lo que se conoce como distribucion poblacional. Por lo tanto,
los parametros poblacionales seran los parametros (p.e. , p, a, n, , . . .) que intervienen en la distribucion de
dicha variable aleatoria.
7.2. Muestro aleatorio simple.
La forma de seleccionar una muestra de la poblacion tiene una importancia vital en la signicacion del resultado
nal de las inferencias realizadas para la poblacion a partir de la muestra.
Ejemplo 7.2.1 Supongamos que se eligen diez alumnos de la Universidad de Oviedo y resultan ser todos
ellos estudian ingeniera industrial. Se puede llegar a la conclusion de que la muchos estudiantes de Uniovi son
futuros ingenieros industriales? Depende de como se haya obtenido la muestra. Si se han elegido diez estudiantes
totalmente al azar dentro de los matriculados este curso en la Universidad de Oviedo y hemos obtenido este
resultado, evidentemente esto implicara que la proporcion de este grupo (estudiantes de ingeniera industrial)
es muy numeroso. Ahora bien, si la encuesta se ha hecho en la puerta del Aulario Sur, evidentemente este
resultado no implicara nada.
As pues, la muestra ha de ser representativa de la poblacion, sin presentar sesgos o tendencias. Para ello lo
mejor es que los individuos de la muestra se elijan al azar.
Denicion 7.2.1 Si se seleccionan n elementos de una poblacion de forma que todas las posibles muestras
tienen la misma probabilidad de ser elegidas, se dice que los n elementos constituyen una muestra aleatoria
simple (m.a.s.).
Formalmente, si consideramos una v.a. y una muestra de n elementos de la poblacion obtenidos de forma
independiente, de manera que
i
representa el valor de la v.a. en la i-esima observacion, se dice que la coleccion
1
,
2
, . . . ,
n
es una muestra aleatoria simple de tama no n de si las n variables son independientes y tienen la
misma distribucion (iid) que .
Se puede ver (
1
,
2
, . . . ,
n
) como una v.a. n-dimensional y puesto que sus componentes son variables aleatorias
independientes y con la misma distribucion que , su funcion de distribucion conjunta es:
F
(
1
,
2
,...,
n
)
(x
1
, x
2
, . . . , x
n
)
indep.
=
n
i=1
F
i
(x
i
)
i.d. que
=
n
i=1
F
(x
i
).
7.3. Estadsticos y distribuciones en el muestreo para poblaciones
normales.
En la practica los tama nos de la muestra son, en ocasiones, muy elevados y una simple observacion de la
misma no conduce a obtener ninguna conclusion. Para solucionar este problema, se resumira la informacion
de la muestra en un unico valor, que puede considerarse el valor de interes, mediante lo que se conoce como
estadsticos.
Denicion 7.3.1 Un estadstico es cualquier transformacion real de la m.a.s. que no depende de parametros
desconocidos, es decir, cualquier funcion T(
1
,
2
, . . . ,
n
), siendo T : IR
n
IR:
(
1
,
2
,...,
n
)
IR
n
T
IR
(
1
(),
2
(), . . . ,
n
()) T(x
1
, x
2
, . . . , x
n
) = t
Ejemplo 7.3.1 Si es la v.a. que describe el fenomeno de interes y
1
,
2
, . . . ,
n
es una m.a.s. de tama no n de
, las siguientes expresiones son estadsticos:
Suma: T(
1
,
2
, . . . ,
n
) =
n
i=1
i
Media muestral: T(
1
,
2
, . . . ,
n
) =
n
=
1
n
n
i=1
i
Varianza muestral: T(
1
,
2
, . . . ,
n
) = S
2
=
1
n
n
i=1
(
i
n
)
2
Maximo: T(
1
,
2
, . . . ,
n
) = max{
1
,
2
, . . . ,
n
}
Mnimo: T(
1
,
2
, . . . ,
n
) = mn{
1
,
2
, . . . ,
n
}
Recorrido: T(
1
,
2
, . . . ,
n
) = max{
1
,
2
, . . . ,
n
} mn{
1
,
2
, . . . ,
n
}
En general, la distribucion de un estadstico se puede calcular teniendo en cuenta que es una transformacion de
una v.a. n-dimensional. As, si representamos por T el estadstico,
F
T
(t) = P{T(
1
,
2
, . . . ,
n
) t} = P{T(
1
,
2
, . . . ,
n
) (, t]}) = P{(
1
,
2
, . . . ,
n
) T
1
(, t])} =
_
. . . . . .
{(x
1
,x
2
,...,x
n
)/T(x
1
,x
2
,...,x
n
)t}
P{
1
= x
1
,
2
= x
2
. . . ,
n
= x
n
} si es discreta,

. . .
T
1
((,t])
f
(
1
,
2
,...,
n
)
(x
1
, x
2
, . . . , x
n
)dx
1
dx
2
. . . dx
n
si es continua.
En algunos casos particulares, como por ejemplo si consideramos que T = T(
1
,
2
, . . . ,
n
) =
n
i=1
i
, entonces
se puede obtener la distribucion de T a partir de su funcion generatriz de momentos, puesto que, aplicando las
propiedades de esta, se tiene que:
g
T
(t) = g n
i=1
i
(t)
indep.
=
n
i=1
g
i
(t)
i.d.
=
n
i=1
g
(t) = [g
(t)]
n
.
Si consideramos una transformacion de la suma h
_
n
i=1
i
_
podemos apoyarnos en el resultado anterior para
conocer su distribucion, sin mas que aplicar los resultados vistos en el Apartado 3.4 del Tema 3 (pag. 118). Si
el estadstico es
n
= h
_
n
i=1
i
_
con h(x) =
1
n
x, entonces, teniendo en cuenta que g
a
(t) = g
(at), se tiene que

g
n
(t) = [g
(
1
n
t)]
n
.
Ahora bien, si tomamos muestras de una poblacion con distribucion desconocida, es imposible obtener la distri-
bucion de la suma o de la media muestral aplicando los metodos anteriores. No obstante, si el tama no muestral es
sucientemente grande, podemos aplicar el Teorema Central del Lmite estudiado en el tema anterior. As pues,
tanto la distribucion de la suma como de la media muestral son aproximadamente normales si n 30:
T = T(
1
,
2
, . . . ,
n
) =
n
i=1
i
N(n,
n)
T = T(
1
,
2
, . . . ,
n
) =
1
n
n
i=1
i
N
_
,

n
_
donde y representan la media y la desviacion tpica poblacionales, respectivamente, es decir, = E[],
2
=
V ar[].
Cuando los metodos anteriores fallan, siempre queda el conocido Metodo de Montecarlo o Metodo de
muestreo articial. Este metodo se basa en simular muestras aleatorias de la variable en estudio a partir
de las cuales obtendremos valores de la variable T = T(
1
,
2
, . . . ,
n
), puesto que a partir de cada muestra
(x
1
, x
2
, . . . , x
n
) obtenemos un valor de T: t = T(x
1
, x
2
, . . . , x
n
).
(x
11
, x
12
, . . . , x
1n
) t
1
= T(x
11
, x
12
, . . . , x
1n
) t
1
(x
21
, x
22
, . . . , x
2n
) t
2
= T(x
21
, x
22
, . . . , x
2n
) t
2
.
.
.
.
.
.
.
.
.
(x
m1
, x
m2
, . . . , x
mn
) t
m
= T(x
m1
, x
m2
, . . . , x
mn
) t
m
_
_
(t
1
, t
2
, . . . , t
m
) m.a.s. de T
Ahora bien, como simulamos el comportamiento de ?, es decir, como obtenemos (x
1
, x
2
, . . . , x
n
)? Vamos a
considerar dos casos:
es continua.
Si la v.a. sigue una distribucion uniforme U(0, 1), entonces existen unas tablas de valores aleatorios de
dicha distribucion. Ademas, hoy en da casi cualquier calculadora permite obtener dichos valores.
Ejemplo 7.3.2 Si T = mn{
1
,
2
,
3
}, a partir de valores simulados de la uniforme U(0, 1) podemos
generar una muestra de T como sigue:
(0
5919, 0
6174, 0
4341) t
1
= T(0
5919, 0
6174, 0
4341) 0
4341
(0
8108, 0
3917, 0
4551) t
2
= T(0
8108, 0
3917, 0
4551) 0
3917
.
.
.
.
.
.
.
.
.
_
_
con lo cual obtendramos una m.a.s. de T que sera (0
4341, 0
3917, . . .) y podra ser representada para

obtener informacion sobre la distribucion de T.
La repeticion de este proceso nos llevara a obtener una muestra aleatoria simple de T cuya representacion
graca, en forma de histograma de frecuencias, podra ser de la forma:
0
0,1
0,2
0,3
0,4
0,5
0,6
0.1 0.3 0.5 0.7 0.9
Valores de T
F
r
e
c
u
e
n
c
i
a
En el caso de la distribucion uniforme U(0, 1), existen estas tablas de valores aleatorios, pero es evidente
que no puede hacerse una tabla para cada una de las distribuciones continuas. En este caso se resuelve
este problema aplicando el siguiente teorema.
Teorema 7.3.1 Si es una v.a. continua con funcion de distribucion F, entonces la variable aleatoria
obtenida mediante la siguiente transformacion de :
= F()
sigue una distribucion uniforme U(0, 1).
Demostracion.
Vamos a calcular la distribucion de y ver que coincide con la de una uniforme U(0, 1). Puesto que es
una transformacion de :
IR IR
() = x y = F(x) = P( x)
entonces su funcion de distribucion es:
F
(y) = P( y) = P(F() y) =
_
_
_
0 si y < 0
P( F
1
(y)) = F(F
1
(y)) = y si 0 y 1
1 si y > 1
y por tanto la funcion de densidad de es:
f
(y) =
d
dy
F
(y) =
_
d
dy
y = 1 si 0 y 1
0 en el resto
con lo cual sigue una distribucion U(0, 1).
Dado que existen procedimientos para obtener valores de la distribucion U(0, 1) y para cualquier v.a.
continua se tiene que = F() U(0, 1), entonces se pueden obtener valores de la v.a. sin mas que
calcular la inversa de F de los valores de la uniforme, ya que = F
1
(). As, el proceso para obtener la
muestra de valores de T sera:
(y
11
, . . . , y
1n
) (F
1
(y
11
), . . . , F
1
(y
1n
)) = (x
11
, . . . , x
1n
) t
1
= T(x
11
, . . . , x
1n
) t
1
(y
21
, . . . , y
2n
) (F
1
(y
21
), . . . , F
1
(y
2n
)) = (x
21
, . . . , x
2n
) t
2
= T(x
21
, . . . , x
2n
) t
2
.
.
.
.
.
.
.
.
.
.
.
.
(y
m1
, . . . , y
mn
) (F
1
(y
m1
), . . . , F
1
(y
mn
)) = (x
m1
, . . . , x
mn
) t
m
= T(x
m1
, . . . , x
mn
) t
m
siendo (t
1
, t
2
, . . . , t
m
) la m.a.s. de T.
Ejemplo 7.3.3 Si exp(1/2), entonces su funcion de distribucion es
F(x) =
_
1 e
x/2
si x > 0
0 si x 0
con lo cual, seg un el teorema anterior, = 1 e
/2
sigue una distribucion U(0, 1). As pues, si y es un
valor de la uniforme U(0, 1), entonces x =
ln(1y)
1/2
es un valor de la v.a. . Con lo cual, si consideramos
el estadstico T = T(
1
,
2
,
3
) = max{
1
,
2
,
3
}, entonces el procedimiento para simular valores de este
estadstico sera:
Valores de Valores de Valores de T
(0
5919, 0
6174, 0
4341) (1
7925, 1
9215, 1
1387) 1
9215
(0
8108, 0
3917, 0
4551) (3
3299, 0
9942, 1
2143) 3
3299
.
.
.
.
.
.
.
.
.
es discreta.
El Teorema 7.3.1 (pag. 244) no puede utilizar en el caso en el que sea una v.a. discreta, ya que no se
cumplen las condiciones de su enunciado. En esta situacion, tambien se simulan los valores de la v.a. a
partir de la distribucion U(0, 1), pero mediante un procedimiento distinto.
Si es una v.a. discreta que toma los valores x
1
, x
2
, . . . x
n
con probabilidad p
1
, p
2
, . . . , p
n
, respectivamente,
entonces
P( = x
1
) = p
1
, P( = x
2
) = p
2
, . . . , P( = x
n
) = p
n
.
Por otro lado, si consideramos una v.a. con distribucion U(0, 1), entonces
P( [0, p
1
]) = p
1
, P( (p
1
, p
1
+p
2
]) = p
2
, . . . , P
_

_
n1
i=1
p
i
, 1
__
= p
n
.
Teniendo en cuenta esto, vemos por ejemplo que el valor x
1
de tiene la misma probabilidad de ocurrir
que el intervalo de valores [0, p
1
] de y por tanto a partir de un valor simulado y de la v.a. , diremos
que ha ocurrido el siguiente valor de la :
_
_
x
1
si y p
1
x
2
si p
1
< y p
1
+p
2
. . . . . .
x
n
si
n1
i=1
p
i
< y 1
Una vez simulados los valores de , podemos utilizar estos, de la misma forma que en el caso continuo,
para generar valores del estadstico T y con ellos obtener informacion sobre su distribucion.
Muestreo en poblaciones normales.
Vamos a estudiar ciertas distribuciones de tipo continuo relacionadas con la distribucion normal y que seran
muy utilizadas en la Inferencia estadstica, especialmente en aquellos temas relacionados con el muestreo en
poblaciones con distribucion normal.
Distribucion chi-cuadrado.
Proposicion 7.3.1 Si N(0, 1), entonces =
2
_
1
2
,
1
2
_
.
Demostracion.
Si y < 0, la funcion de distribucion de vale cero, puesto que es una v.a. positiva.
Si y 0, entonces
F
(y) = P( y) = P(
2
y) = P(
y)
cont.
= F
y) F
y)
N(0, 1)
=
F
y) (1 F
y)) = 2F
y) 1,
donde F
es la funcion de distribucion de .
Derivando, la funcion de densidad de sera
f
(y) =
d
dy
F
(y) =
d
dy
[2F
y) 1] = 2f
y)
1
2
y
=
1
2
e
1
2
(
y)
2
y
,
puesto que f
(x) =
1
2
e
1
2
x
2
, x IR.
Por lo tanto,
f
(y) =
_
(1/2)
1/2
(1/2)
y
1/2
e
1
2
y
si y 0
0 si y < 0
teniendo en cuenta que, como recordamos en el Tema 4, (1/2) =
.
Ahora bien, puesto que la funcion de densidad de una v.a. con distribucion (p, a) es
f
(p,a)
(y) =
_
a
p
(p)
y
p1
e
ay
si y 0
0 si y < 0
acabamos de demostrar que =
2
(
1
2
,
1
2
).
Denicion 7.3.2 Se dice que una v.a. sigue una distribucion chi-cuadrado con un grado de libertad, lo que
representaremos por
2
1
, si su distribucion es (
1
2
,
1
2
).
En general, de una v.a. con distribucion (
n
2
,
1
2
), se dice que sigue una distribucion chi-cuadrado con n
grados de libertad, y lo representamos por
2
n
.
Una propiedad importante que verica la distribucion chi-cuadrado es la reproductividad, es decir, la suma
de variables aleatorias independientes chi-cuadrado es una v.a. chi-cuadrado. El siguiente teorema expresa de
forma mas precisa esta propiedad.
Teorema 7.3.2 Si
1
,
2
, . . . ,
n
son variables aleatorias independientes tal que
i

2
n
i
, i = 1, 2, . . . , n, en-
tonces =
n
i=1
i
es una v.a. chi-cuadrado con
n
i=1
n
i
grados de libertad, es decir,
n
i=1
i

2
n
i=1
n
i
.
Demostracion.
Puesto que cada
i

_
n
i
2
,
1
2
_
, las variables son independientes y la distribucion gamma es reproductiva
respecto a su primer parametro, tenemos que
n
i=1
i

_
_
_
n
i=1
n
i
2
,
1
2
_
_
_
2
n
i=1
n
i
.
Corolario 7.3.1 Si
1
,
2
, . . . ,
n
son n v.a. i.i.d. N(0, 1), entonces,
n
i=1
2
i

2
n
.
Los valores de la funcion de distribucion (probabilidad de ser menor o igual que) de una v.a.
2
n
estan tabulados
(consultar tabla de la pagina 11).
c
a
2
1-a
Figura 7.1: Valores tabulados de la distribucion chi-cuadrado.
Ejemplo 7.3.4 a) Si
2
15
, entonces, seg un la tabla de la pagina 11,
P( 25
0) = 0
95.
Por otro lado, el primer cuartil, es decir, el valor x tal que P( x) = 0
25 es 11
0.
b) Si
2
200
, entonces el primer cuartil x es
1
2
_
z +
2 200 1
_
2
, donde z es tal que P(N(0, 1) z) = 0
25.
As pues, z = 0
6745 y por lo tanto x =

1
2
_
0
6745 +
2 200 1
_
2
= 186
254.
Distribucion t-Student.
Denicion 7.3.3 Sean N(0, 1) y
2
n
v.a. independientes. De la v.a. , denida como sigue,
=

/n
se dice que sigue una distribucion t de Student con n grados de libertad, y lo representamos por t
n
.
La distribucion t-Student se publico por primera vez en 1908 en un trabajo de W.S. Gosset. En esa epoca, Gosset
trabajaba en una cervecera irlandesa cuyo due no desaprobaba la publicacion de trabajos de investigacion por
parte de sus empleados, por lo que Gosset rmo su trabajo con el seudonimo de Student, nombre que tomo esta
distribucion.
Teorema 7.3.3 Si sigue una distribucion t
n
, entonces su funcion de densidad es
f
(t) =
1
(
n
2
,
1
2
)
_
1 +
t
2
n
_
n+1
2
,
donde (
n
2
,
1
2
) =
(
n
2
)(
1
2
)
(
n+1
2
)
.
Demostracion.
La demostracion se reducira a hacer el cambio de variable = g(, ) con g(x, y) =
x
y/n
, N(0, 1),
2
n
y , v.a. independientes.
Los valores de la funcion de distribucion de una v.a. t-Student tambien se encuentran tabulados (consultar tabla
pagina 12).
0
1-a
a
t
Figura 7.2: Valores tabulados de la distribucion t-Student.
Ejemplo 7.3.5 Si t
14
, entonces P( 2
14) = 0
975, con lo cual P( > 2
14) = 0
025 y P(|| > 2
14) =
0
05.
Por otro lado, el cuartil tercero, es decir, el valor x tal que P( x) = 0
75 es 0
692 y el cuartil primero es

0
692, puesto que

P( x) = 0
25 P( x) = P( x) = 0
75 x = 0
692.
Distribucion F de Snedecor.
Denicion 7.3.4 Sean
2
n
y
2
m
v.a. independientes. De la v.a. , denida como sigue,
=
/n
/m
se dice que sigue una distribucion F de Snedecor con n, m grados de libertad, y lo representamos por
F
n
m
.
Teorema 7.3.4 Si sigue una distribucion F
n
m
, entonces su funcion de densidad es
f
(t) =
_
n
n/2
m
m/2
(
n
2
,
m
2
)
t
n/2
1
(nt+m)
(n+m)/2
si t > 0,
0 si t 0.
Demostracion.
La demostracion se reducira a hacer el cambio de variable = g(, ) con g(x, y) =
x/n
y/n
,
2
n
,
2
m
y ,
v.a. independientes.
a
1-a
f
Figura 7.3: Valores tabulados de la distribucion F de Snedecor.
Los valores de la funcion de distribucion de una v.a. F
n
m
tambien se encuentran tabulados (consultar tablas de
las paginas 13 y 14).
Ejemplo 7.3.6 Si F
3
10
, entonces P( 6
55) = 0
99 y el cuantil 090, es decir, el valor x tal que P(

x) = 0
90 es 2
73.
Una propiedad muy importante de la distribucion F de Snedecor y muy util a la hora de obtener probabilidades
directamente con la tabla, puede verse en la siguiente proposicion.
Proposicion 7.3.2 Si F
n
m
, entonces
1
F
m
n
.
Demostracion.
La demostracion es trivial sin mas que tener en cuenta la denicion de distribucion F, puesto que como se
puede escribir como
/n
/m
, entonces
1
=
/m
/n
,
siendo
2
n
,
2
m
,y , v.a. independientes.
7.4. Teorema de Fisher y sus consecuencias.
Las distribuciones muestrales de estadsticos importantes nos permitiran obtener informacion sobre los parame-
tros poblacionales de interes. Dos de los estadsticos mas importantes son la media y la varianza poblacionales.
El siguiente teorema nos proporciona su distribucion en el caso de poblaciones normales.
Teorema 7.4.1 (de Fisher)
Sea
1
,
2
, . . . ,
n
una m.a.s. de tama no n procedente de una poblacion con distribucion N(, ). Se tiene que:
1.

n
n
N(0, 1);
2.
nS
2
2

2
n1
;
3.
n
y S
2
son independientes.
Algunas veces el teorema anterior se enuncia utilizando la cuasivarianza muestral (
S
2
=
1
n1
n
i=1
(
i

n
)
2
) en
lugar de la varianza muestral (S
2
=
1
n
n
i=1
(
i
n
)
2
). La formulacion puede verse en el siguiente corolario.
Corolario 7.4.1 Sea
1
,
2
, . . . ,
n
una m.a.s. de tama no n procedente de una poblacion con distribucion
N(, ). Se tiene que:
1.

n
n
N(0, 1);
2.
(n1)
S
2
2

2
n1
;
3.
n
y

S
2
son independientes.
Demostracion.
1. Trivial, pues coincide con el punto i) el teorema.
2. Puesto que, por denicion, nS
2
= (n 1)
S
2
, la demostracion de este punto tambien es inmediata.
3. Si
n
y S
2
son independientes, entonces, por el Teorema 5.4.1 (pag. 182),
n
y

S
2
tambien, puesto que
S
2
=
n
n2
S
2
.
Consecuencias del Teorema de Fisher.
Corolario 7.4.2 Si
1
,
2
, . . . ,
n
es una m.a.s. de tama no n procedente de una poblacion con distribucion
N(, ), entonces
S/
n
t
n1
.
Demostracion.
Si representamos por =

n
n
y por =
(n1)
S
2
2
, seg un el Teorema 7.4.1 (pag. 249) tenemos que N(0, 1),

2
n1
y son variables independientes. As pues,
S/
n
=
(n1)
S
2
2
n1
=

n1
t
n1
,
seg un la Denicion 7.3.3 (pag. 247).
Corolario 7.4.3 Si
1
,
2
, . . . ,
n
N(
1
,
1
),
1
,
2
, . . . ,
m
es otra m.a.s. de tama no m, independiente de la anterior y procedente de una poblacion
con distribucion N(
2
,
2
), entonces
(
n
m
) (
1
2
)
2
1
n
+

2
2
m
N(0, 1).
Demostracion.
Aplicando el Teorema de Fisher (Teorema 7.4.1 (pag. 249)) tenemos que
n
N
_
1
,

1
n
_
,
m
N
_
2
,

2
m
_
.
Puesto que las muestras eran independientes, entonces tambien lo son
n
y
m
y, aplicando las propiedades de
la distribucion normal (reproductividad y multiplicacion por una constante), se tiene que:
m
N
_
2
,
2
1
n
+

2
2
m
_
,
puesto que
V ar
_
= V ar
_
n
+ (1)
m
indep.
= V ar[
n
] +V ar[(1)
m
] = V ar[
n
] + (1)
2
V ar[
m
] =

2
1
n
+

2
2
m
.
Tipicando, obtenemos por tanto que:
(
n
m
) (
1
2
)
2
1
n
+

2
2
m
N (0, 1) .
Corolario 7.4.4 Si
1
,
2
, . . . ,
n
N(
1
, ),
1
,
2
, . . . ,
m
es otra m.a.s. de tama no m independiente de la anterior y procedente de una poblacion
con distribucion N(
2
, ), entonces
(
n
m
) (
1
2
)
nS
2
1
+mS
2
2
nm(n+m2)
(n +m)
t
n+m2
,
donde S
2
1
representa la varianza muestral de y S
2
2
la de .
Demostracion.
Seg un el Corolario 7.4.3 (pag. 250),
(
n
m
) (
1
2
)
2
n
+

2
m
N(0, 1).
Por otro lado, aplicando el Teorema de Fisher (Teorema 7.4.1 (pag. 249)) tanto a como a , tenemos que
nS
2
1
2

2
n1
,
mS
2
2
2

2
m1
,
y ademas estas variables son independientes por estar trabajando con muestras independientes. As pues, por
la reproductividad de la distribucion chi-cuadrado (Teorema 7.3.2 (pag. 246)) se tiene que
nS
2
1
+mS
2
2
2

2
n+m2
.
Aplicando la denicion de la distribucion t-Student (Denicion 7.3.3 (pag. 247)) se tiene que:
(
n
m
) (
1
2
)
nS
2
1
+mS
2
2
nm(n+m2)
(n +m)
=
(
n
m
)(
1
2
)
2
n
+
2
m
nS
2
1
+mS
2
2
2
(n+m2)
t
n+m2
.
Corolario 7.4.5 Si
1
,
2
, . . . ,
n
N(
1
, ),
1
,
2
, . . . ,
m
es otra m.a.s. de tama no m, independiente de la anterior y procedente de una poblacion
con distribucion N(
2
, ), entonces
S
2
1
/
S
2
2
2
1
/
2
2
F
n1
m1
,
donde

S
2
1
representa la cuasivarianza muestral de y

S
2
2
la de .
Demostracion.
Aplicando de nuevo el Teorema de Fisher (en este caso con la formulacion dada en el Corolario 7.4.1 (pag. 250))
se tiene qu
(n 1)
S
2
1
2
1
2
n1
,
(m1)
S
2
2
2
2
2
m1
,
y ademas estas variables son independientes por estar trabajando con muestras independientes. As pues, apli-
cando la denicion de la distribucion F de Snedecor (Denicion 7.3.4 (pag. 248)) se tiene que:
S
2
1
/
S
2
2
2
1
/
2
2
=
(n1)
S
2
1
2
1
/(n 1)
(m1)
S
2
2
2
2
/(m1)
F
n1
m1
.
Esquema sobre distribuciones Tema 7, 253
ESQUEMA SOBRE DISTRIBUCIONES.
ALGUNAS RELACIONES ENTRE DISTRIBUCIONES
aN(, ) +b = N(a +b, |a|) =
N(,)
= N(0, 1)
(N(0, 1))
2
=
2
1
N(
1
,
1
) +N(
2
,
2
) = N(
1
+
2
,
2
1
+
2
2
) si la N(
1
,
1
) y la N(
2
,
2
) son independientes
exp() = (1, )
2
n
= (
n
2
,
1
2
)
k(p, a) = (p,
a
k
)
(p
1
, a) +(p
2
, a) = (p
1
+p
2
, a) si la (p
1
, a) y la (p
2
, a) son independientes
2
n
1
+
2
n
2
=
2
n
1
+n
2
si la
2
n
1
y la
2
n
2
son independientes
N(0,1)
2
n
/n
= t
n
si la N(0, 1) y la
2
n
son independientes
2
n
/n
2
m
/m
= F
n
m
si la
2
n
y la
2
m
son independientes
Ejercicio 7.1 A continuacion tienes varios ejemplos de obtencion de valores o de probabilidades similares a los
que salen habitualmente en los ejercicios. Resuelvelos AHORA con tu calculadora o con tus tablas (consejo.-
usa la herramienta que vayas a utilizar en el examen) y comprueba los resultados.
DATO SOLUCI
ON
P(N(0, 1) 2) 0
9773
P(N(0, 1) 1) 0
1587
P(N(4, 3) 5) 0
6306
P(N(4, 3) 2) 0
7475
P(
2
4
1
92) 0
2495
P(
2
4
5
39) 0
2496
P(t
4
2
13) 0
9499
P(t
4
4
60) 0
0050
P(F
4
3
5
34) 0
8999
P(F
4
3
9
12) 0
0500
P(N(0, 1) b) = 0
95 b = 1
6449
P(N(0, 1) b) = 0
95 b = 1
6449
P(N(3, 2) b) = 0
95 b = 6
2897
P(N(3, 2) b) = 0
95 b = 0
2897
P(
2
3
b) = 0
95 b = 7
8147
P(
2
3
b) = 0
95 b = 0
3518
P(t
3
b) = 0
95 b = 2
3534
P(t
3
b) = 0
95 b = 2
3534
P(F
3
2
b) = 0
95 b = 19
1643
P(F
3
2
b) = 0
95 b = 0
1047
PREGUNTAS DE TEST.
Examenes.
1. (09-09-03) Sea (
1
, . . . ,
n
) una m.a.s. de una poblacion N(, ). El estadstico
n
i=1
_
_
2
sigue una
distribucion:
a) N(0, 1); b) N(0, 1/
n); c)
2
n1
; d)
2
n
; e) Todo falso.
2. (09-09-03) Sea (
1
, . . . ,
n
n
i=1
_
_2
sigue una
distribucion:
a) N(0, 1); b) N(0, 1/
n); c)
2
n1
; d)
2
n
; e) Todo falso.
3. (17-02-04) Al muestrear una poblacion N(0, ), el estadstico
n1
S
n
a)
2
n1
; b) t
n1
; c) N(0, 1); d) t
n
; e) Todo falso.
4. (21-06-04) Sean y dos variables aleatorias independientes con distribuciones N(0, 1) y
2
n
, respectiva-
mente. Entonces la v.a. =

/n
a) F de Snedecor; b) t de Student; c) Normal; d) Chi-cuadrado; e) Todo falso.
5. (21-06-04) Sean y dos variables aleatorias independientes con distribuciones
2
n
y
2
m
, respectivamente.
Entonces la v.a. =
m
n
2
n
, respectiva-
mente. Entonces la v.a. = n
2
/ sigue una distribucion:
a) F
1
n
; b) t
n
; c)
2
n
; d) F
n
1
; e) Todo falso.
7. (06-07-05) Sean y dos variables independientes con distribuciones
2
n
y
2
m
, respectivamente. Entonces
la v.a. =
m
n
8. (07-09-05) Dada una muestra aleatoria simple, el teorema de Fisher asegura que:
a) La media muestral y la varianza muestral de una poblacion normal son independientes;
b) La media muestral y la varianza muestral de una poblacion no normal son independientes;
c) La media muestral y la cuasivarianza muestral de una poblacion normal son independientes;
d) La media muestral y la cuasivarianza muestral de una poblacion no normal son independientes;
e) Todo falso.
9. (30-06-06) Si denotamos por F
n
m
una v.a. con ditribucion F de Snedecor con n grados de libertad en el
numerador y m en el denominador y P(F
n
m
> x) = , para cualquier [0, 1] se tiene que:
a) P(F
m
n
> 1/x) = ;
d) P(F
m
n
< 1/x) = 1 ;
b) P(F
m
n
< 1/x) = ;
e) Todo falso.
c) P(F
m
n
> 1/x) = 1 ;
10. (07-09-06) Sea
1
,
2
, . . . ,
n
una m.a.s. de una poblacion N(0, ). Entonces
n
i=1
_
_
2
sigue una distri-
bucion:
a) t
n1
; b) F
n1
m1
; c)
2
n
; d) N(0, 1); e) Todo falso.
11. (07-09-06) Al muestrear una poblacion N(0, ), el estadstico
n1
S

n
(S
2
es la varianza muestral) es-
tara con probabilidad 0
95 en el intervalo:
a) (-196,196);
d) (-,153) si n = 5;
b) (-,213) si n = 5;
e) (-278,278) si n = 5.
c) (-164,164);
12. (16-02-07) Si se toma una muestra aleatoria simple de n = 25 observaciones de una poblacion normal con
varianza
2
= 10, la probabilidad de que la varianza muestral (S
2
) sea mayor que 17
2, es decir, P(S
2
> 17
2)
a) 075; b) 012; c) 001; d) 099; e) Todo falso.
13. (16-02-07) Si

S
2
1
y

S
2
2
son las cuasivarianzas muestrales de dos muestras aleatorias independientes de
tama nos n = 10 y m = 20, tomadas de poblaciones normales que tienen la misma varianza, la probabilidad
P(
S
2
1
/
S
2
2
2
42) es aproximadamente igual a:

a) 005; b) 095; c) 099; d) 001; e) Todo falso.
14. (22-06-07) Denotamos por una v.a. con distribucion F
1
m
y por una v.a. con distribucion t
m
. Si
P( < x) = , entonces se tiene siempre que:
a) P(
2
< x) = ;
d) P(
x < <
x) = ;
b) P( < 1/x) = ;
e) Todo falso.
c) P( < x) =
2
;
2
9
, respecti-
vamente, entonces la variable aleatoria =
3

a) F
1
9
; b) F
9
1
; c) t
3
; d) t
9
; e) Todo falso.
2
9
, respecti-
vamente, entonces la variable aleatoria =
9
2

a) F
1
9
; b) F
9
1
; c) t
3
; d) t
9
; e) Todo falso.
17. (26-06-08) Sea (
1
,
2
, . . . ,
9
) una m.a.s. de tama no 9 de una poblacion N(0, 1). Si y S
2
representan la
media y la varianza muestrales, respectivamente, se tiene que:
a) 3 N(0, 1);
b) 9
2
2
1
;
c) 9S
2
2
8
;
d)
8
2
S
2
F
1
8
;
e) Todo falso.
18. (05-09-08) Sea (
1
,
2
, . . . ,
9
) una m.a.s. de una poblacion N(, 1). Entonces
n
i=1
(
i
)
2
sigue una
distribucion:
a) t
n1
; b) N(0, 1); c)
2
n
; d) F
n1
n1
; e) Todo falso.
19. (02-07-09) La probabilidad de que la cuasivarianza muestral obtenida a partir de una m.a.s. de tama no
25 de un poblacion normal con varianza
2
= 4 sea menor de 4
7, es decir, P(
S
2
< 4
7), es aproximadamente
igual a:
a) 095; b) 005; c) 025; d) 075; e) 05.
20. (02-07-09) Sean y dos v.a. independientes e igualmente distribuidas con distribucion chi-cuadrado
2
n
. La v.a. / sigue una distribucion F de Snedecor con:
a) n grados de libertad en el numerador y n grados de libertad en el denominador. b) 1 grado de libertad.
c) 2 grados de libertad. d) n grados de libertad. e) (n 1) grados de libertad.
21. (16-09-09) Sea una v.a. con distribucion normal N(0, 1) y sera =
2
. Se puede asegurar que:
a)
2
2
; b)
2
1
;
c)

t
2
; d)

t
1
; e) Todo falso.
N
o
Solucion N
o
Solucion N
o
Solucion N
o
Solucion N
o
Solucion
1. d) 2. c) 3. b) 4. b) 5. a)
6. a) 7. a) 8. a), c) 9. b), c) 10. c)
11. b), e) 12. c) 13. b) 14. a), d) 15. d)
16. a) 17. a), b), c), d) 18. c) 19. d) 20. a)
21. b)
PR
El metodo de Montecarlo es una tecnica para simular muestras aleatorias simples de una v.a. continua , de la
que conocemos su funcion de distribucion F
. Dicho metodo se basa en el Teorema 7.3.1 (pag. 244):

Sea una v.a. continua cualquiera con funcion de distribucion derivable, con derivada no nula
(en su soporte), F
. La distribucion de la nueva v.a. = F
() es una uniforme U(0, 1).

Aplicando este resultado se tiene que el modo de elegir aleatoriamente un valor de una v.a. continua es:
1. Obtener un valor aleatorio en el intervalo (0, 1) que denotaremos por u.
2. Tomar como observacion de , la cantidad x = F
1
(u).
Ejemplo. Si queremos extraer una muestra de tama no n = 10 de una distribucion exponencial exp(1/40),
puesto que
F
(x) =
(t)dt =
_

x
0dt si x 0
0dt +
x
0
1
40
e
1
40
t
dt si x > 0
=
_
0 si x 0
1 e
x/00
si x > 0
sabemos que u = 1 e
x/40
. Si despejamos x obtenemos que
u = 1 e
x/40
e
x/40
= 1 u
x
40
= ln(1 u) x = 40ln(1 u).
Con lo cual, para cada valor aleatorio entre 0 y 1, si le aplicamos la transformacion anterior, obtenemos un valor
aleatorio de una variable con distribucion exponencial exp(1/40). As pues, la muestra de tama no 10 sera, por
ejemplo,
Valores de la U(0, 1) Valores de la exp(1/40)
(u) (40ln(1 u))
0
441 23
26
0
318 15
31
0
671 44
47
0
226 10
25
0
306 14
61
0
883 85
82
0
361 17
91
0
504 28
05
0
656 42
68
0
351 17
29
Aunque este metodo es de gran utilidad y de sencilla aplicacion, para obtener resultados concluyentes suele ser
necesario que el tama no de la muestra sea elevado. La implementacion manual de este metodo solo permite
obtener muestras de tama no reducido, por lo que es necesario la utilizacion del ordenador para realizar una
simulacion signicativa.
Dada la importancia de la simulacion en nuestros das, algunos programas de ordenador tienen ya programadas
las subrutinas correspondientes para generar n umeros aleatorios de las principales distribuciones. Por ejemplo,
Excel, seg un ya hemos comentado en temas anteriores, incorpora la posibilidad de generar valores de algunas
de las distribuciones de probabilidad mas importantes (Uniforme, Normal, Bernoulli, Binomial y Poisson). Para
obtenerlos era necesario ir a la opcion Herramientas Analisis de Datos del men u principal. Una vez
aqu seleccionar Generacion de n umeros aleatorios dentro de Funciones para analisis.
Puesto que no aparecen recogidas todas las distribuciones de interes, es necesario ser capaces de programar la
simulacion directamente.
El comando fundamental de Excel para aplicar el metodo de Montecarlo es
=ALEATORIO()
que genera un n umero aleatorio entre 0 y 1.
Una vez hecho esto, se aplicara la inversa de la funcion de distribucion correspondiente, como en el ejemplo
anterior y se obtendra un valor simulado de la distribucion en estudio. Vamos a verlo mediante un ejemplo.
Ejemplo: Fiabilidad.
El tiempo de duracion de un ensamble mecanico en una prueba acelerada de vibracion
tiene una distribucion exponencial con media de 40 horas, con lo que si denotamos
por la variable aleatoria =duracion del ensamble (en horas), dicha variable tiene
una distribucion exp(1/40).
El objetivo de la produccion es realizar ensambles que resistan lo mas posible. Para
analizar si dicho objetivo es alcanzado, vamos a generar, en la hoja Ensamble del
chero pr07.xls, 200 valores correspondientes a la duracion de 200 ensambles someti-
dos a la prueba de vibracion y veremos cuales son los tiempos habituales de resistencia
a la prueba.
Comenzaremos generando un valor aleatorio de la distribucion exponencial exp(1/40). Seg un hemos visto en el
ejemplo anterior, la funcion de distribucion de una exponencial de parametro 1/40 es:
F
(x) =
_
1 e
x/40
si x > 0
0 si x 0
el valor aleatorio de una exponencial exp(1/40) es x = 40ln(1 u) y =ALEATORIO() genera un valor
aleatorio de la distribucion uniforme U(0, 1). As pues, si nos colocamos en la celda A2 y tecleamos
=-40*LN(1-ALEATORIO())
obtenemos un valor aleatorio de .
Puesto que es necesario repetir el experimento un n umero suciente de veces para poder obtener conclusiones
para nuestro estudio, vamos a repetir este experimento para 200 ensambles. Para ello seleccionamos la celda
A2, nos colocamos con el raton en la esquina inferior derecha de dicha casilla y hacemos doble click. Con esto,
hemos conseguido arrastrar la celda A2 hasta la la 201, con lo que obtenemos 200 simulaciones.
Para ver la simulacion de forma graca, podemos realizar un graco de lneas con las duraciones. Para ello,
seleccionamos toda la columna, pinchando sobre la letra B que la etiqueta. A continuacion, elegimos la opcion
Insertar Graco del men u principal. En Tipo de Graco elegimos Lneas y seleccionamos el ultimo
de los siete modelos de gracos que nos muestra (Lnea. Presenta tendencias a lo largo del tiempo o
entre categoras). SI pinchamos directamente en Finalizar, obtenemos un graco similar al que sigue (no
sera exactamente igual, pues al ser una simulacion, cada uno tendra un graco diferente):
0
50
100
150
200
250
300
1
1
1
2
1
3
1
4
1
5
1
6
1
7
1
8
1
9
1
1
0
1
1
1
1
1
2
1
1
3
1
1
4
1
1
5
1
1
6
1
1
7
1
1
8
1
1
9
1
Duracin ensamble
Duracin ensamble
En este graco podemos observar como la mayora de los ensambles resistieron entre 0 y 150 horas y como
practicamente ninguno duro mas de 250 horas.
Ayuda para la resolucion del ejercicio.
Para resolver correctamente el ejercicio de esta practica es necesario tener en cuenta varias cuestiones:
a) Si exp(), entonces su funcion de densidad es f
(x) =
_
0 si x 0
e
x
si x > 0
, con lo cual su funcion de
distribucion es
F
(x) =
(t)dt =
_

x
0dt si x 0
0dt +
x
0
e
t
dt si x > 0
=
_
0 si x 0
1 e
x
si x > 0
b) La funcion =MIN(B3:D3) de Excel calcula el mnimo de las celdas B3, C3 y D3.
TEMA 8.- ESTIMACI

APUNTES DE TEOR
IA.
Cuando se conoce la forma funcional de la funcion de distribucion que sigue la variable aleatoria objeto de estudio
y solo tenemos que estimar algunos de los parametros que la determinan, estamos en un problema de inferencia
estadstica parametrica; por el contrario cuando no se conoce la forma funcional de la distribucion que sigue
la variable aleatoria objeto de estudio, estamos ante un problema de inferencia estadstica no parametrica.
En este tema nos vamos a limitar a problemas de inferencia estadstica parametrica, donde la variable aleatoria
objeto de estudio, sigue una distribucion conocida salvo algunos parametros que la determinan, y que tendremos
que tratar de estimar. Esta situacion se presenta con frecuencia debido a que a menudo es posible conocer la
forma funcional de la distribucion por consideraciones teoricas, quedando unicamente indeterminados algunos
parametros que concretan la distribucion.
Existen dos caminos para valorar los parametros desconocidos en funcion de la informacion disponible a priori
y de las observaciones proporcionadas por una muestra, que dan lugar a dos procedimientos de estimacion de
parametros:
Estimacion puntual.
Estimacion por intervalos de conanza.
No se trata de dos formas alternativas de estimacion si no complementarias, la estimacion puntual representa
un primer paso para obtener la estimacion por intervalos.
8.1. Estimacion puntual.
Supongamos que queremos estimar una caracterstica de la distribucion de la poblacion, es decir un parametro
de la poblacion que denotaremos por . Por ejemplo podra ser una media, una varianza o el cuartil de orden
tres de una poblacion. El conjunto de posibles valores de un parametro o de un grupo de parametros se denomina
espacio parametrico .
Ejemplo 8.1.1 Si B(1, p), y p es el parametro desconocido. Entonces = {p/0 p 1}.
Ejemplo 8.1.2 Si N(, ), y ambos, y son desconocidos. Entonces = {(, )/< < , 0}.
Un estimador puntual de es una regla que nos dice como utilizar las observaciones de una muestra para
obtener, mediante un solo elemento del espacio parametrico, una estimacion de .
Denicion 8.1.1 Un estimador es una funcion de la m.a.s. T(
1
,
2
, . . . ,
n
) con valores en el espacio para-
metrico. Recordando la denicion dada en el tema anterior, podemos decir que un estimador es un estadstico
con valores en el espacio parametrico.
Para cada realizacion muestral (x
1
, x
2
, . . . , x
n
) de (
1
,
2
, . . . ,
n
), T(x
1
, x
2
, . . . , x
n
) es una estimacion del
parametro.
De la denicion se desprende que podemos conseguir muchos estimadores para un mismo parametro.
Ejemplo 8.1.3 Sea (
1
,
2
, . . . ,
n
) una m.a.s. de una poblacion B(1, p), donde p es el parametro descono-
cido. Entonces, T
1
(
1
,
2
, . . . ,
n
) =
n
=
1
n
i
, T
2
(
1
,
2
, . . . ,
n
) =
1
y T
3
(
1
,
2
, . . . ,
n
) = (
1
+
n
)/2 son
algunos ejemplos de estimadores de p.
T
4
(
1
,
2
, . . . ,
n
) =
i
es un estadstico pero no un estimador de p ya que puede tomar valores mayores que
1, es decir fuera del espacio parametrico.
Un estimador de un parametro poblacional (media, varianza, proporcion poblacional u otros) es una funcion
cuyo dominio es el conjunto de las muestras posibles y su recorrido se encuentra dentro de los posibles valores
que puede tomar el parametro . En otros terminos, un estimador es un procedimiento mediante el cual a cada
muestra m de M se le asigna un n umero que se reconoce como posible valor de .
Dada una muestra m, el n umero que le asigna un estimador T, es la estimacion (de ).
La situacion se resume en el siguiente graco:
Figura 8.1: Esquema de la obtencion de una estimacion del parametro.
A partir del ejemplo anterior resulta evidente que necesitamos alg un criterio para elegir estimadores con buenas
propiedades.
8.2. Propiedades de los estimadores puntuales.
Cada estimacion, es decir, cada uno de los valores que toma el estimador, tiene una probabilidad de ocurrir. El
cuadro siguiente representa la situacion para todas las muestras posibles:
Figura 8.2: Esquema de la obtencion de m ultiples estimaciones del parametro.
Luego, dado que un estimador se obtiene a partir de una muestra, posee una distribucion dependiente de la
distribucion de la muestra, y en consecuencia de la distribucion poblacional. La distribucion de un estimador
puntual describe por completo sus propiedades.
Una propiedad deseable para un estimador es que en alg un sentido este cercano al verdadero valor del
parametro desconocido.
Denicion 8.2.1 Si la distribucion de la v.a. investigada depende de un parametro desconocido , diremos
que un estimador T = T(
1
,
2
, . . . ,
n
) es un estimador centrado o insesgado de si:
E[T] = , para todo .
La interpretacion intuitiva de esta propiedad se obtiene a partir de las leyes de los grandes n umeros. As el
teorema de la media garantiza que la media aritmetica de un gran n umero de las estimaciones obtenidas a
partir de un estimador centrado se aproximara al verdadero valor del parametro, por coincidir este con la
esperanza del estimador.
Un estimador que no es centrado para un parametro se dice que es un estimador sesgado, y el sesgo de un
estimador T respecto a , b(, T), se dene como:
b(, T) = E[T] .
Ejemplo 8.2.1 Sea (
1
,
2
, . . . ,
n
) una m.a.s. de una poblacion con media nita . Entonces la media muestral
n
=
1
n
i
es un estimador centrado de la media poblacional.
En efecto, en la demostracion del teorema de la media (Teorema 6.2.2, pag. 213) vimos que E(
n
) = E(
i
) = ,
ya que al ser las v.as.
i
componentes de una m.a.s. estan igualmente distribuidas que y tendran la misma
esperanza .
El estimador centrado de un parametro no tiene porque ser unico, los estimadores T
1
, T
2
y T
3
del Ejemplo 8.1.3
(pag. 263) son estimadores centrados para el parametro p. Es sencillo comprobar que cualquier combinacion
lineal de estimadores centrados de , con coecientes de suma uno, proporciona un nuevo estimador centrado
para .
Ejemplo 8.2.2 En una poblacion de media y varianza
2
, la varianza muestral S
2
=
1
n
n
i=1
(
i

n
)
2
es un
estimador sesgado de la varianza poblacional
2
. En efecto:
1
n
n
i=1
(
i
n
)
2
=
1
n
n
i=1
(
2
i
+
2
n
2
i

n
) =
_
1
n
n
i=1
2
i
_
+
2
n
2
n

n
=
_
1
n
n
i=1
2
i
_
2
n
,
luego
E[S
2
] = E
__
1
n
n
i=1
2
i
_
2
n
_
= E
_
1
n
n
i=1
2
i
_
E
_
2
n
_
= E[
2
i
] (V ar
_
+ (E
_
)
2
) =
(
2
+
2
)
_
2
n
+
2
_
=
n 1
n

2
=
2
.
A partir del anterior estimador de la varianza poblacional es facil obtener otro estimador centrado para el mismo
parametro, solo tenemos que multiplicar S
2
por n/(n 1). En efecto, si denimos

S
2
=
n
n1
S
2
, entonces
E[
S
2
] =
n
n 1
E[S
2
] =
n
n 1
n 1
n

2
=
2
.
S
2
=
1
n1
n
i=1
(
i
n
)
2
es la cuasivarianza muestral y es un estimador centrado de la varianza poblacional,
como acabamos de ver. Cuando el tama no de la muestra es peque no, es preferible utilizar la cuasivarianza
muestral en lugar de la varianza muestral como estimador de la varianza poblacional.
La varianza y cuasivarianza muestral, tambien se denotan por S
2
n
y S
2
n1
, respectivamente.
Veamos un ejemplo.
Ejemplo 8.2.3 Sea una poblacion que puede tomar los siguientes cinco valores: 2, 3, 6, 8 y 11, con la misma
probabilidad.
En este caso, es comodo, calcular la media y la varianza de la poblacion:
a) =
2+3+6+8+11
5
= 6
00.
b)
2
=
(26)
2
+(36)
2
+(66)
2
+(86)
2
+(116)
2
5
= 10
8.
Las veinticinco muestras de tama no dos, junto a las medias, varianzas y cuasivarianzas muestrales correspon-
dientes, estan representadas en la siguiente tabla:
Muestras (n = 2) Media muestral Varianza muestral Cuasivarianza muestral
(2,2) 200 000 000
(3,2) 250 025 050
(6,2) 400 400 800
(8,2) 500 900 1800
(11,2) 650 2025 4050
(2,3) 250 025 050
(3,3) 300 000 000
(6,3) 450 225 450
(8,3) 550 625 1250
(11,3) 700 1600 3200
(2,6) 400 400 800
(3,6) 450 225 450
(6,6) 600 000 000
(8,6) 700 100 200
(11,6) 850 625 1250
(2,8) 500 900 1800
(3,8) 550 625 1250
(6,8) 700 100 200
(8,8) 800 000 000
(11,8) 950 225 450
(2,11) 650 2025 4050
(3,11) 700 1600 3200
(6,11) 850 625 1250
(8,11) 950 225 450
(11,11) 1100 000 000
La media de las medias muestrales es:
X
=
suma de todas las medias muestrales (columna 2)
25
=
150
25
= 6
0
que coincide con la media de la poblacion, es decir:
X
= .
La varianza de la distribucion muestral de las medias, sera la varianza de los elementos de la columna 2 (medias
muestrales), que es:
2
X
=
(2 6)
2
+ (2
5 6)
2
+ + (11 6)
2
25
=
135
25
= 5
40.
Por tanto, se conrma la relacion entre la varianza de la distribucion de las medias muestrales y la varianza de
la poblacion es decir:
V ar(
n
) =

2
n
(en este caso n = 2 (tama no de la muestra)).
El valor esperado, media o esperanza, de las varianzas de las muestras, valores de la columna 3, es:
E[S
2
n
] =
0
00 + 0
25 + + 2
25 + 0
00
25
= 5
40. (Valor sesgado respecto a

2
= 10
8)
El valor esperado, media o esperanza, de las cuasivarianzas de las muestras, valores de la columna 4, es:
E[
S
2
n
] =
0
00 + 0
50 + + 4
50 + 0
00
25
= 10
8. (Es decir, la varianza de la poblacion

2
)
Esta es la razon por la que es preferible estimar la varianza de la poblacion con la cuasivarianza de la muestra
en lugar de con la varianza de la muestra.
Si un estimador es centrado, sus valores oscilaran entorno al parametro, pero esas oscilaciones pueden ser muy
grandes, por lo que una propiedad que refuerza la anterior es que su varianza sean lo menor posible, para que
las estimaciones se encuentren muy concentradas entorno al parametro.
Para describir el comportamiento de los estimadores, podramos utilizar un smil de tiradores a una diana que
producen los resultados que se reejan en la siguiente gura:
DIANA1 DIANA2 DIANA3
Figura 8.3: Comportamiento de distintos estimadores.
Diana 1: Todos los lanzamientos proximos entre s pero alejados del centro.
Diana 2: Los lanzamientos estan dispersos, pero en promedio se alcanza el centro.
Diana 3: Mucha proximidad entre los lanzamientos entorno al centro.
Que en la terminologa estadstica se corresponden con:
Diana 1: Estimador sesgado con varianza peque na.
Diana 2: Estimador insesgado con mucha varianza.
Diana 3: Estimador insesgado con varianza peque na.
Una medida utilizada com unmente para valorar la ecacia de un estimador es el error cuadratico medio.
Denicion 8.2.2 El error cuadratico medio de un estimador T de , se dene como:
e.c.m.(T) = E[T ]
2
Existe una relacion muy clara entre el e.c.m. de un estimador y su varianza, que presentamos en la siguiente
proposicion.
Proposicion 8.2.1 Para cualquier estimador T de un parametro , se cumple que:
e.c.m.(T) = V ar[T] +b
2
(, T)
Demostracion:
e.c.m.(T) = E[T ]
2
= E[(T E(T)) + (E(T) )]
2
=
E[(T E(T))
2
] + (E(T) )
2
+ 2(E(T) )E[T E(T)] = V ar[T] +b
2
(, T).
El ultimo sumando es cero ya que: E[T E(T)] = E(T) E(T) = 0.
En consecuencia, si es posible hallar un estimador con sesgo proximo a 0 y con varianza peque na, el error
cuadratico medio sera peque no.
Entre dos estimadores de un parametro que tienen el mismo sesgo, elegiremos el que tiene la menor varianza.
Fijado un tama no muestral, si entre todos los estimadores de un parametro con el mismo sesgo podemos
encontrar uno cuya varianza sea mnima, habremos conseguido el estimador optimo dentro de la clase de los
que tienen el mismo sesgo. Se dice tambien que ese estimador es el mas eciente.
Si el tama no de la m.a.s. es grande existen algunas propiedades que deben de ser tenidas en cuenta, como la
consistencia.
Denicion 8.2.3 Si denotamos por T
n
a un estimador basado en una m.a.s. de tama no n, es decir: T
n
=
T(
1
,
2
, . . . ,
n
), diremos que {T
n
} es una sucesion de estimadores consistente de , o que T es un estimador
consistente de , si:
T
n
p
para cualquier jado de
Por el teorema de la media (Teorema 6.2.2 (pag. 213)), es inmediato comprobar que la media muestral siempre
es un estimador consistente de la media poblacional, en poblaciones con media y varianza nitas.
Es relativamente sencillo vericar si un estimador es centrado o no. Tambien resulta facil comparar las varian-
zas de dos estimadores insesgados. Sin embargo, vericar la convergencia en probabilidad de una sucesion de
estimadores no es tan sencillo. El teorema siguiente es util algunas veces.
Teorema 8.2.1 Sea T
n
un estimador centrado de , si lm
n
V ar(T
n
) = 0, entonces {T
n
} es una sucesion de
estimadores consistente para .
Demostracion:
Usamos la desigualdad de Tchebychev:
P{|T
n
| } = P{|T
n
E(T
n
)| }
V ar(T
n
)
2
.
Por lo tanto, tomando lmites, encontramos que:
0 lm
n
P{|T
n
| } lm
n
V ar(T
n
)
2
= 0,
es decir T
n
p
.
El teorema anterior podemos enunciarlo tambien diciendo que, un estimador centrado tal que su e.c.m. converge
a cero cuando n tiende hacia innito es consistente.
Denicion 8.2.4 Si denotamos por T
n
a un estimador basado en una m.a.s. de tama no n, es decir, T
n
=
T(
1
,
2
, . . . ,
n
), diremos que {T
n
} es una sucesion de estimadores asintoticamente centrada ( o insesgada) de
, o que T es un estimador asintoticamente insesgado de , si:
lm
n
E(T
n
) =
Es evidente que cualquier estimador insesgado es asintoticamente centrado, la aseveracion recproca no es cierta;
as el estimador S
2
, varianza muestral, no es centrado, como hemos visto en el Ejemplo 8.2.2 (pag. 265), pero
si es asintoticamente centrado.
8.3. Metodos de obtencion de estimadores puntuales.
Hasta el momento, solo hemos dado algunos criterios con los cuales podemos juzgar las cualidades de un
estimador o bien compararlo con otro. Es decir, dado un estimador, podemos vericar si es centrado, consistente
y podemos calcular su varianza y compararla con la varianza de otro estimador. Sin embargo, no tenemos a un un
procedimiento general con el cual podamos encontrar estimadores razonables. Existen diversos procedimientos
para conseguir estos estimadores, de los cuales nosotros expondremos dos: el metodo de maxima verosimilitud
y el metodo de los momentos.
Metodo de maxima verosimilitud.
Comenzamos con el metodo mas importante de los dos: el metodo de maxima verosimilitud.
Con el n de evitar la repeticion de nuestra exposicion para el caso discreto y el continuo, a partir de ahora,
utilizaremos la terminologa siguiente en estos apuntes.
Escribiremos f(x, ) tanto para la funcion de densidad de la v.a. (evaluada en x), cuando es continua, como
para P{ = x}, si es discreta. Incluimos (en la notacion) para recordar que la distribucion de depende del
parametro en el cual estamos interesados.
Denicion 8.3.1 Sea (
1
,
2
, . . . ,
n
) una m.a.s. de una poblacion y sean x
1
, x
2
, . . . , x
n
los valores muestrales.
La funcion:
L(x
1
, x
2
, . . . , x
n
; ) = f(x
1
, )f(x
2
, ) f(x
n
, )
considerada como una funcion de , recibe el nombre de funcion de verosimilitud.
Si la poblacion es discreta, de modo que P{ = x
i
} = p
i
(), i = 1, 2, . . . , k, entonces L(x
1
, x
2
, . . . , x
n
; )
representa el valor de la distribucion de probabilidad conjunta de la m.a.s. en (x
1
, x
2
, . . . , x
n
) y sera igual a
L(x
1
, x
2
, . . . , x
n
; ) = (p
1
())
n
1
(p
2
())
n
2
(p
k
())
n
k
si x
i
se ha presentado en la muestra n
i
veces. Mientras
que si la poblacion es continua L(x
1
, x
2
, . . . , x
n
; ) representa el valor de la funcion de densidad conjunta de la
m.a.s. en (x
1
, x
2
, . . . , x
n
).
Si se ha obtenido (x
1
, x
2
, . . . , x
n
) como resultado de la m.a.s. (
1
,
2
, . . . ,
n
), puesto que es desconocido,
podramos preguntarnos. Para que valor de es mas verosmil que (x
1
, x
2
, . . . , x
n
) haya ocurrido? Es decir,
deseamos elegir el valor mas probable de despues de obtener los datos, suponiendo que cada valor de fuese
igualmente posible antes que los datos fuesen obtenidos. Daremos la siguiente denicion formal.
Denicion 8.3.2 El estimador de maxima verosimilitud de es aquel estimador

(
1
,
2
, . . . ,
n
) que maximiza
la funcion de verosimilitud. Es decir:

(
1
,
2
, . . . ,
n
) es un estimador maximo verosmil, (e.m.v.) de si:
L(x
1
, x
2
, . . . , x
n
;

(x
1
, x
2
, . . . , x
n
)) = sup
L(x
1
, x
2
, . . . , x
n
; )
Observaciones:
a)

(
1
,
2
, . . . ,
n
) es un estadstico y por tanto una v.a. Las constantes no se admiten como estimadores.
b) En la mayor parte de nuestros ejemplos representara un parametro unidimensional. Sin embargo puede
ocurrir que la distribucion de la poblacion dependa de dos o mas parametros desconocidos (como ocurre en
la distribucion normal, por ejemplo). En esos casos puede representar un vector de mas de una dimension.
c) Para encontrar el e.m.v. debemos determinar donde se alcanza el maximo de una funcion. Por lo tanto, en
muchas ocasiones podemos aplicar algunas de las tecnicas propias del calculo para encontrar este maximo.
Puesto que la funcion ln(x) es una funcion creciente de x, L(x
1
, x
2
, . . . , x
n
; ) alcanza su valor maximo
para el mismo valor de que ln(L(x
1
, x
2
, . . . , x
n
; )). Luego, en condiciones muy generales, suponiendo que
es un subconjunto de la recta real y que L(x
1
, x
2
, . . . , x
n
; ) es una funcion diferenciable de , podemos
obtener el e.m.v. de al resolver lo que conoce como la ecuacion de verosimilitud:
ln(L(x
1
, x
2
, . . . , x
n
; )) = 0
Si
= (
1
,
2
, . . . ,
k
), la ecuacion anterior debe sustituirse por las ecuaciones de verosimilitud simultaneas:
1
ln(L(x
1
, x
2
, . . . , x
n
; (
1
,
2
, . . . ,
k
))) = 0
2
ln(L(x
1
, x
2
, . . . , x
n
; (
1
,
2
, . . . ,
k
))) = 0
.
.
.
k
ln(L(x
1
, x
2
, . . . , x
n
; (
1
,
2
, . . . ,
k
))) = 0
Ejemplo 8.3.1 Sea (
1
,
2
, . . . ,
n
) una m.a.s. de una poblacion P(), donde es un parametro desconocido
que queremos estimar.
La funcion de verosimilitud para un resultado (x
1
, x
2
, . . . , x
n
) de la muestra es:
L(x
1
, x
2
, . . . , x
n
; ) = f(x
1
, )f(x
2
, ) f(x
n,
) =
n
i=1
e
x
i
x
i
!
= e
n
x
i
x
i
!
.
As, ln(L) = n +
x
i
ln()
ln(x
i
!) y por lo tanto,
ln(L) = n +
x
i
1
ln(L) = 0
da =
1
n
n
i=1
x
i
, que es la estimacion maximo verosmil de para ese resultado muestral. El estimador maximo
verosmil es el que da lugar a esa estimacion para cualquier realizacion muestral, en nuestro caso

=
1
n
n
i=1
i
=
n
.
Ejemplo 8.3.2 Consideremos un ejemplo en el cual dos parametros (ambos desconocidos) caracterizan la
distribucion de la poblacion. Supongamos que (
1
,
2
, . . . ,
n
) es una m.a.s. de una poblacion N(, ).
1
, x
2
, . . . , x
n
) de la muestra es:
L(x
1
, x
2
, . . . , x
n
; (, )) =
f(x
i
, (, )) = (2
2
)
n/2
exp
_
1
2
n
i=1
_
x
i
_
2
_
.
Luego,
ln(L) =
n
2
ln(2
2
)
1
2
n
i=1
_
x
i
_
2
.
Debemos resolver simultaneamente
ln(L)
= 0 y
ln(L)
= 0.
Tenemos
ln(L)
=
n
i=1
_
x
i
2
_
= 0 lo que da =
1
n
n
i=1
x
i
= x
n
, y
ln(L)
=
_
_
+
n
i=1
_
(x
i
)
2
3
_
= 0,
que da =
_
1
n
n
i=1
[x
i
]
2
, y sustituyendo por la solucion anteriormente obtenida x
n
tenemos que
=
_
1
n
n
i=1
[x
i
x
n
]
2
,
que son las estimaciones maximo verosmiles de la media y desviacion tpica para esa realizacion muestral. Los
estimadores maximo verosmiles respectivos son:
=
1
n
n
i=1
i
=
n
y =
_
1
n
n
i=1
[
i
n
]
2
.
Hasta ahora hemos considerado situaciones en las cuales hemos podido encontrar el punto en el que se alcanza
el maximo de L al derivar ln(L) respecto al parametro e igualar esa derivada a cero. El ejemplo siguiente ilustra
que esto no siempre es efectivo.
Ejemplo 8.3.3 Sea (
1
,
2
, . . . ,
n
) una m.a.s. de una poblacion U(0, ), donde es un parametro desco-
nocido que queremos estimar.
1
, x
2
, . . . , x
n
) de la muestra es:
L(x
1
, x
2
, . . . , x
n
; ) =
_ _
1
_
n
si 0 x
i
, para todo i {1, 2, . . . , n},
0 en otro caso,
=
_ _
1
_
n
si max{x
1
, x
2
, . . . , x
n
},
0 en otro caso.
Recordando que L es una funcion de y observando que es una funcion decreciente de , el supremo lo al-
canzara en el extremo inferior del conjunto donde no se anula, es decir, = max{x
1
, x
2
, . . . , x
n
} es la es-
timacion maximo verosmil para esa realizacion muestral. El estimador maximo verosmil correspondiente es
= max{
1
,
2
, . . . ,
n
}.
Cuando el espacio parametrico es nito, es posible que tengamos que recurrir a comparar todos los valores de
la funcion de verosimilitud para calcular el estimador maximo verosmil. Consideremos el siguiente ejemplo, en
el que podemos observar que el e.m.v. no tiene que ser unico.
Ejemplo 8.3.4 Sea B(n, p), se sabe que n es o bien 1 o bien 2 y p = 1/2 o p = 1/3. A partir de una m.a.s.
de tama no dos (
1
,
2
) pretendemos estimar el parametro bidimensional (n, p). La siguiente tabla nos muestra
las nueve funciones de verosimilitud as como el estimador maximo verosmil en la ultima columna. El maximo
de la funcion de verosimilitud lo marcamos en la casilla correspondiente.
(x
1
, x
2
) (n = 1, p = 1/2) (n = 1, p = 1/3) (n = 2, p = 1/2) (n = 2, p = 1/3)

(x
1
, x
2
)
(0, 0) (1/2)
2
(2/3)
2
(1/2)
4
(2/3)
4
(1, 1/3)
(0, 1) (1/2)
2
2/9 (1/2)
3
(2/3)
4
(1, 1/2)
(0, 2) 0 0 (1/2)
4
4(1/3)
4
(2, 1/2)
(1, 0) (1/2)
2
2/9 (1/2)
3
(2/3)
4
(1, 1/2)
(1, 1) (1/2)
2
(1/3)
2
(1/2)
2
(2/3)
4
(1, 1/2) o (2, 1/2)
(1, 2) 0 0 (1/2)
3
4(1/3)
4
(2, 1/2)
(2, 0) 0 0 (1/2)
4
4(1/3)
4
(2, 1/2)
(2, 1) 0 0 (1/2)
3
4(1/3)
4
(2, 1/2)
(2, 2) 0 0 (1/2)
4
(1/3)
4
(2, 1/2)
En este caso tenemos dos estimadores maximo verosmiles para (n, p):
1
(x
1
, x
2
) =
_
_
_
(1, 1/3) si (x
1
, x
2
) = (0, 0),
(1, 1/2) si (x
1
, x
2
) = (1, 1), (0, 1) o (1, 0),
(2, 1/2) en otro caso.
2
(x
1
, x
2
) =
_
_
_
(1, 1/3) si (x
1
, x
2
) = (0, 0),
(1, 1/2) si (x
1
, x
2
) = (0, 1) o (1, 0),
(2, 1/2) en otro caso.
Propiedades de los estimadores de maxima verosimilitud:
a) El e.m.v. puede ser sesgado. Muy a menudo tal sesgo puede evitarse multiplicando por la constante adecuada.
b) El e.m.v. tiene la propiedad de invarianza. Supongamos que

es el e.m.v. de . Entonces puede demostrarse
que el e.m.v. de g() es g(
), siempre que g :
1

2
, donde
1
es un subconjunto de IR
k
y
2
es un
intervalo de IR
p
.
c) Sea (
1
,
2
, . . . ,
n
) una m.a.s. de una poblacion cuya distribucion de probabilidad o funcion de densidad es
f(x, ). Sea

n
=

(
1
,
2
, . . . ,
n
) un e.m.v. de . Entonces, bajo condiciones muy generales:
B [
n
]
L
N(0, 1),
donde B =
nE[

ln(f(; ))]
2
, es decir,

n
N(, 1/B) cuando n es sucientemente grande.
Esta propiedad es mucho mas fuerte que la propiedad de consistencia. Ya que bajo las condiciones generales
anteriormente mencionadas, la distribucion de

n
es aproximadamente normal centrada en y con una
varianza que tiende a cero, por lo que, por el Teorema 8.2.1 (pag. 268),

n
sera consistente para .
Ejemplo 8.3.5 En el Ejemplo 8.3.2 (pag. 270) si queremos calcular los estimadores maximo verosmiles de la
media y la varianza
2
de una poblacion N(, ), por la propiedad b) anterior seran:
=
n
y
2
=
1
n
n
i=1
_
2
.
Ejemplo 8.3.6 Supongamos que el tiempo hasta que se produce un fallo en un componente, es una v.a. con
distribucion exponencial de parametro . La funcion de densidad esta dada por
f(x, ) = e
x
, x > 0.
Si queremos obtener un e.m.v. para , probamos n de esas componentes observando los tiempos de fallo co-
rrespondientes (
1
,
2
, . . . ,
n
). La funcion de verosimilitud para una observacion de esta muestra viene dada
por
L(x
1
, x
2
, . . . , x
n
; ) =
n
exp(
x
i
).
As, ln(L) = nln()
x
i
. Por tanto,
ln(L)
=
n
x
i
y
ln(L)
= 0 da

=
1
n
.
La propiedad c) anterior establece que si n es sucientemente grande,

=
1
n
tiene aproximadamente una
distribucion N(, 1/B), donde B =
nE
_
_
ln(f(; ))
_
2
_
.
Para encontrar B, consideramos lnf(, ) = ln() . Luego
lnf(,)
= (1/) .
Por tanto,
_
lnf(, )
_
2
=
_

1
_
2
.
Puesto que (1, ), entonces
E[] = 1/ y V ar[] = 1/
2
,
con lo cual
E
_
_
lnf(, )
_
2
_
= E
_
_

1
_
2
_
= E
_
( E[])
2
_
= V ar[] = 1/
2
.
Luego B
2
= n/
2
.
Por lo tanto, encontramos que para n grande,

sigue aproximadamente la distribucion N(, /
n). (Esto
verica la consistencia del estimador, puesto que
2
/n 0 cuando n ).
Metodo de los momentos.
Uno de los metodos mas simples de estimacion es el metodo de los momentos. En una amplia variedad de
problemas el parametro que se quiere estimar es alguna funcion conocida de un n umero dado de momentos.
Supongamos que estamos interesados en estimar
= h(m
1
, m
2
, . . . , m
k
)
donde h es una funcion conocida y m
j
es el j-esimo momento de la poblacion (m
j
= E(
j
)) y suponemos que
existen esos momentos.
Denicion 8.3.3 El metodo de los momentos consiste en estimar por el estadstico
T(
1
,
2
, . . . ,
n
) = h
_
1
n
n
i=1
i
,
1
n
n
i=1
2
i
, . . . ,
1
n
n
i=1
n
i
_
.
Nota: Si existe el momento de cualquier orden de la poblacion, por el teorema de la media (Teorema 6.2.2 (pag.
213)),
1
n
n
i=1
j
i
p
E[
j
]. Luego si estamos interesados en estimar momentos poblacionales, el metodo de los
momentos nos proporciona estimadores consistentes e insesgados. Ademas por el Teorema Central del Lmite,
estos estimadores seran asintoticamente normales.
Ejemplo 8.3.7 Sea (
1
,
2
, . . . ,
n
) una m.a.s. de una poblacion con media desconocida y varianza
2
. En-
tonces dado que
2
= m
2
m
2
1
, el estimador por el metodo de los momentos de
2
vendra dado por:
T(
1
,
2
, . . . ,
n
) =
1
n
n
i=1
2
i
(
n
)
2
=
1
n
n
i=1
[
i
n
]
2
= S
2
.
Ejemplo 8.3.8 Sea (
1
,
2
, . . . ,
n
) una m.a.s. de una poblacion uniforme U(a, b). Sabemos que E() =
(a + b)/2 y V ar() = (b a)
2
/12. El metodo de los momentos estima E() por
n
y V ar() por S
2
. Como
a y b los podemos poner en funcion de la media y la varianza, de la forma a = E() [3V ar()]
1/2
y b =
E() + [3V ar()]
1/2
, entonces los estimadores por el metodo de los momentos de a y b son, respectivamente,
T
1
(
1
,
2
, . . . ,
n
) =
n
3S
2
y T
2
(
1
,
2
, . . . ,
n
) =
n
+
3S
2
.
8.4. Estimacion por intervalos de conanza.
En la mayora de los problemas practicos, un estimador puntual por si solo es inadecuado. Por ejemplo, su-
pongamos que un control realizado sobre una muestra aleatoria de piezas procedentes de un envo nos lleve a
estimar que el 10 % de las piezas son defectuosas. Un gerente que se enfrente a este dato posiblemente se haga
preguntas del tipo: Puedo estar totalmente seguro de que el verdadero porcentaje de piezas esta entre el 5 % y
el 10 %? o Es muy posible que entre el 9 % y el 11 % de las piezas sean defectuosas?. Esta clase de preguntas
requieren informacion que va mas alla de la contenida en una simple estimacion puntual.
Si extraemos una muestra relativamente grande de la poblacion, es logico esperar que la informacion que nos
aporta sea mas able que la procedente de una muestra mas peque na, siempre que las restantes condiciones
del muestreo sean las mismas. Sin embargo, este aspecto no se reeja en la estimacion puntual. Por ejemplo,
nuestra estimacion de la proporcion de piezas defectuosas sera la misma si encontramos una pieza defectuosa
en una muestra de tama no diez que si descubrimos 100 defectuosas en una muestra de tama no 1000.
Toda estimacion puntual T(x
1
, x
2
, . . . , x
n
) debera acompa narse de un cierto intervalo, por ejemplo, de la forma
(T(x
1
, x
2
, . . . , x
n
) d, T(x
1
, x
2
, . . . , x
n
) +d), que incluya la estimacion junto con alguna medida de seguridad de
que el verdadero valor del parametro esta dentro de dicho intervalo. A menudo las estimaciones se dan de esa
manera. As, la carga electronica puede estimarse que vale (4
7700
005)10
10
unidades electrostaticas, dandose
a entender con ello que es muy poco probable que el primer factor sea exterior al intervalo (4
765; 4
775). El
Ministerio de Trabajo puede estimar el n umero de parados en un momento dado en 1
4 0
3 millones, teniendo
bastante seguridad en que el n umero verdadero esta comprendido entre 1
1 y 1
7 millones.
Para precisar estas ideas, consideremos el siguiente ejemplo.
Ejemplo 8.4.1 Sea (
1
,
2
, . . . ,
n
) una m.a.s. de una poblacion N(, ), donde se supone que es conocida.
Sabemos que
n
tiene distribucion N(, /
n), por el teorema de Fisher (Teorema 7.4.1 (pag. 249)). Por tanto,
= [(
n
)/]
n tiene una distribucion N(0, 1). Notese que aunque depende de su distribucion no.
Podemos utilizar este hecho como sigue. Sea la funcion de distribucion de la N(0, 1),
2(z) 1 = P{ z <

n
n < z} = P{
n
z/
n < <
n
+z/
n},
es decir,
P{ (
n
z/
n,
n
+z/
n)} = 2(z) 1.
El intervalo (
n
z/
n,
n
+z/
n) es un ejemplo de intervalo aleatorio.

Si sustituimos en el anterior intervalo las componentes de la m.a.s. por una realizacion muestral (x
1
, x
2
, . . . , x
n
)
tenemos un intervalo real
(x
n
z/
n, x
n
+z/
n) (8.4.1)
que es un intervalo de conanza para al nivel 2(z) 1.
Denicion 8.4.1 Consideremos una m.a.s. (
1
,
2
, . . . ,
n
), y sean L
i
(
1
,
2
, . . . ,
n
) y L
s
(
1
,
2
, . . . ,
n
) dos
funciones de la m.a.s. tales que P{L
i
(
1
,
2
, . . . ,
n
) < < L
s
(
1
,
2
, . . . ,
n
)} = 1 , donde 1 =
es una
probabilidad jada. Entonces:
(L
i
(
1
,
2
, . . . ,
n
), L
s
(
1
,
2
, . . . ,
n
))
es un intervalo aleatorio para al nivel de conanza
.
Denicion 8.4.2 Si (L
i
(
1
,
2
, . . . ,
n
), L
s
(
1
,
2
, . . . ,
n
)) es un intervalo aleatorio para al nivel de con-
anza
, y (x
1
, x
2
, . . . , x
n
) es una realizacion muestral de (
1
,
2
, . . . ,
n
), entonces:
(L
i
(x
1
, x
2
, . . . , x
n
), L
s
(x
1
, x
2
, . . . , x
n
))
es un intervalo de conanza para al nivel (o coeciente) de conanza de
. Tambien se dice al
100
%.
El nivel de conanza de un intervalo de conanza, no es, como en el caso de los intervalos aleatorios, la
probabilidad de que el parametro este dentro del intervalo. La interpretacion debe hacerse en el siguiente
sentido, si obtengo muchos intervalos por ese procedimiento, aproximadamente el 100
% de ellos contendran
al verdadero valor del parametro.
La Figura 8.4 muestra dos simulaciones de 100 intervalos cada una para la media de una poblacion normal
N(0, 1) al nivel 0
95. En ambos casos obtuvimos 96 intervalos que contienen al cero.

Figura 8.4: Interpretacion del concepto de coeciente o nivel de conanza.
Supongamos que en el Ejemplo 8.4.1 (pag. 274), representa la duracion de una pieza de un equipo y supongamos
que se probaron 100 piezas que tuvieron una duracion media de x
n
= 501
2 horas. Se sabe que es de cuatro

horas y deseamos tener un intervalo de conanza al nivel
= 0
95 para .
Sustituyendo los valores de x
n
, y n en la formula 8.4.1 del ejemplo y buscando el valor de z en las tablas o en
la calculadora. Encontramos el siguiente intervalo de conanza para :
(501
2 (4/10)(1
96), 501
2 + (4/10)(1
96)), es decir (500
4, 502
0).
8.5. Metodo del pivote para construir intervalos de conanza.
En esta seccion proponemos un procedimiento para construir intervalos de conanza que es valido en la mayor
parte de las situaciones.
Sea una v.a. cuya distribucion depende de un parametro perteneciente a un espacio parametrico que es
un intervalo de IR. Supongamos que podemos denir una funcion h(
1
,
2
, . . . ,
n
, ) cuya distribucion es inde-
pendiente de que para cada realizacion muestral (x
1
, x
2
, . . . , x
n
), h(x
1
, x
2
, . . . , x
n
, ) es una funcion continua
y estrictamente monotona respecto a , (funcion pivote). Entonces, podremos calcular a y b tales que
P{a < h(
1
,
2
, . . . ,
n
, ) < b} =
. (8.5.1)
Como h(x
1
, x
2
, . . . , x
n
, ) es una funcion continua y estrictamente monotona respecto a , existe la solucion de
las siguientes ecuaciones respecto a :
h(x
1
, x
2
, . . . , x
n
, ) = a
h(x
1
, x
2
, . . . , x
n
, ) = b
Sean L
i
(x
1
, x
2
, . . . , x
n
) y L
s
(x
1
, x
2
, . . . , x
n
), respectivamente, la menor y mayor de las soluciones anteriores,
entonces (L
i
(x
1
, x
2
, . . . , x
n
), L
s
(x
1
, x
2
, . . . , x
n
)) es un intervalo de conanza para a nivel
, ya que
P{L
i
(
1
,
2
, . . . ,
n
) < < L
s
(
1
,
2
, . . . ,
n
)} = P{a < h(
1
,
2
, . . . ,
n
, ) < b} =
.
Por otra parte, la b usqueda de los valores a y b que verican (8.5.1) debera llevarse a cabo de forma que el
intervalo de conanza tuviese la menor longitud. Si la distribucion de h(
1
,
2
, . . . ,
n
, ) es simetrica y unimodal,
tomaremos a y b simetricas respecto al centro de simetra.
Si la distribucion de h(
1
,
2
, . . . ,
n
, ) es asimetrica, la determinacion de los valores de a y b que hace mnima
la longitud del intervalo es complicada y por simplicidad los tomamos de forma que
P{h(
1
,
2
, . . . ,
n
, ) < a} =

2
y P{h(
1
,
2
, . . . ,
n
, ) > b} =

2
.
El inconveniente que presenta este procedimiento, es que no siempre es posible encontrar una funcion pivote
que verique las condiciones requeridas.
Veamos algunos ejemplos de intervalos de conanza obtenidos con este metodo.
En los siguientes tres ejemplos siguientes consideraremos que la poblacion sigue una distribucion normal
N(, ), y que (
1
,
2
, . . . ,
n
) es una m.a.s. de esa poblacion.
Ejemplo 8.5.1 Intervalo de conanza para la media de una poblacion normal de varianza cono-
cida.
La funcion h(
1
,
2
, . . . ,
n
; ) =
n[(
n
)/] es la funcion pivote que utilizaremos, ya que sigue una distribu-
cion N(0, 1) (ver Teorema 7.4.1 (pag. 249)), independiente de , y jada una realizacion muestral (x
1
, x
2
, . . . , x
n
),
n[(x
n
)/] es una funcion de continua y estrictamente monotona decreciente, por lo que, siguiendo los
pasos indicados en el metodo del pivote, buscamos dos valores a y b tales que, P{a < N(0, 1) < b} =
. Como
la distribucion N(0, 1) es simetrica elegimos a y b simetricos, es decir a = b, para que el intervalo tenga la
menor longitud.
Una vez hallado b, en las tablas de la distribucion normal, calculadora o cualquier otro procedimiento, planteamos
las ecuaciones
_
_
_
n[(x
n
)/] = b
n[(x
n
)/] = b
_
_
_
que resolviendo respecto a , dan los extremos del intervalo de conanza, L
i
(x
1
, x
2
, . . . , x
n
) = x
n
b/
n y
L
s
(x
1
, x
2
, . . . , x
n
) = x
n
+b/
n.
Por tanto, el intervalo de conanza es
_
x
n
b

n
, x
n
+b

n
_
.
Nota: El anterior intervalo tambien sera valido, si prescindimos de la hipotesis de normalidad de la poblacion
pero tenemos un tama no muestral elevado (n 30), ya que esa hipotesis solo la hemos utilizado para armar
que

n[(
n
)/] sigue una distribucion N(0, 1), pero el teorema central del lmite nos permite aproximar ese
resultado cuando n es sucientemente grande.
Ejemplo 8.5.2 Intervalo de conanza para la media de una poblacion normal de varianza desco-
nocida.
La funcion h(
1
,
2
, . . . ,
n
; ) =
n[(
n
)/
S] es la funcion pivote que utilizaremos, ya que sigue una distribu-

cion t
n1
(ver Corolario 7.4.2 (pag. 250)), independiente de , y jada una realizacion muestral (x
1
, x
2
, . . . , x
n
),
n[(x
n
)/ s] es una funcion de continua y estrictamente monotona decreciente, por lo que, siguiendo los
pasos indicados en el metodo del pivote, buscamos dos valores a y b tales que, P{a < t
n1
< b} =
. Como la
distribucion t
n1
es simetrica elegimos a y b simetricos, es decir a = b, para que el intervalo tenga la menor
longitud.
Una vez hallado b, en las tablas de la distribucion t de Student, calculadora o cualquier otro procedimiento,
planteamos las ecuaciones
_
_
_
n[(x
n
)/ s] = b
n[(x
n
)/ s] = b
_
_
_
cuyas soluciones respecto a , dan los extremos del intervalo de conanza, L
i
(x
1
, x
2
, . . . , x
n
) = x
n
b s/
n y
L
s
(x
1
, x
2
, . . . , x
n
) = x
n
+b s/
n.
_
x
n
b
s
n
, x
n
+b
s
n
_
.
Nota: Por s entendemos el valor de

S =
_
1
n1
n
i=1
[
i
n
]
2
para nuestra realizacion muestral (x
1
, x
2
, . . . , x
n
),
es decir, s =
_
1
n1
n
i=1
[x
i
x
n
]
2
.
Ejemplo 8.5.3 Intervalo de conanza para la varianza de una poblacion normal.
La funcion h(
1
,
2
, . . . ,
n
;
2
) = nS
2
/
2
=
n
i=1
(
i
n
)
2
2
es la funcion pivote que utilizaremos, ya que sigue
una distribucion
2
n1
(ver Teorema 7.4.1 (pag. 249)), independiente de
2
, y jada una realizacion muestral
(x
1
, x
2
, . . . , x
n
), ns
2
/
2
=
n
i=1
(x
i
x
n
)
2
2
es una funcion de
2
continua y estrictamente monotona decreciente,
por lo que, siguiendo los pasos del metodo del pivote, buscamos dos valores a y b tales que, P{a <
2
n1
< b} =
. Como la distribucion
2
n1
no es simetrica elegimos a y b, tales P{
2
n1
< a} = P{
2
n1
> b} = /2.
Una vez hallados a y b, en las tablas, calculadora o cualquier otro procedimiento, planteamos las ecuaciones
_
ns
2
/
2
= a
ns
2
/
2
= b
_
cuyas soluciones respecto a
2
, dan los extremos del intervalo de conanza, L
i
(x
1
, x
2
, . . . , x
n
) = ns
2
/b y
L
s
(x
1
, x
2
, . . . , x
n
) = ns
2
/a.
Luego, el intervalo de conanza para la varianza es
_
ns
2
b
,
ns
2
a
_
.
En los siguientes cuatro ejemplos consideraremos que la poblacion sigue una distribucion normal N(
1
,
1
),
siendo (
1
,
2
, . . . ,
n
) una m.a.s. de esa poblacion; que la poblacion sigue una distribucion normal N(
2
,
2
),
siendo (
1
,
2
, . . . ,
m
) una m.a.s. de esa poblacion; y que ambas muestras son independientes.
Ejemplo 8.5.4 Intervalo de conanza para la diferencia de las medias de dos poblaciones normales
de varianzas conocidas.
La funcion h(
1
,
2
, . . . ,
n
,
1
,
2
, . . . ,
m
,
1

2
) =
(
n
m
)(
1
2
)
2
1
n
+
2
2
m
es la funcion pivote que utilizaremos, ya
que sigue una distribucion N(0, 1) (ver Corolario 7.4.3 (pag. 250)), independiente de
1

2
, y jadas sendas
realizaciones muestrales (x
1
, x
2
, . . . , x
n
) e (y
1
, y
2
, . . . , y
m
),
(x
n
y
m
)(
1
2
)
2
1
n
+
2
2
m
es una funcion de
1
2
continua y
estrictamente monotona decreciente, por lo que, siguiendo los pasos indicados en el metodo del pivote, buscamos
dos valores a y b tales que, P{a < N(0, 1) < b} =
. Como la distribucion N(0, 1) es simetrica elegimos a y b

simetricos, es decir a = b, para que el intervalo tenga la menor longitud.
las ecuaciones
_
_
(x
n
y
m
)(
1
2
)
2
1
n
+
2
2
m
= b
(x
n
y
m
)(
1
2
)
2
1
n
+
2
2
m
= b
_
_
que resolviendo respecto a
1

2
i
= (x
n
y
m
) b
2
1
n
+

2
2
m
y L
s
= (x
n
y
m
) +b
2
1
n
+

2
2
m
.
_
(x
n
y
m
) b
2
1
n
+

2
2
m
, (x
n
y
m
) +b
2
1
n
+

2
2
m
_
.
Nota: El anterior intervalo tambien sera valido, si prescindimos de la hipotesis de normalidad de la poblacion
pero los tama nos muestrales n y m son grandes (n 30 y m 30), ya que en ese caso el teorema central del
lmite nos permite aproximar la distribucion de la funcion pivote a la N(0, 1).
de varianzas desconocidas (iguales).
En la situacion anterior consideramos que
1
=
2
= . Denotamos por S
2
1
=
1
n
n
i=1
(
i
n
)
2
, S
2
2
=
1
m
m
i=1
(
i
m
)
2
, s
2
1
=
1
n
n
i=1
(x
i
x
n
)
2
y s
2
2
=
1
m
m
i=1
(y
i
y
m
)
2
.
La funcion h(
1
,
2
, . . . ,
n
,
1
,
2
, . . . ,
m
,
1
2
) =
(
n
m
)(
1
2
)
nS
2
1
+mS
2
2
nm(n+m2)
(n+m)
es la funcion pivote que utilizaremos, ya
que sigue una distribucion t
n+m2
(ver Corolario 7.4.4 (pag. 251)), independiente de
1
2
, y jadas sendas
realizaciones muestrales (x
1
, x
2
, . . . , x
n
) e (y
1
, y
2
, . . . , y
n
),
(x
n
y
m
)(
1
2
)
ns
2
1
+ms
2
2
nm(n+m2)
(n+m)
es una funcion de
1
2
continua y
estrictamente monotona decreciente, por lo que, siguiendo los pasos indicados en el metodo del pivote, buscamos
dos valores a y b tales que, P{a < t
n+m2
< b} =
. Como la distribucion t de Student es simetrica elegimos

a y b simetricos, es decir a = b, para que el intervalo tenga la menor longitud.
_
_
(x
n
y
m
)(
1
2
)
ns
2
1
+ms
2
2
nm(n+m2)
(n+m)
= b
(x
n
y
m
)(
1
2
)
ns
2
1
+ms
2
2
nm(n+m2)
(n+m)
= b
_
_
1
2
, dan los extremos del intervalo de conanza,
L
i
= (x
n
y
m
) b
ns
2
1
+ms
2
2
nm(n +m2)
(n +m) y L
s
= (x
n
y
m
) +b
ns
2
1
+ms
2
2
nm(n +m2)
(n +m).
_
(x
n
y
m
) b
ns
2
1
+ms
2
2
nm(n +m2)
(n +m) , (x
n
y
m
) +b
ns
2
1
+ms
2
2
nm(n +m2)
(n +m)
_
.
de varianzas desconocidas (distintas).
Cuando las varianzas de ambas poblaciones no pueden suponerse iguales, se utiliza el siguiente procedimiento
aproximado. En lo que sigue, utilizaremos la siguiente notacion:

S
2
1
=
1
n1
n
i=1
(
i
n
)
2
,

S
2
2
=
1
m1
m
i=1
(
i
m
)
2
,
s
2
1
=
1
n1
n
i=1
(x
i
x
n
)
2
y s
2
2
=
1
m1
m
i=1
(y
i
y
m
)
2
.
La funcion h(
1
,
2
, . . . ,
n
,
1
,
2
, . . . ,
m
,
1

2
) =
(
n
m
)(
1
2
)
S
2
1
n
+
S
2
2
m
es la funcion que utilizaremos, ya que
sigue aproximadamente una distribucion t
f
, donde f es el entero mas proximo a
_
s
2
1
n
+
s
2
2
m
_
2
( s
2
1
/n)
2
n+1
+
( s
2
2
/m)
2
m+1
2,
y verica los condiciones requeridas para ser considerada funcion pivote, por lo que, siguiendo los pasos indicados
en el metodo del pivote, buscamos dos valores a y b tales que, P{a < t
f
< b} =
. Como la distribucion t de
Student es simetrica elegimos a y b simetricos, es decir a = b, para que el intervalo tenga la menor longitud.
_
_
(x
n
y
m
)(
1
2
)
s
2
1
n
+
s
2
2
m
= b
(x
n
y
m
)(
1
2
)
s
2
1
n
+
s
2
2
m
= b
_
_
1
2
i
= (x
n
y
m
) b
s
2
1
n
+
s
2
2
m
y
L
s
= (x
n
y
m
) +b
s
2
1
n
+
s
2
2
m
.
_
(x
n
y
m
) b
s
2
1
n
+
s
2
2
m
, (x
n
y
m
) +b
s
2
1
n
+
s
2
2
m
_
.
Ejemplo 8.5.7 Intervalo de conanza para el cociente entre las varianzas de dos poblaciones
normales.
La funcion h(
1
,
2
, . . . ,
n
,
1
,
2
, . . . ,
m
,
2
1
/
2
2
) =
S
2
1
/
S
2
2
2
1
/
2
2
es la funcion pivote que utilizaremos, ya que sigue
una distribucion F
n1
m1
(ver Corolario 7.4.5 (pag. 251)), y verica los condiciones requeridas para ser conside-
rada funcion pivote, puesto que jadas las realizaciones muestrales (x
1
, x
2
, . . . , x
n
) e (y
1
, y
2
, . . . , y
m
),
s
2
1
/ s
2
2
2
1
/
2
2
es
una funcion continua y estrictamente monotona decreciente respecto a
2
1
/
2
2
, por lo que, siguiendo los pasos
indicados en el metodo del pivote, buscamos dos valores a y b tales que, P{a < F
n1
m1
< b} =
. Como la
distribucion F de Snedecor no es simetrica elegimos a y b, tal que P{F
n1
m1
< a} = P{F
n1
m1
> b} = /2.
Una vez hallados a y b, en las tablas, calculadora o cualquier otro procedimiento, planteamos las ecuaciones
_
_
s
2
1
/ s
2
2
2
1
/
2
2
= a
s
2
1
/ s
2
2
2
1
/
2
2
= b
_
_
2
1
/
2
2
i
=
s
2
1
/ s
2
2
b
y L
s
=
s
2
1
/ s
2
2
a
.
Por tanto, el intervalo de conanza para
2
1
/
2
2
es
_
s
2
1
/ s
2
2
b
,
s
2
1
/ s
2
2
a
_
.
Veamos dos ejemplos que tienen que ver con el parametro p de una distribucion de Bernoulli.
Ejemplo 8.5.8 Intervalo de conanza para una proporcion.
Sea (
1
,
2
, . . . ,
n
) una m.a.s. de una poblacion B(1, p), donde p es el parametro desconocido. Entonces, se
comprueba que p = p(
1
,
2
, . . . ,
n
) =
n
=
1
n
i
es el e.m.v. de p. Ademas por el teorema central del lmite, si
n es sucientemente grande,
p p
p(1p)
n
N(0, 1). Se ha comprobado que cuando n es grande podemos sustituir
en el denominador de la expresion anterior p por p sin que se vea afectada la aproximacion a la distribucion
normal. (Lo que ocurre en general es que, en la distribucion normal asintotica de un estimador maximo verosmil
n
, que presentamos en el apartado c) de las propiedades de los estimadores maximo verosmiles, la varianza
2
()
puede reemplazarse por un estimador
2
(
n
), sin que ello afecte apreciablemente el grado de aproximacion).
La funcion h(
1
,
2
, . . . ,
n
; p) =
p p
p(1 p)
n
es la funcion pivote que utilizaremos, ya que sigue aproximadamente
una distribucion N(0, 1), independiente de p, y jada una realizacion muestral (x
1
, x
2
, . . . , x
n
),
x
n
p
x
n
(1x
n
)
n
es
una funcion de p continua y estrictamente monotona decreciente, por lo que, siguiendo los pasos indicados en
el metodo del pivote, buscamos dos valores a y b tales que, P{a < N(0, 1) < b} =
N(0, 1) es simetrica elegimos a y b simetricos, es decir a = b, para que el intervalo tenga la menor longitud.
las ecuaciones
_
_
x
n
p
x
n
(1x
n
)
n
= b
x
n
p
x
n
(1x
n
)
n
= b
_
_
que resolviendo respecto a p, dan los extremos del intervalo de conanza, L
i
(x
1
, x
2
, . . . , x
n
) = x
n
b
x
n
(1x
n
)
n
y L
s
(x
1
, x
2
, . . . , x
n
) = x
n
+b
x
n
(1x
n
)
n
.
Por tanto, el intervalo de conanza para p es
_
x
n
b
x
n
(1 x
n
)
n
, x
n
+b
x
n
(1 x
n
)
n
_
.
Ejemplo 8.5.9 Intervalo de conanza para la diferencia de dos proporciones.
Sean (
1
,
2
, . . . ,
n
) una m.a.s. de una poblacion B(1, p
1
), y (
1
,
2
, . . . ,
m
) una m.a.s. de una poblacion
B(1, p
2
), independientes, donde p
1
y p
2
son parametros desconocidos.
Utilizaremos como funcion pivote, h(
1
,
2
, . . . ,
n
,
1
,
2
, . . . ,
m
; p
1
p
2
) =
( p
1
p
2
) (p
1
p
2
)
p
1
(1 p
1
)
n
+
p
2
(1 p
2
)
m
, ya que, por
las mismas consideraciones hechas el el ejemplo anterior, sigue aproximadamente una distribucion N(0, 1),
independiente de p
1
p
2
, y jadas sendas realizaciones muestrales (x
1
, x
2
, . . . , x
n
) e (y
1
, y
2
, . . . , y
m
),
(x
n
y
m
) (p
1
p
2
)
x
n
(1x
n
)
n
+
y
m
(1y
m
)
m
es una funcion de p
1
p
2
continua y estrictamente monotona decreciente, por lo que, siguiendo los pasos indicados
en el metodo del pivote, buscamos dos valores a y b tales que, P{a < N(0, 1) < b} =
N(0, 1) es simetrica, elegimos a y b simetricos, es decir a = b, para que el intervalo tenga la menor longitud.
las ecuaciones
_
_
(x
n
y
m
) (p
1
p
2
)
x
n
(1x
n
)
n
+
y
m
(1y
m
)
m
= b
(x
n
y
m
) (p
1
p
2
)
x
n
(1x
n
)
n
+
y
m
(1y
m
)
m
= b
_
_
que resolviendo respecto a p
1
p
2
, dan los extremos del intervalo de conanza,
L
i
= (x
n
y
m
) b
x
n
(1 x
n
)
n
+
y
m
(1 y
m
)
m
y L
s
= (x
n
y
m
) +b
x
n
(1 x
n
)
n
+
y
m
(1 y
m
)
m
.
_
(x
n
y
m
) b
x
n
(1 x
n
)
n
+
y
m
(1 y
m
)
m
, (x
n
y
m
) +b
x
n
(1 x
n
)
n
+
y
m
(1 y
m
)
m
_
.
Observaciones sobre la longitud de un intervalo de conanza.
En el Ejemplo 8.5.1 (pag. 276) obtuvimos (x
n
b/
n, x
n
+b/
n) como intervalo de conanza para la media

de una poblacion normal de varianza
2
conocida. Recordamos que b lo obtenamos en funcion del nivel
,
luego b = b(
). La longitud de ese intervalo es:

long = 2b(
n
.
Luego la longitud de un intervalo de conanza de este tipo depende del nivel de conanza
, de la varianza
poblacional
2
y del n umero de observaciones de la muestra n. En particular, se verican los siguientes resultados:
1. Dados un nivel de conanza y un tama no muestral, cuanto mayor sea la varianza poblacional, mayor
sera la longitud del intervalo para la media poblacional.
2. Dados un nivel de conanza y una varianza poblacional, cuanto mayor sea el tama no muestral, menor
sera la longitud del intervalo para la media poblacional.
3. Dados un tama no muestral y una varianza poblacional, cuanto mayor sea el nivel de conanza, ma-
yor sera la longitud del intervalo para la media poblacional. En el Ejemplo 8.4.1 (pag. 274), obtuvimos
como intervalo de conanza para la media al nivel
= 0
95, (500
4, 502
0). Si calculamos el mismo in-

tervalo para
= 0
99, tenemos como intervalo 501
2 (4/10)(2
5758), 501
2 + (4/10)(2
5758), es decir,
(500
17, 502
23). Si utilizamos
= 0
90 como nivel, tenemos 501
2 (4/10)(1
645), 501
2 +(4/10)(1
645),
es decir (500
54, 501
858).
4. Elegir un nivel de conanza
= 1 nos llevara a considerar como intervalo de conanza todo el espacio

parametrico, con lo que la informacion de la estimacion sera nula. Por ejemplo, no nos sirve para nada
conocer que la probabilidad de un suceso esta contenida en el intervalo [0, 1], eso ya lo sabemos sin falta
de llevar a cabo ning un muestreo. As pues, se sacrica seguridad para ganar informacion.
TEMA 8.- ESTIMACI

8.1. Estimacion puntual.
Ejercicio 8.1 En un microcircuito integrado que tiene 20 conexiones. Se sabe que la probabilidad de que cada
una de ellas este mal soldada es p y que cada conexion es independiente de las demas. Si se considera una m.a.s.
del n umero de conexiones mal soldadas de n circuitos,
a) Calcular el estimador maximo verosmil de p.
b) El coste de corregir los errores por microcircuito es 3 +
2
, siendo el n umero de conexiones mal soldadas.
Calcular el estimador maximo verosmil de la esperanza del coste de la correccion por circuito. Es centrado?,
es asintoticamente insesgado?
Ejercicio 8.2 Dada una muestra aleatoria simple de tama no n de la variable aleatoria que mide la duracion
de una llamada en telefona movil sigue una distribucion exponencial de parametro 1/, donde represen-
ta la duracion promedio de las llamadas (Freeman (1995): Ingeniera de sistemas de telecomunicaciones;
KPMG (1995): Tari and interconnection in mobile communications; Mitchell, Bridger(1979): Telephone
call pricing in Europe). Se pide:
a) Obtener el e.m.v. de la media de y estudiar si es insesgado, asintoticamente insesgado y consistente.
b) Sea T
otro estimador de tal que ECM[T
] =
2
. Seg un el criterio del error cuadratico medio, cual es
mejor, el estimador maximo verosmil o T
?
c) Obtener el estimador de = 1/ por el de maxima verosimilitud y por el metodo de los momentos. Es
centrado este estimador?, y asintoticamente centrado?
Ejercicio 8.3 El tiempo de vida de una batera, en a nos, es una variable aleatoria con funcion de densidad
f
(x) =
_
1
x
(1/)1
si x > 1,
0 si x 1,
0 < < 1.
Se realiza una muestra aleatoria simple de tama no n y se pide:
a) Calcular el estimador maximo verosmil de y estudiar sus propiedades.
b) Si T
es otro estimador de con ECM[T
] =
2
2
n
, seg un el criterio del error cuadratico medio, cual es
?
c) Calcular el estimador de por el metodo de los momentos.
Ejercicio 8.4 La proporcion de impurezas (en general metales como el manganeso, vanadio, cromo, nquel,
wolframio y molibdeno) en la fabricacion de un determinado acero es una v.a. con funcion de densidad
f(x) =
_
( + 1)x
si 0 < x < 1
0 en el resto
, con > 1
de la que se extrae una m.a.s. de n observaciones. Se pide:
a) Obtener el estimador maximo verosmil de y estudiar si es centrado y asintoticamente centrado.
b) Obtener el estimador, por el metodo de los momentos, de .
Ejercicio 8.5 En una investigacion sobre la vida util de determinada pieza, se estudiaron una serie de lotes
formados por dos piezas, obteniendose los siguientes resultados:
N
o
de piezas del lote que duran mas de 4h. 0 1 2
N
o
de lotes 368 119 13
Si el fabricante arma que la v.a. =n umero de piezas que duran mas de 4h. en un lote sigue una distribucion
B(2, p), donde p representa la probabilidad de que una pieza dure mas de 4h. Se pide:
a) Obtener el e.m.v. de la proporcion de piezas por lote que duran mas de 4h (p).
b) Obtener el e.m.v. de la varianza de y estudiar si es insesgado y asintoticamente insesgado.
c) Obtener, a partir de los datos de esta muestra, la estimacion maximo verosmil de la varianza de .
d) Obtener el estimador por el metodo de los momentos de p y estudiar si es insesgado, asintoticamente
insesgado y consistente. Calcular el error cuadratico medio de dicho estimador.
Ejercicio 8.6 Se observan n componentes electronicos simultaneamente. Se detiene la observacion en el instante
t
0
, y se comprueba que k componentes se han averiado, aunque desconocemos cuando se han producido las
averas, y las restantes nk componentes funcionan. Suponiendo que el tiempo de funcionamiento hasta que se
avera una componente cualquiera sigue una distribucion exponencial de media , obtener un estimador maximo
verosmil de . Calcular la estimacion para el caso t
0
= 1, n = 100 y k = 45.
8.4. Estimacion por intervalos de conanza.
Ejercicio 8.7 La duracion en a nos de una determinada pieza es una v.a. con funcion de densidad:
f
(x) =
_
1
2
x
e
x/
si x > 0
0 si x 0
,
donde es un parametro positivo y desconocido. Se pide:
a) Encontrar un intervalo de conanza para al 95 %, a partir de una m.a.s. de tama no cuatro.
b) Cual sera ese intervalo si los valores de la muestra hubiesen sido (1, 1
2, 1
1, 1
3)?, y si la muestra hubiese

sido (1, 1
4, 1
2, 0
9)?
Ejercicio 8.8 Con el proposito de estudiar el tiempo de vida de las bateras del Ejercicio 8.3, se ha obtenido
una muestra aleatoria simple de tama no 4. Calcular, a partir del estimador maximo verosmil, un intervalo de
conanza para con nivel de conanza 0
95.
Ejercicio 8.9 El rendimiento medio obtenido en las cubiertas de una muestra de 17 automoviles de una com-
pa na de taxis fue 28000 km. con S=1800. Calcular el intervalo de conanza del 90 % para la vida media de las
cubiertas usadas por esa compa na, suponiendo normalidad en el rendimiento de las cubiertas.
Ejercicio 8.10 Dados los siguientes datos sobre el diametro de las piezas fabricadas en una fabrica: 25, 26, 20,
21, 23, 22, 21, 25, 24, 26, calcular un intervalo de conanza del 95 % para la media poblacional y otro para la
varianza poblacional, suponiendo que el diametro de dichas piezas sigue una distribucion normal.
Ejercicio 8.11 En un experimento industrial, una tarea fue realizada por ocho obreros siguiendo el metodo I,
y otros ocho operarios utilizaron el metodo II, obteniendose los siguientes resultados seg un el metodo empleado:
Media muestral Varianza muestral
Metodo I x
8
= 53
875 s
2
1
= 11
36
Metodo II y
8
= 54
5 s
2
2
= 12
5
Suponiendo normalidad e independencia, obtener un intervalo de conanza al nivel de conanza 0
95 para la
diferencias de medias, si la varianza de ambas poblaciones coincide.
Ejercicio 8.12 En un estudio de determinado proceso de inspeccion de obleas, se examinaron con un sensor de
inspeccion 200 matrices, de las cuales 60 no pasaron la prueba. Suponiendo que el proceso es estable, se pide:
a) Estimar mediante un intervalo de conanza del 99 % la proporcion p de matrices que no pasan la prueba.
Hallar la amplitud y el error de estimacion de dicho intervalo.
b) Repetir el apartado anterior con un nivel de conanza del 95 %.
Ejercicio 8.13 Algunas plantas de electricidad estan situadas cerca de ros u oceanos con objeto de que el
agua disponible pueda utilizarse para enfriar los condensadores. Suponga que, como parte de un estudio sobre
impacto ambiental, una compa na de electricidad desea estimar la temperatura media del agua que descarga de
su planta. Encontrar el tama no muestral mnimo necesario para poder estimar la verdadera temperatura media
con un error de estimacion menor o igual de 05 y un coeciente de conanza mayor o igual que 095, sabiendo
que la desviacion tpica poblacional es:
a) = 2.
b) = 1.
Ejercicio 8.14 Un instituto de opinion p ublica quiere hacer una encuesta para conocer la proporcion de indi-
viduos que estan a favor de una decision del gobierno en una poblacion.
a) A cuanta gente debe preguntar si, al aproximar la proporcion en la poblacion (p) mediante la proporcion
en la muestra ( p), se quiere cometer un error menor del 1 % con una probabilidad de al menos 095?
b) A cuanta gente debe preguntar si se quiere cometer un error menor del 20 % con una probabilidad de al
menos 090?
c) A cuanta gente debe preguntar si se quiere cometer un error menor del 1 % con una probabilidad de al
menos 099?
Ejercicio 8.15 La Universidad de Oviedo adquirio hace tres a nos un lote de ordenadores para equipar sus salas
de ordenadores. Se toma una muestra aleatoria simple formada por 100 ordenadores y se observa que a da de
hoy siguen operativos 80 de ellos.
a) Calcular un intervalo de conanza, al nivel de conanza 095, para la proporcion de ordenadores que siguen
operativos.
b) Suponiendo que el tama no de la poblacion es sucientemente grande, obtener el mnimo tama no muestral
necesario para poder estimar la proporcion poblacional p con un error de estimacion menor o igual de 0
05
y un nivel de conanza de 0
95.
Ejercicio 8.16 Un supervisor de produccion sospecha que existe una diferencia entre las proporciones p
1
y
p
2
de artculos defectuosos producidos por dos maquinas distintas. Si el supervisor quiere estimar la diferencia
entre las proporciones poblacionales, p
1
p
2
, mediante la diferencia entre las proporciones muestrales, p
1
p
2
,
con un error menor o igual de 005 y un coeciente de conanza de 095, cuantos artculos debera muestrear
aleatoriamente de cada maquina? (Supongase que n
1
= n
2
= n)
Examenes.
Ejercicio 8.17 (19-06-03) La duracion en a nos de una determinada pieza es una v.a. con funcion de densi-
dad:
f
(x) =
_
1
2
x
e
x/
si x > 0,
0 si x 0,
a) Obtener la funcion de distribucion de la v.a. =
.
b) Obtener el estimador maximo verosmil de a partir de una m.a.s. de la v.a. y estudiar si es insesgado,
asintoticamente insesgado y consistente.
Ejercicio 8.18 (17-02-04) Algunas plantas de electricidad estan situadas cerca de ros u oceanos con objeto
de que el agua disponible pueda utilizarse para enfriar los condensadores. Suponga que, como parte de un
estudio sobre impacto ambiental, una compa na de electricidad desea estimar la temperatura media del agua
que descarga de su planta. Sabiendo que la desviacion tpica poblacional es = 1
o
C, se pide:
a) Encontrar el tama no muestral mnimo necesario para poder estimar la verdadera temperatura media con
un error de estimacion menor o igual de 05 y un coeciente de conanza mayor o igual que 095.
b) Considerando una muestra de tama no n = 100, en la que la media muestral es de 22
o
C, obtener un intervalo
de conanza de la temperatura media poblacional () al nivel de conanza 0
95.
c) Realizar de nuevo el apartado a) si se supiese ademas que la temperatura del agua sigue una distribucion
normal.
Ejercicio 8.19 (21-06-04) Un hormigon de microslice, reforzado con bra de acero y mezclado en h umedo
(llamado shotcrete), que se utiliza mucho en Escandinavia, ya se esta comercializando en Estados Unidos. A n
de investigar la resistencia a la ruptura del nuevo producto, se considero una muestra aleatoria de cinco trozos
de shotcrete. Dichos trozos fueron sometidos a una comprension de 9000 psi hasta que fallaron. Los tiempos de
fallo fueron 33, 35, 42, 38 y 52 das. Si suponemos que el shotcrete tiene una distribucion de tiempo de fallo
exponencial (exp(1/)) cuando se somete a 9000 psi de compresion, se pide:
a) Obtener la estimacion maximo verosmil del tiempo medio de vida de este material, considerando los datos
de la muestra de 5 trozos.
b) Obtener, a partir del estimador maximo verosmil, un intervalo de conanza para el tiempo medio de vida
de este material, con nivel de conanza del 95 %.
Ejercicio 8.20 (06-07-05) La funcion de densidad de una v.a. viene dada por :
f(x, ) =
_
1
x
2
e
(lnx)
2
2
si 0 < x < ,
0 en otro caso,
, (, ).
a) Obtener, construyendolo paso a paso, el e.m.v. del parametro , a partir de una m.a.s. (
1
,
2
, . . . ,
n
) de
tama no n de la poblacion anterior.
b) Demostrar que la variable aleatoria = ln sigue una distribucion normal.
c) El estimador obtenido en el apartado a) es centrado para ?
d) Si n = 4 y la m.a.s. obtenida es (5
76, 3
49, 1, 7
39), calcular un intervalo de conanza para al nivel 0
95.
Ejercicio 8.21 (07-09-05) La funcion de densidad de una v.a. viene dada por:
f(x, ) =
_
1
x
si x > 1,
0 si x 1,
> 1.
a) Calcular el estimador maximo verosmil de a partir de una m.a.s. de tama no n obtenida de .
b) Demostrar que dicho estimador no es centrado, pero si es asintoticamente centrado.
Ejercicio 8.22 (07-09-06) La duracion en a nos de una determinada pieza es una v.a. con funcion de densi-
dad:
f
(x) =
_
1
2
x
e
x/
si x > 0
0 si x 0
,
donde es un parametro positivo y desconocido. A partir de una muestra aleatoria simple (
1
,
2
, . . . ,
n
), se
pide:
a) Obtener el estimador maximo verosmil de .
b) Obtener la distribucion de dicho estimador.
c) Estudiar si dicho estimador es insesgado, asintoticamente insesgado y consistente.
Ejercicio 8.23 (16-02-07) El tiempo de vida de una batera, en a nos, es una variable aleatoria con funcion
de densidad
f
(x) =
_
1
x
(1/)1
si x > 1,
0 si x 1,
0 < < 1.
a) Calcular el estimador maximo verosmil de y estudiar sus propiedades (insesgado, asintoticamente inses-
gado y consistente).
b) Si T
] =
2
2
n
?
c) Si n = 3 y la m.a.s. obtenida es (2
72, 1, 7
39), calcular, a partir del estimador maximo verosmil de apartado

a), un intervalo de conanza para al nivel de conanza 1 = 0
95.
Ejercicio 8.24 (22-06-07) El tiempo de vida de unas piezas es una variable aleatoria con funcion de densidad
f
(x) =
_
2
xe
x
2
/
si x > 0,
0 si x 0,
0 < .
A partir de una muestra aleatoria simple de tama no 4, (
1
,
2
,
3
,
4
), se pide:
c) Obtener un intervalo de conanza para al nivel 1 = 0
9, a partir de la muestra (1
8; 2
2; 1
3; 2
0).
Ejercicio 8.25 (07-09-07) Se supone que el n umero de accidentes diarios en una empresa es una variable
aleatoria con distribucion de Poisson de parametro y que todos los das se comportan igual e independien-
temente unos de otros, respecto al n umero de accidentes que ocurren. Sea (
1
,
2
, . . . ,
n
) una m.a.s. de tama no
n obtenida a partir de . Calcular:
a) El estimador maximo verosmil de .
b) El estimador maximo verosmil de , siendo la probabilidad de que en una semana no ocurra ning un
accidente. Nota.- La semana tiene 7 das laborables.
c) Comprobar que para una muestra de tama no n = 1 el estimador T(
1
) = (6)
1
es insesgado para .
Ejercicio 8.26 (05-09-08) De una poblacion se van a seleccionar aleatoriamente varios individuos como mues-
tra para estudiar la proporcion de fumadores en dicha poblacion (p).
a) Cual es el mnimo n umero de personas que deberamos seleccionar para que al estimar p mediante un
intervalo de conanza, con un coeciente de conanza del 97
8 %, el error de estimacion sea como mucho

0
05?
b) Si nalmente no se puede disponer mas que de una muestra de 300 individuos, de los que 90 eran fumadores,
cual sera un intervalo de conanza de la proporcion poblacional de fumadores al 95 %.
Ejercicio 8.27 (02-07-09) El tiempo de respuesta a un comando de edicion puede representarse mediante una
v.a. con distribucion normal y desviacion tpica = 25ms. Para estimar el tiempo medio de respuesta se
considera una m.a.s. de tama no n de la v.a. .
a) Obtener el estimador maximo verosmil de y estudiar si es insesgado, asintoticamente insesgado y consis-
tente.
b) Que tama no muestral mnimo es necesario para garantizar que el intervalo de conanza de al 95 %
resultante tendra una amplitud a lo sumo de 10ms?
Ejercicio 8.28 (16-09-09) El n
o
de solicitudes diarias de auxilio que recibe un servicio de remolque de vehcu-
los sigue una distribucion de Poisson. Se considera una m.a.s. obtenida durante 100 das seleccionados al azar,
se cuentan las solicitudes recibidas en esos 100 das y estas resultaron ser un total de 200. Con estos datos, se
pide:
a) Obtener la estimacion maximo verosmil del n umero medio de solicitudes diarias.
b) Determinar si el estimador utilizado en el apartado anterior es insesgado.
c) Obtener, suponiendo independencia entre los das, la estimacion maximo verosmil del n
o
medio de das a
la semana (7 das) en que no se realiza ninguna solicitud.
TEMA 8.- ESTIMACI

Ejercicio 8.1 a) Tenemos una m.a.s. (
1
,
2
, . . . ,
n
) de la variable aleatoria
= n umero de conexiones mal soldadas del microcircuito B(20, p)
y nos piden la obtencion del estimador maximo verosmil de p.
Vamos a proceder a derivar el logaritmo neperiano de la funcion de verosimilitud.
L(x
1
, x
2
, . . . , x
n
; p) =
n
i=1
P( = x
i
) =
n
i=1
_
20
x
i
_
p
x
i
(1 p)
20x
i
=
_
n
i=1
_
20
x
i
_
_
p
i
x
i
(1 p)
20n
i
x
i
,
ln(L(x
1
, x
2
, . . . , x
n
; p)) = ln
_
n
i=1
_
20
x
i
_
_
+
i
x
i
(ln(p)) + (20n
i
x
i
) ln(1 p),
p
ln(L(x
1
, x
2
, . . . , x
n
; p)) = 0 +
i
x
i
1
p
+ (20n
i
x
i
)
1
1 p
= 0 p =
1
20n
n
i=1
x
i
,
con lo cual el estimador maximo verosmil de p es:
T =
1
20n
n
i=1
i
=
1
20
n
.
b) Puesto que el coste de corregir los errores es una v.a. tal que = 3+
2
, el parametro a estimar (coste medio
o esperado) es = E[3 +
2
] = 3E[] +E[
2
] = 3E[] +(V ar[] +(E[])
2
) = 3(20p)+(20p(1p)+(20p)
2
) =
80p + 380p
2
.
Puesto que tanto el espacio parametrico de p ((0, 1)) como el espacio parametrico de ((0, 460)) son intervalos
abiertos, si T es el estimador maximo verosmil de p entonces T
= 80T + 380T
2
es el estimador maximo
verosmil de = 80p + 380p
2
, por lo tanto, el estimador maximo verosmil de es:
80
1
20
n
+ 380
_
1
20
n
_
2
= 4
n
+
19
20
(
n
)
2
.
Para ver si es centrado vamos a calcular la esperanza del estimador que acabamos de obtener y ver si coincide
o no con .
E
_
4
n
+
19
20
(
n
)
2
_
= 4E[
n
] +
19
20
E
_
(
n
)
2
.
Ahora bien,
E[
n
] = E[] = 20p,
E[
2
n
] = V ar[
n
] + (E[
n
])
2
=
1
n
V ar[] + (E[])
2
=
20p(1 p)
n
+ (20p)
2
,
con lo cual
E
_
4
n
+
19
20
(
n
)
2
_
= 4(20p) +
19
20
(
20p(1 p)
n
+ (20p)
2
) = 80p + 380p
2
+ 19
p(1 p)
n
= 80p + 380p
2
= ,
con lo cual el estimador maximo verosmil no es un estimador centrado, pero s es un estimador
asintoticamente centrado de , puesto que
lm
n
E
_
4
n
+
19
20
(
n
)
2
_
= lm
n
80p + 380p
2
+ 19
p(1 p)
n
= 80p + 380p
2
= .
Ejercicio 8.2 a) Estamos trabajando con una v.a. exp(1/) y queremos calcular el e.m.v. de la media
de , es decir, del parametro a partir de una muestra de tama no n, por lo que tenemos que maximizar la
funcion de verosimilitud L(x
1
, x
2
, . . . , x
n
; ).
En este caso se puede obtener el estimador maximo verosmil como solucion de la ecuacion
ln(L(
1
,
2
, . . . ,
n
; )) = 0.
Vamos a ir calculando L, ln(L), y su derivada respecto de :
L(x
1
, x
2
, . . . , x
n
; ) =
n
i=1
f
(x
i
) =
n
i=1
1
e
x
i
/
=
_
1
_
n
e
x
i
/
.
Tomando neperianos:
ln(L(x
1
, x
2
, . . . , x
n
; )) = nln()
1
i=1
x
i
.
Derivando respecto del parametro :
ln(L(x
1
, x
2
, . . . , x
n
; )) =
n
+
1
2
n
i=1
x
i
.
Igualando esta ultima cantidad a cero, obtendremos el maximo de la funcion ln(L) y en consecuencia de L:
+
1
2
n
i=1
x
i
= 0 =
i
x
i
n
por lo que se tiene que el estimador maximo verosmil de es:
T =
1
n
n
i=1
i
.
Como nos piden estudiar algunas de sus propiedades, iremos paso a paso viendo si T es insesgado, asintoti-
camente insesgado y consistente:
Insesgado.- Debemos comprobar si E[T] = .
E[T] = E
_
1
n
n
i=1
i
_
E[a] = aE[]
=
1
n
E
_
n
i=1
i
_
E[
1
+
2
] = E[
1
] +E[
2
]
=
1
n
n
i=1
E [
i
] =
i
exp(1/)
=
1
n
n
i=1
= .
As, se ha demostrado que T es un estimador insesgado de .
Asintoticamente insesgado.- Puesto que es insesgado, entonces evidentemente tambien es asintoticamente
insesgado.
E[T] = lm
n
E[T] = lm
n
= .
Consistente.- Puesto que
V ar[T] = V ar
_
1
n
n
i=1
i
_
V ar[a] = a
2
V ar[]
=
1
n
2
V ar
_
n
i=1
i
_
indep.
=
1
n
2
n
i=1
V ar [
i
] =
i
exp(1/)
=
1
n
2
n
i=1
2
=

2
n
,
T es un estimador insesgado de y lm
n
V ar[T] = lm
n
2
n
= 0, con lo que, aplicando el Teorema 8.2.1
de teora, se tiene que T es un estimador consistente de . No obstante vamos a realizar la demostracion
directamente, para ver como se hara en el caso de que no recordasemos dicho teorema.
Tenemos que comprobar si
> 0, lm
n
P(|T | ) = 0.
Aplicando la desigualdad de Chebychev a la variable aleatoria T tenemos que
> 0, P(|T E[T]| )
V ar[T]
2
,
pero como en este caso ya vimos que E[T] = y que V ar[T] =

2
n
, entonces
> 0, 0 P(|T | )

2
n
2
,
ahora bien, como los lmites conservan desigualdades de este tipo,
lm
n
0 lm
n
P(|T | ) lm
n
2
n
2

0 0
y aplicando la regla del sandwich obtenemos que lm
n
P(|T | ) = 0, es decir, que el estimador
maximo verosmil T es un estimador consistente de .
b) Para comparar el estimador T obtenido en el apartado anterior con el estimador T
, seg un el criterio del

error cuadratico medio, es necesario calcular el e.c.m. de T:
ECM[T] = E[(T )
2
] = V ar[T] + (E[T] )
2
=

2
n
+ ( )
2
=

2
n
.
Como ECM[T] =

2
n

2
= ECM[T
], T es mejor que T
seg un este criterio.

c) Puesto que hemos demostrado en el apartado a) que el estimador maximo verosmil de es:

T =
1
n
n
i=1
i
y la aplicacion h que transforma el parametro en = 1/ esta denida por:
h : (0, ) (0, )
x 1/x
entonces tenemos que el estimador maximo verosmil de 1/ es:
T
=
1
n
.
Para calcular el estimador de = 1/ por el metodo de los momentos debemos igualar el primer momento
respecto al origen poblacional con el muestral, es decir,
E[] =
n
y despejar de esta ecuacion el valor de .
Como tiene una distribucion exp(1/), sabemos que E[] = , expresion de la que al igualarla a
n
nos
da que
=
n

1
=
1
n
por lo que el estimador por el metodo de los momentos de es:
1
n
por lo que en este caso coincide (aunque en general esto no tiene porque ser cierto) con el estimador
obtenido por el metodo de maxima verosimilitud.
Centrado.- Para comprobar si verica esta propiedad debemos estudiar si es cierta la siguiente igualdad:
E[T
] = 1/.
Como T
es el inverso de
n
, tenemos que E[T
] = E
_
1
n
_
. Ahora bien, puesto que
i
exp(1/)
(1, 1/), i, entonces
n
i=1
i
(n, 1/) por la reproductividad de la gamma, y ademas, por las propie-
dades de esta distribucion, se tiene que T =
1
n
n
i=1
i
(n, n/).
As pues,
E[T
] = E
_
1
n
_
=
1
x
f
n
(x)dx =

0
1
x
(n/)
n
(n)
x
n1
e
nx/
dx =
=
(n/)
n
(n)
(n 1)
(n/)
n1

0
(n/)
n1
(n 1)
x
n2
e
nx/
dx =
(n/)
n
(n)
(n 1)
(n/)
n1

0
f
(n1,n/)
(x)dx =
(n/)
n
(n)
(n 1)
(n/)
n1
1 =
n
n 1
1
.
Como E[T
] =
n
n1
1
=
1
, n, entonces T
no es un estimador insesgado/centrado de 1/.

Asintoticamente centrado.- Debemos estudiar si se verica que lm
n
E[T
] =
1
.
Como acabamos de demostrar que E[T
] =
n
n1
1
, n, entonces tenemos que

lm
n
E[T
] = lm
n
n
n 1
1
=
1
,
por lo que T
es un estimador asintoticamente centrado de = 1/.

Ejercicio 8.3 a) Estamos trabajando con una v.a. f
(x) y queremos calcular el e.m.v. del parametro

a partir de una muestra de tama no n.
Comenzaremos pues maximizando la funcion de verosimilitud L(x
1
, x
2
, . . . , x
n
; ). En este caso se puede
obtener dicho maximo como solucion de la ecuacion:
ln(L(x
1
, x
2
, . . . , x
n
; )) = 0.
Con el n de resolver dicha ecuacion, vamos a ir calculando L, ln(L), y su derivada respecto de .
L(x
1
, x
2
, . . . , x
n
; ) =
n
i=1
f
i
(x
i
) =
n
i=1
1
x
(1/)1
i
=
1
n
n
i=1
x
(1/)1
i
.
Tomando neperianos:
ln(L(x
1
, x
2
, . . . , x
n
; )) = nln() + (
1
1)
n
i=1
ln(x
i
).
ln(L(x
1
, x
2
, . . . , x
n
; )) =
n
+
1
2
n
i=1
ln(x
i
).
+
1
2
n
i=1
ln(x
i
) = 0 =
i
ln(x
i
)
n
T =
n
i=1
ln(
i
)
n
.
Una vez hecho esto debemos estudiar si es insesgado, asintoticamente insesgado y consistente:
La expresion de e.m.v. de nos sugiere hacer el cambio de variable = ln(). Puesto que se verican las
hipotesis para utilizar el Teorema del Jacobiano:
Sopp() = (1, ),
g
(x) =
1
x
= 0, x (1, ),
podemos decir que
f
(y) =
_
f
(e
y
) |e
y
| si y g((1, ))
0 en el resto
=
_
1
(e
y
)
(1/)1
e
y
si y (g(1), g())
0 en el resto
=
_
1
e
y/
si y > 0
0 en el resto
por lo que = ln() sigue una distribucion exponencial de parametro 1/.
Si ln() exp(1/) (1, 1/), entonces
n
i=1
ln(
i
) (n, 1/) por la reproductividad de la gamma; y
ademas, por las propiedades de esta distribucion se tiene que
1
n
n
i=1
ln(
i
) (n, n/).
Hemos llegado pues a que T sigue una distribucion (n, n/), por lo que
E(
) =
n
n/
= ,
puesto que la esperanza de una (p, a) es p/a. As, se ha demostrado que T es un estimador insesgado
de .
insesgado.
E[T] = lm
n
E[T] = lm
n
= .
Consistente.- Puesto que V ar[T] =
n
(n/)
2
=

2
n
, puesto que la varianza de una gamma (p, a) es p/a
2
, T
es un estimador insesgado de y lm
n
V ar[T] = lm
n
2
n
= 0, con lo que, aplicando el Teorema 8.2.1 de
teora, se tiene que T es un estimador consistente de .
Si queremos resolver esta cuestion directamente, sin aplicar dicho teorema, tenemos que comprobar si
> 0, lm
n
P(|T | ) = 0.
> 0, P(|T E[T]| )
V ar[T]
2
,

2
n
, entonces
> 0, 0 P(|T | )

2
n
2
,
lm
n
0 lm
n
P(|T | ) lm
n
2
n
2

0 0
n

ECM[T] = E[(T )
2
] = V ar[T] + (E[T] )
2
=

2
n
+ ( )
2
=

2
n
.
Como ECM[T] =

2
n

2
2
n
= ECM[T
], T es mejor que T

c) Para calcular el estimador de por el metodo de los momentos, al que vamos a denotar por T
, debemos
igualar el primer momento respecto al origen poblacional con el muestral (una sola ecuacion pues tenemos
una sola incognita que es ), es decir,
E() =
n
y despejar de esta ecuacion el valor de .
Calculamos la esperanza de , obteniendo que
E() =

1
x
1
x
(1/)1
x =

1
1
x
(1/)
x =
1
1
1
+ 1
x
(1/)+1
_
1
=
1
1
=
1
1
expresion de la que al igualar a
n
obtenemos que
1
1
=
n
=

n
1
n
por lo que el estimador por el metodo de los momentos de es:
T
=

n
1
n
.
Ejercicio 8.4 Si representamos por la v.a. (poblacion) con funcion de densidad f(x), entonces la muestra
aleatoria simple de tama no n puede ser representada por (
1
,
2
, . . . ,
n
).
a) El e.m.v. de puede obtenerse, en este caso, como solucion de la ecuacion

ln(L(
1
,
2
, . . . ,
n
; )) = 0.
Puesto que
L(x
1
, x
2
, . . . , x
n
; ) =
n
i=1
f(x
i
) =
n
i=1
( + 1)x
i
= ( + 1)
n
(
i
x
i
)
,
ln(L(x
1
, x
2
, . . . , x
n
; )) = nln( + 1) +
n
i=1
ln(x
i
),
ln(L(x
1
, x
2
, . . . , x
n
; )) = n
1
+ 1
+
n
i=1
ln(x
i
),
la ecuacion anterior se transforma en
n
1
+ 1
+
n
i=1
ln(x
i
) = 0 =
n
i
ln(x
i
)
1,
con lo que el estimador maximo verosmil de es
T
1
=
n
i
(ln(
i
))
1.
Centrado.- Para comprobar si verica esta propiedad debemos estudiar si es cierta la siguiente igualdad:
E[T
1
] = . Puesto que T
1
=
n
i
(ln(
i
))
1, debemos realizar el cambio de variable = ln(). Como
f(x), Sopp() = (0, 1) y g(x) = ln(x) g
(x) =
1
x
= 0, x (0, 1), se tiene, aplicando el teorema,
que la funcion de densidad de = ln() es:
f
(y) = f
(e
y
) |e
y
| =
_
( + 1)(e
y
)
e
y
si 0 < e
y
< 1
0 en el resto
=
_
( + 1)e
(+1)y
si y > 0
0 en el resto
por lo que = ln() sigue una distribucion exponencial de parametro + 1.
Si ln(
i
) exp( +1) (1, +1), i, entonces
n
i=1
ln(
i
) (n, +1) por la reproductividad de la
gamma, y ademas, por las propiedades de esta distribucion, se tiene que =
1
n
n
i=1
ln(
i
) (n, n(+1)).
As pues, E[T
1
] = E[
n
n
i=1
(ln(
i
))
1] = E[
n
n
i=1
(ln(
i
))
] 1. Ahora bien, como
E[
n
n
i=1
(ln(
i
))
] = E
_
1
_
=
1
x
f
(x)dx =

0
1
x
(n( + 1))
n
(n)
x
n1
e
n(+1)x
dx =
=
(n( + 1))
n
(n)
(n 1)
(n( + 1))
n1

0
(n( + 1))
n1
(n 1)
x
n2
e
n(+1)x
dx =
(n( + 1))
n
(n)
(n 1)
(n( + 1))
n1

0
f
(n1,n(+1))
(x)dx =
(n( + 1))
n
(n)
(n 1)
(n( + 1))
n1
1 =
n( + 1)
n 1
,
con lo cual
E[T
1
] = E
_
1
_
1 =
n( + 1)
n 1
1 =
n + 1
n 1
= .
As pues, T
1
no es un estimador insesgado/centrado de .
Asintoticamente centrado.- Debemos estudiar si se verica que lm
n
E[T
1
] = .
Como acabamos de demostrar que E[T
1
] =
n+1
n1
, n, entonces tenemos que
lm
n
E[T
1
] = lm
n
n + 1
n 1
= ,
por lo que T
1
es un estimador asintoticamente centrado de .
b) El estimador por el metodo de los momentos de es la solucion de la ecuacion E[] =
n
. Ahora bien, como
f(x), entonces
E[] =
xf(x)dx =
1
0
( + 1)x
+1
dx
+ 1
+ 2
y por tanto
+ 1
+ 2
=
n
+ 1 =
n
+ 2
n
=
2
n
1
1
n
con lo que el estimador por el metodo de los momentos de es:
T
2
=
2
n
1
1
n
.
Ejercicio 8.5 a) Para obtener el estimador maximo verosmil de p debemos encontrar, en este caso, la solucion
de la ecuacion
p
ln(L(
1
,
2
, . . . ,
n
; p)) = 0.
Ahora bien, puesto que es una variable aleatoria discreta, tenemos que
L(x
1
, x
2
, . . . , x
n
; p) =
n
i=1
P( = x
i
) =
n
i=1
_
2
x
i
_
p
x
i
(1 p)
2x
i
=
_
n
i=1
_
2
x
i
_
_
p
i
x
i
(1 p)
2n
i
x
i
.
A partir de aqu, aplicando el neperiano y derivando obtenemos que
ln(L(x
1
, x
2
, . . . , x
n
; p)) = ln
_
n
i=1
_
2
x
i
_
_
+
n
i=1
x
i
ln(p) +
_
2n
n
i=1
x
i
_
ln(1 p),
p
ln(L(x
1
, x
2
, . . . , x
n
; p)) = 0 +
n
i=1
x
i
1
p
+
_
2n
n
i=1
x
i
_
1
1 p
,
y por tanto el estimador maximo verosmil de p es la solucion de la ecuacion
n
i=1
x
i
1
p

_
2n
n
i=1
x
i
_
1
1 p
= 0 p =
1
2n
n
i=1
x
i
,
es decir, el estimador maximo verosmil de p es
1
2n
n
i=1
i
=

n
2
.
b) Puesto que la variable aleatoria sigue una distribucion B(2, p), su varianza es V ar() = 2p(1 p), con lo
que el parametro que queremos estimar es 2p(1p). Puesto que dicho parametro es funcion de p, resulta mas
sencillo obtener el e.m.v. del parametro 2p(1 p) a partir de la expresion del estimador maximo verosmil
de p, que directamente.
Puesto que el parametro 2p(1 p) se puede poner como g(p), con
g : (0, 1) (0, 1/2)
x 2x(1 x)
entonces hemos demostrado en teora (Propiedad b) de la pagina 272) que el estimador maximo verosmil
del parametro 2p(1 p) = g(p) es g(
n
) =
2
n
2
(1

n
2
) =

n
2
(2
n
).
Nos falta estudiar si T

n
2
(2
n
) es insesgado y/o asintoticamente insesgado. Para ello es necesario
calcular la esperanza del estimador,
E[T] = E[
n
2
(2
n
)] =
1
2
_
2E[
n
] E[
2
n
]
_
.
Ahora bien,
E[
n
] = E[
1
n
n
i=1
i
] =
1
n
n
i=1
E[
i
] =
1
n
n
i=1
2p =
1
n
n2p = 2p,
puesto que al ser
1
,
2
, . . . ,
n
una m.a.s. de , todas ellas tienen la misma distribucion que , en este caso
B(2, p).
Por otro lado,
E[
2
n
] = V ar[
n
] + (E[
n
])
2
=
2p(1 p)
n
+ (2p)
2
,
puesto que por ser
1
,
2
, . . . ,
n
una m.a.s. de , ademas de igualmente distribuidas, son todas independientes
entre s, con lo que
V ar[
n
] = V ar[
1
n
n
i=1
i
] =
1
n
2
n
i=1
V ar[
i
] =
=
1
n
2
n
i=1
2p(1 p) =
1
n
2
n2p(1 p) =
2p(1 p)
n
.
E[T] =
1
2
_
2E[
n
] E[
2
n
]
_
=
1
2
_
2 2 p
_
2p(1 p)
n
+ (2p)
2
__
= 2p(1 p)
p(1 p)
n
= 2p(1 p),
y puesto que
lm
n
E[T] = lm
n
2p(1 p)
p(1 p)
n
= 2p(1 p), podemos decir que el estimador maximo verosmil de
2p(1 p) no es insesgado, pero s asintoticamente insesgado.
c) Puesto que el n umero medio de piezas en un lote que duran mas de 4h. de las 500 piezas de la muestra es:
x
500
=
0 368 + 1 119 + 2 13
500
= 0
29,
la estimacion maximo verosmil de la varianza de , teniendo en cuenta que el estimador maximo
verosmil era

n
2
(2
n
), es
x
n
2
(2 x
n
) =
0
29
2
(2 0
29) = 0248.
d) Para obtener el estimador por el metodo de los momentos de p igualamos la media muestral con la media
de la variable aleatoria para la que hemos obtenido la muestra. En este caso:
n
= 2p p =

n
2
,
con lo cual el estimador por el metodo de los momentos de p es

n
2
. (De nuevo vuelve a coincidir
con el e.m.v. de p calculado en el apartado a), aunque hay que resalta que esto no tiene porque ser cierto
en general).
Para estudiar si es insesgado, como hemos visto que E[
n
] = 2p, entonces E[
n
2
] =
1
2
E[
n
] = p, con lo cual el
estimador de p por el metodo de los momentos es insesgado, lo que implica que tambien es asintoticamente
insesgado.
Para estudiar si es consistente debemos comprobar si se verica que lm
n
P(|
n
2
p| > ) = 0, > 0. Ahora
bien, como E[
n
/2] = 2p/2 = p y V ar[
n
/2] =
2p(1p)
4n
=
p(1p)
2n
n
0, entonces, aplicando el Teorema
8.2.1 (pag. 268), tenemos que
n
/2 es un estimador consistente de p.
Ejercicio 8.6 Aunque nos hablan de una variable aleatoria (tiempo de vida de una componente) con distri-
bucion exponencial de media , es decir, exp(1/), no tenemos muestra de esta variable (no conocemos n
tiempos de vida), sino de la variable
=
_
1 si el componente ya no funciona en el instante t
0
,
0 si el componente sigue funcionando en el instante t
0
.
Puesto que de la variable no tenemos muestra, no nos sirve de nada trabajar con ella, pues al nal no
llegaramos a poder estimar , con lo que tenemos que trabajar con la variable aleatoria .
Ahora bien, p P(exito) = P(ya no funcione en el instante t
0
) = P( < t
0
) =
t
0
0
1
e
y/
dy = 1 e
t
0
/
=
t
0
ln(1p)
, con lo cual, si obtenemos el estimador maximo verosmil de p, podemos transformarlo facilmente
para obtener el e.m.v. de .
Obtencion del estimador maximo verosmil de p:
Tenemos una muestra aleatoria simple de tama no n de una v.a. B(1, p), y debemos obtener la derivada del
logaritmo neperiano de la funcion de verosimilitud.
L(x
1
, x
2
, . . . , x
n
; p) =
n
i=1
P( = x
i
) =
n
i=1
_
1
x
i
_
p
x
i
(1 p)
1x
i
=
_
n
i=1
_
1
x
i
_
_
p
i
x
i
(1 p)
n
i
x
i
,
ln(L(x
1
, x
2
, . . . , x
n
; p)) = ln
_
n
i=1
_
1
x
i
_
_
+
n
i=1
x
i
(ln(p)) +
_
n
n
i=1
x
i
_
ln(1 p),
p
ln(L(x
1
, x
2
, . . . , x
n
; p)) = 0 +
n
i=1
x
i
1
p
+
_
n
n
i=1
x
i
_
1
1 p
= 0 p =
1
n
n
i=1
x
i
,
con lo cual el estimador maximo verosmil de p es:
T =
1
n
n
i=1
i
=
n
,
y por tanto, el estimador maximo verosmil de es:
t
0
ln(1
n
)
.
En el caso particular de que n = 100, k = 45, t
0
= 1, entonces tenemos 45 componentes que ya no funcionan en
el instante t
0
y los 55 restantes a un funcionan, es decir, tenemos 45 unos en la muestra y 55 ceros. As pues,
100
i=1
x
i
= 45 y por tanto la estimacion maximo verosmil de con estos datos sera:
1
ln(1 (45/100))
= 1
673.
Ejercicio 8.7 a) Nos piden que calculemos un I.C. para con coeciente de conanza 095 a partir de una
muestra de tama no 4. Como la distribucion de la variable no es normal y ademas no nos piden un intervalo
de conanza de la media (pues se tiene que E() = 2
2
), no podemos calcular el intervalo a partir de los
estadsticos conocidos (si la distribucion no es normal, las funciones pivotales obtenidas a partir del T.C.L.
solo se utilizan para intervalos de las medias), por lo que la unica posibilidad que nos queda es obtener el
estimador maximo verosmil de y a partir de el una funcion pivotal que nos permita aplicar el metodo del
pivote.
En este caso, el e.m.v. de es la solucion de la ecuacion

ln(L(
1
,
2
,
3
,
4
; )) = 0. Vamos a comenzar
calculando la funcion de verosimilitud:
L(x
1
, x
2
, x
3
, x
4
; ) =
4
i=1
f
(x
i
) =
4
i=1
1
2
x
i
e
x
i
/
=
1
2
4
x
i
e
x
i
/
.
Tomando neperianos:
ln(L(x
1
, x
2
, x
3
, x
4
; )) = 4ln(2) 4ln()
i
ln(
x
i
)

i
x
i
.
ln(L(x
1
, x
2
, x
3
, x
4
; )) = 0
4
0 +

i
x
i
2
.
4
+

i
x
i
2
= 0 =
4
i=1
x
i
4
por lo que el estimador maximo verosmil de es

T =
1
4
4
i=1
i
.
Vamos a calcular la funcion de densidad de la nueva v.a. =
aplicando el teorema del cambio de variable,

puesto que
Sopp() = (0, ), g
(x) =
1
2
x
= 0, x (0, ).
As pues,
f
(y) =
_
f
(g
1
(y))|(g
1
(y))
| si y g((0, ))
0 en el resto
=
=
_
1
2
y
2
e
y
2
/
|2y| si y (0, )
0 en el resto
=
_
1
e
y/
si y > 0
0 si y 0
,
y por tanto, exp(
1
) (1,
1
). Aplicando ahora la reproductividad de la gamma y las propiedades de

dicha distribucion tenemos que
4
i=1
i
(4,
1
) T =
i
4
(4,
4
).
Como queremos hacer el I.C. a traves del metodo del pivote, tenemos que encontrar a partir del e.m.v.
una funcion que sea continua y estrictamente monotona respecto a y que ademas tenga una distribucion
independiente de . Si multiplicamos y dividimos el e.m.v. adecuadamente, tenemos que
8
T =
2
i=1
i
(4,
4/
8/
) (4,
1
2
)
2
8
.
As, si consideramos T
(
1
,
2
,
3
,
4
; ) =
2
i=1
i
, este T
como funcion de es estrictamente decreciente y

continua, y ademas su distribucion es una chi-cuadrado con 8 grados de libertad, por lo que es independiente
de , y por tanto nos sirve como funcion pivotal.
Ahora, si calculamos los valores a y b tales que P(a <
2
8
< b) = 0
95, tendremos acotada nuestra funcion

T
entre estos dos valores. Vamos pues a calcularlos:

Buscamos el a y el b que verican que dejan entre ellos una probabilidad de 095, por lo que por convenio se
buscan aquellos valores en los cuales P(
2
8
< a) = 0
025 y P(
2
8
< b) = 0
975. As, tenemos que a = 2
1797
y b = 17
5345, por lo que al ser T
una funcion con distribucion

2
8
, tambien estara acotada entre estas dos
cantidades con probabilidad 0
95, y a partir de esto podemos despejar , pues as conseguiramos acotar el

parametro entre dos cantidades conocidas una vez que se conoce la muestra:
0
95 = p
_
2
1797 <
2
i=1
i
< 17
5345
_
= p
_
2
17
5345
4
i=1
i
< <
2
2
1797
4
i=1
i
_
,
y por tanto el intervalo de conanza pedido para es
_
0
114
4
i=1
x
i
, 0
917
4
i=1
x
i
_
.
b) En el primer caso el intervalo de conanza obtenido es:
_
0
114(
1 +
2 +
1 +
3), 0
917(
1 +
2 +
1 +
3)
_
= (0
488, 3
929).
En el segundo caso, el intervalo es:
_
0
114(
1 +
4 +
2 +
9), 0
917(
1 +
4 +
2 +
9)
_
= (0
482, 3
876).
Ejercicio 8.8 Nos piden que calculemos un I.C. para con coeciente de conanza 095 a partir del estimador
maximo verosmil. Seg un vimos en el Ejercicio 8.3, el estimador maximo verosmil de es, en general,
n
i=1
ln(
i
)
n
.
Como en este caso la muestra es de tama no 4, el estimador maximo verosmil de es

T =
4
i=1
ln(
i
)
4
.
Seg un vimos tambien en el Ejercicio 8.3, la distribucion de T es (4, 4/).
Como queremos hacer el I.C. a traves del metodo del pivote, tenemos que encontrar a partir del e.m.v. una fun-
cion que sea continua y estrictamente monotona respecto a y que ademas tenga una distribucion independiente
de . Si multiplicamos y dividimos el e.m.v. adecuadamente, tenemos que
8
T =
2
i=1
ln(
i
) (4,
4/
8/
) (4,
1
2
)
2
8
.
As, si consideramos T
(
1
,
2
,
3
,
4
; ) =
2
i=1
ln(
i
), este T
como funcion de es estrictamente decreciente

y continua, y ademas su distribucion es una chi-cuadrado con 8 grados de libertad, por lo que es independiente
de , y por tanto nos sirve como funcion pivotal.
Ahora, si calculamos los valores a y b tales que P(a <
2
8
< b) = 0
95, tendremos acotada nuestra funcion T
entre estos dos valores. Vamos pues a calcularlos:

Buscamos el a y el b que verican que dejan entre ellos una probabilidad de 095, por lo que por convenio se
buscan aquellos valores en los cuales P(
2
8
< a) = 0
025 y P(
2
8
< b) = 0
975. As, tenemos que a = 2
1797
y b = 17
5345, por lo que al ser T
una funcion con distribucion

2
8
, tambien estara acotada entre estas dos
cantidades con probabilidad 0
95, y a partir de esto podemos despejar , pues as conseguiramos acotar el

parametro entre dos cantidades conocidas una vez que se conoce la muestra:
0
95 = p
_
2
1797 <
2
i=1
ln(
i
) < 17
5345
_
= p
_
2
17
5345
4
i=1
ln(
i
) < <
2
2
1797
4
i=1
ln(
i
)
_
,
y por tanto el intervalo de conanza pedido para es
_
0
114
4
i=1
ln(x
i
), 0
918
4
i=1
ln(x
i
)
_
.
Ejercicio 8.9 En vista del enunciado del ejercicio, disponemos de una muestra
1
,
2
, . . . ,
17
de la variable
aleatoria denida por = rendimiento obtenido en las llantascon distribucion N(, ), donde tanto
como son valores desconocidos. Para dicha muestra sabemos que x
17
= 28000 y que S = 1800. Con todo
esto nos piden obtener un intervalo de conanza para con coeciente de conanza 09.
I.C. de al 09
Para obtener este intervalo vamos a aplicar el metodo del pivote que consta de tres partes:
1. Obtener la funcion pivotal T:
Cuando la distribucion de la variable es normal y queremos obtener un intervalo de conanza de la media,
de la varianza o de la desviacion tpica de la variable, la funcion pivotal adecuada puede encontrarse en la
tabla titulada DISTRIBUCIONES DE ALGUNAS FUNCIONES PIVOTALES. La eleccion de uno u
otro estadstico en esta tabla se hace teniendo en cuenta el parametro que queremos estimar y los datos de
los que disponemos. En este caso, puesto que queremos estimar la media poblacional () los estadsticos
adecuados seran los numerados como 1. o 2. en la citada tabla, sin embargo solo puede utilizarse en 2.,
pues en el 1. aparece el parametro que en este problema es desconocido.
As, si consideramos T =

17
S/
17
, este estadstico nos sirve como funcion pivotal puesto que
La distribucion de T es una t
16
, por lo tanto independiente de .
T considerada como funcion de es una funcion continua y estrictamente decreciente.
Por lo tanto este paso ya esta resuelto, la funcion pivotal es T =

17
S/
17
que tiene distribucion t
16
.
2. Calculo de los valores a y b tales que P(a < T < b) = 0
9:
Puesto que T tiene una distribucion t
16
y dicha distribucion es simetrica respecto a cero, es evidente, a la
vista de la Figura 8.1, que a = b.
Figura 8.1: Funcion de densidad de t
16
.
Observando la graca anterior se puede ver que lo que buscamos es el b tal que P(t
16
< b) = 0
95, y por
tanto tenemos que b = 1
7459.
3. Despejo :
Puesto que tenemos que P(1
7459 <

17
S/
17
< 1
7459) = 0
9 y por otro lado tenemos que

P(1
7459 <

17
S/
17
< 1
7459) = P(1
7459

S
17
<
17
< 1
7459

S
17
) =
P(
17
1
7459

S
17
< <
17
+ 1
7459

S
17
) = P(
17
+ 1
7459

S
17
> >
17
1
7459

S
17
),
tenemos acotado entre dos cantidades aleatorias con probabilidad 0
9, por lo que podemos concluir que

el intervalo de conanza para con coeciente de conanza 0
9 es
_
x
17
1
7459
17
, x
17
+ 1
7459
17
_
,
y en este ejercicio, puesto que x
17
= 28000 y S = 1800, tenemos que el intervalo de conanza buscado
es
_
28000 1
7459
1855
17
, 28000 + 1
7459
1855
17
_
= (27214
4, 28785
6), puesto que tenemos que
S =
n
n1
S =
17
16
1800 = 1855
4.
Ejercicio 8.10 Disponemos de una muestra aleatoria simple
1
,
2
, . . . ,
10
de la variable aleatoria denida
por = diametro de la piezacon distribucion N(, ), donde tanto como son valores desconocidos.
Para dicha muestra sabemos que x
10
=
25+26+...+26
10
= 23
3 y que S =
25
2
+26
2
+...+26
2
10
(23
3)
2
= 2
1. Con
todo esto nos piden obtener un intervalo de conanza para y otro para
2
con coeciente de conanza 095.
Empezaremos con el intervalo de conanza de la media (observese que salvo por los n umeros esta parte del
ejercicio es exactamente igual que el Ejercicio 8.9).
I.C. de al 095
Para obtener este intervalo vamos a aplicar el metodo del pivote:
Cuando la distribucion de la variable es normal y queremos obtener un intervalo de conanza de la media
con varianza poblacional (
2
) desconocida, buscamos una funcion pivotal adecuada en la tabla DISTRI-
BUCIONES DE ALGUNAS FUNCIONES PIVOTALES. En vista de los datos y por un razonamiento
analogo al realizado en el Ejercicio 8.9, obtenemos que la funcion pivotal es T =

10
S/
10
que tiene
distribucion t
9
. Este estadstico sirve como funcion pivotal para calcular un I.C. de puesto que
9
, por lo tanto independiente de .
T considerada como funcion de es una funcion continua y estrictamente decreciente.
95:
9
y dicha distribucion es simetrica respecto a cero, en realidad lo
que buscamos es el b tal que P(b < t
9
< b) = 0
95, o lo que es lo mismo (puede verse en la Figura 8.2),

el b tal que P(t
9
< b) = 0
975. De aqu obtenemos que b = 2
2622.
9
.
3. Despejo :
Puesto que
0
95 = P(2
2622 <

10
S/
10
< 2
2622) = P(
10
2
2622
10
< <
10
+ 2
2622
10
),
tenemos acotado entre dos cantidades aleatorias con probabilidad 0
95, por lo que podemos concluir que

el intervalo de conanza para con coeciente de conanza 0
95 es
_
x
10
2
2622
10
, x
10
+ 2
2622
10
_
,
y en este ejercicio, puesto que x
10
= 23
3 y

S =
10
9
2
1 = 2
214, tenemos que el intervalo de conanza

buscado es
_
23
3 2
2622
2
214
10
, 23
3 + 2
2622
2
214
10
_
= (21
717, 24
884).
I.C. de
2
al 095
Cuando la distribucion de la variable es normal y queremos obtener un intervalo de conanza de la varianza
poblacional (
2
), buscamos una funcion pivotal adecuada en la tabla DISTRIBUCIONES DE ALGUNAS
FUNCIONES PIVOTALES. En este caso la funcion pivotal es T =
10S
2
2
que tiene distribucion
2
9
. Este estadstico sirve como funcion pivotal para calcular un I.C. de
2
puesto que
La distribucion de T es una
2
9
, por lo tanto independiente de
2
.
T considerada como funcion de
2
es una funcion continua y estrictamente decreciente.
Figura 8.3: Funcion de densidad de
2
9
.
2. Calculo del a y el b tales que P(a < T < b) = 0
95:
Puesto que T tiene una distribucion
2
9
, lo que busco son el a y el b (ahora no es simetrica, como puede
verse en la Figura 8.3, as que no bastara con encontrar uno de ellos) tales que
P(
2
9
< a) = 0
025 y P(
2
9
< b) = 0
975,
por lo que
a = 2
700 y b = 19
023.
3. Despejo
2
:
Puesto que tenemos que
0
95 = P(2
7 <
10S
2
2
< 19
023) = P(
10S
2
19
023
<
2
<
10S
2
2
7
),
hemos conseguido acotar
2
entre dos cantidades aleatorias con probabilidad 0
95, por lo que podemos

concluir que el intervalo de conanza para
2
con coeciente de conanza 0
95 es
_
10S
2
19
023
,
10S
2
2
7
_
, es decir,
el intervalo de conanza buscado, al nivel 09, es
_
10(2
1)
2
19
023
,
10(2
1)
2
2
7
_
= (2
318, 16
331).
Ejercicio 8.11 En este ejercicio tenemos una muestra
1
,
2
, . . . ,
8
de la variable aleatoria denida por
= resultado por el metodo Icon distribucion N(
1
,
1
) y tambien tenemos una muestra
1
,
2
, . . . ,
8
de la variable aleatoria denida por = resultado por el metodo IIcon distribucion N(
2
,
2
);
podemos observar que tanto
1
y
1
como
2
y
2
son valores desconocidos. Para dichas muestras sabemos que
x
8
= 53
875, S
2
1
= 11
36, y
8
= 54
5 y S
2
2
= 12
5. Con todo esto nos piden obtener un intervalo de conanza

para
1
2
I.C. de
1
2
al 095
Cuando la distribucion de las variables es normal, y pueden considerarse ambas variables independientes,
para obtener un intervalo de conanza de la diferencia de medias con varianzas poblacionales (
2
1
y
2
2
) iguales buscamos una funcion pivotal adecuada en la tabla DISTRIBUCIONES DE ALGUNAS
FUNCIONES PIVOTALES. En vista de los datos obtenemos que la funcion pivotal es
T =
(
8
8
) (
1
2
)
8S
2
1
+8S
2
2
88(8+82)
(8 + 8)
que tiene distribucion t
8+82
. Este estadstico sirve como funcion pivotal para calcular un I.C. de
2
puesto que
14
, por lo tanto independiente de
1
2
.
T considerada como funcion de
1
2
es una funcion continua y estrictamente decreciente.
14
.
95:
14
y dicha distribucion es simetrica respecto a cero (ver Figura 8.4),
en realidad lo que buscamos es el b tal que P(b < t
14
< b) = 0
95, o lo que es lo mismo, el b tal que

P(t
14
< b) = 0
145.
3. Despejo
1
2
:
Puesto que tenemos que
0
95 = P(2
145 <
(
8
8
) (
1
2
)
8S
2
1
+8S
2
2
88(8+82)
(8 + 8)
< 2
145) =
= p
_
(
8
8
) 2
145
8S
2
1
+ 8S
2
2
896
(16) <
1
2
< (
8
8
) + 2
145
8S
2
1
+ 8S
2
2
896
(16)
_
,
tenemos
1
2
acotado entre dos cantidades aleatorias con probabilidad 0
95, por lo que podemos concluir

que el intervalo de conanza para
1
2
con coeciente de conanza 0
95 es
_
(x
8
y
8
) 2
145
8S
2
1
+ 8S
2
2
896
(16), (x
8
y
8
) + 2
145
8S
2
1
+ 8S
2
2
896
(16)
_
,
que con nuestros datos se transforma en
_
(53
875 54
5) 2
145
8 11
36 + 8 12
5
896
(16), (53
875 54
5) + 2
145
8 11
36 + 8 12
5
896
(16)
_
=
= (4
585, 3
335).
Ejercicio 8.12 a) En este caso el experimento nos proporciona una muestra aleatoria simple
1
, . . . ,
200
de
la variable aleatoria denida por
=
_
1 si la persona se cura (p),
0 si la persona no se cura (1 p),
es decir B(1, p) donde p es la probabilidad de curarse, que es lo que queremos estimar. Para dicha
muestra sabemos que x
60
= p =
60
200
= 0
3 y con esto nos piden obtener un intervalo de conanza para p

I.C. de p al 099
Como queremos obtener un I.C. de una proporcion p y el tama no muestral es 200 30, podemos utilizar
la funcion pivotal 8 de la tabla DISTRIBUCIONES DE ALGUNAS FUNCIONES PIVOTALES.
As pues, tenemos que
p p
p(1 p)
200
N(0, 1),
puesto que n es sucientemente grande para que p(1 p) se pueda aproximar por p(1 p).
Esta funcion sirve como funcion pivotal para calcular un I.C. de p puesto que
La distribucion de T se considera N(0, 1), por lo tanto independiente de p.
T considerada como funcion de p es una funcion continua y estrictamente decreciente.
99:
Puesto que T tiene una distribucion N(0, 1) y dicha distribucion es simetrica respecto a cero (ver
Figura 8.5), en realidad lo que buscamos es el b tal que P(b < N(0, 1) < b) = 0
99, o lo que es lo
mismo, el b tal que P(N(0, 1) < b) = 0
576.
Figura 8.5: Funcion de densidad de N(0, 1).
3. Despejo p:
Hemos demostrado que
0
99 = p
_
_
2
576 <
p p
p(1 p)
200
< 2
576
_
_
= p
_
p 2
576
p(1 p)
200
< p < p + 2
576
p(1 p)
200
_
.
Con lo que tenemos que el intervalo de conanza para p con coeciente de conanza 0
99 es,
_
p 2
576
p(1 p)
200
< p < p + 2
576
p(1 p)
200
_
,
y por tanto, con los datos de este ejercicio obtenemos que el intervalo de conanza buscado es
_
_
0
3 2
576
3(1 0
3)
200
, 0
3 + 2
576
3(1 0
3)
200
_
_
= (0
217, 0
383).
La amplitud de dicho intervalo es: 0
383 0
217 = 0166 y el error de estimacion es: 0083.

b) Siguiendo exactamente los mismos pasos del apartado a), a la hora de calcular el intervalo de conanza de
p con coeciente de conanza 0
95 solo cambiara el paso 2., en el que buscaramos el b tal que P(N(0, 1) <
b) = 0
975 que es b = 1
96, por lo tanto obtendramos que el intervalo buscado es

_
0
3 1
96
3(1 0
3)
200
, 0
3 + 1
96
3(1 0
3)
200
_
= (0237,0364).
Como la amplitud de un intervalo es el extremo superior menos el inferior, en este caso tenemos que dicha
amplitud es 0127, puesto que
_
0
3 + 1
96
3(1 0
3)
200
_
_
0
3 1
96
3(1 0
3)
200
_
= 2 1
96
3(1 0
3)
200
= 0
127,
y el error de estimacion es 00635, puesto que
1
96
3(1 0
3)
200
= 0
0635.
Ejercicio 8.13 Estamos trabajando con una variable aleatoria de media y desviacion tpica , para la
que se desea encontrar el tama no muestral mnimo n de forma que una m.a.s. de dicho tama no verique que
P(|
n
| 0
5) 0
95. El valor de se supone conocido en los dos apartados y vamos a denotarlo en general
por
0
. As pues, comenzaremos suponiendo que n 30 y aplicando el Teorema Central de Lmite, con lo que
tenemos que
n
N(,

o
n
) y, por tanto,
P(|
n
| 0
5) = P(|
0
/
n
|
0
0
) 0
95
0
0
1
96,
puesto que para una N(0, 1) se tiene que P(|N(0, 1)| 1
96) = 0
95.
Despejando n se obtiene que
0
0
1
96
n
1
96
0
0
5
= 3
92
0
n (3
92
0
)
2
= 15
3664
2
0
.
Vamos a ir viendo que condiciones nos da esto para n, seg un los distintos valores de
0
considerados en el
ejercicio.
a) Si
0
= 2, entonces hemos obtenido que la restriccion impuesta es cierta siempre que n 15
3664
2
0
=
15
3664(2)
2
= 61
4656, con lo cual puesto que hemos supuesto que n 30, el tama no muestral es de 62.
b) Si
0
= 1, en este caso tenemos que n 15
3664
2
0
= 15
3664(1)
2
= 15
3664, con lo cual puesto que hemos

supuesto que n 30, y en este caso sabemos que la restriccion es vericada siempre que n 15
3664, seg un
el Teorema Central del Lmite hemos obtenido que es necesario que n = 30 para que sean ciertas ambas
armaciones.
Ejercicio 8.14 a) n = 9604.
b) n = 30.
c) Queremos estimar la proporcion p de personas que estan a favor en la poblacion. La forma de estimar
(aproximar) este valor desconocido es tomando una muestra aleatoria simple de tama no n de la poblacion
y calculando la proporcion de personas a favor en dicha muestra ( p). Evidentemente, queremos que esta
aproximacion sea buena, en este caso, con un error menor del 1 %, es decir, buscamos el tama no muestral
para que | p p| < 0
01. Ahora bien, como p es desconocido, es imposible saber para que valores de n se
verica que | p p| < 0
01, y lo mas que podemos asegurar es que esto se vericara con una probabilidad
alta, en este caso, 0
99. As pues, buscamos el mnimo valor de n con el que podemos garantizar que
P(| p p| < 0
01) 0
99.
Si consideramos la v.a. denida por
=
_
1 si la persona esta a favor,
0 si la persona esta en contra,
como la probabilidad de elegir una persona y que este a favor es p, tenemos que B(1, p). Puesto que si
preguntamos a n personas tenemos una muestra (
1
,
2
, . . . ,
n
) de tama no n de , la suma de todas las
i
nos dara el n umero de personas a favor en la muestra, es decir,
p =
n
.
As pues, suponiendo que n 30 y aplicando el Teorema Central del Lmite, obtenemos que
p =
n
N(p,
p(1 p)
n
)
p p
p(1 p)/
n
N(0, 1).
A partir de aqu obtenemos que
P(| p p| < 0
01) = P
_
p p
p(1 p)/
<
0
01
p(1 p)/
n
_
= P
_
|N(0, 1)| <
0
01
p(1 p)/
n
_
0
99
01
p(1 p)/
n
2
58 n
_
2
58
p(1 p)
0
01
_
2
.
Ahora bien, tenemos ya una cota para n, pero dicha cota depende de p que es un valor desconocido, con lo
cual, debemos solventar este problema de alguna forma.
Si observamos, en la Figura 8.6, la forma de la funcion g(p) = p(1p), observamos que el maximo se alcanza
en el valor 1/2, es decir,
g(p) = p(1 p) g(1/2) = 1/2(1 1/2) = 1/4
p(1 p)
1/4
p(1 p)
0
01

1/4
0
01

_
2
58
p(1 p)
0
01
_
2
_
2
58
1/4
0
01
_
2
= 16641,
con lo cual el mnimo tama no muestral para tener las garantas del enunciado es de 16641
personas.
Ejercicio 8.15 a) Tenemos una muestra de la variable
=
_
1 si el ordenador dura mas de 4 a nos
0 si el ordenador no dura mas de 4 a nos
que tiene una distribucion B(1, p) donde p es la probabilidad de exito, es decir, la probabilidad de durar
mas de cuatro a nos.
Nos piden que calculemos un intervalo de conanza de este parametro p. Puesto que el tama no muestral es
de 100 ordenadores y en realidad nos estan pidiendo un I.C. de la media de una variable , podemos aplicar
el Teorema Central del Lmite para obtener la funcion pivotal. Vamos pues a aplicar el metodo del pivote
para calcular el I.C. pedido.
1. B usqueda de la funcion pivotal: Puesto que n = 100 30, aplicando TCL tenemos que
p p
p(1p)
n
N(0, 1)
y como n es sucientemente grande, podemos aproximar p(1p) por p(1 p), con lo que consideraremos
como funcion pivotal
T
=
p p
p(1 p)
n
N(0, 1),
puesto que tiene una distribucion independiente del parametro p, y ademas como funcion de p es
estrictamente decreciente y continua.
Figura 8.7: Funcion de densidad de N(0, 1).
2. B usqueda del b tal que P(b < N(0, 1) < b) = 0
95: En vista de la Figura 8.7, en realidad buscamos

el b tal que P(N(0, 1) < b) = 0
975, por lo que b = 1
96.
3. Despejamos p: Puesto que hemos demostrado que cualquier normal N(0, 1) esta entre 1
96 y 1
96 con
probabilidad 0
95, entonces en particular lo vericara nuestra funcion pivotal que tiene esta distribucion.
As:
0
95 = P
_
_
1
96 <
p p
p(1 p)
n
< 1
96
_
_
= P
_
p 1
96
p(1 p)
n
< p < p + 1
96
p(1 p)
n
_
y por lo tanto tenemos acotado p entre dos valores aleatorios con probabilidad 0
95, por lo que el

intervalo de conanza buscado es
_
p 1
96
p(1 p)
n
, p + 1
96
p(1 p)
n
_
=
_
0
8 1
96
8(1 0
8)
100
, 0
8 + 1
96
8(1 0
8)
100
_
= (07216,08784).
b) Puesto que ahora no conocemos el tama no muestral n, y evidentemente tampoco conocemos la muestra,
trabajaremos con la funcion
p p
p(1p)
n
N(0, 1)
suponiendo que n 30.
Siguiendo el mismo proceso del apartado a), obtendramos que la forma general del I.C. de p al 95 % sera:
_
p 1
96
p(1 p)
n
, p + 1
96
p(1 p)
n
_
,
y por tanto el error de estimacion sera: = 1
96
p(1p)
n
. Como queremos que este error sea menor o igual
de 0
05, entonces
= 1
96
p(1 p)
n
0
05
_
1
96
p(1 p)
0
05
_
2
n.
Ahora bien, no podemos obtener directamente de aqu el valor mnimo de n, puesto que p es desconocida.
No obstante, sabemos que p(1 p) 1/4, puesto que la funcion g(p) = p(1 p) tiene un maximo en 1/2
como puede verse en la Figura 8.8. As,
_
1
96
p(1 p)
0
05
_
2
_
1
96
1/4
0
05
_
2
= 384
16,
con lo cual es suciente, para cumplir todos los requisitos, considerar el primer n que verique 384
16 n.
As pues, el mnimo tama no muestral es 385. Evidentemente es mayor del n = 100 del apartado
anterior, puesto que ahora la conanza es la misma (95 %), pero la precision que se requiere es mayor:
error de estimacion del apartado a): 0
0784,
error de estimacion del apartado b): 0
05.
Ejercicio 8.16 Buscamos el n tal que
P (|( p
1
p
2
) (p
1
p
2
)| 0
05) = 0
95.
Ahora bien, suponiendo que n 30 y aplicando el Teorema Central del Lmite tenemos que
P
_
_
| ( p
1
p
2
) (p
1
p
2
) |
p
1
(1p
1
)+p
2
(1p
2
)
n
05
p
1
(1p
1
)+p
2
(1p
2
)
n
_
_
= 0
95,
con lo cual, aplicando que la distribucion de
|( p
1
p
2
)(p
1
p
2
)|
p
1
(1p
1
)+p
2
(1p
2
)
n
es aproximadamente normal de media cero y
varianza uno, es suciente con que
0
05
p
1
(1p
1
)+p
2
(1p
2
)
n
1
96
p
1
(1 p
1
) +p
2
(1 p
2
)
(0
05/1
96)
2
n.
El problema esta en que evidentemente no conocemos los valores de p
1
(1 p
1
) y p
2
(1 p
2
), pero seg un la
representacion graca de la funcion g(p) = p(1 p) entre 0 y 1 (ver Figura 8.6) se tiene que ambos productos
son positivos y menores o iguales que 1/4, con lo que es suciente con que
1/4 + 1/4
(0
05/1
96)
2
= 768
32 n,
es decir, hay que muestrear 769 artculos de cada maquina.
Ejercicio 8.17 a) Puesto que es una v.a. continua, que toma valores en el intervalo (0, ) y g
(x) =
1
2
x
=
0, x (0, ), se verican las condiciones del Teorema del Jacobiano, con lo que
f
(y) =
_
f
(g
1
(y))|

y
g
1
(y)| si y g((0, ))
0 en el resto
=
_
f
(y
2
)|2y| si y (0, )
0 en el resto
=
=
_
1
2y
e
y/
(2y) si y > 0
0 si y 0
=
_
1
e
y/
si y > 0
0 si y 0
con lo cual =
sigue una distribucion exponencial exp(

1
).
As pues,
F
(x) =
(y)dy =
_

0
0 dy +
x
0
1
e
y/
dy si x > 0
0 dy si x 0
=
_
1 e
x/
si x > 0
0 si x 0
.
b) Si denotamos por (
1
,
2
, . . . ,
n
) una m.a.s. de la variable aleatoria , en este caso, el estimador maximo
verosmil de es la solucion de la ecuacion
ln(L(
1
,
2
, . . . ,
n
; )) = 0.
Puesto que
L(x
1
, x
2
, . . . , x
n
; ) =
n
i=1
f
(x
i
) =
n
i=1
1
2
x
i
e
x
i
/
=
1
2
n
x
i
n
e
x
i
ln(L(x
1
, x
2
, . . . , x
n
; )) = ln
_
1
2
n
x
i
_
nln()
1
i=1
x
i

ln(L(x
1
, x
2
, . . . , x
n
; )) = 0 n
1
+
1
2
n
i=1
x
i
= 0 =
1
n
n
i=1
x
i
,
el estimador maximo verosmil de es:
T =
1
n
n
i=1
i
.
Seg un hemos demostrado en el apartado a), se tiene que
i
exp(
1
) (1,
1
)
Reprod.
=
n
i=1
i
(n,
1
)
k(p, a) (p, a/k)
= T =
1
n
n
i=1
i
(n,
n
),
con lo cual
E[T] =
n
n/
= ,
es decir, T es un estimador insesgado de .
Es evidente entonces que lm
n
E[T] = lm
n
= , es decir, que T es un estimador asintoticamente
insesgado de .
Aplicando de nuevo que T (n,
n
) obtenemos que
V ar[T] =
n
(n/)
2
=

2
n
,
con lo cual T es un estimador insesgado de y lm
n
V ar[T] = lm
n
2
n
= 0 y por tanto, aplicando un
resultado de teora, concluimos que T es un estimador consistente de .
Ejercicio 8.18 a) Estamos trabajando con una variable aleatoria de media y desviacion tpica = 1, para
la que se desea encontrar el tama no muestral mnimo n de forma que una m.a.s. de dicho tama no verique
que P(|
n
| 0
5) 0
95. As pues, comenzaremos suponiendo que n 30 y aplicando el Teorema

Central de Lmite, con lo que tenemos que
n
N(,
1
n
) y, por tanto,
P(|
n
| 0
5) = P
_
1/
n
1
_
= P(|N(0, 1)| 0
n) 0
95 0
n 1
96.
Despejando n se obtiene que
0
n 1
96
n
1
96
0
5
= 3
92 n (3
92)
2
= 15
3664,
con lo cual puesto que hemos supuesto que n 30, y en este caso sabemos que la restriccion es vericada
siempre que n 15
3664, seg un el Teorema Central del Lmite hemos obtenido que es necesario que n = 30
para que sean ciertas ambas armaciones.
b) Teniendo en cuenta que, seg un hemos visto en el apartado anterior,
100
N(,
1
10
) y por otro lado que
P(1
96 < N(0, 1) < 1
96) = 0
95, se tiene que

0
95 = P(1
96 <

100
1/10
< 1
96) = P(
100
1
96
1
10
< <
100
+ 1
96
1
10
),
con lo cual el intervalo de conanza de al 0
95 es (x
100
1
96
1
10
) = (22 0
196) = (21
804, 22
196).
c) Si N(, 1), entonces no necesitamos aplicar el Teorema Central del Lmite, puesto que por la repro-
ductividad de la normal (tambien podemos aplicar el Teorema de Fisher) se tiene que

1/
n
N(0, 1), n IN,
con lo cual es suciente, para vericar la condicion impuesta en el enunciado, que el tama no muestral sea
de n = 16.
Ejercicio 8.19 Si denotamos por la v.a. tiempo de vida de este materia, el enunciado nos dice que dicha
variable sigue una distribucion exponencial exp(1/). Ademas, nos proporciona una muestra aleatoria de 5
tiempos de vida: 33, 35, 42, 38 y 52.
a) Nos piden que obtengamos la estimacion maximo verosmil de la media de , es decir, de E[] =
1
1/
= .
Puesto que se verican las condiciones necesarias, vamos a obtener dicha estimacion de como solucion de
la ecuacion
ln(L(x
1
, x
2
, . . . , x
n
; )) = 0.
Vamos a ir paso a paso obteniendo los miembros de esta ecuacion:
L(x
1
, x
2
, . . . , x
n
; ) =
n
i=1
f(x
i
) =
n
i=1
1
e
x
i
/
=
n
e
i
x
i
ln(L(x
1
, x
2
, . . . , x
n
; )) = nln()
1
i=1
x
i

ln(L(x
1
, x
2
, . . . , x
n
; )) = n
1
+
1
2
n
i=1
x
i
= 0 =
1
n
n
i=1
x
i
= x
n
con lo cual, la estimacion maximo verosmil de , a partir de los datos de nuestra muestra, es
x
5
=
33 + 35 + 42 + 38 + 52
5
= 40 das.
b) I.C. de al 0
95:
1. El primer paso en la obtencion de un intervalo de conanza, es conseguir una funcion pivotal (funcion
estrictamente monotona como funcion de y con distribucion independiente de ).
Seg un se deduce del apartado anterior, el estimador maximo verosmil de es T =
n
, cuya distribucion,
aplicando la relacion entre la exponencial y la gamma, y las propiedades de esta ultima, es:
i
exp(
1
) (1,
1
)
indep.
=
n
i=1
i
(n,
1
)
k(p, a) (p, a/k)
= T =
1
n
n
i=1
i
(n,
n
)
Haciendo transformaciones en T, podemos obtener una funcion pivotal adecuada:
T =
1
n
n
i=1
i
(n,
n
)
k(p, a) (p, a/k)
=
2n
T =
2
i=1
i
(n,
1
2
)
2
2n
.
As pues, consideraremos como funcion pivotal T
=
2
i=1
i
, que en este caso sigue una distribucion
2
10
, puesto que el tama no de la muestra es n = 5.
2. Buscamos el a y el b tales que P(a <
2
10
< b) = 0
95. Por convenio y teniendo en cuenta la represen-

tacion de la funcion de densidad de
2
10
se obtiene que un a y un b adecuados son:
a b
095
0025
0025
a/P(
2
10
< a) = 0
025 a = 3
25
b/P(
2
10
< b) = 0
975 b = 20
5
3. Teniendo en cuenta todo lo anterior, se puede despejar para acabar acotandola entre dos cantidades
aleatorias con probabilidad 0
95:
0
95 = P(3
25 <
2
i=1
i
< 20
5) = P(
2
20
5
n
i=1
i
< <
2
3
25
n
i=1
i
),
con lo cual, un intervalo de conanza para al nivel de conanza 0
95 es:
(
2
20
5
n
i=1
x
i
< <
2
3
25
n
i=1
x
i
) = (
2
20
5
200 < <
2
3
25
200) = (19
51, 123
08).
Ejercicio 8.20 a) Puesto que se verican las condiciones necesarias, vamos a obtener el estimador maximo
verosmil de como solucion de la ecuacion
ln(L(
1
,
2
, . . . ,
n
; )) = 0.
Vamos a ir paso a paso obteniendo los miembros de esta ecuacion:
L(x
1
, x
2
, . . . , x
n
; ) =
n
i=1
f(x
i
) =
n
i=1
1
x
i
2
e
(lnx
i
)
2
2
=
1
(
i
x
i
) (2)
n/2
e
1
2
i
(lnx
i
)
2
ln(L(x
1
, x
2
, . . . , x
n
; )) = ln
_
1
(
i
x
i
) (2)
n/2
_
1
2
n
i=1
(lnx
i
)
2
ln(L(x
1
, x
2
, . . . , x
n
; )) = 0
1
2
n
i=1
2(lnx
i
)(1) =
n
i=1
(lnx
i
) = 0 =
1
n
n
i=1
lnx
i
con lo cual, el estimador maximo verosmil de es
T =
1
n
n
i=1
ln
i
.
b) Puesto que es continua, g(x) = ln(x) y g
(x) =
1
x
> 0, x (0, ), aplicando el Teorema del Cambio de
Variable (Teorema 3.4.1, pagina 119 de los apuntes) tenemos que
f
(y) =
_
f
(g
1
(y)) |(g
1
(y))
| si y g((0, ))
0 en el resto
=
_
f
(e
y
) |e
y
| si y (, )
0 en el resto
=
1
e
y
2
e
(y)
2
2
e
y
=
1
2
e
(y)
2
2
, y (, ).
Por lo tanto sigue una distribucion normal de media y desviacion tpica 1, es decir, N(, 1).
c) Para ver si es centrado, vamos a calcular su esperanza:
E(T) = E
_
1
n
n
i=1
i
_
=
1
n
n
i=1
E[
i
]
i
N(, 1)
=
1
n
n
i=1
=
1
n
n = ,
con lo cual el estimador maximo verosmil de es centrado.
d) I.C. de al 0
95:
Puesto que se trata de obtener un intervalo de conanza para la media de una distribucion normal con
varianza conocida, la funcion pivotal adecuada sabemos que es:
T
=

n
1/
n
N(0, 1).
2. Puesto que 0
95 = P(1
96 < N(0, 1) < 1
96), se tiene que a = 1
96 y b = 1
96.
95:
0
95 = P
_
1
96 <

n
1/
n
< 1
96
_
= P(
n
1
96
1
n
< <
n
+ 1
96
1
n
),
con lo cual, el intervalo de conanza para al nivel de conanza 0
95 es:
(y
4
1
96
1
2
, y
4
+ 1
96
1
2
) = (1
25 0
98) = (0
27, 2
23),
teniendo en cuenta que
y
n
=
y
1
+y
2
+y
3
+y
4
4
=
ln(5
76) +ln(3
49) +ln(1) +ln(7
39)
4
= 1
25.
Ejercicio 8.21 a) Puesto que se verican las condiciones necesarias, el estimador maximo verosmil de es
la solucion de la ecuacion
ln(L(
1
,
2
, . . . ,
n
; )) = 0.
Teniendo en cuenta que
L(x
1
, x
2
, . . . , x
n
; ) =
n
i=1
f
(x
i
) =
n
i=1
1
x
i
=
( 1)
n
(
i
x
i
)
=
ln(L(x
1
, x
2
, . . . , x
n
; )) = nln( 1)
n
i=1
ln(x
i
) =
ln(L(x
1
, x
2
, . . . , x
n
; )) = n
1
1

n
i=1
ln(x
i
) = = 1 +
n
i
ln(x
i
)
se obtiene que el estimador maximo verosmil de es:
T = 1 +
n
n
i=1
ln(
i
)
= 1 +
1
n
,
donde representa a la variable = ln().
b) Para ver si es o no centrado, vamos a calcular su esperanza:
E(T) = E
_
1 +
1
n
_
= 1 +E
_
1
n
_
.
Ahora bien, haciendo el cambio de variable tenemos que
f
(y) =
_
f
(e
y
)|e
y
| si y > 0
0 en el resto
=
_
1
e
y
e
y
si y > 0
0 en el resto
=
_
( 1)e
(1)y
si y > 0
0 en el resto
con lo cual = ln() sigue una distribucion exponencial exp( 1) o, lo que es lo mismo, gamma (1, 1).
Puesto que la distribucion gamma es reproductiva respecto al primer parametro tenemos que
n
i=1
ln(
i
) (n, 1).
Finalmente, aplicando las propiedades de la gamma se tiene que
n
=
n
i=1
ln(
i
)
n
(n, n( 1)).
De todo lo anterior se deduce que:
E
_
1
n
_
=

0
1
x
(n( 1))
n
(n)
x
n1
e
n(1)x
dx =
(n( 1))
n
(n)
(n 1)
(n( 1))
n1

0
1
x
(n( 1))
n1
(n 1)
x
n2
e
n(1)x
dx =
n( 1)
n 1

0
f
(n1,n(1))
(x)dx =
n( 1)
n 1
1 =
n( 1)
n 1
,
por lo que
E(T) = 1 +
n( 1)
n 1
=
n 1
n 1
= ,
con lo que T no es un estimador centrado de . No obstante, como
lm
n
E(T) = lm
n
n 1
n 1
= ,
s que es un estimador asintoticamente centrado.
Ejercicio 8.22 a) En este caso, puesto que se verican las condiciones necesarias, el estimador maximo ve-
rosmil de es la solucion de la ecuacion

ln(L(
1
,
2
, . . . ,
n
; )) = 0. Vamos a comenzar calculando la
funcion de verosimilitud:
L(x
1
, x
2
, . . . , x
n
; ) =
n
i=1
f
(x
i
) =
n
i=1
1
2
x
i
e
x
i
/
=
1
2
n
x
i
e
x
i
/
.
Tomando neperianos:
ln(L(x
1
, x
2
, . . . , x
n
; )) = nln(2) nln()
n
i=1
ln(
x
i
)
n
i=1
x
i
.
ln(L(x
1
, x
2
, . . . , x
n
; )) = 0
n
0 +
n
i=1
x
i
2
.
n
+
n
i=1
x
i
2
= 0 =
n
i=1
x
i
n
por lo que el estimador maximo verosmil de es

T =
1
n
n
i=1
i
.
b) Para empezar, vamos a calcular la funcion de densidad de la nueva v.a. =
aplicando el teorema del

cambio de variable, puesto que
Sopp() = (0, ), g
(x) =
1
2
x
= 0, x (0, ).
As pues,
f
(y) =
_
f
(g
1
(y))|(g
1
(y))
| si y g((0, ))
0 en otro caso.
=
=
_
1
2
y
2
e
y
2
/
|2y| si y (0, )
0 en otro caso.
=
_
1
e
y/
si y > 0
0 si y 0
y por tanto, exp(
1
) (1,
1
). Aplicando ahora la reproductividad de la gamma y las propiedades de

dicha distribucion tenemos que
n
i=1
i
(n,
1
) T =
1
n
n
i=1
i
(n,
n
).
c) Puesto que, seg un acabamos de ver, T (n,
n
), se tiene que E(T) =

n
n/
= , con lo que hemos probado
que T es un estimador insesgado de y, en consecuencia, tambien es asintoticamente insesgado.
Como ademas V ar(T) =
n
(n/)
2
=

2
n
n
0, aplicando un resultado de teora (Teorema 8.2.1), se puede
concluir que T es tambien un estimador consistente de .
Ejercicio 8.23 a) Estamos trabajando con una v.a. f
(x) y queremos calcular el e.m.v. del parametro

a partir de una muestra de tama no n.
Comenzaremos pues maximizando la funcion de verosimilitud L(x
1
, x
2
, . . . , x
n
; ). En este caso se puede
obtener dicho maximo como solucion de la ecuacion:
ln(L(x
1
, x
2
, . . . , x
n
; )) = 0.
Con el n de resolver dicha ecuacion, vamos a ir calculando L, ln(L), y su derivada respecto de .
L(x
1
, x
2
, . . . , x
n
; ) =
n
i=1
f
i
(x
i
) =
n
i=1
1
x
(1/)1
i
=
1
n
n
i=1
x
(1/)1
i
.
Tomando neperianos:
ln(L(x
1
, x
2
, . . . , x
n
; )) = nln() + (
1
1)
n
i=1
ln(x
i
).
ln(L(x
1
, x
2
, . . . , x
n
; )) =
n
+
1
2
n
i=1
ln(x
i
).
+
1
2
n
i=1
ln(x
i
) = 0 =
i
ln(x
i
)
n
T =
n
i=1
ln(
i
)
n
.
Una vez hecho esto debemos estudiar si es insesgado, asintoticamente insesgado y consistente:
La expresion de e.m.v. de nos sugiere hacer el cambio de variable = ln(). Puesto que se verican las
hipotesis para utilizar el Teorema del Jacobiano:
Sopp() = (1, ),
g
(x) =
1
x
= 0, x (1, ),
podemos decir que
f
(y) =
_
f
(e
y
) |e
y
| si y g((1, ))
0 en el resto
=
_
1
(e
y
)
(1/)1
e
y
si y (g(1), g())
0 en el resto
=
_
1
e
y/
si y > 0
0 en el resto
por lo que = ln() sigue una distribucion exponencial de parametro 1/.
Si ln() exp(1/) (1, 1/), entonces
n
i=1
ln(
i
) (n, 1/) por la reproductividad de la gamma; y
ademas, por las propiedades de esta distribucion se tiene que
1
n
n
i=1
ln(
i
) (n, n/).
Hemos llegado pues a que T sigue una distribucion (n, n/), por lo que
E(
) =
n
n/
= ,
puesto que la esperanza de una (p, a) es p/a. As, se ha demostrado que T es un estimador insesgado
de .
insesgado.
E[T] = lm
n
E[T] = lm
n
= .
Consistente.- Puesto que V ar[T] =
n
(n/)
2
=

2
n
, puesto que la varianza de una gamma (p, a) es p/a
2
, T
es un estimador insesgado de y lm
n
V ar[T] = lm
n
2
n
= 0, con lo que, aplicando el Teorema 8.2.1 de
teora, se tiene que T es un estimador consistente de .
Si queremos resolver esta cuestion directamente, sin aplicar dicho teorema, tenemos que comprobar si
> 0, lm
n
P(|T | ) = 0.
> 0, P(|T E[T]| )
V ar[T]
2
,

2
n
, entonces
> 0, 0 P(|T | )

2
n
2
,
lm
n
0 lm
n
P(|T | ) lm
n
2
n
2

0 0
n

ECM[T] = E[(T )
2
] = V ar[T] + (E[T] )
2
=

2
n
+ ( )
2
=

2
n
.
Como ECM[T] =

2
n

2
2
n
= ECM[T
], T es mejor que T

c) I.C. de al 0
95:
Seg un se deduce del apartado a), el estimador maximo verosmil de es T =
1
n
i
ln(
i
) (n,
n
).
Haciendo transformaciones en T, podemos obtener una funcion pivotal adecuada:
T =
1
n
n
i=1
ln(
i
) (n,
n
)
k(p, a) (p, a/k)
=
2n
T =
2
i=1
ln(
i
) (n,
1
2
)
2
2n
.
As pues, consideraremos como funcion pivotal T
=
2
i=1
ln(
i
), que en este caso sigue una distribucion
2
6
, puesto que el tama no de la muestra es n = 3.
2. Buscamos el a y el b tales que P(a <
2
6
< b) = 0
95. Por convenio y teniendo en cuenta la representacion

de la funcion de densidad de
2
6
se obtiene que un a y un b adecuados son:
a b
095
0025
0025
a/P(
2
6
< a) = 0
025 a = 1
24
b/P(
2
6
< b) = 0
975 b = 14
4
95:
0
95 = P(1
24 <
2
i=1
ln(
i
) < 14
4) = P(
2
14
4
n
i=1
ln(
i
) < <
2
1
24
n
i=1
ln(
i
)),
con lo cual, un intervalo de conanza para al nivel de conanza 0
95 es:
(
2
14
4
n
i=1
ln(x
i
) < <
2
1
24
n
i=1
ln(x
i
)) = (
2
14
4
3 < <
2
1
24
3) = (0
42, 4
84).
Ejercicio 8.24 a) Puesto que se verican las condiciones necesarias, se puede obtener el estimador maximo
verosmil de como solucion de la ecuacion
ln(L(
1
, . . . ,
n
; )) = 0.
As pues,
L(x
1
, . . . , x
n
; ) =
n
i=1
f
(x
i
) =
n
i=1
_
2
x
i
e
x
2
i
/
_
= (2/)
n
n
i=1
x
i
e
x
2
i
/
=
ln(L(x
1
, . . . , x
n
; )) = nln(2/) +ln(
n
i=1
x
i
)
1
n
i=1
x
2
i
=
ln(L(x
1
, . . . , x
n
; )) = n
1
+ 0 +
1
n
i=1
x
2
i
= 0 =
1
n
n
i=1
x
2
i
,
con lo que el estimador maximo verosmil de es
T =
1
n
n
i=1
2
i
.
b) Si denotamos por =
2
, entonces aplicando el teorema del cambio de variable llegamos a que
f
(y) =
_
1
e
y/
si y > 0
0 si y 0
es decir,
2
i
exp(
1
) (1,
1
). Por la reproductividad de la gamma se tiene que

n
i=1
2
i

_
n,
1
_
,
y aplicando las propiedades de la gamma (k (p, a) (p, a/k)), se obtiene que
T =
1
n
n
i=1
2
i

_
n,
n
_

_
4,
4
_
.
c) Para obtener la funcion pivotal que nos permita construir el intervalo de conanza para , no podemos
utilizar ninguna de las de la tabla, al no vericarse las condiciones necesarias. As pues, vamos a construir
dicha funcion a partir del estimador maximo verosmil.
Seg un vimos en el apartado anterior y teniendo en cuenta que n = 4,
T =
1
n
n
i=1
2
i

_
4,
4
_
,
con lo que
T
=
2
i=1
2
i
=
8
T (4,
1
2
)
2
8
.
Dicha funcion T
tiene una distribucion independiente de y como funcion de es estrictamente decreciente,

con lo que nos sirve como funcion pivotal.
Ahora bien, puesto que P(
2
8
< a) = 0
05 y P(
2
8
< b) = 0
95 implica que a = 2
73 y b = 15
5, se tiene que
0
9 = P
_
2
73 <
2
i=1
2
i
< 15
5
_
= P
_
2
15
5
n
i=1
2
i
< <
2
2
73
n
i=1
2
i
_
,
y teniendo en cuenta que
n
i=1
2
i
= 1
8
2
+ 2
2
2
+ 1
3
2
+ 2
0
2
= 13
77
se concluye que un intervalo de conanza para al nivel = 0
9 es
_
2
15
5
13
77,
2
2
73
13
77
_
= (1
78, 10
09).
Ejercicio 8.25 a) Puesto que se verican las condiciones necesarias, el estimador maximo verosmil de se
puede obtener como solucion de la ecuacion

ln(L(
1
,
2
, . . . ,
n
; )) = 0.
L(x
1
, x
2
, . . . , x
n
; ) =
n
i=1
P( = x
i
) =
n
i=1
_
e
x
i
x
i
!
_
= e
n
i
x
i
i
x
i
!
=
ln(L(x
1
, x
2
, . . . , x
n
; )) = n +
n
i=1
x
i
ln() ln
_
n
i=1
x
i
!
_
=
ln(L(x
1
, x
2
, . . . , x
n
; )) = n +
n
i=1
x
i
1
0 = 0 =
1
n
n
i=1
x
i
.
As pues, el estimador maximo verosmil de es
n
.
b) Si representamos por la v.a. n umero de accidentes en una semana, se tiene que =
7
i=1
i
, donde
i
representa el n umero de accidentes ocurridos el da i de esa semana. Como la distribucion de Poisson es
reproductiva y el comportamiento de los das es independiente, se puede concluir que P(7). Puesto
que = P( = 0) = e
7
(7)
0
0!
= e
7
y
n
es el estimador maximo verosmil de , entonces e
7
n
es el
estimador maximo verosmil de .
c) Como
E(T) = E((6)
1
) =
k=0
(6)
k
P(
1
= k) =
k=0
(6)
k
e
k
k!
= e
k=0
(6)
k
k!
= e
e
6
= e
7
= ,
se concluye que T es un estimador insesgado de .
Ejercicio 8.26 a) Suponiendo que n 30, podemos considerar como funcion pivotal
T =
p p
p(1 p)/n
que sigue una distribucion aproximadamente normal N(0, 1).
Por otro lado, como los valores a y b que verican que 0
978 = P(a < N(0, 1) < b) son a = b y b tal que

P(N(0, 1) < b) = 0
989, se tiene que b = 2
29 y a = 2
29.
As pues,
0
978 = P
_
2
29 <
p p
p(1 p)/n
< 2
29
_
= P
_
p 2
29
p(1 p)
n
< p < p + 2
29
p(1 p)
n
_
con lo que el error de estimacion es
2
29
p(1 p)
n
y, por tanto, buscamos el mnimo valor de n tal que la expresion anterior es menor o igual que 0
05. Ahora
bien, como no conocemos el valor de p, consideraremos el caso mas desfavorable, es decir, aquel en el que
p = 1/2. As,
2
29
1/2(1 1/2)
n
= 1
145
1
n
0
05
_
1
145
0
05
_
2
= 524
41 n,
con lo que n = 525.
b) Si n = 300 y p = 90/300 = 0
3, seg un lo visto en el apartado anterior, un intervalo de conanza para p sera

_
0
3 b
3(1 0
3)
300
_
,
donde b es tal que P(N(0, 1) b) = 0
975. As pues, b = 1
96 y, por lo tanto, el intervalo buscado es

(0
248, 0
352).
Ejercicio 8.27 a) Puesto que N(, 25), se tiene que:
L(x
1
, x
2
, . . . , x
n
; ) =
n
i=1
f
(x
i
) =
n
i=1
1
225
e
(x
i
)
2
/1250
=
_
1
225
_
n
e
i
(x
i
)
2
/1250
ln(L(x
1
, x
2
, . . . , x
n
; )) = nln
_
1
225
_
i=1
(x
i
)
2
1250

ln(L(x
1
, x
2
, . . . , x
n
; )) = 0 +
n
i=1
x
i
625
= 0 = x
n
,
con lo que el estimador maximo verosmil de es T =
n
.
Puesto que, por teora sabemos que, E(T) = E(
n
) = E() = , se tiene que dicho estimador es insesgado
y asintoticamente insesgado.
Como ademas V ar(T) = V ar(
n
) =
V ar()
n
=
625
n
n
0, se tiene tambien que es consistente.
b) Para obtener un I.C. de al 0
95 consideramos la funcion pivotal

T
=

n
25/
n
N(0, 1).
Como P(1
96 < N(0, 1) < 1
96) = 0
95, se tiene que

0
95 = P
_
1
96 <

n
25/
n
< 1
96
_
= P
_
n
1
96
25
n
< <
n
+ 1
96
25
n
_
con lo que la amplitud de dicho intervalo es 2 1
96
25
n
. As pues,
2 1
96
25
n
10 96
04 =
_
2 1
96
25
10
_
2
n
y, por tanto, el mnimo tama no muestral es n = 97.
Ejercicio 8.28 Seg un los datos del enunciado, tenemos una v.a. =n
o
de solicitudes en un da de la que
sabemos que sigue una distribucion de Poisson pero desconocemos su parametro, que denotaremos por .
As pues, P(). Para dicha variable tenemos una m.a.s. de tama no n = 100, con
100
i=1
x
i
= 200.

Estos son
los datos de los que disponemos para ir respondiendo a los distintos apartados.
a) Puesto que la media de es , nos estan pidiendo que calculemos la estimacion maximo verosmil de dicho
parametro. Al darse las condiciones necesarias, el estimador maximo verosmil de se puede obtener como
solucion de la ecuacion
ln[L(x
1
, . . . , x
n
; )] = 0.
Ahora bien, como
L(x
1
, . . . , x
n
; ) =
n
i=1
P( = x
i
) =
n
i=1
_
e
x
i
x
i
!
_
= e
n
i
x
i
i
x
i
!

ln[L(x
1
, . . . , x
n
; )] = n +
n
i=1
x
i
ln() ln(
i
x
i
!)
ln[L(x
1
, . . . , x
n
; )] = n +
n
i=1
x
i
1
0 = 0
=
1
n
n
i=1
x
i
,
se tiene que la estimacion maximo verosmil de , de acuerdo con nuestros datos es:
=
1
n
n
i=1
x
i
=
1
100
200 = 2.
b) El estimador utilizado en el apartado anterior es T =
1
n
n
i=1
i
=
n
. Seg un se ha visto en teora, se tiene
que E(T) = E(
n
) = E() = , con lo cual s es un estimador insesgado (tambien llamado centrado) del
parametro .
c) Si denotamos por la v.a. n
o
de das sin solicitudes de 7, al suponer independencia se tiene que la
distribucion de es binomial B(7, p) donde p representa la probabilidad de exito, es decir, de que no haya
ninguna solicitud ese da. As pues, p = P( = 0) = e
.
Nos piden la estimacion maximo verosmil del n umero medio de das sin solicitudes de los 7, es decir, la
estimacion maximo verosmil de E() = 7p = 7e
. Como sabemos que la estimacion maximo verosmil de

es 2, por las propiedades del estimador maximo verosmil, se tiene que la de 7e
es 7e
2
0
95. As pues,
seg un estos datos, el n umero medio de das a la semana sin solicitudes se estima que es de 0
95 das.
TEMA 8.- ESTIMACI

PREGUNTAS DE TEST.
Examenes.
1. (19-06-03) Sea (
1
,
2
, . . . ,
n
) una m.a.s. de una poblacion geometrica de parametro p. El estimador maxi-
mo verosmil de p es,
a)
n
; b) 1/
n
; c) x
n
; d) 1/x
n
; e) Todo falso.
2. (19-06-03) Sea un parametro poblacional y T un estimador de tal que E[T] = , se dice que T es un
estimador :
a) Centrado; b) Insesgado; c) Consistente; d) Inconsistente; e) Todo falso.
3. (19-06-03) De una muestra de tama no 10 de una poblacion normal se han obtenido las estimaciones
puntuales: x
n
= 95 y S
2
= 144. Un intervalo de conanza para la media al nivel de conanza 0
95 es aproxima-
damente:
a) (45335; 50323); b) (95456; 97235); c) (12332; 12333); d) (8595; 10405); e) (445; 504).
4. (19-06-03) Con los mismos datos de la pregunta anterior, un intervalo de conanza para la varianza al
nivel de conanza 0
95 es aproximadamente:
a) (1425; 1466); b) (-1466; -1425); c) (757; 53325); d) (1432,1448); e) (453; 903).
5. (09-09-03) Si (2, 7, 4, 3) es el resultado de una m.a.s. de tama no 4, procedente de una distribucion uniforme
U(1, ) con > 1, entonces la estimacion maximo verosmil de es:
a) 3; b) 4; c) 7; d) 8; e) Todo falso.
6. (09-09-03) Con una muestra de los diametros de 26 cojinetes se ha obtenido una varianza muestral S
2
=
0
64mm
2
. Se supone que los diametros siguen una distribucion normal. Un intervalo de conanza para la
desviacion tpica poblacional al nivel 0
a) (45
34, 90
32); b) (95
46, 97
24); c) (123
32, 123
33); d) (0
61, 1
20); e) (3, 2).

7. (09-09-03) Un instituto de opinion p ublica quiere hacer una encuesta para estimar la proporcion de indi-
viduos que se maniestan dispuestos a comprar un nuevo producto. El n umero de personas a las que se debe de
preguntar si se quiere cometer un error menor de 01 con una probabilidad de al menos 099 es suciente con
que sea:
a) Menor de 50; b) Menor de 75; c) Menor de 100; d) Mayor de 165; e) Todo falso.
8. (17-02-04) Sea un parametro poblacional y T un estimador de tal que: E(T) = 0, entonces se dice
que T es un estimador:
a) Centrado;
d) Asintoticamente insesgado;
b) Insesgado;
e) Todo falso.
c) Consistente;
9. (17-02-04) Se prueba un nuevo farmaco para combatir una enfermedad, en una muestra de 144 enfermos
resulta ecaz para 81 de ellos. Un intervalo de conanza para la proporcion de enfermos curados es aproxima-
damente:
a) (048 ; 064) al nivel 95 %;
d) (9043 ; 10405) al nivel 80 %;
b) (049 ; 063) al nivel 99 %;
e) Todo falso.
c) (046 ; 067) al nivel 90 %;
10. (21-06-04) Sea (
1
,
2
, . . . ,
n
) una m.a.s. de una poblacion geometrica de parametro p. El estimador
maximo verosmil de la probabilidad de fracaso q (q = 1 p) es:
a)
n
; b) 1/
n
; c) 1
n
; d) 1 (1/
n
); e) Todo falso.
11. (21-06-04) Sea un parametro poblacional y T un estimador de tal que E[T] = , se dice que T es un
estimador:
a) Centrado; b) Insesgado; c) Consistente; d) Sesgado; e) Todo falso.
12. (09-09-04) Sea (
1
,
2
, . . . ,
n
) una m.a.s. de una poblacion de Poisson de parametro . El estimador
maximo verosmil de la desviacion tpica de la poblacion es:
a)
n
; b)
n
; c) 1
n
; d) 1 (1/
n
); e) Todo falso.
13. (09-09-04) Sea un parametro poblacional y T
n
una sucesion de estimadores de tal que lm
n
E[T
n
] = ,
se dice que T
n
es una sucesion:
a) Centrada;
d) Asintoticamente insesgada;
b) Insesgada;
e) Todo falso.
c) Consistente;
14. (09-09-04) De una muestra de tama no 100 de una poblacion NO normal con varianza poblacional 144,
se ha obtenido una media muestral x
100
= 25. Un intervalo de conanza para la media poblacional al nivel 0
90
es aproximadamente:
a) (44335,90323); b) (23026,26974); c) (12332,12333); d) (8595,10405); e) Todo falso.
15. (06-07-05) Sea (
1
,
2
, . . . ,
n
) una m.a.s. de una poblacion geometrica de parametro p. El estimador
maximo verosmil de p es:
a) 1/
n
; b)
n
; c) (
n
)
2
; d) (1/
n
)
2
; e) Todo falso.
16. (06-07-05) Sea (
1
,
2
, . . . ,
n
) una m.a.s. de una poblacion con distribucion (, 1), es decir, su funcion
de densidad viene dada por: f(x, ) =
_
x
1
si 0 < x < 1,
0 en otro caso.
El estimador maximo verosmil del parametro
es:
a) 1/
n
; b)
n
; c) (
n
)
2
; d) (1/
n
)
2
; e) Todo falso.
17. (06-07-05) De una muestra de tama no 10 de una poblacion normal, se ha obtenido una media muestral
x
n
= 25, y una varianza muestral igual a 144. Un intervalo de conanza para la media al nivel 0
90 es aproxi-
madamente:
a) (45
335, 90
32); b) (23
03, 26
97); c) (123
3, 123
3); d) (17
67, 32
33); e) Todo falso.

18. (06-07-05) En un intervalo de conanza para la varianza de una poblacion normal, si se disminuye el
nivel de conanza, entonces la amplitud del intervalo:
a) Aumenta; b) Disminuye; c) No se altera; d) Todo cierto; e) Todo falso.
19. (06-07-05) En un intervalo de conanza para la media de una poblacion normal, si se aumenta el nivel
de conanza, entonces la amplitud del intervalo:
20. (07-09-05) Dada una muestra aleatoria de tama no n de una variable con media y varianza
2
, entonces:
a) La esperanza de la varianza muestral es igual a la varianza poblacional, es decir, E(S
2
) =
2
;
b) La esperanza de la media muestral coincide con la media poblacional, es decir, E(
n
) = ;
c) La varianza de la media muestral es igual a la varianza poblacional, es decir, V ar(
n
) =
2
;
d) La media muestral tiene una desviacion tpica menor o igual que la que tienen cada una de las variables
aleatorias que forman la muestra, es decir,
V ar(
n
) ;
e) Todo falso.
21. (07-09-05) Sea (
1
,
2
, . . . ,
n
) una m.a.s. de una poblacion uniforme en (0, ). El estimador de por el
metodo de los momentos es:
a) No se sabe; b) max(
1
, . . . ,
n
); c) mn(
1
, . . . ,
n
); d) 2
n
; e) Todo falso.
22. (07-09-05) Sea un parametro poblacional y T
n
una sucesion de estimadores sesgados de tal que
lm
n
V ar(T
n
) = 0, entonces necesariamente T
n
es una sucesion:
a) Centrada;
b) Insesgada;
e) Todo falso.
c) Consistente;
23. (13-02-06) Se dispone de una bolsa con seis tornillos de dos tipos A y B, pero se desconoce cuantos hay
de cada uno. Si se extraen cuatro tornillos con reemplazamiento y se obtiene tres de tipo A, en este caso la
estimacion maximo verosmil de la proporcion de tornillos de tipo A es:
a) 4/3; b) 3/4; c) 2/3; d) 0395; e) Todo falso.
24. (13-02-06) Sea (
1
,
2
, . . . ,
n
) una m.a.s. de una poblacion U(0, ). El estimador maximo verosmil de
es:
a)
n
; b) 1/2
n
; c) 2
n
; d) 4
n
; e) Todo falso.
25. (30-06-06) Sea (
1
,
2
, . . . ,
n
) una m.a.s. de una poblacion de uniforme en (0, ). El estimador maximo
verosmil de la media de la poblacion es:
a)
n
; b)
n
; c) 1
n
; d) 1 (1/
n
); e) Todo falso.
26. (30-06-06) Sea un parametro poblacional y T un estimador de tal que E(T) = , se dice que T es un
estimador de :
a) Centrado; b) Consistente; c) Insesgado; d) Sesgado; e) Todo falso.
27. (30-06-06) Para una muestra de tama no 121 de una poblacion normal se ha obtenido una media muestral
x
121
= 25 y una varianza muestral s
2
= 144. Un intervalo de conanza aproximado para la media al nivel 0
95
es:
a)
_
25 1
98
12
120
, 25 + 1
98
12
120
_
;
d) (85
95, 104
05);
b) (26
03, 23
97);
e) Todo falso.
c) (123
32, 123
33);
28. (07-09-06) Si la estimacion maximo verosmil de la media de una poblacion uniforme U(0, ) es 1, la
estimacion maximo verosmil de la varianza de la misma poblacion es:
a) 1/3; b) 1; c) 1/12; d) 1/4; e) Todo falso.
29. (07-09-06) Sea una v.a. con distribucion uniforme U(3 10, + 10). Para estimar el parametro se
ha tomado una m.a.s. de tama no cinco que ha arrojado los siguientes resultados: (2, 7, 10, 5, 6). La estimacion
del parametro , por el metodo de los momentos, es:
a) 4; b) 3; c) 2; d) 9; e) Todo falso.
30. (16-02-07) Si T
1
y T
2
son dos estimadores centrados de , entonces la combinacion lineal T = a T
1
+b T
2
,
con a y b constantes en el intervalo [0, 1] es un estimador:
a) Centrado siempre que a = 1 b;
d) Centrado si a = 1/4, b = 3/4;
b) Centrado siempre que a = b;
e) Todo falso.
c) Centrado si a = b = 1/2;
31. (16-02-07) Si al realizar una estimacion por intervalo se quiere aumentar la conanza, manteniendo el
mismo tama no muestral, entonces necesariamente se obtiene que el error de estimacion:
a) Disminuye; b) Aumenta; c) No vara; d) Todo cierto; e) Todo falso.
32. (22-06-07) Sea (
1
,
2
, . . . ,
n
) una m.a.s. de una poblacion de uniforme en (, 1). El estimador maximo
verosmil de la media de la poblacion es:
a)
n
;
d) 1 (1/
n
);
b) (1 + mn{
1
,
2
, . . . ,
n
})/2;
e) Todo falso.
c) 1
n
;
33. (22-06-07) Sea un parametro poblacional y T un estimador de tal que E(T) = para cualquier
tama no muestral, entonces T es un estimador de :
a) Centrado;
b) Asintoticamente centrado;
e) Todo falso.
c) Insesgado;
34. (07-09-07) Sea (
1
,
2
, . . . ,
n
) una m.a.s. de una v.a. con media y varianza
2
> 0. Entonces se puede
armar siempre que:
a)
n
es un estimador insesgado de ;
c) (
n
)
2
es un estimador insesgado de
2
;
e) Todo falso.
b) (
n
)
2
2
;
d)
n
35. (07-09-07) En un sondeo realizado sobre 50 alumnos de la asignatura MEDLI, se ve que 12 de ellos
no estan satisfechos con el enfoque de la asignatura. Un intervalo de conanza, al 99 %, para la proporcion
poblacional de insatisfechos es aproximadamente:
a) (196,342); b) (00025,00032); c) (00842,03958); d) (02393,02407); e) (12,50).
36. (18-02-08) El estimador maximo verosmil del parametro p de una poblacion de Bernoulli B(1, p) es:
a)
n
; b)
1
n
i
(
i
p)
2
;
c)
n
n
n1
; d) n
n
(1
n
); e) Todo falso.
37. (18-02-08) El estimador maximo verosmil de la varianza de una poblacion de Bernoulli B(1, p) es:
a)
n
; b)
1
n
i
(
i
p)
2
;
c)
n
n
n1
; d) n
n
(1
n
); e) Todo falso.
38. (18-02-08) Si se desea obtener un intervalo de conanza para la media de una distribucion normal con
varianza conocida y se preja el nivel de conanza, al aumentar el tama no de la muestra la amplitud del
intervalo:
a) Aumenta;
d) Se multiplica por dos;
b) Se mantiene constante;
e) Todo falso.
c) Disminuye;
39. (18-02-08) Si se desea obtener un intervalo de conanza para la media de una distribucion normal con
varianza conocida y se dispone de una muestra aleatoria de tama no n = 100, al aumentar el nivel de conanza
la amplitud del intervalo:
a) Aumenta;
d) Se divide entre dos;
e) Todo falso.
c) Disminuye;
40. (18-02-08) La longitud de los tornillos cortados por una maquina sigue una distribucion normal. Se toma
una m.a.s. de 20 de estos tornillos, con la que se obtiene que la cuasidesviacion tpica muestral es s
2
= 0
0153.
Un intervalo de conanza, al 95 %, para la varianza poblacional
2
es aproximadamente:
a) (-125,-0026); b) (000885,003264); c) (01,03); d) (125,226); e) Todo falso.
41. (26-06-08) Sea (
1
,
2
, . . . ,
n
) una m.a.s. de una v.a. con funcion de densidad f(x) =
2
xe
x
si x > 0
y f(x) = 0 en el resto, con un parametro desconocido positivo. Entonces el estimador maximo verosmil de
es:
a)
n
;
b)
1
n
;
c) max{
1
, . . . ,
n
}; d) mn{
1
, . . . ,
n
};
e)
2
n
.
42. (26-06-08) Sea (
1
,
2
, . . . ,
n
) una m.a.s. de una v.a. con funcion de densidad f(x) = e
x
si x > y
f(x) = 0 en el resto, con un parametro desconocido positivo. Entonces el estimador maximo verosmil de
es:
a)
n
; b)
n
/2; c)
n
; d)
n
/2; e) Todo falso.
43. (05-09-08) Sea (
1
,
2
, . . . ,
n
) una m.a.s. de una v.a. con funcion de densidad
f(x) =
_
( 2)x
3
si 0 < x < 1
0 en el resto
con un parametro desconocido mayor que 2. Entonces el estimador maximo verosmil de es:
a)
n
;
b) 2
n
i
ln(
i
)
;
c)
1
n
i
ln(
i
); d) max{
1
, . . . ,
n
}; e) Todo falso.
44. (05-09-08) Sea (
1
,
2
, . . . ,
n
) una m.a.s. de una poblacion B(1, p), sea T
1
el estimador maximo verosmil
de p y sea T
2
el estimador de p por el metodo de los momentos. Se tiene que:
a) T
1
= T
2
; b) T
1
=
n
; c) T
2
=
n
; d) T
1
= T
2
= S
2
; e) Todo falso.
45. (05-09-08) Una nueva droga ha curado a 9 de 30 personas de una determinada enfermedad. Un intervalo
de conanza al nivel 1 = 0
99 de la probabilidad de curar a una persona de esa enfermedad es:

a) (008,052); b) (014,046); c) (016,044); d) (019,041); e) (023,034).
46. (02-07-09) Si un estimador T es tal que su error cuadratico medio coincide con su varianza, es decir,
E.C.M.(T) = V ar(T), entonces T es:
a) Insesgado;
d) Asintoticamente sesgado;
b) Sesgado;
e) Todo falso.
c) Asintoticamente insesgado;
47. (02-07-09)Si (2, 13, 4, 6) es una m.a.s. de tama no 4 de una poblacion con distribucion uniforme U(, 15),
la estimacion maximo verosmil de es:
a) 13; b) 2; c) 4; d) 6; e) Todo falso.
48. (02-07-09)Si para una v.a. con distribucion gamma (2, ) se ha obtenido una m.a.s. de tama no uno
siendo x
1
= 1, un intervalo de conanza para al nivel de conanza 0
a) (2, 4); b) (0
24, 5
6); c) (0
5, 2); d) (2
3, 3
2); e) (3, 4).

49. (02-07-09)En un intervalo de conanza para el cociente de varianzas de dos poblaciones normales, si
aumentamos el nivel de conanza, la longitud del intervalo:
a) Aumenta; b) Disminuye; c) Permanece igual; d) Todo cierto; e) Todo falso.
50. (02-07-09)Si (1, 2, 1, 4) es una m.a.s. de tama no n = 4 de una poblacion uniforme U(, +1), la estimacion
de por el metodo de los momentos es:
a) 1; b) 4; c) 15; d) 25; e) Todo falso.
51. (16-09-09) En una empresa saben que el n
o
de horas perdidas por accidente laboral sigue una distribucion
normal N(, 2), siendo desconocida. El mnimo tama no muestral para estimar con un error de estimacion
menor o igual que 1 y un nivel de conanza del 0
95 es:
a) n = 16; b) n = 30; c) n = 8; d) n = 100; e) Todo falso.
52. (16-09-09) Sea (
1
, . . . ,
n
) una m.a.s. de una poblacion con distribucion uniforme U(0, b). El estimador
de b por el metodo de los momentos es:
a) max{
1
, . . . ,
n
}; b) mn{
1
, . . . ,
n
}; c) 2
n
; d)
n
; e) Todo falso.
N
o
Solucion N
o
Solucion N
o
Solucion N
o
Solucion N
o
Solucion
1. b) 2. a), b) 3. d) 4. c) 5. c)
6. d) 7. d) 8. a), b), d) 9. a) 10. d)
11. d) 12. b) 13. e) 14. b) 15. a)
16. e) 17. d) 18. b) 19. a) 20. b), d)
21. d) 22. e) 23. b) 24. e) 25. e)
26. a), c) 27. a) 28. a) 29. b) 30. a), c), d)
31. b) 32. b) 33. a), b), c), d) 34. a) 35. c)
36. a) 37. e) 38. c) 39. a) 40. c)
41. e) 42. e) 43. b) 44. a), b), c) 45. a)
46. a), c) 47. b) 48. b) 49. a) 50. c)
51. a) 52. c)
TEMA 8.- ESTIMACI

PR
En muchas ocasiones los periodicos, la television, etc, nos presentan los resultados de algunas encuestas, donde
ha sido necesario realizar preguntas comprometidas a los encuestados. Por ejemplo:
Para el conjunto de la sociedad se estima que la media de varones con orientacion preferente o exclusivamente
homosexual es de entre un 4 % y 6 % de la poblacion total. Los porcentajes detectados entre el clero cat olico
son signicativamente altos, puesto que entre los sacerdotes en activo, un 60 % mantiene relaciones sexuales
de modo habitual o esporadico y, entre ellos, un 20 % realiza practicas de caracter homosexual y un 12 % es
exclusivamente homosexual (Rodrguez, P. (1995). La vida sexual del clero. Barcelona: Ediciones B, pp. 168-
169).
Aparte de la veracidad o falsedad de los resultados obtenido en el trabajo anteriormente citado, cuestion que no
nos interesa en absoluto en esta asignatura, hay una cuestion de fondo mucho mas importante para nosotros:
como han conseguido estos datos? Es evidente, que no puede pedrsele al encuestador que vaya y pregunte a
una persona elegida al azar en la calle: Es usted homosexual? y menos a un a un sacerdote: Mantiene usted
relaciones sexuales de modo habitual o espor adico?, con lo cual tiene que haber alg un metodo alternativo para
conseguir esto. Vamos a ver uno de ellos, aunque hay varios similares, puesto que esto ademas de ser un buen
ejercicio del tema 8, es utilizado en algunas ocasiones en la industria a la hora de tener datos economicos o de
otro tipo, que las empresas suelen ser reacias a facilitar.
Supongamos que estamos interesados en conocer la proporcion de espa noles que pertenecen a un determinado
grupo social (GS), de forma que es comprometido y/o indiscreto preguntarles directamente si pertenecen a
dicho grupo. En este caso se puede pasar un cuestionario en el que llegados a un punto formule la pregunta
referente a este tema como sigue:
Antes de contestar a las preguntas 1. o 2. lance un dado. Si obtiene un n umero menor o igual que 5
conteste a la pregunta 1., en otro caso conteste a la pregunta 2.. Observe que as su anonimato es total,
puesto que ni siquiera el encuestador que recoge su cuestionario puede saber si usted esta contestando
realmente a la pregunta 1. o a la 2..
1. Pertenece usted al grupo social GS?
2. Su DNI, sin la letra, acaba en un n umero par?
Respuesta: A) S. B) No.
Ahora bien, sirve esto para algo? Podemos pensar que no, puesto que al nal tendremos una serie de respuestas
armativas y otras negativas, pero somos incapaces de saber cuales son a la pregunta de interes. Sin embargo,
a traves de las propiedades del estimador maximo verosmil vamos a ver como esto no es as y como, de hecho,
somos capaces de dar la estimacion mas verosmil de la proporcion de espa noles que pertenecen al grupo social
GS a partir de los datos de una muestra.
Si denotamos por A el suceso el individuo ha respondido A) a la pregunta, puesto que no sabemos a que
pregunta ha contestado, este suceso estara formado por aquellos individuos que han respondido A) a la pregunta
1. (vamos a denotarla Pr
1
) y aquellos que hayan respondido A) a la pregunta 2. (Pr
2
). As pues, aplicando las
propiedades de la probabilidad tenemos que:
P(A) = P(A Pr
1
) +P(A Pr
2
) = P(A/Pr
1
)P(Pr
1
) +P(A/Pr
2
)P(Pr
2
).
Ahora bien, parte de las probabilidades de la expresion anterior son conocida, puesto que han sido realizadas
mediante experimentos controlados:
P(Pr
1
) =
5
6
(sale un n umero 5 al lanzar el dado)
P(Pr
2
) =
1
6
(sale un 6 al lanzar el dado)
P(A/Pr
2
) =
1
2
(la mitad de los DNI acaban en un n umero par)
por otro lado P(A/Pr
1
) denota precisamente la probabilidad de pertenecer al grupo social GS, que es lo que
estamos interesados en estimar. As pues, entre P(A) y P(GS) tenemos una relacion directa:
P(A) = P(GS)
5
6
+
1
2
1
6
P(GS) =
P(A)
1
12
5
6
=
6
5
P(A)
1
10
,
con lo cual, si conseguimos obtener el estimador maximo verosmil de P(A), para lo cual tenemos datos, podemos
obtener, aplicando las propiedades del e.m.v., el de P(GS).
Vamos a comenzar pues, obteniendo el e.m.v. de P(A). Puesto que cada persona responde A) o B), consideramos
la variable aleatoria respuesta a la pregunta denida como sigue:
=
_
1 si responde A),
0 si responde B).
Puesto que hemos denotado por P(A) la probabilidad de que responda A), tenemos que B(1, P(A)). Para
esta v.a. tenemos una muestra de tama no n (
1
,
2
, . . . ,
n
) y podemos obtener el e.m.v. de P(A) al derivadar
del logaritmo neperiano de la funcion de verosimilitud e igualarlo a cero.
L(x
1
, x
2
, . . . , x
n
; P(A)) =
n
i=1
P( = x
i
) =
_
n
i=1
_
1
x
i
_
_
P(A)
i
x
i
(1 P(A))
n
i
x
i
,
ln(L(x
1
, x
2
, . . . , x
n
; P(A))) = ln
_
n
i=1
_
1
x
i
_
_
+
n
i=1
x
i
(ln(P(A))) +
_
n
n
i=1
x
i
_
ln(1 P(A)),
P(A)
ln(L(x
1
, x
2
, . . . , x
n
; P(A))) = 0 +
n
i=1
x
i
1
P(A)
+
_
n
n
i=1
x
i
_
1
1 P(A)
= 0 P(A) =
1
n
n
i=1
x
i
,
con lo cual el estimador maximo verosmil de P(A) es:
1
n
n
i=1
i
=
n
.
Como nosotros estamos interesados en estimar P(GS) y tenamos la relacion P(GS) =
6
5
P(A)
1
10
, aplicando
la propiedad b) de la pagina 272, tenemos que el estimador maximo verosmil de P(GS) es:
T T(
1
,
2
, . . . ,
n
) =
6
5
1
10
,
con lo cual, a partir de los datos muestrales, haremos la media de los mismos y podremos dar la estimacion
maximo verosmil de la proporcion de espa noles en ese grupo social GS como sigue:
T(x
1
, x
2
, . . . , x
n
) =
6
5
x
n
1
10
,
sin haberle preguntado directamente si pertenecan o no al grupo.
Vamos a ir viendo como hacer esto con ayuda del Excel en nuestro ejemplo particular. Para ello comenzamos
abriendo el chero pr08.xls.
Una vez introducidos los datos de las respuestas a la pregunta realizada en clase en la columna correspondiente
(Columna B, a partir de la casilla B11), debemos realizar la media de la muestra, para obtener la estimacion
maximo verosmil de la probabilidad de los que contestaran A) en toda la poblacion, que en este caso podra
ser los estudiantes de Ingeniera de Espa na, o incluso los estudiantes universitarios espa noles. Antes de nada
comenzaremos calculando el tama no de la muestra (n). Para ello nos colocamos en la casilla B2 y tecleamos:
=CONTAR(B11:B160)
Una vez hecho esto, nos situamos en la celda B3 y tecleamos
=SUMA(B11:B160)/B2
con lo cual obtenemos la media muestral (x
n
) para la variable . Como no estamos interesados en estimar
cuantos de los estudiantes de ingeniera espa noles contestaran A) a la pregunta, que puede ser la 1. o la 2., sino
cuantos contestaran A) a la primera, realizamos la transformacion T =
6
5
x
n
1
10
. Para ello nos situamos en la
casilla B6 y tecleamos
=6/5*B3-0,1
con lo cual obtenemos la estimacion maximo verosmil de la proporcion de estudiantes en Espa na que contestaran
A) a la pregunta 1.
De igual forma podramos calcular la estimacion maximo verosmil para el resto de las muestras que aparecen
en el archivo, sin mas que arrastrar las casillas B2:B6 hasta la columna E. Vemos como para cada muestra
la variable aleatoria T(
1
,
2
, . . . ,
n
) toma valores distintos. Cada uno de ellos (lnea 6) sera una estimacion
maximo verosmil de la proporcion que queremos estimar y lo interesante es ver la tendencia general para las
distintas muestras. Esto puede verse mas claramente en la hoja Gracos del archivo.
Seg un vemos en el graco, la estimacion que daramos de la proporcion en la poblacion es diferente seg un la
muestra elegida, algo esperable puesto que T(
1
,
2
, . . . ,
n
) es una variable aleatoria. Si todas las muestras son
de la misma poblacion, debera haber cierta relacion entre las estimaciones proporcionadas. Para ello, se puede
plantear la obtencion de la estimacion de la proporcion por intervalos en lugar de mediante estimacion puntual.
Si tenemos una muestra de tama no n (n 30), seg un hemos visto en teora (Ejemplo 8.5.8 (pag. 280)), el
intervalo de conanza al nivel de conanza 100(1 ) % para una proporcion p es:
_
p b
p(1 p)
n
, p +b
p(1 p)
n
_
,
donde b denota el punto en el que la funcion de distribucion de una N(0, 1) toma el valor 1

2
, puesto que b
es el valor en el que
P(b < N(0, 1) < b) = P(|N(0, 1)| < b) = 1 F
N(0,1)
= P(N(0, 1) b) = 1

2
.
En nuestro caso, vamos a suponer que el nivel de conanza es 1 = 0
94, con lo que el valor de b se obtendra

en la casilla B8 si tecleamos:
=DISTR.NORM.INV(0,97;0;1)
Con esto, vamos a obtener el extremo inferior del intervalo para cada una de las muestras en la lnea 4 y el
extremo superior en la 5. Para ello nos situamos en la casilla B4 y tecleamos:
=B6-$B8*RAIZ(B6*(1-B6)/B2)
con lo que obtenemos el extremo inferior del intervalo de conanza para nuestra muestra. Por otro lado, si nos
situamos en la casilla B5 y tecleamos:
=B6+$B8*RAIZ(B6*(1-B6)/B2)
obtenemos el extremo superior.
Hemos puesto el smbolo $ delante de la referencia de la la y de la columna de la casilla B8 para poder arrastrar
estas celdas hacia la derecha sin que cambie la referencia de la casilla en la que se encuentra el valor de b, que
es la misma en todos los casos. Una vez arrastradas las celdas, hemos conseguimos los intervalos de conanza
obtenidos para cada una de las muestras, al nivel de conanza prejado. Dichos intervalos pueden visualizarse
en la hoja Gracos.
OTESIS.
APUNTES DE TEOR
IA.
La imaginacion, impaciente por remontarse a los orgenes, se complace en crear hipotesis y a menudo
deforma los hechos para plegarlos a su labor: en tales casos, las hipotesis son peligrosas. Pero cuando solo
se las considera como medios para conectar entre s los fenomenos a n de descubrir sus leyes, cuando,
procurando no atribuirles realidad, se las rectica continuamente con ayuda de nuevas observaciones, en-
tonces pueden llevarnos a las causas verdaderas o, por lo menos, ponernos en condiciones de inferir de los
fenomenos observados, aquellos principios que, dadas las circunstancias, han debido originarlos.
(Pierre Simon de Laplace)
El metodo cientco se basa en la formulacion de hipotesis, conjeturas o suposiciones que deben comprobarse
en busca de una conrmacion o de una contradiccion que nos permita reforzar o rechazar, respectivamente, la
hipotesis inicial. La formulacion de hipotesis es tambien la base del metodo estadstico.
En el tema anterior tratamos el problema de la estimacion de un n umero nito de parametros de una poblacion.
En este tema consideraremos otro problema importante de la inferencia estadstica, el contraste de hipotesis
estadsticas.
Las hipotesis en estadstica inferencial son suposiciones que tienen que ver con la distribucion de la poblacion.
Su verdad o falsedad no puede establecerse con exactitud, por lo que el criterio para aceptar o rechazar una
hipotesis estadstica se basa en un razonamiento inductivo o de tipo probabilstico: a traves de una muestra se
determina la probabilidad de que los resultados obtenidos sean compatibles con la hipotesis establecida. Si es
altamente improbable que, de ser cierta la hipotesis, se hayan producido dichos resultados, la rechazaremos. De
no ser as, lo mas que podemos decir es que no existen razones para refutar la hipotesis.
Si la hipotesis estadstica se reere solo a valores numericos de parametros de la distribucion recibe el nombre
de hipotesis parametrica, y el test correspondiente test o contraste parametrico. En caso contrario se
dice que la hipotesis es no parametrica y el test correspondiente es un test no parametrico.
En las primeras secciones del tema nos ocupamos exclusivamente de los contrastes parametricos dejando el caso
no parametrico para la ultima seccion.
9.1. Conceptos basicos.
El proposito de un test o contraste de hipotesis es decidir a partir del resultado de una muestra si la hipotesis
expuesta puede calicarse o no como adecuada o, mas concretamente si la hipotesis debe o no ser rechazada.
Denicion 9.1.1 Un test o contraste de hipotesis es una regla mediante la que decidimos si rechazamos o
no una hipotesis en funcion del resultado de un experimento.
Consideremos los siguientes ejemplos:
1. Un envasador de legumbres arma que, en promedio, el contenido de cada paquete de lentejas pesa al
menos 200 gramos. Para vericar esta armacion, se pesa el contenido de una muestra aleatoria de paquetes
y se compara el resultado con la armacion del envasador.
2. Una compa na recibe un gran cargamento de piezas. Solo puede aceptar el envo si no hay mas de un
5 % de piezas defectuosas. La decision de aceptar la remesa puede basarse en el examen de una muestra
aleatoria de piezas.
3. Un investigador quiere saber si una propuesta del Gobierno es acogida de igual forma por hombres y por
mujeres. Para analizar si es as, recoge las opiniones de una muestra aleatoria de hombres y mujeres.
Para hacer mas general nuestra exposicion, supongamos una poblacion cuya distribucion depende de un
parametro . Supongamos que se formula una hipotesis sobre este parametro y que esta hipotesis se considera-
ra cierta a no ser que se produzca suciente evidencia en contra, en este contexto, una hipotesis de este tipo se
conoce como hipotesis nula. Por ejemplo, en ausencia de evidencia contraria, podemos creer la armacion del
envasador de que, en promedio, el contenido de los paquetes de lentejas pesa al menos 200 gramos. Cuando se
recoge informacion muestral, esta hipotesis es juzgada, o contrastada. Si la hipotesis se rechaza debemos tener
una alternativa, as cuando el investigador elabora un contraste formula una hipotesis alternativa frente a la
cual se contrasta la hipotesis nula. Por ejemplo, para el envasador de legumbres la hipotesis alternativa sera que
el peso medio de cada paquete es inferior a 200 gramos. La hipotesis nula se denota por H
0
y la hipotesis
alternativa H
1
.
Una hipotesis, nula o alternativa puede designar un unico valor,
0
, para el parametro. En este caso, se dice
que la hipotesis es simple. Por ejemplo, en la situacion descrita en el punto 3, el experto puede comenzar su
investigacion estableciendo la hipotesis nula simple de que la diferencia entre las proporciones de hombres y
mujeres de la poblacion que estan a favor de la iniciativa del ejecutivo es 0.
Cuando la hipotesis designa un rango de valores para el parametro, se dice que es compuesta y sera cierta
para mas de un valor del parametro. Por ejemplo, la hipotesis de que el peso medio de los paquetes es al menos
200 gramos es compuesta, y es cierta para cualquier peso medio poblacional mayor o igual que 200 gramos.
En muchas ocasiones, se contrasta una hipotesis nula simple, del tipo, H
0
: =
0
, frente a una alternativa
compuesta. En algunos casos, solo interesan alternativas a un lado de la hipotesis nula. Por ejemplo, H
1
: >
0
,
o por el contrario, la alternativa puede ser H
1
: <
0
.
Las hipotesis alternativas de este tipo se denominan alternativas unilaterales y el test correspondiente, test
o contraste unilateral. Otra posibilidad es presentar la alternativa como que el valor de sea cualquiera
distinto de
0
, es decir H
1
: =
0
.

Estas se denominan alternativas bilaterales y el test correspondiente,
test o contraste bilateral.
Despues de especicar las hipotesis y de recoger informacion muestral debe tomarse una decision. El metodo
general de un test o contraste de hipotesis consiste en:
1
o
Considerar una m.a.s. (
1
,
2
, ...,
n
) a partir de .
2
o
Clasicar el conjunto de todas las posibles realizaciones (x
1
, x
2
, ..., x
n
) de la m.a.s. en dos regiones comple-
mentarias S
1
y S
0
, de forma que si una realizacion (x
1
, x
2
, ..., x
n
) pertenece a S
1
se rechaza H
0
, mientras
que si (x
1
, x
2
, ..., x
n
) esta dentro de S
0
no se rechaza H
0
. S
1
y S
0
reciben el nombre de region crtica (o
de rechazo) y region de aceptacion, respectivamente.
Las verdades deducidas mediante procedimientos estadsticos inferenciales son verdades provisionales, por
eso hablamos de rechazar y no rechazar la hipotesis, pudiendo darse la situacion de no rechazar ni una hipotesis
ni su alternativa.
Errores implicados en un test.
En todo contraste de hipotesis estan en juego dos errores que deniremos sobre el contraste H
0
: =
0
contra
H
1
: =
1
.
Error tipo I: es el que se comete cuando se rechaza H
0
siendo cierta.
Error tipo II: es el que se comete cuando se acepta H
0
siendo falsa.
La situacion se puede esquematizar:
HIP
OTESIS VERDADERA
H
0
cierta H
0
falsa o H
1
cierta
HIP
OTESIS H
0
rechazada Error tipo I () Decision correcta (1 )
ACEPTADA H
0
no rechazada Decision correcta (1 ) Error tipo II ()
Asociados a los errores hay sendas probabilidades que permiten, entre otras cosas, medir la calidad del contraste.
As la probabilidad de error de tipo I se suele denotar por = P(Rechazar H
0
/H
0
es cierta), y la probabilidad
de error de tipo II se denota por = P(No rechazar H
0
/H
1
es cierta). En terminos de la region crtica:
= P((
1
,
2
, . . . ,
n
) S
1
/H
0
) y = P((
1
,
2
, . . . ,
n
) S
0
/H
1
).
Salvo que se trate de hipotesis simples las anteriores probabilidades tendran mas de un valor, uno por cada
valor del parametro que propone la hipotesis correspondiente. En este sentido, sera mas correcta la siguiente
notacion () y ().
q
0
q
1
b a
k
Rechazar H
0
Aceptar H
0
Figura 9.1: Relacion entre y .
En principio, sera deseable utilizar el test que hiciera mnimas ambas probabilidades. Desgraciadamente, cuando
el tama no muestral esta jado, no es posible controlar simultaneamente ambas probabilidades de error. As,
en la situacion lmite podemos hacer que = 0, solo necesitamos establecer S
1
= , esto es, no rechazamos
nunca H
0
. Pero entonces S
0
= IR
n
y = 1. De la misma manera si adoptamos que S
1
= IR
n
, entonces = 0,
pero = 1. Y si se intenta hacer que disminuya, nos encontramos con que aumenta, como podemos ver
en la Figura 9.1, donde suponemos que N(, 1), y tratamos de contrastar H
0
: =
0
contra H
1
: =
1
a partir de una muestra de tama no 1, con el test denido a traves de la region crtica: S
1
= {x/x > k}. Se
observa que si queremos disminuir , solo tenemos que desplazar k hacia la derecha, pero con eso conseguimos
aumentar , y recprocamente, si desplazamos k hacia la izquierda disminuimos pero aumentamos . La
unica manera de disminuir a la vez las dos probabilidades de error sera obtener mas informacion, tomando una
muestra mayor. Habitualmente, lo que se hace en la practica, es jar la probabilidad de cometer un error de
tipo I a un nivel deseado, es decir, se ja el nivel de signicacion y buscamos aquellas regiones crticas
S
1
tales que, = P{(
1
,
2
, . . . ,
n
) S
1
/H
0
} y nos quedamos con la que minimice la probabilidad de error de
tipo II. Si H
0
es compuesta, el nivel de signicacion, (tama no del test seg un algunos autores), es la mayor de
las probabilidades de error de tipo I entre todos los posibles valores del parametro que propone H
0
, es decir:
= sup {()/ propuesto por H
0
}.
Si tambien H
1
es compuesta, la probabilidad de error de tipo II depende del valor especco del parametro
propuesto por H
1
. Por lo que se necesita un nuevo instrumento para comparar los contrastes.
Denicion 9.1.2 Se dene la funcion potencia del test: () = P{rechazar H
0
/ el parametro es = }. Por
lo tanto el valor de la funcion potencia cuando es un valor cualquiera de los que propone H
1
es:
() = 1 ().
Luego, si se utiliza la potencia como instrumento para medir la bondad de un test, interesan tests cuya potencia
sea mnima cuando esta propuesto por H
0
y maxima cuando lo propone H
1
.
Ejemplo 9.1.1 Sea una variable aleatoria que sigue una N(, = 2). Pretendemos calcular la potencia del
contraste:
H
0
: = 5
H
1
: > 5
Se trata de un contraste unilateral que queremos llevar a cabo al nivel 0
05, mediante una m.a.s. de tama no 20.

Como H
1
propone que > 5, la region crtica adecuada sera:
S
1
= {(x
1
, x
2
, ..., x
20
)/x
20
> k}.
La potencia viene dada por:
() = P
_
(
20
)
20
2
>
(k )
20
2
_
= 1
_
(k )
20
2
_
,
siendo la funcion de distribucion de la N(0, 1).
N(0,1)
1.645
a=0.05
El valor de k sera aquel que: = (5) = 0
05, es decir: (k 5)
20/2 = 1
645, luego k = 5
74.
Si calculamos la cuanta de la funcion potencia para otros valores de , tenemos:
(4) = 0
000052, (6) = 0
7228, (7) = 0
9977, . . .
Gracamente la funcion () para contrastes unilaterales tiene la forma:
Si el contraste es bilateral del tipo:
H
0
: = 5
H
1
: = 5
con las demas caractersticas iguales al anterior, como H
1
ahora propone que = 5, la region crtica adecuada
sera:
S
1
= {(x
1
, x
2
, ..., x
20
)/|x
20
5| > k
}.
La potencia viene dada por:
() = 1 P
_
|
(
20
)
20
2
|
(k)
20
2
_
= 1 P
_
(k)
20
2

(
20
)
20
2

(k)
20
2
_
= 1
_
_
(k)
20
2
_
(k)
20
2
__
= 1
_
_
(k)
20
2
_
_
1
_
(k)
20
2
___
= 2
_
1
_
(k)
20
2
__
.
Actuando igual que antes tenemos k = 0
87, y la representacion graca de es de la forma:

Ahora podemos clasicar los contrastes por su potencia as:
Menos potente Ideal Mas potente
Bilaterales
q
0
a
q
0
a
q
0
a
Unilaterales
q
0
a
q
0
a
q
0
a
Figura 9.2: Funcion potencia para distintos contrastes.
En este enfoque de la teora de contrastes de hipotesis, propuesto por Neyman y Pearson hacia 1930, se elige
un nivel de signicacion , en funcion de la importancia que en la practica se conceda al error de tipo I y al
riesgo que el investigador este dispuesto a asumir en el contraste. Es habitual elegir = 0
05, = 0
01, = 0
1,
etc. Si denotamos por S
1
la region critica de un test a nivel , habitualmente ocurre que, si < entonces
S
1
S
1
, es decir, que cuanto mayor sea el nivel de signicacion de un test mayores son los inconvenientes
que se le ponen a la hipotesis nula para no ser rechazada, por lo que puede resultar de mucha utilidad para
valorar la consistencia o debilidad de la hipotesis nula, el nivel crtico.
Denicion 9.1.3 Dada una realizacion (x
1
, x
2
, ..., x
n
) el nivel crtico o p-valor, es el menor nivel de signica-
cion para el que se rechaza H
0
, (o el mayor nivel de signicacion de entre los que H
0
no se rechaza), suponiendo
que H
0
es cierta.
As, si el nivel crtico es muy grande, quiere decir que podemos poner S
1
muy grande sin que rechacemos H
0
,
lo que nos da una gran conanza en esa hipotesis, pues resiste ltros muy rigurosos, mientras si el nivel crtico
es muy peque no, rechazaremos esa hipotesis pues nos merece poca conanza. El umbral para rechazar o no una
determinada hipotesis depende del nivel de signicacion elegido, as si: el nivel crtico es menor que el nivel de
signicacion, rechazamos H
0
, y en caso contrario no rechazamos H
0
.
0 1
Rechazamos H
0
No rechazamos H
0
Nivel crtico
Figura 9.3: Nivel crtico.
Ejemplo 9.1.2 Cuando un proceso de produccion de bolas de rodamientos funciona correctamente, el peso de
las bolas tiene una distribucion normal de media 7
05 gramos y desviacion tpica 0
15 gramos. Se lleva a cabo

una modicacion del proceso, y el director de la fabrica sospecha que esta modicado el peso medio de las bolas
producidas sin afectar a la desviacion tpica. Se toma una muestra aleatoria de 36 bolas, y se comprueba que el
peso medio es de 6
95 gramos. Contradicen estos datos que la media de la poblacion es 7
05?
Se trata de un contraste para la media de una poblacion Normal con varianza conocida. Planteamos el contraste
H
0
: = 7
05
H
1
: = 7
05
La naturaleza del problema y la pregunta imponen que el contraste sea bilateral.
Fijamos = 0
05, y decidimos rechazar H

0
si |x
n
7
05| > k. El valor de k se obtiene en funcion del nivel

= 0
05.
P
_
|
n
7
05| > k/H

0
_
= 0
05 = 1 P
_
|
n
7
05| k/H
0
_
= 1 P
_
k
n
7
05 k/H
0
_
=
1 P
_
k
(
n
7
05)
_
= 1
_
_
k
_
k
__
= 2
_
1
_
k
__
k =

1
_
1

2
_
=
0
15
36
(1
96) = 0
049.
Como en nuestro caso |6
95 7
05| = 0
1 > 0
049 rechazamos H
0
, luego las sospechas del director estaban
fundadas.
Veamos el nivel crtico: Con los datos obtenido rechazaramos H
0
, si k 0
1, entonces la probabilidad de
rechazar H
0
en esas condiciones la obtenemos sin mas que reemplazar k por 0
1 en 2
_
1
_
k
__
, es decir
2
_
1
_
0
36
0
15
__
= 2[1 0
99997] = 0
00006.
Un p-valor tan bajo nos da una gran seguridad en que H
0
es falsa, pues un resultado como el obtenido, solo se
dara 6 de cada 100000 ocasiones si H
0
fuera cierta.
Un intervalo del 95 % de conanza para la media de la poblacion, seg un los datos de que se dispone es:

_
x
n
z
/2
n
_
=
_
6
95 1
96
0
15
36
_
(6
9, 7).
Observamos que el valor del parametro que propone H
0
, = 7
05 / (6
9, 7), lo que refuerza la decision de

rechazar H
0
. Esta manera de decidir si rechazamos o no la hipotesis H
0
, es la que desarrollamos en el apartado
siguiente.
9.2. Test de hipotesis e intervalos de conanza.
Existe una relacion entre un contraste de hipotesis bilateral del tipo:
H
0
: =
0
H
1
: =
0
(9.2.1)
y el intervalo de conanza para , que nos permite dar la regla de decision para esa clase de contrastes de una
manera muy simple e intuitiva, y que podemos adaptar a los contrastes unilaterales de forma natural.
La regla consiste en rechazar H
0
si
0
no pertenece al intervalo de conanza para obtenido a partir de una
realizacion muestral, (x
1
, x
2
, ..., x
n
) de la m.a.s. (
1
,
2
, ...,
n
) y no rechazar H
0
en caso contrario.
Sea (0, 1) un nivel de signicacion jado y sea I
1
(
1
,
2
, ...,
n
) el intervalo aleatorio al nivel de conanza
= 1 , para el parametro , e I
1
(x
1
, x
2
, ..., x
n
) el correspondiente intervalo de conanza. Denimos la
region crtica para ese contraste,
S
1
(
0
) = {(x
1
, x
2
, ..., x
n
)/
0
/ I
1
(x
1
, x
2
, ..., x
n
)}.
En consecuencia:
P(e
I
) = P{(
1
,
2
, ...,
n
) S
1
(
0
)/H
0
es cierta} = P{
0
/ I
1
(
1
,
2
, ...,
n
)/ =
0
} = 1 (1 ) = ,
luego S
1
(
0
) es una region crtica al nivel de signicacion para el contraste (9.2.1).
Si ademas el intervalo es el de menor longitud esperada, conseguiremos que la potencia del contraste sea maxima
para los valores del parametro que propone H
1
.
Ejemplo 9.2.1 Sea N(, ), con conocida, y sea (
1
,
2
, ...,
n
) una m.a.s. obtenida a partir de . Si se
contrasta:
H
0
: =
0
H
1
: =
0
(9.2.2)
entonces la region de aceptacion sera:
S
0
=
_
(x
1
, x
2
, ..., x
n
)/
0

_
x
n
z
/2
n
, x
n
+z
/2
n
__
=
_
(x
1
, x
2
, ..., x
n
)/x
n

_
0
z
/2
n
,
0
+z
/2
n
__
=
_
(x
1
, x
2
, ..., x
n
)/|x
n
0
| < z
/2
n
_
,
donde z
/2
es el punto tal que P{N(0, 1) > z
/2
} = /2.
N(0,1)
z
a
a
A partir de la tres expresiones equivalentes de la region de aceptacion, vemos que no rechazamos H
0
: =
0
contra H
1
: =
0
, si:
a)
0
esta dentro de un intervalo centrado en la media muestral, o
b) la media muestral esta dentro de un intervalo centrado en
0
, o
c) el valor absoluto de la diferencia de la media muestral y
0
es peque no.
La indicacion b), nos sugiere como deberamos actuar el contraste (9.2.2) anterior lo transformamos en el
contraste unilateral,
H
0
: =
0
o H
0
:
0
H
1
: >
0
(9.2.3)
En esta situacion solo rechazaremos H
0
si la estimacion de la media poblacional dada por la media muestral,
es muy superior a
0
, pero no tiene sentido rechazar H
0
si la media muestral es muy inferior a
0
, es decir
S
0
= {(x
1
, x
2
, ..., x
n
)/x
n
(,
0
+z
n
)} = {(x
1
, x
2
, ..., x
n
)/x
n
0
< z
n
},
donde z
es el punto tal que: P{N(0, 1) > z
} = .
La otra posibilidad es que se trate de contrastar,
H
0
: =
0
o H
0
:
0
H
1
: <
0
(9.2.4)
0
es muy inferior a
0
0
si la media muestral es muy superior a
0
, es decir
S
0
= {(x
1
, x
2
, ..., x
n
)/x
n
(
0
z
n
, )} = {(x
1
, x
2
, ..., x
n
)/x
n
0
> z
n
},
donde z
es el punto tal que: P{N(0, 1) > z
} = .
Los comentarios hechos en el Ejemplo 8.5.1 (pag. 276) del tema anterior son validos en este contexto, es decir,
cuando el tama no muestral es sucientemente grande, (n 30), no es necesario conocer la distribucion de la
poblacion, ya que por el teorema central del lmite, la distribucion de la funcion pivote es aproximadamente
una N(0, 1). Tambien, si desconocemos la varianza y la muestra es sucientemente grande, podemos adaptar
facilmente las regiones crticas o de aceptacion, solo tendramos que sustituir la desviacion tpica muestral ,
por su estimacion s.
Ejemplo 9.2.2 Sea N(, ), con desconocida, y sea (
1
,
2
, ...,
n
) una m.a.s. de peque no tama no obte-
nida a partir de . Si se contrasta:
H
0
: =
0
H
1
: =
0
(9.2.5)
S
0
=
_
(x
1
, x
2
, ..., x
n
)/
0

_
x
n
t
/2
s
n
, x
n
+t
/2
s
n
__
=
_
(x
1
, x
2
, ..., x
n
)/x
n

_
0
t
/2
s
n
,
0
+t
/2
s
n
__
=
_
(x
1
, x
2
, ..., x
n
)/|x
n
0
| < t
/2
s
n
_
donde t
/2
es el punto tal que P{t
n1
> t
/2
} = /2.
Con la misma argumentacion que en el ejemplo anterior, adaptamos las regiones crticas y de aceptacion a los
contrastes unilaterales.
As, si el contraste (9.2.5) anterior, lo transformamos en el contraste unilateral,
H
0
: =
0
o H
0
:
0
H
1
: >
0
(9.2.6)
En este caso solo rechazaremos H
0
si la estimacion de la media poblacional dada por la media muestral, es muy
superior a
0
0
si la media muestral es muy inferior a
0
, es decir
S
0
= {(x
1
, x
2
, ..., x
n
)/x
n
(,
0
+t
n
)} = {(x
1
, x
2
, ..., x
n
)/x
n
0
< t
n
},
donde t
es el punto tal que: P{t

n1
> t
} = .
La otra posibilidad es que se trate de contrastar,
H
0
: =
0
o H
0
:
0
H
1
: <
0
(9.2.7)
0
es muy inferior a
0
0
0
, es decir
S
0
= {(x
1
, x
2
, ..., x
n
)/x
n
(
0
t
n
, )} = {(x
1
, x
2
, ..., x
n
)/x
n
0
> t
n
},
donde t
es el punto tal que: P{t

n1
> t
} = .
Es decir, el mismo que obtenemos en el ejemplo anterior si desconocemos la desviacion tpica, sustituyendo z
por t
, es decir, utilizando al distribucion t de Student en lugar de la Normal.

Ejemplo 9.2.3 Sea N(, ), con desconocida, y sea (
1
,
2
, ...,
n
) una m.a.s. de peque no tama no obte-
nida a partir de . Si se contrasta:
H
0
:
2
=
2
0
H
1
:
2
=
2
0
(9.2.8)
S
0
=
_
(x
1
, x
2
, ..., x
n
)/
2
0

_
ns
2
2
/2
,
ns
2
2
1/2
__
=
_
(x
1
, x
2
, ..., x
n
)/s
2
2
1/2
2
0
n
,
2
/2
2
0
n
__
donde
2
es el punto que representamos en la gura siguiente, es decir, el punto tal que: P{

2
n1
>
2
} = ,
para cualquier (0, 1).
c
a
2
1-a
Como en los ejemplos anteriores, adaptamos las regiones crticas y de aceptacion a los contrastes unilaterales.
As, si el contraste (9.2.8) anterior lo transformamos en el contraste unilateral
H
0
:
2
=
2
0
o H
0
:
2

2
0
H
1
:
2
>
2
0
(9.2.9)
En este caso solo rechazaremos H
0
si la estimacion de la varianza poblacional dada por la varianza muestral, es
muy superior a
2
0
0
si la varianza muestral es muy inferior a
2
0
, es decir
S
0
=
_
(x
1
, x
2
, ..., x
n
)/s
2
_
0,

2
2
0
n
__
.
El otro contraste unilateral,
H
0
:
2
=
2
0
o H
0
:
2

2
0
H
1
:
2
<
2
0
(9.2.10)
0
si la estimacion de la varianza poblacional dada por la varianza muestral,
es muy inferior a
2
0
0
2
0
, es decir
S
0
=
_
(x
1
, x
2
, ..., x
n
)/s
2
2
1
2
0
n
,
__
.
En los siguientes cuatro ejemplos consideraremos que: la poblacion sigue una distribucion normal N(
1
,
1
),
que (
1
,
2
, . . . ,
n
) es una m.a.s. de esa poblacion, que la poblacion sigue una distribucion normal N(
2
,
2
),
que (
1
,
2
, . . . ,
m
) es una m.a.s. de esa poblacion, y, por ultimo, que ambas muestras son independientes.
Ejemplo 9.2.4 Si suponemos que
1
y
2
son conocidas, queremos contrastar:
H
0
:
1
=
2

1
2
= 0
H
1
:
1
=
2

1
2
= 0
(9.2.11)
entonces, como se trata de un contraste de dos lados, de acuerdo con lo expuesto al principio de esta seccion, la
region de aceptacion sera:
S
0
=
_
(x
1
, x
2
, ..., x
n
), (y
1
, y
2
, . . . , y
m
)/0
_
(x
n
y
m
) z
/2
2
1
n
+

2
2
m
, (x
n
y
m
) +z
/2
2
1
n
+

2
2
m
__
=
_
(x
1
, x
2
, ..., x
n
), (y
1
, y
2
, . . . , y
m
)/(x
n
y
m
)
_
z
/2
2
1
n
+

2
2
m
, z
/2
2
1
n
+

2
2
m
__
=
_
(x
1
, x
2
, ..., x
n
), (y
1
, y
2
, . . . , y
m
)/|x
n
y
m
| < z
/2
2
1
n
+

2
2
m
_
donde z
} = , para todo (0, 1).

Las transformaciones de las regiones crticas y de aceptacion a los correspondientes tests unilaterales sigue los
mismos pasos que en los ejemplos anteriores, as si el contraste es del tipo:
H
0
:
1
=
2

1
2
= 0 o
1
2
0
H
1
:
1
>
2

1
2
> 0
(9.2.12)
la region de aceptacion es:
S
0
=
_
(x
1
, x
2
, ..., x
n
), (y
1
, y
2
, . . . , y
m
)/(x
n
y
m
)
_
, z
2
1
n
+

2
2
m
__
=
_
(x
1
, x
2
, ..., x
n
), (y
1
, y
2
, . . . , y
m
)/x
n
y
m
< z
2
1
n
+

2
2
m
_
Mientras que si el contraste es de la forma:
H
0
:
1
=
2

1
2
= 0 o
1
2
0
H
1
:
1
<
2

1
2
< 0
(9.2.13)
S
0
=
_
(x
1
, x
2
, ..., x
n
), (y
1
, y
2
, . . . , y
m
)/(x
n
y
m
)
_
z
2
1
n
+

2
2
m
,
__
=
_
(x
1
, x
2
, ..., x
n
), (y
1
, y
2
, . . . , y
m
)/x
n
y
m
> z
2
1
n
+

2
2
m
_
Tambien en este caso podemos hacer el mismo comentario que en el Ejemplo 9.2.1 (pag. 339), en el sentido que,
si los tama nos muestrales n y m son sucientemente grandes ( n 30 y m 30), podemos utilizar las mismas
regiones de aceptacion aunque las distribuciones no sean normales, por aplicacion del teorema central del lmite.
Ademas, si no conocemos las desviaciones tpicas, todo funciona igual, sin mas que sustituir en las expresiones
anteriores
2
1
y
2
2
por s
2
1
y s
2
2
, respectivamente.
Ahora, supongamos que en la situacion precedente sabemos que
2
1
=
2
2
=
2
, pero desconocemos su valor.
Ejemplo 9.2.5 Si suponemos que es desconocida, y queremos contrastar:
H
0
:
1
=
2

1
2
= 0
H
1
:
1
=
2

1
2
= 0
(9.2.14)
entonces, como se trata de un contraste de dos lados, de acuerdo con lo expuesto al principio de esta seccion
y recordando la expresion del intervalo de conanza para la diferencia entre las medias de dos poblaciones
normales con varianzas desconocidas pero iguales, que vimos en el tema anterior (Ejemplo 8.5.5 (pag. 278)), la
S
0
=
_
(x
1
, x
2
, ..., x
n
), (y
1
, y
2
, . . . , y
m
)/0
_
(x
n
y
m
) t
/2
ns
2
1
+ms
2
2
n+m
nm(n+m2)
,
(x
n
y
m
) +t
/2
ns
2
1
+ms
2
2
n+m
nm(n+m2)
__
=
_
(x
1
, x
2
, ..., x
n
), (y
1
, y
2
, . . . , y
m
)/(x
n
y
m
)
_
t
/2
ns
2
1
+ms
2
2
n+m
nm(n+m2)
,
t
/2
ns
2
1
+ms
2
2
n+m
nm(n+m2)
__
=
_
(x
1
, x
2
, ..., x
n
), (y
1
, y
2
, . . . , y
m
)/|x
n
y
m
| < t
/2
ns
2
1
+ms
2
2
n+m
nm(n+m2)
_
donde t

n+m2
> t
} = , para todo (0, 1).

mismos pasos que en los ejemplos previos, as si el contraste es del tipo:
H
0
:
1
=
2

1
2
= 0 o
1
2
0
H
1
:
1
>
2

1
2
> 0
(9.2.15)
S
0
=
_
(x
1
, x
2
, ..., x
n
), (y
1
, y
2
, . . . , y
m
)/(x
n
y
m
)
_
, t
ns
2
1
+ms
2
2
n+m
nm(n+m2)
__
=
_
(x
1
, x
2
, ..., x
n
), (y
1
, y
2
, . . . , y
m
)/x
n
y
m
< t
ns
2
1
+ms
2
2
n+m
nm(n+m2)
_
H
0
:
1
=
2

1
2
= 0 o
1
2
0
H
1
:
1
<
2

1
2
< 0
(9.2.16)
S
0
=
_
(x
1
, x
2
, ..., x
n
), (y
1
, y
2
, . . . , y
m
)/(x
n
y
m
)
_
t
ns
2
1
+ms
2
2
n+m
nm(n+m2)
,
__
=
_
(x
1
, x
2
, ..., x
n
), (y
1
, y
2
, . . . , y
m
)/x
n
y
m
> t
ns
2
1
+ms
2
2
n+m
nm(n+m2)
_
Ahora supongamos que sabemos que
2
1
=
2
2
, y desconocemos su valor.
Ejemplo 9.2.6 Si suponemos que
1
y
2
son desconocidas y distintas, para contrastar:
H
0
:
1
=
2

1
2
= 0
H
1
:
1
=
2

1
2
= 0
(9.2.17)
entonces, como se trata de un contraste de dos lados, de acuerdo con lo expuesto al principio de esta seccion
y recordando la expresion del intervalo de conanza para la diferencia entre las medias de dos poblaciones
normales con varianzas desconocidas y distintas, que vimos en el tema anterior (Ejemplo 8.5.6 (pag. 279)), la
S
0
=
_
(x
1
, x
2
, ..., x
n
), (y
1
, y
2
, . . . , y
m
)/0
_
(x
n
y
m
) t
/2
s
2
1
n
+
s
2
2
m
, (x
n
y
m
) +t
/2
s
2
1
n
+
s
2
2
m
__
=
_
(x
1
, x
2
, ..., x
n
), (y
1
, y
2
, . . . , y
m
)/(x
n
y
m
)
_
t
/2
s
2
1
n
+
s
2
2
m
, t
/2
s
2
1
n
+
s
2
2
m
__
=
_
(x
1
, x
2
, ..., x
n
), (y
1
, y
2
, . . . , y
m
)/|x
n
y
m
| < t
/2
s
2
1
n
+
s
2
2
m
_
donde t

f
> z
} = y f es el entero mas proximo a

_
s
2
1
n
+
s
2
2
m
_
2
( s
2
1
/n)
2
n+1
+
( s
2
2
/m)
2
m+1
2.
mismos pasos que en los anteriores ejemplos, as si el contraste es del tipo:
H
0
:
1
=
2

1
2
= 0 o
1
2
0
H
1
:
1
>
2

1
2
> 0
(9.2.18)
S
0
=
_
(x
1
, x
2
, ..., x
n
), (y
1
, y
2
, . . . , y
m
)/(x
n
y
m
)
_
, t
s
2
1
n
+
s
2
2
m
__
=
_
(x
1
, x
2
, ..., x
n
), (y
1
, y
2
, . . . , y
m
)/x
n
y
m
< t
s
2
1
n
+
s
2
2
m
_
H
0
:
1
=
2

1
2
= 0 o
1
2
0
H
1
:
1
<
2

1
2
< 0
(9.2.19)
S
0
=
_
(x
1
, x
2
, ..., x
n
), (y
1
, y
2
, . . . , y
m
)/(x
n
y
m
)
_
t
s
2
1
n
+
s
2
2
m
,
__
=
_
(x
1
, x
2
, ..., x
n
), (y
1
, y
2
, . . . , y
m
)/x
n
y
m
> t
s
2
1
n
+
s
2
2
m
_
Ejemplo 9.2.7 Si queremos contrastar:
H
0
:
2
1
=
2
2

2
1
/
2
2
= 1
H
1
:
2
1
=
2
2

2
1
/
2
2
= 1
(9.2.20)
entonces, como en los casos anteriores, dado que se trata de un contraste de dos lados, la region de aceptacion
sera:
S
0
=
_
(x
1
, x
2
, ..., x
n
), (y
1
, y
2
, . . . , y
m
)/1
_
s
2
1
/ s
2
2
f
/2
,
s
2
1
/ s
2
2
f
1/2
__
=
_
(x
1
, x
2
, ..., x
n
), (y
1
, y
2
, . . . , y
m
)/
s
2
1
s
2
2
(f
1/2
, f
/2
)
_
donde f
es el punto tal que P{F

n1
m1
> f
} = , para todo (0, 1).

a
a
f
F
0
a
1-a
f
mismos pasos que en los ejemplos anteriores, as si el contraste es del tipo:
H
0
:
2
1
=
2
2

2
1
/
2
2
= 1 o
2
1
/
2
2
1
H
1
:
2
1
>
2
2

2
1
/
2
2
> 1
(9.2.21)
S
0
=
_
(x
1
, x
2
, ..., x
n
), (y
1
, y
2
, . . . , y
m
)/
s
2
1
s
2
2
(0, f
)
_
,
mientras que si la alternativa es del otro lado, es decir:
H
0
:
2
1
=
2
2

2
1
/
2
2
= 1 o
2
1
/
2
2
1
H
1
:
2
1
<
2
2

2
1
/
2
2
< 1
(9.2.22)
S
0
=
_
(x
1
, x
2
, ..., x
n
), (y
1
, y
2
, . . . , y
m
)/
s
2
1
s
2
2
(f
1
, )
_
.
9.3. Test de hipotesis para proporciones (muestras grandes).
Usando la metodologa de la seccion anterior podemos contrastar hipotesis que tienen que ver con proporciones
de elementos de poblaciones que poseen un atributo particular, es decir, con parametros de distribuciones de
Bernoulli.
Ejemplo 9.3.1 Sea (
1
,
2
, . . . ,
n
) una m.a.s. de una poblacion B(1, p), donde p es el parametro descono-
cido.
H
0
: p = p
0
H
1
: p = p
0
(9.3.1)
entonces, la region de aceptacion sera:
S
0
=
_
(x
1
, x
2
, ..., x
n
)/p
0

_
x
n
z
/2
p
0
(1p
0
)
n
, x
n
+z
/2
p
0
(1p
0
)
n
__
=
_
(x
1
, x
2
, ..., x
n
)/x
n

_
p
0
z
/2
p
0
(1p
0
)
n
, p
0
+z
/2
p
0
(1p
0
)
n
__
=
_
(x
1
, x
2
, ..., x
n
)/|x
n
p
0
| < z
/2
p
0
(1p
0
)
n
_
,
donde z
/2
/2
} = /2.
Vemos que el intervalo que se utiliza para denir la region de aceptacion coincide con el intervalo para una
proporcion presentado en el tema anterior (Ejemplo 8.5.8 (pag. 280)), con la particularidad que hemos sustituido
p(1 p) por
p
0
(1 p
0
), debido a que en el tema anterior desconocamos p, por lo que lo estimabamos
con p =
1
n
x
i
= x
n
, para estimar la varianza, mientras que ahora no necesitamos estimarlo ya que, supuesta
cierta H
0
, p = p
0
.
Para el contraste unilateral,
H
0
: p = p
0
o p p
0
H
1
: p p
0
(9.3.3)
S
0
= {(x
1
, x
2
, ..., x
n
)/x
n
(0, p
0
+z
p
0
(1 p
0
)
n
)}.
Para llevar a cabo estos contrastes, se necesita un tama no muestral elevado (n 30).
Este contraste puede ampliarse al caso en que hay dos proporciones de interes y se desea comprobar si son
iguales o si alguno es superior al otro.
Ejemplo 9.3.2 Consideraremos que la poblacion sigue una distribucion B(1, p
1
), que (
1
,
2
, . . . ,
n
) es una
m.a.s. de esa poblacion, que la poblacion sigue una distribucion B(1, p
2
), que (
1
,
2
, . . . ,
m
) es una m.a.s. de
esa poblacion, y que ambas muestras son independientes.
Sean (x
1
, x
2
, . . . , x
n
) e (y
1
, y
2
, . . . , y
m
), realizaciones muestrales de (
1
,
2
, . . . ,
n
) y (
1
,
2
, . . . ,
m
), respectiva-
mente.
Si tratamos de contrastar:
H
0
: p
1
= p
2
p
1
p
2
= 0
H
1
: p
1
= p
2
p
1
p
2
= 0
(9.3.4)
usando el intervalo de conanza para la diferencia entre dos proporciones que vimos en el tema anterior (Ejemplo
8.5.9 (pag. 281)), la region de aceptacion sera:
S
0
=
_
(x
1
, x
2
, ..., x
n
), (y
1
, y
2
, . . . , y
m
)/0
_
(x
n
y
m
) z
/2
x
n
(1x
n
)
n
+
y
m
(1y
m
)
m
,
(x
n
y
m
) +z
/2
x
n
(1x
n
)
n
+
y
m
(1y
m
)
m
__
Sin embargo, modicaremos
x
n
(1x
n
)
n
+
y
m
(1y
m
)
m
, que es la estimacion de la desviacion tpica, usando toda
la informacion que nos da H
0
(p
1
= p
2
= p), por lo que la estimacion de p la obtendremos por
p =
n
i=1
x
i
+
m
j=1
y
j
n +m
.
Luego la region de aceptacion es:
S
0
=
_
(x
1
, x
2
, ..., x
n
), (y
1
, y
2
, . . . , y
m
)/0
_
(x
n
y
m
) z
/2
p(1 p)
_
1
n
+
1
m
_
,
(x
n
y
m
) +z
/2
p(1 p)
_
1
n
+
1
m
_
__
=
_
(x
1
, x
2
, ..., x
n
), (y
1
, y
2
, . . . , y
m
)/x
n
y
m

_
z
/2
p(1 p)
_
1
n
+
1
m
_
, z
/2
p(1 p)
_
1
n
+
1
m
_
__
=
_
(x
1
, x
2
, ..., x
n
), (y
1
, y
2
, . . . , y
m
)/|x
n
y
m
| < z
/2
p(1 p)
_
1
n
+
1
m
_
_
,
donde z
es el punto tal que P(N(0, 1) > z
) = , para todo (0, 1).

Si la alternativa es unilateral:
H
0
: p
1
= p
2
p
1
p
2
= 0 o p
1
p
2
0
H
1
: p
1
< p
2
p
1
p
2
< 0
(9.3.5)
la region de aceptacion ahora es:
S
0
=
_
(x
1
, x
2
, ..., x
n
), (y
1
, y
2
, . . . , y
m
)/x
n
y
m

_
z
p(1 p)
_
1
n
+
1
m
_
, 1
__
.
Si se trata de una alternativa del otro lado,
H
0
: p
1
= p
2
p
1
p
2
= 0 o p
1
p
2
0
H
1
: p
1
> p
2
p
1
p
2
> 0
(9.3.6)
la region de aceptacion es ahora:
S
0
=
_
(x
1
, x
2
, ..., x
n
), (y
1
, y
2
, . . . , y
m
)/x
n
y
m

_
1, z
p(1 p)
_
1
n
+
1
m
_
__
.
9.4. Contrastes de la bondad de ajuste.
Los contrastes de la bondad de ajuste, son los que se llevan a cabo con el n de vericar si una distribucion
puede ser la generadora de los datos. Los contrastes de la bondad de ajuste basicos son el contraste
2
de
Pearson y el de Kolmogorov-Smirnov. El primero compara las frecuencias observadas con las especicadas por
el modelo y es valido para distribuciones discretas y continuas. El segundo mide la distancia entre la funcion
de distribucion teorica y la muestral y solo es efectivo para distribuciones continuas.
9.4.1. El contraste
2
de Pearson.
Si tenemos un conjunto de observaciones muestrales (x
1
, x
2
, ..., x
n
) de una v.a. , a menudo sera necesario
contrastar las hipotesis:
H
0
: la v.a. tiene una funcion de distribucion F(x) dada;
H
1
: la funcion de distribucion de no es F(x).
(9.4.1)
Para efectuar este contraste, se particiona el conjunto de posibles resultados de la v.a , en k grupos, es decir:
() = I
1
I
2
. . . I
k
/ I
i
I
j
= si i = j.
Supongamos que en una muestra de tama no n se han observado O
1
, O
2
, . . . , O
k
veces, respectivamente, cada una
de esas clases. Es decir, O
i
de los (x
1
, x
2
, ..., x
n
), estan dentro de la clase I
i
. Sean p
1
, p
2
, . . . , p
k
, las probabilidades
que les asigna la hipotesis H
0
a los sucesos { I
1
}, { I
2
}, . . . , { I
k
}, respectivamente, y llamemos
E
1
, E
2
, . . . , E
k
, donde E
i
= np
i
, frecuencias esperadas de cada clase si H
0
es cierta. Entonces la variable:
U =
k
i=1
(O
i
E
i
)
2
E
i
=
_
1
n
k
i=1
O
2
i
p
i
_
n
se distribuye aproximadamente, cuando n es grande, como una
2
. Si H
0
es cierta sus grados de libertad son:
a) k 1, si H
0
especica completamente las probabilidades p
i
que son conocidas antes de tomar la muestra.
b) k r 1, si las probabilidades p
i
se han calculado estimando r parametros desconocidos que H
0
no concreta.
Para que el resultado expresado en b) sea valido, los r parametros deben estimarse aplicando el metodo de
maxima verosimilitud a las frecuencias observadas O
i
y las probabilidades correspondientes p
i
para las clases
empleadas en el calculo de U. Los r parametros desconocidos que entran en la expresion de las p
i
se determinaran
de forma que maximicen la funcion de verosimilitud
L(x
1
, x
2
, . . . , x
n,

1
,
2
, . . . ,
r
) = p
O
1
1
(
1
,
2
, . . . ,
r
) p
O
2
2
(
1
,
2
, . . . ,
r
) p
O
k
k
(
1
,
2
, . . . ,
r
).
Obtener las estimaciones de las p
i
por este metodo pueden ser, en ocasiones, un trabajo muy laborioso. Por
esta razon algunos autores emplean un procedimiento ligeramente diferente, puesto que aplican el metodo de
maxima verosimilitud a las observaciones originales, antes de realizar la agrupacion. Naturalmente, esto es solo
una aproximacion, pero en muchos casos que se presentan en la practica cabe esperar que el error cometido sea
peque no.
En cualquiera de los casos, la region crtica a nivel vendra dada por:
S
1
= {(x
1
, x
2
, . . . , x
n
)/U >
2
},
siendo
2
el punto que cumple P{

2
kr1
>
2
} = . Es decir, rechazamos la hipotesis H

0
cuando existe mucha
diferencia entre lo que observamos y lo que esperamos que ocurra si H
0
es cierta.
Tambien podramos buscar el nivel crtico, que sera:
P[
2
kr1
> U(x
1
, x
2
, . . . , x
n
)],
y si este nivel crtico es menor que el nivel de signicacion elegido, rechazamos H
0
, en caso contrario no
rechazamos H
0
. La magnitud de este nivel la usamos como medida de conanza en la hipotesis, que sera mas o
menos grande seg un sea mayor o menor el nivel crtico o p-valor correspondiente.
En realidad el test no contrasta que la funcion de distribucion de sea F(x), sino cualquier distribucion que
atribuya a cada suceso { I
i
} una probabilidad p
i
, i = 1, 2, . . . , k. Cualquier funcion de distribucion que de los
mismos valores para las p
i
, llevara al mismo valor de U, por tanto, sera aceptada o rechazada al mismo tiempo
que F(x).
La distribucion que hemos dado de U bajo H
0
es asintotica. La pregunta del tama no necesario para no cometer
un gran error al considerar la distribucion asintotica como la verdadera, no tiene respuesta sencilla, pero si el
tama no muestral es cuatro o cinco veces el n umero de clases, la aproximacion es bastante buena. Mejora la
aproximacion si la frecuencia esperada de cada clase es mayor o igual a cinco. Si alguna clase no cumple este
requisito, se agrupa con la(s) adyacente(s), hasta conseguirlo. En smbolos,
n 4 o 5 k, E
i
5, i = 1, 2 . . . , k.
9.4.2. El contraste de Kolmogorov-Smirnov.
Como alternativa al test
2
, vamos a estudiar el test de Kolmogorov-Smirnov, que es un test de bondad de ajuste
con dos ventajas sobre el primero, pues no se pierde informacion al agrupar los datos en clases y es aplicable a
muestras peque nas. Sin embargo, tiene el inconveniente de que solo es valido si la si distribucion que propone
H
0
es continua, y no admite, salvo contadas excepciones, la posibilidad de estimar parametros desconocidos.
Sea (x
1
, x
2
, ..., x
n
) el resultado de una m.a.s. (
1
,
2
, ...,
n
) obtenida a partir de una v.a. continua y se desea
contrastar las hipotesis:
H
0
: la v.a. tiene una funcion de distribucion F(x) dada;
H
1
: la funcion de distribucion de no es F(x).
(9.4.2)
Recordamos la denicion dada en el tema 1 de funcion de distribucion emprica o muestral:
F
n
(x) =
n
o
de elementos de la muestra x
n
.
El fundamento de este contraste estriba en comparar la distribucion emprica de la realizacion muestral F
n
con
la distribucion propuesta por H
0
, y si esta comparacion descubre diferencias signicativas, se rechaza H
0
.
Como distancia para medir la separacion entre la distribucion emprica y la teorica, se utiliza el estadstico:
D
n
= sup
x
|F
n
(x) F
0
(x)|
El estadstico D
n
tiene una distribucion, bajo H
0
, que es independiente de la funcion F
0
(x) que propone H
0
.
Por eso se dice es un estadstico de distribucion libre.
La region crtica para este contraste es
S
1
= {(x
1
, x
2
, ..., x
n
)/D
n
> c}.
El valor de la constante c se encuentra en la tabla de Kolmogorov-Smirnov, en funcion del tama no muestral y
del nivel de signicacion .
Figura 9.4: Test de Kolmogorov-Smirnov.
El calculo de D
n
se simplica mucho si se tiene en cuenta que F
0
es una funcion continua y monotona no
decreciente y F
n
una funcion monotona no decreciente y escalonada, por lo que las desviaciones maximas entre
ambas se localizan en los puntos de discontinuidad de F
n
, que son los valores de la muestra (x
1
, x
2
, ..., x
n
) no
repetidos. Por lo que:
D
n
= sup
x
|F
n
(x) F
0
(x)| = max
i=1,2,...,n
{|F
n
(x
i
) F
0
(x
i
)|, |F
n
(x
i
) F
0
(x
i
)|}.
Por F
n
(x
i
) entendemos el lmite por la izda. de F
n
en el punto x
i
, es decir:
F
n
(x
) =
n
o
de elementos de la muestra < x
n
.
La distribucion normal constituye una de las contadas excepciones en las que el contraste de Kolmogorov-
Smirnov puede ser utilizado cuando existen parametros desconocidos. En estos casos, se estiman la media y la
varianza por las correspondientes media y varianza muestrales, y se siguen los pasos anteriores con la salvedad
de que la constante c que dene la region crtica S
1
, se busca en la tabla de Lilliefors.
Esquemas sobre proporciones y bondad de ajuste Tema 9, 349
OTESIS. ESQUEMAS.
ESQUEMA sobre OBTENCI
ON DEL NIVEL CR
ITICO
El siguiente esquema resume, en terminos generales, la forma de obtener el nivel crtico (o p-valor) asociado a
un contraste sobre un parametro :
Hipotesis nula Hipotesis alternativa
H
0
: =
0
H
1
: <
0
H
1
: >
0
H
1
: =
0
Estadstico
de contraste
U(
1
, . . . ,
n
)
Nivel crtico p
1
= P(U < U(x
1
, . . . , x
n
)) p
2
= P(U > U(x
1
, . . . , x
n
)) 2 mn{p
1
, p
2
}
Como ejemplos particulares de este esquema general, vamos a ver algunos contrastes sobre medias, varianzas y
proporciones:
Contrastes para la media de una poblacion normal, cuando se desconoce el valor de la varianza:
H
0
: =
0
H
1
: <
0
H
1
: >
0
H
1
: =
0
Estadstico
de contraste
U(
1
, . . . ,
n
) =

n
S/
n
H
0
t
n1
Nivel crtico p
1
= P(t
n1
<
x
n
0
s/
n
) p
2
= P(t
n1
>
x
n
0
s/
n
) 2 mn{p
1
, p
2
} = 2P(t
n1
> |
x
n
0
s/
n
|)
Contrastes para una proporcion en base a la aproximaci on normal de la proporcion muestral p (n 30):
H
0
: p = p
0
H
1
: p p
0
H
1
: p = p
0
Estadstico
de contraste
U(
1
, . . . ,
n
) =
pp
0
p
0
(1p
0
)
n
H
0
N(0, 1)
Nivel crtico p
1
= P(N(0, 1) <
pp
0
p
0
(1p
0
)
n
) p
2
= P(N(0, 1) >
pp
0
p
0
(1p
0
)
n
) 2 mn{p
1
, p
2
} = 2P(N(0, 1) > |
pp
0
p
0
(1p
0
)
n
|)
Contrastes para la igualdad de varianzas de dos poblaciones normales independientes:
H
0
:
2
1
=
2
2
H
1
:
2
1
<
2
2
H
1
:
2
1
>
2
2
H
1
:
2
1
=
2
2
Estadstico
de contraste
U(
1
, . . . ,
n
) =

S
2
1
S
2
2
H
0
F
n1
m1
Nivel crtico p
1
= P(F
n1
m1
<
s
2
1
s
2
2
) p
2
= P(F
n1
m1
>
s
2
1
s
2
2
) 2 mn{p
1
, p
2
}
Contrastes para comparar dos proporciones con muestras independientes (n, m 30):
H
0
: p
1
= p
1
H
1
: p
1
 p
2
H
1
: p
1
= p
2
Estadstico
de contraste
U(
1
, . . . ,
n
) =
p
1
p
2
( p(1 p))(
1
n
+
1
m
)
H
0
N(0, 1) con p =
n p
1
+m p
2
n+m
Nivel crtico p
1
= P(N(0, 1) 
p
1
p
2
p(1 p)(n+m)
nm
)
2 mn{p
1
, p
2
} =
2P(N(0, 1) > |
p
1
p
2
p(1 p)(n+m)
nm
|)
ESQUEMA sobre ESTIMACI
ON Y CONTRASTES para p
Puesto que
T =
p p
p(1p)
n
N(0, 1),
se obtiene, para n sucientemente grande, que p esta acotado entre
_
p z
/2
p(1 p)
n
_
con probabilidad 1 . Ahora bien, por que expresion se sustituye p(1 p) para tener determinadas las
cotas de p?
Intervalo de conanza. Si buscamos un I.C. de p al 1 y n 30, podemos sustituir p(1 p) por
p(1 p), es decir, las cotas de p son:
_
p z
/2
p(1 p)
n
_
.
Tama no muestral. Si buscamos el mnimo tama no muestral n para poder estimar p mediante p con
un error de estimacion menor o igual que (es decir, | p p| ) a un nivel de conanza 1 , no
podemos sustituir p(1 p) por p(1 p) puesto que si ni siquiera conocemos el tama no de la muestra,
menos a un vamos a conocer la proporcion muestral. En este caso la solucion satisfactoria es acotar
p(1 p) por su valor maximo
1
2
_
1
1
2
_
=
1
4
, es decir, las cotas de p son:
_
_
p z
/2
1
2
_
1
1
2
_
n
_
_
.
Contraste de hipotesis. Si pretendemos contrastar, por ejemplo, si p toma un determinado valor p
0
frente a la alternativa de que no lo toma (es decir, H
0
: p = p
0
; H
1
: p = p
0
), no es necesario aproximar,
ni acotar p como en los dos puntos anteriores, sino que bajo H
0
tenemos un valor supuesto para p que
es p
0
, con lo que las cotas de p son, en este caso:
_
p z
/2
p
0
(1 p
0
)
n
_
.
ESQUEMA sobre ESTIMACI
ON Y CONTRASTES para p
1
p
2
Puesto que
T =
( p
1
p
2
) (p
1
p
2
)
p
1
(1p
1
)
n
+
p
2
(1p
2
)
m
N(0, 1),
se obtiene, para n y m sucientemente grandes, que p
1
p
2
esta acotado entre
_
( p
1
p
2
) z
/2
p
1
(1 p
1
)
n
+
p
2
(1 p
2
)
m
_
con probabilidad 1 . Ahora bien, por que expresiones se sustituiran p
1
(1 p
1
) y p
2
(1 p
2
) para tener
determinadas las cotas de p
1
p
2
?
Intervalo de conanza. Si buscamos un I.C. de p
1
p
2
al 1 y n, m 30, podemos sustituir
p
i
(1 p
i
) por p
i
(1 p
i
), i = 1, 2, es decir, las cotas de p
1
p
2
son:
_
( p
1
p
2
) z
/2
p
1
(1 p
1
)
n
+
p
2
(1 p
2
)
m
_
.
Tama no muestral. Si buscamos el mnimo tama no muestral n = m para poder estimar p
1
p
2
mediante p
1
p
2
con un error de estimacion menor o igual que (es decir, |( p
1
p
2
) (p
1
p
2
)| ) a
un nivel de conanza 1, igual que ocurra en el caso de una muestra, no podemos sustituir p
i
(1p
i
)
por p
i
(1 p
i
) puesto que no conocemos los valores de dichas proporciones muestrales. En este caso la
solucion satisfactoria vuelve a ser acotar p
i
(1 p
i
) por su valor maximo
1
2
_
1
1
2
_
=
1
4
, es decir, las
cotas de p
1
p
2
son:
_
_
( p
1
p
2
) z
/2
1
2
_
1
1
2
_
n
+
1
2
_
1
1
2
_
m
_
_
.
Contraste de hipotesis. Si pretendemos contrastar, por ejemplo, si p
1
es igual a p
2
frente a la
alternativa de que son distintas (es decir, H
0
: p
1
= p
2
; H
1
: p
1
= p
2
), bajo H
0
tenemos que p
1
= p
2
lo
que implica que p
1
(1 p
1
) = p
2
(1 p
2
) y por tanto lo denotaremos en general por p(1 p). As pues,
p
1
(1p
1
)
n
+
p
2
(1p
2
)
m
= p(1 p)
_
1
n
+
1
m
_
y si estimamos p teniendo en cuenta el conjunto de datos de
ambas muestras,
p =
n
i=1
x
i
+
m
j=1
y
j
n +m
,
las cotas de p
1
p
2
seran:
_
( p
1
p
2
) z
/2
p(1 p)
_
1
n
+
1
m
_
_
.
E
S
Q
U
E
M
A
d
e
B
O
N
D
A
D
D
E
A
J
U
S
T
E
H
0
:
F
0
H
1
:
F
0
S
1
=
{
(
x
1
,
.
.
.
,
x
n
)
/
U
>
k
}
N
i
v
e
l
c
r
t
i
c
o
=
P
(
U
>
U
(
x
1
,
.
.
.
,
x
n
)
/
H
0
)
Q
u
e
t
e
s
t
u
s
a
r
e
m
o
s
e
n
l
o
s
c
o
n
t
r
a
s
t
e
s
d
e
b
o
n
d
a
d
d
e
a
j
u
s
t
e
a
u
n
a
d
i
s
t
r
i
b
u
c
i
o
n
F
0
?
___
F
0
d
i
s
c
r
e
t
a
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
t
e
s
t
2
F
0
c
o
n
t
i
n
u
a
___
d
a
t
o
s
a
g
r
u
p
a
d
o
s
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
t
e
s
t
2
d
a
t
o
s
n
o
a
g
r
u
p
a
d
o
s
___
s
i
n
p
a
r
a
m
e
t
r
o
s
d
e
s
c
o
n
o
c
i
d
o
s
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
t
e
s
t
K
o
l
m
o
g
o
r
o
v
c
o
n
T
a
b
l
a
K
o
l
m
o
g
.
c
o
n
p
a
r
a
m
e
t
r
o
s
d
e
s
c
o
n
o
c
i
d
o
s
_
F
0
N
(
)
.
.
.
t
e
s
t
K
o
l
m
o
g
o
r
o
v
c
o
n
T
a
b
l
a
L
i
l
l
i
e
f
o
r
s
F
0
N
(
)
.
.
.
t
e
s
t
2
E
s
t
e
e
s
q
u
e
m
a
N
O
s
e
p
u
e
d
e
t
e
n
e
r
e
n
e
l
e
x
a
m
e
n
.
OTESIS.
Ejercicio 9.1 Un fabricante de sistemas de aspersion utilizados para proteccion de incendios en edicios de
ocina, arma que el verdadero promedio de temperatura de activacion del sistema es 130
o
F. Para contrastar si
dicha armacion es o no cierta, se considera una muestra aleatoria de n = 9 sistemas, los cuales producen una
media muestral de temperatura de activacion de 131
08
o
F. Si la distribucion de la temperatura de activacion
es normal con desviacion tpica de 1
5
o
F,
a) Obtener el p-valor para este contraste.
b) Los datos contradicen la armacion del fabricante al nivel de signicacion = 0
05?, y al nivel de
signicacion = 0
01?
Ejercicio 9.2 Un lugar de trabajo bien dise nado y seguro puede contribuir mucho al incremento de la producti-
vidad. Tiene especial importancia no pedir a los trabajadores ejecutar trabajos que rebasen sus capacidades, por
ejemplo, levantar pesos. La siguiente informacion sobre el maximo peso de levantamiento (MAPL, en kg), para
una frecuencia de cuatro levantamientos por minutos, se obtuvo del artculo The Eects of Speed, Frequency
and Load on Measured Hand Forced for a Floor-to-Knuckle Lifting Task (Ergonomics, 1992, pp. 833-843).
Se seleccionaron cinco personas al azar, de una poblacion de hombres sanos entre 18 y 30 a nos de edad y se
obtuvieron los siguientes resultados:
25
8, 36
6, 26
3, 21
8, 27
2.
Si se supone que el MAPL esta normalmente distribuido y se considera = 0
05, se pide:
a) Estudiar si la informacion muestral sugiere que la media poblacional excede de 25.
b) Estudiar si la informacion muestral sugiere que la desviacion tpica poblacional es menor de 15.
c) Repetir el contraste del apartado a) si se supone que la desviacion tpica poblacional es de 6.
Ejercicio 9.3 Se determino la cantidad de desgaste de un eje (00001 de pulgada), despues de un recorrido
jo de millas para cada uno de n = 4 motores de combustion interna, que llevan cobre y plomo como material
antifriccion, resultando las observaciones muestrales:
x
1
, x
2
, x
3
, x
4
.
Si se supone que la distribucion de desgaste del eje es normal con media desconocida y varianza 9, se pide:
a) Calcular un intervalo de conanza para la media de dicha variable, con nivel de conanza 095.
b) Para dicho nivel de conanza, si el tama no muestral aumenta, que ocurre con el error de estimacion?
c) Para que valores de
i
x
i
no se rechazara, al nivel de signicacion 005, que la media es de 8?
Ejercicio 9.4 El dise nador de una troqueladora nueva de lamina arma que su maquina puede trabajar con
determinado producto con mas rapidez que la maquina que esta en uso. Se hicieron nueve ensayos independientes
en cada maquina y se obtuvieron los siguientes resultados de tiempos de terminacion:
Maquina normal Maquina nueva
n = 9 m = 9
x
n
= 35
22 segundos y
m
= 31
56 segundos
s
2
1
= 24
44 s
2
2
= 20
03
Suponiendo normalidad, comprobar si es cierta la hipotesis de que la velocidad media de ambas maquinas es la
misma, al nivel 01. Cual es el nivel crtico de dicho test?
Ejercicio 9.5 El deterioro de muchas redes de tubera municipal en todo el pas es un asunto que preocupa
cada vez mas. Una de las tecnologas propuestas para la rehabilitacion de las tuberas consiste en usar un forro
exible alrededor del tubo existente. El artculo Eect of Welding on a High-Density Polyethylene Liner (J.
of Materials in Civil Engr., 1996, pp. 94-100) presenta los datos siguientes de resistencia a la tension, en psi,
de especmenes de forro, tanto en el caso en que cierto proceso de fusion se usa, como cuando no se usa:
Sin fusion n = 10 x
n
= 2902
8 s
1
= 277
3
Con fusion m = 8 y
m
= 3108
1 s
2
= 205
9
Suponiendo que tanto la resistencia a la tension sin proceso de fusion, como la resistencia a la tension con
proceso de fusion siguen una distribucion normal, que ambas variables son independientes y = 0
1, se pide:
a) Respaldan los datos de la muestra la hipotesis de que el proceso de fusion aumenta la resistencia media a
la tension?
b) Respaldan los datos de la muestra la hipotesis de que la varianza de la resistencia a la tension en el proceso
sin fusion es mayor que la varianza de la resistencia a la tension en el proceso con fusion?
c) Repetir el contraste del apartado a) si se suponen las varianzas poblacionales conocidas:
Sin fusion
1
= 280
Con fusion
2
= 200
9.3. Test de hipotesis para proporciones (muestras grandes).
Ejercicio 9.6 Un fabricante de bateras de nquel-hidrogeno selecciona al azar 100 placas de nquel para celdas
de prueba, les pone y quita corriente determinada cantidad de veces y observa que 14 de ellas se han ampollado.
Es esto una evidencia concluyente para llegar al resultado de que mas del 8 % de todas las placas se ampollan
bajo las condiciones de la prueba? (Nivel de signicacion = 0
05)
Ejercicio 9.7 Algunos acusados en procesos penales se declaran culpables y son sentenciados sin juicio, mientras
que otros se declaran inocentes y posteriormente se les encuentra culpables, con lo que son sentenciados. En
a nos recientes, expertos en derecho han especulado sobre si las sentencias de quienes se declaran culpables
dieren en severidad de aquellas aplicadas a quienes se declaran inocentes y luego son juzgados y encontrados
culpables. Considera la siguiente informacion sobre acusados de robo en el condado de San Francisco, todos
con antecedentes penales, obtenida en el artculo Does It Pay to Plead Guilty? Dierential Sentencing and the
Functioning of Criminal Courts (Law and Society Rev., 1981-1982, pp.45-69):
Declaracion
Culpable Inocente
N
o
de juzgados culpables n = 191 m = 64
N
o
de sentenciados a prision 101 56
a) Estos datos sugieren que la proporcion de todos los acusados, en estas circunstancias, que se declaran
culpables y son enviados a prision diere de la proporcion de quienes son enviados a prision despues de
declararse inocentes? ( = 0
05)
b) Estos datos sugieren que declararse inicialmente culpable puede ser mejor estrategia que declararse inocen-
te, si se pretende evitar la prision? ( = 0
05)
Ejercicio 9.8 Durante mucho tiempo, los criminalistas han debatido sobre si hay relacion entre las condiciones
del clima y la incidencia de delitos violentos. El autor del artculo Is There a Season por Homicide? (Crimi-
nology, 1988, pp. 287-296) clasico 1361 homicidios seg un la estacion del a no, con los siguientes resultados:
Primavera Verano Oto no Invierno
334 372 327 328
Contrastar la hipotesis de que la epoca del a no no inuye en el n umero de homicidios (proporciones iguales en
las cuatro estaciones), al nivel de signicacion = 0
05.
Ejercicio 9.9 Un seguimiento llevado a cabo en un embalse durante los ultimos 6 a nos, ha proporcionado la
siguiente informacion relativa al n umero de averas:
N
o
de averas 0 1 2 >2
N
o
de meses 45 18 9 0
De acuerdo con estos datos y a un nivel de signicacion 0
05, contrastar si la armacion de la empresa cons-

tructora sobre la distribucion del n umero de averas mensuales es cierta en cada uno de los siguientes casos:
a) Si la empresa constructora asegura que el n umero mensual de averas del embalse sigue una distribucion de
Poisson de media 0
5.
b) Si la empresa constructora asegura que el n umero mensual de averas del embalse sigue una distribucion de
Poisson.
Ejercicio 9.10 Dados los tiempos de funcionamiento, en meses, de 4 componentes electronicas: 3, 12, 24 y 12,
contrastar, al nivel = 0
05, la hipotesis de que el tiempo de funcionamiento sigue una distribucion exponencial

de media 3 meses.
Ejercicio 9.11 Se ha observado el rendimiento en miles de kilometros de 5 tipos de neumaticos obteniendose los
siguientes resultados: 95, 105, 120, 116 y 64. Se desea saber si el rendimiento de los neumaticos se distribuye
normalmente ( = 0
05).
Ejercicio 9.12 El distribuidor arma que el tiempo en a nos de funcionamiento de un tipo de bombillas sigue
una distribucion exponencial de parametro 3. El cliente duda de esta armacion, por lo que estudia 72 bombillas,
obteniendo los siguientes resultados:
Tiempo de func. (en a nos) Entre 0 y 1/4 De 1/4 a 1/2 Mas de 1/2
N umero de bombillas 36 24 12
a) Concuerdan estos datos con la informacion que proporciona el distribuidor al nivel = 0
05?
b) Cual es el mayor nivel para el que los datos concuerdan?
Examenes.
Ejercicio 9.13 (19-06-03) Se determino la cantidad, en 10
4
pulgadas, de desgaste de un eje despues de
recorrer un n umero jo de kilometros para cada uno de los n = 5 motores de combustion interna, que llevan
cobre y plomo como material de antifriccion, obteniendose los siguientes resultados: 5
40, 3
44, 6
49, 8
55 y 8
42.
Se pide:
a) Determinar la media, mediana, varianza y cuasivarianza para esta muestra de cinco motores.
b) Si se supone que la distribucion del desgaste del eje es normal y se considera = 0
05, estudiar si la
informacion muestral sugiere que la media poblacional es mayor de 4 10
4
pulgadas.
c) Obtener el mnimo tama no muestral necesario para estimar mediante un intervalo de conanza con nivel
de conanza 0
95 y un error de estimacion menor o igual de 0
5, si se sabe que la desviacion tpica poblacional

() es 2 10
4
pulgadas.
Ejercicio 9.14 (09-09-03) Los registros de la Direccion de Vehculos de Motor indican que de todos los
vehculos que se sometieron a la prueba de vericacion de emisiones durante el a no anterior, el 60 % pasaron la
prueba al primer intento. Una muestra aleatoria de 100 automoviles probados durante el a no actual indica que
70 pasaron en la prueba inicial.
a) Existen evidencias sucientes para concluir, a un nivel de signicacion = 0
05, que la proporcion de

automoviles que pasan la prueba inicial es superior este a no que el anterior?
b) Calcular el nivel crtico o p-valor del contraste.
c) Obtener un intervalo de conanza al 95 % para la proporcion de automoviles que pasaran este a no la prueba
inicial.
Ejercicio 9.15 (17-02-04) El tiempo de respuesta de un sistema informatico a las doce horas de un da
laborable se supone normalmente distribuido con desviacion tpica desconocida. Se observa una muestra de 41
datos obteniendose:
2256 - 2233 - 2458 - 2314 - 1903 - 2676 - 1833 - 231 - 2153 - 906 - 1675
2329 - 2214 - 1628 - 1889 - 2748 - 1044 - 2686 - 2727 - 1874 - 1988
1576 - 3077 - 2116 - 2426 - 229 - 2714 - 1802 - 2153 - 2499 - 1981
1188 - 2401 - 2211 - 2191 - 1435 - 1114 - 993 - 2022 - 1773 - 1905
La media y varianza muestrales de los anteriores datos son: x
41
= 20
42; s
2
= 25
82, respectivamente.
a) Calcular el nivel crtico o p-valor del contraste siguiente: H
0
: 20 frente a H
1
: > 20.
b) Es razonable mantener la hipotesis H
0
: = 5 frente a la alternativa contraria (H
1
: = 5) al nivel 0
05?
Ejercicio 9.16 (21-06-04) Una marca de detergentes arma que el contenido de sus paquetes pesa al menos
200gr por termino medio. Una muestra aleatoria de n = 9 paquetes presento una media muestra x
9
= 203
5gr
y una desviacion tpica muestral s = 7
07gr. Suponiendo que la distribucion es normal, contesta a los siguientes

apartados, DETALLANDO TODOS LOS PASOS:
a) Contrastar al nivel 005 la hipotesis nula de que el peso medio de la poblacion es al menos 200gr.
b) Hallar el p-valor del contraste anterior.
c) Si el contraste fuese bilateral en lugar de unilateral (es decir, H
0
: = 200 frente a la alternativa H
1
: =
200), con los mismos resultados muestrales, calcular el p-valor de este nuevo contraste.
Ejercicio 9.17 (09-09-04) En un estudio para comparar el nivel de colesterol en jovenes, se midio el nivel de
colesterol de 11 jovenes que practican deporte, obteniendose un nivel medio de 157 mg/dl y una cuasidesviacion
tpica muestral s
1
de 40 mg/dl. Con 16 jovenes que no practican deporte los resultados fueron: un nivel medio
de 187 mg/dl y una cuasidesviacion tpica muestral s
2
de 30 mg/dl. Si se supone que el contenido de colesterol
en cada grupo sigue una distribucion normal y que ambas variables son independientes, se pide:
a) Hallar un intervalo de conanza para el cociente de las varianzas, con coeciente de conanza 09.
b) Al nivel 01, se rechaza que el nivel medio de colesterol es igual para los jovenes deportistas que para los
no deportistas?
Ejercicio 9.18 (06-07-05) Sean y las velocidades de acceso a la memoria central de dos procesadores P1 y
P2. Supongamos que N(
1
,
1
) y que N(
2
,
2
). Sean (
1
,
2
, . . . ,
21
) y (
1
,
2
, . . . ,
11
) dos m.a.s.
independientes de esas poblaciones. Los resultados de esas muestras proporcionan los siguientes datos:
21
i=1
x
i
= 130
5,
21
i=1
x
2
i
= 2866
8,
11
j=1
y
j
= 100
4 y
11
j=1
y
2
j
= 1403
1.
Con esos datos se puede suponer que las velocidades medias de los dos procesadores coinciden al nivel = 0
1?
Ejercicio 9.19 (07-09-05) A partir de las 30 observaciones del espesor del oxido en obleas de silicio indivi-
duales siguientes:
Oblea 1 2 3 4 29 30
Espesor del oxido 454 486 495 440 479 534
se obtiene que
30
i=1
x
i
= 1495
4 y
30
i=1
x
2
i
= 75136
9.
a) Con estos datos se obtiene que la maxima discrepancia entre la funcion de distribucion emprica y la funcion
de distribucion de la normal es 0
098, es decir, D
30
= sup
xIR
|F
n
(x) F
0
(x)| = 0
098, donde F
0
representa
la funcion de distribucion de una normal N(, ) en la que se estimaran los valores de los parametros (, )
mediante las estimaciones maximos verosmiles obtenidas a partir de los valores de la muestra. Con estos
datos, contrastar, al nivel = 0
05, la hipotesis de que el espesor del oxido sigue una distribucion normal.
Suponiendo cierta la hipotesis de normalidad, se pide:
b) Hallar un intervalo de conanza para el espesor medio del oxido en obleas de silicio, con coeciente de
conanza 0
95.
c) Al nivel 001, contrastar la hipotesis nula de que el espesor medio del oxido en obleas de silicio es mayor o
igual de 60, frente a la alternativa de que es menor.
Ejercicio 9.20 (13-02-06) Para comprobar la ecacia de un nuevo dispositivo de radar para cierto sistema de
misiles de defensa, se experimenta con aviones reales en los que se simula una situacion de derribo o no derribo.
Si en 300 pruebas hubo 250 derribos, se pide:
a) Obtener el intervalo de conanza, con coeciente de conanza 1 = 0
95, para la proporcion p de aviones

derribados.
b) Contrastar, a un nivel de signicacion del = 0
05, la hipotesis de que el porcentaje de aviones derribados

es menor del 80 % (H
1
: p < 0
8).
Ejercicio 9.21 (13-02-06) Contrastar, al nivel de signicacion = 0
05, si la siguiente muestra de tiempos

de vida de unos microcircuitos: 15, 8, 11, 1, 6, 5, 2, 17, 4, 23, puede suponerse que procede de una distribucion
exponencial de media 10.
Ejercicio 9.22 (30-06-06) Una empresa dispone de dos maquinas, que denotaremos por maquina 1 y maquina
2, para fabricar determinada pieza. Para la maquina 1, el tiempo empleado para fabricar la pieza tiene una
distribucion normal N(
1
, 5) y se considera una muestra aleatoria de tama no n = 50. Para la maquina 2, el
tiempo empleado en la fabricacion de la pieza vuelve a ser una normal N(
2
, 5) y se considera otra muestra
aleatoria de tama no m = 50. Las dos muestras obtenidas son independientes entre s y para ellas se ha obtenido
que x
50
y
50
= 3
1, donde x
50
y y
50
representan las medias muestrales para las maquinas 1 y 2, respectivamente.
Se pide:
a) Obtener el nivel crtico asociado al contraste de hipotesis H
0
:
1

2
frente a la alternativa H
1
:
1
>
2
.
b) Contrastar, al nivel de signicacion = 0
05, las dos hipotesis anteriores.

c) Obtener un intervalo de conanza, al nivel de conanza 1 = 0
95, para la diferencia de medias pobla-

cionales (
1
2
).
Ejercicio 9.23 (07-09-06) Sea (
1
,
2
, . . . ,
49
) una muestra aleatoria simple de una poblacion de media des-
conocida y varianza igual a uno. Si la media muestral es x
49
= k, se pide:
a) Calcular un intervalo de conanza para la media al nivel 0
90.
b) Obtener el valor aproximado del nivel crtico asociado al contraste H
0
: k frente a la alternativa
H
1
: > k.
Ejercicio 9.24 (16-02-07) Despues de una cantidad ja de millas se determino el desgaste de echa (0
0001
pulg.) para cada una den = 8 maquinas de combustion interna que tienen cobre y plomo como material de
soporte, y se obtuvo como resultado que la media muestral es x = 3
72. Suponiendo que la distribucion del

desgaste de echa es normal con desviacion tpica = 1
25, se pide:
a) Contrastar, al nivel de signicacion = 0
05, la hipotesis de que el desgaste medio de echa es igual a 3
50
frente a la alternativa de que es mayor que dicha cantidad.
b) Obtener la potencia del contraste anterior en el punto 4.
Ejercicio 9.25 (22-06-07) El distribuidor arma que la vida util, en a nos, de un transistor sigue una distri-
bucion gamma de media 1 y desviacion tpica 1/
2. El cliente duda de esta armacion, por lo que estudia 100

transistores, obteniendo los siguientes resultados:
Tiempo de vida (en a nos) Entre 0 y 1 De 1 a 2 Mas de 2
N umero de transistores 60 30 10
05?
b) A un aparato se le instala uno de los transistores de este distribuidor como principal y nueve de repuesto,
para que en caso de que se avera el transmisor principal entre en funcionamiento el primer transistor de
repuesto y permitan al aparato seguir funcionando, y en caso de que se avera el primer transistor de repuesto
entre en funcionamiento el segundo transistor de repuesto, y as sucesivamente hasta haber utilizado los diez
transistores (el principal mas los nueve de repuesto). Teniendo en cuenta el resultado obtenido en el apartado
anterior y suponiendo independencia entre los transistores, calcular la probabilidad de que el aparato dure
mas de 6
1 a nos.
Ejercicio 9.26 (07-09-07) Un fabricante de detergente lquido esta interesado en la uniformidad de la maquina
utilizada para llenar las botellas. De manera especca, es deseable que la varianza del proceso de llenado (
2
)
sea menor o igual de 8ml
2
; de otro modo, existe un porcentaje mayor del deseable de botellas con contenido
insuciente de detergente. Supongase que la distribucion del volumen de llenado es normal y que al tomar una
muestra aleatoria de 20 botellas, se obtiene una varianza muestral s
2
= 14
48ml
2
.
a) Existen evidencias en los datos muestrales que sugieran que el fabricante tiene un problema con el llenado
de las botellas? (Utilice = 0
05.)
b) A partir de los datos muestrales, obtener un intervalo de conanza para la desviacion tpica del volumen
de llenado, con un coeciente de conanza del 99 %.
Ejercicio 9.27 (18-02-08) Una muestra aleatoria simple de los balances nancieros de 100 empresas de tama no
peque no, proporciona un volumen de ventas medio muestral de 0
25 millones de euros. El volumen de ventas,

en millones de euros, de cada una de esas empresas es una v.a.
i
con distribucion beta (p, 1), con lo que su
esperanza y varianza son, respectivamente, E(
i
) =
p
p+1
y V ar(
i
) =
p
(p+1)2(p+2)
. Con estos datos se pide:
a) Contrastar al nivel = 0
05 las hipotesis
H
0
: = 2/3
H
1
: = 2/3
b) Calcular el nivel crtico o p-valor del contraste anterior.
Ejercicio 9.28 (26-06-08) Un fabricante de semiconductores produce controladores que se emplean en apli-
caciones de motores automovilsticos. El cliente requiere que el porcentaje de controladores defectuosos en uno
de los pasos de manufactura crticos (p) sea menor del 4 %. El fabricante de semiconductores toma una muestra
aleatoria de 100 dispositivos y encuentra que tres de ellos son defectuosos. A partir de los datos de la muestra,
se pide:
a) Contrastar la hipotesis H
0
: p 0
04 frente a la alternativa H
1
: p < 0
04, al nivel de signicacion = 0
05.
(Con esto el fabricante pretende demostrar al cliente la calidad del proceso.)
b) Obtener un intervalo de conanza para la proporcion de controladores defectuosos, al nivel de conanza
1 = 0
9.
Ejercicio 9.29 (05-09-08) Un seguimiento llevado a cabo en un ordenador de una sala durante los ultimos 5
das ha proporcionado la siguiente informacion respecto al n umero de personas que lo usaron cada hora:
N
o
personas 0 1 >1
N
o
horas 30 20 10
a) De acuerdo con estos datos y a un nivel de signicacion = 0
05, contrasta la hipotesis de que el n umero

de personas que lo usan cada hora sigue una distribucion de Poisson de parametro 06.
b) Si dicha sala tiene 10 ordenadores que son usados de forma independiente, todos ellos igualmente distribuidos
en cuanto al n
o
de personas que los usan y teniendo en cuenta el resultado obtenido en el apartado anterior,
cual es la probabilidad de que el n umero total de personas que usan la sala en una hora elegida al azar sea
mayor de 1?
c) De acuerdo con los apartados anteriores, si la sala se abre a las 8:00, cual es la probabilidad de que la
primera persona llegue antes de las 9:00?
Ejercicio 9.30 (02-07-09) Se ha medido la anchura del espesor de 10 laminas de acero en una planta industrial,
obteniendose de esas medidas un valor medio x
10
= 0
2573mm y una varianza muestral s

2
= 0
01. Se sabe que

el espesor sigue una distribucion normal N(, ) y se pide:
a) Contrastar, al nivel = 0
05, las hipotesis H

0
: = 0

1
: = 0
253.
b) Cuanto vale el nivel crtico o p-valor asociado al contraste anterior?
c) Calcular la potencia del contraste del apartado a) para una produccion con grosor medio de 0
21mm.
Ejercicio 9.31 (16-09-09) La EPA (Agencia de Proteccion Ambiental de EEUU) establece lmites para la
concentracion de PCB (una sustancia peligrosa) en el agua. Una empresa manufacturera importante que produce
PCB como aislante electrico descarga peque nas cantidades de su planta. La gerencia de la compa na ha dado
instrucciones de parar la produccion si la concentracion media de PCB en el euente es mayor que 3 ppm. A
partir de una muestra aleatoria simple de 61 especmenes de agua, se obtuvo una media de 31 ppm y una
cuasi-desviacion tpica de 06 ppm. Suponiendo normalidad, se pide:
a) Calcular un intervalo de conanza al nivel 095 para la cantidad media de concentracion de PCB, detallando
todos los pasos.
b) Contrastar si, al nivel de signicacion 001, los datos anteriores proporcionan sucientes pruebas como para
detener el proceso de produccion.
OTESIS.
Ejercicio 9.1 a) Nos piden que realicemos el contraste H
0
1
: = 130,
donde representa la media de la variable aleatoria = temperatura de activacion del sistema y sigue
una distribucion N(, 1
5). Para esta variable se ha obtenido una muestra de tama no n = 9, cuya media
ha sido x
9
= 131
08.
Puesto que la region de aceptacion para este contraste es de la forma:
S
0
=
_
(x
1
, x
2
, . . . , x
9
)/
x
9
130
1
5/
k
_
,
la region de rechazo sera de la forma:
S
1
=
_
(x
1
, x
2
, . . . , x
9
)/
x
9
130
1
5/
> k
_
,
con lo cual, el p-valor o nivel crtico para este contraste es:
pvalor = P
_
9
130
1
5/
>
x
9
130
1
5/
_
= P
_
|N(0, 1)| >
131
08 130
1
5/
_
= P (|N(0, 1)| > 2
16) = 0
0308,
teniendo en cuenta que, seg un vimos en el Tema 7,
x
9
n
=
x
9
130
1
5/
9
N(0, 1).
b) Puesto que el nivel crtico para este contraste es 0
0308 y dicho valor es menor de 0
05, se rechaza la hipotesis

nula a este nivel de signicacion = 0
01, es decir, es decir, a este nivel los datos proporcionan evidencias

sucientes en contra de la armacion del fabricante.
Sin embargo, al nivel 0
01, puesto que

p-valor = 0
0308 > 0
01 = nivel de signicacion,
no se puede rechazar la hipotesis nula, es decir, a este nivel los datos no proporcionan evidencias sucientes
en contra de la armacion del fabricante.
Ejercicio 9.2 Para responder a estas cuestiones nos dan una muestra de tama no n = 5 de una variable aleatoria
= peso maximo de levantamiento con distribucion normal N(, ). Como se conocen los datos de dicha
muestra se sabe ademas que:
x
5
=
1
5
5
i=1
x
i
=
25
8 + 36
6 + 26
3 + 21
8 + 27
2
5
= 27
54,
s
2
=
1
5
5
i=1
x
2
i

_
1
5
5
i=1
x
i
_
2
=
25
8
2
+ 36
6
2
+ 26
3
2
+ 21
8
2
+ 27
2
2
5
(27
54)
2
= 23
9424.
a) La region de aceptacion para el contraste H
0
: 25 frente a la alternativa H
1
: > 25 es, seg un vimos en
teora:
S
0
=
_
(x
1
, x
2
, . . . , x
5
)/
x
5
25
s/
n
k
_
,
con lo cual la region de rechazo es:
S
1
=
_
(x
1
, x
2
, . . . , x
5
)/
x
5
25
s/
n
> k
_
,
y, por tanto,
p valor = P
_
5
25
s/
5
>
x
5
25
s/
5
/H
0
_
= P
_
t
4
>
27
54 25
1
5/
5
_
= P (t
4
> 1
04) = 0
179,
teniendo en cuenta que:
s
2
=
n
n 1
s
2
=
5
4
23
9424 = 29
928 = s = +
s
2
= +
29
928 = 5
4707,
y que

5
s/
n
=

5
25
s/
5
t
n1
t
4
, si la variable sigue una distribucion normal N(25, ).
Ahora bien, puesto que el p-valor para este contraste es igual a 0
179 > 0
1 0
05 = , no se rechaza la
hipotesis nula, es decir, es admisible la hipotesis de que la media de la poblacion es (como mucho) de 25.
b) Para el contraste H
0
1
: < 15, la region de aceptacion es:
S
0
=
_
(x
1
, x
2
, . . . , x
5
)/
ns
2
15
2
k
_
,
y, por tanto, la de rechazo es:
S
1
=
_
(x
1
, x
2
, . . . , x
5
)/
ns
2
15
2
< k
_
.
As pues, teniendo en cuenta que para una variable con distribucion normal de varianza
2
se tiene que
nS
2
/
2
2
n1
, por aplicacion del Teorema de Fisher, el p-valor para este contraste es:
p valor = P
_
nS
2
15
2
<
ns
2
15
2
/H
0
_
= P
_
2
4
< 0
532
_
= 0
0297 < 0
05
con lo cual se rechaza la hipotesis nula al nivel de signicacion = 0
05, es decir, la desviacion tpica

poblacional es menor de 15.
c) Razonando de forma analoga al apartado a), la region de rechazo es:
S
1
=
_
(x
1
, x
2
, . . . , x
5
)/
x
5
25
/
n
> k
_
,
y, por tanto,
p valor = P
_
5
25
/
5
>
x
5
25
/
5
/H
0
_
= P
_
N(0, 1) >
27
54 25
6/
5
_
= P (N(0, 1) > 0
95) = 0
1711,
teniendo en cuenta que:
n
=

5
25
6/
5
N(0, 1) t
4
, si la variable sigue una distribucion normal N(25, 6).
Ahora bien, puesto que el p-valor para este contraste es igual a 0
1711 0
05 = , no se rechaza la hipotesis
nula, es decir, tambien bajo estos supuestos es admisible la hipotesis de que la media de la poblacion es
(como mucho) de 25.
Ejercicio 9.3 a) Aplicando la funcion pivotal

4
3/2
que sigue una distribucion N(0, 1), obtenemos que
P(1
96 <

4
3/2
< 1
96) = 0
95
puesto que P(1
96 < N(0, 1) < 1
96) = 0
95. Despejando obtenemos

P(
4
1
96
3
2
< <
4
+ 1
96
3
2
) = 0
95
por lo que el intervalo de conanza para este parametro es
(x
4
1
96
3
2
, x
4
+ 1
96
3
2
).
b) Al aumentar el tama no muestral, es evidente que se tiene mas informacion acerca de la poblacion en estudio,
por lo que al estimar la media mediante un intervalo de conanza, este tendra una amplitud menor (mas
informacion sobre el valor del parametro), es decir, el error de estimacion, que esta denido como la mitad
de la amplitud, disminuira.
c) Nos piden que hagamos el contraste
H
0
: = 8
H
1
: = 8
y obtengamos los valores de
i
x
i
para los cuales no se rechazara H
0
al nivel = 0
05.
Puesto que la hipotesis nula no se rechaza si p valor 0
05, se tiene que

0
05 p valor = 2 mn
_
P
_
N(0, 1) >
x
4
8
3/2
_
, P
_
N(0, 1) <
x
4
8
3/2
__
,
lo que es equivalente a decir que
0
025 mn
_
P
_
N(0, 1) >
x
4
8
3/2
_
, P
_
N(0, 1) <
x
4
8
3/2
__
,
que a su vez es equivalente a
P
_
N(0, 1) >
x
4
8
3/2
_
0
025 y P
_
N(0, 1) <
x
4
8
3/2
_
0
025.
Esto implica que
x
4
8
3/2
1
96 y
x
4
8
3/2
1
96,
es decir, 5
06 x
4
10
94 o, lo que es lo mismo, 20
24
i
x
i
43
76. As pues, no se rechaza que la

media sea de 8, al nivel = 0
05, si
4
i=1
x
i
esta en el intervalo (2024, 4376), es decir, si la muestra
pertenece al conjunto
{(x
1
, x
2
, x
3
, x
4
)/20
24 <
4
i=1
x
i
< 43
76}.
Ejercicio 9.4 Nos piden que comparemos si la velocidad media de ambas maquinas es la misma, por lo que
debemos hacer un contraste de las siguientes hipotesis:
H
0
: las velocidades medias son iguales
H
1
: las velocidades medias son distintas
Puesto que el unico dato que nos dan sobre la distribucion de la velocidad de las maquinas es que siguen una
distribucion normal, lo unico que tenemos es que
= velocidad de la maquina normal N(
1
,
1
)
= velocidad de la maquina nueva N(
2
,
2
)
y sendas muestras de tama no 9 de ambas variables. Como consecuencia de este planteamiento formal del pro-
blema, las hipotesis que antes contrastabamos, se pueden formular como sigue:
H
0
:
1
=
2

1
2
= 0
H
1
:
1
=
2

1
2
= 0
Puesto que trabajamos con distribuciones normales, existen dos regiones de aceptacion distintas para realizar
este contraste sobre la diferencia de medias si las varianzas son desconocidas (como es este caso), dependiendo
que las varianzas, aunque desconocidas, se consideren iguales o distintas, por lo que debemos empezar haciendo
un contraste de hipotesis sobre esta cuestion, y en consecuencia de lo que obtengamos, utilizar una u otra de
las regiones de aceptacion.
Vamos pues a comenzar haciendo el contraste
H
0
:
2
1
=
2
2

2
1
/
2
2
= 1
H
1
:
2
1
=
2
2

2
1
/
2
2
= 1
Para este segundo contraste sobre el cociente de varianzas la region de aceptacion, seg un se vio en teora es:
S
0
= {(x
1
, x
2
, . . . , x
9
), (y
1
, y
2
, . . . , y
9
)/1
_
s
2
1
/ s
2
2
b
,
s
2
1
/ s
2
2
a
_
} =
{(x
1
, x
2
, . . . , x
9
), (y
1
, y
2
, . . . , y
9
)/ s
2
1
/ s
2
2
(a, b)},
siendo a y b tales que P(F
8
8
> a) = 0
95 y P(F
8
8
> b) = 0
05.
As pues, la region crtica para este contraste es:
S
1
= {(x
1
, x
2
, . . . , x
9
), (y
1
, y
2
, . . . , y
9
)/ s
2
1
/ s
2
2
/ (a, b)},
y, por tanto,
p valor = 2 mn{P
_
S
2
1
/
S
2
2
< s
2
1
/ s
2
2
/H
0
_
, P
_
S
2
1
/
S
2
2
> s
2
1
/ s
2
2
/H
0
_
}.
Ahora bien, teniendo en cuenta que tanto como siguen una distribucion normal, se tiene que
S
2
1
/
S
2
2
2
1
/
2
2
F
n1
m1
;
teniendo en cuenta ademas que, si se supone que H
0
es cierta, se esta suponiendo que las varianzas poblacionales
son iguales, es decir,
2
1
/
2
2
= 1, bajo esta hipotesis se tiene que
S
2
1
/
S
2
2
F
8
8
.
Por otro lado, como es la cuasivarianza muestral, s
i
2
, se puede calcular a partir de la varianza muestral, que
es el dato que nos dan, mediante la formula s
2
i
=
n
n1
s
2
i
, y en nuestras muestras tenemos que s
2
1
=
9
8
s
2
1
=
9
8
(24
44) = 27
50 y s
2
2
=
9
8
s
2
2
=
9
8
(20
03) = 22
53, se obtiene que s

2
1
/ s
2
2
= 27
50/22
53 = 1
22.
p valor = 2 mn{P
_
F
8
8
< 1
22
_
, P
_
F
8
8
> 1
22
_
} = 2 mn{0
6073, 0
3927} = 2(0
3927) = 0
7854.
Como p valor = 0
7854 > 0
1, no rechazamos la hipotesis nula, es decir, a partir de ahora, y en vista de

los datos muestrales, consideraremos las varianzas de ambas variables (
1
,
2
) iguales, y por tanto, la region de
aceptacion para el contraste de igualdad de medias es:
S
0
=
_
_
_
(x
1
, x
2
, . . . , x
9
), (y
1
, y
2
, . . . , y
9
)/
x
9
y
9
ns
2
1
+ms
2
2
n+m
nm(n+m2)
k
_
_
_
y, por tanto, la region crtica es:
S
1
=
_
_
_
(x
1
, x
2
, . . . , x
9
), (y
1
, y
2
, . . . , y
9
)/
x
9
y
9
ns
2
1
+ms
2
2
n+m
nm(n+m2)
> k
_
_
_
,
con lo que el p-valor para este contraste es:
p valor = P
_
_
nS
2
1
+mS
2
2
n+m
nm(n+m2)
>
x
9
y
9
ns
2
1
+ms
2
2
n+m
nm(n+m2)
/H
0
_
_
=
P (|t
16
| > 1
55) = 0
1407 > 0
1,
puesto que al tratarse de distribuciones normales,
nS
2
1
+mS
2
2
n+m
nm(n+m2)
t
n+m2
t
16
,
x
9
y
9
ns
2
1
+ms
2
2
n+m
nm(n+m2)
35
22 31
56
9(24
44) + 9(20
03)
18
9(9)16
= 1
55
y P(|t
16
| > 1
55) = 0
14324, como puede verse en la siguiente gura:

Como el p-valor es mayor que el nivel de signicacion jado (0
1), no rechazamos la hipotesis nula H

0
, es decir,
no tenemos evidencias sucientes como para decir que las velocidades son distintas en ambas maquinas.
Ejercicio 9.5 a) Si consideramos las variables:
= resistencia a la tension sin proceso de fusion
= resistencia a la tension con proceso de fusion
el enunciado nos dice que N(
1
,
1
) y N(
2
,
2
) y en este apartado nos piden que realicemos el
contraste:
H
0
:
1
=
2

1
2
= 0
H
1
:
1
<
2

1
2
< 0
No obstante, debemos comenzar realizando el contraste H
0
:
2
1
=
2
2

2
1
2
2
= 1 frente a la alternativa
H
1
:
2
1
=
2
2

2
1
2
2
= 1, para saber cual es la region crtica adecuada para el contraste de medias.
Seg un se vio en teora, la region crtica para este contraste de igualdad de varianzas es:
S
1
= {(x
1
, x
2
, . . . , x
10
), (y
1
, y
2
, . . . , y
8
)/ s
2
1
/ s
2
2
/ (a, b)},
y, por tanto,
p valor = 2 mn{P
_
S
2
1
/
S
2
2
< s
2
1
/ s
2
2
/H
0
_
, P
_
S
2
1
/
S
2
2
> s
2
1
/ s
2
2
/H
0
_
}.
Ahora bien, teniendo en cuenta que, para estas distribuciones normales, se tiene que
S
2
1
/
S
2
2
2
1
/
2
2
F
n1
m1
F
9
7
,
que suponer H
0
cierta es lo mismo que suponer que
2
1
/
2
2
= 1, y que s
2
1
/ s
2
2
= (277
3/205
9)
2
= 1
81,
obtenemos que
p valor = 2 mn{P
_
F
9
7
< 1
81
_
, P
_
F
9
7
> 1
81
_
} = 2 mn{0
7769, 0
2231} = 2(0
2231) = 0
4462 > 0
1,
con lo cual no rechazamos la hipotesis nula, es decir, se puede considerar que las varianzas de ambas
poblaciones son iguales.
Como consecuencia de esto, la region crtica para el contraste de medias es:
S
1
=
_
_
_
(x
1
, x
2
, . . . , x
10
), (y
1
, y
2
, . . . , y
8
)/
x
10
y
8
ns
2
1
+ms
2
2
n+m
nm(n+m2)
< k
_
_
_
,
p valor = P
_
_

10
nS
2
1
+mS
2
2
n+m
nm(n+m2)
<
x
10
y
8
ns
2
1
+ms
2
2
n+m
nm(n+m2)
/H
0
_
_
=
P (t
16
< 1
74) = 0
0505 < 0
1,
10
nS
2
1
+mS
2
2
n+m
nm(n+m2)
t
n+m2
t
16
,
x
10
y
8
ns
2
1
+ms
2
2
n+m
nm(n+m2)
=
2902
8 3108
10(69205
8) + 8(37095
5)
18
10(8)16
= 1
74
considerando que
s
2
1
=
n 1
n
s
2
1
=
9
10
(277
3)
2
= 69205
8 y s
2
2
=
m1
m
s
2
2
=
7
8
(205
9)
2
= 37095
5.
As pues, como el p-valor es menor del nivel de signicacion prejado (0
1), rechazamos la hipotesis nula

H
0
, es decir, los datos respaldan la hipotesis de que el proceso de fusion aumenta la resistencia media a la
tension.
b) El contraste que queremos realizar es:
H
0
:
2
1
=
2
2

2
1
/
2
2
= 1
H
1
:
2
1
>
2
2

2
1
/
2
2
> 1
En este caso la region crtica para el contraste es:
S
1
= {(x
1
, x
2
, . . . , x
10
), (y
1
, y
2
, . . . , y
8
)/ s
2
1
/ s
2
2
> k},
y, por tanto,
p valor = P
_
S
2
1
/
S
2
2
> k/H
0
_
= P(F
9
7
> 1
81) = 0
2231 > 0
1,
teniendo en cuenta lo visto en el apartado anterior.
As pues, el p-valor es mayor del nivel de signicacion prejado (0
1), con lo cual no rechazamos la hipotesis

nula, es decir, se puede admitir que las varianzas de ambos procesos son iguales (o menores).
c) En este caso la region crtica para este contraste es de la forma:
S
1
=
_
(x
1
, x
2
, . . . , x
10
), (y
1
, y
2
, . . . , y
8
)/
x
10
y
8
2
1
/n +
2
2
/m
< k
_
,
p valor = P
_

10
2
1
/n +
2
2
/m
<
x
10
y
8
2
1
/n +
2
2
/m
/H
0
_
=
P (N(0, 1) < 1
81) = 0
0351 < 0
1,
10
2
1
/n +
2
2
/m
N(0, 1),
x
10
y
8
2
1
/n +
2
2
/m
=
2902
8 3108
280
2
/10 + 200
2
/8
= 1
81.
As pues, como el p-valor es menor del nivel de signicacion prejado (0
1), rechazamos la hipotesis nula

H
0
, es decir, el proceso de fusion aumenta la resistencia media a la tension.
Ejercicio 9.6 Para realizar el contraste
H
0
: p = 0
08
H
1
: p > 0
08
la region crtica adecuada es:
S
1
= {(x
1
, x
2
, . . . , x
100
)/
x
100
0
08
08(0
92)/100
> k}.
Ahora bien, teniendo en cuenta que
n
p
p(1p)
n
=
p p
p(1p)
n
n30
N(0, 1),
y que suponer que la hipotesis nula es cierta es lo mismo que suponer que p vale 0
08, se tiene que:

p valor = P
_

100
0
08
08(0
92)/100
>
x
100
0
08
08(0
92)/100
/H
0
_
P(N(0, 1) > 2
21) = 0
0136 < 0
05,
con lo que rechazamos la hipotesis nula, es decir, el porcentaje de placas que se ampollan es mayor del 8 %.
Ejercicio 9.7 a) Debemos realizar el contraste
H
0
: p
1
= p
2
p
1
p
2
= 0
H
1
: p
1
= p
2
p
1
p
2
= 0
Puesto que la region crtica adecuada para este contraste es:
S
1
=
_
_
_
(x
1
, x
2
, . . . , x
191
), (y
1
, y
2
, . . . , y
64
)/
x
191
y
64
p(1 p)
_
1
191
+
1
64
_
> k
_
_
_
y
p(1 p)
_
1
191
+
1
64
_
=
( p
1
p
2
) (p
1
p
2
)
p(1 p)(
1
n
+
1
m
)
n30,m30
N(0, 1),
con
p =
i
x
i
+
j
y
j
n +m
=
101 + 56
191 + 64
= 0
62,
el p-valor para este contraste es:
p valor = P
_
_
191
64
p(1 p)
_
1
191
+
1
64
_
>
x
191
y
64
p(1 p)
_
1
191
+
1
64
_
/H
0
_
_
=
P
_
_
|N(0, 1)| >
101/191 56/64
62(1 0
62)
_
1
191
+
1
64
_
_
_
= P (|N(0, 1)| > |4,94|) = 0 < 0
05,
con lo que podemos concluir que la proporcion de encarcelados entre los que se han declarado culpables y
los que no, es distinta (no hay el mismo comportamiento para ambos grupos).
b) Si planteamos el contraste
H
0
: p
1
= p
2
p
1
p
2
= 0
H
1
: p
1
< p
2
p
1
p
2
< 0
el unico cambio respecto al apartado anterior vendra dado en la region crtica, que ahora sera:
S
1
=
_
_
_
(x
1
, x
2
, . . . , x
191
), (y
1
, y
2
, . . . , y
64
)/
x
191
y
64
p(1 p)
_
1
191
+
1
64
_
< k
_
_
_
,
con lo que el p-valor para este contraste sera:
p valor = P (N(0, 1) < 4,94) = 0 < 0
05,
por lo que tambien en este contraste rechazamos H
0
, es decir, estos datos sugieren que declararse inicialmente
culpable puede ser mejor estrategia que declararse inocente, si se pretende evitar la prision.
Ejercicio 9.8 Por teora sabemos que la region crtica para este contraste es:
S
1
= {(x
1
, x
2
, . . . , x
n
)/U(x
1
, x
2
, . . . , x
n
) > k},
siendo U el estadstico denido por:
U =
k
i=1
(n
i
np
i
)
2
np
i
=
_
1
n
k
i=1
n
2
i
p
i
_
n
H
0
2
410

2
3
.
En nuestro caso, U(x
1
, x
2
, . . . , x
n
) = 4
03, por lo que

p valor = P(U(
1
, . . . ,
4
) > U(x
1
, . . . , x
4
)/H
0
) = P(
2
3
> 4
03) = 0
2582 0
05.
As pues, no rechazamos H
0
, es decir, no hay evidencias sucientes para decir que hay mas homicidios en unas
epocas del a no que en otras.
Ejercicio 9.9 a) Nos piden que estudiemos si es cierta la armacion de la empresa sobre la distribucion del
n umero mensual de averas, es decir, que comprobemos si la variable aleatoria = n umero de averas al
mes en el embalse sigue una distribucion de Poisson de parametro 0
5 (la media de una Poisson coincide

con el parametro de la misma). Para ello vamos a realizar el siguiente contraste de hipotesis:
H
0
: P(0
5)
H
1
: / P(0
5)
por lo tanto nos encontramos ante un contraste de bondad de ajuste a una distribucion discreta, cuya region
crtica sera pues de la forma
S
1
= {(x
1
, x
2
, . . . , x
n
)/U(x
1
, x
2
, . . . , x
n
) > k},
U =
k
i=1
(n
i
np
i
)
2
np
i
=
_
1
n
k
i=1
n
2
i
p
i
_
n
H
0
2
k1r
donde k representa el n umero de modalidades distintas que se han observado en la muestra para la variable,
n
i
el n umero de observaciones muestrales dentro de cada modalidad, p
i
la probabilidad que existe de obtener
esa modalidad si realmente la distribucion de la variable es P(), n el tama no muestral y r el n umero de
parametros a estimar.
En este caso tenemos que k = 3, puesto que agrupamos la clase 2 averas con la clase mas de dos averas,
a n de sastacer las hipotesis de aplicacion del metodo. Por otro lado, r = 0, puesto que no hay parametros
desconocidos en la distribucion considerada en H
0
.
Como en nuestro caso n = 72, n
1
= 45, n
2
= 18 y n
3
= 9, lo unico que nos queda para determinar el valor
de U y, a partir de el, el p-valor asociado a este contraste, es obtener los valores de los p
i
. Dichos valores
son:
p
1
= P( = 0) =
e
0
5
0
5
0
0!
= 0
607,
p
2
= P( = 1) =
e
0
5
0
5
1
1!
= 0
303,
p
3
= P( 2) = 1 p
1
p
2
= 0
090.
En nuestro caso tenemos, pues, que:
Modalidades Frecuencias Probabilidad
0 O
1
n
1
= 45 p
1
= 0
607
1 O
2
n
2
= 18 p
2
= 0
303
2 O
3
n
3
= 9 p
3
= 0
090
n=72 k=3 r=0
con lo que el valor del estadstico U para nuestra muestra es:
U(x
1
, x
2
, . . . , x
72
) =
_
1
72
3
i=1
n
2
i
p
i
_
72 =
_
1
72
(
45
2
0
607
+
18
2
0
303
+
9
2
0
090
)
_
72 = 1
686
y puesto que la region crtica para este contraste es de la forma
S
1
= {(x
1
, x
2
, . . . , x
n
)/U(x
1
, x
2
, . . . , x
n
) > k},
entonces el nivel crtico del test es:
p valor = P(U(
1
,
2
, . . . ,
72
) > 1
686) = P(
2
2
> 1
686) = 0
43 0
05
por lo tanto no rechazamos H
0
, y en consecuencia, podemos considerar que la variable sigue una distribu-
cion de Poisson de parametro 0
5. As, la respuesta a la pregunta del enunciado es que no hay evidencias

que contradigan la armacion de la empresa constructora.
b) Si la empresa constructora arma simplemente que la distribucion de es de Poisson, sin especicar el
parametro de la misma, el contraste a realizar sera:
H
0
: P()
H
1
: / P()
por lo tanto de nuevo nos encontramos ante un contraste chi-cuadrado de bondad de ajuste, pero ahora
r = 1 en lugar de r = 0, puesto que hay un parametro desconocido en la hipotesis nula H
0
. As pues, el
p-valor asociado a este contraste es de la forma:
p valor = P(
2
1
> k/H
0
),
siendo k = U(x
1
, . . . , x
72
) =
_
1
72
(
45
2
p
1
+
18
2
p
2
+
9
2
p
3
)
_
72.
Como se desconoce , tenemos que encontrar su estimacion maximo verosmil, que resulta ser

= x
n
(vease
el Ejemplo 8.3.1, pagina 270). Para los datos de nuestra muestra, la estimacion de es, por lo tanto,
=
72
i=1
x
i
72
=
0 45 + 1 18 + 2 9
72
= 0
5.
De aqu se obtienen las siguientes estimaciones para los valores de los p
i
:
p
1
= P( = 0) =
e
0
0!
= e
e
0
5
,
p
2
= P( = 1) =
e
1
1!
= e
() e
0
5
(0
5),
p
3
= P( 2) = 1 p
1
p
2
1 e
0
5
e
0
5
(0
5).
As, el valor del estadstico U para nuestra muestra es:
U(x
1
, x
2
, . . . , x
48
) =
_
1
72
3
i=1
n
2
i
p
i
_
72 =
_
1
72
(
45
2
e
0
5
+
18
2
e
0
5
(0
5)
+
9
2
1 e
0
5
e
0
5
(0
5)
)
_
72 = 1
681
y, por lo tanto, el p-valor o nivel crtico asociado al contraste es:
p valor = P(
2
1
> 1
681) = 0
195 0
05
por lo tanto no tenemos evidencias sucientes como para rechazar H
0
, y en consecuencia, de acuerdo con
estos datos muestrales, es adecuado considerar que la variable sigue una distribucion de Poisson. As, la
respuesta a la pregunta del enunciado es que la armacion de la empresa constructora parece ser
cierta.
Ejercicio 9.10 Nos piden que estudiemos si es cierta, al nivel 0
05, la armacion de que la variable aleatoria en

estudio, vamos a llamarla , sigue una distribucion exponencial de parametro 1/3 (la media de una exponencial
es uno partido de su parametro). Para ello nos proporcionan una muestra aleatoria simple con 4 valores de la
variable . Debemos pues realizar el siguiente contraste de hipotesis:
H
0
: exp(1/3)
H
1
: / exp(1/3)
por lo tanto nos encontramos ante un contraste de bondad de ajuste de Kolmogorov-Smirnov, puesto que la
distribucion es continua y la muestra no viene agrupada en clases (la muestra es de tama no 4 y conocemos los
4 valores de la variable). Teniendo todo esto en cuenta, la region crtica sera pues de la forma
S
1
= {(x
1
, x
2
, . . . , x
n
)/U(x
1
, x
2
, . . . , x
n
) > c},
U = max
i=1,2,...,n
{|F
n
(x
i
) F
0
(x
i
)|, |F
n
(x
i
-) F
0
(x
i
)|}
donde
_
_
F
n
(x
i
) =
n umero de valores de la muestra x
i
n
,
F
n
(x
i
) =
n umero de valores de la muestra < x
i
n
,
F
0
(x
i
) = P( x
i
/H
0
).
Para calcular el valor de U para nuestra muestra (U(x
1
, x
2
, x
3
, x
4
)) vamos a hacer una tabla con una primera
columna con los valores que toma la variable en la muestra ordenados de menor a mayor, una segunda con los
valores de F
n
(x
i
), la tercera con los de F
n
(x
i
), luego los de F
0
(x
i
) y nalmente dos columnas con las diferencias
|F
n
(x
i
) F
0
(x
i
)| y |F
n
(x
i
) F
0
(x
i
)|.
x
i
F
n
(x
i
) F
n
(x
i
) F
0
(x
i
) |F
n
(x
i
) F
0
(x
i
)| |F
n
(x
i
) F
0
(x
i
)|
3 0
25 0 0
632 0
382 0
632
12 0
75 0
25 0
982 0
232 0732
24 1 0
75 1 0 0
25
donde F
n
(x
i
) y F
n
(x
i
) han sido calculados seg un la formula explicada al principio del ejercicio y F
0
(x
i
) ha sido
calculado teniendo en cuenta que
F
0
(x) = P( x/H
0
) =
(t)dt =
_
1 e
x/3
si x > 0
0 si x 0
por lo que F
0
(3) = 1 e
1
= 0
632, F
0
(12) = 1 e
4
= 0
982 y F
0
(24) = 1 e
8
= 1.
Con todo esto ya estamos en condiciones de calcular el valor del estadstico U para nuestra muestra:
U = max
i=1,2,...,n
{|F
n
(x
i
) F
0
(x
i
)|, |F
n
(x
i
-) F
0
(x
i
)|} = 0
732
y puesto que la region crtica para este contraste es de la forma S
1
= {(x
1
, x
2
, x
3
, x
4
)/U(
1
, . . . ,
4
) > c}, el
nivel crtico para el mismo es
p valor = P(U(
1
, . . . ,
4
) > U(x
1
, . . . , x
4
)/H
0
) = P(U(
1
, . . . ,
4
) > 0
732/H
0
).
La tabla que se debe utilizar para calcular esta probabilidad es la titulada TABLA DE KOLMOGOROV-
SMIRNOV, puesto que la distribucion que aparece en la hipotesis nula esta completamente determinada, es
decir, no hay parametros desconocidos (se utiliza la tabla titulada TABLA DE LILLIEFORS si la distribucion
que aparece en la hipotesis nula es normal con parametros desconocidos (se estimaran por maxima verosimilitud);
en los casos con parametros desconocidos y distribucion no normal, no tenemos herramientas para hacer este
contraste y por tanto se procede a agrupar los datos en clases para hacer el contraste aplicando el test chi-
cuadrado de bondad de ajuste).
De dicha tabla obtenemos que P(U(
1
, . . . ,
4
) > 0
624/H
0
) = 0
05 y, teniendo en cuenta que, p valor =

P(U(
1
, . . . ,
4
) > 0
732/H
0
) < P(U(
1
, . . . ,
4
) > 0
624/H
0
) = 0
05, se obtiene que rechazo H

0
y por tanto se
rechaza que la variable siga una distribucion exponencial de media 3.
05, la armacion de que la variable aleatoria

=rendimiento en miles de kilometros, sigue una distribucion normal de parametros y desconocidos. Para
ello nos proporcionan una muestra aleatoria simple con 5 valores de la variable . Debemos pues realizar el
siguiente contraste de hipotesis:
H
0
: N(, )
H
1
: / N(, )
distribucion es continua y la muestra no viene agrupada en clases (la muestra es de tama no 5 y conocemos los
5 valores de la variable). Teniendo todo esto en cuenta, la region crtica sera pues de la forma
S
1
= {(x
1
, x
2
, . . . , x
n
)/U(x
1
, x
2
, . . . , x
n
) > c},
U = max
i=1,2,...,n
{|F
n
(x
i
) F
0
(x
i
)|, |F
n
(x
i
-) F
0
(x
i
)|}
donde
_
_
F
n
(x
i
) =
i
n
,
F
n
(x
i
) =
i
n
,
F
0
(x
i
) = P( x
i
/H
0
).
Para calcular el valor de U para mi muestra vamos a hacer la misma tabla que en el ejercicio anterior, pero con
los datos y la distribucion actuales, el problema es que ahora no puedo calcular F(x
i
) directamente, puesto que
F
(x) = P( x
i
) y no conocemos exactamente la distribucion de , pues sabemos que es normal pero no sus
parametros.
Dichos parametros los obtenemos por el metodo de maxima verosimilitud. En este caso, los parametros son las
soluciones de las ecuaciones
ln(L(
1
,
2
, . . . ,
n
; (, ))) = 0,
ln(L(
1
,
2
, . . . ,
n
; (, ))) = 0.
Puesto que
L(x
1
, x
2
, . . . , x
n
; (, )) =
n
i=1
f
i
(x
i
) =
n
i=1
1
2
e
(x
i
)
2
/(2
2
)
=
_
1
2
_
n
_
1
_
n
e
i
(x
i
)
2
/(2
2
)
,
entonces
ln(L(x
1
, x
2
, . . . , x
n
; (, ))) = ln
__
1
2
_
n
_
nln()
i
(x
i
)
2
2
2
y por tanto
ln(L(
1
,
2
, . . . ,
n
; (, ))) = 0 + 0 +
i
(x
i
)
ln(L(
1
,
2
, . . . ,
n
; (, ))) = 0 n
1
i
(x
i
)
2
3
ecuaciones que igualadas a cero nos dan las soluciones
=
i
x
i
n
y =
i
(x
i
x
n
)
2
n
que para nuestros datos muestrales toman los valores = 10 y = 2.
Con todo esto podemos concluir que
x
i
F
n
(x
i
) F
n
(x
i
) F
0
(x
i
) |F
n
(x
i
) F
0
(x
i
)| |F
n
(x
i
) F
0
(x
i
)|
6
4 0
2 0 0
036 0
164 0
036
9
5 0
4 0
2 0
401 0
001 0201
10
5 0
6 0
4 0
599 0
001 0
199
11
6 0
8 0
6 0
788 0
012 0
188
12
0 1 0
8 0
841 0
159 0
041
donde F
0
(x
i
) ha sido calculado teniendo en cuenta que F
0
(x) = P(N(10, 2) x).
En este punto estamos en condiciones de calcular el valor del estadstico U para la muestra que nos dan en
el enunciado: U(x
1
, . . . , x
n
) = max
i=1,2,...,n
{|F
n
(x
i
) F
0
(x
i
)|, |F
n
(x
i
-) F
0
(x
i
)|} = 0
201. Teniendo en cuenta este

dato y los valores de la TABLA DE LILLIEFORS (la distribucion que aparece en la hipotesis nula es normal
con parametros desconocidos), se obtiene que
p valor = P(U(
1
, . . . ,
n
) > U(x
1
, . . . , x
n
)/H
0
) = P(U(
1
, . . . ,
n
) > 0
201/H
0
)
> P(U(
1
, . . . ,
n
) > 0
337/H
0
) = 0
05,
por lo que no rechazo H
0
y por tanto puede admitirse, de acuerdo con estos datos muestrales, que la
variable sigue una distribucion normal.
Ejercicio 9.12 a) Tenemos que hacer el contraste
H
0
: exp(3)
H
1
: / exp(3)
Puesto que es un contraste de bondad de ajuste y los datos vienen agrupados en clases, la region crtica
adecuada es
S
1
= {(x
1
, x
2
, . . . , x
n
) / U(x
1
, x
2
, . . . , x
n
) > k},
donde U es el estadstico chi-cuadrado.
En este caso
U(x
1
, x
2
, . . . , x
n
) =
_
1
72
3
i=1
n
2
i
p
i
_
72
que sigue una distribucion
2
301

2
2
.
Lo unico que nos queda para calcular U(x
1
, . . . , x
n
) es conocer los valores de
p
1
= P(0 < < 1/4) =
1/4
0
e
x
dx = 1 e
/4
= 1 e
3/4
= 0
5276,
p
2
= P(1/4 < < 1/2) =
1/2
1/4
e
x
dx = e
/4
e
/2
= e
3/4
e
3/2
= 0
2492,
p
3
= 1 p
1
p
2
0
2232.
En consecuencia
U(x
1
, . . . , x
n
) =
1
72
_
36
2
0
5276
+
24
2
0
2492
+
12
2
0
2232
_
72 = 3
1801,
por lo que
p valor = P(U(
1
, . . . ,
n
) > U(x
1
, . . . , x
n
)/H
0
) = P(
2
2
> 3
1801) = 0
2039 > 0
05
y, por lo tanto, no se rechaza la hipotesis nula de que la distribucion es exponencial de parametro 3, es decir,
a este nivel 0
05, los datos concuerdan con la informacion que proporciona el distribuidor.

b) El mayor nivel crtico para el que los datos concuerdan es, en realidad, el nivel crtico, que tal como acabamos
de ver vale 0
2039.
Ejercicio 9.13 a) Aplicando las deniciones de estos conceptos tenemos que
Media muestral:
x
5
=
1
5
5
i=1
x
i
=
5
40 + 3
44 + 8
55 + 6
49 + 8
42
5
= 646 10
4
pulgadas,
Varianza muestral:
S
2
=
1
5
5
i=1
(x
i
x
5
)
2
=
(5
406
46)
2
+(3
446
46)
2
+(8
556
46)
2
+(6
496
46)
2
+(8
426
46)
2
5
= 3691,
Cuasivarianza muestral
S
2
=
1
4
5
i=1
(x
i
x
5
)
2
=
(5
406
46)
2
+(3
446
46)
2
+(8
556
46)
2
+(6
496
46)
2
+(8
426
46)
2
4
= 4614,
Mediana de la muestra
Me = 649 10
4
pulgadas.
b) Nos piden que realicemos el contraste
H
0
: = 4 4
H
1
: > 4
al nivel de signicacion = 0
05, a partir de una muestra de tama no 5 de una v.a. que mide el desgaste
del eje en 10
4
pulgadas y sigue una distribucion normal N(, ).
Puesto que
la region crtica para este contraste es de la forma:
S
1
=
_
(x
1
, x
2
, . . . , x
5
)/
x
n
s/
n
> k
_
;
supuesto cierta H
0
se tiene que
n
4
S/
n
t
n1
t
4
;
para esta muestra:
x
n
4
s/
n
=
6
46
614/
5
= 2
56;
el p-valor para este contraste es:
p valor = P
_
S/
n
>
x
n
s/
n
_
= P(t
4
> 2
56) = 0
0313 < 0
05,
por lo que se puede rechazar la hipotesis nula, es decir, la informacion muestral sugiere que la media
poblacional es mayor de 4 10
4
pulgadas.
c) Puesto que ahora el unico dato que tenemos sobre la distribucion de la variable es que su desviacion tpica
es = 2, debemos suponer que n 30 para poder aplicar el Teorema Central del Lmite. As pues, bajo
estos supuestos se puede considerar como funcion pivotal
T
=

n
n
N(0, 1)
Teniendo en cuenta que P(1
96 < N(0, 1) < 1
96) = 0
95, se obtiene que

0
95 = P(1
96 <

n
n
< 1
96) = P(1
96

n
<
n
< 1
96

n
) = P(
n
1
96

n
< <
n
+1
96

n
),
con lo cual el error de estimacion a este nivel de conanza es
= 1
96
2
n
0
5
_
1
96
2
0
5
_
2
= 61
47 n,
y, por lo tanto, el mnimo tama no muestral necesario para estimar bajo estas condiciones es
de 62 ejes.
Ejercicio 9.14 a) Queremos estudiar si, a partir de la muestra de tama no 100 de automoviles revisados este
a no, se puede concluir que mas del 60 % pasaran la prueba. Si denotamos por p la proporcion poblacional
de automoviles que pasaran la prueba, queremos estudiar si p > 0
6. Para ello nos planteamos el contraste:

H
0
: p = 0
6 p 0
6
H
1
: p > 0
6
05.
Existen varias formas de estudiar si se rechaza o no la hipotesis nula. Nosotros vamos a resolverlo obteniendo
el p-valor para este contraste.
Seg un lo visto en teora, la region crtica para este contraste sera de la forma:
S
1
=
_
_
_
(x
1
, . . . , x
100
)
_
p 0
6(10
6)
100
> k
_
_
_
.
As pues, el nivel crtico o p-valor del contraste es:
p valor = P
_
_
p p
6(10
6)
100
>
0
7 0
6(10
6)
100
_
H
0
_
_
= P(N(0, 1) > 2
0412) = 0
0206,
teniendo en cuenta, al ser el tama no muestral es sucientemente grande, se tiene que
p p
p(1p)
n
N(0, 1).
Puesto que dicho p-valor (0
0206) es menor que el nivel de signicacion prejado ( = 0
05), entonces
rechazamos la hipotesis nula, es decir, existen evidencias sucientes para concluir, a nivel 005, que la
proporcion de automoviles que pasaran la prueba este a no es superior a la del a no pasado.
b) Seg un lo que acabamos de ver, el p-valor es 0
0206.
c) Si consideramos de nuevo que
p p
p(1p)
n
N(0, 1)
no podemos ahora sustituir en el denominador p por 0
6, puesto que no estamos suponiendo que H

0
sea
cierta. No obstante, puesto que el tama no muestral es sucientemente grande, podemos aproximar p(1 p)
por su estimador maximo verosmil p(1 p), con lo cual, trabajaremos con la funcion pivotal:
p p
p(1 p)
n
N(0, 1).
Puesto que P(N(0, 1) < 1
96) = 0
975, se tiene que P(1
96 < N(0, 1) < 1
96) = 0
95, con lo cual

P
_
_
1
96 <
p p
p(1 p)
n
< 1
96
_
_
= P
_
p 1
96
p(1 p)
n
< p < p + 1
96
p(1 p)
n
_
es decir, un intervalo de conanza de p al 95 % es:
_
0
7 1
96
7(1 0
7)
100
, 0
7 + 1
96
7(1 0
7)
100
_
= (061,079).
Ejercicio 9.15 a) Puesto que la region crtica para el contraste
H
0
: 20
H
1
: > 20
es de la forma
S
1
= {(x
1
, x
2
, . . . , x
41
)/
x
n
20
s/
n
> k},
el nivel crtico del contraste es:
p valor = P(
n
20
S/
n
>
x
n
20
s/
n
/H
0
) = P(t
40
>
20
42 20
5
14/
41
) = P(t
40
> 0
523) = 0
302,
teniendo en cuenta que para poblaciones normales se verica que
S/
n
t
n1
.
b) Teniendo en cuenta que las hipotesis a contrastar son
H
0
: = 5
2
= 25
H
1
: = 5
2
= 25
la region crtica para este contraste es de la forma:
S
1
= {(x
1
, x
2
, . . . , x
41
)/
ns
2
2
< a o
ns
2
2
> b},
p valor = 2 mn{P
_
nS
2
2
<
ns
2
2
/H
0
_
, P
_
nS
2
2
>
ns
2
2
/H
0
_
}
= 2 mn{P
_
2
n1
<
ns
2
2
/H
0
_
, P
_
2
n1
>
ns
2
2
/H
0
_
}
= 2 mn{P
_
2
40
< 42
34
_
, P
_
2
40
> 42
34
_
}
= 2 mn{0
6297, 0
3703} = 0
7406 > 0
50 > 0
05,
considerando que para poblaciones normales se tiene que
nS
2
2

2
n1
y que para esta muestra y este contraste (suponer que la hipotesis nula es cierta es lo mismo que suponer
que
2
vale 25) en particular se tiene que
ns
2
2
=
41 25
82
25
= 42
34.
Puesto que este p-valor es mayor que el nivel de signicacion prejado ( = 0
05), no rechazamos H
0
, es
decir, no hay nada que indique que no es razonable mantener la hipotesis de que la desviacion tpica es de
5.
Ejercicio 9.16 Los datos que nos proporciona el enunciado es que estamos trabajando con una v.a. =peso
de los paquetes, en gr. con distribucion normal N(, ) para la cual se ha obtenido una muestra de tama no
n = 9 cuya media ha resultado ser x
9
= 203
5 y su desviacion tpica muestral s = 7
07.
En funcion de esta muestra, nos piden que planteemos y resolvamos dos contrastes. Esto puede hacerse de varias
formas distintas, pero equivalentes. Nosotros lo haremos calculando los p-valores asociados a dichos contrastes
y concluyendo a partir de ellos.
a) Nos piden que realicemos el contraste
H
0
: 200
H
1
: < 200
al nivel = 0
05.
Seg un hemos visto en teora, por ser desconocida, la region de aceptacion es de la forma:
S
0
= {(x
1
, x
2
, . . . , x
9
)/
x
9
200
s/
8
k},
ya que ns
2
= (n 1) s
2
. Luego la region crtica sera la complementaria de la anterior, es decir:
S
1
= {(x
1
, x
2
, . . . , x
9
)/
x
9
200
s/
8
< k}.
En nuestro caso x
9
= 203
5, s = 7
07 y
x
9
200
s/
8
=
203
5200
7
07/
8
= 1
4. Ademas se tiene que, para muestras de

tama no 9 de poblaciones normales,
S/
n 1
t
n1
t
8
,
con lo que el nivel crtico o p-valor para este contraste es:
p valor = P
_

n
200
S/
n 1
203
5 200
7
07/
8
_
= P(t
8
1
4) = 0
90 > 0
05
luego no rechazamos H
0
.
b) Por el apartado anterior ya podemos armar que el p-valor o nivel crtico es 0
90.
c) Si el contraste es de la forma
H
0
: = 200
H
1
: = 200
la region de aceptacion de H
0
es de la forma S
0
= {(x
1
, x
2
, . . . , x
9
)/
x
9
200
s/
n1
k}, con lo que la region de

rechazo es de la forma S
1
= {(x
1
, x
2
, . . . , x
9
)/
x
9
200
s/
n1
> k}.
En nuestro caso la menor region crtica para la que rechazamos H
0
la obtenemos cuando k =
203
5200
7
07/
=
1
4. En consecuencia, el p-valor sera p valor = P

_
n
200
S/
n1
> 1
4
_
H
0
_
= P (t
8
> 1
4) = 0
2.
= nivel de colesterol de un individuo que practica deporte
= nivel de colesterol de un individuo que no practica deporte
se tiene que
N(
1
,
1
), N(
2
,
2
) y y son independientes.
Para la primera variable nos dan una muestra de tama no n = 11 con x
11
= 157 y s
1
= 40, y para la segunda
una muestra de tama no m = 16 con y
16
= 187 y s
2
= 30.
a) Puesto que nos piden un intervalo de conanza al 0
9 para
2
1
/
2
2
, y se verican las condiciones necesarias,
la funcion pivotal es:
S
2
1
/
S
2
2
2
1
/
2
2
F
10
15
.
Teniendo en cuenta que buscar un a y un b tales que P(a < F
10
15
< b) = 0
9 es equivalente a buscar un a tal

que P(F
10
15
> a) = 0
95 y un b tal que P(F

10
15
> b) = 0
05, se obtiene que a = 0
35 y b = 2
54.
De todo lo anterior se deduce:
0
9 = P
_
0
35 <
S
2
1
/
S
2
2
2
1
/
2
2
< 2
54
_
= P
_
S
2
1
/
S
2
2
2
54
<
2
1
/
2
2
<
S
2
1
/
S
2
2
0
35
_
,
con lo cual, un intervalo de conanza del cociente de varianzas, con coeciente de conanza 0
9 es:
_
s
2
1
/ s
2
2
2
54
,
s
2
1
/ s
2
2
0
35
_
=
_
(40/30)
2
2
54
<
2
1
/
2
2
<
(40/30)
2
0
35
_
= (0
70, 5
08).
b) Nos piden que realicemos el contraste
H
0
:
1
=
2
H
1
:
1
=
2
al nivel = 0
1.
La region crtica para dicho contraste tendra una u otra forma dependiendo de que se pueda suponer que
las varianzas de ambas poblaciones son iguales o distintas. Debemos pues comenzar planteandonos dicho
contraste: H
0
:
2
1
=
2
2
1
:
2
1
=
2
2
. Seg un vimos en teora, ademas de realizar un
contraste de hipotesis a partir de la obtencion del p-valor asociado, tambien podemos realizarlo estableciendo
la region de aceptacion a partir del intervalo de conanza. En este caso hemos elegido el segundo metodo por
ser casi inmediato una vez realizado el apartado anterior, pero, evidentemente, tambien podra realizarse
el contraste de igualdad de varianzas a partir del p-valor asociado. As pues, la region de aceptacion para
dicho contraste de igualdad de varianzas es:
S
0
= {(x
1
, . . . , x
n
), (y
1
, . . . , y
m
)/1
_
s
2
1
/ s
2
2
2
54
,
s
2
1
/ s
2
2
0
35
_
}.
Seg un vimos en el apartado anterior, para nuestras muestras,
_
s
2
1
/ s
2
2
2
54
,
s
2
1
/ s
2
2
0
35
_
= (0
70, 5
08). Puesto que

1 (0
70, 5
08), se pueden suponer las varianzas iguales y, por lo tanto, la region crtica para el contraste
de igualdad de medias es:
S
1
= {(x
1
, . . . , x
n
), (y
1
, . . . , y
m
)/
(x
n
y
m
)
ns
2
1
+ms
2
2
nm(n+m2)
(n +m)
> k}.
Teniendo esto en cuenta, y considerando ademas que bajo H
0
la diferencia de medias (
1
2
) vale cero y
que para poblaciones normales
(
n
m
) (
1
2
)
nS
2
1
+mS
2
2
nm(n+m2)
(n +m)
t
n+m2
,
se obtiene que
p valor = 2 mn
_
_
_
P
_
_
(
n
m
)
nS
2
1
+mS
2
2
nm(n+m2)
(n +m)
>
(x
n
y
m
)
ns
2
1
+ms
2
2
nm(n+m2)
(n +m)
/H
0
_
_
,
P
_
_
(
n
m
)
nS
2
1
+mS
2
2
nm(n+m2)
(n +m)
<
(x
n
y
m
)
ns
2
1
+ms
2
2
nm(n+m2)
(n +m)
/H
0
_
_
_
_
_
= 2 mn
_
_
_
P
_
_
t
11+162
>
(157 187)
11
10
11
(40)
2
+16
15
16
(30)
2
1116(25)
(27)
_
_
, P
_
_
t
11+162
<
(157 187)
11
10
11
(40)
2
+16
15
16
(30)
2
1116(25)
(27)
_
_
_
_
_
= 2 mn{P(t
25
> 2
23), P(t
25
< 2
23)} = 2 mn{0
0175, 0
9825} = 0
0350 < 0
1
con lo cual no se puede aceptar como valida, al nivel 0
1, la hipotesis nula de que la media es igual en ambos

grupos, es decir, a este nivel se rechaza que el nivel medio de colesterol es igual para los jovenes deportistas
que para los no deportistas.
Ejercicio 9.18 Nos piden que comparemos si la velocidad media de ambos procesadores es la misma, por lo
que debemos hacer un contraste de las siguientes hipotesis:
H
0
: las velocidades medias son iguales
1
=
2

1
2
= 0
H
1
: las velocidades medias son distintas
1
=
2

1
2
= 0
A la vista del contraste propuesto y puesto que trabajamos con distribuciones normales, este test se puede
hacer utilizando uno de los estadsticos que aparecen en la tabla DISTRIBUCIONES EN EL MUESTREO
para obtener la region de aceptacion del mismo. El problema esta en cual coger, pues tenemos dos estadsticos
diferentes para ello si las varianzas son desconocidas (como es este caso), dependiendo que las varianzas, aunque
desconocidas, se consideren iguales o distintas. Por lo tanto debemos empezar haciendo un contraste de hipotesis
sobre esta cuestion, y en consecuencia de lo que obtengamos, utilizar uno de los dos estadsticos posibles para
realizar el contraste sobre la diferencia de medias.
Vamos pues a comenzar haciendo el contraste
H
0
:
2
1
=
2
2

2
1
/
2
2
= 1
H
1
:
2
1
=
2
2

2
1
/
2
2
= 1
En este caso usaremos el estadstico
S
2
1
/
S
2
2
1
2
/
2
2
F
n1
m1
F
20
10
y dado que se trata de un contraste de dos lados, como vimos en teora, la region de aceptacion sera:
S
0
=
_
(x
1
, x
2
, ..., x
21
), (y
1
, y
2
, . . . , y
11
)/1
_
s
2
1
/ s
2
2
b
,
s
2
1
/ s
2
2
a
__
=
_
(x
1
, x
2
, ..., x
21
), (y
1
, y
2
, . . . , y
11
)/
s
2
1
s
2
2
(a, b)
_
donde b es el punto tal que P(F
20
10
> b) = 0
05 y a es el punto tal que P(F

20
10
> a) = 0
95. As pues, si se
utilizan las tablas (con la calculadora se obtienen tanto a como b de forma directa) se obtiene directamente que
b = 2
77, pero para obtener a debemos utilizar las propiedades de la distribucion F de Snedecor. Teniendo estas
en cuenta, 0
95 = P(F
20
10
> a) = P(F
10
20
<
1
a
), lo cual es cierto si y solo si, P(F
10
20

1
a
) = 0
05, y buscando este

valor se obtiene que
1
a
= 2
35, con lo que a =

1
2
35
= 0
43.
De todo lo anterior se deduce que la region de aceptacion para este contraste es:
S
0
=
_
(x
1
, x
2
, ..., x
21
), (y
1
, y
2
, . . . , y
11
)/
s
2
1
s
2
2
(0
43, 2
77)
_
.
Como en nuestro caso:
s
2
1
=
1
21
21
i=1
x
2
i

_
1
21
21
i=1
x
i
_
2
=
1
21
2866
8
_
1
21
130
5
_
2
= 97
897,
s
2
2
=
1
11
11
j=1
y
2
j

_
_
1
11
11
j=1
y
j
_
_
2
=
1
11
1403
1
_
1
11
100
4
_
2
= 44
247,
se tiene que
s
2
1
=
n
n 1
s
2
1
=
21
20
s
2
1
=
21
20
(97
897) = 102
792 y s
2
2
=
m
m1
s
2
2
=
11
10
s
2
2
=
11
10
(44
247) = 48
672,
y por lo tanto,
s
2
1
s
2
2
=
102
792
48
672
= 2
112 (0
43, 2
77)
por lo que no rechazamos la hipotesis nula, es decir, a partir de ahora, y en vista de los datos muestrales,
consideraremos las varianzas de ambas variables iguales, y por tanto, el estadstico que vamos a usar para
contrastar la igualdad de medias es
(
n
m
) (
1
2
)
nS
2
1
+mS
2
2
nm(n+m2)
(n +m)
t
n+m2
t
30
.
Como se trata de un contraste de dos lados, de acuerdo con lo expuesto en teora y recordando la expresion del
intervalo de conanza para la diferencia entre las medias de dos poblaciones normales con varianzas desconocidas
pero iguales, la region de aceptacion sera:
S
0
=
_
(x
1
, x
2
, ..., x
n
), (y
1
, y
2
, . . . , y
m
)/0
_
(x
n
y
m
) b
ns
2
1
+ms
2
2
n+m
nm(n+m2)
__
=
_
(x
1
, x
2
, ..., x
n
), (y
1
, y
2
, . . . , y
m
)/(x
n
y
m
)
_
b
ns
2
1
+ms
2
2
n+m
nm(n+m2)
__
=
_
(x
1
, x
2
, ..., x
n
), (y
1
, y
2
, . . . , y
m
)/|x
n
y
m
| b) = 0
1, es decir, b = 1
70.
Como en nuestro caso:
x
21
=
1
21
21
i=1
x
i
=
1
21
130
5 = 6
214 y y
11
=
1
11
11
j=1
y
j
=
1
11
100
4 = 9
127,
se tiene que, para nuestra muestra,
|x
n
y
m
|
ns
2
1
+ms
2
2
n+m
nm(n+m2)
=
|6
214 9
127|
21 97
897 + 11 44,247
32
6930
= 0
850 < 1
70,
con lo cual nuestra muestra pertenece a la region de aceptacion y por lo tanto no tenemos evidencias en contra
de la hipotesis nula (H
0
), es decir, estos datos no contradicen la suposicion de que las velocidades medias de
ambos procesadores son iguales.
OTRA FORMA DE RESOLVER EL EJERCICIO: Hemos resuelto este ejercicio obteniendo las regiones
de aceptacion asociadas a cada contraste y viendo si nuestra muestra pertenece o no a ellas. Otra forma
de resolverlo sera obteniendo los niveles crticos o p-valores asociados a cada contraste y concluyendo en
consecuencia con dichos valores. As, para el contraste de igualdad de varianzas el p-valor es:
p valor = 2 mn{P(
S
2
1
/
S
2
2
< s
2
1
/ s
2
2
/H
0
), P(
S
2
1
/
S
2
2
> s
2
1
/ s
2
2
/H
0
)} = 2 mn{P(F
20
10
< 2
112), P(F
20
10
> 2
112)} =
2 mn{0
8879, 0
1121} = 0
2242 > 0
05,
con lo que es admisible considerar las varianzas iguales (no se rechaza H
0
). Por lo tanto, el nivel crtico para el
contraste de igualdad de medias es:
p valor = 2 mn
_
_
_
P
_
_
(
n
m
)
nS
2
1
+mS
2
2
nm(n+m2)
(n +m)
>
x
n
y
m
ns
2
1
+ms
2
2
nm(n+m2)
(n +m)
/H
0
_
_
,
P
_
_
(
n
m
)
nS
2
1
+mS
2
2
nm(n+m2)
(n +m)
<
x
n
y
m
ns
2
1
+ms
2
2
nm(n+m2)
(n +m)
/H
0
_
_
_
_
_
= 2 mn{P (t
30
> 0
850) , P (t
30
< 0
850)} = 0
4021 > 0
1,
por lo que no se rechaza H
0
, es decir, no hay evidencias sucientes en contra de la suposicion de que la velocidad
media de ambos procesadores es la misma.
Ejercicio 9.19 a) Se nos pide que realicemos el contraste H
0
: N(, ), frente a la alternativa H
1
:
N(, ). Puesto que se trata de un contraste de bondad de ajuste a una distribucion continua, en particular
a una normal de parametros desconocidos, y se conocen todos los valores de la muestra, se trata de un
contraste de Kolmogorov-Smirnov, en el que se debe utilizar la tabla de Lilliefors.
Teniendo en cuenta que la maxima discrepancia entre la funcion de distribucion emprica y la teorica es
0
098, sabemos que el p-valor para este contraste es: P(D

30
> 0
098). Ahora bien, si consideramos los datos

que nos proporciona la tabla de Lilliefors, se tiene que P(D
30
> 0
161) = 0
05 y P(D
30
> 0
187) = 0
01.
p valor = P(D
30
> 0
098) > P(D

30
> 0
161) = 0
05,
con lo cual no se rechaza H
0
, es decir, estos datos no aportan evidencias en contra de la suposicion de que
el espesor del oxido sigue una distribucion normal.
b) Se trata de obtener el intervalo de conanza para la media de una distribucion normal con varianza desco-
nocida, con lo cual la funcion pivotal adecuada es:
S/
n 1

30
S/
29
t
29
.
Puesto que el valor b tal que P(b < t
29
< b) = 0
95 es b = 2
04, se tiene que:

0
95 = P(2
04 <

30
S/
29
< 2
04) = P(
30
2
04
S
29
< <
30
+ 2
04
S
29
),
con lo cual el intervalo de conanza para la media es: (x
30
2
04
s
29
) = (49
85 2
04
4
42
29
) = (48
18, 51
52),
puesto que
x
30
=
1
30
30
i=1
x
i
=
1495
4
30
= 49
85,
s
2
=
1
30
30
i=1
x
2
i
(x
30
)
2
=
75136
9
30
(49
85)
2
= 19
54 y s =
s
2
=
19
54 = 4
42.
c) La region de aceptacion para el contraste H
0
1
: < 60, suponiendo que
la distribucion de la variable es una normal de varianza desconocida, es:
S
0
= {(x
1
, x
2
, . . . , x
30
)/
x
30
60
s/
29
k}
y, por tanto, la region crtica sera:
S
1
= {(x
1
, x
2
, . . . , x
30
)/
x
30
60
s/
29
< k},
con lo cual, el nivel crtico para este contraste es:
p valor = P(
30
S/
29
<
x
30
60
s/
29
) = P(t
29
<
49
85 60
4
42/
29
) = P(t
29
< 12
37) = 0
000.
As pues, se rechaza la hipotesis nula al nivel 0
01, es decir, el espesor medio de oxido en obleas de silicio es

menor de 60.
Ejercicio 9.20 a) Queremos obtener el intervalo de conanza para la proporcion poblacional p, con coeciente
de conanza 1 = 0
95 y tenemos como informacion de la muestra que el tama no muestral es n = 300 y

la proporcion muestral es p = 250/300 = 5/6.
En este caso, una funcion pivotal adecuada es
p p
p(1 p)/n
,
cuya distribucion es aproximadamente normal N(0, 1).
Puesto que para esta distribucion, los valores a y b tales que P(a < N(0, 1) < b) = 0
95 son a = 1
96 y
b = 1
96, se tiene que

0
95 = P
_
1
96 <
p p
p(1 p)/n
< 1
96
_
= P
_
p 1
96
p(1 p)/n < p < p + 1
96
p(1 p)/n
_
,
con lo que un intervalo de conanza para p a este nivel de conanza es:
_
p 1
96
p(1 p)/n
_
=
_
5/6 1
96
5/6(1/6)/300
_
= (0
791, 0
876).
b) Para realizar el contraste
H
0
: p 0
8
H
1
: p < 0
8
la region crtica adecuada es:
S
1
= {(x
1
, x
2
, . . . , x
300
)/
p 0
8(0
2)/300
< k}.
Ahora bien, teniendo en cuenta que
p p
p(1p)
n
n30
N(0, 1),
se tiene que:
p valor = P
_
p 0
8(0
2)/300
<
5/6 0
8(0
2)/300
/H
0
_
P(N(0, 1) < 1
44) = 0
9251 > 0
05,
con lo que no rechazamos la hipotesis nula, es decir, no hay nada que indique el que porcentaje de aviones
derribados sea menor del 80 %.
05, la armacion de que la variable aleatoria en

estudio, vamos a llamarla , sigue una distribucion exponencial de parametro 1/10 (la media de una exponencial
es el inverso de su parametro). Para ello nos proporcionan una muestra aleatoria simple con 10 valores de la
variable . Debemos pues realizar el siguiente contraste de hipotesis:
H
0
: exp(1/10)
H
1
: / exp(1/10)
distribucion es continua sin parametros desconocidos y la muestra no viene agrupada en clases (la muestra es
de tama no 10 y conocemos los 10 valores de la variable). Teniendo todo esto en cuenta, la region crtica es de
la forma
S
1
= {(x
1
, x
2
, . . . , x
n
)/U(x
1
, x
2
, . . . , x
n
) > c},
U = max
i=1,2,...,n
{|F
n
(x
i
) F
0
(x
i
)|, |F
n
(x
i
-) F
0
(x
i
)|}
donde
F
n
(x
i
) =
i
n
,
F
n
(x
i
) =
i
n
,
F
0
(x
i
) = P( x
i
/H
0
).
Para calcular el valor de U vamos a hacer una tabla con una primera columna con los valores que toma la
variable en la muestra ordenados de menor a mayor, una segunda con los valores de F
n
(x
i
), la tercera con los de
F
n
(x
i
), luego los de F
0
(x
i
) y nalmente dos columnas con las diferencias |F
n
(x
i
) F
0
(x
i
)| y |F
n
(x
i
) F
0
(x
i
)|:
x
i
F
n
(x
i
) F
n
(x
i
) F
0
(x
i
) |F
n
(x
i
) F
0
(x
i
)| |F
n
(x
i
) F
0
(x
i
)|
1 0
1 0 0
095 0
005 0
095
2 0
2 0
1 0
181 0
019 0
081
4 0
3 0
2 0
330 0
030 0130
5 0
4 0
3 0
393 0
007 0
093
6 0
5 0
4 0
451 0
049 0
051
8 0
6 0
5 0
551 0
049 0
051
11 0
7 0
6 0
667 0
033 0
067
15 0
8 0
7 0
777 0
023 0
077
17 0
9 0
8 0
817 0
083 0
017
23 1 0
9 0
900 0
100 0
000
donde F
n
(x
i
) y F
n
(x
i
) han sido calculados seg un la formula explicada al principio del ejercicio y F
0
(x
i
) ha sido
calculado teniendo en cuenta que
F
0
(x) = P( x/H
0
) = P( x/ exp(1/10)) =
1
10
e
t/10
dt =
_
1 e
x/10
si x > 0
0 si x 0
por lo que, por ejemplo, F
0
(1) = 1 e
1/10
= 0
095, F
0
(2) = 1 e
2/10
= 0
181, etc.
Con todo esto ya estamos en condiciones de calcular el valor del estadstico U para nuestra muestra:
U = max
i=1,2,...,n
{|F
n
(x
i
) F
0
(x
i
)|, |F
n
(x
i
-) F
0
(x
i
)|} = 0
130
y puesto que la region crtica para este contraste es de la forma {(x
1
, x
2
, . . . , x
n
)/U > c}, entonces el nivel
crtico que es:
P(U > 0
130) > P(U > 0
323) = 0
2 0
05,
con lo cual llegamos a que no se rechaza H
0
, es decir, los datos de la muestra no aportan ninguna evidencia en
contra de la suposicion de procedencia de una distribucion exponencial de media 10.
Ejercicio 9.22 a) El p-valor o nivel crtico para el contraste H
0
:
1

2
1
:
2
> 0 es
p valor = P
_
_
N(0, 1) >
(x
50
y
50
) (
1
2
)
2
1
n
+

2
2
m
_
H
0
_
_
= P
_
_
N(0, 1) >
3
1 0
25
50
+
25
50
_
H
0
_
_
= P (N(0, 1) > 3
1) = 0
001.
b) Puesto que el p-valor es 0
001 < 0
05 = , se rechaza la hipotesis nula, es decir, se concluye que el tiempo

medio empleado por la maquina 1 es mayor que el empleado por la 2.
c) Considerando la funcion pivotal
T
=
(
n
m
) (
1
2
)
2
1
n
+

2
2
m
N(0, 1)
y que P(1
96 < N(0, 1) < 1
96) = 0
95, se tiene que

0
95 = P
_
_
1
96 <
(
n
m
) (
1
2
)
2
1
n
+

2
2
m
< 1
96
_
_
= P
_
(
n
m
) 1
96
2
1
n
+

2
2
m
<
1
2
< (
n
m
) + 1
96
2
1
n
+

2
2
m
_
,
con lo cual un intervalo de conanza, al 0
95, para la diferencia de medias es

_
(x
n
y
m
) 1
96
2
1
n
+

2
2
m
_
=
_
3
1 1
96
25
50
+
25
50
_
= (1
14, 5
06).
Ejercicio 9.23 a) Puesto que el tama no muestral n = 49 30, podemos aplicar el Teorema Central del
Lmite y, en consecuencia, considerar la funcion pivotal
T
=

n
n
N(0, 1).
Puesto que ademas P(1
645 < N(0, 1) < 1
645) = 0
90, se tiene que

0
90 = P
_
1
645 <

n
n
< 1
645
_
= P
_
n
1
645

n
< <
n
+ 1
645

n
_
,
con lo cual un intervalo de conanza, al 0
90, para la media es

_
x
n
1
645

n
_
=
_
k 1
645
49
_
= (k 0
235, k + 0
235).
b) El nivel crtico asociado a este contraste es
P
_
n
>
x
n
n
/H
0
_
P
_
N(0, 1) >
k k
1/
49
_
= P(N(0, 1) > 0) = 0
5.
Ejercicio 9.24 a) Tenemos una muestra de tama no n = 8 de una variable aleatoria =desgaste de echa
con distribucion N(, 1
25), para la que se ha obtenido x = 3
72, y queremos realizar el contraste

H
0
: = 3
50
H
1
: > 3
50
05.
Puesto que la forma de la region crtica para dicho contraste es S
1
= {(x
1
, x
2
, . . . , x
8
)|
x3
5
1
25/
8
> k}, el
p-valor asociado es:
p valor = P
_

/
n
>
3
72 3
5
1
25/
8
_
= P(N(0, 1) > 0
50) = 0
31 >> 0
05,
considerablemente mayor que = 0
05, con lo que no se rechaza la hipotesis nula, es decir, los datos no

aportan evidencias en contra de la hipotesis de que el desgaste de echa medio sea de 3
50.
b) Puesto que P(N(0, 1) > k) = 0
05 k = 1
645, la region crtica asociada a este contraste al nivel = 0
05
es S
1
= {(x
1
, x
2
, . . . , x
8
)|
x3
5
1
25/
8
> 1
645}. Teniendo en cuenta que la potencia en un punto

1
se dene
como (
1
) = P((
1
, . . . ,
n
) S
1
/ =
1
), se tiene que
(4) = P
_
3
5
1
25/
8
> 1
645/ = 4
_
= P
_
4
1
25/
8
> 1
645
0
5
1
25/
8
/ = 4
_
= P(N(0, 1) > 0
51) = 0
305.
Ejercicio 9.25 a) Si denotamos por la v.a. tiempo de vida de un transistor, nos dicen que contrastemos si
es una gamma de media 1 y varianza 1/2. Puesto que si (p, a), se tiene que E() = p/a y V ar() = p/a
2
,
planteando el sistema p/a = 1, p/a
2
= 1/2, se obtiene que p = 2 = a. Tenemos pues que hacer el contraste
H
0
: (2, 2)
H
1
: / (2, 2)
Puesto que es un contraste de bondad de ajuste, el p-valor para este contraste es de la forma P(U >
U(x
1
, . . . , x
n
)/H
0
). Como los datos vienen agrupados en clases, U es el estadstico chi-cuadrado, es decir,
U(x
1
, x
2
, . . . , x
n
) =
_
1
100
3
i=1
n
2
i
p
i
_
100
que sigue una distribucion
2
310

2
2
.
Lo unico que nos queda para calcular U(x
1
, . . . , x
n
) es conocer los valores de
p
1
= P(0 < < 1) =
1
0
4xe
2x
dx = 0
594,
p
2
= P(1 < < 2) =
2
1
4xe
2x
dx = 0
314,
p
3
= 1 p
1
p
2
= 0
092.
En consecuencia
U(x
1
, . . . , x
n
) =
1
100
_
60
2
0
594
+
30
2
0
314
+
10
2
0
092
_
100 = 0
150,
por lo que
p valor = P(U(
1
, . . . ,
n
) > U(x
1
, . . . , x
n
)/H
0
) = P(
2
2
> 0
150) > 0
05
y, por lo tanto, no se rechaza la hipotesis nula de que la distribucion es (2, 2), es decir, a este nivel 0
05,
los datos concuerdan con la informacion que proporciona el distribuidor.
b) La probabilidad pedida es
P
_
10
i=1
i
> 6
1
_
.
Teniendo en cuenta que seg un lo visto en el apartado anterior (2, 2) y aplicando la reproductividad
de la gamma, se tiene que
10
i=1
i
(20, 2), con lo que 4
10
i=1
i
(20, 1/2)
2
40
. As pues, la
probabilidad pedida es
P
_
10
i=1
i
> 6
1
_
= P
_
4
10
i=1
i
> 24
4
_
= P(
2
40
> 24
4) = 1 P(
2
40
24
4) = 1 0
025 = 0
975.
Ejercicio 9.26 a) El contraste que nos piden es H
0
:
2
1
:
2
> 8, con lo que el
p-valor asociado es
P valor = P(
2
19
>
20 14
48
8
) = P(
2
19
> 36
2) = 0
01.
Como dicho p-valor es menor que el nivel de signicacion prejado (p valor = 0
01 < 0
05 = ), se
rechaza la hipotesis nula, es decir, los datos de la muestra aportan evidencias sucientes para sugerir que el
fabricante tiene un problema con el llenado de las botellas.
b) Puesto que la distribucion es normal,
nS
2
2

2
19
, tal como hemos usado en el apartado anterior. Por otro
lado, dos valores a y b que veriquen P(a <
2
19
< b) = 0
99 son a = 6
84 y b = 38
6, suponiendo que
P(
2
19
< a) = 0
005 y P(
2
19
< b) = 0
995.
As pues,
0
99 = P
_
6
84 <
nS
2
2
< 38
6
_
= P
_
nS
2
38
6
<
2
<
nS
2
6
84
_
= P
_
nS
2
38
6
< <
nS
2
6
84
_
,
con lo que, un intervalo de conanza para al 0
99 es
_
2014
48
38
6
,
2014
48
6
84
_
= (2
74, 6
51).
Ejercicio 9.27 a) Tenemos una m.a.s (
1
, . . . ,
100
) de variables aleatorias con
E(
i
) =
p
p + 1
y V ar(
i
) =
p
(p + 1)2(p + 2)
.
Ademas sabemos que la media de la muestra es x
100
= 0
25.
Como se trata de un contraste para la media con un tama no n = 100 30 podemos aplicar el T.C.L. y
tenemos que
n
=
100
p
p+1
p
(p+1)2(p+2)
/10
N(0, 1),
con lo que el p-valor asociado a este contraste es
P valor = 2 mn
_
_
_
P
_
_
N(0, 1) <
x
100
p
p+1
p
(p+1)2(p+2)
/10
/H
0
_
_
, P
_
_
N(0, 1) >
x
100
p
p+1
p
(p+1)2(p+2)
/10
/H
0
_
_
_
_
_
.
Ahora bien, si suponemos que H
0
es cierta, entonces suponemos que = 2/3 o, lo que es lo mismo, que
p
p+1
= 2/3, lo que es equivalente a suponer que p = 2. As pues, supuesta cierta H
0
el valor de la varianza
es conocido, puesto que V ar(
i
) =
p
(p+1)2(p+2)
=
2
24
= 1/12. De todo lo anterior se deduce que
P valor = 2 mn
_
P
_
N(0, 1) <
0
25 2/3
1/12/10
_
, P
_
N(0, 1) >
0
25 2/3
1/12/10
__
= 2 mn {P (N(0, 1) < 14
43) , P (N(0, 1) > 14
43)} = 2 mn{0
000, 1
000} = 0
000.
Como p valor = 0
000 < 0
05 = , se rechaza la hipotesis nula, es decir, la muestra aporta evidencias en

contra de suponer que la media poblacional es 2/3.
b) El p-valor ya lo hemos calculado en el apartado anterior y es 0
000.
Ejercicio 9.28 Los datos que nos proporciona el enunciado son que se ha considerado una muestra de tama no
n = 100 y se ha obtenido una proporcion de defectuosos en ella de p = 0
03.
a) El contraste pedido es:
H
0
: p 0
04
H
1
: p < 0
04
Como se verican las condiciones necesarias (n = 100 30), el p-valor asociado a este contraste es:
P valor = P
_
N(0, 1) <
p p
p(1 p)/n
/H
0
_
= P
_
N(0, 1) <
0
03 0
04
04(1 0
04)/100
_
= P(N(0, 1) < 0
51) = 0
305.
Como dicho p-valor es mayor que = 0
05, no se rechaza la hipotesis nula H

0
, es decir, no hay evidencias
que demuestren que el porcentaje de defectuosas es menor del 4 %.
b) Puesto que la funcion pivotal apropiada para obtener dicho intervalo es
T =
p p
p(1p)
n
N(0, 1)
y los puntos a y b tales que P(a < N(0, 1) < b) = 0
9 son a = 1
645 y b = 1
645, se tiene que

0
9 = P
_
_
1
645 <
p p
p(1p)
n
< 1
645
_
_
= P
_
p 1
645
p(1 p)
n
< p < p + 1
645
p(1 p)
n
_
P
_
p 1
645
p(1 p)
n
< p < p + 1
645
p(1 p)
n
_
.
Como en nuestro caso particular p = 0
03 y n = 100, sustituyendo dichos valores se obtiene el intervalo

_
0
03 1
645
(0
03)(1 0
03)
100
_
= (0
002, 0
058).
Ejercicio 9.29 a) El contraste adecuado para responder a esta pregunta es
H
0
: P(0
6)
H
1
: P(0
6)
donde representa la v.a. n
o
de personas que usan el ordenador en 1 hora. Puesto que se trata de un
contraste de bondad de ajuste, el p-valor asociado se calcula como
p valor = P(U > U(x
1
, . . . , x
n
)/H
0
)
y puesto que es un test Chi-cuadrado, la variable U es
U =
_
1
n
k
i=1
n
2
i
p
i
_
n
H
0
2
k1r
.
Como en este caso hay 3 clases en la muestra (k = 3) y ning un parametro desconocido en H
0
(r = 0), la
distribucion de U bajo H
0
es una
2
2
. Por otro lado, como
p
1
= P( = 0) = e
0
6
(0
6)
0
0!
= 0
55
p
2
= P( = 1) = e
0
6
(0
6)
1
1!
= 0
33
p
3
= P( > 1) = 1 P( = 0) P( = 1) = 1 p
1
p
2
= 0
12
el valor de U(x
1
, . . . , x
n
) para esta muestra es:
U(x
1
, . . . , x
n
) =
1
60
_
30
2
0
55
+
20
2
0
33
+
10
2
0
12
_
60 = 1
36
y, por lo tanto, el p-valor asociado a este contraste es
p valor = P(
2
2
> 1
36) = 0
507 > 0
5 0
05,
con lo que no se rechaza la hipotesis nula H
0
, es decir, es admisible suponer que la distribucion de es
Poisson P(0
6).
b) Si denotamos por la v.a. n
o
de personas que usan la sala en 1 hora, se tiene que =
10
i=1
i
, donde
i
representa la v.a. n
o
de personas que usan el ordenador i en 1 hora. Seg un lo visto en el apartado anterior
y lo que nos dice el enunciado sobre que todos los ordenadores siguen la misma distribucion en cuanto a su
uso, se tiene que
i
P(0
6). Como la Poisson es una distribucion reproductiva y se supone independencia,

=
10
i=1
i
P(10 0
6) P(6). As pues, la probabilidad pedida es:

P( > 1) = 1 P( 1) = 1 (P( = 0) +P( = 1)) = 1
_
e
6
6
0
0!
+e
6
6
1
1!
_
= 1 7e
6
0
983.
c) Nos piden que calculemos la probabilidad de que entre alguna persona en la primera hora, es decir,
P( 1) = 1 P( = 0) = 1 e
6
6
0
0!
= 1 e
6
0
998.
Ejercicio 9.30 Los datos que tenemos son que para una v.a. N(, ) se ha obtenido una m.a.s. de tama no
n = 10 con media muestral x
10
= 0
2573 y varianza muestral s

2
= 0
01.
a) A partir de dichos datos, el p-valor asociado al contraste H
0
: = 0

1
: = 0
253
es:
p valor = 2 mn{P (t
9
< 0
129) , P (t
9
> 0
129)} = 2 mn{0
55, 0
45} = 0
9
donde hemos tenido en cuenta que, supuesto cierto H
0
,
x
10
0
s/
n 1
=
0
2573 0
253
0
01/3
= 0
129
.
As pues, como el p-valor (0
9) es mayor que el nivel de signicacion prejado ( = 0
05), no se rechaza la
hipotesis nula, es decir, no hay evidencias en contra de suponer que la media es de 0
253.
b) Como hemos visto en el apartado anterior, el p-valor o nivel crtico asociado a este contraste es 0
9.
c) Puesto que la hipotesis nula no se rechaza si p valor 0
05, se tiene que

0
05 p valor = 2 mn
_
P
_
t
9
<
x
10
0
253
s/3
_
, P
_
t
9
>
x
10
0
253
s/3
__
,
lo que es equivalente a decir que
0
025 mn
_
P
_
t
9
<
x
10
0
253
s/3
_
, P
_
t
9
>
x
10
0
253
s/3
__
,
que a su vez es equivalente a
P
_
t
9
<
x
10
0
253
s/3
_
0
025 y P
_
t
9
>
x
10
0
253
s/3
_
0
025.
Esto implica que
x
10
0
253
s/3
2
26 y
x
10
0
253
s/3
2
26,
es decir,
x
10
0
253
s/3
26.
As pues, puesto que esta es la region en la que no se rechaza la hipotesis nula, la region crtica sera:
S
1
=
_
(x
1
, x
2
, . . . , x
10
)/
x
10
0
253
s/3
> 2
26
_
y, por tanto, la potencia en = 0
21 es:
(0
21) = P(S
1
/ = 0
21) = P
_
x
10
0
253
s/3
> 2
26/ = 0
21
_
=
P
_
x
10
0
253
s/3
> 2
26/ = 0
21
_
+P
_
x
10
0
253
s/3
< 2
26/ = 0
21
_
=
P
_
x
10
0
21
s/3
> 2
26 +
0
043
s/3
/ = 0
21
_
+P
_
x
10
0
21
s/3
< 2
26 +
0
043
s/3
/ = 0
21
_
=
P(t
9
> 3
44) +P(t
9
< 0
97).
Si utilizamos la calculadora obtenemos que dicha probabilidad es 0
003 + 0
179 = 0
182, si utilizamos las

tablas obtenemos que dicha probabilidad es menor de 0
005 + 0
2 = 0
205.
Ejercicio 9.31 Si denotamos por la v.a. concentracion de PCB se sabe que dicha variable sigue una
distribucion normal de parametros desconocidos, es decir, N(, ). Ademas para dicha variable se tiene
una m.a.s. de tama no n = 61 para la que x
61
= 3
1 y s = 0
6. Con estos datos podremos responder a ambos

apartados.
a) Al suponer normalidad y ser la varianza desconocida, la funcion pivotal para obtener un intervalo de
conanza de la media sera:
T
=

n
S/
n
t
n1
t
60
.
Ahora bien, puesto que P(t
60
< 2) = 0
975, se tiene que P(2 < t

60
< 2) = 0
95, con lo que

0
95 = P
_
2 <

n
S/
n
< 2
_
= P
_
n
2
n
< <
n
+ 2
n
_
y, por tanto, el intervalo de conanza de al 0
95 es
_
n
2
n
_
=
_
3
1 2
0
61
_
= (2
95, 3
25).
b) El proceso se detienen si hay garantas de que > 3. Para responder a esta pregunta, vamos pues a plantear
el siguiente contraste de hipotesis:
H
0
: 3
H
1
: > 3
El p-valor o nivel crtico para este contraste viene dado por
p valor = P (T
> T
(x
1
, . . . , x
n
)/H
0
) = P
_
t
60
>
3
1 3
0
6/
61
_
= P(t
60
> 1
30) = 0
1 0
01.
Como el p-valor (0
1) es mayor del nivel de signicacion (0
01), no se puede rechazar H

0
a ese nivel, es decir,
no hay evidencias sucientes como para detener el proceso de produccion.
OTESIS.
PREGUNTAS DE TEST.
Examenes.
1. (19-06-03) De dos poblaciones normales con varianzas
2
1
y
2
2
, respectivamente, se toman sendas muestras
independientes de tama nos n = 16 y m = 25, que permiten calcular las siguientes cuasivarianzas muestrales
s
2
1
= 0
298 y s
2
2
= 0
364. Con estos datos, si se realiza el contraste H

0
:
2
1
=
2
2
frente a H
1
:
2
1
=
2
2
, al nivel
de signicacion 0
1 se obtiene que:
a) No podemos obtener ninguna conclusion;
c) No se rechaza H
0
;
e) Todo falso.
b) Se rechaza H
0
;
d) No se rechaza H
0
, pero al nivel 0
05 si se rechaza;
2. (19-06-03) Se lanza un dado 180 veces, obteniendose: 20 veces la cara 1, 40 veces la cara 2, 22 veces la
cara 3, 38 veces la cara 4, 27 veces la cara 5 y 33 veces la cara 6. El nivel crtico para contrastar si el dado
esta equilibrado es:
a) 0005; b) 0995; c) Menor de 0005; d) Mayor de 0995; e) Todo falso.
3. (19-06-03) Con los datos de la pregunta anterior, la hipotesis El dado esta equilibrado, se rechaza al
nivel,
a) 005; b) 001; c) 01; d) 0001; e) Todo falso.
4. (09-09-03) Se desea contrastar la hipotesis de que la media de una poblacion de varianza 100 es cero,
frente a la alternativa = 0. Para ello se dispone de una m.a.s. de tama no 100. Una region crtica al nivel 0
1
es S
1
= {(x
1
, x
2
, . . . , x
100
)/x
100
/ A}, siendo A aproximadamente:
a) (1
645, ); b) (1
645, 1
645); c) (1
96, 1
96); d) (1
96, ); e) Todo falso.

2
1
y
2
2
s
2
1
= 16
6 y s
2
2
= 10. Con estos datos, si se realiza el contraste H
0
:
2
1

2
2
frente a H
1
:
2
1
>
2
2
, se obtiene
que:
a) Se rechaza H
0
al nivel = 0
05;
c) El nivel crtico o p-valor es menor de 0
05;
e) Todo falso.
b) Se rechaza H
0
al nivel = 0
01;
d) El nivel crtico o p-valor es menor de 0
01;
6. (09-09-03) Consideremos un contraste del tipo H
0
: =
0
1
: =
1
(hipotesis
nula y alternativa simples). En este caso la suma de la probabilidad de error de tipo II y la potencia es:
a) Siempre uno;
d) Siempre mayor que cero;
b) Siempre menor que uno;
e) Todo falso.
c) A veces menor que uno;
7. (17-02-04) La duraciones de dos tipos de circuitos integrados se suponen normales con medias
1
y
2
,
respectivamente y VARIANZAS IGUALES. Se toman sendas muestras independientes de tama nos n = 12
y m = 11, que permiten calcular las siguientes medias muestrales x
12
= 1400 horas y y
11
= 1500 horas y las
correspondientes varianzas muestrales s
2
1
= 900 y s
2
2
= 289. Con estas informaciones realizamos el contraste
H
0
:
1
=
2
frente a H
1
:
1
=
2
y al nivel de signicacion 01:
c) No se rechaza H
0
;
e) Todo falso.
b) Se rechaza H
0
;
d) A ese nivel no se rechaza H
0
pero al nivel 005 s;
8. (17-02-04) Las duraciones de 5 memorias electronicas seleccionadas al azar son: 25, 17, 23, 28 y 29. El
nivel crtico para contrastar si la distribucion de la poblacion es exponencial de media 2 (parametro 1/2) es:
a) Menor de 005; b) 0995; c) Menor de 0005; d) Mayor de 0995; e) Todo falso.
9. (21-06-04) La probabilidad de error de tipo I es la probabilidad de que:
a) H
0
sea falsa;
c) Se rechace H
0
cuando esta sea cierta;
e) Todo falso.
b) Sea falsa H
0
y esta se rechace;
d) Sea falsa H
1
y esta se rechace;
10. (21-06-04) Durante 49 das, se ha observado la variable n umero diario de averas en una factora,
anotandose la siguiente tabla de frecuencias:
N
o
de averas 0 1 2 >2
Frecuencias (n
o
de das) 16 23 10 0
Si con los datos anteriores se contrasta la hipotesis de que la distribucion de la variable es de Poisson, esta se
rechaza al nivel:
a) 005; b) 001; c) 02; d) 0001; e) Todo falso.
11. (09-09-04) La probabilidad de error de tipo II es la probabilidad de que:
a) H
0
sea falsa;
c) Se rechace H
0
e) Todo falso.
b) Sea falsa H
0
y esta se rechace;
d) Sea falsa H
1
y esta se rechace;
12. (09-09-04) Las duraciones de 5 memorias electronicas seleccionadas al azar son: 137, 162, 354, 070 y
265. La hipotesis los datos proceden de una poblacion normal, se rechaza al nivel:
a) 005; b) 002; c) 001; d) 0001; e) Todo falso.
13. (06-07-05) Se observa el da laborable de la semana en que se produce una determinada avera, en-
contrandose que de 180 veces que ocurrio, en 20 ocasiones la avera fue en lunes, 40 veces en martes, 22 veces
en miercoles, 38 veces en jueves, 27 veces en viernes y 33 veces en sabado. El nivel crtico para contrastar si
todos los das son igualmente probables para producirse la avera es:
14. (06-07-05) Con los datos de la cuestion anterior, la hipotesis Todos los das son equiprobables, se
rechaza al nivel:
a) 005; b) 001; c) 01; d) 0001; e) Todo falso.
2
1
y
2
2
s
2
1
= 0
298 y s
2
2
= 0
364. Con estas informaciones, para el contraste H

0
:
2
1

2
2
frente a H
1
:
2
1
>
2
2
, al nivel
de signicacion 0
1:
c) No se rechaza H
0
;
e) Todo falso.
b) Se rechaza H
0
;
d) No se rechaza H
0
, pero al nivel 0
05 s se rechaza;
16. (06-07-05) Con los mismos datos que en la cuestion anterior, para el contraste H
0
:
2
1
=
2
2
frente a
H
1
:
2
1
=
2
2
, al nivel de signicacion 0
1:
c) No se rechaza H
0
;
e) Todo falso.
b) Se rechaza H
0
;
d) No se rechaza H
0
, pero al nivel 0
05 s se rechaza;
Las dos preguntas siguientes hacen referencia al siguiente enunciado: Para una muestra de tama no 21 de una
poblacion normal, se ha obtenido una media muestral x
21
2
= 20.
17. (07-09-05) Un intervalo de conanza para la media al nivel 0
99 es (aproximadamente):
a) (-14533;-9032); b) (2302;2697); c) (12332;12333); d) (2215;2785); e) Todo falso.
18. (07-09-05) Al contrastar la hipotesis nula de que la media poblacional es 20 contra la alternativa de que
es distinta de 20:
a) H
0
se rechaza al nivel 005;
d) El p-valor es mayor de 005;
b) H
0
no se rechaza al nivel 005;
e) Todo falso.
c) El p-valor es menor de 005;
19. (07-09-05) Si es la probabilidad de error tipo I y es la probabilidad de error tipo II en un contraste
de hipotesis, entonces:
a) La potencia del test es 1 ;
d) + 1;
b) + = 1;
e) Todo falso.
c) 1;
20. (07-09-05) Sean (
1
,
2
, . . . ,
16
) una m.a.s. de una poblacion N(
1
,
1
) y (
1
,
2
, . . . ,
16
) otra m.a.s.
independiente de la anterior de una poblacion N(
2
,
2
). Si denotamos por S
2
1
y S
2
2
las varianzas muestrales
respectivas y la region crtica para contrastar H
0
:
2
1

2
2
frente a H
1
:
2
1
>
2
2
es S
1
= {S
2
1
/S
2
2
> 2}, entonces
el nivel de signicacion es:
a) 005; b) Mayor de 01; c) Menor de 01; d) 095; e) Todo falso.
21. (13-02-06) Se tienen dos muestras independientes, de tama nos n = 16 y m = 25, de dos poblaciones
normales de varianzas
2
1
y
2
2
. Si las cuasivarianzas muestrales respectivas son s
2
1
= 0
298 y s
2
2
= 0
364, para el
contraste H
0
:
2
1
=
2
2
frente a H
1
:
2
1
=
2
2
1, se tiene que:
b) Se rechaza H
0
;
c) No se rechaza H
0
;
0
, pero al nivel 005 s;
e) Todo falso.
22. (30-06-06) La probabilidad de error de tipo I es la probabilidad de que:
a) La hipotesis nula sea falsa;
b) Sea falsa la hipotesis nula y esta se rechaza;
c) Se rechace la hipotesis alternativa cuando esta sea cierta;
d) Sea falsa la hipotesis alternativa y esta se rechaza;
e) Todo falso.
23. (30-06-06) En una muestra de 200 paquetes hay 11 defectuosos. Se contrasta H
0
: p 0
1 frente a
H
1
: p < 0
1. Con estos datos el nivel crtico es aproximadamente:

a) 095; b) 0983; c) 0017; d) 005; e) Todo falso.
24. (30-06-06) Con los mismos datos de la cuestion anterior, si el contraste fuera: H
0
: p 0
1 frente a
H
1
: p > 0
1, el nivel crtico es aproximadamente:

a) 095; b) 0983; c) 0017; d) 005; e) Todo falso.
25. (07-09-06) El nivel crtico de un contraste:
a) Se ja por el investigador;
c) Cuanto mayor es, mayor es la conanza en H
0
;
e) Todo falso.
b) Viene dado por los resultados de la muestra;
d) Siempre tiene que ser mayor que = P(e
I
);
26. (16-02-07) La distribucion del volumen de llenado (en gr.) de unas botellas de detergente lquido es
aproximadamente normal. Para dicho proceso, se toma una muestra aleatoria de 20 botellas y se obtiene que
la varianza muestral es s
2
= 12gr
2
. De acuerdo con estos datos, si se contrasta la hipotesis nula H
0
: 2 (el
proceso esta estable) frente a la alternativa H
1
: > 2 (hay que revisar el proceso), se rechazara H
0
al nivel de
signicacion:
a) = 0
05; b) = 0
01; c) = 0
1; d) = 0
2; e) Todo falso.
27. (16-02-07) Se desea contrastar la hipotesis de que una variable aleatoria sigue una distribucion expo-
nencial de media 1. Con ayuda de una m.a.s. de tama no 225 se calcula la funcion de distribucion emprica (o
muestral) y al compararla con los valores correspondientes a los de la funcion de distribucion de una exponencial
de media 1, se encuentra que la maxima discrepancia es 010. Entonces, rechazaremos que los datos proceden
de una exponencial de media 1 al nivel de signicacion igual a:
a) 015; b) 01; c) 005; d) 002; e) Todo falso.
28. (22-06-07) Para contrastar si la media de una poblacion normal es mayor de 25, es decir, para realizar el
contraste H
0
: 25 frente a H
1
: > 25, se toma una muestra de tama no 121 y se obtiene una cuasivarianza
muestral s
2
= 144 y una media muestral x
121
= 27. Al nivel = 0
10:
a) Se rechaza H
0
;
c) No se puede saber;
e) Todo falso.
b) No se rechaza H
0
;
d) A ese nivel se rechaza H
0
, pero al nivel 0
9 no;
29. (22-06-07) Para contrastar la hipotesis nula de que la proporcion de artculos defectuosos que produce
una fabrica es del 10 %, es decir, H
0
: P(defectuoso) = 0
1, se observan 5 de esos artculos. Se decide rechazar

H
0
si se observa al menos uno defectuoso. El nivel de signicacion del contraste es:
a) 005; b) 040951; c) 003125; d) 059049; e) 09875.
30. (22-06-07) En el contraste anterior, el valor de la funcion potencia en p = 0
6, donde p denota P(defectuoso),

es:
a) 005; b) 003125; c) 098976; d) 05; e) 1875.
31. (07-09-07) A partir de una muestra aleatoria de tama no n = 30 se pretende contrastar si la distribucion es
normal N(5, 3), obteniendose que la maxima discrepancia entre la funcion de distribucion emprica y la funcion
178, es decir, D
30
= sup
xIR
|F
n
(x) F
N(5,3)
(x)| = 0
178, donde F
N(5,3)
representa la funcion de distribucion de una normal N(5, 3). Con estos datos se rechaza la hipotesis de que la
distribucion de la variable es N(5, 3) al nivel de signicacion:
a) 005; b) 001; c) 01; d) 02; e) Todo falso.
32. (07-09-07) A partir de una muestra aleatoria de tama no n = 30 se pretende contrastar si la distribucion
es normal, obteniendose que la maxima discrepancia entre la funcion de distribucion emprica y la funcion
178, es decir, D
30
= sup
xIR
|F
n
(x) F
0
(x)| = 0
178, donde F
0
representa
mediante las estimaciones maximos verosmiles obtenidas a partir de los valores de la muestra. Con estos datos
se rechaza la hipotesis de que la distribucion de la variable es normal al nivel de signicacion:
a) 005; b) 001; c) 01; d) 02; e) Todo falso.
33. (18-02-08) El test chi-cuadrado de bondad de ajuste:
a) Solo se puede utilizar para distribuciones continuas. b) Solo se puede utilizar para distribuciones discretas.
c) Se puede utilizar para distribuciones discretas y continuas, aunque en el caso de continuas, el de Kolmogorov-
Smirnov puede ser mas indicado. d) Se puede utilizar para distribuciones discretas y continuas, aunque en el
caso de discretas, el de Kolmogorov-Smirnov puede ser mas indicado. e) Todo falso.
34. (26-06-08) Los benecios mensuales de dos fabricas A y B, medidos en tanto por ciento, siguen distri-
buciones N(
1
, 3) y N(
2
,
7) y se comportan de manera independiente. Se obtienen sendas muestras de los

benecios mensuales de ambas fabricas del mismo tama no n y se obtiene un benecio medio muestral del 9 % en
la primera y del 8 % en la segunda. De los siguientes tama nos muestrales, el mas peque no que permite obtener
un intervalo de conanza de
1
2
, al nivel de conanza
= 1 = 0
9876, con amplitud menor o igual que

2 es:
a) 30; b) 21; c) 102; d) 1234; e) 34.
35. (26-06-08) Bajo las hipotesis de la cuestion anterior si n = 64, el contraste H
0
:
1

2
frente a la
alternativa H
1
:
1
>
2
tiene un p-valor igual a:
a) 005; b) 0005; c) 05; d) 00005; e) Todo falso.
36. (26-06-08) En la cuestion anterior:
a) La hipotesis H
0
c) La hipotesis H
0
e) Todo falso.
b) La hipotesis H
0
d) La hipotesis H
0
37. (05-09-08) Se considera una muestra de tama no 1 de una poblacion de Poisson de parametro para
contrastar H
0
1
: = 2 y se elige como region crtica S
1
= {x|x > 3}. Entonces
se tiene aproximadamente que:
a) P(e
I
) = 0
02; b) P(e
I
) = 0
98; c) P(e
II
) = 0
86; d) P(e
II
) = 0
14; e) P(e
I
) = 2.
38. (05-09-08) A partir de una muestra aleatoria de tama no n = 20 se pretende contrastar si la distribucion
es normal N(24, 5), obteniendose que la maxima discrepancia entre la funcion de distribucion emprica y la
funcion de distribucion de la normal es 0
160, es decir, D
20
= sup
xIR
|F
n
(x) F
N(24,5)
(x)| = 0
160, donde
F
N(24,5)
representa la funcion de distribucion de una normal N(24, 5). Con estos datos se rechaza la hipotesis
de que la distribucion de la variable es N(24, 5) al nivel de signicacion:
a) 005; b) 001; c) 01; d) 02; e) Todo falso.
39. (02-07-09) Una compa na de seguros de vida sabe que la probabilidad de que un cliente contrate una
poliza de prima unica es 04, de prima ja es 025, de prima decreciente es 015 y de otro tipo es 02. Un cambio
en estas probabilidades podra se nalar la necesidad de cambiar las comisiones. Por ello, la compa na realiza un
estudio de las ultimas 1200 polizas contratadas y se vio que: 438 correspondan a prima unica, 323 a prima ja,
198 a prima decreciente y las 241 restantes a otro tipo. Entonces se puede concluir que:
a) Al nivel = 0
05, las proporciones han cambiado. b) Al nivel = 0
05, las proporciones no han cambiado.

c) Al nivel = 0
1, las proporciones han cambiado. d) Al nivel = 0

e) Todo falso.
40. (16-09-09) Un fabricante arma que la proporcion de aparatos defectuosos entre los de su produccion es
menor o igual que 0
09 (H
0
). El comprador no se fa y para comprobarlo decide tomar una muestra aleatoria de
100 aparatos. Si el n umero de defectuosos es mayor que 14 rechaza H
0
y por lo tanto no le compra al fabricante.
El nivel de signicacion () aproximado de la prueba es:
a) Mayor de 0
97; b) Menor de 0
05; c) Mayor de 0
95; d) Mayor de 0
2; e) Igual a 2
2.
41. (16-09-09) En la pregunta anterior, si la proporcion de defectuosos fuese realmente de 0
21, la potencia
de la prueba sera aproximadamente
a) Menor de 0
07; b) Menor de 0
03; c) Mayor de 0
94; d) Menor de 0
04; e) Igual a 2
2.
N
o
Solucion N
o
Solucion N
o
Solucion N
o
Solucion N
o
Solucion
1. c) 2. e) 3. a), c) 4. b) 5. e)
6. a), d) 7. b) 8. a) 9. c) 10. c)
11. e) 12. e) 13. e) 14. a), c) 15. c)
16. c) 17. d) 18. a), c) 19. c) 20. c)
21. c) 22. e) 23. c) 24. b) 25. b), c)
26. a), b), c), d) 27. a), b), c) 28. a) 29. b) 30. c)
31. e) 32. a), c), d) 33. c) 34. c) 35. e)
36. a), d) 37. a), c) 38. e) 39. b), c) 40. b)
41. c)
OTESIS.
PR

Aunque Excel tiene algunas opciones para realizar contrastes de hipotesis en la herramienta Analisis de Datos,
vamos a utilizar para hacer estas operaciones el modulo StatPlus, puesto que proporciona mas informacion y es
mas sencillo de manejar.
Las opciones del men u de StatPlus que nos permiten realizar contrastes parametricos son One Sample Tests
(Contrastes para una muestra) y Two Sample Tests (Contrastes para dos muestras). La mejor forma de explicar
su utilizacion es a traves de ejemplos.
Contrastes para una muestra.
Consideremos de nuevo el chero cuestionario.xls que contiene los datos recogidos el primer da de clase
5
.
Vamos a estudiar la variable EDAD, que suponemos sigue una distribucion normal.
Comenzamos planteandonos si la media es de 20 a nos o no. As pues, nos planteamos el contraste:
H
0
: = 20
H
1
: = 20
Para realizar este contraste, StatPlus tiene dos opciones: Sample t-test ... y Sample z-test ..., el primero si
suponemos que la varianza poblacional es desconocida y el segundo para varianza poblacional conocida.
Puesto que en nuestro caso desconocemos el valor de la varianza de la poblacion debemos elegir la opcion:
StatPlus One Sample Tests Sample t-test ...
Una vez hecho esto, se abre la ventana de la Figura 9.1.
Figura 9.1: One sample or paired t-test.
En Type dejamos la opcion seleccionada por defecto, puesto que no estamos trabajando con datos apareados.
En Input seleccionamos Use Range y dentro de las variables que aparecen, la variable EDAD, puesto que es
la que estamos interesados en estudiar.
En la zona de Analysis, especicamos nuestro contraste. Puesto que nuestras hipotesis son:
Hipotesis nula H
0
: = 20
Hipotesis alternativa H
1
: = 20
5
El chero cuestionario.xls con el que se trabaja en estos guiones (disponible en la web de la asignatura) y el chero cuestiona-
rio.xls disponible en las salas de ordenadores no coinciden. En el primero de ellos, puesto que los apuntes son elaborados antes de
comenzar las clases, se consideran las respuestas del curso 03-04. En el segundo, las respuestas son las dadas por vosotros.
rellenaremos las casillas seg un aparece en la Figura 9.2. Es importante destacar que en nuestro caso es necesario
cambiar el nivel de conanza (Condence Level) de 0,95 a 0, 95, para adaptar el programa a nuestra version de
Excel.
Figura 9.2: Type and Analysis en One sample or paired t-test.
En Output seleccionamos el lugar en el que queremos que salgan los resultados del contraste. Podemos elegir,
por ejemplo, una nueva hoja (New Worksheet) que llamaremos Edad. A continuacion pinchamos en OK y
obtenemos los resultados que aparecen en la Figura 9.3.
Figura 9.3: Hoja de calculo Edad.
Vamos a ir explicando la salida de este procedimiento. Las casillas C2 y C3 informan sobre la hipotesis nula
y alternativa, respectivamente, que estamos contrastando. En las casillas D2 y D3 aparecen los valores corres-
pondientes, que pueden ser modicados directamente sobre ellas en cualquier momento. La casilla D4 presenta
el nivel de conanza del intervalo de conanza para la media que va a realizar.
B8 presenta el tama no de la muestra, C8 la media de la muestra, D8 la cuasidesviacion tpica de la muestra.
E8 presenta un coeciente que no hemos estudiado, con lo cual no vamos a comentarlo. En F8 aparece el valor
del estadstico de contraste para nuestros datos muestrales, en G8 los grados de libertad de la distribucion t
de Student utilizada en el contraste y en H8 el nivel crtico o p-valor. Por ultimo en las casillas I8 y J8 puede
verse el extremo inferior y el extremo superior, respectivamente, del intervalo de conanza de la media con el
nivel de conanza especicado en D4.
Seg un estos datos tenemos una conanza del 95 % de que la edad media de los estudiantes de 2
o
de Industriales
esta entre 1989 y 2046, con lo que no se rechaza, a nivel de signicacion 0
05 (5 %), que la edad media sea de

20 a nos.
Esto tambien puede verse si observamos el nivel crtico del contraste. Recordemos este concepto.
El nivel crtico o p-valor es el mayor nivel de signicacion para el que NO se rechaza H
0
. Una
vez que el p-valor se ha determinado, la conclusion para cualquier nivel de signicacion resulta
de comparar el p-valor con :
p-valor < Rechazar H
0
al nivel .
p-valor NO rechazar H
0
al nivel .
Puesto que en nuestro caso el nivel crtico es 0
218, nuestra conclusion es que no se rechaza la hipotesis nula al

nivel de signicacion 0
05, es decir, no hay evidencias sucientes para decir, a este nivel, que la media sea distinta
de 20 a nos. No obstante, el nivel crtico informa a un mas, puesto que es mayor que cualquiera de los niveles de
signicacion habituales (nunca se suele considerar un nivel de signicacion mayor de 0
1 y generalmente es 0
05
o menos), podemos decir que no se rechaza la hipotesis nula a ninguno de estos niveles.
Una vez obtenidos estos resultados, podemos plantearnos otros contrastes, como por ejemplo,
Hipotesis nula H
0
: 19
7
1
: > 19
7
Hipotesis nula H
0
: 21
1
: < 21
Para hacer esto simplemente debemos insertar en la casilla D2 por el valor 197 o 21, seg un el caso y en la
casilla D3 modicar el valor 0 por 1 en el primer caso y -1 en el segundo. Los niveles crticos para cada uno de
estos dos contrastes resultan ser:
Nivel crtico o p-valor: 0001 Nivel crtico o p-valor: 0000
As pues, en ambos casos se rechaza la hipotesis nula, es decir, se puede concluir que la edad media es mayor
de 197 a nos y menor de 21 a nos.
Contrastes para dos muestras.
Si se quieren realizar los contrastes para dos muestras que hemos estudiado en teora, debemos seleccionar
StatPlus Two Sample Tests ...
Dentro de esta opcion, podemos realizar contrastes de igualdad de medias con varianzas poblacionales conocidas
(Sample z-test ...) y con varianzas poblacionales desconocidas (Sample t-test ...), tanto si se consideran
iguales como distintas.
En este caso, vamos a considerar de nuevo los datos del archivo cuestionario.xls, pero vamos a analizar la
igualdad en la edad media de los hombres y las mujeres en la carrera de ingeniera, considerando los datos
tomados en clase como muestra. Supondremos que se verican las hipotesis de normalidad e independencia para
poder aplicar los resultados estudiados en teora. As pues, podemos formular el contraste como sigue:
H
0
:
1
=
2
H
1
:
1
=
2
Puesto que no conocemos las varianzas poblacionales (varianza de la v.a que mide la edad de los hombres y de
la v.a. que mide la edad de las mujeres, respectivamente), vamos a realizar el contraste suponiendo varianzas
iguales, que es la opcion que Excel considera por defecto, y modicarla si posteriormente, a la vista de los
resultados, es necesario. Para hacer esto, al seleccionar la opcion Sample t-test ..., se abre la ventana de la
Figura 9.4.
Figura 9.4: Perform Two Sample or Unpaired t-test.
Type: En Data Values seleccionamos EDAD y en Categories seleccionamos SEXO, puesto que es la
categora que utilizaremos para hacer la comparacion.
Analysis: Consideraremos una diferencia entre medias de 0, puesto que queremos contrastar si las medias
son iguales (
1
=
2

1
2
= 0), un nivel de conanza de 0,95 (recordad que es necesario cambiar el
punto por la coma) y una hipotesis alternativa de medias distintas (Not equal to).
Variance estimate: Dejaremos la opcion de Excel por defecto, es decir, consideraremos que las varianzas
son desconocidas pero se suponen iguales (Use Pooled Variance). Una vez obtenida la hoja de resultados,
y en funcion del nivel crtico asociado al contraste de igualdad de varianza (F-test), consideraremos que
las varianzas son iguales (Use Pooled Variance) o distintas (Use Unpooled Variance).
Figura 9.5: Selecciones en Perform Two Sample or Unpaired t-test.
En Output jamos la salida en una nueva hoja de nombre Edad Sexo y con todo ellos solo nos queda pinchar
en OK en la ventana de la Figura 9.5.
Los resultados del procedimiento anterior pueden verse en la Figura 9.6.
Figura 9.6: Hoja de calculo Edad Sexo.
Las las 2, 3 y 4 son equivalentes al caso de una muestra, la unica novedad aparece en la la 5, donde puede
elegirse entre considerar varianzas poblacionales iguales (VERDADERO en D5) o distintas (FALSO en D5).
Recordando que Sexo=1 corresponde a los hombres, y Sexo=2 a las mujeres, se tiene que la lnea 10 contiene la
informacion sobre tama no muestral, media y desviacion tpica de los hombres, y la lnea 11 contiene la misma
informacion para las mujeres.
En B15 aparece la diferencia entre la media muestral para los hombres y las mujeres, en D15 el valor del
estadstico para este contraste, en E15 los grados de libertad de la distribucion t que utilizamos para obtener el
nivel crtico, F15 contiene precisamente dicho nivel crtico. Por ultimo, G15 es el extremo inferior del intervalo
de conanza al nivel de conanza que aparece en D4 para el parametro
1
2
y H15 el extremo superior de
dicho intervalo. Por otro lado, en J15 puede verse el nivel crtico asociado al contraste de igualdad de varianzas
que realizamos en clase. Las casillas K15 y L15 proporcionan los niveles crticos asociados a otros contrastes
de igualdad de varianzas que no hemos estudiado, con lo cual no las tendremos en cuenta.
Seg un los resultados obtenidos, vemos que no se rechaza la igualdad de varianzas (p-valor o nivel crtico =
0
456 0
05), con lo que el p-valor o nivel crtico para el contraste de igualdad de medias es 0
170, y por lo
tanto se puede concluir que no hay evidencias de diferencias signicativas entre la edad media de los hombres
y de las mujeres. As pues, aunque en las primeras practicas vimos que exista cierta diferencia entre la edad
media de los hombres y de las mujeres en la muestra, esta no es suciente para decir que son distintas entre los
hombres y las mujeres de la poblacion.
Igual que en el caso de una sola muestra, es posible cambiar las opciones de las lneas 2, 3, 4 y 5, para obtener
otro tipo de contrastes (suponiendo otro nivel de conanza, una hipotesis alternativas de un lado, etc).
OTESIS.
PR

El contraste
2
de Pearson.
Para realizar un contraste
2
de bondad de ajuste con el Excel es necesario haber introducido las frecuencias
observadas y las frecuencias esperadas en una hoja de calculo. Una vez hecho esto, podemos teclear directamente
en una casilla el comando
=PRUEBA.CHI(frecuencias observadas;frecuencias esperadas)
o bien ir a
Insertar Funcion Estadsticas PRUEBA.CHI
y rellenar la ventana correspondiente.
De cualquiera de las dos formas, Excel devuelve como resultado el nivel crtico o p-valor de este contraste.
Puesto que
0
. Una
1. p-valor < Rechazar H
0
al nivel .
2. p-valor NO rechazar H
0
al nivel .
a partir de este valor podemos concluir si se rechaza o no la hipotesis nula, donde
Hipotesis nula H
0
: La v.a. sigue la distribucion dada.
1
: La v.a. NO sigue la distribucion dada.
Vamos a ver el funcionamiento de este contraste a traves de un ejemplo. Consideremos los datos del Ejercicio
9.8 (pag. 355) relativos a la estacion del a no en la que se han cometido 1361 homicidios. La informacion
proporcionada era:
334 372 327 328
y nos pedan contrastar si la epoca del a no inuye en el n umero de homicidios o no (proporciones iguales en las
cuatro estaciones). As pues,
H
0
: La estacion no inuye P(Primavera)=P(Verano)=P(Oto no)=P(Invierno)=1/4
H
1
: La estacion inuye alguna de las probabilidades = 1/4
Si la hipotesis nula (H
0
) fuese cierta, entonces las frecuencias esperadas para cada una de las estaciones seran:
34025 34025 34025 34025
puesto que 334 + 372 + 327 + 328 = 1361 y
1361
4
= 340
25.
Para realizar este contraste con el Excel, abrimos el archivo pr09.xls y en la hoja Homicidios nos aparecen
las modalidades de la variable en estudio y sus frecuencias observadas.
Antes de nada realizamos un diagrama de barras para observar, desde un punto de vista graco, el comporta-
miento de la variable en la muestra. Para ello seleccionamos las celdas B1:B5 y vamos a la opcion del men u
Insertar Graco Columnas Siguiente
donde nos colocamos en la hoja Serie y pinchamos sobre el icono asociado a Rotulo del eje de categoras
(X). Con esto podemos salir a la hoja de datos y seleccionar las casillas A2:A5. Si presionamos Enter y luego
Finalizar obtenemos el correspondiente diagrama de barras.
A la vista de este graco se observa que el n umero de homicidios en Verano es superior al n umero de homicidios
en el resto de estaciones. Ahora bien, es esta diferencia suciente para concluir que la frecuencia de homicidios
es distinta de unas estaciones a otras?
Para contestar a esta pregunta, que en realidad es realizar el contraste anteriormente especicado, debemos
introducir en primer lugar las frecuencias esperadas. Para ello, en primer lugar, nos situamos en la casilla B6
y obtenemos el tama no de la muestra (n umero de homicidios en el a no) mediante el comando
=SUMA(B2:B5) .
Con esto vemos que ha habido 1361 homicidios, con lo que, si H
0
es cierta, es decir, si el comportamiento es el
mismo en todas las estaciones, se esperara que el n umero de homicidios en cualquiera de las estaciones hubiese
sido
1361
4
. As pues, nos situamos en C2 y tecleamos
=$B$6/4 .
Puesto que hemos introducido el smbolo $ delante de la la y la columna, estas coordenadas no son dinamicas,
sino estaticas, es decir, podemos arrastrar la casilla C2 hasta la casilla C5, con lo que obtenemos las frecuencias
esperadas para cada una de las estaciones.
El p-valor o nivel crtico de este contraste lo podemos obtener si nos situamos en la celda B10 y tecleamos:
=PRUEBA.CHI(B2:B5;C2:C5)
Puesto que obtenemos un p-valor de 02578, mayor o igual que cualquiera de los niveles de signicacion
habituales ( = 0
01, = 0
05 o = 0
1), con lo cual no rechazamos la hipotesis nula, es decir, no hay nada

que nos indique que el n umero de homicidios es diferente de una estacion a otra.
Evidentemente, con unos mismos datos, pueden realizarse muchos contrastes. Por ejemplo, si ahora nos hacemos
la pregunta: puede admitirse, de acuerdo con estos datos, que el n umero de homicidios en verano es el doble
que en cualquiera de las demas estaciones?, esta pregunta puede plantearse matematicamente como sigue:
H
0
: En verano el doble P(Prim)=02, P(Ver)=04, P(Oto)=02, P(Inv)=02
H
1
: Lo anterior es falso P(Prim)= 02 o P(Ver)= 04 o P(Oto)= 02 o P(Inv)= 02
Para realizar este contraste, en la columna C deberan ir las nuevas frecuencias absolutas esperadas, si la hipotesis
nula (H
0
) fuese cierta, que, evidentemente, al haber cambiado dicha hipotesis, seran distintas de las del ejemplo
anterior. As pues, en cada una de ellas lo que sigue:
C
2 =$B$6
0,2
3 =$B$6
0,4
4 =$B$6
0,2
5 =$B$6
0,2
Dadas las caractersticas de Excel, el valor del p-valor que apareca en la casilla B10 es automaticamente
actualizado para la nueva hipotesis nula. Puesto que dicho p-valor es 00000, menor que cualquiera de los
niveles de signicacion habituales ( = 0
01, = 0
05 o = 0
1), se rechaza la hipotesis nula, es decir, el

n umero de homicidios en verano no es el doble que en cualquiera de las otras estaciones.
TEMA 10.- AN
APUNTES DE TEOR
IA.
10.1. Breve introduccion al dise no de experimentos.
El Dise no de Experimentos estudia, en terminos generales, como modicar intencionadamente las condiciones
habituales de un proceso emprico para aumentar la probabilidad de detectar cambios signicativos y obtener
as un conocimiento mas profundo y riguroso del proceso.
PROCESO
Entradas Salida
Factores incontrolables
Factores controlables
x
1
x x
2 p
e
1
e e
2 p
x
Figura 10.1: Proceso.
El proceso puede representarse por medio del modelo de la Figura 10.1. Suele visualizarse el proceso como una
combinacion de maquinas, metodos, personas y otros recursos que transforman alguna entrada (a menudo un
material) en una salida que tiene una o mas respuestas observables.
Las tecnicas estadsticas del dise no experimental tienen su razon de ser en la investigacion emprica que trata
de indagar como ciertas variables, conocidas como factores, act uan sobre una variable respuesta observada tras
la realizacion del experimento.
Es importante hacer destacar que los factores que inuyen sobre el valor de la variable respuesta solo pueden
tomar un n umero nito de estados o niveles.
En cualquier experimento, los resultados y conclusiones que pueden obtenerse dependen, en gran parte, de la
forma en que los datos fueron recopilados. Para considerar este punto, supongamos que un ingeniero esta com-
parando el consumo de gasolina para dos modelos de coches diferentes, coches-A y coches-B. Supongamos que
para probar los coches-A selecciona a diez chicos menores de veinte a nos para que conduzcan diez coches de
este modelo durante una distancia determinada. Para diez coches-B elige a diez personas de mas de cuarenta
a nos que recorren la misma distancia de los anteriores. Los veinte datos resultantes consistiran en los consumos
de los coches examinados. Ahora bien, cuando se comparen los promedios de consumo de los coches A y B, el
ingeniero sera incapaz de decir cuanta de la diferencia observada se debe al modelo de coche utilizado y cuanta
depende del tipo de conduccion, que, posiblemente se podra suponer menos agresivo en cuanto al consumo
con el aumento de la edad del conductor. De esta forma, el metodo utilizado en la obtencion de los datos
ha afectado negativamente las conclusiones que pueden deducirse del experimento. En este ejemplo sera mas
adecuado hacer que cinco de los diez chicos conduzcan el modelo A y los otros cinco el modelo B e igualmente
con los conductores mayores. De esta manera se podra investigar la inuencia del modelo de coche y tambien
la inuencia de la edad en el consumo.
Los tests basicos en estos modelos se centran en contrastar si los factores realmente alteran los resultados de
los experimentos al jarlos en sus diferentes niveles. La tecnica, que consiste en descomponer la variabilidad
total en las variabilidades aportadas por los diferentes factores y sus interacciones mutuas, recibe el nombre de
analisis de la varianza (ANOVA).
Conceptos y deniciones.
Variable repuesta: Variable cuantitativa sobre la que realizamos el estudio asociada al experimento.
Factores: Condiciones que se deciden en un experimento que afectan a la variable respuesta.
Niveles de un factor: Modalidades que puede presentar un factor
Tratamientos: Condiciones bajo las cuales se realiza el experimento, son combinaciones de factores.
Unidades experimentales: Sujetos sometidos a los tratamientos sobre los que se mide la variable respuesta.
Replicas: observaciones adicionales de un mismo tratamiento.
En ejemplo del dise no ultimo, cada uno de los veinte coches es una unidad experimental, la variable respuesta
es el consumo, los factores son el modelo y el grupo de edad y cada uno tiene dos niveles, los tratamientos son
cuatro: (A, > 40); (A, < 20); (B, > 40) y (B, < 20). Cada tratamiento tiene cinco replicas.
Vamos a exponer los metodos parametricos del Analisis de la Varianza para las situaciones mas elementales y
frecuentes.
10.2. Analisis de la varianza con un factor.
En el tema anterior vimos como contrastar la igualdad de las medias de dos poblaciones normales con igual
varianza. En esta seccion nuestro objetivo sera ampliar estos procedimientos para poder contrastar la igualdad
de varias medias de poblaciones normales con la misma varianza. Supongamos que queremos estudiar el consumo
de gasolina de tres coches A, B y C. Para ello, se asignaron aleatoriamente veinte conductores siete a coches
A, siete a coches B y seis a coches C. En la tabla 10.2.1 vemos los datos obtenidos del consumo de gasolina, en
kilometros por litro.
COCHE A COCHE B COCHE C
2220 2460 2270
1990 2310 2190
2030 2200 2330
2140 2350 2410
2120 2360 2210
2100 2210 2340
2030 2350 -
Cuadro 10.2.1: Consumo de gasolina, en km. por litro.
El problema que acabamos de introducir puede ser tratado de forma muy general. Supongamos que queremos
comparar las medias de r poblaciones
1
,
2
, . . . ,
r
donde
i
N(
i
, ), con
i
y desconocidos, i = 1, 2, . . . , r.
Para cada i, sea (
i1
,
i2
, . . . ,
in
i
) una m.a.s. de la v.a.
i
, y sea n =
n
i
, el tama no total de las r muestras.
Al contraste:
H
0
:
1
=
2
= . . . =
r
H
1
:
i
=
j
para alg un i = j
se le conoce con el nombre de Analisis de la Varianza para una clasicacion simple o Analisis de la
Varianza con un factor.
En este caso el factor tiene r niveles, en el ejemplo de los coches r es tres.
En esencia, el analisis de la varianza es un contraste de igualdad de medias y no de varianzas, como su nombre
puede, equivocadamente, insinuar. Lo que sucede es que el contraste se lleva a cabo mediante una division de
la variacion total de las observaciones muestrales en componentes aditivos, y de ah su denominacion.
El modelo en que se basa el analisis supone para cada ij:
ij
=
i
+
ij
= +
i
+
ij
.
ij
= j-esima componente de la m.a.s. correspondiente a la i-esima poblacion o nivel,
= media total ( =
n
i
i
/n),
i
= efecto debido al i-esimo nivel del factor (
n
i
i
= 0),
ij
= error aleatorio. Se supone que son independientes y que
ij
N(0, ).
Con este modelo H
0
se convierte en:
H
0
:
1
=
2
= . . . =
r
= 0
es decir, los efectos especcos de los diferentes niveles del factor son nulos, y no hay inuencia de ese factor
sobre la variable respuesta.
Como dijimos antes, el contraste pasa por descomponer la variacion total:
Q =
r
i=1
n
i
j=1
(
ij
)
2
(con =
1
n
r
i=1
n
i
j=1
ij
),
en suma de dos terminos: Q = Q
1
+Q
2
, donde:
Q
1
=
r
i=1
n
i
(
i
)
2
suma de cuadrados entre niveles
Q
2
=
r
i=1
n
i
j=1
(
ij

i
)
2
suma de cuadrados dentro de los niveles
(con
i
=
1
n
i
n
i
j=1
ij
y =
1
n
r
i=1
n
i
i
)
Se verica que Q
2
/
2
2
nr
y, si H
0
es cierta, Q
1
/
2
2
r1
y Q
1
y Q
2
son independientes.
Si se dene el estadstico:
V =
Q
1
/(r 1)
Q
2
/(n r)
=
[Q
1
/
2
]/(r 1)
[Q
2
/
2
]/(n r)
,
por la independencia de Q
1
y Q
2
bajo H
0
, se deduce V F
(r1)
(n r).
Puede comprobarse que E(Q
1
) = (r 1)
2
+
n
i
2
i
y que E(Q
2
) = (n r)
2
.
Por lo tanto, si H
0
es cierta, el numerador y el denominador de V son dos estimadores insesgados de la varianza
poblacional com un, luego sera razonable esperar que el numerador y denominador anteriores esten cercanos
uno del otro. A mayor discrepancia de ambos, mayor sera nuestra sospecha de que la hipotesis nula no es cierta.
En consecuencia, si V es muy grande se rechaza H
0
, mientras que en caso contrario no se rechaza. Es decir, la
region crtica al nivel viene dada por:
S
1
= {V > f
}, siendo f
/P(F
(r1)
(nr)
> f
) = .
a
1-a
f
Los resultados del analisis de la varianza, habitualmente se resumen en una tabla como la siguiente, denominada
tabla de analisis de la varianza (Tabla ADEVA o Tabla ANOVA).
Fuente de
Variacion
Suma de
Cuadrados
G.L.
Cuadrado
medio
Razon
Nivel
crtico
Entre niveles Q
1
=
r
i=1
n
i
(x
i
x)
2
r 1
Q
1
r1
V =
Q
1
/r1
Q
2
/nr
P(F
r1
nr
> V )
Error (dentro
de los niveles)
Q
2
=
r
i=1
n
i
j=1
(x
ij
x
i
)
2
n r
Q
2
nr
Total Q =
r
i=1
n
j
j=1
(x
ij
x)
2
n 1
Si recuperamos el ejemplo del consumo de los coches, la tabla ANOVA correspondiente es:
ANOVA PARA EL CONSUMO
Fuente de
Variacion
Suma de
Cuadrados
G.L.
Cuadrado
medio
Razon
Nivel
crtico
Inter-grupos 21670 2 10835 15038 0000
Intra-grupos 12248 17 0720
Total 33918 19
Como el nivel crtico es cero, rechazamos la hipotesis de no inuencia del nivel (tipo de coche), sobre el consumo.
Es decir, el consumo medio no es el mismo para los tres modelos. Podemos tener mas informacion si observamos
el resumen descriptivo de los resultados:
ESTAD
ISTICA DESCRIPTIVA DEL CONSUMO

n Media
Desviacion
tpica
Error
tpico
I.de C. 95 Mnimo Maximo
Lmite inferior Lmite superior
A 7 209000 .79162 .29921 201679 216321 1990 2220
B 7 232000 .90921 .34365 223591 240409 2200 2460
C 6 229167 .84004 .34294 220351 237982 2190 2410
Total 20 223100 133610 .29876 216847 229353 1990 2460
Y sobre todo, la representacion graca de los intervalos de conanza de las medias de las tres poblaciones, no
deja lugar a duda de lo que ocurre.
A B C
2.5
2.4
2.3
2.2
2.1
2.0
1.9
Coche
Figura 10.2: Intervalos de conanza al 95 % para el consumo medio de los coches A, B y C.
A la vista de la Figura 10.2, parece que el consumo medio del modelo A es superior
6
al consumo de los otros
dos modelos. Lo que se conrma si se realizan tests de comparaciones m ultiples.
10.3. Analisis de la varianza de dos factores sin interaccion.
Si en el ejemplo anterior sospechamos que parte de la variacion aleatoria puede ser debida a diferencias en los
habitos de los conductores, si pudieramos aislar este factor, la variabilidad aleatoria se podra reducir. Esto hara
mas facil detectar diferencias en el comportamiento de los coches. En otras palabras, dise nando un experimento
que tenga en cuenta la posible inuencia de las caractersticas de los conductores, esperaramos obtener un
contraste mas potente. Veamos como se puede dise nar un experimento de estas caractersticas.
6
El consumo esta medido en Km. recorridos con un litro de combustible, con lo que a mayor consumo, menos kilometros
recorridos.
Supongamos, una vez mas, que seguimos interesados en comparar los consumos de gasolina de los tres modelos
de coche A, B y C anteriores. Consideraremos un experimento que llevaremos a cabo en seis coches de cada
clase. Si cada tipo de coche es conducido por seis conductores distintos, es posible extraer informacion acerca
de la inuencia de los conductores, ademas de la inuencia de los coches. Los niveles del factor adicional en
este caso los conductores se denominan algunas veces bloques. El experimento se dice que esta organizado en
bloques; en nuestro ejemplo, habra seis bloques.
Este tipo de dise no por bloques puede ser utilizado para obtener informacion acerca de dos factores a la vez. Por
ejemplo, supongamos que, ademas del modelo, queremos ver si la edad del conductor inuye sobre el consumo
de gasolina. Para hacer esto, dividimos los conductores en seis categoras:
1. Menos de 25 4. 46 55
2. 26 35 5. 56 65
3. 36 45 6. Mas de 65
Organizamos nuestro experimento de manera que un coche de cada tipo fuera conducido por un conductor
perteneciente a cada una de las seis categoras. En la tabla 10.3.1 guran los resultados del experimento. La
comparacion de los modelos de coches es el objetivo principal y las edades de los conductores seran utilizadas
como bloques. Este tipo de dise nos se denomina dise no de bloques aleatorizados. La aleatoriedad se debe
a que elegimos aleatoriamente un conductor de la primera categora de edad para conducir un coche A, un
conductor de la segunda categora de edad para conducir otro coche A, y as sucesivamente. Este proceso se
repite para cada categora de edad y para cada modelo de coche.
COCHE
EDAD Coche A Coche B Coche C
Menos de 25 251 239 260
26 - 35 247 237 254
36 - 45 260 244 258
46 - 55 243 233 244
56 - 65 239 236 242
Mas de 65 242 245 254
Cuadro 10.3.1: Consumos seg un coche y edad.
En general, si se ha dise nado un experimento de forma que la caracterstica en estudio dependa del efecto de un
factor A con r niveles y se disponga de s observaciones para cada nivel de A, de manera que cada observacion
depende a su vez de un nivel de otro factor B con s niveles.
A\B B
1
B
2
. . . B
s
A
1
x
11
x
12
. . . x
1s
A
2
x
21
x
22
. . . x
2s
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
A
r
x
r1
x
r2
. . . x
rs
Entonces los datos consisten en una observacion por celda de una clasicacion doble.
Supongamos podemos describir las observaciones por el modelo lineal:
ij
= +
i
+
j
+
ij
, con
r
i=1
i
=
s
j=1
j
= 0,
= media total,
i
= efecto debido al i-esimo nivel del factor A,
j
= efecto debido al j-esimo nivel del factor B
ij
= error aleatorio. Se supone que son independientes y que
ij
N(0, ).
Con este modelo se pueden contrastar las hipotesis
H
0
:
1
=
2
= . . . =
r
= 0
H
1
:
i
=
j
para alg un i = j
y
H
0
:
1
=
2
= . . . =
s
= 0
H
1
:
i
=
j
para alg un i = j
que equivalen a contrastar la no inuencia de los factores A y B, respectivamente.
Para llevar a cabo estos contrastes se descompone la variacion total
Q =
r
i=1
s
j=1
(
ij
)
2
, con =
1
rs
r
i=1
s
j=1
ij
,
en suma de tres variaciones:
Q = Q
1
+Q
2
+Q
3
con:
Q
1
= s
r
i=1
(
i
)
2
, siendo
i
=
1
s
s
j=1
ij
,
Q
2
= r
s
j=1
(
j
)
2
, siendo
j
=
1
r
r
i=1
ij
,
Q
3
=
r
i=1
s
j=1
(
ij

i
j
+)
2
,
donde, Q
1
= variacion entre niveles del factor A, Q
2
= variacion entre niveles del factor B y Q
3
= variacion
residual o variacion debida al error.
Se verica que:
Q
3
/
2
2
(r1)(s1).
Si H
0
es cierta, entonces Q
1
/
2
2
r1
y Q
1
y Q
3
son independientes.
Si H
0
2
/
2
2
s1
y Q
2
y Q
3
son independientes.
En consecuencia, si H
0
es cierta, como Q
1
y Q
3
son independientes, el estadstico:
V
A
= (s 1)
Q
1
Q
3
=
[Q
1
/
2
]/(r 1)
[Q
3
/
2
]/(r 1)(s 1)
F
(r1)
(r1)(s1)
.
Luego, si H
0
es cierta, como Q
2
y Q
3
son independientes, el estadstico:
V
B
= (r 1)
Q
2
Q
3
=
[Q
2
/
2
]/(s 1)
[Q
3
/
2
]/(r 1)(s 1)
F
(s1)
(r1)(s1)
.
Por otro lado, se comprueba que:
E(Q
1
) = (r 1)
2
+s
2
i
E(Q
2
) = (s 1)
2
+r
2
j
E(Q
3
) = (r 1)(s 1)
2
.
Razonando igual que en el ANOVA para un factor, valores muy grandes de V
A
y V
B
llevan a pensar en la falsedad
de H
0
y H
0
respectivamente, pues si estas fuesen ciertas las esperanzas de los numeradores y denominadores de
V
A
y V
B
son iguales.
Eso nos lleva a denir las regiones crticas para H
0
y H
0
al nivel , respectivamente, por:
S
1
= {V
A
> f
A
}, siendo f
A
/P(F
r1
(r1)(s1)
> f
A
) =
S
1
= {V
B
> f
B
}, siendo f
B
/P(F
s1
(r1)(s1)
> f
B
) =
La tabla ANOVA en este caso toma la forma:
Fuente de
Variacion
Suma de
Cuadrados
G.L.
Cuadrado
medio
Razon
Nivel
crtico
Entre niveles A Q
1
= s
r
i=1
(x
i
x)
2
r 1
Q
1
r1
V
A
= (s 1)
Q
1
Q
3
P(F
r1
(r1)(s1)
> V
A
)
Entre niveles B Q
2
= r
s
j=1
(x
j
x)
2
s 1
Q
2
s1
V
B
= (r 1)
Q
2
Q
3
P(F
s1
(r1)(s1)
> V
B
)
Error Q
3
=
r
i=1
s
j=1
(x
ij
x
i
x
j
+ x)
2
(r 1)(s 1)
Q
3
(r1)(s1)
Total Q =
r
i=1
s
j=1
(x
ij
x)
2
n 1
Con los datos del ejemplo recogidos en la tabla 10.3.1, los resultados se presentan en la siguiente tabla:
Variable dependiente: CONSUMO
Fuente de
Variacion
Suma de
Cuadrados
G.L.
Cuadrado
medio
Razon
Nivel
crtico
Coche 5160 2 2580 14828 0001
Edad 4980 5 .996 5724 0009
Error 1740 10 .174
Total 1188 17
A la vista de los niveles crticos tan bajos, se rechazan la no inuencia de los dos factores, es decir, inuyen los
coches y tambien las edades en el consumo de gasolina.
Un diagrama de cajas del consumo por edades o la representacion de los intervalos de las consumos medios para
los coches nos aclaran un poco el porque:
3 3 3 3 3 3 N =
EDAD
>65 56-65 46-55 36-45 26-35 <25
C
O
N
S
U
M
O
26,5
26,0
25,5
25,0
24,5
24,0
23,5
23,0
6 6 6 N =
COCHE
C B A
9
5
%
I
C
C
O
N
S
U
M
O
26,5
26,0
25,5
25,0
24,5
24,0
23,5
23,0
Figura 10.3: Consumos seg un edad y coche.
10.4. Analisis de la varianza de dos factores con interaccion.
En el analisis de la varianza que presentamos en la seccion anterior, vimos que el dise no estaba caracterizado
porque cada celda contena solo una observacion muestral. As un conductor de 46 55 a nos conduca un coche
B solo una vez.
En esta seccion consideraremos la posibilidad de replicar el experimento, de manera que los datos resultantes
incluir an mas de una observacion por celda. Existen dos ventajas en extender la muestra en tal sentido. La
primera, que a mas datos, mayor precision y seguridad a la hora de decidir si existe o no diferencia entre las
medias, y la segunda, que un dise no con mas de una observacion por celda permite aislar una nueva fuente de
variabilidad la interaccion entre niveles de los dos factores. La interaccion ocurre cuando los efectos no son
aditivos para los dos factores.
Ejemplo 10.4.1 Supongamos recogemos en la tabla 10.4.1 las observaciones muestrales para el consumo de
gasolina para tres tipos de coches A, B y C conducidos por conductores de cinco categoras; tres observaciones
por celda.
COCHE
CONDUCTOR Coche A Coche B Coche C
1 250 254 252 240 244 239 259 258 254
2 248 248 245 235 238 238 252 250 254
3 261 263 262 246 249 249 257 259 255
4 241 244 244 239 240 238 240 236 235
5 240 236 241 244 244 241 251 252 253
Cuadro 10.4.1: Consumos seg un coches y conductores (con replicas).
En general tendremos una muestra de observaciones de r niveles de un factor y s niveles del otro con m
observaciones por celda. Hemos supuesto que el n umero de observaciones por celda es el mismo, esta restriccion
no es necesaria e incluso en algunas ocasiones puede ser un inconveniente para el investigador. Las formulas para
el calculo de las sumas de cuadrados pueden ser modicadas para permitir contenidos desiguales por celda. No
entraremos aqu en los detalles de esas modicaciones ya que estamos en curso de introduccion a la estadstica
y generalmente, el investigador dispondra de un paquete informatico que realice los calculos. Nuestro interes se
centra en el analisis de los resultados.
Los datos se dispondran en una tabla como la siguiente:
A\B B
1
B
2
. . . B
s
A
1
x
111
, x
112
, . . . , x
11m
x
121
, x
122
, . . . , x
12m
. . . x
1s1
, x
1s2
, . . . , x
1sm
A
2
x
211
, x
212
, . . . , x
21m
x
221
, x
222
, . . . , x
22m
. . . x
2s1
, x
2s2
, . . . , x
2sm
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
A
r
x
r11
, x
r12
, . . . , x
r1m
x
r21
, x
r22
, . . . , x
r2m
. . . x
rs1
, x
rs2
, . . . , x
rsm
El modelo anterior se modica de la siguiente manera:
ijk
= +
i
+
j
+
ij
+
ijk
, con
r
i=1
i
=
s
j=1
j
=
r
i=1
s
j=1
ij
= 0,
= media total,
i
= efecto debido al i-esimo nivel del factor A,
j
= efecto debido al j-esimo nivel del factor B,
ij
= efecto de interaccion entre el nivel i-esimo de A y el j-esimo de B,
ijk
= error aleatorio. Se supone que son independientes y que distribucion
ijk
N(0, ).
Con este modelo se pueden contrastar las hipotesis:
H
0
:
1
=
2
= . . . =
r
= 0
H
1
:
i
=
j
para alg un i = j
H
0
:
1
=
2
= . . . =
s
= 0
H
1
:
i
=
j
para alg un i = j
y
H
0
:
ij
= 0, (i, j)
H
1
: (i, j)/
ij
= 0
que equivalen a contrastar la no inuencia de los factores A, B y la no existencia de interaccion respectivamente.
Como en los casos precedentes se descompone la variacion total
Q =
r
i=1
s
j=1
m
k=1
(
ijk
)
2
, con =
1
rsm
r
i=1
s
j=1
m
k=1
ijk
,
en suma de cuatro variaciones:
Q = Q
1
+Q
2
+Q
3
+Q
4
con:
Q
1
= sm
r
i=1
(
i
)
2
, siendo
i
=
1
sm
s
j=1
m
k=1
ijk
Q
2
= rm
s
j=1
(
j
)
2
, siendo
j
=
1
rm
r
i=1
m
k=1
ijk
Q
3
= m
r
i=1
s
j=1
(
ij
j
+)
2
, siendo
ij
=
1
m
m
k=1
ijk
Q
4
=
r
i=1
s
j=1
m
k=1
(
ijk

ij
)
2
donde, Q
1
= variacion entre niveles del factor A, Q
2
= variacion entre niveles del factor B, Q
3
= variacion por
la interaccion y Q
4
= variacion residual o variacion debida al error.
Se verica que:
Q
4
/
2
2
rs(m1)
.
Si H
0
1
/
2
2
r1
y Q
1
y Q
4
son independientes.
Si H
0
2
/
2
2
s1
y Q
2
y Q
4
son independientes.
Si H
0
3
/
2
2
(r1)(s1)
y Q
3
y Q
4
son independientes.
Por tanto:
Si H
0
es cierta, como Q
1
y Q
4
son independientes, el estadstico
V
A
=
Q
1
/(r 1)
Q
4
/rs(m1)
=
[Q
1
/
2
]/(r 1)
[Q
4
/
2
]/rs(m1)
F
(r1)
rs(m1)
.
Si H
0
es cierta, como Q
2
y Q
4
V
B
=
Q
2
/(s 1)
Q
4
/rs(m1)
=
[Q
2
/
2
]/(s 1)
[Q
4
/
2
]/rs(m1)
F
(s1)
rs(m1)
.
Si H
0
es cierta, como Q
3
y Q
4
V
AB
=
Q
3
/(r 1)(s 1)
Q
4
/rs(m1)
=
[Q
3
/
2
]/(r 1)(s 1)
[Q
4
/
2
]/rs(m1)
F
(r1)(s1)
rs(m1)
.
Razonando igual que en los casos precedentes, valores muy grandes de V
A
, V
B
y V
AB
llevan a pensar en la
falsedad de H
0
, H
0
y H
0
respectivamente.
Eso nos lleva a denir las regiones crticas para H
0
, H
0
y H
0
al nivel , respectivamente por:
S
1
= {V
A
> f
A
}, siendo f
A
/P(F
r1
rs(m1)
> f
A
) = ,
S
1
= {V
B
> f
B
}, siendo f
B
/P(F
s1
rs(m1)
> f
B
) = ,
S
1
= {V
AB
> f
AB
}, siendo f
AB
/P(F
(r1)(s1)
rs(m1)
> f
AB
) = .
Cuando en un analisis de este tipo se rechaza la ausencia de interaccion, las conclusiones de los
otros contrastes no son ables, en esos casos se recomiendan otras tecnicas para vericar las
posibles inuencias de los factores.
El formato general de la tabla ANOVA que se utiliza para resumir los calculos del analisis, toma la forma:
Fuente de
Variacion
Suma de
Cuadrados
G.L.
Cuadrado
medio
Razon
Nivel
crtico
Entre niveles A Q
1
= sm
r
i=1
(x
i
x)
2
r 1
Q
1
r1
V
A
=
Q
1
/(r1)
Q
4
/rs(m1)
P(F
r1
rs(m1)
> V
A
)
Entre niveles B Q
2
= rm
s
j=1
(x
j
x)
2
s 1
Q
2
s1
V
B
=
Q
2
/(s1)
Q
4
/rs(m1)
P(F
s1
rs(m1)
> V
B
)
Interaccion Q
3
= m
r
i=1
s
j=1
(x
ij
x
i
x
j
+ x)
2
(r 1)(s 1)
Q
3
(r1)(s1)
V
AB
=
Q
2
/(r1)(s1)
Q
4
/rs(m1)
P(F
(r1)(s1)
rs(m1)
> V
AB
)
Error Q
4
=
r
i=1
s
j=1
m
k=1
(x
ijk
x
ij
)
2
rs(m 1)
Q
4
rs(m1)
Total Q =
r
i=1
s
j=1
m
k=1
(x
ijk
x)
2
rsm 1
que para los datos de consumo de gasolina del Ejemplo 10.4.1 (pag. 410), sera:
Variable dependiente: CONSUMO
Fuente de
Variacion
Suma de
Cuadrados
G.L.
Cuadrado
medio
Razon
Nivel
crtico
Coche 7156 2 3578 92534 .000
Conductor 13148 4 3287 85009 .000
Coche Conductor 6604 8 .826 21349 .000
Error 1160 30 3867E-02
Total 28068 44
Enmarcamos el nivel crtico (0,000) correspondiente a la hipotesis de interaccion. Un nivel as hace que
rechacemos la no inuencia de la interaccion, un conductor de una categora particular lo hara relativamente
mejor en un tipo de coche que en otro.
Tambien los niveles crticos para los otros contrastes nos llevan a rechazar la no inuencia del coche y del
conductor, pero de acuerdo con lo anteriormente expuesto, estas conclusiones no son muy ables con este
procedimiento de analisis.
COCHE
C B A
26,5
26,0
25,5
25,0
24,5
24,0
23,5
CONDUCTOR
C1
C2
C3
C4
C5
La interaccion se maniesta en el graco adjunto, en el que vemos
que todos los conductores obtienen su mayor consumo con el coche
B, excepto el C4 que empeora con el coche C y el C5 que lo hace
peor con el A.
Si no existiese interaccion, las lneas de las trayectorias seran mas
o menos paralelas.
TEMA 10.- AN
10.2. Analisis de la varianza de un factor.
Ejercicio 10.1 Una compa na desea probar el efecto de cuatro catalizadores que pueden afectar la concentra-
cion de un componente en una mezcla lquida. Para ello se analizaron 16 datos relativos a la concentracion de
dicho componente tratado, en cada caso, con alguno de estos cuatro catalizadores y se obtuvo la siguiente tabla
ANOVA:
Fuente de
variacion
Suma de
cuadrados
Grados de
libertad
Media
cuadratica
F-Razon Nivel crtico
Grupo 85676
Error
Total 120238
Completar dicha tabla y obtener las conclusiones de este estudio a un nivel de signicacion = 0
05.
Ejercicio 10.2 Una compa na qumica investiga los efectos de cinco compuestos. El experimento consiste en
inyectar los compuestos a 12 materiales de caractersticas similares y anotar los tiempos de descomposicion. Los
materiales se clasican en 5 grupos de 4, 2, 2, 3 y 1 material, respectivamente. A cada grupo se le inyecto un
compuesto diferente, obteniendose los siguientes resultados:
Grupo Tiempo de descomposicion
1 83 - 76 - 84 - 83
2 74 - 71
3 81 - 64
4 79 - 85 - 100
5 71
Hay diferencias signicativas entre los tiempos de reaccion de los compuestos? Que hipotesis previas has
utilizado? ( = 0
05)
Ejercicio 10.3 Un fabricante de televisores utiliza tubos electronicos suministrados por 4 proveedores A, B, C
y D. Cada uno de los proveedores asegura que sus productos son los que mas duran. Para tomar una decision,
el fabricante realiza la siguiente experiencia: observa la duracion de diferentes muestras de tubos de cada uno
de los proveedores, obteniendo:
Proveedor A n
1
= 5 tubos x
1
= 118674 horas S
1
= 3175 horas
Proveedor B n
2
= 7 tubos x
2
= 120347 horas S
2
= 6663 horas
Proveedor C n
3
= 4 tubos x
3
= 120680 horas S
3
= 9526 horas
Proveedor D n
4
= 4 tubos x
4
= 119577 horas S
4
= 3375 horas
A la vista de los datos y a un nivel de signicacion = 0
05, se podra suponer que las duraciones medias

de los tubos de los diferentes proveedores son iguales? Calcular el nivel crtico. Suponer que se verican las
condiciones de normalidad, independencia y homocedasticidad al aplicar el ANOVA.
Nota: Recordad que
k
i=1
n
i
(x
i
x)
2
= (x
1
x)
2
+
n
1
)
. . . +(x
1
x)
2
+ (x
2
x)
2
+
n
2
)
. . . +(x
2
x)
2
+. . . . . . + (x
k
x)
2
+
n
k
)
. . . +(x
k
x)
2
.
10.3. Analisis de la varianza de dos factores sin interaccion.
Ejercicio 10.4 Para determinar el punto de fusion de la hidroquinona en cuatro termometros, se dan tres
mediciones de la misma, cada una llevada a cabo por un analista diferente. Con los datos se obtuvo una tabla
ANOVA, parte de la cual se reproduce a continuacion:
Fuente de
variacion
Suma de
cuadrados
Grados de
libertad
Media
cuadratica
Analistas 10900
Termometros
Error 3000
Total 18835
Con estos datos y suponiendo ciertas las condiciones de normalidad, independencia y homocedasticidad, se
puede concluir que inuye el analista en la comprobacion del punto de fusion de la hidroquinona?, sera
razonable considerar que todos los termometros leen igual? ( = 0
05)
Ejercicio 10.5 Para estudiar el efecto de la temperatura y la concentracion sobre el rendimiento de cierto
producto qumico, se lleva a cabo un estudio tomando una medicion de dicho rendimiento en cada una de
las seis condiciones posibles que se obtienen al combinar temperaturas de 50
o
y 60
o
con concentraciones del
40 %, 50 % y 60 %. Con estos datos se obtuvieron las siguientes sumas de cuadrados, correspondientes al factor
concentracion (Q
1
), al factor temperatura (Q
2
) y al total (Q):
Q
1
= 1
043, Q
2
= 0
027 y Q = 1
113.
De acuerdo con estos datos, que se puede decir sobre el efecto que tienen la concentracion y la temperatura
sobre el rendimiento?, que condiciones se deben suponer? ( = 0
05)
Ejercicio 10.6 Se usaron tres clases de gasolina en cuatro marcas de automoviles y se anotaron los kilometros
recorridos por litro. Existe una diferencia signicativa entre las clases de gasolina? Y entre las marcas de
automoviles?
Gasol. Marca. M
1
M
2
M
3
M
4
G
1
629 646 6418 6205
G
2
6503 6290 7225 6843
G
3
7310 7183 7438 7055
10.4. Analisis de la varianza de dos factores con interaccion.
Ejercicio 10.7 Para comparar la efectividad de un cierto proceso de produccion, se obtuvieron 4 observaciones
del n umero de unidades diarias producidas por tres empleados distintos en tres maquinas diferentes. Con estos
datos se obtuvo una tabla ANOVA, la cual es reproducida parcialmente a continuacion:
Fuente de
variacion
Suma de
cuadrados
Grados de
libertad
Media
cuadratica
Empleado 5389
Maquina 1445
Interaccion
Error 2775
Total 37639
Analiza los resultados anteriores a un nivel de signicacion = 0
05.
Ejercicio 10.8 Para fabricar cierta bebida, una medicion importante es el porcentaje de impurezas en el
producto nal. Los datos siguientes muestran los porcentajes de impurezas de muestras tomadas de productos
que se fabricaron a tres temperaturas distintas y a dos tiempos de esterilizacion. Los datos obtenidos fueron los
siguientes:
Tiempo \ Temperatura 75
o
100
o
125
o
15 min. 1405,1493 1055,948 755,659
20 min. 1656,1585 1363,1175 923,878
Analiza los resultados anteriores. ( = 0
05)
Examenes.
Ejercicio 10.9 (09-09-03) Un fabricante realiza un experimento encaminado a investigar el efecto del nivel
de suministro de materia prima y la proporcion de su asignacion a la lnea de fabricacion de un producto.
Los niveles de suministro escogidos para el experimento fueron 15, 18 y 21 Tm; los niveles de proporcion de
asignacion a la lnea de produccion fueron 1/2, 1/3 y 1/4. La variable respuesta fue el benecio por unidad
producida.
Se realizaron tres repeticiones del experimento para cada nivel y proporcion, obteniendose los siguientes datos:
NIVEL DE SUMINISTRO
15 18 21
PROPORCI
ON 1/2 x
111
, x
112
, x
113
x
121
, x
122
, x
123
x
131
, x
132
, x
133
DE 1/3 x
211
, x
212
, x
213
x
221
, x
222
, x
223
x
231
, x
232
, x
233
ASIGNACI
ON 1/4 x
311
, x
312
, x
313
x
321
, x
322
, x
323
x
331
, x
332
, x
333
Con estos datos, y suponiendo que se verican las hipotesis previas, se realizo un analisis de la varianza,
obteniendose las siguientes sumas de cuadrados:
Variacion total: Q = 118
00; Variacion debida al suministro: Q

2
= 50
22
Variacion debida a la proporcion: Q
1
= 8
22 Variacion debida al error: Q

4
= 43
33
Completar la tabla ANOVA y obtener las conclusiones correspondientes.
TEMA 10.- AN
Ejercicio 10.1 La tabla Anova se completa teniendo en cuenta que:
Col.2: Q
1
+ Q
2
= Q, es decir, la suma de cuadrados del factor mas la suma de cuadrados del error siempre es
igual, en un ANOVA con un factor, a la suma de cuadrados del total. As pues, la suma de cuadrado
correspondiente al error es igual a 120
238 85
676 = 34
562.
Col.3: Los grados de libertad entre niveles (grupo) siempre son el n umero de niveles menos uno, con lo cual, en
este caso, como se estudian 4 catalizadores, r 1 = 4 1 = 3.
Los grados de libertad del total siempre se corresponden con el n umero de datos menos uno, es decir,
n 1 = 16 1 = 15.
Los grados de libertad entre niveles mas los del error tienen que sumar siempre, en un ANOVA con un
factor, los del total, con lo cual, los grados de libertad del error son (n1) (r 1) = nr = 153 = 12.
Col.4: Las medias cuadraticas se obtienen como cociente entre las sumas de cuadrados y los grados de libertad.
As pues,
Q
1
/(r 1) = 85
676/3 = 28
559 y Q
2
/(n r) = 34
562/12 = 2
880.
Col.5: La F-Razon se obtiene, en el caso de un ANOVA con un factor, como cociente entre la media cuadratica
entre niveles y la del error, con lo cual:
V = 28
559/2
880 = 9
916.
Col.6: Por ultimo, el nivel crtico se obtiene como la probabilidad de que una F de Snedecor con r 1 (entre
niveles) grados de libertad en el numerador y nr (error) grados de libertad en el denominador sea mayor
que el valor de la F-Razon, es decir,
P(F
3
12
> 9
916) = 0
0014.
De todo lo anterior se deduce que la tabla ANOVA completa es:
Fuente de
variacion
Suma de
cuadrados
Grados de
libertad
Media
cuadratica
Grupo 85676 3 28559 9916 00014
Error 34562 12 2880
Total 120238 15
Con este nivel crtico (00014) tan bajo se rechaza la hipotesis de no inuencia del factor, es decir, los diferentes
catalizadores tienen diferente comportamiento respecto a la variable respuesta.
Ejercicio 10.2 Se trata de un analisis de la varianza con un factor, puesto que se estudia la inuencia del
factor tipo de compuesto sobre la variable aleatoria tiempo descomposicion.
El contraste planteado es:
H
0
: El factor tipo de compuesto no inuye en el tiempo de descomposicion
(medias iguales para cada tipo de compuesto)
H
1
: El factor tipo de compuesto inuye en el tiempo de descomposicion
(no todas las medias son iguales)
por lo que lo que tenemos que hacer es calcular el valor del estadstico correspondiente a este contraste y a
partir de el obtener el nivel crtico.
El estadstico para este contraste es:
V
1
=
Q
1
/(r 1)
Q
2
/(n r)
H
0
F
r1
nr
,
donde r representa el n umero de niveles del factor (en este caso hay 5 tipos de compuestos), n el n umero total
de observaciones (en este caso son 12) y los estadsticos Q
1
y Q
2
se calculan como sigue:
Q
1
= QQ
2
, Q
2
=
r
i=1
n
i
S
2
i
, Q = nS
2
.
En nuestro problema tenemos que:
r = 5, n = 12,
Q = 12 S
2
= 12 0
7702 = 9
2425,
puesto que S
2
representa la varianza de los 12 valores en la muestra.
Q
2
= 4 0
1025 + 2 0
0225 + 2 0
7225 + 3 0
78 + 1 0 = 4
24,
puesto que n
i
representa el tama no de la muestra en cada nivel (en este ejercicio hay 4 observaciones para el
primer tipo de compuesto, 2 para el segundo, etc) y S
2
i
representa la varianza muestral de los elementos en cada
nivel (en este caso S
2
1
es la varianza de los valores (8
3, 7
6, 8
4, 8
3), S
2
2
es la varianza de los valores (7
4, 7
1),
etc).
Q
1
= QQ
2
= 9
2425 4
24 = 5
0025,
sin mas que sustituir los estadsticos por los valores que acabamos de obtener.
As pues, el estadstico V toma para nuestra muestra el valor:
V =
5
0025/(5 1)
4
24/(12 5)
= 2
0647,
por lo que el nivel crtico de este contraste es:
P(F
4
7
> 2
0647) = 0
1893.
Puesto que este valor es mucho mayor que el nivel de signicacion que hemos considerado ( = 0
05), entonces
no se rechaza la hipotesis nula, es decir, no hay evidencias sucientes para considerar que el factor tipo
de compuesto inuye sobre el tiempo de descomposicion, con lo que se admite la no inuencia
del factor.
Nota.-Si el nivel crtico hubiese sido menor de 005, por ejemplo 00003, entonces se habra rechazado la hipotesis
de no inuencia del factor tipo de compuesto, con lo que concluiramos que unos compuestos se descomponen
mas rapido que otros.
Presentando los valores anteriormente calculados en forma de tabla:
Fuente de
variacion
Suma de
cuadrados
Grados de
libertad
Media
cuadratica
Tipo Compuesto Q
1
=50025 r 1=4 Q
1
/(r 1)=12506 V =20647 P(F
4
7
> 2
0647) =01893
Error Q
2
=424 n r=7 Q
2
/(n r)=06057
Total Q=92425 n 1=11
En este ejercicio, las hipotesis previas que tenemos que suponer ciertas son: normalidad, independencia y
homocedasticidad.
Ejercicio 10.3 Queremos contrastar:
H
0
:
1
=
2
=
3
=
4
H
1
:
i
=
j
para alg un i = j
Por un lado sabemos que
Q =
r
i=1
n
i
j=1
(x
ij
x)
2
=
r
i=1
( x
i.
x)
2
+
r
i=1
n
i
j=1
(x
ij
x
i.
)
2

Q
1
Q
2
por otro lado como
Q
2
=
r
i=1
n
i
S
2
i
= 76971
33,
y por ultimo
Q
1
= 5(1186
84 1198
41)
2
+ 7(1203
47 1198
41)
2
+ 4(1206
8 1198
41)
2
+
4(1195
77 1198
41)
2
= 1169
616,
puesto que
x =
5 1186
84 + 7 1203
47 + 4 1206
8 + 4 1195
77
20
= 1198
41.
Reuniendo todo esto podemos rellenar nuestra habitual tabla para el analisis de la varianza:
Fuente de
variacion
Suma de
cuadrados
Grados de
libertad
Media
cuadratica
Proveedor 1169616 3 389872 0081 P(F
3
16
> 0
081) =09693
Error 7697133 16 4810708
Total 78140946 19
As, el nivel crtico del contraste es muy grande, lo que nos proporciona mucha conanza en la certeza de la
hipotesis nula. Consecuentemente las duraciones medias las consideramos iguales.
Ejercicio 10.4 Puesto que lo que nos interesa es estudiar si tanto los analistas como los termometros tienen
alguna inuencia sobre el valor del punto de fusion de la hidroquinona, vamos a realizar los dos contrastes
siguientes
H
0
:
1
=
2
=
3
= 0
H
0
:
1
=
2
=
3
=
4
= 0
Por lo tanto, la forma adecuada de resolver este problema es mediante un analisis de la varianza de dos factores
sin interaccion. Rellenando los datos que faltan de la tabla ANOVA correspondientes obtenemos que
Fuente de
variacion
Suma de
cuadrados
Grados de
libertad
Media
cuadratica
Analistas 10900 2 545 109 P(F
2
6
> 10
9) = 0
01
Termometros 4935 3 1645 329 P(F
3
6
> 3
29) = 0
10
Error 3 6 05
Total 18835 11
y puesto que 0
01 < 0
05, se rechaza la no inuencia de los analistas, es decir, existe alg un sesgo (a este
nivel) correspondiente a los analistas. Sin embargo, puesto que 0
10 0
05, puede considerarse que todos los

termometros miden igual.
Todas estas conclusiones son hechas a un nivel de signicacion 005, pero a otros niveles obtendramos conclu-
siones distintas, as por ejemplo, al nivel de signicacion 0005 no inuye ninguno de los dos factores.
Ejercicio 10.5 Se trata de un analisis de la varianza con dos factores, la concentracion y la temperatura, sin
interaccion.
Los contrastes planteados son:
H
0
: El factor concentracion no inuye en el rendimiento
1
=
2
=
3
= 0
H
0
: El factor temperatura no inuye en el rendimiento
1
=
2
= 0
por lo que lo que tenemos que hacer es calcular el valor de los estadsticos correspondientes para cada una de
las hipotesis nulas y con estos los niveles crticos.
El primer estadstico es
(s 1)Q
1
Q
3
F
r1
(r1)(s1
y el segundo es
(r 1)Q
2
Q
3
F
s1
(r1)(s1)
.
Los valores de Q
1
y Q
2
ya nos los da el enunciado y el de Q
3
se puede obtener como Q
3
= Q Q
1
Q
2
.
As pues, la tabla ANOVA resultante sera:
Fuente de
variacion
Suma de
cuadrados
Grados de
libertad
Media
cuadratica
Concentracion 1043 2 0522 23727 P(F
2
2
> 23
727) =00404
Temperatura 0027 1 0027 1227 P(F
1
2
> 1
227) =03834
Error 0043 2 0022
Total 1113 5
y por tanto el nivel crtico para la concentracion 0
0404 < 0
041, por lo que rechazamos la no inuencia de

la concentracion a cualquier nivel mayor o igual a 0041, por lo que la concentracion inuye sobre el
rendimiento.
El nivel crtico para la temperatura (0
3834 0
05) es mas de siete veces superior al que habitualmente se

toma como umbral para rechazar o no rechazar una hipotesis, luego la temperatura no inuye sobre el
rendimiento.
Las condiciones que se suponen son las relativas a cualquier analisis de la varianza: normalidad, indepen-
dencia y homocedasticidad, y en este caso, la ausencia de interaccion entre la concentracion y la
temperatura.
Ejercicio 10.6 Se trata de un analisis de la varianza con dos factores, la clase de gasolina y la marca del
automovil, sin interaccion (puesto que hay una observacion por casilla) y se estudia la inuencia de tales
factores sobre la variable kilometros recorridos por litro.
En vista de lo anterior, nos vamos a plantear dos contrastes de hipotesis:
H
0
: El factor clase de gasolina no inuye sobre los kilometros recorridos por litro
H
1
: El factor clase de gasolina inuye sobre los kilometros recorridos por litro
H
0
: El factor marca del automovil no inuye sobre los kilometros recorridos por litro
H
1
: El factor marca del automovil inuye sobre los kilometros recorridos por litro
Vamos pues a calcular el valor de los estadsticos correspondientes para cada uno de estos contrastes y con estos
los niveles crticos de ambos.
Comenzaremos con el factor clase de gasolina. El estadstico para este contraste es:
V
A
=
Q
1
/(r 1)
Q
3
/(r 1)(s 1)
H
0
F
r1
(r1)(s1)
,
donde r representa el n umero de niveles del factor clase de gasolina (en este caso hay 3 clases), s representa
el n umero de niveles del factor marca del automovil (en este caso hay 4 marcas) y los estadsticos Q
1
y Q
3
se
calculan como sigue:
Q
1
= n S
2
x
i.
, Q
3
= QQ
1
Q
2
donde Q
2
= n S
2
x
.j
y Q = nS
2
.
En nuestro problema tenemos que:
r = 3, s = 4, n = r s = 12,
Q = 12 S
2
= 12 0
1894 = 2
2733,
puesto que S
2
representa la varianza de los 12 valores en la muestra (6
29, 6
46, 6
418, 6
205, 6
503, . . . , 7
055).
Q
1
= 12 0
1374 = 1
6486,
puesto que S
2
x
i.
representa la varianza muestral de las medias de la muestra para cada clase de gasolina, es decir,
V ALORES MEDIA V ARIANZA
(6
29, 6
46, 6
418, 6
205) x
1.
= 6
3433
(6
503, 6
290, 7
225, 6
843) x
2.
= 6
7153 S
2
x
i.
= 0
1374
(7
310, 7
183, 7
438, 7
055) x
3.
= 7
2465
Q
2
= 12 0
0228 = 0
2741,
puesto que S
2
x
.j
representa la varianza muestral de las medias de la muestra para cada marca de automovil, es
decir,
(6
29, 6
503, 7
310) x
,1
= 6
701
(6
46, 6
290, 7
183) x
,2
= 6
6443 S
2
x
.j
= 0
0228
(6
418, 7
225, 7
438) x
,3
= 7
027
(6
205, 6
843, 7
055) x
,4
= 6
701
Q
3
= QQ
1
Q
2
= 2
2733 1
6486 0
2741 = 0
3506,
sin mas que sustituir los estadsticos por los valores que acabamos de obtener.
As pues, el estadstico V
A
toma para nuestra muestra el valor:
V
1
=
1
6486/(3 1)
0
3506/(3 1)(4 1)
= 14
1067,
P(F
2
6
> 14
1067) = 0
0054.
Puesto que este valor es menor que el nivel de signicacion habitual ( = 0
05), entonces se rechaza la hipotesis

nula de este contraste, es decir, el factor clase de gasolina inuye sobre los kilometros recorridos por
litro.
Para el otro contraste (la inuencia de la marca del automovil), el estadstico que se utiliza es:
V
B
=
Q
2
/(s 1)
Q
3
/(r 1)(s 1)
H
0
F
s1
(r1)(s1)
.
Seg un lo que acabamos de ver, el valor del estadstico para nuestra muestra es:
V
B
=
0
2741/(4 1)
0
3506/(3 1)(4 1)
= 1
5636,
P(F
3
6
> 1
5636) = 0
2930.
Como en este caso el nivel crtico es mayor de 005, entonces no se rechaza la hipotesis nula de este contraste,
es decir, se puede admitir que el factor marca de automovil no inuye sobre los kilometros recorridos
por litro.
Fuente de
variacion
Suma de
cuadrados
Grados de
libertad
Media
cuadratica
Gasolina Q
1
=16486 r 1=2 Q
1
/2=08243 V
A
=141067 P(F
2
6
> 14
1067) =00054
Automovil Q
2
=02741 s 1=3 Q
2
/3=00914 V
B
=15636 P(F
3
6
> 1
5636) =02930
Error Q
3
=03506 (r 1)(s 1)=6 Q
3
/6=00584
Total Q=22733 n 1=11
Ejercicio 10.7 Puesto que la tabla Anova completa para estos datos es:
Fuente de
variacion
Suma de
cuadrados
Grados de
libertad
Media
cuadratica
Empleado 5389 2 2695 2622 0091
Maquina 289 2 1445 1406 0263
Interaccion 161 4 0403 0392 0813
Error 2775 27 1028
Total 37639 35
no se rechaza la hipotesis de no interaccion (Nivel crtico = 0
813 0
05 = ), con lo cual tiene sentido

interpretar el resto de los niveles crticos.
Tanto para el factor empleado, como para el factor maquina, puesto que el nivel crtico es 0
091 0
05 =
y 0
263 0
05 = , respectivamente, no se rechazan las hipotesis nulas, es decir, no hay diferencia en la

produccion entre empleados, ni entre maquinas.
Ejercicio 10.8 Vamos a analizar estos datos llevando a cabo un analisis de varianza. En este caso se trata de
un ANOVA con dos factores y posible interaccion con lo que tenemos que realizar tres contrastes:
H
0
: No hay interaccion entre el tiempo de esterilizacion y la temperatura de fabricacion
H
1
: Hay interaccion entre el tiempo de esterilizacion y la temperatura de fabricacion
H
0
: El factor tiempo de esterilizacion no inuye sobre el porcentaje de impurezas
H
1
: El factor tiempo de esterilizacion inuye sobre el porcentaje de impurezas
H
0
: El factor temperatura de fabricacion no inuye sobre el porcentaje de impurezas
H
1
: El factor temperatura de fabricacion inuye sobre el porcentaje de impurezas
Vamos pues a calcular el valor de los estadsticos correspondientes para cada uno de estos contrastes y con estos
los niveles crticos de ellos. Previamente es necesario calcular varios estadsticos como son Q, Q
1
, Q
2
, Q
3
y Q
4
.
En este caso se tiene que
Q = n S
2
= 12 10
3802 = 124
562,
puesto que S
2
representa la varianza de los 12 valores en la muestra.
Q
1
= n S
2
x
i..
= 12 1
1113 = 13
3352,
puesto que S
2
x
i..
representa la varianza de las medias de la muestra para cada uno de los dos tiempos de
esterilizacion, es decir,
(14
05, 14
93, 10
55, 9
48, 7
55, 6
59) x
1..
= 10
525
(16
56, 15
85, 13
63, 11
75, 9
23, 8
78) x
2..
= 12
6333 S
2
x
i..
= 0
1113
De forma similar obtenemos
Q
2
= n S
2
x
.j.
= 12 8
9317 = 107
18,
puesto que S
2
x
.j.
representa la varianza de las medias de la muestra para cada una de los tres temperaturas de
fabricacion, es decir,
(14
05, 14
93, 16
56, 15
85) x
,1.
= 15
3475
(10
55, 9
48, 13
63, 11
75) x
,2.
= 11
3525 S
2
x
.j.
= 8
9317
(7
55, 6
59, 9
23, 8
78) x
,3.
= 8
0375
Q
4
= m
r
i=1
s
j=1
S
2
ij
= 2(0
1936 + 0
2862 + 0
2304 + 0
1260 + 0
8836 + 0
0506) = 3
5410,
puesto que m representa el n umero de observaciones por casilla (en este caso hay dos observaciones para cada
categora, con lo que m = 2) y S
2
ij
representa la varianza de las observaciones en cada casilla, es decir,
V ALORES V ARIANZA
(14
05, 14
93) S
2
11
= 0
1936
(10
55, 9
48) S
2
12
= 0
2862
(7
55, 6
59) S
2
13
= 0
2304
(16
56, 15
85) S
2
21
= 0
1260
(13
63, 11
75) S
2
22
= 0
8836
(9
23, 8
78) S
2
23
= 0
0506
Q
3
= QQ
1
Q
2
Q
4
= 124
562 13
3352 107
18 3
5410 = 0
5058.
Con estos estadsticos calculados, vamos a proceder a realizar los contrastes establecidos al comienzo del ejercicio.
Puesto que es posible que haya interaccion, es indispensable hacer en primer lugar este contraste, puesto que el
rechazo o no de la hipotesis nula nos obligara a no continuar o continuar con los otros dos contrastes.
El estadstico para el contraste sobre la interaccion es:
V
AB
=
Q
3
/(r 1)(s 1)
Q
4
/rs(m1)
H
0
F
(r1)(s1)
rs(m1)
,
donde r representa el n umero de niveles del factor tiempo de esterilizacion (en este caso hay 2 tiempos), s
representa el n umero de niveles del factor temperatura de fabricacion (en este caso hay 3 temperaturas) y m,
como ya hemos comentado, es el n umero de observaciones por casilla (en este caso 2). As pues, el estadstico
V
3
toma para nuestra muestra el valor:
V
AB
=
0
5058/(2 1)(3 1)
3
5410/2(3)(2 1)
= 0
4285,
P(F
2
6
> 0
4285) = 0
6700.
Puesto que este valor es mayor que el nivel de signicacion habitual ( = 0
05), entonces no se rechaza la

hipotesis nula de este contraste, es decir, se considera que no hay interaccion entre el tiempo y la
temperatura, con lo cual se puede estudiar la inuencia de cada uno de estos factores por separado.
Nota.- Si nos hubiese salido un nivel crtico menor que 005, por ejemplo 00003, entonces se rechazara la
hipotesis de no interaccion, lo que no se puede continuar con los contraste sobre cada uno de los factores, puesto
que podran dar lugar a conclusiones erroneas.
Para el segundo contraste (la inuencia del tiempo de esterilizacion), el estadstico que se utiliza es:
V
A
=
Q
1
/(r 1)
Q
4
/rs(m1)
H
0
F
r1
rs(m1)
,
con lo que seg un nuestros datos,
V
A
=
13
3352/(2 1)
3
5410/2(3)(2 1)
= 22
5957,
P(F
1
6
> 22
5957) = 0
0031.
Como en este caso el nivel crtico es menor de 005, entonces se rechaza la hipotesis nula de este contraste, es
decir, el tiempo de esterilizacion inuye sobre el porcentaje de impurezas.
En el ultimo contraste, el de inuencia o no de la temperatura de fabricacion, el estadstico es:
V
B
=
Q
2
/(s 1)
Q
4
/rs(m1)
H
0
F
s1
rs(m1)
.
Seg un lo que acabamos de ver, el valor del estadstico para nuestra muestra es:
V
B
=
107
18/(3 1)
3
5410/2(3)(2 1)
= 90
8049,
P(F
2
6
> 90
8048) = 0
0000.
Como en este caso de nuevo el nivel crtico es menor de 005, con lo que se rechaza la hipotesis nula de este
contraste, es decir, el factor temperatura de fabricacion inuye sobre el porcentaje de impurezas.
Fuente de
variacion
Suma de
cuadrados
Grados de
libertad
Media
cuadratica
Tiempo Q
1
=133352 r 1=1 Q
1
/1=133352 V
A
=225957 P(F
1
6
> 22
5957) =00031
Temperatura Q
2
=10718 s 1=2 Q
2
/2=5359 V
B
=908049 P(F
2
6
> 90
8049) =00000
Interaccion Q
3
=05058 (r 1)(s 1)=2 Q
3
/2=02529 V
AB
=04285 P(F
2
6
> 0
4285) =06700
Error Q
4
=35410 rs(m1)=6 Q
4
/6=05902
Total Q=124562 n 1=11
Ejercicio 10.9 Se trata de un ANOVA con dos factores y posible interaccion con lo que tenemos que realizar
tres contrastes:
H
0
: No hay interaccion entre el nivel de suministro y la proporcion de asignacion
H
1
: Hay interaccion entre el nivel de suministro y la proporcion de asignacion
H
0
: El factor proporcion de asignacion no inuye sobre el benecio por unidad producida
H
1
: El factor proporcion de asignacion inuye sobre el benecio por unidad producida
H
0
: El factor nivel de suministro no inuye sobre el benecio por unidad producida
H
1
: El factor nivel de suministro inuye sobre el benecio por unidad producida
Seg un los datos del enunciado, ya conocemos todos los estadsticos necesarios para obtener la tabla ANOVA,
excepto Q
3
(variacion debida a la interaccion). No obstante este valor puede obtenerse a partir de los otros
como sigue, Q
3
= QQ
1
Q
2
Q
4
= 118
00 8
22 50
22 43
33 = 16
23.
Con estos estadsticos calculados, vamos a proceder a rellenar la tabla ANOVA:
Fuente de
variacion
Suma de
cuadrados
Grados de
libertad
Media
cuadratica
Proporcion Q
1
=822 r 1=2 Q
1
/2=411 V
A
=17074 P(F
2
18
> 1
7074) =02094
Nivel Q
2
=5022 s 1=2 Q
2
/2=2511 V
B
=104311 P(F
2
18
> 10
4311) =00009
Interaccion Q
3
=1623 (r 1)(s 1)=4 Q
3
/4=40575 V
AB
=16856 P(F
4
18
> 1
6856) =01971
Error Q
4
=4333 rs(m1)=18 Q
4
/18=24072
Total Q=11800 n 1=26
H
0
H
1
: Puesto que es posible que haya interaccion, realizaremos este contraste en primer lugar. Teniendo
en cuenta que el nivel crtico en este caso (01971) es mayor que el nivel de signicacion habitual ( = 0
05),
entonces no se rechaza la hipotesis nula de este contraste, es decir, se considera que no hay interaccion
entre la proporcion de asignacion y el nivel de suministro, con lo cual se puede estudiar la inuencia
de cada uno de estos factores por separado.
H
0
H
1
: Para el segundo contraste, la inuencia de la proporcion de asignacion, el nivel crtico es 02094, de
nuevo mayor que 005, con lo que no se rechaza la hipotesis nula de este contraste, es decir, la proporcion de
asignacion NO inuye sobre el benecio por unidad producida.
H
0
H
1
: En el ultimo contraste, el que estudia la inuencia del nivel de suministro, el nivel crtico ha resultado
ser 00009, en este caso, signicativamente menor que 005, con lo cual se puede concluir que el factor nivel
de suministro SI inuye sobre el benecio por unidad producida.
TEMA 10.- AN
PREGUNTAS DE TEST.
Examenes.
El siguiente enunciado hace referencia a las preguntas 1. y 2.: La siguiente tabla proporciona los resultados del
ANOVA que trata de investigar si determinado factor inuye sobre una variable respuesta. Desgraciadamente
problemas en la impresion hacen que solo tengamos resultados parciales de la misma.
Fuente de
variacion
Suma de
cuadrados
Grados de
libertad
Media
cuadratica
Inter-grupos (Factor) 21670 15039
Intra-grupos (Error) 17
Total 33918 19
1. (19-06-03) A partir de la informacion de la tabla anterior, podemos armar que,
a) El factor que se investiga no inuye al nivel = 0
05;
b) El factor que se investiga inuye al nivel = 0
05;
c) No se puede decir si el factor inuye o no al nivel = 0
05, faltan datos;

d) El nivel crtico es menor de 005;
e) Todo falso.
a) Las medias correspondientes a los niveles del factor son iguales al nivel = 0
05;
b) Las medias correspondientes a los niveles del factor no son iguales al nivel = 0
05;
c) El n umero de niveles del factor es 3;
d) El n umero de niveles del factor es 2;
e) Todo falso.
Fuente de
variacion
Suma de
cuadrados
Grados de
libertad
Media
cuadratica
Total 28203 43
05;
05;
05, faltan datos;

e) Todo falso.
05;
05;
e) Todo falso.
Las preguntas 5. y 6. hacen referencia al siguiente enunciado: La siguiente tabla proporciona los resultados
del ANOVA que trata de investigar si cinco marcas de pintura tienen igual duracion media. Desgraciadamente
Fuente de variacion
Suma de
cuadrados
g.l.
Media
cuadratica
Entre-niveles (Factor) 53497
Dentro de los niveles (Error) 127511
TOTAL 181008 51
a) La marca no inuye al nivel = 0
05;
c) No es posible decidir, faltan datos;
e) Todo falso.
b) La marca inuye al nivel = 0
05;
d) El nivel crtico es menor de 0
05;
a) Las medias correspondientes a las duraciones de las diferentes marcas son iguales al nivel = 0
05;
b) Las medias correspondientes a las duraciones de las diferentes marcas no son iguales al nivel = 0
05;
e) Todo falso.
Las preguntas 7. y 8. hacen referencia al siguiente enunciado: La siguiente tabla proporciona, de manera in-
completa, los resultados del ANOVA que trata de investigar si determinado factor inuye sobre una variable
respuesta.
Fuente de variacion
Suma de
cuadrados
g.l.
Media
cuadratica
Entre-niveles (Factor) 2 697
Dentro de los niveles (Error)
TOTAL 17
7. (21-06-04) A partir de la informacion de la tabla anterior, podemos armar que:
a) El factor no inuye al nivel = 0
05;
e) Todo falso.
b) El factor inuye al nivel = 0
05;
05;
a) Las medias correspondientes a los niveles del factor se pueden suponer iguales al nivel = 0
05;
05;
e) Todo falso.
Las preguntas 9. y 10. hacen referencia al siguiente enunciado: La siguiente tabla proporciona, de manera
incompleta, los resultados del ANOVA que trata de investigar si dos factores inuyen sobre una variable respuesta
y si existe interaccion entre ellos.
Fuente de variacion
Suma de
cuadrados
g.l.
Media
cuadratica
Entre niveles A (Factor A) 2022 2
Entre niveles B (Factor B) 822 2
Interaccion 4622 4
Error 4333 18
TOTAL
a) El factor A no inuye al nivel = 0
05;
c) No es posible decidir, pues existe interaccion;
e) Todo falso.
b) El factor B no inuye al nivel = 0
05;
d) El factor A inuye al nivel = 0
05;
a) El n umero de niveles del factor A es 3;
c) El n umero de observaciones por celda es 3;
e) Todo falso.
b) El n umero de niveles del factor B es 3;
d) El n umero de niveles del factor A es 2;
Las dos preguntas siguientes hacen referencia al siguiente enunciado: La siguiente tabla proporciona los resul-
tados del ANOVA que trata de investigar si determinado factor inuye sobre una variable respuesta, desgracia-
damente problemas en la impresion hacen que solo tengamos resultados parciales de la misma.
Fuente de variacion
Suma de
cuadrados
g.l.
Media
cuadratica
TOTAL 83267535 153
05;
c) El nivel crtico es menor de 0
05;
e) Todo falso.
05;
d) No es posible decidir, faltan datos;
a) Las medias correspondientes a los niveles del factor no son iguales al nivel = 0
05;
b) Las medias correspondientes a los niveles del factor son iguales al nivel = 0
05;
e) Todo falso.
Las dos preguntas siguientes hacen referencia al siguiente enunciado: La siguiente tabla proporciona, a falta de
algunas columnas y dos datos en la ultima, los resultados del ANOVA que trata de investigar si dos factores
inuyen sobre una variable respuesta.
Fuente de variacion
Suma de
cuadrados
g.l.
Error 2352
TOTAL 3772
05;
e) Todo falso.
05;
d) No es posible decidir, pues existe interaccion;
e) Todo falso.
Fuente de variacion
Suma de
cuadrados
g.l.
Media
cuadratica
F-razon Nivel crtico
Entre niveles (Factor) 2 15038
TOTAL 33918 19
15. (13-02-06) A partir de la informacion de la tabla anterior, podemos concluir que:
05;
e) Todo falso.
05;
05;
a) Las medias correspondientes a los niveles del factor son iguales al nivel de signicacion = 0
05;
b) Las medias correspondientes a los niveles del factor no son iguales al nivel de signicacion = 0
05;
e) Todo falso.
Las dos preguntas siguientes hacen referencia al siguiente enunciado: Se analizaron las puntuaciones dadas por
5 jueces a 11 participantes en patinaje artstico. Cada participante fue evaluado por los jueces en 7 ejercicios.
Las calicaciones dadas pueden ser estudiadas mediante un analisis de la varianza de dos factores con 55 celdas
(participantes-jueces) y 7 observaciones por celda. La siguiente tabla proporciona, de manera incompleta, los
resultados del correspondiente ANOVA:
Fuente de variacion
Suma de
cuadrados
g.l.
Media
cuadratica
Entre participantes 150
Entre jueces 18
Interaccion 120
Error 990
TOTAL
17. (30-06-06) A partir de la informacion de la tabla anterior, podemos armar a nivel = 0
05, que:
a) El factor participante no inuye;
c) No existe interaccion;
e) Todo falso.
b) El factor juez no inuye;
d) Existe interaccion;
18. (30-06-06) A partir de la informacion de la tabla anterior, a nivel = 0
05, podemos armar que las

medias correspondientes a las puntuaciones de los diferentes participantes son:
a) Iguales;
e) Todo falso.
b) Distintas;
d) No es posible decidir, pues no existe interaccion;
Las dos preguntas siguientes hacen referencia al siguiente enunciado: Para probar las diferencias en la conduccion
electrica de tres tipos de alambres A, B y C se obtuvieron muestras en las que se estudio la resistencia en ohmios.
La tabla ANOVA proporciona:
Fuente de variacion
Suma de
cuadrados
g.l.
Media
cuadratica
Tipo alambre 18763
Error 42
TOTAL 34086
a) El tipo de alambre no inuye sobre la resistencia, a un nivel de signicacion = 0
1;
b) El tipo de alambre no inuye sobre la resistencia, a un nivel de signicacion > 0
95;
c) El tipo de alambre no inuye sobre la resistencia, al nivel de signicacion = 0
05;
d) El tipo de alambre inuye sobre la resistencia, al nivel de signicacion = 0
05;
e) Todo falso.
a) El n umero de alambres probados es de 42;
e) Todo falso.
b) El n umero de factores es de 2;
d) El n umero de alambres probados es de 44;
Las dos preguntas siguientes hacen referencia al siguiente enunciado: Para investigar el efecto que tienen el
tipo de pintura tapaporos y el metodo de aplicacion sobre la adhesion de la pintura, se realiza un experimento
factorial. Parte de los resultados del mismo pueden verse en la tabla ANOVA siguiente.
Fuente de variacion
Suma de
cuadrados
g.l.
Media
cuadratica
Tipo de tapaporos 458
Metodo de aplicacion 1
Interaccion 024 2
Error 099 12
TOTAL 1072 17
21. (16-02-07) A partir de la informacion de la tabla anterior, podemos concluir, al nivel = 0
05, que:
a) El tipo de tapaporos no inuye;
c) El metodo de aplicacion no inuye;
e) Todo falso.
b) El tipo de tapaporos inuye;
d) El metodo de aplicacion inuye;
a) Se han comparado 2 metodos distintos de aplicacion;
b) Se han comparado 2 tipos de pintura tapaporos;
c) Se han comparado 3 tipos de pintura tapaporos;
d) Para cada tipo de tapaporos y cada metodo de aplicacion se han pintado 3 especmenes;
e) Todo falso.
Las dos preguntas siguientes hacen referencia al siguiente enunciado: La siguiente tabla proporciona, de manera
Fuente de variacion
Suma de
cuadrados
g.l.
Media
cuadratica
Interaccion 562
Error 12
TOTAL 3466 17
05, que:
a) El factor A no inuye;
e) Todo falso.
b) El factor B no inuye;
d) El factor A inuye;
e) Todo falso.
d) El tama no total de la muestra es 18;
incompleta, los resultados del ANOVA que trata de investigar si la concentracion de madera dura en la pulpa
(en %) inuye sobre la resistencia del papel a la tension (psi).
Fuente de variacion
Suma de
cuadrados
g.l.
Media
cuadratica
Concentracion de madera 20011
Error 20
TOTAL 47016 23
05, que:
a) La concentracion de madera no inuye;
c) El p-valor o nivel crtico es mayor de 005;
e) Todo falso.
b) La concentracion de madera inuye;
d) Todo cierto;
a) El n umero de niveles del factor es 3;
c) El tama no total de la muestra es 24;
e) Todo falso.
b) El n umero de niveles del factor es 4;
incompleta, los resultados del ANOVA que trata de investigar si el laboratorio inuye sobre la medicion de la
concentracion de plomo en el agua de ro, expresada en mg/L).
Fuente de variacion
Suma de
cuadrados
g.l.
Media
cuadratica
Tipo de laboratorio
Error 23 125
TOTAL 8375 28
05, que:
a) El laboratorio no inuye;
b) El laboratorio inuye;
c) Al menos uno de los laboratorios ha producido resultados, la media de los cuales diere de forma estadsti-
camente signicativa del resto de laboratorios;
d) No existen diferencias entre las medias de los laboratorios;
e) Todo falso.
a) Se han comparado 3 laboratorios;
b) Se han comparado 4 laboratorios;
c) Entre todos los laboratorios han hecho un total de 27 mediciones;
d) Entre todos los laboratorios han hecho un total de 29 mediciones;
e) Todo falso.
Las dos preguntas siguientes hacen referencia al siguiente enunciado: Se realiza un experimento con un factor de
interes que contiene 4 niveles con 8 observaciones en cada nivel. La tabla ANOVA incompleta da los siguientes
resultados:
Fuente de variacion
Suma de
cuadrados
g.l.
Media
cuadratica
Factor 914
Error 560
TOTAL
a) Al nivel = 0
05, el factor inuye;

c) El p-valor es mayor que 005;
e) Todo falso.
b) Al nivel = 0
05, el factor no inuye;

d) El p-valor es menor que 005;
05;
05;
e) Todo falso.
Las dos preguntas siguientes hacen referencia al siguiente enunciado: La siguiente tabla proporciona, de ma-
nera incompleta, los resultados del ANOVA que trata de investigar si dos factores inuyen sobre una variable
respuesta.
Fuente de variacion
Suma de
cuadrados
g.l.
Media
cuadratica
Factor A 747 3
Factor B 2280 5
Error 15
TOTAL 4527
05, que:
d) El factor B inuye;
e) Todo falso.
c) El factor A inuye;
e) Todo falso.
incompleta, los resultados del ANOVA que trata de investigar si el tipo de carbono inuye sobre la rugosidad
de la supercie.
Fuente de variacion
Suma de
cuadrados
g.l.
Media
cuadratica
Tipo de carbono 504
Error 14
TOTAL 3416 18
05, que:
a) El tipo de carbono no inuye;
c) No existen diferencias entre las medias;
e) Todo falso.
b) El tipo de carbono inuye;
d) Existen diferencias entre las medias;
a) Se han comparado 5 tipos de carbono;
c) El tama no total de la muestra es de 15;
e) Todo falso.
b) Se han comparado 4 tipos de carbono;
d) El tama no total de la muestra es de 19;
respuesta.
Fuente de variacion
Suma de
cuadrados
g.l.
Media
cuadratica
Factor A 2180 2
Factor B 987 3
Error
TOTAL 3767
35. (16-09-09)A partir de la informacion de la tabla anterior, podemos concluir, al nivel = 0
05, que:
e) Todo falso.
36. (16-09-09)A partir de la informacion de la tabla anterior, podemos concluir que:
e) Todo falso.
N
o
Solucion N
o
Solucion N
o
Solucion N
o
Solucion N
o
Solucion
1. b), d) 2. b), c) 3. b), d) 4. b) 5. b), d)
6. b), d) 7. b), d) 8. b), c) 9. c) 10. a), b), c)
11. b), c) 12. a), c) 13. a), b) 14. e) 15. b), d)
16. b), c) 17. b), c) 18. b) 19. d) 20. e)
21. b), d) 22. a), c), d) 23. b), d) 24. a), b), c), d) 25. b)
26. b), c) 27. b), c) 28. d) 29. a), d) 30. b), c)
31. a), d) 32. a), b), d) 33. b), d) 34. a), d) 35. b), c)
36. b), c), d)
TEMA 10.- AN
PR
Excel permite realizar Analisis de la Varianza de un factor (Analisis de varianza de un factor) y de dos
factores, con (Analisis de varianza de dos factores con varias muestras por grupo) o sin interaccion
(Analisis de varianza de dos factores con una sola muestra por grupo). Para ello es necesario ir a
Herramientas Analisis de datos
y elegir la opcion correspondiente.
En esta practica vamos a ver el funcionamiento de estos contrastes a traves de un ejemplo.
Para contrastar la inuencia en la nota de acceso a la Universidad de la comarca de procedencia, se considero co-
mo muestra los datos recogidos el primer da de clase. Dichos datos han sido introducidos de forma adecuada
para realizar el estudio y pueden verse en la hoja Ejemplo del chero pr10.xls.
Lo primero de todo, realizaremos un diagrama de caja con los datos de cada una de las comarcas para realizar
una comparacion graca entre ellas. Para ello vamos a
StatPlus Single Variable Charts BoxPlots
y rellenamos la ventana como se ve en la Figura 10.1.
Figura 10.1: Crear diagramas de caja.
El resultado de esta operacion esta en la Figura 10.2; estos diagramas de caja muestran que hay una nota
ligeramente superior de la gente de Aviles, despues estaran los de Oviedo y por ultimo los de Gijon. No
obstante, esto es una simple apreciacion graca y es necesario la realizacion de un contraste de hipotesis para
llegar a concluir de forma precisa si hay diferencias entre comarcas en cuanto a la nota de acceso a la Universidad
o no.
Oviedo Gijn Avils
0
2
4
6
8
10
12
Figura 10.2: Diagrama de cajas.
As pues, un contraste adecuado para nuestro estudio sera:
H
0
: la nota de acceso a la Universidad NO depende de la comarca
H
1
: la nota de acceso a la Universidad SI depende de la comarca
que puede ser escrito, en modo matematico, como sigue:
H
0
:
1
=
2
=
3
H
1
:
1
=
2
o
1
=
3
o
2
=
3
donde
1
representa la nota media de acceso de la gente de Aviles,
2
la de Oviedo y
3
la de Gijon.
Puesto que es un contraste de igualdad de medias con mas de dos grupos, se trata de un contraste en el que
hay que utilizar tecnicas de Analisis de la Varianza. Teniendo en cuenta que estamos estudiando la inuencia
de un unico factor (la comarca) sobre la nota de acceso, se trata de un Contraste ANOVA con un factor. La
forma de realizar el mismo con el Excel, como ya habamos comentado, sera:
Herramientas Analisis de datos Analisis de varianza de un factorAceptar
La ventana que se abre al realizar este proceso debe ser completada tal como aparece en la Figura 10.3.
Figura 10.3: Analisis de varianza de un factor.
Una vez hecho esto, los resultados aparecen en una hoja titulada Salida ANOVA. Estos resultados aparecen
aqu recogidos en la Figura 10.4.
Figura 10.4: Salida ANOVA.
Vamos a ir analizando estas salidas. Las las 4 a 7 nos ofrecen un estudio descriptivo de la muestra. As, vemos
como hay 20 alumnos de Aviles, 31 de Oviedo y 37 de Gijon, puesto que Cuenta (tama no de la muestra) es
20, 31 y 37, respectivamente, para cada uno de los tres niveles del factor comarca. La columna C de estas
las nos muestra la suma de las notas de acceso de cada una de las comarcas. La columna D nos presenta la
media (Promedio) de dichas notas de acceso y por ultimo la columna E nos presenta la cuasivarianza muestral
(Varianza).
En las las 11 a 15 puede verse la tabla ANOVA para este contraste. El orden de las columnas es el mismo que
el utilizado en las clases de teora, con la excepcion de que aqu aparece una columna mas, la columna G, en
el que nos presenta el valor k en el cual P(F
r1
n1
> k) = 0
05, que nos permitira concluir que la region crtica

para este contraste sera:
S
1
= {(x
1
, . . . , x
n
)/V (x
1
, . . . , x
n
) > 3
1038}.
El nivel crtico o p-valor puede verse en la celda F12, que es 00102, con lo cual rechazamos, al nivel de
signicacion = 0
05, la hipotesis nula, puesto que

0
. Una
1. p-valor < Rechazar H
0
al nivel .
2. p-valor NO rechazar H
0
al nivel .
es decir, la nota media de acceso S
I es distinta dependiendo de la comarca.

Metodos Estadsticos de la Ingeniera Cuestionario de practicas, 437
M
ETODOS ESTAD
ISTICOS DE LA INGENIER
IA - 2
o
INGENIEROS INDUSTRIALES
ENCUESTA - Febrero 2010
Codigo del cuestionario: 1
DATOS GENERALES
1. Edad: a nos. 2. Sexo:
1. Masculino.
2. Femenino.
3. Comarca en que vive:
1. Eo-Navia. 5. Gijon.
2. Narcea. 6. Caudal.
3. Aviles. 7. Nalon.
4. Oviedo. 8. Oriente.
INFORMACI
ON ACAD
EMICA
4. Nota media de acceso a la universidad: .
5. Asignatura que mas te ha gustado de las cursadas hasta ahora en esta carrera:
.
6. N
o
de asignaturas de Ingeniera Industrial aprobadas hasta el momento: asignaturas.
7. Tiempo medio semanal dedicado al estudio durante el curso: horas.
OTRAS ACTIVIDADES
8. Fumas cigarrillos?
1. No, nunca he sido fumador habitual.
2. No, he sido fumador habitual, pero ya lo he dejado.
3. S, soy fumador.
9. A que edad comenzaste a fumar? a nos.
10. Ordena de 1 a 8 las siguientes actividades de ocio seg un el tiempo semanal que les dediques
(1 para la que mas dediques y 8 para la que menos) durante el curso:
ACTIVIDAD ORDEN ACTIVIDAD ORDEN
Deporte Cine
Bares Lectura
Television Ordenador/Internet
M usica Otras
11. Tiempo medio semanal dedicado al ocio durante el curso: horas.
438, Cuestionario de practicas Metodos Estadsticos de la Ingeniera
DESCRIPCI
ON DE LAS VARIABLES
C
ODIGO N umero de identicacion del individuo.

EDAD Edad del individuo.
SEXO Sexo del individuo.
COMARCA Comarca de Asturias en la que vive el individuo.
NOTAMEDIA Nota media de acceso a la universidad.
ASIGNATURA Asignatura preferida de las cursadas hasta el momento en esta carrera.
1. Calculo 2.

Algebra 3. Ec. Diferenciales 4. Expr. Graca
5. Fsica 6. Qumica 7. Ingles 8. Informatica
9. Termodinamica 10. Ampl.Mecanica 11. Ampl.Electromag. 12. Ampl.Matematicas
13. Elast. y Resist. 14. Cc. Materiales 15. Teor.Circuitos 20. Otras
APROBADAS N
o
de asignaturas aprobadas de Ingeniera Industrial.
ESTUDIO N
o
de horas de estudio semanales durante el curso.
FUMAR Si es o no fumador.
EDADFUMAR Edad a la que comenzo a fumar.
DEPORTE Orden de preferencia de hacer deporte en sus actividades de ocio.
BARES Orden de preferencia de ir de bares en sus actividades de ocio.
TELEVISI
ON Orden de preferencia de ver la television en sus actividades de ocio.

MUSICA Orden de preferencia de la m usica en sus actividades de ocio.
CINE Orden de preferencia de ir al cine en sus actividades de ocio.
LECTURA Orden de preferencia de leer en sus actividades de ocio.
ORDENADOR Orden de preferencia del ordenador en sus actividades de ocio.
OTRAS Orden de preferencia de Otras actividades en sus actividades de ocio.
OCIO N
o
de horas semanales dedicadas al ocio durante el curso.
Metodos Estadsticos de la Ingeniera Examenes del curso 02-03, 439
Universidad de Oviedo
E.P.S. de Ingeniera de Gijon
M
ETODOS ESTAD
IA
Convocatoria de Junio - 19 de Junio de 2003
TEST
17
15
13
11
9
7
5
3
1
16
14
12
10
8
6
4
2
1. El diagrama de caja adjunto representa el resumen de una muestra. Se
puede armar que:
a) La mediana es 15.
c) El cuartil de orden 1 es 2.
e) Todo falso.
b) El percentil de orden 75 es 9.
d) El recorrido intercuartlico es 3.
2. A partir del mismo diagrama de la pregunta anterior, podemos asegurar
que:
a) El percentil de orden 25 es 2.
c) 16 es un valor atpico.
e) Todo falso.
b) El cuartil de orden 3 es 6.
d) La media es 37.
x
i
n
i
N
i
0 3 3
1 2 5
2 2 7
3. A partir de la tabla de distribucion de frecuencias adjunta, podemos
armar que,
a) La media de la muestra es 1.
c) La media de la muestra es 6/7.
e) Todo falso.
b) La mediana de la muestra es 1.
d) La mediana de la muestra es 6/7.
4. Desde cada una de las seis estaciones de una lnea de trenes, se proporciona un billete para cualquier trayecto
entre dos estaciones de la lnea. Teniendo en cuenta que es distinto el billete de ida que el de vuelta, entonces
el n umero de billetes distintos que debe de tener disponibles cada estacion es:
a) 6; b) 5; c) 30; d) 720; e) Todo falso.
5. Un centro de calculo tiene tres procesadores que reciben n trabajos de forma aleatoria, con lo que las 3
n
posibles asignaciones de los trabajos a los procesadores son igualmente verosmiles. La probabilidad de que
exactamente dos procesadores no hayan recibido ning un trabajo es:
a) 0; b) 1; c) 1/3
n1
; d) (2/3)
n
; e) Todo falso.
6. Sean A, B y C tres sucesos cualesquiera de un espacio probabilstico (, A, P). Se verica siempre que
P(A B/C) es igual a:
a) P(A) +P(B) P(C);
c) P(A/B) +P(B/B) P(A B/B);
e) Todo falso.
b) P(A/C) +P(B/C) P(A B/C);
d) 0;
7. Sean A y B dos sucesos independientes, con P(A) = 0
25 y P(B) < 1, entonces P(A B/B) es igual a:

a) 1; b) 0; c) 025; d) 075; e) Todo falso.
8. Una urna contiene dos bolas. Se sabe que la urna se lleno tirando una moneda al aire dos veces y poniendo
una bola blanca en la urna por cada cara y una negra por cada cruz. Entonces, la probabilidad de que la urna
contenga:
a) Dos bolas blancas es 1/3;
c) Una bola blanca y una negra es 1/3;
e) Todo falso.
b) Dos bolas negras es 2/3;
d) Dos blancas o dos negras es 2/3;
9. Si se extrae una bola de la urna anterior y resulta ser blanca. La probabilidad de que la otra bola de la urna
sea tambien blanca es:
a) 1/2; b) 0; c) 1/4; d) 3/4; e) Todo falso.
440, Examenes del curso 02-03 Metodos Estadsticos de la Ingeniera
Las preguntas 10. a 13. hacen referencia al siguiente enunciado: Supongamos que el error al hacer cierta medicion
f(x) =
_
k(1 x
2
) si 1 < x < 1
0 en otro caso
10. El valor de k es:
a) -1; b) -2; c) -3; d) 0; e) Todo falso.
11. El error medio de medida es:
a) -1; b) -2; c) -3; d) 0; e) Todo falso.
12. La probabilidad de que el error este entre -01 y 01 es:
a) 1; b) 092; c) 01495; d) 0; e) Todo falso.
13. Suponiendo que cada error de medida supone un coste adicional de 60
2
euros. El coste medio adicional
de una medicion es:
a) 1; b) 0; c) -1495; d) 120; e) Todo falso.
1 2 3 4 5 6
1/2
14. Supongamos que la funcion de distribucion de una v.a. esta represen-
tada en la gura adjunta. Entonces:
a) Se trata de una v.a. continua.
c) Una mediana de es 05.
e) Todo falso.
b) Una mediana de es 1/2.
d) Una mediana de es 5.
15. La probabilidad de alcanzar un barco, cuando se dispone de cuatro torpedos, cada uno de los cuales tiene
la probabilidad 1/4 de hacer blanco y los disparos son independientes es aproximadamente:
a) 075; b) 025; c) 06836; d) 03164; e) Todo falso.
16. El n
o
de partculas emitidas por una fuente radioactiva durante un periodo especco es una v.a. con
distribucion de Poisson. La probabilidad de que no haya ninguna emision durante un periodo es 1/3, entonces
se tiene que:
a) El n
o
medio de partculas emitido en un periodo es ln(3);
b) La probabilidad de que haya sido emitida exactamente una partcula es ln(3)/3;
o
de partculas emitidas por periodo es ln(3);
o
de partculas emitidas por periodo es ln(3)/3;
e) Todo falso.
17. Una fabrica produce un 3 % de fusibles defectuosos. En el departamento de Control de Calidad eval uan el
n
o
de fusibles observados hasta encontrar el primero defectuoso. El n umero medio de esos fusibles observados
es:
a) 1; b) 3/100; c) 100/3; d) 97/3; e) Todo falso.
18. Sea una v.a. con distribucion N(, ). Se tiene que P(| | < k) es aproximadamente igual a:
a) 0
84134, si k = 1;
d) 0

b) 0
02275, si k = 2;
e) 1

c) 0
9973, si k = 3;
19. Sea una v.a. con distribucion exponencial de parametro 1, entonces E[
2
] es:
a) 1; b) 2; c) 1/2; d) -3; e) Todo falso.
20. Sea una v.a. con distribucion gamma (2, 3), entonces:
a) E[] = 3/2; b) E[
2
] = 2/3; c) E[
2
] = 3/2; d) E[] = 2/3; e) Todo falso.
21. Un proceso de fabricacion produce el 10 % de artculos defectuosos. Si se seleccionan al azar 100 artculos,
entonces la probabilidad de que el n umero de defectuosos exceda de 16 es:
a) No se puede saber;
d) 097725;
b) Menor de 003;
e) Todo falso.
c) Mayor de 003;
22. Sea (
1
,
2
, . . . ,
n
) una m.a.s. de una poblacion geometrica de parametro p. El estimador maximo verosmil
de p es,
a)
n
; b) 1/
n
; c) x
n
; d) 1/x
n
; e) Todo falso.
23. Sea un parametro poblacional y T un estimador de tal que E[T] = , se dice que T es un estimador :
a) Centrado; b) Insesgado; c) Consistente; d) Inconsistente; e) Todo falso.
24. De una muestra de tama no 10 de una poblacion normal se han obtenido las estimaciones puntuales: x
n
= 95
y S
2
= 144. Un intervalo de conanza para la media al nivel de conanza 0
a) (45335; 50323); b) (95456; 97235); c) (12332; 12333); d) (8595; 10405); e) (445; 504).
25. Con los mismos datos de la pregunta anterior, un intervalo de conanza para la varianza al nivel de
conanza 0
a) (1425; 1466); b) (-1466; -1425); c) (757; 53325); d) (1432,1448); e) (453; 903).
26. De dos poblaciones normales con varianzas
2
1
y
2
2
, respectivamente, se toman sendas muestras de tama nos
n
1
= 16 y n
2
= 25, que permiten calcular las siguientes cuasivarianzas muestrales

S
2
1
= 0
298 y

S
2
2
= 0
364.
Con estos datos, si se realiza el contraste H
0
:
2
1
=
2
2
frente a H
1
:
2
1
=
2
2
1 se
obtiene que:
b) Se rechaza H
0
;
c) No se rechaza H
0
;
0
, pero al nivel 0
05 si se rechaza;
e) Todo falso.
27. Se lanza un dado 180 veces, obteniendose: 20 veces la cara 1, 40 veces la cara 2, 22 veces la cara 3, 38 veces
la cara 4, 27 veces la cara 5 y 33 veces la cara 6. El nivel crtico para contrastar si el dado esta equilibrado es:
28. Con los datos de la pregunta anterior, la hipotesis El dado esta equilibrado, se rechaza al nivel,
a) 005; b) 001; c) 01; d) 0001; e) Todo falso.
Fuente de
variacion
Suma de
cuadrados
Grados de
libertad
Media
cuadratica
Total 33918 19
29. A partir de la informacion de la tabla anterior, podemos armar que,
05;
05;
05, faltan datos;

e) Todo falso.
05;
05;
e) Todo falso.
M
ETODOS ESTAD
IA
EJERCICIOS
1. (125 puntos) El n umero de averas de una componente en un intervalo de tiempo (en a nos) de amplitud t
es una v.a.
t
con distribucion de Poisson de parametro 3t/2. Ademas el n umero de averas solo depende de la
amplitud del intervalo de tiempo y no de los extremos del intervalo.
a) Calcular la distribucion de la v.a. := Tiempo de duracion sin averas de una componente.
b) Supongase que un sistema esta formado por 100 componentes que funcionan independientemente una de
otra, y que el sistema funciona de forma optima cuando al menos 8 componentes nunca se han averiado.
Cual es la probabilidad de que el sistema funcione de forma optima despues de 2 a nos?
2. (125 puntos) Una fabrica produce laminas rectangulares cuyas dimensiones (en cm) vienen dadas por las
variables aleatorias (ancho) y (alto). La funcion de densidad conjunta de (, ) es:
f(x, y) =
_
1/150, si 10 < x < 20, 25 < y < 40
0, en el resto.
Una lamina se considera defectuosa si su area es menor de 300 o mayor de 750 cm
2
.
a) Cual es la probabilidad de que una lamina sea defectuosa?
b) Si una lamina tiene una anchura menor de 11 cm, cual es la probabilidad de que sea defectuosa?
c) Cual es la supercie media de una lamina?
3. (125 puntos) La duracion en a nos de una determinada pieza es una v.a. con funcion de densidad:
f
(x) =
_
1
2
x
e
x/
si x > 0
0 si x 0
a) Obtener la funcion de distribucion de la v.a. =
.
b) Obtener el estimador maximo verosmil de a partir de una m.a.s. de la v.a. y estudiar si es insesgado,
asintoticamente insesgado y consistente.
4. (125 puntos) Se determino la cantidad, en 10
4
pulgadas, de desgaste de un eje despues de recorrer un
n umero jo de kilometros para cada uno de los n = 5 motores de combustion interna, que llevan cobre y plomo
como material de antifriccion, obteniendose los siguientes resultados:
5
40 3
44 6
49 8
55 8
42.
Se pide:
a) Determinar la media, mediana, varianza y cuasivarianza para esta muestra de cinco motores.
b) Si se supone que la distribucion del desgaste del eje es normal y se considera = 0
05, estudiar si la
informacion muestral sugiere que la media poblacional es mayor de 4 10
4
pulgadas.
c) Obtener el mnimo tama no muestral necesario para estimar mediante un intervalo de conanza con nivel
de conanza 0
95 y un error de estimacion menor o igual de 0
5, si se sabe que la desviacion tpica poblacional

() es 2 10
4
pulgadas.
M
ETODOS ESTAD
IA
SOLUCIONES
TEST
N
o
Respuesta
1. d)
2. b), c)
3. b), c)
4. c)
5. c)
6. b)
7. c)
8. e)
9. a)
10. e)
11. d)
12. c)
13. e)
14. d)
15. c)
16. a), b), c)
17. c)
18. c)
19. b)
20. b), d)
21. b)
22. b)
23. a), b)
24. d)
25. c)
26. c)
27. e)
28. a), c)
29. b), d)
30. b), c)
EJERCICIOS
N
o
Respuesta
1. Ejercicio 6.8
2. Ejercicio 5.8
3. Ejercicio 8.17
4. Ejercicio 9.13
M
ETODOS ESTAD
IA
Convocatoria de Septiembre - 9 de Septiembre de 2003
TEST
0
1
2
3
4
5
6
7
-1 0 1 2 3 4 5 6 7 8 9 10
Frecuencia absoluta
1. El diagrama de barras adjunto representa la temperatura mnima en un
determinado lugar durante un mes de 30 das. Se cumple que:
a) La mediana es 5.
c) La moda es 3.
e) Todo falso.
b) El rango es 4.
d) La media es 3.
2. A partir del mismo diagrama de la pregunta anterior, podemos asegurar
que,
a) El cuartil de orden uno es 2.
c) El cuartil de orden tres es 6.
e) Todo falso.
b) El cuartil de orden dos es 3.
d) El rango es 11.
x
i
F
i
0 1/5
1 7/10
2 1
3. A partir de la tabla de distribucion de frecuencias acumuladas relativas
adjunta, podemos armar que,
a) La media de la muestra es 1.
c) La media de la muestra es 11.
e) Todo falso.
b) La mediana de la muestra es 1.
d) La mediana de la muestra es 11.
4. Con los datos de la pregunta anterior se tiene que el porcentaje de observaciones del valor 2 ha sido:
a) 20 %; b) 30 %; c) 50 %; d) 70 %; e) 100 %.
5. Se tienen 2 barajas espa nolas con 40 cartas cada una. La probabilidad de que al sacar una carta de cada
baraja, se obtengan dos ases de oros es:
a) 1/20; b) 2/40; c) 1/1600; d) 2/400; e) Todo falso.
6. De un grupo de cuatro hombres y cinco mujeres se forma un comite de tres miembros con dos hombres y
una mujer y con la condicion de que el hombre de mayor edad, solo hay uno, debe de estar integrado en el. El
n umero de comisiones posibles es:
a) 84; b) 30; c) 15; d) 40; e) Todo falso.
7. Sean A y B dos sucesos independientes, con P(A) = 1/3 y P(B) = 3/4. Se tiene que P(A/A B) es:
a) 1; b) 0; c) 025; d) 075; e) Todo falso.
8. Una urna contiene 2 bolas. Se sabe que, o bien todas las bolas son blancas o bien hay una bola blanca
y una negra. La probabilidad de que la urna contenga una bola negra es 2/3. Se realiza una extraccion sin
reemplazamiento y resulta ser una bola blanca. La probabilidad de que la segunda bola extrada sea negra es:
a) 2/9; b) 7/9; c) 1/6; d) 1/2; e) Todo falso.
Las preguntas 9. y 10. hacen referencia al siguiente enunciado: Supongamos que el error al hacer cierta medicion
f(x) =
_
k(1 x)
2
si 1 < x < 1
0 en otro caso
a) 3/8; b) -2; c) 8/3; d) 0; e) Todo falso.
10. El error medio de medida es:
a) -1/2; b) -2/3; c) -4/3; d) 0; e) Todo falso.
11. Si la funcion de distribucion de una v.a. viene dada por:
F(x) =
_
_
0 si x < 0
1/8 si 0 x < 1
4/8 si 1 x < 2
7/8 si 2 x < 3
1 si 3 x
entonces una mediana de es:
a) 15; b) 1; c) 05; d) 2; e) Todo falso.
12. La media de la v.a. de la pregunta anterior es:
a) 05; b) 15; c) -05; d) 35; e) Todo falso.
13. Una fabrica produce un 1 % de fusibles defectuosos. En el departamento de Control de Calidad eval uan
el n
o
de fusibles buenos observados hasta encontrar el primero defectuoso. La probabilidad de que se hayan
observado 5 fusibles buenos es:
a) 1; b) 3/100; c) 100/3; d) 97/3; e) Todo falso.
14. Sea una v.a. con distribucion N(0, ). Se tiene que P(|| > k) es aproximadamente igual a:
a) 0
3173, si k = 1;
d) 0

b) 0
0455, si k = 2;
e) 1

c) 0
9973, si k = 3;
Las preguntas 15. a 17. hacen referencia al siguiente enunciado: Sea (, ) una v.a. bidimensional con funcion
de densidad conjunta:
f(x, y) =
_
xe
(x+y)
si x > 0, y > 0
0 en otro caso
15. Se verica que:
d) Cov[, ] = 0;
e) Todo falso.
c) Cov[, ] = 0;
16. Se verica que:
a) E[] = V ar[]; b) E[
2
] = V ar[]; c) E[] = V ar[]; d) E[
2
] = V ar[]; e) Todo falso.
17. Se verica que:
a) E[/ = y] = V ar[/ = y];
d) E[
2
/ = x] = V ar[/ = x];
b) E[
2
/ = y] = V ar[/ = y];
e) Todo falso.
c) E[/ = x] = V ar[/ = x];
18. Dada una v.a. con media 12 y varianza 9, se tiene siempre que P(6 < < 18) es mayor o igual que:
a) 095; b) 1/4; c) 3/4; d) 1/2; e) Todo falso.
19. La venta diaria de una fabrica sigue una distribucion uniforme entre 20 y 30 mil euros. Despues de
transcurridos 182 das de venta, y suponiendo las ventas diarias independientes, la probabilidad de haber vendido
mas de 55 millones de euros (5500 miles de euros) es aproximadamente:
a) 1; b) 2; c) 1/2; d) -3; e) Todo falso.
20. Un instituto de opinion p ublica quiere hacer una encuesta para conocer la proporcion de individuos que
se maniestan dispuestos a comprar un nuevo producto. El n umero de personas a las que se debe de preguntar
si se quiere cometer un error menor de 01 con una probabilidad de al menos 099 es suciente con que sea:
a) Menor de 50; b) Menor de 75; c) Menor de 100; d) Mayor de 165; e) Todo falso.
21. Sean
1
,
2
, . . .
n
n v.a.i.i.d. con media y varianza
2
. La v.a. =
1
+ +
n
seguira, para n sucien-
temente grande, una distribucion
a) N(n , n );
c) N(n ,
n );
e) Todo falso.
b) Aproximadamente N(n , n );
d) Aproximadamente N(n ,
n );
22. Sea (
1
, . . . ,
n
n
i=1
_
_
2
a) N(0, 1); b) N(0, 1/
n); c)
2
n1
; d)
2
n
; e) Todo falso.
23. Sea (
1
, . . . ,
n
n
i=1
_
_2
a) N(0, 1); b) N(0, 1/
n); c)
2
n1
; d)
2
n
; e) Todo falso.
24. Si (2, 7, 4, 3) es el resultado de una m.a.s. de tama no 4, procedente de una distribucion uniforme U(1, )
con > 1, entonces la estimacion maximo verosmil de es:
a) 3; b) 4; c) 7; d) 8; e) Todo falso.
25. Con una muestra de los diametros de 26 cojinetes se ha obtenido una varianza muestral S
2
= 0
64mm
2
.
Se supone que los diametros siguen una distribucion normal. Un intervalo de conanza para la desviacion tpica
poblacional al nivel 0
a) (45
34, 90
32); b) (95
46, 97
24); c) (123
32, 123
33); d) (0
61, 1
20); e) (3, 2).

26. Se desea contrastar la hipotesis de que la media de una poblacion de varianza 100 es cero, frente a
la alternativa = 0. Para ello se dispone de una m.a.s. de tama no 100. Una region crtica al nivel 0
1 es
S
1
= {(x
1
, x
2
, . . . , x
100
)/x
100
/ A}, siendo A aproximadamente:
a) (1
645, ); b) (1
645, 1
645); c) (1
96, 1
96); d) (1
96, ); e) Todo falso.

2
1
y
2
2
n
1
= 31 y n
2
= 25, que permiten calcular las siguientes cuasivarianzas muestrales

S
2
1
= 16
6 y

S
2
2
= 10. Con
estos datos, si se realiza el contraste H
0
:
2
1

2
2
frente a H
1
:
2
1
>
2
2
, se obtiene que:
a) Se rechaza H
0
al nivel = 0
05;
c) El nivel crtico o p-valor es menor de 0
05;
e) Todo falso.
b) Se rechaza H
0
al nivel = 0
01;
d) El nivel crtico o p-valor es menor de 0
01;
28. Consideremos un contraste del tipo H
0
: =
0
1
: =
1
(hipotesis nula y
alternativa simples). En este caso la suma de la probabilidad de error de tipo II y la potencia es:
a) Siempre uno;
d) Siempre mayor que cero;
b) Siempre menor que uno;
e) Todo falso.
c) A veces menor que uno;
Fuente de
variacion
Suma de
cuadrados
Grados de
libertad
Media
cuadratica
Total 28203 43
05;
05;
05, faltan datos;

e) Todo falso.
05;
05;
e) Todo falso.
M
ETODOS ESTAD
IA
EJERCICIOS
1. (125 puntos) Una fabrica A produce paquetes de un determinado producto cuyo peso, debido a uctuaciones
aleatorias en el proceso de produccion, es una variable aleatoria con distribucion normal. Se sabe que la
probabilidad de que un paquete pese menos de 160gr. es 0
02275, mientras que la probabilidad de pesar menos

de 163gr. es 0
841345.
a) Obtener la media y la varianza de la v.a. .
b) Si se eligen al azar 5 paquetes de los producidos por dicha fabrica, cual es la probabilidad de que exacta-
mente 2 pesen menos de 160gr.?
c) Un supermercado recibe un 70 % de los paquetes de dicho producto de la fabrica A, y el 30 % restante de
una fabrica B de la que se sabe que la v.a. peso del paquete sigue una distribucion uniforme U(159, 161).
Con estos datos, cual es la probabilidad de que un paquete elegido al azar entre los que se venden en ese
supermercado haya sido producido por la fabrica B, si se sabe que pesa mas de 160gr.?
2. (125 puntos) Las longitudes de una pieza de acero rectangular se representan mediante dos variables
aleatorias independientes y , cada una de ellas con distribucion uniforme en (0, 2). Calcular la probabilidad
de que se verique simultaneamente que el producto de las longitudes de una pieza sea menor que uno y el
cociente / sea menor que dos.
3. (125 puntos) Los registros de la Direccion de Vehculos de Motor indican que de todos los vehculos que se
sometieron a la prueba de vericacion de emisiones durante el a no anterior, el 60 % pasaron la prueba al primer
intento. Una muestra aleatoria de 100 automoviles probados durante el a no actual indica que 70 pasaron en la
prueba inicial.
a) Existen evidencias sucientes para concluir, a un nivel de signicacion = 0
05, que la proporcion de

automoviles que pasan la prueba inicial es superior este a no que el anterior?
b) Calcular el nivel crtico o p-valor del contraste.
c) Obtener un intervalo de conanza al 95 % para la proporcion de automoviles que pasaran este a no la prueba
inicial.
4. (125 puntos) Un fabricante realiza un experimento encaminado a investigar el efecto del nivel de suministro
de materia prima y la proporcion de su asignacion a la lnea de fabricacion de un producto. Los niveles de
suministro escogidos para el experimento fueron 15, 18 y 21 Tm; los niveles de proporcion de asignacion a la
lnea de produccion fueron 1/2, 1/3 y 1/4. La variable respuesta fue el benecio por unidad producida.
Se realizaron tres repeticiones del experimento para cada nivel y proporcion, obteniendose los siguientes datos:
NIVEL DE SUMINISTRO
15 18 21
PROPORCI
ON 1/2 x
111
, x
112
, x
113
x
121
, x
122
, x
123
x
131
, x
132
, x
133
DE 1/3 x
211
, x
212
, x
213
x
221
, x
222
, x
223
x
231
, x
232
, x
233
ASIGNACI
ON 1/4 x
311
, x
312
, x
313
x
321
, x
322
, x
323
x
331
, x
332
, x
333
Con estos datos, y suponiendo que se verican las hipotesis previas, se realizo un analisis de la varianza,
obteniendose las siguientes sumas de cuadrados:
Variacion total: Q = 118
00; Variacion debida al suministro: Q

2
= 50
22
Variacion debida a la proporcion: Q
1
= 8
22 Variacion debida al error: Q

4
= 43
33
Completar la tabla ANOVA y obtener las conclusiones correspondientes.
M
ETODOS ESTAD
IA
SOLUCIONES
TEST
N
o
Respuesta
1. c)
2. a), b), c), d)
3. b), c)
4. b)
5. c)
6. c)
7. b)
8. d)
9. a)
10. a)
11. a), b), d)
12. b)
13. e)
14. a), b)
15. a), c)
16. a), c)
17. a), c)
18. b), c), d)
19. e)
20. d)
21. d)
22. d)
23. c)
24. c)
25. d)
26. b)
27. e)
28. a), d)
29. b), d)
30. b)
EJERCICIOS
N
o
Respuesta
1. Ejercicio 4.13
2. Ejercicio 5.9
3. Ejercicio 9.14
4. Ejercicio 10.9
M
ETODOS ESTAD
IA
Convocatoria de Febrero - 17 de Febrero de 2004
TEST
1. El siguiente diagrama de tallo y hojas representa el resumen de una muestra de unidades defectuosas. Se
cumple que:
5 9
6 1225559
7 0011225
d) El tama no de la muestra es 15;
b) El rango es 75;
e) Todo falso.
2. A partir del mismo diagrama de la pregunta anterior, podemos asegurar que,
d) El percentil de orden 50 es 50;
e) Todo falso.
c) El valor mnimo es 9;
3. Los resultados del lanzamiento de un dado diez veces fueron (5,2,5,5,3,1,1,4,2,4), podemos armar que,
a) La media es 35;
d) La moda es 5;
b) Una mediana es 35;
e) Todo falso.
c) La moda es 6/7;
4. En una empresa se han producido cuatro cortes independientes de uido electrico durante un n de semana.
Si los dos das (sabado y domingo) tienen la misma probabilidad de sufrir cortes electricos, la probabilidad de
que haya habido alg un corte los dos das del n de semana es:
a) 1; b) 7/8; c) 1/16; d) 0; e) Todo falso.
Las preguntas 5. a 8. hacen referencia al siguiente enunciado: Supongamos que el n umero de veces que falla un
sistema informatico es una v.a. con distribucion de probabilidad:
P( = x) =
_
k
2
x
x!
si x = 0, 1, 2, . . .
0 en otro caso.
a) -1; b) -2; c) -3; d) 0; e) Todo falso.
6. El n umero medio de fallos es:
a) -1; b) -2; c) -3; d) 2; e) Todo falso.
7. La probabilidad de que el n umero de fallos este entre -01 y 01 es:
a) 1; b) 092; c) e
2
; d) 0; e) Todo falso.
8. Suponiendo que existe un coste adicional de
2
euros. El coste medio adicional es:
a) 1; b) 6; c) -1495; d) 120; e) Todo falso.
9. El n
o
de llamadas de telefono a una centralita durante un periodo especco es una v.a. con distribucion de
Poisson. Si la probabilidad de que haya al menos una llamada durante un periodo es 2/3, entonces:
a) El n
o
medio de llamadas en un periodo es ln(3);
b) La probabilidad de que haya habido exactamente una llamada es ln(3)/3;
o
de llamadas por periodo es ln(3);
o
de llamadas por periodo es ln(3)/3;
e) Todo falso.
10. Sea una v.a. con distribucion N(, ), entonces P( > ) es igual a:
a) 084134; b) 002275; c) 05; d) Depende de ; e) Todo falso.
11. La suma de n variables aleatorias normales es:
a) Siempre normal;
c) Siempre normal si n < 30;
e) Todo falso.
b) Normal si los sumandos son independientes;
d) Siempre gamma;
12. Se eligen al azar e independientemente uno de otro dos n umeros reales del intervalo (1,3). La probabilidad
de que su producto sea inferior a 2 es:
a) 9725; b) Menor de 01; c) Mayor de 02; d) No se sabe; e) Todo falso.
13. El diametro interior de un anillo de piston seleccionado al azar es una v.a. con media 12 cm y desviacion
tpica 004 cm. Si

64
es el diametro medio de una muestra aleatoria de tama no n = 64, la desviacion tpica de
la media muestral

64
es:
a) 004; b) 00002; c) 0005; d) 12; e) Todo falso.
14. Al muestrear una poblacion N(0, ), el estadstico
n1
S
n
a)
2
n1
; b) t
n1
; c) N(0, 1); d) t
n
; e) Todo falso.
15. Sea un parametro poblacional y T un estimador de tal que: E(T) = 0, entonces se dice que T es
un estimador:
a) Centrado;
d) De varianza mnima;
b) Insesgado;
e) Todo falso.
c) Consistente;
16. Se prueba un nuevo farmaco para combatir una enfermedad, en una muestra de 144 enfermos resulta ecaz
para 81 de ellos. Un intervalo de conanza para la proporcion de enfermos curados es aproximadamente:
a) (048 ; 064) al nivel 95 %;
d) (9043 ; 10405) al nivel 80 %;
b) (049 ; 063) al nivel 99 %;
e) Todo falso.
c) (046 ; 067) al nivel 90 %;
17. La duraciones de dos tipos de circuitos integrados se suponen normales con medias
1
y
2
, respectivamente
y VARIANZAS IGUALES. Se toman sendas muestras de tama nos n
1
= 12 y n
2
= 11, que permiten calcular
las siguientes medias muestrales x
12
= 1400 horas y y
11
= 1500 horas y las correspondientes varianzas muestrales
s
2
1
= 900 y s
2
2
= 289. Con estas informaciones realizamos el contraste H
0
:
1
=
2
frente a H
1
:
1
=
2
y al
nivel de signicacion 01:
c) No se rechaza H
0
;
e) Todo falso.
b) Se rechaza H
0
;
0
pero al nivel 005 s;
18. Las duraciones de 5 memorias electronicas seleccionadas al azar son: 25, 17, 23, 28 y 29. El nivel crtico
para contrastar si la distribucion de la poblacion es exponencial de media 2 (parametro 1/2) es:
a) Menor de 005; b) 0995; c) Menor de 0005; d) Mayor de 0995; e) Todo falso.
Las preguntas 19. y 20. hacen referencia al siguiente enunciado: La siguiente tabla proporciona los resultados
del ANOVA que trata de investigar si cinco marcas de pintura tienen igual duracion media. Desgraciadamente
Fuente de variacion
Suma de
cuadrados
g.l.
Media
cuadratica
TOTAL 181008 51
a) La marca no inuye al nivel = 0
05;
e) Todo falso.
b) La marca inuye al nivel = 0
05;
05;
a) Las medias correspondientes a las duraciones de las diferentes marcas son iguales al nivel = 0
05;
b) Las medias correspondientes a las duraciones de las diferentes marcas no son iguales al nivel = 0
05;
e) Todo falso.
M
ETODOS ESTAD
IA
EJERCICIOS
1. (125 puntos) El tiempo de fabricacion de una pieza es una v.a. con funcion de densidad:
f
(x) =
_
1/2 si 10 < x < 12,
0 en el resto.
2. (125 puntos) En una fabrica de vidrio se sabe que los defectos en cada plancha de vidrio aparecen de manera
independiente y por causas atribuibles al azar, por lo que la distribucion del n umero de defectos por plancha se
puede suponer de Poisson. El n umero medio de defectos por cada plancha es 1.
a) Si una plancha se rechaza cuando presenta cuatro o mas defectos, cual es la probabilidad de que una
plancha elegida al azar sea rechazada?
b) Calcular la probabilidad de que sea necesario revisar diez planchas para encontrar la primera que se rechace.
c) Si se revisan 1000 planchas independientes, cual es la probabilidad de que se rechacen como mucho 20?
3. (125 puntos) Algunas plantas de electricidad estan situadas cerca de ros u oceanos con objeto de que el
agua disponible pueda utilizarse para enfriar los condensadores. Suponga que, como parte de un estudio sobre
impacto ambiental, una compa na de electricidad desea estimar la temperatura media del agua que descarga de
su planta.
a) Encontrar el tama no muestral mnimo necesario para poder estimar la verdadera temperatura media con
un error de estimacion menor o igual de 05 y un coeciente de conanza mayor o igual que 095, sabiendo
que la desviacion tpica poblacional es = 1
o
C.
b) Considerando una muestra de tama no n = 100, en la que la media muestral es de 22
o
C, obtener un intervalo
de conanza de la temperatura media poblacional () al nivel de conanza 0
95.
c) Realizar de nuevo el apartado a) si se supiese ademas que la temperatura del agua sigue una distribucion
normal.
4. (125 puntos) El tiempo de respuesta de un sistema informatico a las doce horas de un da laborable se supone
normalmente distribuido con desviacion tpica desconocida. Se observa una muestra de 41 datos obteniendose:
2256 - 2233 - 2458 - 2314 - 1903 - 2676 - 1833 - 231 - 2153 - 906 - 1675
2329 - 2214 - 1628 - 1889 - 2748 - 1044 - 2686 - 2727 - 1874 - 1988
1576 - 3077 - 2116 - 2426 - 229 - 2714 - 1802 - 2153 - 2499 - 1981
1188 - 2401 - 2211 - 2191 - 1435 - 1114 - 993 - 2022 - 1773 - 1905
La media y varianza muestrales de los anteriores datos son: x
41
= 20
42; s
2
= 25
82, respectivamente.
a) Es razonable mantener la hipotesis H
0
: = 5 frente a la alternativa contraria (H
1
: = 5) al nivel 0
05?
b) Calcular el nivel crtico o p-valor del contraste siguiente: H
0
: 20 frente a H
1
: > 20.
M
ETODOS ESTAD
IA
SOLUCIONES
TEST
N
o
a) b) c) d) e)
1. X X
2. X
3. X X
4. X
5. X
6. X
7. X
8. X
9. X X X
10. X
11. X
12. X
13. X
14. X
15. X X
16. X
17. X
18. X
19. X X
20. X X
EJERCICIOS
N
o
Respuesta
1. Ejercicio 3.17
2. Ejercicio 6.9
3. Ejercicio 8.18
4. Ejercicio 9.15
M
ETODOS ESTAD
IA
TEST
Las preguntas 1. y 2. hacen referencia al siguiente enunciado: El histograma adjunto representa el resumen de
una muestra de consumo de 45 coches.
235 24 245 25 255 26 265
1
2
3
4
5
6
7
8
9
10
1. Se cumple que:
a) Me = 1/2; b) p
2/4
= 0
5; c) p
1/4
= 0
25; d) x = 8; e) Todo falso.

2. Se tiene que, aproximadamente,
a) Me = 2; b) x = 24
89; c) Mo = 2; d) x = 5; e) Todo falso.

3. Una cadena de grandes almacenes tiene cinco establecimientos. Los porcentajes de incremento de ventas
respecto a las obtenidas en el a no anterior de los cinco establecimientos fueron: 31, 59, 19, 68 y 59.
a) x = 5
9; b) Me = 5
9; c) Mo = 5
9; d) x = 4
72; e) Todo falso.

4. Sean A y B dos sucesos de un espacio probabilstico (, A, P), con P(A) = 0
75 y P(B) < 1. Entonces

P(A B/B) es igual a:
a) 1; b) 0; c) 025; d) 075; e) Todo falso.
5. Sean A y B dos sucesos de un espacio probabilstico (, A, P). Entonces, P(A B/B) es siempre igual a:
a) P(A); b) P(B); c) P(A/B); d) 1; e) Todo falso.
Las preguntas 6. y 7. hacen referencia al siguiente enunciado: Supongamos que la medida de los diametros de
los tubos fabricados en una factora es una v.a. con funcion de densidad:
f(x) =
_
k(2x 1) si 1 < x < 2
0 en otro caso.
6. Se tiene que:
a) El valor de k es 2;
c) No es una funcion de densidad por ser decreciente;
e) Todo falso.
b) La mediana de es 0.5;
d) P( = 1
5) = 0
5;
7. El diametro medio de los tubos es:
a) -1; b) -2; c) -3; d) 19/12; e) Todo falso.
8. La probabilidad de que una v.a. con distribucion normal N(0, 1) tome un valor par es:
a) 075; b) 025; c) 05; d) 0; e) Todo falso.
9. La vida de una componente sigue una distribucion exponencial. La probabilidad de que la vida de una de
esas componentes sea mas peque na que su vida media es siempre igual a:
a) 1; b) 1 e
1
; c) e

10. Dadas dos variables aleatorias (, ) con la siguiente funcion de densidad conjunta, se tiene que:
f
(,)
(x, y) =
_
e
(x+y)
si x > 0, y > 0,
0 en otro caso.
d) f
(y) = f
/=2
(y);
e) Todo falso.
c) f
(x) = f
/=2
(x);
11. Sean
1
,
2
, . . . ,
n
variables aleatorias independientes e igualmente distribuidas con media y varianza nitas
y sea =
1000
i=1
i
. La probabilidad de que tome un valor que diera de su media en menos que el valor de su
desviacion tpica, es decir, P(
< <
), es:
a) 0
66, por la desigualdad de Tchebychev;

c) 0
68, por el Teorema Central del Lmite;

e) Todo falso.
b) No se puede conocer;
d) > 23, por el Teorema de Bayes;
12. Sea una v.a. con media y varianza
2
, nitas. Entonces P(| | < k) es mayor o igual que:
a) 0, si k = 1; b) 3/4, si k = 2; c) 8/9, si k = 3; d) 15/16, si k = 4; e) Todo falso.
13. Sean y dos variables aleatorias independientes con distribuciones N(0, 1) y
2
n
, respectivamente. En-
tonces la v.a. =

/n
14. Sean y dos variables aleatorias independientes con distribuciones
2
n
y
2
m
, respectivamente. Entonces
la v.a. =
m
n
15. Sea (
1
,
2
, . . . ,
n
de la probabilidad de fracaso q (q = 1 p) es:
a)
n
; b) 1/
n
; c) 1
n
; d) 1 (1/
n
); e) Todo falso.
16. Sea un parametro poblacional y T un estimador de tal que E[T] = , se dice que T es un estimador:
a) Centrado; b) Insesgado; c) Consistente; d) Sesgado; e) Todo falso.
17. La probabilidad de error de tipo I es la probabilidad de que:
a) H
0
sea falsa;
c) Se rechace H
0
e) Todo falso.
b) Sea falsa H
0
y esta se rechace;
d) Sea falsa H
1
y esta se rechace;
18. Durante 49 das, se ha observado la variable n umero diario de averas en una factora, anotandose la
siguiente tabla de frecuencias:
N
o
de averas 0 1 2 >2
Frecuencias (n
o
de das) 16 23 10 0
Si con los datos anteriores se contrasta la hipotesis de que la distribucion de la variables es de Poisson, esta se
rechaza al nivel:
a) 005; b) 001; c) 02; d) 0001; e) Todo falso.
incompleta, los resultados del ANOVA que trata de investigar si determinado factor inuye sobre una variable
respuesta.
Fuente de variacion
Suma de
cuadrados
g.l.
Media
cuadratica
Entre-niveles (Factor) 2 697
Dentro de los niveles (Error)
TOTAL 17
19. A partir de la informacion de la tabla anterior, podemos armar que:
05;
e) Todo falso.
05;
05;
a) Las medias correspondientes a los niveles del factor se pueden suponer iguales al nivel = 0
05;
05;
e) Todo falso.
M
ETODOS ESTAD
IA
EJERCICIOS
1. (125 puntos) El tiempo de vida, en a nos, de un tipo de generador electrico viene representado por una
variable aleatoria con funcion de densidad:
f(x) =
_
4
3
x
2
si 0 < x < 1,
0 en otro caso.
Se pide:
a) Calcular el tiempo medio de vida de un generador electrico de este tipo.
b) Calcular la probabilidad de que un generador dure mas de su media.
c) Obtener la funcion de probabilidad de la variable =
_
1 si > 5/12
0 si 5/12
.
2. (125 puntos) Los das que el proceso de fabricacion esta ajustado, el 90 % de las piezas producidas son
correctas. Por motivos incontrolables, el 5 % de los das, el proceso de produccion no esta ajustado, siendo
entonces el porcentaje de piezas producidas defectuosas del 30 %.
a) Si un da cualquiera se eligen al azar 4 piezas para inspeccion, de las cuales una resulta ser defectuosa, cual
es la probabilidad de que ese da el proceso estuviese ajustado?
b) Se decide parar la produccion para revisar la cadena si de una muestra aleatoria de 4 piezas hay al menos
una defectuosa. Cual es la probabilidad de cometer un error, es decir, cual es la probabilidad de parar la
produccion y que el proceso este ajustado o de no pararla y que el proceso este desajustado?
3. (125 puntos) Un hormigon de microslice, reforzado con bra de acero y mezclado en h umedo (llamado
shotcrete), que se utiliza mucho en Escandinavia, ya se esta comercializando en Estados Unidos. A n de
investigar la resistencia a la ruptura del nuevo producto, se considero una muestra aleatoria de cinco trozos de
shotcrete. Dichos trozos fueron sometidos a una comprension de 9000 psi hasta que fallaron. Los tiempos de
fallo fueron 33, 35, 42, 38 y 52 das. Si suponemos que el shotcrete tiene una distribucion de tiempo de fallo
exponencial (exp(1/)) cuando se somete a 9000 psi de compresion, se pide:
a) Obtener la estimacion maximo verosmil del tiempo medio de vida de este material, considerando los datos
de la muestra de 5 trozos.
b) Obtener, a partir del estimador maximo verosmil, un intervalo de conanza para el tiempo medio de vida
de este material, con nivel de conanza del 95 %.
4. (125 puntos) Una marca de detergentes arma que el contenido de sus paquetes pesa al menos 200gr
por termino medio. Una muestra aleatoria de n = 9 paquetes presento una media muestra x
9
= 203
5gr y
una desviacion tpica muestral s = 7
07gr. Suponiendo que la distribucion es normal, contesta a los siguientes

apartados, DETALLANDO TODOS LOS PASOS:
a) Contrastar al nivel 005 la hipotesis nula de que el peso medio de la poblacion es al menos 200gr.
b) Hallar el p-valor del contraste anterior.
c) Si el contraste fuese bilateral en lugar de unilateral (es decir, H
0
1
: =
200), con los mismos resultados muestrales, calcular el p-valor de este nuevo contraste.
M
ETODOS ESTAD
IA
SOLUCIONES
TEST
N
o
a) b) c) d) e)
1. X
2. X
3. X X X
4. X
5. X
6. X
7. X
8. X
9. X
10. X X X
11. X
12. X X X X
13. X
14. X
15. X
16. X
17. X
18. X
19. X X
20. X X
EJERCICIOS
N
o
Respuesta
1. Ejercicio 3.18
2. Ejercicio 4.14
3. Ejercicio 8.19
4. Ejercicio 9.16
M
ETODOS ESTAD
IA
TEST
Las preguntas 1. y 2. hacen referencia al siguiente enunciado: El diagrama de caja adjunto representa el resumen
de una muestra.
10
8
6
4
2
9
7
5
3
1
0
1. A partir del diagrama anterior, podemos armar siempre que:
a) Mo = 8; b) x = 3; c) Me = 0
5; d) p
1/4
= 2; e) Todo falso.
2. A partir del diagrama anterior, podemos armar siempre que:
a) El valor maximo de la muestra es 5;
c) El percentil de orden 75 es 4;
e) Todo falso.
b) El recorrido intercuartlico es 4;
d) Un valor atpico es 8;
3. Si la media de una muestra de tama no 10 es 50, podemos asegurar que:
a) Cinco elementos de la muestra son mayores o iguales que 50 y cinco son menores o iguales que 50;
b) Al menos un valor de la muestra es menor o igual que 50;
c) El valor mas frecuente es el 50;
d) Al menos un valor de la muestra es mayor o igual que 50;
e) Todo falso.
4. Una moneda perfecta se lanza hasta que por primera vez aparece dos veces seguidas el mismo resultado. La
probabilidad de que el experimento termine antes del cuarto lanzamiento es:
a) 84; b) 05; c) 0333; d) 075; e) Todo falso.
5. Un conjunto electrico consta de dos componentes A y B. La probabilidad de que falle A es 0
3, la probabilidad
de que falle B es 0
2 y la probabilidad de que fallen ambos simultaneamente es 0
1. Entonces la probabilidad
de solo falle B es:
a) 0
3; b) 0
1; c) 0
06; d) 0
44; e) Todo falso.

6. Sean A y B dos sucesos de un mismo espacio probabilstico (, A, P). Se cumple siempre que:
a) P(A B) P(A) +P(B) 1;
b) P(A B) = P(A) P(A B);
c) Si A y B son independientes, entonces A y B tambien lo son;
d) P(A B) = P(A) P(B);
e) Todo falso.
7. Sea una v.a. de media y varianza
2
y sea c una constante cualquiera. Entonces E[ c]
2
es siempre
igual a:
a)
2
c
2
; b) 0, si c = 0; c) ( c)
2
; d)
2
+
2
+c
2
2c; e) Todo falso.
8. Sea una v.a con distribucion chi-cuadrado
2
4
, entonces 3 sigue una distribucion:
a)
2
6
; b) (2, 3/2); c) exp(2); d) (2, 1/6); e) Todo falso.
9. La vida de una componente sigue una distribucion exponencial. La probabilidad de que la vida de una de
esas componentes sea mas peque na que su vida media es siempre igual a:
a) 1; b) 1 e
1
; c) e

10. Sea (, ) la v.a. bidimensional que representa el radio () y la longitud () de una circunferencia (Recuerda
que la relacion entre el radio y la longitud de una circunferencia es: = 2). Si la varianza del radio es
2
, la
varianza de la longitud es siempre:
a)
2
/(4
2
); b) 4
2
2
; c) 2
2
; d)
2
/(2); e) Todo falso.
11. Con los datos de la pregunta anterior, la covarianza entre las variables y es:
a) 0; b) 1; c) 1; d) 2
2
; e) Todo falso.
12. Un proceso de fabricacion produce el 10 % de artculos defectuosos. Si se seleccionan al azar 100 artculos,
2
n
, respectivamente. En-
tonces la v.a. = n
2
/ sigue una distribucion:
a) F
1
n
; b) t
n
; c)
2
n
; d) F
n
1
; e) Todo falso.
14. Sea (
1
,
2
, . . . ,
n
) una m.a.s. de una poblacion de Poisson de parametro . El estimador maximo verosmil
de la desviacion tpica de la poblacion es:
a)
n
; b)
n
; c) 1
n
; d) 1 (1/
n
); e) Todo falso.
15. Sea un parametro poblacional y T
n
una sucesion de estimadores de tal que lm
n
E[T
n
] = , se dice
que T
n
es una sucesion:
a) Centrada;
b) Insesgada;
e) Todo falso.
c) Consistente;
16. De una muestra de tama no 100 de una poblacion NO normal con varianza poblacional 144, se ha obtenido
una media muestral x
100
= 25. Un intervalo de conanza para la media poblacional al nivel 0
90 es aproxima-
damente:
a) (44335,90323); b) (23026,26974); c) (12332,12333); d) (8595,10405); e) Todo falso.
17. La probabilidad de error de tipo II es la probabilidad de que:
a) H
0
sea falsa;
d) Sea falsa H
1
y esta se rechace;
b) Sea falsa H
0
y esta se rechace;
e) Todo falso.
c) Se rechace H
0
cuando esta sea
cierta;
18. Las duraciones de 5 memorias electronicas seleccionadas al azar son: 137, 162, 354, 070 y 265. La
hipotesis los datos proceden de una poblacion normal, se rechaza al nivel:
a) 005; b) 002; c) 001; d) 0001; e) Todo falso.
Fuente de variacion
Suma de
cuadrados
g.l.
Media
cuadratica
Interaccion 4622 4
Error 4333 18
TOTAL
05;
e) Todo falso.
05;
d) El factor A inuye al nivel = 0
05;
e) Todo falso.
M
ETODOS ESTAD
IA
EJERCICIOS
1. (125 puntos) Una maquina utilizada en el control de calidad de la produccion, determina si una pieza debe
ser recticada o no, pero puede equivocarse. La probabilidad de que una pieza buena se rectique es 0
05 y la
de que se rectique una pieza que es defectuosa es 0
90. Si el 99 % de las piezas producidas son buenas y el resto

son defectuosas, se pide:
a) Cual es la probabilidad de que una pieza sea recticada?
b) cual es la probabilidad de que una pieza que se rectica sea buena?
c) cual es la probabilidad de que una pieza que se rectica sea defectuosa?
2. (125 puntos) Sean y los niveles de concentracion en ppm de dos contaminantes en una determinada
porcion de un tanque de agua. Si la funcion de densidad conjunta viene dada por:
f
(,)
(x, y) =
_
(x +y)/8000 si 0 < x < 20, 0 < y < 20,
0 en otro caso.
Se pide:
a) Obtener la probabilidad de que el nivel de concentracion total de los dos contaminantes (suma de los dos
niveles de concentracion) sea mayor de 30 ppm.
b) Obtener la funcion de densidad de condicionada a que toma el valor 10 ppm.
c) Obtener la media y la varianza de la distribucion anterior.
3. (125 puntos) Una empresa recibe un pedido de microcircuitos en lotes de 10 microcircuitos. Se sabe que
el 10 % de los microcircuitos son defectuosos y que se comportan de manera independiente con respecto a la
calidad.
a) Si la empresa recibe 200 lotes, cual es la probabilidad de que al menos 1800 de los microcircuitos no sean
defectuosos?
b) Suponiendo que se decide aceptar un lote si en una muestra con reemplazamiento de dos de los microcircuitos
no hay ninguno defectuoso, cual es la probabilidad de que ninguno de los diez microcircuitos de un lote
aceptado sea defectuoso?
4. (125 puntos) En un estudio para comparar el nivel de colesterol en jovenes, se midio el nivel de colesterol
de 11 jovenes que practican deporte, obteniendose un nivel medio de 157 mg/dl y una cuasidesviacion tpica
muestral s
1
de 40 mg/dl. Con 16 jovenes que no practican deporte los resultados fueron: un nivel medio de 187
mg/dl y una cuasidesviacion tpica muestral s
2
de 30 mg/dl. Si se supone que el contenido de colesterol en cada
grupo sigue una distribucion normal y que ambas variables son independientes, se pide:
a) Hallar un intervalo de conanza para el cociente de las varianzas, con coeciente de conanza 09.
b) Al nivel 01, se rechaza que el nivel medio de colesterol es igual para los jovenes deportistas que para los
no deportistas?
M
ETODOS ESTAD
IA
SOLUCIONES
TEST
N
o
a) b) c) d) e)
1. X
2. X X
3. X X
4. X
5. X
6. X X X
7. X
8. X
9. X
10. X
11. X
12. X
13. X
14. X
15. X
16. X
17. X
18. X
19. X
20. X X X
EJERCICIOS
N
o
Respuesta
1. Ejercicio 2.15
2. Ejercicio 5.10
3. Ejercicio 6.10
4. Ejercicio 9.17
M
ETODOS ESTAD
IA
Convocatoria de Junio - 6 de Julio de 2005
TEST
1. A partir del siguiente diagrama de caja, podemos asegurar que:
17
15
13
11
9
7
5
3
1
16
14
12
10
8
6
4
2
e) Todo falso.
2. Con los mismos datos de la cuestion 1, podemos asegurar que:
a) El cuartil de orden 3 de la muestra es 8;
c) El mayor valor de la muestra es 16;
e) Todo falso.
b) El cuartil de orden 1 de la muestra es 5;
d) 16 es un valor atpico;
3. Siguiendo con los datos de la cuestion 1, se cumple que:
a) El rango o recorrido de la muestra es 10;
c) El rango o recorrido de la muestra es 14;
e) Todo falso.
b) El rango o recorrido de la muestra es 8;
d) El recorrido intercuartlico de la muestra es 3;
4. En una sala de ordenadores hay diez PCs. libres, de los cuales tres no funcionan. Para trabajar en dicha
sala llegan a la vez cuatro alumnos. La probabilidad de que solo uno de los cuatro elija un ordenador defectuoso
es:
a) 6; b) 0525; c) 03333; d) 1/2; e) Todo falso.
5. Una fabrica produce un 4 % de fusibles defectuosos. En el departamento de Control de Calidad eval uan el
n umero de fusibles observados hasta encontrar el primero defectuoso. El n umero medio de esos fusibles evaluados
es:
a) 50; b) 4/100; c) 25; d) 48; e) Todo falso.
6. Sea una v.a. con distribucion (2, 1), entonces 2 sigue una distribucion:
a) (2, 2); b) (2, 1/2); c) exp(2); d)
2
4
; e) Todo falso.
7. Sea una v.a. con distribucion normal de media y varianza
2
. Entonces P(| | < k ) es aproxima-
damente igual a:
a) 1, si k = 1; b) 0
9545, si k = 2; c) 0
9973, si k = 3; d) 0, si k = 4; e) Todo falso.

8. Un proceso de fabricacion produce el 0
1 % de artculos defectuosos. Si se seleccionan al azar 10000 artculos,

9. Sean y dos variables independientes con distribuciones
2
n
y
2
m
, respectivamente. Entonces la v.a.
=
m
n
10. Sea (
1
,
2
, . . . ,
n
de p es:
a) 1/
n
; b)
n
; c) (
n
)
2
; d) (1/
n
)
2
; e) Todo falso.
11. Sea (
1
,
2
, . . . ,
n
) una m.a.s. de una poblacion con distribucion (, 1), es decir, su funcion de densidad
viene dada por: f(x, ) =
_
x
1
si 0 < x < 1,
0 en otro caso.
El estimador maximo verosmil del parametro es:
a) 1/
n
; b)
n
; c) (
n
)
2
; d) (1/
n
)
2
; e) Todo falso.
12. De una muestra de tama no 10 de una poblacion normal, se ha obtenido una media muestral x
n
= 25, y
una varianza muestral igual a 144. Un intervalo de conanza para la media al nivel 0
a) (45
335, 90
32); b) (23
03, 26
97); c) (123
3, 123
3); d) (17
67, 32
33); e) Todo falso.

13. En un intervalo de conanza para la varianza de una poblacion normal, si se disminuye el nivel de conanza,
entonces la longitud:
14. En un intervalo de conanza para la media de una poblacion normal, si se aumenta el nivel de conanza,
entonces la longitud:
15. Se observa el da laborable de la semana en que se produce una determinada avera, encontrandose que
de 180 veces que ocurrio, en 20 ocasiones la avera fue en lunes, 40 veces en martes, 22 veces en miercoles, 38
veces en jueves, 27 veces en viernes y 33 veces en sabado. El nivel crtico para contrastar si todos los das son
igualmente probables para producirse la avera es:
16. Con los datos de la cuestion anterior, la hipotesis Todos los das son equiprobables, se rechaza al nivel:
a) 005; b) 001; c) 01; d) 0001; e) Todo falso.
2
1
y
2
2
n = 16 y m = 25, que permiten calcular las siguientes cuasivarianzas muestrales s
2
1
= 0
298 y s
2
2
= 0
364. Con
estas informaciones, para el contraste H
0
:
2
1

2
2
frente a H
1
:
2
1
>
2
2
1:
c) No se rechaza H
0
;
e) Todo falso.
b) Se rechaza H
0
;
d) No se rechaza H
0
, pero al nivel 0
05 s se rechaza;
18. Con los mismos datos que en la cuestion anterior, para el contraste H
0
:
2
1
=
2
2
frente a H
1
:
2
1
=
2
2
, al
nivel de signicacion 0
1:
c) No se rechaza H
0
;
e) Todo falso.
b) Se rechaza H
0
;
d) No se rechaza H
0
, pero al nivel 0
05 s se rechaza;
Las preguntas 19. y 20. hacen referencia al siguiente enunciado: La siguiente tabla proporciona los resultados del
ANOVA que trata de investigar si determinado factor inuye sobre una variable respuesta, desgraciadamente
Fuente de variacion
Suma de
cuadrados
g.l.
Media
cuadratica
TOTAL 83267535 153
05;
c) El nivel crtico es menor de 0
05;
e) Todo falso.
05;
d) No es posible decidir, faltan datos;
a) Las medias correspondientes a los niveles del factor no son iguales al nivel = 0
05;
b) Las medias correspondientes a los niveles del factor son iguales al nivel = 0
05;
e) Todo falso.
M
ETODOS ESTAD
IA
EJERCICIOS
1. (125 puntos) Un producto farmaceutico se distribuye en envases de 100 comprimidos. Dos lneas de pro-
duccion pueden ser utilizadas para envasar el producto con probabilidades 0
45 (lnea I) y 0
55 (lnea II). Las

dos lneas pueden fallar como mucho en dos comprimidos a la hora de llenar los envases. As en la lnea I se
observa que el n umero de comprimidos por envase es de 102, 101, 100, 99 y 98, con probabilidades respectivas
de 0
02, 0
06, 0
88, 0
03 y 0
01 y las probabilidades respectivas para la lnea II son 0
03, 0
08, 0
83, 0
04 y 0
02.
a) Calcular la probabilidad de que un envase tenga el n umero correcto de pldoras.
b) Si un envase tiene el n umero correcto de pldoras, cual es la probabilidad de que proceda de la lnea I?
c) Cual es la probabilidad de que un comprador del producto reciba menos de 100 comprimidos?
2. (125 puntos) Una fabrica de televisores somete cada unidad fabricada a dos pruebas de control de calidad
A y B. Denominamos a la proporcion mensual de unidades que pasan la prueba A y a la proporcion mensual
de unidades que pasan la prueba B. La funcion de densidad conjunta de una variable aleatoria bidimensional
(, ) viene dada por:
f(x, y) =
_
k y si 0 < x < 1, 0 < y < 1,
0 en el resto.
Calcular:
a) El valor de k.
b) P( < ).
c) P(
z), siendo z un n umero real cualquiera en el intervalo (0, 1).

3. (125 puntos) La funcion de densidad de una v.a. viene dada por :
f(x, ) =
_
1
x
2
e
(lnx)
2
2
si 0 < x < ,
0 en otro caso.
a) Obtener, construyendolo paso a paso, el e.m.v. del parametro , a partir de una m.a.s. (
1
,
2
, . . . ,
n
) de
tama no n de la poblacion anterior.
b) Demostrar que la variable aleatoria = ln sigue una distribucion normal.
c) El estimador obtenido en el apartado a) es centrado para ?
d) Si n = 4 y la m.a.s. obtenida es (5
76, 3
49, 1, 7
39), calcular un intervalo de conanza para al nivel 0
95.
4. (125 puntos) Sean y las velocidades de acceso a la memoria central de dos procesadores P1 y P2.
Supongamos que N(
1
,
1
) y que N(
2
,
2
). Sean (
1
,
2
, . . . ,
21
) y (
1
,
2
, . . . ,
11
) dos m.a.s.
independientes de esas poblaciones. Los resultados de esas muestras proporcionan los siguientes datos:
21
i=1
x
i
= 130
5,
21
i=1
x
2
i
= 2866
8,
11
j=1
y
j
= 100
4 y
11
j=1
y
2
j
= 1403
1.
Con esos datos se puede suponer que las velocidades medias de los dos procesadores coinciden al nivel = 0
1?
M
ETODOS ESTAD
IA
SOLUCIONES
TEST
N
o
a) b) c) d) e)
1. X
2. X X X X
3. X X
4. X
5. X
6. X X
7. X X
8. X
9. X
10. X
11. X
12. X
13. X
14. X
15. X
16. X X
17. X
18. X
19. X X
20. X X
EJERCICIOS
N
o
Respuesta
1. Ejercicio 3.19
2. Ejercicio 5.11
3. Ejercicio 8.20
4. Ejercicio 9.18
M
ETODOS ESTAD
IA
TEST
Las dos preguntas siguientes hacen referencia al siguiente enunciado: Para una muestra de tama no 6, se ha
obtenido la siguiente tabla de frecuencias relativas acumuladas:
x
i
1 2 4
F
i
1/6 2/3 1
1. Si denotamos por x
6
a la media de la muestra y por Me a la mediana, podemos armar que:
a) x
6
= 2
5; b) Me = 2
5; c) x
6
= 2; d) Me = 2; e) Todo falso.
2. El n umero de veces que se ha obtenido el valor 2 en esta muestra es:
a) 3; b) 1; c) 2; d) 4; e) Todo falso.
3. Se lanza un dado cuatro veces, la probabilidad de obtener un uno en el primer lanzamiento, un dos en el
segundo, un tres en el tercero y un cuatro en el ultimo es:
a) 1/4; b) 1/15; c) 1/1296; d) 1/54; e) Todo falso.
4. Una moneda perfecta se lanza hasta que por primera vez aparece dos veces seguidas el mismo resultado. La
probabilidad de que el experimento termine como mucho en el tercer lanzamiento es:
a) 84; b) 05; c) 0333; d) 075; e) Todo falso.
5. Un conjunto electrico consta de dos componentes A y B. La probabilidad de que falle A es 07 y la proba-
bilidad de que falle B es 04. Entonces la probabilidad de que fallen ambos simultaneamente es:
a) Mayor o igual que 011;
c) 028 si fallan de manera independiente;
e) Todo falso.
b) 028;
d) Menor o igual que 01;
6. Si el n umero de coches que llegan a un taller al da sigue una distribucion de Poisson de varianza 2, entonces
la probabilidad de que en un da no llegue ning un coche al taller es:
a) 0; b) e
2
;
c) e
2
; d) 1 e
2
;
e) Todo falso.
7.
0
e
x
2
/2
dx es igual a:
a) 05; b)
/2; c)

; d) 2
; e) Todo falso.
8. Sea (, ) la v.a. bidimensional que representa el lado y el

Area de un cuadrado, respectivamente. Si la
funcion generatriz de momentos de la longitud tiene la expresion g
(t) = (1 t)
1
, la covarianza entre las
variables y es:
a) 0; b) 1; c) 2; d) 4; e) Todo falso.
9. Si y son dos variables aleatorias independientes y ambas con distribucion exp(1), la distribucion de +
es:
a) exp(2); b) P(2); c) (2, 1); d) (1, 2); e) Todo falso.
10. El teorema de Fisher asegura que:
a) La media muestral y la varianza muestral de una poblacion normal son independientes;
b) La media muestral y la varianza muestral de una poblacion no normal son independientes;
c) La media muestral y la cuasivarianza muestral de una poblacion normal son independientes;
d) La media muestral y la cuasivarianza muestral de una poblacion no normal son independientes;
e) Todo falso.
11. La probabilidad de que una v.a. con distribucion
2
15
tome cualquier valor entero m ultiplo de tres es:
a) 0; b) 025; c) 05; d) 075; e) Todo falso.
12. Dada una muestra aleatoria de tama no n de una variable con media y varianza
2
, entonces:
a) La esperanza de la varianza muestral es igual a la varianza poblacional, es decir, E(S
2
) =
2
;
b) La esperanza de la media muestral coincide con la media poblacional, es decir, E(
n
) = ;
c) La varianza de la media muestral es igual a la varianza poblacional, es decir, V ar(
n
) =
2
;
d) La media muestral tiene una desviacion tpica menor que la que tienen cada una de las variables aleatorias
que forman la muestra, es decir,
V ar(
n
) < ;
e) Todo falso.
13. Sea (
1
,
2
, . . . ,
n
) una m.a.s. de una poblacion uniforme en (0, ). El estimador de por el metodo de los
momentos es:
a) No se sabe; b) max(
1
, . . . ,
n
); c) mn(
1
, . . . ,
n
); d) 2
n
; e) Todo falso.
14. Sea un parametro poblacional y T
n
una sucesion de estimadores sesgados de tal que lm
n
V ar(T
n
) = 0,
entonces necesariamente T
n
es una sucesion:
a) Centrada;
b) Insesgada;
e) Todo falso.
c) Consistente;
Las dos preguntas siguientes hacen referencia al siguiente enunciado: Para una muestra de tama no 21 de una
poblacion normal, se ha obtenido una media muestral x
21
2
= 20.
15. Un intervalo de conanza para la media al nivel 0
99 es (aproximadamente):
a) (-14533;-9032); b) (2302;2697); c) (12332;12333); d) (2215;2785); e) Todo falso.
16. Al contrastar la hipotesis nula de que la media poblacional es 20 contra la alternativa de que es distinta
de 20:
a) H
0
d) El p-valor es mayor de 005;
b) H
0
e) Todo falso.
c) El p-valor es menor de 005;
17. Si es la probabilidad de error tipo I y es la probabilidad de error tipo II en un contraste de hipotesis,
entonces:
a) La potencia del test es 1 ;
d) + 1;
b) + = 1;
e) Todo falso.
c) 1;
18. Sean (
1
,
2
, . . . ,
16
) una m.a.s. de una poblacion N(
1
,
1
) y (
1
,
2
, . . . ,
16
) otra m.a.s. independiente
de la anterior de una poblacion N(
2
,
2
). Si denotamos por S
2
1
y S
2
2
las varianzas muestrales respectivas y la
region crtica para contrastar H
0
:
2
1

2
2
frente a H
1
:
2
1
>
2
2
es S
1
= {S
2
1
/S
2
2
> 2}, entonces el nivel de
signicacion es:
a) 005; b) Mayor de 01; c) Menor de 01; d) 095; e) Todo falso.
Las dos preguntas siguientes hacen referencia al siguiente enunciado: La siguiente tabla proporciona, a falta de
algunas columnas y dos datos en la ultima, los resultados del ANOVA que trata de investigar si dos factores
inuyen sobre una variable respuesta.
Fuente de variacion
Suma de
cuadrados
g.l.
Error 2352
TOTAL 3772
05;
e) Todo falso.
05;
d) No es posible decidir, pues existe interaccion;
e) Todo falso.
M
ETODOS ESTAD
IA
EJERCICIOS
1. (125 puntos) Una empresa realiza un control de aceptacion para lotes. Dicho plan de control consiste en
seleccionar 45 piezas, con reemplazamiento, de cada lote y aceptar el mismo si hay, como mucho, 2 piezas
defectuosas. Una pieza es defectuosa si pesa mas de 6 o menos de 5. Sabiendo que el peso de la pieza sigue una
distribucion normal de media 5
5 y desviacion tpica 0
255, se pide:
a) Calcular la probabilidad de que una pieza sea defectuosa.
b) Calcular la probabilidad de que se acepte un lote.
c) Calcular la probabilidad de que sea necesario examinar 4 lotes hasta encontrar uno que se acepta.
2. (125 puntos) Un kit esta formado por un eje y un cojinete que deben adaptarse satisfactoriamente para que
el kit sea valido. La adaptacion es satisfactoria cuando el diametro interior del cojinete , excede al diametro
del eje , en al menos 0
004, pero no mas de 0
036 unidades. La funcion de densidad conjunta de (,) viene

dada por:
f(x, y) =
_
2500 si 0
49 < x < 0
51, 0
51 < y < 0
53,
0 en el resto.
a) Calcular la probabilidad de que un kit sea valido.
b) Calcular la probabilidad de que en un lote de 100 kits elegidos al azar, haya mas de 90 validos.
3. ((125 puntos) La funcion de densidad de una v.a. viene dada por:
f(x, ) =
_
1
x
si x > 1,
0 si x 1,
> 1.
a) Calcular el estimador maximo verosmil de a partir de una m.a.s. de tama no n obtenida de .
b) Demostrar que dicho estimador no es centrado, pero si es asintoticamente centrado.
4. (125 puntos) A partir de las 30 observaciones del espesor del oxido en obleas de silicio individuales siguientes:
Oblea 1 2 3 4 29 30
Espesor del oxido 454 486 495 440 479 534
se obtiene que
30
i=1
x
i
= 1495
4 y
30
i=1
x
2
i
= 75136
9.
a) Con estos datos se obtiene que la maxima discrepancia entre la funcion de distribucion emprica y la funcion
098, es decir, D
30
= sup
xIR
|F
n
(x) F
0
(x)| = 0
098, donde F
0
representa
mediante las estimaciones maximos verosmiles obtenidas a partir de los valores de la muestra. Con estos
datos, contrastar, al nivel = 0
05, la hipotesis de que el espesor del oxido sigue una distribucion normal.
Suponiendo cierta la hipotesis de normalidad, se pide:
b) Hallar un intervalo de conanza para el espesor medio del oxido en obleas de silicio, con coeciente de
conanza 0
95.
c) Al nivel 001, contrastar la hipotesis nula de que el espesor medio del oxido en obleas de silicio es mayor o
igual de 60, frente a la alternativa de que es menor.
M
ETODOS ESTAD
IA
SOLUCIONES
TEST
N
o
a) b) c) d) e)
1. X X
2. X
3. X
4. X
5. X
6. X
7. X
8. X
9. X
10. X X
11. X
12. X X
13. X
14. X
15. X
16. X X
17. X
18. X
19. X X
20. X
EJERCICIOS
N
o
Respuesta
1. Ejercicio 4.15
2. Ejercicio 6.11
3. Ejercicio 8.21
4. Ejercicio 9.19
M
ETODOS ESTAD
IA
TEST
Las dos preguntas siguientes hacen referencia al siguiente enunciado: Los resultados de una encuesta para
estudiar el n umero entero de horas dedicadas al estudio durante una semana se recogen en el siguiente diagrama
de tallo y hojas.
0 8888
1 0000334455555
2 0000012455558
3 4
1. Para el tama no muestral n y el rango R se tiene que:
a) n = 4; b) n = 35; c) R = 26; d) n = 33; e) Todo falso.
2. Para la moda Mo y el rango R se tiene que:
a) Mo = 0; b) Mo = 20; c) R = 12; d) Mo = 15; e) Todo falso.
-2 2 3 5
1
08
05
04
02
3. Se ha representado la funcion de distribucion emprica de una muestra,
mediante la curva acumulativa o de distribucion adjunta. A partir de esa
representacion podemos asegurar que:
a) El cuartil de orden 1 es -2. b) La mediana es 05. c) La media es 3.
d) No podemos asegurar nada ya que la gura no corresponde a una funcion
de distribucion emprica, por no ser escalonada. e) Todo falso.
4. Dos sucesos A y B incompatibles son:
a) Siempre independientes;
c) Independientes si P(A), P(B) > 0;
e) Todo falso.
b) Nunca independientes;
d) Dependientes si P(A), P(B) > 0;
5. Sean A y B dos sucesos independientes tales que la probabilidad de que ocurran ambos es 1/6 y la
probabilidad de que no ocurra ninguno es 1/3. Entonces:
a) P(A) = 1, P(B) = 1/3;
d) P(A) = 1/3, P(B) = 1;
b) P(A) = 1/2, P(B) = 1/3;
e) Todo falso.
c) P(A) = 1/3, P(B) = 1/2;
6. Se dispone de dos metodos para transmitir un mensaje. El metodo A transmite correctamente el 70 % de
los mensajes y el metodo B el 90 %. Un da se elige un metodo al azar y se transmiten con el 8 mensajes
independientes, comprobandose que los dos primeros fueron incorrectos y el resto correctos. La probabilidad de
que el metodo utilizado fuese el A es aproximadamente:
a) 0666; b) 0333; c) 05; d) 08; e) Todo falso.
Las tres preguntas siguientes hacen referencia al siguiente enunciado: Se dene una v.a. como el valor obtenido
al lanzar un dado que se construyo de forma que la probabilidad de cada cara es inversamente proporcional a
su n umero, esto es, P( = i) = k/i, con i = 1, 2, . . . , 6.
a) -100; b) -1; c) -2; d) -3; e) Todo falso.
8. El valor esperado de es:
a) 33; b) -35; c) 120/49; d) 2/5; e) Todo falso.
9. La varianza de es:
a) -33; b) -1114; c) -3/2; d) -2/3; e) Todo falso.
10. En un lote de 15 componentes electricos hay 6 defectuosos. Si se eligen de forma simultanea 5 componentes
al azar, la probabilidad de que haya al menos dos defectuosos es aproximadamente:
a) 02937; b) 05; c) 07063; d) 04; e) Todo falso.
11. Si la v.a. altura en metros de un objeto () sigue una distribucion gamma (3, 2), la v.a. altura en decmetros
de ese objeto (10) sigue una distribucion:
a) N(0, 1); b) (30, 2); c) (3, 20); d) (0
3, 2); e) (3, 0
2).
Las dos preguntas siguientes hacen referencia al siguiente enunciado: Sea (, ) una variable aleatoria bidimen-
sional con funcion de densidad conjunta
f
(,)
(x, y) =
_
k(x +y) si 0 < x < k, 0 < y < k,
0 en otro caso.
a) -1; b) 1; c) 1/2; d) -1/2; e) Todo falso.
13. Las variables y son:
a) Independientes;
d) Discretas;
b) Dependientes;
e) Todo falso.
c) Igualmente distribuidas;
14. Dado que el a no tiene 52 semanas, estas se consideran independientes y el volumen semanal de ventas de
un producto sigue una distribucion normal, el n umero esperado de semanas al a no en las que las ventas superan
la media es:
a) 52; b) 26; c) 32; d) 62; e) Todo falso.
15. Si en el enunciado anterior suprimimos la hipotesis de normalidad de la distribucion, la probabilidad de
que en un a no en mas de 26 semanas las ventas superen la venta media semanal es aproximadamente:
a) 0; b) 1; c) 15; d) 05; e) Todo falso.
16. Se dispone de una bolsa con seis tornillos de dos tipos A y B, pero se desconoce cuantos hay de cada
uno. Si se extraen cuatro tornillos con reemplazamiento y se obtiene tres de tipo A, en este caso la estimacion
maximo verosmil de la proporcion de tornillos de tipo A es:
a) 4/3; b) 3/4; c) 2/3; d) 0395; e) Todo falso.
17. Sea (
1
,
2
, . . . ,
n
) una m.a.s. de una poblacion U(0, ). El estimador maximo verosmil de es:
a)
n
; b) 1/2
n
; c) 2
n
; d) 4
n
; e) Todo falso.
18. Se tienen dos muestras independientes, de tama nos n = 16 y m = 25, de dos poblaciones normales de
varianzas
2
1
y
2
2
. Si las cuasivarianzas muestrales respectivas son s
2
1
= 0
298 y s
2
2
= 0
364, para el contraste

H
0
:
2
1
=
2
2
frente a H
1
:
2
1
=
2
2
1, se tiene que:
c) No se rechaza H
0
;
e) Todo falso.
b) Se rechaza H
0
;
0
, pero al nivel 005 s;
Fuente de variacion
Suma de
cuadrados
g.l.
Media
cuadratica
Entre niveles (Factor) 2 15038
TOTAL 33918 19
19. A partir de la informacion de la tabla anterior, podemos concluir que:
05;
e) Todo falso.
05;
05;
05. b) Las
medias correspondientes a los niveles del factor no son iguales al nivel de signicacion = 0
05. c) El n umero
de niveles del factor es 3. d) El n umero de niveles del factor es 2. e) Todo falso.
M
ETODOS ESTAD
IA
EJERCICIOS
1. (125 puntos) Seg un el metodo empleado en su fabricacion (metodo I, II y III) un proveedor suministra
lotes de un producto con un 2 %, 3 % y 5 % de unidades defectuosas. La probabilidad de emplear el metodo I
es 0
50, la de emplear el metodo II es 0
40 y, por consiguiente, la de emplear el metodo III es 0
10. En un lote
recibido se realiza un control de calidad consistente en comprobar la calidad de tres unidades elegidas al azar,
resultando que ninguna es defectuosa. Considerando esta informacion, calcular la probabilidad de que el lote se
haya fabricado:
a) por el metodo I;
b) por el metodo II;
c) por el metodo III.
2. (125 puntos) Una empresa realiza un control de calidad sobre las piezas que recibe del proveedor. As,
para cada lote de 1000 piezas que recibe, selecciona con reemplazamiento 30 piezas. Si hay como mucho dos
defectuosas, estas son reemplazadas por piezas buenas y el lote es automaticamente aceptado. Si hay mas de
dos defectuosas, se inspecciona todo el lote y se reemplazan las piezas defectuosas de todo el lote por piezas
buenas, tras lo cual se acepta el lote. Si los lotes tuviesen una proporcion de defectuosos p = 0
05, se pide:
a) Cual es la probabilidad de que no haya que inspeccionar todo el lote?
b) Obtener la distribucion de probabilidad de la variable aleatoria n umero de piezas inspeccionadas.
c) Obtener el n umero medio de piezas inspeccionadas por lote.
3. (125 puntos) Para comprobar la ecacia de un nuevo dispositivo de radar para cierto sistema de misiles de
defensa, se experimenta con aviones reales en los que se simula una situacion de derribo o no derribo. Si en 300
pruebas hubo 250 derribos, se pide:
a) Obtener el intervalo de conanza, con coeciente de conanza 1 = 0
95, para la proporcion p de aviones

derribados.
b) Contrastar, a un nivel de signicacion del = 0
05, la hipotesis de que el porcentaje de aviones derribados

es menor del 80 % (H
1
: p < 0
8).
4. (125 puntos) Contrastar, al nivel de signicacion = 0
05, si la siguiente muestra de tiempos de vida de

unos microcircuitos: 15, 8, 11, 1, 6, 5, 2, 17, 4, 23, puede suponerse que procede de una distribucion exponencial
de media 10.
M
ETODOS ESTAD
IA
SOLUCIONES
TEST
N
o
a) b) c) d) e)
1. X
2. X X
3. X
4. X
5. X X
6. X
7. X
8. X
9. X
10. X
11. X
12. X
13. X X
14. X
15. X
16. X
17. X
18. X
19. X X
20. X X
EJERCICIOS
N
o
Respuesta
1. Ejercicio 2.16
2. Ejercicio 4.16
3. Ejercicio 9.20
4. Ejercicio 9.21
M
ETODOS ESTAD
IA
TEST
El siguiente diagrama de barras, se reere a las dos cuestiones siguientes:
1. A partir del diagrama anterior, podemos armar que:
a) La media es 05; b) La media es 1; c) La mediana es 0; d) La mediana es 1; e) Todo falso.
2. Siguiendo con el diagrama anterior:
a) El rango es 2; b) La moda es 0; c) El 1
er
cuartil es 0; d) El 2
o
cuartil es 0; e) Todo falso.
3. Si A y B son dos sucesos independientes, tales que P(A) > P(B), P(A B) = 1/2 y P(A B) = 1/12,
entonces:
a) P(A) = 1/3; b) P(A) = 1/4; c) P(B) = 1/4; d) P(B) = 1/3; e) Todo falso.
2
y sea c una constante cualquiera. Entonces V ar( c) es igual a:
a)
2
c
2
; b)
2
c
2
; c) ( c)
2
; d)
2
; e) Todo falso.
Las tres preguntas siguientes hacen referencia al siguiente enunciado: Una caja con nueve guantes de trabajo
contiene dos guantes para la mano izquierda y siete para la mano derecha.
5. Si se eligen dos guantes al azar sin reemplazamiento, la probabilidad de que ambos guantes sean para la
mano derecha es:
a) 84; b) 1/2; c) 7/12; d) 98/243; e) Todo falso.
6. Si se eligen tres guantes al azar sin reemplazamiento, la probabilidad de que uno sea para la izquierda y
dos para la derecha es:
a) 84; b) 1/2; c) 7/12; d) 98/243; e) Todo falso.
7. Si se eligen tres guantes al azar con reemplazamiento, la probabilidad de que uno sea para la izquierda y
dos para la derecha es:
a) 84; b) 1/2; c) 7/12; d) 98/243; e) Todo falso.
8. Sea una v.a. con distribucion de Poisson de parametro 0
5, entonces P( = E()) es igual a:

a) 1, por ser la distribucion de Poisson continua;
c) 3/2;
e) Todo falso.
b) 1/2;
d) 3/4;
9. La probabilidad de que una v.a. con distribucion N(0, ) tome un valor negativo (P( < 0) es:
a) No se puede saber; b) 025; c) 05; d) 0; e) Todo falso.
10. Sea (, ) la v.a. bidimensional que representa el lado y el permetro de un cuadrado. Si la varianza del
lado es
2
, la covarianza entre las variables y es:
a) 0; b) 1; c) 4
2
; d) -1; e) Todo falso.
11. El peso medio de equipaje por viajero de avion es de 40 Kg y la desviacion tpica se desconoce. Si hay 50
pasajeros independientes en un vuelo, la probabilidad de que el peso total del equipaje en el vuelo supere los
2000 Kg es aproximadamente:
a) No se puede saber, por no conocer la desviacion tpica. b) 025. c) 05. d) No se puede saber, por no
conocer la distribucion del peso de equipaje. e) Todo falso.
12. Si denotamos por F
n
m
una v.a. con ditribucion F de Snedecor con n grados de libertad en el numerador y
m en el denominador y P(F
n
m
> x) = , con = 0
5, entonces:
a) P(F
m
n
> 1/x) = ;
d) P(F
m
n
< 1/x) = 1 ;
b) P(F
m
n
< 1/x) = ;
e) Todo falso.
c) P(F
m
n
> 1/x) = 1 ;
13. Sea (
1
,
2
, . . . ,
n
) una m.a.s. de una poblacion de uniforme en (0, ). El estimador maximo verosmil de
la media de la poblacion es:
a)
n
; b)
n
; c) 1
n
; d) 1 (1/
n
); e) Todo falso.
14. Sea un parametro poblacional y T un estimador de tal que E(T) = , se dice que T es un estimador
de :
a) Centrado; b) Consistente; c) Insesgado; d) Sesgado; e) Todo falso.
15. Para una muestra de tama no 121 de una poblacion normal se ha obtenido una media muestral x
121
= 25
y una varianza muestral s
2
= 144. Un intervalo de conanza aproximado para la media al nivel 0
95 es:
a)
_
25 1
98
12
120
, 25 + 1
98
12
120
_
;
d) (85
95, 104
05);
b) (26
03, 23
97);
e) Todo falso.
c) (123
32, 123
33);
16. La probabilidad de error de tipo I es la probabilidad de que:
a) La hipotesis nula sea falsa. b) Sea falsa la hipotesis nula y esta se rechaza. c) Se rechace la hipotesis
alternativa cuando esta sea cierta. d) Sea falsa la hipotesis alternativa y esta se rechaza. e) Todo falso.
17. En una muestra de 200 paquetes hay 11 defectuosos. Se contrasta H
0
: p 0
1 frente a H
1
: p < 0
1. Con
estos datos el nivel crtico es aproximadamente:
a) 095; b) 0983; c) 0017; d) 005; e) Todo falso.
18. Con los mismos datos de la cuestion anterior, si el contraste fuera: H
0
: p 0
1 frente a H
1
: p > 0
1, el
nivel crtico es aproximadamente:
a) 095; b) 0983; c) 0017; d) 005; e) Todo falso.
Las dos preguntas siguientes hacen referencia al siguiente enunciado: Se analizaron las puntuaciones dadas por
5 jueces a 11 participantes en patinaje artstico. Cada participante fue evaluado por los jueces en 7 ejercicios.
Las calicaciones dadas pueden ser estudiadas mediante un analisis de la varianza de dos factores con 55 celdas
(participantes-jueces) y 7 observaciones por celda. La siguiente tabla proporciona, de manera incompleta, los
resultados del correspondiente ANOVA:
Fuente de variacion
Suma de
cuadrados
g.l.
Media
cuadratica
Entre participantes 150
Entre jueces 18
Interaccion 120
Error 990
TOTAL
19. A partir de la informacion de la tabla anterior, podemos armar a nivel = 0
05, que:
a) El factor participante no inuye;
c) No existe interaccion;
e) Todo falso.
b) El factor juez no inuye;
d) Existe interaccion;
20. A partir de la informacion de la tabla anterior, a nivel = 0
05, podemos armar que las medias corres-

pondientes a las puntuaciones de los diferentes participantes son:
a) Iguales;
e) Todo falso.
b) Distintas;
d) No es posible decidir, pues no existe interaccion;
M
ETODOS ESTAD
IA
EJERCICIOS
1. (125 puntos) El tiempo de vida (en meses) de un tipo de componente es una variable aleatoria con funcion
de densidad:
f
(x) =
_
2xe
x
2
si x > 0,
0 en el resto.
Se pide:
a) Obtener la probabilidad de que un componente cualquiera dure mas de dos meses.
b) Si un componente lleva funcionando dos meses y a un sigue funcionando, calcular la probabilidad de que
falle antes del quinto mes.
c) Obtener la funcion de probabilidad de la variable aleatoria denida por
=
_
2 si 2,
4 si > 2.
d) Obtener la funcion generatriz de momentos de la v.a. .
2. (125 puntos) Dos componentes de un ordenador tienen la siguiente funcion de densidad conjunta para sus
tiempos de vida (, ):
f(x, y) =
_
xe
x(1+y)
si x > 0 y y > 0,
0 en caso contrario.
a) Cual es la probabilidad de que el tiempo de vida de la primera componente () sea mayor que 3?
b) Son independientes los tiempos de vida de las dos componentes?
c) Cual es la probabilidad de que el tiempo de vida de por lo menos uno de los componentes sea mayor que
3?
3. (125 puntos) Un club de alpinistas desea comprar cuerdas de bra de nilon para las escaladas. Con el n
de tener las maximas garantas, se exige al fabricante que una cualquiera de estas cuerdas pueda soportar sin
romperse 1000 Kg. como mnimo. Cada bra individual tiene una resistencia media de 5 Kg. y una desviacion
tpica de 01 Kg. Sabiendo que la resistencia de la cuerda es igual a la suma de las resistencias de las bras que
la componen y que las bras son independientes entre s, cual es el n umero mnimo de bras que debe tener
cada cuerda para satisfacer las exigencias de los alpinistas con una probabilidad mayor o igual de 099?
4. (125 puntos) Una empresa dispone de dos maquinas, que denotaremos por maquina 1 y maquina 2, para
fabricar determinada pieza. Para la maquina 1, el tiempo empleado para fabricar la pieza tiene una distribucion
normal N(
1
, 5) y se considera una muestra aleatoria de tama no n = 50. Para la maquina 2, el tiempo empleado
en la fabricacion de la pieza vuelve a ser una normal N(
2
, 5) y se considera otra muestra aleatoria de tama no
m = 50. Las dos muestras obtenidas son independientes entre s y para ellas se ha obtenido que x
50
y
50
= 3
1,
donde x
50
y y
50
representan las medias muestrales para las maquinas 1 y 2, respectivamente. Se pide:
a) Obtener el nivel crtico asociado al contraste de hipotesis H
0
:
1

2
1
:
1
>
2
.
b) Contrastar, al nivel de signicacion = 0
05, las dos hipotesis anteriores.

c) Obtener un intervalo de conanza, al nivel de conanza 1 = 0
95, para la diferencia de medias pobla-

cionales (
1
2
).
M
ETODOS ESTAD
IA
SOLUCIONES
TEST
N
o
a) b) c) d) e)
1. X X
2. X X X X
3. X X
4. X
5. X
6. X
7. X
8. X
9. X
10. X
11. X
12. X X
13. X
14. X X
15. X
16. X
17. X
18. X
19. X X
20. X
EJERCICIOS
N
o
Respuesta
1. Ejercicio 3.20
2. Ejercicio 5.12
3. Ejercicio 6.12
4. Ejercicio 9.22
M
ETODOS ESTAD
IA
TEST
1. Los datos relativos a determinada muestra han sido representados en el siguiente histograma:
Se trata de un histograma de frecuencias:
a) Relativas;
d) Acumuladas absolutas;
b) Absolutas;
e) Todo falso.
c) Acumuladas relativas;
2. Siguiendo con el histograma anterior, el tama no muestral es:
a) 4; b) 10; c) 4/9; d) No se puede saber; e) Todo falso.
3. Siguiendo con el histograma anterior, la mediana es:
a) 1
375; b) 1
5; c) 2; d) 3; e) Todo falso.
4. Sean A, B y C tres sucesos tales que P(A) = 0
2, P(B) = 0
1 y P(C) = 0
8, A y B son disjuntos,
P(A/C) = 1/4 y P(B C) = 0
2. Entonces P(A C) es igual a:

a) 0
2; b) 0
3; c) 0

5. Siguiendo con el enunciado anterior, son sucesos independientes:
a) A y B; b) A y C; c) B y C; d) A, B y C; e) Todo falso.
6. Un dado irregular es tal que la cara 5 tiene probabilidad 05 de aparecer. Todas las demas caras son
equiprobables entre s, repartiendo la probabilidad restante 05. Sea la variable aleatoria puntuacion en un
lanzamiento. Sea F
la funcion de distribucion de . Se tiene que:

a) F
(5) = 0
5; b) F
(2) = 0
2; c) F
(1) = 0
1; d) F
(3) = 0
3; e) Todo falso.
7. De un lote de N televisores, que contiene 3 defectuosos, un hotel instala cinco unidades. La probabilidad
de instalar al menos uno defectuoso es, para cualquier valor de N:
a)
_
5
1
_
3
N
(1
3
N
)
4
; b) 1
_
5
0
_
(1 3/N)
5
; c) 1
_
3
0
__
N3
5
_
/
_
N
5
_
; d)
_
3
1
__
N3
4
_
/
_
N
5
_
; e) Todo falso.
8. Si es una variable aleatoria con distribucion normal N(5, 3), su funcion de densidad f
(x):
a) Tiene un maximo en x = 0;
c) Es simetrica respecto a la recta x = 5;
e) Todo falso.
b) Es simetrica respecto a la recta x = 0;
d) Tiene un maximo en x = 5;
9. Sean y dos variables aleatorias independientes tales que N(1, = 2) y N(3, = 3). Entonces
+ tiene una distribucion:
a) No normal; b) N(4, = 5); c) N(2, =
5); d) N(4, =
5); e) Todo falso.

Las dos preguntas siguientes hacen referencia al siguiente enunciado: Se lanzan dos dados perfectos. Sea la
puntuacion obtenida en el primer dado y la obtenida en el segundo.
10. Podemos asegurar (sin necesidad de hacer ning un calculo) que la covarianza Cov(, ) es:
a) Positiva; b) Negativa; c) Nula; d) Uno; e) Todo falso.
11. Si se consideran las variables = 2 + y = + 2, se tiene que:
a) y tienen la misma media;
b) Cov(, ) = 0;
c) Todos los valores de estan comprendidos entre 2 y 12;
d) Todos los valores de estan comprendidos entre 3 y 18;
e) Todo falso.
12. Sea una variable aleatoria de media 3 y varianza 4. Entonces podemos asegurar que la probabilidad
P(1 < < 7) es siempre mayor o igual que:
a) 0
75; b) 0
8 ; c) 0

13. Una empresa lactea sabe que el contenido de sus botellas de leche se distribuye con media 15 litros y
desviacion tpica 01 litros. Cual es aproximadamente la probabilidad de que en un envo de 100 botellas
independientes haya en total entre 140 y 160 litros de leche?
a) 0; b) 1; c) 05; d) 025; e) Todo falso.
14. Sea
1
,
2
, . . . ,
n
una m.a.s. de una poblacion N(0, ). Entonces
n
i=1
_
_
2
a) t
n1
; b) F
n1
m1
; c)
2
n
; d) N(0, 1); e) Todo falso.
15. Al muestrear una poblacion N(0, ), el estadstico
n1
S

n
(S
2
es la varianza muestral) estara con proba-
bilidad 0
95 en el intervalo:
a) (-196,196);
d) (-,153) si n = 5;
b) (-,213) si n = 5;
e) (-278,278) si n = 5.
c) (-164,164);
16. Si la estimacion maximo verosmil de la media de una poblacion uniforme U(0, ) es 1, la estimacion
maximo verosmil de la varianza de la misma poblacion es:
a) 1/3; b) 1; c) 1/12; d) 1/4; e) Todo falso.
17. Sea una v.a. con distribucion uniforme U(3 10, +10). Para estimar el parametro se ha tomado una
m.a.s. de tama no cinco que ha arrojado los siguientes resultados: (2, 7, 10, 5, 6). La estimacion del parametro ,
por el metodo de los momentos, es:
a) 4; b) 3; c) 2; d) 9; e) Todo falso.
18. El nivel crtico de un contraste:
a) Se ja por el investigador;
c) Cuanto mayor es, mayor es la conanza en H
0
;
e) Todo falso.
b) Viene dado por los resultados de la muestra;
d) Siempre tiene que ser mayor que = P(e
I
);
Las dos preguntas siguientes hacen referencia al siguiente enunciado: Para probar las diferencias en la conduccion
electrica de tres tipos de alambres A, B y C se obtuvieron muestras en las que se estudio la resistencia en ohmios.
La tabla ANOVA proporciona:
Fuente de variacion
Suma de
cuadrados
g.l.
Media
cuadratica
Tipo alambre 18763
Error 42
TOTAL 34086
a) El tipo de alambre no inuye sobre la resistencia, a un nivel de signicacion = 0
1;
b) El tipo de alambre no inuye sobre la resistencia, a un nivel de signicacion > 0
95;
c) El tipo de alambre no inuye sobre la resistencia, al nivel de signicacion = 0
05;
d) El tipo de alambre inuye sobre la resistencia, al nivel de signicacion = 0
05;
e) Todo falso.
a) El n umero de alambres probados es de 42;
e) Todo falso.
b) El n umero de factores es de 2;
d) El n umero de alambres probados es de 44;
M
ETODOS ESTAD
IA
EJERCICIOS
1. (125 puntos) El tiempo, en horas, que transcurre hasta el primer fallo de una pieza es una variable aleatoria
con funcion de densidad:
f
(x) =
_
ke
0
01x
si x > 0,
0 en el resto.
Se pide:
a) Obtener el valor de k.
b) Si la tasa de fallo asociada a una pieza en el instante x (h
(x)) se dene como:

h
(x) =
f
(x)
1 F
(x)
,
donde F
representa la funcion de distribucion de , obtener el valor de la tasa de fallo a las 25 horas.

c) Una pieza se reemplaza inmediatamente despues de un fallo o, como muy tarde, a las 150 horas de funcio-
namiento. Determinar el tiempo medio de reemplazo de la pieza.
2. (125 puntos) Una pieza utilizada en la fabricacion de cierto producto tiene un tiempo de vida que sigue
una distribucion exponencial de media 7 a nos, si ha sido suministrada por el proveedor I o una distribucion
gamma de media 7 a nos y varianza 14, si ha sido suministrada por el proveedor II. El 60 % de las piezas son
suministradas por el proveedor I y el 40 % restante por el II. Con estos datos, se pide:
a) Obtener la probabilidad de que una pieza elegida al azar dure mas de 12 a nos.
b) Si se sabe que una pieza dura mas de 12 a nos, cual es la probabilidad de que haya sido suministrada por
el proveedor II?
3. (125 puntos) La duracion en a nos de una determinada pieza es una v.a. con funcion de densidad:
f
(x) =
_
1
2
x
e
x/
si x > 0
0 si x 0
,
donde es un parametro positivo y desconocido. A partir de una muestra aleatoria simple (
1
,
2
, . . . ,
n
), se
pide:
c) Estudiar si dicho estimador es insesgado, asintoticamente insesgado y consistente.
4. (125 puntos) Sea (
1
,
2
, . . . ,
49
) una muestra aleatoria simple de una poblacion de media desconocida y
varianza igual a uno. Si la media muestral es x
49
= k, se pide:
a) Calcular un intervalo de conanza para la media al nivel 0
90.
b) Obtener el valor aproximado del nivel crtico asociado al contraste H
0
: k frente a la alternativa
H
1
: > k.
M
ETODOS ESTAD
IA
SOLUCIONES
TEST
N
o
a) b) c) d) e)
1. X
2. X
3. X
4. X
5. X
6. X X X
7. X
8. X X
9. X
10. X
11. X X
12. X
13. X
14. X
15. X X
16. X
17. X
18. X X
19. X
20. X
EJERCICIOS
N
o
Respuesta
1. Ejercicio 3.21
2. Ejercicio 4.17
3. Ejercicio 8.22
4. Ejercicio 9.23
M
ETODOS ESTAD
IA
TEST
Las dos preguntas siguientes hacen referencia al siguiente experimento para investigar el tiempo de duracion,
en horas, de un componente electronico: Se colocan las partes en una celda de prueba y se utilizan durante
100 horas bajo condiciones de temperatura elevada. Se prueban siete componentes, uno de los cuales sigue
funcionando al cabo de las 100 horas; para los otros seis los tiempos de fallo fueron: 75, 63, 36, 51, 45 y 80.
1. La mediana de estos siete tiempos de funcionamiento es:
a) 58; b) 63; c) 70; d) 200; e) Todo falso.
2. El tiempo medio de funcionamiento de estos siete componentes:
a) 58; b) 63; c) 70; d) 200; e) Todo falso.
0'95
0'95
0'99
3. El circuito adjunto trabaja solo si existe una trayectoria de dispositivos en
funcionamiento, de izquierda a derecha. La probabilidad de que cada dispositivo
funcione aparece en la gura. Supongase que los dispositivos fallan de forma
independiente. La probabilidad de que el circuito trabaje es aproximadamente:
a) 0107. b) 0893. c) 0012. d) 0988. e) Todo falso.
4. En un sistema de almacenamiento en lnea magnetica, el 20 % de las operaciones de lectura se ven atenuadas
por una alineacion indebida entre la cinta magnetica y la cabeza del sistema, mientras que el resto se realizan
de manera correcta. La probabilidad de un error en la lectura por una alineacion indebida es 0
06 y 0
001 por
una alineacion correcta. La probabilidad de tener un error en la lectura es:
a) 09872; b) 0061; c) 00128; d) 0939; e) Todo falso.
5. Se realiza un control de calidad sobre la coloracion y la reduccion del tama no en un proceso de fabricacion de
partes moldeadas en plastico. Si consideramos la v.a. que nos mide el n umero de caractersticas conformes,
dicha variable toma los valores 0, 1 y 2 con probabilidades 0
04, 0
32 y 0
64, respectivamente. Si denotamos por

F
(x) el valor de la funcion de distribucion de en el punto x, se tiene que:

a) F
(1) = 0
36; b) F
(2) = 1; c) F
(4) = 1; d) F
(0) = 0
04; e) Todo falso.

6. Si es una variable aleatoria con E() = 3, V ar() = 4 y = 3 + 2, entonces:
a) V ar() = 13; b) V ar() = 48; c) V ar() = 36; d) E() = 11; e) Todo falso.
7. En un proceso de fabricacion donde se laminan varias capas ceramicas, el 1 % de los ensambles es defectuoso.
Suponiendo que los ensambles son independientes, el n umero medio de ensambles que es necesario examinar
para tener uno defectuoso es:
a) 100; b) 1; c) -2; d) 20; e) Todo falso.
8. Si es una v.a. con distribucion N(, ), la probabilidad P( 3 < < + 3) es aproximadamente:
a) 09974; b) 00026; c) 12345; d) 02401; e) 095.
9. Sea (, ) una v.a. bidimensional con funcion de densidad conjunta f
(,)
(x, y) = 1 si 0 < x < 1, 0 < y < 1
y f
(,)
(x, y) = 0 en cualquier otro caso. Para las variables y se verica que:
a) Cov(, ) = 0;
d) y son independientes;
b) Cov(, ) = 0;
e) Todo falso.
c) y NO son independientes;
10. Siguiendo con las variables de la pregunta anterior, la probabilidad P( 0
5 < < + 0
5) es:
a) 1/4; b) 3/4; c) 1/2; d) 1/8; e) Todo falso.
11. Dada una coleccion de variables (
1
, . . . ,
100
) independientes y todas ellas igualmente distribuidas, con
distribucion uniforme U(4, 6), entonces la probabilidad de que la media muestral
100
=
1
100
i
sea mayor de
50, es decir, P(
100
> 50), es igual a:
a) 3; b) 0
2345; c) 0
9456; d) 0
1265; e) Todo falso.

12. Si es una v.a. con media 6 y varianza 4, entonces podemos asegurar que la probabilidad P(2 < < 10)
es mayor o igual que:
a) 075; b) 09; c) 095; d) 099; e) Todo falso.
13. Si se toma una muestra aleatoria simple de n = 25 observaciones de una poblacion normal con varianza
2
= 10, la probabilidad de que la varianza muestral (S
2
) sea mayor que 17
2, es decir, P(S
2
> 17
2) es
a) 075; b) 012; c) 001; d) 099; e) Todo falso.
14. Si

S
2
1
y

S
2
2
son las cuasivarianzas muestrales de dos muestras aleatorias independientes de tama nos n = 10
y m = 20, tomadas de poblaciones normales que tienen la misma varianza, la probabilidad P(
S
2
1
/
S
2
2
2
42) es
a) 005; b) 095; c) 099; d) 001; e) Todo falso.
15. Si T
1
y T
2
son dos estimadores centrados de , entonces la combinacion lineal T = a T
1
+b T
2
, con a y
b constantes en el intervalo [0, 1] es un estimador:
a) Centrado siempre que a = 1 b;
d) Centrado si a = 1/4, b = 3/4;
b) Centrado siempre que a = b;
e) Todo falso.
c) Centrado si a = b = 1/2;
16. Si al realizar una estimacion por intervalo se quiere aumentar la conanza, manteniendo el mismo tama no
muestral, entonces necesariamente se obtiene que el error de estimacion:
a) Disminuye; b) Aumenta; c) No vara; d) Todo cierto; e) Todo falso.
17. La distribucion del volumen de llenado (en gr.) de unas botellas de detergente lquido es aproximadamente
normal. Para dicho proceso, se toma una muestra aleatoria de 20 botellas y se obtiene que la varianza muestral
es s
2
= 12gr
2
. De acuerdo con estos datos, si se contrasta la hipotesis nula H
0
: 2 (el proceso esta estable)
1
: > 2 (hay que revisar el proceso), se rechazara H
0
al nivel de signicacion:
a) = 0
05; b) = 0
01; c) = 0
1; d) = 0
2; e) Todo falso.
18. Se desea contrastar la hipotesis de que una variable aleatoria sigue una distribucion exponencial de
media 1. Con ayuda de una m.a.s. de tama no 225 se calcula la funcion de distribucion emprica (o muestral) y
al compararla con los valores correspondientes a los de la funcion de distribucion de una exponencial de media
1, se encuentra que la maxima discrepancia es 010. Entonces, rechazaremos que los datos proceden de una
exponencial de media 1 al nivel de signicacion igual a:
a) 015; b) 01; c) 005; d) 002; e) Todo falso.
Las dos preguntas siguientes hacen referencia al siguiente enunciado: Para investigar el efecto que tienen el
tipo de pintura tapaporos y el metodo de aplicacion sobre la adhesion de la pintura, se realiza un experimento
factorial. Parte de los resultados del mismo pueden verse en la tabla ANOVA siguiente.
Fuente de variaci on
Suma de
cuadrados
g.l.
Media
cuadratica
Tipo de tapaporos 458
Metodo de aplicacion 1
Interaccion 024 2
Error 099 12
TOTAL 1072 17
19. A partir de la informacion de la tabla anterior, podemos concluir, al nivel = 0
05, que:
a) El tipo de tapaporos no inuye;
c) El metodo de aplicacion no inuye;
e) Todo falso.
b) El tipo de tapaporos inuye;
d) El metodo de aplicacion inuye;
a) Se han comparado 2 metodos distintos de aplicacion. b) Se han comparado 2 tipos de pintura tapaporos.
c) Se han comparado 3 tipos de pintura tapaporos. d) Para cada tipo de tapaporos y cada metodo de aplicacion
se han pintado 3 especmenes. e) Todo falso.
M
ETODOS ESTAD
IA
EJERCICIOS
BLOQUE 1
1. (125 puntos) Sean y los tiempos de vida de dos componentes que operan de forma independiente. Si
las funciones de densidad de las variables aleatorias y son:
f
(x) =
_
1
2
e
x1
2
si x > 1,
0 si x 1,
f
(y) =
_
1
4
e
y4
4
si x > 4,
0 si x 4,
a) Determnese la distribucion de la variable aleatoria = 1.
b) Calc ulese la probabilidad de que tome un valor mayor o igual que 7.
c) Obtengase la funcion de densidad de la variable aleatoria =

2
1. Que relacion existe entre la variable
y la variable ?
d) Calc ulese la distribucion de la variable aleatoria = +

2
3.
2. (125 puntos) Despues de una cantidad ja de millas se determino el desgaste de echa (0
0001 pulg.) para

cada una den = 8 maquinas de combustion interna que tienen cobre y plomo como material de soporte, y se
obtuvo como resultado que la media muestral es x = 3
72. Suponiendo que la distribucion del desgaste de echa

es normal con desviacion tpica = 1
25, se pide:
a) Contrastar, al nivel de signicacion = 0
05, la hipotesis de que el desgaste medio de echa es igual a 3
50
frente a la alternativa de que es mayor que dicha cantidad.
b) Obtener la potencia del contraste anterior en el punto 4.
BLOQUE 2
3. (125 puntos) El diametro de un rodamiento tiene una distribucion normal de media 1
5 milmetros y
desviacion tpica 0
05 milmetros.
a) Cual es la probabilidad de que un rodamiento tenga mas de 1
6 milmetros de diametro?, y la de que

tenga entre 1
4 y 1
6 milmetros de diametro?
b) Que diametro es el que exceden el 90 % de los rodamientos?
c) Si un cojinete contiene 10 de rodamientos independientes, cual es la probabilidad de que el diametro
maximo de los rodamientos en el cojinete no sea mayor de 1
6 milmetros?
4. (125 puntos) El tiempo de vida de una batera, en a nos, es una variable aleatoria con funcion de densidad
f
(x) =
_
1
x
(1/)1
si x > 1,
0 si x 1,
0 < < 1.
a) Calcular el estimador maximo verosmil de y estudiar sus propiedades (insesgado, asintoticamente inses-
gado y consistente).
b) Si T
] =
2
2
n
?
c) Si n = 3 y la m.a.s. obtenida es (2
72, 1, 7
39), calcular, a partir del estimador maximo verosmil de apartado

a), un intervalo de conanza para al nivel de conanza 1 = 0
95.
M
ETODOS ESTAD
IA
SOLUCIONES
TEST
N
o
a) b) c) d) e)
1. X
2. X
3. X
4. X
5. X X X X
6. X X
7. X
8. X
9. X X
10. X
11. X
12. X
13. X
14. X
15. X X X
16. X
17. X X X X
18. X X X
19. X X
20. X X X
EJERCICIOS
N
o
Respuesta
1. Ejercicio 5.13
2. Ejercicio 9.24
3. Ejercicio 5.14
4. Ejercicio 8.23
M
ETODOS ESTAD
IA
TEST
1. Dada la muestra 3, 5, 6, 6, 7, 10, 12, se tiene que:
a) Su media es 6; b) Su mediana es 6; c) Su mediana es 7; d) Su media es 7; e) Todo falso.
2. Dada la muestra 3, 5, 6, 6, 7, 10, 12, se tiene que:
a) Su primer cuartil es 6;
d) Su rango es 12;
b) Su tercer cuartil es 10;
e) Todo falso.
c) Su recorrido intercuartlico es 5;
3. Dados dos sucesos A y B tales que P(A) = 0
6, P(B/A) = 0
3 y P(A B) = 0
54, se tiene que P(A/B) es

igual a:
a) 010; b) 018; c) 003; d) 025; e) Todo falso.
2
y sea k una constante cualquiera, entonces V ar(k ) es igual a:
a) k
2
2
; b)
2
k
2
; c) ( k)
2
; d) k
2
; e) Todo falso.
5. En unas pruebas de seleccion acuden 9 personas, 6 varones y 3 mujeres. Si todas las personas tienen la
misma probabilidad de ser seleccionados y se eligen tres, cual es la probabilidad de que, como mucho, quede
una mujer sin seleccionar?
a) 19/84; b) 7/27; c) 30; d) 1/720; e) Todo falso.
El siguiente enunciado hace referencia a las dos cuestiones siguientes: Una baraja espa nola tiene cuarenta cartas,
de las cuales cuatro son ases. Las cartas estan mezcladaa al azar y se extraen dos de ellas.
6. Si se eligen las dos cartas sin reemplazamiento, la probabilidad de que las dos sean ases es:
a) 1/100; b) 1/16; c) 1/4; d) 1/825; e) Todo falso.
7. Si se eligen las dos cartas con reemplazamiento, la probabilidad de que las dos sean ases es:
a) 1/100; b) 1/16; c) 1/4; d) 1/825; e) Todo falso.
8. Si la probabilidad de que un trabajador de una fabrica sufra un accidente laboral es 001, la probabilidad de
que se produzca como mucho un accidente laboral entre los 20 trabajadores de la fabrica es aproximadamente
igual a:
a) 098; b) 05; c) 0; d) 075; e) 27.
9. Sean y dos variables aleatorias, entonces la igualdad E( ) = E()E() se verica:
a) Siempre;
d) Si Cov(, ) = 0;
b) Nunca;
e) Todo falso.
c) Si y son independientes;
10. Sea (, ) la v.a. bidimensional que representa las longitudes de los dos catetos de un triangulo rectangulo.
Si el valor medio de cada una de las dos longitudes es 1 y la covarianza entre las mismas es 1, la supercie media
del triangulo es (Nota.- La supercie del triangulo es

2
):
a) 0; b) 1; c) 1/2; d) -1; e) Todo falso.
11. Se lanza una moneda perfecta 500 veces. La probabilidad de que el n umero de caras sea menor o igual de
a) No se puede saber; b) 0
025; c) 0
63; d) 0
5; e) 263.
12. El peso medio del equipaje de un viajero de avion es de 40 kg. y la desviacion tpica se desconoce. Si hay
50 pasajeros independientes en un vuelo, la probabilidad de que el peso total del equipaje supere los 2000 kg.
a) No se puede saber por no conocer la desviacion tpica;
b) 025;
c) 05;
d) No se puede saber por no conocer la distribucion del peso de equipaje;
e) Todo falso.
13. Denotamos por una v.a. con distribucion F
1
m
y por una v.a. con distribucion t
m
. Si P( < x) = ,
entonces se tiene siempre que:
a) P(
2
< x) = ;
d) P(
x < <
x) = ;
b) P( < 1/x) = ;
e) Todo falso.
c) P( < x) =
2
;
14. Sea (
1
,
2
, . . . ,
n
) una m.a.s. de una poblacion de uniforme en (, 1). El estimador maximo verosmil de
la media de la poblacion es:
a)
n
;
d) 1 (1/
n
);
b) (1 + mn{
1
,
2
, . . . ,
n
})/2;
e) Todo falso.
c) 1
n
;
15. Sea un parametro poblacional y T un estimador de tal que E(T) = para cualquier tama no muestral,
entonces T es un estimador de :
a) Centrado;
b) Asintoticamente centrado;
e) Todo falso.
c) Insesgado;
16. Para contrastar si la media de una poblacion normal es mayor de 25, es decir, para realizar el contraste
H
0
: 25 frente a H
1
: > 25, se toma una muestra de tama no 121 y se obtiene una cuasivarianza muestral
s
2
= 144 y una media muestral x
121
= 27. Al nivel = 0
10:
a) Se rechaza H
0
;
c) No se puede saber;
e) Todo falso.
b) No se rechaza H
0
;
d) A ese nivel se rechaza H
0
, pero al nivel 0
9 no;
17. Para contrastar la hipotesis nula de que la proporcion de artculos defectuosos que produce una fabrica es
del 10 %, es decir, H
0
: P(defectuoso) = 0
1, se observan 5 de esos artculos. Se decide rechazar H

0
si se observa
al menos uno defectuoso. El nivel de signicacion del contraste es:
a) 005; b) 040951; c) 003125; d) 059049; e) 09875.
18. En el contraste anterior, el valor de la funcion potencia en p = 0
6, donde p denota P(defectuoso), es:

a) 005; b) 003125; c) 098976; d) 05; e) 1875.
Fuente de variacion
Suma de
cuadrados
g.l.
Media
cuadratica
Interaccion 562
Error 12
TOTAL 3466 17
05, que:
e) Todo falso.
d) El factor A inuye;
e) Todo falso.
M
ETODOS ESTAD
IA
EJERCICIOS
1. (125 puntos) El 60 % de los tornillos producidos por una fabrica proceden de la maquina A y el resto de la
maquina B. Dentro del total de la produccion, la proporcion de tornillos producidos en A y no defectuosos es
0
54. Dentro de los tornillos producidos en B, la proporcion de no defectuosos es 0
7. Con estos datos, obtener:

a) La probabilidad de que un tornillo de dicha fabrica sea defectuoso.
b) La probabilidad de que, sabiendo que un tornillo es defectuoso, proceda de la maquina A.
2. (125 puntos) La cantidad de mineral, en toneladas, que se embarca diariamente en un puerto, es una v.a.
normal de media 10 y desviacion tpica 4. Suponiendo independencia entre los das, calcular:
a) El n
o
esperado de das de una semana en los que el embarque supera la media.
b) La probabilidad de que como mucho en uno de siete das elegidos al azar la cantidad embarcada haya sido
inferior a seis toneladas.
c) La probabilidad de que se necesite esperar tres o mas das hasta encontrar uno con un embarque superior
a 6 toneladas.
3. (125 puntos) El tiempo de vida de unas piezas es una variable aleatoria con funcion de densidad
f
(x) =
_
2
xe
x
2
/
si x > 0,
0 si x 0,
0 < .
A partir de una muestra aleatoria simple de tama no 4, (
1
,
2
,
3
,
4
), se pide:
c) Obtener un intervalo de conanza para al nivel 1 = 0
9, a partir de la muestra (1
8; 2
2; 1
3; 2
0).
4. (125 puntos) El distribuidor arma que la vida util, en a nos, de un transistor sigue una distribucion gamma
de media 1 y desviacion tpica 1/
2. El cliente duda de esta armacion, por lo que estudia 100 transistores,

obteniendo los siguientes resultados:
Tiempo de vida (en a nos) Entre 0 y 1 De 1 a 2 Mas de 2
N umero de transistores 60 30 10
05?
b) A un aparato se le instala uno de los transistores de este distribuidor como principal y nueve de repuesto,
para que en caso de que se avera el transmisor principal entre en funcionamiento el primer transistor de
repuesto y permitan al aparato seguir funcionando, y en caso de que se avera el primer transistor de repuesto
entre en funcionamiento el segundo transistor de repuesto, y as sucesivamente hasta haber utilizado los diez
transistores (el principal mas los nueve de repuesto). Teniendo en cuenta el resultado obtenido en el apartado
anterior y suponiendo independencia entre los transistores, calcular la probabilidad de que el aparato dure
mas de 6
1 a nos.
M
ETODOS ESTAD
IA
SOLUCIONES
TEST
N
o
a) b) c) d) e)
1. X X
2. X X
3. X
4. X
5. X
6. X
7. X
8. X
9. X X
10. X
11. X
12. X
13. X X
14. X
15. X X X X
16. X
17. X
18. X
19. X X
20. X X X X
EJERCICIOS
N
o
Respuesta
1. Ejercicio 2.17
2. Ejercicio 4.18
3. Ejercicio 8.24
4. Ejercicio 9.25
M
ETODOS ESTAD
IA
TEST
1. Los datos de resistencia a la tension (en psi) de una muestra de aleacion de aluminio-litio son 92, 120, 200
y 140. Con estos datos se obtiene que 1572 es el valor de la:
a) Varianza muestral;
d) Desviacion tpica muestral;
b) Cuasivarianza muestral;
e) Todo falso.
c) Cuasidesviacion tpica muestral;
2. Los datos de resistencia a la tension (en psi) de una muestra de aleacion de aluminio-litio son 92, 120, 200
y 140. Con estos datos se obtiene que una mediana de la muestra es:
a) 130; b) 127; c) 135; d) 125; e) Todo falso.
3. Un individuo llega a casa completamente ebrio y se encuentra con que tiene en su bolsillo 4 llaves que es
incapaz de diferenciar, de las que solo una abre la puerta. Al intentar abrir, elige al azar una llave, la prueba y
si no abre, lo intenta con otra. Teniendo en cuenta que su estado es tal que no es capaz de separar las llaves ya
utilizadas, cual es la probabilidad de que tenga que realizar no mas de 2 intentos para abrir la puerta?
a) 1/2; b) 7/16; c) 61/125; d) 3/5; e) Todo falso.
4. Laura es una estudiante de 2
o
de Industriales que ademas milita en Organizaciones Sociales y Ecologistas
(OSE). Han pasado 10 a nos y los tres sucesos siguientes son posibles: A = {Laura trabaja como Ingeniera en una
Central Nuclear}, B = {Laura trabaja como Ingeniera en una Central Nuclear y sigue militando activamente
en OSE} y C = {Laura trabaja como Ingeniera en una Central Nuclear o no trabaja en ning un sitio}. Las
probabilidades de estos tres sucesos se ordenan as:
a) P(A) P(B) P(C);
d) P(B) P(A) P(C);
b) P(C) P(A) P(B);
e) Todo falso.
c) P(C) P(A) P(B);
5. Sea una variable aleatoria con funcion de probabilidad
0 1 2
P
3 0
5 0
2
. Si F
(x) representa el valor

de la funcion de distribucion de en un punto x, se tiene que:
a) F
(1) = 0
8; b) F
(2) = 0
2; c) F
(0
5) = 0
3; d) F
(3) = 1; e) Todo falso.

6. Sea una variable aleatoria con funcion de probabilidad
0 2
P
3 0
7
. Si g
(t) representa el valor de la

funcion generatriz de momentos de en un punto t, se tiene que:
a) g
(0) = 1; b) g
(2) = 6
8456; c) g
(0) = 0
3245; d) g
(1) = 5
4723; e) g
(1) = 1.
7. Si sigue una distribucion binomial B(2, 0
5), se tiene que la esperanza de

2
es igual a:
a) 15; b) 1; c) 05; d) -35; e) Todo falso.
8. Si es una variable con distribucion normal N(, ), la probabilidad P(| | < 3) es aproximadamente
igual a:
a) 19987; b) 09974; c) 00026; d) -00013; e) 27.
9. Sean
1
y
2
dos v.a. independientes e igualmente distribuidas, con distribucion gamma (1, 1/2). Entonces
la v.a.
1
+
2
a)
2
4
; b) (1, 1); c) (2, 1/2); d) (2, 2); e) Todo falso.
10. Sean y dos variables aleatorias independientes e igualmente distribuidas, con distribucion exponencial
exp(2), entonces la covarianza Cov(2, 3) es igual a:
a) 3/2; b) 1; c) 0; d) -1; e) Todo falso.
11. Una compa na de electronica fabrica resistores que tienen una resistencia media de 90 y una desviacion
tpica de 10. Al tomar una muestra de n = 100 resistores, podemos asegurar que la probabilidad de que la
resistencia promedio de estos resistores sea menor de 95, es decir, P(
100
a) 075; b) 025; c) 099; d) 002; e) 095.
12. Una compa na de electronica fabrica resistores que tienen una resistencia media de 90 y una desviacion
tpica de 10. Al tomar una muestra de n = 20 resistores, podemos asegurar que la probabilidad de que la
resistencia promedio de estos resistores sea menor de 95, es decir, P(
20
a) 075; b) 025; c) 099; d) 002; e) 095.
2
9
, respectivamente, en-
tonces la variable aleatoria =
3

a) F
1
9
; b) F
9
1
; c) t
3
; d) t
9
; e) Todo falso.
2
9
, respectivamente, en-
tonces la variable aleatoria =
9
2

a) F
1
9
; b) F
9
1
; c) t
3
; d) t
9
; e) Todo falso.
15. Sea (
1
,
2
, . . . ,
n
) una m.a.s. de una v.a. con media y varianza
2
> 0. Entonces se puede armar
siempre que:
a)
n
c) (
n
)
2
2
;
e) Todo falso.
b) (
n
)
2
2
;
d)
n
16. En un sondeo realizado sobre 50 alumnos de la asignatura MEDLI, se ve que 12 de ellos no estan satisfechos
con el enfoque de la asignatura. Un intervalo de conanza, al 99 %, para la proporcion poblacional de insatisfechos
es aproximadamente:
a) (196,342); b) (00025,00032); c) (00842,03958); d) (02393,02407); e) (12,50).
17. A partir de una muestra aleatoria de tama no n = 30 se pretende contrastar si la distribucion es normal
N(5, 3), obteniendose que la maxima discrepancia entre la funcion de distribucion emprica y la funcion de
distribucion de la normal es 0
178, es decir, D
30
= sup
xIR
|F
n
(x)F
N(5,3)
(x)| = 0
178, donde F
N(5,3)
representa
la funcion de distribucion de una normal N(5, 3). Con estos datos se rechaza la hipotesis de que la distribucion
de la variable es N(5, 3) al nivel de signicacion:
a) 005; b) 001; c) 01; d) 02; e) Todo falso.
18. A partir de una muestra aleatoria de tama no n = 30 se pretende contrastar si la distribucion es normal,
obteniendose que la maxima discrepancia entre la funcion de distribucion emprica y la funcion de distribucion
de la normal es 0
178, es decir, D
30
= sup
xIR
|F
n
(x) F
0
(x)| = 0
178, donde F
0
representa la funcion de
distribucion de una normal N(, ) en la que se estimaran los valores de los parametros (, ) mediante las
estimaciones maximos verosmiles obtenidas a partir de los valores de la muestra. Con estos datos se rechaza la
hipotesis de que la distribucion de la variable es normal al nivel de signicacion:
a) 005; b) 001; c) 01; d) 02; e) Todo falso.
incompleta, los resultados del ANOVA que trata de investigar si la concentracion de madera dura en la pulpa
(en %) inuye sobre la resistencia del papel a la tension (psi).
Fuente de variacion
Suma de
cuadrados
g.l.
Media
cuadratica
Concentraci on de madera 20011
Error 20
TOTAL 47016 23
05, que:
a) La concentracion de madera no inuye. b) La concentracion de madera inuye. c) El p-valor o nivel
crtico es mayor de 005. d) Todo cierto. e) Todo falso.
a) El n umero de niveles del factor es 3. b) El n umero de niveles del factor es 4. c) El tama no total de la
muestra es 24. d) El tama no total de la muestra es 23. e) Todo falso.
M
ETODOS ESTAD
IA
EJERCICIOS
1. (125 puntos) Supongase que la variable aleatoria continua denota el ancho (en cm) de una pieza moldeada
por inyeccion, y que la variable aleatoria continua denota el alto (en cm) de la misma pieza. Supongase ademas
que la funcion de densidad conjunta es
f
(,)
(x, y) =
_
k si 4
8 < x < 5
2 y x + 4
8 < y < x + 5
3,
0 en el resto.
a) Determnese el valor de k.
b) Determnese la probabilidad de que el alto este entre 9
8 y 9
9 cm.
c) Determnese la funcion de densidad condicional de dado que = 5.
d) Determnese la probabilidad de que el alto este entre 9
8 y 9
9 cm., suponiendo que el ancho de la pieza es

de 5 cm.
2. (125 puntos) Una maquina que fabrica componentes electricos dispone de un detector de artculos de-
fectuosos. Este detector detecta un componente defectuoso con probabilidad 0
99 y considera defectuoso un
componente que no lo es con probabilidad 0
02. Si la maquina produce un 5 % de componentes defectuosos,

calcular:
defectuoso.
tuoso.
tuoso.
d) Si el detector analiza 10000 componentes de manera independiente, cual es la probabilidad de que cometa
menos de 195 errores? Nota.- El detector comete un error si clasica como defectuoso un componente no-
defectuoso o como no-defectuoso un componente defectuoso.
3. (125 puntos) Se supone que el n umero de accidentes diarios en una empresa es una variable aleatoria
con distribucion de Poisson de parametro y que todos los das se comportan igual e independientemente unos
de otros, respecto al n umero de accidentes que ocurren. Sea (
1
,
2
, . . . ,
n
) una m.a.s. de tama no n obtenida a
partir de . Calcular:
a) El estimador maximo verosmil de .
b) El estimador maximo verosmil de , siendo la probabilidad de que en una semana no ocurra ning un
accidente. Nota.- La semana tiene 7 das laborables.
c) Comprobar que para una muestra de tama no n = 1 el estimador T(
1
) = (6)
1
es insesgado para .
4. (125 puntos) Un fabricante de detergente lquido esta interesado en la uniformidad de la maquina utilizada
para llenar las botellas. De manera especca, es deseable que la varianza del proceso de llenado (
2
) sea menor
o igual de 8ml
2
; de otro modo, existe un porcentaje mayor del deseable de botellas con contenido insuciente
de detergente. Supongase que la distribucion del volumen de llenado es normal y que al tomar una muestra
aleatoria de 20 botellas, se obtiene una varianza muestral s
2
= 14
48ml
2
.
a) Existen evidencias en los datos muestrales que sugieran que el fabricante tiene un problema con el llenado
de las botellas? (Utilice = 0
05.)
b) A partir de los datos muestrales, obtener un intervalo de conanza para la desviacion tpica del volumen
de llenado, con un coeciente de conanza del 99 %.
M
ETODOS ESTAD
IA
SOLUCIONES
TEST
N
o
a) b) c) d) e)
1. X
2. X X X X
3. X
4. X X
5. X X X
6. X X
7. X
8. X
9. X X
10. X
11. X X X X X
12. X X X
13. X
14. X
15. X
16. X
17. X
18. X X X
19. X
20. X X
EJERCICIOS
N
o
Respuesta
1. Ejercicio 5.15
2. Ejercicio 6.13
3. Ejercicio 8.25
4. Ejercicio 9.26
M
ETODOS ESTAD
IA
TEST
1. La distribucion de frecuencias relativas acumuladas para la variable n umero de asignaturas aprobadas es:
x
i
6 7 8 9 10 11
F
i
0
2 0
35 0
6 0
8 0
95 1
De acuerdo con estos datos se tiene que el porcentaje de gente con mas de 6 asignaturas aprobadas y menos de
10 es:
a) 80 %; b) 60 %; c) 20 %; d) 15 %; e) Todo falso.
2. De acuerdo con los datos de la pregunta anterior, y teniendo en cuenta que en la clase hay 50 alumnos, el
n umero de ellos que tienen mas de 8 asignaturas aprobadas es:
a) 80; b) 60; c) 20; d) 15; e) Todo falso.
3. Un individuo llega a casa completamente ebrio y se encuentra con que tiene en su bolsillo 4 llaves que es
incapaz de diferenciar. Al intentar abrir la puerta elige al azar una llave, la prueba y si no abre, lo intenta con
otra. Teniendo en cuenta que, a pesar de su estado, es capaz de separar las llaves que ya ha utilizado, cual es
la probabilidad de que tenga que realizar no mas de 2 intentos para abrir la puerta?
a) 1/2; b) 7/16; c) 61/125; d) 3/5; e) Todo falso.
4. La probabilidad de que un dispositivo A falle es 0
5, la probabilidad de que falle otro dispositivo B es 0
3
y la probabilidad de que fallen los dos es 0
2. Entonces la probabilidad de que:

a) Al menos uno falle es 0
6;
c) Ninguno de los dos falle es 0
4;
e) Falle B pero no falle A es 0
1.
b) Exactamente uno de los dos falle es 0
4;
d) Falle A pero no falle B es 0
3;
5. Una sociedad con 30 miembros elige entre ellos los puestos de presidente, secretario y tesorero. Cuantas
directivas diferentes se pueden formar?
a) 3; b) 24360; c) 460; d) 90; e) Todo falso.
6. Juan es uno de los miembros de la sociedad anterior. La probabilidad de que no sea elegido para ninguno
de los tres cargos es:
a) 09; b) 01; c) 03; d) 05; e) Todo falso.
7. La funcion de densidad de una v.a. es f
(x) = e
x
, si x a y f
(x) = 0, en el resto. El valor de a es:

a) 1; b) +; c) 0; d) -1; e) Todo falso.
8. Siguiendo con la variable de la pregunta 7., la funcion de distribucion de es igual a:
a) f
(x), x IR; b) 1 e
x
si x > 0; c) 1 e
x
si x < 0; d) 1 +e
x
si x < 0; e) Todo falso.
9. Siguiendo con la variable de la pregunta 7., su esperanza E() es igual a:
a) 1; b) 0; c) -05; d) -1; e) Todo falso.
10. Siguiendo con la variable de la pregunta 7., su varianza V ar() es igual a:
a) 1; b) 0; c) -05; d) -1; e) Todo falso.
11. Sean y dos variables aleatorias independientes e igualmente distribuidas, con distribucion exponencial
exp(2), entonces la distribucion de + es:
a) exp(4); b) (1, 4); c) (2, 2); d) (2, 4); e) Todo falso.
12. Se puede asegurar que la suma de 75 variables aleatorias independientes con distribucion uniforme U(2, 2)
a) U(150, 150);
d) Aproximadamente N(0, 10);
b) H(150, 12, 2);
e) Todo falso.
c) Aproximadamente N(0, 0
13);
13. El estimador maximo verosmil del parametro p de una poblacion de Bernoulli B(1, p) es:
a)
n
; b)
1
n
i
(
i
p)
2
;
c)
n
n
n1
; d) n
n
(1
n
); e) Todo falso.
14. El estimador maximo verosmil de la varianza de una poblacion de Bernoulli B(1, p) es:
a)
n
; b)
1
n
i
(
i
p)
2
;
c)
n
n
n1
; d) n
n
(1
n
); e) Todo falso.
15. Si se desea obtener un intervalo de conanza para la media de una distribucion normal con varianza
conocida y se preja el nivel de conanza, al aumentar el tama no de la muestra la amplitud del intervalo:
a) Aumenta;
d) Se multiplica por dos;
e) Todo falso.
c) Disminuye;
16. Si se desea obtener un intervalo de conanza para la media de una distribucion normal con varianza
conocida y se dispone de una muestra aleatoria de tama no n = 100, al aumentar el nivel de conanza la
amplitud del intervalo:
a) Aumenta;
d) Se divide entre dos;
e) Todo falso.
c) Disminuye;
17. La longitud de los tornillos cortados por una maquina sigue una distribucion normal. Se toma una m.a.s.
de 20 de estos tornillos, con la que se obtiene que la cuasidesviacion tpica muestral es s
2
= 0
0153. Un intervalo
de conanza, al 95 %, para la varianza poblacional
2
es aproximadamente:
a) (-125,-0026); b) (000885,003264); c) (01,03); d) (125,226); e) Todo falso.
18. El test chi-cuadrado de bondad de ajuste:
a) Solo se puede utilizar para distribuciones continuas. b) Solo se puede utilizar para distribuciones discretas.
c) Se puede utilizar para distribuciones discretas y continuas, aunque en el caso de continuas, el de Kolmogorov-
Smirnov puede ser mas indicado. d) Se puede utilizar para distribuciones discretas y continuas, aunque en el
caso de discretas, el de Kolmogorov-Smirnov puede ser mas indicado. e) Todo falso.
incompleta, los resultados del ANOVA que trata de investigar si el laboratorio inuye sobre la medicion de la
concentracion de plomo en el agua de ro, expresada en mg/L).
Fuente de variacion
Suma de
cuadrados
g.l.
Media
cuadratica
Tipo de laboratorio
Error 23 125
TOTAL 8375 28
05, que:
a) El laboratorio no inuye;
b) El laboratorio inuye;
c) Al menos uno de los laboratorios ha producido resultados, la media de los cuales diere de forma estadsti-
camente signicativa del resto de laboratorios;
d) No existen diferencias entre las medias de los laboratorios;
e) Todo falso.
a) Se han comparado 3 laboratorios;
b) Se han comparado 4 laboratorios;
c) Entre todos los laboratorios han hecho un total de 27 mediciones;
d) Entre todos los laboratorios han hecho un total de 29 mediciones;
e) Todo falso.
M
ETODOS ESTAD
IA
EJERCICIOS
1. (125 puntos) El diametro (en mm.) de un agujero taladrado en una placa de metal es una variable aleatoria
continua con funcion de distribucion:
F
(x) =
_
1 e
20(x12
5)
si x > 12
5,
0 si x 12
5.
a) Sabiendo que una pieza se deshecha si el diametro es mayor de 12
60, cual es la probabilidad de que se

desheche una pieza?
b) Cual es la probabilidad de que una pieza tenga un diametro entre 12
5 y 12
6 milmetros?
c) Obten la distribucion de la variable = 12
5?
d) Cuanto vale el diametro medio de estas piezas?
e) Obten la funcion generatriz de .
2. (125 puntos) El n umero de puntos de oxido por placa que se producen en las placas de un circuito sometido
a un grado de humedad sigue una distribucion de Poisson con un promedio de un punto de oxido por placa. Si
se supone que las placas son independientes unas de otras, se pide:
a) Calcular la probabilidad de que una placa no tenga puntos de oxido.
b) Se considera que una placa es aceptable si tiene menos de tres puntos de oxido. Cual es la probabilidad de
que una placa sea aceptable?
c) Si un circuito tiene 8 placas, cual es la probabilidad de que al menos 7 de ellas sean aceptables?
d) Cual es la probabilidad de que tengamos que observar 4 placas para encontrar una no aceptable?
3. (125 puntos) El diametro de los agujeros resultantes al taladrar en tarjetas de circuito impreso es una
variable aleatoria con una desviacion tpica de 0
01 milmetros y media desconocida . Si se consideran n

diametros independientes
1
,
2
, . . . ,
n
, se pide:
a) Obtener la media y la varianza de la media muestral
n
.
b) Calcular de forma aproximada la probabilidad de que
n
005 milmetros del

diametro promedio del proceso, suponiendo que n = 36.
c) Acotar inferiormente la probabilidad de que
n
005 milmetros del diametro

promedio del proceso, suponiendo que n = 20.
4. (125 puntos) Una muestra aleatoria simple de los balances nancieros de 100 empresas de tama no peque no,
proporciona un volumen de ventas medio muestral de 0
25 millones de euros. El volumen de ventas, en millones

de euros, de cada una de esas empresas es una v.a.
i
con distribucion beta (p, 1), con lo que su esperanza y
varianza son, respectivamente, E(
i
) =
p
p+1
y V ar(
i
) =
p
(p+1)2(p+2)
. Con estos datos se pide:
a) Contrastar al nivel = 0
05 las hipotesis
H
0
: = 2/3
H
1
: = 2/3
b) Calcular el nivel crtico o p-valor del contraste anterior.
M
ETODOS ESTAD
IA
SOLUCIONES
TEST
N
o
a) b) c) d) e)
1. X
2. X
3. X
4. X X X X X
5. X
6. X
7. X
8. X
9. X
10. X
11. X
12. X
13. X
14. X
15. X
16. X
17. X
18. X
19. X X
20. X
EJERCICIOS
N
o
Respuesta
1. Ejercicio 4.19
2. Ejercicio 4.20
3. Ejercicio 6.14
4. Ejercicio 9.27
M
ETODOS ESTAD
IA
TEST
Temp:40C
50%
Temp:50C
30%
Temp:60C
20%
Las dos preguntas siguientes hacen referencia al siguiente enunciado:
Se ha anotado la temperatura de fabricacion de 200 piezas, obteniendose los resulta-
dos del diagrama de sectores adjunto, en el que se representan las frecuencias relativas
correspondientes a cada temperatura.
1. Con dichos datos se obtiene que una mediana de la variable en estudio es:
a) Me = 30; b) Me = 45; c) Me = 150; d) Me = 60; e) Todo falso.
2. Con dichos datos se obtiene que la varianza de la temperatura es exactamente:
a) 781; b) 783; c) 61; d) 613; e) Todo falso.
3. En un colectivo de 50 personas, 32 son varones, 41 son espa noles y 26 son varones espa noles. Si se eligen al
azar 10 de esas personas, la probabilidad de que exactamente 4 sean mujeres extranjeras es:
a) 0; b) 05; c) 0025; d) 075; e) Todo falso.
4. En el codigo Morse cada smbolo se representa por una sucesion de puntos y rayas. El n umero de smbolos
distintos que se pueden representar por una sucesion de 5 o menos puntos y rayas, si no se considera la posibilidad
de espacios en blanco, es:
a) 64; b) 62; c) 32; d) 2; e) Todo falso.
5. Sea una variable aleatoria continua con funcion de densidad f
(x) = 3x
2
para todo x (0, 1) y f
(x) = 0
en el resto. El valor de su funcion de distribucion en 0
5, F
(0
5), es igual a:
a) 1; b) 0
125; c) 0
875; d) 0
75; e) Todo falso.

6. Sea una variable aleatoria continua con funcion de distribucion F
tal que F
(x) = 3x 3x
2
+ x
3
para
todo x (0, 1). El valor de su funcion de densidad en 0
5, f
(0
5), es igual a:
a) 1; b) 0
125; c) 0
875; d) 0
75; e) Todo falso.

7. Suponiendo que la demanda aleatoria de gasolina durante un cierto periodo de tiempo se comporta con
arreglo a la distribucion normal de media 150000 litros y desviacion tpica 10000 litros, la mnima cantidad que
hay que tener disponible para satisfacer la demanda con una probabilidad p es:
a) 166450 litros si p = 0
95;
d) 169 litros si p = 0
975;
b) 166 litros si p = 0
95;
e) 150 litros si p = 0
975.
c) 169600 litros si p = 0
975;
8. Una urna contiene 20 bolas, de las que 8 son rojas, 3 verdes y 9 negras. Se extraen simultaneamente 3 bolas
de la urna. La probabilidad de que
a) Las 3 sean rojas es (1/8)
3
;
d) Ninguna sea verde es 1 (1/9)
3
;
b) Al menos 1 sea verde es (1/9)
3
;
e) Todo falso.
c) Dos sean rojas es 8/95;
9. Sea (, ) una v.a. bidimensional con funcion de densidad conjunta f(x, y) = k si 0 < x < 3, 1 < y < 4 y
f(x, y) = 0 en el resto. Entonces su funcion de distribucion conjunta F(x, y) verica que:
a) F(1, 2) = F(2, 1);
d) F(2, 2) = 1/4;
b) F(2, 2) = P( < 2, < 2) =
1
2
;
e) Todo falso.
c) F(2, 2) = 2/9;
10. Considerese la siguiente cadena de razonamiento: Sea N(, ), entonces N(, ), con lo que
0 = + () N(0,
2). Como evidentemente la v.a. constante 0 no sigue una distribucion normal, la

anterior cadena falla en que:
a) no sigue una distribucion N(, ), sin una N(, );
b) + () no sigue una distribucion N(0,
2), por no estar y igualmente distribuidas;

c) + () no sigue una distribucion N(0,
2), por no ser y independientes;

d) + () no sigue una distribucion N(0,
2), por no ser reproductiva la distribucion normal;

e) Todo falso.
11. Dada una v.a. con media 12 y varianza 9, se tiene siempre que P(4 < < 18) es mayor o igual que:
a) 095; b) 085; c) 075; d) 09; e) Todo falso.
12. Los ingresos diarios se representan mediante una v.a. con media 3 y varianza 4. Si se consideran 40
das independientes, la probabilidad de que los ingresos totales (suma de los ingresos) sean mayores de 120 es
aproximadamente:
a) 05; b) 1; c) 0; d) 095; e) Todo falso.
13. Sea (
1
,
2
, . . . ,
9
) una m.a.s. de tama no 9 de una poblacion N(0, 1). Si y S
2
representan la media y la
varianza muestrales, respectivamente, se tiene que:
a) 3 N(0, 1);
b) 9
2
2
1
;
c) 9S
2
2
8
;
d)
8
2
S
2
F
1
8
;
e) Todo falso.
14. Sea (
1
,
2
, . . . ,
n
) una m.a.s. de una v.a. con funcion de densidad f(x) =
2
xe
x
si x > 0 y f(x) = 0
en el resto, con un parametro desconocido positivo. Entonces el estimador maximo verosmil de es:
a)
n
;
b)
1
n
;
c) max{
1
, . . . ,
n
}; d) mn{
1
, . . . ,
n
};
e)
2
n
.
15. Sea (
1
,
2
, . . . ,
n
) una m.a.s. de una v.a. con funcion de densidad f(x) = e
x
si x > y f(x) = 0 en
el resto, con un parametro desconocido positivo. Entonces el estimador maximo verosmil de es:
a)
n
; b)
n
/2; c)
n
; d)
n
/2; e) Todo falso.
16. Los benecios mensuales de dos fabricas A y B, medidos en tanto por ciento, siguen distribuciones N(
1
, 3)
y N(
2
,
7) y se comportan de manera independiente. Se obtienen sendas muestras de los benecios mensuales

de ambas fabricas del mismo tama no n y se obtiene un benecio medio muestral del 9 % en la primera y del
8 % en la segunda. De los siguientes tama nos muestrales, el mas peque no que permite obtener un intervalo de
conanza de
1
2
, al nivel de conanza
= 1 = 0
9876, con amplitud menor o igual que 2 es:

a) 30; b) 21; c) 102; d) 1234; e) 34.
17. Bajo las hipotesis de la cuestion anterior si n = 64, el contraste H
0
:
1

2
frente a la alternativa
H
1
:
1
>
2
tiene un p-valor igual a:
a) 005; b) 0005; c) 05; d) 00005; e) Todo falso.
18. En la cuestion anterior:
a) La hipotesis H
0
c) La hipotesis H
0
e) Todo falso.
b) La hipotesis H
0
d) La hipotesis H
0
Las dos preguntas siguientes hacen referencia al siguiente enunciado: Se realiza un experimento con un factor de
interes que contiene 4 niveles con 8 observaciones en cada nivel. La tabla ANOVA incompleta da los siguientes
resultados:
Fuente de variacion
Suma de
cuadrados
g.l.
Media
cuadratica
Factor 914
Error 560
TOTAL
a) Al nivel = 0
05, el factor inuye;

c) El p-valor es mayor que 005;
e) Todo falso.
b) Al nivel = 0
05, el factor no inuye;

d) El p-valor es menor que 005;
05;
05;
e) Todo falso.
M
ETODOS ESTAD
IA
EJERCICIOS
1. (125 puntos) Un sistema consta de 3 componentes tal como se ilustra en la gura adjunta.
2
3
1
Todo el sistema funcionara si el subsistema 1-2 funciona o el subsistema 1-3 funciona. Las componentes funcionan o
fallan una independiente de otra y cada una funciona con probabilidad 09.
a) Calcula la probabilidad de que el sistema funcione.
b) Si se sabe que el sistema funciona, cual es la probabilidad de que la componente 2 este funcionando?
c) Si se sabe que la componente 2 funciona, cual es la probabilidad de que el sistema funcione?
2. (125 puntos) El tiempo, en minutos, que tarda en atender a un internauta un programa de dispensacion de billetes
de avion es una v.a. con funcion de densidad:
f(x) =
1
2
x si 0 < x < 1,
1
6
x +
2
3
si 1 < x < 4,
0 en el resto.
Si el programa tarda mas de 2 minutos, se considera una duracion excesiva, siendo aceptable en caso contrario.
a) Una compa na A comprara el programa con probabilidad 0
8 si la duracion de una prueba es aceptable y con

probabilidad 0
1 si es excesiva. Tras una ejecucion del programa, la compa na ha decidido comprarlo, cual es la
probabilidad de que la duracion haya sido excesiva?
b) La compa na B, menos conada, preere realizar 5 ejecuciones independientes del programa, comprandolo solo si
tiene una duracion aceptable en al menos 4 de ellas. Cual es la probabilidad de que compre el programa?
c) La compa na C, a un mas desconada, decide realizar 50 ejecuciones independientes del programa y comprarlo solo
si a lo sumo en 10 ocasiones la duracion ha sido excesiva. Cual es la probabilidad de que compre el programa la
compa na C?
3. (125 puntos) Una pagina de descargas de Internet esta estudiando el tiempo, en minutos, que permanece en ella un
usuario cualquiera. Para ello utiliza un modelo formado por tres variables aleatorias, de forma que =el tiempo total,
=el tiempo en cola y =el tiempo de descarga , con lo que = . La distribucion de (, ) viene dada por la
siguiente funcion de densidad conjunta:
f
,
(x, y) =
{
1
2
e
kx
si 0 < x < , 0 < y < x,
0 en otro caso.
a) Obten el valor de la constante k.
b) Determina la funcion de densidad de condicionada a que = 4.
c) Si un individuo estuvo en cola 4 minutos, cual es la probabilidad de que el tiempo total sea mayor de 10 minutos?
4. (125 puntos) Un fabricante de semiconductores produce controladores que se emplean en aplicaciones de motores
automovilsticos. El cliente requiere que el porcentaje de controladores defectuosos en uno de los pasos de manufactura
crticos (p) sea menor del 4 %. El fabricante de semiconductores toma una muestra aleatoria de 100 dispositivos y
encuentra que tres de ellos son defectuosos. A partir de los datos de la muestra, se pide:
a) Contrastar la hipotesis H
0
: p 0
1
: p < 0
04, al nivel de signicacion = 0
05. (Con
esto el fabricante pretende demostrar al cliente la calidad del proceso.)
b) Obtener un intervalo de conanza para la proporcion de controladores defectuosos, al nivel de conanza 1 = 0
9.
M
ETODOS ESTAD
IA
SOLUCIONES
TEST
N
o
a) b) c) d) e)
1. X
2. X
3. X
4. X
5. X
6. X
7. X X
8. X
9. X
10. X
11. X
12. X
13. X X X X
14. X
15. X
16. X
17. X
18. X X
19. X X
20. X X
EJERCICIOS
N
o
Respuesta
1. Ejercicio 2.18
2. Ejercicio 6.15
3. Ejercicio 5.16
4. Ejercicio 9.28
M
ETODOS ESTAD
IA
TEST
Las dos preguntas siguientes hacen referencia al siguiente enunciado: Se ha anotado la temperatura de fabricacion
de 200 piezas, obteniendose la siguiente tabla de frecuencias absolutas:
Temperatura (x
i
) 40 50 60
N
o
piezas (n
i
) 100 60 40
1. Con dichos datos se obtiene que la temperatura media de esta muestra es:
a) 40; b) 47; c) 50; d) 60; e) Todo falso.
2. Con dichos datos se obtiene que el tercer cuartil es:
a) 40; b) 47; c) 50; d) 60; e) Todo falso.
3. Consideremos el lanzamiento de dos dados y los siguientes sucesos: A=en el primer dado sale el 3, B=en
el primer dado sale par y C=en el segundo dado sale par. El suceso A B C representa:
a) En el primer dado sale 1 o 5;
b) En el primer dado sale un n
o
distinto de 3 y en el segundo sale par;
c) En el segundo dado sale par;
d) En ambos dados sale par;
e) Todo falso.
4. Siguiendo con el enunciado de la pregunta anterior, la probabilidad P(A B C) es:
a) 1/6; b) 5/12; c) 12/5; d) 1/2; e) Todo falso.
5. Sea una variable aleatoria con E() = 6 y V ar() = 3. Sea = 3
2
+ 1, entonces E() es igual a:
a) 118; b) 18; c) 100; d) 11; e) Todo falso.
6. Sea una variable aleatoria discreta que toma los valores 1 y 2 con probabilidades: P( = 1) = 0
6 y
P( = 2) = 0
4. La funcion generatriz de es:

a) g
(t) = 0
6e
t
+ 0
4e
2t
;
d) g
(t) = 1
4;
b) g
(t) = e
0
6t
+ 2e
0
4t
;
e) Todo falso.
c) g
(t) = e
3t
;
7. Un alumno responde al azar una pregunta de un test con 5 posibles respuestas correctas de las que sabe,
por un compa nero, que exactamente 2 son ciertas. Cual es la probabilidad de que se nale exactamente las dos
correctas?
a) 1/5; b) 1/10; c) 5; d) 1/20; e) Todo falso.
8. Supongamos que sigue una distribucion uniforme U(0, 1), entonces:
a) 3 U(0, 3); b) 0
5 U(0, 2); c) 3 U(0, 2); d) 0
5 U(0, 0
5); e) Todo falso.

9. Sea una v.a. con V ar() = 3 y sea otra v.a. tal que = 2, entonces la covarianza entre las variables
y es:
a) -3; b) 3; c) 6; d) 9; e) Todo falso.
10. Sean y dos variables aleatorias independientes y ambas con distribucion exponencial de media 2, la
distribucion de + es:
a)
2
1
; b)
2
4
; c) (2, 1/2); d) (2, 2); e) Todo falso.
11. Dada una v.a. con media 4 y varianza 2, se tiene siempre que P( < 7) es mayor o igual que:
a) 17/18; b) 15/18; c) 7/9; d) 8/9; e) Todo falso.
12. Sea (
1
,
2
, . . . ,
100
) una m.a.s. de tama no 100 de una poblacion uniforme U(0, 6). La distribucion de la
variable
100
i=1
i
es aproximadamente:
a) U(0, 600); b) N(300,
300); c) N(300, 300); d) P(100); e) Todo falso.

13. Sea (
1
,
2
, . . . ,
9
) una m.a.s. de una poblacion N(, 1). Entonces
n
i=1
(
i
)
2
a) t
n1
; b) N(0, 1); c)
2
n
; d) F
n1
n1
; e) Todo falso.
14. Sea (
1
,
2
, . . . ,
n
) una m.a.s. de una v.a. con funcion de densidad
f(x) =
_
( 2)x
3
si 0 < x < 1
0 en el resto
con un parametro desconocido mayor que 2. Entonces el estimador maximo verosmil de es:
a)
n
;
b) 2
n
i
ln(
i
)
;
c)
1
n
i
ln(
i
); d) max{
1
, . . . ,
n
}; e) Todo falso.
15. Sea (
1
,
2
, . . . ,
n
) una m.a.s. de una poblacion B(1, p), sea T
1
el estimador maximo verosmil de p y sea
T
2
el estimador de p por el metodo de los momentos. Se tiene que:
a) T
1
= T
2
; b) T
1
=
n
; c) T
2
=
n
; d) T
1
= T
2
= S
2
; e) Todo falso.
16. Una nueva droga ha curado a 9 de 30 personas de una determinada enfermedad. Un intervalo de conanza
al nivel 1 = 0
99 de la probabilidad de curar a una persona de esa enfermedad es:

a) (008,052); b) (014,046); c) (016,044); d) (019,041); e) (023,034).
17. Se considera una muestra de tama no 1 de una poblacion de Poisson de parametro para contrastar
H
0
1
: = 2 y se elige como region crtica S
1
= {x|x > 3}. Entonces se tiene
aproximadamente que:
a) P(e
I
) = 0
02; b) P(e
I
) = 0
98; c) P(e
II
) = 0
86; d) P(e
II
) = 0
14; e) P(e
I
) = 2.
18. A partir de una muestra aleatoria de tama no n = 20 se pretende contrastar si la distribucion es normal
N(24, 5), obteniendose que la maxima discrepancia entre la funcion de distribucion emprica y la funcion de
distribucion de la normal es 0
160, es decir, D
20
= sup
xIR
|F
n
(x) F
N(24,5)
(x)| = 0
160, donde F
N(24,5)
representa la funcion de distribucion de una normal N(24, 5). Con estos datos se rechaza la hipotesis de que la
distribucion de la variable es N(24, 5) al nivel de signicacion:
a) 005; b) 001; c) 01; d) 02; e) Todo falso.
respuesta.
Fuente de variacion
Suma de
cuadrados
g.l.
Media
cuadratica
Factor A 747 3
Factor B 2280 5
Error 15
TOTAL 4527
05, que:
e) Todo falso.
e) Todo falso.
M
ETODOS ESTAD
IA
EJERCICIOS
1. (125 puntos) Un sistema dispone de dos canales de comunicacion A y B, de forma que si representamos por la
v.a. n
o
de bits transmitidos de forma erronea en la transmision de un bit la funcion de distribucion asociada a dicha
variable sera, en cada caso,
CANAL A CANAL B
F(x) =
0 si x < 0
0
8 si 0 x < 1
1 si 1 x
F(x) =
0 si x < 0
0
9 si 0 x < 1
1 si 1 x
La probabilidad de que un bit sea enviado por el canal A es 0
2 y la probabilidad de que sea enviado por el canal B es

0
8.
a) Cual es la probabilidad de que un bit enviado por este sistema sea transmitido erroneamente?
Ayuda.- La probabilidad pedida es P( = 1).
b) Obtener la distribucion de probabilidad de .
c) Obtener la funcion generatriz de momentos de .
2. (125 puntos) En la fabricacion de aleacion de esta no-plomo para la soldadura de componentes electronicos se quiere
estudiar la relacion existente entre la proporcion de plomo en la aleacion y la cantidad de aleacion producida por ella.
Si denotamos por a la proporcion de plomo en la aleacion y por a la produccion diaria de aleacion (en toneladas), se
sabe que la funcion de densidad conjunta de las variables aleatorias y es
f
(,)
(x, y) =
{
ky(1 + 3x
2
) si 0 < x < 1, 0 < y < 2,
0 en otro caso.
b) Obten las funciones de densidad marginales de y .
c) Estudia si las variables y son independientes.
d) Calcula la proporcion media de plomo en la aleacion, la produccion media diaria de aleacion y la esperanza del
producto .
3. (125 puntos) De una poblacion se van a seleccionar aleatoriamente varios individuos como muestra para estudiar la
proporcion de fumadores en dicha poblacion (p).
a) Cual es el mnimo n umero de personas que deberamos seleccionar para que al estimar p mediante un intervalo de
conanza, con un coeciente de conanza del 97
8 %, el error de estimacion sea como mucho 0
05?
b) Si nalmente no se puede disponer mas que de una muestra de 300 individuos, de los que 90 eran fumadores, cual
sera un intervalo de conanza de la proporcion poblacional de fumadores al 95 %.
4. (125 puntos) Un seguimiento llevado a cabo en un ordenador de una sala durante los ultimos 5 das ha proporcionado
la siguiente informacion respecto al n umero de personas que lo usaron cada hora:
N
o
personas 0 1 >1
N
o
horas 30 20 10
a) De acuerdo con estos datos y a un nivel de signicacion = 0
05, contrasta la hipotesis de que el n umero de personas

que lo usan cada hora sigue una distribucion de Poisson de parametro 06.
b) Si dicha sala tiene 10 ordenadores que son usados de forma independiente, todos ellos igualmente distribuidos en
cuanto al n
o
de personas que los usan y teniendo en cuenta el resultado obtenido en el apartado anterior, cual es la
probabilidad de que el n umero total de personas que usan la sala en una hora elegida al azar sea mayor de 1?
c) De acuerdo con los apartados anteriores, si la sala se abre a las 8:00, cual es la probabilidad de que la primera
persona llegue antes de las 9:00?
M
ETODOS ESTAD
IA
SOLUCIONES
TEST
N
o
a) b) c) d) e)
1. X
2. X
3. X
4. X
5. X
6. X
7. X
8. X X
9. X
10. X X
11. X
12. X
13. X
14. X
15. X X X
16. X
17. X X
18. X
19. X X
20. X X X
EJERCICIOS
N
o
Respuesta
1. Ejercicio 4.21
2. Ejercicio 5.17
3. Ejercicio 8.26
4. Ejercicio 9.29
M
ETODOS ESTAD
IA
TEST
1. El diagrama de caja es una representacion graca de un conjunto de datos que siempre muestra:
a) La media y la desviacion tpica;
d) La mediana y la varianza;
b) La media y la varianza;
e) Todo falso.
c) La mediana y el 1
er
y 3
er
cuartil;
2. El recorrido intercuartlico de una variable estadstica:
a) Puede ser igual al rango de los datos;
c) Puede ser menor que el rango de los datos;
e) Todo falso.
b) Puede ser mayor que el rango de los datos;
d) Debe ser menor que el rango de los datos;
3. Un nuevo sistema hidraulico va a probarse en una de las dos plantas de una empresa. La probabilidad de
que se pruebe en la planta A es de 1/4 y de que sea en la planta B es de 3/4. Si se prueba en la planta A,
hay una probabilidad 0
2 de que falle; dicha probabilidad es 0
1 en caso de ser probado en la B. Cual es la

probabilidad de que dicho sistema falle en la empresa?
a) 005; b) 0125; c) 06; d) 095; e) Todo falso.
4. Bajo las hipotesis de la pregunta anterior, si el sistema ha fallado, cual es la probabilidad de que se haya
probado en la planta B?
a) 005; b) 0125; c) 06; d) 095; e) Todo falso.
Las tres preguntas siguientes hacen referencia al siguiente enunciado: Una caracterstica de la se nal recibida por
una antena se comporta como una v.a. con funcion de densidad f(x) = ke
|x|
para todo x (, ).
5. El valor de la constante k es:
a) 0; b) 1; c) -1; d) -3; e) Todo falso.
6. El valor medio de es:
a) 0; b) 1; c) -1; d) -3; e) Todo falso.
7. Si consideramos una nueva v.a. denida como = || + 2, entonces el valor de la funcion de distribucion
de en el punto 1, es decir, F
(1), es aproximadamente:
a) -0345; b) 0973; c) 0234; d) 0159; e) Todo falso.
8. Dada la v.a. bidimensional (, ) con funcion de densidad conjunta
f(x, y) =
_
k x sen(y) si 0 < x < 1, 0 < y < /2,
0 en el resto,
se tiene que:
a) k = 2;
d) P(
1
2
) = 1/4;
b) y son independientes;
e) Todo falso.
c) P
_

1
2
/ >

4
_
= 1/4;
9. El encargado de ltrar el correo electronico de una empresa establece una barrera para la publicidad que
consiste en eliminar cualquier mensaje que contenga la palabra GRATIS. Se sabe que el 40 % de los mensajes
que se reciben son publicidad, que solo el 1 % de los mensajes que no son publicidad contienen la palabra GRA-
TIS y que la frecuencia de la palabra GRATIS en los mensajes de publicidad se ajusta a una distribucion de
Poisson de parametro = 2. Bajo tales condiciones, la probabilidad de cometer un error, es decir, de eliminar
un mensaje que no es publicidad o de no eliminar un mensaje que es publicidad es aproximadamente:
a) 025; b) 075; c) 042; d) 006; e) 321.
10. Bajo las hipotesis de la pregunta anterior, si la empresa recibe 250 mensajes, la probabilidad de que la
menos la mitad sean publicidad es aproximadamente:
a) 0001; b) 0999; c) 095; d) 27; e) 032.
11. La probabilidad de que la cuasivarianza muestral obtenida a partir de una m.a.s. de tama no 25 de un
poblacion normal con varianza
2
= 4 sea menor de 4
7, es decir, P(
S
2
< 4
7), es aproximadamente igual a:

a) 095; b) 005; c) 025; d) 075; e) 05.
12. Sean y dos v.a. independientes e igualmente distribuidas con distribucion chi-cuadrado
2
n
. La v.a. /
sigue una distribucion F de Snedecor con:
a) n grados de libertad en el numerador y n grados de libertad en el denominador. b) 1 grado de libertad.
c) 2 grados de libertad. d) n grados de libertad. e) (n 1) grados de libertad.
13. Si un estimador T es tal que su error cuadratico medio coincide con su varianza, es decir, E.C.M.(T) =
V ar(T), entonces T es:
a) Insesgado;
d) Asintoticamente sesgado;
b) Sesgado;
e) Todo falso.
c) Asintoticamente insesgado;
14. Si (2, 13, 4, 6) es una m.a.s. de tama no 4 de una poblacion con distribucion uniforme U(, 15), la estima-
cion maximo verosmil de es:
a) 13; b) 2; c) 4; d) 6; e) Todo falso.
15. Si para una v.a. con distribucion gamma (2, ) se ha obtenido una m.a.s. de tama no uno siendo x
1
= 1,
un intervalo de conanza para al nivel de conanza 0
a) (2, 4); b) (0
24, 5
6); c) (0
5, 2); d) (2
3, 3
2); e) (3, 4).

16. En un intervalo de conanza para el cociente de varianzas de dos poblaciones normales, si aumentamos el
nivel de conanza, la longitud del intervalo:
a) Aumenta; b) Disminuye; c) Permanece igual; d) Todo cierto; e) Todo falso.
17. Si (1, 2, 1, 4) es una m.a.s. de tama no n = 4 de una poblacion uniforme U(, +1), la estimacion de por
el metodo de los momentos es:
a) 1; b) 4; c) 15; d) 25; e) Todo falso.
18. Una compa na de seguros de vida sabe que la probabilidad de que un cliente contrate una poliza de prima
unica es 04, de prima ja es 025, de prima decreciente es 015 y de otro tipo es 02. Un cambio en estas
probabilidades podra se nalar la necesidad de cambiar las comisiones. Por ello, la compa na realiza un estudio
de las ultimas 1200 polizas contratadas y se vio que: 438 correspondan a prima unica, 323 a prima ja, 198 a
prima decreciente y las 241 restantes a otro tipo. Entonces se puede concluir que:
a) Al nivel = 0
05, las proporciones han cambiado. b) Al nivel = 0

c) Al nivel = 0
1, las proporciones han cambiado. d) Al nivel = 0

e) Todo falso.
incompleta, los resultados del ANOVA que trata de investigar si el tipo de carbono inuye sobre la rugosidad
de la supercie.
Fuente de variacion
Suma de
cuadrados
g.l.
Media
cuadratica
Tipo de carbono 504
Error 14
TOTAL 3416 18
05, que:
a) El tipo de carbono no inuye;
c) No existen diferencias entre las medias;
e) Todo falso.
b) El tipo de carbono inuye;
d) Existen diferencias entre las medias;
a) Se han comparado 5 tipos de carbono;
c) El tama no total de la muestra es de 15;
e) Todo falso.
b) Se han comparado 4 tipos de carbono;
d) El tama no total de la muestra es de 19;
M
ETODOS ESTAD
IA
EJERCICIOS
1. (125 puntos) Una determinada empresa multinacional consta de varias factoras. Los ingresos anuales, en
millones de euros, de una factora elegida al azar es una v.a. con funcion de densidad:
f(x) =
_
50/x
3
si x > 5,
0 si x 5.
a) Cual es la probabilidad de que una factora elegida al azar tenga unos ingresos superiores a los 10 millones
de euros?
b) Si se eligen dos factoras al azar que funcionan de forma independiente, cual es la probabilidad de que el
maximo de los ingresos de las dos sea menor de 10 millones?
c) Existe un seguro que todas las factoras contratan, por ser obligatorio, que cuesta 6000 euros anuales. La
empresa colabora con las factoras de distinta forma seg un sean sus ingresos anuales. As, a las que ingresan
mas de 10 millones anuales, les paga un 30 % del importe del seguro y al resto les paga un 50 % de dicho
importe. Cual es la cantidad media anual del seguro que paga la factora?
2. (125 puntos) En un lote de 10 productos, 2 son disconformes y el resto son conformes. Con estos datos se
pide:
a) Si el control de calidad del lote consiste en elegir sin reemplazamiento una muestra de 3 productos del lote
y examinarlos,
Cual es la probabilidad de que encuentre al menos un producto disconforme en la muestra?
Cual es el n umero medio de productos disconformes encontrados en la muestra?
b) Otro posible control de calidad consiste en elegir productos del lote, sin reemplazamiento, hasta que aparece
el primero conforme.
Cual es la distribucion de la v.a. =n
o
de productos elegidos sin reemplazamiento para encontrar
el primero conforme?
Cual es el n umero medio de productos que deben ser elegidos para encontrar el primero conforme?
Cual es el n umero medio de productos disconformes que deben ser elegidos hasta encontrar el primero
conforme?
3. (125 puntos) El tiempo de respuesta a un comando de edicion puede representarse mediante una v.a. con
distribucion normal y desviacion tpica = 25ms. Para estimar el tiempo medio de respuesta se considera
una m.a.s. de tama no n de la v.a. .
a) Obtener el estimador maximo verosmil de y estudiar si es insesgado, asintoticamente insesgado y consis-
tente.
b) Que tama no muestral mnimo es necesario para garantizar que el intervalo de conanza de al 95 %
resultante tendra una amplitud a lo sumo de 10ms?
4. (125 puntos) Se ha medido la anchura del espesor de 10 laminas de acero en una planta industrial, obte-
niendose de esas medidas un valor medio x
10
= 0
2573mm y una varianza muestral s

2
= 0
01. Se sabe que el

espesor sigue una distribucion normal N(, ) y se pide:
a) Contrastar, al nivel = 0
05, las hipotesis H

0
: = 0

1
: = 0
253.
b) Cuanto vale el nivel crtico o p-valor asociado al contraste anterior?
c) Calcular la potencia del contraste del apartado a) para una produccion con grosor medio de 0
21mm.
M
ETODOS ESTAD
IA
SOLUCIONES
TEST
N
o
a) b) c) d) e)
1. X
2. X X
3. X
4. X
5. X
6. X
7. X
8. X X X X
9. X
10. X
11. X
12. X
13. X X
14. X
15. X
16. X
17. X
18. X X
19. X X
20. X X
EJERCICIOS
N
o
Respuesta
1. Ejercicio 5.18
2. Ejercicio 4.22
3. Ejercicio 8.27
4. Ejercicio 9.30
M
ETODOS ESTAD
IA
Convocatoria de Septiembre- 16 de Septiembre de 2009
TEST
1. Si para una muestra se obtiene que la media muestral es x = 6, la mediana de dicha muestra siempre es:
a) Mayor que 6; b) Menor que 6; c) Igual a 6; d) Distinta de 6; e) Todo falso.
2. Dada la muestra 2,4,4,6,6,7,8, se tiene que:
a) Su mediana es 6;
d) Su tercer cuartil es 7;
b) Su primer cuartil es 4;
e) Su rango es 6.
c) Su segundo cuartil es 6;
Las tres preguntas siguientes hacen referencia al siguiente enunciado: En una cesta hay seis pares de alpargatas
de distintos n umeros (cada par) y se extraen tres alpargatas.
3. La probabilidad de que sean de distinto n umero, si se extrajo sin reemplazamiento, es:
a) 8/11; b) 5/23; c) 1/11; d) 100/231; e) Todo falso.
4. La probabilidad de que sean de distinto n umero, si se extrajo con reemplazamiento, es:
a) 8/11; b) 2/9; c) 1/216; d) 5/9; e) Todo falso.
5. La probabilidad de que sean de distinto n umero y todas del pie izquierdo, si se extrajo con reemplazamiento,
es:
a) 3/8; b) 1/8; c) 5/72; d) 5/9; e) Todo falso.
6. Si la distribucion de probabilidad de la variable aleatoria =n
o
de defectos en un aparato viene dada por
0 1 2
P
80 0
15 0
05
se tiene que:
a) La media de es 525;
d) La mediana de es 15;
b) La varianza de es -23;
e) Todo falso.
c) La desviacion tpica de es 16;
7. Se puede asegurar que la funcion f(x) =
_
k x si 1 < x < 2,
0 en el resto,
es:
a) Funcion de densidad para todo k IR;
c) Funcion de densidad para alg un k IR;
e) Todo falso.
b) Funcion de distribucion para todo k IR;
d) Funcion de distribucion para alg un k IR;
8. Si es una v.a. con distribucion binomial B(10, p), entonces la varianza de :
a) No puede ser menor que cero;
c) No puede ser mayor que cero;
e) Todo falso.
b) No puede ser mayor que uno;
d) No puede ser menor que uno;
9. Si es una v.a. con distribucion de Poisson P(2), se tiene que:
a) P( = 2) > P( 1);
c) P( = 2) = P( = 1);
e) Todo falso.
b) P( = 0) = P( = 1);
d) P( = 0) P( = 1);
10. Dadas dos variables aleatorias y con varianzas
2
y
2
, respectivamente y covarianza
. Se tiene
siempre que la varianza de la variable aleatoria , es decir, V ar( ), es igual a:
a)
2
+
2
; b)
2
; c)
2
+
2
; d)
2
+
2
+ 2
; e) Todo falso.
11. Dadas dos v.a. y independientes e igualmente distribuidas con distribucion exponencial de media 1, se
tiene que:
a) f(x, y) = e
(x+y)
si x > 0, y > 0;
c) P( 1, 1) = (1 e
1
)
2
;
e) Todo falso.
b) P( 1, 1) = e
2
;
d) +
2
2
;
12. Dada una v.a. con media 4 y varianza 2, se puede asegurar que P(2 < < 6) es mayor o igual que:
a) 02; b) 03; c) 04; d) 05; e) Todo falso.
13. Dada una v.a. con media 4 y varianza 2, se puede asegurar que P( < 6) es mayor o igual que:
a) 08; b) 07; c) 06; d) 05; e) Todo falso.
14. Sea una v.a. con distribucion normal N(0, 1) y sera =
2
. Se puede asegurar que:
a)
2
2
; b)
2
1
;
c)

t
2
; d)

t
1
; e) Todo falso.
15. En una empresa saben que el n
o
de horas perdidas por accidente laboral sigue una distribucion normal
N(, 2), siendo desconocida. El mnimo tama no muestral para estimar con un error de estimacion menor o
igual que 1 y un nivel de conanza del 0
95 es:
a) n = 16; b) n = 30; c) n = 8; d) n = 100; e) Todo falso.
16. Sea (
1
, . . . ,
n
) una m.a.s. de una poblacion con distribucion uniforme U(0, b). El estimador de b por el
metodo de los momentos es:
a) max{
1
, . . . ,
n
}; b) mn{
1
, . . . ,
n
}; c) 2
n
; d)
n
; e) Todo falso.
17. Un fabricante arma que la proporcion de aparatos defectuosos entre los de su produccion es menor o igual
que 0
09 (H
0
). El comprador no se fa y para comprobarlo decide tomar una muestra aleatoria de 100 aparatos.
Si el n umero de defectuosos es mayor que 14 rechaza H
0
y por lo tanto no le compra al fabricante. El nivel de
signicacion () aproximado de la prueba es:
a) Mayor de 0
97; b) Menor de 0
05; c) Mayor de 0
95; d) Mayor de 0
2; e) Igual a 2
2.
18. En la pregunta anterior, si la proporcion de defectuosos fuese realmente de 0
21, la potencia de la prueba

sera aproximadamente
a) Menor de 0
07; b) Menor de 0
03; c) Mayor de 0
94; d) Menor de 0
04; e) Igual a 2
2.
respuesta.
Fuente de variacion
Suma de
cuadrados
g.l.
Media
cuadratica
Factor A 2180 2
Factor B 987 3
Error
TOTAL 3767
05, que:
e) Todo falso.
e) Todo falso.
M
ETODOS ESTAD
IA
EJERCICIOS
1. (125 puntos) Un modelo simplicado del movimiento del n umero de llamadas que se producen diariamente en una
centralita de telefonos, supone que ese n umero aumenta cada da respecto al da anterior en una unidad con probabilidad
p y disminuye cada da respecto al da anterior en una unidad con probabilidad 1 p. Las variaciones del n umero de
llamadas en das diferentes se suponen independientes. Se pide calcular:
a) La probabilidad de que pasados dos das, el n umero de llamadas del tercer da coincida con el n umero de llamadas
del primer da.
b) La probabilidad de que pasados tres das, el n umero de llamadas del cuarto da se haya incrementado en una unidad
respecto al n umero de llamadas del primer da.
c) Si al cabo de tres das el n umero de llamadas aumento en una unidad (el cuarto da hubo una llamada mas que el
primero), cual es la probabilidad de que el segundo da haya aumentado el n umero de llamadas respecto al primero?
d) Cual es la probabilidad de que pasados 100 das, el n umero de llamadas del da 101 no supere en cinco a las
producidas el primer da? (Suponer p = 0
5.)
2. (125 puntos) Sea (, ) una v.a. bidimensional cuya funcion de densidad conjunta es:
f(x, y) =
{
k si 0 < x < 4, x 1 < y < x + 1,
0 en otro caso.
b) Obten las funciones de densidad marginales.
c) Estudia si las variables aleatorias y son independientes.
d) Determina el valor de la esperanza E( ).
3. (125 puntos) El n
o
de solicitudes diarias de auxilio que recibe un servicio de remolque de vehculos sigue una
distribucion de Poisson. Se considera una m.a.s. obtenida durante 100 das seleccionados al azar, se cuentan las solicitudes
recibidas en esos 100 das y estas resultaron ser un total de 200. Con estos datos, se pide:
a) Obtener la estimacion maximo verosmil del n umero medio de solicitudes diarias.
b) Determinar si el estimador utilizado en el apartado anterior es insesgado.
c) Obtener, suponiendo independencia entre los das, la estimacion maximo verosmil del n
o
medio de das a la semana
(7 das) en que no se realiza ninguna solicitud.
4. (125 puntos) La EPA (Agencia de Proteccion Ambiental de EEUU) establece lmites para la concentracion de PCB
(una sustancia peligrosa) en el agua. Una empresa manufacturera importante que produce PCB como aislante electrico
descarga peque nas cantidades de su planta. La gerencia de la compa na ha dado instrucciones de parar la produccion
si la concentracion media de PCB en el euente es mayor que 3 ppm. A partir de una muestra aleatoria simple de 61
especmenes de agua, se obtuvo una media de 31 ppm y una cuasi-desviacion tpica de 06 ppm. Suponiendo normalidad,
se pide:
a) Calcular un intervalo de conanza al nivel 095 para la cantidad media de concentracion de PCB, detallando todos
los pasos.
b) Contrastar si, al nivel de signicacion 001, los datos anteriores proporcionan sucientes pruebas como para detener
el proceso de produccion.
M
ETODOS ESTAD
IA
SOLUCIONES
TEST
N
o
a) b) c) d) e)
1. X
2. X X X X X
3. X
4. X
5. X
6. X
7. X
8. X
9. X
10. X
11. X X
12. X X X X
13. X
14. X
15. X
16. X
17. X
18. X
19. X X
20. X X X
EJERCICIOS
N
o
Respuesta
1. Ejercicio 6.16
2. Ejercicio 5.19
3. Ejercicio 8.28
4. Ejercicio 9.31

Métodos estadísticos de la ingeniería (Univ. Oviedo

Загружено:

Сведения о документе

Оригинальное название

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

Métodos estadísticos de la ingeniería (Univ. Oviedo

Загружено:

Авторское право:

Доступные форматы

UNIVERSIDAD DE OVIEDO

ON PUNTUAL Y POR INTERVALOS. 263

ALISIS DE LA VARIANZA. 403

AMENES DEL CURSO 02-03. 439

AMENES DEL CURSO 03-04. 451

AMENES DEL CURSO 04-05. 463

AMENES DEL CURSO 05-06. 471

AMENES DEL CURSO 06-07. 483

AMENES DEL CURSO 07-08. 495

AMENES DEL CURSO 08-09. 507

AMENES DEL CURSO 08-09. 511

ON PUNTUAL Y POR INTERVALOS.

AGINA WEB: http://enol.epsig.uniovi.es/medli

es tal que P(N(0, 1) z

97, puesto que para n = 41 se tiene que

1 Grados de libertad del numerador

1 Grados de libertad del numerador

ON PIVOTAL I.C. DE CONDICIONES

83. Como el mayor valor es x

5, obteniendo como intervalos en los que clasicar los

5, 12), y aplicando la formula anterior, sera

5, 12] como el (12, 13

5] tienen frecuencia absoluta maxima. Deberamos aplicar, por tanto, para

75 < 19, sera p

8 < 31, el intervalo a considerar sera el [12, 13

es un cuantil de orden si se verican las siguientes

1906 y la desviacion tpica del ejemplo del n umero de hijos es s = 1

06, pero la mediana no cambia.

4 o mayor que 150

25; d) x = 8; e) Todo falso.

89; c) Mo = 2; d) x = 5; e) Todo falso.

72; e) Todo falso.

ACTICA 1.1 DE ORDENADOR.

ACTICA 1.2 DE ORDENADOR.

ACTICA 1.3 DE ORDENADOR.

07, la probabilidad de que tengan el defecto tipo B es 0

12. Seleccionada una tarjeta al azar:

7. Cuando un artculo no se ha clasicado como defectuoso en tres

05 y la de que se rectique una pieza que es defectuosa es 0

90. Si el 99 % de las piezas producidas son buenas

50, la de emplear el metodo II es 0

40 y, por consiguiente, la de emplear el metodo III es

54. Dentro de los tornillos producidos en B, la proporcion de no defectuosos es 0

667 > P(B/O

333, donde G representa el suceso la roca es granito

294 < P(B/O

067 < P(B/O

25 y P(B) < 1, entonces P(A B/B)

2 y la probabilidad de que fallen ambos simultaneamente es 0

44; e) Todo falso.

2. Entonces P(A C) es igual a:

25; d) 1; e) Todo falso.

5, la probabilidad de que falle otro dispositivo

3 y la probabilidad de que fallen los dos es 0

2. Entonces la probabilidad de que:

2 de que falle; dicha probabilidad es 0

1 en caso de ser probado en la B.

0177, es decir, en media 1

sobre el espacio (IR, P(IR)).

denida de la siguiente manera:

as determinada cumple los axiomas de Kolmogorov, con lo que tenemos el siguiente

((, a]) = F(b) F(a).

({b}) = F(b) F(a) [F(b) F(b