Вы находитесь на странице: 1из 61

UAP Ingeniera de Sistemas

Inferencia Estadstica

PRUEBA CHI CUADRADO ( 2 )

Es una prueba no paramtrica que es particularmente til para las variables cualitativas
que estn compuestas por dos o ms categoras.

La Prueba Chi Cuadrado puede ser:

Procedimiento:

1. Se establecen las hiptesis nula y alternativa.

2. Se halla el valor crtico en la tabla, segn el nivel de confianza dado.

3. Se calcula la estadstica de prueba:


( Oi j ei j )2
2
= ei j
Oij : Frecuencias observadas.
eij : Frecuencias esperadas si Ho es correcta

Para lo cual previamente debern calcularse las frecuencias esperadas.

En el caso de las pruebas de independencia y homogeneidad; las frecuencias


esperadas se calculan usando las frecuencias observadas de la tabla de doble
entrada (tabla de contingencia), para lo cual se utiliza la siguiente frmula:

ei j = . .
fi f j
n
En el caso de la prueba de homogeneidad; las frecuencias esperadas se
calculan mediante: e ij = n Pi donde las Pi se calculan de acuerdo a la
distribucin que se est haciendo el ajuste.

4. Se toma la decisin, teniendo en cuenta la ubicacin de la estadstica de prueba.

Si 2 pertenece a la Re gin de Aceptacin Aceptar H0


Caso contrario se rechaza H0 y se acepta H1

5. Especificando el nivel de confianza, finalmente se redacta la conclusin.

Gladys Enrquez Mantilla 143


UAP Ingeniera de Sistemas
Inferencia Estadstica

PRUEBA CHI CUADRADO DE HOMOGENEIDAD

La prueba de Homogeneidad es una generalizacin de la prueba de igualdad de dos


proporciones. En este caso se trata de probar si para cada nivel de la variable A, la
proporcin con respecto a cada nivel de la variable B es la misma. Si B tiene 3 niveles y A
tiene 2 niveles entonces Ho : P1 = P2 = P3 , donde Pi es la proporcin de uno de los valores
de la variable A en cada columna de B.

Variable B
Variable A B3
B1 B2
A1 O11 O12 O 23
A2 O21 O22 O 23

Se utiliza tambin para determinar si dos o ms muestras aleatorias provienen de la misma


poblacin (sus proporciones son iguales) o de poblaciones diferentes (sus proporciones son
diferentes).

Ejemplo:

Si estamos interesados en establecer si hay relacin entre el nivel de educacin y el nivel


econmico, se usar una prueba de independencia. Si deseamos probar que para cada nivel
econmico hay igual proporcin de personas en cada nivel de educacin, se usar una
prueba de homogeneidad.

Nota:

La muestra de tamao n debe ser suficientemente grande, de modo que ninguna de las
frecuencias esperadas sea menor que 1 y no ms del 20 % de las mismas sea menores
que 5.
Cuando no puede usarse la prueba Chi Cuadrado, entonces deber usarse el Test
Exacto de Fisher o la prueba de Mc Nemar.

Procedimiento:

1. Hiptesis:
H0 : p1 = p2 = ... = pc c>2
H1 : no todas las proporciones son iguales.

2. Valor Crtico:

21 , ( F 1 ) ( C 1 )
F: N de filas C: N de columnas

3. Estadstica de Prueba:

2
=
( Oi j ei j )2
, ei j = . .
fi f j
ei j n

Gladys Enrquez Mantilla 144


UAP Ingeniera de Sistemas
Inferencia Estadstica

4. Decisin:

Si 2 R A Aceptar H0

5. Conclusin:

Responder a la pregunta formulada, indicando el nivel de confianza.

Si la tabla presenta una fila o una columna: F=1 C=1

Valor Crtico:

2 k : nmero de celdas.
1 , k 1

Estadstica de Prueba:
ei j = n pi

1
donde : pi =
k
n = Oi j

Correccin de Yates:

Se aplica cuando:

El 20% o ms de las celdas contienen frecuencias esperadas menores que 5


( e i j < 5 ).
Alguna e i j < 1

La Estadstica de Prueba corregida es:

2

F C 0i j e i j 0,5

2 = eij
i =1 j=1

En muestras grandes la correccin de Yates conduce a los mismos resultados que sin
efectuar la correccin.

Gladys Enrquez Mantilla 145


UAP Ingeniera de Sistemas
Inferencia Estadstica

Ejemplo 1:

Una compaa deseaba saber si sus obreros, sus empleados de oficina, sus empleados de
ventas y sus otros empleados se diferenciaban en cuanto a su opinin acerca de la
conveniencia de ser empleado de la compaa. Se tomo una muestra aleatoria de personas
de cada uno de los cuatro grupos y a cada uno se le solicit que diera su opinin sobre la
compaa como lugar de trabajo, en comparacin con otras compaas que le fueran
familiares. Las respuestas se clasifican en por encima del promedio y en por debajo del
promedio. La siguiente tabla muestra los resultados:

Otros
Opinin Obreros Empl.Oficina Vendedores
Emp.
Por encima del promedio 68 45 70 60
Por debajo del Promedio 57 30 30 15

Proporcionan estos datos suficiente evidencia como para indicar una falta de
homogeneidad entre los cuatro grupos respecto de su opinin acerca de la conveniencia de
ser empleado de la compaa?

Solucin:

1. Hiptesis:
H0 : P1 = P2 = P3 = P4 (hay homogeneidad)
H1 : al menos una Pi es diferente (no existe homogeneidad).

2. Valor Crtico:

2 = 2 = 7.81
1 , ( 2 1 ) ( 4 1 ) 0.95 , 3

3. Estadstica de Prueba:

2 4( Oi j e i j )2
2H = ei j
= 15.47
i =1 j=1

Empleados Otros
Opinin Obreros Vended. Total
Oficina Emp.
68 45 70 60
Por encima del promedio 243
81.0 48.6 64.8 48.6
57 30 30 15
Por debajo del Promedio 132
44.0 26.4 35.2 26.4
Total 125 75 100 75 375

4. Decisin:
2 = 15,47 R R rechazar H0 y aceptar H1

5. Conclusin:

Con una confianza del 95%, podemos afirmar que existe suficiente evidencia como
para indicar una falta de homogeneidad entre los cuatro grupos respecto a su
opinin acerca de la conveniencia de ser empleado de la compaa.

Gladys Enrquez Mantilla 146


UAP Ingeniera de Sistemas
Inferencia Estadstica

Ejemplo 2:

El nmero de reclamos recibidos en cinco establecimientos, por concepto de mercanca


defectuosa en cierto mes del ao es la siguiente:

Establecimiento : A B C D E
Reclamos : 50 65 72 47 52

Con un nivel del 5%; Podemos afirmar que el nmero de reclamos que recibe cada
establecimiento es aproximadamente el mismo?

Solucin:

k = 5 celdas
1 1 1
pi = = e i j = n p i = 286 x = 57.2
k 5 5
Entonces:

Establecimiento A B C D E n
Reclamos ( Oi j ) 50 65 72 47 52
286
ei j 57.2 57.2 57.2 57.2 57.2

1. Hiptesis:

H0 : El nmero de reclamos que recibe cada establecimiento es el mismo.


H1 : El nmero de reclamos que recibe cada establecimiento no es el mismo.

2. Valor Crtico:

2 = 2
0.95 , 4
= 9.49
1 , k 1

3. Estadstica de Prueba:

( Oi j e i j )2
2H = = 8.09
ei j

4. Decisin: 2 = 8.09 R A aceptar H0

5. Conclusin:

Con una confianza del 95%, s podemos afirmar que el nmero de reclamos que
recibe cada establecimiento es aproximadamente el mismo.

Gladys Enrquez Mantilla 147


UAP Ingeniera de Sistemas
Inferencia Estadstica

PRUEBA CHI CUADRADO DE INDEPENDENCIA

Esta prueba se usa en general cuando el investigador desea saber si dos variables estn o
no asociadas. Si no hay asociacin entre las variables, se dice que ambas son
independientes, trmino que se emplea para indicar que la distribucin de una de ellas no
depende en absoluto de la distribucin de la otra.

Si dos variables no son independientes, ello significa que el conocimiento de una de ellas
puede ayudarnos de alguna forma a conocer la otra. Es decir, se aplica para establecer si
hay alguna relacin o dependencia en cuanto a los criterios de clasificacin de la
informacin.

Procedimiento:

1. Hiptesis:

H0 : Existe independencia (no existe relacin).


H1 : No existe independencia (existe relacin)

2. Valor Crtico:

21 , ( F 1 ) ( C 1 )
3. Estadstica de Prueba:

2 =
( Oi j ei j )2
, ei j = . .
fi f j
ei j n
4. Decisin:

Si 2 R A Aceptar H0

5. Conclusin:

Responder a la pregunta formulada, especificando el nivel de confianza.

Ejemplo:

Una casa de prstamos desea investigar la asociacin entre situacin de empleo en el


momento en que se aprob un prstamo y el hecho de que actualmente est o no pagando
dicho prstamo, el gerente de dicha casa de prstamos selecciona al azar 115 clientes y
obtiene los siguientes resultados:

Situacin de empleo en el momento


Estado actual del del prstamo
Prstamo
Empleado Desempleado
En mora 10 8
Al da 60 22
No paga 5 10

Existe asociacin entre la situacin de empleo y el estado del prstamo?

Gladys Enrquez Mantilla 148


UAP Ingeniera de Sistemas
Inferencia Estadstica

Solucin:

1. Hiptesis:

H0 : No existe relacin entre situacin de empleo y estado del prstamo.


H1 : S existe relacin entre situacin de empleo y estado del prstamo.

2. Valor Crtico:

21 , ( F 1 ) ( C 1 ) = 20,95 , 2 = 5,99

3. Estadstica de Prueba:
( Oi j ei j )2
2 = ei j = 9.74

La estadstica de prueba se calcul en base a los siguientes datos:

Situacin de empleo en el
Estado actual del
Prstamo
momento del prstamo
Empleado Desempleado
.
fi

10 8 18
En mora
11.74 6.26
60 22 82
Al da
53.48 28.52
5 10 15
No paga
9.78 5.22
.
f j 75 40 n = 115

4. Decisin:

2 = 9,74 R R Re chazar H0

5. Conclusin:

Con una confianza del 95%, podemos afirmar que s existe relacin entre situacin
de empleo y estado de prstamo.

Nota:

Si existe independencia entre las variables, los valores esperados y observados sern
parecidos y el valor de 2 ser pequeo.

Gladys Enrquez Mantilla 149


UAP Ingeniera de Sistemas
Inferencia Estadstica

COEFICIENTE DE CONTINGENCIA

Cuantifica la fuerza de la asociacin entre las dos variables. Si en la prueba de


Independencia se acepta H1 entonces el siguiente paso es determinar el grado de asociacin
de las dos variables mediante el Coeficiente de Contingencia, siempre y cuando interese
conocer si la asociacin es alta o baja.

C =
2
n + 2

Donde: 2 es la estadstica de prueba obtenida en la prueba Chi cuadrado de


independencia.

Si C 0.30 Hay buena asociacin entre las variables consideradas

En el problema anterior:

9.74
C = = 0.279 < 0.30
115 + 9.74

No es tan buena la asociacin entre situacin de empleo y estado de prstamo debido a


que el coeficiente de contingencia es menor que 0.30.

Gladys Enrquez Mantilla 150


UAP Ingeniera de Sistemas
Inferencia Estadstica

PRUEBA CHI CUADRADO DE BONDAD DE AJUSTE

Esta prueba permite verificar si una muestra aleatoria procede de una poblacin con una
distribucin de probabilidad conocida (Binomial, Poisson, Normal).

Para aplicar esta prueba primero debern agruparse los datos de la muestra en una tabla y
luego estimar los verdaderos parmetros de la poblacin en caso que no sean dados ( p , ,
y ) segn el caso.

Las frecuencias esperadas eij para cada valor de X (binomial y Poisson) o para cada
intervalo (Normal) se calculan hallando primero las probabilidades de ocurrencia pi usando
la frmula del modelo supuesto.

Procedimiento:

1. Hiptesis:

H0 : La distribucin es Normal (Binomial o Poisson)


H1 : La distribucin no es Normal (Binomial o Poisson)

2. Valor Crtico:

2
1 , k p 1

p : nmero de parmetros que se estimaron)


k : N de e ij 5 (despus de reagrupar las e ij < 5)

3. Estadstica de Prueba:

2
k ( Oij eij )
2
= , ei j = n pi
i =1 eij

p i : se calcula usando la frmula de las distribuciones Binomial o Poisson


(segn el caso) o la tabla normal para el caso de ajuste a la normal.

4. Decisin:

Si 2 R A Aceptar H0

5. Conclusin:

Responder a la pregunta efectuada, especificando el nivel de confianza.

Nota:

Mientras ms cercano a cero sea el valor de la estadstica de pueba 2 , tanto mejor


ser el ajuste entre los datos observados y el modelo terico propuesto.

Gladys Enrquez Mantilla 151


UAP Ingeniera de Sistemas
Inferencia Estadstica

Ejemplo 1:

Los siguientes datos se refieren a los salarios de 120 trabajadores de una compaa. Con un
nivel de significancia del 5%, podemos afirmar que la distribucin se aproxima a una
normal?

Salarios ($) 150-156 156-162 162-168 168-174 174-180 180-186


N trabajadores 14 12 22 40 20 12

Solucin:

1. Hiptesis:

H0 : La distribucin se aproxima a una Normal.


H1 : La distribucin no se aproxima a una Normal.

2. Valor Crtico: 2 = 20,95 , 3 = 7,81


0,95 , 6 2 1

p = 2 porque y fueron estimados.

3. Estadstica de Prueba:
6 ( Oij eij )2
2
= = 15.74
i =1 eij
La estadstica de prueba se calcul en base a los siguientes resultados:

Salarios Xi N de trabajadores pi e ij = n p i
150-156 153 14 0.05444 6.53
156-162 159 12 0.14532 17.44
162-168 165 22 0.24938 29.93
168-174 171 40 0.26161 31.39
174-180 177 20 0.17572 21.09
180-186 183 12 0.07523 9.03
Total n = 120

= x = 168.8
= S = 8.66
p1 = P (150 X 156 ) = P ( 2.17 Z 1.48 ) = 0.06944 0.01500 = 0.05444
p2 = P (156 X 162 ) = P ( 1.48 Z 0.79 ) = 0.21476 0.06944 = 0.14532
p3 = P (162 X 168 ) = P ( 0.79 Z 0.09 ) = 0.46414 0.21476 = 0.24938
p4 = P (168 X 174 ) = P ( 0.09 Z 0.60 ) = 0.72575 0.46414 = 0.26161
p5 = P (174 X 180 ) = P ( 0.60 Z 1.29 ) = 0.90147 0.72575 = 0.17572
p6 = P (180 X 186 ) = P (1.29 Z 1.99 ) = 0.97670 0.90147 = 0.07523
Todas las eij > 5 entonces no es necesario reagrupar.
4. Decisin:
2 = 15.74 R R Re chazar H0 y aceptar H1

5. Conclusin:
Con una confianza del 95% podemos afirmar que la distribucin no se aproxima a
una normal.

Gladys Enrquez Mantilla 152


UAP Ingeniera de Sistemas
Inferencia Estadstica

Ejemplo 2:

El nmero de defectos por unidad observada en una muestra de 100 radios dio la siguiente
distribucin de frecuencias.

N de defectos : 0 1 2 3 4 5 6 7
N de radios : 28 32 15 10 6 4 3 2

Verificar si la distribucin de estos datos se aproxima a una distribucin Poisson.

Solucin:

1. Hiptesis:
H0 : Los datos se aproximan a una distribucin Poisson.
H1 : Los datos no se aproximan a una distribucin Poisson.

2. Valor Crtico:

2 = 20,95 , 3 = 7,81 p = 1:
0,95 , 5 1 1

k = 5 despus de reagrupar las eij < 5


p = 1 porque se estim un parmetro:

3. Estadstica de Prueba:
5 ( Oij eij )2
=
2
= 15.12
i =1 eij

La estadstica de prueba se calcul en base a los siguientes resultados:

N defectos N de radios
Xi Oi j pi = P (X = x ) ei j = 100 pi

0 28 0.186 18.6
1 32 0.313 31.3
2 15 0.263 26.3
3 10 0.147 14.7
4 6 0.062 6.2
5 4 0.021 2.1
9
6 3 0.006 0.6
7 2 0.001 0.1
Total n = 100

1.68 x
e 1.68
= x = 1.68 pi =
x!
4. Decisin:

2 = 15.12 R R Re chazar H0

5. Conclusin:

Con una confianza del 95% podemos afirmar que la distribucin de estos datos no se
aproxima a una Poisson.

Gladys Enrquez Mantilla 153


UAP Ingeniera de Sistemas
Inferencia Estadstica

Ejemplo 3:

El nmero de computadoras vendidas en una tienda presentan la siguiente distribucin:

N de computadoras : 0 1 2 3
N de das : 1 16 55 228

Probar en el nivel del 5% si se puede considerar como valores de una variable aleatoria
binomial.

Solucin:

1. Hiptesis:

H0 : La distribucin es Binomial.
H1 : La distribucin no es Binomial.

2. Valor Crtico:

2 = 20.95 , 1 = 3.84
0.95 , 3 1 1

= n p
n : N de computadoras vendidas

x 2.7
x = np
=
p = = 0.9 q = 1 0,9 = 0.10
n' 3

P(X = x ) = C3x 0,90 x 0,103 x

N computadoras N das pi = P ( X = x ) ei j = 300 pi


0 1 0,001 0,3 8.4
1 16 0,027 8,1
2 55 0,243 72,9
3 228 0,729 218,7
Total n = 300

3. Estadstica de Prueba:
3 ( Oi j e i j )2
2 = ei j
= 13.6
i =1

4. Decisin:
2 = 13.6 R R Re chazar H0

5. Conclusin:

Con una confianza del 95% no podemos considerar los datos como valores de una
variable aleatoria binomial.

Gladys Enrquez Mantilla 154


UAP Ingeniera de Sistemas
Inferencia Estadstica
PRUEBA DE BARTLETT

Esta prueba se emplea para determinar si las varianzas de k poblaciones son iguales o no.
La prueba es muy sensible a la normalidad: si los datos no son normales, la prueba ofrece
resultados significativos cuando en realidad no lo son.

Se basa en un estadstico cuya distribucin muestral proporciona valores crticos exactos


cuando los tamaos de las muestras son iguales. Estos valores crticos se pueden utilizar
para dar aproximaciones muy exactas a los valores crticos para tamaos diferentes de
muestra.

1. Hiptesis:

H0 : 12 = 22 = ........... = 2k

H1 : Al menos una 2i es diferente

2. Valor Crtico: bk

bk ( , n ) Si ni iguales

Para ni diferentes
n1 b k ( , n1 ) + n2 b k ( , n2 ) + .... + n k b k ( , nk )
b k ( , n1 , n2 , ..., n k ) =
N

3. Estadstica de Prueba: b

Para ni iguales:
1 k
S S ...... S k
2 2 2 S2i
1 2 k
b = donde: S2
p =
i =1
S2p
k

Para ni diferentes:
1
( ) ( ) ( ) ( ni 1) S2i
k
2 n1 1 n 1 n 1
S1 S2
2
2 .... 2
Sk k

N k
b = ; S2
p =
i =1
S2
p
Nk

4. Decisin:

Si b < b k entonces, rechazar H0

5. Conclusin:

Responder a la pregunta efectuada, especificando el nivel de confianza.

Gladys Enrquez Mantilla 155


UAP Ingeniera de Sistemas
Inferencia Estadstica
Ejemplo 1:

Tres proveedores diferentes proporcionan piezas en lotes de 500. Para comparar la calidad
de los lotes se toman muestras aleatorias de seis lotes de cada proveedor y se examinan
para determinar el nmero de piezas no conformes. Los resultados fueron:

Proveedor:
A : 28 37 34 29 31 33
B : 22 27 29 20 18 30
C : 33 29 39 33 37 38
Al nivel del 1%, podemos afirmar que existe diferencia significativa entre las varianzas?

Solucin:

k = 3 n1 = n2 = n3 = 6 N = 18
S2A = 11.2 S2B = 25.07 S2C = 14.57

1. Hiptesis:

H0 : 2A = 2B = 2C
H1 : Al menos una 2i es diferente

2. Valor Crtico:

b k ( , n ) = b3 ( 0.01 , 6 ) = 0.5149

3. Estadstica de Prueba:
1
3
b =
[11.2 25.07 14.57 ]
= 0.944
16.95

S2p =
S2i =
11.2 + 25.07 + 14.57
= 16.95
k 3

4. Decisin:

b = 0.944 > b k = 0.5149 Entonces, aceptar H0

5. Conclusin:

Con una confianza del 99% podemos afirmar que no existen pruebas suficientes para
decir que las varianzas son diferentes.

Gladys Enrquez Mantilla 156


UAP Ingeniera de Sistemas
Inferencia Estadstica

Ejemplo 2:

A una muestra aleatoria de seis profesores auxiliares, cuatro profesores asociados y cinco
profesores principales se les propuso que hicieran una estimacin del tiempo que haban
dedicado la ltima semana a preparar sus clases. Los resultados, en horas, fueron los
siguientes:
Categora: Tiempo
Auxiliar : 7 12 11 15 9 14
Asociado : 15 12 15 8
Principal : 11 7 6 9 7
El Decano cree que no existe diferencia significativa entre la variabilidad del tiempo
empleado por los profesores para preparar sus clases, cree usted que est en lo correcto?

Solucin:
k = 3 N = 15
S12 = 9.07 S22 = 11 S23 = 4
n1 = 6 n2 = 4 n3 = 5

1. Hiptesis:

H0 : 2Au = 2As = 2Pr


H1 : Al menos una 2i es diferente

2. Valor Crtico:
6 b3 ( 0.05 , 6 ) + 4 b3 ( 0.05 , 4 ) + 5 b3 ( 0.05 , 5 )
b3 ( 0.05 ; 6 , 4 , 5 ) =
15
6 0.6483 + 4 0.4699 + 5 0.5762
= = 0.577
15
3. Estadstica de Prueba:
1

b =
[9.07 5
113 44 ]
12

= 0.92
7.86

S2p =
( ni 1 )S2i =
5 9.07 + 3 11 + 4 4
= 7.86
Nk 12

4. Decisin:

b = 0.92 > b k = 0.577 Entonces, aceptar H0

5. Conclusin:

Con un 95% de confianza podemos afirmar que el Decano est en lo correcto, no


existe diferencia significativa entre la variabilidad del tiempo empleado por los
profesores para preparar sus clases.

Nota:

Para averiguar si una varianza es mayor que las otras, se utiliza la prueba de Cochran.

Gladys Enrquez Mantilla 157


UAP Ingeniera de Sistemas
Inferencia Estadstica

DISEO DE EXPERIMENTOS

La experimentacin es el procedimiento apropiado para investigar cualquier fenmeno en el


que existe incertidumbre. Los investigadores realizan experimentos virtualmente en todos
los campos del saber, por lo general para descubrir algo acerca de un proceso o sistema en
particular.

Experimento

Es cualquier proceso o actividad que origina un resultado o una observacin. Un


experimento se efecta para establecer las condiciones ptimas en las cuales se desarrolla
un proceso, con el objeto de comparar entre s los efectos de las distintas condiciones en las
que se realiza un fenmeno. Los experimentos son una parte natural de la ingeniera y de
los procesos de toma de decisiones cientficos.

Diseo del experimento

Este trmino se utiliza para planear un experimento de manera que se pueda obtener la
informacin pertinente a un determinado problema que se investiga y as tomar decisiones
correctas. El diseo adecuado del experimento es una etapa fundamental de la
experimentacin, que permite el suministro correcto de datos a posteriori, lo que a su vez
conducirn a un anlisis objetivo y con deducciones vlidas del problema.

Un experimento diseado no es ms que una prueba o una serie de pruebas en las que se
inducen cambios deliberados en las variables de entrada de un proceso o sistema, de
manera que sea posible observar e identificar las causas de los cambios en la respuesta de
salida.

Anlisis de un experimento

Un experimento se analiza efectuando su anlisis de varianza.

Variable independiente

Es aquella que el investigador desea medir su efecto y est bajo control.

Ejemplo:

Consideremos un experimento diseado para adquirir informacin acerca de la efectividad


de dos diferentes mtodos de enseanza de Estadstica. El experimentador tiene bajo control
la seleccin de los diferentes mtodos que va a utilizar en dicho experimento, entonces el
mtodo es la variable independiente.

Variable dependiente (respuesta o endgena)

Es toda aquella variable que es explicada por el modelo y refleja el efecto de las variables
independientes.

Ejemplo:

La efectividad en el aprendizaje de estadstica.

Gladys Enrquez Mantilla 158


UAP Ingeniera de Sistemas
Inferencia Estadstica

Variables exgenas

Son todas aquellas variables que explican a la variable dependiente en menor escala que las
variables independientes. Generalmente no tiene ninguna importancia para el investigador.
El investigador deber controlar estas variables puesto que ocasionan en el experimento
variaciones que no resultan convenientes.

Cuando se controla dos o ms variables exgenas generalmente el mtodo ms adecuado es


el anlisis de covarianza. Las dificultades aumentan a medida que aumentan las variables
exgenas.

Ejemplo:

Las inasistencias, la atencin.

Factor o tratamiento

Los tratamientos son los diferentes procedimientos, procesos, factores o materiales cuyos
efectos van a ser medidos y comparados. El tratamiento establece un conjunto de
condiciones experimentales que deben imponerse a una unidad experimental dentro de un
diseo seleccionado.

Se emplea como sinnimo de variable independiente. Es decir son todas aquellas variables
cuyos efectos se desean medir. Pueden ser cuantitativas o cualitativas.

Ejemplo:

Los diferentes mtodos de enseanza.

Niveles de factor o tratamiento

Son las diferentes categoras lgicas o intensidades de cada factor investigado.

Unidad experimental

Es la entidad ms pequea a la que se aplica un tratamiento. Son los objetos sobre los
cuales se hacen mediciones y se analiza la variable que se investiga.

Ejemplo: Los alumnos.

Aleatorizacin

Es la asignacin aleatoria de los tratamientos en estudio a las unidades experimentales con


el propsito de asegurar que un determinado tratamiento no presente sesgo. Por otro lado la
aleatorizacin hace vlidos los procesos de inferencia y las pruebas estadsticas.

Error experimental

Es la medida de la variabilidad de respuesta que presentan las unidades experimentales al


ser expuestas al mismo nivel de tratamiento.
Las principales fuentes del error experimental son: Las diferencias inherentes en las
unidades experimentales y la ausencia de uniformidad que se puede presentar en el
procedimiento experimental.

Gladys Enrquez Mantilla 159


UAP Ingeniera de Sistemas
Inferencia Estadstica

Repeticin

Es la reproduccin o rplica del experimento bsico (asignacin de un tratamiento a una


unidad experimental). Las principales razones por las cuales es deseable la repeticin son:
primero porque proporciona una estimacin del error experimental, siendo tal estimacin
confiable a mediada que aumenta el nmero de repeticiones, y segundo permite
estimaciones ms precisas del tratamiento en estudio.

Propsito de un Diseo Experimental

Proporcionar mtodos que permitan obtener la mayor cantidad de informacin vlida acerca
de una investigacin, teniendo en cuenta el factor costo y el uso adecuado del material
disponible mediante mtodos que permitan disminuir el error experimental.

Anlisis de varianza (ANOVA)

Es una tcnica estadstica que sirve para analizar la variacin total de los resultados
experimentales de un diseo en particular, descomponindolo en fuentes de variacin
independientes atribuibles a cada uno de los efectos en que constituye el diseo
experimental.

Una suposicin fundamental del ANOVA es que las varianzas son homogneas. Esta
suposicin se emplea para estimar una varianza comn (el Cuadrado Medio del Error CME)
que sirva para realizar comparaciones entre las medias de los tratamientos.

Cuando se detecta heterogeneidad de varianzas lo que se puede hacer es realizar


transformaciones para estabilizar dichas varianzas, particionar el anlisis en grupos con
varianzas homogneas o emplear estadstica no paramtrica.

APLICACIONES DE LOS DISEOS EXPERIMENTALES

Las tcnicas de diseo experimental basadas en la estadstica son particularmente tiles en


el mundo de la ingeniera en lo que corresponde a la mejora del rendimiento de los procesos
de manufactura.

Mediante el empleo de experimentos diseados, los ingenieros pueden determinar el


subconjunto de variables del proceso que tienen la mayor influencia sobre el rendimiento de
ste. Los resultados de estos experimentos pueden conducir a:
- Mejorar el rendimiento del proceso.
- Reducir la variabilidad del proceso y acercarlo a los requerimientos nominales.
- Disminucin del tiempo de diseo y desarrollo.
- Disminucin del costo de operacin.

Los mtodos de diseo experimental tambin son tiles en las actividades de ingeniera de
diseo, donde se desarrollan nuevos productos y se mejoran los existentes. Algunas
aplicaciones representativas de los experimentos diseados de manera estadstica en la
ingeniera de diseo incluyen:
- Evaluacin y comparacin de configuraciones de diseo bsicas.
- Evaluacin de materiales diferentes.
- Seleccin de parmetros de diseo de modo que el producto funcione bien bajo una
gama amplia de condiciones de campo.

El empleo del diseo experimental en el proceso de diseo puede dar como resultado
productos que son ms fciles de fabricar, productos que tienen un desempeo y una
confiabilidad mejores que los de la competencia, y productos que pueden disearse,
desarrollarse y producirse en menor tiempo.

Gladys Enrquez Mantilla 160


UAP Ingeniera de Sistemas
Inferencia Estadstica

DISEO COMPLETAMENTE ALEATORIO (DCA)


(ANOVA con un solo factor)

Es aquel modelo en el cual las unidades experimentales sobre las que se toman medidas se
asignan al azar a los diferentes factores o tratamientos (variable independiente).
Se utiliza cuando el experimentador cuenta con los resultados de k muestras aleatorias
independientes, cada una de tamao n i y le interesa probar la hiptesis de que las medias
de las k poblaciones son todas iguales.
Para probar esta hiptesis se supondr estar trabajando con poblaciones normales que
tienen varianzas iguales. Si uno o los dos supuestos no se cumplen entonces deber
aplicarse la prueba no paramtrica de Kruskal-Wallis.

Anlisis de Varianza: ANOVA

Si disponemos de medidas cuantitativas que se puede suponer como procedentes de una


distribucin de probabilidad normal, y queremos comparar slo dos grupos de resultados,
la prueba estadstica que se utiliza es una comparacin de medias basado en la distribucin
t Student.
Cuando se dispone de ms de dos grupos de datos, la prueba a emplear es el Anlisis de
Varianza o ANOVA por sus siglas en ingls (ANlisis Of VAriance).

G1 G2 G1 G2 G3

Difieren los promedios Difieren los promedios


de los dos grupos? de los tres grupos?
Prueba t ANOVA

La prueba t nos dice si existe diferencia entre los promedios de dos grupos. Podramos
entonces efectuar pruebas t para cada pareja de grupos. Sin embargo el nmero de pruebas
aumentara a medida que hubieran ms grupos. El ANOVA nos da un solo valor para la
comparacin colectiva o global.

El ANOVA fue ideado por Fisher en 1925 y permite comprobar si existen diferencias entre
promedios de tres o ms tratamientos; para ello se calcula el valor de F. Cuando
encontramos el valor de F sabremos si existen diferencias entre los grupos, pero no nos dice
entre cules grupos, y por eso debemos aplicar posteriormente otros tests llamados de
comparacin mltiple.

Esta tcnica permite no slo analizar los datos sino tambin planificar los experimentos, por
lo tanto el anlisis de varianza es un procedimiento estadstico que nos permite dividir la
variabilidad observada en componentes independientes que pueden atribuirse a diferentes
causas de inters.

Procedimiento para realizar el DCA:

1. Hiptesis:
H0 : 1 = 2 = ........ = k
H1 : Las i no son todas iguales

Gladys Enrquez Mantilla 161


UAP Ingeniera de Sistemas
Inferencia Estadstica

2. Valor Crtico: C

F1 , k 1 , k ( n 1 ) para n i iguales

F1 , k 1 , N k para n i diferentes

3.- Estadstica de Prueba:


CM ( tr )
F =
CME

Para obtener este valor F se construye la siguiente tabla llamada tabla de ANOVA.

Tabla de Anlisis de Varianza


Fuente de Grados de Suma de Cuadrado
F
Variacin Libertad Cuadrados Medio
SC ( tr )
Tratamientos k 1 SC (tr) CM ( tr ) =
k 1
CM ( tr )
SCE
Error N-k SCE CME = CME
N-k
Total N1 SCT

Suma de Cuadrados del Total:


k n k n
T2
SCT = X2
ij N
donde : T = X ij
i =1 j =1 i =1 j =1

Suma de Cuadrados de Tratamientos: Suma de Cuadrados del Error:


k T2
T2

i.
SC ( tr ) = SCE = SCT SC ( tr )
n
i =1 i
N
4. Decisin:

Si la estadstica de prueba F pertenece a la regin de aceptacin, aceptar H0 , caso


contrario rechazarla.

5. Conclusin:

Especificando el nivel de confianza, se contesta a la pregunta formulada.

PRUEBA DE TUKEY

Cuando un investigador ha efectuado un anlisis de varianza y acepta la hiptesis


alternativa, se interesa generalmente por obtener ms informacin a partir de los datos.
Casi siempre que se puede concluir, con base en la prueba F, que no todas las medias son
iguales, resulta conveniente poder determinar dnde se presentan las diferencias, es decir
se averiguar qu pares de medias muestrales de los tratamientos son diferentes. Estas
comparaciones que se hacen despus del anlisis inicial de varianza se denominan
comparaciones a posteriori o post hoc.

Gladys Enrquez Mantilla 162


UAP Ingeniera de Sistemas
Inferencia Estadstica

Tukey propuso un mtodo para hacer todas las comparaciones pareadas entre medias. Con
este mtodo se calcula un solo valor con el que se comparan todas las diferencias.

Valor Crtico:

q , k , N k

Estadstica de Prueba:

Para ni iguales: Para ni diferentes:

xi x j xi x j
q = q =
CME CME 1 1
+
n 2 ni n j

Decisin:

Si la estadstica de prueba es mayor que el valor crtico, entonces: i j

Ejemplo 1:

Un ingeniero de control de calidad de una compaa fabricante de equipos electrnicos de


audio se encuentra inspeccionando un nuevo tipo de batera que tal vez pueda utilizar. Un
lote de 20 bateras fue dividido aleatoriamente en cuatro grupos (de modo que haba cinco
bateras en cada uno). Cada grupo de bateras fue sometido a un nivel particular de presin:
baja, normal, alta y muy alta. Las bateras se probaron simultneamente bajo estos niveles
de presin y se registraron los tiempos de falla (en horas).
Baja : 8.0 8.1 9.2 9.4 11.7
Normal : 7.6 8.2 9.8 10.9 12.3
Alta : 6.0 6.3 7.1 7.7 8.9
Muy Alta : 5.1 5.6 5.9 6.7 7.8
Se afirma que existe diferencia altamente significativa solamente entre el grupo de bateras
con presin baja y el grupo de bateras con presin muy alta, Est usted de acuerdo?
Explique por qu s o por qu no.

Solucin:

k = 4 grupos N = 20 datos
1: Baja 2: Normal 3: Alta 4: Muy Alta
8.0 7.6 6.0 5.1
8.1 8.2 6.3 5.6
9.2 9.8 7.1 5.9
9.4 10.9 7.7 6.7
11.7 12.3 8.9 7.8
T1. = 46.4 T2 . = 48.8 T3 . = 36.0 T4 . = 31.1
n1 = 5 n2 = 5 n3 = 5 n4 = 5
x1 = 9.28 x 2 = 9.76 x 3 = 7.20 x 4 = 6.22
S12 = 2.23 S22 = 3.71 S23 = 1.35 S24 = 1.12
T= Xi j = 162.30 X2i j = 1393.15

Gladys Enrquez Mantilla 163


UAP Ingeniera de Sistemas
Inferencia Estadstica

1ero.- Se realizar la prueba de Bartlett para verificar si las varianzas poblacionales de los
cuatro grupos son iguales.

1. Hiptesis:
H0 : 12 = 22 = 23 = 24
H1 : Al menos una 2i es diferente

2. Valor Crtico: b k ( , n ) = b 4 ( 0.01 , 5 ) = 0.4607

3. Estadstica de Prueba:
1
4
b =
[ 2.23 3.71 1.35 1.12 ]
= 0.8955
2.10

S2p =
S2i =
2.23 + 3.71 + 1.35 + 1.12
= 2.10
k 4

4. Decisin: b = 0.8955 > bk = 0.4607 Entonces, aceptar H0

5. Conclusin: Al 90% de confianza se ha verificado que las varianzas son iguales.

2do.- Al verificarse el supuesto de homogeneidad de varianzas, entonces se comprobar si


existe o no diferencia entre los promedios poblacionales de los cuatro grupos.

1. Hiptesis:

H0 : 1 = 2 = = 4
3
H1 : Al menos un i es diferente

2. Valor crtico: F1 , k 1 , N k

F0.99 , 3 , 16 = 5.29

3. Estadstica de prueba:
CM(tr )
F =
CME

Tabla de Anlisis de Varianza (ANOVA)


Fuente de Variacin Grados de Suma de Cuadrado
F
Libertad Cuadrados Medio
Tratamientos 3 42.46 14.15
Error 16 33.63 2.10 6.74
Total 19 76.09

Suma de cuadrados del total:


T2 162.302
SCT = X2
N
= 1393.15
20
= 76.09

Gladys Enrquez Mantilla 164


UAP Ingeniera de Sistemas
Inferencia Estadstica

Suma de cuadrados de tratamientos:


Ti2 T2
SC ( Tr ) = ni

N

46.42 48.82 36.02 31.12 162.302


= + + +
5 5 5 5 20

= 42.46

Suma de cuadrados del error:

SCE = SCT SC ( Tr)


= 76.09 42.46 = 33.63

4. Decisin: F = 6.74 RR Rechazar H0 y Aceptar H1

5. Conclusin:

Con una confianza del 99% podemos afirmar que los tiempos promedio de falla de
las bateras se diferencian entre s.

3ero.- Como se acept H1 entonces deber realizarse la prueba de Tukey para determinar
entre qu promedios existe tal diferencia.

1. Valor crtico:

q , k , Nk = q 0.01 , 4 , 16 = 5.19

2. Estadstica de Prueba:

xi x j xi x j
q = =
CME 2.10
n 5

Los promedios son:

x 2 = 9.76 x1 = 9.28 x 3 = 7.20 x 4 = 6.22

Realizando las comparaciones mltiples:

x 2 x1 9.76 9.28
q = = = 0.74 < 5.19 2 = 1
CME 2.10
n 5

x2 x3 9.76 7.20
q = = = 3.94 < 5.19 2 = 3
CME 2.10
n 5

x2 x4 9.76 6.22
q = = = 5.45 > 5.19 2 4
CME 2.10
n 5

Gladys Enrquez Mantilla 165


UAP Ingeniera de Sistemas
Inferencia Estadstica

x1 x 3 9.28 7.20
q = = = 3.2 < 5.19 1 = 3
CME 2.10
n 5

x1 x 4 9.28 6.22
q = = = 4.71 < 5.19 1 = 4
CME 2.10
n 5

x3 x4 7.20 6.22
q = = = 1.51 < 5.19 3 = 4
CME 2.10
n 5

Con una confianza del 99% podemos concluir que los nicos promedios que difieren son:
2 y 4

Ejemplo 2:

En una empresa particular se escogieron 20 empleados al azar, para que en uno de cuatro
grupos de entrenamiento, aprendieran a ejecutar una tarea en una lnea de ensamble. Los
grupos eran diferentes respecto de la cantidad de instruccin que haban recibido. Al
terminar el periodo de entrenamiento, cada uno de los 20 empleados realiz la tarea. Se hizo
un registro del tiempo (en minutos) que necesitaron para la realizacin completa de la tarea
y se obtuvieron los resultados siguientes:

A : 51 42 35 65 49
B : 30 48 44 56 54 40
C : 80 75 85 73
D : 53 47 45 50 71

Proporcionan estos datos evidencia suficiente como para concluir que existe diferencia
significativa entre el tiempo promedio que necesitaron para la realizacin completa de la
tarea? En caso de existir diferencia, entre qu grupos se presenta?

Solucin:

k = 4 grupos N = 20 datos
A B C D
51 30 80 53
42 48 75 47
35 44 85 45
65 56 73 50
49 54 71
40
T1. = 242 T2 . = 272 T3 . = 313 T4 . = 266
n1 = 5 n2 = 6 n3 = 4 n4 = 5
x1 = 48.40 x 2 = 45.33 x 3 = 78.25 x 4 = 53.20
S12 = 125.8 S22 = 92.27 S23 = 28.92 S24 = 108.2
T= X i j = 1093 X2i j = 64171

Gladys Enrquez Mantilla 166


UAP Ingeniera de Sistemas
Inferencia Estadstica

1ero.- Se realizar la prueba de Bartlett para verificar si las varianzas poblacionales de los
cuatro grupos son iguales.

1. Hiptesis:

H0 : 12 = 22 = 23 = 24

H1 : Al menos una 2i es diferente

2. Valor crtico:

n1 b 4 ( , n1 ) + n2 b 4 ( , n2 ) + n3 b 4 ( , n3 ) + n4 b 4 (, n 4 )
b 4 ( , n1 , n2 , n3 , n 4 ) =
N
5 b 4 ( 0.05, 5) + 6 b 4 (0.05 , 6) + 4 b 4 (0.05 , 4) + 5 b 4 (0.05 , 5)
b 4 ( 0.05 , 5, 6, 4, 5) =
20
5 0.5850 + 6 0.6559 + 4 0.4803 + 5 0.5850
= = 0.585
20
3. Estadstica de Prueba:
1
16
4 5 3 4
125.8 92.27 28.92 108.2
b = = 0.90
92.76
4
( ni 1) S2i 4 125.8 + 5 92.27 + 3 28.92 + 4 108.2
i =1
S2p = = = 92.76
Nk 16

4. Decisin: b = 0.90 > b k = 0.585 Aceptar H0

5. Conclusin:
Con una confianza del 95% podemos afirmar que no existe diferencia significativa
entre las varianzas poblacionales de los cuatro grupos.

2do.- Al verificarse el supuesto de homogeneidad de varianzas, entonces se comprobar si


existe o no diferencia entre los promedios poblacionales de los cuatro grupos.

1. Hiptesis:

H0 : 1 = 2 = 3 = 4
H1 : Al menos un i es diferente

2. Valor crtico: F1 , k 1 , N k

F0.95 , 3 , 16 = 3.24

10.61

Gladys Enrquez Mantilla 167


UAP Ingeniera de Sistemas
Inferencia Estadstica

3. Estadstica de prueba:
CM(tr )
F =
CME

Tabla de Anlisis de Varianza (ANOVA)


Fuente de Variacin Grados de Suma de Cuadrado
F
Libertad Cuadrados Medio
Tratamientos 3 2954.5 984.8
Error 16 1484.1 92.8 10.61
Total 19 4438.6

Suma de cuadrados del total:


T2 10932
SCT = X2
N
= 64171
20
= 4438.6

Suma de cuadrados de tratamientos:


T2 T2
SC ( Tr ) = nii
N
2422 2722 3132 2662 10932
= + + + = 2954.5
5 6 4 5 20

Suma de cuadrados del error:

SCE = SCT SC ( Tr)


= 4438.6 2954.5 = 1484.1
4. Decisin:
F = 10.61 RR Re chazar H0 y Aceptar H1

5. Conclusin:

Con una confianza del 95% podemos afirmar que los tiempos promedio que
necesitaron los cuatro grupos para la realizacin de la tarea se diferencian
significativamente entre s.

3ero.- Como se acept H1 entonces deber realizarse la prueba de Tukey para determinar
entre qu promedios existe diferencia significativa.

1. Valor crtico:

q , k , Nk = q 0.05 , 4 , 16 = 4.05

2. Estadstica de Prueba:

xi x j xi x j xi x j
q = = =
CME 1 1 92.8 1 1 1 1
+ + 46.4 +
2 ni n j 2 ni n j ni n j

Gladys Enrquez Mantilla 168


UAP Ingeniera de Sistemas
Inferencia Estadstica

Los promedios son:

x1 = 48.40 x 2 = 45.33 x 3 = 78.25 x 4 = 53.20


n1 = 5 n2 = 6 n3 = 4 n4 = 5

Realizando las comparaciones mltiples:

x1 x 2 48.40 45.33
q = = = 0.74 < 4.05 1 = 2
1 1 1 1
46.4 + 46.4 +
n1 n2
5 6

x1 x 3 48.40 78.25
q = = = 6.53 > 4.05 1 3
1 1 1 1
46.4 +
46.4 +
n1 n3 5 4

x1 x 4 48.40 53.20
q = = = 1.11 < 4.05 1 = 4
1 1 1 1
46.4 + 46.4 +
n1 n4 5 5

x2 x3 45.33 78.25
q = = = 7.49 > 4.05 2 3
1 1 1 1
46.4 +
46.4 +
n2 n3 6 4

x2 x4 45.33 53.20
q = = = 1.91 < 4.05 2 = 4
1 1 1 1
46.4 + 46.4 +
n
2 n 4

6 5

x3 x4 78.25 53.20
q = = = 5.48 > 4.05 3 4
1 1 1 1
46.4 +
46.4 +
n
3 n 4 4 5

Conclusin:

Con una confianza del 95% se concluye que los nicos promedios poblacionales que
difieren son:

1 y 3 2 y 3 3 y 4

Gladys Enrquez Mantilla 169


UAP Ingeniera de Sistemas
Inferencia Estadstica
DISEO EN BLOQUES COMPLETOS AL AZAR
(ANOVA con dos factores)

Un diseo de bloques aleatorizados consiste de b bloques con k unidades experimentales


cada uno. Los tratamientos se asignan al azar a las unidades de cada bloque, apareciendo
cada tratamiento exactamente una vez en cada bloque.

Este tipo de diseo implica la presencia de dos variables cualitativas independientes


bloques y tratamientos.

1. HIPTESIS 1:

H0 : No hay diferencia entre las medias de los tratamientos.


H1 : Al menos uno de los tratamientos tiene una media diferente.

2. Valor Crtico:

F1 , k 1 , N b k + 1

CM ( t r )
3. Estadstica de Prueba: F =
CME

4. Decisin:

Si la estadstica de prueba pertenece a la regin de aceptacin entonces se acepta


H0 , caso contrario se rechaza y se acepta H1

5. Conclusin:

Expresando el nivel de confianza, se responde a la pregunta formulada.

1. HIPTESIS 2:

H0 : No hay diferencia entre las medias de los bloques


H1 : Al menos uno de los bloques presenta una media diferente.

2. Valor Crtico:

F1 , b 1 , N b k +1

CMB
3. Estadstica de Prueba: F =
CME
4. Decisin:

Si las estadsticas de prueba pertenecen a la regin de aceptacin, aceptar H0 , caso


contrario rechazarla.

5. Conclusin:
Expresando el nivel de confianza, se responde a la pregunta formulada.

Gladys Enrquez Mantilla 170


UAP Ingeniera de Sistemas
Inferencia Estadstica

Tabla de ANOVA
Fuente de Grados de Suma de Cuadrado
F
Variacin Libertad Cuadrados Medio
SC ( tr )
CM ( tr ) = CM ( tr )
Tratamientos k 1 SC (tr) k 1
CME
SCB CMB
Bloques b 1 SCB CMB =
b 1 CME
SCE
Error N b k +1 SCE CME =
N b k +1

Total N 1 SCT

Suma de Cuadrados del Total: Suma de Cuadrados de Tratamientos:


k

k b Ti2.
2
T i =1 T2
SCT = X2i j
N
SC ( tr ) =
b

N
i =1j =1

Suma de Cuadrados de Bloques: Suma de Cuadrados del Error:


b
B.2j
j =1 T2
SC B = SCE = SCT SC ( tr ) SCB
k N

Ejemplo:

Una empresa trata de seleccionar un sistema informtico integrado entre tres modelos que
tiene en estudio. La eleccin final depender de la productividad del sistema. Se eligen al
azar cinco operadores que hagan funcionar cada sistema. Es importante saber que la
experiencia de cada operador en el manejo de ordenadores puede afectar al resultado de la
prueba. Por consiguiente, ser preciso tener en cuenta el efecto de la experiencia al
determinar las ventajas respectivas de cada sistema informtico. Los niveles de produccin
resultantes, medidos en unidades por hora, se presentan en la siguiente tabla. Un cdigo
numrico ms alto para la experiencia indica ms aos de formacin.

Grado de Experiencia
Sistemas
1 2 3 4 5
A 27 31 42 38 45
B 21 33 39 41 46
C 25 35 39 37 45

a) Se puede llegar a la conclusin de que los niveles medios de produccin de los


tres sistemas informticos no difieren?

b) Los empleados con distinta experiencia consiguen el mismo rendimiento en


todas las mquinas?

Gladys Enrquez Mantilla 171


UAP Ingeniera de Sistemas
Inferencia Estadstica

Solucin: N = 15

b=5
Grado de Experiencia Ti .
Sistemas
1 2 3 4 5
A 27 31 42 38 45 183
k=3

B 21 33 39 41 46 180
C 25 35 39 37 45 181
B. j 73 99 120 116 136 T = 544

Suma de Cuadrados del Total:


k b
T2 5442
SCT = X2
ij N
= 20536
15
= 806.93
i =1j =1

Suma de Cuadrados de Tratamientos:


k
Ti2.
i =1 T2 1832 + 180 2 + 1812 5442
SC ( tr ) = = = 0.93
b N 5 15

Suma de Cuadrados de Bloques:


b
B.2j
j =1 T2 732 + 992 + 1202 + 1162 + 1362 5442
SC B = = = 764.93
k N 3 15

Suma de Cuadrados del Error:

SCE = SCT SC ( tr ) SCB


= 806.93 0.93 764.93 = 41.07

Tabla de ANOVA
Fuente de Grados de Suma de Cuadrado
F
Variacin Libertad Cuadrados Medio
0.93 0.465
Tratamientos k 1 = 2 0.93 = 0.465 = 0.09
2 5.13
764.93 191.23
Bloques b 1 = 4 764.93 = 191.23 = 37.28
4 5.13
Error 41.07
Nb k +1 = 8 41.07 = 5.13
8
Total N 1 = 14 806.93

1. Hiptesis 1:

H0 : Los niveles de produccin de los sistemas no difieren.


H1 : Al menos un nivel de produccin difiere.

Gladys Enrquez Mantilla 172


UAP Ingeniera de Sistemas
Inferencia Estadstica

2. Valor Crtico:

F0.95 , 2, 8 = 4.46

3. Estadstica de Prueba:

CM ( t r ) 0.465
F = = = 0.09
CME 5.13

4. Decisin:

F = 0.09 RA Aceptar H0

5. Conclusin:

Con una confianza del 95% podemos afirmar que los niveles medios de produccin
de los 3 sistemas informticos no difieren.

1. Hiptesis 2:

H0 : Consiguen el mismo rendimiento en todas las mquinas.


H1 : No consiguen el mismo rendimiento en todas las mquinas.

2. Valor Crtico:

F0.95 , 4 , 8 = 3.84

3. Estadstica de Prueba:

CMB 191.23
F = = = 37.28
CME 5.13

4. Decisin:

F = 37.28 RR Re chazar H0 y aceptar H1

5. Conclusin:

Con una confianza del 95% se puede afirmar que los empleados con distinta
experiencia no consiguen el mismo rendimiento en todas las mquinas.

Gladys Enrquez Mantilla 173


UAP Ingeniera de Sistemas
Inferencia Estadstica

PRCTICA N 6
Prueba Chi Cuadrado Bartlett DCA Tukey - DBA

1.- El fabricante de una terminal de computadora informa en su material de publicidad


que la duracin media de tal dispositivo, bajo el uso normal, es de seis aos, con una
varianza de 1,96. Una muestra aleatoria de unidades vendidas hace diez aos, revel
la siguiente distribucin de las duraciones:

Duracin (aos) : <4 4a5 5a6 6a7 7a8 8


Frecuencia : 7 14 25 22 16 6

Al nivel de significacin de 0,05, puede el fabricante concluir que las duraciones


estn distribuidas normalmente? * ep = 0,46 aceptar Ho

2.- Se desea comparar la utilizacin de cuatro hojas de clculo diferentes y para ello se
pone a grupos de empleados para que trabajen con cada hoja y luego se anota el
nmero de errores que cada uno de ellos cometi. Los resultados obtenidos en este
estudio fueron:

Hoja de clculo Nmero de errores


1 3 6 5 8 3
2 7 2 6 7 4
3 5 7 9 12 8
4 4 5 3 4 5

Podemos afirmar que existe una diferencia significativa entre las hojas de clculo?
Si es as, cul hoja de clculo presenta un promedio mayor?
* ep = 3,71 rechazar Ho hoja 3

3.- En la siguiente tabla se encuentran anotadas las frecuencias correspondientes a las


clasificaciones indicadas para una muestra de 400.

Adaptacin al Matrimonio
Educacin
Muy bajo Bajo Alto Muy alto
Universitaria 18 29 70 115
Secundaria 17 28 30 41
Primaria 11 10 11 20
Existe relacin entre el nivel educacional de un individuo y su adaptacin al
matrimonio? * ep = 19,94 P = 0,003

4.- El ordenador DEC-20 era utilizado en las universidades americanas en la dcada de


los ochenta. Los datos dados a continuacin indican el nmero de averas que tena
uno de estos ordenadores en 76 semanas consecutivas de funcionamiento. Se
puede ajustar a estos datos una distribucin de conocida?
4 0 0 0 3 2 0 0 6 7 6 2
1 6 1 2 1 1 2 0 2 2 1 0
4 5 0 5 4 1 0 2 5 2 1 2
3 4 1 2 5 1 2 2 3 1 2 0
2 1 6 3 3 6 4 3 0 2 4 2
1 5 3 3 2 5 3 1 3 6 4 4
7 7 6 7
* ep = 9.94 rechazar Ho

Gladys Enrquez Mantilla 174


UAP Ingeniera de Sistemas
Inferencia Estadstica

5.- Un ingeniero prueba la fuente de alimentacin utilizada en una computadora


porttil. Con un nivel de significancia de 5%, desea determinar si el voltaje de salida
est descrito de manera adecuada por una distribucin normal. A partir de una
muestra aleatoria de 100 unidades, obtiene las estimaciones muestrales de la media
y la desviacin estndar como 5,04v y 0,08v respectivamente.

Voltaje de
N de unidades
salida
<4,948 12
4,948-4,986 14
4,986-5,014 12
5,014-5,040 13
5,040-5,066 12
5,066-5,094 11
5,094-5,122 14
5,122 12

Podemos afirmar que no hay evidencia fuerte que indique que el voltaje de salida no
est distribuido de manera normal? ep = 3.03 Aceptar Ho

6.- Un fabricante desea comparar el rodaje de tres distintos tipos de neumticos, A, B y


C. Para realizar la comparacin se seleccionan aleatoriamente un neumtico del tipo
A, uno del tipo B y otro del tipo C, y se colocan en las ruedas traseras de cada uno
de tres automviles. Los automviles se usan para una distancia preestablecida y se
registra la cantidad desgastada para cada neumtico

Tipo de neumtico
Automvil
A B C
1 10.6 10.2 9.4
2 9.8 9.4 8.7
3 12.3 11.8 12.6

Presentan estos datos suficiente evidencia para afirmar que existe diferencia en el
desgaste promedio de los tres tipos de neumticos?

7.- Una empresa de mercadotecnia tiene muchas mquinas fotocopiadoras, varias de


cada una de 3 modelos. Durante el semestre pasado, el gerente ha tabulado para
cada mquina el nmero promedio de minutos por semana que est fuera de servicio
como consecuencia de reparaciones, obteniendo los siguientes datos.
Modelo: Minutos por semana
A : 15 17 16 15 13
B : 17 18 20 22 21
C : 10 12 14 11
Se afirma que el promedio del modelo B difiere de los otros promedios, Est usted
de acuerdo? * ep = 22,10 P = 0,00

8.- Los empleados de un Policlnico encuestados sobre el nivel de satisfaccin con su


trabajo produjeron la siguiente tabla de contingencia.

Categora Ocupacional
Satisfaccin
Tcnico Mdico Administr. Servicio
S 30 50 22 18
No 10 10 2 18

Se realiz una prueba poco significativa, se puede afirmar que todos los grupos
estn igualmente satisfechos? * ep = 17,78 rechazar Ho

Gladys Enrquez Mantilla 175


UAP Ingeniera de Sistemas
Inferencia Estadstica

9.- Un fabricante de partes maquinadas est considerando la compra de una de tres


marcas de mquinas de venta en el mercado. Para ayudar a tomar esta decisin el
gerente ha acumulado la produccin diaria de algunos das escogidos al azar para
cada mquina.
Marca: Produccin
I 36 34 37 35 33 38
II 31 35 32 33 39 36 37
III 36 28 34 32 30

Sin embargo el gerente no recuerda mucho inferencia, por lo cual contrata a un


estadstico, quien luego de realizar el anlisis le aconseja que puede comprar cualquiera
de las mquinas. El gerente tiene sus dudas con respecto a esta recomendacin,
Podra ayudarle, explicndole en qu se bas el estadstico?
* ep = 2,54 P = 0,112

10.- Se clasific una muestra aleatoria de hombres casados, todos jubilados, de acuerdo
con su nivel de educacin y el nmero de hijos.

Nmero de hijos
Educacin
0-1 2-4 Ms de 4
Primaria 43 41 36
Secundaria 107 152 81
Universidad 30 47 63

Se puede afirmar que es alta la asociacin entre el tamao de una familia y el nivel
de educacin alcanzado por el padre?
* ep = 24,21 Aceptar H1 No 0,20

11.- Tres proveedores diferentes proporcionan piezas en lotes de 500. Para comparar la
calidad de los lotes se toman muestras aleatorias de seis lotes de cada proveedor y se
examinan para determinar el nmero de piezas no conformes. Los resultados fueron:
Proveedor:
A : 28 37 34 29 31 33
B : 22 27 29 20 18 30
C : 33 29 39 33 37 38
Podemos afirmar que al menos uno de los proveedores es diferente en cuanto a su
uniformidad? * ep = 0,944 aceptar Ho

12.- Los datos siguientes pertenecen a un estudio en el cual un socilogo desea


determinar si existe una relacin entre tener xito en la vida (medido por un
cuestionario) y el sentido del humor (medido por una prueba especial).

Sentido del humor


xito en la vida
Bajo Medio Elevado
Bajo 52 60 58
Medio 120 180 94
Elevado 48 54 65

Se puede afirmar que quienes tienen sentido del humor, tienen xito en la vida?

13.- El N de reclamos recibidos en cinco establecimientos de una cadena de tiendas, por


concepto de mercanca equivocada o defectuosa en cierto mes del ao son:
Tienda : A B C D
N de reclamos : 63 78 54 49
Con una confianza del 90%, Podemos afirmar que una de las tiendas es la que
recibe la mayor cantidad de reclamos. * ep = 7,97 rechazar Ho

Gladys Enrquez Mantilla 176


UAP Ingeniera de Sistemas
Inferencia Estadstica

14.- Un sistema de apoyo para decisiones (SAD) es un sistema computarizado diseado


para facilitar el anlisis y gestin de conjuntos de datos grandes. Idealmente, un
SAD deber incluir cuatro componentes: (1) un sistema de extraccin de datos, (2)
una organizacin de base de datos relacional, (3) modelos de anlisis y (4) un dilogo
interactivo, amable con el usuario entre este y el sistema. Una dependencia estatal
instal un SAD para coadyuvar al manejo de datos sobre licitaciones por contratos
de construccin de carreteras. Como parte de un autoexamen, la dependencia
seleccion 151 de los problemas ms recientes que podran achacarse directamente
al SAD y los clasific segn el componente en el que se originaron.

Componente : 1 2 3 4
N de problemas : 31 28 45 47
Se puede concluir que las proporciones de problemas son diferentes para al menos
dos de los cuatro componentes del SAD? ep = 7.39 Aceptar Ho

15.- El Colegio de Ingenieros est interesado en comparar los pagos iniciales por hora de
los graduados en ingeniera de sistemas de tres universidades A, B y C. Para
estudiar el caso se eligieron muestras aleatorias de seis graduados de ingeniera de
sistemas de cada universidad. La tabla muestra el salario por hora inicial de cada
ingeniero.
Universidad: Pago por hora (dlares)
A : 21,25 21,25 22,35 22,25 22,00 21,85
B : 22,50 23,05 23,12 23,35 22,55 22,60
C : 21,75 22,00 20,85 21,61 22,10 22,15

El rector de la universidad A dice que no existe diferencia significativa entre lo que


ellos pagan por hora y lo que paga por el mismo periodo la universidad C. Est
usted de acuerdo? Explique por qu. * ep = 11,82 P = 0,001

16.- El empleo de lenguajes de alto nivel para programar computadoras con


microprocesadores y mini computadoras se ha incrementado drsticamente en los
ltimos aos. Esto ha hecho crecer la necesidad de contar con nuevos y mejores
mtodos para evaluar el rendimiento. En un estudio, un investigador desarroll un
sistema de medicin para evaluar dos lenguajes de programacin de alto nivel, Algol
y Pascal. Los resultados informados incluyen una distribucin de la frecuencia de
ocurrencia relativa de los diferentes tipos de enunciados que se utilizan en
programas tpicos escritos en Algol y Pascal del mismo tamao aproximadamente.
Los porcentajes informados se usaron para tabular la informacin como sigue:

Tipo de enunciado Lenguaje de Alto Nivel


Algol Pascal
IF 125 2 045
FOR 968 350
E/S 135 1 847
Asignacin 8 923 4 763
Otro 261 465

Los porcentajes de los diferentes tipos de enunciados de programacin difieren para


los lenguajes? Use un nivel de significancia del 5%.* ep = 4755,2 P =0,00

17.- El nmero de accidentes mensuales durante un periodo de 30 meses fue:

8 0 0 1 3 4 0 2 12 5
1 8 0 2 0 1 9 3 4 5
3 3 4 7 4 0 1 2 1 2

Realice una prueba de bondad de ajuste apropiada, altamente significativa.


* ep = 8,33 aceptar Ho

Gladys Enrquez Mantilla 177


UAP Ingeniera de Sistemas
Inferencia Estadstica

18.- El supervisor de un proceso de ensamblado desea determinar si el nmero de


artculos fabricados con defectos depende del da de la semana en que son
producidos. Reuni la informacin siguiente.

Da de la semana
Lunes Martes Mircoles Jueves Viernes
Sin defectos 85 90 95 95 90
Defectuosos 15 10 5 5 10

Con una confianza del 99%, Existe la evidencia suficiente para afirmar que el
nmero de artculos defectuosos nada tiene que ver con el da de la semana en que
se fabrican? * ep = 8,55 P = 0,073

19.- Un estudiante de estadstica quiere verificar si es razonable suponer que algunos


datos de ventas han sido muestreados de una poblacin normal. Antes de realizar
una prueba de hiptesis con las ventas promedio, reuni algunos datos de ventas y
calcul un promedio de 76 y una varianza de 81, tabulando los datos como sigue:

Ventas < 65 65-70 70-75 75-80 80-85 85-90 90


N de das 12 22 4 16 25 6 20

Aydele al estudiante a verificar si los datos tienen una distribucin normal


ep = 86.97 Rechazar Ho

20.- El gerente de una compaa de software para computadoras est estudiando el


nmero de horas que los ejecutivos de alto nivel dedican al uso de sus terminales de
computadora, por tipo de industria. Se tiene una muestra de cinco ejecutivos de
cada una de las tres industrias.

Banca : 12 10 10 12 10
Comercio : 8 8 6 8 10
Seguros : 10 8 6 8 10

Al nivel de significacin 0,05, El Gerente puede llegar a la conclusin de que existe


diferencia en el nmero promedio de horas por industria que los ejecutivos dedican
al uso de terminales semanalmente? De ser as, explique entre quines se da esa
diferencia. * ep = 5,73 P = 0,018

21.- Una empresa est intentando decidir cul de entre tres tipos de automviles
consume menos uno americano, uno japons y otro europeo. Para verlo, se toman
muestras de cada tipo y a cada automvil se le hace recorrer 100 kilmetros y se
anota el consumo. Los resultados son los siguientes:

Tipo de automvil Consumo


Americano 18,0 17,6 15,4 19,1 16,9
Japons 20,1 15,6 16,1 15,3 15,4 18,7
Europeo 19,3 17,4 15,1 18,6 16,1

Podemos suponer que los tres tipos de automviles son igualmente homogneos con
respecto a su consumo? Usar un nivel del 1%. ep = 0.96 Aceptar Ho

22.- Se pregunta a 50 economistas, 40 ingenieros y 10 abogados si creen que la bolsa en


el prximo mes va a bajar, subir o permanecer igual. El 20% de los economistas
opina que subir, mientras que el 40% de ellos piensa que bajar. El 50% de los
ingenieros se inclina por que permanecer igual, y tan slo el 5% cree que bajar.
Por ltimo, la mitad de los abogados se inclina por la subida y la otra mitad cree que
bajar. Existe relacin entre los pronsticos sobre la evolucin del mercado burstil
y la profesin del encuestado? * ep = 18,105 rechazar Ho

Gladys Enrquez Mantilla 178


UAP Ingeniera de Sistemas
Inferencia Estadstica

23.- Una compaa deseaba saber si sus obreros, sus empleados de oficina, sus
empleados de ventas y sus otros empleados se diferenciaban en cuanto a su opinin
acerca de la conveniencia de ser empleado de la compaa. Se tom una muestra
aleatoria de personas de cada uno de los cuatro grupos (poblaciones) y a cada uno se
le solicit que diera su opinin sobre la compaa como lugar de trabajo, en
comparacin con otras compaas que le fueran familiares. Las respuestas se
clasifican en "por encima del promedio" y en "promedio o debajo del promedio". La
siguiente tabla muestra los resultados:

Empleados Otros
Opinin Obreros Vendedores
de Oficina Empleados
Por encima del 68 45 70 60
promedio
Promedio o debajo del 57 30 30 15
promedio

Proporcionan estos datos suficiente evidencia como para indicar una falta de
homogeneidad entre los cuatro grupos respecto de su opinin acerca de la
conveniencia de su empleado de la compaa? * ep = 15,47 P = 0,001

24.- Un investigador realiz un experimento para evaluar los efectos de cuatro drogas
diferentes sobre los tiempos de reaccin, en seres humanos. A cuatro sujetos de cada
uno de los cuatro grupos de edades que form se le asign una de las cuatro drogas.
La siguiente tabla muestra los tiempos de reaccin ante determinado estmulo
despus de haber sido aplicadas las drogas.

Grupo de Droga
Edad A B C D
1 6 7 4 7
2 6 8 9 9
3 9 12 8 6
4 8 9 5 9
5 8 10 7 6

Despus de eliminar el efecto de la edad, Puede el investigador concluir que las


drogas tienen diferentes efectos? * ep = 2,26 aceptar Ho

25.- Una empresa va a seleccionar un sistema informtico integrado entre tres modelos
que tiene en estudio. La eleccin final depender de la productividad del sistema. Se
eligen al azar cinco operadores que hagan funcionar cada sistema. Es importante
saber que la experiencia de cada operador en el manejo de ordenadores puede
afectar el resultado de la prueba. Por lo tanto, ser preciso tener en cuenta el efecto
de la experiencia al determinar las ventajas respectivas de cada sistema informtico.
Los niveles de produccin resultantes (unidades por hora), se presentan en la
siguiente tabla. Un cdigo numrico ms alto para la experiencia indica ms aos de
formacin.

Sistemas Grado de experiencia


Informticos 1 2 3 4 5
A 27 31 42 38 45
B 21 33 39 41 46
C 25 35 37 37 44

Al 99% de confianza, Los empleados con distinta experiencia consiguen el mismo


rendimiento en todas las mquinas? * ep = 30,9 rechazar Ho

Gladys Enrquez Mantilla 179


UAP Ingeniera de Sistemas
Inferencia Estadstica

26.- Se desea comparar la efectividad de tres mtodos de enseanza de la programacin


de cierta computadora; mtodo 1 que es la instruccin directa a travs de las
instrucciones de la computadora; mtodo 2 que implica la atencin personal de un
instructor y alguna experiencia directa trabajando con la computadora; y el mtodo
3 que implica la atencin personal de un instructor ms no el trabajo con la
computadora misma. Se toman muestras al azar de tamao 4 de grupos de
estudiantes instruidos por los tres mtodos, los estudiantes obtuvieron las siguientes
calificaciones:
Calificaciones
Mtodo 1 : 71 75 65 69
Mtodo 2 : 90 80 86 84
Mtodo 3 : 72 77 76 79
En el nivel de 0,01, Se puede afirmar que los tres mtodos de enseanza son
igualmente efectivos? De no ser as, explique entre cules se presenta diferencias.
* ep = 15,78 P = 0,001 1 y 2 ; 2 y 3

27.- Un distribuidor de aparatos electrnicos quiere determinar si hay diferencias en las


proporciones de los aparatos reparados para cada una de las cuatro principales
marcas de televisores vendidos en cierta ciudad. Los datos siguientes fueron
recolectados durante un periodo de dos aos.

Marca A Marca B Marca C Marca D


Servicio 20 30 55 45
No servicio 280 289 350 89
Con una confianza del 90%, Puede concluirse que son distintas las proporciones de
aparatos defectuosos entre las distintas marcas? * ep = 64,78 P = 0,00

28.- El fabricante de una bebida baja en caloras est considerando la importancia del
color del envase rojo, amarillo o azul- en las ventas de la bebida. Para ello elige
diecisis tiendas ms o menos del mismo tamao, y lleva potes rojos a seis de las
tiendas, amarillo a cinco y azules a los cinco restantes. Despus de unos cuantos
das, se anotan las ventas (en decenas de latas) en las diferentes tiendas,
obtenindose los resultados que aparecen a continuacin:
Rojo : 43 52 59 76 61 81
Amarillo : 52 37 38 64 74
Azul : 61 29 38 53 79
Con una confianza del 99%, Se puede afirmar que las ventas medias para los tres
colores de envase son las mismas? Si no es as, Entre qu colores se da la
diferencia? * ep = 0,61 P = 0,556

29.- Se realiza un experimento para determinar el efecto de tres sustancias diferentes


sobre la resistencia de una tela. Las sustancias se emplean como parte del proceso
terminal de planchado permanente. Para ello se escogen cinco muestras de tela y se
aplica un diseo completamente aleatorizado por bloques completos mediante la
prueba de cada sustancia en un orden aleatorio sobre cada una de las muestras de
tela. Los datos aparecen en la siguientes tabla:

Muestra de tela
Sustancia
1 2 3 4 5
A 1,3 1,6 0,5 1,2 1,1
B 2,2 2,4 0,4 2,0 1,8
C 1,8 1,7 0,6 1,5 1,3

Existe diferencia en las sustancias qumicas en cuanto al efecto que tienen sobre la
resistencia promedio de la tela? * ep = 9,60 P = 0,008

Gladys Enrquez Mantilla 180


UAP Ingeniera de Sistemas
Inferencia Estadstica

30.- Un analista de mercado tiene el problema de si las amas de casa que "no se
encuentran en ella" cuando los entrevistadores, difieren en sus opiniones acerca de
un determinado producto. Para comprobar esta posibilidad, los entrevistadores
regresaron a las casas hasta que obtuvieron una entrevista. Los resultados de este
estudio aparecen en la siguiente tabla.

Nmero de amas de casa entrevistadas


Opinin del Producto
Primera llamada Llamadas Posteriores
Excelente 62 36
Satisfactoria 84 42
No satisfactoria 24 22

Las amas de casa "muy caseras" tienen las mismas opiniones que las que no lo son?
* ep = 3,04 P = 0,219

31.- Se realiza un estudio para comparar el rendimiento de los automviles, en millas por
galn, para tres marcas de gasolina: A, B y C. En el experimento se usaron cuatro
automviles de la misma marca y modelo, y cada marca de gasolina se prob en
todos los automviles. El uso de todas las marcas de gasolina en el mismo automvil
tiene el efecto de eliminar la variabilidad de automvil a automvil. Los datos, en
millas por galn, son las siguientes:

Marca de Automvil
gasolina 1 2 3 4
A 15,7 17,0 17,3 16,1
B 17,2 18,1 17,9 17,7
C 16,1 17,5 16,8 17,8

Proporcionan los datos suficiente evidencia que indique que hay diferencia entre los
nmeros medios de millas por galn de las tres marcas de gasolina?
* ep = 6,46 P = 0,032

32.- Se est realizando un estudio acerca de las fallas de un componente electrnico.


Existen cuatro tipos posibles de falla y dos posiciones de montaje para el dispositivo.
Se han obtenido los siguientes datos:

Posicin de Tipo de falla


montaje A B C D
1 22 46 18 9
2 4 17 6 12
3 14 25 20 15

Podra llegarse a la conclusin de que el tipo de falla nada tiene que ver con la
posicin de montaje? * ep = 14.39 aceptar Ho

33.- El gerente de un centro comercial quera saber si hay diferencias en la proporcin de


clientes compradores a diversas horas durante diferentes das de la semana. Se
seleccionaron muestras aleatorias de 300 clientes en el da, 300 clientes en la noche
y 400 clientes de fin de semana, con los siguientes resultados:

Fin de
Da Noche
semana
Hombres 90 125 185
Mujeres 210 175 215

Con un nivel de significancia del 1%, Hay una diferencia en la proporcin de


clientes en los diversos das y horas de la semana? * ep = 19,36 P = 0,00

Gladys Enrquez Mantilla 181


UAP Ingeniera de Sistemas
Inferencia Estadstica

34.- Una empresa va a seleccionar un sistema informtico integrado entre tres modelos
que tiene en estudio. La eleccin final depender de la productividad del sistema. Se
eligen al azar 5 operadores que hagan funcionar cada sistema. Se sabe que la
experiencia de cada operador en el manejo de ordenadores puede afectar al resultado
de la prueba. Por lo tanto, ser preciso tener en cuenta el efecto de la experiencia al
determinar las ventajas respectivas de cada sistema informtico. Los niveles de
produccin resultantes, (unidades por hora), se presentan en la siguiente tabla. Un
cdigo numrico ms alto para la experiencia indica ms aos de formacin.

Sistemas Grado de experiencia


Informticos 1 2 3 4 5
1 27 31 42 38 45
2 21 33 39 41 46
3 25 35 39 37 45

Con un nivel de significancia del 1%, Se puede llegar a la conclusin de que los
niveles medios de produccin de los tres sistemas informticos no difieren?
* ep = 0,09 P = 0,914

35- Los siguientes datos corresponden a los docentes que trabajan en una universidad,
clasificados segn su categora y su satisfaccin en el trabajo.
Categora del Docente
Satisfaccin
en el Trabajo Jefe de Profesor Profesor Profesor
Prctica Auxiliar Asociado Principal
Mucha 40 60 52 63
Regular 78 87 82 88
Poca 57 63 66 64

Podemos afirmar con una confianza del 98% que la categora de un docente influye
en su satisfaccin en el trabajo? * ep = 2,75 P = 0,839

36.- Un socilogo desea determinar si existe una relacin entre la inteligencia de jvenes
que se han sometido a un programa de capacitacin especial en el trabajo y su
desempeo subsiguiente en sus empleos. Una muestra de 400 casos tomados de
archivos muy grandes produjo los siguientes resultados:
Desempeo
Cociente Intelectual
Deficiente Regular Bueno
Debajo del promedio 67 64 25
Promedio 42 76 56
Arriba del promedio 10 23 37
Se puede concluir que existe buena asociacin entre el desempeo en el trabajo y la
inteligencia? * ep = 41,01 P = 0,00

37.- En un estudio, a 80 personas solteras, 120 casadas y 100 viudas o divorciadas se les
pregunt si sienten que los amigos y la vida social, el trabajo o la actividad principal
o la condicin fsica y de salud contribuyen en forma importante a su felicidad
general.

Solteros Casados Viudos o Divorc.


Amigos y vida social 41 49 42
Trab. o activ. Principal 27 50 33
Condic. Fsica y de salud 12 21 25

Demostrar si las probabilidades de las tres elecciones son las mismas para personas
solteras, casadas o viudas o divorciadas. * ep = 5,34 P = 0,254

Gladys Enrquez Mantilla 182


UAP Ingeniera de Sistemas
Inferencia Estadstica

38.- Se clasific una muestra aleatoria de 90 adultos, de acuerdo con su sexo y el nmero
de horas que ven televisin durante una semana.

Sexo
Horas
Masculino Femenino
Ms de 25 15 29
Menos de 25 27 19

Es buena la asociacin entre el sexo de las personas y el nmero de horas que ven
televisin durante la semana? . * ep = 5,47 P = 0,019

39.- Los siguientes datos se refieren a los salarios ($) de 130 trabajadores de una
empresa elegidos en forma aleatoria. Si se sabe que el promedio es 165 y la varianza
25.
Salarios ($) N de trabajadores
< 156 18 Verificar si la distribucin
156-160 20 dada se aproxima a una
160-164 9 distribucin normal.
164-168 45
168-172 28
172 10
* ep = 34,17 rechazar Ho

40.- Un departamento de estudios de transporte de los tres principales centros de peaje


de una ciudad midi el volumen de trnsito que pasa por un punto del centro en
cada calle durante intervalos de cinco minutos. Se cuenta con el nmero de
vehculos en periodos seleccionados al azar para cada calle.
Calle: Volumen de trnsito
1 : 30 45 26 44 18 24 38 42 29
2 : 24 33 31 16 31 13 12
3 : 35 47 31 43 46 27 31 21

A un nivel de significancia de 0,10, Es el volumen promedio del trfico igual en las


tres calles? De no ser as, En cul es mayor? * ep = 3,54 P = 0,047 2y3

41.- Se registr el nmero de accidentes, por semana, en cierto cruce de caminos durante
una muestra aleatoria de semanas, con los resultados que se muestran a
continuacin:
N de accidentes : 0 1 2 3 4 5
N de semanas : 52 32 16 9 11 7
Verificar si la variable aleatoria nmero de accidentes tiene una distribucin
conocida, suponiendo que las observaciones son independientes.

42.- Un investigador desea determinar si existe o no una relacin entre un estudiante de


una especialidad y su intencin de asistir a cursos de post-grado. La siguiente tabla
muestra los resultados de una encuesta hecha a un grupo de estudiantes.

Especialidad Piensa asistir a cursos de Post-Grado


S No Inseguro
Ing. Electrnica 12 9 15
Ing. de Sistemas 14 5 5
Ing. Qumica 10 7 9
Ing. Mecnica 8 6 5

Al nivel del 5%, Qu se puede inferir? * ep = 4,95 P = 0,550

Gladys Enrquez Mantilla 183


UAP Ingeniera de Sistemas
Inferencia Estadstica

43.- Se realiza una investigacin acerca de la calificacin del desempeo en el trabajo y


los logros acadmicos en la universidad. Se selecciona una muestra aleatoria de
empleados y se obtienen los siguientes resultados:

Nivel Acadmico en Universidad


Calificacin de desempeo
A B C
Excelente 10 5 5
Promedio 20 12 8
Malo 20 13 7

Debe llegarse a la conclusin de que la calificacin del desempeo en el trabajo no


est altamente relacionada con los logros acadmicos en la universidad? Por qu?

44.- Un auditor del departamento de impuestos quiere comparar la eficiencia de cuatro


centros regionales de procesamiento de datos de impuestos. Se seleccion una
muestra aleatoria de cinco declaraciones y se determin el nmero de das entre
recepcin de la declaracin de impuestos y el procesamiento final. Los resultados (en
das) fueron como sigue:
C. Regionales :
Oriente : 49 54 40 60 43
Centro : 47 56 40 51 55
Sur : 39 55 48 43 50
Occidente : 52 42 57 46 50
Existe diferencia altamente significativa en el tiempo de procesamiento entre los
cuatro centros regionales? Si es as, explique entre quines se da diferencia.
* ep = 0,18 P = 0,911

45.- A continuacin se presenta una distribucin de frecuencias observadas. Utilizando


una distribucin normal con media 5 y desviacin estndar 1,5.

Variable Frecuencia
< 2,5 6
2,5-3,8 30
3,8-5,0 41
5,0-6,2 52
6,2 12

Esta distribucin de frecuencias parece estar bien descrita por la distribucin


normal sugerida? ep = 15.96 Rechazar Ho

46.- Estn considerndose cuatro diferentes mquinas para su uso en la manufactura de


sellos de goma. Estas mquinas estn siendo comparadas con respecto a la
resistencia de tensin del producto. Se utiliza una muestra aleatoria de 4 sellos de
cada mquina para determinar si la resistencia promedio a la tensin vara de
mquina a mquina o no. Las siguientes son las mediciones de resistencia a la
tensin en kilogramos por centmetro cuadrado10-4.

Mquinas
A B C D
17,5 16,4 20,3 14,6
16,9 19,2 15,7 16,7
15,8 17,7 17,8 20,8
18,6 15,4 18,9 18,9
Con un nivel de significancia de 0,05, Podemos afirmar que al menos una de las
mquinas presenta diferente variabilidad? * ep = 0.84 aceptar Ho

Gladys Enrquez Mantilla 184


UAP Ingeniera de Sistemas
Inferencia Estadstica

47- Se determina el tiempo de respuesta, en milisegundos, para tres tipos diferentes de


circuitos en una calculadora electrnica. Los resultados son los siguientes:
Tipo de circuito Respuesta
1 : 19 22 20 18 25
2 : 20 21 33 27 40
3 : 16 15 18 26 17

Podemos afirmar que el tiempo de respuesta promedio de los tres circuitos es el


mismo? Si no es as, entre cules se da la diferencia.
* ep = 4.01 P = 0.046 2y3

48.- Se desea probar si el nmero de rayos gamma emitidos por segundo por cierta
sustancia radiactiva es una variable aleatoria que tiene la distribucin de Poisson.
Para ello se cuenta con los datos obtenidos en 300 intervalos de un segundo.
N de rayos gamma 0 1 2 3 4 5 6 7
Frecuencia 19 48 66 74 44 35 10 4
Obtener una conclusin altamente significativa. ep = 5.14 Aceptar Ho

49.- Con el fin de planear cunto dinero en efectivo se debe dejar a la mano en la caja
fuerte de un banco, el gerente est interesado en ver si el depsito promedio de un
cliente est distribuido normalmente. Se sabe que la media es S/1500 y la varianza
360000.

Depsito N de clientes
< 1000 20
1000- 2000 65
2000-3000 86
3000-4000 58
4000-5000 72
5000-6000 43
6000 25
Un empleado recin contratado, con la esperanza de ser ascendido, ha recolectado la
informacin de la tabla anterior y desea probar si la distribucin es normal.

50.- La tabla siguiente est basada en una encuesta acerca de los ingenieros de sistemas,
realizada en una ciudad. Se les dividi en tres grupos en base a su currculum
acadmico y a sus ingresos al cabo de 10 aos de ejercicio.

Currculum Ingreso
Acadmico Alto Mediano Bajo
Alto 18 17 5
Mediano 26 38 16
Bajo 6 15 9

El hecho de tener un tipo de currculum afecta el tipo de ingreso? Llegue a una


conclusin altamente significativa. * ep = 6.11 Aceptar Ho

51.- En un da dado, el gerente de un supermercado observ el nmero de clientes que


escogieron cada una de las ocho cajas de pago distintas de la salida. Los resultados
se dan en la siguiente tabla:

Caja N : 1 2 3 4 5 6 7 8
Frecuencia : 80 100 130 145 120 110 60 55
Presentan estos datos suficiente evidencia de que hay cajas preferidas?
* ep = 74,5 rechazar Ho

Gladys Enrquez Mantilla 185


UAP Ingeniera de Sistemas
Inferencia Estadstica

52.- Los siguientes datos corresponden a los puntajes obtenidos por los alumnos de una
universidad. Con una probabilidad de 0,90

Inters en la Capacidad para las Matemticas


Estadstica Baja Media Alta
Bajo 63 42 15
Medio 58 61 31
Alto 14 47 29

Podemos afirmar que un alumno que es bueno en matemticas no necesariamente


es bueno en estadstica? Tenga en cuenta que no estamos dispuestos a rechazar la
hiptesis cuando sta en realidad sea verdadera. * ep = 32,14 P = 0,00

53.- Determinar si los puntajes de un considerable grupo de estudiantes de Inferencia


Estadstica pueden ser aproximados mediante una distribucin normal, si se sabe
que el promedio aritmtico es 58,6 y la desviacin estndar 14.

Puntajes N de estudiantes
< 30 14
30-35 18
35-40 22
40-45 20
45-50 40
50 28

Obtener una conclusin altamente significativa.


* ep = 243.29 Rechazar Ho

54.- El gerente de un departamento de ventas realiz un experimento para calcular si


existe diferencia en el promedio de salarios semanales de los tres vendedores del
departamento de pedidos. Los datos siguientes indican las ventas en cientos de
dlares de los tres empleados en siete semanas.

semana
Vendedores
1 2 3 4 5
A 27,6 31,2 28,8 30,6 30,0
B 28,7 29,3 28,4 29,8 31,0
C 26,4 30,3 28,0 28,7 32,3

Con un nivel de significancia de 0,10, Podemos concluir que existe diferencia en la


media de ventas de los tres vendedores y en la media de ventas por semana?
* ep = 0,29 y 5,63 P = 0,753 y 0,019

55- En cuatro secciones de una facultad se dicta como curso obligatorio el de


Estadstica. Se desea saber si existe o no una diferencia significativa entre las notas
de las cuatro secciones. Para esto se toman muestras aleatorias de cada clase.
Supngase que las calificaciones estn normalmente distribuidas.

Seccin : Notas
A : 85 78 90 79 92 88
B : 66 75 72 81
C : 59 50 66 70 62 72 65
D : 61 71 69 80 75

Obtenga una decisin significativa. ep = 11.60 Rechazar Ho

Gladys Enrquez Mantilla 186


UAP Ingeniera de Sistemas
Inferencia Estadstica

56.- Disponemos de un lote de dispositivos electrnicos, cada uno de los cuales consta de
seis circuitos, observndose el siguiente nmero de defectos en cada dispositivo
electrnico.

N de circuitos defectuosos : 0 1 2 3 4 5 6
N de dispositivos : 49 153 148 50 95 86 98

Aproximar los datos a una distribucin conocida, con un nivel de 0.01.

57.- Se utilizaron tres mtodos para determinar si stos influyen en el aprendizaje en


ciertos cursos. El mtodo I puede ser descrito de la manera siguiente: las tareas se
entregan semanalmente y debe aplicarse un examen a la mitad del curso y otro final.
El mtodo II consiste en hacer 4 exmenes cada mes, los mismos que cubren el
material visto en el mes anterior. El mtodo III consiste en exmenes semanales de
30 minutos y un examen final. Se asignaron tareas en los mtodos II y III, pero su
entrega no fue exigida. Se utiliz el mismo profesor y libro de texto en los tres
mtodos, y los tres grupos fueron representativos de los estudiantes, de los ltimos
semestres de la escuela. La variable de respuesta medida fue un porcentaje de los
puntos obtenidos por cada estudiante.
Mtodo:
1 : 91 62 77 84 52 67 58 78 88 72
2 : 85 91 79 84 73 47 92 91 62
3 : 79 85 74 89 79 80 94 91
Para una probabilidad de 0,99, Existe o no diferencia en los promedios de los tres
mtodos? * ep = 1,72 P = 0,200

58- Un especialista en computacin deseaba llevar a cabo un experimento para


investigar la eficiencia relativa de los tres lenguajes de computacin: Fox Pro, C++ y
Java en la solucin de un problema de gran escala. Se seleccion una muestra
aleatoria de estudiantes del ltimo ao de ingeniera de sistemas, con la misma
idoneidad para los tres lenguajes. Los estudiantes se asignaron de modo aleatorio a
un lenguaje en particular y se les pidi contar el nmero de horas de trabajo
necesarias para resolver el problema. Los resultados fueron como sigue:
Lenguaje : N de horas
Fox Pro : 20 17 26 19 24 22
C++ : 23 20 27 30 25 26
Java : 20 23 19 24 27 25
a) El especialista cree que el nmero de horas promedio de trabajo es ms
representativo en el lenguaje Java, ests de acuerdo? Por qu?
* ep = 0,99 No
b) Podemos afirmar que existe diferencia altamente significativa entre el
nmero de horas promedio de los tres lenguajes de programacin?
* ep = 2,08 P = 0,160

59.- Se propone que el nmero de defectos en las tarjetas de circuito impreso sigue una
distribucin Poisson. Se rene una muestra aleatoria de 60 tarjetas de circuito
impreso y se observa el nmero de defectos. Los resultados obtenidos son los
siguientes:
N de defectos : 0 1 2 3
Frecuencia : 32 15 19 14
Con una confianza del 95%, Podemos afirmar que la distribucin de los defectos en
las tarjetas de circuito impreso es Poisson?

Gladys Enrquez Mantilla 187


UAP Ingeniera de Sistemas
Inferencia Estadstica

60- Se ha de efectuar un estudio de movimientos para determinar el mejor plan de


trabajo para montaje de relojes de pared; se investigan cinco planes. Tres obreros
son escogidos al azar entre todos los obreros de la planta y se les ensea
concienzudamente a trabajar con los cinco planes. Entonces, cada obrero sigue cada
plan durante un da, habiendo sido escogido al azar su plan para dicho da entre los
distintos planes, y se registra el nmero de relojes montados. Los datos son:

Plan de trabajo
Obrero
A B C D E
1 10 13 9 14 11
2 5 10 5 10 6
3 6 12 5 10 6

Se puede afirmar que no existe diferencia entre los diferentes planes de trabajo?
Considera que sera perjudicial para la empresa si decides rechazar la hiptesis nula
cuando sta en realidad es verdadera. * ep = 29,89 rechazar Ho

61.- Un editor de un peridico, deseoso de identificar con precisin las caractersticas de


su mercado, se pregunta si el nmero de lectores en la comunidad guarda relacin
con la escolaridad de ellos. En un cuestionario pregunt a los adultos, que vivan en
la zona, su nivel de escolaridad y la frecuencia de lectura. Los resultados se incluyen
en la siguiente tabla:

Frecuencia Graduados
Postgrado Secundaria Primaria
de Lectura Universit.
Nunca 7 14 13 16
Algunas veces 13 17 7 7
Matut. o Vesper. 39 41 10 5
Ambas ediciones 22 23 8 12

En el nivel de significancia de 0,10, La frecuencia de lectura de los peridicos en la


comunidad difiere segn la escolaridad de los lectores?
* ep = 30,76 rechazar Ho

62.- El nmero de reclamos recibidos en cuatro establecimientos de una cadena de


tiendas, por concepto de mercanca equivocada o defectuosa en cierto mes del ao es
la siguiente:

Tienda N A B C D
Reclamos 63 78 54 49
Sobre la base de estos resultados, Es sostenible la hiptesis de que el nmero de
reclamos, que recibe cada tienda, es aproximadamente el mismo, al nivel del 10%?
* ep = 7,97 rechazar Ho

63.- A una muestra aleatoria de seis profesores auxiliares, cuatro profesores asociados y
cinco profesores principales se les propuso que hicieran una estimacin del tiempo
que haban dedicado la ltima semana a preparar sus clases. Los resultados, en
horas, fueron los siguientes:

Categora Tiempo
Auxiliar 7 12 11 15 9 14
Asociado 15 12 15 8
Principal 11 7 6 9 7
El decano cree que no existe diferencia significativa entre la variabilidad del tiempo
empleado por los profesores para preparar sus clases, Cree usted que est en lo
correcto? * ep = 0,92 aceptar Ho

Gladys Enrquez Mantilla 188


UAP Ingeniera de Sistemas
Inferencia Estadstica

64.- Un profesor de la facultad de Ingeniera de Sistemas ensea en cuatro clases el


mismo curso de Inferencia Estadstica. En cada clase procede de la misma forma,
esto es, utiliza la misma metodologa as como el mismo sistema de evaluacin; sin
embargo, en cada una utiliza un texto diferente. Supngase que los estudiantes se
eligen aleatoriamente para las cuatro clases. Al terminar el periodo el profesor hace
un resumen de las notas, las cuales son las siguientes:
Texto : Notas
1 : 78 78 74 72 81 34 80
2 : 51 53 62 78 49 83 50 57 66
3 : 69 54 68 58 71 68 58 71
4 : 54 65 79 69 50
Puede el profesor concluir que el tipo de texto ha afectado el rendimiento de los
alumnos? * ep = 0,90 aceptar Ho

65.- Un experimento del tipo "estmulo-reaccin" que contiene tres tratamientos se


organiz en forma de bloques aleatorizados, usando cuatro individuos. La respuesta
(variable de inters fue el tiempo de reaccin medido en segundos. Los datos son los
siguientes (los nmeros enteros representan los tratamientos).
Individuos
A B C D
1 3 1 2
1,7 2,1 0,1 2,2
3 1 2 1
2,3 1,5 2,3 0,6
2 2 3 3
3,4 2,6 0,8 1,6

a) Presentan los datos suficiente evidencia que indique que hay diferencia entre
las reacciones a los estmulos? Utilice un nivel de significancia del 5%.
* ep = 34,25 rechazar Ho
b) Se puede afirmar que existe diferencia entre las reacciones de los
individuos? * ep = 14,5 rechazar Ho

66.- Un partido poltico desea conocer si existe relacin entre el grado de aceptacin de su
programa electoral y el sueldo de los electores ((en soles). Para ello selecciona al azar
a 50 personas y obtiene los siguientes resultados.

Sueldo A favor En contra Indecisos


Menos de 800 15 43 54
Entre 800 y 1200 25 32 12
Ms de 1200 28 18 10

Aceptara el partido poltico que el sueldo medio de los electores explica el grado de
aceptacin del programa electoral a un nivel de confianza del 95%.

67.- Dos operadores de una mquina, A y B, produjeron cierto artculo con el


consiguiente nmero de defectuosos.

Resultados A B
Defectuosos 40 60
No defectuosos 300 500

Existe alguna diferencia entre la proporcin de defectuosos para los dos


operadores? * ep = 0,24 P = 0,627

Gladys Enrquez Mantilla 189


UAP Ingeniera de Sistemas
Inferencia Estadstica

68.- Estamos interesados en estudiar la fiabilidad de cierto componente informtico con


relacin al distribuidor que nos lo suministra. Para realizar esto, tomamos una
muestra de 100 componentes de cada uno de los 3 distribuidores que nos sirven el
producto comprobando el nmero de defectuosos en cada lote. La siguiente tabla
muestra el nmero de defectuosos para cada uno de los distribuidores.

Componentes Componentes
Distribuidor
defectuosos correctos
1 16 94
2 24 76
3 9 81

Obtener una conclusin altamente significativa.

69.- Se crearon modelos para fomentar la utilizacin, por parte de la gerencia, de los
informes generados por computadora. Se ensay en la empresa un modelo flexible,
en el que ya sea el receptor o el productor pueden procurar fomentar el uso. 41
receptores y 41 productores aceptaron la responsabilidad de fomentar el uso de
informes generados por computadora. En la siguiente tabla se indica el nmero de
veces que cada grupo satisfizo las condiciones especificadas en el modelo.

Se satisficieron las Copias de informe Copias no


Condiciones del modelo usadas usadas
S 20 2
No 21 39

Se puede afirmar que la proporcin de veces en que se satisficieron las condiciones


del modelo son idnticas para ambos grupos. Utilice un nivel de significacin del 1%.
* ep = 20,13 rechazar Ho

70.- Se les pidi a cuatro analistas financieros que predijeran el crecimiento de las
ganancias para el prximo ao de tres compaas petrolferas. Sus predicciones se
dan en la siguiente tabla en forma de incremento porcentual.

Compaa Analista
Petrolfera Prez Ruiz Garca Alva
A 8 12 7 13
B 9 9 8 12
C 12 10 9 10

Con una confianza del 99%, Podemos afirmar que las predicciones medias dadas
por los cuatro analistas son las mismas para las tres compaas?
* ep = 2,22 0,186

71.- Tres proveedores diferentes proporcionan piezas en lotes de 500. Para comparar la
calidad de los lotes se toman muestras aleatorias de seis lotes de cada proveedor y se
examinan para determinar el nmero de piezas no conformes. Los resultados se
muestran a continuacin:
Proveedor:
A : 28 37 34 29 31 33
B : 22 27 29 20 18 30
C : 33 29 39 33 37 38
Podemos afirmar que el nmero medio de piezas no conformes por lote no es la
misma para los tres proveedores? * ep = 10,45 p = 0,001

Gladys Enrquez Mantilla 190


UAP Ingeniera de Sistemas
Inferencia Estadstica

72.- Un director de recursos humanos, decide investigar la percepcin de los empleados


sobre la equidad de dos mtodos de evaluacin del desempeo. Para probar la
diferencia entre los dos mtodos, 160 empleados se asignaron al azar para ser
evaluados con uno de los dos mtodos: 78 se asignaron al mtodo 1, donde los
individuos proporcionan retroalimentacin al supervisor como parte del proceso de
evaluacin; 82 se asignaron al mtodo 2, donde los individuos aportan la auto
evaluacin de su desempeo. Despus de las evaluaciones, se pregunt a los
empleados si consideraban justa o injusta la evaluacin del desempeo. De los 78
empleados en el mtodo 1, 63 dijeron que era justa; 49 de los 82 empleados en el
mtodo 2 dijeron que era justa. Con un nivel del 5%, existen indicios de una
diferencia entre los dos mtodos?

73.- Actualmente se estudian diferentes algoritmos para estimar los costos de desarrollo
de software. Para ello se aplican cuatro algoritmos a cinco proyectos de desarrollo de
software y se observa el porcentaje de error al estimar los costos de desarrollo. Los
datos son los siguientes:

Proyecto
Algoritmo
1 2 3 4 5
1 (SLIM) 1244 21 82 839 527
2 (COCOMO-A) 281 129 396 910 473
3 (COCOMO-R) 220 84 458 794 488
4 (FUNCTION POINTS) 19 11 -34 103 87
Podemos afirmar que las diferencias que existen entre los algoritmos en cuanto a la
exactitud de la estimacin del costo promedio, puede atribuirse al azar?
* ep = 3,25 P = 0,060

74.- Se compararon estudiantes universitarios de tres especialidades diferentes con


respecto a su aptitud para la computacin. Los estudiantes se clasificaron en las
categoras excelente, promedio, inferior al promedio. A cada estudiante se le aplic el
examen de aptitud en computacin KSW, registrndose el puntaje obtenido. Los
resultados fueron los siguientes:
Puntajes
Excelente : 16 22 18 20 16 21
Promedio : 21 19 16 17 5 20 18 19
Inferior : 4 20 13 14 8 6 11
Podemos afirmar que existe diferencia significativa entre las tres categoras o slo
entre dos? Explique. * ep = 5,39 P = 0,015

75.- Una firma fabricante de aparatos electrnicos trabaja las 24 horas del da, cinco das
a la semana. Estn establecidos tres turnos de ocho horas cada uno y los
trabajadores cambian de turno cada semana. Un equipo de directivos efectu un
estudio para determinar si hay diferencia entre las medias del nmero de monitores
de video de 14 pulgadas producidos cuando los empleados trabajan en los diferentes
turnos. Una muestra aleatoria de cinco trabajadores registr el nmero de monitores
que producen en cada turno, como sigue:

Empleados Turno
Maana Tarde Noche
Castro 10 4 14
Gonzlez 12 5 12
Mendoza 7 3 9
Ramrez 9 8 7
lvarez 7 5 6
Podemos concluir que hay diferencia en la media de produccin por cada turno y
por cada trabajador? * ep = 1,55 y 5,75 P = 0,276 y 0,028

Gladys Enrquez Mantilla 191


UAP Ingeniera de Sistemas
Inferencia Estadstica

76.- Se realiz una encuesta entre los votantes de cuatro distritos de la ciudad de Lima
para comparar las proporciones de votantes a favor del candidato A para la alcalda
de Lima. Se tom una muestra de 300 votantes en cada uno de los cuatro distritos,
obtenindose los resultados que se muestran en la siguiente tabla:

Distritos
Votantes
Lince Brea Cercado Comas
A favor de A 126 103 109 98
En contra de A 174 197 191 202
Presentan los datos suficiente evidencia que indique que las proporciones de
votantes que estn a favor del candidato A en los cuatro distritos, son diferentes?
* ep = 6,49 P = 0,090

77.- Los nmeros que siguen son las prdidas de peso de ciertas partes de una mquina
debidas a la friccin, en miligramos, donde se utilizaron con tres lubricantes
diferentes.
Lubric. Prdidas de peso (miligramos)
X : 12 11 7 13 9 11 12 9
Y : 8 10 7 5 6 10 7 8 11 7
Z : 9 3 7 8 4 6 6 5
Podemos afirmar que las diferencias entre las tres medias de las muestras se
pueden atribuir al azar? * ep = 10,58 P = 0,001

78.- Se realiza un experimento para comparar la efectividad de 4 compuestos qumicos (A,


B, C, D) en producir resistencia a la humedad en productos textiles. Una tira de
material, seleccionada al azar de un rollo, se cort en 4 piezas y las piezas se
asignaron al azar a los cuatro tratamientos A, B, C o D. Este proceso se repiti tres
veces, produciendo as un diseo en bloques aleatorizados. A continuacin se
muestra el modelo, con las medidas de la resistencia a la humedad.
MUESTRAS DE ROLLO (Bloques)
1 2 3
C D B
9,9 13,4 12,7
A B D
10,1 12,9 12,9
B A C
11,4 12,2 11,4
D C A
12,1 12,3 11,9
Existe diferencia altamente significativa entre los cuatro compuestos qumicos?
* ep = 19,44 P = 0,002

79.- En un experimento un ingeniero est interesado en cmo vara la absorcin media de


humedad en el concreto de entre cuatro diferentes mezclas de concreto. Las mezclas
varan en el porcentaje en peso de cierto ingrediente importante. Se exponen a la
humedad durante 48 horas.
Mezcla (% de peso)
1 : 551 457 450 731 499 632
2 : 595 580 508 583 633 517
3 : 639 615 511 573 648 677
4 : 417 449 517 438 415 555
El ingeniero cree que la mezcla 4 presenta un promedio mayor, es correcta su
apreciacin? Obtener una conclusin al nivel del 10%.

Gladys Enrquez Mantilla 192


UAP Ingeniera de Sistemas
Inferencia Estadstica

80.- Una compaa de seguros desea investigar si hay diferencia entre el porcentaje de
accidentes que tienen las personas: menores de 25 aos, entre 25 y 50 aos; as
como aquellos de ms de 50 aos.

Menores de Mayores de
25 - 50
25 aos 50
Tiene accidente 50 90 20
No tiene accidente 90 300 30

De acuerdo con la evidencia, existe diferencia entre el porcentaje de accidentes de


estos tres grupos de edades

81.- Cada da, de lunes a sbado, un repostero hornea tres pasteles grandes de chocolate
y los que no se venden el mismo da se regalan a un centro de beneficencia.

N de pasteles vendidos 0 1 2 3
N de das 1 16 55 228
Probar si se pueden considerar valores de una variable aleatoria binomial.
* ep = 13,6 rechazar Ho

82.- Un contratista de construccin emplea a los ingenieros A, B y C para que realicen


estimaciones de costos con la finalidad de participar en las subastas de contratos.
Para determinar si uno de ellos tiende a ser ms conservador que los otros, el
contratista selecciona cuatro proyectos de construccin y hace que cada ingeniero
estime independientemente el costo (en soles por pie cuadrado) de cada proyecto. Los
datos son los siguientes:

Proyectos de construccin
Ingeniero
1 2 3 4
A 35,10 34,50 29,25 31,60
B 37,45 34,60 33,10 34,40
C 36,30 35,10 32,45 32,90
a) Proporcionan los datos suficiente evidencia que indique que hay diferencia
entre los costos medios de construccin para los 3 ingenieros?
* ep = 7,20 P = 0,025
b) Apoyan los datos la afirmacin de que la estimacin media del costo por pie
cuadrado vara de proyecto a proyecto? * ep = 16,61 P = 0,003

83.- Los siguientes datos corresponden a una muestra tomada al azar de 100 personas,
obtenindose los resultados que se indican:

Hombres Mujeres
Fumadores 30 10
No fumadores 20 40

Podemos afirmar que hay buena asociacin entre gnero y fumar?


* ep = 16,67 rechazar Ho

84.- Seis monedas fueron lanzadas muchas veces. Las frecuencias de los nmeros de
caras se dan a continuacin:

Nmero de caras 0 1 2 3 4 5 6
Frecuencias 48 120 285 324 312 145 58

Con una confianza del 99%, verifica si los datos se ajustan a un modelo binomial.
* ep = 123,24 rechazar Ho

Gladys Enrquez Mantilla 193


UAP Ingeniera de Sistemas
Inferencia Estadstica

85.- Una agencia de empleos desea saber cul es ms efectivo de tres tipos de anuncios
en la seccin de avisos clasificados de un peridico local. Durante varias semanas se
alternaron de manera aleatoria los tres tipos de anuncios (con encabezado grande,
normal, o con letra especial), registrndose semanalmente el nmero de personas
que respondan a los anuncios.
N de personas que respondieron
Encabezado grande : 23 42 36 48 33 26
Normal : 19 31 18 24 26
Con letra especial : 28 33 46 29 34 34
Podemos afirmar que no hay diferencia en la efectividad de los anuncios, tomando
como base el nmero medio de respuestas? * ep = 3,73 aceptar Ho

86.- Se obtuvo una muestra de 270 diskettes de cierta marca que pueden poseer errores
clasificados en distintos tipos.

Tipo de error : 0 1 2 3 4
Frecuencia : 46 96 85 35 8
Se quiere averiguar si la variable aleatoria tipo de error, sigue una distribucin
Binomial. Con un 5% de riesgo de equivocarnos.

87.- Las investigaciones han revelado que existe una resistencia bsica por parte de los
gerentes a utilizar informacin producida por computadora. En una empresa, ms de
40% de todos los informes generados por computadora y proporcionados al personal
gerencial no se utilizaron en absoluto. En la tabla se presenta un desglose del
nmero real de informes recibidos y no utilizados por cada uno de los tres grupos de
empleados.
Copias
Grupo que recibe Del informante No usadas
usadas
Directores y gerentes generales 38 29
Gerentes medios 22 20
Oficinistas 138 42
Hay pruebas suficientes para llegar a la conclusin de que los porcentajes de
informes generados por computadora y no utilizados difieren entre los tres grupos
que reciben los informes? * ep = 14,94 P = 0,001

88.- La siguiente tabla presenta las estimaciones de un ndice del costo de vida en cuatro
zonas de una gran ciudad, realizadas por cinco investigadores.

Zonas
Investigador
1 2 3 4
A 106 110 107 109
B 107 111 110 112
C 105 109 108 108
D 104 108 104 114
E 109 105 109 111

a) Existe diferencia significativa en los ndices de costo de vida en cuanto a


cada investigador independientemente de la zona?
* ep = 0,82 P = 0,536
b) Existe diferencia significativa en los ndices de cada zona
independientemente del investigador que lo realiza?
* ep = 3,58 P = 0,047

Gladys Enrquez Mantilla 194


UAP Ingeniera de Sistemas
Inferencia Estadstica

89.- El fabricante de una bebida baja en caloras est considerando la importancia del
color del envase rojo, amarillo o azul- en las ventas de la bebida. Para ello elige 16
tiendas ms o menos del mismo tamao, y lleva envases rojos a seis de las tiendas,
amarillos a cinco y azules a las cinco restantes. Despus de unos cuantos das, se
anotan las ventas (en decenas de latas) en las diferentes tiendas, obtenindose los
siguientes resultados:
Color del envase:
Rojo : 43 52 59 76 61 81
Amarillo : 52 37 38 64 74
Azul : 61 29 38 53
Podemos afirmar que las diferencias que se encuentren entre el grado de dispersin
de los tres envases no son significativas y se deben slo al azar?
* ep = 1,54 P = 0,254

90.- Supngase que deseamos decidir, sobre la base de los datos que se muestran en la
siguiente tabla, si el nmero de errores que comete un tipgrafo al elaborar una
galera de texto es una variable aleatoria que tiene una distribucin de Poisson.

N de errores 0 1 2 3 4 5 6 7 8 9
Frecuencias 18 53 103 107 82 46 18 10 2 1
Realizar dicha prueba, con un nivel del 10%. * ep = 6 Aceptar Ho

91.- Un investigador opina que las calificaciones que consiguen los estudiantes
universitarios dependen del tiempo que dediquen a escuchar msica. Con el objeto
de probar su teora, ha aplicado aleatoriamente un cuestionario a 400 alumnos. El
cuestionario contiene dos preguntas: "cuntas horas por semana escucha usted
msica?" y "cul es su calificacin promedio en todos los cursos?". Los datos de la
encuesta se incluyen en la tabla siguiente.

Horas dedicadas Calificacin Promedio


a or msica A B C D E
<5 13 10 11 16 5
5-10 20 27 27 19 2
11-20 9 27 71 16 32
20 8 11 41 24 11
Usando un nivel de significacin del 5%, Podemos afirmar que existe relacin entre
la calificacin promedio y el nmero de horas que dedican a or msica?
* ep = 63,83 P = 0,00

92.- En un experimento se compararon las velocidades que logran varias secretarias al


teclado de una mquina de escribir mecnica, de una elctrica y de una terminal de
computadora. En forma aleatoria se pidi a 18 secretarias que utilizaran el teclado
en ambas mquinas. Los puntajes obtenidos fueron los siguientes:

Puntajes
Mquina mecnica : 70 58 62 56 65 49
Mquina elctrica : 62 78 48 63 55 51
Computadora : 52 60 47 48 52 40
Hay evidencia suficiente para concluir que existe una diferencia entre las medias
poblacionales de los tres tipos de mquinas? Recomendaras en especial una de las
tres mquinas? * ep = 2.75 aceptar Ho

Gladys Enrquez Mantilla 195


UAP Ingeniera de Sistemas
Inferencia Estadstica

93.- Para comparar cinco procesadores de palabras A, B, C, D y E, se tom el tiempo de


cuatro personas para elaborar cierta clase de informe en cada una de las mquinas.
Los resultados (en minutos) aparecen en la tabla siguiente:

Personas
Procesador
1 2 3 4
A 49.1 48.2 52.3 57.0
B 47.5 40.9 44.6 49.5
C 76.2 46.8 50.1 55.3
D 50.7 43.4 47.0 52.6
E 55.8 48.3 82.6 57.8

Con una confianza del 99%, Podemos afirmar que las diferencias que existen entre
los cinco procesadores de palabras no se deben al azar?
* ep = 1.98 P = 0.163

94.- Una muestra al azar de sujetos lee 1, 3 y 5 veces una lista de palabras que deben
memorizar. Tras cada lectura se les pasa una tarea de recuerdo. Sus aciertos fueron:

N de Lecturas Nmero de aciertos


1 15 17 14 18 18 16
3 21 25 22 24 29 27
5 28 32 34 35 30 30
Se afirma que en este caso es imposible realizar un estudio de Diseo Completo al
Azar, ests de acuerdo? Por qu? * ep = 0,885 No

95.- La distribucin siguiente corresponde a las lecturas obtenidas con un contador


Geiger del nmero de partculas emitidas por una sustancia radiactiva en intervalos
sucesivos de 40 segundos.

N de partculas Frecuencia
5- 9 1
10-18 10
19-24 37
25-30 36
31-36 13
37-43 2
44-50 1

Probar si los datos pueden considerarse como una muestra tomada al azar de una
poblacin normal. * ep = 2,97 aceptar Ho

96.- Junto con el gran crecimiento de las aplicaciones del computador han aparecido
numerosos casos de abuso del mismo, de fraudes financieros, de robos de
informacin, etc. Los datos de la tabla siguiente dan cuatro tipos distintos de abusos
del computador que fueron observados durante los aos 2003 a 2005. Es de
esperarse que el nmero de abusos del computador aumente a medida que pasen los
aos, a menos que se tomen precauciones para evitarlo.

Tipo de abuso
Aos Fraude Robo de Uso no autoriz.
Vandalismo
Financiero Informacin de Informacin
2003 10 18 14 17
2004 20 16 16 20
2005 25 22 20 24
Han cambiado con el tiempo las proporciones de los cuatro tipos de abusos?
* ep = 3,07 P = 0,800

Gladys Enrquez Mantilla 196


UAP Ingeniera de Sistemas
Inferencia Estadstica

97.- Un ingeniero de control de calidad de una compaa fabricante de equipos


electrnicos de audio se encuentra inspeccionando un nuevo tipo de batera que tal
vez pueda utilizar. Un lote de 20 bateras fue dividido aleatoriamente en cuatro
grupos (de modo que haba cinco bateras en cada uno). Cada grupo de bateras fue
sometido a un nivel particular de presin: baja, normal, alta y muy alta. Las bateras
se probaron simultneamente bajo estos niveles de presin y se registraron los
tiempos de falla (en horas).
Presin:
Baja : 8,0 8,1 9,2 9,4 11,7
Normal : 7,6 8,2 9,8 10,9 12,3
Alta : 6,0 6,3 7,1 7,7 8,9
Muy Alta : 5,1 5,6 5,9 6,7 7,8

Se afirma que existe diferencia altamente significativa solamente entre el grupo de


bateras con presin baja y el grupo de bateras con presin muy alta, Est usted
de acuerdo? Explique por qu s o por qu no. * ep = 6,74 rechazar Ho

98.- En un estudio acerca del nmero de clientes esperando turno para ser atendidos en
la caja de una tienda de autoservicios, se eligieron al azar intervalos no superpuestos
de 5 minutos cada uno. Los resultados se muestran a continuacin:

N de clientes : 0 1 2 3 4 ms
N de intervalos : 8 20 25 18 9
Realizar la prueba de bondad de ajuste ms apropiada, para un nivel del 1%
* ep = 2,77 aceptar Ho

99.- En una encuesta aparecida el ao 2002 en un diario nacional, ante la pregunta:


Est usted de acuerdo con la afirmacin de que en los colegios de enseanza
primaria debera haber mucha ms disciplina con los alumnos?, se obtuvieron los
siguientes porcentajes:

Nada Poco Bastante Muy NS/NC


de acuerdo de acuerdo de acuerdo de acuerdo
18% 29% 33% 19% 1%

Para verificar si estos datos siguen siendo ciertos hoy en da, un grupo de
estudiantes de estadstica hace la misma pregunta a 100 personas elegidas al azar, y
obtiene los siguientes resultados:

Nada Poco Bastante Muy NS/NC


de acuerdo de acuerdo de acuerdo de acuerdo
10 30 25 20 15

Teniendo en cuenta los resultados de la muestra de 100 personas, se pueden


considerar admisibles en la actualidad los resultados del ao 2002?
* ep = 15,68 P = 0,003

100.- Se cree que el nmero de erratas por pgina de un determinado libro sigue una
distribucin de Poisson. Elegida una muestra aleatoria simple de pginas del
mencionado libro se obtuvo la siguiente distribucin de frecuencias absolutas sobre
dicho nmero de erratas por pgina.

N de erratas : 0 1 2 3 4 5
N de pginas : 35 72 68 48 17 6
Obtener una decisin altamente significativa. * ep = 2,22 aceptar Ho

Gladys Enrquez Mantilla 197


UAP Ingeniera de Sistemas
Inferencia Estadstica

101.- Un investigador decide tomar una muestra de 30 estudiantes de ingeniera, 35 de


filosofa y 40 de derecho. El objetivo es contrastar si la distribucin del conocimiento
de actualidad es la misma en los tres grupos.

Conocimiento
Facultad
Bajo Medio Alto
Ingeniera 18 10 2
Filosofa 6 14 15
Derecho 11 20 9

Obtener una conclusin altamente significativa. ep = 19.42 P = 0.001

102.- En una empresa se escogi a un grupo de empleados al azar; para que en uno de
cuatro grupos de entrenamiento, aprendieran a ejecutar una tarea en una lnea de
ensamble. Los grupos eran diferentes respecto de la cantidad de instruccin que
haban recibido. Al terminar el periodo de entrenamiento, cada uno de los empleados
realiz la tarea. Se hizo un registro del tiempo (en minutos) que necesitaron para la
realizacin completa de la tarea y se obtuvieron los siguientes resultados:

A : 51 42 44 65 49
B : 60 65 82 56 40 12
C : 80 75 98 23
D : 53 50 45 50 45
El Jefe de Personal quiere saber si existe diferencia significativa entre el tiempo
promedio necesitado por cada uno de los empleados, entonces le encarga dicho
trabajo al ingeniero Jefe de Turno, quien resuelve la situacin realizando un DCA y
llegando a la conclusin que no existe diferencia significativa entre dichos promedios.
Sin embargo, el Jefe de Personal duda de esta respuesta y conocedor que usted tiene
buenos conocimientos de inferencia estadstica, le pide su ayuda. Sin volver a
realizar el DCA, qu duda tendra y en qu se basara para decirle si la respuesta es
correcta o incorrecta? Aclrele la situacin, no defraude a quien confa en usted.
* ep = 0,3788 Rpta. Incorrecta

103.- Los siguientes datos corresponden a la distribucin de descomposturas de


maquinaria por hora en una planta de ensamble.

N de descomposturas : 0 1 2 3 4 5 6 7 8 9
N de horas : 4 8 12 18 10 8 5 4 2 1
Con un nivel de significancia del 2.5%, podemos ajustar los datos a una
distribucin conocida?

104.- Se han aplicado tres mtodos de empaquetado de dispositivos electrnicos durante


un periodo de 4 meses; al final de cada mes se realiza un recuento del nmero de
paquetes estropeados, obtenindose los siguientes datos:

Meses
Mtodo
1 2 3 4
A 6 8 8 8
B 10 12 9 14
C 9 11 13 15

Comprobar con un nivel de confianza del 95% si los tres mtodos de envasado son
igualmente buenos o existen diferencias significativas entre ellos.
ep = 10.33 Rechazar Ho

Gladys Enrquez Mantilla 198


UAP Ingeniera de Sistemas
Inferencia Estadstica

105.- Antes de presentar una licitacin para un trabajo de construccin, los ingenieros de
costos preparan un anlisis detallado de los costos estimados de mano de obra y
materiales que se necesitarn para completar el trabajo. Tal estimacin depender
del ingeniero que realice el anlisis. Una estimacin demasiado grande reducir la
probabilidad de que el predio de licitacin de la compaa sea aceptado, mientras
que una estimacin demasiado baja reducir las utilidades o incluso har que la
compaa pierda dinero en el trabajo. Una compaa que cuenta con tres ingenieros
de costos quiso comparar el nivel medio de las estimaciones de los ingenieros. Esto
se hizo pidiendo a cada ingeniero estimar el costo de los mismos cuatro trabajos. Los
datos (en cientos de miles de dlares) se muestran en la siguiente tabla:

Trabajo
Ingeniero
I II III IV
Gonzlez 4.6 6.2 5.0 6.6
Martnez 4.9 6.3 5.4 6.8
Rodrguez 4.4 5.9 5.4 6.3

Obtener una conclusin altamente significativa. ep = 4.33 Aceptar Ho

106.- En el estudio de un taller, se obtuvo un conjunto de datos para determinar si la


proporcin de artculos defectuosos producidos por los trabajadores era la misma
durante el da, la tarde o la noche. Se encontraron los siguientes datos:

Turno
Artculos
Da Tarde Noche
Defectuosos 45 55 70
No Defectuosos 905 890 870

Utilice un nivel de significacin de 0,025 para determinar si la proporcin de


artculos defectuosos es la misma para los tres turnos. ep = 6.234 P = 0.044

107.- Una afirmacin generalizada entre los profesores es que la popularidad de un


maestro entre los estudiantes est altamente relacionada con las calificaciones que
stos reciben. Para poner a prueba esta afirmacin, un investigador recab los
siguientes datos:

Calificaciones
Popularidad
A B C D E
Sobresaliente 13 17 15 13 13
Competente 20 38 60 16 10
Necesita Mejorar 20 30 45 12 10

Se puede concluir que la afirmacin es correcta? Por qu?


ep = 15.83 Aceptar H1

108.- Se realiza una investigacin para determinar si hay alguna asociacin entre el peso
de un estudiante y un xito precoz en la escuela, a juicio de un psiclogo escolar. Se
selecciona una muestra aleatoria consistente en 500 estudiantes. Se clasifica a cada
estudiante de acuerdo con dos criterios, el peso y el xito en la escuela. La tabla de
contingencia generada es la siguiente:

Con sobrepeso Sin sobrepeso


xito 162 263
Fracaso 38 37

Se puede concluir que hay una alta asociacin entre ambas variables?

Gladys Enrquez Mantilla 199


UAP Ingeniera de Sistemas
Inferencia Estadstica

109.- El temor a un examen es una emocin que experimentan muchas personas de


todos los grupos de edad. Una encuesta a 276 individuos pertenecientes a cada uno
de cinco grupos de edad, arroj los siguientes resultados.

Grupos
Primaria Secundar. Tecnolog. Universit. Especializ.
N de temerosos 74 56 50 54 42
Probar, al nivel del 5%, la afirmacin de que cada grupo de edad teme igualmente a
los exmenes. * ep = 10,09 rechazar Ho

110.- Se seleccionaron al azar tres grupos de nios de quinto grado y se les asign a tres
programas distintos de ejercicios fsicos, con la finalidad de determinar si los
programas eran eficaces en aumentar la habilidad de los nios para lanzar un
objeto. De los 28 nios que participaron en el experimento, 10 formaron un grupo de
control (sin ningn ejercicio) y los restantes formaron dos grupos de 9,
correspondientes a dos regmenes de ejercicios distintos que duraron cuatro
semanas. Antes y despus de las cuatro semanas de ejercicios se midi la velocidad a
la que cada nio poda lanzar una bola de prueba, y se registr el aumento (o
disminucin) y de la velocidad (en pies/seg.). A continuacin se muestra el aumento
medio para cada grupo y una tabla de Anova parcialmente llena.
Control Rgimen A Rgimen B
-1,34 0,32 3,69

Tabla de Anova
Fuente de variacin G.L. SC CM F
Grupos - 64,31 -
Error - - - -
Total - 402,33

a) Colocar los nmeros que faltan en la tabla de Anova.


b) Presentan los datos evidencias para concluir que hay diferencia entre las
medias poblacionales de los tres grupos? * ep = 2,38 aceptar Ho

111.- El control de calidad de una determinada pieza se realiza a travs de tres pruebas,
considerndose que los resultados proporcionados por las tres pruebas son
igualmente significativos. Para contrastar dicha hiptesis, con un nivel del 1%, se
seleccionan tres muestras, las cuales dan los siguientes resultados:

Prueba 1 23 70 50 58 64 73
Prueba 2 36 50 43 32 71 55 61 29 42 60
Prueba 3 56 58 40 31 63

A la vista de estas observaciones, puede afirmarse que las tres pruebas aportan
resultados similares? * ep = 0.60 Aceptar Ho

112.- Un psiclogo especialista en recursos humanos ha realizado un estudio en una


empresa para conocer la motivacin de sus empleados. Dispone de los datos de 200
empleados clasificados en tres grupos: motivados, no motivados y neutrales.
Tambin tiene datos sobre si dichos empleados han recibido cursos de formacin o
no. Los datos de que dispone son los siguientes:

Motivados Neutrales No Motivados


Reciben cursos 65 15 20
No reciben cursos 5 25 70

Interesa averiguar si los empleados que han recibido cursos estn igualmente
motivados que los que no lo han recibido. * ep = 81.706 Rechazar Ho

Gladys Enrquez Mantilla 200


UAP Ingeniera de Sistemas
Inferencia Estadstica

113.- Se han realizado mediciones sobre el tiempo de respuesta, en milisegundos, para


tres tipos diferentes de circuitos de una calculadora electrnica. Se sabe que en los
tres tipos de circuitos el promedio aritmtico es igualmente representativo. Los
resultados son los que siguen a continuacin:

Tipo de circuito Tiempo de respuesta


A 9.5 11 10 9
B 10 10.5 16.5 20
C 8 7.5 9 11 8.5

Se puede concluir que el tiempo medio de respuesta de los circuitos B y C difiere?


Obtener una conclusin con un nivel del 5%.

114.- Un experimento est diseado para determinar el efecto de cuatro diferentes


conservantes para productos enlatados. Estos cuatro conservantes fueron
ensayados en 5 tipos de alimentos diferentes. El tiempo promedio de duracin (en
aos) sin ningn tipo de contaminacin de cada tipo de alimento segn el
conservante empleado se muestra en la siguiente tabla:

Tipo de alimento
Conservante
A B C D E
1 1.3 1.6 0.5 1.2 1.1
2 2.2 2.4 0.4 2.0 1.8
3 1.8 1.7 0.6 1.5 1.3
4 3.9 4.4 2.0 4.1 3.4

Existen suficientes evidencias como para afirmar que hay diferencia significativa
entre los conservantes? Por qu? ep = 75.13 Rechazar Ho

115.- Una acreditada zapatera es abastecida por cuatro fabricantes. Cada zapato es
inspeccionado antes de ponerlo a la venta. Hay tres defectos diferentes que
causaran la devolucin al fabricante. Al observar una muestra se encontraron los
siguientes defectos:

Defecto
Fabricante
I II II
A 17 10 13
B 10 10 10
C 18 15 17
D 15 5 10

Se puede afirmar que la cantidad de defectos es independiente del fabricante?

116.- Se pregunta a los estudiantes de tres carreras si para una tarde del sbado prefieren
a) ir al cine, b) salir con amigos o c) leer un libro. Los resultados se dan en la
siguiente tabla.

Actividad
Carrera
Ir al cine Salir con amigos Leer un libro
A 26 55 19
B 24 118 58
C 10 112 68

Queremos saber si hay diferencias en los gustos de los estudiantes de las tres
carreras con un nivel de significacin de 0.01.

Gladys Enrquez Mantilla 201


UAP Ingeniera de Sistemas
Inferencia Estadstica

117.- Al gerente de una compaa de software le interesa conocer el nmero de horas


semanales que dedican al uso de sus terminales de computadora los ejecutivos de
alto nivel, por tipo de industria, considerando: Banca, Comercio y Seguros. El
gerente encarg dicho anlisis a un estadstico quien le entreg los resultados
correspondientes al DCA en una pgina y los correspondientes a la Prueba de Tukey
en otra pgina; debido a esto y sin querer mezcl estos papeles con otros similares y
ahora no sabe si este grfico corresponde o no a este caso, podras ayudarlo?

Explcale si corresponde o no, justificando por qu.

118.- Una cadena de grandes almacenes tiene cinco divisiones, una en cada piso. De una
muestra aleatoria de clientes se obtuvo la siguiente clasificacin:

Ropa y Cosmtica Muebles y Regalos


Tipo de pago Juguetes
calzado y belleza electrodomsticos y joyas
Al contado (billetes) 20 30 10 10 30
Al contado (cheque) 100 90 30 20 60
Tarjeta de crdito 140 150 50 40 100

Se puede concluir que el tipo de pago est altamente asociado con la divisin de
compra? Por qu?

119.- Con la esperanza de atraer ms usuarios, una compaa de transporte urbano


planea ofrecer servicios de autobuses a partir de un terminal suburbano hacia el
distrito comercial en el centro de la ciudad. Estos autobuses deben reducir el tiempo
de traslado. La municipalidad decide realizar un estudio del efecto de cuatro
diferentes proyectos (tales como un carril especial para los autobuses y una
sealizacin secuencial del trfico) sobre el tiempo de traslado de los autobuses. Se
miden los tiempos en minutos durante varios das de la semana durante un viaje, a
la hora de mayor afluencia en la maana, cuando cada proyecto est en operacin.
Los resultados se muestran en la tabla siguiente:

Plan Tiempo de traslado(minutos)


A 27 25 29 26
B 25 28 30 27 24
C 34 29 32 31 36
D 30 33 31

Si tuvieras que adoptar uno de estos planes, sabiendo que cometer un error tipo I
sera muy grave, qu plan adoptaras? Por qu? ep = 7.80 Rechazar Ho

Gladys Enrquez Mantilla 202


UAP Ingeniera de Sistemas
Inferencia Estadstica

120.- Una fbrica de automviles quiere averiguar si el gnero de sus posibles clientes
tiene algo que ver con la preferencia de modelo. Se toma una muestra aleatoria de
posibles clientes y se obtiene los siguientes resultados:

Modelo
Gnero
A B C
Femenino 340 400 260
Masculino 350 270 380

A qu conclusin se llegar en la fbrica? Usar un nivel del 10%.


ep = 47.87 P = 0.00

121.- Se tienen los siguientes datos correspondientes al nmero de disquetes defectuosos


fabricados por el grupo de obreros de los distintos turnos de una fbrica. Los datos
son mensuales. Los meses de recogida de datos se han seleccionado al azar para
cada turno.

Maana : 6 11 10 8 11 8
Tarde : 14 10 12 10 14 12
Noche : 10 12 7 15 11 11
Adems se conocen los siguientes datos:

Se puede apreciar alguna diferencia altamente significativa entre el nmero de


defectuosos que se producen en cada turno de trabajo? ep = 3 Aceptar Ho

122.- Quinientos nios de un centro educativo fueron clasificados en forma cruzada de


acuerdo con el grupo socioeconmico al que pertenecen y la presencia o ausencia de
cierto defecto en el lenguaje. Los resultados fueron los siguientes:

Grupo Socioeconmico
Defecto del lenguaje
Alto Medio alto Medio bajo Bajo
Presente 8 24 32 27
Ausente 42 121 138 108

Son compatibles estos datos con la hiptesis de que el defecto en el lenguaje est
altamente relacionado con el grupo socioeconmico? Por qu?

123.- En un centro universitario se dispone de tres libros de texto para impartir la


asignatura de Estadstica. Se supone que la calidad de los textos influye en las
calificaciones obtenidas por los alumnos. Para comprobarlo se realiza un
experimento consistente en que tres grupos de alumnos estudien con cada uno de
los libros, siendo impartidas las clases por el mismo profesor. Los resultados fueron:

Libros Reprobado Aprobado Notable Sobresaliente


A 10 32 12 40
B 14 12 10 30
C 8 40 6 16

Estudiar el tipo de asociacin que existe entre las calificaciones y los libros
utilizados. ep = 24.98 P = 0.00

Gladys Enrquez Mantilla 203

Вам также может понравиться