Академический Документы
Профессиональный Документы
Культура Документы
Inferencia Estadstica
Es una prueba no paramtrica que es particularmente til para las variables cualitativas
que estn compuestas por dos o ms categoras.
Procedimiento:
ei j = . .
fi f j
n
En el caso de la prueba de homogeneidad; las frecuencias esperadas se
calculan mediante: e ij = n Pi donde las Pi se calculan de acuerdo a la
distribucin que se est haciendo el ajuste.
Variable B
Variable A B3
B1 B2
A1 O11 O12 O 23
A2 O21 O22 O 23
Ejemplo:
Nota:
La muestra de tamao n debe ser suficientemente grande, de modo que ninguna de las
frecuencias esperadas sea menor que 1 y no ms del 20 % de las mismas sea menores
que 5.
Cuando no puede usarse la prueba Chi Cuadrado, entonces deber usarse el Test
Exacto de Fisher o la prueba de Mc Nemar.
Procedimiento:
1. Hiptesis:
H0 : p1 = p2 = ... = pc c>2
H1 : no todas las proporciones son iguales.
2. Valor Crtico:
21 , ( F 1 ) ( C 1 )
F: N de filas C: N de columnas
3. Estadstica de Prueba:
2
=
( Oi j ei j )2
, ei j = . .
fi f j
ei j n
4. Decisin:
Si 2 R A Aceptar H0
5. Conclusin:
Valor Crtico:
2 k : nmero de celdas.
1 , k 1
Estadstica de Prueba:
ei j = n pi
1
donde : pi =
k
n = Oi j
Correccin de Yates:
Se aplica cuando:
2
F C 0i j e i j 0,5
2 = eij
i =1 j=1
En muestras grandes la correccin de Yates conduce a los mismos resultados que sin
efectuar la correccin.
Ejemplo 1:
Una compaa deseaba saber si sus obreros, sus empleados de oficina, sus empleados de
ventas y sus otros empleados se diferenciaban en cuanto a su opinin acerca de la
conveniencia de ser empleado de la compaa. Se tomo una muestra aleatoria de personas
de cada uno de los cuatro grupos y a cada uno se le solicit que diera su opinin sobre la
compaa como lugar de trabajo, en comparacin con otras compaas que le fueran
familiares. Las respuestas se clasifican en por encima del promedio y en por debajo del
promedio. La siguiente tabla muestra los resultados:
Otros
Opinin Obreros Empl.Oficina Vendedores
Emp.
Por encima del promedio 68 45 70 60
Por debajo del Promedio 57 30 30 15
Proporcionan estos datos suficiente evidencia como para indicar una falta de
homogeneidad entre los cuatro grupos respecto de su opinin acerca de la conveniencia de
ser empleado de la compaa?
Solucin:
1. Hiptesis:
H0 : P1 = P2 = P3 = P4 (hay homogeneidad)
H1 : al menos una Pi es diferente (no existe homogeneidad).
2. Valor Crtico:
2 = 2 = 7.81
1 , ( 2 1 ) ( 4 1 ) 0.95 , 3
3. Estadstica de Prueba:
2 4( Oi j e i j )2
2H = ei j
= 15.47
i =1 j=1
Empleados Otros
Opinin Obreros Vended. Total
Oficina Emp.
68 45 70 60
Por encima del promedio 243
81.0 48.6 64.8 48.6
57 30 30 15
Por debajo del Promedio 132
44.0 26.4 35.2 26.4
Total 125 75 100 75 375
4. Decisin:
2 = 15,47 R R rechazar H0 y aceptar H1
5. Conclusin:
Con una confianza del 95%, podemos afirmar que existe suficiente evidencia como
para indicar una falta de homogeneidad entre los cuatro grupos respecto a su
opinin acerca de la conveniencia de ser empleado de la compaa.
Ejemplo 2:
Establecimiento : A B C D E
Reclamos : 50 65 72 47 52
Con un nivel del 5%; Podemos afirmar que el nmero de reclamos que recibe cada
establecimiento es aproximadamente el mismo?
Solucin:
k = 5 celdas
1 1 1
pi = = e i j = n p i = 286 x = 57.2
k 5 5
Entonces:
Establecimiento A B C D E n
Reclamos ( Oi j ) 50 65 72 47 52
286
ei j 57.2 57.2 57.2 57.2 57.2
1. Hiptesis:
2. Valor Crtico:
2 = 2
0.95 , 4
= 9.49
1 , k 1
3. Estadstica de Prueba:
( Oi j e i j )2
2H = = 8.09
ei j
5. Conclusin:
Con una confianza del 95%, s podemos afirmar que el nmero de reclamos que
recibe cada establecimiento es aproximadamente el mismo.
Esta prueba se usa en general cuando el investigador desea saber si dos variables estn o
no asociadas. Si no hay asociacin entre las variables, se dice que ambas son
independientes, trmino que se emplea para indicar que la distribucin de una de ellas no
depende en absoluto de la distribucin de la otra.
Si dos variables no son independientes, ello significa que el conocimiento de una de ellas
puede ayudarnos de alguna forma a conocer la otra. Es decir, se aplica para establecer si
hay alguna relacin o dependencia en cuanto a los criterios de clasificacin de la
informacin.
Procedimiento:
1. Hiptesis:
2. Valor Crtico:
21 , ( F 1 ) ( C 1 )
3. Estadstica de Prueba:
2 =
( Oi j ei j )2
, ei j = . .
fi f j
ei j n
4. Decisin:
Si 2 R A Aceptar H0
5. Conclusin:
Ejemplo:
Solucin:
1. Hiptesis:
2. Valor Crtico:
21 , ( F 1 ) ( C 1 ) = 20,95 , 2 = 5,99
3. Estadstica de Prueba:
( Oi j ei j )2
2 = ei j = 9.74
Situacin de empleo en el
Estado actual del
Prstamo
momento del prstamo
Empleado Desempleado
.
fi
10 8 18
En mora
11.74 6.26
60 22 82
Al da
53.48 28.52
5 10 15
No paga
9.78 5.22
.
f j 75 40 n = 115
4. Decisin:
2 = 9,74 R R Re chazar H0
5. Conclusin:
Con una confianza del 95%, podemos afirmar que s existe relacin entre situacin
de empleo y estado de prstamo.
Nota:
Si existe independencia entre las variables, los valores esperados y observados sern
parecidos y el valor de 2 ser pequeo.
COEFICIENTE DE CONTINGENCIA
C =
2
n + 2
En el problema anterior:
9.74
C = = 0.279 < 0.30
115 + 9.74
Esta prueba permite verificar si una muestra aleatoria procede de una poblacin con una
distribucin de probabilidad conocida (Binomial, Poisson, Normal).
Para aplicar esta prueba primero debern agruparse los datos de la muestra en una tabla y
luego estimar los verdaderos parmetros de la poblacin en caso que no sean dados ( p , ,
y ) segn el caso.
Las frecuencias esperadas eij para cada valor de X (binomial y Poisson) o para cada
intervalo (Normal) se calculan hallando primero las probabilidades de ocurrencia pi usando
la frmula del modelo supuesto.
Procedimiento:
1. Hiptesis:
2. Valor Crtico:
2
1 , k p 1
3. Estadstica de Prueba:
2
k ( Oij eij )
2
= , ei j = n pi
i =1 eij
4. Decisin:
Si 2 R A Aceptar H0
5. Conclusin:
Nota:
Ejemplo 1:
Los siguientes datos se refieren a los salarios de 120 trabajadores de una compaa. Con un
nivel de significancia del 5%, podemos afirmar que la distribucin se aproxima a una
normal?
Solucin:
1. Hiptesis:
3. Estadstica de Prueba:
6 ( Oij eij )2
2
= = 15.74
i =1 eij
La estadstica de prueba se calcul en base a los siguientes resultados:
Salarios Xi N de trabajadores pi e ij = n p i
150-156 153 14 0.05444 6.53
156-162 159 12 0.14532 17.44
162-168 165 22 0.24938 29.93
168-174 171 40 0.26161 31.39
174-180 177 20 0.17572 21.09
180-186 183 12 0.07523 9.03
Total n = 120
= x = 168.8
= S = 8.66
p1 = P (150 X 156 ) = P ( 2.17 Z 1.48 ) = 0.06944 0.01500 = 0.05444
p2 = P (156 X 162 ) = P ( 1.48 Z 0.79 ) = 0.21476 0.06944 = 0.14532
p3 = P (162 X 168 ) = P ( 0.79 Z 0.09 ) = 0.46414 0.21476 = 0.24938
p4 = P (168 X 174 ) = P ( 0.09 Z 0.60 ) = 0.72575 0.46414 = 0.26161
p5 = P (174 X 180 ) = P ( 0.60 Z 1.29 ) = 0.90147 0.72575 = 0.17572
p6 = P (180 X 186 ) = P (1.29 Z 1.99 ) = 0.97670 0.90147 = 0.07523
Todas las eij > 5 entonces no es necesario reagrupar.
4. Decisin:
2 = 15.74 R R Re chazar H0 y aceptar H1
5. Conclusin:
Con una confianza del 95% podemos afirmar que la distribucin no se aproxima a
una normal.
Ejemplo 2:
El nmero de defectos por unidad observada en una muestra de 100 radios dio la siguiente
distribucin de frecuencias.
N de defectos : 0 1 2 3 4 5 6 7
N de radios : 28 32 15 10 6 4 3 2
Solucin:
1. Hiptesis:
H0 : Los datos se aproximan a una distribucin Poisson.
H1 : Los datos no se aproximan a una distribucin Poisson.
2. Valor Crtico:
2 = 20,95 , 3 = 7,81 p = 1:
0,95 , 5 1 1
3. Estadstica de Prueba:
5 ( Oij eij )2
=
2
= 15.12
i =1 eij
N defectos N de radios
Xi Oi j pi = P (X = x ) ei j = 100 pi
0 28 0.186 18.6
1 32 0.313 31.3
2 15 0.263 26.3
3 10 0.147 14.7
4 6 0.062 6.2
5 4 0.021 2.1
9
6 3 0.006 0.6
7 2 0.001 0.1
Total n = 100
1.68 x
e 1.68
= x = 1.68 pi =
x!
4. Decisin:
2 = 15.12 R R Re chazar H0
5. Conclusin:
Con una confianza del 95% podemos afirmar que la distribucin de estos datos no se
aproxima a una Poisson.
Ejemplo 3:
N de computadoras : 0 1 2 3
N de das : 1 16 55 228
Probar en el nivel del 5% si se puede considerar como valores de una variable aleatoria
binomial.
Solucin:
1. Hiptesis:
H0 : La distribucin es Binomial.
H1 : La distribucin no es Binomial.
2. Valor Crtico:
2 = 20.95 , 1 = 3.84
0.95 , 3 1 1
= n p
n : N de computadoras vendidas
x 2.7
x = np
=
p = = 0.9 q = 1 0,9 = 0.10
n' 3
3. Estadstica de Prueba:
3 ( Oi j e i j )2
2 = ei j
= 13.6
i =1
4. Decisin:
2 = 13.6 R R Re chazar H0
5. Conclusin:
Con una confianza del 95% no podemos considerar los datos como valores de una
variable aleatoria binomial.
Esta prueba se emplea para determinar si las varianzas de k poblaciones son iguales o no.
La prueba es muy sensible a la normalidad: si los datos no son normales, la prueba ofrece
resultados significativos cuando en realidad no lo son.
1. Hiptesis:
H0 : 12 = 22 = ........... = 2k
2. Valor Crtico: bk
bk ( , n ) Si ni iguales
Para ni diferentes
n1 b k ( , n1 ) + n2 b k ( , n2 ) + .... + n k b k ( , nk )
b k ( , n1 , n2 , ..., n k ) =
N
3. Estadstica de Prueba: b
Para ni iguales:
1 k
S S ...... S k
2 2 2 S2i
1 2 k
b = donde: S2
p =
i =1
S2p
k
Para ni diferentes:
1
( ) ( ) ( ) ( ni 1) S2i
k
2 n1 1 n 1 n 1
S1 S2
2
2 .... 2
Sk k
N k
b = ; S2
p =
i =1
S2
p
Nk
4. Decisin:
5. Conclusin:
Tres proveedores diferentes proporcionan piezas en lotes de 500. Para comparar la calidad
de los lotes se toman muestras aleatorias de seis lotes de cada proveedor y se examinan
para determinar el nmero de piezas no conformes. Los resultados fueron:
Proveedor:
A : 28 37 34 29 31 33
B : 22 27 29 20 18 30
C : 33 29 39 33 37 38
Al nivel del 1%, podemos afirmar que existe diferencia significativa entre las varianzas?
Solucin:
k = 3 n1 = n2 = n3 = 6 N = 18
S2A = 11.2 S2B = 25.07 S2C = 14.57
1. Hiptesis:
H0 : 2A = 2B = 2C
H1 : Al menos una 2i es diferente
2. Valor Crtico:
b k ( , n ) = b3 ( 0.01 , 6 ) = 0.5149
3. Estadstica de Prueba:
1
3
b =
[11.2 25.07 14.57 ]
= 0.944
16.95
S2p =
S2i =
11.2 + 25.07 + 14.57
= 16.95
k 3
4. Decisin:
5. Conclusin:
Con una confianza del 99% podemos afirmar que no existen pruebas suficientes para
decir que las varianzas son diferentes.
Ejemplo 2:
A una muestra aleatoria de seis profesores auxiliares, cuatro profesores asociados y cinco
profesores principales se les propuso que hicieran una estimacin del tiempo que haban
dedicado la ltima semana a preparar sus clases. Los resultados, en horas, fueron los
siguientes:
Categora: Tiempo
Auxiliar : 7 12 11 15 9 14
Asociado : 15 12 15 8
Principal : 11 7 6 9 7
El Decano cree que no existe diferencia significativa entre la variabilidad del tiempo
empleado por los profesores para preparar sus clases, cree usted que est en lo correcto?
Solucin:
k = 3 N = 15
S12 = 9.07 S22 = 11 S23 = 4
n1 = 6 n2 = 4 n3 = 5
1. Hiptesis:
2. Valor Crtico:
6 b3 ( 0.05 , 6 ) + 4 b3 ( 0.05 , 4 ) + 5 b3 ( 0.05 , 5 )
b3 ( 0.05 ; 6 , 4 , 5 ) =
15
6 0.6483 + 4 0.4699 + 5 0.5762
= = 0.577
15
3. Estadstica de Prueba:
1
b =
[9.07 5
113 44 ]
12
= 0.92
7.86
S2p =
( ni 1 )S2i =
5 9.07 + 3 11 + 4 4
= 7.86
Nk 12
4. Decisin:
5. Conclusin:
Nota:
Para averiguar si una varianza es mayor que las otras, se utiliza la prueba de Cochran.
DISEO DE EXPERIMENTOS
Experimento
Este trmino se utiliza para planear un experimento de manera que se pueda obtener la
informacin pertinente a un determinado problema que se investiga y as tomar decisiones
correctas. El diseo adecuado del experimento es una etapa fundamental de la
experimentacin, que permite el suministro correcto de datos a posteriori, lo que a su vez
conducirn a un anlisis objetivo y con deducciones vlidas del problema.
Un experimento diseado no es ms que una prueba o una serie de pruebas en las que se
inducen cambios deliberados en las variables de entrada de un proceso o sistema, de
manera que sea posible observar e identificar las causas de los cambios en la respuesta de
salida.
Anlisis de un experimento
Variable independiente
Ejemplo:
Es toda aquella variable que es explicada por el modelo y refleja el efecto de las variables
independientes.
Ejemplo:
Variables exgenas
Son todas aquellas variables que explican a la variable dependiente en menor escala que las
variables independientes. Generalmente no tiene ninguna importancia para el investigador.
El investigador deber controlar estas variables puesto que ocasionan en el experimento
variaciones que no resultan convenientes.
Ejemplo:
Factor o tratamiento
Los tratamientos son los diferentes procedimientos, procesos, factores o materiales cuyos
efectos van a ser medidos y comparados. El tratamiento establece un conjunto de
condiciones experimentales que deben imponerse a una unidad experimental dentro de un
diseo seleccionado.
Se emplea como sinnimo de variable independiente. Es decir son todas aquellas variables
cuyos efectos se desean medir. Pueden ser cuantitativas o cualitativas.
Ejemplo:
Unidad experimental
Es la entidad ms pequea a la que se aplica un tratamiento. Son los objetos sobre los
cuales se hacen mediciones y se analiza la variable que se investiga.
Aleatorizacin
Error experimental
Repeticin
Proporcionar mtodos que permitan obtener la mayor cantidad de informacin vlida acerca
de una investigacin, teniendo en cuenta el factor costo y el uso adecuado del material
disponible mediante mtodos que permitan disminuir el error experimental.
Es una tcnica estadstica que sirve para analizar la variacin total de los resultados
experimentales de un diseo en particular, descomponindolo en fuentes de variacin
independientes atribuibles a cada uno de los efectos en que constituye el diseo
experimental.
Una suposicin fundamental del ANOVA es que las varianzas son homogneas. Esta
suposicin se emplea para estimar una varianza comn (el Cuadrado Medio del Error CME)
que sirva para realizar comparaciones entre las medias de los tratamientos.
Los mtodos de diseo experimental tambin son tiles en las actividades de ingeniera de
diseo, donde se desarrollan nuevos productos y se mejoran los existentes. Algunas
aplicaciones representativas de los experimentos diseados de manera estadstica en la
ingeniera de diseo incluyen:
- Evaluacin y comparacin de configuraciones de diseo bsicas.
- Evaluacin de materiales diferentes.
- Seleccin de parmetros de diseo de modo que el producto funcione bien bajo una
gama amplia de condiciones de campo.
El empleo del diseo experimental en el proceso de diseo puede dar como resultado
productos que son ms fciles de fabricar, productos que tienen un desempeo y una
confiabilidad mejores que los de la competencia, y productos que pueden disearse,
desarrollarse y producirse en menor tiempo.
Es aquel modelo en el cual las unidades experimentales sobre las que se toman medidas se
asignan al azar a los diferentes factores o tratamientos (variable independiente).
Se utiliza cuando el experimentador cuenta con los resultados de k muestras aleatorias
independientes, cada una de tamao n i y le interesa probar la hiptesis de que las medias
de las k poblaciones son todas iguales.
Para probar esta hiptesis se supondr estar trabajando con poblaciones normales que
tienen varianzas iguales. Si uno o los dos supuestos no se cumplen entonces deber
aplicarse la prueba no paramtrica de Kruskal-Wallis.
G1 G2 G1 G2 G3
La prueba t nos dice si existe diferencia entre los promedios de dos grupos. Podramos
entonces efectuar pruebas t para cada pareja de grupos. Sin embargo el nmero de pruebas
aumentara a medida que hubieran ms grupos. El ANOVA nos da un solo valor para la
comparacin colectiva o global.
El ANOVA fue ideado por Fisher en 1925 y permite comprobar si existen diferencias entre
promedios de tres o ms tratamientos; para ello se calcula el valor de F. Cuando
encontramos el valor de F sabremos si existen diferencias entre los grupos, pero no nos dice
entre cules grupos, y por eso debemos aplicar posteriormente otros tests llamados de
comparacin mltiple.
Esta tcnica permite no slo analizar los datos sino tambin planificar los experimentos, por
lo tanto el anlisis de varianza es un procedimiento estadstico que nos permite dividir la
variabilidad observada en componentes independientes que pueden atribuirse a diferentes
causas de inters.
1. Hiptesis:
H0 : 1 = 2 = ........ = k
H1 : Las i no son todas iguales
2. Valor Crtico: C
F1 , k 1 , k ( n 1 ) para n i iguales
F1 , k 1 , N k para n i diferentes
Para obtener este valor F se construye la siguiente tabla llamada tabla de ANOVA.
5. Conclusin:
PRUEBA DE TUKEY
Tukey propuso un mtodo para hacer todas las comparaciones pareadas entre medias. Con
este mtodo se calcula un solo valor con el que se comparan todas las diferencias.
Valor Crtico:
q , k , N k
Estadstica de Prueba:
xi x j xi x j
q = q =
CME CME 1 1
+
n 2 ni n j
Decisin:
Ejemplo 1:
Solucin:
k = 4 grupos N = 20 datos
1: Baja 2: Normal 3: Alta 4: Muy Alta
8.0 7.6 6.0 5.1
8.1 8.2 6.3 5.6
9.2 9.8 7.1 5.9
9.4 10.9 7.7 6.7
11.7 12.3 8.9 7.8
T1. = 46.4 T2 . = 48.8 T3 . = 36.0 T4 . = 31.1
n1 = 5 n2 = 5 n3 = 5 n4 = 5
x1 = 9.28 x 2 = 9.76 x 3 = 7.20 x 4 = 6.22
S12 = 2.23 S22 = 3.71 S23 = 1.35 S24 = 1.12
T= Xi j = 162.30 X2i j = 1393.15
1ero.- Se realizar la prueba de Bartlett para verificar si las varianzas poblacionales de los
cuatro grupos son iguales.
1. Hiptesis:
H0 : 12 = 22 = 23 = 24
H1 : Al menos una 2i es diferente
3. Estadstica de Prueba:
1
4
b =
[ 2.23 3.71 1.35 1.12 ]
= 0.8955
2.10
S2p =
S2i =
2.23 + 3.71 + 1.35 + 1.12
= 2.10
k 4
1. Hiptesis:
H0 : 1 = 2 = = 4
3
H1 : Al menos un i es diferente
2. Valor crtico: F1 , k 1 , N k
F0.99 , 3 , 16 = 5.29
3. Estadstica de prueba:
CM(tr )
F =
CME
= 42.46
5. Conclusin:
Con una confianza del 99% podemos afirmar que los tiempos promedio de falla de
las bateras se diferencian entre s.
3ero.- Como se acept H1 entonces deber realizarse la prueba de Tukey para determinar
entre qu promedios existe tal diferencia.
1. Valor crtico:
q , k , Nk = q 0.01 , 4 , 16 = 5.19
2. Estadstica de Prueba:
xi x j xi x j
q = =
CME 2.10
n 5
x 2 x1 9.76 9.28
q = = = 0.74 < 5.19 2 = 1
CME 2.10
n 5
x2 x3 9.76 7.20
q = = = 3.94 < 5.19 2 = 3
CME 2.10
n 5
x2 x4 9.76 6.22
q = = = 5.45 > 5.19 2 4
CME 2.10
n 5
x1 x 3 9.28 7.20
q = = = 3.2 < 5.19 1 = 3
CME 2.10
n 5
x1 x 4 9.28 6.22
q = = = 4.71 < 5.19 1 = 4
CME 2.10
n 5
x3 x4 7.20 6.22
q = = = 1.51 < 5.19 3 = 4
CME 2.10
n 5
Con una confianza del 99% podemos concluir que los nicos promedios que difieren son:
2 y 4
Ejemplo 2:
En una empresa particular se escogieron 20 empleados al azar, para que en uno de cuatro
grupos de entrenamiento, aprendieran a ejecutar una tarea en una lnea de ensamble. Los
grupos eran diferentes respecto de la cantidad de instruccin que haban recibido. Al
terminar el periodo de entrenamiento, cada uno de los 20 empleados realiz la tarea. Se hizo
un registro del tiempo (en minutos) que necesitaron para la realizacin completa de la tarea
y se obtuvieron los resultados siguientes:
A : 51 42 35 65 49
B : 30 48 44 56 54 40
C : 80 75 85 73
D : 53 47 45 50 71
Proporcionan estos datos evidencia suficiente como para concluir que existe diferencia
significativa entre el tiempo promedio que necesitaron para la realizacin completa de la
tarea? En caso de existir diferencia, entre qu grupos se presenta?
Solucin:
k = 4 grupos N = 20 datos
A B C D
51 30 80 53
42 48 75 47
35 44 85 45
65 56 73 50
49 54 71
40
T1. = 242 T2 . = 272 T3 . = 313 T4 . = 266
n1 = 5 n2 = 6 n3 = 4 n4 = 5
x1 = 48.40 x 2 = 45.33 x 3 = 78.25 x 4 = 53.20
S12 = 125.8 S22 = 92.27 S23 = 28.92 S24 = 108.2
T= X i j = 1093 X2i j = 64171
1ero.- Se realizar la prueba de Bartlett para verificar si las varianzas poblacionales de los
cuatro grupos son iguales.
1. Hiptesis:
H0 : 12 = 22 = 23 = 24
2. Valor crtico:
n1 b 4 ( , n1 ) + n2 b 4 ( , n2 ) + n3 b 4 ( , n3 ) + n4 b 4 (, n 4 )
b 4 ( , n1 , n2 , n3 , n 4 ) =
N
5 b 4 ( 0.05, 5) + 6 b 4 (0.05 , 6) + 4 b 4 (0.05 , 4) + 5 b 4 (0.05 , 5)
b 4 ( 0.05 , 5, 6, 4, 5) =
20
5 0.5850 + 6 0.6559 + 4 0.4803 + 5 0.5850
= = 0.585
20
3. Estadstica de Prueba:
1
16
4 5 3 4
125.8 92.27 28.92 108.2
b = = 0.90
92.76
4
( ni 1) S2i 4 125.8 + 5 92.27 + 3 28.92 + 4 108.2
i =1
S2p = = = 92.76
Nk 16
5. Conclusin:
Con una confianza del 95% podemos afirmar que no existe diferencia significativa
entre las varianzas poblacionales de los cuatro grupos.
1. Hiptesis:
H0 : 1 = 2 = 3 = 4
H1 : Al menos un i es diferente
2. Valor crtico: F1 , k 1 , N k
F0.95 , 3 , 16 = 3.24
10.61
3. Estadstica de prueba:
CM(tr )
F =
CME
5. Conclusin:
Con una confianza del 95% podemos afirmar que los tiempos promedio que
necesitaron los cuatro grupos para la realizacin de la tarea se diferencian
significativamente entre s.
3ero.- Como se acept H1 entonces deber realizarse la prueba de Tukey para determinar
entre qu promedios existe diferencia significativa.
1. Valor crtico:
q , k , Nk = q 0.05 , 4 , 16 = 4.05
2. Estadstica de Prueba:
xi x j xi x j xi x j
q = = =
CME 1 1 92.8 1 1 1 1
+ + 46.4 +
2 ni n j 2 ni n j ni n j
x1 x 2 48.40 45.33
q = = = 0.74 < 4.05 1 = 2
1 1 1 1
46.4 + 46.4 +
n1 n2
5 6
x1 x 3 48.40 78.25
q = = = 6.53 > 4.05 1 3
1 1 1 1
46.4 +
46.4 +
n1 n3 5 4
x1 x 4 48.40 53.20
q = = = 1.11 < 4.05 1 = 4
1 1 1 1
46.4 + 46.4 +
n1 n4 5 5
x2 x3 45.33 78.25
q = = = 7.49 > 4.05 2 3
1 1 1 1
46.4 +
46.4 +
n2 n3 6 4
x2 x4 45.33 53.20
q = = = 1.91 < 4.05 2 = 4
1 1 1 1
46.4 + 46.4 +
n
2 n 4
6 5
x3 x4 78.25 53.20
q = = = 5.48 > 4.05 3 4
1 1 1 1
46.4 +
46.4 +
n
3 n 4 4 5
Conclusin:
Con una confianza del 95% se concluye que los nicos promedios poblacionales que
difieren son:
1 y 3 2 y 3 3 y 4
1. HIPTESIS 1:
2. Valor Crtico:
F1 , k 1 , N b k + 1
CM ( t r )
3. Estadstica de Prueba: F =
CME
4. Decisin:
5. Conclusin:
1. HIPTESIS 2:
2. Valor Crtico:
F1 , b 1 , N b k +1
CMB
3. Estadstica de Prueba: F =
CME
4. Decisin:
5. Conclusin:
Expresando el nivel de confianza, se responde a la pregunta formulada.
Tabla de ANOVA
Fuente de Grados de Suma de Cuadrado
F
Variacin Libertad Cuadrados Medio
SC ( tr )
CM ( tr ) = CM ( tr )
Tratamientos k 1 SC (tr) k 1
CME
SCB CMB
Bloques b 1 SCB CMB =
b 1 CME
SCE
Error N b k +1 SCE CME =
N b k +1
Total N 1 SCT
k b Ti2.
2
T i =1 T2
SCT = X2i j
N
SC ( tr ) =
b
N
i =1j =1
Ejemplo:
Una empresa trata de seleccionar un sistema informtico integrado entre tres modelos que
tiene en estudio. La eleccin final depender de la productividad del sistema. Se eligen al
azar cinco operadores que hagan funcionar cada sistema. Es importante saber que la
experiencia de cada operador en el manejo de ordenadores puede afectar al resultado de la
prueba. Por consiguiente, ser preciso tener en cuenta el efecto de la experiencia al
determinar las ventajas respectivas de cada sistema informtico. Los niveles de produccin
resultantes, medidos en unidades por hora, se presentan en la siguiente tabla. Un cdigo
numrico ms alto para la experiencia indica ms aos de formacin.
Grado de Experiencia
Sistemas
1 2 3 4 5
A 27 31 42 38 45
B 21 33 39 41 46
C 25 35 39 37 45
Solucin: N = 15
b=5
Grado de Experiencia Ti .
Sistemas
1 2 3 4 5
A 27 31 42 38 45 183
k=3
B 21 33 39 41 46 180
C 25 35 39 37 45 181
B. j 73 99 120 116 136 T = 544
Tabla de ANOVA
Fuente de Grados de Suma de Cuadrado
F
Variacin Libertad Cuadrados Medio
0.93 0.465
Tratamientos k 1 = 2 0.93 = 0.465 = 0.09
2 5.13
764.93 191.23
Bloques b 1 = 4 764.93 = 191.23 = 37.28
4 5.13
Error 41.07
Nb k +1 = 8 41.07 = 5.13
8
Total N 1 = 14 806.93
1. Hiptesis 1:
2. Valor Crtico:
F0.95 , 2, 8 = 4.46
3. Estadstica de Prueba:
CM ( t r ) 0.465
F = = = 0.09
CME 5.13
4. Decisin:
F = 0.09 RA Aceptar H0
5. Conclusin:
Con una confianza del 95% podemos afirmar que los niveles medios de produccin
de los 3 sistemas informticos no difieren.
1. Hiptesis 2:
2. Valor Crtico:
F0.95 , 4 , 8 = 3.84
3. Estadstica de Prueba:
CMB 191.23
F = = = 37.28
CME 5.13
4. Decisin:
5. Conclusin:
Con una confianza del 95% se puede afirmar que los empleados con distinta
experiencia no consiguen el mismo rendimiento en todas las mquinas.
PRCTICA N 6
Prueba Chi Cuadrado Bartlett DCA Tukey - DBA
2.- Se desea comparar la utilizacin de cuatro hojas de clculo diferentes y para ello se
pone a grupos de empleados para que trabajen con cada hoja y luego se anota el
nmero de errores que cada uno de ellos cometi. Los resultados obtenidos en este
estudio fueron:
Podemos afirmar que existe una diferencia significativa entre las hojas de clculo?
Si es as, cul hoja de clculo presenta un promedio mayor?
* ep = 3,71 rechazar Ho hoja 3
Adaptacin al Matrimonio
Educacin
Muy bajo Bajo Alto Muy alto
Universitaria 18 29 70 115
Secundaria 17 28 30 41
Primaria 11 10 11 20
Existe relacin entre el nivel educacional de un individuo y su adaptacin al
matrimonio? * ep = 19,94 P = 0,003
Voltaje de
N de unidades
salida
<4,948 12
4,948-4,986 14
4,986-5,014 12
5,014-5,040 13
5,040-5,066 12
5,066-5,094 11
5,094-5,122 14
5,122 12
Podemos afirmar que no hay evidencia fuerte que indique que el voltaje de salida no
est distribuido de manera normal? ep = 3.03 Aceptar Ho
Tipo de neumtico
Automvil
A B C
1 10.6 10.2 9.4
2 9.8 9.4 8.7
3 12.3 11.8 12.6
Presentan estos datos suficiente evidencia para afirmar que existe diferencia en el
desgaste promedio de los tres tipos de neumticos?
Categora Ocupacional
Satisfaccin
Tcnico Mdico Administr. Servicio
S 30 50 22 18
No 10 10 2 18
Se realiz una prueba poco significativa, se puede afirmar que todos los grupos
estn igualmente satisfechos? * ep = 17,78 rechazar Ho
10.- Se clasific una muestra aleatoria de hombres casados, todos jubilados, de acuerdo
con su nivel de educacin y el nmero de hijos.
Nmero de hijos
Educacin
0-1 2-4 Ms de 4
Primaria 43 41 36
Secundaria 107 152 81
Universidad 30 47 63
Se puede afirmar que es alta la asociacin entre el tamao de una familia y el nivel
de educacin alcanzado por el padre?
* ep = 24,21 Aceptar H1 No 0,20
11.- Tres proveedores diferentes proporcionan piezas en lotes de 500. Para comparar la
calidad de los lotes se toman muestras aleatorias de seis lotes de cada proveedor y se
examinan para determinar el nmero de piezas no conformes. Los resultados fueron:
Proveedor:
A : 28 37 34 29 31 33
B : 22 27 29 20 18 30
C : 33 29 39 33 37 38
Podemos afirmar que al menos uno de los proveedores es diferente en cuanto a su
uniformidad? * ep = 0,944 aceptar Ho
Se puede afirmar que quienes tienen sentido del humor, tienen xito en la vida?
Componente : 1 2 3 4
N de problemas : 31 28 45 47
Se puede concluir que las proporciones de problemas son diferentes para al menos
dos de los cuatro componentes del SAD? ep = 7.39 Aceptar Ho
15.- El Colegio de Ingenieros est interesado en comparar los pagos iniciales por hora de
los graduados en ingeniera de sistemas de tres universidades A, B y C. Para
estudiar el caso se eligieron muestras aleatorias de seis graduados de ingeniera de
sistemas de cada universidad. La tabla muestra el salario por hora inicial de cada
ingeniero.
Universidad: Pago por hora (dlares)
A : 21,25 21,25 22,35 22,25 22,00 21,85
B : 22,50 23,05 23,12 23,35 22,55 22,60
C : 21,75 22,00 20,85 21,61 22,10 22,15
8 0 0 1 3 4 0 2 12 5
1 8 0 2 0 1 9 3 4 5
3 3 4 7 4 0 1 2 1 2
Da de la semana
Lunes Martes Mircoles Jueves Viernes
Sin defectos 85 90 95 95 90
Defectuosos 15 10 5 5 10
Con una confianza del 99%, Existe la evidencia suficiente para afirmar que el
nmero de artculos defectuosos nada tiene que ver con el da de la semana en que
se fabrican? * ep = 8,55 P = 0,073
Banca : 12 10 10 12 10
Comercio : 8 8 6 8 10
Seguros : 10 8 6 8 10
21.- Una empresa est intentando decidir cul de entre tres tipos de automviles
consume menos uno americano, uno japons y otro europeo. Para verlo, se toman
muestras de cada tipo y a cada automvil se le hace recorrer 100 kilmetros y se
anota el consumo. Los resultados son los siguientes:
Podemos suponer que los tres tipos de automviles son igualmente homogneos con
respecto a su consumo? Usar un nivel del 1%. ep = 0.96 Aceptar Ho
23.- Una compaa deseaba saber si sus obreros, sus empleados de oficina, sus
empleados de ventas y sus otros empleados se diferenciaban en cuanto a su opinin
acerca de la conveniencia de ser empleado de la compaa. Se tom una muestra
aleatoria de personas de cada uno de los cuatro grupos (poblaciones) y a cada uno se
le solicit que diera su opinin sobre la compaa como lugar de trabajo, en
comparacin con otras compaas que le fueran familiares. Las respuestas se
clasifican en "por encima del promedio" y en "promedio o debajo del promedio". La
siguiente tabla muestra los resultados:
Empleados Otros
Opinin Obreros Vendedores
de Oficina Empleados
Por encima del 68 45 70 60
promedio
Promedio o debajo del 57 30 30 15
promedio
Proporcionan estos datos suficiente evidencia como para indicar una falta de
homogeneidad entre los cuatro grupos respecto de su opinin acerca de la
conveniencia de su empleado de la compaa? * ep = 15,47 P = 0,001
24.- Un investigador realiz un experimento para evaluar los efectos de cuatro drogas
diferentes sobre los tiempos de reaccin, en seres humanos. A cuatro sujetos de cada
uno de los cuatro grupos de edades que form se le asign una de las cuatro drogas.
La siguiente tabla muestra los tiempos de reaccin ante determinado estmulo
despus de haber sido aplicadas las drogas.
Grupo de Droga
Edad A B C D
1 6 7 4 7
2 6 8 9 9
3 9 12 8 6
4 8 9 5 9
5 8 10 7 6
25.- Una empresa va a seleccionar un sistema informtico integrado entre tres modelos
que tiene en estudio. La eleccin final depender de la productividad del sistema. Se
eligen al azar cinco operadores que hagan funcionar cada sistema. Es importante
saber que la experiencia de cada operador en el manejo de ordenadores puede
afectar el resultado de la prueba. Por lo tanto, ser preciso tener en cuenta el efecto
de la experiencia al determinar las ventajas respectivas de cada sistema informtico.
Los niveles de produccin resultantes (unidades por hora), se presentan en la
siguiente tabla. Un cdigo numrico ms alto para la experiencia indica ms aos de
formacin.
28.- El fabricante de una bebida baja en caloras est considerando la importancia del
color del envase rojo, amarillo o azul- en las ventas de la bebida. Para ello elige
diecisis tiendas ms o menos del mismo tamao, y lleva potes rojos a seis de las
tiendas, amarillo a cinco y azules a los cinco restantes. Despus de unos cuantos
das, se anotan las ventas (en decenas de latas) en las diferentes tiendas,
obtenindose los resultados que aparecen a continuacin:
Rojo : 43 52 59 76 61 81
Amarillo : 52 37 38 64 74
Azul : 61 29 38 53 79
Con una confianza del 99%, Se puede afirmar que las ventas medias para los tres
colores de envase son las mismas? Si no es as, Entre qu colores se da la
diferencia? * ep = 0,61 P = 0,556
Muestra de tela
Sustancia
1 2 3 4 5
A 1,3 1,6 0,5 1,2 1,1
B 2,2 2,4 0,4 2,0 1,8
C 1,8 1,7 0,6 1,5 1,3
Existe diferencia en las sustancias qumicas en cuanto al efecto que tienen sobre la
resistencia promedio de la tela? * ep = 9,60 P = 0,008
30.- Un analista de mercado tiene el problema de si las amas de casa que "no se
encuentran en ella" cuando los entrevistadores, difieren en sus opiniones acerca de
un determinado producto. Para comprobar esta posibilidad, los entrevistadores
regresaron a las casas hasta que obtuvieron una entrevista. Los resultados de este
estudio aparecen en la siguiente tabla.
Las amas de casa "muy caseras" tienen las mismas opiniones que las que no lo son?
* ep = 3,04 P = 0,219
31.- Se realiza un estudio para comparar el rendimiento de los automviles, en millas por
galn, para tres marcas de gasolina: A, B y C. En el experimento se usaron cuatro
automviles de la misma marca y modelo, y cada marca de gasolina se prob en
todos los automviles. El uso de todas las marcas de gasolina en el mismo automvil
tiene el efecto de eliminar la variabilidad de automvil a automvil. Los datos, en
millas por galn, son las siguientes:
Marca de Automvil
gasolina 1 2 3 4
A 15,7 17,0 17,3 16,1
B 17,2 18,1 17,9 17,7
C 16,1 17,5 16,8 17,8
Proporcionan los datos suficiente evidencia que indique que hay diferencia entre los
nmeros medios de millas por galn de las tres marcas de gasolina?
* ep = 6,46 P = 0,032
Podra llegarse a la conclusin de que el tipo de falla nada tiene que ver con la
posicin de montaje? * ep = 14.39 aceptar Ho
Fin de
Da Noche
semana
Hombres 90 125 185
Mujeres 210 175 215
34.- Una empresa va a seleccionar un sistema informtico integrado entre tres modelos
que tiene en estudio. La eleccin final depender de la productividad del sistema. Se
eligen al azar 5 operadores que hagan funcionar cada sistema. Se sabe que la
experiencia de cada operador en el manejo de ordenadores puede afectar al resultado
de la prueba. Por lo tanto, ser preciso tener en cuenta el efecto de la experiencia al
determinar las ventajas respectivas de cada sistema informtico. Los niveles de
produccin resultantes, (unidades por hora), se presentan en la siguiente tabla. Un
cdigo numrico ms alto para la experiencia indica ms aos de formacin.
Con un nivel de significancia del 1%, Se puede llegar a la conclusin de que los
niveles medios de produccin de los tres sistemas informticos no difieren?
* ep = 0,09 P = 0,914
35- Los siguientes datos corresponden a los docentes que trabajan en una universidad,
clasificados segn su categora y su satisfaccin en el trabajo.
Categora del Docente
Satisfaccin
en el Trabajo Jefe de Profesor Profesor Profesor
Prctica Auxiliar Asociado Principal
Mucha 40 60 52 63
Regular 78 87 82 88
Poca 57 63 66 64
Podemos afirmar con una confianza del 98% que la categora de un docente influye
en su satisfaccin en el trabajo? * ep = 2,75 P = 0,839
36.- Un socilogo desea determinar si existe una relacin entre la inteligencia de jvenes
que se han sometido a un programa de capacitacin especial en el trabajo y su
desempeo subsiguiente en sus empleos. Una muestra de 400 casos tomados de
archivos muy grandes produjo los siguientes resultados:
Desempeo
Cociente Intelectual
Deficiente Regular Bueno
Debajo del promedio 67 64 25
Promedio 42 76 56
Arriba del promedio 10 23 37
Se puede concluir que existe buena asociacin entre el desempeo en el trabajo y la
inteligencia? * ep = 41,01 P = 0,00
37.- En un estudio, a 80 personas solteras, 120 casadas y 100 viudas o divorciadas se les
pregunt si sienten que los amigos y la vida social, el trabajo o la actividad principal
o la condicin fsica y de salud contribuyen en forma importante a su felicidad
general.
Demostrar si las probabilidades de las tres elecciones son las mismas para personas
solteras, casadas o viudas o divorciadas. * ep = 5,34 P = 0,254
38.- Se clasific una muestra aleatoria de 90 adultos, de acuerdo con su sexo y el nmero
de horas que ven televisin durante una semana.
Sexo
Horas
Masculino Femenino
Ms de 25 15 29
Menos de 25 27 19
Es buena la asociacin entre el sexo de las personas y el nmero de horas que ven
televisin durante la semana? . * ep = 5,47 P = 0,019
39.- Los siguientes datos se refieren a los salarios ($) de 130 trabajadores de una
empresa elegidos en forma aleatoria. Si se sabe que el promedio es 165 y la varianza
25.
Salarios ($) N de trabajadores
< 156 18 Verificar si la distribucin
156-160 20 dada se aproxima a una
160-164 9 distribucin normal.
164-168 45
168-172 28
172 10
* ep = 34,17 rechazar Ho
41.- Se registr el nmero de accidentes, por semana, en cierto cruce de caminos durante
una muestra aleatoria de semanas, con los resultados que se muestran a
continuacin:
N de accidentes : 0 1 2 3 4 5
N de semanas : 52 32 16 9 11 7
Verificar si la variable aleatoria nmero de accidentes tiene una distribucin
conocida, suponiendo que las observaciones son independientes.
Variable Frecuencia
< 2,5 6
2,5-3,8 30
3,8-5,0 41
5,0-6,2 52
6,2 12
Mquinas
A B C D
17,5 16,4 20,3 14,6
16,9 19,2 15,7 16,7
15,8 17,7 17,8 20,8
18,6 15,4 18,9 18,9
Con un nivel de significancia de 0,05, Podemos afirmar que al menos una de las
mquinas presenta diferente variabilidad? * ep = 0.84 aceptar Ho
48.- Se desea probar si el nmero de rayos gamma emitidos por segundo por cierta
sustancia radiactiva es una variable aleatoria que tiene la distribucin de Poisson.
Para ello se cuenta con los datos obtenidos en 300 intervalos de un segundo.
N de rayos gamma 0 1 2 3 4 5 6 7
Frecuencia 19 48 66 74 44 35 10 4
Obtener una conclusin altamente significativa. ep = 5.14 Aceptar Ho
49.- Con el fin de planear cunto dinero en efectivo se debe dejar a la mano en la caja
fuerte de un banco, el gerente est interesado en ver si el depsito promedio de un
cliente est distribuido normalmente. Se sabe que la media es S/1500 y la varianza
360000.
Depsito N de clientes
< 1000 20
1000- 2000 65
2000-3000 86
3000-4000 58
4000-5000 72
5000-6000 43
6000 25
Un empleado recin contratado, con la esperanza de ser ascendido, ha recolectado la
informacin de la tabla anterior y desea probar si la distribucin es normal.
50.- La tabla siguiente est basada en una encuesta acerca de los ingenieros de sistemas,
realizada en una ciudad. Se les dividi en tres grupos en base a su currculum
acadmico y a sus ingresos al cabo de 10 aos de ejercicio.
Currculum Ingreso
Acadmico Alto Mediano Bajo
Alto 18 17 5
Mediano 26 38 16
Bajo 6 15 9
Caja N : 1 2 3 4 5 6 7 8
Frecuencia : 80 100 130 145 120 110 60 55
Presentan estos datos suficiente evidencia de que hay cajas preferidas?
* ep = 74,5 rechazar Ho
52.- Los siguientes datos corresponden a los puntajes obtenidos por los alumnos de una
universidad. Con una probabilidad de 0,90
Puntajes N de estudiantes
< 30 14
30-35 18
35-40 22
40-45 20
45-50 40
50 28
semana
Vendedores
1 2 3 4 5
A 27,6 31,2 28,8 30,6 30,0
B 28,7 29,3 28,4 29,8 31,0
C 26,4 30,3 28,0 28,7 32,3
Seccin : Notas
A : 85 78 90 79 92 88
B : 66 75 72 81
C : 59 50 66 70 62 72 65
D : 61 71 69 80 75
56.- Disponemos de un lote de dispositivos electrnicos, cada uno de los cuales consta de
seis circuitos, observndose el siguiente nmero de defectos en cada dispositivo
electrnico.
N de circuitos defectuosos : 0 1 2 3 4 5 6
N de dispositivos : 49 153 148 50 95 86 98
59.- Se propone que el nmero de defectos en las tarjetas de circuito impreso sigue una
distribucin Poisson. Se rene una muestra aleatoria de 60 tarjetas de circuito
impreso y se observa el nmero de defectos. Los resultados obtenidos son los
siguientes:
N de defectos : 0 1 2 3
Frecuencia : 32 15 19 14
Con una confianza del 95%, Podemos afirmar que la distribucin de los defectos en
las tarjetas de circuito impreso es Poisson?
Plan de trabajo
Obrero
A B C D E
1 10 13 9 14 11
2 5 10 5 10 6
3 6 12 5 10 6
Se puede afirmar que no existe diferencia entre los diferentes planes de trabajo?
Considera que sera perjudicial para la empresa si decides rechazar la hiptesis nula
cuando sta en realidad es verdadera. * ep = 29,89 rechazar Ho
Frecuencia Graduados
Postgrado Secundaria Primaria
de Lectura Universit.
Nunca 7 14 13 16
Algunas veces 13 17 7 7
Matut. o Vesper. 39 41 10 5
Ambas ediciones 22 23 8 12
Tienda N A B C D
Reclamos 63 78 54 49
Sobre la base de estos resultados, Es sostenible la hiptesis de que el nmero de
reclamos, que recibe cada tienda, es aproximadamente el mismo, al nivel del 10%?
* ep = 7,97 rechazar Ho
63.- A una muestra aleatoria de seis profesores auxiliares, cuatro profesores asociados y
cinco profesores principales se les propuso que hicieran una estimacin del tiempo
que haban dedicado la ltima semana a preparar sus clases. Los resultados, en
horas, fueron los siguientes:
Categora Tiempo
Auxiliar 7 12 11 15 9 14
Asociado 15 12 15 8
Principal 11 7 6 9 7
El decano cree que no existe diferencia significativa entre la variabilidad del tiempo
empleado por los profesores para preparar sus clases, Cree usted que est en lo
correcto? * ep = 0,92 aceptar Ho
a) Presentan los datos suficiente evidencia que indique que hay diferencia entre
las reacciones a los estmulos? Utilice un nivel de significancia del 5%.
* ep = 34,25 rechazar Ho
b) Se puede afirmar que existe diferencia entre las reacciones de los
individuos? * ep = 14,5 rechazar Ho
66.- Un partido poltico desea conocer si existe relacin entre el grado de aceptacin de su
programa electoral y el sueldo de los electores ((en soles). Para ello selecciona al azar
a 50 personas y obtiene los siguientes resultados.
Aceptara el partido poltico que el sueldo medio de los electores explica el grado de
aceptacin del programa electoral a un nivel de confianza del 95%.
Resultados A B
Defectuosos 40 60
No defectuosos 300 500
Componentes Componentes
Distribuidor
defectuosos correctos
1 16 94
2 24 76
3 9 81
69.- Se crearon modelos para fomentar la utilizacin, por parte de la gerencia, de los
informes generados por computadora. Se ensay en la empresa un modelo flexible,
en el que ya sea el receptor o el productor pueden procurar fomentar el uso. 41
receptores y 41 productores aceptaron la responsabilidad de fomentar el uso de
informes generados por computadora. En la siguiente tabla se indica el nmero de
veces que cada grupo satisfizo las condiciones especificadas en el modelo.
70.- Se les pidi a cuatro analistas financieros que predijeran el crecimiento de las
ganancias para el prximo ao de tres compaas petrolferas. Sus predicciones se
dan en la siguiente tabla en forma de incremento porcentual.
Compaa Analista
Petrolfera Prez Ruiz Garca Alva
A 8 12 7 13
B 9 9 8 12
C 12 10 9 10
Con una confianza del 99%, Podemos afirmar que las predicciones medias dadas
por los cuatro analistas son las mismas para las tres compaas?
* ep = 2,22 0,186
71.- Tres proveedores diferentes proporcionan piezas en lotes de 500. Para comparar la
calidad de los lotes se toman muestras aleatorias de seis lotes de cada proveedor y se
examinan para determinar el nmero de piezas no conformes. Los resultados se
muestran a continuacin:
Proveedor:
A : 28 37 34 29 31 33
B : 22 27 29 20 18 30
C : 33 29 39 33 37 38
Podemos afirmar que el nmero medio de piezas no conformes por lote no es la
misma para los tres proveedores? * ep = 10,45 p = 0,001
73.- Actualmente se estudian diferentes algoritmos para estimar los costos de desarrollo
de software. Para ello se aplican cuatro algoritmos a cinco proyectos de desarrollo de
software y se observa el porcentaje de error al estimar los costos de desarrollo. Los
datos son los siguientes:
Proyecto
Algoritmo
1 2 3 4 5
1 (SLIM) 1244 21 82 839 527
2 (COCOMO-A) 281 129 396 910 473
3 (COCOMO-R) 220 84 458 794 488
4 (FUNCTION POINTS) 19 11 -34 103 87
Podemos afirmar que las diferencias que existen entre los algoritmos en cuanto a la
exactitud de la estimacin del costo promedio, puede atribuirse al azar?
* ep = 3,25 P = 0,060
75.- Una firma fabricante de aparatos electrnicos trabaja las 24 horas del da, cinco das
a la semana. Estn establecidos tres turnos de ocho horas cada uno y los
trabajadores cambian de turno cada semana. Un equipo de directivos efectu un
estudio para determinar si hay diferencia entre las medias del nmero de monitores
de video de 14 pulgadas producidos cuando los empleados trabajan en los diferentes
turnos. Una muestra aleatoria de cinco trabajadores registr el nmero de monitores
que producen en cada turno, como sigue:
Empleados Turno
Maana Tarde Noche
Castro 10 4 14
Gonzlez 12 5 12
Mendoza 7 3 9
Ramrez 9 8 7
lvarez 7 5 6
Podemos concluir que hay diferencia en la media de produccin por cada turno y
por cada trabajador? * ep = 1,55 y 5,75 P = 0,276 y 0,028
76.- Se realiz una encuesta entre los votantes de cuatro distritos de la ciudad de Lima
para comparar las proporciones de votantes a favor del candidato A para la alcalda
de Lima. Se tom una muestra de 300 votantes en cada uno de los cuatro distritos,
obtenindose los resultados que se muestran en la siguiente tabla:
Distritos
Votantes
Lince Brea Cercado Comas
A favor de A 126 103 109 98
En contra de A 174 197 191 202
Presentan los datos suficiente evidencia que indique que las proporciones de
votantes que estn a favor del candidato A en los cuatro distritos, son diferentes?
* ep = 6,49 P = 0,090
77.- Los nmeros que siguen son las prdidas de peso de ciertas partes de una mquina
debidas a la friccin, en miligramos, donde se utilizaron con tres lubricantes
diferentes.
Lubric. Prdidas de peso (miligramos)
X : 12 11 7 13 9 11 12 9
Y : 8 10 7 5 6 10 7 8 11 7
Z : 9 3 7 8 4 6 6 5
Podemos afirmar que las diferencias entre las tres medias de las muestras se
pueden atribuir al azar? * ep = 10,58 P = 0,001
80.- Una compaa de seguros desea investigar si hay diferencia entre el porcentaje de
accidentes que tienen las personas: menores de 25 aos, entre 25 y 50 aos; as
como aquellos de ms de 50 aos.
Menores de Mayores de
25 - 50
25 aos 50
Tiene accidente 50 90 20
No tiene accidente 90 300 30
81.- Cada da, de lunes a sbado, un repostero hornea tres pasteles grandes de chocolate
y los que no se venden el mismo da se regalan a un centro de beneficencia.
N de pasteles vendidos 0 1 2 3
N de das 1 16 55 228
Probar si se pueden considerar valores de una variable aleatoria binomial.
* ep = 13,6 rechazar Ho
Proyectos de construccin
Ingeniero
1 2 3 4
A 35,10 34,50 29,25 31,60
B 37,45 34,60 33,10 34,40
C 36,30 35,10 32,45 32,90
a) Proporcionan los datos suficiente evidencia que indique que hay diferencia
entre los costos medios de construccin para los 3 ingenieros?
* ep = 7,20 P = 0,025
b) Apoyan los datos la afirmacin de que la estimacin media del costo por pie
cuadrado vara de proyecto a proyecto? * ep = 16,61 P = 0,003
83.- Los siguientes datos corresponden a una muestra tomada al azar de 100 personas,
obtenindose los resultados que se indican:
Hombres Mujeres
Fumadores 30 10
No fumadores 20 40
84.- Seis monedas fueron lanzadas muchas veces. Las frecuencias de los nmeros de
caras se dan a continuacin:
Nmero de caras 0 1 2 3 4 5 6
Frecuencias 48 120 285 324 312 145 58
Con una confianza del 99%, verifica si los datos se ajustan a un modelo binomial.
* ep = 123,24 rechazar Ho
85.- Una agencia de empleos desea saber cul es ms efectivo de tres tipos de anuncios
en la seccin de avisos clasificados de un peridico local. Durante varias semanas se
alternaron de manera aleatoria los tres tipos de anuncios (con encabezado grande,
normal, o con letra especial), registrndose semanalmente el nmero de personas
que respondan a los anuncios.
N de personas que respondieron
Encabezado grande : 23 42 36 48 33 26
Normal : 19 31 18 24 26
Con letra especial : 28 33 46 29 34 34
Podemos afirmar que no hay diferencia en la efectividad de los anuncios, tomando
como base el nmero medio de respuestas? * ep = 3,73 aceptar Ho
86.- Se obtuvo una muestra de 270 diskettes de cierta marca que pueden poseer errores
clasificados en distintos tipos.
Tipo de error : 0 1 2 3 4
Frecuencia : 46 96 85 35 8
Se quiere averiguar si la variable aleatoria tipo de error, sigue una distribucin
Binomial. Con un 5% de riesgo de equivocarnos.
87.- Las investigaciones han revelado que existe una resistencia bsica por parte de los
gerentes a utilizar informacin producida por computadora. En una empresa, ms de
40% de todos los informes generados por computadora y proporcionados al personal
gerencial no se utilizaron en absoluto. En la tabla se presenta un desglose del
nmero real de informes recibidos y no utilizados por cada uno de los tres grupos de
empleados.
Copias
Grupo que recibe Del informante No usadas
usadas
Directores y gerentes generales 38 29
Gerentes medios 22 20
Oficinistas 138 42
Hay pruebas suficientes para llegar a la conclusin de que los porcentajes de
informes generados por computadora y no utilizados difieren entre los tres grupos
que reciben los informes? * ep = 14,94 P = 0,001
88.- La siguiente tabla presenta las estimaciones de un ndice del costo de vida en cuatro
zonas de una gran ciudad, realizadas por cinco investigadores.
Zonas
Investigador
1 2 3 4
A 106 110 107 109
B 107 111 110 112
C 105 109 108 108
D 104 108 104 114
E 109 105 109 111
89.- El fabricante de una bebida baja en caloras est considerando la importancia del
color del envase rojo, amarillo o azul- en las ventas de la bebida. Para ello elige 16
tiendas ms o menos del mismo tamao, y lleva envases rojos a seis de las tiendas,
amarillos a cinco y azules a las cinco restantes. Despus de unos cuantos das, se
anotan las ventas (en decenas de latas) en las diferentes tiendas, obtenindose los
siguientes resultados:
Color del envase:
Rojo : 43 52 59 76 61 81
Amarillo : 52 37 38 64 74
Azul : 61 29 38 53
Podemos afirmar que las diferencias que se encuentren entre el grado de dispersin
de los tres envases no son significativas y se deben slo al azar?
* ep = 1,54 P = 0,254
90.- Supngase que deseamos decidir, sobre la base de los datos que se muestran en la
siguiente tabla, si el nmero de errores que comete un tipgrafo al elaborar una
galera de texto es una variable aleatoria que tiene una distribucin de Poisson.
N de errores 0 1 2 3 4 5 6 7 8 9
Frecuencias 18 53 103 107 82 46 18 10 2 1
Realizar dicha prueba, con un nivel del 10%. * ep = 6 Aceptar Ho
91.- Un investigador opina que las calificaciones que consiguen los estudiantes
universitarios dependen del tiempo que dediquen a escuchar msica. Con el objeto
de probar su teora, ha aplicado aleatoriamente un cuestionario a 400 alumnos. El
cuestionario contiene dos preguntas: "cuntas horas por semana escucha usted
msica?" y "cul es su calificacin promedio en todos los cursos?". Los datos de la
encuesta se incluyen en la tabla siguiente.
Puntajes
Mquina mecnica : 70 58 62 56 65 49
Mquina elctrica : 62 78 48 63 55 51
Computadora : 52 60 47 48 52 40
Hay evidencia suficiente para concluir que existe una diferencia entre las medias
poblacionales de los tres tipos de mquinas? Recomendaras en especial una de las
tres mquinas? * ep = 2.75 aceptar Ho
Personas
Procesador
1 2 3 4
A 49.1 48.2 52.3 57.0
B 47.5 40.9 44.6 49.5
C 76.2 46.8 50.1 55.3
D 50.7 43.4 47.0 52.6
E 55.8 48.3 82.6 57.8
Con una confianza del 99%, Podemos afirmar que las diferencias que existen entre
los cinco procesadores de palabras no se deben al azar?
* ep = 1.98 P = 0.163
94.- Una muestra al azar de sujetos lee 1, 3 y 5 veces una lista de palabras que deben
memorizar. Tras cada lectura se les pasa una tarea de recuerdo. Sus aciertos fueron:
N de partculas Frecuencia
5- 9 1
10-18 10
19-24 37
25-30 36
31-36 13
37-43 2
44-50 1
Probar si los datos pueden considerarse como una muestra tomada al azar de una
poblacin normal. * ep = 2,97 aceptar Ho
96.- Junto con el gran crecimiento de las aplicaciones del computador han aparecido
numerosos casos de abuso del mismo, de fraudes financieros, de robos de
informacin, etc. Los datos de la tabla siguiente dan cuatro tipos distintos de abusos
del computador que fueron observados durante los aos 2003 a 2005. Es de
esperarse que el nmero de abusos del computador aumente a medida que pasen los
aos, a menos que se tomen precauciones para evitarlo.
Tipo de abuso
Aos Fraude Robo de Uso no autoriz.
Vandalismo
Financiero Informacin de Informacin
2003 10 18 14 17
2004 20 16 16 20
2005 25 22 20 24
Han cambiado con el tiempo las proporciones de los cuatro tipos de abusos?
* ep = 3,07 P = 0,800
98.- En un estudio acerca del nmero de clientes esperando turno para ser atendidos en
la caja de una tienda de autoservicios, se eligieron al azar intervalos no superpuestos
de 5 minutos cada uno. Los resultados se muestran a continuacin:
N de clientes : 0 1 2 3 4 ms
N de intervalos : 8 20 25 18 9
Realizar la prueba de bondad de ajuste ms apropiada, para un nivel del 1%
* ep = 2,77 aceptar Ho
Para verificar si estos datos siguen siendo ciertos hoy en da, un grupo de
estudiantes de estadstica hace la misma pregunta a 100 personas elegidas al azar, y
obtiene los siguientes resultados:
100.- Se cree que el nmero de erratas por pgina de un determinado libro sigue una
distribucin de Poisson. Elegida una muestra aleatoria simple de pginas del
mencionado libro se obtuvo la siguiente distribucin de frecuencias absolutas sobre
dicho nmero de erratas por pgina.
N de erratas : 0 1 2 3 4 5
N de pginas : 35 72 68 48 17 6
Obtener una decisin altamente significativa. * ep = 2,22 aceptar Ho
Conocimiento
Facultad
Bajo Medio Alto
Ingeniera 18 10 2
Filosofa 6 14 15
Derecho 11 20 9
102.- En una empresa se escogi a un grupo de empleados al azar; para que en uno de
cuatro grupos de entrenamiento, aprendieran a ejecutar una tarea en una lnea de
ensamble. Los grupos eran diferentes respecto de la cantidad de instruccin que
haban recibido. Al terminar el periodo de entrenamiento, cada uno de los empleados
realiz la tarea. Se hizo un registro del tiempo (en minutos) que necesitaron para la
realizacin completa de la tarea y se obtuvieron los siguientes resultados:
A : 51 42 44 65 49
B : 60 65 82 56 40 12
C : 80 75 98 23
D : 53 50 45 50 45
El Jefe de Personal quiere saber si existe diferencia significativa entre el tiempo
promedio necesitado por cada uno de los empleados, entonces le encarga dicho
trabajo al ingeniero Jefe de Turno, quien resuelve la situacin realizando un DCA y
llegando a la conclusin que no existe diferencia significativa entre dichos promedios.
Sin embargo, el Jefe de Personal duda de esta respuesta y conocedor que usted tiene
buenos conocimientos de inferencia estadstica, le pide su ayuda. Sin volver a
realizar el DCA, qu duda tendra y en qu se basara para decirle si la respuesta es
correcta o incorrecta? Aclrele la situacin, no defraude a quien confa en usted.
* ep = 0,3788 Rpta. Incorrecta
N de descomposturas : 0 1 2 3 4 5 6 7 8 9
N de horas : 4 8 12 18 10 8 5 4 2 1
Con un nivel de significancia del 2.5%, podemos ajustar los datos a una
distribucin conocida?
Meses
Mtodo
1 2 3 4
A 6 8 8 8
B 10 12 9 14
C 9 11 13 15
Comprobar con un nivel de confianza del 95% si los tres mtodos de envasado son
igualmente buenos o existen diferencias significativas entre ellos.
ep = 10.33 Rechazar Ho
105.- Antes de presentar una licitacin para un trabajo de construccin, los ingenieros de
costos preparan un anlisis detallado de los costos estimados de mano de obra y
materiales que se necesitarn para completar el trabajo. Tal estimacin depender
del ingeniero que realice el anlisis. Una estimacin demasiado grande reducir la
probabilidad de que el predio de licitacin de la compaa sea aceptado, mientras
que una estimacin demasiado baja reducir las utilidades o incluso har que la
compaa pierda dinero en el trabajo. Una compaa que cuenta con tres ingenieros
de costos quiso comparar el nivel medio de las estimaciones de los ingenieros. Esto
se hizo pidiendo a cada ingeniero estimar el costo de los mismos cuatro trabajos. Los
datos (en cientos de miles de dlares) se muestran en la siguiente tabla:
Trabajo
Ingeniero
I II III IV
Gonzlez 4.6 6.2 5.0 6.6
Martnez 4.9 6.3 5.4 6.8
Rodrguez 4.4 5.9 5.4 6.3
Turno
Artculos
Da Tarde Noche
Defectuosos 45 55 70
No Defectuosos 905 890 870
Calificaciones
Popularidad
A B C D E
Sobresaliente 13 17 15 13 13
Competente 20 38 60 16 10
Necesita Mejorar 20 30 45 12 10
108.- Se realiza una investigacin para determinar si hay alguna asociacin entre el peso
de un estudiante y un xito precoz en la escuela, a juicio de un psiclogo escolar. Se
selecciona una muestra aleatoria consistente en 500 estudiantes. Se clasifica a cada
estudiante de acuerdo con dos criterios, el peso y el xito en la escuela. La tabla de
contingencia generada es la siguiente:
Se puede concluir que hay una alta asociacin entre ambas variables?
Grupos
Primaria Secundar. Tecnolog. Universit. Especializ.
N de temerosos 74 56 50 54 42
Probar, al nivel del 5%, la afirmacin de que cada grupo de edad teme igualmente a
los exmenes. * ep = 10,09 rechazar Ho
110.- Se seleccionaron al azar tres grupos de nios de quinto grado y se les asign a tres
programas distintos de ejercicios fsicos, con la finalidad de determinar si los
programas eran eficaces en aumentar la habilidad de los nios para lanzar un
objeto. De los 28 nios que participaron en el experimento, 10 formaron un grupo de
control (sin ningn ejercicio) y los restantes formaron dos grupos de 9,
correspondientes a dos regmenes de ejercicios distintos que duraron cuatro
semanas. Antes y despus de las cuatro semanas de ejercicios se midi la velocidad a
la que cada nio poda lanzar una bola de prueba, y se registr el aumento (o
disminucin) y de la velocidad (en pies/seg.). A continuacin se muestra el aumento
medio para cada grupo y una tabla de Anova parcialmente llena.
Control Rgimen A Rgimen B
-1,34 0,32 3,69
Tabla de Anova
Fuente de variacin G.L. SC CM F
Grupos - 64,31 -
Error - - - -
Total - 402,33
111.- El control de calidad de una determinada pieza se realiza a travs de tres pruebas,
considerndose que los resultados proporcionados por las tres pruebas son
igualmente significativos. Para contrastar dicha hiptesis, con un nivel del 1%, se
seleccionan tres muestras, las cuales dan los siguientes resultados:
Prueba 1 23 70 50 58 64 73
Prueba 2 36 50 43 32 71 55 61 29 42 60
Prueba 3 56 58 40 31 63
A la vista de estas observaciones, puede afirmarse que las tres pruebas aportan
resultados similares? * ep = 0.60 Aceptar Ho
Interesa averiguar si los empleados que han recibido cursos estn igualmente
motivados que los que no lo han recibido. * ep = 81.706 Rechazar Ho
Tipo de alimento
Conservante
A B C D E
1 1.3 1.6 0.5 1.2 1.1
2 2.2 2.4 0.4 2.0 1.8
3 1.8 1.7 0.6 1.5 1.3
4 3.9 4.4 2.0 4.1 3.4
Existen suficientes evidencias como para afirmar que hay diferencia significativa
entre los conservantes? Por qu? ep = 75.13 Rechazar Ho
115.- Una acreditada zapatera es abastecida por cuatro fabricantes. Cada zapato es
inspeccionado antes de ponerlo a la venta. Hay tres defectos diferentes que
causaran la devolucin al fabricante. Al observar una muestra se encontraron los
siguientes defectos:
Defecto
Fabricante
I II II
A 17 10 13
B 10 10 10
C 18 15 17
D 15 5 10
116.- Se pregunta a los estudiantes de tres carreras si para una tarde del sbado prefieren
a) ir al cine, b) salir con amigos o c) leer un libro. Los resultados se dan en la
siguiente tabla.
Actividad
Carrera
Ir al cine Salir con amigos Leer un libro
A 26 55 19
B 24 118 58
C 10 112 68
Queremos saber si hay diferencias en los gustos de los estudiantes de las tres
carreras con un nivel de significacin de 0.01.
118.- Una cadena de grandes almacenes tiene cinco divisiones, una en cada piso. De una
muestra aleatoria de clientes se obtuvo la siguiente clasificacin:
Se puede concluir que el tipo de pago est altamente asociado con la divisin de
compra? Por qu?
Si tuvieras que adoptar uno de estos planes, sabiendo que cometer un error tipo I
sera muy grave, qu plan adoptaras? Por qu? ep = 7.80 Rechazar Ho
120.- Una fbrica de automviles quiere averiguar si el gnero de sus posibles clientes
tiene algo que ver con la preferencia de modelo. Se toma una muestra aleatoria de
posibles clientes y se obtiene los siguientes resultados:
Modelo
Gnero
A B C
Femenino 340 400 260
Masculino 350 270 380
Maana : 6 11 10 8 11 8
Tarde : 14 10 12 10 14 12
Noche : 10 12 7 15 11 11
Adems se conocen los siguientes datos:
Grupo Socioeconmico
Defecto del lenguaje
Alto Medio alto Medio bajo Bajo
Presente 8 24 32 27
Ausente 42 121 138 108
Son compatibles estos datos con la hiptesis de que el defecto en el lenguaje est
altamente relacionado con el grupo socioeconmico? Por qu?
Estudiar el tipo de asociacin que existe entre las calificaciones y los libros
utilizados. ep = 24.98 P = 0.00