Вы находитесь на странице: 1из 17

TALLER I

PRUEBA DE HIPOTESIS Y EXPERIMENTOS CON UN SOLO FACTOR

ANGIE SERRANO
SEBASTIAN MEYER
ANDREA BENAVIDEZ

RICK KEEVING ACOSTA

UNIVERSIDAD DEL MAGDALENA


FACULTAD DE INGENIERIA
ESTADISTICA III
GRUPO 5
SANTA MARTA - MAGDALENA
2018 I
1. Explique en qué consiste y cuando se debe aplicar el diseño completamente al azar con
un solo criterio de clasificación.

R// Está centrado en comparar los tratamientos en cuanto a sus medias poblacionales y se
utiliza cuando el objetivo es comparar más de dos tratamientos

2. Supongamos que se desea aprobar la igualdad entre sí de cinco medias. Una alternativa
para hacer esto sería comparar de dos en dos las medias, utilizando la prueba T student y
al final tomar una decisión. Explique porque esto aumenta el error tipo I.

R// En este caso con cinco medias tenemos diez posibles pares de medias, y si la
probabilidad de aceptar la H0 para cada prueba individual es de 1-α = 0.95, entonces la
probabilidad de aceptar las diez H0 es de 0.95^10 = 0.5987, lo cual representa un aumento
considerable del error tipo I. Aunque se utilice un nivel de confianza tal que (1-α )^10= 0.95,
el procedimiento resulta inapropiado porque se pueden producir sesgos por parte del
experimentador.

3. ¿Qué mide el cuadrado medio del error en el ANOVA de un experimento?

R// Es la suma de cuadrados divididos entre sus respectivos grados de libertad

4. ¿Qué son los grados de libertad para una suma de cuadrados en un análisis de varianza?

R// Representa el número de piezas de información independientes en la suma de


cuadrados. En general, es el número de observaciones menos el número de parámetros
estimados de los datos.
1.

a) ¿Cuáles son los tratamientos que se comparan en este estudio?


La temperatura más confortante entre ambos sexos
b) ¿Las muestras son dependientes o independientes? Explique
Las muestras son independientes, no existe relación de otros factores que influyan
en algún dato. Ningún dato depende de alguna relación a otra variable.
c) ¿La temperatura promedio más confortable es igual para hombres que para
mujeres? Pruebe la hipótesis adecuada.
𝐻0 : 𝜇1 = 𝜇2
𝐻0 : 𝜇1 ≠ 𝜇2
Medias muestrales = 77,4 y 74,5
Desviaciones estándar muestrales = 1,0 y 1,0
Tamaños de muestra = 10 y 10

Intervalos de confianza del 95,0% para la diferencia entre medias: 2,9 +/- 0,939563
[1,96044,3,83956]

Hipótesis Nula: diferencia entre medias = 0,0


Alternativa: no igual
Estadístico t calculado = 6,4846
Valor-P = 0,00000424226
Rechazar la hipótesis nula para alfa = 0,05.

Como el promedio para mujeres es de 77,4 y para hombres es de 74,5 entonces se concluye
que la temperatura promedio más confortable no es igual para hombres que para mujeres.
Trabajando con un nivel de confianza del 95% también podemos decir que como el valor-
p<0,05 se debe rechazar la hipótesis nula, por lo tanto, de igual forma los promedios no son
iguales, son diferentes.
2.

a) Describe un procedimiento de aleatorización para la obtención de estos datos.

Para obtener datos para una muestra de manera aleatoria podemos utilizar las
combinaciones, una vez tomados los datos podemos comparar sus varianzas, medias y
proporción de errores de las cuales las podemos comprobar con intervalos e hipótesis.

b) Pruebe la hipótesis de igualdad de los diámetros de los proveedores en cuanto a sus


medias

𝐻𝑜 = 𝜇1 = 𝜇2

𝑖 = 1, 2, 3, 4 … 𝑎
𝐻𝑎 = 𝜇𝑖 ≠ 𝜇𝑗 Para al menos un par de medias ij. Donde {
𝑗 = 1, 2, 3, 4 … 𝑎

Resumen Estadístico para diametros


provedo Recuent Promedi Desviación Coeficiente de Mínimo Máxim Rango
r o o Estándar Variación o
1 14 20,1936 1,58347 7,84146% 18,0 22,6 4,6
2 14 21,8114 0,528552 2,42328% 20,82 22,71 1,89
Total 28 21,0025 1,4214 6,76775% 18,0 22,71 4,71

Tabla ANOVA para diametros por provedor


Fuente Suma de Gl Cuadrado Razón-F Valor-P
Cuadrados Medio
Entre 18,3222 1 18,3222 13,15 0,0012
grupos
Intra 36,2277 26 1,39337
grupos
Total 54,5499 27
(Corr.)

 Como el Valor-p es mucho menor que 0,05 entonces no hay información suficiente
para aceptar la hipótesis nula, por lo tanto, se rechaza, esto significa que si hay una
diferencia significativa entre el promedio de diámetros de un proveedor y otro

c) Pruebe la hipótesis de igualdad de varianzas

2 2
Ho:𝜎1= 𝜎2
2 2
Ha: 𝜎𝑖≠ 𝜎𝑗

Verificación de Varianza
Prueba Valor-P
de 1,6648 0,000353499
Bartlett 3

Comparació Sigma1 Sigma2 F-Ratio P-Valor


n
1/2 1,5834 0,52855 8,9752 0,0003
7 2 1

Puesto que el valor-P es menor que 0,05, existe una diferencia estadísticamente
significativa entre las desviaciones estándar, con un nivel del 95,0% de confianza, esto
quiere decir que se rechaza la hipótesis nula por lo cual cuncluiriamos que las varianzas son
diferentes
3. La prueba actual de un solo disco se tarda 2 minutos. Se propone un nuevo método
de prueba que consiste en medir solamente los radios 24 y 57, donde casi es seguro
que estará el valor mínimo buscado. Si el método nuevo resulta igual de efectivo
que el método actual se podrá reducir en 60% el tiempo de prueba. Se plantea un
experimento donde se mide la densidad mínima de metal en 18 discos usando tanto
el método actual como el método nuevo. Los resultados están ordenados
horizontalmente por disco. Así 1.88 y 1.87 es el resultado para el primer disco con
ambos métodos.

a) Pruebe la igualdad de las medias usando la prueba pareada. ¿Cuál es el criterio


de apareamiento?

Ho: µa = µn
Ha: µa ≠ µn

P-value= 0.81 > α=0.05, No se rechaza la hipótesis nula, es decir existe igualdad de
las medias en cada uno de los métodos.

b) Encuentre un intervalo para la diferencia de medias usando la desviación


estándar de las diferencias. Interprete.

Intervalos de Confianza para metodo nuevo - metodo actual


Intervalos de confianza del 95.0% para la media: -0.00222222 +/- 0.0196381 [-
0.0218603; 0.0174158]
Intervalos de confianza del 95.0% para la desviación estándar: [0.029633;
0.0592015]

El intervalo de confianza de la diferencia de medias se encuentra entre (-0.02 – 0.02),


se dice que los datos provienen de una distribución normal por lo que la media para
ambos métodos se encuentra entre el intervalo con un 95% de confianza.

c) Haga el análisis de los datos ignorando el apareamiento. Compare con los


resultados del inciso a), ¿por qué ignorar el apareamiento es incorrecto?

Ho: µa = µn
Ha: µa ≠ µn
P-value=0.95 > α=0.05, es decir no se rechaza la hipótesis nula, se dice las medias no
presentan diferencia estadísticamente significativa. En este caso se asume que las
desviaciones estándar de los dos métodos son iguales, sin embargo es incorrecto
ignorar el apareamiento debido a que no se tienen en cuenta los datos necesarios
para la prueba.

d) Determine un intervalo de confianza para la diferencia de medias suponiendo


muestras independientes. Compare con el inciso b).
Comparación de Medias
Intervalos de confianza del 95.0% para la media de método nuevo: 1.96056 +/-
0.0571971 [1.90336; 2.01775]
Intervalos de confianza del 95.0% para la media de método actual: 1.96278 +/-
0.0558937 [1.90688; 2.01867]
Intervalos de confianza del 95.0% intervalo de confianza para la diferencia de medias
suponiendo varianzas iguales: -0.00222222 +/- 0.0770322 [-0.0792544; 0.07481]

No se presenta diferencia significativa entre las medias de las dos muestras.

e) ¿Qué se gana con el apareamiento de los datos en este caso?

Se busca delimitar los errores que se presentan en el momento del análisis de dos
muestras, porque el tomar datos en pares permite un análisis estadístico más
detallado.

f) ¿Recomendaría usted la adopción del método nuevo? Argumente su respuesta.

El recomendar el nuevo método es irrelevante puesto que en comparación con el


método actual no hay diferencia en densidad del metal mínima que se requiere para
cada disco, por lo tanto los discos pueden ser sometidos por cualquiera de los dos
métodos y darán resultados iguales.

4.
a) las diferencias son significativas estadísticamente?
Realizamos el análisis de varianza

Indica una diferencia estadísticamente significativa


Como el valor P es mucho menor que 0.05 se puede concluir que hay diferencias
estadísticamente significativas entre la media PRODUCTO DEFECTUOSOS para los niveles
de la prueba con y sin tratamientos con un 95,0% de nivel de confianza.
b) cual es el porcentaje de defectos que se espera con el nuevo tratamiento?

Se espera que el promedio de productos actual que es de 9.272 se disminuya en 3.16 para
que existan un total de 6.216 piezas defectuosas.

c) Cuantifique el nivel de reducción que se logró con el tratamiento propuesto?

La disminución es de 3.16 piezas defectuosas, por cada 25 piezas con tratamientos.


5. Para estudiar la confiabilidad de ciertos tableros electrónicos para carros, se someten a
un envejecimiento acelerado durante 100 horas a determinada temperatura, y como
variable de interés se mide la intensidad de corriente que circula entre dos puntos, cuyos
valores aumentan con el deterioro. Se probaron 20 módulos repartidos de manera
equitativamente en cinco temperaturas y los resultados obtenidos fueron los siguientes:

a) Formule la hipótesis y el modelo estadístico para el problema.

Hipótesis:
𝐻𝑜 = 𝜇1 = 𝜇2 = 𝜇3 = 𝜇4

𝑖 = 1, 2, 3, 4 … 𝑎
𝐻𝑎 = 𝜇𝑖 ≠ 𝜇𝑗 Para al menos un par de medias ij. Donde {
𝑗 = 1, 2, 3, 4 … 𝑎

Modelo estadístico:
𝑖 = 1, 2, 3, 4 … 𝑎
yij = μ + εij 𝐷𝑜𝑛𝑑𝑒 {
𝑗 = 1, 2, 3, 4 … 𝑎

 yij Es la observación ij-ésima.


 μ Es la media del nivel del factor o tratamiento i-ésimo.
 εij Es un componente del error aleatorio que incorpora todas las demás fuentes de
variabilidad del experimento

b) Realice el análisis de varianza para estos datos, a fin de estudiar si la temperatura


afecta la intensidad de corriente promedio.

Tabla ANOVA para Intensidad de corriente por Temperatura


Fuente Suma de Gl Cuadrado Razón-F Valor-P
Cuadrados Medio
Entre 3411,8 4 852,95 68,05 0,0000
grupos
Intra 188,0 15 12,5333
grupos
Total 3599,8 19
(Corr.)

 Debido a que el P- valor es menor a 0,05 existe una diferencia significativa entre la
media de intensidad de corriente entre los niveles de temperatura, por lo tanto, la
temperatura si afecta a la intensidad de corriente promedio.

Método: 95,0 porcentaje LSD


Temperatu Casos Media Grupos
ra Homogéneos
20 4 14,5 X
40 4 16,25 X
60 4 22,25 X
80 4 31,25 X
100 4 50,25 X

Contrast Sig. Diferenci +/-


e a Límites
20 – 40 -1,75 5,33574
20 – 60 * -7,75 5,33574
20 – 80 * -16,75 5,33574
20 - 100 * -35,75 5,33574
40 – 60 * -6,0 5,33574
40 – 80 * -15,0 5,33574
40 - 100 * -34,0 5,33574
60 – 80 * -9,0 5,33574
60 - 100 * -28,0 5,33574
80 - 100 * -19,0 5,33574
* indica una diferencia significativa.
Gráfico Caja y Bigotes

20

40
Temperatura

60

80

100

0 10 20 30 40 50 60
Intensidad de corriente

 Además al realizar el método LSD o pruebas de múltiples rangos para la intensidad


de corriente de las medias y el grafico de caja y bigotes con respecto a los niveles de
temperatura se puede concluir que no existe una diferencia significativa entre el
rango de 20 a 40 grados de temperatura, pero si existe una diferencia significativa
de 40 a 60, de 60 a 80 y de 80 a 100, por lo que se deducir que los niveles de
temperatura a medida que van aumentando deterioran progresivamente a los
tableros electrónicos. Por otra parte a temperatura ambiente (entre 20 y 40 grados)
los tableros electrónicos se deterioran menos.

c) ¿La temperatura afecta la variabilidad de las intensidades? Es decir, verifique si hay igual
varianza entre los diferentes tratamientos.
Verificación de Varianza
Prueba Valor-P
de 1,2056 0,649156
Bartlett 1

Comparació Sigma1 Sigma2 F-Ratio P-Valor


n
20 / 40 2,6457 4,1129 0,41379 0,4876
5 9 3
20 / 60 2,6457 2,5 1,12 0,9280
5
20 / 80 2,6457 2,5 1,12 0,9280
5
20 / 100 2,6457 5,1234 0,26666 0,3064
5 8 7
40 / 60 4,1129 2,5 2,70667 0,4352
9
40 / 80 4,1129 2,5 2,70667 0,4352
9
40 / 100 4,1129 5,1234 0,64444 0,7269
9 8 4
60 / 80 2,5 2,5 1,0 1,0000
60 / 100 2,5 5,1234 0,23809 0,2692
8 5
80 / 100 2,5 5,1234 0,23809 0,2692
8 5

 Puesto que el valor-P es mayor o igual que 0,05, no existe una diferencia
estadísticamente significativa entre las desviaciones estándar, por ende la
temperatura no afecta a la variabilidad de la intensidad de corriente.

6. Se hace un estudio sobre la efectividad de tres marcas de atomizador para matar moscas.
Para ello, cada producto se aplica a un grupo de 100 moscas, y se cuenta el número de
moscas muertas expresado en porcentajes. Se hicieron seis réplicas, pero en días diferentes;
por ello, se sospecha que puede haber algún efecto importante debido a esta fuente de
variación. Los datos obtenidos se muestran a continuación:

a) Suponiendo un DBCA, formule las hipótesis adecuadas y el modelo estadístico.

𝐻𝑜 = 𝜇1 = 𝜇2 = 𝜇3 = 𝜇4 = 𝜇5 = 𝜇6

𝑖 = 1, 2, 3, 4 … 𝑎
𝐻𝑎 = 𝜇𝑖 ≠ 𝜇𝑗 Para al menos un par de medias ij. Donde {
𝑗 = 1, 2, 3, 4 … 𝑎

b) ¿Existe diferencia entre la efectividad promedio de los atomizadores?

Análisis de Varianza para Promedio de moscas muertas - Suma de Cuadrados Tipo III
Fuente Suma de Gl Cuadrado Razón-F Valor-P
Cuadrados Medio
EFECTOS PRINCIPALES
A:Sprays 296,333 2 148,167 2,88 0,1028
B:BLOQUE 281,333 5 56,2667 1,09 0,4207
RESIDUOS 514,333 10 51,4333
TOTAL (CORREGIDO) 1092,0 17
Todas las razones-F se basan en el cuadrado medio del error residual

 Como P-Valor es mayor a 0,05 se concluye que no hay suficiente evidencia


estadística para afirmar que la media de la efectividad de los atomizadores es
diferente, por lo que se infiere que no afecta significativamente el estudio realizado.

c) ¿Hay algún atomizador mejor? Argumente su respuesta.

Pruebas de Múltiple Rangos para Promedio de moscas muertas por Sprays


Método: 95,0 porcentaje LSD
Sprays Casos Media LS Sigma LS Grupos
Homogéneos
2 6 59,1667 2,92784 X
3 6 62,8333 2,92784 XX
1 6 69,0 2,92784 X

Contrast Sig. Diferenci +/-


e a Límites
1-2 * 9,83333 9,22582
1-3 6,16667 9,22582
2-3 -3,66667 9,22582
* indica una diferencia significativa.

 De acuerdo a la prueba LSD se puede concluir que hay diferencias significativas entre
1 y 2 lo que nos dice al mismo tiempo que las demás combinaciones son similares
entre sí; también que el atomizador 3 es neutral en cuanto a los otros dos, siendo
este mejor que el atomizador 2 pero no con respecto al 1. Por tal razón se dice que
el atomizador 1 es el mejor con una media LSD de 69,0. Y se puede comprobar a
través del siguiente gráfico.
Medias y 95,0% de Fisher LSD

74
Promedio de moscas muertas

70

66

62

58

54
1 2 3
Sprays

d) ¿Hay diferencias significativas en los resultados de diferentes días en que se realizó el


experimento? Argumente su respuesta.

Análisis de Varianza para Promedio de moscas muertas - Suma de Cuadrados Tipo III
Fuente Suma de Gl Cuadrado Razón-F Valor-P
Cuadrados Medio
EFECTOS PRINCIPALES
A:Sprays 296,333 2 148,167 2,88 0,1028
B:BLOQUE 281,333 5 56,2667 1,09 0,4207
RESIDUOS 514,333 10 51,4333
TOTAL (CORREGIDO) 1092,0 17

 Como P- value > 0,05 se puede concluir que hay indicios de que no hay diferencias
entre los días en que se hizo el estudio estadístico por lo que la formación de bloques
no afectaba el experimento.

e) Verifique los supuestos de normalidad y de igual varianza entre las marcas.

Pruebas de Normalidad para RESIDUOS


Prueba Estadístic Valor-P
o
Estadístico W de Shapiro- 0,957418 0,547789
Wilk

 Puesto que P- value es mayor que 0,05 los datos provienen de una distribución
normal.

Verificación de Varianza
Prueba Valor-P
de 1,2848 0,77376
Bartlett 6

Comparació Sigma1 Sigma2 F-Ratio P-Valor


n
1/2 3,7230 7,8863 0,22286 0,3645
5 4 8
1/3 3,7230 6,2070 0,35976 0,5292
5 8 9
1/4 3,7230 8,0225 0,21536 0,3544
5 3 5
1/5 3,7230 3,0595 1,48071 0,8062
5 9
1/6 3,7230 8,2982 0,20129 0,3351
5 6 1
2/3 7,8863 6,2070 1,61427 0,7650
4 8
2/4 7,8863 8,0225 0,96633 0,9829
4 3 6
2/5 7,8863 3,0595 6,64391 0,2616
4 9
2/6 7,8863 8,2982 0,90318 0,9491
4 6 6
3/4 6,2070 8,0225 0,59862 0,7489
8 3
3/5 6,2070 3,0595 4,11573 0,3910
8 9
3/6 6,2070 8,2982 0,5595 0,7175
8 6
4/5 8,0225 3,0595 6,87536 0,2540
3 9
4/6 8,0225 8,2982 0,93465 0,9662
3 6
5/6 3,0595 8,2982 0,13594 0,2393
9 6 2

 Como el P- value > 0,05 se cumple el supuesto de igualdad de varianza para el factor
bloque.

Verificación de Varianza
Prueba Valor-P
de 1,0962 0,531069
Bartlett 4

Comparació Sigma1 Sigma2 F-Ratio P-Valor


n
1/2 4,0442 6,5819 0,37753 0,3087
6 3
1/3 4,0442 6,5718 0,37869 0,3102
2 8
2/3 6,5819 6,5718 1,00309 0,9974
6 2

 Dado que el p- valor > 0,05 se cumple el supuesto de igualdad de varianza para el
factor tratamiento.

Вам также может понравиться