You are on page 1of 10

Dirección General de Educación Ingeniería Industrial

Superior Tecnológica Estadística Inferencial II


Instituto Tecnológico de Toluca

Nombre: DAVID MARES CASAS, EMMANUEL HERNADEZ SOBERANES


No. Control: 12280132, 12280290

Tarea 2. Diseño de Experimentos de un Factor

Instrucciones:

 Envía este archivo ya revisado y terminado al correo gtg515i@hotmail.com. Indica


en el asunto la materia y la actividad.
 Resuelve correctamente en R los problemas siguientes, incluye el script, gráficas y
en base a los resultados obtenidos justifica tus respuestas.

Texto: Gutiérrez P. H., De la Vara S. R. 2012. Análisis y Diseño de Experimentos. 3ª


Edición. McGraw Hill

11. Se hace un estudio sobre la efectividad de tres marcas de spray para matar moscas.
Para ello, cada producto se aplica a un grupo de 100 moscas, y se cuenta el número de
moscas muertas expresado en porcentajes. Se hacen seis réplicas y los resultados
obtenidos se muestran a continuación

Réplica
Spray 1 2 3 4 5 6
A 72 65 67 75 62 73
B 55 59 68 70 53 50
C 64 74 61 58 51 69

a) Formule la hipótesis adecuada y el modelo estadístico

Hipótesis a contrastar:
𝐻0 : 𝜇𝐴 = 𝜇𝐵 = 𝜇𝐶 = 𝜇
𝐻1 : 𝜇𝑖 ≠ 𝜇𝑗 𝑝𝑎𝑟𝑎 𝑎𝑙𝑔𝑢𝑛 𝑖 ≠ 𝑗 (𝑖, 𝑗 = 𝐴, 𝐵, 𝐶)
Modelo estadístico:
𝐶𝑀𝑇𝑅𝐴𝑇
𝐹0 =
𝐶𝑀𝐸
b) ¿Existe diferencia entre la efectividad promedio de los productos en spray?

Respuesta:
Para contestar esta pregunta se calcula el estadístico 𝐹0 con los
datos que nos proporciona la tabla ANOVA:
𝐶𝑀𝑇𝑅𝐴𝑇 148.167
𝐹0 = 𝐹0 = = 2.7932
𝐶𝑀𝐸 53.044
Y en base a las hipótesis:
 𝐻0 : 𝜇𝐴 = 𝜇𝐵 = 𝜇𝐶 = 𝜇
 𝐻1 : 𝜇𝑖 ≠ 𝜇𝑗 𝑝𝑎𝑟𝑎 𝑎𝑙𝑔𝑢𝑛 𝑖 ≠ 𝑗 (𝑖, 𝑗 = 𝐴, 𝐵, 𝐶)

Para confirmar que se rechaza la hipótesis nula se debe cumplir la


siguiente inecuación:
𝐹0 > 𝐹𝛼,𝑘−1,𝑁−𝑘 .
Por el cual para probar esto se asigna que 𝛼 = 0.05 con 𝐹2,15 el cual
al hacer uso de R o uso de tablas F inferimos que 𝐹𝛼,𝑘−1,𝑁−𝑘 .= 3.68
quedando así la inecuación. 2.79>3.68; dado que no se cumple
podemos decir que no se rechaza la 𝐻0 dado que la efectividad
promedio de los tres productos de sprays son estadísticamente
iguales y no diferentes con α=0.05, se hace la aclaración ya que
como en este estudio prefijamos un α=0.05, también pudimos haber
prefijado un α=0.1 y en este caso sería todo lo contrario ya que aquí
se rechazaría la hipótesis nula.

c) ¿Hay algún spray mejor?


Respuesta:
Para responder esta pregunta solo basta con mirar la gráfica de cajas o con la
prueba de hipótesis, pero antes de eso tenemos que tener bajo qué
condiciones podríamos decidir cuál spray elegir, en este caso como podemos
ver en la gráfica cajas cada spray está dado por las moscas muertas o
eficiencia de cada spray; entonces podríamos elegir a conveniencia el SPRAY
A ya que este puede alcanzar a matar un promedio mayor de moscas y con
menor variabilidad; sin embargo esto es solo por conveniencia ya que todos los
intervalos de los sprays con α=0.05 son estadísticamente iguales deduciendo
que no hay un spray mejor .
Aun que dado que el grafico de cajas muestra que las media del spray A es muy
alejado, o diferente de los otros dos, el investigador tiene la decisión de concluir que
en promedio son iguales o en verdad el spray A es diferente de los otros dos, para
estar más seguro, proseguiremos a usar el METODO LSD para saber si hay un spray
mejor.
Estadísticamente se prosigue a formular aquellas igualdades de las medias de los
spray para ello las hipótesis serian:

1. 𝐻0 : 𝜇𝐴 = 𝜇𝐵 El estadístico está dado por:


2. 𝐻1 : 𝜇𝐴 ≠ 𝜇𝐵
2𝐶𝑀𝐸
3. 𝐻0 : 𝜇𝐴 = 𝜇𝐶 𝐿𝑆𝐷 = 𝑡𝛼⁄2,𝑁−𝑘 √ 𝑛
4. 𝐻1 : 𝜇𝐴 ≠ 𝜇𝐶
5. 𝐻0 : 𝜇𝐵 = 𝜇𝐶 Y se rechaza hipótesis nula si:
6. 𝐻1 : 𝜇𝐵 ≠ 𝜇𝐶 2𝐶𝑀𝐸
|𝑦̅𝑖 − 𝑦̅𝑗 | > 𝑡𝛼⁄2,𝑁−𝑘 √ 𝑛

Obteniendo:
2(53.044)
𝐿𝑆𝐷 = 2.131√ = 8.9606
6
1. Para la diferencia entre el SPRAY A y el SPRAY B

|𝑦̅𝑖 − 𝑦̅𝑗 | = 69-59.16667 =9.8333 9.8333 > 8.96 Dado esto son diferentes.
2. Para la diferencia entre el SPRAY A y el SPRAY C
|𝑦̅𝑖 − 𝑦̅𝑗 | = 69 − 62.8333 = 6.1667 6.1667>8.96 Dado esto son iguales
3. Para la diferencia entre el SPRAY B y el SPRAY C
|𝑦̅𝑖 − 𝑦̅𝑗 | = 59.16667-62.8333 =3.66663 3.6663>8.96 Dado esto son iguales

De tal manera podría ser elegido el SPRAY A como el mejor de entre los tres dado
que este en promedio es igual al SPRAY C pero la única diferencia de entre estos dos
es que el SPRAY A tiene menos variabilidad. Cabe mencionar que EL METODO LSD
es uno de los más precisos y confiables todo depende de que tan fino sea el cálculo,
ya que entre más potencia tenga el método, puede detectar diferencias más
pequeñas, siempre y cuando estas reales.

d) Dé un intervalo al 95% de confianza para la efectividad promedio (porcentaje) de


cada una de las marcas.
Respuesta:
Para un intervalo de confianza de 100(1-α) por ciento para la media 𝜇𝑖 del tratamiento
i-esimo se calcula con la fórmula:

𝑀𝑆𝐸 𝑀𝑆𝐸
𝑦̅𝑖 − 𝑡𝛼⁄2,𝑁−𝑘 √ ≤ 𝜇𝑖 ≤ 𝑦̅𝑖 + 𝑡𝛼⁄2,𝑁−𝑘 √
𝑛 𝑛
quedando así los intervalos:
 PARA EL SPRAY A:
53.044 53.044
69 − 2.131√ ≤ 𝜇𝐴 ≤ 69 + 2.131√
6 6
62.663 ≤ 𝜇𝐴 ≤ 75.336
 PARA EL SPRAY B:

53.044 53.044
59.16667 − 2.131√ ≤ 𝜇𝐵 ≤ 59.16667 + 2.131√
6 6
52.830 ≤ 𝜇𝐵 ≤ 65.502
 PARA EL SPRAY C:
53.044 53.044
62.8333 − 2.131√ ≤ 𝜇𝐶 ≤ 62.8333 + 2.131√
6 6
56.497 ≤ 𝜇𝐶 ≤ 69.169

e) Dibuje el diagrama de caja simultáneos, e interprételos

Gráfica Interpretación
Bueno en esta grafica de cajas
podemos observar el valor mínimo,
máximo, la mediana, los cuartiles,
pero como notamos en el spray
3(C) existe mayor variabilidad que
los otros dos, mas sin embargo; se
puede observar que las medias del
spray 3 ( C ) y del 2 (B) podrían ser
iguales pero la del spray 1(A) no,
pero para mayores conclusiones y
mejor observación se realizara una
prueba de hipótesis para la
efectividad promedio de los tres
sprays y también usando el
METODO LSD para mayor
seguridad , dado que el spray 1(A)
podría ser el mejor candidato para
usarse ya que tiene poca
variabilidad, mejor promedio de
porcentaje de moscas muertas que
los otros dos.

f) Verifique los supuestos de normalidad y de igual varianza entre las marcas

Respuesta:
NORMALIDAD:
Para comprobar que los datos fueron generados por un proceso normal se deben se
deben generar las hipótesis a constatar, que son las siguientes.
 𝐻0 : 𝐿𝑜𝑠 𝑑𝑎𝑡𝑜𝑠 𝑝𝑟𝑜𝑐𝑒𝑑𝑒𝑛 𝑑𝑒 𝑢𝑛𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖𝑜𝑛 𝑛𝑜𝑟𝑚𝑎𝑙(𝐹(𝑥)𝑒𝑠 𝑛𝑜𝑟𝑚𝑎𝑙)
 𝐻1 : 𝐿𝑜𝑠 𝑑𝑎𝑡𝑜𝑠 𝑛𝑜 𝑝𝑟𝑜𝑐𝑒𝑑𝑒𝑛 𝑑𝑒 𝑢𝑛𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖𝑜𝑛 𝑛𝑜𝑟𝑚𝑎𝑙(𝐹(𝑥) 𝑛𝑜 𝑒𝑠 𝑛𝑜𝑟𝑚𝑎𝑙)
Bueno en el software R se usa la función “shapiro.test()” para comprobar si hay
normalidad, del cual se obtuvo un p-valor general de los datos de 0.4149 el cual es
mayor a 0.05 del cual no se rechaza la hipótesis nula e infiriendo que los datos fueron
generados por un proceso normal.

Sin embargo se puede observar la normalidad de los datos de cada marca utilizando
en este caso la función “tapply(moscas,spray,shapiro.test)”del cual nos arroja tres p-
valores de cada marca .
 Para el SPRAY A = 0.6471
 Para el SPRAY B=0.4145
 Para el SPRAY C=0.9975
Del cual en todas las marcas de spray al ser comparadas con el P-valor= 0.05,
notamos que en todas no se rechaza la hipótesis nula, del cual podemos inferir que
en cada marca de spray los datos fueron generados por un proceso normal.

VARIANZA CONSTANTE(VARIANZAS IGUALES)


Para comprobar este supuesto de varianza iguales solo basta en introducir la función
Bartlett.test() el cual te arroja un p-valor en este caso 0.5519 del cual con respecto a
las siguientes hipótesis:
 𝐻0 : 𝜎 21 = 𝜎 2 2 = ⋯ = 𝜎 2 𝑘 = 𝜎
 𝐻1 : 𝜎 2 𝑖 ≠ 𝜎 2𝑗 𝑝𝑎𝑟𝑎 𝑎𝑙𝑔𝑢𝑛 𝑖 ≠ 𝑗
Del cual dado que el p-valor es mayor al .05 podemos inferir que existe varianza
constante. Estos se pueden comprobar en las gráficas que se muestran a
continuación.
Script de R
USO DE R:
moscas=c(72,65,67,75,62,73,55,59,68,70,53,50,64,74,61,58,51,69)
spray=c(1,1,1,1,1,1,2,2,2,2,2,2,3,3,3,3,3,3)
datos=data.frame(moscas,spray)
datos
spray=factor(spray)
spray
is.factor(spray)
ilm=lm(moscas~spray)
ilm
residuos=resid(ilm)
residuos
plot(fitted(ilm),residuos,xlab="fitted",ylab="Residuals",main="fitted vs residuals")
hist(residuos)
qqnorm(residuos)
qqline(residuos)
anova(ilm)
shapiro.test(moscas)
tapply(moscas,spray,shapiro.test)
bartlett.test(moscas~spray,data=datos)

USO DE (Rcmdr)
Datos <- edit(as.data.frame(NULL))

library(abind, pos=4)
library(e1071, pos=4)
numSummary(Datos[,"MOSCAS"], groups=Datos$SPRAY, statistics=c("mean", "sd",
"IQR",
"quantiles"), quantiles=c(0,.25,.5,.75,1))
LinearModel.1 <- lm(MOSCAS ~ SPRAY, data=Datos)
summary(LinearModel.1)
anova(LinearModel.1)
Boxplot(MOSCAS~SPRAY, data=Datos, id.method="y")
plotMeans(Datos$MOSCAS, Datos$SPRAY, error.bars="conf.int", level=0.95,
xlab="SPRAY",
ylab="MOSCAS", main="GRAFICA DE MEDIAS")
#SE COMPRUEBA LA NORMALIDAD CON EL TEST DE shapiro wilks
shapiro.test(Datos$MOSCAS)
#SE COMPRUEBA LA VARIANZA CONSTANTE
tapply(Datos$MOSCAS, Datos$SPRAY, var, na.rm=TRUE)
bartlett.test(MOSCAS ~ SPRAY, data=Datos)

14. En una empresa de manufactura se propone un tratamiento para reducir el porcentaje


de productos defectuosos. Para validar esta propuesta se diseñó un experimento en el
que se producía con o sin la propuesta de mejora. Cada corrida experimental consistió en
producir un lote y la variable de respuesta es el porcentaje de producto defectuoso. Se
hicieron 25 réplicas para cada tratamiento. Los datos obtenidos se muestran a
continuación.

Porcentaje de producto defectuoso


Con 5.3 4.0 4.0 4.0 2.6 2.1 5.1 4.1 4.1 3.2 5.1 2.2 4.1
tratamiento 2.2 1.1 2.0 3.0 3.1 2.1 1.2 3.3 2.1 4.0 2.0 3.0
Sin 8.0 13.2 7.2 8.2 9.1 6.7 12.2 16.3 9.2 6.4 7.2 17.2 12.3
tratamiento 8.7 11.3 4.5 6.6 9.2 10.2 10.6 13.3 5.2 6.2 8.0 4.8

a) ¿Las diferencias son significativas estadísticamente?

Respuesta:
Respuesta:
summary(lm(defectuoso~tratamiento))

Call:
lm(formula = defectuoso ~ tratamiento)

Residuals:
Min 1Q Median 3Q Max
-4.772 -1.244 -0.160 0.940 7.928

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 3.1600 0.5054 6.253 1.03e-07 ***
tratamientosintratamiento 6.1120 0.7147 8.552 3.27e-11 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 2.527 on 48 degrees of freedom


Multiple R-squared: 0.6038, Adjusted R-squared: 0.5955
F-statistic: 73.14 on 1 and 48 DF, p-value: 3.269e-11

anova(lm(defectuoso~tratamiento))
Analysis of Variance Table

Response: defectuoso
Df Sum Sq Mean Sq F value Pr(>F)
tratamiento 1 466.96 466.96 73.136 3.269e-11 ***
Residuals 48 306.47 6.38
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Como p-value<0.05 en ambos análisis, hace que exista una significativa diferencia entre
ambos tratamientos.

a) ¿Cuál es el porcentaje de defectos que se espera con el nuevo tratamiento?


Respuesta:
#MODELO LINEAL
> summary(lm(defectuoso~tratamiento))

Call:
lm(formula = defectuoso ~ tratamiento)

Residuals:
Min 1Q Median 3Q Max
-4.772 -1.244 -0.160 0.940 7.928

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 3.1600 0.5054 6.253 1.03e-07 ***
tratamientosintratamiento 6.1120 0.7147 8.552 3.27e-11 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 2.527 on 48 degrees of freedom


Multiple R-squared: 0.6038, Adjusted R-squared: 0.5955
F-statistic: 73.14 on 1 and 48 DF, p-value: 3.269e-11

El porcentaje esperado con el nuevo tratamiento es de 6.1120%

b) Cuantifique el nivel de reducción que se logró con el tratamiento propuesto


Respuesta:
#MODELO LINEAL
> summary(lm(defectuoso~tratamiento))

Call:
lm(formula = defectuoso ~ tratamiento)

Residuals:
Min 1Q Median 3Q Max
-4.772 -1.244 -0.160 0.940 7.928

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 3.1600 0.5054 6.253 1.03e-07 ***
tratamientosintratamiento 6.1120 0.7147 8.552 3.27e-11 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 2.527 on 48 degrees of freedom


Multiple R-squared: 0.6038, Adjusted R-squared: 0.5955
F-statistic: 73.14 on 1 and 48 DF, p-value: 3.269e-11

El nivel de reducción logrado con el tratamiento propuesto es de 3.16%

Script de R:
#EJERCICIO 14 U2
#CAPTURACIÓN DE DATOS
defectuoso=c(5.3,4.0,4.0,4.0,2.6,2.1,5.1,4.1,4.1,3.2,5.1,2.2,4.1,2.2,1.1,2.0,3.0,3.1,2.1,1.2,3.3
,2.1,4.0,2.0,3.0,8.0,13.2,7.2,8.2,9.1,6.7,12.2,16.3,9.2,6.4,7.2,17.2,12.3,8.7,11.3,4.5,6.6,9.2,1
0.2,10.6,13.3,5.2,6.2,8.0,4.8)
contratamiento=c(5.3,4.0,4.0,4.0,2.6,2.1,5.1,4.1,4.1,3.2,5.1,2.2,4.1,2.2,1.1,2.0,3.0,3.1,2.1,1.
2,3.3,2.1,4.0,2.0,3.0)
sintratamiento=c(8.0,13.2,7.2,8.2,9.1,6.7,12.2,16.3,9.2,6.4,7.2,17.2,12.3,8.7,11.3,4.5,6.6,9.2
,10.2,10.6,13.3,5.2,6.2,8.0,4.8)
tratamiento=factor(rep(c("contratamiento","sintratamiento"),c(25,25)))
tratamiento
#MODELO LINEAL
summary(lm(defectuoso~tratamiento))
#TABLA ANOVA
anova(lm(defectuoso~tratamiento))
REFERENCIAS

Gutiérrez P. H., De la Vara S. R. 2012. Análisis y Diseño de Experimentos. 3ª Edición.


McGraw Hil

EVALUACIÓN

11 14 Total

Dr. Manuel González De La Rosa

gtg515i@hotmail.com

Julio de 2014