Вы находитесь на странице: 1из 16

UNIVERSIDAD DE COSTA RICA

ESCUELA DE ESTADISTICA
XS3015-PRINCIPIOS DE DISEOS EXPERIMENTALES




TAREA #1






ESTUDIANTE: OSCAR MARIO CARMONA ARGUEDAS
B01345





PROF. ALVARO CASTRO


I SEMESTRE 2012
EJERCICIOS DEL LIBRO DISEO Y ANLISIS DE EXPERIMENTOS, DOUGLAS
MONTGOMERY
Ejercicio 3.10
Se determin el tiempo de respuesta en milisegundos para tres diferentes tipos de circuitos que
podran usarse en un mecanismo de desconexin automtica. Los resultados se muestran en la
siguiente tabla:

a) Probar la hiptesis de que los tres tipos de circuitos tienen el mismo tiempo de respuesta.
Utilizar
H
0
:


H
1
: al menos un valor del promedio es diferente
Realizando un anlisis de variancia, determinamos la igualdad de las medias.
Tratamientos Suma Cuadrados Cuadrado Medio Valor estadstico
F
p-value asociado
al valor F
Tiempo de
respuesta
543.6 271.8 16.083 0.0004023
Tipo de circuito 202.8 16.9

Como el p-value asociado tiene un valor de 0.0004023 entonces se puede decir que hay suficiente
evidencia estadstica como para rechazar la hiptesis nula de que las medias entre los tres tipos de
circuitos son iguales; es decir que al menos un tipo de circuito no tiene el mismo tiempo de
respuesta.
b) Usar la prueba de Tukey para comparar pares de medias de los tratamientos. Utilizar


Pares de comparacin p-value asociado
2-1 0.0023656
3-1 0.6367043
2-3 0.0005042

Como puede notarse en la tabla con los valores de p asociado a las comparaciones de cada una de
las medias de tratamientos, se puede decir que entre los circuitos 1 y 2 as como 2 y 3 existen
diferencias en el tiempo de respuesta ya que sus valores p son menores al nivel de significancia.
Con esto se puede concluir que el circuito 2 tiene un tiempo de respuesta diferente a los otros
dos.
c) Construir un conjunto de contrastes ortogonales, suponiendo que al principio del
experimento se sospechaba que el tiempo de respuesta del circuito tipo 2 era diferente
del de los otros dos.
H
0
:


H
1
:


Utilizando la matriz de contrastes y el comando contrasts del software R, se obtienen los
siguientes datos:
Contrastes Suma de Cuadrados p-value asociado
Circuito 1 y 3 vrs. 2 529.2 0.0001169

Como se puede notar, gracias al valor bajo del p-value asociado, el circuito tipo 2 es diferente a los
otros dos tipos de circuitos.
d) Si el lector fuera el ingeniero de diseo y quisiera maximizar el tiempo de respuesta, qu
tipo de circuito seleccionara?

Seleccionara el circuito 1 o 3 ya que no hay diferencia entre ellos y tienen el menor
tiempo de respuesta. El circuito 3 an tiene menor tiempo de respuesta que el 1.


e) Analizar los residuales de este experimento. Se satisfacen los supuestos del anlisis de
variancia bsico?

De acuerdo a los grficos residuales, en el grfico de normalidad se presentan algunos puntos que
hacen una ligera curva de la lnea de normalidad, indicando una posible violacin de este
supuesto. En el caso de homocedasticidad, valores extremos, grficamente no se presentan
violaciones a estos supuestos.
Ejercicio 3.11
Se estudia la vida efectiva de los fluidos aislantes en una carga acelerada de 35 kV. Se han
obtenido datos de una prueba para cuatro tipos de fluidos. Los resultados fueron los siguientes:

a) Hay algn indicio de que los fluidos difieran? Utilizar
H
0
:


H
1
: al menos un valor del promedio es diferente
Realizando un anlisis de variancias, obtenemos lo siguiente:
Tratamientos Suma Cuadrados Cuadrado Medio Valor estadstico
F
p-value asociado
al valor F
Vida efectiva 30.165 10.0550 3.0473 0.05246
Tipo de fluido 65.993 3.2997

Como la probabilidad asociada al estadstico F de la prueba es 0.05246 y es mayor a nuestro valor
de alfa, se puede decir que no hay suficiente evidencia estadstica como para rechazar la hiptesis
nula de que los promedios de los tipos de fluidos son iguales; es decir no hay diferencias
significativas entre los diferentes tipos de fluidos.
b) Cul fluido seleccionara el lector, dado que el objetivo es conseguir la vida
efectiva ms larga?

De acuerdo al grfico de cajas de este experimento, se puede notar que el tipo de fluido 3 tiene
una vida efectiva mayor que los otros tipos de fluidos. A pesar de que el anlisis de variancia no
resultara diferencias entre ellos, puede que si exista ya que el valor de no rechazo es ligeramente
un poco ms alto que el valor de alfa. En este caso, el lector seleccionara el fluido 3.
b) Analizar los residuales de este experimento. Se satisfacen los supuestos del anlisis
de variancia bsico?

Como se puede notar en los grficos de los residuales, no hay ninguna posible violacin de los
supuestos del anlisis de variancia.
Ejercicio 3.12
Se estudian cuatro diferentes tipos de diseos de un circuito digital de computadora para
comparar la cantidad de ruido presente. Se obtienen los siguientes datos:

a) La cantidad de ruido presente es la misma para los cuatro diseos? Utilizar
H
0
:




Realizando un ANOVA, obtenemos lo siguiente:
Tratamientos Suma Cuadrados Cuadrado Medio Valor estadstico
F
p-value asociado
al valor F
Ruido observado 12042.0 4014.0 21.780 6.797e-06
Diseo del
circuito
2948.8 184.3

Al comparar el p-value asociado a valor del estadstico de la prueba y el nivel de
significancia, se puede decir que hay suficiente evidencia estadstica como para rechazar la
hiptesis nula de que las medias de los diseos del circuito son iguales; en otras palabras,
al menos un diseo del circuito es diferente.















b) Analizar los residuales de este experimento. Se satisfacen los supuestos del anlisis de
varianza?

Como se nota grficamente con los residuales, no hay posibles violaciones de los
supuestos del anlisis de varianza.

c) Qu diseo del circuito se seleccionara para usarlo? El ruido bajo es mejor.

Como se puede notar en el diagrama de cajas, el tipo de diseo 1 fue observado con ruido
menor, por tanto se adecua mejor para su uso.



Ejercicio 3.13
Se pide a cuatro qumicos que determinen el porcentaje de alcohol metlico en cierto compuesto
qumico. Cada qumico hace tres determinaciones, y los resultados son los siguientes:


a) Los qumicos difieren sigificativamente? Utilizar

H
0
:


H
1
: al menos un valor del promedio es diferente

Realizando un anlisis de varianza obtenemos lo siguiente:
Tratamientos Suma Cuadrados Cuadrado Medio Valor estadstico
F
p-value asociado
al valor F
Porcentaje de
alcohol metlico
1.0446 0.34819 3.2458 0.08129
Qumico 0.8582 0.10727

Como nos p-value asociado es mayor al nivel de significancia, se puede decir que no hay suficiente
evidencia estadstica como para rechazar la hiptesis nula de que el promedio de alcohol metlico
en los diferentes tipos de qumicos es igual; es decir no hay diferencia significativa entre los
diferentes tipos de qumicos.

b) Analizar los residuales del experimento.

Como se puede ver grficamente, no hay posibles violaciones a los supuestos del anlisis de
variancia.
c) Si el qumico 2 es un empleado nuevo, construir un conjunto razonable de contrastes
ortogonales que podra haberse usado al principio del experimento.

H
0
:


H
1
:




Utilizando la matriz de contrastes y el comando contrasts del software R, se obtienen los
siguientes datos:
Contrastes Suma de Cuadrados p-value asociado
Circuito 1 y 3 vrs. 2 0.65610 0.03853

Como se puede notar, gracias al valor bajo del p-value asociado, el qumico tipo 2 es diferente a
los otros tipos de qumicos, es decir se comprueba la diferencia del qumico nuevo con los
existentes anteriormente.


Ejercicio 3.16
Se llev a cabo un experimento para investigar la eficacia de cinco materiales aislantes. Se
probaron cuatro muestras de cada material con un nivel elevado de voltaje para acelerar el tiempo
de falla. Los tiempos de falla (en minutos) se muestran abajo:

a) Los cinco materiales tienen el mismo efecto sobre el tiempo de falla?
Para conocer si los cinco materiales tienen el mismo efecto sobre el tiempo de falla se
realiza un anlisis de varianza, bajo las siguientes hiptesis:

H
0
:


H
1
: al menos un valor del promedio es diferente
Tratamientos Suma Cuadrados Cuadrado Medio Valor estadstico
F
p-value asociado
al valor F
Tiempo de falla 103191489 25797872 6.1909 0.003786
Material 62505657 4167044

Bajo un nivel de significancia de 0.01, se puede decir que hay suficiente evidencia
estadstica como para rechazar la hiptesis nula de que los promedios de tiempo de falla
de cada tipo de material son diferentes. Es decir, al menos un tipo de material tiene un
tiempo de falla significativamente diferente a los otros.














b) Graficar los residuales contra la respuesta predicha. Construir una grfica de probabilidad
normal de los residuales. Qu informacin transmiten estas graficas?

El primer grfico de valores residuales versus valores predichos nos indica que hay un
problema de heterocedasticidad ya que su patrn abierto hacia el lado derecho indica una
que la variancia de las observaciones originales no es constante.
Para el grfico de normalidad, tambin se halla una violacin a este supuesto puesto que
no concuerda con la lnea de normalidad.

c) Con base en la respuesta del inciso b, realizar otro anlisis de los datos del tiempo de falla
y sacar las conclusiones apropiadas.

Una tcnica vlida para analizar de otra forma los datos y as tener un mejor ajuste a los
supuestos del anlisis de varianza, es la de realizar transformaciones.
En este caso intentaremos primero con la raz cuadrada de la variable respuesta:

En este caso se puede notar que ambos supuestos no se corrigen.
Lo prximo a realizar es la transformacin logaritmo natural a la variable tiempo de falla.
Con esto obtenemos los siguientes grficos:

En ellos se puede notar que el supuesto de normalidad y homocedasticidad se cumplen.
Por tanto la transformacin logaritmo natural es necesaria para el anlisis. Realizando el
anlisis de varianza de este modelo tenemos:
Tratamientos Suma Cuadrados Cuadrado Medio Valor estadstico
F
p-value asociado
al valor F
Tiempo de falla 165.056 41.264 37.657 1.176e-07
Material 16.437 1.096

Como se puede ver, el anlisis de varianza indica que al menos existe una diferencia en los
promedios de los tratamientos.

Ejercicio 3.17

Un fabricante de semiconductores ha desarrollado tres mtodos diferentes para reducir el
conteo de partculas en las obleas. Los tres mtodos se prueban en cinco obleas y se
obtiene el conteo de partculas despus del tratamiento. Los datos se muestran abajo:

a) Todos los mtodos tienen el mismo efecto sobre el conteo promedio de partculas?
Para saber si los mtodos tienen el mismo efecto sobre el conteo promedio,
realizamos un anlisis de variancia bajo las hiptesis:
H
0
:


H
1
: al menos un valor del promedio es diferente

Tratamientos Suma Cuadrados Cuadrado Medio Valor estadstico
F
p-value asociado
al valor F
Conteo 8963.7 4481.9 7.9138 0.00643
Mtodo 6796.0 566.3

No todos los mtodos tienen el mismo efecto sobre el conteo promedio de partculas
ya que hay suficiente evidencia estadstica como para rechazar la hiptesis nula de
que los promedios de conteo de cada mtodo son iguales.

b) Graficar los residuales contra la respuesta predicha. Construir una grfica de
probabilidad normal de los residuales. Hay motivo de preocupacin potencial acerca
de la validez de los supuestos?

El grfico de residuos vrs predichos nos indica un patrn como estilo cono lo cual es indicador de
un problema de heterocedasticidad. En el caso del grfico de normalidad, al no existir un patrn
lineal normal, parece tambin existir una violacin de este supuesto.
c) Con base en la respuesta del inciso b, realizar otro anlisis de los datos del conteo de
partculas y sacar las conclusiones apropiadas.
Al igual que en el problema anterior, realizamos una transformacin a la variable
respuesta para analizar si se corrigen la violacin a los supuestos del anlisis de varianza.
Primeramente se intenta con la transformacin raz cuadrada a la variable respuesta. Con
esta transformacin se obtienen los siguientes grficos residuales:

Con la transformacin raz cuadrada se resuelve el problema de heterocedasticidad y normalidad.
A continuacin se muestra el anlisis de varianza con la transformacin, en el cual se nota una
diferencia considerable que con el modelo antes de la transformacin:
Tratamientos Suma Cuadrados Cuadrado Medio Valor estadstico
F
p-value asociado
al valor F
Conteo 63.900 31.950 9.84 0.002954
Mtodo 38.963 3.247

Ejercicio 3.19
Demostrar que la variancia de la combinacin lineal

es


Primeramente, aplicamos la variancia a la combinacin lineal:
1
a
i i
i
Var c y

=
| |
|
\ .


( )
1
a
i i
i
Var c y

=
=

Por las propiedades de la variancia, la introducimos a la sumatoria.


2
1 1
i
n a
i ij
i j
c Var y
= =
| |
=
|
\ .

Como el coeficiente c es constante, sale elevado al cuadrado, de la
variancia; por lo cual nos queda la variancia de la sumatoria de cada uno de los valores de cada
una de las repeticiones de cada factor.
( )
2
1 1
i
n a
i ij
i j
c Var y
= =
=

Introducimos la variancia a la sumatoria.
( )
2
ij
Var y o = Entonces tenemos que la variancia de cada uno de los datos es sigma cuadrado
2 2
1
a
i i
i
c no
=
=

Sustituyendo en la sumatoria entonces tenemos la variancia de la combinacin lineal.


Ejercicio 3.33
Usar la prueba de Kruskal-Wallis en el experimento del problema 3.11. Comparar las conclusiones
obtenidas con las del anlisis de variancia usual.
Para esta prueba contamos con las siguientes hiptesis:
H
0
:


H
1
: al menos un valor del promedio es diferente
Al utilizar la prueba de Kruskal-Wallis, que no se ve afectada por el supuesto de normalidad, se
puede comprobar que no rechazamos la hiptesis nula; es decir no hay diferencia significativa
entre cada uno de los tipos de fluido.
Kruskal-Wallis chi-cuadrado = 6.2177, df = 3, p-value = 0.1015
Este resultado apoya al resultante en el anlisis de variancia del ejercicio 3.11.
Ejercicio 3.34
Usar la prueba de Kruskal-Wallis en el experimento del problema 3.12. Los resultados son
comparables con los encontrados por el anlisis de variancia usual?
Nuestras hiptesis son:
H
0
:


H
1
: al menos un valor del promedio es diferente
Al aplicar la prueba no paramtrica de Kruskal-Wallis, obtenemos los siguientes resultados:
Kruskal-Wallis chi-cuadrado = 14.931, df = 3, p-value = 0.001877
Por lo tanto concluimos que hay suficiente evidencia estadstica como para rechazar la hiptesis
nula de que los promedios de los diseos del circuito son iguales.
Esto confirma los resultados del anlisis de variancia realizado en ejercicio 3.12
Ejercicio de recoleccin de datos
Los resultados de la toma de peso de las fajas rancheras del negocio La Canela se presenta a
continuacin. Se compr una faja ranchera en la maana y en la tarde, en cinco das hbiles.
Luego se pes en una balanza para repostera.
Datos Experimento de las fajitas Rancheras de " La Canela "

Mediciones en gramos


Lunes Martes Mircoles Jueves Viernes


Maana 250 270 300 265 240


Tarde 240 250 230 240 260


Persona Encargada de Pesar


Lunes Martes Mircoles Jueves Viernes

Maana Sergio Melissa Sergio Melissa Melissa


Tarde Sergio Melissa Melissa Melissa Melissa