Вы находитесь на странице: 1из 112

Temas 3 y 4

Diseo y anlisis de experimentos

4.1 Algunos Principios Generales


Varios de los mltiples aspectos del diseo experimental pueden ilustrarse por medio de
un ejemplo proveniente del importante tema de las mediciones en ingeniera.
Supngase que una fundidora de acero surte de lmina de hojalata a tres fabricantes de
latas, la especificacin principal es que el peso del revestimiento de estao deber ser al
menos de 0.25 libras en el fondo del envase de hojalata. La fundidora y cada uno de los
fabricantes de latas tienen laboratorios donde se realizan mediciones de los pesos de los
revestimientos de estao, tomando muestras de cada cargamento. Supongamos tambin
que han surgido algunos desacuerdos sobre los pesos reales de los revestimientos de
estao de los cargamentos de lmina, y se decide planear un experimento para
determinar si los cuatro laboratorios estn realizando mediciones consistentes. Un factor
que complica las cosas es que parte del proceso de medidas consiste en eliminar con
productos qumicos el estao de la superficie del metal en la base; de manera que es
imposible tener las mismas mediciones en las muestras de cada laboratorio para
determinar qu tan aproximadas son las mediciones.
Una posibilidad consiste en enviar varias muestras (con forma de discos circulares de
igual rea) a cada uno de los laboratorios. Aun cuando los discos en realidad pueden no
tener pesos idnticos del revestimiento de estao, se confa en que tales diferencias sean
muy pequeas y que ms o menos alcancen un promedio. En otras palabras, se
supondr que, si bien pueden existir diferencias entre las medias de las cuatro
muestras, podrn ser atribuidas slo a diferencias sistemticas en las tcnicas de
medicin y a variabilidad aleatoria. Esto abre la posibilidad de averiguar si los
resultados obtenidos en los laboratorios son consistentes comparando la variabilidad de
las medias de las cuatro muestras con una medida apropiada de la variacin aleatoria.
Ahora queda el problema de decidir cuntos discos deben enviarse a cada laboratorio
y cuntos en realidad deben seleccionarse. Supngase que se toma la decisin de
enviar una muestra de 12 discos a cada laboratorio.
El problema de seleccionar los 48 discos requeridos y asignar 12 a cada laboratorio no
es tan simple como podra parecer a primera vista. Para empezar, supngase que una
lmina de hojalata de las dimensiones apropiadas se selecciona y que los 48 discos se
cortan de ella como se aprecia en la Figura 4.1. Los 12 discos cortados de la tira 1 se
envan al primer laboratorio, los 12 obtenidos de la tira 2 se mandan al segundo
laboratorio, etc. Si se descubre que las medias de los pesos de los cuatro revestimientos
subsecuentemente obtenidos varan significativamente, nos permitira esto concluir que
las diferencias pueden atribuirse a falta de consistencia en las tcnicas de medicin?
1

Figura 4.1. Numeracin de las muestras de hojalata.


Supngase, por ejemplo, que otras investigaciones indican que la cantidad de estao
depositada electrolticamente sobre una larga lmina de acero tiene un patrn distinto y
repetido perpendicular a la direccin en que es laminado. (El patrn podra originarse
en la disposicin de los electrones, efectos de borde, etc.). Entonces, aunque los
cuatro laboratorios hayan medido la cantidad de estao consistentemente y sin error, las
diferencias en las determinaciones de los pesos de los revestimientos de estao se
deberan a alguna otra causa. La asignacin de los discos de una tira completa a cada
laboratorio es tal que las inconsistencias entre los mtodos de medicin de los
laboratorios no pueden separarse (o confundirse), si las diferencias provienen de la
cantidad real de estao depositado perpendicularmente a la direccin en que la hoja de
metal se lamina.
Una forma de evitar este tipo de confusin consiste en numerar los discos y distribuirlos
a los cuatro laboratorios al azar como en el siguiente esquema, que se obtuvo con ayuda
de la tabla de nmeros aleatorios:

Figura 4.2. Distribucin aleatoria de los discos a los cuatro laboratorios.


Si hubiese algn patrn real en el grueso del recubrimiento de estao sobre la lmina de
hojalata, seria disuelto por la aleatorizacin.

Si bien identificamos y contrarrestamos un posible patrn de variacin sistemtica, no


hay seguridad de que lo podamos hacer con los otros. Por ejemplo, pueden existir
diferencias sistemticas en las reas de los discos causadas por un desgastamiento
progresivo del instrumento de corte o pueden presentarse rayaduras u otras
imperfecciones en una parte de la lmina, lo que podra afectar a las mediciones. En
consecuencia, siempre existe la posibilidad de que las diferencias en las medias
atribuidas a inconsistencias entre los laboratorios sean en realidad causadas por alguna
otra variable incontrolable, y el propsito de la aleatorizacin es evitar confundir la
variable sujeta a investigacin con otras.
Distribuyendo totalmente al azar los 48 discos entre los cuatro laboratorios, no tenemos
otra opcin que incluir cualquier variacin atribuible a causas extraas bajo la etiqueta
de variacin aleatoria . Esto puede darnos una estimacin demasiado grande de la
variacin aleatoria, lo cual a su vez puede dificultar detectar diferencias entre las medias
reales de laboratorio. Con el propsito de evitar esto, podramos, quizs, slo usar
discos cortados de la misma tira (o de alguna otra regin homognea). Por desgracia,
esta clase de experimentacin controlada nos presenta nuevas complicaciones. De qu
servira, por ejemplo, efectuar un experimento que nos permitiera concluir que los
laboratorios son consistentes (o inconsistentes), si tal conclusin se limita a mediciones
realizadas a una distancia fija a partir de un extremo de la lmina? Para ofrecer un
ejemplo ms realista, supngase que un fabricante de artculos de plomera desea
comparar el rendimiento de varias clases de materiales que se usarn en tuberas
subterrneas de agua. Si condiciones como la acidez del suelo, la profundidad del tubo y
el contenido de minerales del agua que transportar pudieran mantenerse fijas, las
conclusiones sobre qu material es mejor serian vlidas slo para el conjunto de
condiciones dadas. Lo que el fabricante quiere saber es cul material es mejor en una
amplia variedad de condiciones; el disear un experimento adecuado sera aconsejable
(en realidad, necesario) especificar que el tubo de cada material ser enterrado a
diferentes profundidades en diversos tipos de suelos y lugares en donde el agua tiene
diferente dureza.
Este ejemplo sirve para ilustrar que rara vez se desean mantener fijos todos o la mayora
de los factores extraos a lo largo de un experimento; se consigue as una estimacin de
la variacin aleatoria que no est inflada por variaciones debidas a otras causas. (En
realidad, es muy raro, sino imposible, ejercer un control tan estricto, esto es, mantener
fijas todas las variables extraas). En la prctica, los experimentos debern planearse de
tal manera que las fuentes conocidas de variabilidad sean deliberadamente consideradas
sobre un rango tan amplio como sea necesario; ms an, debern variarse en tal forma
que su variabilidad pueda eliminarse en la estimacin de la variacin aleatoria. Una
manera de lograrlo es repetir el experimento en varios bloques, en los que fuentes
conocidas de variabilidad (esto es, variables extraas) se mantienen fijas en cada
bloque, pero variando de bloque a bloque.
En el problema del revestimiento de estao podramos explicar as las variaciones a
travs de la lmina de acero, asignando aleatoriamente tres discos de cada tira a cada
uno de los laboratorios como en el siguiente arreglo:

TABLA 1. Asignacin aleatoria de tres discos de cada tira a cada uno de los laboratorios
Laboratorio

Tira 1

Tira 2

Tira 3

Tira 4

8, 4, 10

23, 24, 19

26, 29, 35

37, 44, 48

2, 6, 12

21, 15, 22

34, 33, 32

45, 43, 46

1, 5, 11

16, 20, 13

36, 27, 30

41, 38, 47

7, 3, 9

17, 18, 14

28, 31, 25

39, 40, 42

En este esquema experimental, las tiras forman los bloques, y si fundamentamos nuestra
estimacin de la variacin aleatoria en la variabilidad dentro de los 16 conjuntos de tres
discos, esta estimacin no ser inflada por variables extraas, esto es, las diferencias
entre las tiras. (Obsrvese tambin que, con este arreglo, las diferencias entre las mediar
obtenidas por los cuatro laboratorios no pueden atribuirse a variaciones entre las tiras.
No podemos decir lo mismo del arreglo de la Figura 4.1).
El anlisis de experimentos en que los bloques se utilizan para eliminar una de las
fuentes de variabilidad se abordar en la seccin 4.3. El anlisis de experimentos en que
dos o tres fuentes de variabilidad son en esta forma eliminadas se expondr en la
seccin 4.5.

4.2 Diseos Completamente Aleatorios


En esta seccin consideramos, en general, el anlisis estadstico del diseo
completamente aleatorio o con un criterio de clasificacin. Supondremos que el
experimentador cuenta con los resultados de k muestras aleatorias independientes, cada
una de tamao n, de k diferentes poblaciones (esto es, datos relativos a k tratamientos, k
grupos, k mtodos de produccin, etc.); y le interesa probar la hiptesis de que las
medias de esas k poblaciones son todas iguales. Un ejemplo de tal experimento, con
k = 4, est dado por la Figura 4.1. Si denotamos la jsima observacin en la
isima

muestra por

y ij

, el esquema general para un criterio de clasificacin es

como sigue:
Muestra

y ij

Medias

y 11 , y 12 , , y1 j , , y

y 1

y 21 , y 22 , , y 2 j , , y 2n

y 2

...
i

...
y i 1 , y i 2 , , y ij , , y

y k 1 , y k 2 , , y kj , , y kn

...
y i
y k

Media global o gran media

En relacin con el esquema


experimental de la Figura 4.1
y ij ( i=1, 2,3, 4 ; j=1, 2, ,12 ) la jsima medicin del peso del revestimiento de
estao del

isimo

isimo

y i

laboratorio,

laboratorio y

es la media de las mediciones obtenidas en el

es la media global (o gran media) de las 48

observaciones.
Para probar la hiptesis de que las muestras se obtuvieron de

poblaciones con

medias iguales, haremos varias suposiciones. Con ms precisin, supondremos estar


trabajando con poblaciones normales que tienen variancias iguales.
Si

comn de las
i

isima

denota la media de las


k

poblacin y

indica la variancia

poblaciones, podemos expresar cada observacin

y ij

como

ms el valor de un componente aleatorio; es decir, podemos escribir:


y ij =i + ij

i=1,2, .. . , k ; j=1, 2, , n.

para

De acuerdo con las suposiciones anteriores, los

ij

son valores de variables

aleatorias independientes, distribuidas normalmente con medias cero y la variancia


2
comn .
Para lograr uniformidad en las ecuaciones correspondientes a clases de diseo ms
i
+ i
complicados, se acostumbra reemplazar
por
, donde es la media
de las

es el efecto del

isimo

tratamiento; de ah que:

i=0 .
i=1

Con estos nuevos parmetros, podemos escribir la ecuacin modelo para el criterio de
clasificacin:

y ij =+ i + ij para

i=1, 2,. . . ,k ; j=1, 2, , n

y la hiptesis nula de que las medias de las k poblaciones son iguales puede
1= 2 == k =0
reemplazarse con la hiptesis nula de que
. La hiptesis alterna de
i 0

que al menos dos de las medias son distintas equivale a que


Para probar la hiptesis nula de que las medias de las

para alguna i .

poblaciones son iguales,

2
compararemos dos estimaciones de (una con base en la variacin entre las medias

muestrales y la otra con la variacin dentro de las muestras). Dado que, como se ha
2
supuesto, cada muestra proviene de una poblacin que tiene la variancia , la
variancia puede estimarse por cualquiera de las variancias muestrales:
n

s =
2
i

( y ij y i )

n1

j=1

y entonces tambin por su media:


2
k
n
s 2i
( y ij y i )
=
k
i=1 j=1 k (n1)
k

^ =
2
W

i=1

si

Obsrvese que cada una de las variancias muestrales

grados de libertad ( n1 desviaciones independientes de


est basada en

k ( n1)

est basada en
y i

n1

) y, entonces,

grados de libertad. Ahora bien, la variancia de las

^ 2W
k

medias muestrales est dada por:


k

s =
2
x

( yi y )
k 1

i=1

y si la hiptesis nula es verdadera esta expresin nos da una estimacin de /n . As,


una estimacin de

basada en las diferencias entre las medias muestrales est dada

por:
k

^ 2B=n s 2x =n
i=1

( y i y )
k1

y est basada en k 1 grados de libertad.


^ 2W

Si la hiptesis nula es cierta, puede demostrarse que

^ 2B

son estimaciones

2
independientes de , y se sigue de ello que:

^ 2B
F= 2
^ W
F

es un valor de una variable aleatoria que tiene la distribucin


k ( n1)

k 1

con

2
^ B ,

grados de libertad. Cabe esperar que la variancia entre muestras,

^2
exceda a la variancia dentro de las muestras, W , cuando la hiptesis nula es falsa;
F

por eso la hiptesis nula ser rechazada si

excede a

, donde

se

obtuvo de la Tabla 4.1 con k 1 y k ( n1) grados de libertad.


El argumento anterior ha indicado cmo la prueba de la igualdad de las

medias

puede fundamentarse en la comparacin de dos estimaciones de variancias. Ms


notable, quizs. es el hecho de que las dos estimaciones en cuestin [excepto por los
n
divisores k 1 , y k 1)] pueden obtenerse partiendo o analizando la variancia
total de las

nk observaciones en dos partes. La variancia muestral de las

nk

observaciones est dada por:


k

s 2=
i=1 j=1

( y ij y )
nk 1

Y con respecto a su numerador, llamado suma de cuadrados total, probaremos ahora el


siguiente teorema.

Teorema 4.1: Identidad para el anlisis con un criterio de clasificacin.


k

ni

ni

( y ij y ) = ( y ij y i) 2+ n ( y i y )2
i=1 j=1
i=1 j=1
i=1

SST

SSE

La demostracin de este teorema se basa en la identidad:


7

SS(Tr)

y ij y =( y ij y i ) + ( y i y ) .
Elevando ambos lados al cuadrado y sumando sobre i y sobre
ni

ni

j , obtenemos:

ni

( y ij y i )2 + ( y i y )2 +2 ( y ij y i ) ( y i y )
j=1

i=1 j=1
ni

i=1 j=1
k

( y ij y )2=
j=1

i =1

i=1

Ahora bien, observemos que:


k

ni

ni

( y ij yi ) ( y i y )= ( y i y ) ( y ij y i )=0
i=1 j=1

dado que

i=1

y i

j=1

es la media de la isima

muestra y, de ah que:

ni

( y ij y i ) =0
j=1

para toda

i .

Para completar la demostracin del Teorema 4.1, slo debemos

observar que en el sumando de la segunda sumatoria del lado derecho de la identidad


anterior no aparece el subndice j y que, en consecuencia:
k

ni

( y i y ) =n ( y i y )2
i=1 j=1

i=1

Se acostumbra denotar la suma total de cuadrados, el miembro izquierdo de la


^2
identidad del Teorema 4.1 por SST. El primer trmino del lado derecho es W
veces sus grados de libertad; y a esta suma la llamaremos suma de cuadrados del
error, SSE. El trmino suma de cuadrados del error expresa la idea de que la
cantidad estima errores aleatorios (o al azar). El segundo trmino del lado derecho de la
^2
identidad del Teorema 4.1 es a B
veces sus grados de libertad, y a esto lo
llamaremos suma de cuadrados entre muestras o suma de cuadrados entre
tratamientos, SS(Tr). (La mayora de las primeras aplicaciones de este tipo de anlisis

se hicieron en la agricultura, donde

poblaciones representaban distintos

tratamientos, tales como fertilizantes, aplicados a parcelas agrcolas). Obsrvese que


con esta notacin la razn F puede escribirse as:

Razn

para tratamientos:
2
^ B SS (Tr)/(k 1)
F= 2 =
^ W SSE /k (n1)

Las sumas requeridas para calcular esta ltima frmula suelen obtenerse por medio de
las siguientes expresiones que ahorran bastante trabajo. En primer trmino calculamos
SST y SS(Tr) por medio de las frmulas:
Suma de cuadrados en muestras de igual tamao:
ni

SST = y 2ij C
i =1 j=1

SS (Tr )=

1
2
T i C

n i=1

Donde C, denominado trmino de correccin, est dado por:


C=

En estas expresiones,

Ti

muestra mientras que

T2
kn

es el nmero total de

es el gran total de las

observaciones en la
kn

isima

observaciones. La suma de

cuadrados del error, SSE, se obtiene entonces por sustraccin; de acuerdo con el
Teorema 4.1 podemos escribir
Suma de cuadrados del error:
SSE=SST SS (Tr)

Los resultados obtenidos al analizar la suma total de cuadrados (SST) en sus


componentes son resumidos de manera conveniente por medio de la siguiente tabla de
anlisis de variancia:

Fuente de
variacin

Grados de
libertad

Suma de
cuadrados

Media cuadrada

Tratamientos

k 1

SS (Tr )

MS ( Tr ) =SS (Tr)/(k 1)

MS (Tr )
MSE

Error

k (n1)

SSE

MSE=SSE /k (n1)

Total

nk1

SST

Ntese que cada cuadrado medio (MS) (media cuadrada) se obtuvo dividiendo la suma
de cuadrados correspondiente entre su nmero de grados de libertad.
EJEMPLO
A fin de ilustrar el anlisis de variancia (nombre que apropiadamente se da a esta
tcnica) para un criterio de clasificacin, supongamos que segn el esquema de la
Figura 4.1, cada laboratorio mide los pesos de los revestimientos de estao de 12
discos y que los resultados son los siguientes:

Totales

Laboratorio A

Laboratorio B

Laboratorio C

Laboratorio D

0.25

0.18

0.19

0.23

0.27

0.28

0.25

0.30

0.22

0.21

0.27

0.28

0.30

0.23

0.24

0.28

0.27

0.25

0.18

0.24

0.28

0.20

0.26

0.34

0.32

0.27

0.28

0.20

0.24

0.19

0.24

0.18

0.31

0.24

0.25

0.24

0.26

0.22

0.20

0.28

0.21

0.29

0.21

0.22

0.28

0.16

0.19

0.21

3.21

2.72

2.76

3.00

Gran total

11.69

Construye una tabla de anlisis de variancia.


10

Solucin:
Los totales para las cuatro muestras son, respectivamente, 3.21, 2.72, 2.76 y 3.00, el
gran total es 11.69, y los clculos con que se obtienen las sumas necesarias son los
siguientes:
Clculo del trmino de correccin (C):
2

C=

T 2 (11.69)
=
=2.847
kn ( 4)(12)

Clculo de la suma total de cuadrados (SST)


n

y 2ij=
j=1


i=1

y 2A 1 + y2A 2+ y 2A 3 + y 2A 4 + y 2A 5 + y 2A 6 + y 2A 7+ y 2A 8 + y 2A 9 + y 2A 10 + y 2A 11 + y 2A 12
+ y 2B 1 + y 2B 2 + y 2B 3 + y 2B 4 + y 2B 5+ y 2B 6 + y 2B 7+ y 2B 8 + y 2B 9+ y 2B 10+ y 2B 11 + y 2B 12
2

+ y C 1 + y C 2 + y C 3 + y C 4 + y C 5 + y C 6 + y C 7 + y C 8+ y C 9+ y C10 + y C 11 + y C 12
+ y 2D 1 + y 2D 2+ y 2D 3 + y 2D 4 + y 2D 5 + y 2D 6 + y 2D 7 + y 2D 8+ y 2D 9+ y 2D 10 + y 2D 11 + y 2D 12

Y haciendo los productos y las sumas con Excel, resulta:


12

Lab. A
0.25
0.27
0.22
0.30
0.27
0.28
0.32
0.24

y
j=1

2
Aj

0.0625
0.0729
0.0484
0.0900
0.0729
0.0784
0.1024
0.0576

12

Lab. B
0.18
0.28
0.21
0.23
0.25
0.20
0.27
0.19

y
j=1

12

2
Bj

Lab. C

0.0324
0.0784
0.0441
0.0529
0.0625
0.04
0.0729
0.0361

0.19
0.25
0.27
0.24
0.18
0.26
0.28
0.24
11

y
j=1

2
Cj

0.0361
0.0625
0.0729
0.0576
0.0324
0.0676
0.0784
0.0576

12

Lab. D

y 2Dj

0.23
0.30
0.28
0.28
0.24
0.34
0.20
0.18

0.0529
0.0900
0.0784
0.0784
0.0576
0.1156
0.0400
0.0324

j=1

0.31
0.26
0.21
0.28
Totales

0.0961
0.0676
0.0441
0.0784
0.8713

0.24
0.22
0.29
0.16

0.0576
0.0484
0.0841
0.0256
0.6350

0.25
0.20
0.21
0.19

0.0625
0.24
0.04
0.28
0.0441
0.22
0.0361
0.21
0.6478
Gran total

0.0576
0.0784
0.0484
0.0441
0.7738
2.9279

Entonces, la suma total de cuadrados es:


k

SST = y 2ij C=2.92792.847=0.0809 .


i =1 j=1

Clculo de la suma de cuadrados entre muestras o tratamientos, SS(Tr)


k

SS (Tr )=

1
1
[ ( 3.21 )2+ (2.72 )2 + ( 2.76 )2+ ( 3.00 )2 ] 2.847
T 2C= 12
n i=1 i

2.8602.847=0.0130

Clculo de la suma de cuadrados del error:


SSE=SST SS ( Tr ) =0.08090.013=0.0679 .
En esta forma, obtenemos la siguiente tabla de anlisis de variancia:
Fuente de
variacin

Grados de
libertad

Suma de
cuadrado
s

Media cuadrada

SS ( Tr )
MS ( Tr ) =
k 1

k 1
Tratamientos

= 4 1= 3

F
MS ( Tr )
MSE

SS (Tr )

0.0130

=0.0043
41

= 0.0130

0.0043
0.0015
2.87

12

MSE=
k ( n1)

Error

SSE

= 4(121)
= 44

= 0.0679

nk1

Total

para tratamientos:

F0.05

0.0679
=0.0015
4(121)

= 0.0809

, por medio de la Tabla 4.1, leemos en las columnas

k 1=41=3

k ( n1 )=4 ( 121 )=44

SST

= (12)(4)1
= 47

Obtencin del valor de

SSE
k ( n1 )

grados de libertad. Y en las filas para el error:

grados de libertad. De donde, observamos que no existen los

44 grados de libertad, pero se tienen los valores para 40 y 60 grados de libertad.


Por lo tanto, debemos interpolar.

Entonces, estableciendo la igualdad:


4440
x2.84
=
6040 2.762.84
de donde,
x=2.84+

4(0.08)
=2.840.016=2.82
20

Puesto que el valor obtenido para F calculada (2.81) no excede a F terica (2.82), que
F0.05
corresponde al valor de
con 3 y 44 grados de libertad, la hiptesis nula no
puede rechazarse con un nivel de significancia de 0.05; concluimos que los laboratorios
estn logrando resultados consistentes.
Para estimar los parmetros

, 1 , 2 , 3

o (

podemos emplear el mtodo de mnimos cuadrados, minimizando


13

1 , 2 , 3

),

( y ij i )2
i=1 j=1

con respecto a

y a las

, sujetas a la restriccin de que


k

i=0 .
i=1

Esto puede realizarse eliminando una de las

o, mejor an, utilizando el mtodo de

los multiplicadores de Lagrange. En cualquier caso obtenemos las estimaciones


intuitivamente obvias:
^= y
y

^ i= y i y

para

i=1, 2, , k , y las estimaciones correspondientes para las

dadas por

^i= y i .

EJEMPLO
Estima los parmetros del modelo con un criterio de clasificacin para los pesos de los
revestimientos de estao del ejemplo anterior.
Solucin:
Para los datos de los cuatro laboratorios obtenemos:
^= y =

^ A= y A y =

^ B= y B y =

11.69
=0.244,
48

3.21
0.244=0.0235,
12

2.72
0.244=0.0173,
12

^ C = y C y =

2.76
0.244=0.014,
12

14

^ D = y D y =

3.00
0.244=0.006 .
12

i= A + B + C + D =0.0240.0170.014+0.006=0.001 0
k=D

i= A

El anlisis de variancia descrito en esta seccin se aplica a criterios de clasificacin en


que cada muestra tiene el mismo nmero de observaciones. En caso contrario y si los
n , n , , nk
tamaos muestrales son: 1 2
slo tenemos que sustituir:
k

N= ni
i=1

por

nk

en todo lo anterior y escribir las expresiones para calcular

SST

SS (Tr ) en la forma:

Suma de cuadrados para muestras de tamaos distintos


k

ni

SST = y ij C , SS ( Tr ) =
i =1 j=1

i=1

T 2i
C
ni

En lo dems, el procedimiento es el mismo que antes.

EJEMPLO
Como parte de la investigacin del derrumbe del techo de un edificio, un laboratorio
prueba todos los pernos disponibles que conectaban la estructura de acero en tres
distintas posiciones del techo. Las fuerzas requeridas para cortar cada uno de los
pernos (valores codificados) son las siguientes:
Posicin 1:
Posicin 2:
Posicin 3:

90,
105,
83,

82,
89,
89,

79,
98,
93, 104,
80, 94
15

83, 91
89, 95, 86

Efecta el anlisis de variancia para probar con un nivel de significancia de 0.05 si las
diferencias entre las medias muestrales en las tres posiciones son significativas.
Solucin:
Utilizando las etapas para pruebas de hiptesis, obtenemos:
1. Hiptesis nula:

1=2= 3

Hiptesis alterna: las

no son iguales.

2. Nivel de significancia: =0.05 .


3. Criterio: Se rechaza la hiptesis nula si
k 1=31=2 ,
donde

F>3.74 , el valor de

Nk=173=14

F0.05

para:

grados de libertad,

es determinado por un anlisis de variancia; de lo contrario, lo

aceptamos. Para ello, hacemos uso de la Tabla 4.1 (pgina 45).


4. Clculos:
Posicin 1
90
82
79
98
83
91

Posicin 2
105
89
93
104
89
95
86
T 2 =661

T 1 =523

Posicin 3
83
89
80
94

T 3 =346

T = T i=T 1 +T 2+ T 3=523+ 661+ 346=1,530


i=1

n1=6

n2=7
k =3

N= ni=n1 +n 2+ n3=6+7 +4=17


i=1

16

n3=4

y 22 j + y 23 j
j=1
7

y 21 j +
j =1
6

ni

y 2ij=
j=1

j=1

k=3

i=1

( y 211 + y 212 + y 213+ y 214+ y 215+ y 216 )


+ ( y 221 + y 222+ y 223+ y 224 + y 225 + y 226 + y 227 )
+ ( y 231 + y 232 + y 233 + y 244 )

Utilizando Excel:
y 21 j ,
Posicin 1

j=1, , 6

90
82
79
98
83
91

8,100
6,724
6,241
9,604
6,889
8,281

SUMA:

45,839

y 22 j ,
Posicin 2

j=1, , 7

105
89
93
104
89
95
86

y 23 j ,
Posicin 3

11,025
7,921
8,649
10,816
7,921
9,025
7,396
62,753

83
89
80
94

j=1, , 4

6,889
7,921
6,400
8,836

30,046
ni

y 2ij=
j=1
k=3

i=1

C=

T 2 (1,530)
=
=137,700
N
17

En las expresiones para calcular las sumas de cuadrados, obtenemos:

17

138,638

ni

y 2ijC=138,638 137,700=938
j=1

SST =
i=1

] [

2
2
2
T
T T T
523 661 346
SS (Tr )= i C= 1 + 2 + 3 C=
+
+
137,700
n1 n2 n 3
6
7
4
i=1 ni

[ 45,588+62,417+29,929 ] 137,700=137,934137,700=234.
y tambin,
SSE=SST SS ( Tr ) =938234=704.
El resto del trabajo se advierte en la siguiente tabla de anlisis de variancia.
Fuente de
Grados de
Suma de
Media cuadrada
variacin
libertad
cuadrados
SS ( Tr )
MS ( Tr ) =
k 1

k 1
Tratamientos

= 3 1= 2

F
MS ( Tr )
MSE

SS (Tr )

234

=117
31

= 234

117
50.3

2.33

MSE=

Nk

Error

173
14

SSE

= 704

SSE
N k

704
=50.3
173

N1

Total

171

SST

16

= 938

5. Decisin: Dado que F = 2.33 no sobrepasa 3.74, o sea el valor de

F0.05

para 2 y

14 grados de libertad, la hiptesis nula no puede rechazarse; en otras palabras, no


18

podemos concluir que existe una diferencia en las resistencias medias a los
esfuerzos deslizantes de los pernos en las tres posiciones sobre el techo.

4.3 Diseos en Bloques Aleatorios


Como observamos en la seccin 4.1, la estimacin de la variacin aleatoria (el error
experimental) a menudo puede reducirse, esto es, liberarse de la variabilidad debida a
causas extraas, dividiendo las observaciones de cada clasificacin en bloques. Esto se
logra cuando fuentes conocidas de variabilidad (es decir, variables extraas) se
mantienen fijas dentro de cada bloque, pero varan de bloque en bloque.
En la presente seccin supondremos que el experimentador tiene a su disposicin
mediciones relativas a a tratamientos distribuidos sobre b bloques. En primer
trmino, consideraremos el caso en que hay exactamente una observacin de cada
tratamiento en cada bloque; en relacin con la Tabla 1 de la pgina 4, este caso
y ij
aparecera si cada laboratorio probara un disco de cada tira. Conveniendo en que
denote la observacin relativa el i-simo tratamiento y al j-simo bloque,
de las

observaciones para el i-simo tratamiento,

observaciones en el j-simo bloque y

y ..

y j

y i

la media

la media de las

la gran media de las

observaciones,

empleamos el siguiente esquema en esta clase de clasificacin con dos criterios:


Bloques

19

B1
Tratamiento 1

B2
y 11 ,

Bj
y 12 ,

Bb Medias
y 1. Tratamiento 2 y 21 , y 22 , y 2 j , y 2 b , y
y1 j ,
y1b ,

Este tipo de esquema se denomina tambin diseo en bloques aleatorios, siempre que
los tratamientos sean asignados el azar dentro de cada bloque. Ntese que, cuando un
punto se usa en lugar de un subndice, esto significa que la media se obtiene sumando
sobre l.
El modelo fundamental que supondremos para el anlisis de esta clase de experimento
con una observacin por celda (esto es, existe una observacin correspondiente a cada
tratamiento dentro de cada bloque) est dado por:
Ecuacin modelo para diseo de bloques aleatorios
y ij =+ i+ j+ ij

Aqu

es la gran media,

efecto del jsimo bloque y los

i
ij

para i=1,2, , a; j=1,2, , b


es el efecto del isimo tratamiento,

es el

son valores de variables aleatorias independientes

2
normalmente distribuidas que tienen medias cero y la variancia comn . En forma

semejante a lo que hicimos en el modelo para un criterio de clasificacin, restringimos


los parmetros imponiendo las condiciones de que:
a

i=0
i=1

y que,
b

j =0
j=1

En el anlisis de clasificacin con dos criterios cada tratamiento es representado una vez
dentro de cada bloque, el objetivo principal consiste en probar la significancia de las
y i
diferencias entre las
, o sea probar la hiptesis nula:
1= 2 == a =0
Ms an, quiz convenga probar si la divisin en bloques ha sido eficaz, esto es, si la
hiptesis es nula:
1= 2== b=0

20

puede rechazarse. En cualquier caso, la hiptesis alterna establece que al menos uno de
los efectos no es cero.
Como en el anlisis de variancia con un criterio de clasificacin, fundamentaremos esta
2
prueba de significancia mediante comparaciones de (una basada en la variacin
entre tratamientos, otra basada en la variacin entre bloques y la ltima que mide el
2
error experimental). Ntese que slo el ltimo es una estimacin de
cuando
cualquiera (o ambas) de las hiptesis nulas no son vlidas. Las sumas de cuadrados
requeridas son dadas por las tres componentes en que la suma de cuadrados total se
divide por medio del siguiente teorema:
Teorema 4.2: Identidad para el anlisis de una clasificacin con dos criterios
b

( y ij y i . y . j + y .. ) + b ( y i .y ..) + a ( y . j y .. )2
2

j=1

i=1

i=1

( y ij y .. )2=
j=1

i=1

i=1

SST , y los
trminos del lado derecho son, respectivamente, la suma de cuadrados del error, SSE

El lado izquierdo de esta identidad representa la suma de cuadrados total,

, la suma de cuadrados entre tratamientos,

SS (Tr ) y la suma de cuadrados en bloque

SS ( Bl) . Para probar este teorema, empleamos la identidad:


y ij y ..=( y ij y i . y . j+ y ..) + ( y i . y .. ) + ( y . j y .. )
y seguimos en esencia el mismo argumento de la demostracin del Teorema 4.1.
En la prctica, calculamos las sumas necesarias por medio de frmulas que ahorran
trabajo, en lugar de usar las expresiones que definen estas sumas de cuadrados en el
Teorema 4.2. Inicialmente calcularemos SST , SS (Tr) y SS ( Bl) por medio de las
frmulas:

21

Sumas de cuadrados para el anlisis de variancia de una clasificacin con dos


criterios
a

SST = y 2ij C
i =1 j=1

1
SS (Tr )= T 2i .C
b i=1
b

1
SS ( Bl )= T 2. jC
a j=1
donde C , es el trmino de correccin, dado por:

C=

En estas frmulas
tratamiento,

T. j

Ti.

T 2..
ab

es la suma de las

es la suma de las

observaciones para el i-simo

observaciones en el j-simo bloque y

T ..

es el gran total de todas las observaciones. Notemos que los divisores de SS (Tr ) y de
SS ( Bl)

son el nmero de observaciones en los totales respectivos,

Ti.

T. j

La suma de cuadrados del error se obtiene entonces por sustraccin; de acuerdo con el
Teorema 4.2 podemos escribir:
Suma de cuadrados del error
SSE=SST SS ( Tr ) SS ( Bl)
Empleando estas sumas de cuadrados, podemos rechazar la hiptesis nula de que las
i
son todas iguales a cero, con un nivel de significacin si la:
Razn F para tratamientos
FTr =

MS (Tr )
SS (Tr )/(a1)
=
MSE
SSE /(a1)(b1)

22

excede

que todas las

con
j

a1

( a1 )( b1 )

grados de libertad. La hiptesis nula de

son iguales a cero puede rechazarse con un nivel de significancia

si:

Razn F para bloques


F Bl=

excede

a1

con

MS ( Bl)
SS(Bl)/( a1)
=
MSE
SSE /(a1)(b1)

( a1 )( b1 )

MS ( Tr ) ,

medias de los cuadrados

grados de libertad. Ntese que las

MS (Bl )

MSE

se definen otra vez como

las correspondientes sumas de cuadrados divididas entre sus grados de libertad.


Los resultados de este anlisis se resumen en la siguiente tabla de anlisis de variancia:
Fuente de
variacin

Grados de
libertad

Suma de
cuadrados

Tratamientos

a1

SS (Tr )

MS ( Tr ) =

SS(Tr )
(a1)

FTr =

MS (Tr )
MSE

Bloques

b1

SS (Bl)

MS ( Bl )=

SS (Bl )
(b1)

F Bl =

MS ( Bl)
MSE

(a1)(b1)

Error

ab1

Total

Cuadrado medio

MSE=

SSE

SSE
(a1)(b1)

SST

EJEMPLO
Se dise un experimento para estudiar el rendimiento de cuatro detergentes diferentes.
Las siguientes lecturas de blancura se obtuvieron con un equipo especialmente
diseado para 12 cargas de lavado distribuidas en tres modelos de lavadoras:

Lavadora 1

Lavadora 2

Lavadora 3

Totales

Detergente A

45

43

51

139

Detergente B

47

46

52

145

Detergente C

48

50

55

153

23

Detergente D
Totales

42

37

49

128

182

176

207

565

Considerando los detergentes como tratamientos y las lavadoras como bloques,


obtenemos la tabla de anlisis de variancia adecuada y probamos con un nivel de
significancia de 0.01 si existen diferencias entre los detergentes o entre las lavadoras.
Solucin:
1= 2 = 3 = 3 =0 ; 1= 2= 3=0.

1. Hiptesis nula:

Hiptesis alterna: No todas las

son iguales a cero; tampoco todas las

2. Nivel de significancia: =0.01 .


3. Criterio: Para tratamientos, rechazamos la hiptesis nula si F> 9.78 el valor de
F0.01
con a1=41=3
y ( a1 )( b1 )=( 41 )( 31 )=6 grados de
libertad; para bloques rechazamos la hiptesis nula si F>10.90,
el valor de
F0.01
( a1 )( b1 )=( 41 )( 31 )=6 grados de
para b1=31=2
y
libertad.
4. Clculos:
sustituyendo:
a=4, b=3,T 1.=139, T 2.=145, T 3. =153,T 4. =128,T .1=182, T .2=176, T .3 =207, T ..=565.
Se debe calcular:

( y 2Aj + y 2Bj + y 2Cj + y 2Dj )


b

y 2ij=
j=1

j=1
a

i=1

y A 1 + y A 2 + y A 3 +

+ ( y 2C 1 + y 2C 2 + y 2C 3 ) + ( y 2D 1 + y 2D 2+ y 2D 3 )

24

( 45 2+ 432 +512 ) + ( 47 2+ 462 +522 )


+ ( 48 2+50 2+55 2 )

+ ( 422 +37 2+ 492 )

( 2,025+1,849+2,601 ) + ( 2,209+2,116+ 2,704 )


+ ( 2,304+2,500+ 3,025 )+ ( 1,764+1,369+2,401 )
6,475+7,029+7,829+5,534=26,867.

T 2.. ( 565 )2
C= =
=26,602
ab (3)(4 )

SST = y ij C=26,86726,602=265
2

i =1 j=1

SS (Tr )=

1
T 2 C= 13 ( 1392+ 1452+153 2+128 2) 26,602
b i=1 i .

26,71326,602=111.
b

1
1
SS ( Bl )= T 2. jC= ( 1822 +1762 +2072 ) =26,73726,602=135
a j=1
4
SSE=SST SS ( Tr ) SS ( Bl )=265111135=19
Despus dividimos las sumas de cuadrados entre sus respectivos grados de libertad para
obtener las sumas de cuadrados adecuadas, los resultados finales se indican en la
siguiente tabla de anlisis de varianza:

Fuente de
variacin
Tratamientos:
Detergentes

Grados de libertad

a1=

Suma de
cuadrados

SS (Tr )=111

41=3

25

Cuadrado medio

MS ( Tr ) =

SS ( Tr )
( a1 )

FTr =

MS ( Tr )
MSE

111
=37
(41)

MS ( Bl )=
Bloques:
Lavadoras:

b1

135
=67.5
(31)

MSE=

( a1 )( b1 )

F Bl=

MS ( Bl )
MSE

67.5
=21.1
3.2

SSE
( a1 ) ( b1 )

SSE=19
( 41 ) ( 31 ) =6

Total

37
=11.6
3.2

SS ( Bl )=135

31=2

Error

SS ( Bl )
( b1 )

19
=3.2
(41)(31)

ab1=( 3 ) ( 4 )1=11
SST =265

FTr =11.6

Decisiones: Dado que

sobrepasa a 9.78, el valor de

F0.01

con 3 y 6

grados de libertad, concluimos que existen diferencias en la eficacia de los cuatro


F Bl=21.1
F0.01
detergentes. Tambin, puesto que
excede a 10.9, el valor de
con 2
y 6 grados de libertad, concluimos que las diferencias entre los resultados obtenidos por
las tres lavadoras son significativos, es decir, que la divisin en bloques fue eficaz. Con
el fin de hacer resaltar an ms el efecto de estos bloques.
El efecto del isimo

detergente puede estimarse por medio de la frmula:


^ i= y i . y ..

^ 1= y 1. y ..=

139 565

=46.347.1=0.08,
3
12

^ 2= y 2. y.. =

145 565

=48.347.1=1.2,
3
12

^ 3= y 3. y.. =

153 565

=51.047.1=3.9,
3
12

^ 4= y 4. y ..=

128 565

=42.747.1=4.4 .
3
12
26

Clculos similares nos llevan a que:


^ i= y .i y ..
^ 1= y .1 y.. = 182 565 =45.547.1=1.6,
4
12
^ 2= y .2 y.. = 176 565 =4447.1=3.1,
4
12
^ 3= y .3 y ..= 207 565 =51.7547.1=4.65 .
4
12
para los efectos estimados de las lavadoras.
Debera observarse que la clasificacin con dos criterios de manera automtica nos
permite repetir las condiciones experimentales; por ejemplo, en el experimento anterior
cada detergente fue probado tres veces. Un nmero mayor de repeticiones pueden
manejarse en varias formas, y debemos tener presente que el modelo debe describir de
manera aproximada la situacin considerada. Una forma de considerar ms repeticiones
en la clasificacin con dos criterios es incluir un nmero mayor de bloques (por
ejemplo, probar cada detergente usando ms lavadoras, aleatorizando el orden de prueba
de cada mquina). Obsrvese que el modelo en esencia es el mismo que antes; la nica
diferencia es que se ha aumentado b , y un correspondiente incremento en los grados
de libertad de los bloques y del error. Este ltimo detalle es importante, debido a que un
incremento en los grados de libertad del error hace que la prueba de la hiptesis nula
i=0
para cada i sea ms sensible a pequeas diferencias entre las medias de los
tratamientos. En realidad, el objetivo real de esta clase de repeticin es aumentar los
grados de libertad del error, y por ende incrementar la sensibilidad de las pruebas F .
Un segundo mtodo consiste en repetir el experimento por completo, empleando un
nuevo patrn de aleatorizacin para obtener a b
nuevas observaciones. Esto es
posible slo si los bloques son identificables, esto es, si las condiciones que definen a
cada bloque pueden repetirse. Por ejemplo, en el experimento descrito en la seccin 4.1,
en que se pesaba el recubrimiento de estao, los bloques son tiras transversales a la
direccin en que una lmina de hojalata se desplaza hacia los rodillos; y, dada una nueva
lmina es posible reconocer que se trata de la tira 1, de la tira 2, etc. En el ejemplo de
esta seccin, este tipo de repeticin (denominado por lo general duplicacin) requerira
que la operacin de las lavadoras sea exactamente duplicada. Este tipo de repeticin
ser usado en relacin con los diseos de cuadros latinos de la seccin 4.5.

27

Un tercer mtodo de repeticin es incluir

observaciones para cada tratamiento en


cada bloque. Cuando se disea un experimento en esta forma, las n observaciones en
cada celda se consideran como duplicados y se espera que su variabilidad sea algo
menor que el error experimental. Para ilustrar este punto, supongamos que los pesos de
los recubrimientos de estao de los tres discos de posiciones adyacentes en una tira se
miden sucesivamente en uno de los laboratorios, empleando las mismas soluciones
qumicas. La variabilidad de estas mediciones probablemente sea considerada menor
que la de tres discos de la misma tira medidos en esos laboratorios en distintas
ocasiones, usando diferentes soluciones qumicas y quizs distintos laboratoristas. El
anlisis de variancia adecuado para este tipo de repeticin se reduce en esencia a un
anlisis de variancia con dos criterios aplicado a las medias de los n duplicados en
las

ab

celdas; as, no habra ganancia en los grados de libertad del error, y, en

consecuencia, ninguna ganancia en la sensibilidad de las pruebas F. Puede esperarse, sin


embargo, que halla alguna reduccin en el error de la media cuadrada, dado que ahora
mide la variancia residual de las medias de varias observaciones.

4.4 Comparaciones Mltiples


Las pruebas

utilizadas hasta ahora en este captulo han indicado si las diferencias

entre varias medias son significativas, pero no nos informaron si una media dada (o
grupo de medias) difieren en forma significativa de otra media considerada (o grupo de
medias). En la prctica, esto ltimo es la clase de informacin que un investigador en
realidad desea; por ejemplo, habiendo determinado las medias de los pesos de los
recubrimientos de estao obtenidos por los cuatro laboratoristas difieren de manera
significativa, puede ser importante determinar qu laboratorio (o laboratoristas) difieren
de los otros.
Si un experimentador tiene ante s

medias, parece razonable en primer trmino

probar diferencias significativas entre todos los pares posibles, esto es, efectuar

(k2 )=
pruebas t
cuando k

k (k1)
2

bimuestrales. Aparte de que esto requerira un gran nmero de pruebas aun


sea relativamente pequeo, estas pruebas no seran independientes y sera

casi imposible asignar un nivel de significancia global a este procedimiento.


Se han propuesto varias pruebas de comparaciones mltiples para salvar estas
dificultades, entre ellas la prueba del rango mltiple de Duncan. Las suposiciones
bsicas de las pruebas del rango mltiple de Duncan son, en esencia, las del anlisis de
variancia en una dimensin para tamaos muestrales iguales. La prueba compara el

28

rango de cualquier conjunto de


Rp
significancia,
, dado por:

medias con un apropiado rango de mnima

Rango de mnima significancia


R p=s x r p
s x

Aqu

es una estimacin de x = / n , y puede calcularse mediante la frmula:

Error estndar de la media


s x =

MSE
n

donde MSE es la media de los cuadrados del error en el anlisis de variancia. El valor
rp
de
depende del nivel deseado de significancia y del nmero de grados de libertad
correspondientes a la MSE, que se obtienen de Tablas 4.2 (a) y (b) para =0.05
=0.01 , para p=2,3, , 10 , y para varios grados de libertad entre 1 y 120.

EJEMPLO
Con respecto a los datos de los pesos de los recubrimientos de estao de la seccin 4.2,
pgina 9, se aplica una prueba de rango mltiple de Duncan para probar cules medias
de los laboratorios difieren de las otras empleando un nivel de significancia de 0.05.
Solucin:
y A =

3.21
2.72
2.76
3.00
=0.268, y B =
=0.227, y C =
=0.230, y D =
=0.250
12
12
12
12

En primer trmino ordenamos en un orden creciente de magnitud las cuatro medias


muestrales como sigue:
Laboratorio
Media
A continuacin calculamos

0.227

0.230

0.250

0.268

s x

, usando la media del error cuadrado MSE = 0.0015

que se obtuvo en el anlisis de la variancia de la pgina 11, y tenemos as:

29

s x =

MSE
0.0015
=
=0.011 .
n
12

Entonces, obtenemos (por interpolacin lineal) de la Tabla 4.2(a) los siguientes valores
r
de p para =0.05 y k ( n1 )=4 ( 121 )=44 grados de libertad:

Para p=2,

r p=2.85

6040 2.832.86
=
4440
x2.86

x=2.86+

Para p=3,

r p=3.004

(0.03)(4 )
=2.860.006=2.854
20

6040 2.983.01
=
4440
x3.01

x=3.01+

Para p=4,

r p=3.004

(0.03)(4)
=3.010.006=3.004
20

30

6040 3.073.10
=
4440
x3.10

x=3.10+

(0.03)(4 )
=3.100.006=3.094
20

rp

2.854

3.004

3.094

Multiplicando cada valor de


p

rp

por

s x =0.011

, obtenemos finalmente:

rp

2.854

3.004

3.094

r p s x

0.031

0.033

0.034

El rango de las cuatro medias es 0.268 0.227 = 0.041, que excede a

r 4 s x =0.034

que es el rango significativo mnimo. Este resultado era de esperarse, dado que la
prueba F de la pgina 11 indic que las diferencias entre las cuatro medias eran
significativas con =0.05 . Para probar si hay diferencias significativas entre tres
medias adyacentes, obtenemos rangos de
0.268 0.230 = 0.038 y 0.250 0.227 = 0.023, respectivamente, para 0.230, 0.250,
0.268 y 0.227, 0.230, 0.250. Puesto que el primero de estos valores sobrepasa
r 3 s x =0.033
, las diferencias observadas en el primer conjunto son significativas y
dado que el segundo valor no sobrepasa 0.033, las diferencias correspondientes no son
significativas. Por ltimo en el caso de parejas adyacentes de medias encontramos que
ningn par adyacente tiene un rango mayor que el rango significativo mnimo
r 2 s x =0.031
.

31

Concluimos as en nuestro ejemplo que el laboratorio A obtiene pesos medios del


recubrimiento de estao ms altos que los laboratorios B y C.

4.5 Algunos otros diseos experimentales


El diseo en bloques aleatorios de la Seccin 4.4 es adecuado cuando una fuente de
variabilidad extraa se elimina comparando un conjunto de medias muestrales. Una
caracterstica importante de este tipo de diseo es su balance, que se logra asignando el
mismo nmero de observaciones a cada tratamiento de cada bloque.
La misma clase de balance puede lograrse en otros tipos de diseo ms complicados, en
los cuales es conveniente eliminar el efecto de varias fuentes extraas de variabilidad.
En esta seccin explicaremos otros dos diseos balanceados: el diseo de cuadros
latinos y el diseo de cuadros grecolatinos, que se usarn para eliminar los efectos
de dos y tres fuentes extraas de variabilidad, respectivamente.

Cuadro latino
Con el fin de presentar el diseo de cuadro latino, supongamos que es necesario
comparar tres tratamientos, A, B y C, en presencia de otras dos fuentes de variabilidad.
Por ejemplo, los tres tratamientos pueden ser tres mtodos de soldadura para
conductores elctricos, y las dos fuentes extraas de variabilidad pueden ser (1)
diferentes operadores aplicando la soldadura y (2) la utilizacin de diversos fundentes
para soldar. Si tres operadores y tres fundentes son considerados, el experimento podra
disponerse segn el patrn siguiente:
Fundente 1

Fundente 2

Fundente 3

Operador 1

Operador 2

Operador 3

Aqu cada mtodo de soldadura se aplica una sola vez por cada operador junto con cada
fundente, y si existiesen efectos sistemticos debidos a diferencias entre los operadores
o entre los fundentes dichos efectos estaran presentes de igual manera en cada
tratamiento, esto es, en cada mtodo de soldadura.
Un arreglo experimental como el que se describi se denomina cuadro latino. Un
cuadro latino n n
es un arreglo cuadrado de n letras distintas, las cuales
aparecen slo una vez en cada rengln y en cada columna. Ejemplos de cuadros latinos
con n=4 y n=5 aparecen en la Figura 4.3. Ntese que en un experimento de
2
cuadro latino que requiera n tratamientos es necesario incluir n observaciones, n

por cada tratamiento.


32

(n1)(n2)

Un experimento de cuadro latino sin repeticin da slo

grados de

libertad para estimar el error experimental. As, tales experimentos son efectuados en
contadas ocasiones sin repeticin cuando n es pequea, esto es, sin repetir el patrn
r

completo de cuadro latino varias veces. Si existe un total de


y ij ( k ) l
anlisis de los datos presupone el siguiente modelo, donde
el

isimo

jsima

rengln en la

columna de la

subindice k , entre parntesis, indica que corresponde al

repeticiones, el

es la observacin en

lsima

repeticin, y el

k simo

tratamiento:

Ecuacin del modelo para cuadro latino


y ij ( k ) l=+ i + j + k + l + ij (k ) l
para i, j , k =1,2, , n

l=1,2, , r ,

sujeta a las restricciones de que:

i=1

j=1

k=1

l =1

i=0, j =0, k=0, y l=0,


Aqu

efecto de la

es la gran media,

jsima columna, k
lsima

es el efecto de la

isimo

es el efecto del
es el efecto del

repeticin y los

rnglon,

k simo

ij ( k ) l

es el

tratamiento,

son valores de variables

aleatorias independientes normalmente distribuidas con medias cero y la variancia


2
comn . Obsrvese que por los efectos de los renglones y los efectos de las
columnas entenderemos los efectos de las dos variables extraas, y que estamos
incluyendo los efectos de repeticin pues como veremos la repeticin puede introducir
una tercera variable extraa. Ntese tambin que el subndice k est entre parntesis
en

y ij( k ) l

, debido a que, para un diseno de cuadro latino dado,

automticamente determinado cuando i y

j se conocen.

55
44

33

es

Figura 4.3. Cuadros latinos.


La hiptesis principal que desearemos probar es la hiptesis nula

k =0

, para toda

k , es decir, la hiptesis nula de que no existe diferencia en la eficacia de los n

tratamientos. Sin embargo, podemos probar tambin si el bloqueo cruzado del diseo
en cuadro latino ha sido eficaz; esto es, podemos probar las dos hiptesis nulas
i=0
j=0
para toda i y
para toda j (contra las alternativas adecuadas), con el
fin de comprobar si las dos variables extraas en realidad tienen algn efecto sobre el
fenmeno que se est considerando. Ms an, podemos probar la hiptesis nula
l=0
l
para toda l contra la alternativa de que no todas las
son iguales a cero,
y esta prueba de los efectos de las repeticiones puede ser importante si las partes del
experimento que representan los cuadros latinos individuales fueron realizadas en
distintos das, por varios tcnicos, a diferentes temperaturas, etc.
Las sumas de cuadrados requeridas para efectuar estas pruebas suelen obtenerse por
T i ..
medio de las siguientes frmulas abreviadas, donde
es el total de las r n
observaciones en todos los

isimos

renglones,

T. j.

observaciones en todas las

jsimas

columnas,

T .. l

observaciones en la

lsima

repeticin,

observaciones relativas al k simo


r n

T (k)

tratamiento y

es el total de las
es el total de las

es el total de todas
T

Suma de cuadrados cuadro latino


C=

r n 2
n

SS (Tr )=

1
2
T (k)C

r n k=1

SSR=

1
T 2i ..C

r n i =1

SSC=

1
T 2 C
r n j=1 . j .

(para renglones)

(para columnas)

34

r n

es el gran total de todas las

observaciones:

( T)

r n

SS (Rep)=

1
T 2 C
2 ..l
n i=1
n

SST =

(para repeticiones)

yij2 (k ) lC
i=1 j=1 l =1

SSE=

SST SS ( Tr )SSRSSCSS(Rep)

Obsrvese de nuevo que cada divisor es igual al nmero de observaciones en los


correspondientes totales cuadrados. Por ltimo, los resultados del anlisis son los que
aparecen en la siguiente tabla de anlisis de variancia:
Fuente de
variacin
Tratamiento
s

Grados de libertad

Suma de
cuadrado
s

Cuadrado medio

SS(Tr )
n1

FTr =

MS (Tr )
MSE

MSR=

SSR
n1

F R=

MSR
MSE

MSC=

SSC
n1

FC =

MSC
MSE

SS(Rep)
r1

F Rep=

n1

SS (Tr )

Rengln

n1

SSR

Columna

n1

SSC

Repeticiones

r1

SS (Rep)

MS ( Rep )=

SSE

MSE=

Error

Total

(n1)(rn +r3)
r n21

MS ( Tr ) =

MS (Rep)
MSE

SSE
(n1)(rn +r3)

SST

Como antes, los grados de libertad para la suma de cuadrados total es igual a la suma
de los grados de libertad de los componentes individuales:

( n1 )+ ( n1 ) + ( n1 ) + ( r1 ) + ( n1 ) ( rn+r3 )
3 n+r4+ r n2+ rn3 nrnr +3=r n21.
As, en definitiva los grados de libertad del error se encuentran por sustraccin.
EJEMPLO. Supn que se efectan dos repeticiones del ya mencionado experimento
de soldadura, empleando el siguiente arreglo:

35

Repeticin I
fundente

Repeticin II
fundente

Operador 1

Operador 2

Operador 3

Los resultados, que sealan el nmero de kilogramos de fuerza de tensin requerida


para reparar los puntos soldados, fueron como se indica a continuacin:
Repeticin I
fundente
1

Repeticin II
fundente
3

Operador 1

14.0 16.5 11.0

Operador 2

9.5 17.0 15.0

Operador 3

11.0 12.0 13.5

1
10.
0
12.
0
13.
5

16.5 13.0
12.0 14.0
18.0 11.5

Analiza el experimento como un cuadro latino y prueba con un nivel de significancia de


0.01 si existen diferencias en los mtodos, en los operadores, en los fundentes o en las
repeticiones.
Solucin:
1. Hiptesis nula:
1= 2 = 3 =0 ; 1= 2= 3=0 ; 1= 2= 3=0 ; 1=2=0.
Hiptesis alterna:
Las no son iguales a cero; no todas las son iguales a cero; no todas las
son iguales a cero, no son iguales a cero todas las .
2. Niveles de significancia: =0.01 para cada prueba.
3. Criterios: Para tratamientos, renglones o columnas, se rechaza la hiptesis nula si
F>7.56 , el valor de F0.01 para
n1=31=2
grados de libertad y
36

( n1 )( rn+ r3 ) =( 31 ) ( 2 3+23 )=10


rechaza la hiptesis nula si

grados de libertad. Para repeticiones, se

F>10.0 , el valor de

F0.01

para

y 10 grados de libertad.
4. Clculos: Se tiene que
Para

n=3,r =2.

i=1:
n =3 r=2

r =2

r=2

r =2

j=1 l=1

l=1

l=1

l=1

T 1. .= y 1 jl = y 11l + y 12 l + y 13l

y 111+ y 112 + y121 + y 122 + y 131 + y 132


14.0+10.0+16.5+16.5+11.0+ 13.0=81.0

Para

i=2 :

r=2

r=2

r=2

r =2

l=1

l=1

l=1
n =3

l=1

y 2 jl= y 21l + y 22 l+ y 23l


T 2. .=
j=1

y 211 + y 212 + y 221 + y 222 + y 231 + y 232


9.5+12.0+17.0+12.0+15.0+ 14.0=79.5

Para

i=3 :

r=2

r=2

r=2

r =2

l=1

l=1

l=1
n=3

l=1

y 3 jl= y 31l + y 32 l+ y 33l


T 3. .=
j=1

y 311 + y 312 + y 321 + y 322 + y 331 + y 332


11.0+13.5+12.0+18.0+ 13.5+ 11.5=79.5

Para

j=1:

37

r1=21=1

n =3 r=2

r=2

r =2

r=2

i =1 l=1

l=1

l=1

l=1

T .1 .= y i1 l= y 11l + y 21 l+ y 31l

y 111+ y 112 + y211 + y 212 + y 311 + y 312


14.0+10.0+9.5+12.0+11.0 +13.5=70.0
Para

j=2:
n =3 r=2

r=2

r=2

r =2

i =1 l=1

l=1

l=1

l=1

T .2 .= y i2 l = y 12l + y 22 l + y 32l

y 121 + y 122 + y 221 + y 222 + y 321 + y 322


16.5+16.5+17.0+12.0+12.0+18.0=92.0

Para

j=3:
n=3 r=2

r =2

r=2

r=2

i=1 l=1

l=1

l=1

l=1

T .3 .= y i 3l = y 13 l+ y 23l + y 33 l

y 131 + y 132 + y 231 + y 232 + y 331 + y 332


11.0+13.0+15.0+14.0+ 13.5+ 11.5=78.0
Para l=1 :
n=3

n=3

n=3

n=3

j=1

j=1

j=1
n=3

j=1

y ij 1= y 1 j 1 + y 2 j 1 + y 3 j 1
T ..1=
i=1

y 111+ y 121 + y 131 + y 211 + y 221 + y 231 + y 311 + y 321 + y331


14.0+16.5+11.0+ 9.5+17.0+15.0+11.0+ 12.0+ 13.5=119.5
Para l=2 :

38

n=3

n=3

n=3

n=3

j=1

j=1

j=1
n=3

j=1

y ij 2= y 1 j 2 + y 2 j 2 + y 3 j2
T ..2=
i=1

y 112 + y 122 + y 132 + y 212 + y 222 + y 232 + y 312 + y 322 + y 332


10.0+16.5+13.0+12.0+12.0+14.0+13.5+18.0+ 11.5=120.5

T ( A )=14.0+13.0+17.0+12.0+13.5+18.0=87.5
T ( B )=16.5+16.5+15.0+14.0+11.0 +13.5=86.5
T ( C )=11.0 +10.0+9.5+12.0+12.0+ 11.5=66.0
El gran total se puede calcular de varias maneras:
T =T ( A ) +T (B )+ T ( C )=87.5+ 86.5+66=240
T i ..= T 1.. +T 2.. + T 3.. =81.0+79.5+ 79.5=240
n=3

T =
i=1

T . j . = T .1 . +T .2. +T .3. =70+92+78=240


n=3

T =
j=1

T .. l=T ..1+T ..2=119.5+ 120.5=240


r=2

T =
l=1

Sumas al cuadrado:
n=3 n=3 r=2

y
i=1 j=1 l =1

r =2

y
l=1

2
11 ( k ) l

2
ij ( k ) l

r=2

= y

+ y
l=1

n=3 r=2
j=1 l=1

2
12 ( k ) l

r =2

2
1 j ( k) l

+ y
l=1

n=3 r =2

+ y

2
13 ( k ) l

j=1 l=1

r=2

+ y
l=1

2
2 j ( k) l

2
21 ( k ) l

n=3 r =2

+ y 23 j ( k ) l
j=1 l=1

r=2

+ y
l =1

39

2
22 ( k ) l

r =2

+ y 23 (k ) l
l=1

r =2

r=2

r=2

+ y 31 (k ) l + y 32 (k )l + y33 ( k ) l
2

l=1

l=1

l =1

y 211 (k ) 1+ y 211 (k ) 2 + y 212 (k ) 1 + y 212( k ) 2 + y 213 (k )1 + y 213 (k )2 + y 221 (k )1 + y 221 (k )2

+ y 222( k ) 1 + y 222( k ) 2 + y 223 (k ) 1 + y 223 (k )2 + y 231 (k )1 + y 231 (k )2 + y 232 (k )1 + y 232 (k ) 2

+ y 33 (k ) 1 + y 33 (k )2
2

14.0 + 10.0 + 16.5 + 16.5 +11.0 +13.0 +9.5 +12.0 +17.0 +12.0
2

+15.0 +14.0 +11.0 +13.5 +12.0 +18.0 +13.5 +11.5


3,304.5
En las frmulas de las sumas de cuadrados, obtenemos:
C=

( T)
r n

=
2

240 2
=3,200.0
2
2 3
n

1
1
2
2
2
2
SS (Tr )=
T ( k )C=
T ( A ) +T ( B )+T (C ) )C

(
r n k=1
r n

1
( 87.52 +86.5 2+66.0 2) 3,2000=3,249.13,200.0=49.1
23
n

SSR=

1
T 2 C= r 1n (T 21..+T 22..+ T 23.. )C
r n i=1 i ..

1
( 81.02 +79.52 +79.52 ) 3,200=3,200.253,200=0.25
23
n

SSC=

1
1
2
T . j . C=
(T 2 +T 2 +T 2 )C

r n j=1
r n .1. .2 . .3.

1
( 702 +922 +782 ) 3,200=3,241.333,200=41.33
23
40

SS ( Rep )=

1
1
1
T 2 C= 2 ( T 2..1+T 2..2) C= 2 ( 119.5 2+120.52 ) 3,200
2 ..l
n i=1
n
3

3,200.053,200=0.055
n

SST = y 2ij ( k ) lC=3,304.53,200=104.5


i =1 j=1 l=1

SSE=SST SS ( Tr ) SSRSSCSS ( Rep )


104.549.10.2541.330.055=13.765
Y los resultados son como se indica en la tabla siguiente del anlisis de variancia:
Fuente de
variacin

Grados de libertad

Suma de
cuadrado
s

Cuadrado medio

MS ( Tr ) =
Tratamiento
s
(Mtodos)

n1=31=2

n1=31=2

49.1
=24.6
2

SSC
n1

41.33
=20.6
2

MS ( Rep )=

r1=21=1

24.6
=17.6
1.4

F R=

MSR
MSE

0.125
=0.1
1.4

FC =

MSC
MSE

SSC=41.33

Repeticiones

SSR
n1

0.25
=0.125
2

MSC=
n1=31=2

MS ( Tr )
MSE

SSR=0.25

Columnas
(fundentes)

FTr =

SS (Tr )=49.1

MSR=
Renglones
(operador)

SS ( Tr )
n1

SS ( Rep )
r 1

20.6
=14.7
1.4

F Rep=

MS ( Rep )
MSE

SS ( Rep )=0.055

41

0.055
=0.055
1

0.055
=0.04
1.4

MSE=
Error

SSE=13.765
( n1 )( rn+ r3 ) =( 31
) ( 2 3+23 )=2 5=10

Total

SSE
( n1 ) ( rn+r 3 )

13.765
=1.4
10

2
2
r n 1=2 3 1=17SST =104.5

5. Decisin: Por lo que respecta a tratamientos (mtodos) y a columnas (fundentes), dado


que F=17.6 y 14.7 sobrepasan 7.56, las hiptesis nulas correspondientes deben
rechazarse; para renglones (operadores), dado que F=0.1 no excede 7.56, y para
repeticiones, dado que

F=0.01

no excede a 10.00, la hiptesis nula correspondiente

no puede rechazarse. En otras palabras, concluimos que hay diferencias en los mtodos
y en los fundentes, pero no en los operadores ni en las repeticiones, afectan a la
resistencia de la soldadura de las terminales elctricas. Ms an, la prueba de rango
mltiple de Duncan de la Seccin 4.4 da el siguiente patrn de decisin con un nivel de
significancia de 0.01.

y A =

14.0+13.0+17.0+ 12.0+ 13.5+18 87.5


=
=14.6
6
6

y B =

16.5+16.5+15.0+ 14.0+11.0+13.5 86.5


=
=14.4
6
6

y C =

11.0+10.0+ 9.5+12.0+12.0+11.5 66
= =11.0
6
6

En primer trmino ordenamos en un orden creciente de magnitud las tres medias


muestrales como sigue:
Mtodo

Media

11.0

14.4

14.6

A continuacin calculamos

s x

, usando la media del error cuadrado

que se obtuvo en el anlisis de la variancia, y tenemos as:


s x =

MSE
1.4
=
=0.677687 .
n
3

42

MSE=1.4

De la Tabla 4.2(b) se obtienen los siguientes valores de


significancia

=0.01 y

rp

para un nivel de

(n1)(rn +r3)=(31)(2 3+23)=10

grados de

libertad:
p

rp

4.48

4.67

rp

Multiplicando cada valor de

s x =0.677687

por

, obtenemos finalmente:

rp

4.48

4.67

r p s x

2.1

2.2

Para probar si hay diferencias significativas entre las tres medias adyacentes,
obtenemos los rangos de:

CB=14.411.0=3.4
. Puesto que el primero de estos valores sobrepasa
r 2 s x =2.1

, las diferencias observadas en el primer conjunto son significativas y dado

que el segundo valor BA=14.614.4=0.2 no sobrepasa 2.2, las diferencias


correspondientes no son significativas.
Entonces,

Media

Mtodo C
11.0

Mtodo B
14.4

Mtodo A
14.6

En consecuencia, concluimos que el mtodo C produce uniones con soldadura ms


dbiles que los mtodos A o B.

Cuadros grecolatinos
La eliminacin de tres fuentes extraas de variabilidad puede lograrse por medio de un
diseo denominado cuadro grecolatino. Este diseo es un arreglo cuadrado de n
letras latinas y

letras griegas, formando con ellas un cuadro latino; ms

exactamente cada letra latina aparece slo una vez al lado de cada letra griega. A
continuacin se da un ejemplo de un cuadro grecolatino de 4 4:

43

La construccin de cuadros grecolatinos, tambin denominados cuadros latinos


ortogonales, da lugar a interesantes problemas matemticos.
Con el objeto de dar un ejemplo en el cual podra ser adecuado el uso de un cuadrado
latino, supngase que en el ejemplo de la soldadura la temperatura de sta es otra fuente
de variabilidad. Si tres temperaturas de soldado, denotadas por , y se
utilizan junto con los tres mtodos (A, B y C), tres operadores (renglones) y tres
fundentes (columnas), la repeticin de un experimento apropiado de cuadrado
grecolatino puede establecerse de la siguiente manera:
Fundente 1

Fundente 2

Fundente 3

Operador 1

Operador 2

Operador 3

As pues, el mtodo A sera utilizado por el operador 1 usando fundente 1 a


temperatura , por el operador 2 con fundente 2 a temperatura y por el
operador 3 empleando fundente 3 a temperatura . En forma similar, el mtodo B lo
aplicara el operador 1 usando fundente 2 y temperatura , etc.
En un cuadro grecolatino, cada variable (representada por renglones, columnas, letras
latinas o letras griegas) est distribuida equitativamente respecto a las otras variables.
As, al comparar las medias obtenidas de una variable, los efectos de las otras son
promediados por completo. El anlisis de un cuadro grecolatino es similar al de un
cuadro latino, slo que se agrega una fuente extra de variabilidad correspondiente a las
letras griegas.
Existe una gran variedad de diseos experimentales. Entre los ms utilizados estn los
diseos en bloques incompletos, que se caracterizan por el hecho de que cada
tratamiento no est representado en cada bloque. Si el nmero de tratamientos que se

44

investiga en un experimento es grande, a menudo es imposible encontrar bloques


homogneos tales que todos los tratamientos puedan acomodarse en cada bloque.
Por ejemplo, si n pinturas son comparadas aplicando cada una de ellas a una hoja de
metal e introducindolas en un horno, quiz sea imposible poner todas las hojas al
mismo tiempo dentro del horno. En consecuencia, es necesario valernos de un diseo
experimental en que k < n tratamientos (pinturas) sean incluidos en cada bloque
(hornada). Una manera de hacer esto es asignar los tratamientos a cada hornada en tal
forma que cada tratamiento ocurra junto con cualquier otro en el mismo nmero de
bloques. Por ejemplo, si n=4 y k =2 , podramos utilizar el siguiente esquema:
Serie

Pinturas

1
2

1y2
3y4

1y3

2y4

1y4

2y3

Este tipo de diseo se denomina diseo balanceado en bloques incompletos y tiene la


importante propiedad de que las comparaciones entre dos tratamientos cualesquiera
pueden realizarse con igual precisin.
Dado que el diseo en bloques incompletos puede requerir demasiados bloques, se han
ideado otros esquemas. La mayora de estos diseos experimentales cumplen las
necesidades especficas de experimentadores, sobre todo en el campo de la agricultura.
Como sealamos antes, gran parte de la terminologa del diseo experimental,
incluyendo los trminos como tratamientos, bloques, parcelas, etc., tienen su
origen en la agricultura. Slo en aos recientes se han aplicado diseos ms complejos a
la industria y a la experimentaci6n en ingeniera, y, con una mayor aplicacin, se espera
que se den muchsimos otros para satisfacer los requerimientos de estos campos.

4.6 Anlisis de Covariancia


El objetivo de los mtodos de las Secciones 4.3 y 4.5 fue librar al error experimental de
la variabilidad debida a causas extraas identificables y controlables. En esta seccin
abordamos un mtodo, denominado anlisis de covariancia, que se aplica cuando esas
variables extraas, o concomitantes, no pueden mantenerse fijas pero pueden medirse.
Esto sucedera, por ejemplo, si necesitamos comparar la eficacia de varios programas de
capacitacin industrial y los resultados que dependen del CI de los aprendices; si
deseamos comparar la durabilidad de varios tipos de suelas de cuero y los resultados
dependen del peso de las personas que utilizan los zapatos; si queremos comparar las
cualidades de varios agentes limpiadores y los resultados dependen de las condiciones
originales de las superficies que se pretende limpiar.

45

El mtodo mediante el cual analizamos los datos de este tipo es una combinacin del
mtodo de regresin lineal y del anlisis de variancia de la Seccin 4.2. El modelo
fundamental est dado por:
Ecuacin modelo para el clculo de covariancia
y ij =+ i+ x ij + ij
i=1,2, , k ; j=1,2, , n .

Para

isimo

y las

ij

Donde

es la gran media,

es el efecto

son valores de variables aleatorias independientes distribuidas

normalmente con medias cero y la variancia comn

es la pendiente de la

ecuacin de regresin lineal.


En el anlisis de tales datos, los valores de la variable concomitante
eliminados por mtodos de regresin, es decir, estimando

x ij

, son

con el mtodo de
mnimos cuadrados, y despus efectuando un anlisis de variancia sobre las y
'
^
ajustadas, esto es, las cantidades y ij = y ij x ij . Este procedimiento recibe el nombre
de anlisis de covariancia, cuando requiere una particin de la suma de productos:
k

SPT = ( y ij y . ) ( x ij x. )
i=1 j=1

en la misma forma que un anlisis de variancia ordinario requiere la particin de la


suma total de cuadrados. En la prctica, los clculos se realizan de la siguiente manera:
1. El total, el tratamiento y la suma de cuadrados del error se calculan para las x
por medio de las frmulas de un criterio de clasificacin; sern denotados por:
SST x , SS (Tr )x
Para las

SSE x

x , el trmino de correccin es:

T 2x
C x=
k n
2.

El total, el tratamiento y la suma de cuadrados del error se calculan para las


mediante las frmulas de un criterio de clasificacin; sern denotados por:
SST y , SS (Tr) y
46

SSE y

y , el trmino de correccin es:

Para las
C y=

3.

T 2y
kn

El total, el tratamiento y la suma de productos del error se calculan por medio de las
frmulas:
Suma de productos anlisis de covariancia
k

SPT = x ij y ij C
i=1 j=1

1
SP ( Tr )= T xi T yi C
n i=1
SPE=SPT SP(Tr )
donde el trmino de correccin, C, est dado por:
C=

T xi

y donde
de las
Ty

4.

es el total de las

para el

isimo

T x T y
k n

para el i-simo tratamiento,

tratamiento,

Tx

T yi

es el total

es el total de todas las

es el total de todas las y.

El total, el error y las sumas de cuadrados de tratamientos se calculan para las


ajustadas mediante las frmulas:

47

Sumas de cuadrados ajustadas anlisis de covariancia

( SPT )2
SS T y ' =SS T y
SS T x

SS E y ' =SS E y

( SPE )2
SS E x

SS (Tr ) y' =SS T y ' SS E y '


Los resultados en estos clculos se resumen de manera conveniente en el siguiente
tipo de tabla de anlisis de covariancia.

Fuente de
variacin

Suma de
cuadrado
s para

Suma de
cuadrado
s para

Suma de
productos

Grados de
libertad
para

y.

Suma de
cuadrados

Cuadro
medio

MS ( Tr ) y
Tratamient
o

SS (Tr )x

SS (Tr ) y

SP (Tr)

SS (Tr ) y'

k 1

'

SS ( Tr ) y '
k 1
MS E y

'

Error

SS E x

SS E y

SPE

SS E y '

nkk1

Total

SS T x

SS T y

SPT

SS T y '

SS E y'
nkk 1

nk2

Ntese que cada media de cuadrados se obtiene dividiendo la suma de cuadrados


correspondiente entre sus grados de libertad.
Por ltimo, la hiptesis nula
alterna de que no todas las

1= 2 == k =0

se prueba contra la hiptesis

son iguales a cero con base en el estadstico:

Razn F para tratamientos ajustados


F=

MS ( Tr ) y '
MS E y '

48

Se rechaza con un nivel de significancia si el valor obtenido de


F
con k 1 y nkk1 grados de libertad.

excede a

EJEMPLO. Supn que un investigador tiene tres sustancias limpiadoras diferentes,


A1 , A2
A3
y
que desea seleccionar la ms eficiente para limpiar una superficie
metlica. La limpieza de una superficie se mide por su poder de reflexin, expresado en
unidades arbitrarias como la razn del poder de reflexin observado con respecto al de
un espejo comn. El anlisis de covariancia debe utilizarse debido a que el efecto de la
sustancia limpiadora sobre el poder de reflexin depender de la limpieza original, es
decir, del poder de reflexin original de la superficie. El investigador obtuvo los
siguientes resultados:
A1

Poder de reflexin original,


Poder de reflexin final,

A2

A3

Poder de reflexin original,


Poder de reflexin final,

Poder de reflexin original,


Poder de reflexin final,

0.50

0.55

0.60

0.35

1.00

1.20

0.80

1.40

0.75

1.65

1.00

1.10

0.75

0.60

0.55

0.50

0.60

0.90

0.80

0.70

1.00

0.70

0.80

0.90

Determina mediante un anlisis de covariancia (con un nivel de significancia de 0.05) si


existen diferencias en las mejoras del poder de reflexin producidas por los tres agentes
limpiadores.
Solucin
1.

Hiptesis nula:

1= 2 = 3 =0.

Hiptesis alterna: no todas las

son iguales a cero.

2.

Nivel de significancia : =0.05

3.

Criterio: se rechaza la hiptesis nula si


k 1=31=2

4.

F> 4.46 , el valor de

nkk1=4 x 331=8

Clculos: los totales son:


T x 1=0.50+0.55+ 0.60+ 0.35=2.00
T x 2=0.75+1.65+1.00+1.10=4.50
49

F0.05

grados de libertad.

para

T x 3=0.60+0.90+ 0.80+0.70=3.00
T y1=1.00+ 1.20+0.80+1.40=4.40
T y2=0.75+0.60+0.55+ 0.50=2.40
T y3 =1.00+0.70+0.80+ 0.90=3.40
3

T x = T xi =T x 1+T x2 +T x 3=2.00+ 4.50+3.00=9.50


i=1

T y = T yi=T y 1+ T y 2 +T y3 =4.40+2.40+ 3.40=10.20


i=1

Para las
C x=

x , el trmino de correccin es:

T 2x ( 9.50 )2
=
=7.52
k n
3 4

y las sumas de cuadrados son:


0.50

2
x i C x =
i=12

SS T x =
i=1

+1.102 +0.602 +0.902 +0.802 +0.70 2 7.52


8.837.52=1.31

(T x 1 +T x 2+T x3 )
1
2
SS (Tr )x = T xiC x =
C x
n i=1
n
k =3

( 2.00 )2 + ( 4.50 )2+ ( 3.00 )2

7.52=8.317.52=0.79
4
50

SS E x =SS T x SS ( Tr ) x =1.310.79=0.52
Para las

y , el trmino de correccin es:

T 2y ( 10.20 )2
C y=
=
=8.67
kn
34
y las sumas de cuadrados son:
1.00

2
y i C y =
i =12

SS T y =
i=1

+0.502 +1.002 +0.702 +0.802 +0.90 2 8.67


9.458.67=0.78
2

(T y 1+ T y 2 +T y3 )
1
2
SS (Tr ) y = T yi C y =
C y
n i=1
n
k=3

( 4.40 )2 + ( 2.40 )2+ ( 3.40 )2


8.67=9.178.67=0.50
4
SS E y =SS T y SS (Tr ) y =0.780.50=0.28
Para las sumas de los productos, el trmino de correccin es:
C=

T x T y ( 9.50 ) (10.20 )
=
=8.08
k n
( 3)(4)

y obtenemos,
n

x ij y ijC=
j=1

SPT =
i=1

51

SP ( Tr )=

1
T T C=
n i=1 xi yi

SPE=SPT SP (Tr )=

5.

Decisin: Dado que

F=

0.035
=1.34
0.026

no sobrepasa 4.46, la hiptesis nula no

puede rechazarse. En otras palabras, no podemos concluir que alguna de las


sustancias limpiadoras sea ms eficaz que las otras.
Los mtodos de anlisis de covariancia no haban sido utilizados de manera amplia
sino hasta aos recientes, debido principalmente a que se requieren clculos ms
bien complicados. Por supuesto, con la mayor disponibilidad de computadoras y de
programas apropiados, esto ya no es problema. Hay varias formas en que el mtodo
de anlisis de covariancia presentado aqu puede generalizarse. En primer trmino,
puede haber ms de una variable concomitante; entonces, el mtodo puede aplicarse
a clases de diseo ms complicados, digamos, a un diseo en bloques aleatorios,
donde el coeficiente de regresin incluso podra considerarse diferente en cada
bloque.

TABLA 4.1(a) Valores de F0.05*


v2 = grados de
libertad para el
denominador.

10

12

15

20

1
2
3
4
5

161
18.50
10.10
7.71
6.61

200
19.00
9.55
6.94
5.79

216
19.20
9.28
6.59
5.41

225
19.20
9.12
6.39
5.19

230
19.30
9.01
6.26
5.05

234
19.30
8.94
6.16
4.95

237
19.40
8.89
6.09
4.88

239
19.40
8.85
6.04
4.82

241
19.40
8.81
6.00
4.77

242
19.40
8.79
5.96
4.74

244
19.40
8.74
5.91
4.68

246
19.40
8.70
5.86
4.62

248
19.40
8.66
5.80
4.56

6
7
8
9
10

5.99
5.59
5.32
5.12
4.96

5.14
4.74
4.46
4.26
4.10

4.76
4.35
4.07
3.86
3.71

4.53
4.12
3.84
3.63
3.48

4.39
3.97
3.69
3.48
3.33

4.28
3.87
3.58
3.37
3.22

4.21
3.79
3.50
3.29
3.14

4.15
3.73
3.44
3.23
3.07

4.10
3.68
3.39
3.18
3.02

4.06
3.64
3.35
3.14
2.98

4.00
3.57
3.28
3.07
2.91

3.94
3.51
3.22
3.01
2.85

3".87
3.44
3.15
2.94
2.77

11
12
13
14
15

4.84
4.75
4.67
4.60
4.54

3.98
3.89
3.81
3.74
3.68

3.59
3.49
3.41
3.34
3.29

3.36
3.26
3.18
3.11
3.06

3.20
3.11
3.03
2.96
2.90

3.09
3.00
2.92
2.85
2.79

3.01
2.91
2.83
2.76
2.71

2.95
2.85
2.77
2.70
2.64

2.90
2.80
2.71
2.65
2.59

2.85
2.75
2.67
2.60
2.54

2.79
2.69
2.60
2.53
2.48

2.72
2.62
2.53
2.46
2.40

2.65
2.54
2.46
2.39
2.33

16
17
18
19
20

4.49
3.45
4.41
4.38
4.35

3.63
3.59
3.55
3.52
3.49

3.24
3.20
3.16
3.13
3.10

3.01
2.96
2.93
2.90
2.87

2.85
2.81
2.77
2.74
2.71

2.74
2.70
2.66
2.63
2.60

2.66
2.61
2.58
2.54
2.51

2.59
2.55
2.51
2.48
2.45

2.54
2.49
2.46
2.42
2.39

2.49
2.45
2.41
2.38
2.35

2.42
2.38
2.34
2.31
2.28

2.35
2.31
2.27
2.23
2.20

2.28
2.23
2.19
2.16
2.12

v1 = grados de libertad para el numerador.

52

21
22
23
24
25

4.32
4.30
4.28
4.26
4.24

3.47
3.44
3.42
3.40
3.39

3.07
3.05
3.03
3.01
2.99

2.84
2.82
2.80
2.78
2.76

2.68
2.66
2.64
2.62
2.60

2.57
2.55
2.53
2.51
2.49

2.49
2.46
2.44
2.42
2.40

2.42
2.40
2.37
2.36
2.34

2.37
2.34
2.32
2.30
2.28

2.32
2.30
2.27
2.25
2.24

2.25
2.23
2.20
2.18
2.16

2.18
2.15
2.13
2.11
2.09

2.10
2.07
2.05
2.03
2.01

30
40
60
120

4.17
4.08
4.00
3.92
3.84

3.32
3.23
3.15
3.07
3.00

2.92
2.84
2.76
2.68
2.60

2.69
2.61
2.53
2.45
2.37

2.53
2.45
2.37
2.29
2.21

2.42
2.34
2.25
2.18
2.10

2.33
2.25
2.17
2.09
2.01

2.27
2.18
2.10
2.02
1.94

2.21
2.12
2.04
1.96
1.88

2.16
2.08
1.99
1.91
1.83

2.09
2.00
1.92
1.83
1.75

2.01
1.92
1.84
1.75
1.67

1.93
1.84
1.75
1.66
1.57

TABLA 4.1(b) Valores de F0.01*


v2 = grados de
libertad para el
denominador,

^ 2W

v1 = grados de libertad para el numerador,

^ 2B = k1

10

12

15

20

1
2
3
4
5

4,052
98.50
34.10
21.20
16.30

5,000
99.00
30.80
18.00
13.30

5,403
99.20
29.50
16.70
12.10

5,625
99.20
28.70
16.00
11.40

5,764
99.30
28.20
15.50
11.00

5,859
99.30
27.90
15.20
10.70

5,928
99.40
27.70
15.00
10.50

5,982
99.40
27.50
14.80
10.30

6,023
99.40
27.30
14.70
10.20

6,056
99.40
27.20
14.50
10.10

6,106
99.40
27.10
14.40
9.89

6,157
99.40
26.90
14.20
9.72

6,209
99.40
26.70
14.00
9.55

6
7
8
9
10

13.70
12.20
11..30
10.60
10.00

10.90
9.55
8.65
8.02
7.56

9.78
8.45
7.59
6.99
6.55

9.15
7.85
7.01
6.42
5.99

8.75
7.46
6.63
6.06
5.64

8.47
7.19
6.37
5.80
5.39

8.26
6.99
6.18
5.61
5.20

8.10
6.84
6.03
5.47
5.06

7.98
6.72
5.91
5.35
4.94

7.87
6.62
5.81
5.26
4.85

7.72
6.47
5.67
5.11
4.71

7.56
6.31
5.52
4.96
4.56

7.40
6.16
5.36
4.81
4.41

11
12
13
14
15

9.65
9.33
9.07
8.86
8.68

7.21
6.93
6.70
6.51
6.36

6.22
5.95
5.74
5.56
5.42

5.67
5.41
5.21
5.04
4.89

5.32
5.06
4.86
4.70
4.56

5.07
4.82
4.62
4.46
4.32

4.89
4.64
4.44
4.28
4.14

4.74
4.50
4.30
4.14
4.00

4.63
4.39
4.19
4.03
3.89

4.54
4.30
4.10
3.94
3.80

4.40
4.16
3.96
3.80
3.67

4.25
4.01
3.82
3.66
3.52

4.10
3.86
3.66
3.51
3.37

16
17
18
19
20

8.53
8.40
8.29
8.19
8.10

6.23
6.11
6.01
5.93
5.85

5.29
5.19
5.09
5.01
4.94

4.77
4.67
4.58
4.50
4.43

4.44
4.34
4.25
4.17
4.10

4.20
4.10
4.01
3.94
3.87

4.03
3.93
3.84
3.77
3.70

3.89
3.79
3.71
3.63
3.56

3.78
3.68
3.60
3.52
3.46

3.69
3.59
3.51
3.43
3.37

3.55
3.46
3.37
3.30
3.23

3.41
3.31
3.23
3.15
3.09

3.26
3.16
3.08
3.00
2.94

21
22
23
24
25

8.02
7.95
7.88
7.82
7.77

5.78
5.72
5.66
5.61
5.57

4.87
4.82
4.76
4.72
4.68

4.37
4.31
4.26
4.22
4.18

4.04
3.99
3.94
3.90
3.86

3.81
3.76
3.71
3.67
3.63

3.64
3.59
3.54
3.50
3.46

3.51
3.45
3.41
3.36
3.32

3.40
3.35
3.30
3.26
3.22

3.31
3.26
3.21
3.17
3.13

3.17
3.12
3.07
3.03
2.99

3.03
2.98
2.93
2.89
2.85

2.88
2.83
2.78
2.74
2.70

30
40
60
120

7.56
7.31
7.08
6.85
6.63

5.39
5.18
4.98
4.79
4.61

4.51
4.31
4.13
3.95
3.78

4.02
3.83
3.65
3.48
3.32

3.70
3.51
3.34
3.17
3.02

3.47
3.29
3.12
2.96
2.80

3.30
3.12
2.95
2.79
2.64

3.17
2.99
2.82
2.66
2.51

3.07
2.89
2.72
2.56
2.41

2.98
2.80
2.63
2.47
2.32

2.84
2.66
2.50
2.34
2.18

2.70
2.52
2.35
2.19
2.04

2.55
2.37
2.20
2.03
1.88

= k(n1)

TABLA 4.2(a) Valores de


p
g. l.
1
2
3
4
5

r p para =0.05 *

17.97
6.09
4.50
3.93
3.64

6.09
4.52
4.01
3.75

4.52
4.03
3.80

4.03
3.81

3.81
53

10

6
7
8
9
10

3.46
3.34
3.26
3.20
3.15

3.59
3.48
3.40
3.34
3.29

3.65
3.55
3.48
3.42
3.38

3.68
3.59
3.52
3.47
3.43

3.69
3.61
3.55
3.50
3.47

3.70
3.62
3.57
3.52
3.49

3.63
3.57
3.54
3.51

3.58
3.54
3.52

3.55
3.52

11
12
13
14
15

3.11
3.08
3.06
3.03
3.01

3.26
3.23
3.20
3.18
3.16

3.34
3.31
3.29
3.27
3.25

3.40
3.37
3.35
3.33
3.31

3.44
3.41
3.39
3.37
3.36

3.46
3.44
3.42
3.40
3.39

3.48
3.46
3.46
3.43
3.41

3.49
3.47
3.46
3.44
3.43

3.50
3.48
3.47
3.46
3.45

16
17
18
19
20

3.00
2.98
2.97
2.96
2.95

3.14
3.13
3.12
3.11
3.10

3.23
3.22
3.21
3.20
3.19

3.30
3.28
3.27
3.26
3.25

3.34
3.33
3.32
3.31
3.30

3.38
3.37
3.36
3.35
3.34

3.40
3.39
3.38
3.38
3.37

3.42
3.41
3.40
3.40
3.39

3.44
3.43
3.42
3.41
3.41

24
30
40
60
120

2.92
2.89
2.86
2.83
2.80

3.07
3.03
3.01
2.98
2.95

3.16
3.13
3.10
3.07
3.04

3.23
3.20
3.17
3.14
3.12

3.28
3.25
3.22
3.20
3.17

3.31
3.29
3.27
3.24
3.22

3.35
3.32
3.30
3.28
3.25

3.37
3.35
3.33
3.31
3.29

3.39
3.37
3.35
3.33
3.31

2.77

2.92

3.02

3.09

3.15

3.19

3.23

3.27

3.29

* Esta tabla se tom de H. L. Harter, Critical values for Duncans new multiple range test.

TABLA 4.2(b) Valores de


p
g. l.
1
2
3
4
5

r p para =0.01 *

90.02
14.04
8.26
6.51
5.70

14.04
8.32
6.68
5.90

8.32
6.74
5.99

6.76
6.04

6.07
54

10

6
7
8
9
10

5.24
4.95
4.74
4.60
4.48

5.44
5.15
4.94
4.79
4.67

5.55
5.26
5.06
4.91
4.79

5.62
5.33
5.13
4.99
4.88

5.66
5.38
5.19
5.04
4.93

5.68
5.42
5.23
5.09
4.98

5.44
5.26
5.12
5.01

5.28
5.14
5.04

5.16
5.06

11
12
13
14
15

4.39
4.32
4.26
4.21
4.17

4.58
4.50
4.44
4.39
4.34

4.70
4.62
4.56
4.51
4.46

4.78
4.71
4.64
4.59
4.55

4.84
4.77
4.71
4.66
4.61

4.89
4.81
4.75
4.70
4.66

4.92
4.85
4.79
4.74
4.70

4.95
4.88
4.82
4.77
4.73

4.97
4.91
4.85
4.80
4.76

16
17
18
19
20

4.13
4.10
4.07
4.05
4.02

4.31
4.27
4.25
4.22
4.20

4.43
4.39
4.36
4.33
4.31

4.51
4.47
4.45
4.42
4.40

4.57
4.54
4.51
4.48
4.46

4.62
4.59
4.56
4.53
4.51

4.66
4.63
4.60
4.57
4.55

4.70
4.66
4.64
4.61
4.59

4.72
4.69
4.66
4.64
4.62

24
30
40
60
120

3.96
3.89
3.82
3.76
3.70

4.13
4.06
3.99
3.92
3.86

4.24
4.17
4.10
4.03
3.97

4.32
4.25
4.18
4.11
4.04

4.39
4.31
4.24
4.18
4.11

4.44
4.36
4.29
4.23
4.16

4.48
4.41
4.33
4.37
4.20

4.52
4.45
4.38
4.31
4.24

4.55
4.48
4.41
4.34
4.27

3.64

3.80

3.90

3.98

4.04

4.09

4.13

4.17

4.21

* Esta tabla se tom de H. L. Harter, Critical values for Duncans new multiple range test.

PROBLEMAS RESUELTOS
4.2. Diseos completamente aleatorios
Problema 4.1. Se efecta un experimento para comparar la accin limpiadora de
dos detergentes: el detergente A y el detergente B. Veinte muestras de ropa se manchan
con mugre y grasa, cada una se lava con uno de los detergentes en una lavadora
automtica y se mide despus la blancura. Critica los siguientes aspectos del
experimento:
a) Todo el experimento se realiza con agua suave.
b) Quince muestras se lavan con el detergente A y cinco con el detergente B.
c) Para acelerar la prueba, se emplean en el experimento agua muy caliente y tiempos
de lavado de 30 segundos.

55

d) Las mediciones de blancura de todas las muestras lavadas con el detergente A se


hacen primero.
Respuesta:
a) Si el experimento se realiza con agua suave, los resultados solo pueden ser validos
en agua blanda. Tambin deben utilizarse otros tipos de agua.
b) Con 15 resultados para el detergente A y solo 5 para el detergente B, la variabilidad
para el detergente A se conoce con mayor precisin que para el detergente B. Deben
usarse muestras del mismo tamao.
c) Se emplea en el experimento agua muy caliente y un tiempo de lavado muy corto.
No se consideran las circunstancias normales de lavado usando una baja
temperatura del agua y un mayor tiempo de lavado.
d) Puede haber un efecto del tiempo para el proceso de medicin de la determinacin
de la blancura. Por ejemplo, el instrumento de medicin puede requerir de la
calibracin despus de unas cuantas lecturas. Los resultados de la prueba pueden
estar sesgados en este caso.
Problema 4.2. Un bebedor desea averiguar la causa de sus frecuentes malestares
despus de las borracheras, y realiza el siguiente experimento. La primera noche slo
ingiere whiskey y agua; la segunda toma vodka y agua; la tercera ginebra y agua, y en la
cuarta, ron y agua. Cada una de las maanas siguientes senta el malestar, y concluy
que el factor comn, el agua, era la causa de sus malestares.
a) Esta conclusin obviamente carece de fundamentos, pero puedes citar qu
principios de un diseo experimental firme se han violado?
b) Da un ejemplo menos obvio de un experimento que tenga el mismo inconveniente.
c) Supn que nuestro amigo modific su experimento de tal forma que ingiri cada
una de las cuatro bebidas alcohlicas con agua y sin ella; as que el experimento
duro ocho noches. Podran servir los resultados de este experimento modificado
para apoyar o refutar la hiptesis de que el agua fue la causa de los malestares?
Explica tu respuesta.
Respuesta:
a) El problema es que el efecto del agua se confunde con el efecto del alcohol.
b) Muchas veces los experimentos con humanos se realizan solo con voluntarios, y los
resultados se comparan con los resultados observados de la poblacin en general.
Estos resultados se confunden con un efecto de voluntariado. La gente de
voluntariado para experimentos, particularmente experimentos mdicos, son muy
diferentes al resto de la poblacin, son educados.
c) Esto elimina al agua como la nica causa de los malestares. Nuestro bebedor podra
concluir que amanecer con resaca independientemente de lo que tome.
Problema 4.3. Para comparar la eficiencia de tres mtodos de enseanza de
programacin de cierta computadora (el mtodo A consiste en instruccin directa con la
56

computadora, el mtodo B requiere la intervencin de un instructor y de algunas


prcticas directas con la computadora y el mtodo C que tan slo exige atencin
personal de un instructor), se extraen de grandes grupos de personas instruidas por los
tres mtodos muestras de tamao cuatro. Las calificaciones que se obtuvieron en una
prueba de aprovechamiento adecuada son las siguientes:
Mtodo A
73
77
67
71

Mtodo B
91
81
87
85

Mtodo C
72
77
76
79

a) Calcula:
k

( y ij y )2 ; ( y ij y i) 2 ; n ( y i y ) 2 .
i=1 j=1

i=1 j=1

i=1

Y comprueba la identidad del Teorema 4.1.

( y ij y )2= ( y ij y i) 2+ n ( y i y )2
i=1 j=1
i=1 j=1
i=1

SST

SSE

SS(Tr)

b) Verifica los resultados obtenidos para las tres sumas de cuadrados empleando las
frmulas siguientes.
Suma de cuadrados para muestras de tamaos distintos
k

ni

SST =
i =1 j=1

T 2i
y C , SS ( Tr ) = C
i=1 ni
k

2
ij

Solucin:
a) La media general es:

57

n=4

y Bj + y Cj
n= 4

j=1
n=4

y Aj+
j=1

j=1

k=C n=12

1
y =
n i= A

j=1

1
y ij =
n

1
( y + y + y + y ) + ( y B 1 + y B 2 + y B 3+ y B 4 ) + ( y C 1 + y C 2 + y C 3 + y C 4 ) ]
n [ A1 A2 A 3 A 4

1
[ ( 73+77+67 +71 )+ ( 91+81+87+ 85 )+ ( 72+ 77+76+79 ) ]
12

1
[ 288+344 +304 ] =78.
12

Las desviaciones con respecto a la media son:


Mtodo A

Ai y

Mtodo B

Bi y

Mtodo C

Ci y

73
77
67
71

5
1
11
7

91
81
87
85

13
3
9
7

72
77
76
79

6
1
2
1

La suma de los cuadrados de las desviaciones es:


Mtodo A

Ai y

Mtodo B

Bi y

Mtodo C

Ci y

73
77
67
71
Suma:

25
1
121
49
196

91
81
87
85

169
9
81
49
308

72
77
76
79

36
1
4
1
42
546

Total:
Por lo tanto,

58

SST = ( y ij y ) =546
2

i =1 j=1

Las medias para las tres muestras son:


Mtodo A:
n =4

y A 1 + y A 2 + y A 3 + y A 4 73+77+67+71 288
1
y A = y Aj =
=
=
=72 Mtodo B:
n j =1
n
4
4
n=4

y + y +y +y
1
91+81+87+ 85 344
y B = y Bj = B 1 B 2 B 3 B 4 =
=
=86
n j=1
n
4
4
Mtodo C:
n=4
y C 1+ y C 2+ y C 3 + y C 4 72+77+76+ 79 304
1
y C = y Cj=
=
=
=76
n j=1
n
4
4

En resumen las medias para las tres muestras son:

Mtodo A

Mtodo B

Mtodo C

y A =72

y B =86

y C =76

Las desviaciones de cada media con respecto a su propia media son:


Mtodo A

Ai y A

Mtodo B

Bi y B

Mtodo C

Ci y C

73
77
67
71

1
5
5
1

91
81
87
85

5
5
1
1

72
77
76
79

4
1
0
3

La suma de los cuadrados de las desviaciones es:

59

Mtodo A

Ai y A

Mtodo B

Bi y B

Mtodo C

Ci y C

73
77
67
71
Suma:

1
25
25
1
52

91
81
87
85

25
25
1
1
52

72
77
76
79

16
1
0
9
26
130

Total:
Por lo tanto,
k

SSE= ( yij yi ) 2=130.


i=1 j=1

Las desviaciones de las medias individuales de las muestras con respecto a la media
general y las variancias, son:
Mtod
o

y i ,i= A , B ,C

( y i y )

( y i y )

72

78

36

86

78

64

76

78

Suma:

104

Entonces,
k

SS (Tr )=n ( y i y ) =4 ( 104 )=416


2

i=1

b) El tamao total de la muestra es

N=4+ 4+ 4=12 , y los totales de cada muestra

son:
Mtodo A

Mtodo B

Mtodo C

288

344

304

Entonces,
60

T =288+344+ 304=936.

T 2i T 2A T 2B T 2C ( 288 )2 (344 )2 ( 304 )2


n =n +n + n = 4 + 4 + 4
i=1
i
A
B
C
k

20,736+29,584+ 23,104=73,424
2

C=

T 2 ( 936 )
=
=73,008.
N
12

SS (Tr )=
i=1

T 2i
C=73,42473,008=416
ni

La suma de los cuadrados de todas las observaciones es 73,554:

Mtodo A

Mtodo B

Mtodo C

y ij

y 2ij

73
77
67
71
91
81
87
85
72
77
76
79
Suma:

5,329
5,929
4,489
5,041
8,281
6,561
7,569
7,225
5,184
5,929
5,776
6,241
73,554

Por lo tanto,
k

ni

SST = y ij C=73,55473,008=546
i =1 j=1

61

SSE=SST SS ( Tr ) =546416=130 .
Estas cifras concuerdan con las del inciso (a).
Problema 4.4. Mediante las sumas de cuadrados obtenidas en el Problema 4.3,
prueba con un nivel de significancia =0.05 si las diferencias obtenidas para las tres
muestras son significativas.
Solucin:
La tabla del anlisis de variancia es:
Fuente de
variacin

Grados de
libertad

Suma de
cuadrados

Media cuadrada

SS ( Tr )
MS ( Tr ) =
k 1
k 1
Tratamientos
= 3 1= 2

MS ( Tr )
MSE

SS (Tr )
416

=208
31

= 416

208
14.44

14.40

MSE=
Error

Nk=123=9

SSE
= 130

Total

N1=121=11

SSE
N k

130
=14.44
123

SST
= 546

Puesto que el valor crtico se encuentra en el nivel 0.05 para una distribucin F con 2 y
9 grados de libertad. De la Tabla 4.1, se obtiene el valor de 4.26. Como el valor de la F
calculada es mayor a la F estimada, se rechaza la hiptesis nula de que las medias son
todas iguales.

Problema 4.5. Las cifras siguientes son el nmero de errores realizados en cinco
das consecutivos de trabajo por cuatro tcnicos de un laboratorio fotogrfico:
62

Tcnico I

Tcnico II

Tcnico III

Tcnico IV

6
14
10
8
11

14
9
12
10
14

10
12
7
15
11

9
12
8
10
11

=0.01

Prueba con un nivel de significancia

si las diferencias entre las cuatro

muestras pueden atribuirse al azar.


Solucin:
La hiptesis nula es que la media del nmero de errores es la misma para los cuatro
tcnicos. La hiptesis alternativa es que las medias no son iguales.
Utilizando las etapas para pruebas de hiptesis, obtenemos:
I =II = III = IV

1. Hiptesis nula:

Hiptesis alterna: las

no son iguales.

2. Nivel de significancia: =0.01 .


3. Criterio: Se rechaza la hiptesis nula si
k 1=41=3 ,
F

donde

F>5.29 , el valor de

Nk=204=16

F0.01

para:

grados de libertad,

es determinado por un anlisis de variancia; de lo contrario, lo

aceptamos.
Para ello, hacemos uso de la Tabla 4.1.
4. Clculos:
Tcnico I
6
14
10
8
11

Tcnico II
14
9
12
10
14

Tcnico III
10
12
7
15
11

Tcnico IV
9
12
8
10
11

T I =49

T II =59

T III =55

T IV =50

63

IV

T = T i=T I +T II +T III +T III =49+59+55+50=213


i=I

n I =5

n II =5

n III =5

n IV =5

k =IV

N= ni=n I +n II +n III + nIV =5+5+5+ 5=20


i=I

y 2IIj + y 2IIIj + y 2IVj


j=1

j =1

y 2Ij +
j=1

ni

y 2ij=
j=1

j=1

k=IV

i=I

( y 2I 1+ y 2I 2 + y 2I 3 + y 2I 4 + y 2I 5) + ( y 2II 1 + y 2II 2 + y 2II 3 + y 2II 4 + y 2II 5 )


+ ( y 2III 1 + y 2III 2+ y 2III 3+ y 2III 4 + y 2III 5 ) + ( y 2IV 1 + y 2IV 2 + y 2IV 3+ y 2IV 4 + y 2IV 5 )
Utilizando Excel:
2

Tcnico
I

y Ij ,

Tcnico
j=1, , 5 II

y IIj ,
j=1, , 5

Tcnico
III

y IIIj ,

Tcnico
j=1, , 5 IV

y IVj ,
j=1, , 5

36

14

196

10

100

81

14

196

81

12

144

12

144

10

100

12

144

49

64

64

10

100

15

225

10

100

11

121

14

196

11

121

11

121

Suma:

517

717

639

510

ni

y 2ij=
j=1
k=IV

i=I

T 2 (213)
C= =
=2,268.45
N
20
64

2,383

En las expresiones para calcular las sumas de cuadrados, obtenemos:


k

ni

SST = y 2ij C=2,3832,268.45=114.55


i =1 j=1

k=IV

SS (Tr )=
i= I

T 2i
T 2I T 2II T 2III T 2IV
C=
+ +
+
C
ni
n I nII n III n IV

492 592 552 50 2


+
+
+
2,268.45
5
5
5
5

[ 480.2+696.2+605+500 ] 2,268.45=2,281.402,268.45=12.95 .
y tambin,
SSE=SST SS ( Tr ) =114.5512.95=101.60 .
El resto del trabajo se advierte en la siguiente tabla de anlisis de variancia.
Fuente de
variacin

Grados de
libertad

Suma de
cuadrados

Media cuadrada

SS ( Tr )
MS ( Tr ) =
k 1
k 1
Tratamientos
= 4 1= 3

MS ( Tr )
MSE

SS (Tr )
12.95

=4.3167
41

= 12.95

4.3167
6.3500
0.68

MSE=

Nk
Error

204
16

SSE
= 101.60

N1
Total

201

19

SST
= 114.55

65

SSE
N k

101.60
=6.3500
204

5. Decisin: Dado que el valor crtico en el nivel de significancia de 0.01 para una
distribucin F con 3 y 16 grados de libertad es 5.29. F = 0.68 no sobrepasa 5.29, o
F0.01
sea el valor de
para 3 y 16 grados de libertad, la hiptesis nula no puede
rechazarse; en otras palabras, no podemos concluir que existe una diferencia en los
errores de los tcnicos.
Problema 4.6. Los datos siguientes se refieren a las prdidas de peso de ciertas
piezas mecnicas (en miligramos) debidas a la friccin, cuando tres lubricantes
diferentes se utilizaron en condiciones controladas.
Lubricante A:

12.2,

11.8,

13.1,

11.0,

3.9,

4.1,

10.3,

8.4

Lubricante B:

10.9,

5.7,

13.5,

9.4,

11.4,

15.7,

10.8,

14.0

Lubricante C:
12.7, 19.9, 13.6, 11.7, 18.3, 14.3, 22.8, 20.4
a) Prueba con un nivel de significancia de 0.01 si las diferencias entre las medias
muestrales puede atribuirse al azar.
b) Estima los parmetros del modelo usado en el anlisis de este experimento.
Solucin:
a) La hiptesis nula es que las prdidas de peso para los tres lubricantes son las
mismas. La hiptesis alternativa es que las prdidas de peso no son las mismas.
Utilizando las etapas para pruebas de hiptesis, obtenemos:
A =B =C

1. Hiptesis nula:

Hiptesis alterna: las

no son iguales.

2. Nivel de significancia: =0.01 .


3. Criterio: Se rechaza la hiptesis nula si
k 1=31=2 ,

donde

F>5.78 , el valor de

Nk=243=21

F0.01

para:

grados de libertad,

es determinado por un anlisis de variancia; de lo contrario, lo

aceptamos.
Para ello, hacemos uso de la Tabla 4.1.
4. Clculos:
Lubricante A

Lubricante B

12.2

10.9
66

Lubricante C
12.7

11.8

5.7

19.9

13.1

13.5

13.6

11.0

9.4

11.7

3.9

11.4

18.3

4.1

15.7

14.3

10.3

10.8

22.8

8.4

14.0

20.4

T A =74.8

T B=91.4

T C =133.7

T = T i=T A +T B +T C =74.8+91.4 +133.7=299.90


i= A

n A =8

n B=8

nC =8

k =C

N= ni=n A +n B +nC =8+8+8=24


i= A

y 2Bj + y 2Cj
j=1
8

y 2Aj +
j=1
8

ni

y 2ij=
j=1

j=1

k=C

i= A

( y 2A 1 + y 2A 2+ y 2A 3+ y 2A 4 + y 2A 5+ y 2A 6 + y 2A 7 + y 2A 8 ) +

( y 2B 1+ y 2B 2 + y 2B 3 + y 2B 4 + y 2B 5 + y 2B 6 + y 2B 7 + y 2B 8 )+
( y 2C 1 + y 2C 2+ y 2C 3+ y 2C 4 + y 2C 5+ y 2C 6+ y 2C 7+ y 2C 8) +
Utilizando Excel:
Lubricante
A
12.2
11.8
13.1
11.0

y 2Aj ,

y 2Bj ,

j=1, , 5

Lubricante
B

j=1, , 5

148.84
139.24
171.61
121

10.9
5.7
13.5
9.4

118.81
32.49
182.25
88.36
67

Lubricante
C
12.7
19.9
13.6
11.7

y 2Cj ,
j=1, , 5
161.29
396.01
184.96
136.89

3.9
4.1
10.3
8.4

15.21
16.81
106.09
70.56
789.36

11.4
15.7
10.8
14.0

129.96
246.49
116.64
196.00
1,111.00

18.3
14.3
22.8
20.4

334.89
204.49
519.84
416.16
2,354.53

ni

y 2ij=
j=1
k=C

4,254.89

i= A

C=

T 2 (299.90)
=
=3,747.5
N
24

En las expresiones para calcular las sumas de cuadrados, obtenemos:


k=C

ni

SST = y 2ij C=4,254.893,747.5=507.39


i= A j=1

k=C

SS (Tr )=
i= A

Ti
T T T
C= A + B + C C
ni
n A n B nC

74.82 91.42 133.7 2


+
+
3,747.5
8
8
8

[ 699.38+ 1,044.25+2,234.46 ] 3,747.5=3,978.093,747.5


230.59 .
y tambin,
SSE=SST SS ( Tr ) =507.39230.59=276.80 .
El resto del trabajo se advierte en la siguiente tabla de anlisis de variancia.

Fuente de
variacin

Grados de
libertad

Suma de
cuadrados

Media cuadrada

68

MS ( Tr ) =

k 1
Tratamientos

= 3 1= 2

SS ( Tr )
k 1

MS ( Tr )
MSE

SS (Tr )

230.59

=115.295
31

= 230.59

115.295
13.18

8.747

MSE=

Nk

Error

243
21

SSE

= 276.80

SSE
N k

276.80
=13.18
243

N1

Total

241

SST

23

= 507.39

5. Decisin: Dado que el valor crtico en el nivel de significancia de 0.01 para una
distribucin F con 2 y 21 grados de libertad es 5.78. F = 8.747 > 5.78, podemos
rechazar la hiptesis nula. Las prdidas de peso no son las mismas para los tres
lubricantes.
b) Para los datos de los tres lubricantes obtenemos:
^= y =

T 299.90
=
=12.496,
N
24

^ A= y A y =

TA
74.8
y =
12.496=3.146,
nA
8

^ B= y B y =

TB
91.4
y =
12.496=1.071,
nB
8

^ C = y C y =

TC
133.7
y =
12.496=4.2165,
nC
8

69

i= A + B + C =3.1461.071+ 4.2165=0.0005 0
k=C

i= A

Problema 4.7 Para encontrar el efecto de la carga de polvo en la salida de un


sistema con un
precipitante, se efectuaron las siguientes mediciones:
Flujo total
(m3/hora)

Carga del polvo de salida


(gramos por m3 en el tubo de gas)

200

1.5

1.7

1.6

1.9

1.9

300

1.5

1.8

2.2

1.9

2.2

400

1.4

1.6

1.7

1.5

1.8

500

1.1

1.5

1.4

1.4

2.0

=0.05

para probar si el flujo a travs del

Emplea un nivel de significancia

precipitante tiene algn efecto sobre la carga del polvo de salida.


Solucin:

Problema 4.8. Con objeto de estudiar el rendimiento de un motor fuera de borda,


recientemente diseado, se cronometr sobre un trayecto determinado en diversas
condiciones acuticas y del viento:

Condiciones de calma:

20,

17,

14,

24

Condiciones moderadas:

21,

23,

16,

25,

18,

Condiciones agitadas:

26,

24,

23,

29,

21,

23

Utiliza un nivel de significancia de =0.05 .


Solucin:

Problema 4.9. Para determinar la mejor disposicin de los instrumentos sobre un


tablero de control de un aeroplano, se prueban tres distintos arreglos simulando una
situacin de emergencia y observando el tiempo de reaccin requerido para corregir la
avera. Los tiempos de reaccin (en dcimas de segundo) de 28 pilotos (aleatoriamente
asignados a los diversos arreglos) son los siguientes:
Disposicin 1:

14
,

13
,

9,

15
,

11,
70

13
,

14
,

11

Disposicin 2:

10
,

12
,

9,

7,

11,

9,

12
,

9,

Disposicin 3:

11,

5,

9,

10
,

6,

8,

8,

Con un nivel de significancia

10
,

13
,

9,

10

=0.01 prueba si podemos rechazar la hiptesis nula

de que las diferencias entre los disposiciones no tuvieron efecto alguno.


Solucin:
Utilizando las etapas para pruebas de hiptesis, obtenemos:
1. Hiptesis nula:

D 1= D 2= D 3

Hiptesis alterna: las

no son iguales.

2. Nivel de significancia: =0.01 .


3. Criterio: Se rechaza la hiptesis nula si
k 1=31=2 ,
F

donde

F>5.57 , el valor de

Nk=283=25

F0.01

para:

grados de libertad,

es determinado por un anlisis de variancia; de lo contrario, lo

aceptamos.
Para ello, hacemos uso de la Tabla 4.1.
4. Clculos:

Disposicin 1
14
13
9
15
11
13
14
11

Disposicin 2
10
12
9
7
11
8
12
9
10
13
9
10
71

Disposicin 3
11
5
9
10
6
8
8
7

T 1 =100

T 2 =120

T 3 =64

D3

T = T i=T 1+ T 2 +T 3=100+120+64=284
i=D 1

n1=8

n2=12

n3=8

k =3

N= ni=n1 +n 2+ n3=8+12+ 8=28


i=1

y 22 j + y 23 j
j=1
12

y 21 j +
j =1
8

ni

y 2ij=
j=1

j=1

k=3

i=1

( y 211 + y 212 + y 213+ y 214+ y 215+ y 216 + y 217 + y 218 ) +


( y 221 + y 222+ y 223 + y 224 + y 225 + y 226 + y 227+ y228 + y 229 + y 2210 + y 2211+ y 2212 )
( y 231+ y 232+ y 233 + y 234 + y 235+ y 236+ y 237 + y 238 ) +

Utilizando Excel:
2

y1 j ,

Disposicin
1

j=1, , 8

Disposicin
2

14
13
9
15
11
13
14

196
169
81
225
121
169
196

10
12
9
7
11
8
12

Disposicin
3
j=1, , 12
100
144
81
49
121
64
144

72

y2 j ,

11
5
9
10
6
8
8

y3 j ,
j=1, , 8

121
25
81
100
36
64
64

11

121

Suma:

1,278

9
10
13
9
10

81
100
169
81
100
1,234

49

540
ni

y 2ij=
j=1
k=3

i=1

2
T (284)
C= =
=2,880.57
N
28

En las expresiones para calcular las sumas de cuadrados, obtenemos:


k=3 ni

SST = y ij C=3,0522,880.57=171.43
i =1 j=1

k=C 3

SS (Tr )=
i=1

T 2i
T2 T 2 T 2
C= 1 + 2 + 3 C
ni
n1 n2 n3
2

100 120 64
+
+
2,880.57
8
12
8

[ 1,250+ 1,200+ 512 ] 2,880.57=


81.43 .

y tambin,
SSE=SST SS ( Tr ) =171.4381.43=90.00
El resto del trabajo se advierte en la siguiente tabla de anlisis de variancia.

73

3,052

Grados de
libertad

Fuente de
variacin

Suma de
cuadrados

Media cuadrada

F
MS ( Tr )
MSE

SS ( Tr )
MS ( Tr ) =
k 1
k 1

Tratamientos

SS (Tr )

= 3 1= 2

= 81.43

81.43
=40.715
31

40.715
3.600

11.31
MSE=

Nk
283

Error

SSE
= 90.00

25

SSE
N k

90.00
=3.60
283

N1
Total

281

SST

27

= 171.43

5. Decisin: Dado que el valor crtico en el nivel de significancia de 0.01 para una
distribucin F con 2 y 25 grados de libertad es 5.57. Por lo tanto, F = 11.31 > 5.57,
podemos rechazar la hiptesis nula. Los tiempos medios de reaccin no son los
mismos para las tres disposiciones.
Problema 4.10. Varias aleaciones de aluminio se han considerado para utilizarse
en aplicaciones de circuitos destinados a servicio pesado. Entre las propiedades
deseadas est una baja resistencia, y varios modelos de cada alambre se prueban
aplicando un voltaje fijo a una longitud determinada de alambre y se mide la corriente
que fluye a travs del alambre. Dados los resultados siguientes, puedes concluir que las
aleaciones difieren en resistencia? (Emplea un nivel de significancia de 0.01.)
Aleacin

Corriente (amperes)

1
2

1.085
1.051

1.016
0.993

1.009
1.022

1.034

0.985

1.001

0.990

0.988

1.101

1.015

74

1.011

Solucin:
Problema 4.11. Se realizan dos pruebas de la resistencia a la compresin en seis
muestras de concreto. La fuerza que fractura cada muestra de forma cilndrica, medida
en kilogramos, est dada en la siguiente tabla:
Muestra
A

Prueba 1

110

125

98

95

104

115

Prueba 2

105

130

107

92

96

121

Prueba con un nivel de significancia de 0.05 si estas muestras difieren en su resistencia


a la compresin.
Solucin:

Problema 4.12. Refirindonos a la exposicin de la seccin 4.1 ALGUNOS


PRINCIPIOS GENERALES pgina 1, supn que las desviaciones estndar de los pesos
de los revestimientos de estao determinados por cada uno de los laboratorios tienen el
valor comn =0.012 , supn tambin que se desea detectar con una confianza del
95% alguna diferencia en las medias entre dos de los laboratorios en ms de 0.01
kilogramos en el fondo de la lata. Demuestra que estas suposiciones llevan a la decisin
de enviar una muestra de 12 discos a cada laboratorio.
Solucin:

Problema 4.13. Demuestra que, si

i=+ i

se sigue que:
k

i=0
i=1

Solucin:
Usamos la notacin:
k

N= ni
i=1

para el tamao total de la muestra.

75

,y

es la media de las

Definimos a

como:
k

1
n
N i=1 i i

E [ Y ij ]

que es la media de las esperanzas

. Adems,

i=1

i=1

i=+ i

i= i
k

i=1

i=1

n i i= n i ( i )
k

i=1

i=1

n i i n i

ni iN=0
i=1

Problema 4.14. Verifica las siguientes frmulas:


Suma de cuadrados en muestras de igual tamao:
ni

SST = y ij C
i =1 j=1

SS (Tr )=

1
T 2i C

n i=1

Donde C, denominado trmino de correccin, est dado por:


2

C=

T
kn

Solucin:

76

Problema 4.15. Establece y prueba un resultado anlogo al Teorema 4.1 para el


ni
caso de que el tamao de la i-sima muestra sea
, esto es, donde los tamaos
muestrales no necesariamente son iguales.
Teorema 4.1: Identidad para el anlisis con un criterio de clasificacin.
k

ni

ni

( y ij y ) = ( y ij y i) 2+ n ( y i y )2
i=1 j=1
i=1 j=1
i=1

SST

SSE

SS(Tr)

Solucin:
Usando la notacin:
k

N= ni .
i=1

ni

ni

SST = ( y ij y )2= ( y 2ij 2 y ij y + y 2 )


i =1 j=1

i=1 j=1

ni

ni

2
ij

ni

y 2 y y ij + y
i=1 j=1

i=1 j=1

ni

i=1 j=1

ni

y ij
+ N y 2
N
i=1 j=1

2
ij

y 2 N y
i=1 j=1

ni

y ij 2 N y + N y
i=1 j=1

ni

y 2ij N y 2
i=1 j=1
k

ni

y ij C
i=1 j=1

Donde

77

C=N y 2=N

T
T
=
N
N

( )

De manera semejante:
k

SS (Tr )= ni ( y i y ) = ni ( y i 2 y y i+ y
2

i=1

i=1

i=1

i=1

i=1

ni y i22 y n i y + y 2 ni

ni
i=1

k
Ti 2
T
T
T
2 ni i + N
ni
N i=1 ni
N

( )

( )

k
T 2i
T
T2
2 T i +
ni
N i=1
N
k


i =1

T 2i
T 2 T2
2 +
ni
N N
k


i=1

k
T 2i
T2
T2
= i C
ni
N i=1 ni
k


i=1

Problema 4.16. El contenido de aflatoxina de algunas muestras de crema de


cacahuate se prueba y se consiguen los siguientes resultados:
Contenido de aflatoxina (ppb)
Marca A
Marca B
0.5
4.7
0.0
6.2
3.2
0.0
1.4
10.5
0.0
2.1
1.0
0.8
78

8.6
2.9

a)

Emplea el anlisis de variancia para probar si las dos marcas difieren en contenido
de aflatoxina.
b) Prueba la misma hiptesis usando una prueba t bimuestral.
c) Puede comprobarse que el estadstico t con v grados de libertad y el estadstico F
con 1 y v grados de libertad estn relacionados por la frmula
F ( 1, v )=t 2 (v )
donde v = grados de libertad. Con este resultado prueba que los mtodos de
anlisis de variancia y la prueba t bimuestral son equivalentes en este caso.
Solucin:

79

4.3. Diseos en bloques aleatorios


Problema 4.17. Un tcnico laboratorista mide la resistencia a la ruptura de cinco
clases de fibras textiles por medio de cuatro distintos instrumentos, y obtiene los
siguientes resultados (en onzas).
Instrumento de medicin
I1

I2

I3

I4

Fibra 1

20.6

20.7

20.0

21.4

Fibra 2

24.7

26.5

27.1

24.3

Fibra 3

25.2

23.4

21.6

23.9

Fibra 4

24.5

21.5

23.6

25.2

Fibra 5

19.3

21.5

22.2

20.6

Considerando las fibras como tratamientos y los instrumentos como bloques realiza un
anlisis de variancia con un nivel de significancia de =0.01 .
Solucin:
La hiptesis nula es que las medias de la resistencia a la ruptura de las cinco fibras son
iguales. La hiptesis nula es que no son iguales. Para construir la tabla de anlisis de
variancia, primero debemos calcular las sumas de las filas y de las columnas:
y 1 j= y 11 + y 12+ y 13 + y 14=20.6+20.7 +20.0+21.4=8.27 .
4

T 1. =
j=1

y 2 j= y 21 + y 22+ y 23+ y 24 =24.7+26.5+27.1+24.3=102.6 .


4

T 2. =
j =1

y 3 j= y 31+ y 32+ y 33+ y 34 =25.2+ 23.4+21.6+23.9=94.1 .


4

T 3. =
j=1

y 4 j= y 41 + y 42+ y 43+ y 44=24.5+21.5+23.6 +25.2=94.8 .


4

T 4.=
j=1

80

y 1 j= y 51 + y 52+ y53 + y 54=19.3+ 21.5+22.2+ 20.6=83.6 .


4

T 5.=
j=1

y i 1= y 11 + y 21 + y 31+ y 41 + y 51
5

T .1 =
i=1

20.6+24.7+25.2+24.5+19.3=114.3 .

y i 2= y 12+ y 22 + y 32+ y 42+ y52


5

T .2 =
i=1

20.7+26.5+23.4 +21.5+21.5=113.6 .
y i 3= y 13+ y 23+ y 33 + y 43 + y 53
5

T .3 =
i=1

20.0+27.1+21.6+23.6+ 22.2=114.5

y i 4= y14 + y 24 + y 34 + y 44 + y 54
5

T .4 =
i=1

21.4+24.3+23.9+ 25.2+ 20.6=115.4 .


4

y ij= 457.8
j=1

T ..=
i=1

Estas sumas en forma de tabla son:


Instrumento de medicin

Fibra 1

I1

I2

I3

I4

20.6

20.7

20.0

21.4

81

T 1. =82.7

Fibra 2

24.7

26.5

27.1

24.3

T 2. =102.6

Fibra 3

25.2

23.4

21.6

23.9

T 3. =94.1

Fibra 4

24.5

21.5

23.6

25.2

T 4.=94.8

Fibra 5

19.3

21.5

22.2

20.6

T 5. =83.6

T .1 =114.3

T .2 =113.6

T .3 =114.5

As,
2

T
( 457.8 )
C= .. =
=10,479.042.
ab (5)( 4)
T 2i . = T 21. +T 22. +T 23. +T 24. +T 25.
5

i=1

( 82.7 )2 + ( 102.6 )2 + ( 94.1 )2 + ( 94.8 )2 + ( 82.7 )2 =42,196.86


2

T . j=T .1 +T .2 +T .3 +T .4
4

j=1

( 114.3 ) + ( 113.6 ) + ( 114.5 ) + ( 115.4 ) =52,396.86


La suma de todas las observaciones al cuadrado es:
a=5 b =4

b=4

y = ( y 21 j + y 22 j + y 23 j+ y 24 j + y 25 j )
2
ij

i=1 j=1

b=4

j=1

b=4

y + y + y 25 j
2
3j

j=1

2
4j

j=1

b=4

y 2 j +
2

j=1
b=4

y 21 j +
j=1
b=4

j=1

82

T .4 =115.4

T .. =457.8

( y 211 + y 212 + y 213+ y 214 ) + ( y 221 + y 222+ y 223+ y 224 )


+ ( y 231 + y 232+ y 233 + y 234 ) + ( y 241+ y 242+ y 243+ y 244 )
+ ( y 251 + y 252 + y 253 + y 254 )
Si lo hacemos con Excel se simplifica el clculo:
Instrumento de medicin

I1
Fibra 1
Fibra 2
Fibra 3
Fibra 4
Fibra 5

2
i1

I2

20.6
24.7
25.2
24.5
19.3

424.36
610.09
635.04
600.25
372.49
SUMA: 2,642.23

20.7
26.5
23.4
21.5
21.5

y 2i 2

I3

428.49
702.25
547.56
462.25
462.25
2,602.8

20
27.1
21.6
23.6
22.2

y 2i 3
400
734.41
466.56
556.96
492.84
2,650.77

I4
21.4
24.3
23.9
25.2
20.6

y 2i 4
457.96
590.49
571.21
635.04
424.36
2,679.06

i=1,2,3,4,5.

En la tabla
Por lo tanto,

a=5 b =4

y 2ij =10,574.86
i=1 j=1

a =5 b=4

SST = y ij C=10,574.8610,479.042=95.818 .
2

i=1 j=1

a=5

SS (Tr )=

1
42,196.86
2
T i . C=
10,479.042=70.173

b i=1
4

SS ( Bl )=

1
10,479.042=0.330
T 2 C= 52,396.86
a i=1 . j
5

b =4

SSE=SST SS ( Tr ) SS ( Bl )=95.81870.1730.330=25.315 .

Los resultados finales se indican en la siguiente tabla de anlisis de variancia:

83

SUMA:
1710.81
2637.24
2220.37
2254.5
1751.94
10,574.86

Fuente de
variacin

Grados de libertad

Suma de
cuadrados

Cuadrado medio

MS ( Tr ) =
Tratamientos:
Fibras

a1=

70.173
=17.543
( 51)

MS ( Bl )=
b1

SS ( Bl )
( b1 )

0.330
=0.11
(41)

MSE=

( a1 )( b1 )

17.543
=8.314
2.11

F Bl=

MS ( Bl )
MSE

0.11
=0.052
2.11

SSE
( a1 ) ( b1 )

SSE=25.315

( 51 ) ( 41 )=12

Total

MS ( Tr )
MSE

SS ( Bl )=0.330

41=3

Error

FTr =

SS (Tr )=70.173

51=4

Bloques:
Instrumentos:

SS ( Tr )
( a1 )

25.315
=2.11
(51)(41)

SST =95.818
ab1=( 5 ) ( 4 )1=19

Decisiones: Dado que el valor crtico en el nivel 0.01 para una distribucin F con 4
FTr =8.314
y 12 grados de libertad es 5.41 y
sobrepasa a 5.41, rechazamos la
hiptesis nula. Por lo tanto, existe una diferencia en las medias de la resistencia a la
ruptura. Concluimos que existen diferencias en la resistencia a la ruptura de las cinco
fibras. Puesto que el valor crtico en el nivel 0.01 para una distribucin F con 3 y 12
grados de libertad es 5.95,

F Bl =0.052

no excede este valor crtico. Rechazamos la

hiptesis nula de la inexistencia de efectos de bloque. Los instrumentos de medicin no


tienen ningn efecto.
Problema 4.18. Las cifras siguientes son el nmero de errores realizados en
cinco das consecutivos de trabajo por cuatro tcnicos de un laboratorio fotogrfico:
Das
1
2
3

Tcnicos
1
6
14
10

2
14
9
12
84

3
10
12
7

4
9
12
8

4
5

8
11

Prueba con un nivel de significancia

10
14
=0.01

15
11

10
11

si las diferencias entre las cuatro

muestras pueden atribuirse al azar. Considerando a los das (renglones) como bloques.
Solucin:
La hiptesis nula es que las verdaderas medias para los tcnicos son iguales. La
hiptesis alternativa es que no son iguales. Una segunda hiptesis nula es que no hay
ningn efecto de bloque (das).
Para construir la tabla de anlisis de variancia, primero debemos calcular las sumas de
las filas y de las columnas:
y 1 j= y 11 + y 12+ y 13 + y 14 + y 15 =6+14 +10+8+11=49.
5

T 1.=
j=1

y 2 j= y 21 + y 22+ y 23+ y 24 + y 25=14 +9+12+10+14=59


5

T 2. =
j=1

y 3 j= y 31+ y 32+ y 33+ y 34 + y 35=10+12+7+ 15+11=55


5

T 3.=
j=1

y 4 j= y 41 + y 42+ y 43+ y 44 + y 45 =9+12+ 8+10+11=50


5

T 4.=
j=1

y i 1= y 11 + y 21 + y 31+ y 41=6+14+10+ 9=39


4

T .1 =
i=1

y i 2= y 12+ y 22 + y 32+ y 42=14+ 9+12+ 12=47


4

T .2=
i=1

85

y i 3= y 13+ y 23+ y 33 + y 43=10+12+7 +8=37


4

T .3=
i=1

y i 4= y14 + y 24 + y 34 + y 44 =8+10+15+10=43
4

T .4 =
i=1

y i 5= y 15+ y 25+ y 35 + y 45=11+ 14+11+11=47


4

T .5=
i=1

y ij= 213
j=1

T ..=
i=1

Estas sumas en forma de tabla son:


Das

Tcnico
s

14

10

11

T 1. =49

14

12

10

14

T 2. =59

10

12

15

11

T 3. =55

12

10

11

T 4.=50

T .1 =39

T .2 =47

T .3 =37

T .4 =43

T .5 =47

T .. =213

As,
T 2.. ( 213 )2
C= =
=2,268.45.
ab ( 4)(5)
2

T i . = T 1. +T 2. +T 3. +T 4.
4

i=1

86

( 49 ) + ( 59 ) + ( 55 ) + ( 50 ) =11,407
T 2. j=T 2.1 +T 2.2 +T 2.3 +T .42 +T 2.5
5

j =1

( 39 )2+ ( 47 )2 + ( 37 )2+ ( 43 )2 + ( 47 )2 =9,157

La suma de todas las observaciones al cuadrado es:


a=4 b=5

b=5

i=1 j=1

j=1

y 2ij= ( y 21 j+ y22 j+ y 23 j + y 24 j )
b=5

y 23 j + y 24 j
j=1
b=5

y 2 j +
2

j=1
b=5

y 21 j +
j =1
b=5


j=1

( y 211 + y 212 + y 213+ y 214+ y 215) + ( y 221+ y 222+ y 223 + y 224 + y 225)
+ ( y 231 + y 232 + y 233 + y 234 + y 235 ) + ( y 241+ y 242+ y 243 + y 244 + y 245)

Si lo hacemos con Excel se simplifica el clculo:


Das
1

2
i1

2
i2

SUMA:

2
i3

36

14

196

10

100

14

196

81

12

144

10

100

12

144

81

12

144

Tcnicos

SUMA:

En la tabla

413

565

2
i4

2
i5

64

11

121

517

10

100

14

196

717

49

15

225

11

121

639

64

10

100

11

121

510

559

2,383

357

i=1,2,3,4.
87

489

Por lo tanto,
a=4 b=5

y 2ij =2,383
i=1 j=1

a =4 b=5

SST = y ij C=2,3832,268.45=114.55 .
2

i=1 j=1

a=5

SS (Tr )=

1
2,268.45=12.95
T 2 C= 11,407
b i=1 i .
5

SS ( Bl )=

1
9,157
2
T . jC=
2,268.45=20.8

a i=1
4

b =4

SSE=SST SS ( Tr ) SS ( Bl )=114.5512.9520.80=80.80 .

Los resultados finales se indican en la siguiente tabla de anlisis de variancia:

Fuente de
variacin

Grados de libertad

Suma de
cuadrados

Cuadrado medio

MS ( Tr ) =
Tratamientos:
Tcnicos

a1=

41=3

12.95
=4.32
(41)

MS ( Bl )=
b1

51=4

( a1 )( b1 )

MS ( Tr )
MSE

SS ( Bl )
( b1 )

4.32
=0.642
6.73

F Bl=

MS ( Bl )
MSE

SS ( Bl )=20.80

Error

FTr =

SS (Tr )=12.95

Bloques:
Das

SS ( Tr )
( a1 )

SSE=80.80

( 41 ) ( 51 )=12

88

20.80
=5.20
(51)

MSE=

SSE
( a1 ) ( b1 )

5.20
=0.773
6.73

Total

80.80
=6.73
(41)(51)

SST =114.55
ab1=( 4 ) ( 5 )1=19

Decisiones. Dado que el valor crtico en el nivel 0.01 para una distribucin

con 3

y 12 grados de libertad es 5.95, no podemos rechazar la hiptesis que no existe


diferencia entre las medias de los tcnicos. Dado que el valor crtico en el nivel 0.01
para una distribucin F con 4 y 12 grados de libertad es 5.41, no podemos rechazar
la hiptesis nula de que no hay efectos de bloque.
Problema 4.19. Cuatro formas diferentes, y a pesar de ello supuestamente
equivalentes, de un material estandarizado de una prueba vocacional fue aplicado a
cinco estudiantes, los cuales obtuvieron las siguientes calificaciones:
Formas

Estudiante
s

75

83

86

73

73

72

61

67

59

56

53

62

69

70

72

79

84

92

88

95

Efecta un anlisis de variancia en dos dimensiones para probar con un nivel de


significancia =0.01 si es razonable manejar las cuatro formas como equivalentes.
Solucin:
La hiptesis nula es que las verdaderas medias para los estudiantes sean iguales. La
hiptesis alternativa es que no son iguales. Una segunda hiptesis es que la forma no
tiene ningn efecto sobre la prueba.
Para construir la tabla de anlisis de variancia, primero debemos calcular las sumas de
las filas y de las columnas:
y 1 j= y 1 A + y1 B+ y 1C + y 1 D=75+ 83+86+73=317.
D

T 1.=
j= A

89

y 2 j= y 2 A + y 2 B + y 2 C + y 2 D =73+72+ 61+ 67=273.


D

T 2.=
j=A

y 3 j= y 3 A + y 3 B + y 3 C + y 3 D =59+56+53+ 62=230.
D

T 3.=
j= A

y 4 j= y 4 A + y 4 B + y 4 C + y 4 D=69+ 70+72+ 79=290.


D

T 4. =
j= A

y 5 j= y 5 A + y 5 B + y 5 C + y 5 D =84+ 92+88+95=359.
D

T 5. =
j= A

y iA= y 1 A + y 2 A + y 3 A + y 4 A + y5 A =75+73+59+ 69+84=360.


5

T . A =
i=1

y iB= y 1 B + y 2 B + y 3 B + y 4 B + y 5 B=83+72+56+70+92=373.
5

T .B =
i=1

y iC = y 1 C + y 2C + y 3 C + y 4 C + y 5 C =86+61+53+72+88=360.
5

T .C =
i=1

y iD= y 1 D + y 2 D + y 3 D + y 4 D + y 5 D=73+67 +62+79+95=376.


5

T . D =
i=1

y ij= 1,469
j=1

T .. =
i=A

90

Estas sumas en forma de tabla son:

Formas

Estudiante
s

75

83

86

73

T 1. =317

73

72

61

67

T 2. =273

59

56

53

62

T 3. =230

69

70

72

79

T 4.=290

84

92

88

95

T 5. =359

T . A=360

T . B =373

T . C =360

As,
T 2.. (1,469 )2
C= =
=107,898.05 .
ab (5)(4 )
T 2i . = T 21. +T 22. +T 23. +T 24. +T 25.
5

i=1

( 317 )2 + ( 273 )2 + ( 230 )2 + ( 290 )2+ ( 359 )2=440,899.


T 2. j=T 2. A +T 2. B +T 2.C +T 2. D
D

j= A

( 360 ) + ( 373 ) + ( 360 ) + (373 ) =539,705.

La suma de todas las observaciones al cuadrado es:


a=5 b =D

b =D

y = ( y 21 j + y 22 j + y 23 j+ y24 j + y 25 j)
i=1 j= A

2
ij

j= A

91

T . D =376

T .. =1,469

b=D

y 24 j+ y 25 j
j =A
b=D

y 3 j +
2

j= A
b=D

y 2 j +
j= A
b=D

y 21 j +
j= A
b= D


j= A

( y 21 A + y 21 B + y 21C + y 21 D )+ ( y 22 A + y 22 B + y 22 C + y 22 D )
+ ( y 23 A + y 23 B + y 23 C + y 23 D ) + ( y 24 A + y 24 B + y 24 C + y 24 D )
+ ( y 25 A + y 25 B + y 25 C + y 25 D )
[ ( 75 )2 + ( 83 )2 + ( 86 )2 + ( 73 )2 ] + [ ( 73 )2 + ( 72 )2 + ( 61 )2+ ( 67 )2 ]
+ [ ( 59 )2 + ( 56 )2 + ( 53 )2 + ( 62 )2 ]+ [ ( 69 )2 + ( 70 )2+ ( 72 )2+ ( 79 )2 ]
+ [ ( 84 )2+ ( 92 )2+ ( 88 )2+ ( 95 )2 ]

Si lo hacemos con Excel se simplifica el clculo:


SUMA:
Formas

y 2ij

y 2iA

y 2iB

y 2iC

y 2iD

75

5,625

83

6,889

86

7,396

73

5,329

25,239

73

5,329

72

5,184

61

3,721

67

4,489

18,723

59

3,481

56

3,136

53

2,809

62

3,844

13,270

69

4,761

70

4,900

72

5,184

79

6,241

21,086

84

7,056

92

8,464

88

7,744

95

9,025

32,289

28,928

110,607

Estudiantes

SUMA:

26,252

28,573

26,854

92

i=1,2,3,4,5.

En la tabla

Por lo tanto,
a=5 b =D

y 2ij =110,607
i=1 j= A

a =5 b=D

SST = y 2ij C=110,607107,898.05=2,708.95


i=1 j=A

a=5

SS (Tr )=

1
440,899
2
T i . C=
107,898.05=2,326.70

b i=1
4

SS ( Bl )=

1
539,705
T 2. jC=
107,898.05=42.95

a i=1
5

b =4

SSE=SST SS ( Tr ) SS ( Bl )=2,708.952,326.7042.95=339.30 .
Los resultados finales se indican en la siguiente tabla de anlisis de variancia:
Fuente de
variacin

Grados de libertad

Suma de
cuadrados

Cuadrado medio

MS ( Tr ) =
Tratamientos:
Estudiantes

a1=
51=4

SS ( Tr )
( a1 )

FTr =

SS (Tr )=2,326.70

2,326.70
=581.675
(51)

MS ( Tr )
MSE

581.675
28.275

20.572
MS ( Bl )=
Bloques:
Formas

b1

41=3

SS ( Bl )
( b1 )

F Bl=

MS ( Bl )
MSE

SS ( Bl )=42.95

93

42.95
=14.317
(41)

14.317
=0.506
28.275

MSE=

SSE
( a1 ) ( b1 )

( a1 )( b1 )
Error

SSE=339.30

( 51 ) ( 41 )=12

339.30
( 51 )( 41 )

28.275
Total

SST =2,708.95
ab1=( 5 ) ( 4 )1=19

Dado que el valor crtico en el nivel 0.01 para una distribucin F con 4 y 12 grados
FTr =20.572 ,
de libertad es 5.41 y
rechazamos la hiptesis nula de no hay ningn
efecto de los estudiantes. Por lo tanto, son diferentes las capacidades de los estudiantes.
Puesto que el valor crtico en el nivel 0.01 para una distribucin
F Bl=0.506
de libertad es 5.95 y
, no rebasa el punto crtico.

F con 3 y 12 grados

Mientras no se facilite una prueba ms, vamos a tratar las cuatro formas como
equivalentes.

Problema 4.20. Se desarroll un experimento para juzgar el efecto que cuatro


diferentes combustibles y dos tipos de lanzacohetes tienen sobre el alcance de cierto
proyectil. Prueba, con base en los siguientes datos (en millas nuticas), si existen
diferencias significativas (a) entre las medias obtenidas para los combustibles y (b) entre
las medias obtenidas para los lanzacohetes:
Combustible
I

Combustible
II

Combustible
III

Combustible
IV

Lanzacohetes X

62.5

49.3

33.8

43.6

Lanzacohetes Y

40.4

39.7

47.4

59.8

94

Emplea un nivel de significancia de =0.05 .


Solucin:

Problema 4.21. Se han tomado muestras de aguas subterrneas de cinco diferentes


zonas de depsito de aguas txicas por cada una de tres agencias siguientes: la EPA, la
compaa propietaria de los lugares de depsito y un asesor independiente dedicados a
asuntos de ingeniera. Cada muestra fue analizada buscando detectar la presencia de
cierto contaminante por todos los mtodos de laboratorio que la agencia que recolect la
muestra suele emplear. Se consiguieron los siguientes resultados:
Concentracin ( partes por milln )
Lugar A Lugar B Lugar C Lugar D Lugar E
Agente 1

23.8

7.6

15.4

30.6

4.2

Agente 2

19.2

6.8

13.2

22.5

3.9

Agente 3

20.9

5.9

14.0

27.1

3.0

Existe alguna razn para creer que los laboratoristas no son, en sus mediciones,
consistentes entre si? Difiere una zona de depsito con respecto a cualquier otra en su
nivel de contaminacin? Utiliza un nivel de significancia de 0.05.
Solucin:

Problema 4.22. Un ingeniero industrial prueba cuatro diferentes arreglos de los


anaqueles de una tienda de departamentos que cuenta con seis cuadrillas de trabajadores
para ensamblar, los cuales montan una seccin, y se mide el tiempo que emplean (en
minutos) obteniendo los resultados siguientes:

Arreglo 1

Arreglo 2

Arreglo 3

Arreglo 4

Cuadrilla A

48.2

53.1

51.2

58.6

Cuadrilla B

49.5

52.9

50.0

60.1

Cuadrilla C

50.7

56.8

49.9

62.4

Cuadrilla D

48.6

50.6

47.5

57.5

Cuadrilla E

47.1

51.8

49.1

55.3

Cuadrilla F

52.4

57.2

53.5

61.7

95

Prueba con un nivel de significancia de 0.01 si los cuatro arreglos producen distintos
tiempos de montaje y si alguno de las cuadrillas de utilera son consistentemente ms
rpidos al montar estos anaqueles.
Solucin:

Problema 4.25. Si en una clasificacin con dos criterios el experimento completo


se repite r veces, el modelo es entonces:
y ijk=+ i + j + k + ijk
para;
las

i=1,2, , a ,
j=1,2, , b y k =1,2, , r , donde la suma de las ,
y las son iguales a cero, y donde las representan los efectos de las

repeticiones. Las

ijk

son otra vez valores de variables aleatorias independientes

2
distribuidas normalmente con medias cero y la variancia comn .

(a) Escribe una identidad anloga a la de Teorema 4.2, dividiendo la suma total de
cuadrados en componentes atribuibles a tratamientos, bloques, repeticiones y error.
(b) Generaliza las frmulas de clculo de tal manera que se apliquen diseo de bloques
aleatorios repetidos. Ntese que el divisor en cada caso es igual al nmero de
observaciones en los totales respectivos.

96

(c) Si el nmero de grados de libertad para la suma de cuadrados de las repeticiones es


igual a r1 , cuntos grados de libertad hay para el error de la suma de
cuadrados?
Solucin:
(a) Identidad anloga al Teorema 4.2:
a

( y ijk y )2= ( y ijk y i.. y . j . y .. k +2 y )2


i=1 j=1 k=1

i =1 j=1 k=1

+br ( y i .. y ) + ar ( y . j . y ) +ab ( y ..k y )


2

i=1

j=1

k =1

Estos es,
SST =SSE+ SS ( Tr ) +SS ( Bl ) +SS ( Reps ) .
(b) Generalizacin de las frmulas:
a

SST = y ijkC
2

i =1 j=1 k=1

SS (Tr )=

1
T 2 C
br i=1 i..

SS ( Bl )=

1
T 2 C
ar j=1 . j .

SS ( Reps )=

1
T 2.. k C

ab k=1

donde,
C=

T 2
.
abr

(c) El nmero de grados de libertad para la SSE, es:


g .l . [ SST ] g . l . [ SS ( Tr ) ] g . l. [ SS ( Bl )g . l. [ SS ( Reps ) ] ]

97

( abr1 ) ( a1 )( b1 )( r 1 )=abr abr+ 2.


Problema 4.26. Los siguientes datos se refieren al nmero de unidades
defectuosas producidas por cuatro trabajadores operando, en sucesin, tres diferentes
mquinas; en cada caso, la primera cifra representa el nmero de unidades defectuosas
producidas en un viernes y la segunda corresponde a la cantidad producida el lunes
siguiente:
Trabajador
B1

B2

B3

B4

Mquina A1

37, 43

38, 44

38, 40

32, 36

Mquina A2

31, 36

40, 44

43, 41

31, 38

Mquina A3

36, 40

33, 37

41, 39

38, 45

Con la teora desarrollada en el Problema 4.25 analiza las cifras combinadas para los
dos das mediante una clasificacin de dos dimensiones con repeticin. Emplea un nivel
de significancia =0.05 .
Solucin:
Para

i=1:

r=2

r=2

r =2

k=1

k=1

k=1

r=2

r=2

k=1

k=1

y 1 jk = y 11k + y 12 k+ y 13k + y 14 k
b=4

T 1.. =
j=1

y 111+ y 112 + y121 + y 122 + y 131 + y 132 + y 141 + y 142


37+ 43+ 38+44 +38+ 40+ 32+ 36=308

Para

i=2 :

r=2

r=2

r=2

k=1

k=1

k=1

r =2

r =2

k=1

k=1

y 2 jk = y 21k + y 22 k + y 23 k + y 24 k
b= 4

T 2.. =
j=1

y 211 + y 212 + y 221 + y 222 + y 231 + y 232 + y 241 + y 242

98

31+ 36+40+ 44+ 43+ 41+ 31+ 38=304 .

Para

i=3 :

r=2

r=2

r=2

k=1

k=1

k=1

r =2

r =2

k=1

k=1

y 3 jk= y 31k + y 32 k + y 33 k + y 34 k
b= 4

T 3.. =
j=1

y 311 + y 312 + y 321 + y 322 + y 331 + y 332 + y 341 + y 342


36+ 40+ 33+37+ 41+ 39+38+45=309

Para k =1:
b=4

j=1

b= 4

b=4

b =4

j=1

j=1
a=3

j =1

y ij1= y 1 j 1 + y2 j 1+ y 3 j 1
T ..1=
i=1

y 111+ y 121 + y 131 + y 141 + y 211+ y 221 + y 231 + y241


+ y 311 + y 321 + y 331 + y 341
Sustituyendo valores:
T ..1=37 +38+38+32+31+40+ 43+31+36+33+ 41+38=438

Para k =2:
b=4

j=1

b= 4

b=4

b=4

j=1

j=1
a=3

j=1

y ij2= y 1 j 2 + y 2 j 2+ y 3 j2
T ..2=
i=1

y 112 + y 122 + y 132 + y 142 + y 212 + y 222 + y 232 + y 242

99

+ y 312 + y 322 + y 332 + y 342


Sustituyendo valores:
T ..2=43+44 +40+ 36+36+ 44+ 41+ 38+40+ 37+39+45=483
Por lo tanto,
2

T .. k =T ..1+ T ..2=438+483=921
r =2

k=1

Para

j=1:
a =3 r=2

r =2

r=2

r =2

i =1 k=1

k=1

k=1

k=1

T .1 .= y i 1k = y 11k + y 21 k + y 31 k

y 111+ y 112 + y211 + y 212 + y 311 + y 312


Sustituyendo valores:
T .1 .=37+ 43+31+36+ 36+40=223.
Para

j=2:
a =3 r=2

r =2

r=2

r=2

i =1 k=1

k=1

k=1

k =1

T .2 .= y i 2k = y 12 k + y 22k + y 32 k

y 121 + y 122 + y 221 + y 222 + y 321 + y 322


Sustituyendo valores:
T .2 .=38+ 44+ 40+ 44+33+37=236
Para

j=3:
a=3 r =2

r =2

r =2

r =2

i=1 k=1

k=1

k=1

k=1

T .3 .= y i 3 k = y 13 k + y 23 k + y 33 k

100

y 131 + y 132 + y 231 + y 232 + y 331 + y 332


Sustituyendo valores:
T .3 .=38+ 40+ 43+41+ 41+39=242 .
Para

j=4 :
a=3 r =2

r =2

r =2

r =2

i=1 k=1

k=1

k=1

k=1

T .4 . = y i 4 k = y 14 k + y 24 k + y 34 k

y 141 + y 142 + y 241 + y 242 + y 341 + y 342


Sustituyendo valores:
T .4 . =32+ 36+31+38+38+ 45=220.

T . j . =T .1. + T .2. +T .3. +T .4. =223+236 +242+220=921


b=4

T =
j=1

o bien,
a=3

T = T i ..=T 1.. +T 2. . +T 3.. =308+304 +309=921


i=1

Entonces,
T 2 (921)2
C=
=
=35,343.375
abr 3 4 2

Adems,
a

T 2i ..=3082 +3042 +3092=282,761


i=1

b=4

T 2. j .=T 2.1. +T 2.2. +T 2.3 .+T 2.4.=2232 +2362 +2422 +2202=212,389


j=1

101

r=2

T 2.. k =T 2..1+T 2..2=4382 + 4832=425,133


k=1

Sumas al cuadrado:
a=3 b =4 r =2

y
i=1 j=1 k=1

[
[

2
ijk

b=4 r=2

b =4 r =2

= y + y
2
1 jk

j=1 k=1

j=1 k=1

r =2

r=2

r=2

r =2

k=1

k=1

k=1

k=1

r=2

r =2

r =2

r=2

k=1

k=1

k=1

k=1

2
2 jk

y 211k + y 212k + y 213 k + y 214 k

r=2

k=1

2
31 k

r =2

+ y
k=1

2
32 k

r=2

+ y
k=1

2
33 k

r=2

+ y 234 k
k=1

+ y 23 jk
j=1 k=1

y 221 k + y 222 k+ y 223 k + y 224 k

b=4 r=2

2
[ y 2111+ y 2112+ y 2121 + y 2122 + y 2131 + y 2132 + y 2141 + y142
]

+ [ y 2211 + y 2212 + y 2221 + y 2222 + y 2231 + y 2232 + y 2241 + y 2242 ]


+ [ y 2311 + y 2312 + y2321 + y 2322 + y 2331 + y 2332 + y 2341 + y 2342 ]
Para su clculo, hacemos uso del Excel:
B1

y 2i 11 B 1

y 2i 12 B 2

y 2i 21 B 2

y 2i 22

B 3 y 2i 31

B3

y 2i 32 B 4

y 2i 41 B 4 y 2i 42

A1

37

1,369

43

1,849

38

1,444

44

1,936

38

1,444

40

1,600

32

1,024

36

1,296

A2

31

961

36

1,296

40

1,600

44

1,936

43

1,849

41

1,681

31

961

38

1,444

A3

36

1,296

40

1,600

33

1,089

37

1,369

41

1,681

39

1,521

38

1,444

45

2,025

Subtotal:

3,626

4,745

4,133

5,241

i =1, 2, 3.

4,974

4,802

3,429
Total:

Por consiguiente:

102

4,765
35,715

a=3 b =4 r =2

y 2ijk =35,715
i=1 j=1 k=1

As, tenemos que:


a

SST = y 2ijkC=35,71535,343.375=371.625
i =1 j=1 k=1

1
1
2
SS (Tr )= T i.. C=
( 282,761 )35,343.375=1.75
br i=1
4 2
b

1
1
SS ( Bl )= T 2. j .C=
( 212,389 )35,343.375=54.792
ar j=1
32
2

T .. k C=

1
( 425,133 ) 35,343.375=84.375 .
34
r
1
SS ( Reps ) =
ab k=1

SSE=SST SS ( Tr ) SS ( Bl )SS ( Reps )=371.6251.7554.79284.375=230.708 .


Los resultados finales se indican en la siguiente tabla de anlisis de variancia:
Fuente de
variacin

Grados de libertad

Suma de
cuadrados

Cuadrado medio

MS ( Tr ) =
Tratamientos:
Mquinas

a1=
31=2

SS ( Tr )
( a1 )

FTr =

SS (Tr )=1.75

2,326.70
=581.675
(51)

MS ( Tr )
MSE

581.675
28.275

20.572
MS ( Bl )=
Bloques:
Trabajadores

b1

41=3

SS ( Bl )
( b1 )

F Bl=

MS ( Bl )
MSE

SS ( Bl )=54.792

103

42.95
=14.317
(41)

14.317
=0.506
28.275

r1
Repeticiones

21=1

SS ( Reps )=84.375

MSE=

SSE
( a1 ) ( b1 )

abrabr + 2
Error

SSE=230.708
339.30
3 4 2342+2=269=17 ( 51 )( 41 )
28.275

Total

abr1=3 4 21=23
SST =371.625

Dado que el valor crtico en el nivel 0.05 para una distribucin F con 2 y 17 grados de
FTr =0.064
libertad (Tabla 4.1), es 3.59 (punto crtico) >
; no podemos rechazar la
hiptesis nula de no tienen efecto los tratamientos (mquinas). Por lo tanto, las medias
verdaderas de las mquinas son iguales.
Dado que el valor crtico en el nivel 0.05 para una distribucin F con 3 y 17 grados de
F Bl=1.346
libertad (Tabla 4.1), es 3.20 (punto crtico) >
; no podemos rechazar la
hiptesis nula de no tienen efecto los bloques (trabajadores). Por lo tanto, las medias
verdaderas de los trabajadores son iguales.
Dado que el valor crtico en el nivel 0.05 para una distribucin F con 1 y 17 grados de
F Reps=6.217
libertad (Tabla 4.1), es 3.45 (punto crtico) <
; rechazamos la hiptesis
nula de no tienen efecto las repeticiones. Por lo tanto, las medias verdaderas de las
repeticiones son diferentes.
Problema 4.27. Dos formas de aumentar el tamao de un experimento para una
clasificacin con dos criterios son (a) duplicar el nmero de bloque y (b) repetir el
experimento completo. Analiza y compara la ganancia en grados de libertad para la
suma de cuadrados del error por los dos mtodos.
Solucin:
(a) En una tabla con doble entrada, si duplicamos el nmero de bloques, cambian los
grados de libertad de ( a1 )( b1 ) a ( a1 )( 2 b1 ) . La diferencia es :

104

( a1 )( 2 b1 )=

2 aba2 b+1

( a1 )( b1 )=

abab+1
abb

o bien, b ( a1 ) .
(b) En una tabla de doble entrada, si repetimos el experimento, cambian los grados de
2 ab1 ( a1 )( b1 )1=2 abab . La
libertad de ( a1 )( b1 ) a
diferencia es:
2 ab1 ( a1 )( b1 )1=

( a1 )( b1 )=

2 abab

abab+1
ab1

Es decir, ab1 . Se aconseja la repeticin.

Problema 4.28.

Demuestra que si

(sumada sobre j) es igual a


es igual a

+ i

ij =+ i+ j

, y la media de las

, se sigue que:
b

i= j=0.
j=1
a

i=1

Solucin:
Del enunciado del problema, sabemos que:
ij =+ i+ j (1)

105

ij

, la media de las

ij

(sumada sobre i y sobre j)

ij = + i (2)
b

b j=1
a

1
= (3)
ab i=1 j=1 ij
Sumando la primera relacin sobre j y dividiendo por b, resulta:
b

ij = + i+

b j=1 j

b j=1
Comparando con la segunda relacin dada, concluimos que:
b

1
=0 , o bien , j=0.
b j=1 j
j=1
Ahora, sumamos la primera relacin sobre i y j y dividimos por ab:
a

1
1
1
ij=+ i+ j

ab i=1 j=1
a i=1
b j=1
Comparando con la tercera relacin dada, y usando:
b

j =0.
j=1

Concluimos que:
a

i=0.
i=1

SST , SS ( Tr ) , SS (Bl )

Problema 4.29. Verifica que las frmulas para

SSE ,

son equivalentes a los trminos correspondientes de la identidad del Teorema 4.2.


Solucin:
Para

SST , se tiene:
a

SST = ( y ij y .. ) = ( y ij 2 y .. y ij + y .. )
i =1 j=1

i=1 j=1

106

y 2ij2 y .. y ij+ y 2..


j=1

i=1 j=1
a

i=1 j=1


i=1

y ij 2 ab y ..+ ab y ..= y ij ab y ..
2

i=1 j=1

i=1 j=1

Pero,

T 2..
ab y = =C
ab
2
..

As que,
a

SST = y ij C .
2

i =1 j=1

Como se requiere.

Para

SS (Tr ) , se tiene:
a

SS (Tr )=b ( y i . y .. ) =b ( y i .2 y .. y + y ..)


2

i=1

(
i=1

i=1

i=1

i=1

) (

y 2 y .. y + y =a
2
i.

2
..

i=1

i=1

y 2i . 2 a y 2..+ a y 2..

y 2i. a y 2..

Dado que,
a

1
y = y
a i=1 i . ..
Entonces,
2

a
T i.
T
C= i. C .
b
i=1 b

( )
a

SS (Tr )=b

(
i=1

y 2i .a y 2.. =b y 2i. ab y2.. =b

107

i=1

i=1

Como se requiere.

Para

SS (Bl) , intercambiando i y j y tambin a y b se tiene:

SS ( Bl )=a ( y . j y .. ) =a
2

j=1

(
j =1

y b y =a
2
.j

2
..

j=1

b
T.j 2
T 2. j
C=
C .
a
j=1 a

( )

Como se requiere.

4.4 Comparaciones mltiples


Problema 4.30. Se dise un experimento para estudiar el rendimiento de cuatro
detergentes diferentes. Las siguientes lecturas de blancura se obtuvieron con un
equipo especialmente diseado para 12 cargas de lavado distribuidas en tres modelos de
lavadoras:

Lavadora 1

Lavadora 2

Lavadora 3

Totales

Detergente A

45

43

51

139

Detergente B

47

46

52

145

Detergente C

48

50

55

153

Detergente D

42

37

49

128

182

176

207

565

Totales

Comprueba los resultados de la prueba de Duncan en la comparacin de los cuatro


detergentes, con un nivel de significancia de 0.05 si existen diferencias entre los
detergentes.
Solucin:
Las medias para los cuatro detergentes son:
y A =

139
145
153
128
=46.3 , y B=
=48.3 , y C =
=51.0 , y D =
=42.7 .
3
3
3
3

Ordenamos en un orden creciente de magnitud las cuatro medias muestrales como


sigue:
Detergent

A
108

e
Media

42.7

A continuacin se calcula

s x

46.3

48.3

51.0

, usando la media del error cuadrado 3.2 que se obtuvo

en el anlisis de variancia de la pgina 22, y tenemos as:


s x =
Para

=0.05

MSE
3.2
=
=1.033.
n
3

( a1 )( b1 )=( 41 )( 31 )=6

grados de libertad. De la Tabla

4.2(a), se obtiene:
p

rp

3.46

3.59

3.65

Multiplicando cada valor de

rp

por

s x =1.033

, obtenemos:

rp

3.46

3.59

3.65

R p=r p s x

3.57

3.71

3.77

Se calculan ahora los rangos de las medias.


Rango de las medias adyacentes:
y A y D =46.342.7=3.6> R 2=3.57 , tiene un rango mayor que el significativo.
y B y A=48.346.3=2< R 2=3.57 .
y C y B=51.048.3=2.7< R2=3.57 .
Rango de las tres medias:
y B y D =48.342.7=5.6> R 3=3.71 , tiene un rango mayor que el significativo.
y C y A =5.1046.3=4.7> R 3=3.71 , tiene un rango mayor que el significativo
Rango de cuatro medias:

109

y C y D=5.1042.7=8.3> R 3=3.77 , tiene un rango mayor que el significativo


=0.05 ,

Entonces, para el rango de las medias adyacentes con

y A y D =3.6> R2

y B y D =5.6

es significativa. Tambin para el rango de tres medias


y C y A =4.7

son significativas. Concluimos que en el nivel de significancia de 0.05,

las medias de los detergentes A y D son significativamente diferentes y las medias de


los detergentes A y C, y B y D son significativamente diferentes. Tambin las medias de
los detergentes C y D son significativamente diferentes. Esto lo podemos resumir de la
siguiente forma:
D

42.7

46.3

40.3

51.0

Interpretando estos resultados, se puede decir, que el detergente D es significativamente


inferior a cualquiera de los otros y que el detergente A es evidentemente inferior al
detergente C.
Problema 4.32. Los datos siguientes se refieren a las prdidas de peso de ciertas
piezas mecnicas (en miligramos) debidas a la friccin, cuando tres lubricantes
diferentes se utilizaron en condiciones controladas.
Lubricante A:

12.2,

11.8,

13.1,

11.0,

3.9,

4.1,

10.3,

8.4

Lubricante B:

10.9,

5.7,

13.5,

9.4,

11.4,

15.7,

10.8,

14.0

Lubricante C:

12.7,

19.9,

13.6,

11.7,

18.3,

14.3,

22.8,

20.4

Utiliza la prueba de Duncan con

=0.05

en la comparacin de la eficacia de los tres

lubricantes.
Solucin:
Clculo de las medias:

y A =

12.2+11.8+ 13.1+11.0 +3.9+ 4.1+10.3+ 8.4 74.8


=
=9.35 .
8
8

y B =

10.9+5.7+ 13.5+9.4+11.4 +15.7+ 10.8+14.0 91.4


=
=11.425 .
8
8

110

y C =

12.7+19.9+13.6+11.7 +18.3+14.3+22.8+20.4 133.7


=
=16.7125.
8
8

Ordenamos en un orden creciente de magnitud las tres medias muestrales como sigue:
Lubricante
Media
A continuacin calculamos

A
9.35
s x

B
11.425

C
16.7125

, usando la media del error cuadrado MSE = 13.18 que

se obtuvo en el anlisis de variancia de la pgina 45 (problema 4.6).


Para

=0.05

Nk=243=21

grados de libertad. De la Tabla 4.2(a)

interpolamos para 21 grados de libertad.

Para

p=2 :

2420 2.922.95
=
2120
x2.95

x=2.95
Para

0.03
=2.943
4

p=3 :

2420 3.073.10
=
2120
x3.10

111

x=3.10

rp

Los valores de

s x =

0.03
=3.093
4

son:
p

rp

2.943

3.093

MSE
13.18
=
=1.284
n
8
s x =1.284

, obtenemos:

rp

2.943

3.093

R p=r p s x

3.779

3.971

Multiplicando cada valor de

rp

por

Rango de las medias adyacentes:


y B y A=11.4259.35=2.075< R 2=3.779 .
y C y B=16.712511.425=5.2875< R 2=3.779,

tiene un rango mayor que el

significativo.
Concluimos que en el nivel de significancia de 0.05, las medias de los lubricantes B y C
son significativamente diferentes. En cambio las medias de los detergentes A y B no son
diferentes.
A
9.35

B
11.425

112

C
16.7125

Вам также может понравиться