Вы находитесь на странице: 1из 34

Departamento de Estadstica e Informtica

Curso: Mtodos Estadsticos para la Investigacin I Diseo Completamente al Azar


Ing. Ral Eyzaguirre Prez
reyzaguirre@lamolina.edu.pe
24
Captulo III
Diseo Completamente al Azar
Los nmeros redondos son siempre falsos.
Samuel Johnson
Los estadsticos generalmente hacen la pregunta incorrecta, y estn dispuestos a responder
con una mentira, una que es frecuentemente una descarada mentira. Ellos preguntan Son
los efectos de A y B diferentes? y ellos estn dispuestos a responder no.
Todo lo que nosotros sabemos acerca del mundo nos ensea que los efectos de A y B son
siempre diferentes en algn lugar decimal para cualquier A y B. De esta manera,
preguntar Son los efectos diferentes? es tonto.
Lo que deberamos responder primero es Podemos indicar la direccin en la cual los
efectos de A difieren de los efectos de B?. Es arriba, abajo o incierta?
La tercera respuesta a la ltima pregunta es que nosotros tenemos incertidumbre sobre la
direccin, y no que nosotros aceptemos la hiptesis nula.
John Tukey
1. Introduccin
El diseo completamente al azar (DCA) es el ms simple de todos los diseos. Es un diseo
en el cual los tratamientos son asignados aleatoriamente a las unidades experimentales sin
ningn tipo de restriccin. Este diseo es utilizado cuando las unidades experimentales son
bastante homogneas, es decir, cuando la variabilidad entre ellas es pequea y no existe
ningn criterio de bloqueo que permita disminuirla. Dado que los tratamientos constituyen el
nico criterio de clasificacin para las unidades experimentales, a este diseo se le conoce
tambin como diseo de clasificacin de una va (One Way).
En este captulo se vern los casos paramtrico y no paramtrico del DCA, el anlisis de la
variancia y las pruebas de comparacin de medias de tratamientos.
Departamento de Estadstica e Informtica
Curso: Mtodos Estadsticos para la Investigacin I Diseo Completamente al Azar
Ing. Ral Eyzaguirre Prez
reyzaguirre@lamolina.edu.pe
25
2. Diseo Completamente al Azar (DCA Clsico o Paramtrico)
2.1. Ventajas y Desventajas del DCA
Ventajas:
- Es un diseo flexible en tanto que el nmero de tratamientos y de repeticiones solo est
limitado por el nmero de unidades experimentales.
- El nmero de repeticiones puede variar entre tratamientos aunque generalmente lo ideal es
tener un nmero igual para cada tratamiento.
- El anlisis estadstico es simple.
- El nmero de grados de libertad para estimar el error experimental es mximo. Esto
mejora la precisin del experimento.
Desventajas:
- Solo es aplicable en situaciones en las que el material experimental es homogneo.
- Dado que no hay restricciones de aleatoriedad toda la variabilidad existente en las
unidades experimentales tratadas con el mismo tratamiento estar incluida en el error
experimental.
2.2. Aleatorizacin y Croquis Experimental
Como ya se mencion, en este diseo no existe ninguna restriccin de aleatoriedad por lo que
la asignacin de los tratamientos a las unidades experimentales ser completamente aleatoria
(Esto quiere decir que cualquier distribucin de los tratamientos en las unidades
experimentales es igualmente probable). Para lograr la asignacin aleatoria de los
tratamientos se puede utilizar cualquier mtodo de generacin de nmeros aleatorios como
una tabla de nmeros al azar, un modelo de urnas o un sistema de cmputo (aunque los
nmeros generados por calculadoras y computadoras no son estrictamente aleatorios sino solo
pseudoaleatorios, son aceptables).
Por ejemplo, suponga que va a evaluar 4 tratamientos con 3 repeticiones cada uno; en este
caso necesitar de 12 unidades experimentales. Para asignar los tratamientos completamente
al azar a las unidades experimentales, genere primero un orden aleatorio para los primeros 12
nmeros naturales. Para ello podra por ejemplo utilizar 12 papeles idnticos, numerarlos del
1 al 12, colocarlos en una urna y luego sacarlos uno a uno anotando el orden en el cual son
seleccionados. Otra alternativa sera generar 12 nmeros aleatorios usando la computadora o
una tabla de nmeros aleatorios y luego asignarle a cada uno un nmero de orden desde el 1
hasta el 12 (de menor a mayor). A continuacin se presenta una secuencia de 12 nmeros
aleatorios obtenidos utilizando la funcin ALEATORIO() de Excel con su respectivo nmero
de orden:
.755 .442 .582 .601 .479 .994 .306 .416 .435 .836 .743 .902
9 4 6 7 5 12 1 2 3 10 8 11
Departamento de Estadstica e Informtica
Curso: Mtodos Estadsticos para la Investigacin I Diseo Completamente al Azar
Ing. Ral Eyzaguirre Prez
reyzaguirre@lamolina.edu.pe
26
Con esta secuencia, el primer tratamiento es asignado a las unidades experimentales 9, 4 y 6,
el segundo a las u.e. 7, 5 y 12, el tercero a las u.e. 1, 2 y 3 y el cuarto a las u.e. 10, 8 y 11. El
croquis para este experimento podra ser el siguiente:
T3 T3 T3 T1 T2 T1 T2 T4 T1 T4 T4 T2
2.3. Modelo Aditivo Lineal
El modelo aditivo lineal para un diseo completamente al azar es el siguiente:
ij i ij
Y = + + t i ,..., 1 =
i
r j ,... 1 =
donde:
Y
ij
es el valor o rendimiento observado en el i-simo tratamiento, j-sima repeticin.
es el efecto de la media general.

i
es el efecto del i-simo tratamiento.

ij
es el efecto del error experimental en el i-simo tratamiento, j-sima repeticin.
t es el nmero de tratamientos.
r
i
es el nmero de repeticiones para el i-simo tratamiento.
Ejemplo 1: Se realiz un experimento para evaluar el efecto de la adicin de compuestos
vitamnicos al alimento balanceado en la ganancia de peso en cerdos. Tres diferentes
compuestos fueron evaluados (A, B y C) y un control (D sin la adicin de compuesto
vitamnico). El aumento de peso tras una semana en una muestra aleatoria de 22 cerdos se
da a continuacin:
Compuesto Vitamnico Aumento de peso tras una semana en lb
A 11.1 10.9 10.8 10.2 11.4 10.7
B 11.5 11 10.8 10.6 11.2 10.9
C 10.1 10.6 11.2 10.2 10.4
D 9.2 9.8 10.1 9.7 10.4
Este experimento fue conducido bajo los lineamientos de un DCA, por lo que el modelo
aditivo lineal es el siguiente:
ij i ij
Y = + + t i ,..., 1 =
i
r j ,... 1 =
donde:
- Y
ij
es la ganancia de peso obtenida en el j-simo cerdo alimentado con el i-simo
compuesto vitamnico.
- es el efecto de la media general de las ganancias de peso.
-
i
es el efecto del i-simo compuesto vitamnico.
-
ij
es el efecto del error experimental con el j-simo cerdo alimentado con el i-simo
compuesto vitamnico.
Departamento de Estadstica e Informtica
Curso: Mtodos Estadsticos para la Investigacin I Diseo Completamente al Azar
Ing. Ral Eyzaguirre Prez
reyzaguirre@lamolina.edu.pe
27
- t = 4 (Nmero de tratamientos)
- r
1
= 6, r
2
= 6, r
3
= 5 y r
4
= 5 (Nmero de repeticiones por tratamiento).
2.4. Supuestos del Modelo Estadstico
El modelo estadstico debe cumplir con los siguientes supuestos:
1. Aditividad: Los efectos del modelo son aditivos.
2. Linealidad: Las relaciones entre los efectos del modelo son lineales.
3. Normalidad: Los errores del modelo deben tener una distribucin normal con media cero
y variancia
2
.
4. Independencia. Los resultados obtenidos en el experimento son independientes entre s.
5. Homogeneidad de Variancias: Las diferentes poblaciones generadas por la aplicacin de
los diferentes tratamientos tienen variancias iguales (
2
).
Ms adelante se presentarn pruebas estadsticas para evaluar los supuestos de normalidad de
los errores y de homogeneidad de variancias.
2.5. Estimacin de los Efectos
Los efectos del modelo son estimados por el mtodo de Mnimos Cuadrados. Este mtodo
permite obtener los valores de y
i
que minimizan la suma de los errores al cuadrado, es
decir, que minimizan la siguiente expresin:
2 2
1 1
( )
i i
r r t t
ij ij i
i j i i j i
Q Y
= = = =
= =

Para calcular los valores de y
i
que minimizan la suma de los errores al cuadrado, se debe
solucionar el sistema de ecuaciones obtenido al igualar las derivadas parciales de Q con
respecto a y cada uno de los
i
a cero, y la siguiente restriccin adicional:
0
1
=

=
t
i
i i
r
La aplicacin de este mtodo da los siguientes resultados para la estimacin de los
parmetros:

= Y


= Y Y
i i

ij ij i
Y Y

=
Ejemplo 1 (Cont.): Con los datos del ejemplo anterior, la media estimada es:
Departamento de Estadstica e Informtica
Curso: Mtodos Estadsticos para la Investigacin I Diseo Completamente al Azar
Ing. Ral Eyzaguirre Prez
reyzaguirre@lamolina.edu.pe
28
582 . 10

=
Los efectos estimados de los tratamientos:
268 . 0 582 . 10 850 . 10

1 1
= = =

Y Y
418 . 0 582 . 10 000 . 11

2 2
= = =

Y Y
082 . 0 582 . 10 500 . 10

3 3
= = =

Y Y
742 . 0 582 . 10 840 . 9

4 4
= = =

Y Y
El efecto estimado del error
42
:
42 42 4
9.8 9.840 0.04 Y Y

= = =
2.6. Prueba de Anderson Darling para Normalidad
La prueba de Anderson-Darling, al igual que la prueba chi-cuadrado para bondad de ajuste
tratada en el captulo I, es utilizada para probar si un conjunto de datos muestrales provienen
de una poblacin con una distribucin de probabilidades especfica. Aunque en esta seccin
se tratar solo el caso de bondad de ajuste a la distribucin normal, al igual que la prueba chi-
cuadrado esta prueba puede ser aplicada para evaluar el ajuste a cualquier distribucin de
probabilidades. La prueba de Anderson-Darling se basa en la comparacin de la distribucin
de probabilidades acumulada emprica (resultado de los datos) con la distribucin de
probabilidades acumulada terica (defina por H
0
).
En un diseo completamente al azar se debe evaluar si la variable respuesta Y sigue una
distribucin Normal con media +
i
y variancia
2
en cada uno de los tratamientos, o si los
errores siguen una distribucin Normal con media 0 y variancia
2
.
Hiptesis:
H
0
: La variable sigue una distribucin Normal (,
2
)
H
1
: La variable no sigue una distribucin Normal (,
2
)
Estadstico de Prueba:
El estadstico de prueba, A
2
, est dado por:
2
A n S =
( ) ( )
1
1
1
2 1 ln ( ) ln 1 ( )
n
i n i
i
S i F Y F Y
n
+
=
= + (

donde n es el nmero de observaciones, F(Y) es la distribucin de probabilidades acumulada


normal con media y variancia especificadas a partir de la muestra y Y
i
son los datos obtenidos
en la muestra, ordenados de menor a mayor.
Departamento de Estadstica e Informtica
Curso: Mtodos Estadsticos para la Investigacin I Diseo Completamente al Azar
Ing. Ral Eyzaguirre Prez
reyzaguirre@lamolina.edu.pe
29
Regla de decisin:
La hiptesis nula se rechaza con un nivel de significacin s A
2
es mayor que el valor crtico
A
2
crit
. Aunque la prueba de Anderson-Darling puede ser aplicada a cualquier distribucin, no
se dispone de tablas para todos los casos. A continuacin se presenta una tabla para la prueba
a la distribucin normal.
0.1 0.05 0.025 0.01
A
2
crit
0.631 0.752 0.873 1.035
Ejemplo 1 (Cont.):
H
0
: Los errores siguen una distribucin Normal (0,
2
)
H
1
: Los errores no siguen una distribucin Normal (0,
2
)
A continuacin se presentan los residuales obtenidos con los datos del ejemplo:
Compuesto Vitamnico Residuales
A 0.25 0.05 -0.05 -0.65 0.55 -0.15
B 0.50 0.00 -0.20 -0.40 0.20 -0.10
C -0.40 0.10 0.70 -0.30 -0.10
D -0.64 -0.04 0.26 -0.14 0.56
La media de los residuales es 0 y la desviacin estndar es 0.3708. Con estos valores, el
clculo del estadstico de prueba se presenta en la siguiente tabla:
i (2i-1) Y
i
Y
n+1-i
F(Y
i
) F(Y
n+1-i
) ln(F(Y
i
)) ln(F(Y
n+1-i
)) S
i
1 1 -0.65 0.70 0.0398 0.9705 -3.224 -3.523 -0.307
2 3 -0.64 0.56 0.0422 0.9345 -3.166 -2.726 -0.803
3 5 -0.40 0.55 0.1403 0.9310 -1.964 -2.674 -1.054
4 7 -0.40 0.50 0.1403 0.9113 -1.964 -2.422 -1.395
5 9 -0.30 0.26 0.2092 0.7584 -1.564 -1.421 -1.221
6 11 -0.20 0.25 0.2948 0.7499 -1.221 -1.386 -1.304
7 13 -0.15 0.20 0.3429 0.7052 -1.070 -1.221 -1.354
8 15 -0.14 0.10 0.3529 0.6063 -1.042 -0.932 -1.346
9 17 -0.10 0.05 0.3937 0.5536 -0.932 -0.807 -1.344
10 19 -0.10 0.00 0.3937 0.5000 -0.932 -0.693 -1.404
11 21 -0.05 -0.04 0.4464 0.4570 -0.807 -0.611 -1.353
12 23 -0.04 -0.05 0.4570 0.4464 -0.783 -0.591 -1.437
13 25 0.00 -0.10 0.5000 0.3937 -0.693 -0.500 -1.356
14 27 0.05 -0.10 0.5536 0.3937 -0.591 -0.500 -1.340
15 29 0.10 -0.14 0.6063 0.3529 -0.500 -0.435 -1.233
16 31 0.20 -0.15 0.7052 0.3429 -0.349 -0.420 -1.084
17 33 0.25 -0.20 0.7499 0.2948 -0.288 -0.349 -0.956
18 35 0.26 -0.30 0.7584 0.2092 -0.277 -0.235 -0.813
19 37 0.50 -0.40 0.9113 0.1403 -0.093 -0.151 -0.411
20 39 0.55 -0.40 0.9310 0.1403 -0.071 -0.151 -0.395
21 41 0.56 -0.64 0.9345 0.0422 -0.068 -0.043 -0.206
22 43 0.70 -0.65 0.9705 0.0398 -0.030 -0.041 -0.138
Departamento de Estadstica e Informtica
Curso: Mtodos Estadsticos para la Investigacin I Diseo Completamente al Azar
Ing. Ral Eyzaguirre Prez
reyzaguirre@lamolina.edu.pe
30
Sumando los valores de la ltima columna se tiene que S = -22.253 y entonces:
2
22 22.253 0.2532 A = + =
Este valor es menor inclusive al valor crtico correspondiente a = 0.1. Por lo tanto se
acepta el supuesto de normalidad de los errores.
2.7. Prueba de Bartlett para Homogeneidad de Variancias
Esta prueba se utiliza para evaluar si existe homogeneidad de variancias entre k (2 ms)
poblaciones (en el caso de un diseo experimental, las poblaciones correspondern a los
tratamientos). Los supuestos para la aplicacin de esta prueba son que las poblaciones tienen
distribuciones normales e independientes, y que las muestras son tomadas al azar.
Hiptesis:
H
0
:
2 2 2 2
1 2 k
= = = =
H
1
: Al menos un
2
i
es diferente.
Estadstico de Prueba:
El estadstico de prueba tiene una distribucin Chi-Cuadrado con k-1 grados de libertad y se
define de la siguiente manera:
( )
2 2
1 1
1
1
( 1) ( 1)
1 1 1
1
3( 1) 1
( 1)
k k
i p i i
i i
k
k
i i
i
i
r Ln s r Ln s
Q
k r
r
= =
=
=
| |

|
\ .
=
| |
|
| |
| +
|

|
\ .

|
\ .


2
1) - (k

donde k es el nmero de poblaciones (tratamientos), r


i
es el tamao de muestra para cada
poblacin,
2
i
s es la variancia muestral para la poblacin i y
2
p
s es la variancia muestral
ponderada para las k muestras. Estas dos ltimas cantidades son calculadas por las siguientes
frmulas:
2
2
( )
1
i
r
ij i
i
j i
i
Y Y
s
r

=

2
2
( 1)
( 1)
k
i i
i i
p k
i
i i
r s
s
r
=
=

Regla de decisin:
La hiptesis nula se rechaza con un nivel de significacin s Q resulta mayor que el valor de
tabla
2
[1-, k -1]
.
Departamento de Estadstica e Informtica
Curso: Mtodos Estadsticos para la Investigacin I Diseo Completamente al Azar
Ing. Ral Eyzaguirre Prez
reyzaguirre@lamolina.edu.pe
31
Ejemplo 1 (Cont.):
H
0
:
2 2 2 2
1 2 3 4
= = =
H
1
: Al menos un
2
i
es diferente.
2
1
s = 0.163
2
2
s = 0.1
2
3
s =0.19
2
4
s =0.203
2
p
s = 0.1610
Q = 0.605
2
(3)

El valor de tabla es =
2
3gl) (0.95,
7.815. Como Q resulta menor que el valor de tabla, se
acepta H
0
. Por lo tanto se acepta el supuesto de homogeneidad de variancias.
2.8. Anlisis de Variancia
En este modelo la variabilidad total se descompone en dos fuentes de variacin, la explicada
por los tratamientos y la explicada por el error. Por lo tanto, el modelo de descomposicin de
la variancia ser el siguiente:
Variabilidad (Total) = Variabilidad (Tratamientos) + Variabilidad (Error)
La variabilidad total es cuantificada por la suma de cuadrados total, la cual se calcula de la
siguiente manera:
SC(Total)
2
2 2
1 1 1 1
SC( ) ( )
i i
r r t t
ij ij
i j i j
Y
Y Y Y Y
r

= = = =

= = =

A la expresin


r
Y
2
se le conoce como el trmino de correccin (TC).
La variabilidad explicada por los tratamientos (o suma de cuadrados de los tratamientos) se
calcula de la siguiente manera:
SC(Tratamientos) TC
r
Y
t
i i
i
=

1
2
Por ltimo, la variabilidad explicada por el error puede ser calculada por la siguiente
expresin:
SC(Error)

=

= =
=
t
i i
i
t
i
r
j
ij
r
Y
Y
i
1
2
1 1
2
o por diferencia desde la relacin SC(Total) = SC(Tratamientos) + SC(Error), con lo que se
tiene:
SC(Error) = SC(Total) - SC(Tratamientos)
Departamento de Estadstica e Informtica
Curso: Mtodos Estadsticos para la Investigacin I Diseo Completamente al Azar
Ing. Ral Eyzaguirre Prez
reyzaguirre@lamolina.edu.pe
32
Estas dos fuentes de variacin (tratamientos y error) son comparadas mediante el siguiente
procedimiento de prueba de hiptesis a partir del cuadro de anlisis de variancia (Cuadro
ANVA):
Cuadro ANVA
Fuentes de
Variacin
Grados de
Libertad (gl)
Sumas de
Cuadrados (SC)
Cuadrados
Medios (CM)
Fc
Tratamientos t 1
TC
r
Y
t
i i
i

1
2
SC(Trat)
gl(Trat)
CM(Trat)
CM(Error)
Error
Experimental
r

- t

=

= =

t
i i
i
t
i
r
j
ij
r
Y
Y
i
1
2
1 1
2
SC(Error)
gl(Error)
Total r

- 1
TC Y
t
i
r
j
ij
i

= = 1 1
2
Hiptesis:
Para el Modelo I (Efectos fijos) las hiptesis son, en trminos de los efectos de los
tratamientos las siguientes:
H
0
:
i
= 0 i
H
1
:
i
0 para al menos algn i
En trminos de las medias de los tratamientos:
H
0
:
i
= i
H
1
:
i
para al menos algn i
Para el Modelo II (Efectos aleatorios) las hiptesis sern planteadas en trminos de la
variancia de los tratamientos:
H
0
:
2

= 0
H
1
:
2

> 0
En cualquiera de los casos, la hiptesis nula implica que los tratamientos no afectan a la
variable respuesta, o lo que es lo mismo, que con todos los tratamientos se obtienen los
mismos resultados.
Valores Esperados de los Cuadrados Medios:
Si un experimento en DCA, con igual nmero de repeticiones por tratamiento, se repitiera
bajo las mismas condiciones indefinidamente, y se calculara la media de los cuadrados
medios obtenidos, estas medias se aproximaran a los valores presentados en la siguiente
tabla. Esto permite establecer qu parmetros se estn estimando cuando se calculan los
diferentes cuadrados medios y el valor Fc.
Departamento de Estadstica e Informtica
Curso: Mtodos Estadsticos para la Investigacin I Diseo Completamente al Azar
Ing. Ral Eyzaguirre Prez
reyzaguirre@lamolina.edu.pe
33
Valor Esperado de los Cuadrados Medios
Fuentes de Variacin
Grados de
Libertad (GL) Modelo I Modelo II
Tratamientos t 1
2
2
1
1
t
i
i
r
t

=
+

2 2
r

+
Error Experimental t(r 1)
2

Total tr - 1
Estadstico de Prueba:
CM(Error)
CM(Trat)
= Fc
( ) gl(Trat ),gl(Error)
F
Regla de Decisin:
La hiptesis nula se rechaza con un nivel de significacin si el Fc resulta mayor que el valor
de tabla
( ) 1 , gl(Trat ),gl(Error)
F

.
Ejemplo 1 (Cont.): A continuacin se presenta el anlisis de variancia y la prueba de
hiptesis correspondiente para el ejemplo tratado en esta seccin:
2
2
1 1
2
2 2 2
SC(Total)
232.8
(11.1 10.9 ... 10.4 ) 7.1527
22
i
r t
ij
i j
Y
Y
r

= =

=
= + + + =

2
1
2 2 2 2 2
SC(Tratamientos)
65.1 66 52.5 49.2 232.8
4.2657
6 6 5 5 22
t
i
i
i
Y
TC
r

=
=
= + + + =

SC(Error) = SC(Total) - SC(Tratamientos) = 2.8870


Cuadro ANVA
Fuentes de Variacin gl SC CM Fc
Tratamientos 3 4.2657 1.4219 8.87
Error Experimental 18 2.8870 0.1604
Total 21 7.1527
Departamento de Estadstica e Informtica
Curso: Mtodos Estadsticos para la Investigacin I Diseo Completamente al Azar
Ing. Ral Eyzaguirre Prez
reyzaguirre@lamolina.edu.pe
34
D C B A
11.5
11.0
10.5
10.0
9.5
9.0
Tratamientos
G
a
n
a
n
c
i
a

d
e

P
e
s
o

e
n

l
b
Asumiendo un modelo de efectos fijos, las hiptesis en trminos de los efectos de los
tratamientos son:
H
0
:
i
= 0 i = 1, ..., 4
H
1
:
i
0 para al menos algn i
En trminos de las medias de los tratamientos:
H
0
:
i
= i = 1, ..., 4
H
1
:
i
para al menos algn i
o literalmente:
H
0
: Todos los compuestos vitamnicos tienen el mismo efecto en la ganancia de peso de los
cerdos.
H
1
: Con al menos uno de los compuestos vitamnicos se obtiene una ganancia de peso
diferente.
El estadstico de prueba es Fc = 8.87. El valor de tabla para un nivel de significacin del
5% es
( )
=
18 , 3 , 95 . 0
F 3.19. Dado que el estadstico de prueba resulta mayor que el valor de
tabla se rechaza H
0
. En conclusin, existe suficiente evidencia estadstica para aceptar que
con al menos uno de los compuestos vitamnicos se obtienen ganancias de peso diferentes
en los cerdos.
El nivel de significacin usual y aceptado en investigacin cientfica para considerar que un
efecto o diferencia es significativo es 5%. Cuando la prueba resulta significativa con = 1%
se dice que el efecto o diferencia es altamente significativo.
Departamento de Estadstica e Informtica
Curso: Mtodos Estadsticos para la Investigacin I Diseo Completamente al Azar
Ing. Ral Eyzaguirre Prez
reyzaguirre@lamolina.edu.pe
35
2.9. Coeficiente de Variacin
Es una medida usada por los experimentadores para evaluar el grado de homogeneidad de los
resultados de un experimento. Para saber si un determinado coeficiente de variacin es
demasiado grande o pequeo, es preciso tener experiencia con datos similares.
En el DCA, el cuadrado medio del error (CME) es el estimador de la variancia del
experimento
2
y el coeficiente de variacin es calculado por la siguiente expresin:
CME
cv
Y

=
Con los datos del ejemplo, el coeficiente de variacin ser:
% 78 . 3
58 . 10
1604 . 0
= = cv
Ejemplo 2: Se desarroll un experimento para evaluar 4 tratamientos para la preparacin
del terreno:
T1: Aplicacin de herbicida
T2: Quemado del campo
T3: Escarificacin
T4: Control (sin preparacin del terreno)
La variable respuesta fue el tamao de los plantones en cm a los 30 das. Los resultados
del experimento se dan a continuacin:
Tratamiento
Repeticin T1 T2 T3 T4
1 25 15 12 4
2 18 22 7 6
3 29 17 8 5
4 24 17 13 9
Este experimento fue conducido bajo los lineamientos de un DCA, por lo que el modelo
aditivo lineal es el siguiente:
ij i ij
Y = + + t i ,..., 1 = 1,... j r =
donde:
- Y
ij
es el tamao de los plantones a los 30 das obtenido con el i-simo mtodo de
preparacin del terreno y en la j-sima repeticin.
- es el efecto de la media general de los tamaos de los plantones.
-
i
es el efecto del i-simo mtodo de preparacin del terreno.
-
ij
es el efecto del error experimental con el i-simo mtodo de preparacin del terreno y
en la j-sima repeticin.
Departamento de Estadstica e Informtica
Curso: Mtodos Estadsticos para la Investigacin I Diseo Completamente al Azar
Ing. Ral Eyzaguirre Prez
reyzaguirre@lamolina.edu.pe
36
- t = 4 (Nmero de tratamientos)
- r = 4 (Nmero de repeticiones por tratamiento).
En este problema los resultados obtenidos en las pruebas de Anderson-Darling y de
Bartlett son satisfactorios y por lo tanto se aceptan los supuestos de normalidad y
homogeneidad de variancias (ver anexo al final del captulo). El cuadro de anlisis de
variancia se presenta a continuacin:
Cuadro ANVA
Fuente de Variacin gl SC CM Fc
Tratamientos 3 773.2 257.7 24.02
Error 12 128.8 10.7
Total 15 901.9
H
0
:
i
= i = 1, ..., 4
H
1
:
i
para al menos algn i
Como F = 24.02 > F
[0.95, 3, 12]
=3.49, entonces se rechaza H
0
y se concluye que existe
suficiente evidencia estadstica con un nivel de significacin del 5% para aceptar que con
al menos uno de los tratamientos para la preparacin del terreno se obtienen resultados
diferentes en el tamao de los plantones. El coeficiente de variacin en este problema es:
10.73
22.68%
14.44
cv = =
3. Pruebas de Comparacin de Medias de Tratamientos
Note que la conclusin obtenida tras un anlisis de variancia significativo es que con al menos
uno de los tratamientos se obtienen resultados diferentes. Si bien esta conclusin ya resulta
valiosa, definitivamente no es suficiente. Un investigador, querr ir ms all en el anlisis y
responder preguntas tales como: Con qu tratamiento se obtienen los mejores resultados?,
es este tratamiento significativamente superior a los dems?, es el tratamiento A mejor que
el B?. Para responder a este tipo de preguntas ser necesario realizar pruebas adicionales que
permitan comparar a los distintos tratamientos, en forma individual o por grupos, unos con
otros.
A algunas de estas pruebas se les conoce tambin como pruebas de comparaciones mltiples,
ya que permiten efectuar un conjunto de comparaciones. Suponga por ejemplo que usted
conduce un experimento con 3 tratamientos (A, B y C). En este caso usted podra efectuar 3
comparaciones por pares (A con B, A con C y B con C). Si tiene cuatro tratamientos, el
nmero de comparaciones por pares sera 6, con cinco tratamientos sera 10, y en general, con
t tratamientos, el nmero de comparaciones por pares sera
t
C
2
.
Debido a que se estn efectuando varias pruebas de hiptesis simultneamente y no solo una,
un problema a tener en cuenta es el de la definicin del nivel de significacin. Por ejemplo,
suponga que usted hace un experimento con 5 tratamientos entre los cuales realmente no
Departamento de Estadstica e Informtica
Curso: Mtodos Estadsticos para la Investigacin I Diseo Completamente al Azar
Ing. Ral Eyzaguirre Prez
reyzaguirre@lamolina.edu.pe
37
existen diferencias. En este caso la hiptesis nula de no diferencias sera verdadera para todas
las comparaciones, aunque de hecho por cuestiones de azar usted obtendra resultados
ligeramente diferentes en su experimento. Si usted realizara una prueba para comparar dos de
estos tratamientos a un nivel de significacin del 5%, y repitiera esta misma prueba con
diferentes datos varias veces, encontrara diferencias significativas en aproximadamente el 5%
de las veces; pero qu pasa si usted decide comparar los dos tratamientos en los que se
obtuvieron los resultados ms similares?, qu pasa si usted decide comparar los dos
tratamientos en los que se obtuvieron los resultados ms extremos? En el primer caso la
probabilidad de encontrar diferencias significativas va a ser menor a 5% y en el segundo caso
mayor. Por esta razn, algunas de las pruebas que se vern ms adelante deben ser planeadas
con anterioridad a la ejecucin del experimento y no sugeridas por los resultados obtenidos.
Por ltimo, otro factor a considerar es el nmero de comparaciones que se estn efectuando.
En el caso descrito anteriormente, con un total de cinco tratamientos, usted efectuar 10
pruebas. Cada una de esas pruebas tendr una probabilidad de 5% de resultar en diferencias
significativas, pero cul es la probabilidad de que al menos una de las 10 comparaciones
resulte significativa?. Dado que realmente no existen diferencias entre los 5 tratamientos,
bastar que se encuentren diferencias significativas en una de las 10 comparaciones para
cometer un error. Obviamente, la probabilidad de errar en al menos una de las 10
comparaciones ser mayor al 5%. Esta caracterstica lleva a la necesidad de definir el nivel de
significacin en dos formas. Al total de comparaciones por pares que se puedan plantear entre
todos los tratamientos considerados en un experimento se le llamar una familia de
comparaciones, y entonces al nivel de significacin para una comparacin se le llamar
error individual y al nivel de significacin para el total de comparaciones (probabilidad de
encontrar diferencias significativas en al menos una de las comparaciones) error por
familia. Las pruebas en las que el nivel de significacin sea individual servirn para efectuar
comparaciones individuales planeadas con anterioridad; las pruebas en las que el nivel de
significacin sea por familia servirn para efectuar todas las comparaciones posibles
(comparaciones mltiples).
3.1. Prueba t
Es una prueba para comparaciones planeadas con anterioridad. El nivel de significacin se
toma como un error individual. Los supuestos para la realizacin de esta prueba son:
- Prueba F del anlisis de variancia significativa.
- Variancias homogneas.
- Las muestras son extradas al azar.
Hiptesis:
Caso A: Caso B: Caso C:
H
0
:
i
-
j
= k H
0
:
i
-
j
= k H
0
:
i
-
j
= k
H
1
:
i
-
j
> k H
1
:
i
-
j
< k H
1
:
i
-
j
k
Departamento de Estadstica e Informtica
Curso: Mtodos Estadsticos para la Investigacin I Diseo Completamente al Azar
Ing. Ral Eyzaguirre Prez
reyzaguirre@lamolina.edu.pe
38
Estadstico de Prueba:
( )
i j
c
d
Y Y k
t
s


= t
(gl(Error))
donde
1 1
CME
d
i j
s
r r
| |
= +
|
|
\ .
es la desviacin estndar de la diferencia de las medias
muestrales de los dos tratamientos. Si todos los tratamientos tienen el mismo nmero de
repeticiones, el estadstico de prueba se simplifica a:
( )
2CME
i j
c
Y Y k
t
r


=
Regla de Decisin:
Caso A: La hiptesis nula se rechaza con un nivel de significacin si el t
c
es mayor que el
valor de tabla t
(1-, gl(Error))
.
Caso B: La hiptesis nula se rechaza con un nivel de significacin si el t
c
es menor que el
valor de tabla t
(, gl(Error))
.
Caso C: La hiptesis nula se rechaza con un nivel de significacin si el t
c
es menor que el
valor de tabla t
(/2, gl(Error))
o mayor que el valor de tabla t
(1-/2, gl(Error))
.
Ejemplo 1 (Cont.): Uno de los objetivos del experimento era evaluar si el aumento de
peso logrado con el compuesto vitamnico B superaba al logrado con D en ms de una
libra. El procedimiento para esta prueba ser el siguiente:
H
0
:
B
-
D
= 1
H
1
:
B
-
D
> 1
( ) (11 9.84) 1
0.6598
1 1
1 1
0.1604
CME
6 5
B D
c
B D
Y Y k
t
r r

= = =
| | | |
+
+
|
|
\ .
\ .
El valor de tabla para un nivel de significacin de 5% es t
(0.95, 18)
= 1.734. Como el valor
calculado es menor al valor de tabla no se rechaza H
0
. En conclusin, no existe suficiente
evidencia estadstica para aceptar que el aumento de peso logrado con el compuesto
vitamnico B supere al logrado con D en ms de una libra.
3.2. Prueba DLS
La prueba DLS es una forma abreviada de la prueba t para el caso bilateral (Caso C). La
prueba consiste en calcular una diferencia lmite significativa (DLS) de modo que cualquier
diferencia entre las medias de dos tratamientos mayor a dicho lmite sea significativa. Los
Departamento de Estadstica e Informtica
Curso: Mtodos Estadsticos para la Investigacin I Diseo Completamente al Azar
Ing. Ral Eyzaguirre Prez
reyzaguirre@lamolina.edu.pe
39
supuestos para esta prueba son los mismos que para la prueba t y por supuesto, tambin debe
ser planeada con anterioridad.
Hiptesis:
H
0
:
i
=
j
H
1
:
i

j
Diferencia Lmite Significativa:
DLS = t
(1-/2, gl(Error))

d
s
donde
1 1
CME
d
i j
s
r r
| |
= +
|
|
\ .
es la desviacin estndar de la diferencia de las medias
muestrales de los dos tratamientos.
Regla de Decisin:
La hiptesis nula se rechaza con un nivel de significacin si >
j i
Y Y DLS.
Ejemplo 1 (Cont.): Aplique la prueba DLS para comparar los tratamientos A y B.
H
0
:
A
=
B
H
1
:
A

B
DLS = t
(0.975, 18)

1 1
CME
A B
r r
| |
+
|
\ .
= 2.101 |
.
|

\
|
+
6
1
6
1
1604 . 0 = 0.4858
15 . 0 11 85 . 10 = =
B A
Y Y
Como
B A
Y Y es menor al DLS no se rechaza H
0
. En conclusin, no existe suficiente
evidencia estadstica para aceptar que la ganancia de peso obtenida con el compuesto
vitamnico A sea diferente a la obtenida con el compuesto vitamnico B.
3.3. Prueba de Contrastes Ortogonales
La prueba t vista anteriormente permite comparar dos tratamientos; la prueba de contrastes es
el caso general, ya que permite comparar ms de dos tratamientos. Especficamente, el inters
del investigador estar en comparar combinaciones lineales de las medias de los tratamientos.
Tanto la prueba t como la DLS vienen a ser casos particulares de esta prueba. Los supuestos
para esta prueba son los mismos que para la prueba t o DLS y cada combinacin lineal de las
medias de los tratamientos que sea evaluada tambin debe ser planeada con anterioridad.
Una comparacin o contraste, al que se denotar por L, es una combinacin lineal de la forma:
Departamento de Estadstica e Informtica
Curso: Mtodos Estadsticos para la Investigacin I Diseo Completamente al Azar
Ing. Ral Eyzaguirre Prez
reyzaguirre@lamolina.edu.pe
40
1 1
t t
i i i i i
i i
L c Y rc

= =
= =

en donde:
1
0
t
i i
i
rc
=
=

Si todos los tratamientos tienen el mismo nmero de repeticiones, entonces la condicin


anterior se reduce a:
0
1
=

=
t
i
i
c
y el contraste puede plantearse como:
1
t
i i
i
L c
=
=

Por ejemplo, para comparar los tratamientos 1 y 2 en un experimento con igual nmero de
repeticiones por tratamiento, podra plantearse el siguiente contraste:

1 2
L =
Este es un contraste ya que el coeficiente de
1
es 1 y el de
2
es 1, con lo que la suma de los
coeficientes da cero. Como este contraste involucra solo dos tratamientos puede ser evaluado
con una prueba t o DLS (de hecho note que este contraste fue evaluado en el ejemplo
anterior).
Un contraste que involucre 4 tratamientos, en un experimento con igual nmero de
repeticiones por tratamiento, podra ser el siguiente:
L =
1
+
2
+
3
- 3
4
Cada contraste tiene un grado de libertad, por lo que en un experimento con t tratamientos
podrn efectuarse t 1 contrastes ortogonales (ya que se tienen t 1 grados de libertad para
los tratamientos). Dos contrastes,
1 1 i i i
L rc =

y
2 2 i i i
L rc =

son ortogonales si cumplen


con la siguiente condicin:
1 2
1
0
t
i i i
i
rc c
=
=

Si todos los tratamientos tienen el mismo nmero de repeticiones, la condicin anterior se


reduce a:
1 2
1
0
t
i i
i
c c
=
=

Departamento de Estadstica e Informtica


Curso: Mtodos Estadsticos para la Investigacin I Diseo Completamente al Azar
Ing. Ral Eyzaguirre Prez
reyzaguirre@lamolina.edu.pe
41
Ejemplo: Suponga que se tienen 4 tratamientos (A, B, C y D) con igual nmero de
repeticiones. Un conjunto de contrastes ortogonales podra ser el siguiente:
L
1
=
A
+
B
+
C
- 3
D
L
2
=
A
+
B
- 2
C
L
3
=
A
-
B
Un contraste puede ser evaluado en una prueba de hiptesis usando la distribucin t. Un
conjunto de contrastes ortogonales pueden ser evaluados simultneamente en una prueba de
hiptesis usando la distribucin F. En esta seccin se ver solo el primer caso.
Hiptesis:
Caso A: Caso B: Caso C:
H
0
: L = L
0
H
0
: L = L
0
H
0
: L = L
0
H
1
: L > L
0
H
1
: L < L
0
H
1
: L L
0
Estadstico de Prueba:
L
c
s
L L
t


= t
(gl(Error))
donde
1

t
i i i
i
L c rY

=
=

es el contraste estimado y
2

1
CME
t
i i
L
i
s rc
=
=

es la desviacin estndar
del contraste estimado. Si todos los tratamientos tienen el mismo nmero de repeticiones, el
contraste estimado se puede definir por
1

t
i i
i
L c Y

=
=

y su desviacin estndar ser


2

1
CME
t
i
L
i
c
s
r
=
=

.
Regla de Decisin:
Caso A: La hiptesis nula se rechaza con un nivel de significacin si el t
c
es mayor que el
valor de tabla t
(1-, gl(Error))
.
Caso B: La hiptesis nula se rechaza con un nivel de significacin si el t
c
es menor que el
valor de tabla t
(, gl(Error))
.
Caso C: La hiptesis nula se rechaza con un nivel de significacin si el t
c
es menor que el
valor de tabla t
(/2, gl(Error))
o mayor que el valor de tabla t
(1-/2, gl(Error))
.
Ejemplo 2 (Cont.): En el ejemplo de preparacin del terreno, evale si el tamao medio de
los plantones obtenido en terreno preparado (Tratamientos T1, T2 y T3) es superior en ms
de 5 cm al obtenido en terreno sin preparacin (Tratamiento T4).
El contraste a evaluar en este caso es L =
1
+
2
+
3
- 3
4
, y se quiere probar si:
Departamento de Estadstica e Informtica
Curso: Mtodos Estadsticos para la Investigacin I Diseo Completamente al Azar
Ing. Ral Eyzaguirre Prez
reyzaguirre@lamolina.edu.pe
42
1 2 3
4
5
3


+ +
>
es decir, si L es mayor a 15. Luego, las hiptesis sern:
H
0
: L = 15
H
1
: L > 15
El clculo del estadstico de prueba es el siguiente:
= L

1 2 3 4
3 Y Y Y Y + + = 33.75
2 2 2 2

(1) (1) (1) ( 3)


CME 5.674
4 4 4 4
L
s
| |
= + + + =
|
\ .
0

33.75 15
3.305
5.674
c
L
L L
t
s

= = =
El valor de tabla para un nivel de significacin de 5% es t
(0.95, 12)
= 1.782. Como el valor
calculado es mayor al valor de tabla se rechaza H
0
y se concluye que existe suficiente
evidencia estadstica para aceptar que el tamao medio de los plantones obtenido en
terreno preparado es superior en ms de 5 cm al obtenido en terreno sin preparacin.
3.4. Prueba de Tukey
La prueba de Tukey permite evaluar la significancia de todas las diferencias entre
tratamientos. Las hiptesis correspondientes a todas las comparaciones constituyen una
familia y por lo tanto el error es familiar. Los supuestos para la realizacin de esta prueba son:
- Variancias homogneas.
- Las muestras son extradas al azar.
Hiptesis:
H
0
:
i
=
j
i j
H
1
:
i

j
Amplitud Lmite Significativa de Tukey:
ALS(T) = AES(T)
d
s
donde:
- AES(T) es la amplitud estudiantizada significativa de Tukey, obtenida desde la tabla de
Tukey con = nivel de significacin, p = nmero de tratamientos del experimento y los
grados de libertad del error experimental.
Departamento de Estadstica e Informtica
Curso: Mtodos Estadsticos para la Investigacin I Diseo Completamente al Azar
Ing. Ral Eyzaguirre Prez
reyzaguirre@lamolina.edu.pe
43
-
CME
d
s
r
= es la desviacin estndar de la diferencia de las medias muestrales de dos
tratamientos para la prueba de Tukey cuando los tratamientos tienen el mismo nmero de
repeticiones.
Si los tratamientos no estn igualmente repetidos, entonces la desviacin estndar puede
calcularse por:
CME 1 1
2
d
i j
s
r r
| |
= +
|
|
\ .
Sin embargo, esta aproximacin hace que la prueba sea ligeramente conservadora (esto es,
disminuye la probabilidad de detectar diferencias significativas) ya que el nivel de
significacin real es ligeramente menor que el establecido en la prueba.
Regla de Decisin:
La hiptesis nula se rechaza con un nivel de significacin si >
j i
Y Y ALS(T).
Ejemplo 1 (Cont.): Aplique la prueba de Tukey para evaluar la significancia de las
diferencias entre los tratamientos.
En este caso se estn evaluando un conjunto de hiptesis:
H
0
:
A
=
B
H
0
:
A
=
C
H
0
:
A
=
D
H
1
:
A

B
H
1
:
A

C
H
1
:
A

D
H
0
:
B
=
C
H
0
:
B
=
D
H
0
:
C
=
D
H
1
:
B

C
H
1
:
B

D
H
1
:
C

D
El valor de tabla con = 5%, p = 4 tratamientos y 18 grados de libertad para el error
experimental es AES(T) = 4.00. Dado que los tratamientos tienen diferentes nmeros de
repeticiones, la desviacin estndar para la diferencia de dos medias ser diferente
dependiendo de los tratamientos que se estn comparando. En el siguiente cuadro se
resumen los clculos necesarios para efectuar las 6 comparaciones:
Tratamientos
comparados
Nmero de
repeticiones
CME 1 1
2
i j
r r
| |
+
|
|
\ .
ALS(T)


j i
Y Y
Significancia
A y B 6 y 6 0.1675 0.6540 0.15 n.s.
A y C 6 y 5 0.1715 0.6859 0.35 n.s.
A y D 6 y 5 0.1715 0.6859 1.01 *
B y C 6 y 5 0.1715 0.6859 0.50 n.s.
B y D 6 y 5 0.1715 0.6859 1.16 *
C y D 5 y 5 0.1791 0.7164 0.66 n.s
Departamento de Estadstica e Informtica
Curso: Mtodos Estadsticos para la Investigacin I Diseo Completamente al Azar
Ing. Ral Eyzaguirre Prez
reyzaguirre@lamolina.edu.pe
44
n.s. significa que la diferencia entre ambos tratamientos no es significativa (es decir, que no
existe evidencia suficiente para rechazar H
0
). * significa que la diferencia entre ambos
tratamientos s es significativa. Es usual utilizar el smbolo * para denotar diferencias o
efectos significativos con = 5% y ** para denotar diferencias o efectos significativos con
= 1%. En el primer caso se dice que la diferencia o efecto es significativo y en el segundo
que es altamente significativo. Esta simbologa es muy til para presentar los resultados de
pruebas mltiples en las que se evalan un gran nmero de hiptesis. Otra representacin
resumida y bastante til es la del diagrama de lneas. El mtodo consiste en ordenar las
medias de los tratamientos en forma ascendente o descendente y unir con una lnea todos los
tratamientos que no presentan diferencias significativas. En el ejemplo, el diagrama de lneas
sera el siguiente:
D C A B
9.84 10.50 10.85 11.00
3.5. Prueba de Dunnett
La prueba de Dunnett es utilizada cuando se quiere comparar a cada uno de los tratamientos
contra el tratamiento testigo o control. En esta prueba, el error tambin es familiar. Los
supuestos para la realizacin de esta prueba son:
- Variancias homogneas.
- Las muestras son extradas al azar.
Hiptesis:
H
0
:
T
=
i
i T (tratamiento testigo)
H
1
:
T

i
Amplitud Lmite Significativa de Dunnett:
ALS(Dn) = t(Dn)
d
s
donde:
- t(Dn) es el valor de tabla para la prueba, obtenido desde la tabla de Dunnett con = nivel
de significacin, p = nmero de tratamientos del experimento sin incluir el control y los
grados de libertad del error experimental.
-
2CME
d
s
r
= es la desviacin estndar de la diferencia de las medias muestrales del
tratamiento testigo y el tratamiento i para la prueba de Dunnett cuando los tratamientos
tienen el mismo nmero de repeticiones.
Si los tratamientos no estn igualmente repetidos, entonces la desviacin estndar puede
calcularse por:
Departamento de Estadstica e Informtica
Curso: Mtodos Estadsticos para la Investigacin I Diseo Completamente al Azar
Ing. Ral Eyzaguirre Prez
reyzaguirre@lamolina.edu.pe
45
1 1
CME
d
T i
s
r r
| |
= +
|
\ .
Regla de Decisin:
La hiptesis nula se rechaza con un nivel de significacin si >
i T
Y Y ALS(Dn).
Ejemplo 1 (Cont.): Aplique la prueba de Dunnett para evaluar la significancia de las
diferencias de los tratamientos con el tratamiento testigo.
H
0
:
D
=
A
H
0
:
D
=
B
H
0
:
D
=
C
H
1
:
D

A
H
1
:
D

B
H
1
:
D

C
El valor de tabla con = 5%, p = 3 tratamientos sin considerar el control y 18 grados de
libertad para el error experimental es t(Dn) = 2.56. Dado que los tratamientos tienen
diferente nmero de repeticiones, la desviacin estndar para la diferencia de dos medias
ser diferente dependiendo de los tratamientos que se estn comparando. En el siguiente
cuadro se resumen los clculos necesarios para efectuar las 3 comparaciones:
Tratamientos
comparados
Nmero de
repeticiones
1 1
CME
T i
r r
| |
+
|
\ .
ALS(Dn)


i T
Y Y
Significancia
D y A 5 y 6 0.2425 0.6208 1.01 *
D y B 5 y 6 0.2425 0.6208 1.16 *
D y C 5 y 5 0.2533 0.6484 0.66 *
En este caso, en los tres tratamientos (A, B y C) se obtienen diferencias significativas con
respecto al tratamiento testigo.
4. Prueba de Kruskal Wallis
La prueba de Kruskal Wallis es la alternativa no paramtrica para el diseo completamente al
azar. Para la aplicacin de una prueba paramtrica, se requiere del cumplimiento de ciertos
supuestos sobre los parmetros de las poblaciones desde las cuales se obtienen los datos,
como por ejemplo la normalidad de los errores. En una prueba no paramtrica en cambio, no
son necesarios estos supuestos.
4.1. Datos
Los datos consisten de k muestras independientes (correspondientes a los k tratamientos) de
tamaos n
i
(i = 1, ... k). Sea N que denota el total de observaciones:
1
k
i
i
N n
=
=

Departamento de Estadstica e Informtica


Curso: Mtodos Estadsticos para la Investigacin I Diseo Completamente al Azar
Ing. Ral Eyzaguirre Prez
reyzaguirre@lamolina.edu.pe
46
Asigne el rango 1 a la observacin ms pequea, 2 a la segunda y as sucesivamente hasta la
ms grande de las N observaciones, la cual recibir el rango N. En caso de empates utilice la
media de los rangos correspondientes. Sea R(X
ij
) el rango asignado a la observacin X
ij
y sea
R
i
la suma de los rangos asignados a la muestra i:
1
( )
i
n
i ij
i
R R X
=
=

Calcule R
i
para cada muestra.
4.2. Supuestos
1. Las k muestras son seleccionadas aleatoriamente desde sus respectivas poblaciones, lo
cual implica independencia entre los datos dentro de cada muestra.
2. Las muestras son independientes.
3. La escala de medida es al menos ordinal.
4. Las k poblaciones tienen distribuciones de probabilidad idnticas a no ser que algunas
tiendan a generar valores mayores o menores que las otras.
4.3. Procedimiento de Prueba
Hiptesis:
H
0
: Las k muestras provienen de poblaciones idnticas.
H
1
: Las k muestras no provienen de poblaciones idnticas.
Debido a que esta prueba est diseada para encontrar diferencias entre las medias de las
poblaciones, las hiptesis algunas veces (cuando la variable sea cuantitativa) pueden
definirse como sigue:
H
0
: Las k poblaciones tienen la misma media.
H
1
: Las k poblaciones no tienen la misma media.
Estadstico de Prueba:
2 2
2
1
1 ( 1)
4
k
i
i
i
R N N
T
S n
=
| | +
=
|
\ .

donde:
2
2 2
1 ( 1)
( )
1 4
ij
ij
N N
S R X
N
| |
+
=
|

\ .

Si no hay empates, S
2
se simplifica a:
2
( 1)
12
N N
S
+
=
Departamento de Estadstica e Informtica
Curso: Mtodos Estadsticos para la Investigacin I Diseo Completamente al Azar
Ing. Ral Eyzaguirre Prez
reyzaguirre@lamolina.edu.pe
47
y el estadstico de prueba se reduce a:
2
1
12
3( 1)
( 1)
k
i
i
i
R
T N
N N n
=
= +
+

Si el nmero de empates es moderado, la diferencia entre ambas expresiones de T ser
pequea.
Regla de Decisin:
La hiptesis nula se rechaza con un nivel de significacin si T resulta mayor que el valor de
tabla
2
(1-, k-1)
.
Ejemplo 3: Para evaluar el efecto de la expectativa sobre la percepcin de la calidad en
vinos, un investigador asign aleatoriamente 24 bebedores aficionados a tres grupos A, B y
C, de 8 individuos cada uno. Cada individuo fue citado para una entrevista individual.
Desafortunadamente, uno de los individuos del grupo B y dos del grupo C no se
presentaron por lo que el investigador tuvo que trabajar con muestras de distinto tamao. A
los individuos que s se presentaron se les pidi que prueben una copa de vino y que la
evalen en una escala de 10 puntos donde 1 era el calificativo menor y 10 el mayor. En
realidad, los tres grupos probaron el mismo vino; la nica diferencia est en la presentacin
de la muestra, la cual es diseada para inducir a una alta expectativa sobre la calidad del
vino en los miembros del grupo A, una baja expectativa en los miembros del grupo C y una
expectativa neutral en los del grupo B. La siguiente tabla muestra los calificativos
asignados por los 21 individuos:
Grupo A 6 7 7 8 8 9 9 9
Grupo B 4 5 5 6 8 8 7
Grupo C 3 4 5 5 8 6
C B A
9
8
7
6
5
4
3
Grupo
C
a
l
i
f
i
c
a
t
i
v
o
H
0
: La presentacin del vino no influye en la percepcin de su calidad.
H
1
: La presentacin del vino s influye en la percepcin de su calidad.
Departamento de Estadstica e Informtica
Curso: Mtodos Estadsticos para la Investigacin I Diseo Completamente al Azar
Ing. Ral Eyzaguirre Prez
reyzaguirre@lamolina.edu.pe
48
La asignacin de los rangos a las observaciones, de menor a mayor (desde 1 a 21), se
presenta en el siguiente cuadro:
Grupo A 9 12 12 16 16 20 20 20 R
1
= 125
Grupo B 2.5 5.5 5.5 9 16 16 12 R
2
= 66.5
Grupo C 1 2.5 5.5 5.5 16 9 R
3
= 39.5
Note que en este caso hay varios empates por lo que los clculos sern los siguientes:
2 2 2 2
( ) 9 12 9 3289.5
ij
ij
R X = + + + =


2
2 2
1 ( 1)
( )
1 4
ij
ij
N
S R X N
N
| |
+
=
|

\ .

=
2
1 21(21 1)
3289.5
21 1 4
| | +
=
|

\ .
37.425
2 2
2
1
1 ( 1)
4
k
i
i
i
R N N
T
S n
=
| | +
=
|
\ .

=
2 2 2 2
1 125 66.5 39.5 21(21 1)
37.425 8 7 6 4
| | +
+ + =
|
\ .
8.12
De haber pocos empates, el clculo se simplificara a:
2
( 1)
12
N N
S
+
= =
2
21(21 1)
12
+
= 38.5
2
1
12
3( 1)
( 1)
k
i
i
i
R
T N
N N n
=
= +
+

=
2 2 2
12 125 66.5 39.5
3(21 1)
21(21 1) 8 7 6
| |
+ + + =
|
+
\ .
7.89
El valor de tabla para un nivel de significacin del 5% es
2
(0.95, 2)
= 5.991. Como el
estadstico de prueba resulta mayor que el valor de tabla se rechaza H
0
y se concluye que
existe suficiente evidencia estadstica para aceptar que la presentacin del vino influye en la
percepcin sobre su calidad.
4.4. Comparaciones Mltiples
Si la hiptesis nula es rechazada, la prueba de Kruskal Wallis presenta un procedimiento para
comparar a los tratamientos por pares. Se dir que los tratamientos i y j difieren
significativamente si satisfacen la siguiente desigualdad:
2
(1 / 2, )
1 1 1
j
i
N k
i j i j
R
R N T
t S
n n N k n n

| |
| |
> +
|
|
|

\ .
\ .
Ejemplo 3 (Cont.): Con los datos del ejemplo se tiene:
(1 / 2, ) (0.975,18)
2.101
N k
t t

= =
Departamento de Estadstica e Informtica
Curso: Mtodos Estadsticos para la Investigacin I Diseo Completamente al Azar
Ing. Ral Eyzaguirre Prez
reyzaguirre@lamolina.edu.pe
49
Tratamientos
comparados
Nmero de
repeticiones
j
i
i j
R
R
n n

2
(1 / 2, )
1 1 1
N k
i j
N T
t S
N k n n

| |
| |
+
|
|
|

\ .
\ .
Sig.
A y B 8 y 7 6.13 5.40 *
A y C 8 y 6 9.04 5.64 *
B y C 7 y 6 2.92 5.81 ns
Las diferencias encontradas entre los grupos A y B as como las encontradas entre A y C
resultan significativas, no as la diferencia entre los grupos B y C.
Departamento de Estadstica e Informtica
Curso: Mtodos Estadsticos para la Investigacin I Diseo Completamente al Azar
Ing. Ral Eyzaguirre Prez
reyzaguirre@lamolina.edu.pe
50
Anexo: Salida de Minitab
Ejemplo 1
P-Value: 0.701
A-Squared: 0.253
Anderson-Darling Normality Test
N: 22
StDev: 0.370778
Average: 0
0.5 0.0 -0.5
.999
.99
.95
.80
.50
.20
.05
.01
.001
P
r
o
b
a
b
i
l
i
t
y
RESI1
Normal Probability Plot
Test for Equal Variances
Response Y
Factors Trat
ConfLvl 95.0000
Bartlett's Test (normal distribution)
Test Statistic: 0.605
P-Value : 0.895
One-way ANOVA: Resp versus Trat
Analysis of Variance for Resp
Source DF SS MS F P
Trat 3 4.266 1.422 8.87 0.001
Error 18 2.887 0.160
Total 21 7.153
Individual 95% CIs For Mean
Based on Pooled StDev
Level N Mean StDev ---+---------+---------+---------+---
A 6 10.850 0.404 (-----*-----)
B 6 11.000 0.316 (----*-----)
C 5 10.500 0.436 (-----*-----)
D 5 9.840 0.451 (-----*-----)
---+---------+---------+---------+---
Pooled StDev = 0.400 9.60 10.20 10.80 11.40
Departamento de Estadstica e Informtica
Curso: Mtodos Estadsticos para la Investigacin I Diseo Completamente al Azar
Ing. Ral Eyzaguirre Prez
reyzaguirre@lamolina.edu.pe
51
Dunnett's comparisons with a control
Family error rate = 0.0500
Individual error rate = 0.0199
Critical value = 2.56
Control = level (D) of Trat
Intervals for treatment mean minus control mean
Level Lower Center Upper ----------+---------+---------+-------
A 0.3902 1.0100 1.6298 (-----------*------------)
B 0.5402 1.1600 1.7798 (-----------*------------)
C 0.0127 0.6600 1.3073 (------------*------------)
----------+---------+---------+-------
0.50 1.00 1.50
Tukey's pairwise comparisons
Family error rate = 0.0500
Individual error rate = 0.0111
Critical value = 4.00
Intervals for (column level mean) - (row level mean)
A B C
B -0.8040
0.5040
C -0.3359 -0.1859
1.0359 1.1859
D 0.3241 0.4741 -0.0564
1.6959 1.8459 1.3764
Fisher's pairwise comparisons
Family error rate = 0.190
Individual error rate = 0.0500
Critical value = 2.101
Intervals for (column level mean) - (row level mean)
A B C
B -0.6358
0.3358
C -0.1595 -0.0095
0.8595 1.0095
D 0.5005 0.6505 0.1278
1.5195 1.6695 1.1922
Departamento de Estadstica e Informtica
Curso: Mtodos Estadsticos para la Investigacin I Diseo Completamente al Azar
Ing. Ral Eyzaguirre Prez
reyzaguirre@lamolina.edu.pe
52
Ejemplo 2
P-Value: 0.827
A-Squared: 0.211
Anderson-Darling Normality Test
N: 16
StDev: 2.92973
Average: 0
5 0 -5
.999
.99
.95
.80
.50
.20
.05
.01
.001
P
r
o
b
a
b
i
l
i
t
y
RESI1
Normal Probability Plot
Test for Equal Variances
Response Y
Factors T
ConfLvl 95.0000
Bartlett's Test (normal distribution)
Test Statistic: 1.516
P-Value : 0.679
One-way ANOVA: Y versus T
Analysis of Variance for Y
Source DF SS MS F P
T 3 773.2 257.7 24.02 0.000
Error 12 128.8 10.7
Total 15 901.9
Individual 95% CIs For Mean
Based on Pooled StDev
Level N Mean StDev -------+---------+---------+---------
1 4 24.000 4.546 (----*----)
2 4 17.750 2.986 (----*----)
3 4 10.000 2.944 (----*----)
4 4 6.000 2.160 (-----*----)
-------+---------+---------+---------
Pooled StDev = 3.276 7.0 14.0 21.0
Departamento de Estadstica e Informtica
Curso: Mtodos Estadsticos para la Investigacin I Diseo Completamente al Azar
Ing. Ral Eyzaguirre Prez
reyzaguirre@lamolina.edu.pe
53
Dunnett's comparisons with a control
Family error rate = 0.0500
Individual error rate = 0.0199
Critical value = 2.68
Control = level (4) of T
Intervals for treatment mean minus control mean
Level Lower Center Upper ----+---------+---------+---------+---
1 11.786 18.000 24.214 (--------*--------)
2 5.536 11.750 17.964 (--------*--------)
3 -2.214 4.000 10.214 (--------*--------)
----+---------+---------+---------+---
0.0 7.0 14.0 21.0
Tukey's pairwise comparisons
Family error rate = 0.0500
Individual error rate = 0.0117
Critical value = 4.20
Intervals for (column level mean) - (row level mean)
1 2 3
2 -0.629
13.129
3 7.121 0.871
20.879 14.629
4 11.121 4.871 -2.879
24.879 18.629 10.879
Fisher's pairwise comparisons
Family error rate = 0.184
Individual error rate = 0.0500
Critical value = 2.179
Intervals for (column level mean) - (row level mean)
1 2 3
2 1.203
11.297
3 8.953 2.703
19.047 12.797
4 12.953 6.703 -1.047
23.047 16.797 9.047
Departamento de Estadstica e Informtica
Curso: Mtodos Estadsticos para la Investigacin I Diseo Completamente al Azar
Ing. Ral Eyzaguirre Prez
reyzaguirre@lamolina.edu.pe
54
Ejemplo 3
Kruskal-Wallis Test
Kruskal-Wallis Test on Resp
Grupo N Median Ave Rank Z
A 8 8.000 15.6 2.68
B 7 6.000 9.5 -0.78
C 6 5.000 6.6 -2.06
Overall 21 11.0
H = 7.89 DF = 2 P = 0.019
H = 8.12 DF = 2 P = 0.017 (adjusted for ties)
Departamento de Estadstica e Informtica
Curso: Mtodos Estadsticos para la Investigacin I Diseo Completamente al Azar
Ing. Ral Eyzaguirre Prez
reyzaguirre@lamolina.edu.pe
55
Ejercicios
1. Los datos que se presentan a continuacin corresponden al tiempo de coagulacin (en
segundos) de sangre extrada a 24 animales, asignados aleatoriamente a cuatro dietas
diferentes.
Dieta
A B C D
62 63 68 56
60 67 66 62
63 71 71 60
59 64 67 61
65 68 63
64
a) Presente el modelo aditivo lineal. Interprete cada uno de sus componentes en trminos del
problema.
b) Estime los efectos de los tratamientos.
c) Calcule los residuales obtenidos con la dieta B (error experimental).
d) Efecte la prueba de Anderson Darling para normalidad.
e) Efecte la prueba de Bartlett para homogeneidad de variancias.
f) Realice el anlisis de variancia. Calcule el coeficiente de variacin.
g) Realice la prueba de Tukey. Concluya mediante el diagrama de lneas.
2. En una estacin experimental se estudiaron cuatro dosis de insecticidas (3 l/ha, 5 l/ha, 7
l/ha. y 9 l/ha.) para el control de la Racha en papa. Los resultados se presentan a
continuacin en TM de rendimiento de papa por ha:
Dosis de insecticida
3 l/ha 5 l/ha 7 l/ha 9 l/ha
4.29 8.50 10.75 5.63
4.24 8.03 11.52 5.96
4.53 7.94 11.49 5.47
4.26 6.75 11.52 6.01
4.62 7.16 10.81 6.09
a) Presente el modelo aditivo lineal e interprete cada uno se sus componentes en trminos del
problema.
b) Estime los efectos de los tratamientos.
c) Efecte la prueba de Anderson Darling para normalidad.
d) Efecte la prueba de Bartlett para homogeneidad de variancias.
e) Realice el anlisis de variancia. Calcule el coeficiente de variacin.
f) Realice la prueba de Tukey. Concluya mediante el diagrama de lneas.
Departamento de Estadstica e Informtica
Curso: Mtodos Estadsticos para la Investigacin I Diseo Completamente al Azar
Ing. Ral Eyzaguirre Prez
reyzaguirre@lamolina.edu.pe
56
g) Antes de realizar el experimento, el experimentador sostena que con la dosis 2 (5 l/ha) se
poda obtener un rendimiento medio superior en ms de 2 Tm/ha al de la dosis 1 (3 l/ha).
A que conclusin puede llegar con la informacin del experimento.
3. Se realiz un estudio para evaluar el efecto de tres frmacos en la duracin de la relajacin
muscular inducida. En el experimento 24 pacientes fueron aleatoriamente asignados a los
cuatro grupos, cinco pacientes a los dos primeros grupos y 7 a los dos ltimos. Un grupo
no recibi frmaco alguno, uno recibi Innovar, uno Droperidol y uno Fentayl antes de la
aplicacin de anestesia. Para cada paciente la duracin de la relajacin muscular fue
registrada en minutos. Los resultados del experimento son dados a continuacin:
Frmaco
Sin droga Innovar Droperidol Fentayl
5.9 16.1 10.3 7.2
8.0 11.2 6.8 10.5
11.5 9.0 5.3 8.5
6.0 8.8 3.2 4.2
9.2 10.2 6.5 6.5
7.0 6.6
7.5 9.1
a) Presente el modelo aditivo lineal. Interprete cada uno de sus componentes en trminos del
problema.
b) Estime los efectos de los tratamientos.
c) Calcule los residuales obtenidos con la droga Innovar.
d) Efecte la prueba de Anderson Darling para normalidad.
e) Efecte la prueba de Bartlett para homogeneidad de variancias.
f) Realice el anlisis de variancia. Calcule el coeficiente de variacin.
g) Realice la prueba de Tukey. Concluya mediante el diagrama de lneas.
h) Realice la prueba de Dunnett. Qu frmaco recomendara usted?
i) Uno de los objetivos del experimento era comparar los frmacos Droperidol y Fentayl,
razn por la cual se asignaron 7 repeticiones a cada uno. Existe suficiente evidencia
estadstica para aceptar que Fentayl es mejor que Droperidol?
4. Se desea comparar los resultados obtenidos en el examen parcial de Mtodos Estadsticos
para la Investigacin I por las clases de 4 profesores. A continuacin se presentan los
resultados de una muestra aleatoria de 8 alumnos de cada clase.
Profesor Nota en el examen parcial
A 10 16 17 13 14 17 18 12
B 16 14 13 7 9 13 11 14
C 9 6 10 8 14 11 12 8
D 13 13 12 16 8 11 7 12
a) Presentan los datos suficiente evidencia estadstica para aceptar que las notas en el
examen parcial son diferentes entre los grupos?
Departamento de Estadstica e Informtica
Curso: Mtodos Estadsticos para la Investigacin I Diseo Completamente al Azar
Ing. Ral Eyzaguirre Prez
reyzaguirre@lamolina.edu.pe
57
b) Realice la prueba de comparacin por pares.
5. Cuatro programas de entrenamiento para cierto trabajo fueron probados con 20 empleados
nuevos. Los 20 empleados fueron asignados al mismo supervisor y, al final del periodo de
entrenamiento, el supervisor calific a los empleados de acuerdo a su habilidad para el
trabajo, asignando los rangos ms bajos a aquellos empleados con la menor habilidad.
Programa Rangos
A 4 6 7 2 10
B 1 8 12 3 11
C 20 19 19 14 5
D 18 15 17 13 9
Indican estos datos diferencias en la efectividad de los programas de entrenamiento? Si la
respuesta es afirmativa, cules son diferentes?

Вам также может понравиться