Вы находитесь на странице: 1из 29

Comparaciones Mltiples

Cuando se realiza un experimento, y se utiliza el modelo I, el investigador siempre est


interesado en determinar si existe o no diferencia significante de comparaciones entre
dos medias de la variable respuesta con diferentes tratamientos. Estas comparaciones
pueden ser planeadas o no antes del experimento. Las pruebas de comparaciones ms
usadas son:
1) Prueba de t y DMS o DLS (Diferencia Mnima o Limite Significante)(Para
comparaciones planeadas).
2) Prueba de Tukey (Para muchas comparaciones planeadas o comparaciones no
planeadas).
3) Prueba de Dunnett (para comparar con un tratamiento testigo o control).
4.) Prueba de t y F con contrastes.
5) Prueba de Scheffe (para funciones lineales de media o para contraste y
comparaciones no planeadas).
6) Prueba de Bonferroni (para pocas comparaciones entre en m pares).
7) La prueba de Hsu con el mejor tratamiento (cuando se desea que el mejor o el
conjunto de los mejores tratamiento sea seleccionado)
Prueba de t y Diferencia Mnima o Lmite Significante (DMS o DLS)
Esta prueba puede realizarse si se cumple las siguientes condiciones:
a) Esta prueba es vlida para comparaciones planeadas. Es decir, cuando las
comparaciones entre dos medias de la variable respuesta con diferentes
tratamientos han sido planeados de antemano, antes de realizar el experimento.
b) La prueba de F en el ANVA debe resultar significante.
c) Los ij es una variable aleatoria independiente distribuida normalmente con
media cero y variancia comn 2 .
Prueba de t
Planteamiento de hiptesis
Caso Bilateral
H 0 : i i k

Unilateral a la derecha
H 0 : i i k

Unilateral a la izquierda
H 0 : i i k

H a : i i k

H a : i i k

H a : i i k

Para i i , i, i 1, 2,

,t

Nivel de significacin
Estadstica de prueba

tc
donde :

Yi Yi k
~ tGLE / H 0 es verdadera
SYi Yi

GLE = Grados de libertad del error


1 1
SYi Yi CME
ni ni
Criterio de decisin
Decisin

Caso Bilateral

Se acepta H 0

Se rechaza H 0

tc t

,GLE
2

tc t

1 ,GLE
2

,GLE
2

Unilateral a la
derecha
tc t1 ,GLE

Unilateral a la
izquierda
tc t ,GLE

tc t1 ,GLE

tc t ,GLE

o tc t

1 ,GLE
2

Diferencia mnima o lmite de significacin (DMS o DLS)


H 0 : i i

H a : i i

Para i i , i, i 1, 2,

,t

Nivel de significacin
En la prueba de t se acepta H 0 si

,GLE
2

,GLE
2

Yi Yi
1 ,GLE
2

tc t

1 ,GLE
2

Yi Yi
t
SYi Yi
1 ,GLE
2

Yi Yi t

Yi Yi
1 ,GLE
2

Yi Yi t

Yi Yi t

o DLS i, i t

Yi Yi
1 ,GLE
2

Y se rechaza H 0 si

Yi Yi
1 ,GLE
2

Entonces si definimos

DMS i, i t

Yi Yi
1 ,GLE
2

Yi Yi
1 ,GLE
2

Luego, un criterio para examinar si existe diferencia significativa entre comparaciones


de dos medias de la variable respuestas de diferentes tratamientos se puede usar este
criterio de la diferencia mnima o lmite significante DMS i, i o DLS i, i . Esto
es, se rechaza H 0 si

Yi Yi DMS i, i o Yi Yi DLS i, i
Para i i , i, i 1, 2,

,t

Ejemplo: Para el ejemplo de tiempo de coagulacin, suponga se ha planeado comparar


las verdaderas media de los tiempos de coagulacin que se obtiene con la dieta A y la
dieta C, use la prueba de t para realizar esta comparacin a un nivel de significacin
0.05 .
H 0 : A C

H a : A C

0.05
1
1
SYA YC CME
nA nC

tc

5.6

1 1

1.5275
4 6

YA YC 61 68

4.5826
SYA YC
1.5275

t 0.025,20 2.086 y t 0.975,20 2.086 , como tc t 0.975,20 , se rechaza H 0


Ejemplo Si se planeo realizar todas las comparaciones en el ejemplo de coagulacin a
un nivel de significacin 0.05 , use la prueba de DMS. Luego, se tiene:
H 0 : i i

H a : i i

Para i i , i, i A, B, C, D

i
Yi.

A
61

D
61

B
66

C
68

ni

Comparaciones

Yi Yi

C-A
C-D
C-B
B-A
B-D
D-A
*=significativo ,

SYi Yi

DMS i, i t 0.975,20 SYi Yi

7
1.5275
7
1.2780
2
1.3663
5
1.5275
5
1.2780
0
1.4491
ns= no significativo

3.1864 *
2.6659 *
2.8501 ns
3.1864 *
2.6659 *
3.0228 ns

Prueba de t con R
>
>
>
>

coag<-read.table("coag.txt",header=TRUE)
tiempo<-coag[,1]
dieta<-coag[,2]
pairwise.t.test(tiempo,dieta,p.adjust.method="none")

Pairwise comparisons using t tests with pooled SD


data:
b
c
d

tiempo and dieta

a
0.00380
0.00018
1.00000

b
0.15878
0.00086

c
2.3e-05

P value adjustment method: none

Las comparaciones mltiples afectan las tasas de error


Para probar la hiptesis
H 0 : i j
H1 : i j

para i j , i, j 1, 2,

,t

se utiliza la estadstica
t0

yi y j
1 1
s2
ri rj

(1)

Siendo s 2 CME , el nivel de significacin o probabilidad de error tipo I para una sola
prueba es una tasa de error con respecto a la comparacin , C , es el riesgo que se estn
dispuestos a correr en una sola comparacin .
Si se tienen t tratamientos entonces se pueden hacer t t 1 2 comparaciones por
pares. Por ejemplo si se tienen cuatro tratamientos: A, B, C, D, entonces se puede hacer
4 3 / 2 6 pares posibles de comparaciones: (A,B), (A,C), (A,D), (B,C), (B,D), (C,D),
Si se prueban los 6 pares existe la posibilidad de cometer 0, 1, 2, 3, 4, 5 o 6 errores de
tipo I, si las medias poblacionales son iguales.
Con la posibilidad de hasta 6 errores tipo I para 6 pruebas, se puede emplear otra forma
de error tipo I basada en el riesgo acumulado asociado con la familia de prueba en
estudio. La familia es el conjunto de comparaciones por pares como para el ejemplo del
prrafo anterior. El riesgo acumulado asociado con una familia de comparaciones se
conoce como la tasa de error tipo I con respecto al experimento, E . Es el riesgo de
cometer al menos un error tipo I en la familia de comparaciones en el experimento.
Para una familia de pruebas independientes, se puede evaluar la tasa de error tipo I con
respecto al experimento. Sin embargo, no todas las pruebas son independientes con la
ecuacin dado en (1), ya que s 2 CME en el denominador es la misma, y en el
numerador de cada prueba contiene la misma media que en algunos otros estadsticos
t0 .

Aunque las pruebas en la familia descrita no son independientes, se puede evaluar el


lmite superior para el valor del error tipo I con respecto al experimento, si se suponen
pruebas independientes. Suponiendo que las hiptesis nulas son ciertas para cada una de
t t 1
las n
pruebas, la probabilidad de un error tipo I para cualquier prueba sola es
2
C ( la tasa respecto a la comparacin) con 1 C como la probabilidad de una
decisin correcta. La probabilidad de cometer x errores tipo I est dada por la
distribucin Binomial como:

n
n x
(2)
P x Cx 1 C
x
, n errores tipo I. La probabilidad de no cometer error tipo I es:

para x 0,1,

P X 0 1 C

(3)

La probabilidad de cometer al menos un error tipo I ( x 1, 2,

, n ) es

P x 1 1 P x 0 , o sea

E 1 1 C

(4)

La probabilidad E es el riesgo de cometer al menos un error tipo I entre las n


comparaciones independientes. Es el lmite superior de la tasa de error tipo I con
respecto al experimento, para n pruebas en un conjunto de medias de variables
respuestas con diferentes tratamientos.
La relacin

C 1 1 E

1/ n

(5)

Expresa la tasa de error tipo I con respecto a la comparacin como una funcin de la
tasa de error tipo I con respecto al experimento o familiar.
En la siguiente tabla se muestra la relacin entre la tasa de error tipo I del Experimento
o familiar y la tasa de error tipo I de la comparacin
N

E cuando C 0.05

C cuando E 0.05

1
2
3
4
5
10

0.050
0.098
0.143
0.185
0.226
0.401

0.050
0.025
0.017
0.013
0.010
0.005

Para el caso del ejemplo de comparacin de las medias de los tiempos de coagulacin si
se fija una tasa de error tipo I C 0.05 para cada comparacin, la tasa de error tipo I

para el experimento ser de E 1 1 .05 0.265 y si se fija una tasa de error tipo I
6

para el experimento de E 0.05 , la tasa de error tipo I para la comparacin ser de

C 1 (1 0.05)1/ 6 0.009
Nota: la prueba t y DMS o DLS es recomendable para una sola comparacin planeada
Prueba de Tukey-Cramer (Tukey HSD)
Esta prueba fue propuesta por Tukey(1949), quien desarroll un procedimiento que
proporciona una tasa con respecto al experimento en el sentido fuerte, para las
comparaciones por pares de todas las medias de la variable respuestas sujetos
tratamiento diferentes, que se usa para obtener intervalos de confianza simultneos de
100 1 % . La prueba se le conoce por varios nombres, entre ellas diferencia
honestamente significativa.
Para aplicar esta prueba slo es necesario que los ij sea una variable aleatoria
independiente distribuida normalmente con media cero y variancia comn 2 . Es decir
no se necesita que las comparaciones sean previamente planeadas y que la prueba de F
en el ANVA resulte significativa.
Para realiza la prueba de Tukey se procede de la siguiente manera:
Planteamiento de hiptesis
H 0 : i i
Para i i , i, i 1, 2,
H a : i i

,t

Nivel de significacin
Clculo del Valor Crtico:

w q t , GLE

1
SY Y
2 i i

donde:
q t , GLE =amplitud estudiantizada para la prueba de Tukey

t = nmero de tratamiento a comparar


GLE = Grados de libertad del error
1 1
SYi Yi CME
ni ni
Se rechaza H 0 a un nivel de significacin , si

Yi Yi w
Ejemplo Use la prueba de Tukey para realizar todas comparaciones en el ejemplo de
coagulacin a un nivel de significacin 0.05 .

i
Yi.

A
61

D
61

B
66

C
68

ni

q0.05 4, 20 3.96
H 0 : i i

H a : i i

Para i i , i, i A, B, C, D

Comparaciones

Yi Yi

C-A
C-D
C-B
B-A
B-D
D-A
*=significativo ,

SYi Yi

w q0.05 4, 20

7
1.5275
7
1.2780
2
1.3663
5
1.5275
5
1.2780
0
1.4491
ns= no significativo

1
SY Y
2 i i

4.2770 *
3.5784 *
3.82564 ns
4.2770 *
3.5784 *
4.0575 ns

Con el paquete R
Para realizar esta pruebas con el lenguaje R bajar del CRAN los paquetes multcomp y
mvtnorm. Esto puede realizarse directamente usando el Men para el caso que tuviera
Internet. Ente caso ir a Package y dentro de esto a la opcin Install package(s) from
CRAN. Para el caso que no tuviera internet, se puede ir al CRAN y bajar los archivos
zip en www.cran.r-project/bin/windows, guardar estos archivos en una carpeta, luego ir
al menu de R a Package y dentro de este ir a la opcin Install package(s) from local zip
files buscar la carpeta e instalar estos paquetes. Una vez instalado esto queda grabado en
una librera. Para usar estos paquetes primero instalar mediante la opcin de Menu en
Packages e ir a la opcin Load Packages y leer primero mvtnorm luego hacer lo
mismo con multcomp.
> coag<-read.table("coag.txt",header=T)
> mod<-aov(Tiempo~dieta,data=coag)
> summary(mod)
Df Sum Sq Mean Sq F value
Pr(>F)
dieta
3 228.0
76.0 13.571 4.658e-05 ***
Residuals
20 112.0
5.6
> library(multcomp)
> cht <- glht(mod, linfct = mcp(dieta = "Tukey"))
> summary(cht)
Simultaneous Tests for General Linear Hypotheses
Multiple Comparisons of Means: Tukey Contrasts
Fit: aov(formula = Tiempo ~ dieta, data = coag)
Linear Hypotheses:

Estimate Std. Error


t value Pr(>|t|)
B - A == 0 5.000e+00 1.528e+00
3.273 0.01832 *
C - A == 0 7.000e+00 1.528e+00
4.583 < 0.001 ***
D - A == 0 -1.071e-14 1.449e+00 -7.39e-15 1.00000
C - B == 0 2.000e+00 1.366e+00
1.464 0.47487
D - B == 0 -5.000e+00 1.278e+00
-3.912 0.00433 **
D - C == 0 -7.000e+00 1.278e+00
-5.477 < 0.001 ***
--Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
(Adjusted p values reported -- single-step method)
Con otro comando en R
> coag<-read.table("coag.txt",header=T)
> mod<-aov(Tiempo~dieta,data=coag)
> TukeyHSD(mod,"dieta")
Tukey multiple comparisons of means
95% family-wise confidence level
Fit: aov(formula = Tiempo ~ dieta, data = coag)
$dieta
diff
lwr
upr
p adj
B-A 5.000000e+00
0.7245544 9.275446 0.0183283
C-A 7.000000e+00
2.7245544 11.275446 0.0009577
D-A -1.421085e-14 -4.0560438 4.056044 1.0000000
C-B 2.000000e+00 -1.8240748 5.824075 0.4766005
D-B -5.000000e+00 -8.5770944 -1.422906 0.0044114
D-C -7.000000e+00 -10.5770944 -3.422906 0.0001268

Prueba de Dunnett (comparaciones de todas las medias de la variable respuesta,


excepto la de control, con la media de la variable respuesta obtenido con un tratamiento
control o testigo)
Tratamiento testigo o control: Es un tratamiento estndar, cuya efectividad es conocida.
Este tratamiento se usa cuando la efectividad de los tratamientos en estudio es no
conocido o cuando la efectividad general de los tratamientos bajo estudio es conocido
pero no es consistente bajo todas las condiciones.
Ejemplo: En un experimento para comparar el efecto de tres nuevos aditivos para
gasolina, el tratamiento de control puede ser sin aditivo.
Procedimiento: Para realizar la comparacin de todas las medias de la variable respuesta
al cual se aplicaron tratamientos diferente al testigo con la media de la variable
respuesta con el tratamiento testigo se usa la prueba de Dunnett. Para aplicar esta prueba
requiere:
a) Las comparaciones deben ser planeada
b) Los ij sea una variable aleatoria independiente distribuida normalmente con
media cero y variancia comn 2 .
H 0 : i 1
H a : i 1 , para i 2,

,t

Donde: 1 = es la media de la variable respuesta con el tratamiento testigo o de control


Nivel de significacin
Valor Crtico:

d tDunnet , t , GLE SYi Y1 , para i 2,

,t

donde :

tDunnet , t , GLE = t de Dunnett con un nivel de significacin .

t = nmero de tratamiento a comparar


GLE = Grados de libertad del error
1 1
SYi Yi CME
ni ni
Se rechaza H 0 aun nivel de significacin , si

Yi Y1 d , para i 2,

,t

Ejemplo: Suponga que el tratamiento A es el testigo. Use la prueba de Dunnett para


realizar la comparacin entre media de tratamiento testigo con el resto a un nivel de
significacin 0.05 .

H 0 : i A
H a : i A , para i B, C, D
0.05
tDunnett 0.05,3, 20 2.54
Comparaciones

Yi Yi

D-A
C-A
B-A
*=significativo ,

SYi Yi

d tDunnett 0.05, 4, 20 SYi YA

0
1.4491
7
1.5275
5
1.5275
ns= no significativo

3.6807 ns
3.8799 *
3.8799 *

Usando el paquete R
>
>
>
>
>

library(multcomp)
coag<-read.table("coag.txt",header=T)
mod<-aov(Tiempo~dieta,data=coag)
cdu <- glht(mod, linfct = mcp(dieta = "Dunnett"))
summary(cdu)
Simultaneous Tests for General Linear Hypotheses

Multiple Comparisons of Means: Dunnett Contrasts

Fit: aov(formula = Tiempo ~ dieta, data = coag)


Linear Hypotheses:
Estimate Std. Error
t value Pr(>|t|)
B - A == 0 5.000e+00 1.528e+00
3.273 0.00955 **
C - A == 0 7.000e+00 1.528e+00
4.583 < 0.001 ***
D - A == 0 -1.071e-14 1.449e+00 -7.39e-15 1.00000
--Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
(Adjusted p values reported -- single-step method)

Prueba de t y F con Contraste(solo caso balanceado)


Contraste: Son subconjunto de funciones lineales de los totales o de las medias
estimadas de la variable respuestas de todos los tratamientos. De esta manera si se tiene
t tratamiento, de modo que cada tratamiento est igualmente repetido n veces en el
experimento, entonces un contraste se define:
t

i 1

i 1

Q CiYi. nCiYi. , con

i 1

Contrastes Ortogonales:
t

i 1

i 1

i 1

i 1

Dos contrastes: Q1 C1iYi. n C1iYi. y Q2 C2 iYi. n C2 iYi. son ortogonales


si
t

C1i 0 ,
i 1

C2i 0 y
i 1

C C
i 1

1i

2i

Nota: En un experimento con t tratamiento y dado un contraste base entonces se puede


formar t-1 contrastes ortogonales.
t

i 1

i 1

Media y variancia de un contraste: Sea Q CiYi. n CiYi. , entonces la media del


contraste est dado por:
t
t
t

E Q E CiYi. E n CiYi. n Ci E Yi. n Ci i


i 1
i 1
i 1

i 1

E Q n Ci i
i 1

y la variancia est dado por:


2
t
t
t
t

2
2
2 2
Var Q Var n CiYi. n Ci Var Yi. n Ci
n Ci2 2
n
i 1
i 1
i 1
i 1

Var Q n 2 Ci2
i 1

Distribucin Muestral de un contraste:


Si los ij sea una variable aleatoria independiente distribuida normalmente con media
cero y variancia comn 2 , entonces
t
t
t
t

Q CiYi. n Yi. ~ N n Ci i , n Ci2 2


i 1
i 1
i 1
i 1

Luego
t

C Y C
i i.

i 1

i 1

2
i

i 1

~ N 0,1

Adems se sabe que:

GLE CME ~ 2

GLE

Tambin se puede demostrar que para este caso las variables

i 1

i 1

CiYi. Ci i
2

C
i 1

2
i

~ N 0,1 y

Son variables aleatorias independientes. Entonces


t

2GLE
GLE

Luego
t

CiYi. Ci i
i 1

i 1

i 1

Ci2

GLE CME
2
GLE

i 1

i 1

CiYi. Ci i
CME t 2
Ci
n i 1

~ tGLE

GLE CME
2

i 1

i 1

CiYi. Ci i

~ tGLE

CME t 2
Ci
n i 1

Para realizar la prueba de t y F que se dan a continuacin se necesita las siguientes


condiciones:
a) Los contraste deben ser planeados antes de realizar el experimento
b) Los ij sea una variable aleatoria independiente distribuida normalmente con
media cero y variancia comn 2 .
Prueba de t con contraste:
Suponga que se desea probar una de las siguientes Hiptesis
Caso Bilateral

Unilateral a la derecha

H 0 : Ci i k

H 0 : Ci i k

i 1

i 1

H a : Ci i k

H a : Ci i k

i 1

i 1

Unilateral a la izquierda
t

H 0 : Ci i k
i 1
t

H a : Ci i k
i 1

a un nivel de significacin
Estadstica de Prueba
t

C Y
i 1

i i.

~ tGLE / H 0 es verdadera
CME t 2
Ci
n i 1
Luego, se tiene los siguientes criterios de decisin

Decisin

Caso Bilateral

Se acepta H 0

Se rechaza H 0

tc t

,GLE
2

tc t

,GLE
2

1 ,GLE
2

o tc t

1 ,GLE
2

Unilateral a la
derecha
tc t1 ,GLE

Unilateral a la
izquierda
tc t ,GLE

tc t1 ,GLE

tc t ,GLE

Ejemplo: Suponga que se tiene cuatro fertilizantes que se desea comparar, con tal
motivo se realiz un experimento bajo un DCA con cinco repeticiones por tratamiento,
de la cual se obtuvo los siguientes resultados:
Fertilizante
T1
73.8

Yi.

SCE 10.4 Luego CME

T2
74.2

T3
69.0

T4
71.8

10.4
0.65
16

Supngase que se ha planeado realizar la siguiente prueba:


H 0 : 22 3 4 1
H1 : 22 3 4 1

2 74.2 69 71.8 1

tc

0.65 2
2
2
2 1 1
5
> pvalue<-1-pt(tc,16)
> pvalue
[1] 6.634694e-07.

7.473028

La prueba result altamente significativa, se puede afirmar que la media del rendimiento
obtenido con el fertilizante 2 supera en ms de una unidad a la media de los
rendimientos obtenidos con los fertilizantes 3 y 4.
Prueba de F con contraste:
Suponga que se desea probar la Hiptesis
t

H 0 : Ci i 0
i 1
t

H a : Ci i 0
i 1

a un nivel de significacin
Estadstica de Prueba:

CiYi.
F t 2 i 1 t
CME
Ci2
n i 1

n CiYi.
i 1

C
i 1

2
i

CME

~ F1,GLE / H 0

Se sabe que t2GLE F1,GLE , entonces la prueba de t para este caso es equivalente a usar
la siguiente estadstica

Si se hace
2

n CiYi
=Suma de cuadrado de contraste, entonces se puede usar la
SCQ i 1t
Ci2
i 1

siguiente estadstica de prueba:

Fc

SCQ
~ F1,GLE / H 0 es verdadera
CME

Luego, se rechaza H o a un nivel de significacin , si Fc F1 ,1,GLE

Prueba de F con contrastes ortogonales


Si se planeado comparar t-1 funciones de medias de la variable respuestas con estos t
tratamientos resultante de t-1 contrastes ortogonales : Q1 , Q2 , , Qt 1 , se puede
demostrar que
SCTrat SCQ1 SCQ2

SCQt 1

Luego se puede tener el siguiente cuadro de ANVA

Fuente de
SC
Variacin
Entre Tratamiento SCTrat
Q1
Q2
.
.
.
Qt 1

Dentro de
Tratamiento
Total

GL

CM

Fc

GLTrat

CMTrat

SCQ1

SCQ1

CMTrat / CME
SCQ1 / CME

SCQ2
.
.
.
SCQt 1

SCQ2
.
.
.
SCQt 1

SCQ2 / CME
.
.
.
SCQt 1 / CME

.
.
.
1

SCE

GLE

SCTotal

n. 1

CME

Este cuadro de ANVA permite probar las siguientes pruebas de hiptesis:

i 1

i 1

H 0 : Cli i 0 versus H a : Cli i 0 , para l 1, 2,


t

donde :

C
i 1

li

0 y

C C
i 1

li

l i

, t 1

0 , para l l y l , l 1, 2,

, t 1

para el cual se utiliza la siguiente estadstica:

Fcl

SCQl
~ F1,GLE / H 0 , para l 1, 2,
CME

, t 1

Ejemplo:
En el ejemplo del fertilizante se sabe adems que los fertilizantes 3 y 4 poseen un
componente K que no poseen los fertilizantes 1 y 2. Se ha planeado antes de realizar el
experimento comparar ( T1 y T2 ) versus ( T3 y T4 ). Obtenga todos los contrastes
ortogonales. Realice las pruebas de hiptesis correspondientes a un nivel de
significacin 0.05
Matriz de contraste
Fertilizante
Coeficientes T1 T2 T3 T4
-1 -1 1 1
C1i
C2i

-1

C3i

-1

Contrastes ortogonales
Q1 Y1. Y2. Y3. Y4.
Q2 Y1. Y2.
Q3 Y3. Y4.

Hiptesis:
( T1 y T2 ) versus ( T3 y T4 )
H 0 : 3 4 1 2 0 contra H a : 3 4 1 2 0
T1 versus T2
H 0 : 2 1 0 contra H a : 2 1 0

T3 versus T4
H 0 : 4 3 0 contra H a : 4 3 0

n C1iYi.
2
5 73.8 74.2 69.0 71.8

i 1

SCQ1

64.8
t
2
2
2
2
2

C1i
i 1

n C2iYi.
2
5 73.8 74.2

i 1

SCQ2

0.4
t
2
2
2

C2i
i 1

n C3iYi.
2
5 69.0 71.8

i 1

SCQ3

19.6
t
2
2
2

1
1

C3i
t

i 1

Contraste
( T1 y T2 ) versus ( T3 y T4 )

SC
64.80

GL
1

CM
64.80

Fc
99.69**

T1 versus T2

0.4

0.4

0.62 ns

19.6
1
19.6
30.15**
T3 versus T4
Residual
10.4
16 0.65
**= altamente Significativo, ns = no significativo F 0.90,1,16 3.05 , F 0.95,1,16 4.49 ,

F 0.99,1,16 8.53
>
>
>
>
>
>

vp<-c(73.8,74.2,69,71.8)
sce<-10.4
r=5
ct<-c(-1,-1,1,1)
scc1<-r*((t(ct)%*%vp)^2)/(sum(ct^2))
scc1
[,1]
[1,] 64.8
> ct2<-c(-1,1,0,0)
> scc2<-r*((t(ct2)%*%vp)^2)/(sum(ct2^2))
> scc2
[,1]
[1,] 0.4
> ct3<-c(0,0,-1,1)
> scc3<-r*((t(ct3)%*%vp)^2)/(sum(ct3^2))
> scc3
[,1]
[1,] 19.6
> tr<-4
> gle<-r*tr-tr
> gle
[1] 16
> cme<-sce/gle
> fuente<-c("Q1","Q2","Q3","Residuals")
> gl<-c(1,1,1,gle)

>
>
>
>
>
>
>
1
2
3
4

SC<-c(scc1,scc2,scc3,sce)
CM<-SC/gl
Fc<-c(round(CM[1:3]/CM[4],4),"")
Fc1<-as.numeric(Fc[1:3])
pvalue1<-round(1-pf(Fc1,1,gle),4)
pvalue<-c(pvalue1,"")
data.frame(fuente,gl,SC,CM,Fc,pvalue)
fuente gl
SC
CM
Fc pvalue
Q1 1 64.8 64.80 99.6923
0
Q2 1 0.4 0.40 0.6154 0.4442
Q3 1 19.6 19.60 30.1538
0
Residuals 16 10.4 0.65

Prueba de Scheffe
Es una prueba que permite realizar pruebas sobre cualquier funcin estimable de
medias de la variable respuesta de todos los tratamientos. Esto quiere decir que se
puede realizar infinitas pruebas simultneas aunque en la prctica se realice un nmero
finito de pruebas simultneas. Inclusive esta prueba es vlida para comparaciones
sugeridas por los datos. Luego, las hiptesis son sobre las siguientes funciones lineales
de parmetros:
t

L Ci i donde
i 1

C
i 1

Para aplicar esta prueba se requiere que los ij son variables aleatorias independientes
distribuidas normalmente con media cero y variancia comn 2 .
Para probar las siguientes hiptesis
t

H 0 : Ci i 0 contra
i 1
t

H a : Ci i 0
i 1

Nivel de significacin
Se utiliza el siguiente valor crtico de la prueba

VCS S L
donde:
t

L CiYi.
i 1

S L CME
i 1

Ci2
ni

t 1 F1 ,t 1,GLE

t = nmero de tratamientos
Se acepta H 0 , si

L VCS
Se rechaza H 0 , si
20 L VCS
Ejemplo: Con los datos de tiempo de coagulacin, pruebe:
H 0 : A B C D 0 contra la alternativa H a : A B C D 0

0.05

Yi.

A
61

B
66

C
68

D
61

ni

Ci

-1

-1

CME 5.6 , F 0.95,4,20 3.10


4

L CiYi. 1 61 1 66 1 68 1 61 2
i 1

C2
S L CME i
i 1 ni
4

VCS SL

12 12 12 12

1.991649
5.6
6
6
8
4

4 1 F1 ,t 1,GLE 1.991649 33.1 6.072138

Como L 2 VCS 6.072138 , se acepta H 0


Usando R
>
>
>
>
>
>

tiempo<-coag[,1]
dieta<-coag[,2]
yp<-tapply(tiempo,dieta,mean)
ci<-c(1,1,-1,-1)
lab<-abs(t(ci)%*%yp)
lab
[,1]
[1,]
2
> re<-tapply(tiempo,dieta,length)
> mod<- lm(tiempo~dieta)
> cme<-deviance(mod)/df.residual(mod)
> sdl<-sqrt(cme*(sum(ci^2/re)))
> vcs5<-sdl*sqrt(3*qf(0.95,3,20))
> vcs5
[1] 6.072138

> vcs10<-sdl*sqrt(3*qf(0.9,3,20))
> vcs10
[1] 5.321939
El Mtodo de Bonferroni
Este mtodo se basa en la desigualdad de Bonferroni, el cual dice: dado una secuencia
de eventos Aj , P

Aj j P Aj . De esta manera la posibilidad de uno o ms

error tipo I es una coleccin arbitraria de la prueba es a lo ms la suma de sus


t
posibilidades separada de error tipo I. Para el caso que se desee realizar nc de
2
tratamientos se puede seguir el siguiente procedimiento:
1) Plantear las hiptesis:
H 0 : i i

H a : i i , para i i , y i, i 1, 2,

.t

2) Fijar el nivel de significacin de comparacin simultnea


3) Encontrar toda las diferencias absolutas de medias muestrales para las
comparaciones:

Yi. Yi. , para i i , y i, i 1, 2,

.t

4) Encontrar el valor Crtico de Bonferroni

VCB i, i t

Y Y
,GLE i . i.
1
2 nc

donde:

1 1
SYi . Yi. CME
ni ni
Se rechaza H 0 para i i , y i, i 1, 2,

. t , si

Yi. Yi. VCB i, i


Para aplicar esta prueba se requiere que ij son variables aleatorias independientes
distribuidas normalmente con media cero y variancia comn 2 . Adems, en este caso
las comparaciones deben ser planeadas de antemano. Esta prueba es recomendable
cuando se desea realizar pocas comparaciones entre medias de la variable respuesta de
dos tratamientos.
Ejemplo Si se planeo realizar todas las comparaciones en forma simultanea en el
ejemplo de coagulacin a un nivel de significacin 0.05 , use la prueba de
Bonferroni. Luego, se tiene:

H 0 : i i

H a : i i

Para i i , i, i A, B, C, D

i
Yi.

A
61

D
61

B
66

C
68

ni

0.05
,20
1
12

t 0.9958333,20 2.927116 , esto se obtuvo usando R:

> qt(0.9958333,20)
[1] 2.927116
Comparaciones

Yi Yi

C-A
C-D
C-B
B-A
B-D
D-A
*=significativo ,

SYi Yi

VCB i, i t 0.9995833,20 SYi Yi

7
1.5275
7
1.2780
2
1.3663
5
1.5275
5
1.2780
0
1.4491
ns= no significativo

4.471243*
3.74091*
3.999201ns
4.471243*
3.74091*
4.241793ns

4.471243
3.740910
3.999201
4.471243
3.740910
4.241793

> pairwise.t.test(tiempo,dieta,p.adjust.method="bonferroni")
Pairwise comparisons using t tests with pooled SD
data:
b
c
d

tiempo and dieta

a
0.02282
0.00108
1.00000

b
0.95266
0.00518

c
0.00014

P value adjustment method: bonferroni

Nota el R da los pvalue ajustado de manera que se pueda tomar decisiones con la tasa
de error del experimento.
Prueba de Comparaciones Mltiple con el Mejor
El objetivo de esta prueba es seleccionar el conjunto de tratamientos o un slo
tratamiento (si es posible) que proporcione el resultado ms deseable. El procedimiento
de comparaciones mltiple con el mejor (CMM) permite al investigador clasificar los
tratamientos de manera que la mejor poblacin est incluida en subconjunto con un
nivel de confianza dado. Existen dos casos:
a) Eleccin de subconjunto con la media ms grande
b) Eleccin de subconjunto con la media ms pequea
a) Eleccin de subconjunto con la media ms grande

En este caso los parmetros de inters son:

i . mx j , para i 1, 2,
j i

,t

donde: mx j es la media mxima sin incluir i . Si i . mx j 0 , entonces el


j i

j i

tratamiento i es el mejor. Por otro lado, si i . mx j 0 , entonces el tratamiento i


j i

no es el mejor.
Los intervalos de confianza simultneos (ICS) de las CMM para i . mx j tiene la
j i

restriccin de incluir el cero con la perspectiva de que a la larga dos tratamientos nunca
tienen promedio idnticos. El intervalo de confianza CMM restringido establece que el
tratamiento i es uno de los mejores si el intervalo para i . mx j incluye el cero o el
j i

cero es su lmite inferior. Por el contrario, si el lmite superior del intervalo para
i . mx j es cero, entonces el tratamiento i no es el mejor. El procedimiento para
j i

construir los intervalos de confianza simultneos se da a continuacin:


1.- Se calcula la diferencia, Di yi mx y j , para i 1, 2,
j i

, t . Esto es entre cada

media de la variable respuesta de estos tratamientos, yi , y con la mayor media de la


variable respuesta de los tratamientos restantes, mx y j
j i

2CME
, donde d ,t 1, gle es el estadstico tabulado para las
r
comparaciones de un lado en la Tabla IV del apndice del texto Diseos de
Experimentos de Robert Kuehl para una tasa experimental de , t 1 comparaciones y
gle grados de libertad del error experimental.
3.- Encontrar los intervalos de confianza restringidos. El lmite inferior del intervalo de
confianza restringido para i . mx j es:

2.- La cantidad M d ,t 1, gle

j i

D M , Si Di M 0
L i
de otra manera
0
y el lmite superior de confianza para i . mx j es:
j i

D M , Si Di M 0
U i
de otra manera
0
4.- Para obtener el mejor tratamiento o el conjunto de los mejores de tratamientos con
una tasa de error experimental de se selecciona a aquellos tratamientos cuyo lmite
superior cumple con la regla: Di M 0
b) Eleccin de subconjunto con la media ms pequea
En este caso los parmetros de inters son:

i . min j , para i 1, 2,
j i

,t

donde: min j es la media mnima sin incluir i . Si i . min j 0 , entonces el


j i

j i

tratamiento i es el mejor. Por otro lado, si i . min j 0 , entonces el tratamiento i


j i

no es el mejor.
El procedimiento para construir los intervalos de confianza simultneos se da a
continuacin:
1.- Se calcula la diferencia, Di yi min y j , para i 1, 2,
j i

, t . Esto es entre media

de la variable respuesta de cada tratamiento, yi , y la menor media de la variable


respuesta obtenido con los tratamientos restantes, min y j
j i

2CME
, donde d ,t 1, gle es el estadstico tabulado para las
r
comparaciones de un lado en la Tabla IV del apndice del texto Diseos de
Experimentos de Robert Kuehl para una tasa experimental de , t 1 comparaciones y
gle grados de libertad del error experimental.
3.- Encontrar los intervalos de confianza restringidos. El lmite inferior del intervalo de
confianza restringido para i . min j es:

2.- La cantidad M d ,t 1, gle

j i

D M , Si Di M 0
L i
de otra manera
0
y el lmite superior de confianza para i . min j es:
j i

D M , Si Di M 0
U i
de otra manera
0
4.- Para obtener el mejor tratamiento o el conjunto de los mejores de tratamientos con
una tasa de error experimental de se selecciona a aquellos tratamientos cuyo lmite
inferior cumple con la regla: Di M 0
Observacin: Hsu (1996) desarroll su metodologa para el caso balanceado donde las
variancias de la diferencia de media de la variable respuesta de tratamientos son todos
iguales. Por otro lado, para el caso del Diseo completamente aleatorizado
desigualmente repetido, recomienda algunas aproximaciones basadas en desigualdades
de probabilidad, que paquetes como el Minitab ha incorporado
Ejemplo: Un ingeniero de desarrollo de producto le interesa determinar si el porcentaje
de algodn en una fibra sinttica afecta la tensin, y ha llevado a cabo un experimento
completamente aleatorizado con 5 niveles del peso porcentual de algodn y cinco
rplicas. los resultados sobre resistencia en lb/pulg2 del experimento se muestra a
continuacin:

> algodon
Resistencia Porcentajes
1
7
15
2
7
15
3
15
15
4
11
15
5
9
15
6
12
20
7
17
20
8
12
20
9
18
20
10
18
20
11
14
25
12
18
25
13
18
25
14
19
25
15
19
25
16
19
30
17
25
30
18
22
30
19
19
30
20
23
30
21
7
35
22
10
35
23
11
35
24
15
35
25
11
35
One-way ANOVA: Resistencia versus Porcentajes
Source
Porcentajes
Error
Total
S = 2,839

Level
15
20
25
30
35

N
5
5
5
5
5

DF
4
20
24

SS
475,76
161,20
636,96

MS
118,94
8,06

R-Sq = 74,69%

Mean
9,800
15,400
17,600
21,600
10,800

StDev
3,347
3,130
2,074
2,608
2,864

F
14,76

P
0,000

R-Sq(adj) = 69,63%

Individual 95% CIs For Mean Based on


Pooled StDev
------+---------+---------+---------+--(-----*----)
(----*----)
(----*----)
(----*----)
(-----*----)
------+---------+---------+---------+--10,0
15,0
20,0
25,0

Pooled StDev = 2,839


Hsu's MCB (Multiple Comparisons with the Best)
Family error rate = 0,05
Critical value = 2,30
Intervals for level mean minus largest of other level means
Level
15
20
25
30
35

Lower
-15,938
-10,338
-8,138
-0,138
-14,938

Center
-11,800
-6,200
-4,000
4,000
-10,800

Upper
0,000
0,000
0,138
8,138
0,000

---+---------+---------+---------+-----(-----*----------------)
(-----*--------)
(-----*-----)
(-----*-----)
(-----*--------------)
---+---------+---------+---------+------14,0
-7,0
0,0
7,0

En este caso el conjunto de los tratamientos con mejores resistencia promedio est dado
por los tratamientos con los porcentajes de algodn 25 y 30
En el caso del tiempo de coagulacin, si estuviramos interesados en determinar con
cuales de las dietas se obtienen las menores medias de los tiempos de coagulacin,
aplicando la prueba de Hsu se tiene:
ANOVA unidireccional: Tiempo vs. dieta
Fuente
dieta
Error
Total

GL
3
20
23

S = 2.366

Nivel
A
B
C
D

N
4
6
6
8

SC
228.00
112.00
340.00

MC
76.00
5.60

F
13.57

R-cuad. = 67.06%

Media
61.000
66.000
68.000
61.000

Desv.Est.
1.826
2.828
1.673
2.619

P
0.000

R-cuad.(ajustado) = 62.12%
ICs de 95% individuales para la media
basados en Desv.Est. agrupada
-----+---------+---------+---------+---(-------*--------)
(------*------)
(------*-----)
(----*-----)
-----+---------+---------+---------+---60.0
63.0
66.0
69.0

Desv.Est. agrupada = 2.366


MCB de Hsu (comparaciones mltiples con el mejor)
Tasa de error por familia = 0.05
Valor crtico = 2.22
Intervalos para la media de los niveles menos la menor de las medias de otros
niveles
Nivel
A
B
C
D

Inferior
-3.214
0.000
0.000
-3.214

Centro
0.000
5.000
7.000
0.000

Superior
3.214
8.388
10.388
3.214

---------+---------+---------+---------+
(--------*--------)
(-------------*---------)
(-------------------*---------)
(--------*--------)
---------+---------+---------+---------+
0.0
3.5
7.0
10.5

Varias Muestras Independientes (La prueba de Kruskal - Wallis)


Cuando no se cumple el supuesto de Normalidad de los errores, una alternativa es usar
Mtodos no paramtricos, como la pruebas de Kruskal-Wallis. Para realizar esta prueba
se sigue el siguiente procedimiento.
Datos: Los datos consisten de k muestras aleatorias, posiblemente de tamaos
diferentes. La i-sima muestra aleatoria de tamao n i se denota por X i1 , X i 2 , , X ini .
Entonces, los datos pueden ser arreglados en columna:
Muestra1
X11
X12

Muestra 2
X21
X22

...

Muestra k
Xk1
Xk2

.
.
.

.
.
.

.
.
.

X 1n1

X 2n 2

X kn k

Sea N que denota el nmero total de observaciones

ni

(1)

i 1

Asignar el rango 1 al ms pequeo de la totalidad de N observaciones, rango 2 al


segundo ms pequeo, y as sucesivamente hasta el ms grande de todas las
observaciones, al cual se le asigna rango N. Sea R(Xij) que representa el rango asignado
a Xij. Sea Ri la suma de rango asignado a la i-sima muestra

Ri

R X ij
ni

i=1, 2, ..., k

(2)

j 1

Calcule Ri para cada muestra.


En caso que existan empates, asignar el promedio de los rangos a cada una de las
observaciones empatadas.
Asunciones:
1.- Todas las muestras son muestras aleatorias de sus respectivas poblaciones
2.- Las muestras son mutuamente independientes.
3.- La escala de medida es al menos ordinal.
4.- Las k poblaciones tienen funciones de distribucin idnticas, o algunas de las
poblaciones tiende a producir valores ms grandes que otras poblaciones.
Hiptesis :
H0 : Las k poblaciones tienen funciones de distribucin idnticas.
H1 : Al menos una de las k poblaciones tiende a producir observaciones ms grandes
que las restantes.
Nota : La prueba de Kruskal - Wallis est diseado para ser ms sensitivo contra la
diferencia entre medias en k poblaciones, por esta razn, algunas veces la hiptesis
alternativa se expresa como sigue :
H1 : Las k poblaciones no tiene medias idnticas.

Estadstico de Prueba : Se usa el siguiente estadstico


2
1 k Ri2 N N 1
T 2

4
S i 1 ni

(3)

donde
1
S
R X ij
N 1 i, j

2
N N 1

N N 1
si no hay empates S se simplifica a
4

(4)

y el estadstico de prueba se reduce a

k
Ri2
12
T
3 N 1
N N 1 i 1 ni

(5)

Si hay pocos empates (nmero de empates moderado) de manera que los valores
obtenidos con la ecuacin (3) y (5) son muy prximos, entonces se prefiere usar
ecuacin (5).
Regla de decisin :
Si k=3, todos los tamaos de muestras son 5 o menos y no hay empates, el cuantil
exacto puede ser obtenido de la tabla A8. Tabla ms completa pueden ser obtenidos de
Iman Quade y Alexander (1975). Cuando hay empates o cuando tablas exactas no son
disponibles, entonces se puede usar la aproximacin

T 2k 1 | H0 es cierta
Comparaciones Mltiples :
Si y solamente si la hiptesis nula es rechazada, se puede usar el siguiente
procedimiento para determinar cuales de los pares de poblaciones tiende a ser
diferentes. As, para ver si existe diferencia entre las poblaciones i y j a un nivel de
significacin se compara:
Ri R j

ni n j

con
S 2 N 1 T 1
1

t 1 , N k
2
N k
ni n j

1/ 2

As si

S 2 N 1 T 1
Ri R j
1

t 1 , N k
2
ni n j
N k
ni n j

1/ 2

Existe diferencia entre las funciones de distribucin de las poblaciones i y j a un nivel


de significacin .
Ejemplo No 1 : Para comparar tres mtodos de enseanza de programacin en cierto
lenguaje en computadora, en donde:
El mtodo A: instruccin directa con la computadora
El mtodo B: instruccin de teora y prctica en computadora
El mtodo C: instruccin solo de clase tericas
Se extraen de grandes grupos de alumnos instruidas por uno de los mtodos en forma
aleatoria: 4 alumnos del mtodo A, 6 del mtodo B y 5 del mtodo C. Luego se les tom
una prueba. Los puntajes obtenidos se dan a continuacin:
Mtodos
B
C
91 72
90 76
81 79
83 77
84 78
83

A
73
77
67
71

H0 : Los tres mtodos son equivalentes.


H1 : Algunos mtodos de enseanza tiene puntajes ms altos que otros.

A
Observ.
73
77
67
71

Ri
ni

Rango
4
6.5
1
2

13.5
4

Mtodos
B
C
Observ. Rango Observ. Rango
91
15
72
3
90
14
76
5
81
10
79
9
83
11.5
77
6.5
84
13
78
8
83
11.5
75
31.5
6
5

N=15
2
2
2
N N 1 1
15 15 1
1
S
R X ij

19.92857
1239
N 1 i , j
4
4
15 1

1
T 2
S

2
k R 2 N N 12

15 15 1
1
i

1181.513
11.11535
4
4
i 1 ni
19.92857

20.95,2 5.991, se rechaza H0.


Como se rechaz H0 en la prueba anterior, entonces se prosigue con las comparaciones
mltiples para determinar entre que mtodos existe diferencias en los rendimientos:
t 0.975,11 2.201
Comparaciones

Ri R j

ni n j

AyB
AyC
ByC

9.125
2.925
6.2

>
>
>
>
>

1/ 2

S 2 N 1 T 1 1
t1 , N k

2
N k

ni n j
3.078296*
3.199059ns
2.887698*

curso<-read.table("calif.txt",T)
calificacin<-curso[,1]
mtodo<-curso[,2]
library(agricolae)
kruskal(calificacin,mtodo)

Study:
Kruskal-Wallis test's
Ties or no Ties
Value: 11.11532
degrees of freedom: 2
Pvalue chisq : 0.003857788
mtodo,
a
b
c

means of the ranks

calificacin replication
3.375
4
12.500
6
6.300
5

t-Student: 2.178813
Alpha
: 0.05
LSD
: 3.057705
Harmonic Mean of Cell Sizes 4.864865
Means with the same letter are not significantly different
Groups, Treatments and mean of the ranks
a
b
12.5
b
c
6.3
b
a
3.375
> kruskal(calificacin,mtodo,group=FALSE)
Study:
Kruskal-Wallis test's
Ties or no Ties
Value: 11.11532
degrees of freedom: 2
Pvalue chisq : 0.003857788
mtodo,

means of the ranks

a
b
c

calificacin replication
3.375
4
12.500
6
6.300
5

Comparison between treatments mean of the ranks


a - b
a - c
b - c
>

Difference
pvalue sig
LCL
UCL
-9.125 0.000032 *** -12.203296 -6.0467039
-2.925 0.069606
. -6.124059 0.2740591
6.200 0.000534 ***
3.312302 9.0876977

Вам также может понравиться