Вы находитесь на странице: 1из 9

Prueba Newman-Keuls y prueba Tukey

1 Comparaciones dos a dos.


Un anlisis de varianza (ANOVA) indica si varias medias provienen de la misma
poblacin. Este procedimiento es llamado prueba mnibus, debido a que las
pruebas del conjunto de medias se realizan al mismo tiempo (mnibus significa
para todos en latn). En una prueba ANOVA mnibus, un resultado
significativo indica que al menos dos grupos difieren uno de otro pero no
identifica los grupos que difieren. As un ANOVA generalmente es seguido por
un anlisis cuyo objetivo es identificar el patrn de diferencias en los
resultados. Este anlisis se realiza a menudo para evaluar todos los pares de
medias en orden para determinar cules muestran una diferencia significativa.
En un marco general, este mtodo, llamado comparaciones dos a dos, es un
caso especfico de a posteriori anlisis contrastante (ver registro en
contraste), pero es suficientemente especfico para ser estudiado por si mismo.
Dos de los mtodos ms comunes de comparaciones dos a dos son la prueba
Tukey y la prueba Newman-Keuls. Ambas pruebas estn basadas en el rango
estudentizado o la q estudentizada. Difieren en que la prueba NewmanKeuls es una prueba secuencial diseada para tener ms capacidad que la
prueba Tukey.
Elegir entre las pruebas Tukey y Newman-Keuls no es directo y no hay
consensos en este resultado. La prueba Newman-Keuls es ms usada
frecuentemente en psicologa, mientras que la prueba Tukey es comnmente
ms usada en otras disciplinas. Una ventaja de la prueba Tukey es que
mantiene el nivel del error tipo I (es decir, encontrar una diferencia cuando
ninguna existe) que es igual a elegir el nivel alfa (es decir, =.05 o =.01). Una
ventaja adicional de la prueba Tukey es que permite el clculo de intervalos de
confianza para las diferencias entre las medias. Aunque la prueba NewmanKeuls tiene ms capacidad que la prueba Tukey, el valor exacto de la
probabilidad de hacer un error de Tipo I de la prueba Newman-Keuls no puede
ser calculada debido a la naturaleza secuencial de esta prueba. Adems, por
los cambios de criterio para cada nivel de la prueba Newman-Keuls, los
intervalos de confianza no pueden ser calculados alrededor de las diferencias
entre medias. Por lo tanto, seleccionar si usas la prueba Tukey o la prueba
Newman-Keuls depender de si la capacidad adicional es requerida o no para
detectar diferencias significativas entre medias.
1.1

Rango Estudentizado y q estudentizada

Ambas pruebas la Tukey y Newman-Keuls usan un muestreo de distribucin


obtenido por Gosset (quien estaba trabajado para Guiness y decidi publicarlo
bajo el pseudnimo de Student a causa de la confidencialidad de la polica
Guiness). Esta distribucin, llamada Rango estudentizado o q estudentizada, es

similar a la distribucin t. Este corresponde al muestreo de distribucin de la


diferencia ms grande entre dos medias procedentes de un conjunto de medias
A (cuando A=2 la distribucin q corresponde al usual t estudentizado).
En la prctica, clcula un criterio denotado por q observada la cual evala la
diferencia entre las medias de dos grupos. Este criterio es calculado por:

Donde

son del grupo de medias que se comparan,

es la media

cuadrada del error del previamente calculado ANOVA (esto es, esta es la media
cuadrada usada para el denominador de la proporcin F de mnibus), y S es el
nmero de observaciones por grupo ( los grupos se supone que son de igual
tamao).
Una vez que la qobservada se calcula, es comparada con una q critica del valor de una
tabla de valores crticos (ver apndice). El valor de la q critica depende de la nivel, los grados de libertad =N-K donde N es el nmero total de participantes
y K es el nmero de grupos, y un parmetro R, el cual es el nmero de medias
puestas a pruebas. Por ejemplo, en un grupo de K=5 medias ordenadas de la
ms pequea a la ms grande,

R=5 cuando comparamos


para

para

; sin embargo, R=3 cuando comparamos

1.1.1 F-rango
Algunos libros de texto de estadstica se refieren a una distribucin pseudo-F
llamada el F-rango o F rango, antes que la distribucin de la q estudentizada.
El F rango puede ser fcilmente calculado de q usando la siguiente frmula:

1.2

Prueba Tukey

Para la prueba Tukey,

(ver ecuacin 1) es calculada entre cualquier

par de medias que necesitan someterse a ensayo. Luego,

es

determinada usando R=nmero total de medias. La

es la misma para

todos los pares de comparaciones. Usando el ejemplo anterior, R=5 para todas
las comparaciones.
1.3

prueba Newman-Keuls

La prueba Newman-Keuls es similar a la prueba Tukey, excepto que la prueba


Newmn-Keuls es una prueba secuencial en la cual

depende del rango de

cada par e medias. Para facilitar la exposicin, suponemos que las medias son
ordenadas de la ms pequea a la ms grande. Por lo tanto
ms pequea y

es la media

es la media ms grande.

La prueba Newman-Keuls empieza exactamente como la prueba Tukey. Es


seleccionada la diferencia ms grande entre las dos medias. El rango de esta
diferencia es R=A. Una

es calculada usando la ecuacin 1 y este valor

es comparado con el valor crtico,

, en los valores crticos de la tabla

usando , , y R. La hiptesis nula puede ser rechazada si


grande que

es ms

. Si la hiptesis nula no puede ser rechazada, las pruebas se

detienen aqu, porque no rechazar la hiptesis para la diferencia ms grande


implica no rechazar la hiptesis nula para cualquier otra diferencia.
Si la hiptesis nula es rechazada para la diferencia ms grande, las dos
diferencias con un rango de A-1 son examinadas. Estas medias sern probadas
con R=A-1. Cuando la hiptesis nula para un determinado par de medias no
puede ser rechazada, ninguna de las diferencias incluidas en esta diferencia
ser probada. Si la hiptesis nula es rechazada, entonces el procedimiento se
reitera para un rango de A-2 (esto es, R=A-2). El procedimiento se reitera hasta
que todas las medias hayan sido probadas o hayan sido declaradas no
significativas por implicacin.
Se necesita algo de experiencia para determinar cules comparaciones estn
implcitas para otras comparaciones. La figura 1 describe la estructura de la
implicacin para un conjunto de medias numeradas de 1 (la ms pequea) a 5
(la ms grande). Las comparaciones dos a dos implicadas por otra comparacin
son obtenidas siguiendo las flechas. Cuando la hiptesis nula no puede ser
rechazada para una comparacin dos a dos, entonces todas las comparaciones
incluidas son tachadas de modo que no se prueban.

A-1

A-2

A-3

Figura 1. Estructura de implicacin de las comparaciones en pares cuando A=5 para


la prueba Newman-Keuls. Las medias son numeradas de 1 (la ms pequea) a 5 (la
ms grande). Las comparaciones en pares implcitas por otra se obtienen siguiendo las
flechas. Cuando la hiptesis nula no puede ser rechazada para una comparacin dos a
dos, entonces todas las comparaciones incluidas pueden ser tachadas in orden para
omitirlas de la prueba.

2 Un ejemplo
Un ejemplo ayudar a describir la prueba el uso de las pruebas Tukey y
Newman-Keuls y la figura 1. Usaremos el resultado de una rplica de un
experimento clsico en el testimonio de testigos oculares por Loftus y Palmer
(1974). Este experimento prueba la influencia de preguntas sobre las
respuestas dadas por los testigos oculares. Los autores presentaron un video
de un accidente mltiple de coches a sus participantes. Despus de ver el
video, pidieron a los participantes
responder un nmero especfico de
preguntas acerca del accidente. Entre las preguntas, una acerca de la
velocidad del auto fue presentada en cinco versiones diferentes:
GOLPEAR: Qu tan rpido iban los autos cuando se golpearon unos con otros?
ESTRELLAR: Qu tan rpido iban los autos cuando se estrellaron unos con
otros?
COLISIONAR: Qu tan rpido iban los autos cuando colisionaron unos con
otros?
CHOCAR: Qu tan rpido iban los autos cuando chocaron unos con otros?
HACER CONTACTO: Qu tan rpido iban los autos cuando hicieron contacto
unos con otros?
En nuestra rplica usamos 50 participantes (10 en cada grupo); sus respuestas
son dadas en la Tabla 1.
Tabla 1. Un conjunto de datos para ilustrar las pruebas Tukey y Newman-Keuls

Grupo experimental

Ma.
2.1

Hacer
contact
o
21
20
26
46
35
13
41
30
42
26
M1
30.00
S=10;

Golpear

Chocar

23
35
30
35
34
52
51
29
20
54
38
32
34
30
44
42
41
50
35
21
M2
M3
35.00
38.00
MSerror=80.00

Colisiona
r

Estrellar

44
40
33
45
45
30
46
34
49
44
M4
41.00

39
44
51
47
50
45
39
51
39
55
M5
46.00

Prueba Tukey

Para la prueba Tukey, las

son calculadas entre cada par de medias

usando la ecuacin 1. Por ejemplo, se toma en cuenta que el


anteriormente calculado es 80.00, el valor de

del ANOVA

para la diferencia entre

M1 y M2 (ejemplo, hacer contacto y golpear) es igual a:

Los valores de
cada

son mostrados en la Tabla 2. Con el enfoque de Tukey,


se declara significativa en el nivel de =.05 (o el nivel =.01) si

es ms grande que el valor crtico obtenido por este nivel alfa de la Tabla con
R=5 y =N-K=45 grados de libertad (45 no est en la tabla as que en su lugar
es usado 40). La

es igual a 4.04 y la

es igual a 4.93.

Tabla 2. Valores absolutos de


prueba Tukey,

para los datos de la Tabla 1. Para la

es significativa en =.05 (o en el nivel =.01), si

es ms grande que

M1=30 Hacer
contacto
M2=35
Golpear
M3=38 Chocar
M4=41
Colisionar
M5=46
Estrellar

M2

).

Grupo experimental
M3
M4

M1
Hacer
contact
o
30

M5

Golpear

Chocar

Colisionar

Estrellar

35

38

41

46

1.77 ns

2.83 ns

3.89 ns

5.66**

1.06 ns

2.12 ns

3.89 ns

1.06 ns

2.83 ns

1.77 ns
0

*p<.05,

**p<.01

Cuando se realizan comparaciones dos a dos, se acostumbra a informar la


tabla de diferencias entre medias con una indicacin de su importancia (esto
es, un asterisco de significado importante en el nivel .05). Esto se muestra en
la Tabla 3.
Tabla 3. Presentacin de los resultados de la prueba Tukey para los datos de la
tabla 1.

M1=30 Hacer
contacto
M2=35
Golpear
M3=38 Chocar
M4=41
Colisionar
M5=46
Estrellar

M2

Grupo experimental
M3
M4

M1
Hacer
contact
o
30

M5

Golpear

Chocar

Colisionar

Estrellar

35

38

41

46

5.00 ns

8.00 ns

11.00 ns

16.00**

3.00 ns

6.00 ns

11.00 ns

3.00 ns

8.00 ns

5.00 ns
0

*p<.05,

**p<.01

Valores crticos de
q/nk

4.04

A-1

3.79

A-2

3.44

A-3 2.86

Figura 2.

Prueba Newman-Keuls para los datos de la rplica de Loftus y Palmer

(1974). El nmero de debajo de cada rango es la

para ese rango.

2.2 Prueba Newman-Keuls


Tenga en cuenta que oar la prueba Newman-Keuls, el grupo de medias estn
ordenadas de la ms pequea a la ms grande. Las pruebas inician por evaluar
la diferencia ms grande la cual corresponde a la diferencia entre M 1 y M5 (es
decir, Hacer contacto y Estrellar). Para =.05, R=5 y =N-K=45 grados de
libertad, el valor crtico de q es 4.04 (usando el valor de de 40 en la tabla).
Este valor se denota como

. La

es calculada de la

ecuacin 1 (vase tambin la Tabla 2) como:

La

es ms grande que la

y H0 es rechazada para el par

mayor.
Ahora procedemos a las pruebas de medias con un rango de 4, a saber, las
diferencias (M4-M1) y (M5-M2). Con =.05, R=4 y 45 grados de libertad,

. Ambas diferencias se declaran importantes en el nivel .05 (


en ambos casos). Hemos procedido a la prueba de
comparaciones

con un rango de 3. El valor de

es ahora 3.44. Las

diferencias (M3-M1) y (M5-M3) ambas con una

de 2.83 son declaradas

no- significativas. Adems la diferencia (M 4-M2), con una

de 2.12,

tambin es declarada no- significativa. Por lo tanto, , la hiptesis nula para


estas diferencias no puede ser rechazada y todas las comparaciones implcitas
para estas diferencias debern ser tachadas. Estos es, no hacemos ninguna
prueba con un rango de A-3 [(M 2-M1), (M3-M2), (M4-M3), y (M5-M4)]. Porque las
comparaciones con un rango de 3 ya se han probado y han demostrado ser
no-significativas, las comparaciones con un rango de de 2 consecuentemente
se declararn no-significativas ya que estn implicadas o incluidas en el rango
de 3 (es decir, la prueba se ha realizado implcitamente).
En cuanto a la prueba Tukey, los resultados de las pruebas Newman-Keuls se
presentan a menudo con los valores de las diferencias por pares entre las
medias y con asteriscos que indican el nivel de significancia (vase la tabla 4).
La comparacin de la tabla 4 y la Tabla 3 confirma que la prueba NewmanKeuls es ms potente que la prueba Tukey.

M1=30 Hacer
contacto
M2=35
Golpear
M3=38 Chocar
M4=41
Colisionar
M5=46
Estrellar

M2

Grupo experimental
M3
M4

M1
Hacer
contact
o
30

M5

Golpear

Chocar

Colisionar

Estrellar

35

38

41

46

5.00 ns

8.00 ns

11.00*

16.00**

3.00 ns

6.00 ns

11.00*

3.00 ns

8.00 ns

5.00 ns
0

*p<.05,

**p<.01

Entradas relacionadas
Anlisis de varianza, Procedimiento Bonferroni, procedimiento Bonferroni de
encinas secuenciales, Prueba de Diferencia Honestamente Significativa (HSD),

Prueba de la mltiple comparacin, Comparaciones dos a dos, Comparaciones,


Comparaciones Post-hoc, Prueba de Scheff.

Вам также может понравиться