You are on page 1of 7

HOMOGENEIDAD DE VARIANZAS

Resumen. Si se consideran varias poblaciones con el mismo grado de gene-


ralidad, podemos esperar cambios en las medias pero no en las varianzas, ya
que los factores que determinan e
i
siguen siendo los mismos. De lo contrario,
si pasamos de un concepto de poblacin a otro de un grado de generalidad
mayor, se espera tener cambios imprevistos en la media, sin embargo, en la
varianza se espera un incremento motivado por las discrepancias que existen
en las mediciones que son incrementadas al generalizarse las especicaciones
de la poblacin.
Si ste supuesto no se cumple, es decir, si las varianzas de todos los tra-
tamientos no son iguales entre s, puede aumentarse el tamao de la regin
crtica del estadstico F para el caso de efectos jos; pero, este efecto puede
minimizarse mediante el empleo de muestras de igual tamao para cada trata-
miento. En otras palabras, en el anlisis de varianza, el estadstico F tambin
es ms robusto ante varianzas desiguales siempre y cuando los tamaos de la
muestra de los tratamientos sean iguales. Desafortunadamente este resultado
no se extiende al caso de efectos aleatorios en el que la violacin de la hip-
tesis de varianzas iguales generalmente tendr efectos considerables sobre las
inferencias an para muestras del mismo tamao.
A continuacin se describirn tres procedimientos para detectar si existe o
no homogeneidad de varianzas.

Palabras Clave: Homogeneidad de varianzas, Prueba de Barlett, Trans-


formaciones de varianza
1. Grfica de residuales en secuencia de tiempo
En algunas ocasiones, la experiencia del experimentador puede cambiar conforme
el experimento progrese, o si el proceso ha sido estudiado, ste puede variar. Esto
frecuentemente tendr como resultado un cambio en la varianza del error en funcin
del tiempo. Esta condicin frecuentemente llevar a una grca de residuales contra
el tiempo que se muestre ms desparramada en un lado que en el otro.
Para ilustrar lo anterior, supngase que los residuales ocurren en un orden dado
y espaciados en tiempos iguales. La grca de los residuales contra el tiempo se
muestra en la gura 1.1.
En este diagrama puede observarse que el tiempo no est inuyendo sobre los
datos. Sin embargo, el diagrama pudo haberse visto de cualquiera de las formas
presentadas en la gura 1.2.
Al observar las gura 1.2, se puede concluir que en ninguna de las formas se
tom en cuenta el efecto tiempo, y cada uno de los casos muestra que:
1. La varianza de las observaciones no es constante, se incrementa con el tiempo.
2. Deber agregarse un trmino lineal en el tiempo al modelo.
3. Debern agregarse trminos lineales y cuadrticos en el tiempo al modelo.
En el ejemplo mencionado, se supone que los residuales estn igualmente espaciados
en el tiempo. Si no fuera as, y se conocen los espacios exactos entre los datos, los
residuales se gracarn usando estos espacios.
1
Figura 1.1. Residuales en secuencia de tiempo
Figura 1.2. Formas hipotticas del comportamiento de los residuales
2. Grfica de residuales contra los valores estimados

ij
Si es vlida la suposicin de que los errores aleatorios tienen las mismas varianzas
para todos los niveles del factor, entonces una grca de los residuales de cada tra-
tamiento no revelar ninguna diferencia apreciable en la dispersin de los residuales
alrededor de cero. Si esta dispersin es notablemente diferente para algunos trata-
mientos, entonces es posible que las varianzas no sean iguales para todos ellos. Una
manera sencilla de probar lo anterior, es gracar los residuales contra los valores
estimados
ij
(para el modelo de un criterio de clasicacin,
ij
=
i
, el promedio
del tratamiento i). Esta grca no debe revelar ningn patrn obvio.
El efecto que se observa ocasionalmente en esta grca, es la varianza no es
constante. Algunas veces, la varianza de las observaciones aumenta conforme la
magnitud de los datos aumenta. Este sera el caso si el error fuera el porcentaje
constante del tamao de las observaciones (esto sucede comnmente en muchos
instrumentos de medicin donde el error es un porcentaje de la escala de lectu-
ra). Si este fuera el caso, los residuales aumentaran conforme
ij
aumenta, y la
grca de los residuales contra
ij
, tendra forma de embudo. La varianza no cons-
tante tambin surge en casos donde los datos siguen una distribucin sesgada no
2
Figura 2.1. Residuales Vs Valores estimados

ij
normal, porque en distribuciones sesgadas la varianza tiende a ser funcin de la
media. Tambin pueden causar varianzas diferentes las respuestas errneas de los
tratamientos.
Si la suposicin de homogeneidad de varianzas es violada, la prueba F es lige-
ramente afectada slo en el modelo de efectos jos balanceado. Sin embargo, en
diseos no balanceados, o en casos donde la varianza es mucho ms grande que
las otras, el problema es ms serio. Para el modelo de efectos aleatorios, las va-
rianzas del error distintas, pueden alterar signicativamente las inferencias en los
componentes de la varianza slo si se usan diseos balanceados.
La gura 2.1 muestra los residuales gracados contra los valores estimados

ij
.
Esta grca no revela ningn modelo obvio.
3. Prueba de Bartlett
Uno de los procedimientos estadsticos que pueden utilizarse para probar la de-
sigualdad de varianzas, es el procedimiento conocido como prueba de Barlett. A
continuacin se presenta dicho procedimiento:
Supngase que hay a tratamientos, y se desea probar la hiptesis
H
0
:
2
1
=
2
2
= . . . =
2
a
H
1
: No verdadera al menos para una
2
i
.
El procedimiento de prueba utiliza un estadstico cuya distribucin de muestreo
est aproximada por la distribucin chi cuadrada con a1 grados de libertad cuando
las a muestras aleatorias provienen de poblaciones normales independientes.
El estadstico de prueba es
(3.1)
2
0
= 2,3026
q
c
en donde:
(3.2) q = (N a) log
2
P

a

i=1
(n 1) log
_
S
2
i
_
(3.3) c = 1 +
1
3 (a 1)
_
a

i=1
(n 1)
1
(N a)
1
_
3
(3.4) Sp
2
p
=

(n
i
1) S
2
i
N a
y S
2
i
es la varianza muestral en el i-simo tratamiento. La cantidad q es grande
si las varianzas muestrales S
2
i
dieren mucho; q es igual a cero si todas las S
2
i
son
iguales. Por tanto, se rechazara H
0
si

i
>
a,a1
La prueba de Barlett es muy sensible a la consideracin de normalidad y no debe
aplicarse cuando existan dudas en cuanto a dicha consideracin de normalidad.
Ejemplo 1. Aplique la prueba de Bartlett a los datos del Ejemplo 1. Las varianzas
muestrales en cada tratamiento son: S
2
1
=0.007, S
2
2
=0.007, S
2
3
=0.013, S
2
4
=0.1581,
S
2
5
=0.022.
Ejemplo. Entonces
S
2
p
=
4 (0,007) + 4 (0,007) + 4 (0,013) + 4 (0,1581)
20
= 0,04142
q = 20 log (0,0414) 4(log (0,007) + log (0,007) + log (0,013)
+log (0,1581) + log (0,22))
= 6,962
c = 1 +
1
3 (5 1)
5/4 1/20 = 1,10
y el estadstico de prueba es:

2
0
= 2,3026
(6,962)
(1,100)
= 14,57
Puesto que
2
a,a1
= 9,49, as se rechaz la hiptesis nula y se llega a la conclusin
de que las varianzas no son homogneas.
4. Transformaciones de varianza
Si la desigualdad de las varianzas constituye un problema, el enfoque usual reco-
mendado consiste en transformar las observaciones y aplicar el anlisis de varianza a
los datos transformados. Debe observarse que las conclusiones obtenidas se aplican
a los datos transformados, no a los datos originales. Es posible proporcionar algunos
lineamientos generales para seleccionar una transformacin apropiada. Si se conoce
la verdadera distribucin de los datos, es posible utilizar esta informacin al selec-
cionar una transformacin. Por ejemplo, si las observaciones siguen la distribucin
de Poisson entonces se recomienda la transformacin logartmica

ij
= log (
ij
).
Para datos binomiales expresados como fracciones resulta til la transformacin

ij
= arcsin (
ij
). Cuando no haya una transformacin obvia, quien realiza el ex-
perimento generalmente buscar una transformacin que iguale las varianzas sin
importar el valor de la media.
Si los efectos de los tratamientos no son aditivos, las transformaciones anali-
zadas anteriormente tambin pueden resultar tiles. Existen varias causas de no
aditividad. Por ejemplo, los verdaderos efectos de los tratamientos pueden ser mul-
tiplicativos; esto es,
ij
=
i

ij
, o pueden existir efectos de interaccin que no se
4
Cuadro 1. Transformaciones estabilizadoras de la varianza
Relacin entre

y = 1 Transformacin

, Constante 0 1 No requiere

, ,
1
/2
1
/2
1
/2 Raz cuadrada

, , 1 0 Logartmica

, ,
3
/2
3
/2
1
/2 Recproco de raz cuadrada

, ,
2
2 -1 Recproco
hayan incluido en el modelo. Las transformaciones realizadas para lograr no aditivi-
dad tambin afectarn la distribucin de los errores experimentales. En la mayora
de los casos, esta transformacin har que la distribucin de errores sea ms cercana
a la normal.
5. Seleccin de una transformacin de varianza
Si se conoce la relacin entre la varianza de las observaciones y la media, puede
usarse esta informacin de gua en la seleccin de la forma de la transformacin.
A continuacin, se mostrar cmo es posible estimar la forma de la transformacin
requerida de los datos.
Se dice que E () = , la media de . Se supone que la desviacin estndar de
es proporcional a una potencia de la media de , tal que

a
Se quiere encontrar una transformacin para que d una varianza constante.
Supngase que la transformacin es una potencia que los datos originales, es decir
(5.1)

Entonces puede demostrarse que


(5.2)

+1
Claramente, si se ajusta = 1 , entonces la varianza de los datos transfor-
mados es constante.
Algunas de las transformaciones comunes discutidas anteriormente, se resumen
en la tabla 1.
6. Determinacin analtica de la transformacin
Box y Cox (1964) demostraron cmo el parmetro de transformacin en

puede ser estimado simultneamente con los otros parmetros del modelo (media
general y efectos de los tratamientos) usando el mtodo de mxima verosimilitud. El
procedimiento consiste en ejecutar, para varios valores de , un anlisis de varianza
estndar sobre

()
=
_

1
= 0

ln () = 0
5
Cuadro 2. Observaciones de experimento
Tratamiento Observaciones
1 0.34 0.12 1.23 0.70 1.75 0.12
2 0.91 2.94 2.14 2.36 2.86 4.55
3 6.31 8.37 9.75 6.09 9.82 7.24
4 17.15 11.82 10.95 17.20 14.35 16.82
donde = ln
1
[(
1
/n)

ln ()] es la media geomtrica de las observaciones.


El estimador de mxima verosimilitud de es el valor para el cual la suma de
cuadrados del error, es decir SCE (), es mnimo. Este valor de se encuentra
usualmente haciendo una grca de la SCE () contra y despus leyendo el valor
de que minimice SCE () de la grca. Usualmente entre 10 y 20 valores de son
sucientes para la estimacin de un valor ptimo. Una segunda iteracin puede ser
ejecutada si se necesita un estimador ms exacto. Ntese que no se puede seleccionar
el valor directamente por comparacin de la SCE del anlisis de varianza sobre

, porque para cada valor de la SCE est medida en una escala diferente. La
ecuacin anterior da una escala nueva a las respuestas de tal manera que la SCE
se compara directamente. Es recomendable que el experimentador use selecciones
simples para , para facilitar la interpretacin.
Un intervalo de conanza al 100 (1 ) % aproximado para puede encontrarse
calculando
SC

= SCE ()
_
1 +
t
2

/2,

_
donde es el nmero de grados de libertad del error , despus se leen los lmites
de conanza correspondientes para directamente de la grca. Si este intervalo de
conanza incluye el valor = 1, esto implica que los datos no soportan la necesidad
de transformacin.
Ejemplo 2. La tabla 2 muestra los resultados de un experimento, en el cual se
utiliz un diseo completamente aleatorio, con 4 tratamientos y 6 observaciones
por tratamiento.
En la grca 6.1 se muestra los resultados contra los valores estimados

ij
y se
puede observar que la suposicin de varianza constante no se satisface.
Utilizando los datos de la tabla 2 se tienen los siguientes valores para la SCE ()
despus de haber ejecutado para varios valores de , un anlisis de varianza estndar
sobre

.
SCE () SCE ()
-1.00 7922.11 0.50 35.42
-0.50 687.10 0.60 35.76
-0.25 232.52 0.75 40.61
0.00 91.96 0.80 43.43
0.20 52.30 1.00 62.08
0.25 46.99 1.25 109.82
0.40 37.62 1.5 208.12
6
Figura 6.1. Resultados contra los valores estimados

ij
(Ejemplo)
Figura 6.2. Valores SC* (Ejemplo 2)
La gura 6.2 muestra la grca de stos valores, de la cual, se puede ver que
= 0,52 da un valor mnimo de aproximadamente 35 para la SCE ().
Un intervalo de conanza al 95 % puede concentrarse calculando SC

como sigue:
SC

= 35,00
_
1 +
(2,086)
2
20
_
= 42,61
Gracando SC

en la grca anterior y leyendo los puntos sobre la escala ho-


rizontal, donde esta lnea intersecta a la curva, se obtienen los lmites inferior y
superior de conanza siguientes para:

= 0,27 y
+
= 0,77. Ya que estos lmites
de conanza no incluyen el valor 1, signica que se debe usar una transformacin
y que la transformacin raz cuadrada ( = 0,50) es la adecuada.
7