Вы находитесь на странице: 1из 9

Anlisis de la varianza con dos factores.

Introduccin Hasta ahora se ha visto el modelo de anlisis de la varianza con un factor que es una variable cualitativa cuyas categoras sirven para clasificar las medidas de otra variable cuantitativa en grupos cuyas medias se desea comparar. As, podremos comparar el peso medio de aves agrupndolas por especies, la variable de clasificacin o factor es la especie y la variable dependiente es el peso. En el tema actual se ampliar el modelo para incluir dos factores en lugar de uno solo. Por ejemplo, cuando se pretenda comparar el peso medio de aves agrupndolas por especie y por sexo. La inclusin de un factor ms no es trivial, el problema de la comparacin de las medias de grupos inducidos por dos factores cua litativos no se resuelve por la simple ampliacin del modelo de un factor a uno ms, pues es posible que ambos factores sean fijos (Modelo I), ambos aleatorios (Modelo II) o uno fijo y otro aleatorio (Modelo III), pero adems es posible que ambos factores acten de modo independiente o que la accin combinada de ambos factores potencie o inhiba la accin de cada uno por separado, en este segundo caso diremos que existe interaccin, por lo que podremos hablar de modelo con o sin interaccin. Tambin es posib le que el diseo sea equilibrado (todos los grupos son representados con un nmero igual de medidas) o que no lo sea. Una ltima posibilidad es que todas las categoras de un factor puedan ser combinadas con todas las del otro factor, entonces hablaremos de un diseo cruzado, (que en el caso de incluir interaccin se denomina modelo factorial), o que las categoras de uno de los factores solamente puedan aparecer para determinados niveles del otro, en este caso decimos que el primer nivel est jerarquizado en el segundo o que el diseo es jerarquizado. En resumen, un anlisis de la varianza de dos factores puede ser: De factores fijos De factores aleatorios Mixto Con interaccin Sin interaccin

Segn el tipo de factores

Segn la interferencia entre los factores

Segn el nmero de observaciones en Equilibrado cada categora No equilibrado Segn las posibles combinaciones de Cruzado niveles de ambos factores Jerarquizado Por supuesto, cada una de estas clasificaciones se puede combinar con cualquiera de las otras, as podremos encontrar, por ejemplo, un anlisis de la varianza de dos factores fijos, con interaccin, equilibrado y cruzado. En el caso del diseo jerarquizado no es posible determinar (al menos por los mtodos convencionales) el efecto de la interaccin de ambos factores.

Modelo de anlisis de la varianza con dos factores. En lo que sigue y salvo que se indique lo contrario, trataremos siempre con modelos equilibrados. Sean dos factores, que denominaremos A, con t niveles y B, con r niveles, si el diseo es cruzado tendremos tr clases en total, si adems es equilibrado, con n observaciones en cada clase, el nmero total de observaciones es N = trn. El modelo de anlisis de la varianza con dos factores sin interaccin se puede escribir como: X ij = + Ai + Bj + ij Donde Xij es una variable aleatoria que representa al conjunto de valores posibles de la variable dependiente correspondiente al nivel i-simo del factor A y al nivel j-simo del factor B, es la media general, Ai es el efecto aditivo que sobre esa media produce el nivel i- simo del factor A, Bj el correspondiente al nivel j-simo del factor B y ij es el error o residuo del modelo. Los distintos elementos que componen el modelo se definen como: Ai = i , siendo i la media poblacional del nivel i-simo del factor A, sin considerar el factor B. B j = j siendo j la media poblacional del nivel j-simo del factor B, sin considerar el factor A. ij = X ij i j + En el caso de que se considere la interaccin, el modelo se formula como: X ijk = + Ai + B j + ABij + ij Donde ABij es el efecto de la combinacin del nivel i- simo del factor A con el j-simo del factor B no contemplado por dichos niveles individualmente. En este caso, si definimos ij = + Ai+ Bj+ ABij como la media total correspondiente a los niveles i simo de A y j-simo de B, el modelo se puede expresar como: X ijk = ij + ij , con lo que el residuo es ij = X ij ij , y la interaccin: ABij = Xij Ai Bj ij = ij i j + Vemos que el modelo sin interaccin est incluido en el modelo con interaccin, sin ms que considerar en este ltimo caso que ABij es cero, por ello, en lo que sigue se considera siempre modelo con interaccin, procediendo a anular dicho trmino en el caso de que no lo haya.

Anlisis de la varianza de dos factores fijos cruzados. Cuando los factores son fijos, los distintos niveles de cada uno de ellos son todos los posibles (o todos los que interesa estudiar), en ese caso cada uno de los trminos Ai Bj ABij son constantes, verificndose adems que Ai= 0, Bj =0, ABij = 0 y que

ABij = 0 .
j

Sea cual sea el carcter de los factores, se considera que los trminos ij son todos variables aleatorias Normales e incorreladas, de media cero y varianza 2 igual para todos los grupos. El contraste de anlisis de la varianza se plantea como: H0 : todos los Ai , los Bj y los ABij son cero. H1 : alguno de ellos no es cero. La hiptesis nula supone que si todos los efectos de todos los niveles de los factores son nulos, todas las medias de todos los grupos considerados son iguales entre s e iguales a la media general y no hay interaccin. Para resolver el contraste se toma una muestra aleatoria de cada una de las combinaciones de categoras de los factores considerados, si el diseo es equilibrado todas estas muestras son de igual tamao n, por lo tanto, como se dijo al principio, si A tiene t niveles, B tiene r niveles y si el diseo es cruzado tendremos tr clases en total, si adems es equilibrado, con n observaciones en cada clase, el nmero total de observaciones es N = trn = n Finalmente, se estima el modelo con las observaciones obtenidas y sus correspondientes medias: xijk = x + ai + b j + abij + eijk , siendo: x ijk la k-sima (k toma valores entre 1 y n) observacin correspondiente al nivel i- simo (i entre 1 y t) del factor A y el j-simo (j entre 1 y r) nivel del factor B. x es la media de todos los datos considerados como una sola muestra. ai = xi x la estimacin del efecto del nivel i- simo del factor A, con xi la media de todos los datos incluidos dentro del nivel i-simo del factor (rn datos). bi = x j x la estimacin del efecto del nivel j-simo del factor B, con x j la media de todos los datos incluidos dentro del nivel j-simo del factor (tn datos). abij = x xi x j + x , con xij la media de todos los datos medidos para la ij combinacin ij de los niveles de los factores. eijk = x ijk x ij los residuos o diferencias de cada observacin a la media de los datos correspondientes a la combinacin ij de los factores. Pasando al primer miembro el trmino x , elevando al cuadrado y sumando, teniendo en cuenta que todos los dobles productos se anulan al sumar, queda:

( xijk x )

= ( xi x ) + ( x j x ) + ( xij xi x j + x ) + ( xijk x )
2 2 2

Que es la expresin para dos factores del teorema de descomposicin de la varianza. Los grados de libertad de cada uno de los sumandos son: N-1 = trn-1 para la suma de cuadrados total t-1 para la suma de cuadrados de A r-1 para la suma de cuadrados de B (t-1)(r-1) para la suma de cuadrados de la interaccin. N-tr = tr(n-1) para la suma de cuadrados del error. Abreviadamente, este teorema se expresa: SC = SCA + SCB + SCAB + SCE Adems cada uno de los trminos es una variable aleatoria Chi cuadrado con sus respectivos grados de libertad e independientes entre s. El paso siguiente es determinar la media de cuadrados, dividiendo cada suma de cuadrados entre sus correspondientes grados de libertad. La esperanza matemtica de cada una de las medias de cuadrados son las siguientes. SCA 2 i E(MCA) = E t 1 = + rn t 1 Bi2 SCB j 2 E(MCB) = E r 1 = + tn r 1

Ai2

ABij2 SCAB 2 i E(MCAB) = E ( t 1)( r 1) = + n ( t 1) ( r 1) SCE 2 E(MCE) = E N tr =


Por lo tanto, si es cierto H0 , todas las medias de cuadrados estiman la misma cantidad, la varianza de comn 2 , mientras que si alguno de los niveles de algn factor o la interaccin no son nulos, su media de cuadrados ser mayor que la media de cuadrados del error, el contraste, que se resuelve de modo unilateral, termina por comparar el cociente entre cada media de cuadrados y la media de cuadrados del error con el cuantil correspondiente de la distribucin F de Snedecor con los grados de libertad respectivos del numerador y del denominador. Se resume todo en una tabla como la siguiente:

Fuente de Grados variacin de libertad Factor A t-1

Suma de cuadrados

Media de Esperanza M. C. cuadrados SCA t 1 SCB r 1


2 x

Fexp

SCA = SCB =

1 x2 xi2 rn i N 1 x2 j N tn i
2 x

+ rn
2

Ai2
i

Factor B

rt-1

+ tn
2

t 1 B 2j
j

SCA SCE SCB SCE SCAB SCE

r 1
i

Interaccin (t-1)(r-1) AB Error N-tr

1 2 SCAB = xij SCA SCB n ij N


2 SCE = xijk ijk

SCAB ( t 1) ( r 1) 2 + n SCE N tr 2

ABij2

( t 1 )(r 1 )

1 2 xij n ij

En las frmulas de la anterior tabla, las equis cuyos subndices han sido sustituidos por puntos indican la suma de todo los valores de la variable dependiente correspondientes a los subndices sustituidos. Los sumatorios con ms de un subndice indican dobles o triples sumatorios para todos los posibles valores de los subndices.

Anlisis de la varianza de dos factores aleatorios con interaccin. Diseo cruzado y equilibrado. En este caso, los niveles de los factores A y B, y por tanto los de su interaccin son una muestra aleatoria de todos los niveles posibles de ambos factores, que se consideran infinitos. En este caso, los efectos producidos por dichos niveles son variables aleatorias 2 Normales, independientes, de media cero y varianzas respectivas 2 , B , 2 , igual A AB para todos los niveles. Por su parte, el error es una variable aleatoria Normal, independiente de las anteriores, de media cero y varianza 2 igual para todas las combinaciones de niveles. El contraste a realizar es: H0 : Las varianzas de los factores y la interaccin son nulas. H1 : Alguna de ellas no lo es. La hiptesis nula supone que todos los factores son constantes y no inducen variabilidad en la variable dependiente, por lo que las medias de todas las combinaciones de factores han de ser iguales. el planteamiento del modelo es idntico al de dos factores fijos, y la descomposic in en sumas de cuadrados tambin, pero la esperanza de las media de cuadrados ya no son iguales, por lo que las F experimentales no se calculan del mismo modo. Los resultados son los siguientes: SCA 2 2 2 E(MCA) = E t 1 = + n AB + rn A SCB 2 2 2 E(MCB) = E r 1 = + n AB + tn B SCAB 2 2 E(MCAB) = E ( t 1) ( r 1) = + n AB SCE 2 E(MCE) = E N tr = Por tanto, si hay interaccin pero los factores de modo individual no tienen influencia, las medias de cuadrados de los factores son mayores que la media de cuadrados del error, pero sern aproximadamente iguales que la media de cuadrados de la interaccin. Si la interaccin no afecta, su media de cuadrados ser parecida a la media de cuadrados del error. As, para realizar el contraste sobre los factores, se calculan los cocientes de sus medias de cuadrados entre la media de cuadrados de la interaccin y se comparan con una F de Snedecor con los grados de libertad correspondientes, mientras que para realizar el contraste sobre la interaccin se divide su media de cuadrados entre la del error y se compara con la adecuada F de Snedecor. Anlisis de la varianza de dos factores cruzados. Modelo mixto equilibrado. Sin prdida de generalidad, supondremos que el factor A es el fijo, mientras que el B es aleatorio.

Ahora, los efectos de A son constantes de suma nula, mientras que los de B y la 2 interaccin son variables aleatorias de media cero y varianzas respectivas B y 2 , AB igual para todos los niveles. Por su parte, el error es una variable aleatoria Normal, independiente de las anteriores, de media cero y varianza 2 igual para todas las combinaciones de niveles. El contraste se plantear:

H0 : Los Ai son todos nulos. Las varianzas del factor B y de la interaccin, tambin. H1 : Alguna de ellas no lo es. Se resuelve planteando un modelo igual que el que ya visto, con idntica descomposicin en suma de cuadrados y grados de libertad, pero nuevamente, las esperanzas de las medias de cuadrados son distintas, ahora son: SCA 2 2 i E(MCA) = E t 1 = + n AB + rn t 1 SCB 2 2 E(MCB) = E r 1 = + tn B SCAB 2 2 E(MCAB) = E ( t 1) ( r 1) = + n AB SCE 2 E(MCE) = E N tr = Ahora, la media de cuadrados del factor fijo A se comparar con la media de cuadrados de la interaccin, mientras que la media de cuadrados del factor aleatorio y la de la interaccin se han de comparar con la media de cuadrados del error. La tabla siguiente resume todos los casos:

Ai2

Esperanza Media de Cuadrados Fuente de Grados variacin de libertad Factor A t-1 Suma de cuadrados Media de cuadrados SCA t 1 SCB r 1
2

Fexp Fijo SCA SCE SCB SCE SCAB SCE Aleatorio SCA SCAB SCB SCAB SCAB SCE Mixto SCA SCAB SCB SCE SCAB SCE

Fijo

Aleatorio

Mixto (A es Fijo)

SCA =

x2 1 2 xi rn i N 1 x2j N tn i
2 x

+ rn
2

Ai2
i

t 1

+ n 2 AB

2 + rn A

+ n
2

2 AB

+ rn

Ai2
i

t 1

Factor B

rt-1

SCB =

+ tn
2 j

B2 j

Interaccin AB Error

(t-1)(r-1)

x 1 2 SCAB = xij SCA SCB n ij N


2 SCE = xijk ijk

SCAB ( t 1 )(r 1 ) SCE N tr

+n
2

r 1 2 ABij
i

2 2 + n 2 + tn B AB

2 2 + tn B

( t 1 )(r 1 ) 2

2 + n 2 AB
2

2 + n 2 AB
2

N-tr

1 2 xij n ij

Realizacin de contrastes de anlisis de la varianza con dos factores mediante SPSS. Para realizar estos contrastes se tendr que desplegar el men Statistics-General Linear Model-GLM Factorial, que nos lleva a un cuadro de dilogo como el siguiente:

Donde se puede seleccionar la variable dependiente y los factores, tanto fijos como aleatorios. Por defecto se realizar un modelo con interaccin. Si se desea realizar un modelo sin interaccin, se puede pulsar el botn Model que nos lleva a un nuevo cuadro de dilogo:

En el que se puede seleccionar los factores que entran en el modelo, pulsando en el botn Custom y arrastrndolos desde el recuadro Factor & Covariates al recuadro Model. Los factores que interactan se pueden seleccionar pulsando el cuadro desplegable Interaction. El cuadro de verificacin Include intercept in Model permite considerar la media general como parte del modelo o considerarla en el primer miembro con lo cual estar incluida en la suma de cuadrados total. Ejercicio: Abrir el fichero Gastos familiares.sav y analizar la variable Consumo como si ambos factores fuesen fijos, como si ambos fuesen aleatorios o como si uno fuese aleatorio y el otro fijo.

Вам также может понравиться