Академический Документы
Профессиональный Документы
Культура Документы
Universitat de Valncia
Dpto. de Direccin de Empresas Juan Jos Renau Piqueras
1
Estas notas son una seleccin de aquellos textos que, bajo mi punto de vista, mejor abordan
el tema analizado. Sus autores aparecen citados al principio de cada epgrafe, y a ellos hay
que referirse cuando se citen los contenidos de estas notas. Mi nica tarea ha sido la de selec-
cionar, ordenar y, en algunos casos traducir los textos originales.
2 Anlisis de la varianza
Joaqun Alds Manzano
El anlisis de la varianza
1. Qu es el anlisis de la varianza?
(Uriel, 1995)
H 0 : x F = xNF = x D
Ygi - Y
Ygi - Y = (Y g - Y ) + (Ygi - Y )
donde el primer componente,(Y g Y ) refleja la desviacin de la media muestral
de cada grupo respecto a la media global, lo que llamamos desviacin explicada
por el factor.
5 Anlisis de la varianza
Joaqun Alds Manzano
G ng G G ng
g =1 i =1 g =1 g =1 i =1
SCF
MCF =
G -1
SCR
MCR =
n -G
SCT
MCT =
n -1
SCF
MCF
F = = G -1
MCR SCR
n -G
Suma de Media
cuadrados gl cuadrtica F Sig.
Inter-grupos 171,378 2 85,689 59,161 ,000
Intra-grupos 344,721 238 1,448
Total 516,100 240
SCF 171,37
MCF
F = = G - 1 = 344,72
3 - 1 = 59,16
MCR SCR
n -G 241 - 3
La hiptesis ms relevante que deben cumplir los datos para poder aplicar un
anlisis de la varianza, es la hiptesis de homoscedasticidad, es decir, que la
varianza de la variable dependiente (opinin acerca de que deben subirse los
impuestos sobre el tabaco) es constante en los grupos que hace el factor
(fumadores, no fumadores y los que lo han dejado).
Algunos autores (Uriel, 1995; Stevens, 1986) afirman, sin embargo, que el
estadstico F no se ve muy afectado por el hecho de que no exista homoscedas-
ticidad siempre que las muestras de los diferentes grupos sean del mismo o
similar tamao. Se afirma que el estadstico se ver afectado cuando la razn
entre el tamao muestral del grupo de mayor tamao y el ms pequeo sea
superior a 2. El cuadro 2.2 nos muestra unos estadsticos descriptivos de
nuestra muestra de ejemplo, se observa que el grupo ms numeroso es el de los
no fumadores con 120 individuos, mientras que el ms pequeo es el de los que
han dejado de fumar con 14. Es evidente que la razn es superior a 2 (120/14
> 2), por lo que la vulneracin de la hiptesis de homoscedasticidad s que
afectar a la aplicabilidad del anlisis de varianza.
1,0
,5
0,0
Normal esperado
-,5
-1,0
0 1 2 3 4 5 6
Valor observado
Hasta este momento, hemos planteado los objetivos del ANOVA (saber si la
opinin que se tiene acerca de que se suban los impuestos sobre el tabaco, vara
o no entre fumadores y no fumadores), hemos comprobado las hiptesis que
deben cumplir los datos y, adems, hemos construdo el estadstico que nos ha
de permitir aceptar o rechazar la hiptesis nula de igualdad de medias, pero
cul es el resultado del anlisis?
estadstico F=59,16 no nos dice mucho dado que no conocemos de memoria las
tablas, pero s el valor de la significatividad p=0.000. Dijimos que la significati-
vidad era la probabilidad de equivocarnos al rechazar la hiptesis nula de que
las medias son iguales. Esta probabilidad es nula (en todo caso menor que
cualquiera de los dos valores crticos: 0.01 y 0.05), por lo que, dado que no
tenemos ninguna probabilidad de equivocarnos la rechazaremos, es decir,
alguna de las medias es significativamente distinta de las dems. Sin embargo
no sabemos si todas son distintas entre s (xFxNFxD) o, por ejemplo, la de los
fumadores es distinta del grupo de no fumadores y lo han dejado, pero estas
dos ltimas no son diferentes (xFxNF=xD). Para ello habr que realizar alguna
prueba post hoc, como veremos inmediatamente.
Leamos ahora la segunda fila. Ahora la diferencia entre los que lo han dejado y
los que s que fuman es de 1,13 y significativa (ya lo sabamos de la fila
anterior), pero la diferencia ente los que lo han dejado y los que no fuman es
de 0,61 y NO ES SIGNFICATIVA, dado que ni lleva asterisco ni 0,172<0,05.
Luego la opinin de los que fuman es distinta de los que lo han dejado, pero la
de estos ltimos no es distinta de los que no fuman.
La tercera fila nos confirma lo anterior. La diferencia de opinin entre los que
no fuman y los que s (1,74) es estadsticamente significativa, pero no la
diferencia con los que lo han dejado (0,61).
11 Anlisis de la varianza
Joaqun Alds Manzano
Intervalo de confianza al
95%
Diferencia
de medias Lmite Lmite
(I) FUMA USTED? (J) FUMA USTED? (I-J) Error tpico Sig. inferior superior
SI SI
DEJADO -1,13 * ,342 ,003 -1,93 -,33
NO -1,74 * ,160 ,000 -2,11 -1,36
DEJADO SI 1,13* ,342 ,003 ,33 1,93
DEJADO
NO -,61 ,340 ,172 -1,41 ,19
NO SI 1,74* ,160 ,000 1,36 2,11
DEJADO ,61 ,340 ,172 -,19 1,41
NO
*. La diferencia entre las medias es significativa al nivel .05.
En sntesis, como muestra el cuadro 5 que ofrece los grupos con la misma
media, por un lado tenemos el grupo de los no fumadores, con media 1,73 que
mantiene una opinin distinta (son menos favorables a que se suban los
impuestos) que el otro grupo, formado por no fumadores y quienes lo han
dejado, cuyas medias no son significativamente diferentes.
Subconjunto
para alfa = .05
FUMA USTED? N 1 2
SI 107 1,73
DEJADO 14 2,86
NO 120 3,47
Sig. 1,000 ,094
Se muestran las medias para los grupos en los subconjuntos
homogneos.
1. Usa tamao de la muestra de la media armnica = 33,667.
2. Los tamaos de los grupos no son iguales. Se utilizar la
media armnica de los tamaos de los grupos. Los niveles de
error del tipo I no estn garantizados.
12 Anlisis de la varianza
Joaqun Alds Manzano
SCF 171,37
R2 = = = 0,33
SCT 516,10
G J ngj G J G J ngj
g =1 j =1 i =1 g =1 j =1 g =1 j =1 i =1
14 Anlisis de la varianza
Joaqun Alds Manzano
ngj (Ygj - Y )
2
=
g =1 j =1
G J G J G J
Al igual que en el caso de un factor, cada suma de cuadrados tiene sus propios
grados de libertad, tal y como ilustramos en el cuadro 2.7. En este mismo
cuadro ilustramos tambin como se construye cada uno de los estadsticos F
que, ahora, han de permitirnos determinar si el efecto de cada factor por
separado y la interaccin de ambos, son o no significativos.
15 Anlisis de la varianza
Joaqun Alds Manzano
SCF A MCF A
Factor A SCFA G-1 MCF A = G1 F= MCR
SCF B MCF B
Factor B SCFB J-1 MCF B = J1 F= MCR
SCR
Residual SCR n-GJ MCR = nGJ
SCT
Total SCT n-1 MCT = n1
Antes de comentar los resultados concretos del ejemplo que venimos analizan-
do, tratemos de analizar los posibles resultados que podran obtenerse y
comprender, as, qu significar que uno de los factores, o la interaccin de
ambos sea significativa. La figura 2 es una ilustracin del resultado que se
obtendra si el efecto del factor 1 (fumar o no fumar) fuera significativo sin que
lo sea el factor 2 (sexo) ni la interaccin entre ambos. En el eje y se ha repre-
sentado la opinin sobre que se suban los impuestos. En el eje x vienen repre-
sentados los tres niveles del factor 1 (fumador, no fumador, han dejado de
fumar) y se han representado las medias de la opinin en cada uno de estos
tres grupos pero utilizando dos lineas, una para hombres y otra para mujeres.
Decimos que el factor 1 influye y el factor 2 no porque:
La figura 3 ilustra el caso en que el resultado fuera que el sexo influye, pero no
lo hace el factor 1, es decir, el hbito. Se observa que en este caso las lneas
estn separadas (sexo influye), pero las medias de opinin son las mismas
independientemente del hbito (lneas paralelas al eje x).
16 Anlisis de la varianza
Joaqun Alds Manzano
Acuerdo l Hombres
n Mujeres
Opinin
n
l
n
Desacuerdo
Factor 1: Fumar
Acuerdo
l l l Hombres
Opinin
n n n Mujeres
Desacuerdo
Factor 1: Fumar
Acuerdo
n Mujeres
l
Opinin
Desacuerdo
n
Factor 1: Fumar
l l l Hombres
n n n Mujeres
Desacuerdo
Factor 1: Fumar
n Mujeres
l
n
Desacuerdo
Factor 1: Fumar
Estadsticos descriptivos
Variable dependiente: Deben aumentarse los impuestos
sexo FUMA USTED? Media Desv. tp. N
Hombre SI 1,71 1,25 41
DEJADO 3,50 1,73 4
NO 3,59 1,26 46
Total 2,74 1,57 91
Mujer SI 1,74 1,10 66
DEJADO 2,60 1,51 10
NO 3,39 1,17 74
Total 2,61 1,40 150
Total SI 1,73 1,15 107
DEJADO 2,86 1,56 14
NO 3,47 1,20 120
Total 2,66 1,47 241
Suma de
cuadrados Media
Fuente tipo III gl cuadrtica F Sig.
1
Modelo corregido 174,803 5 34,961 24,072 ,000
Intercept 643,121 1 643,121 442,822 ,000
SEXO 2,645 1 2,645 1,821 ,178
FUMA 168,187 2 84,094 57,903 ,000
SEXO * FUMA 2,503 2 1,252 ,862 ,424
Error 341,296 235 1,452
Total 2221,000 241
Total corregido 516,100 240
1. R cuadrado = ,339 (R cuadrado corregido = ,325)
Se deja como ejercicio para el lector el que se comprueben los clculos que
permiten obtener los estadsticos F de acuerdo con lo descrito en el cuadro 6.
Por ejemplo, para el factor sexo:
SCFsexo 2,645
MCFsexo J -1 = 2-1
F = =
MCR SCR 341,29 = 1,821
n - GJ 241 - 3 2
3,5
Medias marginales estimadas
3,0
2,5
2,0
sexo
Hombre
1,5 Mujer
SI DEJADO NO
FUMA USTED?
Referencias bibliogrficas