Академический Документы
Профессиональный Документы
Культура Документы
Anlisis de
Varianza
4. Anlisis de Varianza
4. Anlisis de Varianza
e.4.1. Quines obtienen mejores resultados en Matemticas, los estudiantes que viven en
zonas rurales, en pequeas ciudades, en ciudades medias o en grandes ciudades?
Analicemos la pregunta, se trata de estudiar si "existen diferencias significativas en el
rendimiento en matemticas de los estudiantes (VD) en funcin de su hbitat (VI)"; la variable
independiente es nominal politmica (con cuatro alternativas) y la dependiente es de
intervalo.
La hiptesis nula es:
H0:
Es decir, que las muestras obtenidas sean de la misma poblacin. Y la alternativa (H1), que
alguna de las igualdades no se cumpla (que pertenezcan a poblaciones diferentes).
Si la variable dependiente (hbitat) tuviese dos alternativas utilizaramos la prueba T de
Student para dos muestras, pero al tener ms de dos se utilizar un Anlisis de Varianza
Simple.
Pgina 52
4. Anlisis de Varianza
El estadstico F est asociado a un nivel crtico (la probabilidad de obtener valores como el
obtenido o mayores). Si ste es mayor a nuestro nivel de error asumido (que habitualmente
ser del 95%, de decir de un 0,05) se rechaza la hiptesis nula, que indica la igualdad de
medias, y se acepta la alternativa.
Adems de determinar que existen diferencias entre las medias, es posible que deseemos
saber qu medias difieren. Existen dos tipos de contrastes para comparar medias: a priori y
post hoc.
Los contrastes post hoc se realizan despus de haber llevado a cabo el experimento.
Para verificar este supuesto, en el subcuadro de opciones est la Prueba de homogeneidad de las
varianzas, que calcula el estadstico de Levene para contrastar la igualdad de las varianzas de grupo. Si
las varianzas no son iguales, en este mismo subcuadro se encuentra la opcin "Brown-Forsythe". Calcula
el estadstico de Brown-Forsythe para contrastar la igualdad de las medias de grupo.
Pgina 53
4. Anlisis de Varianza
52621,047
2141072,744
2193693,791
gl
Media cuadrtica
3
6594
6597
17540,349
324,700
F
54,020
Sig.
,000
Pgina 54
4. Anlisis de Varianza
La interpretacin es igual que en la T de Student del tema anterior, si el nivel crtico asociado al
estadstico F es menor que 0,05 (o el que estemos considerando) se rechaza la hiptesis y se
acepta la alterna, es decir, se concluye que, efectivamente, hay relacin entre el hbitat y el
rendimiento en Matemticas (o que los cuatro hbitat forman parte de la misma poblacin).
Sin embargo, de lo que no tenemos informacin es entre qu tipo de hbitat hay diferencias,
ni el sentido de las mismas. Para ello se necesitan los contrastes a posteriori.
Contrastes post hoc
Una vez que se ha determinado que existen diferencias entre las medias, los contrastes de
comparaciones mltiples post hoc, o comparaciones a posteriori, permiten determinar entre
qu medias existen diferencias significativas.
El procedimiento es sencillo. Slo hay que pulsar la opcin "Post Hoc" del cuadro de dilogo de
ANOVA de un factor. Lo difcil quiz es elegir entre tantas opciones. En el Anexo, al final de
este tema, se presenta un cuadro resumen con las caractersticas de los diferentes
estadsticos.
FIGURA 4.2. SUBCUADRO DE DILOGO ANOVA DE UN FACTOR: COMPARACIONES MLTIPLES POST HOC
Pgina 55
4. Anlisis de Varianza
Una posibilidad razonable es elegir el estadstico de HDS Tukey (opcin Tukey) si las varianzas
son iguales y el estadstico Games-Howell si no se asumen varianzas iguales.
Los resultados para nuestro ejemplo se muestran en las tablas 4.2 y 4.3.
TABLA 4.2. RESULTADOS DEL ANOVA DE UN FACTOR CON COMPARACIONES MLTIPLES POST HOC
Rendimiento en Matemticas
HSD de Tukey
(I) Habitat (pueblo,
ciudad pequea, media
o grande)
Pueblos (menos de
10.009 habs.)
-3,085022*
,598434
,000
-4,62281
-1,54723
-6,209442*
,611973
,000
-7,78202
-4,63686
-8,560321*
,788173
,000
-10,58568
-6,53496
3,085022*
,598434
,000
1,54723
4,62281
-3,124419*
,551351
,000
-4,54122
-1,70762
-5,475298*
,742086
,000
-7,38223
-3,56837
6,209442*
,611973
,000
4,63686
7,78202
3,124419*
,551351
,000
1,70762
4,54122
-2,350879*
,753047
,010
-4,28597
-,41578
8,560321*
,788173
,000
6,53496
10,58568
5,475298*
,742086
,000
3,56837
7,38223
2,350879*
,753047
,010
,41578
4,28597
Diferencia de
medias (I-J) Error tpico
La interpretacin es igualmente sencilla. En cada una de las filas compara las medias de los
grupos por pares. La interpretacin, una vez ms, es fijndose en el nivel crtico y compararlo
con nuestro (normalmente 0,05). De esta forma se puede observar que hay diferencias en el
rendimiento de los estudiantes en Matemticas entre los que viven en pueblos y en ciudades
pequeas, entre pueblos y ciudades medias... y as entre todos los pares de grupos.
En la segunda de las tablas nos ofrece los resultados y encontramos ayuda para una mejor
interpretacin.
TABLA 4.3. RESULTADOS DEL ANOVA DE UN FACTOR CON COMPARACIONES MLTIPLES POST HOC,
SUBCONJUNTOS HOMOGNEOS
F.J. Murillo y C. Martnez-Garrido
Pgina 56
4. Anlisis de Varianza
HSD de Tukeya,,b
Habitat (pueblo, ciudad pequea,
media o grande)
Pueblos (menos de 10.009 habs.)
Ciudades pequeas (de 10.001 a
10.000 habs.)
Ciudades medias (de 100.001 a
500.000 habs.)
Ciudades grandes (ms de
500.000 habs.)
Sig.
1
1515
2258
48,28904
51,37406
2027
54,49848
798
56,84936
1,000
1,000
1,000
1,000
Se observa que existen cuatro grupos diferenciados (cuatro poblaciones), cada una de un tipo
de hbitat, indicndose la media del rendimiento de cada grupo. De esta forma, los resultados
apuntan a que los nios y nias que viven en pueblos sacan el peor resultado (48,28), despus
(con diferencias estadsticamente significativas) los que viven en ciudades pequeas (51,37),
despus los que viven el ciudades medias (54,49) y lo que mejores resultados obtienen en
rendimiento en Matemticas son los que viven en grandes ciudades (56,84 de media). Este
resultado, obtenido a partir de datos reales, nos muestra la desigual distribucin del
rendimiento en funcin del lugar donde vive el nio, y muestra unas preocupantes seales de
inequidad en funcin del hbitat.
Docente varn
Docente mujer
Total
Estudiante
varn
7
4
6
Estudiante
mujer
4
7
6
Total
6
6
6
Pgina 57
4. Anlisis de Varianza
Entonces seleccione:
Pgina 58
4. Anlisis de Varianza
Y pinchamos en "Aceptar".
Nos aparecen cuatro opciones:
Efectos fijos: un factor de efectos fijos es aquel en el que contamos con todas las
alternativas en la variable. Bien sea porque estn todas -por ejemplo, el hbitat- bien
porque queremos ver la diferencia entre esas alternativas. Es decir, las alternativas son
la poblacin de alternativas de respuesta sobre los que se quiere hacer la inferencia.
Efectos aleatorios: un factor de efectos aleatorios, por su parte, es aquel que las
alternativas seleccionadas son una muestra aleatoria de todas las alternativas posibles.
Luego haremos un ejemplo de las mismas.
Suma de
cuadrados tipo III
95166,829a
8140315,782
29030,841
30473,790
4895,081
2098526,962
2,023E7
2193693,791
gl
Media cuadrtica
15
1
3
3
9
6582
6598
6597
6344,455
8140315,782
9676,947
10157,930
543,898
318,828
Sig.
19,899
25531,985
30,352
31,860
1,706
,000
,000
,000
,000
,082
Pgina 59
4. Anlisis de Varianza
Estadsticamente, una relacin espuria es una relacin en la cual dos acontecimientos no tienen
conexin, aunque aparentemente la tienen debido a un tercer factor no considerado an (llamado
"factor de confusin" o "variable escondida"). La relacin espuria da la impresin de la existencia de un
vnculo apreciable entre dos grupos que es invlido cuando se examina objetivamente.
Pgina 60
4. Anlisis de Varianza
Entonces selecciona:
"Rendimiento en Matemticas" como Dependiente.
"Hbitat" en Factores fijos.
Y pinchamos en "Aceptar".
Los resultados aparecen en la tabla 4.6.
TABLA 4.6. RESULTADOS DEL ANCOVA. PRUEBAS DE EFECTOS INTERSUJETOS
Variable dependiente: Rendimiento en Matemticas
Origen
Modelo corregido
Interseccin
N_SocEc
Habitat
Error
Total
Total corregida
Suma de
cuadrados tipo III
256689,123a
1,556E7
204068,075
19724,214
1937004,669
2,023E7
2193693,791
gl
Media cuadrtica
4
1
1
3
6593
6598
6597
64172,281
1,556E7
204068,075
6574,738
293,797
F
218,424
52965,266
694,588
22,378
Sig.
,000
,000
,000
,000
Pgina 61
4. Anlisis de Varianza
El resultado buscado se presenta en la cuarta fila: nos indica que existen diferencias en el
rendimiento en funcin del Hbitat, incluso habiendo controlado el Nivel Socio-econmico de
las familias de los estudiantes (0,00<0,05).
En la fila tercera nos indica que la variable "Nivel Socio-econmico", al mostrar un nivel crtico
de menos de 0,05 se encuentran relacionadas con la variable dependiente, y tiene sentido
incluirlo en el modelo. Es decir, el Hbitat y el Nivel Socio-econmico son dos factores de
inequidad en el sistema educativo cuya influencia es aditiva.
Pgina 62
4. Anlisis de Varianza
4.5. Ejercicios
e.4.4. Existen diferencias significativas en el Rendimiento en Lengua de los estudiantes en
funcin del Hbitat? Si es as, dnde viven los estudiantes que sacan mejores y peores
resultados?
e.4.5. Existen diferencias significativas en el Rendimiento en Lengua de los estudiantes en
funcin de su hbitat, de su gnero y de la interaccin entre ambas variables?
e.4.6. Existen diferencias en el Rendimiento en Lengua de los estudiantes en funcin del
Hbitat, si controlamos el efecto del Nivel Socio-econmico?
e.4.7. Los estudiantes matriculados en centros pblicos obtienen diferente Rendimiento en
Matemticas que los que asisten a centros privados? Si controlamos el efecto del Nivel
Socio-Econmico de las familias, hay diferencias?
e.4.8. El entorno socio-econmico donde est situado el centro influye en el Rendimiento de los
estudiantes en Matemticas? Si lo controlamos por titularidad de centro?
Pgina 63
4. Anlisis de Varianza
Pgina 64