Вы находитесь на странице: 1из 4

Análisis de las varianzas (ANOVA)1

I. Objetivo

Analizar, comparar e interpretar datos por medio del análisis de las varianzas ANOVA,
solucionando con creatividad los problemas.

II. Apoyo teórico

Las pruebas que hemos aprendido hasta ahora, nos permiten probar hipótesis que
examinan la diferencia entre dos medias solamente. El análisis de la varianza o ANOVA
nos permitirá probar la diferencia entre dos o más medias examinando el cociente de la
variabilidad entre dos condiciones y de la variabilidad dentro de cada condición. Por
ejemplo, digamos que suministramos una droga que creamos mejorará la memoria a un
grupo de personas y demos un placebo a otro grupo. Podríamos medir el funcionamiento
de la memoria por el número de las palabras recordadas de una lista que pedimos a
cada uno para memorizar. Una prueba t compararía la probabilidad de observar la
diferencia entre los números medios de las palabras recordadas por cada grupo. Una
prueba ANOVA, por otra parte, compararía la variabilidad que observamos entre las dos
condiciones a la variabilidad observada dentro de cada condición. Recuerde que
medimos variabilidad como la suma de la diferencia de cada valor con respecto a la
media. Cuando realmente calculamos un ANOVA utilizaremos una fórmula atajo.

Por lo tanto, cuando la variabilidad que predecimos entre dos grupos es mucho mas
grande que la variabilidad que no pudimos predecir dentro de cada grupo, concluiremos
que nuestro tratamiento produce resultados diferentes.

Un Ejemplo Ilustrativo de ANOVA

Considere las muestras aleatorias (enteros pequeños, solo para efectos ilustrativos mientras
se ahorra espacio) siguientes que corresponden a tres poblaciones diferentes.

Con hipótesis nula:


H0: µ1 = µ2 = µ3,

y alternativa:
Ha: al menos dos de las medias no son iguales.

A un valor de significancia de a = 0,05, el valor critico de la tabla F es:


F 0.05, 2, 12 = 3,89.

1
Statistical Thinking for Managerial Decisions
http://home.ubalt.edu/ntsbarsh/Business-stat/opre504S.htm#rreganovachi

1
Suma Media

Muestra P1 2 3 1 3 1 10 2

Muestra P2 3 4 3 5 0 15 3

Muestra P3 5 5 5 3 2 20 4

Demostrar que, SCT = SCE + SCD.

Esto es, la suma de los cuadrados totales (SCT) igual a la suma de los cuadrados entre
(SCE) los grupos mas la suma de los cuadrados dentro (SCD) de los grupos.

Cálculo de la muestra SCT: Con la media principal = 3, primero, se comienza tomando la


diferencia entre cada observación y la media, y luego se eleva al cuadrado para punto
de los datos.
Suma

Muestra P1 1 0 4 0 4 9

Muestra P2 0 1 0 4 9 14

Muestra P3 4 4 4 0 1 13

Por lo tanto SCT = 36 con gl = (n-1) = 15-1 = 14.

Cálculo de la muestra SCE:


Segundo, deje que todos los datos en cada muestra tenga el mismo valor como la media
principal en esa muestra. Esto remueve cualquier variación DENTRO de ella. Calcule la
suma de los cuadrados de las diferencias con respecto a la media principal.

Suma

Muestra P1 1 1 1 1 1 5

Muestra P2 0 0 0 0 0 0

Muestra P3 1 1 1 1 1 5

Por lo tanto, SCE = 10, con gl = (m-1)= 3-1 = 2 para m =3 grupos.

Cálculo de la muestra SCD:

2
Tercero, calcule la suma de los cuadrados de las diferencias dentro de cada muestra
usando sus propias medias muestrales. Esto provee una suma de los cuadrados de las
desviaciones DENTRO de todas las muestras.

Suma

Muestra P1 0 1 1 1 1 4

Muestra P2 0 1 0 4 9 14

Muestra P3 1 1 1 1 4 8

SCD = 26 con gl = 3(5-1) = 12. Esto es, 3 grupos por (5 observaciones en cada -1)

Los resultados son: SCT = SCE + SCD, y gl SCT = glSCE + glSCD, como se esperaba.

Ahora, construya la tabla ANOVA para este ejemplo numérico colocando los resultados
de sus cálculos en esta tabla. Note que, los Cuadrados de las Medias son la Suma de los
cuadrados divididos por sus Grados de Libertad. El estadístico F es el cociente de las dos
Medias al Cuadrado.

Tabla ANOVA
Origen de la Suma de Grados de Medias al Estadístico
Variación Cuadrados Libertad Cuadrado F
Entre Muestras 10 2 5 2,30
Dentro de las 26 12 2.17
Muestras
Total 36 14

Conclusión: No existe suficiente evidencia para rechazar la hipótesis nula H 0.

La lógica detrás de ANOVA: Primero, intentemos explicar la lógica y después ilustrarla con
un ejemplo simple. En la ejecución de la prueba de ANOVA, estamos intentando
determinar si un cierto número de medias poblacionales son iguales. Para hacer esto,
medimos la diferencia de las medias muestrales y las comparamos con la variabilidad
dentro de las observaciones de la muestra. Esta es la razón del porqué la prueba
estadística es el cociente de la variación entre muestra (VEM) y de la variación dentro-
muestra (VDM). Si este cociente está cerca de 1, existe evidencia de que las medias
poblacionales son iguales.

Esta es un buen uso para usted: Mucha gente cree que en el mundo de los negocios, los
hombres perciben mejor salario que las mujeres, simplemente por ser del género
masculinos. Para justificar o rechazar tal proposición, se podría mirar la variación dentro de
cada grupo (un grupo que es el salario percibido por las mujeres y el otro grupo el
percibido por hombres) y compararlos con la variación entre las medias de las muestras
aleatoriamente seleccionadas de cada población. Si la variación en los salarios de las
mujeres es mucho mayor que la variación entre la media de los salarios de los hombres y

3
de las mujeres, uno podría decir que porque la variación es muy grande dentro del grupo
de las mujeres, esto podría no ser un problema relacionado al género.

Ahora, volviendo a nuestro ejemplo numérico del tratamiento de la droga para


incrementar la memoria contra el placebo. Notamos que: dada la conclusión de la
prueba y las condiciones de la prueba ANOVA, podemos concluir que estas tres
poblaciones son de hecho, la misma población. Por lo tanto, la técnica de ANOVA se
podría utilizar como una herramienta de medición de rutina estadística para el control de
calidad, según lo descrito a continuación con ejemplo numérico.

Construcción del Cuadro de Control para las Medias de la Muestra: Bajo la hipótesis nula,
el ANOVA concluye que µ1 = µ2 = µ3; es decir, tenemos una “población familiar
hipotética.” La pregunta es, ¿cuál es su varianza? La varianza estimada (es decir, los
cuadrados de las medias totales) es 36/14 = 2,57. De esta forma, la desviación estándar
estimada es = 1,60 y la desviación estándar estimada para las medias es 1,6/ 5 ½ = 0,71.
Bajo las condiciones de ANOVA, podemos construir un cuadro de control con los límites
de cuidado = 3 ± 2(0,71); Los límites de acción = 3± 3(0,71). La figura siguiente representa el
cuadro de control.

III. Bibliografía

 Razonamiento Estadístico para Decisiones Gerenciales.


http://home.ubalt.edu/ntsbarsh/Business-stat/opre504S.htm#rreganovachi
 Webster Allen. Estadística aplicada a los negocios y la economía. McGraw Hill.
Colombia
 Anderson, Sweeney, William. Estadística para Administración y Economía.
Octava Edición.
 Levin & Rovin. Estadística para administradores. Prentice Hall. México. 1996.
 Mendenhall / Reinmuth. Estadística para administración y economía. Grupo
Editorial Iberoamericana. 3ª. Edición.
 Spiegel, Murray. Estadística. Editorial McGraw Hill. Serie Schaum. Segunda
Edición. 1994.
 Pérez López, César. Estadística aplicada a través de Excel. 2ª. Ed. Prentice
Hall. 2002.
 http://sites.google.com/site/estadisticaperu/ejercicios-propuestos

Вам также может понравиться