Вы находитесь на странице: 1из 19

ANOVA

• ANOVA: Análisis de Varianza.

Los modelos ANOVA se utilizan para evaluar la significancia estadística de la relación entre una
variable dependiente cuantitativa y una(s) variable(s) independiente(s) cualitativa(s) . Se emplea
para comparar las diferencias entre los valores medios de dos o más grupos.
ANOVA

• Ejemplo: ANOVA

• Datos sobre salarios (USD) de los maestros de escuelas públicas en 50 estados y el distrito de
Columbia para los años 2006-2006. Las 51 áreas se clasifican en 3 regiones geográficas:

o Noreste y nor-centro (21 estados)


o Sur (17 estados)
o Oeste (13 estados)

• ¿El salario promedio anual de los maestros difiere en las 3 áreas geográficas de Estados
Unidos?

o ¿cuál es el promedio para cada área?


ANOVA

• ¿son las diferencias estadísticamente significativas?

• salario = 0 + 1norec + 2sur + ui

o E(salario | norec=1, sur=0) = 0 + 1


o E(salario | norec=0, sur=1) = 0 + 2
o E(salario | norec=0, sur=0) = 0

• Interpretación coeficientes:

o Categoría base, de comparación, de control, de referencia u omitida: todos son sinónimos.


o Categoría base  el grupo contra el que se hacen las comparaciones.
o Categoría base  quién adopta el valor 0 dentro de la variable.

• Interpretación coeficientes: las variables binarias simplemente señalan las diferencias, si existen,
pero no indican las razones por las que se presentan.
Trampa de la variable binaria

• ¿Por qué utilizar sólo norec y sur como binarias en el modelo del ejemplo anterior (salario = 0 +
1norec + 2sur + ui ) en lugar de incluir norec, sur y oeste (salario = 0 + 1norec + 2sur +
3oeste + ui )?

R:/ para no generar colinealidad perfecta.

• Colinealidad perfecta  Trampa de la variable binaria (norec+ sur + oeste = 1  son una
combinación lineal)

o salario = 0 + 1norec + 2sur + ui


o salario = 1norec + 2sur + 3oeste + ui

• ¿Cuáles la diferencia entre los modelos?


ANOVA

• Ejemplo: ANOVA

• Datos sobre salarios por hora (USD) para una muestra de 528 personas tomada en 1985.

• salario = 0 + 1casado + 2sur + ui

• ¿Cuál o quién es la categoría base?

• ¿Los salarios promedio por hora son estadísticamente distintos en comparación con la categoría
base?
ANCOVA

• ANCOVA: Análisis de Covarianza.

Los modelos ANCOVA se utilizan para evaluar la significancia estadística de la relación entre
una variable dependiente cuantitativa y una(s) variable(s) independiente(s) cualitativa(s)
incluyendo el control de regresoras cuantitativas (covariantes). Se emplea para comparar las
diferencias entre los valores medios de dos o más grupos.
ANCOVA

• Ejemplo: ANCOVA

• ¿Existen determinantes para el salario de los maestros distintos al área de presencia?

• salario = 0 + 1norec + 2sur + 3gasto + ui

Fuente: Gujarati (2003)


ANCOVA

• En el ejemplo anterior se muestran 3 líneas de regresión (una para cada región). Sin embargo,
estadísticamente, las tres líneas son las mismas. ¿por qué?
Estabilidad estructural

• Cuando se utiliza información de series de tiempo en un modelo de regresión, tal vez pueda
existir un cambio estructural (“punto de quiebre”) entre la variable dependiente y las
regresoras.

• Un cambio estructural significa que los valores de los coeficientes del modelo no
permanecen constantes a lo largo del período de estudio.

• Los cambios estructurales pueden generarse por fuerzas externas o cambios en políticas,
por ejemplo.

Fuente: Gujarati (2003)


Estabilidad estructural

• La prueba de Chow es una prueba formal para la identificación de cambios estructurales en


un modelo de regresión.

• Variable dicótoma  alternativa a la prueba de Chow.

• La prueba de Chow indica sólo si dos o más regresiones son distintas pero no el origen de la
diferencia.
Estabilidad estructural

(a) Regresiones coincidentes

(b) Regresiones paralelas

(c) Regresiones concurrentes

(d) Regresiones disímiles

Fuente: Gujarati (2003)


Estabilidad estructural

• Si existen diferencias, éstas pueden notarse si se agrupan todas las observaciones en una
sola regresión múltiple:

donde Dt es una dummy que identifica los dos grupos a comparar (por ejemplo, 1 para
observaciones entre 1982-1995 y 0 para observaciones entre 1970-1981)

• Asumiendo E(ui)=0 y homocedasticidad (20 = 21 = 2) se tiene que:

• 2: intercepto diferencial


• 2: pendiente diferencial
Estabilidad estructural

• Ejemplo: CHOW

• Diferencias estructurales en la regresión ahorro-ingreso para Estados Unidos:

• Yt: ahorro (miles de millones de USD)


• Xt: ingreso (miles de millones de USD)
• Dt: 1: 1982-1995, 0: 1970-1981
Estabilidad estructural

• Ventajas:

o Sólo es necesaria una regresión


o Se pueden probar diversas hipótesis respecto a la significancia de los parámetros
(intercepto y pendiente)
o Al realizarse una única regresión, se incluyen todas las observaciones aumentando los
grados de libertad, favoreciendo la precisión relativa de los parámetros estimados.

• Advertencia: Debe tenerse en cuenta que cada inclusión de una variable dicótoma consume un
grado de libertad.
Interacción de variables binarias

donde:

Y: salario por hora (USD)


X: años de escolaridad
D2: 1 si es mujer
D3: 1 si es no blanco
• En el modelo anterior, genero y raza son variables cualitativas y escolaridad cuantitativa
(ANCOVA)

• El modelo supone que el efecto que tienen tanto género como raza son constantes e
independientes de la categoría de la otra cualitativa. Es decir, el efecto sobre el salario del
atributo ser mujer es el mismo independientemente de la raza y el efecto de la raza sobre el
salario es el mismo independientemente del género.
Interacción de variables binarias

• En muchas situaciones, el anterior supuesto no es realista. Tal vez exista interacción entre las
cualitativas (género y raza en el ejemplo). El efecto sobre la media no sólo es aditivo (1) sino
también multiplicativo (2):

(1)

(2)
Interacción de variables binarias

• Ejemplo: interaccion

• Ingreso promedio por hora en comparación con la escolaridad, el género y la raza:

o Y: ingreso promedio por hora (USD)


o X: escolaridad (año)
o D2: 1: si es mujer
o D3: 1 si es no blanco

• .

• .
Referencias

• Guajarati, D. (2003). Basic Econometrics, Fourth Edition, McGraw-Hill, USA.

• Guajarati, D. (2010). Econometría, 5ª edición, McGraw-Hill, México.

• Wooldridge, J. (2010). Introducción a la econometría. Un enfoque moderno, 4ª edición,


Cengage Learning, México.
Julián Meléndez
Gerente de Producto Cuantitativo
julian.melendez@SOFTWARE-shop.com

Вам также может понравиться