Вы находитесь на странице: 1из 34

Econometria de

Datos en Paneles
Walter Sosa Escudero
(wsosa@udesa.edu.ar)
Universidad de San Andres y UNLP

Econometria de Datos en Paneles


Walter Sosa Escudero

Introduccion

Datos en paneles
Una base de datos en panel contiene informacion
para varios individuos (empresas, paises, etc.) en
el tiempo.
El aspecto fundamental es esta bidimensionalidad
de los datos.
Ejemplos: PSID: 6500 familias desde 1968.
La EPH tiene una estructura de panel rotativo.

Econometria de Datos en Paneles.

Ventajas de usar datos en


panel
Con N individuos y T periodos podriamos estimar
N modelos de series de tiempo y T modelos de
corte transversal.
Las ventajas de disponer de un panel tiene que
ver con la posibilidad de agregar (pool) esta
informacin de alguna manera.
Ej: yit=xit +uit
Supone que el modelo lineal subyacente es el
mismo para todos los individuos y periodos.

Econometria de Datos en Paneles.

Ventajas
Mayor informacion sobre un mismo parametro.
Mayor eficiencia.
Control de "heterogeneidades no-observables":
Ej. (Cronwell y Trumbull)
y=g(E,I)
y=crimen, E=variables economicas,I=variables de
justicia criminal
En la estimacion de corte transversal I resulta ser
muy importante.
Critica: I esta muy correlacionada con factores
regionales que influyen sobre el crimen (problema de
omision de variables.
Un panel de datos permite controlar por estos efectos
omitidos.

Econometria de Datos en Paneles.

Ventajas
Explorar efectos dinmicos:
Ej: (Ben-Porath, 1973)La tasa de desempleo de
los ultimos dos aos ronda el 18%. Son
siempre los mismos individuos o van rotando?

Permite eliminar sesgos por agregacion.


Varias ms (Baltagi, 2002)

Econometria de Datos en Paneles.

Limitaciones
No siempre es posible agregar informacion
temporal y de corte transversal (pueden ser ms
observaciones pero de poblaciones
heterogeneas).
Los paneles son costosos de implementar y
administrar.
Problemas de selectividad: auto-seleccion, no
respuesta, "attrition".
Dimension temporal corta

Econometria de Datos en Paneles.

Econometria de Datos en Paneles


Walter Sosa Escudero

El Modelo Bsico de
Componente de Errores

Especificacion
El modelo basico es:

xit vector de K variables explicativas (incluye una


constante). es un vector de coeficientes
El termino de error incluye dos componentes, uno
especifico del individuo y otro de la observacion

Econometria de Datos en Paneles.

Caso ms simple: i = 0
Supongamos adicionalmente, que it satisface
todos los supuestos clasicos:

En este caso, el estimador de MCO es MELI


La estructura de panel no agrega informacion
Econometria de Datos en Paneles.

El estimador MCO de es:

en donde X es una matriz NT x K con las


observaciones de todas las variables
explicativas para todos los individuos, Y se
define en forma similar

Econometria de Datos en Paneles.

Modelo de efectos fijos


Corresponde a:
en donde i es un
numero fijo para cada
individuo.
Equivale a N modelos
de regresion, uno
para cada invididuo,
misma pendiente, y
un intercepto
especifico para cada
individuo

1+
1

1+
1+
2
3

Econometria de Datos en Paneles.

Estimacion del modelo de EF

Si satisface todos los supuestos clasicos, el


estimador MELI de y i es el estimador MCO
incorporando N-1 variables binarias.
(una por individuo menos una. Porque?).
En terminos matriciales:

en donde Z es una matriz NT x (K+(N-1)) con


todas las K variables explicativas (X) y las N-1
dummies
Econometria de Datos en Paneles.

Problema: Z es una matriz muy grande para


invertir.
Truco: transformar el modelo para eliminar los i
Comencemos con:
(1)
tomando promedios por individuo:
(2)
restando (1) (2):
(3)
Es facil mostrar que el estimador MCO de en (3)
es exactamente igual al estimador MCO de en
el modelo con variables binarias.
(3) es llamado modelo within.

Econometria de Datos en Paneles.

Estimacion de la matriz de varianzas.


Inferencia
Bajo el supuesto de normalidad de los eit, la
teoria estandar bsica de inferencia para MCO
funciona Ok (tests t, F, etc.).
En general, los paquetes estandarizados
(Stata, etc.) calculan correctamente las
varianzas (hay que tener cuidado con los
grados de libertad si uno lo hace a mano).
La teoria asintotica de MCO tambien funciona
en forma estandar (tests basados en
resultados de normalidad asintotica).
Econometria de Datos en Paneles.

Propiedades del estimador de EF


El estimador de es consistente cuando N o T
tienden a infinito.
El estimador de NO es consistente (el
numero de parametros aumenta con N)

Econometria de Datos en Paneles.

Modelo de efectos
aleatorios
Corresponde a:

en donde i es una variable aleatoria para cada


individuo.
i forma parte del termino de error, que ahora
tiene dos componentes uno especifico del
individuo y otro de la observacin.

Econometria de Datos en Paneles.

Recordatorio MCG y MGCF

Consideremos:
Y=X +u
Valen todos los
supuestos clasicos, salvo
que:
V(u) = ,
simetrica y positiva
definida (permite
autocorrelacion y
heterocedasticidad).

Teorema (Aitken): El
MELI de es:

Alternativamente:

con X*=PX
y P satisface PP=-1.

Econometria de Datos en Paneles.

MCG Factibles
MCG requiere conocer , en muchos casos esto no
es factible.

es un estimador consistente de , una version


Si
factible del estimador es:
No es MELI, es asintoticamente equivalente a
MCG.
La estrategia es estimar y luego computar el
MCGF
Econometria de Datos en Paneles.

Especificacion del modelo de EA

Econometria de Datos en Paneles.

En terminos matriciales:
Y = X + u
con E(u)= 0, y V(u)=.
es una matriz NT x NT con elemento
caracteristico:

O sea que no es un escalar por la identidad.


Por construccion, el modelo de EA tiene
autocorrelacion.
El MELI de es el estimador MCG.

Econometria de Datos en Paneles.

Estimacion del modelo de EA


Se puede mostrar que el estimador MCG de es
identico al estimador de MCO en:

Con

El estimador de MCGF reemplaza las varianzas por


estimaciones consistentes de las mismas.

Econometria de Datos en Paneles.

Estimacion de varianzas
Resultado: Si Y=X+u, y se cumplen todos los
supuestos clasicos, S2=ee/(n-K) estima
consistentemente a V(ui)=2, e = vector de
residuos de estimar por MCO.
Swamy-Arora: Dos modelos de regresion:
(Within)
(Between)
Econometria de Datos en Paneles.

Se puede mostrar que:

S2W y S2B son estimaciones consistentes de la


varianza del error de los modelos (W) y (B).
Las estimaciones consistentes de las varianzas se
obtienen resolviendo el sistema de ecuaciones.
Hay varios metodos de estimacion de varianzas

Econometria de Datos en Paneles.

Estimacion de la matriz de varianza de .


Inferencia.
Bajo el supuesto de normalidad de los eit, la teoria
estandar bsica de inferencia para MCGF funciona
Ok (tests t, F, etc.).
En general, los paquetes estandarizados (Stata,
etc.) calculan correctamente las varianzas (hay
que tener cuidado con los grados de libertad si
uno lo hace a mano).
La teoria asintotica de MCG tambien funciona en
forma estandar (tests basados en resultados de
normalidad asintotica).

Econometria de Datos en Paneles.

Estimacion del modelo de EA (resumen)


1.
2.
3.

Estimar las varianzas corriendo los modelos (W)


y (B). Computar .
Computar las "cuasidiferencias"
y
Estimar por MCO usando las cuasidiferencias.

Econometria de Datos en Paneles.

Relaciones entre modelos


Dos estimadores alternativos
Estimacion MCO
Si el verdadero modelo es EA, MCO es ineficiente
(porque?). Si el verdadero modelo es EF, MCO es
potencialmente sesgado e inconsistente (porque?).
Estimacion Between
Si el verdadero modelo es EA, (B) es ineficiente
(porque?). Si el verdadero modelo es EF, (B) es
potencialmente sesgado e inconsistente.

Econometria de Datos en Paneles.

Variables que varian solo por individuos.


Consideremos el modelo

zi = vector observable de variables que varian solo por


individuos (ej, tamao de una provincia). No
correlacionada con ni .
El estimador de EF no puede identificar . Porque?
El estimador de EA si puede identificar . Porque?
Que pasa con Between y MCO?

Econometria de Datos en Paneles.

X correlacionada con .

Resultado muy importante


El estimador de EA es inconsistente
(porque?).
El estimador de EF sigue siendo
consistente.
Between y MCO son inconsistentes.

Econometria de Datos en Paneles.

Efectos fijos o aleatorios?

Pregunta muy complicada


No confundir modelos (DGP's) con estimadores.
Algunos creen que es una cuestion de tratamiento.
Otros, de seleccion de modelos (Hsiao)
EF es valido (no necesariamente optimo) aun
cuando X esta correlacionado con .
EA tiende a ser mas eficiente cuando X esta
correlacionado con .
Estas reglas "eliminan" estimadores, pero no
necesariamente sugieren cual usar.

Econometria de Datos en Paneles.

Ejemplo empirico
Disparidades regionales en el desampleo
Fuente: Galiani, Porto, Lamarche y Sosa Escudero
(2003).
Cuestion: fuertes disparidades regionales con
desempleo cambiante.
Informacion: panel de provincias argentinas, 11
aos.
Variable explicada: tasa de desempleo regional para
cada periodo
Variables explicativas: pbgm (producto regional),
shockp (desvios de la tendencia en el producto),
uprom (desempleo promedio), rpf, amen (indicador
de "amenities).

Econometria de Datos en Paneles.

Estimacion de efectos
fijos
Test F de
significatividad
conjunta
Stata NO
muestra las
estimaciones de
los efectos fijos!

EF no puede estimar
el coeficiente de
amenities

Test de Efectos
Fijos

Econometria de Datos en Paneles.

Estimacion de efectos
aleatorios

Test de
Efectos
Aleatorios

RE puede estimar
el coeficiente de
amenities

Componentes
de varianzas

Econometria de Datos en Paneles.

Test de Hausman

Las diferencias
entre EF y RE son
significativas

Econometria de Datos en Paneles.

Вам также может понравиться