Вы находитесь на странице: 1из 208

Econometría

Econometría
Universidad Nacional de Ingenieria
Setiembre 2013

1
Econometría

Econometría es la ciencia que aplica métodos matemáticos y estadísticos al


análisis de datos económicos, con el objetivo de dotar de una base empírica a una
teoría económica, para así refutarla o verificarla.

"La experiencia ha mostrado que cada uno de estos tres puntos de vista, el de la
estadística, la teoría económica y las matemáticas, es necesario, pero por si
mismo no suficiente para una comprensión real de las relaciones cuantitativas
de la vida económica modera. Es la unión de los tres aspectos lo que constituye
una herramienta de análisis potente. Es la unión lo que constituye la
econometría".

2
Econometría

3
Econometría

Análisis de Regresión

¿Qué es una regresión?

Relaciones estadísticas versus relaciones determinísticas

4
Econometría

Análisis de Regresión
Regresión versus Causalidad
La regresión es una relación estadística, que no implica causalidad apriori.
Regresión versus Correlación

El Análisis de Correlación está estrechamente relacionado con el de regresión aunque


conceptualmente son dos cosas muy diferentes.

5
Econometría

Análisis de Regresión

6
Econometría

Algunas precauciones con el coeficiente de correlación:

•Cuidado cuando el grado de correlación muestral depende de solo unas pocas observaciones.
•El coeficiente de correlación mide una relación lineal. Por lo tanto, una variable puede
depender de otra aún cuando la correlación sea cero si la relación es no lineal.
•Correlación no implica causalidad económica, es sólo una relación estadística.
•Correlación puede indicar relación espuria.
•No olvidar que la correlación muestral es una variable aleatoria y que por lo tanto, el
coeficiente por si sólo no garantiza la existencia de una relación estadística entre las series.

7
Econometría

La unión de los valores esperados condicionales representa la Recta de regresión poblacional,


donde el término poblacional se refiere a que estamos trabajando con el total de la población.

8
Econometría

Definición: La curva de regresión poblacional es simplemente el lugar geométrico de las


medias condicionales de la variable dependiente para los valores fijos de las variables
explicativas.

9
Econometría

Función de regresión poblacional (FRP)

Especificación estocástica de la función de regresión poblacional

10
Econometría

11
Econometría

Función de regresión muestral

Población

Muestra

12
Econometría

Función de regresión muestral

Población

Muestra

13
Econometría

Definición: Un estimador es una regla, fórmula o método que dice cómo determinar el
parámetro poblacional a partir de la información suministrada por la muestra disponible.

14
Econometría

15
Econometría
Propiedades de un Estimador

16
Econometría
Propiedades de un Estimador

17
Econometría
Propiedades de un Estimador

18
Econometría

19
Econometría

20
Econometría

21
Econometría

Modelo de regresión con dos variables

Método de Mínimos Cuadrados Ordinarios

22
Econometría

23
Econometría

ecuaciones normales

24
Econometría

25
Econometría

26
Econometría

27
Econometría

28
Econometría

Supuestos detrás del método MCO:

29
Econometría

30
Econometría

31
Econometría

32
Econometría

33
Econometría

34
Econometría

Modelo con “k” variables

El modelo de regresión profesional tomaría la siguiente forma:

Representación matricial

35
Econometría

Ahora debemos expresar la distribución del término de error en términos matriciales:

De los supuestos 3, 4 y 5, tenemos entonces que el término de error tiene la siguiente


distribución:

36
Econometría

Estimador Mínimo Cuadrados Ordinarios


El método de MCO, plantea que los parámetros del modelo pueden ser estimados
minimizando la suma de los errores al cuadrado:

Donde:
Entonces el problema de minimizar la suma de los errores al cuadrado se expresa de
la siguiente forma:

37
Econometría

Condición de ortogonalidad:

De esta forma, el vector de parámetros estimados de se obtiene de resolver el


siguiente sistema de ecuaciones normales:

38
Econometría

39
Econometría

Es importante recordar que el estimador MCO esta definido solo cuando la matriz (X’X)
es invertible, lo que ocurre siempre y cuando:

1. Las k columnas de la matriz X sean linealmente independientes.


2. Se disponga al menos de tantas observaciones como variables
explicativas, es decir: n¸ k.(Supuesto 7)

Pongamos atención en el segundo supuesto, cuando n=k

Sin embargo, esta no es una característica deseable, el ajuste perfecto ocurre porque tenemos
una muestra muy reducida. Esto trae como consecuencia poco robustez e imprecisión en las
estimaciones.

40
Econometría

Para lograr estimaciones precisas de los parámetros, es necesario tener un número de


observaciones notablemente superior al de las variables explicativas. La diferencia n-k se conoce
como el número de grados de libertad de la estimación.

Propiedades del estimador MCO


Media del estimador:

El estimador de MCO es insesgado


El error de estimación o sesgo se define como:

41
Econometría

Varianza del estimador:

Para poder estimar la varianza de necesitamos reemplazar por su estimador


insesgado

42
Econometría

Propiedad de mejor estimador lineal insesgado


Se dice que , es el mejor estimador lineal insesgado (MELI) de si se cumple
lo siguiente:
1. El lineal, es decir, es una función lineal de una variable aleatoria, como la variable y
en el modelo de regresión.
2. Es insesgado, es decir, su valor esperado, es igual a el verdadero valor,
3. Tiene varianza mínima dentro de la clase de todos los estimadores lineales
insesgados; un estimador insesgado como varianza mínima es conocido como un
estimador eficiente.
Teorema de Gauss-Markov
Proposición: El estimador MCO es el estimador lineal insesgado óptimo, en el sentido
de que cualquier otro estimador lineal e insesgado tiene una matriz de covarianza
mayor que la del estimador MCO. Es decir, el estimador MCO es MELI.

43
Econometría

Aplicando esperanza a la expresión anterior:

El estimador será insesgado solo si la matriz A es tal que . De esta forma:

44
Econometría

Bondad de Ajuste y Análisis de Varianza


Modelo de Regresión Lineal en Desvíos

Sea el modelo poblacional usual con k variables:

donde i = 1 : n y cuya contraparte estimada es:

Luego, si sumamos para todas las observaciones y dividimos a ambos lados por el tamaño
muestral n, tenemos:

45
Econometría

La expresión es similar a la anterior, excepto por dos importantes diferencias.


Primero, el modelo no posee constante y segundo, las variables se encuentran
expresadas en desvíos con respecto a la media. A pesar de ello, note que los
coeficientes y los residuos son los mismos en ambos modelos.
El término constante no es más que una corrección que garantiza que los promedios
muestrales de ambos miembros del modelo econométrico coincidan.
Para transformar en desvíos con respecto a la media un modelo en términos matriciales,
introduciremos una matriz fundamental para el análisis de esta sección. Denotaremos
por M0 una matriz de n x n, definida como:

46
Econometría

donde I es la identidad (nxn) e i corresponde al vector unitario de dimensión n. Dicha


matriz es singular, simétrica (M0’=M0) e idempotente (M0M0=M0).
M0 es conocida como matriz de desvíos, ya que resta a cada columna de la matriz
involucrada, su media aritmética

Por lo tanto, nuestro modelo expresado en matrices, puede ser expresado en términos
de desvío con respecto a la media como:

47
Econometría

Análisis de Varianza
Suponga entonces el siguiente modelo poblacional:

Donde Y corresponde a una vector n x 1, X corresponde a nuestra matriz de regresores


que incluye un término constante, tal que X es de nxk y u corresponde al vector de
errores de nx1.

Sea TSS: Suma de los cuadrados totales

48
Econometría
con lo cual, al particionar nuestra matriz X en , nuestro vector de parámetros
en y considerando que 0 y que , tenemos que:

La igualdad anterior es conocida como la descomposición de varianza. El término de la


izquierda corresponde a TSS o la suma de los cuadrados de las desviaciones de
la variable dependiente.

49
Econometría

Bondad de Ajuste:

Definimos entonces la bondad de ajuste del modelo a través del siguiente estadígrafo
llamado también coeficiente de determinación:

es decir, como la proporción de la varianza de Y que es explicada por la varianza


de la regresión. Alternativamente:

50
Econometría

Note que:
1. El coeficiente de determinación es siempre menor a 1. Ello porque RSS <=TSS y por lo tanto
RSS/TSS <= 1.

2. El análisis de varianza anterior fue derivado bajo el supuesto que el modelo incluía una
constante (por ello utilizábamos la matriz M0). En dicho caso, necesariamente R2>= 0. En caso
de que el modelo no incluya una constante, se debe utilizar la fórmula utilizando TSS=Y’Y (sin
desvíos).

3. Al agregar regresores al modelo, el R2 nunca decrecerá (se mantendrá constante o


aumentará)

4. No es claro cuan bueno sea como predictor de ajuste.

Para ver este último punto, suponga que usted posee el siguiente modelo poblacional:

51
Econometría

donde X es un vector (n x1). Suponga ahora que restamos X a ambos lados de


nuestro modelo. Obtenemos entonces:

Si , entonces es fácil verificar que el R2 del primer modelo será cercano a 1,


mientras que el del segundo será cercano a cero, a pesar de que los modelos son
matemáticamente equivalentes. A pesar de lo anterior, en trabajos aplicados, el R2 es
ampliamente utilizado, por lo cual se recomienda su publicación.

52
Econometría

Inferencia

53
Econometría
Sean entonces las siguientes hipótesis:
1. H0: βi = 0 Plantea que el regresor Xi no posee influencia alguna sobre Y.
Este es el test más común y nos referiremos a él como test de significancia.

2. H0: βi = βi0 Plantea que el regresor Xi posee un impacto determinado por Xi0
sobre Y.

3. H0: βi + βj =1 Plantea que la suma de los regresores Xi y Xj poseen un impacto


conjunto de magnitud 1.

4. H0: βi = βj Plantea que los regresores Xi y Xj poseen el mismo impacto sobre Y.

5. H0: βi =0 ; i=2: : : k ) Plantea que todos los regresores conjuntamente, excepto


la constante, son cero.

6. H0: βl =0 donde el vector β ha sido particionado en dos (βl y βp ) con


dimensiones (kl x 1) y (kp x 1) respectivamente, tal que kl + kp = k. Plantea
entonces que un subconjunto de parámetros son estadísticamente no
significativos.

54
Econometría

Todas las hipótesis anteriores pueden ser resumidas en la siguiente expresión:

donde R es una matriz de (qxk) constantes conocidas (ceros o unos), cuyo objetivo será
seleccionar los parámetros a testear, cuyo número de filas, q, representa el número de
restricciones. A su vez, r es un vector de dimensión q y contiene el real al cual es
restringido cada parámetro. Veamos como serán las matrices R y r en cada una de
nuestras hipótesis:

55
Econometría

Entonces, nuestra hipótesis nula corresponde a:

Con lo cual, sólo nos resta derivar el test que nos permita rechazar o no rechazar
nuestra nula. La construcción del estadígrafo es como sigue.

Esperanza

Varianza

56
Econometría

y si la nula Rβ = r es cierta:

luego estandarizamos, con lo cual:

57
Econometría

Además, se puede demostrar que

Luego, se puede demostrar que

Luego, combinando los dos resultados anteriores, se puede demostrar que

58
Econometría

El test expuesto corresponde a la forma general del test F. Dicho test es de utilidad
para testear cualquier hipótesis.

Test t (Una hipótesis lineal)

Reescribiendo el test F como:

59
Econometría

Recordando que t2 es una caso particular de una F con un grado de libertad en


el numerador, tenemos que:

60
Econometría

La distribución t es simétrica y se aproxima a la normal para tamaños de muestras


grandes, sin embargo, la t posee colas más gruesas que la normal (lo cual es más
pronunciado en muestras pequeñas: n<=30). La siguiente figura expone la relación
entre la distribución t y la normal:

61
Econometría

Nota precautoria:

Toda la derivación anterior se basa en el estricto supuesto de normalidad de los


errores. En caso de que los mismos no distribuyan normal, la distribución del
test F (y por lo tanto el del t) es desconocida en muestras finitas. Sin embargo,
es posible demostrar que es decir, que el test t distribuye
asintóticamente normal. Luego, los valores críticos de t y (normal estándar)
se encuentran sumamente cerca si n-k¸30, por lo cual, en términos prácticos no
importa mucho cual de ellas escojamos para los valores críticos (a menos que la
muestra sea especialmente pequeña).

Criterio de Rechazo y Nivel de Confianza

Una vez que hemos calculado el valor del test para nuestra nula particular (o valor
calculado), resta calcular el valor crítico o el valor que nos indica la tabla t.

62
Econometría

Dicho valor crítico nos dirá si nuestra nula es falsa o si no podemos afirmar que lo es.
La elección de dicho valor crítico se toma desde la tabla de distribución t y el número
debe ser escogido tomado en cuenta el nivel de significancia escogido (1 %, 5% o 10
%), el cual a su vez determina el nivel de confianza del test (99 %, 95% o 90 %,
respectivamente).

El nivel de confianza posee una explicación intuitiva: Nuestro estadígrafo es función de la


muestra con lo que estamos trabajando, por lo cual, si contáramos con una gran número
de ellas y con cada una pudiésemos calcular nuestro estadígrafo, el nivel de confianza
indica el porcentaje de veces que calculamos nuestro estadígrafo en que realmente no
rechazamos lo cierto o rechazamos correctamente lo falso.

La forma en que se distribuya la probabilidad de rechazo, es decir, el nivel de


significancia, depende de nuestra hipótesis alternativa.

63
Econometría

Test de una cola


Supongamos que nuestra hipótesis es:

donde . En dicho caso, el estadígrafo es calculado según lo propuesto


en la sección anterior. El punto está en como acumulamos la probabilidad de
rechazo. En este caso, el total de la probabilidad de rechazo se acumula en la
cola derecha de la distribución
¿Por qué en la cola derecha? Porque la probabilidad de rechazo, es decir, el nivel
de significancia, nos indica hasta donde puedo tolerar un valor mayor a , por
lo cual, carecería de sentido que la zona de rechazo se encuentre en la cola
izquierda de la distribución. Por ejemplo, si , la distribución de nuestro
estadígrafo se centra en cero (vea la fórmula), por lo cual la hipótesis alternativa
correspondería a que el parámetro es positivo. el punto es ¿cuán positivo puedo
aceptar que sea?.

64
Econometría

Rechazaremos nuestra hipótesis nula de que el coeficiente es cero contra la hipótesis


alternativa que el parámetro es mayor que , si el valor calculado del test es mayor al
valor crítico de la tabla t. En el caso que H1 sea que el parámetro es menor a , entonces
la probabilidad de rechazo se concentra en la cola izquierda y se rechaza la nula en el caso
que el valor calculado sea menor que el valor crítico de la tabla t.

65
Econometría

Test de dos colas

Supongamos que nuestra hipótesis es:

En este caso estamos repartiendo uniformemente la probabilidad de rechazo en ambas


colas de la distribución como lo muestra la siguiente figura (al 95% de confianza):

66
Econometría

Error de Tipo I, Error de Tipo II, Tamaño y Potencia de un test

1. Error de Tipo I (ETI): Corresponde a la probabilidad de rechazar la nula


cuando es cierta.
2. Error de Tipo II (ETII): Corresponde a la probabilidad de aceptar la nula
cuando es falsa.
3. Tamaño del Test: Corresponde la probabilidad de cometer ETI. Se define
como el nivel de significancia del test (α).
4. Potencia del Test: Corresponde a la probabilidad de rechazar la nula cuando
es falsa. Se define como Potencia =1-ETII.

El óptimo para el investigador sería minimizar ambos tipos de errores y tener un test
con un menor tamaño y mayor potencia posibles, sin embargo, note que el tamaño del
test y por lo tanto, el ETI, es una variable endógena al investigador, en tanto que él
decide con que nivel de confianza trabajar. Luego, el objetivo se transforma en, dado un
nivel de confianza, minimizar la ocurrencia de ETII. Intuitivamente, si usted escoge un
nivel de significancia pequeño (1 %, por ejemplo), sus zonas de rechazo serán
pequeñas, con lo cual, inevitablemente, la zona de no rechazo crece, lo cual implica que
por minimizar el ETI, ha aumentado el ETII.
67
Econometría

P-value

Otra forma alternativa al valor crítico de tabla para rechazar o no rechazar nuestra nula,
corresponde al uso de los llamados p-values, los cuales son reportados en cualquier
paquete estadístico. El p-value (p) se define como:

Es decir, el p-value representa la probabilidad de que el valor crítico (t de tabla, en


nuestro caso), sea mayor al valor t calculado, es decir, describe el nivel de significancia
exacto asociado a un resultado econométrico en particular. Por ejemplo, un p-value de
0.07 indica que un coeficiente es estadísticamente significativo en un nivel de 0.07 (o
con un 93% de confianza).

68
Econometría

Ejemplo:

Suponga el siguiente Modelo de Regresión lineal Simple:

69
Econometría

Primero veamos el ajuste de este modelo, es decir, en que grado la variable x explica a
la variable y, para lo cual calculemos el

Como podemos ver, el grado de ajuste del modelo es bastante bueno, como el modelo
incluye constante, el R2 se puede interpretar como la proporción de la variabilidad de la
variable independiente que es explicada por la variabilidad de la variable dependiente, la
que en este caso alcanza un 97 %.

Ahora veamos si estos parámetros estimados son significativos a un 95% de confianza,


para lo cual realizaremos un test t de significancia a cada uno de ellos:

70
Econometría

De esta forma, el valor calculado para el estadístico t es:

El valor de tabla del estadístico t


a un 95% de confianza y con dos
grados
de libertad es 4,303.
De esta forma, se rechaza la
hipótesis nula de que β1=0, y por
lo tanto el parámetro estimado
resulta ser estadísticamente
significativo.

71
Econometría

De esta forma, el valor calculado para el estadístico t es:

El valor de tabla del estadístico t a


un 95% de confianza y con dos
grados de libertad es 4,303.

De esta forma, se rechaza la


hipótesis nula de que β2=0, y por lo
tanto el parámetro estimado
resulta ser estadísticamente
significativo.

72
Econometría

De esta forma, se rechaza la hipótesis nula de que β2=0, y por lo tanto el


parámetro estimado resulta ser estadísticamente significativo.

Test F (Conjunto de hipótesis lineales)

Los casos 6. y 5. corresponden a un conjunto de hipótesis a testear. En el caso 5.


correspondía a un subconjunto particular de parámetros, mientras que el caso
6. correspondía a la nula de que todos ellos eran cero, menos la constante. En
dichos casos se aplica la fórmula del test F según la ecuación (2.63) y los
criterios de rechazo siguen lo expuesto en la sección anterior.

Sin embargo, en ambos casos podemos derivar expresiones alternativas para


nuestro test.
73
Econometría

Todas las pendientes del modelo son cero: En este caso, se puede demostrar que el
test F puede expresarse como:

Un subconjunto de las pendientes del modelo son cero: En este caso, se puede
demostrar que el test F puede expresarse como:

Donde denotan los residuos MCO restringidos (donde k2 representa el número de


regresores que han sido restringidos a cero), mientras que representan los
residuos del modelo MCO original.
74
Econometría

Intervalos de Confianza
Una forma alternativa (o mejor dicho complementaria) de examinar la significancia
estadística de un parámetro ( o un conjunto de ellos) es a través de intervalos de
confianza (IC). Ellos nos indican, dado un nivel de confianza, el rango de valores
admisibles del coeficiente que se estima. Los niveles de confianza generalmente
utilizados son 99 %, 95% y 90% (al igual que en los test de hipótesis), donde el tamaño
de los mismos es necesariamente decreciente.

Una manera natural de obtener el IC asociado a es a través del test t asociado.


Vimos entonces que él corresponde a:

75
Econometría

Entonces, si deseamos un IC del (1-α)% de confianza (es decir, de α% de significancia)


para el parámetro , basta obtener de las tablas de distribución el valor
correspondiente, es decir:

donde la tercera expresión se obtiene de despejar de la segunda. Note que el


intervalo ha sido construido en base a una distribución simétrica (como la t o la
normal), por lo cual el valor de tabla a escoger debe corresponder a .

76
Econometría

Note además que dicho intervalo está construido sólo en base a constantes conocidas.
Una vez construido, se puede contrastar la nula al nivel de significancia
sencillamente observando si pertenece al intervalo (en cuyo caso no rechazamos la
nula) o se encuentra fuera de él (en cuyo caso rechazamos la nula)10. Nuevamente, la
validez de dicho intervalo de confianza depende críticamente del supuesto de
distribución de los errores. En el caso que el valor se obtenga de la tabla t, como ya
sabemos, estamos suponiendo que los errores siguen una distribución normal. Un caso
más general es utilizar los valores críticos de la distribución normal estándar.

El intervalo de confianza para la varianza de los errores.

77
Econometría

78
Econometría
Test de normalidad
Consideramos ahora el problema de utilizar los momentos de los residuos MCO para
hacer inferencia sobre la distribución de los errores poblacionales. Dado que algunas
de las propiedades de MCO y de la inferencia dependen del supuesto de normalidad
en los errores, es importante poseer un contraste para dicho supuesto.

Como es sabido, la distribución normal es simétrica y mesocúrtica. La simetría implica


que el tercer momento poblacional E(u3) en torno a la media, es cero. El hecho que
sea mesocúrtica implica que la kurtosis es 3 (es decir, el ancho de las colas de la
distribución, el cual se mide utilizando el cuarto momento en torno a la media).
Recordemos entonces que el coeficiente de simetría poblacional se define como:

mientras que la kurtosis (o coeficiente de):

79
Econometría

En base a los anteriores, Bera y Jarke (1981), propusieron el siguiente estadígrafo,


construido bajo la nula de normalidad:

Donde los estimadores muestrales del coeficiente de asimetría y kurtosis se


obtienen al considerar que un estimador natural de:

80
Econometría

Note que el estadígrafo está definido en términos del exceso de kurtosis, por lo cual,
a menor sea el valor, menor es la probabilidad de rechazar la nula de normalidad.
Note además que el estadístico es esencialmente no constructivo, en términos de
que no nos indica que camino seguir en caso de rechazar la nula, además de que no
rechazar normalidad no implica confirmar su existencia. Sin embargo, en la práctica
corresponde al test más utilizado.

81
Econometría

Predicción
La predicción es una de las herramientas más atractivas y utilizadas en Econometría. Si el
modelo que hemos escogido confirma la teoría en consideración, es decir, ha sobrevivido a
las pruebas de hipótesis, podemos utilizar el modelo estimado para predecir. La
predicción se puede efectuar para un valor puntual de la variable dependiente, y0,
correspondiente a un valor dado de los regresores, x0, o predecir el valor esperado
condicional a las variables explicativas.

De esta forma, el error de predicción estará dado por :

En donde se distinguen dos fuentes del error de predicción

82
Econometría

83
Econometría

84
Econometría

Medición de la precisión de la predicción

Se han propuesto varias medidas para valorar la precisión de los modelos de


predicción. Muchas de estas medidas están para evaluar la predicción expost, es decir,
predicciones para las que las variables exógenas no tienen que ser predichas. Dos de
estas medidas que se basan en los residuos de la predicción, son la raíz cuadrada del
error cuadrado medio y el error absoluto medio.

85
Econometría

86
Econometría
Ejemplo:
Supongamos que un analista comercial está pensando en construir un edificio
comercial para luego vender. Sin embargo, no sabe cuales son las características que
debiera tener el edificio para maximizar su rentabilidad. Para descubrir esto el se
propone realizar un análisis de regresión.

El analista elige al azar una muestra de 11 edificios de oficinas de 1500 edificios


posibles. Estos datos los puede utilizar para emplear el análisis de regresión lineal
múltiple para estimar el valor de un edificio de oficinas en un área determinada
basándose en las siguientes variables.
Superficie
Superficie Antiguedad Valor
Antiguedad ValorEdificio
Edificio
Datos
Datos Oficinas Entradas
Oficinas Entradas
m2
m2 años
años US$
US$
11 2310
2310 2.0
2.0 2.0
2.0 20.0
20.0 142000
142000
22 2333
2333 2.0
2.0 2.0
2.0 12.0
12.0 144000
144000
33 2356
2356 3.0
3.0 1.5
1.5 33.0
33.0 151000
151000
44 2379
2379 3.0
3.0 2.0
2.0 43.0
43.0 150000
150000
55 2402
2402 2.0
2.0 3.0
3.0 53.0
53.0 139000
139000
66 2425
2425 4.0
4.0 2.0
2.0 23.0
23.0 169000
169000
77 2448
2448 2.0
2.0 1.5
1.5 99.0
99.0 126000
126000
88 2471
2471 2.0
2.0 2.0
2.0 34.0
34.0 142900
142900
99 2494
2494 3.0
3.0 3.0
3.0 23.0
23.0 163000
163000
1010 2517
2517 4.0
4.0 4.0
4.0 55.0
55.0 169000
169000
1111 2540
2540 2.0
2.0 3.0
3.0 22.0
22.0 149000
149000

87
Econometría

88
Econometría

A mayor número de metros cuadrados, entradas y cantidad de oficinas del edificio


mayor es el valor comercial de este. Además, mientras más años de construcción
menor es el valor del edificio. Todas las variables incluidas en el modelo son
estadísticamente significativas( lo cual se puede ver comparando los test calculados
con los de t de tabla, o viendo directamente el p-value) individualmente (Test t) y
conjuntamente(Test F). Un porcentaje importante de la varianza del precio es
explicada por la varianza de las variables explicativas, conclusión obtenida a partir
del alto R2 y R2 ajustado observado.

Las conclusiones obtenidas a partir de la inferencia realizada son válidas s i el


upuesto de normalidad de los errores se cumple. Para estudiar esto observemos el
comportamiento de los errores estimados y realicemos un Test de Normalidad
(Jarque- Bera).

89
Econometría

Podemos ver que la distribución de los errores no es del todo simétrica (Skewness =
1,2) y que tampoco presenta un comportamiento mesocurtico (Kurtosis = 3). Ambos
elementos se ven reflejados en el estadísitico Jarque - Bera, el cual cae en la zona de
rechazo (Ver además p -value).

90
Econometría

Con los parámetros estimados es posible realizar predicciones del valor de un edificio
particular condicional a sus características.

Por ejemplo podría calcular el valor tasado de un edificio de oficinas en la misma zona
con 2500 metros cuadrados, tres oficinas, dos entradas y una antiguedad de 25 años. Es
decir realizar predicciones fuera de la muestra.

PRECIO = 2553.21066*ENTRADAS + 12529.76817*OFICINAS + 27.64138737*SUPERFICIE -


234.2371645*ANTIGUEDAD + 52317.83051

= 158261.1

91
Econometría

92
Econometría

Incorporación de No Linealidades

Muchas de las relaciones económicas no son lineales. Veamos el siguiente ejemplo


de la relación entre las ventas de los portales de Internet y el número de visitas al
portal.

93
Econometría

Claramente la relación es no lineal. No es lo mismo en términos de ventas aumentar


desde 40 visitas a 50 que de 10 visitas a 20. Pero, ¿Cómo podemos incorporar no
linealidad entre Y y X en nuestro modelo de regresión?. Básicamente lo que haremos
es utilizar algunos tipos de transformación de variables. Esto nos permitirá tener un
modelo no lineal y a partir de la aplicación de las transformaciones tener un modelo de
regresión lineal para el que se cumplen todas las cosas que hemos visto.

94
Econometría

Test de No Linealidades Omitidas (Test de Reset)

Una pregunta interesante de plantearse es si nuestro modelo ha omitido no


linealidades en ciertos regresores. Ramsey (1969) introdujo el siguiente test. Bajo
la nula, el modelo poblacional corresponde a:

95
Econometría

96
Econometría

Variables Dummies o cualitativas

En el análisis de regresión, la variable dependiente esta influida frecuentemente o


solo por variables continuas como so el ingreso, producción, precios, costos, estatura,
temperatura, etc..., sino también por variables que son esencialmente cualitativas,
estos son regresores binarios, es decir, variables que sólo toman el valor 0 o 1. Dichas
variables son llamadas variables dummies, variables dicotómicas o variables ficticias.

Algunos ejemplos de variable dummies son: género, raza, religión, nacionalidad,


región geográfica, etc....Con respecto a las dos primeras variables mencionadas

Ejemplo:

Se ha encontrado que manteniendo todos los demás factores constantes, las


trabajadoras mujeres ganan menos que sus colegas hombres, y que las personas
de color ganan menos que las blancas. Este patrón puede resultar de
discriminación sexual o racial, pero cualquiera sea la razón, las variables
cualitativas tales como género o raza sí influyen sobre la variable dependiente.

97
Econometría

Por ejemplo, consideremos la siguiente variable dummy para género (mujer/hombre)


del individuo. Entonces la variable dummy consistirá en un vector (n x1) con
elementos 0 o 1 según corresponda. Es decir:

Entonces, dada la especificación escogida para la dummy, tenemos que:

98
Econometría

Alternativamente, podríamos haber definido la dummy de la siguiente forma:

y el modelo como

Entonces, en esta segunda especificación escogida para la dummy, tenemos


que:

Una tercera forma de definir el modelo sería incluyendo ambas dummies:

99
Econometría

Con el cual tendríamos que los retornos a ambos géneros serían:

Los tres modelos anteriores son equivalentes. Note que en el tercer modelo no
incluimos término constante ya que ello haría que la matriz X fuese singular y por lo
tanto, no invertible. Dicho error de especificación es llamado en la literatura Trampa
de las Dummies y corresponde a un error netamente del investigador, no de los datos.

Un modelo de regresión puede contener variables explicativas que son


exclusivamente dicotómicas o cualitativas, tales modelos se denominas Modelos de
análisis de varianza (ANOVA), estos modelos son utilizados para determinar la
significancia estadística de la diferencias de medias entre grupos, por ejemplo, serviría
para determinar si existe diferencia significativa entre los ingresos medios de los
hombres y mujeres.

100
Econometría

Estos números son claramente diferentes entre sí, pero lo que nos interesa saber
es si esta diferencia es estadísticamente significativa, para esto utilizaremos un
modelo ANOVA.

Consideremos el siguiente modelo de regresión:

donde:

101
Econometría

Este modelo es como cualquier otro modelo de regresión lineal, la única diferencia
que ahora todo nuestras variables explicativas son binarias. De esta forma, el salario
promedio de los individuos que viven en el norte es:

De igual forma el salario promedio de los individuos que viven en el sur es:

y por último, el salario promedio de los individuos que viven en el centro es:

102
Econometría

Los modelos ANOVA que acabamos de analizar no son muy frecuentes en


economía, sólo se utilizan para testear diferencias de medias.

Los modelos econométricos generalmente son más amplios e introducen tanto variables
explicativas continuas como dicotómicas. Por ejemplo, es razonable suponer que, además
del género, existen otros factores que explican el salario (educación y experiencia (entre
otros) siguiendo a Mincer (1974)).

Especifiquemos nuevamente el modelo:

103
Econometría

104
Econometría

Ahora, si quisiéramos especificar un modelo en que además las pendientes varíen con
el género (retornos a la educación diferenciados), tendríamos el siguiente modelo:

donde:

En el caso que existan otros regresores continuos (experiencia, por ejemplo), podría ser
deseable poseer efectos diferenciados en la pendiente sólo para algunos de ellos.

105
Econometría

Posibles usos de las variables Dummies

106
Econometría

Posibles usos de las variables Dummies


Como hemos mencionado las variable dummies pueden reflejar características
individuales como género, status marital,raza, etc, y de esta forma las habiamos
llamado variable cualitativas. Sin embargo, este no es el único motivo para incluir
dummies en una regresión.
Existen además aquellas dummies llamadas dummies estacionales cuyo objetivo es
controlar por factores temporales de los datos.
Las dummies también pueden ser útiles para captar efectos umbrales.
las dummies pueden ser de utilidad para cuantificar efectos condicionales.

Manejo algebraico de Dummies

Sea el modelo simple:

O en nuestra notación matricial usual:

107
Econometría

108
Econometría

Y con respecto a la varianza de los estimadores:

donde:

109
Econometría

Variable Dependiente Rezagada

Cuando trabajamos con series de tiempo, es posible que sea de nuestro interés incluir
rezagos de la variable dependiente como variables explicativas. Ello puede ocurrir
cuando creemos que existe cierta persistencia de nuestra variable dependiente.

Ejemplo:

110
Econometría

Regresión Particionada

Sea el siguiente modelo de regresión lineal con k regresores:

De esta forma, el modelo anterior puede ser reescrito como:

En términos matriciales estamos haciendo lo siguiente:

111
Econometría

Recordando que la estimación mínimos cuadrados ordinaria implica despejar el


vector de parámetros del sistema de ecuaciones normales

Lo que puede ser expresado de la siguiente forma:

112
Econometría

113
Econometría

También se puede demostrar que las matrices de varianzas y covarianzas de


ambos estimadores son:

114
Econometría

Omisión de Variables Relevantes


Impacto sobre el Insesgamiento

Considere el siguiente modelo poblacional (expresado en desvíos con respecto a


la media):

Suponga ahora que el investigador se equivoca y estima el siguiente modelo:

Estimando el modelo “incorrecto” obtenemos:

115
Econometría

Ello implica que por lo general, la omisión de variables relevantes (que pertenecen al
modelo poblacional), causará que los parámetros estimados sea sesgados. Ello no
sucederá, sólo en el caso que Z=0 (es decir que X1 y X2 sea ortogonales) o si ¯2=0
(aunque dicho caso es contradictorio, dado que implicaría que la variable no pertenece
al modelo poblacional).

De lo anterior, se desprende que la dirección del sesgo depende de como covarien


las variables incluidas con respecto a las excluidas y del signo del parámetro omitido.

116
Econometría

Impacto sobre la Varianza


Estimando el modelo ”incorrecto”, el estimador de la varianza será:

Tal que se puede demostrar que dicha matriz es definida positiva.


El omitir variables relevantes implica que los parámetros estimados serán sesgados y
que sus varianzas serán menores.

117
Econometría

Inclusión de Variable Irrelevantes

Impacto sobre Insesgamiento

Considere ahora el siguiente modelo poblacional:

Suponga ahora que el investigador se equivoca y estima el siguiente modelo:

Estimando el modelo “incorrecto” obtenemos:

118
Econometría
y con el mismo razonamiento, se puede demostrar que:

Es decir, la inclusión de variable irrelevantes no causa sesgo en los parámetros


estimados, ni en la varianza de los errores estimados. Bajo dichos resultados, pareciera
que es mejor poner muchos regresores en nuestro modelo. Sin embargo, nos falta
estudiar que sucede con la varianza de los parámetros estimados.

Impacto sobre Varianza

Recordemos que:

con lo cual, la varianza estimada:

119
Econometría

Mientras que la varianza verdadera:

La varianza verdadera es menor que la varianza estimada. Ello implica que el incluir
regresores adicionales, aumenta la varianza de nuestros parámetros estimados, lo cual se
traduce en parámetros menos eficientes.

120
Econometría

Perturbaciones no Esféricas

Un supuesto importante en el modelo clásico de regresión lineal (Supuesto 4) es


que los errores ui son homocedásticos, es decir la varianza es constante para todo
valor de Xi:

121
Econometría

Además se suponía que los términos de error no estaban correlacionados entre si

Consecuencias de estimación por MCO

Recordemos que el estimador MCO es:

122
Econometría

123
Econometría

Estimación Eficiente: Mínimos Cuadrados Generalizados

Bajo estas condiciones el Método de Mínimos Cuadrados Generalizados nos


permite estimar de manera eficiente los parámetros.

124
Econometría

Notemos que la ecuaci{on anterior es un modelo transformado de forma tal


que:

125
Econometría

126
Econometría

Estimación cuando es desconocida: Mínimos Cuadrados Factibles

127
Econometría

Heterocedasticidad

128
Econometría

La heterocedasticidad es un problema bastante recurrente, especialmente al trabajar


con datos de corte transversal. Algunas razones por las que ui puede variar son las
siguientes:

129
Econometría

130
Econometría

que no requiere una representación especifica de la forma funcional que adopta la


heterocedasticidad, por lo que no tendremos riesgo de asumir una forma funcional
incorrecta.

131
Econometría

la que se estima de la siguiente forma:

White demuestra bajo condiciones generales que:

De esta forma, una estimación consistente de la matriz de covarianzas es:

La estimación de White de una matriz consistente con Heterocedasticidad es un


resultado muy útil, ya que no se necesita saber la naturaleza de la Heterocedasticidad.
Ante la duda de presencia de este problema es mejor ocupar este estimador ya que no
produce alteraciones, y nos permite hacer inferencia correcta con o sin la presencia de
Heterocedasticidad.

132
Econometría

Contrastes de Heterocedasticidad:

133
Econometría

134
Econometría

135
Econometría

Si se sospecha que la varianza del error depende inversamente de zi, entonces las
observaciones se deben ordenar de mayor a menor. Si se llega a la conclusión de que el
término de error del modelo no presenta heterocedasticidad, podría deberse a que hemos
comenzado con una mala especificación del parámetro , que quizás depende de un
variable diferente a la que hemos supuesto. Por esta razón el contraste debería realizarse
varias veces con distintas variables de las que tengamos sospechas pueda depender la
varianza del término de error.

136
Econometría

137
Econometría

138
Econometría

139
Econometría

Autocorrelación

Luego, nuestra matriz de varianzas y covarianzas del error ya no será una matriz diagonal
(como en el caso de varianzas esféricas y no esférica pero sólo con heterocedasticidad) ya
que el término de error se encuentra correlacionado consigo mismo a través del tiempo.
La forma que toma la matriz cuando sólo tenemos autocorrelación pero los errores son
homocedásticos:

140
Econometría

Matriz de Varianzas y Covarianzas cuando ut es un AR(1):

En este caso el término de error tiene la forma señalada:

141
Econometría

142
Econometría

143
Econometría

Naturaleza y causas de la autocorrelación


Existe autocorrelación cuando el término de error de un modelo econométrico está
correlacionado consigo mismo a través del tiempo. Por supuesto, no es necesario
que ut este correlacionado consigo mismo sólo un periodo atrás, esta correlación
puede ser de cualquier orden, es decir, ut puede ser un AR(1), AR(2),...,AR(q), etc.
Así, dependiendo de cual sea el orden de la autocorrelación en el término de error,
la matriz de varianzas y covarianzas ira tomando distintas formas.
La autocorrelación en el término de error puede ser producida por varias causas:

Existencia de ciclos y tendencias


Un valor alto de ut que genera un valor de yt por sobre su media condicional, tendrá
una probabilidad elevada de ir seguido por un valor alto de ut+1, y por ello, de un
valor de yt+1 por encima del promedio; lo mismo ocurría para yt debajo del
promedio. Sin embargo, si existe autocorrelación negativa, valores de yt por sobre su
valor promedio condicional irán seguidos, con alta probabilidad, de valores de yt+1
por debajo de su promedio. Por lo tanto, la autocorrelación positiva esta asociada a
la existencia de rachas de valores altos y bajos de yt.

144
Econometría

Variables omitidas: Omisión tanto de variables relevantes, de no linealidades y de


relaciones dinámicas (rezagos de la variable dependiente) serán incorporadas al
término de error, causando posible autocorrelación

145
Econometría
De esta forma, MCO sigue siendo insesgado, pero pierde eficiencia, por lo cual ya no
es MELI. El estimador de mínima varianza en este contexto es MCG, y en caso de
desconocerse la forma de la autocorrelación se debe utilizar MCF.

146
Econometría

147
Econometría

Respecto a los valores críticos del test, la distribución en muestras finitas


depende del supuesto de normalidad de los errores y de la matriz X, por lo cual
Durbin y Watson derivaron las tablas de valores de críticos para facilitar la
aplicación del test. Sin embargo, dichos valores poseen rangos indeterminados,
en los cuales no podemos tomar una decisión respecto a la nula. El test
distribuye con dos colas y se presenta en la siguiente figura:

148
Econometría

149
Econometría

150
Econometría

3. Test de Breusch y Godfrey Este test es una alternativa para testear


autocorrelaciones de ordenes superiores a 1. La nula, al igual que en todos los
test de autocorrelación es que los residuos no se encuentran correlacionados.
Consideremos para distintos valores de k, el siguiente conjunto de estadísticos:

151
Econometría

152
Econometría

Estimación de Modelos con Autocorrelación

153
Econometría

Entonces utilizando esta matriz P podemos transformar el modelo y aplicar


Mínimos Cuadrados Generalizados. Al premultiplicar X e Y por la matriz P
tendremos que la primera observación se transforma de la siguiente forma:

Y para el resto de las (T -1) observaciones la transformación es la siguiente:

El que la primera observación de la muestra tenga un trato especial, es porque


para ella no existe una observación anterior, y por lo tanto, es imposible aplicar
la transformación en

154
Econometría

La matriz P que transforma nuestro modelo en un libre de autocorrelación en el


error, es tal que cada observación de las variables dependientes, explicativas y
término de error, se debe transformar de acuerdo a:

Si es que nuestro modelo es el siguiente:

155
Econometría

156
Econometría

Problema con los datos

Es prácticamente imposible encontrar dos variables económicas cuyo coeficiente de


correlación es una determinada muestra sea numéricamente cero, dicho coeficiente
puede tomar valores pequeños pero nunca llegar a ser cero.

Granger y Newbold (1974) entre otros autores han ilustrado como el sólo hecho de
introducir una tendencia lineal en dos series de tiempo independientes aumenta su
correlación notablemente.

La Multicolinealidad aparece cuando las variables explicativas en modelo


econométrico están correlacionadas entre si, esto tiene efectos negativas cuando se
quire estimar los parámetros del modelo por MCO.

157
Econometría

Existen diversas fuentes de la multicolinealidad:


El método de recolección de información empleado, obtención de muestras en un intervalo
limitado de valores de los regresores en la población.
Restricción en el modelo o en la población objeto de muestreo.
Especificación del modelo.

Consideremos el siguiente modelo:

158
Econometría

1. La solución del sistema de ecuaciones normales está mal definido: mientras la


dependencia de Xji sea aleatoria y no exacta, X’X no será exactamente singular y existirá un
único estimador MCO, ya que existe una única solución al sistema de ecuaciones normales,
pero también habrá un número de vectores que al sustituirlos en el sistema de
ecuaciones normales, serían aproximadamente una solución al mismo.

2. Pequeñas variaciones muestrales por incorporar o sustraer un número reducido de


observaciones muestrales, introducirá ligeros cambios en (X’X) y X’y, pero podrían generar
importantes cambios en la solución del sistema de ecuaciones normales.

3. Al ser la matriz X’X casi singular, es muy pequeña. Como consecuencia la matriz de
covarianzas será muy grande, por lo tanto el estimador MCO es poco preciso en este caso.

159
Econometría

Multicolinealidad Exacta y Multicolinealidad Aproximada

La presencia de multicolinealidad en un modelo de regresión lineal puede ser


de dos formas:

Multicolinealidad Exacta: una de las variables explicativas es una combinación lineal


determinística de todas las demás (o algunas de ellas).

Multicolinealidad Aproximada: ocurre cuando una de las variables es


aproximadamente igual a una combinación lineal de las restantes.

Detección de Multicolinealidad

Puesto que la multicolinealidad es un problema de naturaleza muestral, que surge


principalmente por el carácter no experimental de la mayoría de la información
recopilada en las Ciencias Sociales, no tiene una manera única de ser detectada. Lo
que se tiene son algunas reglas prácticas detalladas a continuación:

160
Econometría

1. El R2 es alto, pero los parámetros no resultan ser individualmente significativos.


Por ejemplo: Considere los siguientes datos:

161
Econometría

2. Pequeños cambios en los datos, produce importantes variaciones en las estimaciones


mínimo cuadráticas.

3. Los coeficientes pueden tener signos opuestos a los esperados o una magnitud
poco creíble.

162
Econometría

163
Econometría

Otros métodos de detección de multicolinealidad

164
Econometría

165
Econometría

166
Econometría

De acuerdo con este análisis, los coeficientes de determinación obtenidos en


las regresiones de cada variable explicativa con el resto son un buen indicador
de una posible situación de multicolinealidad.

167
Econometría

168
Econometría

169
Econometría

Remedios contra la Multicolinealidad

Se han propuesto varios métodos para hacer frente a la multicolinealidad. La


solución más sencilla es eliminar de la regresión las variables que se sospeche son la
causa del problema. Obviamente de este método surgen problemas de
especificación, como la omisión de variables relevantes. Es necesario recordar que el
estimador MCO sigue siendo el mejor estimador lineal insesgado de los parámetros.
El problema es que, cuando hay multicolinealidad, el mejor no resulta ser muy bueno.

Las soluciones propuestas en la literatura (estimador de ridge o estimador cresta y


estimador de componentes principales) tienen como característica buscar un
estimador ligeramente sesgado pero cuya varianza sea mucho menor, es decir, un
estimador con menor error cuadrático medio. No existe una metodología que
permita eliminar el problema de alta multicolinealidad sin alterar las propiedades y
la interpretación de los parámetros.

Estas metodologías tienen poco respaldo intuitivo, por lo tanto la interpretación


de los parámetros es desconocida.

170
Econometría

Error de Medición
Una dificultad en todo trabajo empírico en Economía es la imposibilidad de disponer
de las observaciones muestrales de las variables de interés. Por ejemplo, las variables
de contabilidad nacional como el PIB, stock de capital o consumo, son sólo
estimaciones de conceptos teóricos que no se observan en la realidad. En otros casos,
como la Renta Permanente, inteligencia o habilidad de un trabajador, no disponemos
ni siquiera estimaciones, y debemos utilizar variables Proxies, que aproximan los
conceptos que se quieren utilizar. Así por ejemplo se utilizan años de experiencia del
trabajador para aproximar su habilidad.
Podemos adelantar que el error de medición o el uso de variables proxies generará sesgos
en las estimaciones por MCO, el que será menor cuanto más se aproxime la verdadera
variable que debería incluirse en el modelo con que incluyo efectivamente. Cuanto más
independiente sea el error de medida de las restantes variables del modelo.

171
Econometría

Consideremos el siguiente modelo lineal simple:

172
Econometría

Ahora supongamos que la variable xi está medida con error, es decir:

contrario a lo que ocurría en anteriormente en este caso tenemos dificultad al


estimar por MCO, ya que el término de error está correlacionado con el regresor.

173
Econometría

Estimación por Variables Instrumentales

La estimación consistente de los parámetros en presencia de errores de medida es posible si


se disponen de instrumentos.

Definición: Un instrumento es una variable no incluida en el modelo, que cumple con:

No estar correlacionada con el término de error.


Esta correlacionada con la variable explicativa para la cual actúa como instrumento (en
este caso la variable medida con error).

el sesgo del estimador MCO de surge por la correlación entre la variable y


Supongamos ahora que se dispone de la variable zi, tal que:

174
Econometría

175
Econometría

Con matriz de varianzas y covarianzas:

176
Econometría

Test de Hausman
Bajo errores de medida, el estimador MCO es inconsistente, mientras que el estimador
de variables instrumentales es consistente. Si en realidad no hubiese errores de medida,
ambos estimadores serán consistentes, y MCO es además eficiente, lo que no ocurre con
cualquier estimador de variables instrumentales (es un estimador en dos etapas, lo que
hace perder eficiencia).

177
Econometría

Selección de Modelos

Una pregunta crucial que se enfrenta en econometría aplicada es como escoger entre
diversas especificaciones planteadas para responder una misma pregunta. No existe un
respuesta única al problema anterior, sin embargo, algunas recomendaciones son:

Elegir el modelo más parsimonioso (lo más pequeño posible)


Que posea un buen ajuste
Que sea consistente con los datos observados
Sin embargo, en el caso de tener que elegir entre modelos anidados, es posible utilizar
los llamados Criterios de Información. Suponga que usted desea escoger entre alguno de
los siguientes modelos:

178
Econometría

La pregunta relevante es ¿Cuál de las tres especificaciones anteriores es mejor?.


Los criterios de información nos ayudan a responder dicha pregunta.
El primer criterio de información es el Criterio de Akaike (ACI) y se define como:

mientras que el Criterio de Schwarz (BIC) se define como:

Luego, el criterio de selección entre modelos anidados corresponde a elegir el


modelo con menor criterio de información. Note que para que los criterios sean
comprables, deben poseer el mismo tamaño de muestra.

179
Econometría

Estimación Máximo Verosímil (EMV)


A diferencia de MCO, el EMV descansa en un determinado supuesto respecto de la
distribución del término de error, teniendo por objetivo, como veremos más
adelante, determinar los parámetros que maximicen la probabilidad de ocurrencia
de la muestra observada. La ventaja de MV es que puede producir estimadores
consistentes y asintóticamente eficientes cuando MCO falla.

Note que hemos invertido la notación entre L y la densidad. Ello porque la densidad escribe
los valores probables de Y dado un vector µ determinado, sin embargo, en nuestro caso el
sentido es inverso: estamos interesados en el vector µ dado un vector Y determinado.

180
Econometría

181
Econometría

Propiedades de los estimadores MV


Las propiedades de los estimadores ML se derivan en grandes muestras, por lo cual
hablaremos de las propiedades asintóticas de los mismos. Ellas son:
1. Consistencia:

Es decir, asintóticamente, el parámetro estimado corresponde al parámetro poblacional.


2. Eficiencia Asintótica:

La varianza del estimador MV alcanza la llamada Cota Inferior de Cramer Rao, es decir .
Esta propiedad asintótica es la principal virtud de los estimadores MV. La cota inferior de
Cramer Rao corresponde al inverso de la matriz de información, la cual corresponde a la
mínima varianza que puede poseer un estimador insesgado.

182
Econometría

3. Normalidad Asintótica:

donde note que la matriz hessiana de segundas derivadas de L es una matriz cuadrada y
simétrica de orden kxk.

183
Econometría

Estimación por MV

Como ya es usual, sea el siguiente modelo poblacional:

184
Econometría

Luego, dado nuestro modelo poblacional, tenemos que:

185
Econometría

186
Econometría

Nos queda entonces derivar la varianza de los estimadores MV. Vimos que la matriz de
varianzas correspondía al inverso de la matriz de información Por facilidad de cálculo,
generalmente se utiliza la segunda definición de es decir, la de las segundas derivadas
de la función de verosimilitud. Entonces:

187
Econometría

188
Econometría

189
Econometría

190
Econometría

Inferencia en el contexto MV

Test de Razón de Verosimilitud (LR)

191
Econometría

El test LR se define entonces como:

Donde q corresponde al número de restricciones impuestas


Intuitivamente, el valor del estadígrafo crecerá a mayor sea la discrepancia entre los
valores de la verosimilitud restringida y la no restringida, lo cual nos aleja de la
posibilidad que las restricciones impuestas sea válidas

192
Econometría

193
Econometría

Test de Wald (W)

194
Econometría

donde q es el número de filas de R y por lo tanto, el número de restricciones.


Luego, como los estimadores MV distribuyen asintóticamente normales, entonces la
matriz de información expuesta es válida en muestras grandes, tenemos que el
estadístico de Wald se define como:

Una nota: Dijimos que el test era válido asintóticamente, donde hemos utilizado el
resultado de normalidad asintótica de MV. En caso de que los errores efectivamente
distribuyan normal en muestra finita, el test (lógicamente) mantiene su distribución.

195
Econometría

Test del Multiplicador de Lagrange (LM)


Un tercer test corresponde al test LM, el cual también es conocido como el test del
Score. recordemos que el Score corresponde a la matriz de primeras derivadas de la
función de Verosimilitud:

196
Econometría

Note que contraposición al test de Wald, sólo necesitamos calcular el estimador


restringido. De hecho, su popularidad reside en que muchas veces es más fácil
calcular el estimador restringido que el irrestricto.

Dada la normalidad asintótica de los estimadores MV, podemos reducir el


estadígrafo a una forma mucho más simple. Para ver lo anterior, considere una
notación matricial del score:

197
Econometría

entonces, para evaluar el score en la estimación restringida, utilizamos los residuos


restringidos, los cuales denotaremos por:

y por lo tanto: con lo cual:

Entonces, tomado en cuenta la definición de y evaluándola en el estimador


restringido, tenemos que nuestro test queda como:

198
Econometría

199
Econometría

Del ejercicio anterior:

200
Econometría

201
Econometría

202
Econometría

203
Econometría

204
Econometría

205
Econometría

206
Econometría

Algunas acotaciones respecto a la estimación y la inferencia MV

1. Se asumió que la distribución de los errores sigue una distribución


normal. Sin embargo, suponer errores normales es sólo uno de los
posibles supuestos respecto a la distribución de los errores. Existe una
gran cantidad de posibilidades al respecto, utilizándose otras como la
distribución logística y la exponencial, muy regularmente en otros
tópicos econométricos. Lo anterior es una ventaja de la estimación MV,
dado que sus propiedades asintóticas se mantienen independientemente
de la distribución utilizada.

2. Otra ventaja corresponde a la posibilidad de utilizar modelos no lineales.


MCO (tal y como lo hemos estudiado) sólo permite estimar modelos
lineales en parámetros, mientras que MV permite no linealidades
(aunque ello implique la imposibilidad de obtener de obtener formas
funcionales cerradas para nuestros estimadores, lo cual implica
necesariamente utilizar métodos numéricos para optimizar la función
objetivo).

207
Econometría

3. Otra ventaja reside en la inferencia. Toda la inferencia vista en MCO poseía distribución
exacta bajo el supuesto de normalidad. Los test asintóticos visto en la inferencia MV son
válidos bajo cualquier distribución supuesta (aunque asintóticamente).

4. Adicionalmente, los tres test vistos son capaces de lidiar con restricciones no lineales. ¿Por
qué? Porque MV es capaz de lidiar con modelos no lineales.

5. Es posible demostrar que W >= LR >= LM al ser aplicados a un modelo lineal. Los tres son
asintóticamente equivalentes, sin embargo, en muestras finitas arrojarán resultados
diferentes.

6. ¿Cuándo es recomendable utilizar un test t o un test F por sobre un test asintótico?

7. Todos los paquetes estadísticos reportan el valor de la función de verosimilitud (es decir, la
función evaluada en los parámetros estimados). Ello, muchas veces es utilizado como un
criterio de selección entre modelos (recuerde que nuestro objetivo es maximizar la función de
verosimilitud).

208

Вам также может понравиться