Econometría Uni

Econometría
Econometría
Universidad Nacional de Ingenieria
Setiembre 2013
1
Econometría
Econometría es la ciencia que aplica métodos matemáticos y estadísticos al

análisis de datos económicos, con el objetivo de dotar de una base empírica a una
teoría económica, para así refutarla o verificarla.
"La experiencia ha mostrado que cada uno de estos tres puntos de vista, el de la
estadística, la teoría económica y las matemáticas, es necesario, pero por si
mismo no suficiente para una comprensión real de las relaciones cuantitativas
de la vida económica modera. Es la unión de los tres aspectos lo que constituye
una herramienta de análisis potente. Es la unión lo que constituye la
econometría".
2
Econometría
3
Econometría
Análisis de Regresión
¿Qué es una regresión?
Relaciones estadísticas versus relaciones determinísticas
4
Econometría
Regresión versus Causalidad
La regresión es una relación estadística, que no implica causalidad apriori.
Regresión versus Correlación
El Análisis de Correlación está estrechamente relacionado con el de regresión aunque

conceptualmente son dos cosas muy diferentes.
5
Econometría
6
Econometría
Algunas precauciones con el coeficiente de correlación:
•Cuidado cuando el grado de correlación muestral depende de solo unas pocas observaciones.
•El coeficiente de correlación mide una relación lineal. Por lo tanto, una variable puede
depender de otra aún cuando la correlación sea cero si la relación es no lineal.
•Correlación no implica causalidad económica, es sólo una relación estadística.
•Correlación puede indicar relación espuria.
•No olvidar que la correlación muestral es una variable aleatoria y que por lo tanto, el
coeficiente por si sólo no garantiza la existencia de una relación estadística entre las series.
7
Econometría
La unión de los valores esperados condicionales representa la Recta de regresión poblacional,

donde el término poblacional se refiere a que estamos trabajando con el total de la población.
8
Econometría
Definición: La curva de regresión poblacional es simplemente el lugar geométrico de las

medias condicionales de la variable dependiente para los valores fijos de las variables
explicativas.
9
Econometría
Función de regresión poblacional (FRP)
Especificación estocástica de la función de regresión poblacional
10
Econometría
11
Econometría
Función de regresión muestral
Población
Muestra
12
Econometría
Función de regresión muestral
Población
Muestra
13
Econometría
Definición: Un estimador es una regla, fórmula o método que dice cómo determinar el
parámetro poblacional a partir de la información suministrada por la muestra disponible.
14
Econometría
15
Econometría
Propiedades de un Estimador
16
Econometría
17
Econometría
18
Econometría
19
Econometría
20
Econometría
21
Econometría
Modelo de regresión con dos variables
Método de Mínimos Cuadrados Ordinarios
22
Econometría
23
Econometría
ecuaciones normales
24
Econometría
25
Econometría
26
Econometría
27
Econometría
28
Econometría
Supuestos detrás del método MCO:
29
Econometría
30
Econometría
31
Econometría
32
Econometría
33
Econometría
34
Econometría
Modelo con “k” variables
El modelo de regresión profesional tomaría la siguiente forma:
Representación matricial
35
Econometría
Ahora debemos expresar la distribución del término de error en términos matriciales:
De los supuestos 3, 4 y 5, tenemos entonces que el término de error tiene la siguiente

distribución:
36
Econometría
Estimador Mínimo Cuadrados Ordinarios

El método de MCO, plantea que los parámetros del modelo pueden ser estimados
minimizando la suma de los errores al cuadrado:
Donde:
Entonces el problema de minimizar la suma de los errores al cuadrado se expresa de
la siguiente forma:
37
Econometría
Condición de ortogonalidad:
De esta forma, el vector de parámetros estimados de se obtiene de resolver el

siguiente sistema de ecuaciones normales:
38
Econometría
39
Econometría
Es importante recordar que el estimador MCO esta definido solo cuando la matriz (X’X)
es invertible, lo que ocurre siempre y cuando:
1. Las k columnas de la matriz X sean linealmente independientes.

2. Se disponga al menos de tantas observaciones como variables
explicativas, es decir: n¸ k.(Supuesto 7)
Pongamos atención en el segundo supuesto, cuando n=k
Sin embargo, esta no es una característica deseable, el ajuste perfecto ocurre porque tenemos
una muestra muy reducida. Esto trae como consecuencia poco robustez e imprecisión en las
estimaciones.
40
Econometría
Para lograr estimaciones precisas de los parámetros, es necesario tener un número de

observaciones notablemente superior al de las variables explicativas. La diferencia n-k se conoce
como el número de grados de libertad de la estimación.
Propiedades del estimador MCO

Media del estimador:
El estimador de MCO es insesgado

El error de estimación o sesgo se define como:
41
Econometría
Varianza del estimador:
Para poder estimar la varianza de necesitamos reemplazar por su estimador

insesgado
42
Econometría
Propiedad de mejor estimador lineal insesgado

Se dice que , es el mejor estimador lineal insesgado (MELI) de si se cumple
lo siguiente:
1. El lineal, es decir, es una función lineal de una variable aleatoria, como la variable y
en el modelo de regresión.
2. Es insesgado, es decir, su valor esperado, es igual a el verdadero valor,
3. Tiene varianza mínima dentro de la clase de todos los estimadores lineales
insesgados; un estimador insesgado como varianza mínima es conocido como un
estimador eficiente.
Teorema de Gauss-Markov
Proposición: El estimador MCO es el estimador lineal insesgado óptimo, en el sentido
de que cualquier otro estimador lineal e insesgado tiene una matriz de covarianza
mayor que la del estimador MCO. Es decir, el estimador MCO es MELI.
43
Econometría
Aplicando esperanza a la expresión anterior:
El estimador será insesgado solo si la matriz A es tal que . De esta forma:
44
Econometría
Bondad de Ajuste y Análisis de Varianza

Modelo de Regresión Lineal en Desvíos
Sea el modelo poblacional usual con k variables:
donde i = 1 : n y cuya contraparte estimada es:
Luego, si sumamos para todas las observaciones y dividimos a ambos lados por el tamaño
muestral n, tenemos:
45
Econometría
La expresión es similar a la anterior, excepto por dos importantes diferencias.

Primero, el modelo no posee constante y segundo, las variables se encuentran
expresadas en desvíos con respecto a la media. A pesar de ello, note que los
coeficientes y los residuos son los mismos en ambos modelos.
El término constante no es más que una corrección que garantiza que los promedios
muestrales de ambos miembros del modelo econométrico coincidan.
Para transformar en desvíos con respecto a la media un modelo en términos matriciales,
introduciremos una matriz fundamental para el análisis de esta sección. Denotaremos
por M0 una matriz de n x n, definida como:
46
Econometría
donde I es la identidad (nxn) e i corresponde al vector unitario de dimensión n. Dicha

matriz es singular, simétrica (M0’=M0) e idempotente (M0M0=M0).
M0 es conocida como matriz de desvíos, ya que resta a cada columna de la matriz
involucrada, su media aritmética
Por lo tanto, nuestro modelo expresado en matrices, puede ser expresado en términos
de desvío con respecto a la media como:
47
Econometría
Análisis de Varianza
Suponga entonces el siguiente modelo poblacional:
Donde Y corresponde a una vector n x 1, X corresponde a nuestra matriz de regresores

que incluye un término constante, tal que X es de nxk y u corresponde al vector de
errores de nx1.
Sea TSS: Suma de los cuadrados totales
48
Econometría
con lo cual, al particionar nuestra matriz X en , nuestro vector de parámetros
en y considerando que 0 y que , tenemos que:
La igualdad anterior es conocida como la descomposición de varianza. El término de la

izquierda corresponde a TSS o la suma de los cuadrados de las desviaciones de
la variable dependiente.
49
Econometría
Bondad de Ajuste:
Definimos entonces la bondad de ajuste del modelo a través del siguiente estadígrafo
llamado también coeficiente de determinación:
es decir, como la proporción de la varianza de Y que es explicada por la varianza

de la regresión. Alternativamente:
50
Econometría
Note que:
1. El coeficiente de determinación es siempre menor a 1. Ello porque RSS <=TSS y por lo tanto
RSS/TSS <= 1.
2. El análisis de varianza anterior fue derivado bajo el supuesto que el modelo incluía una
constante (por ello utilizábamos la matriz M0). En dicho caso, necesariamente R2>= 0. En caso
de que el modelo no incluya una constante, se debe utilizar la fórmula utilizando TSS=Y’Y (sin
desvíos).
3. Al agregar regresores al modelo, el R2 nunca decrecerá (se mantendrá constante o

aumentará)
4. No es claro cuan bueno sea como predictor de ajuste.
Para ver este último punto, suponga que usted posee el siguiente modelo poblacional:
51
Econometría
donde X es un vector (n x1). Suponga ahora que restamos X a ambos lados de

nuestro modelo. Obtenemos entonces:
Si , entonces es fácil verificar que el R2 del primer modelo será cercano a 1,

mientras que el del segundo será cercano a cero, a pesar de que los modelos son
matemáticamente equivalentes. A pesar de lo anterior, en trabajos aplicados, el R2 es
ampliamente utilizado, por lo cual se recomienda su publicación.
52
Econometría
Inferencia
53
Econometría
Sean entonces las siguientes hipótesis:
1. H0: βi = 0 Plantea que el regresor Xi no posee influencia alguna sobre Y.
Este es el test más común y nos referiremos a él como test de significancia.
2. H0: βi = βi0 Plantea que el regresor Xi posee un impacto determinado por Xi0
sobre Y.
3. H0: βi + βj =1 Plantea que la suma de los regresores Xi y Xj poseen un impacto

conjunto de magnitud 1.
4. H0: βi = βj Plantea que los regresores Xi y Xj poseen el mismo impacto sobre Y.
5. H0: βi =0 ; i=2: : : k ) Plantea que todos los regresores conjuntamente, excepto

la constante, son cero.
6. H0: βl =0 donde el vector β ha sido particionado en dos (βl y βp ) con

dimensiones (kl x 1) y (kp x 1) respectivamente, tal que kl + kp = k. Plantea
entonces que un subconjunto de parámetros son estadísticamente no
significativos.
54
Econometría
Todas las hipótesis anteriores pueden ser resumidas en la siguiente expresión:
donde R es una matriz de (qxk) constantes conocidas (ceros o unos), cuyo objetivo será
seleccionar los parámetros a testear, cuyo número de filas, q, representa el número de
restricciones. A su vez, r es un vector de dimensión q y contiene el real al cual es
restringido cada parámetro. Veamos como serán las matrices R y r en cada una de
nuestras hipótesis:
55
Econometría
Entonces, nuestra hipótesis nula corresponde a:
Con lo cual, sólo nos resta derivar el test que nos permita rechazar o no rechazar
nuestra nula. La construcción del estadígrafo es como sigue.
Esperanza
Varianza
56
Econometría
y si la nula Rβ = r es cierta:
luego estandarizamos, con lo cual:
57
Econometría
Además, se puede demostrar que
Luego, se puede demostrar que
Luego, combinando los dos resultados anteriores, se puede demostrar que
58
Econometría
El test expuesto corresponde a la forma general del test F. Dicho test es de utilidad
para testear cualquier hipótesis.
Test t (Una hipótesis lineal)
Reescribiendo el test F como:
59
Econometría
Recordando que t2 es una caso particular de una F con un grado de libertad en

el numerador, tenemos que:
60
Econometría
La distribución t es simétrica y se aproxima a la normal para tamaños de muestras

grandes, sin embargo, la t posee colas más gruesas que la normal (lo cual es más
pronunciado en muestras pequeñas: n<=30). La siguiente figura expone la relación
entre la distribución t y la normal:
61
Econometría
Nota precautoria:
Toda la derivación anterior se basa en el estricto supuesto de normalidad de los

errores. En caso de que los mismos no distribuyan normal, la distribución del
test F (y por lo tanto el del t) es desconocida en muestras finitas. Sin embargo,
es posible demostrar que es decir, que el test t distribuye
asintóticamente normal. Luego, los valores críticos de t y (normal estándar)
se encuentran sumamente cerca si n-k¸30, por lo cual, en términos prácticos no
importa mucho cual de ellas escojamos para los valores críticos (a menos que la
muestra sea especialmente pequeña).
Criterio de Rechazo y Nivel de Confianza
Una vez que hemos calculado el valor del test para nuestra nula particular (o valor
calculado), resta calcular el valor crítico o el valor que nos indica la tabla t.
62
Econometría
Dicho valor crítico nos dirá si nuestra nula es falsa o si no podemos afirmar que lo es.
La elección de dicho valor crítico se toma desde la tabla de distribución t y el número
debe ser escogido tomado en cuenta el nivel de significancia escogido (1 %, 5% o 10
%), el cual a su vez determina el nivel de confianza del test (99 %, 95% o 90 %,
respectivamente).
El nivel de confianza posee una explicación intuitiva: Nuestro estadígrafo es función de la

muestra con lo que estamos trabajando, por lo cual, si contáramos con una gran número
de ellas y con cada una pudiésemos calcular nuestro estadígrafo, el nivel de confianza
indica el porcentaje de veces que calculamos nuestro estadígrafo en que realmente no
rechazamos lo cierto o rechazamos correctamente lo falso.
La forma en que se distribuya la probabilidad de rechazo, es decir, el nivel de

significancia, depende de nuestra hipótesis alternativa.
63
Econometría
Test de una cola

Supongamos que nuestra hipótesis es:
donde . En dicho caso, el estadígrafo es calculado según lo propuesto

en la sección anterior. El punto está en como acumulamos la probabilidad de
rechazo. En este caso, el total de la probabilidad de rechazo se acumula en la
cola derecha de la distribución
¿Por qué en la cola derecha? Porque la probabilidad de rechazo, es decir, el nivel
de significancia, nos indica hasta donde puedo tolerar un valor mayor a , por
lo cual, carecería de sentido que la zona de rechazo se encuentre en la cola
izquierda de la distribución. Por ejemplo, si , la distribución de nuestro
estadígrafo se centra en cero (vea la fórmula), por lo cual la hipótesis alternativa
correspondería a que el parámetro es positivo. el punto es ¿cuán positivo puedo
aceptar que sea?.
64
Econometría
Rechazaremos nuestra hipótesis nula de que el coeficiente es cero contra la hipótesis

alternativa que el parámetro es mayor que , si el valor calculado del test es mayor al
valor crítico de la tabla t. En el caso que H1 sea que el parámetro es menor a , entonces
la probabilidad de rechazo se concentra en la cola izquierda y se rechaza la nula en el caso
que el valor calculado sea menor que el valor crítico de la tabla t.
65
Econometría
Test de dos colas
Supongamos que nuestra hipótesis es:
En este caso estamos repartiendo uniformemente la probabilidad de rechazo en ambas

colas de la distribución como lo muestra la siguiente figura (al 95% de confianza):
66
Econometría
Error de Tipo I, Error de Tipo II, Tamaño y Potencia de un test
1. Error de Tipo I (ETI): Corresponde a la probabilidad de rechazar la nula

cuando es cierta.
2. Error de Tipo II (ETII): Corresponde a la probabilidad de aceptar la nula
cuando es falsa.
3. Tamaño del Test: Corresponde la probabilidad de cometer ETI. Se define
como el nivel de significancia del test (α).
4. Potencia del Test: Corresponde a la probabilidad de rechazar la nula cuando
es falsa. Se define como Potencia =1-ETII.
El óptimo para el investigador sería minimizar ambos tipos de errores y tener un test
con un menor tamaño y mayor potencia posibles, sin embargo, note que el tamaño del
test y por lo tanto, el ETI, es una variable endógena al investigador, en tanto que él
decide con que nivel de confianza trabajar. Luego, el objetivo se transforma en, dado un
nivel de confianza, minimizar la ocurrencia de ETII. Intuitivamente, si usted escoge un
nivel de significancia pequeño (1 %, por ejemplo), sus zonas de rechazo serán
pequeñas, con lo cual, inevitablemente, la zona de no rechazo crece, lo cual implica que
por minimizar el ETI, ha aumentado el ETII.
67
Econometría
P-value
Otra forma alternativa al valor crítico de tabla para rechazar o no rechazar nuestra nula,
corresponde al uso de los llamados p-values, los cuales son reportados en cualquier
paquete estadístico. El p-value (p) se define como:
Es decir, el p-value representa la probabilidad de que el valor crítico (t de tabla, en

nuestro caso), sea mayor al valor t calculado, es decir, describe el nivel de significancia
exacto asociado a un resultado econométrico en particular. Por ejemplo, un p-value de
0.07 indica que un coeficiente es estadísticamente significativo en un nivel de 0.07 (o
con un 93% de confianza).
68
Econometría
Ejemplo:
Suponga el siguiente Modelo de Regresión lineal Simple:
69
Econometría
Primero veamos el ajuste de este modelo, es decir, en que grado la variable x explica a
la variable y, para lo cual calculemos el
Como podemos ver, el grado de ajuste del modelo es bastante bueno, como el modelo
incluye constante, el R2 se puede interpretar como la proporción de la variabilidad de la
variable independiente que es explicada por la variabilidad de la variable dependiente, la
que en este caso alcanza un 97 %.
Ahora veamos si estos parámetros estimados son significativos a un 95% de confianza,

para lo cual realizaremos un test t de significancia a cada uno de ellos:
70
Econometría
De esta forma, el valor calculado para el estadístico t es:
El valor de tabla del estadístico t

a un 95% de confianza y con dos
grados
de libertad es 4,303.
De esta forma, se rechaza la
hipótesis nula de que β1=0, y por
lo tanto el parámetro estimado
resulta ser estadísticamente
significativo.
71
Econometría
De esta forma, el valor calculado para el estadístico t es:
El valor de tabla del estadístico t a

un 95% de confianza y con dos
grados de libertad es 4,303.
De esta forma, se rechaza la

hipótesis nula de que β2=0, y por lo
tanto el parámetro estimado
resulta ser estadísticamente
significativo.
72
Econometría
De esta forma, se rechaza la hipótesis nula de que β2=0, y por lo tanto el

parámetro estimado resulta ser estadísticamente significativo.
Test F (Conjunto de hipótesis lineales)
Los casos 6. y 5. corresponden a un conjunto de hipótesis a testear. En el caso 5.

correspondía a un subconjunto particular de parámetros, mientras que el caso
6. correspondía a la nula de que todos ellos eran cero, menos la constante. En
dichos casos se aplica la fórmula del test F según la ecuación (2.63) y los
criterios de rechazo siguen lo expuesto en la sección anterior.
Sin embargo, en ambos casos podemos derivar expresiones alternativas para

nuestro test.
73
Econometría
Todas las pendientes del modelo son cero: En este caso, se puede demostrar que el
test F puede expresarse como:
Un subconjunto de las pendientes del modelo son cero: En este caso, se puede
demostrar que el test F puede expresarse como:
Donde denotan los residuos MCO restringidos (donde k2 representa el número de

regresores que han sido restringidos a cero), mientras que representan los
residuos del modelo MCO original.
74
Econometría
Intervalos de Confianza
Una forma alternativa (o mejor dicho complementaria) de examinar la significancia
estadística de un parámetro ( o un conjunto de ellos) es a través de intervalos de
confianza (IC). Ellos nos indican, dado un nivel de confianza, el rango de valores
admisibles del coeficiente que se estima. Los niveles de confianza generalmente
utilizados son 99 %, 95% y 90% (al igual que en los test de hipótesis), donde el tamaño
de los mismos es necesariamente decreciente.
Una manera natural de obtener el IC asociado a es a través del test t asociado.

Vimos entonces que él corresponde a:
75
Econometría
Entonces, si deseamos un IC del (1-α)% de confianza (es decir, de α% de significancia)

para el parámetro , basta obtener de las tablas de distribución el valor
correspondiente, es decir:
donde la tercera expresión se obtiene de despejar de la segunda. Note que el

intervalo ha sido construido en base a una distribución simétrica (como la t o la
normal), por lo cual el valor de tabla a escoger debe corresponder a .
76
Econometría
Note además que dicho intervalo está construido sólo en base a constantes conocidas.
Una vez construido, se puede contrastar la nula al nivel de significancia
sencillamente observando si pertenece al intervalo (en cuyo caso no rechazamos la
nula) o se encuentra fuera de él (en cuyo caso rechazamos la nula)10. Nuevamente, la
validez de dicho intervalo de confianza depende críticamente del supuesto de
distribución de los errores. En el caso que el valor se obtenga de la tabla t, como ya
sabemos, estamos suponiendo que los errores siguen una distribución normal. Un caso
más general es utilizar los valores críticos de la distribución normal estándar.
El intervalo de confianza para la varianza de los errores.
77
Econometría
78
Econometría
Test de normalidad
Consideramos ahora el problema de utilizar los momentos de los residuos MCO para
hacer inferencia sobre la distribución de los errores poblacionales. Dado que algunas
de las propiedades de MCO y de la inferencia dependen del supuesto de normalidad
en los errores, es importante poseer un contraste para dicho supuesto.
Como es sabido, la distribución normal es simétrica y mesocúrtica. La simetría implica

que el tercer momento poblacional E(u3) en torno a la media, es cero. El hecho que
sea mesocúrtica implica que la kurtosis es 3 (es decir, el ancho de las colas de la
distribución, el cual se mide utilizando el cuarto momento en torno a la media).
Recordemos entonces que el coeficiente de simetría poblacional se define como:
mientras que la kurtosis (o coeficiente de):
79
Econometría
En base a los anteriores, Bera y Jarke (1981), propusieron el siguiente estadígrafo,

construido bajo la nula de normalidad:
Donde los estimadores muestrales del coeficiente de asimetría y kurtosis se

obtienen al considerar que un estimador natural de:
80
Econometría
Note que el estadígrafo está definido en términos del exceso de kurtosis, por lo cual,
a menor sea el valor, menor es la probabilidad de rechazar la nula de normalidad.
Note además que el estadístico es esencialmente no constructivo, en términos de
que no nos indica que camino seguir en caso de rechazar la nula, además de que no
rechazar normalidad no implica confirmar su existencia. Sin embargo, en la práctica
corresponde al test más utilizado.
81
Econometría
Predicción
La predicción es una de las herramientas más atractivas y utilizadas en Econometría. Si el
modelo que hemos escogido confirma la teoría en consideración, es decir, ha sobrevivido a
las pruebas de hipótesis, podemos utilizar el modelo estimado para predecir. La
predicción se puede efectuar para un valor puntual de la variable dependiente, y0,
correspondiente a un valor dado de los regresores, x0, o predecir el valor esperado
condicional a las variables explicativas.
De esta forma, el error de predicción estará dado por :
En donde se distinguen dos fuentes del error de predicción
82
Econometría
83
Econometría
84
Econometría
Medición de la precisión de la predicción
Se han propuesto varias medidas para valorar la precisión de los modelos de

predicción. Muchas de estas medidas están para evaluar la predicción expost, es decir,
predicciones para las que las variables exógenas no tienen que ser predichas. Dos de
estas medidas que se basan en los residuos de la predicción, son la raíz cuadrada del
error cuadrado medio y el error absoluto medio.
85
Econometría
86
Econometría
Ejemplo:
Supongamos que un analista comercial está pensando en construir un edificio
comercial para luego vender. Sin embargo, no sabe cuales son las características que
debiera tener el edificio para maximizar su rentabilidad. Para descubrir esto el se
propone realizar un análisis de regresión.
El analista elige al azar una muestra de 11 edificios de oficinas de 1500 edificios

posibles. Estos datos los puede utilizar para emplear el análisis de regresión lineal
múltiple para estimar el valor de un edificio de oficinas en un área determinada
basándose en las siguientes variables.
Superficie
Superficie Antiguedad Valor
Antiguedad ValorEdificio
Edificio
Datos
Datos Oficinas Entradas
Oficinas Entradas
m2
m2 años
años US$
US$
11 2310
2310 2.0
2.0 2.0
2.0 20.0
20.0 142000
142000
22 2333
2333 2.0
2.0 2.0
2.0 12.0
12.0 144000
144000
33 2356
2356 3.0
3.0 1.5
1.5 33.0
33.0 151000
151000
44 2379
2379 3.0
3.0 2.0
2.0 43.0
43.0 150000
150000
55 2402
2402 2.0
2.0 3.0
3.0 53.0
53.0 139000
139000
66 2425
2425 4.0
4.0 2.0
2.0 23.0
23.0 169000
169000
77 2448
2448 2.0
2.0 1.5
1.5 99.0
99.0 126000
126000
88 2471
2471 2.0
2.0 2.0
2.0 34.0
34.0 142900
142900
99 2494
2494 3.0
3.0 3.0
3.0 23.0
23.0 163000
163000
1010 2517
2517 4.0
4.0 4.0
4.0 55.0
55.0 169000
169000
1111 2540
2540 2.0
2.0 3.0
3.0 22.0
22.0 149000
149000
87
Econometría
88
Econometría
A mayor número de metros cuadrados, entradas y cantidad de oficinas del edificio

mayor es el valor comercial de este. Además, mientras más años de construcción
menor es el valor del edificio. Todas las variables incluidas en el modelo son
estadísticamente significativas( lo cual se puede ver comparando los test calculados
con los de t de tabla, o viendo directamente el p-value) individualmente (Test t) y
conjuntamente(Test F). Un porcentaje importante de la varianza del precio es
explicada por la varianza de las variables explicativas, conclusión obtenida a partir
del alto R2 y R2 ajustado observado.
Las conclusiones obtenidas a partir de la inferencia realizada son válidas s i el

upuesto de normalidad de los errores se cumple. Para estudiar esto observemos el
comportamiento de los errores estimados y realicemos un Test de Normalidad
(Jarque- Bera).
89
Econometría
Podemos ver que la distribución de los errores no es del todo simétrica (Skewness =
1,2) y que tampoco presenta un comportamiento mesocurtico (Kurtosis = 3). Ambos
elementos se ven reflejados en el estadísitico Jarque - Bera, el cual cae en la zona de
rechazo (Ver además p -value).
90
Econometría
Con los parámetros estimados es posible realizar predicciones del valor de un edificio
particular condicional a sus características.
Por ejemplo podría calcular el valor tasado de un edificio de oficinas en la misma zona
con 2500 metros cuadrados, tres oficinas, dos entradas y una antiguedad de 25 años. Es
decir realizar predicciones fuera de la muestra.
PRECIO = 2553.21066*ENTRADAS + 12529.76817*OFICINAS + 27.64138737*SUPERFICIE -

234.2371645*ANTIGUEDAD + 52317.83051
= 158261.1
91
Econometría
92
Econometría
Incorporación de No Linealidades
Muchas de las relaciones económicas no son lineales. Veamos el siguiente ejemplo

de la relación entre las ventas de los portales de Internet y el número de visitas al
portal.
93
Econometría
Claramente la relación es no lineal. No es lo mismo en términos de ventas aumentar

desde 40 visitas a 50 que de 10 visitas a 20. Pero, ¿Cómo podemos incorporar no
linealidad entre Y y X en nuestro modelo de regresión?. Básicamente lo que haremos
es utilizar algunos tipos de transformación de variables. Esto nos permitirá tener un
modelo no lineal y a partir de la aplicación de las transformaciones tener un modelo de
regresión lineal para el que se cumplen todas las cosas que hemos visto.
94
Econometría
Test de No Linealidades Omitidas (Test de Reset)
Una pregunta interesante de plantearse es si nuestro modelo ha omitido no

linealidades en ciertos regresores. Ramsey (1969) introdujo el siguiente test. Bajo
la nula, el modelo poblacional corresponde a:
95
Econometría
96
Econometría
Variables Dummies o cualitativas
En el análisis de regresión, la variable dependiente esta influida frecuentemente o

solo por variables continuas como so el ingreso, producción, precios, costos, estatura,
temperatura, etc..., sino también por variables que son esencialmente cualitativas,
estos son regresores binarios, es decir, variables que sólo toman el valor 0 o 1. Dichas
variables son llamadas variables dummies, variables dicotómicas o variables ficticias.
Algunos ejemplos de variable dummies son: género, raza, religión, nacionalidad,

región geográfica, etc....Con respecto a las dos primeras variables mencionadas
Ejemplo:
Se ha encontrado que manteniendo todos los demás factores constantes, las

trabajadoras mujeres ganan menos que sus colegas hombres, y que las personas
de color ganan menos que las blancas. Este patrón puede resultar de
discriminación sexual o racial, pero cualquiera sea la razón, las variables
cualitativas tales como género o raza sí influyen sobre la variable dependiente.
97
Econometría
Por ejemplo, consideremos la siguiente variable dummy para género (mujer/hombre)

del individuo. Entonces la variable dummy consistirá en un vector (n x1) con
elementos 0 o 1 según corresponda. Es decir:
Entonces, dada la especificación escogida para la dummy, tenemos que:
98
Econometría
Alternativamente, podríamos haber definido la dummy de la siguiente forma:
y el modelo como
Entonces, en esta segunda especificación escogida para la dummy, tenemos

que:
Una tercera forma de definir el modelo sería incluyendo ambas dummies:
99
Econometría
Con el cual tendríamos que los retornos a ambos géneros serían:
Los tres modelos anteriores son equivalentes. Note que en el tercer modelo no
incluimos término constante ya que ello haría que la matriz X fuese singular y por lo
tanto, no invertible. Dicho error de especificación es llamado en la literatura Trampa
de las Dummies y corresponde a un error netamente del investigador, no de los datos.
Un modelo de regresión puede contener variables explicativas que son

exclusivamente dicotómicas o cualitativas, tales modelos se denominas Modelos de
análisis de varianza (ANOVA), estos modelos son utilizados para determinar la
significancia estadística de la diferencias de medias entre grupos, por ejemplo, serviría
para determinar si existe diferencia significativa entre los ingresos medios de los
hombres y mujeres.
100
Econometría
Estos números son claramente diferentes entre sí, pero lo que nos interesa saber
es si esta diferencia es estadísticamente significativa, para esto utilizaremos un
modelo ANOVA.
Consideremos el siguiente modelo de regresión:
donde:
101
Econometría
Este modelo es como cualquier otro modelo de regresión lineal, la única diferencia
que ahora todo nuestras variables explicativas son binarias. De esta forma, el salario
promedio de los individuos que viven en el norte es:
De igual forma el salario promedio de los individuos que viven en el sur es:
y por último, el salario promedio de los individuos que viven en el centro es:
102
Econometría
Los modelos ANOVA que acabamos de analizar no son muy frecuentes en

economía, sólo se utilizan para testear diferencias de medias.
Los modelos econométricos generalmente son más amplios e introducen tanto variables
explicativas continuas como dicotómicas. Por ejemplo, es razonable suponer que, además
del género, existen otros factores que explican el salario (educación y experiencia (entre
otros) siguiendo a Mincer (1974)).
Especifiquemos nuevamente el modelo:
103
Econometría
104
Econometría
Ahora, si quisiéramos especificar un modelo en que además las pendientes varíen con
el género (retornos a la educación diferenciados), tendríamos el siguiente modelo:
donde:
En el caso que existan otros regresores continuos (experiencia, por ejemplo), podría ser
deseable poseer efectos diferenciados en la pendiente sólo para algunos de ellos.
105
Econometría
Posibles usos de las variables Dummies
106
Econometría
Posibles usos de las variables Dummies

Como hemos mencionado las variable dummies pueden reflejar características
individuales como género, status marital,raza, etc, y de esta forma las habiamos
llamado variable cualitativas. Sin embargo, este no es el único motivo para incluir
dummies en una regresión.
Existen además aquellas dummies llamadas dummies estacionales cuyo objetivo es
controlar por factores temporales de los datos.
Las dummies también pueden ser útiles para captar efectos umbrales.
las dummies pueden ser de utilidad para cuantificar efectos condicionales.
Manejo algebraico de Dummies
Sea el modelo simple:
O en nuestra notación matricial usual:
107
Econometría
108
Econometría
Y con respecto a la varianza de los estimadores:
donde:
109
Econometría
Variable Dependiente Rezagada
Cuando trabajamos con series de tiempo, es posible que sea de nuestro interés incluir
rezagos de la variable dependiente como variables explicativas. Ello puede ocurrir
cuando creemos que existe cierta persistencia de nuestra variable dependiente.
Ejemplo:
110
Econometría
Regresión Particionada
Sea el siguiente modelo de regresión lineal con k regresores:
De esta forma, el modelo anterior puede ser reescrito como:
En términos matriciales estamos haciendo lo siguiente:
111
Econometría
Recordando que la estimación mínimos cuadrados ordinaria implica despejar el

vector de parámetros del sistema de ecuaciones normales
Lo que puede ser expresado de la siguiente forma:
112
Econometría
113
Econometría
También se puede demostrar que las matrices de varianzas y covarianzas de

ambos estimadores son:
114
Econometría
Omisión de Variables Relevantes

Impacto sobre el Insesgamiento
Considere el siguiente modelo poblacional (expresado en desvíos con respecto a

la media):
Suponga ahora que el investigador se equivoca y estima el siguiente modelo:
Estimando el modelo “incorrecto” obtenemos:
115
Econometría
Ello implica que por lo general, la omisión de variables relevantes (que pertenecen al
modelo poblacional), causará que los parámetros estimados sea sesgados. Ello no
sucederá, sólo en el caso que Z=0 (es decir que X1 y X2 sea ortogonales) o si ¯2=0
(aunque dicho caso es contradictorio, dado que implicaría que la variable no pertenece
al modelo poblacional).
De lo anterior, se desprende que la dirección del sesgo depende de como covarien

las variables incluidas con respecto a las excluidas y del signo del parámetro omitido.
116
Econometría
Impacto sobre la Varianza

Estimando el modelo ”incorrecto”, el estimador de la varianza será:
Tal que se puede demostrar que dicha matriz es definida positiva.

El omitir variables relevantes implica que los parámetros estimados serán sesgados y
que sus varianzas serán menores.
117
Econometría
Inclusión de Variable Irrelevantes
Impacto sobre Insesgamiento
Considere ahora el siguiente modelo poblacional:
Suponga ahora que el investigador se equivoca y estima el siguiente modelo:
Estimando el modelo “incorrecto” obtenemos:
118
Econometría
y con el mismo razonamiento, se puede demostrar que:
Es decir, la inclusión de variable irrelevantes no causa sesgo en los parámetros

estimados, ni en la varianza de los errores estimados. Bajo dichos resultados, pareciera
que es mejor poner muchos regresores en nuestro modelo. Sin embargo, nos falta
estudiar que sucede con la varianza de los parámetros estimados.
Impacto sobre Varianza
Recordemos que:
con lo cual, la varianza estimada:
119
Econometría
Mientras que la varianza verdadera:
La varianza verdadera es menor que la varianza estimada. Ello implica que el incluir
regresores adicionales, aumenta la varianza de nuestros parámetros estimados, lo cual se
traduce en parámetros menos eficientes.
120
Econometría
Perturbaciones no Esféricas
Un supuesto importante en el modelo clásico de regresión lineal (Supuesto 4) es

que los errores ui son homocedásticos, es decir la varianza es constante para todo
valor de Xi:
121
Econometría
Además se suponía que los términos de error no estaban correlacionados entre si
Consecuencias de estimación por MCO
Recordemos que el estimador MCO es:
122
Econometría
123
Econometría
Estimación Eficiente: Mínimos Cuadrados Generalizados
Bajo estas condiciones el Método de Mínimos Cuadrados Generalizados nos

permite estimar de manera eficiente los parámetros.
124
Econometría
Notemos que la ecuaci{on anterior es un modelo transformado de forma tal

que:
125
Econometría
126
Econometría
Estimación cuando es desconocida: Mínimos Cuadrados Factibles
127
Econometría
Heterocedasticidad
128
Econometría
La heterocedasticidad es un problema bastante recurrente, especialmente al trabajar

con datos de corte transversal. Algunas razones por las que ui puede variar son las
siguientes:
129
Econometría
130
Econometría
que no requiere una representación especifica de la forma funcional que adopta la

heterocedasticidad, por lo que no tendremos riesgo de asumir una forma funcional
incorrecta.
131
Econometría
la que se estima de la siguiente forma:
White demuestra bajo condiciones generales que:
De esta forma, una estimación consistente de la matriz de covarianzas es:
La estimación de White de una matriz consistente con Heterocedasticidad es un

resultado muy útil, ya que no se necesita saber la naturaleza de la Heterocedasticidad.
Ante la duda de presencia de este problema es mejor ocupar este estimador ya que no
produce alteraciones, y nos permite hacer inferencia correcta con o sin la presencia de
Heterocedasticidad.
132
Econometría
Contrastes de Heterocedasticidad:
133
Econometría
134
Econometría
135
Econometría
Si se sospecha que la varianza del error depende inversamente de zi, entonces las
observaciones se deben ordenar de mayor a menor. Si se llega a la conclusión de que el
término de error del modelo no presenta heterocedasticidad, podría deberse a que hemos
comenzado con una mala especificación del parámetro , que quizás depende de un
variable diferente a la que hemos supuesto. Por esta razón el contraste debería realizarse
varias veces con distintas variables de las que tengamos sospechas pueda depender la
varianza del término de error.
136
Econometría
137
Econometría
138
Econometría
139
Econometría
Autocorrelación
Luego, nuestra matriz de varianzas y covarianzas del error ya no será una matriz diagonal
(como en el caso de varianzas esféricas y no esférica pero sólo con heterocedasticidad) ya
que el término de error se encuentra correlacionado consigo mismo a través del tiempo.
La forma que toma la matriz cuando sólo tenemos autocorrelación pero los errores son
homocedásticos:
140
Econometría
Matriz de Varianzas y Covarianzas cuando ut es un AR(1):
En este caso el término de error tiene la forma señalada:
141
Econometría
142
Econometría
143
Econometría
Naturaleza y causas de la autocorrelación

Existe autocorrelación cuando el término de error de un modelo econométrico está
correlacionado consigo mismo a través del tiempo. Por supuesto, no es necesario
que ut este correlacionado consigo mismo sólo un periodo atrás, esta correlación
puede ser de cualquier orden, es decir, ut puede ser un AR(1), AR(2),...,AR(q), etc.
Así, dependiendo de cual sea el orden de la autocorrelación en el término de error,
la matriz de varianzas y covarianzas ira tomando distintas formas.
La autocorrelación en el término de error puede ser producida por varias causas:
Existencia de ciclos y tendencias

Un valor alto de ut que genera un valor de yt por sobre su media condicional, tendrá
una probabilidad elevada de ir seguido por un valor alto de ut+1, y por ello, de un
valor de yt+1 por encima del promedio; lo mismo ocurría para yt debajo del
promedio. Sin embargo, si existe autocorrelación negativa, valores de yt por sobre su
valor promedio condicional irán seguidos, con alta probabilidad, de valores de yt+1
por debajo de su promedio. Por lo tanto, la autocorrelación positiva esta asociada a
la existencia de rachas de valores altos y bajos de yt.
144
Econometría
Variables omitidas: Omisión tanto de variables relevantes, de no linealidades y de

relaciones dinámicas (rezagos de la variable dependiente) serán incorporadas al
término de error, causando posible autocorrelación
145
Econometría
De esta forma, MCO sigue siendo insesgado, pero pierde eficiencia, por lo cual ya no
es MELI. El estimador de mínima varianza en este contexto es MCG, y en caso de
desconocerse la forma de la autocorrelación se debe utilizar MCF.
146
Econometría
147
Econometría
Respecto a los valores críticos del test, la distribución en muestras finitas

depende del supuesto de normalidad de los errores y de la matriz X, por lo cual
Durbin y Watson derivaron las tablas de valores de críticos para facilitar la
aplicación del test. Sin embargo, dichos valores poseen rangos indeterminados,
en los cuales no podemos tomar una decisión respecto a la nula. El test
distribuye con dos colas y se presenta en la siguiente figura:
148
Econometría
149
Econometría
150
Econometría
3. Test de Breusch y Godfrey Este test es una alternativa para testear

autocorrelaciones de ordenes superiores a 1. La nula, al igual que en todos los
test de autocorrelación es que los residuos no se encuentran correlacionados.
Consideremos para distintos valores de k, el siguiente conjunto de estadísticos:
151
Econometría
152
Econometría
Estimación de Modelos con Autocorrelación
153
Econometría
Entonces utilizando esta matriz P podemos transformar el modelo y aplicar

Mínimos Cuadrados Generalizados. Al premultiplicar X e Y por la matriz P
tendremos que la primera observación se transforma de la siguiente forma:
Y para el resto de las (T -1) observaciones la transformación es la siguiente:
El que la primera observación de la muestra tenga un trato especial, es porque

para ella no existe una observación anterior, y por lo tanto, es imposible aplicar
la transformación en
154
Econometría
La matriz P que transforma nuestro modelo en un libre de autocorrelación en el

error, es tal que cada observación de las variables dependientes, explicativas y
término de error, se debe transformar de acuerdo a:
Si es que nuestro modelo es el siguiente:
155
Econometría
156
Econometría
Problema con los datos
Es prácticamente imposible encontrar dos variables económicas cuyo coeficiente de

correlación es una determinada muestra sea numéricamente cero, dicho coeficiente
puede tomar valores pequeños pero nunca llegar a ser cero.
Granger y Newbold (1974) entre otros autores han ilustrado como el sólo hecho de
introducir una tendencia lineal en dos series de tiempo independientes aumenta su
correlación notablemente.
La Multicolinealidad aparece cuando las variables explicativas en modelo

econométrico están correlacionadas entre si, esto tiene efectos negativas cuando se
quire estimar los parámetros del modelo por MCO.
157
Econometría
Existen diversas fuentes de la multicolinealidad:

El método de recolección de información empleado, obtención de muestras en un intervalo
limitado de valores de los regresores en la población.
Restricción en el modelo o en la población objeto de muestreo.
Especificación del modelo.
Consideremos el siguiente modelo:
158
Econometría
1. La solución del sistema de ecuaciones normales está mal definido: mientras la

dependencia de Xji sea aleatoria y no exacta, X’X no será exactamente singular y existirá un
único estimador MCO, ya que existe una única solución al sistema de ecuaciones normales,
pero también habrá un número de vectores que al sustituirlos en el sistema de
ecuaciones normales, serían aproximadamente una solución al mismo.
2. Pequeñas variaciones muestrales por incorporar o sustraer un número reducido de

observaciones muestrales, introducirá ligeros cambios en (X’X) y X’y, pero podrían generar
importantes cambios en la solución del sistema de ecuaciones normales.
3. Al ser la matriz X’X casi singular, es muy pequeña. Como consecuencia la matriz de
covarianzas será muy grande, por lo tanto el estimador MCO es poco preciso en este caso.
159
Econometría
Multicolinealidad Exacta y Multicolinealidad Aproximada
La presencia de multicolinealidad en un modelo de regresión lineal puede ser

de dos formas:
Multicolinealidad Exacta: una de las variables explicativas es una combinación lineal

determinística de todas las demás (o algunas de ellas).
Multicolinealidad Aproximada: ocurre cuando una de las variables es

aproximadamente igual a una combinación lineal de las restantes.
Detección de Multicolinealidad
Puesto que la multicolinealidad es un problema de naturaleza muestral, que surge

principalmente por el carácter no experimental de la mayoría de la información
recopilada en las Ciencias Sociales, no tiene una manera única de ser detectada. Lo
que se tiene son algunas reglas prácticas detalladas a continuación:
160
Econometría
1. El R2 es alto, pero los parámetros no resultan ser individualmente significativos.

Por ejemplo: Considere los siguientes datos:
161
Econometría
2. Pequeños cambios en los datos, produce importantes variaciones en las estimaciones

mínimo cuadráticas.
3. Los coeficientes pueden tener signos opuestos a los esperados o una magnitud
poco creíble.
162
Econometría
163
Econometría
Otros métodos de detección de multicolinealidad
164
Econometría
165
Econometría
166
Econometría
De acuerdo con este análisis, los coeficientes de determinación obtenidos en

las regresiones de cada variable explicativa con el resto son un buen indicador
de una posible situación de multicolinealidad.
167
Econometría
168
Econometría
169
Econometría
Remedios contra la Multicolinealidad
Se han propuesto varios métodos para hacer frente a la multicolinealidad. La

solución más sencilla es eliminar de la regresión las variables que se sospeche son la
causa del problema. Obviamente de este método surgen problemas de
especificación, como la omisión de variables relevantes. Es necesario recordar que el
estimador MCO sigue siendo el mejor estimador lineal insesgado de los parámetros.
El problema es que, cuando hay multicolinealidad, el mejor no resulta ser muy bueno.
Las soluciones propuestas en la literatura (estimador de ridge o estimador cresta y

estimador de componentes principales) tienen como característica buscar un
estimador ligeramente sesgado pero cuya varianza sea mucho menor, es decir, un
estimador con menor error cuadrático medio. No existe una metodología que
permita eliminar el problema de alta multicolinealidad sin alterar las propiedades y
la interpretación de los parámetros.
Estas metodologías tienen poco respaldo intuitivo, por lo tanto la interpretación

de los parámetros es desconocida.
170
Econometría
Error de Medición
Una dificultad en todo trabajo empírico en Economía es la imposibilidad de disponer
de las observaciones muestrales de las variables de interés. Por ejemplo, las variables
de contabilidad nacional como el PIB, stock de capital o consumo, son sólo
estimaciones de conceptos teóricos que no se observan en la realidad. En otros casos,
como la Renta Permanente, inteligencia o habilidad de un trabajador, no disponemos
ni siquiera estimaciones, y debemos utilizar variables Proxies, que aproximan los
conceptos que se quieren utilizar. Así por ejemplo se utilizan años de experiencia del
trabajador para aproximar su habilidad.
Podemos adelantar que el error de medición o el uso de variables proxies generará sesgos
en las estimaciones por MCO, el que será menor cuanto más se aproxime la verdadera
variable que debería incluirse en el modelo con que incluyo efectivamente. Cuanto más
independiente sea el error de medida de las restantes variables del modelo.
171
Econometría
Consideremos el siguiente modelo lineal simple:
172
Econometría
Ahora supongamos que la variable xi está medida con error, es decir:
contrario a lo que ocurría en anteriormente en este caso tenemos dificultad al

estimar por MCO, ya que el término de error está correlacionado con el regresor.
173
Econometría
Estimación por Variables Instrumentales
La estimación consistente de los parámetros en presencia de errores de medida es posible si

se disponen de instrumentos.
Definición: Un instrumento es una variable no incluida en el modelo, que cumple con:
No estar correlacionada con el término de error.

Esta correlacionada con la variable explicativa para la cual actúa como instrumento (en
este caso la variable medida con error).
el sesgo del estimador MCO de surge por la correlación entre la variable y

Supongamos ahora que se dispone de la variable zi, tal que:
174
Econometría
175
Econometría
Con matriz de varianzas y covarianzas:
176
Econometría
Test de Hausman
Bajo errores de medida, el estimador MCO es inconsistente, mientras que el estimador
de variables instrumentales es consistente. Si en realidad no hubiese errores de medida,
ambos estimadores serán consistentes, y MCO es además eficiente, lo que no ocurre con
cualquier estimador de variables instrumentales (es un estimador en dos etapas, lo que
hace perder eficiencia).
177
Econometría
Selección de Modelos
Una pregunta crucial que se enfrenta en econometría aplicada es como escoger entre
diversas especificaciones planteadas para responder una misma pregunta. No existe un
respuesta única al problema anterior, sin embargo, algunas recomendaciones son:
Elegir el modelo más parsimonioso (lo más pequeño posible)

Que posea un buen ajuste
Que sea consistente con los datos observados
Sin embargo, en el caso de tener que elegir entre modelos anidados, es posible utilizar
los llamados Criterios de Información. Suponga que usted desea escoger entre alguno de
los siguientes modelos:
178
Econometría
La pregunta relevante es ¿Cuál de las tres especificaciones anteriores es mejor?.

Los criterios de información nos ayudan a responder dicha pregunta.
El primer criterio de información es el Criterio de Akaike (ACI) y se define como:
mientras que el Criterio de Schwarz (BIC) se define como:
Luego, el criterio de selección entre modelos anidados corresponde a elegir el

modelo con menor criterio de información. Note que para que los criterios sean
comprables, deben poseer el mismo tamaño de muestra.
179
Econometría
Estimación Máximo Verosímil (EMV)

A diferencia de MCO, el EMV descansa en un determinado supuesto respecto de la
distribución del término de error, teniendo por objetivo, como veremos más
adelante, determinar los parámetros que maximicen la probabilidad de ocurrencia
de la muestra observada. La ventaja de MV es que puede producir estimadores
consistentes y asintóticamente eficientes cuando MCO falla.
Note que hemos invertido la notación entre L y la densidad. Ello porque la densidad escribe
los valores probables de Y dado un vector µ determinado, sin embargo, en nuestro caso el
sentido es inverso: estamos interesados en el vector µ dado un vector Y determinado.
180
Econometría
181
Econometría
Propiedades de los estimadores MV

Las propiedades de los estimadores ML se derivan en grandes muestras, por lo cual
hablaremos de las propiedades asintóticas de los mismos. Ellas son:
1. Consistencia:
Es decir, asintóticamente, el parámetro estimado corresponde al parámetro poblacional.

2. Eficiencia Asintótica:
La varianza del estimador MV alcanza la llamada Cota Inferior de Cramer Rao, es decir .
Esta propiedad asintótica es la principal virtud de los estimadores MV. La cota inferior de
Cramer Rao corresponde al inverso de la matriz de información, la cual corresponde a la
mínima varianza que puede poseer un estimador insesgado.
182
Econometría
3. Normalidad Asintótica:
donde note que la matriz hessiana de segundas derivadas de L es una matriz cuadrada y
simétrica de orden kxk.
183
Econometría
Estimación por MV
Como ya es usual, sea el siguiente modelo poblacional:
184
Econometría
Luego, dado nuestro modelo poblacional, tenemos que:
185
Econometría
186
Econometría
Nos queda entonces derivar la varianza de los estimadores MV. Vimos que la matriz de
varianzas correspondía al inverso de la matriz de información Por facilidad de cálculo,
generalmente se utiliza la segunda definición de es decir, la de las segundas derivadas
de la función de verosimilitud. Entonces:
187
Econometría
188
Econometría
189
Econometría
190
Econometría
Inferencia en el contexto MV
Test de Razón de Verosimilitud (LR)
191
Econometría
El test LR se define entonces como:
Donde q corresponde al número de restricciones impuestas

Intuitivamente, el valor del estadígrafo crecerá a mayor sea la discrepancia entre los
valores de la verosimilitud restringida y la no restringida, lo cual nos aleja de la
posibilidad que las restricciones impuestas sea válidas
192
Econometría
193
Econometría
Test de Wald (W)
194
Econometría
donde q es el número de filas de R y por lo tanto, el número de restricciones.

Luego, como los estimadores MV distribuyen asintóticamente normales, entonces la
matriz de información expuesta es válida en muestras grandes, tenemos que el
estadístico de Wald se define como:
Una nota: Dijimos que el test era válido asintóticamente, donde hemos utilizado el
resultado de normalidad asintótica de MV. En caso de que los errores efectivamente
distribuyan normal en muestra finita, el test (lógicamente) mantiene su distribución.
195
Econometría
Test del Multiplicador de Lagrange (LM)

Un tercer test corresponde al test LM, el cual también es conocido como el test del
Score. recordemos que el Score corresponde a la matriz de primeras derivadas de la
función de Verosimilitud:
196
Econometría
Note que contraposición al test de Wald, sólo necesitamos calcular el estimador

restringido. De hecho, su popularidad reside en que muchas veces es más fácil
calcular el estimador restringido que el irrestricto.
Dada la normalidad asintótica de los estimadores MV, podemos reducir el

estadígrafo a una forma mucho más simple. Para ver lo anterior, considere una
notación matricial del score:
197
Econometría
entonces, para evaluar el score en la estimación restringida, utilizamos los residuos

restringidos, los cuales denotaremos por:
y por lo tanto: con lo cual:
Entonces, tomado en cuenta la definición de y evaluándola en el estimador

restringido, tenemos que nuestro test queda como:
198
Econometría
199
Econometría
Del ejercicio anterior:
200
Econometría
201
Econometría
202
Econometría
203
Econometría
204
Econometría
205
Econometría
206
Econometría
Algunas acotaciones respecto a la estimación y la inferencia MV
1. Se asumió que la distribución de los errores sigue una distribución

normal. Sin embargo, suponer errores normales es sólo uno de los
posibles supuestos respecto a la distribución de los errores. Existe una
gran cantidad de posibilidades al respecto, utilizándose otras como la
distribución logística y la exponencial, muy regularmente en otros
tópicos econométricos. Lo anterior es una ventaja de la estimación MV,
dado que sus propiedades asintóticas se mantienen independientemente
de la distribución utilizada.
2. Otra ventaja corresponde a la posibilidad de utilizar modelos no lineales.

MCO (tal y como lo hemos estudiado) sólo permite estimar modelos
lineales en parámetros, mientras que MV permite no linealidades
(aunque ello implique la imposibilidad de obtener de obtener formas
funcionales cerradas para nuestros estimadores, lo cual implica
necesariamente utilizar métodos numéricos para optimizar la función
objetivo).
207
Econometría
3. Otra ventaja reside en la inferencia. Toda la inferencia vista en MCO poseía distribución
exacta bajo el supuesto de normalidad. Los test asintóticos visto en la inferencia MV son
válidos bajo cualquier distribución supuesta (aunque asintóticamente).
4. Adicionalmente, los tres test vistos son capaces de lidiar con restricciones no lineales. ¿Por
qué? Porque MV es capaz de lidiar con modelos no lineales.
5. Es posible demostrar que W >= LR >= LM al ser aplicados a un modelo lineal. Los tres son
asintóticamente equivalentes, sin embargo, en muestras finitas arrojarán resultados
diferentes.
6. ¿Cuándo es recomendable utilizar un test t o un test F por sobre un test asintótico?
7. Todos los paquetes estadísticos reportan el valor de la función de verosimilitud (es decir, la
función evaluada en los parámetros estimados). Ello, muchas veces es utilizado como un
criterio de selección entre modelos (recuerde que nuestro objetivo es maximizar la función de
verosimilitud).
208

Econometría Uni

Загружено:

Сведения о документе

Исходное описание:

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

Econometría Uni

Загружено:

Авторское право:

Доступные форматы

Econometría

Econometría es la ciencia que aplica métodos matemáticos y estadísticos al

¿Qué es una regresión?

Relaciones estadísticas versus relaciones determinísticas

El Análisis de Correlación está estrechamente relacionado con el de regresión aunque

Algunas precauciones con el coeficiente de correlación:

La unión de los valores esperados condicionales representa la Recta de regresión poblacional,

Definición: La curva de regresión poblacional es simplemente el lugar geométrico de las

Función de regresión poblacional (FRP)

Especificación estocástica de la función de regresión poblacional

Función de regresión muestral

Función de regresión muestral

Modelo de regresión con dos variables

Método de Mínimos Cuadrados Ordinarios

Supuestos detrás del método MCO:

Modelo con “k” variables

El modelo de regresión profesional tomaría la siguiente forma:

Ahora debemos expresar la distribución del término de error en términos matriciales:

De los supuestos 3, 4 y 5, tenemos entonces que el término de error tiene la siguiente

Estimador Mínimo Cuadrados Ordinarios

De esta forma, el vector de parámetros estimados de se obtiene de resolver el

1. Las k columnas de la matriz X sean linealmente independientes.

Pongamos atención en el segundo supuesto, cuando n=k

Para lograr estimaciones precisas de los parámetros, es necesario tener un número de

Propiedades del estimador MCO

El estimador de MCO es insesgado

Varianza del estimador:

Para poder estimar la varianza de necesitamos reemplazar por su estimador

Propiedad de mejor estimador lineal insesgado

Aplicando esperanza a la expresión anterior:

El estimador será insesgado solo si la matriz A es tal que . De esta forma:

Bondad de Ajuste y Análisis de Varianza

Sea el modelo poblacional usual con k variables:

donde i = 1 : n y cuya contraparte estimada es:

La expresión es similar a la anterior, excepto por dos importantes diferencias.

donde I es la identidad (nxn) e i corresponde al vector unitario de dimensión n. Dicha

Donde Y corresponde a una vector n x 1, X corresponde a nuestra matriz de regresores

Sea TSS: Suma de los cuadrados totales

La igualdad anterior es conocida como la descomposición de varianza. El término de la

es decir, como la proporción de la varianza de Y que es explicada por la varianza

3. Al agregar regresores al modelo, el R2 nunca decrecerá (se mantendrá constante o

4. No es claro cuan bueno sea como predictor de ajuste.

donde X es un vector (n x1). Suponga ahora que restamos X a ambos lados de

Si , entonces es fácil verificar que el R2 del primer modelo será cercano a 1,

3. H0: βi + βj =1 Plantea que la suma de los regresores Xi y Xj poseen un impacto

4. H0: βi = βj Plantea que los regresores Xi y Xj poseen el mismo impacto sobre Y.

5. H0: βi =0 ; i=2: : : k ) Plantea que todos los regresores conjuntamente, excepto

6. H0: βl =0 donde el vector β ha sido particionado en dos (βl y βp ) con

Todas las hipótesis anteriores pueden ser resumidas en la siguiente expresión:

Entonces, nuestra hipótesis nula corresponde a:

luego estandarizamos, con lo cual:

Además, se puede demostrar que

Luego, se puede demostrar que

Luego, combinando los dos resultados anteriores, se puede demostrar que

Test t (Una hipótesis lineal)

Reescribiendo el test F como:

Recordando que t2 es una caso particular de una F con un grado de libertad en

La distribución t es simétrica y se aproxima a la normal para tamaños de muestras

Toda la derivación anterior se basa en el estricto supuesto de normalidad de los

Criterio de Rechazo y Nivel de Confianza

El nivel de confianza posee una explicación intuitiva: Nuestro estadígrafo es función de la

La forma en que se distribuya la probabilidad de rechazo, es decir, el nivel de

Test de una cola

PRECIO = 2553.21066ENTRADAS + 12529.76817OFICINAS + 27.64138737*SUPERFICIE -