Академический Документы
Профессиональный Документы
Культура Документы
Econometría
Universidad Nacional de Ingenieria
Setiembre 2013
1
Econometría
"La experiencia ha mostrado que cada uno de estos tres puntos de vista, el de la
estadística, la teoría económica y las matemáticas, es necesario, pero por si
mismo no suficiente para una comprensión real de las relaciones cuantitativas
de la vida económica modera. Es la unión de los tres aspectos lo que constituye
una herramienta de análisis potente. Es la unión lo que constituye la
econometría".
2
Econometría
3
Econometría
Análisis de Regresión
4
Econometría
Análisis de Regresión
Regresión versus Causalidad
La regresión es una relación estadística, que no implica causalidad apriori.
Regresión versus Correlación
5
Econometría
Análisis de Regresión
6
Econometría
•Cuidado cuando el grado de correlación muestral depende de solo unas pocas observaciones.
•El coeficiente de correlación mide una relación lineal. Por lo tanto, una variable puede
depender de otra aún cuando la correlación sea cero si la relación es no lineal.
•Correlación no implica causalidad económica, es sólo una relación estadística.
•Correlación puede indicar relación espuria.
•No olvidar que la correlación muestral es una variable aleatoria y que por lo tanto, el
coeficiente por si sólo no garantiza la existencia de una relación estadística entre las series.
7
Econometría
8
Econometría
9
Econometría
10
Econometría
11
Econometría
Población
Muestra
12
Econometría
Población
Muestra
13
Econometría
Definición: Un estimador es una regla, fórmula o método que dice cómo determinar el
parámetro poblacional a partir de la información suministrada por la muestra disponible.
14
Econometría
15
Econometría
Propiedades de un Estimador
16
Econometría
Propiedades de un Estimador
17
Econometría
Propiedades de un Estimador
18
Econometría
19
Econometría
20
Econometría
21
Econometría
22
Econometría
23
Econometría
ecuaciones normales
24
Econometría
25
Econometría
26
Econometría
27
Econometría
28
Econometría
29
Econometría
30
Econometría
31
Econometría
32
Econometría
33
Econometría
34
Econometría
Representación matricial
35
Econometría
36
Econometría
Donde:
Entonces el problema de minimizar la suma de los errores al cuadrado se expresa de
la siguiente forma:
37
Econometría
Condición de ortogonalidad:
38
Econometría
39
Econometría
Es importante recordar que el estimador MCO esta definido solo cuando la matriz (X’X)
es invertible, lo que ocurre siempre y cuando:
Sin embargo, esta no es una característica deseable, el ajuste perfecto ocurre porque tenemos
una muestra muy reducida. Esto trae como consecuencia poco robustez e imprecisión en las
estimaciones.
40
Econometría
41
Econometría
42
Econometría
43
Econometría
44
Econometría
Luego, si sumamos para todas las observaciones y dividimos a ambos lados por el tamaño
muestral n, tenemos:
45
Econometría
46
Econometría
Por lo tanto, nuestro modelo expresado en matrices, puede ser expresado en términos
de desvío con respecto a la media como:
47
Econometría
Análisis de Varianza
Suponga entonces el siguiente modelo poblacional:
48
Econometría
con lo cual, al particionar nuestra matriz X en , nuestro vector de parámetros
en y considerando que 0 y que , tenemos que:
49
Econometría
Bondad de Ajuste:
Definimos entonces la bondad de ajuste del modelo a través del siguiente estadígrafo
llamado también coeficiente de determinación:
50
Econometría
Note que:
1. El coeficiente de determinación es siempre menor a 1. Ello porque RSS <=TSS y por lo tanto
RSS/TSS <= 1.
2. El análisis de varianza anterior fue derivado bajo el supuesto que el modelo incluía una
constante (por ello utilizábamos la matriz M0). En dicho caso, necesariamente R2>= 0. En caso
de que el modelo no incluya una constante, se debe utilizar la fórmula utilizando TSS=Y’Y (sin
desvíos).
Para ver este último punto, suponga que usted posee el siguiente modelo poblacional:
51
Econometría
52
Econometría
Inferencia
53
Econometría
Sean entonces las siguientes hipótesis:
1. H0: βi = 0 Plantea que el regresor Xi no posee influencia alguna sobre Y.
Este es el test más común y nos referiremos a él como test de significancia.
2. H0: βi = βi0 Plantea que el regresor Xi posee un impacto determinado por Xi0
sobre Y.
54
Econometría
donde R es una matriz de (qxk) constantes conocidas (ceros o unos), cuyo objetivo será
seleccionar los parámetros a testear, cuyo número de filas, q, representa el número de
restricciones. A su vez, r es un vector de dimensión q y contiene el real al cual es
restringido cada parámetro. Veamos como serán las matrices R y r en cada una de
nuestras hipótesis:
55
Econometría
Con lo cual, sólo nos resta derivar el test que nos permita rechazar o no rechazar
nuestra nula. La construcción del estadígrafo es como sigue.
Esperanza
Varianza
56
Econometría
y si la nula Rβ = r es cierta:
57
Econometría
58
Econometría
El test expuesto corresponde a la forma general del test F. Dicho test es de utilidad
para testear cualquier hipótesis.
59
Econometría
60
Econometría
61
Econometría
Nota precautoria:
Una vez que hemos calculado el valor del test para nuestra nula particular (o valor
calculado), resta calcular el valor crítico o el valor que nos indica la tabla t.
62
Econometría
Dicho valor crítico nos dirá si nuestra nula es falsa o si no podemos afirmar que lo es.
La elección de dicho valor crítico se toma desde la tabla de distribución t y el número
debe ser escogido tomado en cuenta el nivel de significancia escogido (1 %, 5% o 10
%), el cual a su vez determina el nivel de confianza del test (99 %, 95% o 90 %,
respectivamente).
63
Econometría
64
Econometría
65
Econometría
66
Econometría
El óptimo para el investigador sería minimizar ambos tipos de errores y tener un test
con un menor tamaño y mayor potencia posibles, sin embargo, note que el tamaño del
test y por lo tanto, el ETI, es una variable endógena al investigador, en tanto que él
decide con que nivel de confianza trabajar. Luego, el objetivo se transforma en, dado un
nivel de confianza, minimizar la ocurrencia de ETII. Intuitivamente, si usted escoge un
nivel de significancia pequeño (1 %, por ejemplo), sus zonas de rechazo serán
pequeñas, con lo cual, inevitablemente, la zona de no rechazo crece, lo cual implica que
por minimizar el ETI, ha aumentado el ETII.
67
Econometría
P-value
Otra forma alternativa al valor crítico de tabla para rechazar o no rechazar nuestra nula,
corresponde al uso de los llamados p-values, los cuales son reportados en cualquier
paquete estadístico. El p-value (p) se define como:
68
Econometría
Ejemplo:
69
Econometría
Primero veamos el ajuste de este modelo, es decir, en que grado la variable x explica a
la variable y, para lo cual calculemos el
Como podemos ver, el grado de ajuste del modelo es bastante bueno, como el modelo
incluye constante, el R2 se puede interpretar como la proporción de la variabilidad de la
variable independiente que es explicada por la variabilidad de la variable dependiente, la
que en este caso alcanza un 97 %.
70
Econometría
71
Econometría
72
Econometría
Todas las pendientes del modelo son cero: En este caso, se puede demostrar que el
test F puede expresarse como:
Un subconjunto de las pendientes del modelo son cero: En este caso, se puede
demostrar que el test F puede expresarse como:
Intervalos de Confianza
Una forma alternativa (o mejor dicho complementaria) de examinar la significancia
estadística de un parámetro ( o un conjunto de ellos) es a través de intervalos de
confianza (IC). Ellos nos indican, dado un nivel de confianza, el rango de valores
admisibles del coeficiente que se estima. Los niveles de confianza generalmente
utilizados son 99 %, 95% y 90% (al igual que en los test de hipótesis), donde el tamaño
de los mismos es necesariamente decreciente.
75
Econometría
76
Econometría
Note además que dicho intervalo está construido sólo en base a constantes conocidas.
Una vez construido, se puede contrastar la nula al nivel de significancia
sencillamente observando si pertenece al intervalo (en cuyo caso no rechazamos la
nula) o se encuentra fuera de él (en cuyo caso rechazamos la nula)10. Nuevamente, la
validez de dicho intervalo de confianza depende críticamente del supuesto de
distribución de los errores. En el caso que el valor se obtenga de la tabla t, como ya
sabemos, estamos suponiendo que los errores siguen una distribución normal. Un caso
más general es utilizar los valores críticos de la distribución normal estándar.
77
Econometría
78
Econometría
Test de normalidad
Consideramos ahora el problema de utilizar los momentos de los residuos MCO para
hacer inferencia sobre la distribución de los errores poblacionales. Dado que algunas
de las propiedades de MCO y de la inferencia dependen del supuesto de normalidad
en los errores, es importante poseer un contraste para dicho supuesto.
79
Econometría
80
Econometría
Note que el estadígrafo está definido en términos del exceso de kurtosis, por lo cual,
a menor sea el valor, menor es la probabilidad de rechazar la nula de normalidad.
Note además que el estadístico es esencialmente no constructivo, en términos de
que no nos indica que camino seguir en caso de rechazar la nula, además de que no
rechazar normalidad no implica confirmar su existencia. Sin embargo, en la práctica
corresponde al test más utilizado.
81
Econometría
Predicción
La predicción es una de las herramientas más atractivas y utilizadas en Econometría. Si el
modelo que hemos escogido confirma la teoría en consideración, es decir, ha sobrevivido a
las pruebas de hipótesis, podemos utilizar el modelo estimado para predecir. La
predicción se puede efectuar para un valor puntual de la variable dependiente, y0,
correspondiente a un valor dado de los regresores, x0, o predecir el valor esperado
condicional a las variables explicativas.
82
Econometría
83
Econometría
84
Econometría
85
Econometría
86
Econometría
Ejemplo:
Supongamos que un analista comercial está pensando en construir un edificio
comercial para luego vender. Sin embargo, no sabe cuales son las características que
debiera tener el edificio para maximizar su rentabilidad. Para descubrir esto el se
propone realizar un análisis de regresión.
87
Econometría
88
Econometría
89
Econometría
Podemos ver que la distribución de los errores no es del todo simétrica (Skewness =
1,2) y que tampoco presenta un comportamiento mesocurtico (Kurtosis = 3). Ambos
elementos se ven reflejados en el estadísitico Jarque - Bera, el cual cae en la zona de
rechazo (Ver además p -value).
90
Econometría
Con los parámetros estimados es posible realizar predicciones del valor de un edificio
particular condicional a sus características.
Por ejemplo podría calcular el valor tasado de un edificio de oficinas en la misma zona
con 2500 metros cuadrados, tres oficinas, dos entradas y una antiguedad de 25 años. Es
decir realizar predicciones fuera de la muestra.
= 158261.1
91
Econometría
92
Econometría
Incorporación de No Linealidades
93
Econometría
94
Econometría
95
Econometría
96
Econometría
Ejemplo:
97
Econometría
98
Econometría
y el modelo como
99
Econometría
Los tres modelos anteriores son equivalentes. Note que en el tercer modelo no
incluimos término constante ya que ello haría que la matriz X fuese singular y por lo
tanto, no invertible. Dicho error de especificación es llamado en la literatura Trampa
de las Dummies y corresponde a un error netamente del investigador, no de los datos.
100
Econometría
Estos números son claramente diferentes entre sí, pero lo que nos interesa saber
es si esta diferencia es estadísticamente significativa, para esto utilizaremos un
modelo ANOVA.
donde:
101
Econometría
Este modelo es como cualquier otro modelo de regresión lineal, la única diferencia
que ahora todo nuestras variables explicativas son binarias. De esta forma, el salario
promedio de los individuos que viven en el norte es:
De igual forma el salario promedio de los individuos que viven en el sur es:
y por último, el salario promedio de los individuos que viven en el centro es:
102
Econometría
Los modelos econométricos generalmente son más amplios e introducen tanto variables
explicativas continuas como dicotómicas. Por ejemplo, es razonable suponer que, además
del género, existen otros factores que explican el salario (educación y experiencia (entre
otros) siguiendo a Mincer (1974)).
103
Econometría
104
Econometría
Ahora, si quisiéramos especificar un modelo en que además las pendientes varíen con
el género (retornos a la educación diferenciados), tendríamos el siguiente modelo:
donde:
En el caso que existan otros regresores continuos (experiencia, por ejemplo), podría ser
deseable poseer efectos diferenciados en la pendiente sólo para algunos de ellos.
105
Econometría
106
Econometría
107
Econometría
108
Econometría
donde:
109
Econometría
Cuando trabajamos con series de tiempo, es posible que sea de nuestro interés incluir
rezagos de la variable dependiente como variables explicativas. Ello puede ocurrir
cuando creemos que existe cierta persistencia de nuestra variable dependiente.
Ejemplo:
110
Econometría
Regresión Particionada
111
Econometría
112
Econometría
113
Econometría
114
Econometría
115
Econometría
Ello implica que por lo general, la omisión de variables relevantes (que pertenecen al
modelo poblacional), causará que los parámetros estimados sea sesgados. Ello no
sucederá, sólo en el caso que Z=0 (es decir que X1 y X2 sea ortogonales) o si ¯2=0
(aunque dicho caso es contradictorio, dado que implicaría que la variable no pertenece
al modelo poblacional).
116
Econometría
117
Econometría
118
Econometría
y con el mismo razonamiento, se puede demostrar que:
Recordemos que:
119
Econometría
La varianza verdadera es menor que la varianza estimada. Ello implica que el incluir
regresores adicionales, aumenta la varianza de nuestros parámetros estimados, lo cual se
traduce en parámetros menos eficientes.
120
Econometría
Perturbaciones no Esféricas
121
Econometría
122
Econometría
123
Econometría
124
Econometría
125
Econometría
126
Econometría
127
Econometría
Heterocedasticidad
128
Econometría
129
Econometría
130
Econometría
131
Econometría
132
Econometría
Contrastes de Heterocedasticidad:
133
Econometría
134
Econometría
135
Econometría
Si se sospecha que la varianza del error depende inversamente de zi, entonces las
observaciones se deben ordenar de mayor a menor. Si se llega a la conclusión de que el
término de error del modelo no presenta heterocedasticidad, podría deberse a que hemos
comenzado con una mala especificación del parámetro , que quizás depende de un
variable diferente a la que hemos supuesto. Por esta razón el contraste debería realizarse
varias veces con distintas variables de las que tengamos sospechas pueda depender la
varianza del término de error.
136
Econometría
137
Econometría
138
Econometría
139
Econometría
Autocorrelación
Luego, nuestra matriz de varianzas y covarianzas del error ya no será una matriz diagonal
(como en el caso de varianzas esféricas y no esférica pero sólo con heterocedasticidad) ya
que el término de error se encuentra correlacionado consigo mismo a través del tiempo.
La forma que toma la matriz cuando sólo tenemos autocorrelación pero los errores son
homocedásticos:
140
Econometría
141
Econometría
142
Econometría
143
Econometría
144
Econometría
145
Econometría
De esta forma, MCO sigue siendo insesgado, pero pierde eficiencia, por lo cual ya no
es MELI. El estimador de mínima varianza en este contexto es MCG, y en caso de
desconocerse la forma de la autocorrelación se debe utilizar MCF.
146
Econometría
147
Econometría
148
Econometría
149
Econometría
150
Econometría
151
Econometría
152
Econometría
153
Econometría
154
Econometría
155
Econometría
156
Econometría
Granger y Newbold (1974) entre otros autores han ilustrado como el sólo hecho de
introducir una tendencia lineal en dos series de tiempo independientes aumenta su
correlación notablemente.
157
Econometría
158
Econometría
3. Al ser la matriz X’X casi singular, es muy pequeña. Como consecuencia la matriz de
covarianzas será muy grande, por lo tanto el estimador MCO es poco preciso en este caso.
159
Econometría
Detección de Multicolinealidad
160
Econometría
161
Econometría
3. Los coeficientes pueden tener signos opuestos a los esperados o una magnitud
poco creíble.
162
Econometría
163
Econometría
164
Econometría
165
Econometría
166
Econometría
167
Econometría
168
Econometría
169
Econometría
170
Econometría
Error de Medición
Una dificultad en todo trabajo empírico en Economía es la imposibilidad de disponer
de las observaciones muestrales de las variables de interés. Por ejemplo, las variables
de contabilidad nacional como el PIB, stock de capital o consumo, son sólo
estimaciones de conceptos teóricos que no se observan en la realidad. En otros casos,
como la Renta Permanente, inteligencia o habilidad de un trabajador, no disponemos
ni siquiera estimaciones, y debemos utilizar variables Proxies, que aproximan los
conceptos que se quieren utilizar. Así por ejemplo se utilizan años de experiencia del
trabajador para aproximar su habilidad.
Podemos adelantar que el error de medición o el uso de variables proxies generará sesgos
en las estimaciones por MCO, el que será menor cuanto más se aproxime la verdadera
variable que debería incluirse en el modelo con que incluyo efectivamente. Cuanto más
independiente sea el error de medida de las restantes variables del modelo.
171
Econometría
172
Econometría
173
Econometría
174
Econometría
175
Econometría
176
Econometría
Test de Hausman
Bajo errores de medida, el estimador MCO es inconsistente, mientras que el estimador
de variables instrumentales es consistente. Si en realidad no hubiese errores de medida,
ambos estimadores serán consistentes, y MCO es además eficiente, lo que no ocurre con
cualquier estimador de variables instrumentales (es un estimador en dos etapas, lo que
hace perder eficiencia).
177
Econometría
Selección de Modelos
Una pregunta crucial que se enfrenta en econometría aplicada es como escoger entre
diversas especificaciones planteadas para responder una misma pregunta. No existe un
respuesta única al problema anterior, sin embargo, algunas recomendaciones son:
178
Econometría
179
Econometría
Note que hemos invertido la notación entre L y la densidad. Ello porque la densidad escribe
los valores probables de Y dado un vector µ determinado, sin embargo, en nuestro caso el
sentido es inverso: estamos interesados en el vector µ dado un vector Y determinado.
180
Econometría
181
Econometría
La varianza del estimador MV alcanza la llamada Cota Inferior de Cramer Rao, es decir .
Esta propiedad asintótica es la principal virtud de los estimadores MV. La cota inferior de
Cramer Rao corresponde al inverso de la matriz de información, la cual corresponde a la
mínima varianza que puede poseer un estimador insesgado.
182
Econometría
3. Normalidad Asintótica:
donde note que la matriz hessiana de segundas derivadas de L es una matriz cuadrada y
simétrica de orden kxk.
183
Econometría
Estimación por MV
184
Econometría
185
Econometría
186
Econometría
Nos queda entonces derivar la varianza de los estimadores MV. Vimos que la matriz de
varianzas correspondía al inverso de la matriz de información Por facilidad de cálculo,
generalmente se utiliza la segunda definición de es decir, la de las segundas derivadas
de la función de verosimilitud. Entonces:
187
Econometría
188
Econometría
189
Econometría
190
Econometría
Inferencia en el contexto MV
191
Econometría
192
Econometría
193
Econometría
194
Econometría
Una nota: Dijimos que el test era válido asintóticamente, donde hemos utilizado el
resultado de normalidad asintótica de MV. En caso de que los errores efectivamente
distribuyan normal en muestra finita, el test (lógicamente) mantiene su distribución.
195
Econometría
196
Econometría
197
Econometría
198
Econometría
199
Econometría
200
Econometría
201
Econometría
202
Econometría
203
Econometría
204
Econometría
205
Econometría
206
Econometría
207
Econometría
3. Otra ventaja reside en la inferencia. Toda la inferencia vista en MCO poseía distribución
exacta bajo el supuesto de normalidad. Los test asintóticos visto en la inferencia MV son
válidos bajo cualquier distribución supuesta (aunque asintóticamente).
4. Adicionalmente, los tres test vistos son capaces de lidiar con restricciones no lineales. ¿Por
qué? Porque MV es capaz de lidiar con modelos no lineales.
5. Es posible demostrar que W >= LR >= LM al ser aplicados a un modelo lineal. Los tres son
asintóticamente equivalentes, sin embargo, en muestras finitas arrojarán resultados
diferentes.
7. Todos los paquetes estadísticos reportan el valor de la función de verosimilitud (es decir, la
función evaluada en los parámetros estimados). Ello, muchas veces es utilizado como un
criterio de selección entre modelos (recuerde que nuestro objetivo es maximizar la función de
verosimilitud).
208