Академический Документы
Профессиональный Документы
Культура Документы
Econometría Aplicada
Pablo Lavado , Gonzalo Rivera , Claudia Lisboa, Luciana Velarde, Óscar Jara
Agosto del 2016
Libro de Ejercicios de Econometría
Aplicada
Introducción
El manejo de los conocimientos y herramientas econométricas es de vital importancia para
un economista, ya sea que se desempeñe en la academia, en el sector privado y en el
sector público. La econometría es una herramienta estadística útil para explicar fenómenos
y regularidades empíricas. De igual forma, brinda al investigador la capacidad de poder
aislar los efectos causales de una variable de interés sobre otra y distinguir entre correlación
y causalidad. El objetivo central de la econometría es confrontar la teoría con los datos
observados y dar una interpretación de los mecanismos subyacentes o modelar estos
mecanismos. En suma, la econometría permite explicar, predecir y controlar el fenómeno
que estamos analizando a través de un modelo econométrico simple, que debe ser realista
y manejable.
Existen libros de texto de muy buena calidad dedicados al desarrollo del contenido teórico
econométrico introductorio. En particular, destacamos los textos llevados a cabo por Jeffrey
Wooldridge (2009), Alfonso Novales (1993), Guajarati (1995), Johnston y DiNardo (1997) y
Stock y Watson (2009); y, para mayor profundidad, el texto desarrollado por William Greene
(2012). No obstante esta gran cantidad de literatura, consideramos que no existe en la
actualidad un documento que permita reforzar la parte práctica de la econometría básica.
Por la naturaleza de la econometría, es conveniente que la parte teórica sea
complementada por ejercicios prácticos a fin de que se pueda contrastar los conocimientos
teóricos. Si bien los libros de texto mencionados poseen una parte práctica, consideramos
que hace falta una guía de resolución de ejercicios un poco más detallada que permita un
mayor entendimiento de la parte teórica; en especial para aquellos estudiantes que están
empezando a dar sus primeros pasos en el campo de la econometría.
De este modo, el objetivo de este libro es justamente ser una guía práctica de resolución
de ejercicios de econometría básica. En ese sentido, este documento permitirá al estudiante
contrastar los conocimientos teóricos con ejercicios prácticos, ayudándolo a internalizar de
una mejor manera los conceptos y la intuición que hay detrás de ellos y familiarizarse con
los modelos aplicados en trabajos de investigación aplicados a la realidad.
El presente documento no pretende ser un libro de texto, sino ser una guía dirigida para el
desarrollo de la parte práctica de la econometría, de tal manera que el estudiante pueda
aprovechar de la mejor manera posible el contenido teórico adquirido durante los cursos
que realice o a través de la lectura de libros de texto relacionados. Es por ello que se
recomienda al lector poseer conocimientos previos de álgebra lineal, estadística y alguna
noción acerca de econometría básica.
El presente trabajo es el resultado de una recolección y resolución de ejercicios del primer
curso de Econometría en la Universidad del Pacífico. Las fuentes de estos problemas
presentados son muy diversas. Algunos provienen de las épocas en que cada uno de los
autores eran alumnos en la Universidad del Pacífico; mientras que otros se originaron
cuando luego los mismos pasaron a dictar el curso de Econometría I, ya sea como jefes de
prácticas o profesor. Los ejercicios desarrollados en este libro provinieron de las tareas,
prácticas dirigidas y calificadas de este curso.
Queremos agradecer el apoyo de todos los profesores y jefes de práctica que han dictado
el curso en estos últimos años por habernos provisto de ejercicios; así como de permitirnos
su uso en este libro. En particular, queremos realizar un cordial agradecimiento a Juan
Francisco Castro, Guillermo Díaz y Miguel Jaramillo. Asimismo, agradecemos el apoyo de
nuestros coautores Claudia Lisboa, Luciana Velarde y Oscar Jara sin cuyo apoyo este libro
no podría haberse desarrollado. De este modo, queremos enfatizar que todas las
resoluciones propuestas en este libro son de nuestra responsabilidad. Pablo Lavado
quisiera agradecer a aquellas personas que durante su vida le enseñaron la ciencia y arte
de la econometría cultivada con rigurosidad y pasión: Manuel Arellano (CEMFI), Arlette
Beltrán (UP), Stephanne Bonhomme (Universidad de Chicago), Carlos Casas (UP), Jorge
Cortez (UP), Pedro Mira (CEMFI) y Enrique Sentana (CEMFI). Finalmente, queremos
agradecer a Nelson Oviedo por su asistencia en la preparación final de este manuscrito y
al revisor anónimo que ayudó mucho con sus comentarios a versiones previas del
manuscrito.
Pablo Lavado
Gonzalo Rivera
Glosario de términos
LEI: Ley de Esperanzas Iteradas
MCG: Mínimos Cuadrados Generalizados
MCGF: Mínimos Cuadrados Generalizados Factibles
MCO: Mínimos Cuadrados Ordinarios
MELI: Mejor Estimador Lineal Insesgado
MLG: Modelo Lineal General
MV: Máxima Verosimilitud
PGD: Proceso Generador de Datos
PMC: Propensión Marginal a Consumir
SCE: Suma de Cuadrados Explicados
SCR: Suma de Cuadrados Residuales
SCT: Suma de Cuadrados Totales
TLC: Teorema del Límite Central
VI: Variables Instrumentales
Índice
INTRODUCCIÓN.................................................................................................................. 1
1. MODELO LINEAL GENERAL: MÍNIMOS CUADRADOS ORDINARIOS...................... 5
2. INFERENCIA............................................................................................................... 55
3. MÁXIMA VEROSIMILITUD ......................................................................................... 92
4. ERRORES NO ESFÉRICOS .................................................................................... 118
4.1 HETEROCEDASTICIDAD ............................................................................................. 122
4.2 AUTOCORRELACIÓN .................................................................................................. 141
5. ENDOGENEIDAD ..................................................................................................... 158
6. BIBLIOGRAFÍA ......................................................................................................... 169
1. Modelo Lineal General: Mínimos Cuadrados Ordinarios
Problema 1.1
Solución
Problema 1.2
Solución
Problema 1.3
El teorema de Gauss-Markov señala que es estimador MCO es MELI sobre la base de que
"(4 ! = 0 y que 5 = 6+ + 4 (el modelo es lineal) con "(4) = 0.
Solución
Problema 1.4
Solución
Falso. Existe la posibilidad de tener un estimador con menor varianza al de MCO (siempre
que no se cumplan algunos supuestos) aunque estos sean sesgados (como el MCG).
Puede que el sesgo de un estimador sea tan grande que, a pesar de tener la menor
varianza, sea menos preferible que otro estimador sesgado. Esto dependerá
exclusivamente del propósito de la investigación.
Problema 1.5
El teorema del límite central (TLC) establece que la distribución de cualquier variable
aleatoria debe tener una distribución 8 para que, en el límite, cuando el número de
observaciones tienda a infinito, converja a una distribución normal.
Solución
9:;[9]
Falso. El TLC indica que todo promedio muestral estandarizando se distribuye
>?@[9]
aproximadamente normal estándar, si el tamaño de muestra es lo suficientemente grande.
Problema 1.6
En un modelo econométrico, lo ideal es que los datos observados no varíen ya que de esta
forma reduzco las perturbaciones estocásticas A* , por lo que será más fácil minimizar los
∑0*# y encontrar los parámetros eficientes.
Solución
Problema 1.7
Solución
Problema 1.8
Solución
Falso. El hecho de que +EFG ∼ I(+, C # (!′!):, ) cuando K → ∞, implica que se cumplen los
siguientes supuestos:
Sin embargo, para que el estimador sea eficiente, es necesario verificar los siguientes
supuestos:
• Independencia en media del término de error con las ! (" 4|! = 0), lo que
garantiza insesgamiento.
• El error presenta una matriz de varianzas y covarianzas escalar. Esto es necesario
para garantizar que el estimador MCO sea el de mínima varianza dentro del grupo
de los estimadores insesgados.
Ahora, en el caso de que no se cumpla que +EFG ∼ I(+, C # (!′!):, ), esto implica que no se
cumplen los supuestos de no contemporaneidad y homocedasticidad. Por lo tanto, el
comente continúa siendo falso.
Problema 1.9
Una condición suficiente para que el estimador mínimo cuadrático sea insesgado es que
los errores sean independientes en media de la matriz !. Por otro lado, para garantizar
consistencia no debe existir correlación contemporánea entre las variables explicativas y el
término de error.
Solución
Problema 1.10
Se desea calcular los determinantes del salario por hora para lo que se ha planteado la
siguiente regresión: QRSRTUV = WRñVQ YZ ZY0[R[Uó] + !+ + 4 donde ! es la matriz del resto
de explicativas del modelo (asuma una correcta especificación del mismo).
Solución
Problema 1.11
Si al trabajar con el logaritmo de las variables del modelo obtengo un R2 mayor que al
trabajar con las variables en niveles, ¿puede concluir que el modelo en logaritmos es
“mejor”?
Solución
En primer lugar, hay que notar que cuando se aplican logaritmos a las variables se está
modificando la escala de la regresión. En particular, lo que ocurre es que se reduce la
dispersión de los datos. Esto conlleva a obtener una menor Suma de Cuadrados Totales
(SCT), y; por ende, un mayor R2.
Problema 1.12
Una regresión del residuo MCO sobre los regresores del modelo que los generó dará por
construcción un R2 igual a cero.
Solución
Los coeficiente de una regresión de los residuos contra los X que los generan son por
definición iguales a cero: (! ^ !):, ! ^ _ = 0, dado que ! ^ _ = 0 (de las ecuaciones normales).
Ahora, esto implica que el R2 será igual a cero puesto que: (1) cada valor ajustado de esta
regresión será igual a cero, y (2) que el promedio de los residuos es igual a cero – ambos
puntos implican que la SEC (suma explicada de cuadrados) de esta regresión será cero.
Luego basta recordar:
a
*b,(5* − 5)# cd"
`# = a = (1)
*b,(5* − 5)# cdK
Problema 1.13
5* = 6* + + 4* para U = 1,2, … , ]
Solución
4* = 5* − 6* + (1)
a a
4*# = 5* − 6* + # (2)
*b, *b,
a a
0= 6* 5* − 6* h (4)
*b,
a a
0= 6* 5* − 6* 6*^ h (5)
*b, *b,
a a
:,
h=( 6* 6* ′) 6* (6* + + 4* ) (7)
*b, *b,
a a
:,
h =++( 6* 6* ′) 6* 4* (8)
*b, *b,
" h = + (10)
a :, a a a :,
% h =( 6* 6* ′) " :,
4*# 6* 6* ′ ( 6* 6* ′):, (14)
*b, *b, *b,
Dado que los errores son homocedásticos entre los individuos, a partir de (14):
a a a
% h = "(4*# )( 6* 6* ′) :,
6* 6* ′ ( 6* 6* ′):, (15)
*b, *b, *b,
a
#
% h =C ( 6* 6* ´):, (16)
*b,
Problema 1.14
Sea ! una variable que se distribuye normalmente con media A y varianza C # . Suponga
que se han obtenido independientemente dos muestras aleatorias simples a partir de !, de
tamaños K, y K# , y con medias !, y !# respectivamente.
!, + !#
A= (1)
2
K, !, + K# !#
A= (2)
K, + K#
Comparar las propiedades finitas de ambos: ¿los estimadores son insesgados? ¿Cuál de
ellos tiene menor varianza?
Solución
!, + !# + ⋯ + !p/ 1 K* A
"(!* ) = " = " !, + " !# + ⋯ + " !p/ = =A (3)
K* K* K*
#
1 #
" !* − A = " (!, − A) + (!# − A) + ⋯ + (!p/ − A) (5)
K*#
Dado que
1 .q r.s r⋯r.t/
Una forma alternativa de hallar la varianza muestral es la siguiente: %RT !* = %RT =
p/
, u?@ . vs
%RT !, + ⋯ + %RT !p/ = = .
p/s p/ p/
Tomando en cuenta (8), se obtiene que la varianza del promedio muestral obtenido en (5)
es
#
1 # # K* C # C #
" !* − A = " !, − A + ⋯ + " !p / − A = = (9)
K*# K*# K*
Sesgo
"(!, ) + "(!# ) 2A
"(A) = = =A (10)
2 2
Varianza
# #
!, + !# (!, − A) + (!# − A)
%RT(A) = "[A − "(A)]# = " −A =" (12)
2 2
1 # #
%RT(A) = " !, − A + " !# − A + 2"[(!, − A)(!# − A)] (13)
4
Por lo tanto,
1 C# C# C#
%RT(A) = + +0 = K + K# (14)
4 K, K# 4K, K# ,
1
%RT(A) = [K # " !, − A #
+ K## " !# − A # ] (16)
(K, + K# )# ,
pqs v s pss v s
( + ) C#
%RT A =
pq ps
= (K + K# ) (17)
(K, + K# )# (K, + K# )# ,
Entonces,
#
K, + K# > 4K, K# , si K, ≠ K# (20)
Por lo tanto,
y, = !, ∗ !# (1)
#
!, + !#
y# = (2)
2
!,# + !##
y2 = (3)
2
¿Estos estimadores son sesgados? ¿Si es así, cuál de ellos presenta un menor sesgo?
Solución
Para y, :
Para y# :
#
!, + !# 1
"(y# ) = " = "(!,# ) + "(!## ) + 2"(!, )"(!# ) (5)
2 4
1 C# C# 1 C# C#
"(y# ) = + A# + + A # + 2A # = ( + + 4A # ) (6)
4 K, K# 4 K, K#
1 C# C#
cZQ{V(y# ) = "(y# ) − A = ( + ) (7)
4 K, K#
Para y2 :
1 C# C#
cZQ{V(y2 ) = "(y2 ) − A = ( + ) (9)
2 K, K#
Tomando en cuenta (4), (7) y (9), se concluye que el de menor sesgo es el estimador y, ya
que es insesgado.
Problema 1.15
)* = 1 + 2!* + 4* (1)
Donde 4* tiene una distribución normal con media igual a 0 y varianza igual a 1. Además, !
toma los valores: 1, 2, 3, 4, 5 y 6. El investigador simula 6 observaciones de 4* con la
distribución asumida y obtiene:
4, = 0.464 4} = −0.160
4# = 0.060 4~ = 1.022
42 = −1.500 4Ä = 0.200
Otro investigador B solo tiene acceso a los datos de ! e ) generados por el investigador A
(pero no conoce el modelo verdadero) y a partir de ellos trata de obtener una estimación
del coeficientede la variable ! en el modelo verdadero, para lo cual utiliza dos estimadores:
1
+= ) + )~ − )# − ), ; (2)
100 Ä
(!* − !)()* − ))
+= (3)
(!* − !)#
Se pide:
Solución
), = 1 + 2 1 + 0.464 = 3.464
)# = 1 + 2 2 + 0.060 = 5.060
)2 = 1 + 2 3 − 1.5 = 5.500
)} = 1 + 2 4 − 0.160 = 8.840
)~ = 1 + 2 5 + 1.022 = 12.022
)~ = 1 + 2 6 + 0.200 = 13.200
6* 5* 6 − 6 5 − 5 (6 − 6)(5 − 5) (6 − 6)#
Solución
"(+) = + (1)
C# C#
ÜRT + = = (2)
(!* − !) # 17.5
Sobre el estimador +:
1
" + = "()Ä ) + "()~ ) − "()# ) − "(), ) (3)
100
1 8
" + = +!Ä + +!~ − +!# − +!, = + = 0.08+ (4)
100 100
Sobre su varianza:
1 4C # C#
ÜRT + = ÜRT()Ä ) + ÜRT()~ ) + ÜRT()# ) + ÜRT(), ) = = (6)
100# 10000 2500
Solución
C# 1
"dà + = 0 + ÜRT + = = = 0.05714. (1)
17.5 17.5
C#
"dà + = [QZQ{V(+)]# + ÜRT + = (−0.92+)# + = 3.3856 + 0.0004 = 3.386 (2)
2500
Problema 1.16
5* = +â + +, 6* + 0* (1)
se plantea la regresión:
con
5* − 5
5*∗ = (3)
Qä
6* − 6
6*∗ = (4)
Q9
Donde 5 y 6 son las medias muestrales, y Qä y Q9 son las desviaciones estándar muestrales
de 5 y 6 respectivamente:
a
*b,(5* − 5)#
Qä = (5)
]
a
*b,(6* − 6)#
Q9 = (6)
]
Solución
Solución
Nótese que:
a a a
6* − 6 1
6*∗ = = (6* − 6) = 0 (7)
Q9 Q9
*b, *b, *b,
a ∗
*b, 6*
6∗ = =0 (8)
]
Ya que se probó 5 ∗ = 6 ∗ = +â∗ = 0, la fórmula MCO para +,∗ es la misma que en el modelo
sin intercepto:
a ∗ ∗
*b, 6* 5*
+,∗ = a ∗ # (10)
*b, 6*
, ,
d) Muestre que 5*∗ = 5* − 5 , y que Ü* = 0* .
ãç ãç
Solución
Q9 6* − 6 1
5*∗ = +,∗ 6*∗ = + = + 6 − +, 6 (12)
Qä , Q9 Qä , *
1 1 1
5*∗ = + 6 − +, 6 = 5 − +â − 5 + +â = 5 −5 (13)
Qä , * Qä * Qä *
Además,
5* − 5 5* − 5 5* − 5* 0*
Ü* = 5*∗ − 5*∗ = − = = (14)
Qä Qä Qä Qä
ãå
e) Muestre que ZZ +,∗ = ZZ +, . (Recordar que ZZ denota “error estándar” y es nuestro
ãç
estimador de la desviación estándar del coeficiente MCO estimado).
Solución
# s
∗s , a é/
a >/
*b, a ãç *b, a Q9
ZZ +,∗ = = = ZZ(+, ) (15)
a ∗# #
Qä
*b, 6*
, a #
ã *b,(6* − 6)
å
s
a é/
Q9 *b, a Q9 (16)
ZZ +,∗ = a = ZZ(+, )
Qä *b,(6* − 6)# Qä
Problema 1.17
Solución
• )* = !* + + 4* (Modelo Teórico)
• )* = !* + + Z* (Modelo Empírico)
Por lo tanto,
èSUê Z* − 4* = 0 (1)
èSUê !* + − !* + = 0 (3)
èSUê !* (+ − +) = 0 (4)
Asumiendo que se cumplen los supuestos del MLG (modelo lineal general), se sabe que el
estimador MCO de + es consistente, lo cual implica que: èSUê + = +. Finalmente:
èSUê!* ∅ = 0 (7)
0=0 (8)
Problema 1.18
2
El teorema de Slutsky señala que el límite probabilístico de un producto puede ser expresado como
el producto de los límites probabilísticos.
Considere el siguiente modelo de regresión lineal: 5* = A + 4* , con 4* ~U. U. Y. 0, C # .
Demuestre que el promedio muestral A un estimador consistente y cuál es su distribución
asintótica.
Solución
4*
èSUêA = A + èSUê (2)
I
Por LGN, se cumple que:
èSUêA = A (4)
4*
I(A − A) = (5)
I
Aplicando el TLC (dado que está dividido entre I), podemos obtener que:
I(A − A) = I 0; C # (6)
Problema 1.19
Considere el siguiente modelo de regresión lineal: 5* = A + 4* , con 4* ~U. U. Y. 0, C # . Ahora
* *
considere el estimador alternativo A = ì* 5* , ì* = = . Note que ì* = 1.
a ar, /# *
Demuestre que este es un estimador consistente de A y obtenga su varianza asintótica.
[Recordar que: U # = ](] + 1)(2] + 1)/6]
Solución
A= ì* A + 4* = A + ì* 4* (2)
Reemplazando el peso:
U
A=A+ 4 (3)
] ] + 1 /2 *
Utilizando la LGN, se puede llegar a:
2
èSUêA = A + èSUê( )U" 4* (4)
]+1
èSUêA = A (5)
Para ver la varianza asintótica, podemos hallar primero la varianza del estimador
alternativo:
% A =% A+ ì* 4* = " ì* # 4* # (6)
% A = C# ì* # (7)
Se puede ver que la sumatoria de los pesos al cuadrado se puede expresar de la siguiente
forma:
2a ,
U# [](] + 1)(2] + 1)/6] 2[]# + + ]
ì* =#
= = # # (8)
U # [](] + 1)/2]# 1.5][]# + 2] + 1]
2a ,
2[]# + + ]
lim % A = C # # #
= 1.333C # (9)
a→ñ 1.5[]# + 2] + 1]
Esta varianza es mayor a la varianza obtenida por MCO; demostrando así que MCO es
eficiente.
3
La LEI indica que " ) = " " )|! .
Problema 1.20
Una variable ) está determinada por una variable !. La relación tiene la forma de
) = +, + +# ! + 0 (1)
Donde 0 es la perturbación que satisface los supuestos del modelo. Los valores de las !
son tomados aleatoriamente de una población con varianza C # . Un investigador comete un
error y regresiona ! sobre ) ajustando el modelo ! = Y, + Y# ) + 0, donde Y# =
ó
/òq(9/ :9)(ä/ :ä)
ó s .
/òq(ä/ :ä)
Cuando se nota su error, el investigador señala la relación original puede ser escrita como
+, 1 1
!=− + )− 0 (2)
+# +# +#
,
Y, por lo tanto Y# sería un estimador de , de donde puede recuperarse un estimador de
ôs
,
+# . Se le encarga demostrar que Y# es un estimador inconsistente de y determinar la
ôs
dirección del sesgo en muestras grandes.
Solución
a
*b,(6* − 6)(5* − 5)
Y# = a #
(3)
*b,(5* − 5)
a ôq , , ôq , ,
− + 5* − 0 + − 5+ 0 5* − 5
*b, ôs ôs ôs * ôs ôs ôs (4)
Y# = a #
5
*b, * − 5
a , , , ,
*b, ô 5* −
ôs *
0 − 5+ 0 5* − 5
Y# = s ôs ôs (5)
a #
*b, 5* − 5
a , ,
*b, ô (5* − 5) −
ôs
(0* − 0) (5* − 5)
Y# = s (6)
a
*b,(5* − 5)#
a , a ,
*b, ô (5* − 5)# − *b, ô (0* − 0)(5* − 5)
Y# = s s (7)
a #
*b,(5* − 5)
a , , , a ,
*b, a ô (5* − 5)# − (0* − 0)(5* − 5)
s a *b, ô s
Y# = ,
(8)
a
*b,(5* − 5)#
a
Aplicando el límite probabilístico para evaluar la consistencia del estimador desarrollado por
el practicante:
, ,
ÜRT 5 − [VÜ(0, 5)
ôs ôs (9)
èSUê(Y# ) =
ÜRT 5
1 1 [VÜ(0, 5)
èSUê(Y# ) = − (10)
+# +# ÜRT 5
Problema 1.21
Considere que desea estimar el modelo 5* = ö + +6*∗ + 4* , donde 5* denota al promedio final
obtenido por un alumno al terminar la secundaria y 6*∗ denota a las habilidades cognitivas
del alumno. Sin embargo, dado que las habilidades cognitivas no se conocen, sólo se puede
aproximar a ellas con los resultados de un grupo de tests que los alumnos tomaron para
medir su habilidad verbal y lógico-matemática. Por ello, no cuenta con 6*∗ sino con una
variable proxy (resultados del test) 6* = 6* ∗ + ì* . Además sabe que 4* ~I 0, Cõ# es un
término de error independiente de las habilidades cognitivas del alumno; ì* ~I 0, Cú# es un
error de medición independiente de las habilidades cognitivas y de 4* que cumple con
s
vû
" ì* ìã = 0 ∀ U ≠ Q. Demuestre que èSUê + = + 1 − .
vås
Solución
a a
*b, 6−6 5−5 *b, 6−6 0−0
èSUê + = èSUê a = èSUê + + a (1)
*b, 6−6 # *b, 6−6 #
+dVÜ 6* , ì* +dVÜ 6* ∗ + ì* , ì*
èSUê + = + − = − (3)
C9# C9#
Cú# Cú#
èSUê + = + − + = + 1 − (4)
C9# C9#
Problema 1.172
) = !, + r + ü (2)
Se pide:
Solución
Obteniendo ü
ü = ) − !, + r = ! − !, † + + 0 (3)
Sus propiedades:
" üü ^ = ! − !, † ++ ^ ! − !, † ^ + C # °p (6)
^
" ü−" ü ü−" ü = C # °p (7)
Solución
"(+ r ) = + r (10)
"[(+ r − + r )(+ r − + r )′] = C # (!, ′!, ):, (11)
Problema 1.183
5 = +â + +, 6, + +# 6# + 4 (1)
Solución
Entonces se plantea:
+, = 6,^ à# 6, :,
(6,^ à# 5) (3)
Donde à# = ° − 6# 6#^ 6# :, ^
6#
Problema 1.194
Solución
) = !+ + Z (1)
) = !+ + 4 (2)
) =)+4 (3)
) =)−Z+4 (4)
Z=4 (5)
Recordar que una pendiente igual a 1 (en el caso que no haya intercepto en el modelo)
implica un ajuste perfecto (determinístico) entre la variable dependiente y la independiente.
Al regresionar ) contra su valor predicho ), se llega a que Z = 4. De ello, se desprende que
la regresión original a partir de la cual se obtuvo ) y la nueva regresión planteada se
encuentran superpuestas. No obstante, la pendiente de la nueva regresión no será
exactamente uno en tanto exista un término de error reconocido en el modelo.
Problema 1.205
Se quiere regresionar una variable ) versus una variable ¢ (la explicativa). Halle el
estimador MCO, si se sabe que ¢ es el doble de ).
Solución
) = +¢ + Z (1)
Por tanto, el estimador MCO de ¢ sería (tomando en cuenta que solo hay una variable):
§
*b, £* 5*
+EFG = ¢ ^ ¢ :, ^
¢)= § #
(2)
*b, £*
§ § #
*b, 25* 5* 2 *b,(5* ) 1
+EFG = § #
= § #
= (3)
*b,(25* ) 4 *b,(5* ) 2
Este resultado es evidente ya que el valor esperado de la variable y siempre será la mitad
del que tome la variable Z; por construcción de esta última.
) = +• + +, ¢ + Z (4)
§ §
*b,(£* − £)(5* − 5) *b, 2(5* − 5)(5* − 5) 1
+¶ß• = § #
= § #
= (5)
*b,(£* − £) *b, 4(5* − 5) 2
En este segundo caso, el estimador MCO del intercepto resultará ser aproximadamente
cero.
Problema 1.26
Demostrar qué ocurre con el estimador de mínimos cuadrados ordinarios cuando se omite
una variable relevante. ¿Qué pasa cuando se incluye una variable irrelevante?
Solución
Para ver qué es lo que ocurre ante estos dos casos, es necesario analizar cómo se ven
afectadas las propiedades del estimador MCO: insesgadez y eficiencia.
Omisión de una variable relevante:
) = !+, + Z (M2)
Para analizar el efecto sobre las propiedades del estimador, se debe comparar los
resultados obtenidos bajo ambas especificaciones:
(M1): +, = ! ^ à® ! :,
!′à® ) vs (M2): +, = ! ^ ! :,
!′) (3)
Sesgo
A priori, se puede ver que el estimador obtenido omitiendo una variable relevante se
encuentra sesgado. Para confirmar esta impresión, se procede a analizar si dicho estimador
es insesgado:
+,,EFG = ! ^ ! :,
! ^) = ! ^! :,
! ^ (!+, + ¢+# + 4) (4)
+,,EFG = ! ^ ! :,
! ^ !+, + ! ^ ! :,
!′¢+# + ! ^ ! :,
!′4 (5)
"[+,,¶ß• /!, ¢] = +, + ! ^ ! :,
! ^ ¢+# + ! ^ ! :,
!′"[4/!, ¢] (7)
"[+,,¶ß• /!, ¢] = +, + ! ^ ! :,
! ^ ¢+# (8)
Se puede apreciar claramente el sesgo que implica la omisión de la variable Z. Sin embargo,
se debe notar que dicho estimador será insesgado en cualquiera de los siguientes dos
casos: (i) ambas variables son ortogonales (!’¢ = 0) o (ii) ¢ es una variable irrelevante; es
decir, +# = 0 .
Eficiencia:
En segundo lugar, para analizar la varianza de MCO, se debe comparar la varianza bajo
ambas especificaciones:
Al comparar ambas expresiones, es claro ver que la varianza del estimador del segundo
modelo es menor. Esto se puede apreciar si se diferencia los denominadores de ambas
expresiones; obteniendo que el del segundo modelo es mayor; y por tanto, dicho estimador
tendrá una menor varianza:
) = !+, + 4 (M12)
(M12): +, = ! ^ ! :,
!′) vs (M13): +, = ! ^ à® ! :,
!′à® ) (14)
Sesgo
Al igual que el caso anterior, se analizará si el estimador MCO del M4 presenta un sesgo:
+,,EFG = ! ^ à® ! :,
! ^ à® ) = ! ^ à® ! :,
! ^ à® (!+, + ¢+# + 4) (15)
+,,EFG = ! ^ à® ! :,
! ^ à® !+, + ! ^ à® ! :,
!′à® ¢+# + ! ^ à® ! :,
!′à® 4 (16)
Recordar que el producto del “hacedor de residuos”, à, de una variable y ella misma es
cero (à® ¢ = 0). De esta manera, simplificando, se llega a:
+,,¶ß• = +, + ! ^ à® ! :,
!′à® 4 (17)
"[+,,¶ß• /!, ¢] = +, + ! ^ ! :,
!′"[4/!, ¢] (19)
Eficiencia:
La comparación entre ambas expresiones resulta en que es M3 el que tiene menor varianza;
según lo visto en el caso anterior. Es decir, incluir una variable irrelevante al modelo genera
ruido adicional (e innecesario) a la estimación; por lo que incrementa la variabilidad del
estimador.
Problema 1.27
:, (1)
+, = !, ′!, (!, ′ !, +, + !# +# + 4 )
:, :, (2)
+, = +, + !, ′!, ′!, ′!# +# + !, ′!, !, ′4
:, :, (3)
"(+, ) = +, + !, ′!, ′!, ′!# +# + !, ′!, !, ′"(4)
:, (4)
"(+, ) = +, + !, ′!, ′!, ′!# +#
Esto indica que la estimación de +, a partir de una regresión de 5 sobre !, genera un sesgo
positivo que está dado por: !, ′!, :, ′!, ′!# +#
Además, este sesgo desaparece o lo que es lo mismo, "(+, ) = +, , si !, ′!# = 0, esto es, si
!, y !# son ortogonales.
Por otro lado, el estimador usual de la varianza del error está dado por:
Z′Z
Q# = (5)
]
Z, ′Z,
Q# = (6)
]
Donde Z, = 5 − !, +, . Entonces,
Z, = !, +, + !# +# + 4 − !, +, (7)
Z, = !, +, + !# +# + 4 − !, +, + !,^ !, :,
′!,^ !# +# + !, ′!, :,
!,^ 4 (8)
Z, = !# +# + 4 − !, !,^ !, :,
′!,^ !# +# + !, !,^ !, :,
!,^ 4 (9)
Z, ′Z, = +# !# ′à., ′à., !# +# + +# !# ′à., ′à., 4 + 4′à., ′à., !# +# + 4′à., à., 4 (14)
Tomando esperanzas y teniendo en cuenta que los errores son ortogonales a las !:
:,
"(Z, ′Z, ) = +# !# ′!# +# − +# !# ′!, !, ′!, !, ′!# +# + C # (17)
En el caso de que !, y !# son ortogonales (!, ′!# = 0), el sesgo estaría dado únicamente
por: +# !# ′!# +# , es decir, sería menor que el anterior.
Problema 1.28
Solución
El modelo teórico considera aquellas variables que son parte del proceso generador
de datos. Así, el modelo teórico es el siguiente:
Donde las características del hogar y la vivienda seleccionadas son: nivel educativo
del jefe de hogar, ingreso del hogar, material del hogar, tipo de alumbrado y fuentes
de comunicación como radio y televisión. d≠∞ está compuesto por indicadores de
número promedio de alumnos por aula en los colegios, material predominante en el
colegio, años de experiencia promedio de los profesores y si es el colegio es
multigrado y si tiene más de un turno.
En este caso, desde que se cuenta con toda la información disponible observable es
posible en principio estimar el modelo. El problema radica en que no se puede incluir
el efecto individual debido ya que no es observable (como es un corte transversal
tampoco se puede hacer un modelo de efectos aleatorios). Es decir, el modelo usado
al momento de la estimación no tendría problemas si no fuera por el ö, el cual lleva
un estimador sesgado pero consistente.
El punto principal radica en que no exista correlación entre los ö y los errores. En
segunda instancia, que la variable dependiente sea comparable entre los distintos
colegios y que no se presente error de medición en ningún regresor por lo difícil de
estandarizar la data a nivel nacional.
b. Considere el modelo propuesto en el inciso anterior y los supuestos tomados para
su estimación insesgada vía MCO. Discuta la razonabilidad de dichos supuestos.
Solución
Tales supuestos son poco realistas en la medida que en el error existan factores
idiosincráticos como el esfuerzo de los padres por educar a sus hijos o institucionales
relativos a cada comunidad y centro escolar. Es decir, debe observarse si existe
alguna correlación entre el ö y las !.
Problema 1.29
pero, por diversas razones, realiza una regresión de "cRSRTUV" sobre "ZYRY" y "RñVQ_ZY0["
únicamente. Respecto a los estimadores de mínimos cuadrados del modelo estimado
¿serán consistentes? ¿es posible que uno de ellos sea consistente y el otro no? Explique.
Solución
En tanto existe una variable relevante omitida, la consistencia de los estimadores puede
verse afectada. El estimador de +, será consistente si y solo si " 6,* 62* = 0. Ello, sin
embargo, no implica que el otro estimador +# sea también consistente, lo cual se dará si
" 6#* 62* = 0 ya que la variable 62* formaría parte del error en el modelo estimado.
Problema 1.30
Solución
Solución
Si se asume que la cantidad de TVVêQ aumenta con la calidad del inmueble, entonces
SV{(]V6) y TVVêQ estaría negativamente correlacionados, especialmente en
vecindarios que tienen más contaminación ya que a mayor SV{ ]V6 menor calidad4.
Si se realiza la regresión solo entre log èTU[Z y log ]V6 , se estaría omitiendo una
variable relevante. Sobre la base de la tabla 1.2, se puede decir que, debido a que
[VTT 6, , 6# < 0 y +# > 0, el estimador +, podría tener un sesgo negativo. Sin
embargo, como +, < 0, esto implicaría que se estaría sobrestimando el efecto
negativo de la polución; es decir, existe un sesgo positivo.
log èT∫[Z = 9.23 − 0.718 log ]V6 + 0.306TVVêQ, ] = 506, ` # = 0.514 (2)
Solución
4
También podría darse el caso en el que las variables estén correlacionadas positivamente si se
asume que a mayor número de cuartos existe un mayor nivel de contaminación dado que existe un
mayor número de personas dentro de la vivienda, lo cual implica una mayor cantidad de desperdicios
generados.
Problema 1.31
Solución
El coeficiente esperado del ingreso es positivo. Se espera una correlación positiva entre el
precio e ingreso. Con esto, el sesgo por la omisión de la variable es positivo. Esto podría
tornar un coeficiente negativo a positivo.
Problema 1.212
Solución
Sin embargo, se sabe que tanto las cantidades y los precios son determinados casi de
manera simultánea; por lo que otra ecuación relevante sería de la forma:
º ªO AO
†O = − + − (6)
W W W
Problema 1.223
Solución
Para ver qué ocurre cuando se modifican las explicativas en un modelo, es necesario
comparar los estimadores de ambos modelos. El estimador MCO del modelo inicial es:
+,,¶ß• = ! ^ àâ ! :,
! ^ àâ ) (1)
Ahora es necesario hallar el estimador del otro modelo y tratar de expresarlo en términos
del inicial. El primer caso es en el que se multiplica por una constante a los valores de !;
por lo que se debe definir la variable:
! ∗ = Ω! (2)
) = +• + +, ! ∗ + 4 (3)
+, = ! ∗ ^ àâ ! ∗ :,
! ∗ ^ àâ ) (4)
Reemplazando el valor de ! ∗ :
+, = Ω! ^ àâ Ω! :,
Ω! ^ àâ ) (5)
+, = Ω :, ! ^ àâ ! :,
! ^ àâ ) (6)
+, = Ω :, +,,EFG (7)
Es decir, cuando se multiplica a las explicativas por una misma constante, el estimador
original queda multiplicado por la inversa de dicha constante.
De manera similar se analiza el segundo caso, en el cual se suma a cada variable de X una
constante; para lo cual se empieza definiendo la variable:
! ∗∗ = ! + W (8)
) = +• + +, ! ∗∗ + 4 (9)
Reemplazando y reagrupando:
) = +• + +, (! + W) + 4 (10)
+, = ! ∗∗ − ! ∗∗ ^
! ∗∗ − ! ∗∗ :,
[ ! ∗∗ − ! ∗∗ ′ ) − ) ] (13)
, a
Dado que W= *b, W = W:
a
+, = +,,EFG (16)
En efecto, se puede observar que sumarle una constante a las explicativas no afecta el
estimador relacionado a las pendientes.
Problema 1.34
Un investigador desea hallar los determinantes del consumo de helados. Para eso, ha
estimado una ecuación de la forma:
) = 20 + 100d (1)
` # = 0.90 (3)
Qué pasaría con los siguientes componentes de la regresión si en vez de usar grados
Celsius se hubiera utilizado grados Fahrenheit (8). Explique matemáticamente (Recuerde
que 8 = 1.8d + 32).
• El coeficiente estimado de 8
• El estimador del intercepto
• La suma de errores al cuadrado (SCR)
Solución
æ:2#
• A partir de 8 = 1.8d + 32, se tiene que d = . Con esto, se reemplaza en la
,.≤
æ:2#
ecuación principal tal que ) = 20 + 100 = −1757.7 + 55.58. Entonces, el
,.≤
coeficiente estimado de 8 es 11.1.
• El estimador del intercepto es: -1757.7.
a
• Luego, como el ) no ha cambiado y la cd` = øb,() − ))# , se tiene que la SCR
tampoco ha cambiado y sigue siendo 1020.
Problema 1.35
Solución
En primer lugar, se debe notar que, de acuerdo con la forma en la que está planteada la
regresión, se trata claramente de una regresión particionada. En este caso, se está
dividiendo a las variables explicativas en dos grupos: el intercepto y las variables de interés.
Tomando esto en cuenta, se puede definir las matrices “†” y “à” (hacedor de estimados y
residuos respectivamente) como:
UU′ UU′
†â = U(U ^ U):, U ^ = 5 àâ = ° − †â = ° − (1)
I I
Donde U representa un vector de (]6]) lleno de unos. De esta manera, se puede ver que
multiplicando por àâ al modelo inicial, se obtiene el modelo original pero con las variables
desviadas de su media:
àâ ) = àâ U′+â + àâ !, +, + àâ Z (2)
) − ) = +, (!, − !, ) + Z (3)
Por tanto, se puede ver que el estimador MCO de +, en ambos modelos resulta ser el
mismo. Por otro lado, el teorema de Frisch-Waugh establece que el estimador MCO de +,
de una regresión particionada () = +, !, + +# !# + Z) será el mismo que el estimador MCO
.
de ö en la siguiente regresión de residuos: Z.¿s = öZ.sq + Ü, donde Ü = à# Z.
.
En este caso, se busca demostrar que el estimador ö de la siguiente regresión Z*¿ = öZ* q +
Ü equivale a +, . La variable dependiente son los residuos de ) contra un intercepto
(desviado de la media); mientras que la explicativa son los residuos de ! contra un
intercepto:
. . .
ö = (Z* q ′ Z* q ):, Z* q ′Z*¿ (4)
^ :,
ö= àâ !, àâ !, (àâ !, )′àâ ) (5)
:,
ö= àâ !, ^
àâ !, (àâ !, )′àâ ) (6)
)* − ) !* − !
ö = +, = (7)
!* − ! #
Por lo tanto, dicho modelo con intercepto sí tiene una relación con el teorema de Frisch-
Waugh.
Problema 1.36
En la siguiente regresión:
5 = ö + +6 + Z (1)
Solución
Para evaluar qué sucede en los tres casos que se plantean en el problema, se tiene:
5∗ = 5 − 5 (2)
6∗ = 6 − 6 (3)
Entonces, si se transforman 6 e 5:
5 ∗ = +6 ∗ + Z (4)
+ = (6 ∗ ′6 ∗ ):, 6 ∗ 5 ∗ (5)
:,
+= 6−6 6−6 (6 − 6)(5 − 5) (6)
:, (7)
+ = 6′àâ 6 6′àâ 5
Si se transforma solo 6:
5 = +6 ∗ + Z (8)
+ = (6 ∗ ′6 ∗ ):, 6 ∗ 5 (9)
:,
+= 6−6 6−6 (6 − 6)5 (10)
:, (11)
+ = 6′àâ 6 6′àâ 5
Si se transforma solo 5:
5 ∗ = +6 + Z (12)
:, (14)
+ = 6′6 6′(5 − 5)
:, (15)
+ = 6′6 6àâ 5
Entonces, en el primer y segundo caso, se obtienen los mismos resultado; sin embargo, si
se desvía solo 5 respecto de su media, esto no ocurre. Como àâ es idempotente al limpiar
a 5 del efecto de su media, se está limpiando a 6 de la suya, pero al revés no ocurre lo
mismo.
Problema 1.37
Solución
Dado que el modelo posee intercepto, el modelo puede ser expresado como desviaciones
con respecto a la media:
5* − 5 = +, 6* − 6 + 0* (1)
a
*b, 6* − 6 5* − 5
+, = a #
(2)
*b, 6* − 6
Reemplazando (5* − 5), se obtiene
a
*b, 6* − 6 0*
+, = +, + a #
(3)
*b, 6* − 6
a
*b, 6* − 6 0*
" +, !] = " +, + a #
! (4)
*b, 6* − 6
a
*b, 6* − 6 " 0* !
= +, + a #
(5)
*b, 6* − 6
a
y *b, 6* − 6
= +, + a #
(6)
*b, 6* − 6
Dado que y es constante, se puede sacar de la sumatoria. Luego, se usa el hecho que
a
*b, 6* − 6 = 0. Así,
" +, !] = +, (7)
Sustituyendo 5 = +â + +, 6 + 0,
a
*b, 0*
" +â !] = +â + " ! (11)
]
a
*b, "[0* |!]
" +â !] = +â + (12)
]
" +â !] = +â + y (13)
Problema 1.38
Considere el modelo de regresión lineal:
Solución
5* |6* = +, + 6* +# (2)
Donde U = 1 … 1
Entonces,
h# = 6# ′6# − 6# ′U U ^ U :, ^
U 6# :,
(6# ′5 − 6# ′U U ^ U :, ^
U 5) (5)
:,
6# ′U U′6# 6# ′U U′5
h# = 6# ′6# − 6# ´5 − (6)
] ]
a :, a
a # a a
( *b, 6# ) *b, 6# *b, 5
h# = 6## − 6# 5 − (7)
] ]
*b, *b,
:, a a
],# ], *b, 5
h# = ], − 5, − (8)
] ]
*b,
:, a a
], ] − ],# ] *b, 5, − ], *b, 5
h# = (9)
] ]
a a
] ] *b, 5, − ], *b, 5
h# = (10)
], ] − ],# ]
a a
] *b, 5, − ], *b, 5
h# = (11)
], ] − ],#
]5, − ]5
h# = (12)
] − ],
]5, − ]5
h# = (13)
]#
]5, − ], 5, − ]# 5#
h# = (14)
]#
h# = 5, − 5# (15)
h, = 5 − h# 6 (16)
Se sabe que
a
],
6# = 6# = (18)
]
*b,
Entonces,
],
h, = 5 − (5, − 5# ) (19)
]
]5 − 5, ] + 5# ],
h, = (20)
]
], 5, + ]# 5# − 5, ], + 5# ],
h, = (21)
]
]# 5# + 5# ],
h, = (22)
]
h, = 5# (23)
Problema 1.39
Dadas las siguientes expresiones del modelo lineal: ) = !+ y A = ) − !+. Se pide:
p
a) Demostrar que *bâ A* = 0.
Solución
p
»
= −2 ()* − +â − +, !*, − ⋯ − +¡ !*¡ )# = 0 (2)
¬+â
*b,
p p
b) Demostrar que * )* = â )*
Solución
p p p
)* = )* + 0* (3)
*b, *b, *b,
p
Pero por resultado de U, *bâ 0* = 0, se tiene que:
p p
)* = )* (4)
*b, *b,
Solución
^
) ^ ) = !+ !+ = +! ^ !+ = + ! ^ ! ! ^ ! :,
! ^ ) = +′!′) (5)
Solución
0 ^ 0 = ) ^ ) − 2+′! ^ ) + + ^ ! ^ !+ = ) ^ ) − 2+ ^ ! ^ ) + + ^ ! ^ ! ! ^ ! :,
! ^) (7)
= ) ^ ) − 2+ ^ ! ^ ) + + ^ ! ^ ) = ) ^ ) − +′!′) (8)
p p
e) Dada la siguiente información, calcular +, ) y A y verificar que *bâ A* =0y * )* =
p
)
â *.
!, 1 0 1 2 1
!# 2 2 0 -1 0
) 2 2 5 10 5
Solución
5 3 3
! ^! = 3 7 −4 ; ! ^ ! = 19; (9)
3 −4 9
1 47 −39 −33 24
! ^! :,
= −39 36 29 ; ! ^ ) = 28 (10)
19
−33 29 26 −2
102/19
^ :,
1 47
^
−39 −33 24 5.368
+ = (! !) ! ) = −39 36 29 28 = 14/19 = 0.736 (11)
19
−33 29 26 −2 −32/19 −1.684
1 −1 2 24 1.2631
1 0 2 102/19 38 2
1
) = !+ = 1 1 0 14/19 = 116 = 6.1052 (12)
19
1 2 −1 −32/19 162 8.263
1 1 0 116 6.1052
p p
)* = )* = 24 (13)
* â
Problema 1.23
Se supone que se ha estimado la siguiente ecuación utilizando MCO (con las variables
medidas en logaritmos):
)^ ° − ! ! ^! :,
! ^ ) = 0.0028 (3)
Y los elementos de ! ^ ! :,
son:
Solución
0′0
C# = (5)
K−´
0 = ) − !+ = ) − ! ! ^ ! :,
! ^) (6)
0^0 = ) ^ − ) ^! ! ^! :,
! ^ ) − ! ! ^! :,
! ^) (7)
= )^) − )^! ! ^! :,
! ^) − )^! ! ^! :,
! ^ ) + )′! ! ^ ! :,
!′! ! ^ ! :,
!′) (8)
= )^) − )^! ! ^! :,
! ^) = )^ ° − ! ! ^! :,
! ^ ) = 0.0028 (9)
Entonces
0.0028
C# = = 0.0002 (10)
17 − 3
)O = +, + +# !O + 0O (1)
Una vez realizada la estimación extravía toda la información de que disponía excepto la
que aparece en la tabla 1.4.
Núm. Xt uàt
obs.
1 1 2
2 3 -3
3 4 0
4 5 ¿?
5 6 ¿?
Solución
El primer problema que se debe resolver es hallar los valores de los residuos para las
observaciones número 4 y 5. Para ello, se considera que las dos ecuaciones normales de
los coeficientes imponen restricciones sobre los residuos, ya que:
0O = 0 (2)
Ob,
p
0O !O = 0 (3)
Ob,
Entonces,
0, + 0# + 02 + 0} + 0~ = 0 (4)
0, !, + 0# !# + 02 !2 + 0} !} + 0~ !~ = 0 (5)
Reemplazado los valores de la tabla:
2 − 3 + 0 + 0} + 0~ = 0 (6)
Es decir,
0} + 0~ = 1 (8)
Resolviendo el sistema:
0} = −1 (10)
0~ = 2 (11)
p #
Ob, 0O
Cõ# = (12)
K−2
Aplicando la fórmula:
~ #
Ob, 0O 2# + (−3)# + 0# + (−1)# + 2#
Cõ# = = =6 (13)
5−2 3
Problema 1.42
Solución
Partiendo del modelo: ) = ö + +! + Z, se define dos variables transformadas desviándolas
de su media:
) ∗ = àâ ) = ) − ) (1)
! ∗ = àâ ! = ! − ! (2)
^ :,
+¶ß• = !−! !−! (! − !)′() − )) (4)
^ :,
+¶ß• = àâ ! àâ ! (àâ !)′(àâ )) (5)
:,
+¶ß• = !′àâ ′àâ ! !′àâ ′àâ ) (6)
:,
+¶ß• = !′àâ ! !′àâ ) … (1)
(7)
^ :,
+¶ß• = àâ ! àâ ! (àâ !)′()) (9)
:,
+¶ß• = !′àâ ′àâ ! !′àâ ′) (10)
:,
+¶ß• = !′àâ ! !′àâ ) … (2) (11)
Por tanto, se puede concluir que el modelo arroja el mismo estimador si se transforma
tanto la dependiente y las explicativas como si sólo se transforma las explicativas. El
último caso es:
+¶ß• = ! ^ ! :,
!′() − )) (13)
+¶ß• = ! ^ ! :,
!′àâ ) … (3) (14)
Problema 1.43
Considere tres variables I, Ø e ), con media cero y varianzas unitarias. Una cuarta variable
es creada como d = I + Ø. Se sabe que (i) en una regresión de d contra ), se obtiene
que el coeficiente es 0.8, (ii) en una regresión de d contra I, se obtiene que el coeficiente
es 0.5 y (iii) en una regresión de Ø contra ), el coeficiente obtenido es 0.4. ¿A cuánto
equivale la suma de cuadrados residuales (SCR) en una regresión de C contra D?
Considere que hay 21 observaciones.
Solución
Ahora, primero veamos qué es lo que se necesita obtener para obtener la SCR. Sabemos
que esta suma equivale a:
#
dVÜ d; Ø (1)
cd` = (] − 1) Z* # = [* − hY* #
= [* # − h # Y* # = % d − %(Ø)
% Ø
#
dVÜ d; Ø
cd` = (] − 1) % d − %(Ø) (2)
% Ø
Como sabemos que las varianzas son unitarias; lo único que debemos hallar es la
covarianza entre C y D; y la covarianza entre N y D.
Dado que las variables tienen media cero, los coeficientes proporcionados nos
proporcionan en general la covarianza entre la varianza. Sin embargo, como la varianza
de cada variable es unitaria; en general, los coeficientes que nos dan nos están diciendo
las covarianzas entre las variables relacionadas.
(4)
dVÜ d; ) = dVÜ I; ) + dVÜ Ø; ) = 0.8
(5)
dVÜ d; I = % I + dVÜ(I; Ø) = 0.5
(6)
dVÜ Ø; ) = 0.4
(7)
1 + dVÜ I; Ø = 0.5 → dVÜ I; Ø = −0.5
(8)
% d = 2 1 + −0.5 =1
#
0.5
cd` = 21 − 1 1− 1 = 15 (10)
1
Problema 1.44
Muestre que si h es el estimador MCO de la regresión de 5 sobre ! y si [ es cualquier otro
vector de ´61, se cumple lo siguiente:
5 − ![ ′ 5 − ![ − 5 − !h ′ 5 − !h = ([ − h)′!′!([ − h) (1)
Solución
Primero se llega a la expresión planteada en la pregunta. Para ello, se define las siguientes
ecuaciones:
5 = !h + Z (2)
5 = !h + 0 (3)
Usamos [ = h − h + [
0′0 = 5 − !h ′ 5 − !h − 2 5 − !h ! [ − h ′ + ! [ − h ′ ! [ − h (6)
5 − ![ ′ 5 − ![ − 5 − !h ′ 5 − !h = ([ − h)′!′! [ − h (8)
Si se reemplaza Z:
Problema 2.1
Solución
Falso. El nivel de significancia refleja la probabilidad de cometer Error Tipo 1, esto es, la
probabilidad de rechazar …• dado que la …• es verdadera. Para una muestra, existe un nivel
determinado de trade-off entre la probabilidad de cometer Error Tipo I y II. Para reducir el
error tipo II sin incrementar el Error Tipo I es necesario incrementar el tamaño de la muestra.
Problema 2.2
¿Qué es el nivel de potencia de una prueba de hipótesis y cuál es la relación que tiene con
el nivel de significancia?
Solución
Problema 2.3
En una prueba de significancia individual, siempre que el √ calculado (√ß? ) sea menor al √
de tabla puedo asegurar que la variable es no significativa.
Solución
Problema 2.4
Solución
ô/ :ô/
Hipótesis nula de no significancia recae en el √ß? = . Si disminuye la varianza del
vÀ
estimador, entonces el ç? aumenta. Considerando que se trabaja con el valor absoluto, el
objetivo de la prueba √ es conocer si el coeficiente de +* es estadísticamente significativo
(proviene de una distribución en la cual el valor más probable, el parámetro, es diferente de
cero) o si el valor obtenido toma su valor debido a la varianza (el coeficiente efectivamente
proviene de una distribución centrada en cero pero por un tema de varianza, aleatoriedad,
el valor del coeficiente resultó diferente de cero). Es por ello que se divide entre la
desviación estándar y se compara con el √ de tabla. Así, ante un mayor √ß? , se disminuye
la posibilidad de aceptación de la hipótesis nula. Por lo tanto, el comente es falso, sin
importar si el coeficiente sea positivo o negativo.
Problema 2.5
Si existe evidencia estadística suficiente para rechazar que solo uno de los regresores
incluidos en un determinado modelo es distinto de cero (es decir que todos los demás
regresores son no significativos), entonces es probable que la prueba 8 de significancia
conjunta lleve a no rechazar la …â .
Solución
Problema 2.6
El proceso de inferencia no tiene sentido ya que siempre podré aceptar cualquier hipótesis
nula de trabajar con un nivel de significancia lo suficientemente alto.
Solución
Problema 2.7
A medida que la correlación entre las variables explicativas tiende a uno, la potencia de la
prueba de hipótesis de no significancia individual crece.
Solución
:,
Cõ# ! ^ †Ã !
%RT(+, ) = 1 − (5)
! ^! ! ^!
Cõ#
%RT(+, ) = 1 − `# :, (6)
! ^!
Problema 2.8
Solución
Se tienen las Õ restricciones tal que …G : `œ9¡ +¡9, = Tœ9, donde ` no es necesariamente una
matriz cuadrada.
1
∞ +, λ = (5 − !+)´ 5 − !+ + λ´(`+ − T) (1)
2
Donde λ es un vector de dimensión Õ61 que contiene multiplicadores de Lagrange. Las
condiciones de primer orden (CPO) para minimizar:
¬∞ +— , λ
= −!´ 5 − !+— + `´λ = 0 (2)
¬+—
¬∞ +— , λ
= `+— − T = 0 (3)
¬λ
A partir de (1):
Además, se premultiplica por ` para poder encontrar una forma cuadrada que se pueda
invertir:
:,
(` !´! `´):, `(!´!):, `´λ = (` !´! :,
`´):, `hEFG − `+— (8)
:,
λ = (` !´! `´):, `hEFG − T (9)
Problema 2.9
+EF— = +EFG − ! ^ ! :,
`^ ` ! ^! :,
`^ :,
(` +EFG − T) (1)
SCR @ − SCR ã@ ] − ´
F= (2)
SCR ã@ Õ
Solución
Además,
Z@ = ) − !+@ (4)
e@ = ) − ! +EFG − ! ^ ! :,
`^ ` ! ^! :,
`^ :,
`+EFG − T (5)
e@ = eã@ + ! ! ^ ! :,
`^ ` ! ^! :,
`^ :,
`+EFG − T (6)
Entonces:
^
e^@ e@ = e^ã@ eã@ + ! ! ^ ! :,
`^ ` ! ^! :,
`^ :,
`+EFG − T (9)
! ! ^! :,
`^ ` ! ^! :,
`^ :,
`+EFG − T (10)
^
e^@ e@ = e^ã@ eã@ + ! ^! :,
`^ ` ! ^! :,
`^ :,
`+EFG − T (11)
! ^! :,
`^ ` ! ^! :,
`^ :,
`+EFG − T (12)
Problema 2.10
(iv) Cinco años de experiencia pueden compensar por un año menos de educación.
Solución
+â expresa el valor promedio del logaritmo del ingreso mensual cuando los valores de
las demás variables son iguales a cero. "6èZT se calcula como la edad menos los años
de educación. Cabe señalar también que, en la práctica, los modelos presentan cierto
grado de colinealidad o multicolinealidad, las variables explicativas no son del todo
ortogonales. Sin embargo, es posible permitir cierto grado de multicolinealidad ya que
el objetivo es que ninguna variable se pueda definir como una combinación lineal de
otras. Por su parte, "Y0[ # busca introducir en el modelo el hecho que el ingreso tiende
a incrementarse más rápidamente en los últimos años de educación que en los
primeros.
Solución
ii) Hipótesis nula 1, +, menor o igual a cero y alternativa mayor a cero. Hipótesis
nula 2, +# menor o igual a cero y la alternativa mayor a cero. Hipótesis nula
3, +, − +# menor o igual a cero y la alternativa mayor a cero.
Problema 2.11
Así, se le pide que verifique las hipótesis siguientes sabiendo que √â.â#~ = 1.96:
a) Verifique la hipótesis de que las elasticidades del capital y trabajo son idénticas.
Solución
…• : ö − + = 0 (3)
…• : ö − + ≠ 0 (4)
(0.632 − 0.452)
ç? = = 2.842498 (5)
0.257 # + 0.219 # + 2(0.055)
Solución
…• : ö + + = 1 (7)
…• : ö + + ≠ 1 (8)
0.632 + 0.452 − 1
ç? = = 0.177478 (9)
0.257 # + 0.219 # + 2(0.055)
Problema 2.12
5
Se conoce como regresión de Mincer a aquellas ecuaciones que buscan explicar el salario de las
personas a partir, principalmente, de su educación y experiencia.
(0.000)
Z6èZT 0.04
(0.000)
Z6èZTQÕ -0.0007
(0.000)
Prob>F 0.0000
R2 0.3003
Solución
El `2 es una medida de bondad de ajuste, que en este caso indica que el modelo, como
está planteado, no está explicando la variabilidad de la dependiente. La prueba 8 es una
prueba de significancia global. En este caso dicho è − ÜRS0Z es menor al 5%, por ende, se
rechaza la …• de la prueba 8 (…• de la prueba 8 es que todos los betas son iguales a cero).
Problema 2.13
Solución
b) Suponga que el gobierno impone un impuesto que incrementa el precio del vino en
10%. ¿Qué efecto tendrá este impuesto sobre el consumo de vino? Dé una
respuesta numérica.
Solución
Se consideran dos respuestas correctas, aunque una es más precisa que la otra. La
respuesta más directa es usar la aproximación de cálculo: dado que la elasticidad
de d con respecto a †ú es igual al coeficiente de †ú en la regresión anterior (definido
como δ, )
†ú ¬d ¬ log d
= = δ, (1)
d ¬†ú ¬ log †ú
Se obtiene:
:,.2}
∆d ∆†ú :,.2}
= 1+ − 1 = 1 + 10% − 1 = −11.2% (6)
d †ú
c) Alguien sugiere que la demanda debería depender de los precios pero relativos al
ingreso. Es decir, se sugiere que el modelo debería ser:
†ú †fi
log d = +â + +, log + +# log + +2 ) + _ (7)
) )
¿Qué valores de los coeficientes obtendría si estima este modelo por MCO?
Solución
†ú †fi
log d = +â + +, log + +# log + +2 log ) + _ (8)
) )
d) Alguien más le sugiere que debería incluir los precios relativos del vino y la cerveza.
Es decir, se sugiere que el modelo debería ser:
†ú
log d = +â + +, log †ú + +# log †fi + +2 log ( ) + +} ) + _ (10)
†fi
¿Qué pasará si intenta estimar este modelo?
Solución
‚û
Este modelo exhibe colinealidad perfecta pues se tiene que log =
‚„
log †ú − log †fi . Por lo tanto, no puede ser estimado.
6
‰. SV{Æ = log Æ Â
e) La figura de abajo muestra los residuos de la regresión del cuadro anterior
(“residuals” es el término en inglés para residuos, y “fittedvalues” es el término para
valores ajustados). A partir de esta evidencia, ¿qué opina sobre la especificación de
la demanda de vino escogida?
Solución
La figura muestra un patrón entre los residuos y los valores ajustados: los residuos
tienden a ser negativos en los bordes, y positivos en el centro. Esto es una indicación
de que existiría alguna relación no lineal entre las X y la Y que no está siendo
capturada por nuestra regresión lineal.
Problema 2.14
Solución
Solución
El valor de mercado sí parece tener un efecto significativo (el valor del estadístico √
en las columnas 2 y 3 es mayor a 1.96). Analizando la columna 3 (que tiene un
mayor número de controles y es menos probable que sufra de variable relevante
omitida), se observa que el efecto es relativamente pequeño: un cambio de 10%
generaría un incremento de 1% en el salario de los gerentes.
Solución
s
Ë(s) ~.≥≥
Esto se compara con el valor crítico de una 8#,,±, = 3 o con una = ≈ 3,
# #
dado que en muestras grandes ambos valores son aproximadamente iguales (la chi-
cuadrado dividida entre Õ se aproxima a una 8, al igual como la normal estándar se
aproxima a una √ cuando la muestra es grande). Se rechaza la hipótesis nula: las
variables son conjuntamente significativas.
Solución
El signo negativo puede deberse a lo que se llama efecto “súper estrella”. Las
compañías que contratan CEOs de fuera de la empresa tienden a buscar los
mejores candidatos posibles, con salarios potencialmente altos. Si una persona ha
sido muchos años un empleado normal (no CEO) de una compañía significa que no
es probablemente considerado una súper estrella.
Problema 2.15
Considere una ecuación para explicar los sueldos de los directores generales en términos
de las ventas anuales de la empresa, el rendimiento sobre capital (TVZ, en forma de
porcentaje), y el rendimiento de las acciones de la empresa (TVQ, en forma de porcentaje):
a) Establezca la hipótesis nula de que controlando por ÜZ]√RQ y TVZ, TVQ no tiene efecto
en el sueldo de los directores generales. Establecer la alternativa de que un mejor
desempeño de las acciones de la empresa incrementa el suelo de los directores.
Solución
7
Note que la aproximación funciona bien para cambios pequeños.
…â : +2 = 0 (2)
…, : +2 > 0 (3)
log QRSRT∫V = 4.32 + 0.28 log ÜZ]√RQ + 0.0174 TVZ + 0.00024 TVQ (4)
Solución
Se debe notar que, como el modelo está en logaritmos y TVQ está expresado en
porcentaje; el coeficiente estimado para ros en el modelo anterior es una elasticidad.
Por tanto, para calcular el aumento del salario ante un incremento de TVQ en 50 puntos
porcentuales, se multiplica la elasticidad calculada por dicho aumento porcentual:
c) Pruebe la hipótesis nula que TVQ no tiene efecto sobre QRSRTUV contra la hipótesis
alternativa de que TVQ tiene un efecto positivo. Realice la prueba al 10% de
significancia.
Solución
…â : +2 = 0 (6)
…, : +2 > 0 (7)
ö = 0.1 (8)
+2 − +2
√= ~√a:¡:, (9)
ZZ +2
Se acepta …â si √ ≤ 1.282.
0.00024
ç? = = 0.444 (10)
0.00054
Por lo tanto, no puede rechazarse …â ; es decir, a un nivel de significancia de ö = 0.1,
se concluye que ante las evidencias muestrales el rendimiento de las acciones no
tiene un efecto positivo sobre el salario de los directores.
d) Explique si incluiría TVQ en el modelo final que explica las compensaciones de los
directores en términos del desempeño de la empresa.
Solución
Las evidencias muéstrales indican que la variable TVQ no tiene ningún efecto sobre la
variable independiente, por lo que de existir algún sesgo por omitir esta variable sería
muy pequeño.
Problema 2.16
Solución
En general, todas tienen el signo esperado. Por ejemplo, √Zêè tiene un coeficiente
negativo lo que era de esperarse ya que si el estudiante practica algún deporte
tendrá menos tiempo para estudiar y por ende tendrá notas más bajas.
Todos los efectos calculados (tanto con los estadísticos t usuales como los robustos
a la heterocedasticidad) son estadísticamente significativos excepto los de ℎVTRQ.
Solución
Solución
Problema 2.17
Un investigador está interesado en estimar el efecto que tiene una serie de factores sobre
la productividad agrícola de los productores de papa en la Sierra del Perú. Gracias a su
grupo de ayudantes, pudo estimar una serie de regresiones que se muestran a
continuación:
Regresión 1
Variable dependiente: LN(Producción)
R2 0.318516
Prob (F) 0.000000
Regresión 2
R2 0.295559
Prob (F) 0.000000
Regresión 3
R2 0.493302
Prob (F) 0.000000
Regresión 4
R2 0.226759
Prob (F) 0.000000
Regresión 5
Variable dependiente: LN(Producción)
R2 0.493072
Prob (F) 0.000000
Donde:
Especifique para cada hipótesis: i) La regresión con la que cree que es más pertinente
trabajar, ii) La(s) hipótesis nula(s), iii) la prueba estadística correspondiente y iv) qué
resultados/valores le permiten concluir que la hipótesis efectivamente se cumple o no.
Trabaje con un nivel de confianza de 95%.
Solución
Regresión 2
…â : 3.5+, = 25 (1)
…, : 3.5+, ≠ 25 (2)
#~
+, −
Kß? ß = 2.~ (3)
c√Y. "TTVT
36.46 − 7.14
Kß? ß = = 9.06 (4)
3.24
Se rechaza …â .
b. Realizar otras actividades diferentes de la agricultura durante una hora más por día
reducirá la producción en 13%.
Solución
Regresión 4
…â : +# = −0.13 (5)
…, : +# ≠ −0.13 (6)
+# + 0.13
Kß? ß = (7)
c√Y. "TTVT
0.02
Kß? ß = = 0.28 (8)
0.07
No se puede rechazar …â .
Solución
Regresión 3
…â : +2 = 15 (9)
…, : +2 ≠ 15 (10)
+2 − 15
Kß? ß = (11)
c√Y. "TTVT
27.09 − 15
Kß? ß = = 0.48 (12)
25
No se puede rechazar …â . Sin embargo, hay que observar también que esta
variable no es significativa, por lo cual también se aceptaría la hipótesis de que
tener más integrantes en la familia no afecta a la producción.
Solución
Problema 2.18
Considere lo siguiente:
• Earnings: representa el salario por hora y que la muestra está compuesta solo por
individuos de razas blanca y negra.
• Ethblack: es una dummy que indica si el individuo es de raza negra,
• Male: es una dummy que indica si el individuo es hombre,
• S: representa los años de educación,
• Sblack: es una variable creada multiplicando las dummies “S” y “Ethblack”
• MB: es la multiplicación de las dummies “Male” y “Ethblack”.
b. Los individuos de raza blanca ganan aproximadamente tres soles más por hora
que los de raza negra.
Regresión 1
Variable dependiente: EARNINGS
R2 0.178038
Prob (F) 0.000000
Regresión 2
R2 0.213735
Prob (F) 0.000000
Regresión 3
R2 0.216106
Prob (F) 0.000000
Regresión 4
Variable dependiente: LNEARNINGS
R2 0.014904
Prob (F) 0.000000
Regresión 5
R2 0.092702
Prob (F) 0.000000
Solución
…â : +# = 11 (1)
…, : +# ≠ 11 (2)
+# − 11
Kß? ß = (3)
c√Y. "TTVT
11 − 11
Kß? ß = =0 (4)
0.01
No se rechaza …â .
…, : +, ≠ −3 (6)
+# + 3
Kß? ß = (7)
c√Y. "TTVT
−0.49
Kß? ß = = −0.02 (8)
1.84
No se rechaza Ho.
ln 5 = +â + +, + +# c + +2 c ∗ 1 + Z (10)
ln 5 = +â + +, + (+# + +2 )c + Z (11)
cU Z√ℎhSR[´ = 0 → ln 5 = +â + +# c + Z (12)
…â : +2 ≤ 0 (13)
…, : +2 > 0 (14)
+2 − 0
Kß? ß = (15)
c√Y. "TTVT
No se rechaza Ho.
…, : +, + +# < 0 (18)
(+, + +# ) − 0
Kß? ß =
s (19)
c√Y. "TTVT, # + c√Y. "TTVT# # + 2dVÜ(+, ; +# )
g. Se roma todas las hipótesis como si fueran con una regresión que contiene a
todas las variables cuyos betas se van a evaluar:
+â dV]Q√R]√Z
+, "√ℎhSR[´
+# °]{
+2 c
+} chSR[´
+~ àRSZ
+Ä àÆ
…â : `+ = Õ (20)
0 0 0 1 0 0 0
0 0
`= 0 1 0 0 0 (21)
0 0 0 1 0 0 0
0 0 1 0 0 0 1
+ = [+â +, +# +2 +} +~ +Ä ] (22)
Õ = [11 − 3 0 0] (23)
Problema 2.19
Tres investigadores se encuentran analizando los determinantes de los ingresos por hora
con una data proveniente de una muestra de 104 trabajadores (todos varones) en EEUU
en 2006. Las variables incluidas son las siguientes:
∞]°]{ = 2.02 + 0.063 ∗ "Y0[ + 0.0044 ∗ I0ê + 0.0026 ∗ %ZTh; cd` = 2 000 (1)
El investigador 2 define una nueva variable cd≠`", como el promedio entre I0ê y %ZTh.
Él estima la siguiente ecuación:
∞]°]{ = 1.72 + 0.050 ∗ "Y0[ + 0.0086 ∗ cd≠`"; `cc = 2 045 (2)
El investigador 3 estima:
∞]°]{ = 2.02 + 0.063 ∗ "Y0[ + 0.0088 ∗ cd≠`" − 0.0018 ∗ %ZTh; `cc = 2 000 (3)
Solución
%ZTh + I0ê
(4)
2
Por ende, el modelo 2 puede reescribirse como:
+# +#
∞] °]{ = +â + +, "Y0[ + %ZTh + I0ê + 4 (5)
2 2
Por otro lado, el modelo 1 es el siguiente:
SCR @ − SCR ã@ /Õ
F= (7)
SCR ã@ /] − ´
Solución
Se tiene el modelo 1:
Problema 2.20
Sobre la base de esta información, el MIDIS está interesado en verificar las siguientes
hipótesis:
(i) “El acceso a la educación secundaria por parte del jefe de hogar tiene un impacto
positivo sobre la decisión de enviar a los hijos al colegio”.
(ii) “La decisión de enviar a los hijos al colegio de un hogar cuyo jefe tiene
instrucción superior será similar a la de un hogar cuyo jefe tiene sólo instrucción
secundaria”.
(iii) “La falta de acceso a instrucción secundaria por parte del jefe de hogar puede
ser compensada si es que el hogar en cuestión tiene un jefe mujer”.
Solución
Los controles pueden ser una serie de variables diferentes que respondan a
características relevantes. Podrían ser:
Los signos esperados de las variables principales son positivos para †`°à, c"d y
c_†. Para la variable c"!≠ va a depender de la percepción del alumno. En principio,
podría esperarse que tenga un efecto negativo por la misma definición de esta
variable dummy. Es decir, se puede esperar que en promedio las mujeres (como jefe
de hogar) estén más preocupadas por mandar al colegio a sus hijos. Sobre algunos
supuestos, los básicos son el supuesto de normalidad y homocedasticidad si se
busca hacer inferencia en muestras pequeñas.
b. Sobre la base del modelo teórico, plantea un conjunto de pruebas de hipótesis (y los
respectivos tests a utilizar) que permitan verificar las tres hipótesis que tiene el
MIDIS.
Solución
Primera hipótesis:
…â : +# > 0 (2)
…, : +# ≤ 0 (3)
Segunda hipótesis:
…â : +# = +2 (4)
…, : +# ≠ +2 (5)
Tercera hipótesis:
Una posible interpretación pasa por reconocer que el efecto de tener primaria y a la
vez ser mujer es equivalente al efecto de tener secundaria y ser hombre. En este
caso, es importante definir que el efecto de ser hombre impacta negativamente sobre
la asistencia al colegio. Así, podría compararse el impacto de ser jefe del hogar
hombre con secundaria versus solamente el hecho de ser mujer. Esto, no obstante,
es complicado por la definición de la variable dummy SEXO (1 si es hombre, 0 de
otro modo).
La hipótesis sería:
…â : +, = +# + +Ä (9)
…, : +, ≠ +# + +Ä (10)
Asist
Sec + mujer
Una función de consumo que tiene diferentes propensiones marginales a consumir (PMC)
de corto y de largo plazo puede escribirse como:
En este modelo, la PMC de corto plazo es igual a +; mientras que la de largo plazo equivale
a W = +/(1 − Ω).
Un investigador decidió estimar este modelo; pero olvidó incluir la variable dependiente
rezagada en la regresión (dO:, ). Sin embargo, dijo que no importaba demasiado,
argumentando que muchos estudios previos afirmaban que este parámetro era igual a 0.9.
Los resultados que obtuvo de este modelo fueron los siguientes:
ln dO = 0.004132 + 0.12643S])O + 0O #
, ` = 0.67845 (2)
. (0.01560) . (0.03157) . .
Solución
ô
La hipótesis nula en este caso es …â : W = = 1. Por tanto, lo que se debe probar
(,:â.≥)
es que:
…â : + = 0.1 (3)
0.0008254 −0.0008207
%RT +; Ω = (6)
−0.0008207 0.0008173
Solución
Ahora, no se conoce el valor de gamma; sino que se estima. La hipótesis nula es:
+
…â : W = =1 (7)
(1 − Ω)
En este caso, se trata de una única restricción; por lo que el estadístico se puede
expresar como:
#
` y −Õ
Ì= ~Ó # (™) (9)
%RT y
Por lo tanto, dado que una chi-cuadrado es una normal al cuadrado; el estadístico
se distribuye como una normal estándar bajo la hipótesis nula:
` y −Õ
£= ~I(0,1) (10)
cØ(y)
1
1 + 0.0008254 −0.0008207 (1 − Ω)
%RT W = − (13)
(1 − Ω) (1 − Ω)# −0.0008207 0.0008173 +
−
(1 − Ω)#
0.0008254 −0.0008207 13.2626
%RT W = 13.2626 −13.1834 (14)
−0.0008207 0.0008173 −13.1834
0.99403 − 1 0.99403 − 1
£= = = −0.37131 (18)
0.0002585 0.016078
Otra manera de hacerlo es usando una prueba lineal. Si se plantea la hipótesis nula
como:
…â : + + Ω = 1 (19)
++Ω−1
√= (20)
cØ(+ + Ω)
Problema 3.1
¿Cuál es la intuición detrás del estimador de MV? ¿Cuál es el valor al que deben ser
igualadas las condiciones de primer y segundo orden de la maximización de MV?
Solución
) = {54,53,49,61,58} (1)
Problema 3.2
Solución
Solución
Problema 3.4
Solución
Problema 3.5
Comente la siguiente afirmación: “Es lo mismo estimar un parámetro a partir de la función
de verosimilitud que a partir de la función de log-verosimilitud ya que el valor máximo de
ambas funciones, que se obtiene con el parámetro hallado, es el mismo”
Solución
Problema 3.6
Solución
En caso quisiera hallarse estimados de MV de las dos distribuciones de las que provienen
las observaciones, se debe proceder a estimar por separado usando realizaciones solo de
una u otra distribución (en caso sea posible identificar que vienen de alguna determinada
distribución).
Problema 3.7
Solución
Problema 3.8
Solución
] ] 1
S]∞ +, C # 5, ! = − S]C # − S]2Ù − # 5* − !*^ + # ] (2)
2 2 2C P
] ] 1
S]∞ +, C # 5, ! = − S]C # − S]2Ù − # [5 ^ 5 − 25 ^ !+ + + ^ ! ^ !+] (4)
2 2 2C
Para hallar el valor de los parámetros que maximizan la verosimilitud, se busca el vector
gradiente derivando la función S]∞ respecto a + y C # .
Derivando respecto a +:
YS]∞ 1 Y 5 ^ 5 − 25 ^ !+ + + ^ ! ^ !+
=− # (5)
Y+ 2C Y+
YS]∞ 1
= − # [−2! ^ 5 + 2! ^ !+] (6)
Y+ 2C
YS]∞ 1
= # [! ^ 5 − ! ^ !+] (7)
Y+ C
! ^ !+ = ! ^ 5 (9)
+ = ! ^! :,
!′5 (10)
Derivando respecto a σ# :
YS]∞ ] 1
#
= − # − } [(5 − !+)′(5 − !+)] (11)
YC 2C 2C
1 ^
]
5 − !+ 5 − !+ = (13)
2C } 2C #
1 ^
5 − !+ 5 − !+ =] (14)
C#
1 ^
5−5 5−5 =] (16)
C#
1
Z′Z = ] (17)
C#
Z ^Z
C# = (18)
]
Problema 3.9
Asumiendo que las observaciones correspondientes a la variable dependiente provienen
de una función de distribución marginal normal, derive la normalidad asintótica del
estimador de MV.
Solución
+EFG = ! ^ ! :,
! ^) (1)
Reemplazando ) se obtiene:
+EFG − + = ! ^ ! :,
! ^Ÿ (2)
:,
1 ^ ] ^
](+EFG − +) = !! !Ÿ (3)
] ]
, :,
Por Ley de Grandes números: ! ^! → " ! ^! :,
a
a
Por TLC: ! ^ Ÿ → I[0, Cˆ# " ! ^ ! ]
a
Por tanto,
Problema 3.10
Solución
Z :¯/ ˜* ä/
∞* = (2)
5* !
Función de verosimilitud:
a a
Z :¯/ ˜* ä/
∞* = (3)
5* !
*b, *b,
Solución
a
Z :¯/ ˜* ä/
∞V{∞ = ∞V{ (4)
5* !
*b,
a (Àq ˙Às ˚/ )ç/
Z :¥ Z (ôqrôs ./)ä/
∞V{∞ = ∞V{ (5)
5* !
*b,
a
ôq rôs ./
∞V{∞ = [−Z + 5* +, + +# !* − log (5* !)] (6)
*b,
a
¬SV{∞ ôq rôs ./
= [5* − Z ] (7)
¬+,
*b,
a
¬SV{∞ ôq rôs ./
= [6* 5* − 6* Z ] (8)
¬+#
*b,
Para demostrar que las contribuciones al Score son cero, se usará el dato que
provee el enunciado. Si se evalúa los estimadores en los parámetros y se
toman expectativas condicionales en !:
a
ôq rôs ./ ôq rôs ./
" 5* − Z = "(5* /6* ) − " Z 6* ) = ]˜* − ]˜*
(9)
*b,
=0
a
ôq rôs ./ ôq rôs ./
" 5* 6* − 6* Z |6* = "(5* /6* )6* − 6* " Z 6* )
*b, (10)
= 6* ˜* − 6* ˜* = 0
a
ôq rôs ./ ôq rôs ./
" 5* − Z = "(5* /6* ) − " Z 6* ) = ]˜* − ]˜*
(11)
*b,
=0
Solución
¬ # ln ∞ ôq rôs 9/
= −Z (12)
¬+, #
¬ # ln ∞
= −6*# Z ôq rôs 9/
(13)
¬+# #
¬ # ln ∞ ôq rôs 9/
= −6* Z (14)
¬+, ¬+#
*b, *b,
§ §
ôq rôs 9/ ôq rôs 9/
Z 6* Z
*b, *b,
° +, ; +# = § § (16)
6* Z ôq rôs 9/
6*# Z ôq rôs 9/
*b, *b,
Ahora, invirtiendo esta matriz para obtener la varianza:
§ § :,
˜* 6* ˜*
:, *b, *b, (17)
%RT +, ; +# = ° +, ; +# = § §
6* ˜* 6* # ˜*
*b, *b,
Problema 3.11
La UP ha decidido regalar un carro a cada alumno del salón de Econometría I (el salón está
compuesto por 14 alumnos). Cada alumno puede elegir el color del carro que recibe.
Considere que 5 es la variable aleatoria que denota el color de carro elegido, asuma que
esta puede tomar los siguientes valores: 5* = 0 si el carro elegido es rojo, 5* = 1 si el carro
elegido es negro, y 5* = 2 si el carro elegido es blanco.
Solución
L˝ = πˇ 1 − π ,:ˇ
(1)
Dado que el problema plantea tres opciones (rojo, negro y blanco), la función de
verosimilitud, la función de verosimilitud es:
# $ % (2)
L˝ = Pr y = 0 Pr y = 1 Pr y = 2
b) Asuma que los 14 carros elegidos por los alumnos de la sección B del curso de
Econometría I tienen la siguiente distribución: 3 carros rojos, 7 carros negros y 4
carros blancos. Asimismo, considere que ö es la probabilidad de que un alumno elija
un auto rojo, + es la probabilidad de que un alumno elija un auto negro y W, la
probabilidad de que un alumno elija un auto blanco. A partir de la contribución
individual hallada en (i), plantee la función de verosimilitud y halle el valor de los
parámetros que maximizan dicha función.
Solución
(5)
∞ = ö a)*+*, + aó-.)*, (1 − ö − +),}: a)*+*,: aó-.)*,
(6)
∞ = ö 2 + ± (1 − ö − +)}
(7)
∞]∞ = 3∞]ö + 7∞]+ + 4 ∞](1 − ö − +)
¬∞]∞ 3 4 (8)
≡ − =0
¬ö ö (1 − ö − +)
¬∞]∞ 7 4 (9)
≡ − =0
¬+ + (1 − ö − +)
2 ± ±
= ;+= ö (10)
4 ô 2
3 4 (11)
=
ö (1 − ö − ± ö)
2
3 4 (12)
=
ö (1 − ,â ö)
2
10 (13)
3 1 − ö = 4ö
3
(14)
3 − 10ö = 4ö
(15)
3 = 14ö
2 ± }
ö∗ = ; +∗ = ; W∗ = (16)
,} ,} ,}
Problema 3.12
Solución
Se parte asumiendo que 5 proviene de una distribución normal, tal que 5 ∼
I(A, 6) . La función de densidad normal multivariada seria:
1 1
7 Z6è − (5 − A)′6 :, (5 − A)
q (3)
2Ù s 6 s
2
1
∞ h = [ − (5 − !h)′5 :, (5 − !h) (4)
2
Ya que es una constante, maximizar la función L b equivale a maximizar el
segundo término, (5 − !h)′5 :, (5 − !h), que es justamente lo que se pedía
demostrar.
b) Muestre que:
+ = ! ^ 5 :, ! :,
!′5 :, 5 (5)
Solución
:q
−2! ^9 5 + 2! ^ 5 :, !+ = 0 (7)
+ = ! ^ 5 :, ! :,
!′5 :, 5 (8)
c) Halle la varianza de +.
Solución
Ya que + = ! ^ 5 :, ! :,
!′5 :, 5, se extrae la varianza de los dos lados de la
expresión:
%RT(+|!) = ! ^ 5 :, ! :,
!′5 :, %RT(5|!)5 :, ! ! ^ 5 :, ! :, (9)
Solución
"(+|!) = ! ^ 5 :, ! :,
!′5 :, "(5|!) (11)
"(+|!) = ! ^ 5 :, ! :,
!′5 :, !+ (12)
"(+|!) = + ()
Solución
1 Y#∞ + 1 ^ :,
° + =" − =" − !5 ! (13)
I Y+Y+′ I
%RT(+) = "[ ! ^ 5 :, ! :,
] (14)
Solución
+ = ! ^ 6 :, ! :,
!′6 :, 5 (17)
:q
%RT + ! = ! ^ 6 :, ! :,
! ^; %RT 5 ! 6 :, ! ! ^ 6 :, ! :, (18)
%RT(+|!) = ! ^ 6 :, ! :,
!′6 :, 56 :, ! ! ^ 6 :, ! :, (19)
:q
%RT + ! = ! ^ 6 :, ! :, ! ^; 56 :, ! ! ^ 6 :, ! :,
> ! ^ 6 :, ! :,
(20)
= %RT + !
Esta es la fórmula de White. Es un ejemplo de pseudo-verosimilitud en la
que se logra obtener consistencia, pero se debe considerar la estructura
(errónea) de las perturbaciones con el fin de obtener errores estándares
adecuados para la inferencia.
Problema 3.13
en el cual las observaciones son UUY y 0* |6* ∼ I(0,1). Además, asuma que + y Ω son los
estimadores de MV de + y Ω, respectivamente.
Solución
§
1 1 5* − 6*^ h #
∞ h, [ = S] Z6è − (2)
2ÙZ6è (6* ′[) 2 Z6è 26*^ [
*b,
Para hallar los estimados, se buscaría maximizar la función de verosimilitud
respecto a h y [, haciendo uso de una rutina de maximización como el método
iterativo de Newton-Raphson.
§
1 5* − 6*^ h #
∞ h, [ = d − 6*^ [ + (3)
2 Z6è 26*^ [
*b,
Se halla la CPO:
§
Y∞ h, [ 5* − 6*^ h #
= 6 (4)
Y+ Z6è 26*^ [ *
*b,
Por lo tanto,
§ #
Y∞ +, Ω 5* − 6*^ +
= 6 (5)
Y+ Z6è 26*^ Ω *
*b,
Lo cual conlleva a:
§ :, §
1 1
+= 66′ 65 (6)
Z6è 26*^ Ω * * Z6è 26*^ Ω * *
*b, *b,
Solución
La derivada cruzada:
§
Y # ∞ h, [
= −2 5* − 6*^ h Z6è −26*^ [ 6* 6*^ (7)
Y+YΩ′
*b,
Por lo cual
Y # ∞ +, Ω
" =0 (8)
Y+YΩ′
ya que " 0* 6* ) = 0.
§
Y # ∞ h, [ 1
=− 6 6^ (9)
Y+Y+′ Z6è −26*^ [ * *
*b,
Problema 3.14
6* = W£* + Ü* (2)
Y" 5* £*
A +, Ω, W = (3)
Y£*
Solución
De manera que:
A +, Ω, W = +W + Ω (6)
C ô# 0 0
6= 0 C #> 0 (7)
0 0 C B#
Solución
+ +
I Ω − Ω I 0, èSUê I6 (8)
µ §→ñ
W W
YA YA YA
= W 1 + (9)
Y+ YΩ YW
W
I(A − A) I 0, W 1 + èSUê I6 1 (10)
µ §→ñ +
Se deriva que el estadístico de Wald es:
#
+W + Ω
Ì= (11)
W # C ô# + C #> + + # C B#
Solución
Solución
+W + Ω
à= ∼ I(0,1)
(12)
W # C ô# + C #> + + # C B#
Problema 3.15
Pedro inventa un juego, similar al “Bingo”, que consta de una caja que contiene canicas,
donde cada canica representa a un número. Los números considerados como elegibles son
consecutivos y pertenecen a un rango determinado. En particular, Pedro decide incluir
números consecutivos, no repetidos, contenidos en el rango [5, 15]. Quien dirige el juego
elige en cada ronda una canica de la caja a manera de muestreo con reemplazo, es decir,
en cada ronda se elige una canica y anuncia el número correspondiente, tras lo cual se
vuelve a incluir dicha canica en el “pool” de canicas elegibles. Cada jugador tiene una cartilla
con números. Un jugador puede marcar un número en su cartilla si quien dirige el juego
anuncia dicho número como elegido en alguna determinada ronda. Quien llene la cartilla
primero gana.
Juan, muy ansioso, desea descifrar cómo ganar el juego antes de que Pedro le explique
cómo jugar. Juan deduce que todas las canicas tienen la misma probabilidad de ser
elegidas y que lo único que necesita para determinar dicha probabilidad es el intervalo al
que pertenecen los números elegibles en el juego. Así, logra descifrar que la distribución
de números elegibles corresponde a una distribución uniforme y recuerda que los
parámetros característicos de este tipo de distribución son el límite inferior y el límite
superior del rango al que pertenecen los números.
Ê 5O , + = 0 QU 5O < +, (1)
1
Ê 5O , + = QU +, ≤ 5O ≤ +# (2)
+# − +,
Ê 5O , + = 0 QU 5O > +# (3)
Solución
1
∞= (4)
+# − +,
1
∞= a
(5)
+# − +,
+# = max(5O ) (8)
Por la forma como se encuentra definida una distribución uniforme, siempre los
valores de 5O estarán contenidos entre +, y +# . Asi, se cumplira que +, ≥ +, y
+# ≤ +# . Sin embargo, ambos estitmados son consistentes. De manera intuitiva,
ello se justifica por el hecho de que conforme se incremente el tamaño de la
muestra, los valores observados de 5O irán rellenando el espacio entre +, y +# .
Problema 3.16
Demuestre que la función de log-verosimilitud para el modelo lineal general con errores
distribuidos normalmente (evaluada en los estimados de + y C # que lo maximizan) es una
función creciente del ` # del modelo.
Solución
a
1 1 1
ln ∞ = − S] 2Ù − S] C # − # 5* − 6′* + #
(1)
2 2 2C
*b,
Realizando el proceso de maximización, se sabe que los estimados obtenidos para los
parámetros son:
a #
:,
6* 5* # Z′Z *b, 5* − 6′* +
+ = !′! ! ^) = C = = (2)
6* # I I
La función de log-verosimilitud evaluada en estos parámetros resulta en:
a
] ] Z′Z I #
ln ∞ = − S] 2Ù − S] − a #
5* − 6′* + (3)
2 2 I 2 *b, 5* − 6′* +
*b,
] Z′Z
ln ∞ = − 1 + S] 2Ù + S] (4)
2 I
Recordando que el ` # = 1 − Z ^ Z/cdK; la expresión anterior queda como:
] cdK 1 − ` #
ln ∞ = − 1 + S] 2Ù + S] (5)
2 I
] cdK
ln ∞ = − 1 + S] 2Ù + S] + S] 1 − ` # (6)
2 I
Derivando con respecto al ` # :
¬ ln ∞ ] 1
#
=− −1 > 0 (7)
¬` 2 1 − `#
Problema 3.17
À
Ê 6 = ö+6 ô:, Z :49 ; 6 ≥ 0, ö, + > 0 (1)
Solución
À
S* = ö+6* ô:, Z :49/ (2)
a a
À
∞= S* = ö+6* ô:, Z :49/ (3)
*b, *b,
Aplicando logaritmos:
a
ln ∞ = S] ö + S] + + + − 1 S] 6* − ö6* ô (4)
*b,
a a
ln ∞ = ] ∗ S] ö + ] ∗ S] + + + − 1 S] 6* − ö 6* ô (5)
*b, *b,
b) Halle las condiciones de primer orden y obtenga una ecuación implícita para +.
Solución
a
¬ ln ∞ ] ]
= − 6* ô = 0 → ö = a ô
(6)
¬ö ö *b, 6*
*b,
a a
¬ ln ∞ ]
= + S] 6* − ö S] 6* 6* ô = 0 (7)
¬+ +
*b, *b,
a a
] ]
+ S] 6* − a ô
S] 6* 6* ô = 0 (8)
+ *b, 6* *b,
*b,
Solución
¬ # ln ∞ ]
=− # (9)
¬ö # ö
a
¬ # ln ∞ ]
=− #−ö S] 6* # 6* ô (10)
¬+ # +
*b,
a
#
¬ ln ∞
=− S] 6* 6* ô (11)
¬ö¬+
*b,
Solución
a
¬ ln ∞ ] 1
" = − 6* ô = 0 → " 6* ô = (13)
¬ö ö ö
*b,
a a
¬ ln ∞ ]
" = +" S] 6* − ö" S] 6* 6* ô = 0 (14)
¬+ +
*b, *b,
Dividiendo entre ]:
a a
1 " *b, S] 6*
+ − ö" S] 6* 6* ô /] = 0 (15)
+ ]
*b,
1 " S] 6* 6* ô
+ " S] 6* − =0 (16)
+ " 6* ô
" 6* ô " 6* ô
+ " 6* ô " S] 6* − " S] 6* 6* ô = 0 →
+ + (17)
= " S] 6* 6* ô − " 6* ô " S] 6*
1
= dVÜ ln 6; 6 ô (18)
ö+
Problema 3.18
a
1 1 1
ln ∞ = − S] 2Ù − S] C # − # 5* − 6′* + # (1)
2 2 2C
*b,
a
1 1 1
ln ∞ = − S] 2Ù + S] E # − E5* − 6′* W # (2)
2 2 2
*b,
a
¬ ln ∞
= 6* E5* − 6′* W = 0 (3)
¬W
*b,
a
¬ ln ∞ ]
= − 5* E5* − 6′* W = 0 (4)
¬E E
*b,
a
*b, 6* 5* :,
W=E a #
= E !′! ! ^ ) = Eh (5)
*b, 6*
a
]
= 5* E5* − 6′* Eh (6)
E
*b,
a
]
=E 5* 5* − 6′* h (7)
E
*b,
a
]
E# = ] 5* 5* − 6′* h = (8)
Z′Z
*b,
a ,/#
W= ] 5* 5* − 6′* h ∗h (9)
*b,
Luego, se debe obtener el esperado de cada una de las segundas derivadas. Se debe tomar
9/= B , ,
en cuenta que " 5* |6* = 6*^ h = . Por lo tanto, " 5* # |6* = W′6* + (dado que los
F Fs Fs
términos cruzados son cero). Agregando para todos los términos se reemplaza en la
segunda derivada con respecto a E. En términos matriciales, la matriz de información se
construye a partir de:
¬ # ln ∞
" |! = −!′! (13)
¬W #
¬ # ln ∞ 2] ]
" |! = − # − # W′!′!W (14)
¬E # E E
¬ # ln ∞ 1
" |! = !′!W (15)
¬W¬E E
1
!′! − !′!W
%RT(W, E) = E (16)
1 2] ]
− !′!W − W′!′!W
E E# E#
Problema 3.19
Considere una muestra (de ] observaciones) obtenida a partir de una distribución normal
multivariada con media A = A, ; A# ; … ; AE y matriz de covarianzas escalar (C # °). La
función log-verosímil es de la forma:
a
−]à ]à 1
ln ∞ = ln 2Ù — ln C # − # 5* − A ′ 5* − A (1)
2 2 2C
*b,
a) Obtenga los estimadores para A y C # .
Solución
a E a E
E #
# *b, ¶b,5*¶ − 5¶ 1 1 #
1
C = = 5*¶ − 5¶ = C #¶ (4)
]à à ] à
¶b, *b, ¶b,
Solución
¬ # ln ∞
" =0 (9)
¬A¬C #
a
¬ # ln ∞ ]à 1 ]à ]à ]à
" # #
= }
− Ä àC # = }
− } =− } (10)
¬C ¬C 2C C 2C C C
*b,
] :,
° 0
C#
%RT(A, C # ) = ]à
(11)
0
C}
4. Errores no esféricos
Problema 4.1
Solución
^
%RT + = " + − "(+) + − " + |! (1)
:,
%RT + = " !′! !′4 ! ^! :,
! ^ 4 ^ |! (2)
:,
%RT + = " !′! ! ^ 44 ^ ! ! ^ ! :,
|! (3)
:,
%RT + = !′! !′" 44 ^ |! ! ! ^ ! :, (4)
%RT + = C # !′! :,
! ^ Ω! ! ^ ! :,
> %RT + = C # !′! :, (5)
Problema 4.2
¿Qué se debe hacer para obtener un estimador eficiente cuando la matriz de varianzas y
covarianzas no es escalar?
Solución
) = !+ + 4 (1)
donde " 44 ^ = C # Ω. Para transformar el modelo, se debe multiplicar por una matriz,
llámese † que haga que el nuevo error tenga una matriz de varianzas y covarianzas escalar:
†) = †!+ + †4 (2)
Donde ahora " †4 †4 ^ = " †44 ^ † = †′" 44 ^ † = C # †′ΩP. Para que esta matriz sea
escalar; se debe cumplir que: † ^ ΩP = °; de donde se obtiene que : ††′ = Ω:, . Para el lector
que tenga conocimientos de álgebra matricial, † es la matriz que contiene a los vectores
propios ortonormales de Ω.
De este modo, aplicando MCO al nuevo modelo transformado, se obtiene el estimador por
MCG:
:,
+EFI = †! ′†! †! ′†) (3)
:, (4)
+EFI = !′†′†! !′†′†)
+EFI = !′Ω:, ! :,
!′Ω:, ) (5)
Problema 4.3
Solución
+ = !′Ω:, ! :,
!′Ω:, ) (6)
Problema 4.4
Solución
) = !+ + A (1)
†) = †!+ + †A (2)
)∗ = ! ∗+ + 4 (3)
Donde ahora " 44′|! = " †AA′†′|! = †C # Ω† ^ = C # I. Por tanto, se cumple que †Ω† ^ = °;
es decir, que Ω:, = †′†.
+ = !′Ω:, ! :,
!′Ω:, ) = ! ∗ ′! ∗ :,
! ∗ ′) ∗ (4)
Para analizar la eficiencia, se debe hallar la varianza de +EFI . Se sabe que este estimador
es insesgado (tarea) dado que las perturbaciones no esféricas sólo afectan la eficiencia del
estimador, mas no le incluyen un sesgo.
%RT +EFI |! = C # ! ∗ ′! ∗ :,
= C # !′†′†! :, (5)
De esta forma, la varianza del nuevo estimador lineal insesgado puede escribirse como:
‰†! !′Ω:, ! :,
− !′Ω:, ! :,
!′†′†! !′Ω:, ! :,
(11)
° !′Ω:, ! :,
− !′Ω:, ! :,
!′Ω:, ! !′Ω:, ! :,
(12)
!′Ω:, ! :,
− !′Ω:, ! :,
=∅ (13)
De esta forma:
De esta manera, la diferencia entre ambas varianzas siempre dará una matriz semi-definida
positiva; por lo que se concluye que el estimador MCG es el estimador de menor varianza
trabajando sobre el modelo transformado.
Problema 4.5
¿Cuáles son los casos en los que existe una matriz de varianzas y covarianzas no escalar?
Solución
4.1 Heterocedasticidad
Problema 4.6
Solución
L, ⋯ 0
Ω= ⋮ ⋱ ⋮ (1)
0 ⋯ L§
Se puede ver claramente que la varianza de los errores será distinta ya que cada una
depende de su propio peso denotado por L. La matriz † en este caso es:
1
⋯ 0
L,
P= ⋮ ⋱ ⋮ (2)
1
0 ⋯
L§
Como se puede ver, al multiplicar al modelo por la matriz †, se está ponderando a cada
observación. La ponderación que se le asigne a cada una de ellas dependerá de manera
negativa del peso L; es decir, lo que se hace al multiplicar por † al modelo es
semiestandarizar cada observación, dándole mayor importancia a aquellas observaciones
menos variables (más precisas).
Problema 4.7
Solución
Para detectar la heterocedasticidad, la prueba más utilizada es la prueba de White. Esta
prueba tiene como hipótesis nula que no hay heterocedasticidad. Para evaluarla, White
corre una regresión entre los errores al cuadrado de la regresión y las explicativas; así como
sus productos cruzados. El estadístico que evalúa es Ì = I` # ~Ó¡# ; donde k es el número
de regresores. Si se acepta la hipótesis nula, la prueba indica que hay no hay
heterocedasticidad; por lo que se puede utilizar MCO. De lo contrario, se debe corregir el
modelo.
De este modo, si el ajuste de la regresión auxiliar es bueno; quiere decir que las
características individuales explican la varianza del error; lo que conlleva a que el L sea
distinto para cada individuo.
Una gran limitación de esta prueba es que asume que el modelo está bien especificado. Si
el modelo no está bien especificado, la prueba puede indicar que hay heterocedasticidad
cuando en realidad no hay; es decir, es poco potente. Por ello, se pueden utilizar otras
pruebas como la prueba de Goldfeld y Quant o la de Breusch Pagan.
La primera compara los residuos recursivos en una submuestra al inicio y otra al final; y si
la SCR es muy distinta, entonces indica que hay heterocedasticidad. Por otro lado, la prueba
de Breusch-Pagan asume que hay una relación únicamente lineal entre los regresores y la
varianza del error. Por ello, corre una regresión de los errores al cuadrado contra los
regresores y utiliza la prueba F de significancia global para evaluar si los coeficientes son
cero. Si se acepta, entonces la prueba indica que no hay heterocedasticidad. El estadístico
es el mismo que le de la prueba de White.
Problema 4.8
Solución
Para ello, lo que se hace es correr los errores al cuadrado de la regresión contra algunas
variables que uno considere puedan ser la causa de heterocedasticidad. Por ejemplo, en
una regresión donde la dependiente es el nivel educativo, el ingreso podría ser una variable
escala útil. Una vez realizada la regresión, se estima la varianza del error:
C # = Z # = ö! (1)
Por último, se arma la matriz P estimada como y luego se transforma el modelo. El estimado
de este modelo transformado se le denomina Mínimos Cuadrados Generalizados Factibles
(MCGF):
1
⋯ 0
ö!,
P= ⋮ ⋱ ⋮ (2)
1
0 ⋯
ö!§
%RT + = C # !′! :,
Z*# 6* 6* ^ ! ^! :,
(3)
Es decir, se utiliza esta varianza a la hora de realizar inferencia una vez hecho el modelo.
Problema 4.9
Solución
Falso. MCG se prefiere cuando existe evidencia de que el error del modelo no tiene una
varianza homogénea ya que es más eficiente que MCO. Por otro lado, omitir una variable
importante del modelo genera estimadores sesgados e inconsistentes tanto en MCG como
en MCO.
Problema 4.10
Solución
El problema que acarrea esto es que MCO ya no es eficiente. La segunda parte del comente
es falsa dado que utilizar esa matriz de White no corrige el problema, ya que simplemente
indica que se tomará en cuenta dicha varianza para realizar la inferencia.
Problema 4.11
¿Cuál de las siguientes causas pueden hacer que los estadísticos √ de MCO no sean
válidos, es decir que no tengan una distribución √ bajo …• ?
a) Heterocedasticidad
Solución
Solución
Solución
Problema 4.12
5* = +â + +, 6,* + +# 6#* + 4*
(1)
O 4* = 0 (2)
#
%RT 4* = Cõ# 6#* (3)
Solución
1
⋯ 0
6#,
†= ⋮ ⋱ ⋮ (4)
1
0 ⋯
6#§
1 6,* 1
5* = +â + +, + +# + 4* (5)
6#* 6#* 6#*
Así, la matriz † contiene Cõ# porque desde que este término es constante no es necesario
controlar por tal variable al momento de ponderar a las observaciones.
Problema 4.13
Solución
Problema 4.14
Solución
White tiene la gran limitación de que va a trabajar desde el modelo (a partir de su regresión
extra). De esta forma, puede haber heterocedasticidad a partir del análisis visual, pero
White puede rechazarlo ya que esta heterocedasticidad puede que sea explicada desde el
error mismo y no desde las !’s.
Por otro lado, el estimador consistente de White no construye 5, sino que ajusta a MCO
para poder utilizarlo con la posibilidad de hacer inferencia más acotada.
Problema 4.15
Ante errores no esféricos, la estimación MCO de un modelo ignorando este problema hace
que la prueba K de significancia sea menos potente.
Solución
Si no se considera la presencia de errores no esféricos, las varianzas de los estimadores
son subestimadas. Por lo tanto, los estadísticos √ de significancia individual serían mayores,
y se rechazarían más veces la hipótesis nula que en otros casos, aumentando la
probabilidad de cometer error tipo 1 (ö).
Problema 4.16
51O = 6O ´+ + 4O (1)
52O = £O ´Ω + AO (2)
Luego de obtener un primer conjunto de estimados para cada vector de parámetros a través
de MCO, nuestro investigador decide analizar el comportamiento del residuo recursivo. Los
resultados que obtiene se muestran a continuación:
Solución
Solución
Para ver si están ocurriendo estos problemas, se debería correr el test de White
para verificar la presencia de heterocedasticidad. La hipótesis nula de esta prueba
es la ausencia de heterocedasticidad.
Por otro lado, para analizar la presencia de quiebre estructural, existen dos tipos de
pruebas: las recursivas y las estructurales. Las primeras son aquellas que te ayudan
a encontrar el momento del quiebre; dentro de las cuales se encuentra la prueba de
residuos recursivos (arriba), CUSUM y CUSUM cuadrado. Luego, con la fecha de
quiebre obtenida de estas pruebas, se puede realizar las estructurales, que consiste
principalmente en la prueba 8 de Chow. Su hipótesis nula es que no existe quiebre
en el periodo colocado como input. Esta prueba se basa en la de errores residuales
entre el modelo restringido (que los betas no cambien) y el modelo sin restringir (que
los betas si son diferentes):
c) Si se tiene que el modelo mostrado del lado derecho presenta los siguientes
resultados:
Solución
A partir de lo obtenido tras correr el test de White se confirma que este test es muy
sensible ante cambios en la especificación, por lo cual puede llevar a rechazar la
hipótesis nula aún en ausencia de heterocedasticidad si es que el modelo está
incorrectamente especificado.
Problema 4.17
Donde d indica el gasto de consumo en soles, †Æ° es el producto bruto interno real y I es
la población total. No obstante, es probable que las variables incluidas en el modelo estén
altamente correlacionadas ya que aumentan con el tiempo. Ante ello, se puede solucionar
este problema expresando todo el modelo en términos per-cápita; la cual usualmente
reduce la colinealidad en las variables:
dO 1 †Æ°O 1
= +â + +, + +# + 4O (2)
IO IO IO IO
Solución
El principal problema que ocasiona este modelo es que genera heterocedasticidad, dado
que ahora el error nuevo dependerá de la población en cada periodo. Se debería corregir
multiplicando el modelo por la raíz cuadrada de I√ (recuerde la forma de la matriz †).
Problema 4.18
[* = öâ + ö, 5* + 4* ; 4* ~I(0, Cõ # ) (1)
Donde [* denota el consumo familiar e 5* denota la renta disponible. Para ello se recoge
información de N familias estructuradas en k subgrupos de tamaños IP , con ™ = 1, 2, . . , ´.
De cada uno de ellos se obtiene el consumo y la renta disponible agregados para cada
§+ §+ ¡
subgrupo poblacional dP = [
*b, *
y )P = 5.
*b, *
Note que: *b, I* = I.
[P = Ωâ + Ω, 5P + 0* (2)
¿Cuál es la relación existente entre los parámetros del primer modelo (öâ , ö, ) y los
del nuevo modelo (Ωâ , Ω, )? Demuestre analíticamente la forma de la varianza del
error este nuevo modelo.
Solución
§+ §+
dP ö
*b, â
+ ö, 5* + 4* 4
*b, *
[P = = = öâ + ö, 5P + (3)
IP IP IP
P+
õ
/òq /
Por tanto, öâ y ö, , serán iguales a Ωâ , Ω, y 0* = . La varianza del nuevo error
§+
será:
§+ §+
4
*b, * 1 1 Cõ #
ÜRT 0* = ÜRT = ÜRT(4* ) = IP ∗ Cõ # = (4)
# #
IP IP IP IP
*b,
Solución
1
⋯ 0
I,
5= ⋮ ⋱ ⋮ (5)
1
0 ⋯
I¡
I, ⋯ 0
†= ⋮ ⋱ ⋮ (6)
0 ⋯ I¡
Esto indica que cuando se trabaja con promedios de datos agrupados, hay
heterocedasticidad.
Problema 4.19
6* = 5 + 4* ; 4* ~I(0,4) (1)
£* = 6* + A* ; A* ~I 0, C # ; C = 5 (2)
Al correr una regresión de 5* sobre 6* y aplicar el test de White, obtiene que no tiene
suficiente evidencia para rechazar la hipótesis nula. Contrariado, decide probar con distintos
valores de C. Para cada uno de ellos, genera los datos, corre una regresión y aplica la
prueba de White 100 veces. La tabla 4.1 muestra el porcentaje de veces que se rechazó la
hipótesis nula en cada caso:
Explique al investigador los resultados obtenidos. ¿Qué otra prueba se aplicaría para
detectar de manera correcta la heterocedasticidad?
Solución
El problema aquí es que a medida que aumenta sigma; quiere decir que hay una menor
correlación entre el error y el regresor 6* . Por tanto, esto indica que mientras peor
especificado esté el modelo (medido a través de la correlación entre el error y el regresor);
la prueba de White aceptará más veces. Esto refleja la poca potencia que tiene este test.
Problema 4.20
(1)
[ZTÜZ£R = +• + +, U][ + +# èTZ[UV + +2 ZY0[ + +} ÊZêZ]U]V + 0
(2)
O 0 U][, èTZ[UV, ZY0[, ÊZêZ]U]V = 0
(3)
%RT 0 U][, èTZ[UV, ZY0[, ÊZêZ]U]V = C # U][ #
Solución
Donde
6 0
6∗ = ;Z = (5)
U][ U][
Y se cumple que:
" 0
" Z = =0 (6)
U][
%RT 0
%RT Z = = C# (7)
U][ #
Problema 4.21
Donde 0 son los residuos MCO y las 5* son los valores ajustados de MCO. Después se
prueba la significancia conjunta de 6*, , 6*# , … , 6*¡ y 5* incluyendo un intercepto.
Solución
b) Explique por qué el ` # de la regresión indicada arriba siempre era por lo menos tan
grande como el ` # de la regresión BP y del caso especial de la prueba de White.
Solución
c) Explique porque el inciso b) implica que con la nueva prueba siempre se obtiene un
valor-p menor que el estadístico BP o que el del caso especial del estadístico White.
Solución
Solución
Problema 4.22
a) Suponga que %RT Ê* = CQ# , %RT Ü*,¥ = C># y que Ê* y Ü*,¥ no estén correlacionadas.
Muestre que %RT 0*,¥ = CQ# + C># , llame a esto C # .
Solución
b) Ahora suponga que para Z ≠ {, Ü*,¥ y Ü*,¥ no están correlacionadas. Muestre que
dVÜ 0*,¥ , 0*,R = CQ# .
Solución
dVÜ 0*,¥ , 0*,R = dVÜ Ê* , Ê* + dVÜ Ü*,¥ , Ê* + dVÜ Ê* , Ü*,R + dVÜ Ü*,¥ , Ü*,R (9)
¶
c) Sea 0* = ê* :, ¥b, 0*,¥ el promedio de los errores compuestos dentro de una
vSs
empresa. Muestre que %RT 0* = CQ# + .
¶/
Solución
¶
:,
0* = ê * 0*,¥ (11)
¥b,
¶
1
%RT 0* = ê* # CQ# + ê* C># (14)
ê* #
1 # # # #
C>#
%RT 0* = ê * CQ + ê * C> = CQ + (15)
ê* # ê*
Solución
Problema 4.23
%RT 5 ! = C # °§ (2)
1 1
5P∗ = 5* , 6P∗ = 6* , (3)
]P ]P
* ˆ P * ˆ P
1. Muestre que:
O 5 ∗ ! ∗ = ! ∗+ (4)
%RT 5 ∗ ! ∗ = C # ا (5)
Donde
C#
0 0
],
ا = 0 … 0 (6)
C#
0 0
]T
Solución
Se tiene:
5 ∗ = à5 (7)
! ∗ = à! (8)
Entonces:
5 = !+ + 0 (10)
O 5 ∗ ! ∗ = ! ∗ + + 0. (11)
Así,
2. Muestre que:
T :, T
Interprete.
Solución
Se tiene.
T :, T
+EFI = ! ∗^
ا:, ! ∗ :, ! ∗^ ا:, 5 ∗ = ]P 6P∗ 6P∗^ ]P 6P∗ 5P∗ (14)
Pb, Pb,
Problema 4.24
O 5 ! = !+ (1)
Se regresiona5P∗ contra 6P∗ mediante MCO y se usa formula estándar para computar el error
estándar.
Solución
1
5P∗ = 5 + 5Q , (3)
2 ¶ P P
1
6P∗ = 6 + 6Q , (4)
2 ¶ P P
Por lo tanto:
5 ∗ = à5 (5)
! ∗ = à! (6)
1 1 1 0 0 … 0 0
à= 0 0 1 1 … 0 0 , (7)
2
0 0 0 0 … 1 1
Entonces
O 5∗ !∗ = O O 5∗ ! !∗
(8)
= O àO 5 ! ! ∗ (9)
= O à!+ ! ∗ (10)
= O ! ∗+ ! ∗ (11)
= ! ∗+ (12)
Por lo tanto:
1/2 0 0 … 0
∗ ∗ # 0 1/2 0 … 0
%RT 5 ! =C … … … … (18)
1/2
0 0 0 … 1/2
Solución
Problema 4.25
Solución
:,
hEFIæ = ! ^ Ω:, ! ! ^ Ω:, 5 (2)
Entonces lo que se necesita es comprobar que la diferencia asintótica entre ambos sea
nula. Debe de notarse que lo que en realidad se necesita es un estimador de 5 :, . Así, debe
de notarse que:
:,
! ^ 5 :, ! ! ^ 5 :, Ÿ
] hEFI − + = (3)
] ]
:,
! ^ 5 :, ! ! ^Ÿ
] hEFIæ − + = (4)
] ]
Donde hEFIæ tendrá la misma distribución asintótica que hEFI , es decir serán
asintóticamente equivalente si se cumple que:
! ^ 5 :, ! ! ^ 5 :, ! ‚
− 0 (5)
] ]
! ^ 5 :, Ÿ ! ^ 5 :, Ÿ ‚
− 0 (6)
] ]
. = W:q .
La primera expresión no hace sino asegurar que pueda ser efectivamente reeplazada
a
. = W:q .
cuando ] tienda a infinito por . Por otro lado, la segunda expresión implica que en el
a
. = W:q ˆ . = W:q ˆ
límite puede ser reemplazado por .
a a
4.2 Autocorrelación
Problema 4.26
Solución
5O = 6O + + 4O (1)
4O = º4O:, + 0O ; donde 0O ∼ I(0; Cé# ) (2)
4O = º ã 0O:ã (3)
Ob,
Cé#
ÜRT 4O = (4)
1−º
Cé#
[VÜ 4O ; 4O:¡ = º ¡ (5)
1−º
Tomando esto en cuenta, la matriz de varianzas covarianzas es:
1 º ⋯ º§
º 1 ⋯ º §:,
Ω= ⋮ (6)
⋮ ⋱ ⋮
§:,
º§ º ⋯ 1
Problema 4.27
Solución
Otra prueba muy utilizada es la de Breusch Godfrey. Esta prueba consiste en regresionar
el error sobre sus “p” propios rezagos:
Se obtiene el ` # de este modelo auxiliar. La hipótesis nula es que todos los coeficientes ö
sean cero; lo cual implica que el error es un ruido blanco. El estadístico de la prueba es
#
I` # ~!(Î) . Si el ajuste de la regresión es alto, quiere decir que, en efecto, el error depende
de sus rezagos; por lo que se rechaza la nula afirmando que existe autocorrelación de orden
p.
Problema 4.28
Solución
5O = 6O + + 4O
(1)
5O − º5O:, = 6O − º6O:, + + 0O
(4)
Problema 4.29
Se tiene una base de series de tiempo que contiene las variables Y, X1 y X2. Se le pide
que corra una regresión entre las mismas, donde Y es la variable dependiente y analice los
residuos de dicha regresión. En particular se quiere determinar si dichos residuos presentan
autocorrelación o no. Analice e intérprete de manera particular el estadístico de Durbin-
Watson, el correlograma de los residuos así como el estadístico de Ljung-Box.
Dependent Variable: Y
Method: LeastSquares
Sample: 1 100
Includedobservations: 100
-
R-squared 0.353531 Mean dependent var 0.023485
Es necesario analizar el comportamiento de los residuos. Para ello, se puede ver los
siguientes estadísticos
Problema 4.30
Dependent Variable: Y
Method: Least Squares
Sample: 1 1000
Se corrieron una serie de pruebas porque se sabe que un modelo de serie de tiempo
puede tener varios problemas.
12
-4
-8
-12
250 500 750 1000
Test Equation:
Coefficie
Variable nt Std. Error t-Statistic Prob.
-
C 0.046787 0.121288 -0.385753 0.6998
Solución
Solución
Solución
Problema 4.31
Solución
Verdadero. Dado que MCGF transforma el modelo tal que la matriz de varianzas y
covarianzas del modelo transformado sea escalar, lo que hace que posea la mínima
varianza al compararlo con cualquier otro estimador lineal insesgado aplicado sobre el
modelo transformado. Por tanto, MCGF es MELI.
Problema 4.32
Solución
Problema 4.33
Dos investigadores están discutiendo los resultados de una estimación que acaban de
hacer con series de tiempo. El primero de ellos dice que como el Durbin Watson es cercano
a 2, entonces pueden estar tranquilos porque su ecuación no tiene problemas de
autocorrelación; sin embargo el segundo investigador no está convencido y cree que deben
hacer más pruebas. ¿Qué deberían hacer?
Solución
Ambas no deberían estar completamente seguras dado que el Durbin Watson sólo mide
autocorrelación de primer orden en el error; es decir, que el error sea AR(1). Para ver
autocorrelación de mayor orden, deben realizar pruebas adicionales como la de Breusch-
Godfrey o ver el correlograma de Box-Pierce.
Problema 4.34
Un investigador halla la relación existente entre una variable dependiente (Y) y un conjunto
de regresores (X1 y X2). Para esto, se plantea la regresión:
Dada la evidencia mostrada en la regresión anterior, ¿se puede afirmar que el estimador es
eficiente? Ante esto, se plantea aplicar el procedimiento iterativo de Cochrane-Orcutt y
transformar las variables involucradas en su modelo utilizando el resultado de este
procedimiento.
• “No creo que los estimados obtenidos en esta segunda regresión correspondan a
los que interesa estimar en primera instancia dado que estás trabajando con
transformaciones de las variables originales. Además, no veo qué ventaja hay en
utilizar las dos pendientes estimadas en esta segunda regresión en lugar de las
obtenidas en el primer modelo.”
• “En lugar de usar este segundo modelo, me parece que sería mejor usar el
siguiente.”
a) Responder la primera observación. Para reforzar el argumento, se debe mostrar
analíticamente si el investigador independiente está o no en lo cierto respecto a la
primera parte de su primer su comentario.
Solución
) = !+ + 4 (1)
†) = †!+ + †4 (2)
)∗ = ! ∗+ + A (3)
Solución
Investigador independiente
Investigador:
0 Ω# Ω, 1 0 0
d= (8)
0 Ω} 0 0 Ω, 1
129.7305 −159.1379
d %RT(Ω) d ^ = (9)
−159.1379 6725.706
Solución
Sin embargo, antes se reemplaza para dejarlo en función de los alfas (del modelo
del compañero) dado que la inferencia se realiza sobre el mismo modelo.
Reemplazando, se obtiene: ö2 + ö, ö# = 0 y ö~ + ö, ö} = 0.
^ :,
Ì = ` + ′ d%RT + ` + ~Ó # (™) (11)
Ya se cuenta con la matriz de varianzas y covarianzas; por lo que falta R(h). Esta
matriz contiene a las hipótesis no lineales. En este caso, es de la forma:
ö2 + ö, ö#
` ö = (12)
ö~ + ö, ö}
Para obtener esta matriz, simplemente se reemplaza los valores estimados del
modelo del compañero; de acuerdo con los parámetros que se han colocado en la
parte b). La matriz C mostrada arriba es simplemente la derivada de R(+) con
respecto a B; que sirve para hallar la matriz de varianzas y covarianzas.
Se ve que es menor al crítico; por lo que se aceptan las hipótesis nulas; es decir, se
acepta la hipótesis de que ambos modelos son equivalentes. De manera adicional
se podrían realizar las demás hipótesis, utilizando simples pruebas T para verificar
si son iguales.
Problema 4.35
5O = 6O + + 4O (1)
4O = º4O:, + 0O (2)
0O = ö0O:, + ÜO (3)
Sample: 1 1000
-
R-squared 0.890279 Mean dependentvar 0.127131
Adjusted R-squared 0.890279 S.D. dependent var 4.758422
Regresión 2:
Dependent Variable: Y_STAR
-
R-squared 0.947295 Mean dependent var 0.076318
Regresión 3:
Method: LeastSquares
-
R-squared 0.971660 Mean dependent var 0.011710
Donde
Solución
Las dos primeras especificaciones no corrigen bien; basta ver el Durbin Watson.
La tercera sí corrige bien la autocorrelación de primer orden (DW cercano a 2);
no obstante, no toma en cuenta en absoluto que existe autocorrelación de
segundo orden; por lo que esta transformación no produce los resultados más
eficientes.
Solución
Problema 5.1
:, ^
Considere el estimador de variables instrumentales (VI): βYZ = X ^ X XY
:, (1)
+uø = ¢′! ¢′)
Solución
:,
+uø = ! ^ ! ! ^) (2)
(3)
+uø = ! ^ †® ! :,
! ^ †® )
(4)
+uø = ! ^ ¢(¢ ^ ¢):, ¢′! :,
! ^ ¢(¢ ^ ¢):, ¢′)
(5)
+uø = ¢ ^ ! :, ^
¢ ¢ ! ^¢ :,
(! ^ ¢)(¢ ^ ¢):, ¢′)
:, (6)
+uø = ¢′! ¢′)
Solución
:, (7)
+uø = ¢′! ¢′)
:, ^ (8)
+uø = ¢′! ¢ !+ + Ÿ
:, ^ (9)
+uø = + + ¢′! ¢Ÿ
(10)
èSUê +uø = èSUê [+ + ¢ ^ ! :, ^
¢ Ÿ]
:,
1 ^ 1 ^ (12)
èSUê +uø = + + èSUê ¢! ¢Ÿ
] ]
Problema 5.2
8
El teorema de Slutsky señala que el límite probabilístico de un producto puede ser expresado como
el producto de los límites probabilísticos.
9
Ley Débil de Grandes Números.
clase al que pertenece el estudiante tiene algún efecto sobre su rendimiento (conocido
como peer-effect). En el tercero, el objetivo es determinar si existen externalidades a la
educación (y se propone regresionar el logaritmo del ingreso laboral sobre los años de
educación promedio en la localidad donde reside el individuo).
Solución
Solución
Problema 5.3
Solución
ö − ö = ! ^! :,
! ^Ÿ (2)
èSUê (ö − ö) = " ! ^ ! :,
"[! ^ Ÿ] (3)
Solución
Problema 5.4
Para acceder a este programa, el único requisito es que algún miembro de la familia se
presente físicamente en alguna agencia del Gobierno, haga la solicitud de participar en el
programa y demuestre su condición de pobreza. Sabe además que el sistema para
determinar si un individuo es pobre no presenta fallas; es decir, no hay gente que se pueda
hacer pasar como pobre para recibir el programa si no lo es realmente.
Variables ha_nchs
Independientes
Ø 0.248
0.000
èZTQV]RQ -0.009
0.039
VTYZ]_] -0.063
0.026
V[0èRYV_™ZÊZ -0.036
0.103
ZY0[R_™ZÊZ 0.005
0.010
U]{TZQVQ_ℎV{RT_™ZÊZ 0.0001
0.107
[V]Q√R]√Z -0.084
0.063
Observaciones 4000
R2 0.056
Para medir el impacto del programa, se decidió hacer una regresión en 2 etapas,
utilizando dos instrumentos: número de oficinas operadoras del programa en el
municipio de residencia y la distancia desde el hogar de la familia hasta la oficina
administradora más cercana. Además, los encargados de la evaluación
decidieron hacer un test de Hausman para evaluar si el procedimiento realizado
era el correcto. A continuación se presentan sus resultados:
Variables D
Independientes
YUQ√R][UR -0.00004
0.000
èZTQV]RQ -0.021
0.000
VTYZ]_] -0.097
0.000
V[0èRYV_™ZÊZ 0.075
0.000
ZY0[R_™ZÊZ -0.005
0.006
U]{TZQVQ_ℎV{RT_™ZÊZ 0.0003
0.001
VÊ_Vè 0.033
0.000
[V]Q√R]√Z 0.452
0.000
Observaciones 4000
R2 0.054
Variables ha_nchs
Independientes
Ø 0.210
0.030
èZTQV]RQ -0.010
0.040
VTYZ]_] -0.059
0.031
V[0èRYV_™ZÊZ -0.033
0.158
ZY0[R_™ZÊZ 0.005
0.016
U]{TZQVQ_ℎV{RT_™ZÊZ 0.0001
0.097
[V]Q√R]√Z -0.066
0.283
Observaciones 4000
R2 0.054
Test de Hausman
^ :,
Ó = +*> − +¶ß• (% +*> − % +¶ß• +*> − +¶ß•
Solución
Solución
Problema 5.5
Solución
Problema 5.6
De aceptarse la hipótesis nula del test de Haussman, puede concluirse que tanto el
estimador de mínimos cuadrados ordinarios como el de variables instrumentales son
igualmente consistentes. Por lo mismo, esto será evidencia a favor del hecho de que se ha
elegido un buen conjunto de instrumentos.
Solución
Falso. El test de Haussman es una prueba de Wald que contrasta si dos estimadores son
asintóticamente equivalentes. Intenta comparar las propiedades del estimador MCO y del
estimador VI (generalizado) bajo homocedasticidad.
(2)
…, : 5 = !+ + Ÿ, Ÿ ~ UUY 0, C # °a [V] " ¢ ^ Ÿ = 0
Bajo …â tanto hEFG como bYZ son consistentes. Sin embargo, hEFG es más eficiente (seria
el MELI); por lo tanto, de aceptarse la hipótesis nula, debería ser el elegido. En contraste,
bajo la …, , bYZ preserva la consistencia mientras que bb%c se torna inconsistente. No
obstante, la prueba de Haussman parte del supuesto de que los instrumentos utilizados
previamente son buenos; es decir, son tanto relevantes (alta correlación con la variable
endógena) como exógenos (correlación de cero con el error).
Al evaluar la diferencia asintótica entre ambos estimadores, es posible que ambos sean
igual de inconsistentes lo cual podría sugerir (erróneamente) que se estarían utilizando un
conjunto inadecuado de instrumentos (ya que VI no representa una ganancia respecto a
MCO).
Problema 5.7
Un alumno le dice que a otro que bajo ningún motivo el +Xd— será igual al +, el estimador
MCO ecuación por ecuación. El otro alumno, preocupado por tal afirmación contesta
rápidamente que estos dos estimadores serán iguales solo cuando los regresores sean
iguales. Comente y demuestre de ser el caso si alguno de ellos tiene razón.
Solución
La solución de este ejercicio pasa por contar como dos los casos en los cuales ambos
estimadores son iguales.
Cuando los regresores son los mismos en todas las ecuaciones, entonces aplicar MCO a
cada ecuación es equivalente a aplicar SUR al sistema.
Problema 5.8
Solución
Solución
Falso. A medida que la correlación entre los errores crece, la ganancia en eficiencia es
mayor para el estimador SUR, debido a que aprovecha justamente esa correlación usando
las estructurar que existen entre las unidades de observación en el tiempo. Dicho de otro
modo, a mayor correlación entre los errores, el problema de ineficiencia de MCO crece; por
lo que al utilizar el estimador SUR, la ganancia en eficiencia es cada vez mayor.
6. Bibliografía
Kennedy, P.; 1993. A Guide to Econometrics. The MIT Press, tercera edición.