Вы находитесь на странице: 1из 32

Problema 1: El modelo de regresión múltiple, hipótesis y pruebas de especificación (100

puntos)

El modelo (1) explica el salario semanal en dólares estadounidenses (WAGE) de un trabajador


según las horas trabajadas (HORAS), el número de años de capacitación (EDUC) y la duración del
servicio dentro de la empresa (TENURE). El nivel de significancia α = 0.05 se aplica a todas las
pruebas posteriores.

La estimación del modelo (1) con el método KQ basado en n = 935 observaciones dan el siguiente
resultado:

a) Comenta sobre la influencia de lo exógeno en la variable endógena. ¿Qué variables exógenas


tienen una influencia significativa en la variable endógena?

b) Verifique la hipótesis e interprete el resultado

c) Interpretar y verificar la hipótesis con y

d) El modelo (1) se compara con el modelo (2).

¿Qué modelo prefiere basado en los criterios de certeza, corrección y AIC? Justifica tu respuesta.
¿Cuál es la diferencia fundamental entre los criterios aplicados?

e) Verifique con una prueba RESET-test, si el modelo (1) está correctamente especificado
(estadística de prueba: F = 1.1222).

f) Una prueba de endogeneidad en el modelo 1 muestra que el registro log(EDUC) está


correlacionado con u. Como enfoque, se propone utilizar la variable "cociente de inteligencia"
(IQ) como un instrumento para registro log(EDUC). Explique brevemente los requisitos para la
variable IQ y explique el principio del procedimiento TSLS.

Problema 2: Variables dependientes binarias (60 puntos)

El Modelo de probabilidad lineal (3) describe los préstamos de un banco estadounidense sobre
la base de las solicitudes de préstamos hipotecarios.

APPROVE dummy igual a 1 si el préstamo hipotecario se otorgó a un particular y 0 si no se otorga.

HRAT Participación de los costos por préstamos en los ingresos.

OBRAT Participación de otros pasivos en resultados.

LOANPRC Parte del monto del préstamo al precio de la casa.

PUBREC dummy igual a 1 si el prestatario se ha declarado en bancarrota.

La estimación del modelo (3) con el método KQ sobre la base de n = 1989 observaciones
producen el siguiente resultado:

a) Interpreta la influencia de lo exógeno en la variable endógena. ¿Son las estimaciones útiles


para todos los coeficientes? ¿Cambiaría tu interpretación si este fuera un modelo Probit?

b) ¿Se estiman los coeficientes de a) como se espera? ¿Cómo es problemática la interpretación


de los valores t correspondientes?

c) El modelo predice las siguientes probabilidades de préstamo para las n = 1,989 observaciones.
Interpretar la distribución de las previsiones. ¿Para qué valores de la distribución diferiría con
certeza el pronóstico comparable de un modelo Probit?

Problema 3: Análisis de series de tiempo (40 puntos)

Los dos modelos A y B de ARMA (p, q) describen la misma serie temporal estacionaria. La
siguiente tabla muestra, para ambos modelos, el número de coeficientes no significativos
(Coef.), El criterio de información bayesiano (BIC) y el número de ceros en el círculo unitario
(cero).
a) Explique en qué condiciones un proceso o una serie de tiempo es estacionario.

b) Dada la información de la tabla anterior, ¿prefiere ARMA (p, q) modelo A o B para un análisis
más detallado? Justifica la respuesta.

Apéndice: Formulario

• reescalado

Con se aplica:

Con se aplica:

• Modelo de regresión estandarizado.

Con

así como

• Transformación logarítmica

En la se aplica:

En la se aplica:

En la se aplica:
Pronóstico en los modelos :

En la se aplica:

• Bondad de ajuste

Suma total de cuadrados:

Suma de regresión de cuadrados:

Suma de errores al cuadrado:

Se aplica lo siguiente:

Fórmula de descomposición de la varianza:

Coeficiente de determinación:

Medida de determinación corregida:

• Variables binarias independientes.

Elasticidad exacta :

• F estadísticas

con suma residual del modelo restringido


Balance del modelo completo.

• Estadísticas Chow

con para el grupo 1 con n1 observaciones.

y para el grupo 2 con n2 observaciones también.

y J: número de restricciones.

• Variable dependiente binaria

El enfoque

implica la variable binomial

Probabilidad de respuesta:

Modelo de probabilidad lineal:

Varianza de :
Modelo variable dependiente limitado:

Con

Modelo Logit:

Modelo Probit:

con como la función de densidad de la distribución normal estándar.

Función de observación i de probabilidad de registro para modelos variables dependientes


limitados:

El estimador de ML de β maximiza la siguiente función de probabilidad de registro:

Prueba de razón de verosimilitud: Likelihood-Ratio Test:

Pseudo R-Square:

con la función de probabilidad de registro L0 para el modelo con solo la constante

Influencia parcial media de una variable exógena


• Calidad del pronóstico

Error cuadrático medio (RMSE):

con para el número de observaciones de la muestra pronosticada.

• Prueba de Jarque-Bera

H0: la muestra (residuos) se distribuye normalmente.

Tamaño de prueba y distribución:

con la asimetría y la curvatura (para la distribución normal se aplica


lo siguiente: S = 0 y K = 3).

• heteroscedasticidad

Variedades heterocedasticidad-robustas.

Para regresión simple:

con los residuos de OLS y


Para regresión múltiple:

con : enésimo residuo de la regresión de en las otras variables.

Valores de t de Heterocedasticidad-robustos:

Prueba de heteroscedasticidad:

Enfoque de la prueba de Breusch-Pagan:

Enfoque de prueba de blanco: White-test

o bien:

F-estadística:

con medida de determinación del modelo para las variables de perturbación al cuadrado

y L Número de regresores de la regresión auxiliar.

LM estadística:
Estimadores KQ ponderados estimados para heteroscedasticidad:

Modelo de regresión:

Con

con de la regresión de a x1, ...,

• series de tiempo

Proceso estocástico:

Modelo estático

Modelo de retraso finito distribuido de orden

Multiplicador de impacto:

Multiplicador de largo plazo:

Proceso de orden de media móvil

Proceso autorregresivo de orden

autocorrelación

Hipótesis nula:
Para el modelo AR (1) de correlación serial:

Durbin-Watson estadística:

Hipótesis nula para la correlación serial AR (q):

Estimadores de KQ ponderados estimados en autocorrelación:

Modelo de regresión:

con (método
Cochrane-Orcutt) y (método Prais-Winston) .

proviene de la regresión del proceso AR (1):

Tarea 3: transformación logarítmica

En un periódico suizo, se ofrecieron 33 Volkswagen en la parte de exhibición a fines de julio de


2001. Para todos los 33 autos se dan las variables de Alter (edad en años), kilometer (millaje en
miles) y preis (precio de oferta en CHF).

Para explicar el precio de oferta, se proponen los siguientes modelos de regresión:

Las estimaciones de los modelos (1) y (2) basadas en la muestra actual dieron los resultados de
computadora que se muestran en las Figuras 1 y 2.

1. Explicar los méritos de los modelos con variables logarítmicas.

2. ¿Cómo cambia el precio en los dos modelos de regresión cuando la variable kilómetro o la
edad aumenta en una unidad? Explique por qué el modelo (2) da porcentajes para el cambio en
las variables endógenas.

3. Desde las salidas de la computadora, tome la medida de la certeza de estas regresiones e


interprete sus valores. ¿Se puede comparar la certeza de las dos regresiones?

4. Calcule el precio de un Volkswagen de cuatro años con 96,000 millas conducidas con ambos
modelos. Eche un vistazo crítico a la calidad de la estimación de precios utilizando el Modelo (2).
(Supuesto: u ~ N (0, σ2) para ambos modelos σ1 = 1554 para el modelo (3) y σ2 = 0.09077 para
el modelo (2).)

Figura 1: Salida de computadora de la estimación del modelo de regresión (1)

Figura 2: Salida de computadora de la estimación del modelo de regresión (2)

Solución. –

1. Ventajas de los modelos con variables logarítmicas:

• Los coeficientes β son independientes de la escala.

• Los supuestos de KQ a menudo se cumplen mejor para los modelos que para los
modelos con , debido a:

- Reducción de la heteroscedasticidad.

- Simetrización

• El rango de observaciones se reduce, lo que significa:

- Una reducida sensibilidad atípica del estimador.


En el modelo (2), puede interpretarse como la semi-elasticidad de con respecto a

La formación de la diferencia y la multiplicación con 100 lleva a:

y de lo que sigue:

La semi-elasticidad de con respecto a .

indica por qué porcentaje cambia a medida que crece en una unidad.

La medida de certeza indica el porcentaje en el cual la varianza de observada es "explicada"


por la regresión.

Los valores de los modelos no deben compararse con los de los modelos .
Explicación: La logaritmación crea una nueva variable endógena que no es comparable a la
original.

Para modelos con variables endógenas , los pronósticos de son más complejos.
La calidad de predicción de es más débil de lo normal en el método KQ, ya que

la predicción obtenida por la transformación inversa subestima

sistemáticamente. Sin embargo, si el modelo satisface los supuestos del modelo lineal

clásico, se obtiene una predicción consistente de con:

donde es el estimador imparcial para Si no es un estimador sin distorsión, entonces


se calcula:

y pone esto en:

Tarea 2: Variables binarias independientes(dummys)

Una asociación para la igualdad de mujeres y hombres en la vida profesional desearía saber si
existen diferencias de género entre los sexos. Sobre la base de una muestra de 526 individuos,
incluidas 252 mujeres, un instituto de investigación investigó la relación entre el wage(salario
promedio por hora en USD), educ (educación (años)) y female (= 1 si es mujer) y recibió los
siguientes modelos de regresión estimados ( entre paréntesis están los errores estándar):

1. ¿Cómo cambian los salarios medios por hora de una mujer y un hombre si invierten un año
adicional en su educación? Dibuje el modelo de regresión anterior para mujeres y hombres en
el siguiente gráfico.

2. Calcule la medida de certeza corregida para las dos estimaciones del modelo y compare los
resultados. ¿Por qué la certeza corregida es más adecuada para tal comparación que la certeza
de determinación?

3. ¿Calcular los valores t para todos los coeficientes de regresión e interpretar los resultados?

4. Sobre la base de los resultados del apartado 3 se afirma que no existe una diferencia
significativa entre hombres y mujeres en términos de salario por hora. ¿Es esta afirmación
correcta? Justifique su respuesta con la ayuda de una prueba adecuada.

Solucion.-

Männer(hombres)…Frauen(mujeres)

Las funciones a dibujar son:

2. Determinación corregida:

Estimación (1):

Estimación (2):

Estimar (1) explica wage mejor.

castiga la adición de variables adicionales en un modelo. Como crece monótonamente


con el número de regresores.

3. Regla de oro: para que la vraible sea significativa.

Estimación (1):

Estimación (2):

Solo educ tiene un impacto significativo en ambos modelos. Todos los otros regresores no son
significativos.
4. Sobre la base de que hasta el momento no se puede hacer una declaración acerca de la brecha
salarial entre mujeres y hombres, porque los valores t se refieren solo a los regresores
individuales y no consideran los dos términos con la variable mujer. Por lo tanto, es necesario
probar adicionalmente las siguientes hipótesis simultáneas:

Para esto necesitas la estadística F:

es por lo tanto descartado,es decir Existe una brecha salarial significativa entre mujeres y
hombres. La afirmación es por lo tanto errónea.

Tarea 3: Estandarización y reescalado.

A un suizo le gustaría emigrar a América. Buscando una casa adecuada en una ciudad en
particular, está interesado en la relación entre el Price(precio en 1000 USD) de una casa y su
tamaño en pies cuadrados (sqrtft), el número de habitaciones (bdrms) y el tamaño del tamaño
de un lote (lotsize). Una estimación del método de regresión correspondiente (n = 88) dio el
siguiente resultado (entre paréntesis, se proporcionan los errores estándar de las estimaciones
de coeficientes):

Con

La determinación de las varianzas empíricas de las variables de este modelo arrojó los siguientes
valores:

1. cuál de las variables exógenas tiene la mayor influencia en la variable precio en el modelo de
regresión descrito anteriormente. Determine esta variable y justifique su enfoque.

2. Calcule los valores t para todos los coeficientes de regresión e interprete los resultados.
¿Cómo cambian los valores t cuando los valores variables están estandarizados? Justifica tu
afirmación.

3. Calcule la certeza del modelo y el coeficiente de determinación corregido. ¿Cómo cambia la


certeza de la determinación y la corrección de la determinación al estandarizar los valores de las
variables?
4. Los suizos dispuestos a emigrar prefieren esperar en francos suizos que en dólares
estadounidenses (1USD=1,2CHF). ¿Cómo cambian los coeficientes de regresión, las desviaciones
estándar y las puntuaciones t en el modelo estimado arriba cuando se usan francos suizos en
lugar de dólares?

Solucion.-

1. Debido a que las variables exógenas se escalan de manera diferente, todos los valores de las
variables deben estandarizarse para que la pregunta se pueda responder correctamente. Donde

La variable exógena sqrtft tiene el mayor coeficiente de regresión estandarizado y, por lo tanto,
tiene la mayor influencia de las variables consideradas en el price(precio) variable endógeno.

Regla de oro: el coeficiente de regresión es significativamente diferente


de cero!

Solo las variables sqrft y lotsize tienen una influencia significativa en la variable endogena precio.

Al estandarizar los valores de las variables, los valores de t permanecen sin cambios (iguales)
debido a:
3. coeficiente de determinación:

Coeficiente de determinación corregido:

Al estandarizar los valores de las variables, ambos coeficientes de determinación no cambian.


Obtienes los mismos valores calculados anteriormente.

4. Coeficientes de regresión:

Las desviaciones estándar:

t-Werte (t-valor) :

Los valores de t no cambian al volver a escalar.


Tarea 4: Calidad de ajuste.

Sobre la base de una muestra de 526 individuos, incluidas 252 mujeres, un instituto de
investigación examinó la relación entre el salario por hora promedio (wage en USD), educación
(educ en años) y género (female = 1 si es mujer) y recibió los cuatro siguientes modelos de
regresión estimada:

Con

Además,

1. Para los cuatro enfoques de regresión, calcule los coeficientes de determinación y determine
el modelo que mejor explica la variación del wage(salario). Justifica tu respuesta.

2. ¿Qué problemas estan relacionados con los coeficientes de determinacion ¿Qué significa esto
para la elección del "mejor" modelo en la subtarea 1)?

3. Explique las propiedades del coeficiente de determinacion corregida. ¿Es esto más adecuado
para comparar la bondad de ajuste de los cuatro enfoques del modelo? Justifica tu respuesta.

4. Calcule la medida de confianza corregida para los cuatro modelos de regresión y determine
el modelo con la mejor calidad de ajuste. Compara el resultado obtenido con el de la subtarea
1). Justifica tus respuestas

Solucion.-

1. coeficiente de determinación:
Debido a que el coeficiente de determinación es mayor para el cuarto modelo, este explica
mejor la variación de wage.

2.• es una variable aleatoria que no tiene que coincidir con el valor verdadero

• solo registra relaciones lineales.

• R2 crece monótonamente con el número de variables explicativas.

El modelo de regresión (4) puede explicar mejor la variación del desafío solo porque tiene el

mayor número de variables explicativas. favorece el modelo (4) a priori.

3. castiga la adición de variables adicionales altamente significativas en un modelo.

aumenta si el valor t de una variable adicional es mayor que 1.

• no es interpretable como .

• ≤ para k> 1.

• puede incluso volverse negativo para pequeños y N - k pequeños.

es más adecuado porque los cuatro modelos tienen diferentes números de regresores.

4. coeficiente de determinación corregido:

En el sentido del coeficiente de determinación corregido, el modelo (3) tiene la mejor calidad de
ajuste. El modelo (4) tiene la medida más precisa porque tiene los mismos regresores que el
modelo (3) más un término de interacción. Sin embargo, el término interacción no tiene
influencia relevante.

Ejercicio 5: Variables binarias independientes(dummies)

Sobre la base de una muestra de 526 individuos, incluidos 54 no blancos, un instituto de


investigación examinó la relación entre el salario por hora promedio (wage en USD), educación
(educ en años) y color de piel (nonwhite = 1 si no blanco) de una persona y recibió el siguiente
estimado Modelo de regresión (entre paréntesis están los errores estándar):

1. ¿Cómo cambia el salario por hora promedio de blancos y no blancos en base al modelo (7) si
invierten un año adicional en su educación? Dibuje el modelo de regresión para personas con
color de piel blanca y aquellas sin color de piel blanca en el siguiente sistema de coordenadas.

2. Los salarios a menudo se pagan al final de una semana. Por lo tanto, el instituto de
investigación decidió establecer el salario semanal para el salario variable en lugar del salario
por hora (1 semana laboral = 45 horas de trabajo). Calcule los coeficientes de regresión y los
valores t asociados del modelo (7) si el salario semanal promedio se utiliza como la cantidad
endógena en lugar del salario promedio por hora. Interpretar los resultados obtenidos.

Un empleado argumentó que, para personas de diferente color de piel, la brecha salarial debería
establecerse más alto para una mejor capacitación que para una mejor. Para tomar en cuenta
esta circunstancia en el modelo (7), se extendió por un término de interacción. Una estimación
de este modelo extendido produjo el siguiente resultado:

3. ¿Cómo cambian las ganancias medias por hora de los blancos y no blancos en el modelo (8) si
invierten un año adicional en su educación? Dibuje el modelo de regresión (8) para las personas
con color de piel blanca y aquellas sin color de piel blanca en el siguiente sistema de
coordenadas.

4. ¿El modelo estimado (8) con término de interacción explica mejor el salario por hora
promedio que el modelo (7) sin término de interacción? Justifique su respuesta basándose en la
medida de certeza corregida.

5. Sobre la base de los resultados de 4), se afirma que no existe una diferencia significativa en el
pago entre blancos y no blancos. ¿Sigue siendo correcta esta afirmación para el modelo de
término de interacción (8)? Justifique su respuesta con la ayuda de una prueba adecuada. (F
(0.95.2.522) = 3.012991; SSRr = 5980.682)

Solución.-

1. Las funciones a bosquejar son:

2. Coeficientes de regresión.
Todos los coeficientes de regresión se multiplican por un factor de 45 (número de horas por
semana).

Los valores t siguen siendo los mismos.

Resulta que solo la variable educ tiene una influencia significativa sobre el salario por hora
promedio o el salario semanal.

3. Las funciones a dibujar son:

4. coeficiente de determinación corregido:


El modelo (8) explica mejor el salario por hora promedio, porque la medida de certeza corregida
(coeficiente de determinación corregido) es mayor.

5. Para responder a la pregunta, también se deben examinar las siguientes hipótesis


simultáneas:

Para esto necesitas la estadística F:

Por lo tanto, H0 no se descarta, es decir no hay una diferencia significativa en el pago entre
blancos y no blancos.

Ejercicio 6: Variable dependiente binaria

En una encuesta sobre la demanda de manzanas producidas orgánicamente, un instituto de


investigación de mercado realizó una encuesta telefónica de 660 personas. Las personas se
enfrentaron al azar con diferentes precios de manzanas "normales" (regprc: en CHF por pieza) y
producidas orgánicamente (ecoprc: en CHF por pieza) y se les preguntó si comprarían manzanas
producidas orgánicamente o normales a estos precios (ecobuy = 1, si se eligieron manzanas
producidas ecológicamente y = 0 de lo contrario). Además, se recogieron los ingresos (income:
en miles de CHF), educación (educ: en número de años) y edad (age: en años) de las personas
encuestadas.

La influencia de las variables consideradas en la decisión de compra (ecobuy) se estimó


utilizando un modelo de probabilidad lineal (LWM) y un modelo logit (Logit). Los coeficientes de
regresión de los dos modelos y las desviaciones estándar asociadas (entre paréntesis) dieron los
valores dados en la Tabla 1 a continuación:
Tabla 1: LWM y Logit estimaciones

1. Interpretar los coeficientes de regresión estimados de las variables ecoprc, regprc y educ del
modelo de probabilidad lineal (LWM). ¿Cuál de estas variables tiene el mayor impacto en la
compra de manzanas producidas orgánicamente?

2. ¿Cuáles son las tres desventajas principales del modelo de probabilidad lineal? ¿Están todas
estas desventajas arregladas en el modelo Logit?

3. Determine la influencia parcial promedio de las variables exógenas ecoprice, regprc y educ
sobre la probabilidad de respuesta del modelo logit P(ecobuy=1|x) (use
Interprete los resultados obtenidos y compárelos con los
coeficientes de regresión estimados del modelo de probabilidad lineal (LWM).

4. Compare el modelo de probabilidad lineal y el modelo logit con respecto a su calidad de


ajuste. Para hacer esto, determine el porcentaje de valores de ecobuy predichos correctamente
del modelo de probabilidad lineal y el modelo logit para las siguientes diez observaciones.

5. ¿Las dos variables exógenas income y age juntas tienen un impacto significativo en la
probabilidad de respuesta? Formule la hipótesis nula de una prueba adecuada y realícela
utilizando los datos de la Tabla 1 a un nivel de significación de α = 0.05. Interpretar el resultado
obtenido.

Solución. –
1. Interpretaciones:

• ecoprc: la probabilidad de comprar una manzana producida orgánicamente disminuye en un


80.45% si el precio de la manzana producida orgánicamente (ecoprc: en CHF por pieza) aumenta
en una unidad.

• regprc: la probabilidad de comprar una manzana producida orgánicamente aumenta en


72.07% si el precio de la manzana producida normalmente (regprc: en CHF por pieza) aumenta
en una unidad.

• educ: la probabilidad de comprar una manzana producida orgánicamente aumenta en un


2.28% a medida que aumenta el número de años de educación (educ) en una unidad.

La mayor influencia en la compra de una manzana producida orgánicamente es la variable


ecoprc o el precio de la manzana producida orgánicamente.

2. Desventajas:

• Son posibles predicciones de velocidad inferiores a 0 y superiores a 1.

• La sucesión no puede depender linealmente de las variables x para todos los valores x posibles.

• LWM siempre tiene heteroscedasticidad!

Todas las desventajas se resuelven con el modelo logit!

3. Influencia media e interpretación:

La probabilidad de respuesta de comprar una manzana producida orgánicamente disminuye en


un promedio de 76.97% si el precio de la manzana producida ecológicamente (ecoprc: en CHF
por pieza) aumenta en una unidad. Alrededor de 3,46 puntos porcentuales de pequeño impacto
en la probabilidad de respuesta que LWM.

La probabilidad de respuesta de comprar una manzana producida orgánicamente aumenta en


promedio un 68.53% si el precio de la manzana producida normalmente (regprc: en CHF por
pieza) aumenta en una unidad. Aproximadamente 3.54 puntos porcentuales de pequeño
impacto en la probabilidad de respuesta que LWM.

La probabilidad de respuesta de comprar una manzana producida orgánicamente aumenta en


promedio en un 2.27% a medida que el número de años de educación (educ) aumenta en una
unidad. Corresponde al coeficiente de regresión de la LWM para educ.
Las influencias parciales medias de estas variables son aproximadamente comparables con los
coeficientes de regresión de la LWM.

4. Pronósticos:

Proporción de valores predichos correctamente para LWM: 7/10 = 0.7

Proporción de valores predichos correctamente para el modelo logit: 7/10 = 0.7

Los dos valores son idénticos, i. Ambos modelos predicen la compra de una manzana producida
orgánicamente igualmente bien.

5. Hipótesis simultánea de cero:

variable de prueba:

Región crítica:

no se descarta, i. Las dos variables no tienen influencia significativa en la


probabilidad de respuesta.

Problema 7: variables binarias

Una Organización Americana contra la Discriminación encargó a un instituto de investigación


que estudiara la situación de las mujeres extranjeras en el mercado laboral. En una primera parte
del estudio, se examinó si una correlación entre el salario promedio por hora (wage en dólares
estadounidenses) y la educación (educ; en años), el color de la piel (black = 1 si el color de la piel
es oscuro) así como el origen latinoamericano (hispanic = 1 si la persona es de latinoamerica).
Sobre la base de una muestra de 3286 mujeres trabajadoras, surgió el siguiente modelo de
regresión estimada (entre paréntesis se encuentran las desviaciones estándar de los coeficientes
de regresión estimados):

Con

1. ¿Cómo cambian las ganancias promedio por hora de las mujeres con piel oscura y aquellas sin
piel oscura en el modelo (9) si cada una invierte un año adicional en su educación? Dibuje el
modelo de regresión para mujeres de piel oscura y sin piel en el siguiente sistema de
coordenadas.

2. La pregunta que surge es si las dos variables exógenas, negra e hispana juntas, tienen un
impacto significativo en el salario promedio por hora. Formule la hipótesis nula de una prueba
adecuada para esta pregunta y hágala con un nivel de significancia de α = 0.05. Interpretar el

resultado obtenido. (Se aplica

La segunda parte del estudio examina si las variables educación (educ; en años), color de la piel
(black = 1 si es color de piel oscura), origen latinoamericano (hispanic = 1 si la persona proviene
de América Latina), experiencia laboral (exper; número de años) así como el ingreso familiar no
femenino (nwifeinc; in 1000 USD$ ) tiene un impacto en el empleo de las mujeres (inlf = 1 si está
empleado). El impacto de las variables consideradas en el empleo de las mujeres se estimó sobre
la base de una muestra de 5,634 mujeres utilizando un modelo Probit. Los coeficientes de
regresión y sus desviaciones estándar (entre paréntesis) del modelo fueron los siguientes:

con valor de probabilidad de registro L ( Log-Likelihood Wert L) = -3611,719

3. ¿Cuáles son las tres desventajas principales del modelo de probabilidad lineal? ¿Están todas
estas desventajas con el modelo Probit arreglado?

4. Determine la influencia parcial promedio de las variables exógenas educ, exper y nwifeinc
sobre la probabilidad de respuesta del modelo Probit P(inlf=1|x) (use

e interpretar los resultados obtenidos.

5. ¿Las dos variables exógenas negro e hispano juntas tienen un impacto significativo en la
probabilidad de respuesta? Formular la hipótesis nula de una prueba adecuada y realizarla en
un nivel de significación de α = 0.05. Interpretar el resultado obtenido. (Se aplica:

Solución. -

1. Las funciones a bosquejar son:


2. Para responder a la pregunta, se debe verificar la siguiente hipótesis nula simultánea:

Para esto necesitas la estadística F:

Por lo tanto, H0 no se descarta, i. Juntas, estas dos variables no tienen una influencia significativa
en la variable endógena wage.

3. Desventajas:

• Son posibles pronósticos de probabilidad menores que 0 y mayores que 1.

• La probabilidad de éxito no puede depender linealmente de las variables x para todos los
valores x posibles.

• LWM siempre tiene heteroscedasticidad!

Todas las desventajas se resuelven con el modelo Probit.

4. Influencia media e interpretación:


La probabilidad de respuesta del empleo de una mujer aumenta en promedio en 3.88%, si esto
puede ser entrenado adicionalmente un año.

La probabilidad de respuesta del empleo de una mujer disminuye en promedio un 0.27%, si ha


ganado un año más de experiencia laboral.

La probabilidad de respuesta del empleo de una mujer disminuye en promedio en 0.32%, si el


ingreso familiar no femenino aumenta en una unidad o 1000 USD.

5. Para responder a la pregunta, se debe verificar la siguiente hipótesis nula simultánea:

variable de prueba:

Región crítica:

no se descarta, es decir las dos variables juntas no tienen una influencia


significativa en la probabilidad de respuesta.

Tarea 8: Series de tiempo y autocorrelación.

gprice es la tasa de crecimiento mensual del nivel de precios y gwage la tasa de crecimiento
mensual de los salarios por hora para los EE. UU. Sobre la base de los datos históricos (t = 1, ...,
286), el siguiente modelo de retraso distribuido se estimó utilizando el método OLS y el método
FGLS factible (Mínimos cuadrados generalizados GLS) :
Además, se obtuvieron las siguientes relaciones AR (1) para los residuales de las dos
estimaciones (entre paréntesis se encuentran las desviaciones estándar de los coeficientes de
regresión estimados):

1. ¿Qué condiciones debe cumplir un proceso estocástico con un segundo momento finito para
que sea débilmente estacionario? Además, explique qué debe cumplir el requisito de coeficiente
de regresión de un proceso AR (1) para que sea débilmente estacionario, y vea si este es el caso
de las relaciones AR (1) de los residuos de OLS y FGLS ,

2. Para la estimación de OLS y FGLS del modelo de retraso distribuido, determine los
multiplicadores de impacto y los multiplicadores de largo plazo. Interpretar y comparar los
resultados obtenidos.

3. Explique brevemente cuándo ocurre la autocorrelación en un modelo de regresión y la idea y


la hipótesis nula de una prueba de autocorrelación apropiada. Ejecute esta prueba para las
estimaciones de OLS y FGLS del modelo de retraso distribuido e interprete los resultados. ¿Qué
importancia tienen los dos resultados para los coeficientes de regresión de la estimación de OLS
o FGLS calculados en la tarea?

4. Con la denominada estimación de KQ generalizada estimada. (Inglés: la estimación de


mínimos cuadrados generalizados factibles (FGLS)) se puede determinar estimadores
asintóticamente eficientes con una forma desconocida de autocorrelación. En general, explique
los pasos de este método de estimación en el método Cochrane-Orcutt y su diferencia con el
método Prais-Winston.

Solución. -

1. Un proceso estocástico con un segundo momento finito se llama


covarianza o estáticamente estacionario si:

(a) es constante

(b) es constante y

(c) Para todo t, , depende solo de h y no de t.


Los coeficientes de regresión de los procesos AR(1) deben ser absolutamente más pequeños que
la unidad , de modo que estén débilmente estacionarios. Este es el caso para
ambas relaciones AR(1) de los residuos.

2. • Multiplicadores de impacto (propensión):

El multiplicador de impacto muestra la influencia directa sobre la variable endógena de un


cambio regresivo en el tiempo t. Para la estimación OLS, el multiplicador de impacto es
mínimamente mayor que para la estimación FGLS.

• Multiplicadores de largo plazo (propensión):

El multiplicador a largo plazo proporciona el efecto total de un cambio de regresor en la variable


endógena. Nuevamente, en la estimación de OLS, el multiplicador es mínimamente mayor que
la estimación de FGLS.

3. Existe autocorrelación si el supuesto:

no satisfecho sentado es decir Los residuos no son independientes de sus valores retardados.

Idea y hipótesis nula de una prueba adecuada: compruebe la hipótesis nula con
una prueba t para el proceso AR (1):

donde son los residuos del modelo estimado y el ruido blanco.

t estadísticas para ρ:

Según la regla general para un coeficiente de regresión significativamente diferente de

cero, es significativo y no es significativamente diferente de cero, i. no se


autocorrelaciona con la estimación de autocorrelación de OLS y la estimación de FGLS. Para los
coeficientes de regresión, esto significa que los estimadores FGLS no cumplen con las
propiedades AZULES, pero los estimadores OLS no (estimadores eficientes).
4.

1. Determine la utilidad residual del modelo de regresión estimada OLS a partir del problema.

2. Estime el parámetro de regresión ρ para:

3. Corrija la matriz de diseño y la variable endógena del modelo a partir de la declaración del
problema con:

4. Calcule el modelo ahora:

Los parámetros de regresión obtenidos β * son los estimadores FGLS.

En el método Cochrane-Orcutt solo se corrigen las observaciones t = 2, ..., n, en el método Prais-


Winston t = 1 se corrige adicionalmente de la siguiente manera:

Вам также может понравиться