Вы находитесь на странице: 1из 17

MICROECONOMETRIA:

TAREAS
Tarea 1: Variables Ficticias

Práctica 1:Análisis de discriminación laboral en la empresa NIHON.SA.

Primera Parte: Se desea estimar el salario en miles de euros (S) de los trabajadores de la empresa
NIHON.SA que ocupan un determinado puesto en función de su nivel de formación (F ) medido
en años de educación y su experiencia (E) medida en los años que llevan ocupando ese puesto. El
modelo de regresión lineal propuesto para la determinación del salario es:

Si = β1 + β2 Fi + β3 Ei + ui i = 1, 2, . . . , 100 (1)
Una muestra de 100 trabajadores1 de la empresa proporciona los siguientes datos:
X X X X X
Si = 2489, 017 Fi = 288 Ei = 119 Fi2 = 2090 Si2 = 64870, 3
X X X X
Ei2 = 695 Fi Ei = 329 Si Fi = 7869, 098 Si Ei = 3921, 297

 
0, 019276 −0, 0023 −0, 0022
(X 0 X)−1 =  −0, 0023 0, 00079 −0, 00001967 
−0, 0022 −0, 00001967 0, 00180753

a) Interpreta los coeficientes del modelo de regresión lineal (1).


b) Según el criterio Mı́nimo Cuadrático Ordinario, ¿cuál serı́a la función objetivo a minimizar
para estimar los coeficientes del modelo (1)?.
c) Escribe la matriz X 0 X con los datos muestrales disponibles.
d) Estima por MCO los coeficientes del modelo y escribe la recta de regresión muestral.
e) El empleado A lleva trabajando en la empresa dos años más que el empleado B. Según el
modelo, ¿cuál serı́a la diferencia estimada de salario entre ambos?
f) El empleado C lleva trabajando en la empresa tres años menos que el trabajador D pero
cuenta con 5 años más de formación. Según el modelo, ¿cuál serı́a la diferencia estimada de
salario entre ambos?
g) Si un trabajador se ha estado formando durante doce años y lleva tres años trabajando en la
empresa, ¿cuál serı́a su salario estimado según el modelo?
h) Calcula e interpreta una medida de la bondad de ajuste del modelo.
i) Interpreta los resultados obtenidos: ¿qué miden los valores de los coeficientes estimados,
qué significado tiene el estadı́stico de bondad ajuste utilizado, ...?

NOTA: Los datos de la muestra de 100 trabajadores se encuentran en el fichero nihon.gdt de la


carpeta DATOS-C. Comprueba, utilizando el software apropiado, los resultados que has obtenido
en este ejercicio.

Segunda Parte: Consideremos el modelo de determinación del salario:


Si = β1 + β2 Fi + β3 Ei + ui i = 1, 2, . . . , 100 (2)
propuesto y estimado anteriormente.
1
Los datos han sido obtenidos del libro de G. Koop, Analysis of Economic data, Wiley, 2000.

1
a) Construye intervalos de confianza del 95 % para los coeficientes β1 , β2 y β3 .
b) Contrasta la significatividad individual de las variables explicativas (α = 5 %).
c) Contrasta la significatividad conjunta de las variables explicativas (α = 5 %).
d) Un conocido te dice que trabaja en la empresa NIHON y que su salario asciende a 45 mil
euros anuales. Tú sabes que lleva 1 año trabajando en la empresa y que su formación ha
durado 10 años, ¿te parece razonable su comentario?
e) El gerente de la empresa supone que el efecto de la formación sobre el salario (ceteris paribus)
es igual al de la experiencia.
• ¿Qué restricción impone la hipótesis del gerente sobre los coeficientes del modelo de
regresión lineal (2)?
• Estima los coeficientes del modelo sujetos a la restricción anterior.
• Contrasta la hipótesis del gerente con un nivel de significación del 5 %.
• De acuerdo a los resultados obtenidos en el apartado anterior, ¿qué modelo propones
para la determinación del salario? ¿por qué?

Tercera Parte: El comité de empresa de NIHON.SA sostiene que existe discriminación salarial
por razones de género. Para investigar este tema desea utilizar el modelo de determinación del
salario desarrollado hasta el momento, pero incluyendo una variable explicativa más: el género.
Esta variable cualitativa se puede incluir mediante la variable ficticia Gi que toma el valor 1 si el
empleado i-ésimo es una mujer y cero en caso contrario.
Con los datos de la muestra de 100 empleados que se encuentran en el fichero nihon.gdt:

a) Calcula algunos valores muestrales de interés: salario medio total, salario medio para las
mujeres y salario medio para los hombres, sabiendo que los primeros 31 individuos de la
muestra son hombres.
b) Estima por MCO un modelo de regresión lineal simple del salario sobre Gi .
• Compara los resultados de esta estimación con los obtenidos en el apartado 1.
• ¿Es la variable género significativa?
• Únicamente en base a este resultado, ¿puedes concluir que hay discriminación salarial
por razones de género?.
c) Escribe el Modelo de Regresión Lineal que determina el salario en función de la formación,
la experiencia y el género.
d) Interpreta los coeficientes del modelo que has propuesto.
e) Estima el modelo por MCO.
• ¿Cuál es el salario estimado para una mujer?
• ¿Cuál es el salario estimado para un hombre con cinco años de experiencia y 10 años de
formación?
• ¿Cuál es la diferencia salarial estimada entre un hombre y una mujer?
• ¿Cuál es el efecto estimado, ceteris paribus, de la experiencia sobre el salario?, ¿y para
una mujer?, ¿y para un hombre?
f) Interpreta los resultados obtenidos y redacta un informe para el comité de empresa que in-
cluya tus conclusiones en lo que al tema de la discriminación salarial se refiere.

2
Cuarta Parte: El comité de empresa estudia el informe presentado y dados los resultados obte-
nidos en el apartado 2. del ejercicio anterior sigue pensando que hay indicios de discriminación
salarial en la empresa. Trás estudiar la matriz de correlaciones entre las variables explicativas, te
propone que estimes el siguiente modelo:

Si = β1 + β2 Fi + β3 Ei + β4 Gi + β5 (Ei × Gi ) + ui i = 1, 2, . . . , 100 (3)

a) Calcula la matriz de correlaciones entre las variables explicativas. ¿Por qué crees que te han
propuesto este modelo?
b) Explica el modelo (3): qué variables afectan al salario, de que forma, si está introducida o no
la posibilidad de discriminación salarial y cómo.
c) Estima el modelo por MCO e interpreta los coeficientes estimados.
d) ¿Cuál es el salario estimado para una mujer? ¿Y para un hombre con cinco años de experien-
cia y 10 años de formación?
e) ¿Cuál es la diferencia salarial estimada entre un hombre y una mujer?
f) ¿Cuál es el efecto estimado, ceteris paribus, de la experiencia sobre el salario?, ¿y para una
mujer?, ¿y para un hombre?
g) Contrasta la hipótesis de discriminación salarial por género.

Explica al comité de empresa las conclusiones a las que has llegado respecto a la existencia de
discriminación salarial por género en la empresa NIHON.SA.
Práctica 2: Análisis salarial
Una empresa está realizando un estudio sobre el salario de sus empleados. Para ello recoge infor-
mación de sus 474 empleados2 sobre las siguientes variables:
Si : Salario actual del empleado i−ésimo (en miles de euros)
Ini : Salario inicial del empleado i−ésimo (en miles de euros)
Ai : Antigüedad del empleado i−ésimo (en meses)
Ei : Experiencia previa del empleado i−ésimo (en meses)
Primera Parte: El experto contratado para realizar el estudio comienza estimando un MRLS del
salario actual en función del salario inicial:
Si = β1 + β2 Ini + ui i = 1, . . . , N (4)

Empleando la siguiente información muestral,

474
X 474
X
Si = 16314,875 (Si − S̄)2 = 137916,495
i=1 i=1
474
X 474
X
Ini = 8065,625 ¯ 2 = 29300,905
(Ini − In)
i=1 i=1
474
X 474
X
Si Ini = 333563,929 ¯ = 55948,605
(Si − S̄)(Ini − In)
i=1 i=1

a) Interpreta el coeficiente estimado que acompaña a la variable salario inicial (In).


2 b) Comenta el gráfico de los residuos del Modelo 1.
Los datos han sido obtenidos del libro César Pérez López, Métodos estadı́sticos avanzados con SPSS, 2005

3
i Si Ini Ai Ei i Si Ini Ai Ei
1 21,90 9,75 98 0 ...
2 22,50 9,75 94 36 ...
3 16,20 9,75 92 0 460 70,00 35,04 67 75
4 19,65 9,75 90 229 461 51,45 36,24 78 149
5 16,65 9,75 88 412 462 61,88 36,75 80 199
6 21,90 9,75 86 156 463 65,00 37,50 88 264
7 18,15 9,75 86 72 464 92,00 39,99 96 175
8 24,60 10,05 92 44 465 69,25 42,48 85 134
9 17,10 10,20 85 72 466 75,00 42,51 65 54
10 27,45 10,20 85 101 467 70,88 43,50 83 156
11 18,45 10,20 85 228 468 100,00 44,10 66 128
12 16,50 10,20 84 288 469 110,63 45,00 96 120
13 19,80 10,20 83 75 470 86,25 45,00 66 50
14 22,35 10,20 82 48 471 66,00 47,49 86 150
15 16,20 10,20 82 0 472 66,75 52,50 83 258
... 473 103,50 60,00 73 150
... 474 135,00 79,98 96 199

Figura 1: Algunas observaciones

Figura 2: Gráfico de residuos del Modelo 1

c) ¿Qué supuestos sobre la perturbación son necesarios para que el estimador MCO sea inses-
gado y de mı́nima varianza? ¿Y qué supuestos son necesarios para realizar los contrastes?
d) ¿Cuál serı́a la función de regresión muestral si las variables, S e In, estuvieran medidas en
euros?
e) En la Figura 1 se encuentran las primeras y últimas observaciones de la muestra. Si tuvieras
que estimar el modelo sólo con 15 observaciones, ¿crees que serı́a mejor hacerlo con las 15
primeras, con las 15 últimas o darı́a lo mismo?, ¿por qué? (Nota: Fı́jate que las observaciones
están ordenadas según el salario inicial (In)).

Segunda Parte: El experto decide utilizar toda la información disponible, es decir, incluir las
variables explicativas antigüedad y experiencia previa en el modelo obteniendo los siguientes re-
sultados:

Modelo 2: estimaciones MCO utilizando las 474 observaciones 1–474


Variable dependiente: S

Variable Coeficiente Desv. tı́pica Estadı́stico t valor p


const −10,266 2,95984 −3,4686 0,0006
In 1,92732 0,0443723 43,4353 0,0000
A 0,173203 0,0346771 4,9947 0,0000
E −0,0225094 0,00333860 −6,7422 0,0000

4
Suma de cuadrados de los residuos 27048,6
Desviación tı́pica de los residuos (σ̂) 7,58619
R2 0,803877
F (3, 470) 642,151

a) Escribe el modelo de regresión lineal general propuesto.


b) Interpreta el coeficiente estimado que acompaña a la variable antigüedad del empleado.
c) Interpreta la bondad del ajuste realizado.
d) ¿Cuál es el salario actual estimado, según el Modelo 2, para el primer individuo de la mues-
tra?
e) El individuo A tiene 60 meses más de antigüedad que el individuo B, entraron a trabajar con
la misma experiencia previa y con el mismo salario inicial. ¿Cuál es la diferencia estimada
de salario entre ambos?
f) Contrasta la significatividad individual de la variable antigüedad del empleado.
g) Contrasta la significatividad conjunta de las variables explicativas del Modelo 2.
h) ¿Crees que tendrı́as algún problema en la estimación en cada uno de los siguientes casos?,
¿cuál?, ¿por qué?, ¿cuál serı́a la forma óptima de resolverlo?
• Caso-a): Si decides estimar el modelo con las 7 primeras observaciones.
• Caso-b): Si decides estimar el modelo con las 2 últimas observaciones.
i) El experto piensa que la experiencia previa y la antigüedad tienen el mismo efecto en la
determinación del salario actual y decide incorporar esta información al modelo porque cree
que obtendrı́a estimadores con menor varianza, y por lo tanto mejores.
I) Obtén el modelo restringido que propone el experto.
II ) Dada la siguiente información:

474
X
Sbi = 5, 37927 + 1, 92131 Ini − 0, 0206410 (Ai + Ei ) û2i = 28863, 6
(desv)
d (1,0312) (0,045775) (0,003428) i=1

¿Es correcto su razonamiento?, ¿por qué?

Práctica 3: Análisis del efecto de la construcción de una incineradora sobre el precio de las
viviendas.
Un agente inmobiliario quiere analizar los factores que influyen en el precio de las viviendas en
Houston. Para ello dispone de una muestra correspondiente a 321 viviendas sobre las siguientes
variables:

Pt : Precio de venta de la vivienda en miles de doláres U.S.A.


At : Años de antigüedad de construcción de la vivienda.
St : Superficie de la vivienda en metros cuadrados.
Bt : Número de baños.

Primera Parte: En la siguiente tabla se resumen los resultados de estimación de un modelo de


regresión lineal general para determinar el precio de la vivienda:

5
Modelo 1: estimaciones MCO utilizando las 321 observaciones 1–321
Variable dependiente: P

Variable Coeficiente Desv. tı́pica Estadı́stico t valor p


const 8,76 6,26 1,41 0,16
A -0,31 0,06 -5,41 0,00
S 0,33 0,04 9,17 0,00
B 12,25 3,21 3,82 0,00
Media de la var. dependiente 96,10
D.T. de la variable dependiente 43,22
Suma de cuadrados de los residuos 281066
Desviación tı́pica de los residuos (σ̂) 29,78
R2 0,5299
R̄2 corregido 0,5254
F (3, 317) 119,096

Matriz de covarianzas de los coeficientes


const A S B
39, 14 −0, 14 −0, 05 −9, 93 const
0, 003 −0, 0005 0, 08 A
0, 001 −0, 08 S
10, 29 B

a) Escribe el modelo de regresión lineal general propuesto por el agente (Modelo 1).
b) Manteniéndose el resto de las caracterı́sticas de la vivienda constantes, ¿en cuántos dólares
se estima el valor de un cuarto de baño adicional?, ¿por qué?
c) Contrasta la significación conjunta de las variables.
d) Contrasta la significatividad individual de la variable antigüedad (At ).
e) ¿Existe evidencia en la muestra de que, ceteris paribus, se está dispuesto a pagar 500 dólares
por un metro cuadrado adicional?
f) El agente inmobiliario piensa que el efecto negativo sobre el precio de la antigüedad de una
vivienda se ve compensado por el efecto de un aumento de la superficie. Dada la información
con la que cuentas, ¿está este agente equivocado?
g) Dada la conclusión que has obtenido en el apartado anterior, ¿propondrı́as un modelo alter-
nativo para la determinación del precio?, ¿por qué?
h) A la vista del gráfico de los residuos del Modelo 1. ¿Se incumple alguna hipótesis básica?

Segunda Parte: La muestra disponible cuenta con precios de viviendas vendidas en 1980 y en
1981. Las 179 primeras viviendas de la muestra se vendieron en 1980 y las restantes en 1981.
En 1981 se puso en marcha una incineradora en la zona, lo que trajo consigo la construcción de
una nueva autopista y, por lo tanto, una mejora en las comunicaciones. Debido a esto, el agente
inmobiliario mantiene la teorı́a de que existen diferencias de precio entre las viviendas vendidas
en el año 1980 y las vendidas en 1981.

6
a) Especifica un modelo de regresión lineal que tenga en cuenta la posible influencia en la deter-
minación del precio de la puesta en marcha de la incineradora. ¿Cuáles son las caracterı́sticas
de la nueva variable que añadirı́as en el modelo para recoger este efecto? Defı́nela con clari-
dad. ¿Qué valor tomarı́a esta variable para la primera observación de la muestra? ¿Y para la
última?
b) Denominemos por IN C la variable que tú has definido en el apartado anterior para recoger
la puesta en marcha de la incineradora. En la siguiente tabla se presentan los resultados de la
estimación de un modelo de regresión que incluye esta nueva variable:
Modelo 2: estimaciones MCO utilizando las 321 observaciones 1–321
Variable dependiente: P

Variable Coeficiente Desv. tı́pica Estadı́stico t valor p


const -3,96 5,20 -0,76 0,45
A -0,21 0,05 -4,50 0,00
S 0,24 0,03 8,07 0,00
B 17,41 2,65 6,58 0,00
INC 35,78 2,82 12,70 0,00
Media de la var. dependiente 96,10
D.T. de la variable dependiente 43,22
Suma de cuadrados de los residuos 193270
Desviación tı́pica de los residuos (σ̂) 24,27
R2 0,6888
R̄2 corregido 0,6848
F (4, 316) 174,820
Interpreta el coeficiente que acompaña a la variable IN C. ¿Tiene el signo esperado?
c) Contrasta la hipótesis del agente de que la puesta en marcha de la incineradora ha podido
influir en el precio de venta.
d) Comenta el gráfico de los residuos del Modelo 2. Compáralo con el gráfico de los residuos
del Modelo 1. ¿A qué crees que se debe la diferencia?

Tercera Parte: A continuación, el agente inmobiliario se cuestiona si el modelo recoge adecuada-


mente la influencia que ejerce la antigüedad de la vivienda sobre su precio de venta. La siguiente
tabla muestra los resultados de la estimación del modelo que propone el agente, incluyendo la
variable A2 (antigüedad al cuadrado) como variable explicativa:

Modelo 3: estimaciones MCO utilizando las 321 observaciones 1–321


Variable dependiente: P

Variable Coeficiente Desv. tı́pica Estadı́stico t valor p


const 12,93 6,83 1,89 0,06
A -0,70 0,14 -5,03 0,00
A2 0,0033 −−− −−− −−−
S 0,24 0,03 8,16 0,00
B 12,08 2,96 4,08 0,00
INC 36,33 2,77 13,14 0,00

7
Media de la var. dependiente 96,10
D.T. de la variable dependiente 43,22
Suma de cuadrados de los residuos 178257
Desviación tı́pica de los residuos (σ̂) 23,79
R2 0,7018
R̄2 corregido 0,6971
F (5, 315) 148,294

a) Escribe el modelo de regresión lineal general propuesto. ¿En qué se diferencia del Modelo
2? ¿Qué se pretende recoger con la inclusión de la nueva variable?
b) ¿Incumple este modelo alguna de las hipótesis básicas del modelo de regresión lineal gene-
ral?, ¿por qué?
c) ¿Cómo contrastarı́as en el Modelo 3 la significativad de la variable antigüedad? Explica con
detalle la hipótesis nula, el estadı́stico de contraste y la regla de decisión.
d) Si la antigüedad de la casa aumentara en un año manteniéndose constante el resto de las
caracterı́sticas, ¿cuánto estimas que varı́e el precio medio de venta de las viviendas? ¿Y si la
casa tiene una antigüedad de 5 años? ¿Y si la casa tiene una antigüedad de 50 años?
e) Con la información de que dispones, ¿estás de acuerdo con el agente inmobiliario en el
sentido de la relación entre el precio de la vivienda y su antigüedad no es lineal?
f) De acuerdo a tu respuesta en el apartado anterior, ¿qué modelo elegirı́as para determinar el
precio de la vivienda?, ¿por qué? ¿Cuáles son los problemas que presentan los modelos que
NO has elegido? Razona tu respuesta y explica cuáles son las propiedades de los estimadores
en los modelos que NO has elegido.
g) Si tú como agente inmobiliario tuvieras que explicar a las autoridades locales tu teorı́a sobre
la determinación de los precios de la vivienda en la zona, ¿qué aspectos destacarı́as de lo que
has aprendido en este estudio y por qué?

Práctica 4: Análisis del precio de embarcaciones deportivas


Un grupo de estudiantes están interesados en determinar el precio de las embarcaciones del puerto
deportivo de Getxo. Consideran que el Precio (P) medido en miles de euros, depende de factores
como la Potencia del motor (E) medida en caballos de vapor (cv), la Longitud (L), medida en
pies (ft) y la Anchura (W), medida en pulgadas (inc). Los estudiantes han recogido datos del
precio y caracterı́sticas de una muestra de 22 barcos (ver la tabla siguiente). Ya que el Precio viene
suministrado por intervalos, los estudiantes usan el valor medio como el precio de la embarcación.

8
Año Poten. Long. Tipo Ancho Tipo Precio (miles)
barco Botad. (cv) (ft) Combus. (inc) Casco min max medio
1 1983 375 10 LPG 67 Madera 58.67 80.73 69.7
2 1982 245 10 LPG 65 Fibra Vidrio 78.69 89.51 84.1
3 1984 375 11 LPG 70 Fibra Carbón 59.98 75.42 67.7
4 1984 245 13 LPG 71 Fibra Vidrio 74.07 96.13 85.1
5 1983 245 10 LPG 68 Fibra Vidrio 23.27 40.93 32.1
6 1982 500 11 LPG 66 Fiber Glass 61.30 74.10 67.7
7 1980 182 11 LPG 60 Fiber Glass 40.99 47.61 44.3
8 1983 189 11 LPG 68 Fiber Glass 22.46 25.54 24.0
9 1986 245 10 Gasoline 75 Carbon Fibre 29.89 34.31 32.1
10 1984 257 11 LPG 71 Wood 65.29 74.11 69.7
11 1987 245 13 Gasoline 78 Fiber Glass 40.04 51.96 46.0
12 1985 375 12 Gasoline 72 Fiber Glass 66.98 69.62 68.3
13 1989 245 18 Gasoline 84 Fiber Glass 29.97 45.63 37.8
14 1985 120 14 Gasoline 74 Fiber Glass 16.69 23.31 20.0
15 1984 182 10 Gasoline 72 Fiber Glass 16.50 25.10 20.8
16 1985 257 11 Gasolina 72 Madera 27.49 29.91 28.7
17 1985 189 11 Gasolina 73 Fibra Vidrio 18.47 23.33 20.9
18 2006 319 32 Diesel 131 Fibra Carbón 91.50 108.50 100.0
19 2005 319 32 Diesel 128 Fibra Vidrio 82.04 96.16 89.1
20 2010 245 32 Diesel 140 Fibra Vidrio 91.26 107.14 99.2
21 1987 375 16 Diesel 79 Fibra Vidrio 71.90 74.10 73.0
22 1990 182 27 Diesel 86 Fibra Vidrio 58.87 78.73 68.8

Para determinar el precio de los barcos, los estudiantes comienzan especificando un modelo de
regresión lineal. Estiman el modelo con la información disponible obteniendo los siguientes resul-
tados:

Modelo 1: MCO, usando observaciones 1–22


Variable dependiente: P

Coeficiente Desv. Tı́pica Estadı́stico t Valor p


const −8.77827 23.9814 −0.3660 0.7186
E 0.154312 0.0446643 3.4549 0.0028
L 2.46736 1.48305 1.6637 0.1135
W −0.168900 0.519940 −0.3248 0.7490

Media de vble. dependiente 56.77727 D.T. de vble. dependiente 26.74497


Suma de cuad. residuos 5841.517 D.T. de la regresión 18.01468
R − cuadrado 0.611114 F (3, 18) 9.428688

Matriz correlación muestral entre las variables Matriz de covarianzas de los coeficientes
E L W P const E L W
1,0000 0,0146 0,0568 0,5145 E 575.11 −0.41563 22.726 −9.8910 const
1,0000 0,9395 0,5941 L 0.0019949 0.0075098 −0.0029217 E
1,0000 0,5638 W 2.1994 −0.72508 L
1,0000 P 0.27034 W

9
a) ¿Son ciertas las siguientes igualdades? Coméntalas brevemente.
P P 2 P
[a] ûi = 0 ; [b] ûP i =0; [c] ui = 0 ; [d] Li = Wi , ∀i ; [e] Pi = P̂i , ∀i
[f] ûi = ui , ∀i ; [g] Li ûi = 0
Segunda Parte: Un mes después los estudiantes, tras comentar los resultados obtenidos, creen que
el tipo de Combustible y el tipo de Casco pueden influir en el precio. Dados los datos obtenidos
sobre el Combustible definen las siguientes variables:
- LPGi = 1 si el Combustible del i-ésimo barco es LPG (propano) y 0 en caso contrario.
- GASi = 1 si el Combustible del i-ésimo barco es gasolina y 0 en caso contrario.
- DIEi = 1 si el Combustible del i-ésimo barco es diesel y 0 en caso contrario.
y para el tipo de Casco se definen las variables:
- WDi = 1 si el tipo de Casco del i-ésimo barco es madera y 0 en caso contrario.
- FGi = 1 si el tipo Casco del i-ésimo barco es fibra de vidrio y 0 en caso contrario.
- CFi = 1 si el tipo de Casco del i-ésimo barco es fibra de carbón y 0 en caso contrario.
Añadiendo la información sobre estas dos variables cualitativas los estudiantes estiman el modelo:

Modelo 2: MCO, usando observaciones 1–22


Variable dependiente: P

Coeficiente Desv. Tı́pica Estadı́stico t Valor p


const 3.47693 19.0808 0.1822 0.8578
E 0.116078 0.0440822 2.6332 0.0188
L 2.06358 1.04481 1.9751 0.0670
GAS −22.1521 8.33496 −2.6577 0.0179
DIE −8.35546 19.7710 −0.4226 0.6786
WD 3.53123 10.6179 0.3326 0.7441
CF 0.503374 10.5288 0.0478 0.9625

Media de vble. dependiente 56.77727 D.T. de vble. dependiente 26.74497


Suma de cuad. residuos 3917.078 D.T. de la regresión 16.15978
R − cuadrado 0.739229 F (6, 15) 7.086967

Matriz de covarianzas de los coeficientes


const E L GAS DIE WD CF
364.08 −0.623 −14.20 −45.75 204.18 −12.83 28.86 const
0.002 0.008 0.096 −0.136 −0.070 −0.113 E
1.09 −1.09 −18.22 0.55 −1.15 L
69.47 49.37 5.82 −4.60 GAS
390.89 13.90 13.38 DIE
112.74 18.35 WD
110.86 CF

a) Escribe el modelo de regresión lineal general correspondiente al Modelo 2. Explica cómo las
nuevas variables Combustible y tipo de Casco han sido incluı́das en el modelo.
b) Considera las estimaciones -22,1521 y 0,5033, ¿qué significan?

10
c) Contrasta la significación conjunta de las variables tipo de Combustible y tipo de Casco.
d) Dada la información obtenida hasta el momento, ¿pagarı́as 5.000 euros más por un barco de
madera en lugar de uno de fibra de vidrio (todo lo demás siendo igual)?
e) Otro estudiante dice que un tı́o suyo compró hace un año un barco de propano (LPG) y fibra
de vidreo con una potencia de 300 cv. y una longitud de 10 pies, pagando por él 99.000 e.
Sobre la base del Modelo 2, ¿cres que el precio pagado fue un precio razonable?
Tercera Parte: Al analizar los resultados del Modelo 2, los estudiantes concluyen que el tipo de
Casco no es una variable significativa en la determinación del precio y, por lo tanto, que el Precio
puede ser determinado por la Potencia del motor, la Longitud y tipo de Combustible del barco.
Aún ası́, un experto en barcos les dice que el efecto de la longitud sobre el precio puede variar con
el tipo de combustible. En orden a realizar el contraste de esta hipótesis, los estudiantes estiman el
modelo siguiente:

Modelo 3: MCO, usando observaciones 1–22


Variable dependiente: P

Coeficiente Desv. Tı́pica Estadı́stico t Valor p


const −61.8392 67.3895 −0.9176 0.3733
E 0.121493 0.0412484 2.9454 0.0100
L 7.99481 5.97895 1.3372 0.2011
GAS 53.1849 71.2222 0.7467 0.4668
DIE 55.3158 72.5564 0.7624 0.4577
LxGAS −6.80188 6.37308 −1.0673 0.3027
LxDIE −5.92454 6.07149 −0.9758 0.3446

Media de vble. dependiente 56.77727 D.T. de vble. dependiente 26.74497


Suma de cuad. residuos 3667.387 D.T. de la regresión 15.63626
R-cuadrado 0.755852 R-cuadrado corregido 0.658193
F (6, 15) 7.739687 Valor p ( de F ) 0.000636
Log-verosimilitud −87.49476 Criterio de Akaike 188.9895
Criterio de Schwarz 196.6268 Criter. de Hannan–Quinn 190.7886

Matriz de covarianzas de los coeficientes


const E L GAS DIE LxGAS LxDIE
4541.4 −0.72168 −395.33 −4366.3 −4243.8 394.72 392.10 const
0.0017014 0.020911 0.30890 0.020194 −0.019487 −0.013304 E
35.748 390.25 386.70 −35.730 −35.654 L
5072.6 4238.9 −450.66 −388.87 GAS
5264.4 −386.69 −421.87 DIE
40.616 35.643 LxGAS
36.863 LxDIE

a) Escribe el modelo de regresión linela general correspondiente al Modelo 3. ¿Se infringe algu-
na de las hipótesis del MRLG?, ¿por qué?
b) En el Modelo 3, si la longitud se incrementa en un 1 pie y la potencia del motor se mantiene
constante, ¿cuál es el incremento esperado en el precio?, ¿es constante?, ¿de qué depende?

11
c) Explica como contrastar la hipótesis del experto, esto es, que para una potencia dada de motor,
la influencia de la longitud sobre el precio depende del tipo de combustible del barco.
d) ¿Hay evidencia muestral que sugiera que para una potencia de motor y longitud, el tipo de
combustible del barco tiene algún efecto sobre el precio?
e) Después de acabar este ejercicio, uno de los estudiantes lee un ensayo en la revista “El Mundo
del Barco” recomendando comprar un barco con las mismas caracterı́sticas del primer barco
de la muestra. Sobre la base del Modelo 3, ¿cuál es el precio estimado de este barco?, ¿cuál es
la diferencia con respecto al precio mostrado en la tabla?, ¿cuál es el nombre de esta diferencia
en Econometrı́a?
Cuarta Parte: En el análisis inicial del Modelo 1, los estudiantes se encuentraron con el proble-
ma siguiente:.
a) Verificaron que que la variable Potencia del Motor (E) era individualmente significativa, pero
que habı́a problemas con las variables Longitud (L) y Anchura (W). ¿Por qué?
Si además los alumnos estimaron las regresiones auxiliares:

X
Modelo A: Pbi = −14,9579 + 0,152487Ei + 2,01436Li ; R2 = 0,6088; û2i = 5875,763
(14,254) (0,043254) (0,49267)
X
Modelo B: Pbi = −34,2730 + 0,145888Ei + 0,644499Wi ; R2 = 0,5513; û2i = 6739,786
(19,286) (0,046395) (0,18499)
X
Modelo C: Pbi = 15,1131 + 0,155069Ei ; R2 = 0,2647; û2i = 11045,56
(16,317) (0,057797)

Con esta información adicional,


a) Contrasta si las variables Longitud(L) y Anchura(W) del Modelo 1 son conjuntamente signi-
ficativas
b) Con toda la información disponible hasta este momento y los resultados obtenidos en los dos
últimos apartados, ¿qué poblema crees que puede haber en el Modelo 1? Explica claramente.

Práctica 5: Análisis del gasto en restaurantes.


El gerente de una conocida cadena de restaurantes de comida rápida quiere explicar el gasto anual,
Gas (en euros), de sus productos para llevar por parte de los residentes de cierta área metropolitana.
Después de enviar cuestionarios a sus clientes ha recibido 40 respuestas. Según este gerente, las
siguientes variables son importantes para explicar el gasto anual de sus clientes: I, ingreso anual
en miles de euros; A, edad en años; C, coche en propiedad, en años; Género: Femenino (F) o
masculino (M); y Nivel de Estudios máximo alcanzado, dividido en cuatro categorı́as: sin estudios
(SNE), est. primarios (EP), est. secundarios (ES) y est. universitarios (EU):

12
Datos muestrales Matriz de correlation muestral entre las vari
Gas. I A C Género Estudios Gas I A C
1 102 25.7 28 8 Femenino Primarios 1.0000 -0.0649 -0.3764 -0.3666 G
2 146 41.9 35 15 Masculino Secundarios 1.0000 0.7162 0.6677 I
3 183 33.2 27 8 Masculino Secundarios 1.0000 0.9541 A
4 64 23.3 28 6 Femenino Primarios 1.0000 C
5 105 46.2 32 10 Masculino Universitarios
6 0 41 32 13 Femenino Secundarios
7 86 0 24 5 Femenino Primarios
8 236 8.7 23 4 Masculino Sin Estudios
··· ··· ··· ··· ··· ··· ···
36 96 45.2 41 19 Masculino Secundarios
37 170 25.4 18 0 Femenino Primarios
38 165 39.9 31 13 Masculino Secundarios
39 166 21 19 0 Femenino Primarios
40 85 24.8 24 5 Femenino Primarios
Para explicar el gasto anual, el gerente comienza especificando un primer modelo de regresión
lineal general y, con la información disponible, lo estima por MCO obteniendo el siguiente resul-
tado:
X
d i = 283.080 + 2.404 Ii − 8.413 Ai ; R2 = 0.2277;
Modelo 1A; Gas û2i = 162610.9
(54.083) (1.184) (2.571)

Matriz covarianzas de los coeficientes


const I A
2924.9 20.348 −121.71 const
1.4021 −2.1803 I
6.6102 A
a) Describe cuáles son las hipótesis necesarias sobre el término de error del denominado Modelo
1A para que los estimadores MCO de los coeficientes sean ELIO(BLUE).
b) ¿Son ciertas las siguientes afirmaciones? Justifica tu respuesta brevemente (una lı́nea para
cada una). [A] Rechazar que la variable Edad es relevante o significativa para explicar el
gasto,
Pal nivel de significación
P del 5 %, implica también rechazar que es relevante al 10 %. 1cm
[B] P ui = 0. 1cm [C] Ai ûi = 0. 1cm [D] Gas ˆ i = Gasi , ∀i; 1cm [E] P û2 = 0; 1cm
i
[F] Ii ui = 0; 1cm [G] Ai + Ii = 53,7, ∀i. 1cm [H] Para contrastar H0 : βI = βA = 5
podemos usar el estadı́stico t:
β̂I − β̂A − 5
t= q ∼ t(37)
ˆ
V ar(β̂I − β̂A − 5)
1cm
c) Interpreta el número 2.404 que aparece en el Modelo 1A.
d) En el Modelo 1A contrasta si la Edad es una variable relevante o significativa.
e) ] ¿Qué es el número 0.2277 en el Modelo 1A? Interprétalo.
f) En el Modelo 1A contrasta si las variables explicativas son conjuntamente significactivas.
pone203
H0 : βI = βA = 0 vs.
Ha : βI 6= 0 y/o βA 6= 0

13
R2 /2 H0
F= ∼ F (2, 37)
(1 − R2 )/37
0,2277
Regla de decisión FM = = 5,45 > 3,2 ≈ F (2, 37)0,05
0,7723

Al nivel de significación del 5 % se rechaza la hipótesis nula βI = βA = 0, y por lo tanto,


Ingresos y Edad son conjuntamente significativas o relevantes para explicar el gasto.
Segunda Parte: Más tarde, el gerente aprende cómo introducir variables explicativas cualitativas
en un modelo y considera la posibilidad de que el Género y el Nivel de Estudios puedan influir en el
gasto anual. Dados los datos obtenidos sobre el Género y el máximo Nivel de Estudios alcanzado,
el gerente define las siguientes variables:
- Fi = 1 si el Género del i-ésimo cliente es Femenino y 0 en caso contrario,
- Mi = 1 si el Género del i-ésimo cliente es Masculino y 0 en caso contrario,
- SNEi = 1 si el máximo Nivel de Estudios del i-ésimo cliente es Sin Estudios y 0 en caso
contrario,
- EPi = 1 si el max.Nivel de Est. del i-ésimo cliente es Estudios Primarios y 0 en caso contrario,
- ESi = 1 si el max.Nivel de Est. del i-ésimo cliente es Estudios Secundarios y 0 en caso con-
trario,
- EUi = 1 si el max.Nivel de Est. del i-ésimo cliente es Estudios Universitarios y 0 en caso
contrario.
Añadiendo la información sobre estas dos variables explicativas cualitativas, el gerente estima el
modelo siguiente:

Modelo 2: MCO, usando observaciones 1–40; Variable Dependiente : Gas

Coeficiente Desv. Tı́pica Estadı́stico t valor p


const 378.705 22.357 16.939 0.000
I 0.663 0.617 1.075 0.290
A -7.601 0.833 -9.126 0.000
F -161.268 9.101 -17.720 0.000
EP 64.024 11.621 5.509 0.000
ES -9.346 20.372 -0.459 0.649
EU -52.933 29.145 -1.816 0.078
Media var. dependiente 117.425 D.T. var. dependiente 73.476
Suma cuadrados residuos 13138.42 D.T. de la regresión 19.953
R2 0.9376 F (6, 33) 82.640

Matriz covarianzas de los coeficientes


const I A F EP ES EU
499.840 0.538 −15.211 −47.105 −106.28 −23.825 13.357 const
0.381 −0.182 −0.94780 −3.3486 −9.7294 −13.062 I
0.693 −0.27422 2.7008 0.23963 −0.35380 A
82.822 0.46362 78.250 104.09 F
135.05 153.20 177.33 EP
415.03 500.33 ES
849.42 EU

14
a) Escribe la función de regresión muestral (FRM) correspondiente al Modelo 2. ¿Cuál es el
nombre de la diferencia entre la variable dependiente observada y el valor dado por esta fun-
ción?
b) Explica por qué los Hombres Sin Estudios no aparecen de manera explı́cita en el Modelo 2.
¿En qué parte del modelo se encuentran representados? Explica suficientemente.
c) Considera la estimación 64.024, ¿qué significa?
d) Contrasta conjuntamente si las variables Género y Nivel de Estudios son significativas o rele-
vantes para explicar el gasto.
e) Dada la información de la que disponemos hasta este momento, ¿crees que un cliente con un
nivel de estudios Primarios gastarı́a 90 e más que otro Sin estudios (siendo iguales el resto
de sus caracterı́sticas)?
f) Un camarero muy experimentado de uno de los restaurantes le comenta al gerente que hace
un año conoció a un cliente masculino, de 30 años de edad, sin estudios y unos ingresos de
20000 e que realizó un gasto anual de 250 e en comida para llevar en el restaurante. Sobre la
base del Modelo 2, ¿crees que este comentario es razonable?
g) Después de terminar este estudio, el gerente lee un artı́culo en la revista China World Ma-
gazine que sugiere que el cliente tı́pico o medio de este tipo de negocio tiene las mismas
caracterı́sticas que el individuo octavo que aparece en los datos de la tabla. De nuevo, sobre la
base del Modelo 2, ¿cuál es el gasto anual estimado para tal cliente tı́pico o medio? ¿Cuál es
la diferencia con respecto al valor del gasto mostrado en la tabla? ¿Cuál es la suma de todas
las diferencias para todos los individuos de la muestra? Explica suficientemente.
h) Supón que al realizar en el Modelo 2 un contraste de significación sobre el nivel de estudios
NO se rechaza la hipótesis nula. Propón una modificación de dicho modelo. ¿Qué propiedades
tendrı́an los estimadores del nuevo modelo propuesto frente a las propiedades que tendrı́an los
estimadores del Modelo 2? Explica suficientemente.
Tercera Parte: Inicialmente, el gerente pensaba que la variable Coche (C) podrı́a ser usada para
mejorar las estimaciones de los coeficientes del primer modelo. Ası́ pues, como una alternativa al
Modelo 1A también estimó el modelo siguiente:
X
d i = 280.700 + 2.402 Ii − 8.289 Ai − 0.133 Ci ; R2 = 0.2277;
Modelo 1B; Gas û2i = 162608.9
(127.120) (1.204) (6.499) (6.416)

a) Explica de dónde se ha obtenido el número 6,499.


b) Analizando los resultados obtenidos en la estimación del Modelo 1B, el gerente piensa que
la variable Ingreso (I) solo es relevante al nivel del 10 % de significación, pero tiene algunas
dudas sobre las variables Edad (A) y Coche (C). Explica este razonamiento del gerente.
El gerente también ha estimado varios modelos extra:
X
d i = 122.155 + 1.857 Ii − 7.630 Ci ; R2 = 0.1928;
Modelo C; Gas û2i = 169956.6
(26.813) (1.135) (2.595)
X
d i = 128.179 − 0.371 Ii ; R2 = 0.0042;
Modelo D; Gas û2i = 209664.3
(29.300) (0.926)

Con esta información adicional,


a) Contrasta si las variables Edad (A) y Coche (C) del Modelo 1B son conjuntamente significa-
tivas.

15
b) Juzgando los resultados obtenidos en los últimos dos apartados, qué problema crees que puede
estar presente en el Modelo 1B? Explica suficientemente.
Cuarta Parte: Analizando todos los resultados, el gerente concluye que el Ingreso no es una
variable significativa en la determinación del gasto del cliente y que, por tanto, el gasto anual
puede ser determinado por la Edad, el Género y el Nivel de Estudios del cliente. Aún ası́, uno de
sus clientes, experto en econometrı́a, le comenta que el efecto de la Edad sobre el Gasto puede
depender del Nivel de Estudios. Para contrastar esta hipótesis, el gerente estima un nuevo modelo:
Modelo 3: MCO, usando observaciones 1–40; Variable dependiente: Gas
Coeficiente Desv. Tı́pica estadı́stico t valor p
const 344.783 26.4887 13.0162 0.0000
A −6.02657 0.833559 −7.2299 0.0000
F −158.626 7.64982 −20.7359 0.0000
EP 151.212 37.9328 3.9863 0.0003
EU −93.4971 138.311 −0.6760 0.5038
AxEP −3.31954 1.44649 −2.2949 0.0282
AxEU 1.45515 3.89573 0.3735 0.7111
Media var. dependiente 117.4250 D.T. var. dependiente 73.47593
Suma cuadrados residuos 11708.59 D.T. de la regresión 18.83629
R2 0.944390 F (6, 33) 93.40378
Matriz covarianzas de los Coeficientes
const A F EP EU AxEP AxEU
701.65 −21.714 −62.805 −667.64 −701.65 22.610 21.714 const
0.69482 1.4163 20.947 21.714 −0.71503 −0.69482 A
58.520 31.118 62.805 −2.2516 −1.4163 F
1438.9 667.64 −53.517 −20.947 EP
19130. −22.610 −535.82 EU
2.0923 0.71503 AxEP
15.177 AxEU
a) Escribe el modelo de regresión lineal general que se corresponde con el denominado Modelo
3. ¿Infringe ese modelo alguna de las hipótesis del MRLG? Explica brevemente.
b) En el Modelo 3, si la Edad de una cliente femenina se incrementa en 1 año, ¿cuál es el
incremento esperado en sus gastos anuales? ¿Es constante?
c) Explica cómo contrastar la hipótesis del experto, esto es, cómo contrastar que la influencia de
la Edad en el Gasto depende del Nivel de Estudios del cliente.

16

Вам также может понравиться