Академический Документы
Профессиональный Документы
Культура Документы
1. Usted está estudiando el rendimiento por galón de una muestra de autos con la siguientes
variables, en una muestra de 392 autos, donde:
Plantea que el rendimiento está relacionado con estas variables, tal que:
Obtiene lo siguiente:
------------------------------------------------------------------------------
mpg | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
cyl | -.2677968 .4130673 -0.65 0.517 -1.079927 .5443336
eng | -.012674 .0082501 -1.54 0.125 -.0288944 .0035465
wgt | -.0057079 .0007139 -8.00 0.000 -.0071115 -.0043043
_cons | 44.37096 1.480685 29.97 0.000 41.45979 47.28213
------------------------------------------------------------------------------
Obtiene:
reg mpg cyl
------------------------------------------------------------------------------
mpg | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
cyl | -3.558078 .1456755 -24.42 0.000 -3.844486 -3.271671
_cons | 42.91551 .8348668 51.40 0.000 41.2741 44.55691
------------------------------------------------------------------------------
Usted calcula la matriz de correlaciones de las variables exógenas del primer modelo:
1
corr cyl eng wgt
(obs=392)
vif
reg faminc he
------------------------------------------------------------------------------
faminc | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
he | 5155.483 658.4574 7.83 0.000 3861.254 6449.713
_cons | 26191.27 8541.108 3.07 0.002 9403.309 42979.23
------------------------------------------------------------------------------
2
Obteniendo:
reg faminc he we
------------------------------------------------------------------------------
faminc | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
he | 3131.509 802.908 3.90 0.000 1553.344 4709.674
we | 4522.641 1066.327 4.24 0.000 2426.711 6618.572
_cons | -5533.629 11229.53 -0.49 0.622 -27605.97 16538.71
------------------------------------------------------------------------------
F(1,oo) = 3.84
F empírico > F tabla, los estimadores si son relevantes (diferentes de 0), se deben incluir
en el modelo.
estat ovtest
Comente que evidencia de mala especificación tiene (o no) según los resultados del test
anterior (3 p).
F tabla(3,oo) = 2.60
3
. reg faminc he we kl6
------------------------------------------------------------------------------
faminc | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
he | 3211.526 796.7026 4.03 0.000 1645.547 4777.504
we | 4776.907 1061.164 4.50 0.000 2691.111 6862.704
kl6 | -14310.92 5003.928 -2.86 0.004 -24146.52 -4475.326
_cons | -7755.33 11162.93 -0.69 0.488 -29696.91 14186.25
------------------------------------------------------------------------------
5 10 15 0 1 2
400000
Family
income in 200000
2006
dollars
0
15
Husband
educational
10 attainment,
in years
5
15
Wife
educational
attainment, 10
in years
5
2
Number of
children less
1 than 6 years
old in
household
0
0 200000 400000 5 10 15
estat ovtest
Comente los resultados de esta modificación, se queda con este último modelo?
Sustente. (2 p)
Incluir kl6 mejora los resultados del modelo (sube t de he y we), aumenta R2, si bien he y
we están positivamente correlacionadas, el efecto de la multicolinealidad es bajo.
F tabla(3,oo) = 2.37
F empírico < F tabla, se acepta la H0, no hay variables omitidas.
4
3. Suponga que lo ha contratado una empresa que le quiere hacer competencia a la vivienda
universitaria y está estudiando el precio de viviendas cerca de la universidad, en una
muestra donde:
Price = precio de la vivienda en miles de soles
Utown = variable binaria 1 si está cerca, 0 si está lejos
Sqft = pies cuadrados de la vivienda
Age = antigüedad de la vivienda
Pool = 1 si tiene piscina, 0 si no tiene.
Fplace = si tiene chimenea, 0 si no
------------------------------------------------------------------------------
price | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
utown | 27.45295 8.422582 3.26 0.001 10.92485 43.98105
sqft | 7.612177 .2451765 31.05 0.000 7.131053 8.0933
utownsqft | 1.299405 .3320478 3.91 0.000 .6478091 1.951001
age | -.1900864 .0512046 -3.71 0.000 -.2905681 -.0896048
pool | 4.377163 1.196692 3.66 0.000 2.028828 6.725498
fplace | 1.649176 .9719568 1.70 0.090 -.2581495 3.556501
_cons | 24.49999 6.191721 3.96 0.000 12.34963 36.65035
------------------------------------------------------------------------------
Si la vivienda está cerca la vivienda cuesta 27,452 soles más; pool si la vivienda tiene piscina
la casa cuenta 4377 soles más; fireplace si la vivienda tiene chimenea la vivienda 1649 soles
más.
------------------------------------------------------------------------------
price | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
utown | 60.19623 .9715313 61.96 0.000 58.28975 62.10272
sqft | 8.318325 .1671728 49.76 0.000 7.990273 8.646377
age | -.192991 .0515666 -3.74 0.000 -.2941828 -.0917992
pool | 4.35257 1.205261 3.61 0.000 1.987422 6.717717
fplace | 1.39881 .976807 1.43 0.152 -.5180307 3.315651
_cons | 6.91188 4.289365 1.61 0.107 -1.505371 15.32913
------------------------------------------------------------------------------
Según lo visto en clases, es correcto hacer eso? (Hint: realice la prueba F) (2p)
5
233734.3−230184.4
1 3549.89
𝐹= 233734.3 = = 15.09
235.14
993
F(1,993) = 3.84
F empírico > F tabla, el estimador si es relevante (diferente de 0), se debe incluir en el
modelo.
1
CUSUM squared
9 1000
t
reg COST N
Source | SS df MS Number of obs = 74
---------+------------------------------ F( 1, 72) = 46.82
Model | 5.7974e+11 1 5.7974e+11 Prob > F = 0.0000
6
Residual | 8.9160e+11 72 1.2383e+10 R-squared = 0.3940
---------+------------------------------ Adj R-squared = 0.3856
Total | 1.4713e+12 73 2.0155e+10 Root MSE = 1.1e+05
------------------------------------------------------------------------------
COST | Coef. Std. Err. t P>|t| [95% Conf. Interval]
---------+--------------------------------------------------------------------
N | 339.0432 49.55144 6.842 0.000 240.2642 437.8222
_cons | 23953.3 27167.96 0.882 0.381 -30205.04 78111.65
------------------------------------------------------------------------------
Indique mediante una prueba F porque la primera regresión es mejor que la segunda.
(3p)
541,380,000,000−891,600,000,000
3 116,740,000,000
𝐹= 541,380,000,000
= = 14.87
7846,086,956.5
69
F(3,69) = 2.76
F empírico > F tabla, los estimadores si son relevantes (diferentes de 0), se deben incluir
en el modelo.
Good luck!
28/06/2018