Академический Документы
Профессиональный Документы
Культура Документы
AULAS 1, 2 e 3
O Modelo de Regresso Mltipla - estimao na forma matricial
Modelo populacional:
Y = X +
Modelo amostral:
Y = Xb + e
Matrizes/vetores:
Y1
Y
Y
2
1
1
.
1
Y N
nx1
X
X
X
12
22
32
.
n2
X
X
X
1K
2K
3K
nK
nxK
2
3
Kx1
N
nx1
20
(1)
matriz X
1
1
1
1
X'
1
2
4
5
X'
21
1
1
(X'X)
5
15
1
1
1
1
X
=
55
X X
15
1
2
4
5
2
2
2
b
b
b
1
1
1
2
3
7
8
9
(X'Y)
29
106
X Y
X Y
(X'X) b
(X'Y)
X 2 b1
Y
Y
2
X 2 X 2 b2
X2
E as equaes normais so :
N b1 X 2 b2 Y
X 2 b1 X 22 b2 X 2 Y
Resolvendo para b2:
Obs: multiplicar a equao (1) por X2 e a equao (2) por N e depois
subtrairN(2) - (1). (
)2
Y
b1 X 2 X 2 b2 X 2
N b1 X 2 N b2 X 22 N X 2 Y
Chega - se a :
N X 2 Y X 2 Y
b2
N X 22 ( X 2) 2
Resolvendo para b1 a partir de (1) :
Y
X2
b2
Y b2 X 2
b1
N
N
22
Agora voltando a:
XX b = XY equaes normais
(1)
Y b1 b2 X
b1 Y b2 X
23
Y Xb
^
Y Y e
E Y E
Ee
E Y E
Y
Y
na populao
na populao fixo
Varb
padro de b.
Diferena entre desvio padro e erro padro
O desvio padro uma medida da disperso dos dados em torno da mdia.
a) Extramos uma amostra de uma populao (amostra 1) e calcularmos a
mdia e o desvio padro da mdia dessa amostra;
b) Extramos outras amostras da mesma populao (amostras 1,2,3,4,etc) e
calculamos as mdias e os desvios padres de todas essas amostras.
Agora temos uma distribuio das mdias amostrais. Se calcularmos a
mdia dessa distribuio (ou seja, a mdia de todas essas mdias) e o
desvio padro dessa nova mdia, esse desvio padro o erro padro.
c) Na maioria das vezes em econometria, temos somente uma amostra e
temos que calcular o seu erro padro. O erro padro importante para
obter o intervalo de confiana da mdia na populao. Ou seja, dada a
sua amostra, voc quer calcular a mdia da populao de onde veio
aquela amostra. Para isso voc constri um intervalo de confiana que
provavelmente conter a media populacional, usando a mdia e o
25
desvio padro obtidos com a sua amostra. Como obter o erro padro
partir do desvio padro?
Erro padro = desvio padro /
Desvio padro:
(X X )
N 1
Vis E (b)
2.
Vis E (b)
Var b
, o erro padro de b.
enviesado)
3. Eficincia
No somente o vis (ou ausncia dele) importante para definir um
estimador. Precisamos de critrios de preciso. A varincia um critrios de
preciso ou eficincia.
Varincia se eu tenho dois estimadores no viesados, aquele com a menor
varincia o mais preciso eficiente
Um estimador qualquer, , considerado eficiente se as seguintes condies
ao satisfeitas:
1) no viesado
~
2) Var () Var ( ) onde ~ qualquer outro estimador no viesado de .
Um estimador eficiente chamado de estimador de varincia mnima, ou
melhor estimador no viesado. Observar que pelas condies acima, um
26
estimador um pouco viesado, mesmo que tenha uma varincia bem menor
no pode ser chamado de eficiente.
Notar tambm que estamos preocupados com a eficincia relativa, uma vez
que estamos comparando dois estimadores.
Existe uma condio que fornece a eficincia no sentido absoluto. o limite
inferior de Cramer-Rao (Cramer-Rao lower bound) que veremos mais tarde.
Propriedades dos MQO em amostras finitas (pequenas amostras)
Ausncia de vis:
b = (X X)-1 X Y
b = (X X)-1 X (X + )
b = (X X)-1 X X + (X X)-1 X
b = + (X X)-1 X
E[b] = E[ + (X X)-1 X ]
E[b] = + (X X)-1 X E[]
E[b] =
Ento, o vetor b dos MQO um estimador linear no viesado do vetor de
parmetros populacionais, .
Matriz de varincias e covarincias de b
varincia eficincia!!
Var b = E{(b E[b]) (b - E[b])}
Var b = E[(b - ) (b - )]
Var b = E[( + (X X)-1 X - ) ( + (X X)-1 X - )]
Var b = E[(X X)-1 X X (X X)-1]
Var b = (X X)-1 X 2 I X (X X)-1
Var b = 2 (X X)-1
27
A matriz M
Y=Xb + e
e = Y- X (XX)-1XY
e = [I- X (XX)-1X]Y
e = MY
M = [I - X (XX)-1X] = matriz que quando pr-multiplicada por Y produz os
resduos da regresso de Y em X.
M = matriz idempotente M= M ; MM= M; M M= M ; M2 = M
MX = 0 ( resduos da regresso de X em X!!)
[I - X (XX)-1X] X = X - X (XX)-1XX = 0
Resduos dos MQO:
e = MY = M(X + ) = M
ee = M
E[ee X] = E[M X] = E[tr(M) X] = E[tr(M) X]
E[ee X] = tr(M E[ X] = tr (M 2 I)
Obs: ateno s propriedades do trao: trao de ABC = trao de BCA= trao
de CAB
Trao de M = n- k
E[ee X] = 2 (n-k)
2 = E[ee X]/(n-k)
28
s2=ee/n-k
E[s2] = 2
Unidades de medida e forma funcional
(cap. 2 item 2.4 do livro do Wooldridge)
Mudana da unidade de medida na varivel dependente:
Ex: salrio medido em reais
Source |
SS
df
MS
-------------+-----------------------------Model | 35121876.3
8 4390234.54
Residual |
117594292
926 126991.676
-------------+-----------------------------Total |
152716168
934 163507.675
Number of obs =
F( 8,
926)
Prob > F
R-squared
Adj R-squared
Root MSE
=
=
=
=
=
935
34.57
0.0000
0.2300
0.2233
356.36
-----------------------------------------------------------------------------salariom |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------educ |
56.72081
6.825013
8.31
0.000
43.32652
70.11509
exper |
19.26636
12.28546
1.57
0.117
-4.844224
43.37694
exp2 | -.1413615
.5149724
-0.27
0.784
-1.15201
.8692869
qi |
3.472021
.9724784
3.57
0.000
1.563503
5.380538
casado |
185.6528
38.1132
4.87
0.000
110.8545
260.451
negro | -126.9398
38.72529
-3.28
0.001
-202.9393
-50.9403
sul | -54.49159
25.73656
-2.12
0.035
-105.0003
-3.98285
urban |
166.3909
26.27843
6.33
0.000
114.8187
217.9631
_cons | -609.1583
136.2062
-4.47
0.000
-876.467
-341.8496
Number of obs
F( 8,
926)
Prob > F
R-squared
Adj R-squared
Root MSE
=
=
=
=
=
=
935
34.57
0.0000
0.2300
0.2233
.35636
-----------------------------------------------------------------------------salariom_mil |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------educ |
.0567208
.006825
8.31
0.000
.0433265
.0701151
exper |
.0192664
.0122855
1.57
0.117
-.0048442
.0433769
exp2 | -.0001414
.000515
-0.27
0.784
-.001152
.0008693
qi |
.003472
.0009725
3.57
0.000
.0015635
.0053805
casado |
.1856528
.0381132
4.87
0.000
.1108545
.260451
negro | -.1269398
.0387253
-3.28
0.001
-.2029393
-.0509403
sul | -.0544916
.0257366
-2.12
0.035
-.1050003
-.0039829
urban |
.1663909
.0262784
6.33
0.000
.1148187
.2179631
_cons | -.6091584
.1362062
-4.47
0.000
-.876467
-.3418497
------------------------------------------------------------------------------
29
Observar que todos os coeficientes ficaram divididos por mil e a soma dos
quadrados dos resduos (e do modelo SQ explicada) ficou dividida por um
milho isso porque os resduos ficaram divididos por mil.
Mudana da unidade de medida nas variveis independentes:
Ex. dividindo a varivel educao por dez.
Source |
SS
df
MS
-------------+-----------------------------Model | 35121876.1
8 4390234.52
Residual |
117594292
926 126991.676
-------------+-----------------------------Total |
152716168
934 163507.675
Number of obs
F( 8,
926)
Prob > F
R-squared
Adj R-squared
Root MSE
=
=
=
=
=
=
935
34.57
0.0000
0.2300
0.2233
356.36
-----------------------------------------------------------------------------salariom |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------educ_dez |
567.2081
68.25013
8.31
0.000
433.2652
701.1509
exper |
19.26636
12.28546
1.57
0.117
-4.844224
43.37694
exp2 | -.1413615
.5149724
-0.27
0.784
-1.15201
.8692869
qi |
3.472021
.9724784
3.57
0.000
1.563504
5.380538
casado |
185.6528
38.1132
4.87
0.000
110.8545
260.451
negro | -126.9398
38.72529
-3.28
0.001
-202.9393
-50.9403
sul | -54.49159
25.73656
-2.12
0.035
-105.0003
-3.982849
urban |
166.3909
26.27843
6.33
0.000
114.8187
217.9631
_cons | -609.1584
136.2062
-4.47
0.000
-876.4671
-341.8497
------------------------------------------------------------------------------
Number of obs
F( 8,
926)
Prob > F
R-squared
Adj R-squared
Root MSE
=
=
=
=
=
=
935
34.57
0.0000
0.2300
0.2233
356.36
-----------------------------------------------------------------------------salariom |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------educ |
56.72081
6.825013
8.31
0.000
43.32652
70.11509
exper |
19.26636
12.28546
1.57
0.117
-4.844224
43.37694
exp2 | -.1413615
.5149724
-0.27
0.784
-1.15201
.8692869
qi |
3.472021
.9724784
3.57
0.000
1.563503
5.380538
casado |
185.6528
38.1132
4.87
0.000
110.8545
260.451
negro | -126.9398
38.72529
-3.28
0.001
-202.9393
-50.9403
sul | -54.49159
25.73656
-2.12
0.035
-105.0003
-3.98285
urban |
166.3909
26.27843
6.33
0.000
114.8187
217.9631
_cons | -609.1583
136.2062
-4.47
0.000
-876.467
-341.8496
-----------------------------------------------------------------------------summarize qi
31
Variable |
Obs
Mean
Std. Dev.
Min
Max
-------------+-------------------------------------------------------qi |
935
101.2824
15.05264
50
145
Interpretao:
Aumento de um desvio padro (15.05264) no QI provoca um aumento de:
15.05264*3.472021 = 52.26307 reais no salrio
Regresso com a varivel transformada em desvios padres antes de
estimar:
Source |
SS
df
MS
-------------+-----------------------------Model | 35121876.3
8 4390234.54
Residual |
117594292
926 126991.676
-------------+-----------------------------Total |
152716168
934 163507.675
Number of obs
F( 8,
926)
Prob > F
R-squared
Adj R-squared
Root MSE
=
=
=
=
=
=
935
34.57
0.0000
0.2300
0.2233
356.36
-----------------------------------------------------------------------------salariom |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------educ |
56.7208
6.825013
8.31
0.000
43.32652
70.11509
exper |
19.26636
12.28546
1.57
0.117
-4.844224
43.37694
exp2 | -.1413615
.5149724
-0.27
0.784
-1.15201
.8692869
qin |
52.26307
14.63836
3.57
0.000
23.53485
80.99128
casado |
185.6528
38.1132
4.87
0.000
110.8545
260.451
negro | -126.9398
38.72529
-3.28
0.001
-202.9393
-50.9403
sul | -54.49159
25.73656
-2.12
0.035
-105.0003
-3.98285
urban |
166.3909
26.27843
6.33
0.000
114.8187
217.9631
_cons | -257.5039
128.0464
-2.01
0.045
-508.7986
-6.209174
------------------------------------------------------------------------------
32
33
34