Академический Документы
Профессиональный Документы
Культура Документы
Ax + By + Cz + D = 0 .
D A B
Ax1 + Bx2 + Cy + D = 0 y = x1 x2
C C C
y = b0 + b1 x1 + b2 x2
11111111111111111111111
00000000000000000000000
00000000000000000000000
11111111111111111111111
00000000000000000000000
11111111111111111111111
00000000000000000000000
11111111111111111111111
00000000000000000000000
11111111111111111111111
00000000000000000000000
11111111111111111111111
00000000000000000000000
11111111111111111111111
00000000000000000000000
11111111111111111111111
00000000000000000000000
11111111111111111111111
00000000000000000000000
11111111111111111111111
00000000000000000000000
11111111111111111111111
Y = b0 + b1 x1 + b2 x2
00000000000000000000000
11111111111111111111111
00000000000000000000000
11111111111111111111111
00000000000000000000000
11111111111111111111111
00000000000000000000000
11111111111111111111111
00000000000000000000000
11111111111111111111111
00000000000000000000000
11111111111111111111111
00000000000000000000000
11111111111111111111111
00000000000000000000000
11111111111111111111111
00000000000000000000000
11111111111111111111111
00000000000000000000000
11111111111111111111111
00000000000000000000000
11111111111111111111111
00000000000000000000000
11111111111111111111111
00000000000000000000000
11111111111111111111111
00000000000000000000000
11111111111111111111111
00000000000000000000000
11111111111111111111111
00000000000000000000000
11111111111111111111111
00000000000000000000000
11111111111111111111111x1
00000000000000000000000
11111111111111111111111
x2
y = b0 + b1 x1 + b2 x2 + ... + bp xp .
n n
SQRE = ei2 = (yi yi )2
i= i=
y = b0 + b1 x1 + b2 x2 + ... + bp xp .
7.5
Sepal.Length
6.0
4.5
4.0
Sepal.Width
3.0
2.0
7
5
Petal.Length
3
1
2.5
1.5
Petal.Width
0.5
y = (y1 , y2 , y3 , ..., yn ) .
x1
Ind. 1
1n
Rn
y
x2
Ind. 2
x3
Ind. 3
...
Ind n
Ind. 4
=
y
= a0 1n + a1 x1 + a2 x2 + ... + ap xp
= Hy.
SOLUO: Tomar a projeco ortogonal de y sobre C (X) : y
Rn y
= Hy
y
C (X)
Rn y
k
SQRE = ky y
= Hy
y
C (X)
Logo, temos:
= Hy
y
= X (Xt X)1 Xt y
y
| {z }
=b
kyk2 = ky
k2 + ky y
k2
n n n
yi2 = yi2 + (yi yi )2
i=1 i=1 i=1
| {z }
= SQRE
n n
yi2 ny 2 = yi2 ny 2 + SQRE
i=1 i=1
SQT = SQR + SQRE
s
n
A norma deste vector kyc k = (yi y)2 = SQT .
i=1
Hyc = H (y y 1n )
Hyc = Hy y H1n
Hyc = y
y 1n
i=1
c
o vector y e a sua projeco ortogonal sobre C (X)
A distncia entre
continua a ser SQRE:
yc Hyc = (y
y 1
n ) (y y 1
n)
c c
y Hy = y y
pelo que
s
n
kyc Hyc k = ky y
k = (yi yi )2 = SQRE .
i=1
Hyc
C (X)
SQR = kHyc k
SQR
cos2 ( ) = = R2 ,
SQT
onde o ngulo entre os vectores yc e Hyc .
Rn
yc
SQT = kyc k
SQRE = ky Hyk
Hyc
C (X)
SQR = kHyc k
SQR
O Coeficiente de Determinao na Regresso Linear, R 2 = SQT ,
o cosseno ao quadrado do ngulo entre yc e Hyc .
y x1 + x2 + x3
> lm ( y x1 + x2 + x3 , data=dados)
O hiperplano ajustado :
1
SQRE minimo se b = Xt X Xt y.
Mas, tal como na Regresso Linear Simples, coloca-se o problema
inferencial quando as n observaes representam uma amostra
aleatria de uma populao mais vasta. a relao populacional
entre Y e as p variveis preditoras que se pretende conhecer. Para
esse fim, ser necessrio admitir alguns pressupostos adicionais.
Y = X + ,
onde
Y1 1 x1(1) x2(1) xp(1) 0 1
Y2
1 x1(2) x2(2) xp(2)
1
2
Y= Y3
, X = 1 x1(3) x2(3) xp(3)
, =
2 , =
3
..
.. .. .. .. ..
.. ..
. . . . . . . .
Yn 1 x1(n) x2(n) xp(n) p n
1 1
e 2 (w ) (w )
1 t
f (w) = p , w Rk . (3)
(2 )k /2 )
det(
Notao: W Nk ( ,
).
y
x
Y Nn (X , 2 In ).
j N j , 2 (Xt X)1
(j+1,j+1)
j j
N (0, 1) ,
j
q
onde = 2 (Xt X)1
(j+1,j+1) .
j
SQRE independente de .
Corolrio
h i
Dado o Modelo de RLM, E SQRE
n(p+1) = 2.
SQRE
QMRE =
n (p + 1)
2 = QMRE .
j j
Z = q N (0, 1) .
2 (Xt X)1
(j+1,j+1)
Temos ainda:
SQRE
W = n(p+1)
2
e Z , W v.a. independentes .
2
Z j j
p = q tn(p+1) .
W /(n(p+1)) QMRE (Xt X)1
(j+1,j+1)
j j
tn(p+1) ,
j
q
com = QMRE (Xt X)1
(j +1,j +1) .
j
q
com j = QMRE (Xt X)1(j +1,j +1) , e sendo t /2[n(p+1)] o valor que na
distribuio tn(p+1) deixa direita uma regio de probabilidade /2.
O valor bj o elemento j +1 do vector das estimativas b (acetato 207).
> summary(iris2.lm)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -0.24031 0.17837 -1.347 0.18
Petal.Length 0.52408 0.02449 21.399 < 2e-16 ***
Sepal.Length -0.20727 0.04751 -4.363 2.41e-05 ***
Sepal.Width 0.22283 0.04894 4.553 1.10e-05 ***
] 0.3012 , 0.1134 [
> confint(iris2.lm)
2.5 % 97.5 %
(Intercept) -0.5928277 0.1122129
Petal.Length 0.4756798 0.5724865
Sepal.Length -0.3011547 -0.1133775
Sepal.Width 0.1261101 0.3195470
> confint(iris2.lm,level=0.99)
0.5 % 99.5 %
(Intercept) -0.70583864 0.22522386
Petal.Length 0.46016260 0.58800363
Sepal.Length -0.33125352 -0.08327863
Sepal.Width 0.09510404 0.35055304
at = a0 0 + a1 1 + a2 2 + ... + ap p .
at = 0 + 1 x1 + 2 x2 + ... + p xp
= E [Y | X1 = x1 , X2 = x2 , ..., Xp = xp ] .
at at
p tn(p+1) .
QMRE at (Xt X)1 a
at at
tn(p+1) ,
at
p
com at = QMRE at (Xt X)1 a.
Y |x t /2 [n(p+1)] indiv , Y |x + t /2 [n(p+1)] indiv
Y |x = b0 + b1 x1 + b2 x2 + ... + bp xp
e
q
indiv = QMRE 1 + at (Xt X)1 a com a = (1, x1 , x2 , ..., xp ).
H0 : 1 = 2 = ... = p = 0
[MODELO INTIL]
vs.
H1 : j = 1, ..., p t.q. j 6= 0
[MODELO NO INTIL]
Teorema
Dado o Modelo de Regresso Linear Mltipla,
SQR
2
p2 , se 1 = 2 = ... = p = 0.
SQR e SQRE so variveis aleatrias independentes.
SQR
Defina-se o Quadrado Mdio associado Regresso, QMR = p .
W = SQR
2
p2
W /p QMR
V = SQRE
2
n(p+1)
2 = Fp,n(p+1) .
V /n(p+1) QMRE
W , V independentes
SQR SQRE
sendo QMR = p e QMRE = n(p+1) .
0.7
0.6
0.5
df(x, 4, 16)
Rejeitar H0 se Fcalc > f [p,n(p+1)]
0.4
0.3
0.2
0.1
0.0
0 1 2 3 4
n (p + 1) R2
F = .
p 1 R2
H0 : R 2 = 0 vs. H1 : R 2 > 0 .
Y = 0 + 1 x1 + 2 x2 + 3 x3 + 4 x4 + 5 x5 ,
Y = 0 + 2 x2 + 5 x5 ,
0.7
0.6
0.5
df(x, 4, 16)
Rejeitar H0 se Fcalc > f [pk , n(p+1)]
0.4
0.3
0.2
0.1
0.0
0 1 2 3 4
n (p + 1) RC2 RS2
F = .
pk 1 RC2
0.7
0.6
0.5
df(x, 4, 16)
Rejeitar H0 se Fcalc > f [pk , n(p+1)]
0.4
0.3
0.2
0.1
0.0
0 1 2 3 4
> anova(brix2.lm,brix.lm)
Analysis of Variance Table
Model 1: Brix ~ Diametro + Acucar
Model 2: Brix ~ Diametro + Altura + Peso + pH + Acucar
Res.Df RSS Df Sum of Sq F Pr(>F)
1 11 0.42743
2 8 0.14925 3 0.27818 4.97 0.03104 *
SQREk
AIC = n ln + 2(k + 1)
n
Deve ser usado com bom senso e o submodelo obtido cruzado com
outras consideraes (como por exemplo, o custo ou dificuldade de
obteno de cada varivel, ou o papel que a teoria relativa ao
problema em questo reserva a cada preditor).
20
0
0 2 4 6 8 10
400
300
videiras$Area
200
100
4 6 8 10 12 14 16
videiras$NP
R2 = 0.8162
400
y = 7.5951 0.2172x + 1.2941x2
300
videiras$Area
200
100
R2 = 0.8003
4 6 8 10 12 14 16
videiras$NP
Y = 0 + 1 |{z}
x +2 |{z}
x 2 +3 |{z}
x 3 +... + p |{z}
xp
=x1 =x2 =x3 =xp
Y = 0 + 1 |{z}
x +2 |{z}
x 2 +3 |{z}
z +4 |{z}
z 2 +5 |{z}
xz
=x1 =x2 =x3 =x4 =x5
i N (0 , 2 ) i = 1, ..., n .
= Y HY = (In H)Y ,
Em notao vectorial: E = Y Y
simtrica, isto Ht = H;
idempotente, isto , H2 = H H = H.
cov(Ei , Ej ) = 2 hij , se i 6= j ,
Ei
Ti = q
QMRE[i] (1 hii )
p+1
h= ,
n
ou seja, a razo entre o nmero de parmetros e o nmero de
observaes.
y
ky (i)k2
Di = ,
(p + 1) QMRE
onde y(i) = X (i) o vector dos n valores ajustados de Y obtido
estimando os s sem a observao i. Expresso equivalente (sendo
Ri o correspondente resduo estandardizado):
2 hii 1
Di = Ri .
1 hii p+1
13
2
1.5 14
1
1
Standardized residuals
0.5
1
14
Cooks distance
1.0
0
1
1
0.5
0.5
2
13
Cooks distance
0.0
2 QMRE SQRE
Rmod = 1 = 1 n1 = 1 (1 R 2) n(p+1)
n1 .
QMT SQT n(p+1)
2
Tem-se sempre n1 > n(p+1), pelo que Rmod < R 2.
2
Se n pouco maior que o nmero de variveis preditoras, Rmod
2 2
bastante inferior a R , excepto se R fr muito prximo de 1.
J. Cadima (ISA) Estatstica e Delineamento 2014-15 301 / 479
Advertncias finais
y = a x1b x2c
Uma relao causal s pode ser afirmada com base em teoria prpria
do fenmeno sob estudo, e no com base na relao linear
estabelecida estatisticamente.