Академический Документы
Профессиональный Документы
Культура Документы
y y
x x
y y
x x
Exemplos de grficos de disperso
(continuao)
Relaes fortes Relaes fracas
y y
x x
y y
x x
Exemplos de grficos de disperso
(continuao)
Nenhuma relao
x
Coeficiente de correlao (continuao)
O coeficiente de correlao
populacional (r) mede a fora da
associao entre as variveis
O coeficiente de correlao amostral r
uma estimativa de e usado para
medir a fora da relao linear em
observaes amostrais
Caractersticas de e r
y y y
x x x
r = -1 r = -.6 r=0
y y
x x
r = +.3 r = +1
Clculo do coeficiente de correlao
Coeficiente de correlao da amostra:
r
( x x )( y y )
2 2
[ ( x x ) ][ ( y y ) ]
equivalente a:
n xy x y
r
[n( x 2 ) ( x )2 ][n( y 2 ) ( y )2 ]
onde:
r = coeficiente de correlao da amostra
n = Tamanho da amostra
x = Valor da varivel independente
y = Valor da varivel dependente
Exemplo de clculo
Consumo Renda
(em R$) (em mil R$)
y x xy y2 x2
35 8 280 1225 64
49 9 441 2401 81
27 7 189 729 49
33 6 198 1089 36
60 13 780 3600 169
21 7 147 441 49
45 11 495 2025 121
51 12 612 2601 144
=321 =73 =3142 =14111 =713
Exemplo de clculo (continuao)
n xy x y
Y (Consumo) r
70
[n( x 2 ) ( x)2 ][n( y 2 ) ( y)2 ]
60
8(3142) (73)(321)
50
40
[8(713) (73) 2 ][8(14111) (321) 2 ]
30
0.886
20
10
0
r = 0.886 relativamente forte e
0 2 4 6 8 10 12 14
positiva a associao linear entre x e y
(Renda) x
Sada do Excel
Sada de correlao do Excel
Ferramentas / anlise de dados / correlao
Consumo Renda
Consumo 1
Renda 0,886231 1
Hipteses
H0: = 0 (no h correlao)
HA: 0 (existe correlao)
Estatstica de teste
r
t
(com n-2 graus de liberdade)
2
1 r
n2
Exemplo: Consumo e Renda
H evidncia de uma relao linear entre
consumo e renda ao nvel de significncia de 5%?
r .886
t 4.68
1 r 2 1 .886 2
n2 82
Exemplo: Consumo e Renda
r .886 Deciso:
t 4.68
1 r 2 1 .886 2 Rejeitar H0
n2 82 Concluso:
H evidncia de
gl = 8-2 = 6
uma relao linear
ao nvel de
a/2=.025 a/2=.025
significncia de 5 %
Coeficiente Termo de
Intercepto Varivel
de inclinao erro aleatrio,
populacional independente
populacional ou residual
Varivel
dependente
y 0 1x
Componente linear Componente de
erro aleatrio
Hipteses do modelo de regresso linear
Os erros () so estatisticamente
independentes
Os erros so normalmente distribudos para
qualquer determinado valor de x
A distribuio de probabilidade dos erros
normal
A distribuio de probabilidade dos erros tem
varincia constante
A relao entre x e y linear
Testes para verificao das hipteses do
modelo de regresso linear
y y 0 1x
Valor observado
de y para xi
i Inclinao = 1
Valor previsto
de y para xi Erro aleatrio para
este valor de x
Intercepto = 0
xi x
O modelo de regresso estimado
A regresso com base na amostra fornece uma
estimativa da reta de regresso da populao.
y i b0 b1x independente
b0 e b1 so obtidos encontrando-se
os valores de b0 e b1 que minimize a
soma dos quadrados dos resduos
2 2
e (y y)
2
(y (b 0 b1x))
As equaes de mnimos quadrados
b1
( x x )( y y )
e b0 y b1 x
2
(x x)
equivalente a:
n xy x y
b1
n x 2 ( x) 2
Interpretao da inclinao e do intercepto
Os coeficientes b0 e b1 so usualmente
determinados usando a HP 12C, Excel ou
pacotes estatsticos, como STATISTICA e
SPSS, disponveis no Labefin da UP.
Estatstica de regresso
R mltiplo 0,762113713
R-Quadrado 0,580817312
R-quadrado ajustado 0,528419476
Erro padro 41,33032365
Observaes 10
ANOVA
gl SQ MQ F F de significao
Regresso 1 18934,93478 18934,93478 11,08475762 0,010394016
Resduo 8 13665,56522 1708,195653
Total 9 32600,5
450
400
350 Inclinao
300
Preo
250 = 1,0977
200
150
100
50
0
Intercepto 0 100 200 300
Metro quadrado
= 98,248
VT VE VR
Variao Variao Explicada Variao No Explicada pela
Total pela regresso regresso (ou residual)
VT ( y y ) 2 VE ( y y ) 2 VR ( y y ) 2
onde:
y = Valor mdio da varivel dependente
y = Valores observados da varivel dependente
y = Valor estimado de y para um dado valor de x
Variao explicada e no explicada
(continuao)
y _2
_ VE = (yi - y) _
y y
Xi x
Coeficiente de Determinao, R2
2 VE onde 2
R 0 R 1
VT
Coeficiente de Determinao, R2
(continuao)
Coeficiente de determinao
2 2
onde:
R r
R2 = Coeficiente de determinao
r = Coeficiente de correlao simples
Exemplos de valores aproximados de R2
y
R2 = 1
x
R2 = +1
Exemplos de valores aproximados de R2
y
0 < R2 < 1
x
Exemplos de valores aproximados de R2
R2 = 0
y
No h relao linear entre
x e y:
O valor de y no depende
x de x. (Nenhum parcela da
R2 = 0
variao de y explicada
pela variao de x)
Sada do Excel
VE 18934,9348
RESUMO DOS RESULTADOS R2 0,58082
VT 32600,5000
Estatstica de regresso
R mltiplo 0,762113713
R-Quadrado 0,580817312 58,08% da variao do preo
R-quadrado ajustado 0,528419476 do ap explicado pela
Erro padro 41,33032365
variao do metro quadrado
Observaes 10
ANOVA
gl SQ MQ F F de significao
Regresso 1 18934,93478 18934,93478 11,08475762 0,010394016
Resduo 8 13665,56522 1708,195653
Total 9 32600,5
VR
s
nk
onde:
VR = Variao residual
n = Tamanho da amostra
k = Nmero de parmetros estimados no modelo
O desvio-padro do coeficiente angular
de regresso
s s
sb1
2 2
(x x) 2 (
x n x)
onde:
sb1 = Estimativa do erro-padro do coeficiente b 1
VR
s = Erro padro de estimativa
n2
Sada do Excel
s 41,33032
RESUMO DOS RESULTADOS
Estatstica de regresso
R mltiplo
R-Quadrado
0,762113713
0,580817312
sb1 0,32969
R-quadrado ajustado 0,528419476
Erro padro 41,33032365
Observaes 10
ANOVA
gl SQ MQ F F de significao
Regresso 1 18934,93478 18934,93478 11,08475762 0,010394016
Resduo 8 13665,56522 1708,195653
Total 9 32600,5
y y
a/2=.025 a/2=.025
Deciso: Rejeitar H0
Concluso:
RejeitarH0
-t/2
No rejeitar H0
t/2
Rejeitar H
0 Existe evidncia suficiente que
0
-2.3060 2.3060 3.329 o metro quadrado afeta o preo
do apartamento
Resultados da anlise de regresso
b1 t a/2 sb1 gl = n - 2
Inferior Superior
Coeficientes Erro padro Estat t Valor p 95% 95%
Intercepto 98.24833 58.03348 1.69296 0.12892 -35.57711 232.07377
Metro
quadrado 1.0977 0.32969 3.32938 0.01039 0.33740 1.85795
2
1 (x x)
y ta/2s
n (x x)2
Intervalo de confiana para um valor
Individual de y, dado x
2
1 (x x)
y ta/2s 1
n (x x)2
Intervalo de previso
para um valor
y individual de y, dado x
Intervalo de
confiana
para a mdia
de y, dado x
x
x x
Exemplo: Preos do apartamento
1 (x x)2
y t /2s 317,85 37,12
n (x x)2
1 (x x)2
y t /2s 1 317,85 102,28
n (x x) 2
Propsitos
Examinar a suposio de linearidade
Examinar se a varincia constante para
todos os nveis do x
Avaliar a suposio de normalidade
y y
x x
resduos
x resduos x
No Linear
Linear
Anlise dos resduos para varincia
constante
y y
x x
resduos
x resduos x
RESULTADOS DE
RESDUOS
m2 Plotagem de resduos
Observao Previsto(a) preco Resduos 80
1 251,9231626 -6,923162584 60
2 273,8767101 38,12328985
40
3 284,8534839 -5,853483933
Resduos
4 304,0628381 3,937161947 20
5 218,9928412 -19,99284123
0
6 268,3883233 -49,38832326 0,0 50,0 100,0 150,0 200,0 250,0 300,0
7 356,2025135 48,79748648 -20
8 367,1792873 -43,17928731
-40
9 254,667356 64,33264397
10 284,8534839 -29,85348393 -60
m2
Regresso usando o Statistica
Regresso usando o Statistica
Regresso usando o Statistica
Regresso usando o Statistica
Regresso usando o Statistica
Sada do Statistica:
Coeficiente de determinao e parmetros
estimados do modelo linear
Summary
Statistic Statistics; DV:
preco
(preco_ap)
Value
Multiple R 0,762113713
Multiple R 0,580817312
Adjusted R 0,528419476
F(1,8) 11,0847576
p 0,0103940163
Std.Err. of Estimate 41,3303237
Total 32600,50
Sada do Statistica:
Intervalos de confiana para as estimativas
60
40
Raw residuals
20
-20
-40
-60
100 120 140 160 180 200 220 240 260
m2 0,95 Conf.Int.
Sada do Statistica:
Anlise dos resduos
1,5
1,0
Expected Normal Value
0,5
0,0
-0,5
-1,0
-1,5
-2,0
-60 -40 -20 0 20 40 60 80
Residuals
Regresso usando o GRETL
Regresso usando o GRETL
Regresso usando o GRETL
Regresso usando o GRETL
Regresso usando o GRETL
Regresso usando o GRETL
Regresso usando o GRETL
Regresso usando o GRETL
Regresso usando o GRETL
Regresso usando o GRETL
Regresso usando o GRETL
Regresso usando o GRETL
Regresso usando o GRETL
Regresso usando o GRETL
Regresso usando o GRETL
Regresso usando o GRETL