Вы находитесь на странице: 1из 56

Curso de Adm e Eltrica

Prof. Dennis Marinho


Estatstica Bsica
Regresso Linear Simples
e Correlao Linear
Correlao Linear Simples
Determina o grau de relacionamento ou ligao
entre variveis - (X
i
, Y
i
);

Seu valor um coeficiente flutuante, entre 0 e 1 ou
0 e -1 ou -1 at 1;

-1 < < 1, no entanto =0 significa que no existe
relao entre os dados na forma linear;

> |0.60| considerado j uma boa correlao.
Tabela de Correlao
|| <20 Muito Fraca Correlao
20<||<50 Fraca Correlao
50<||<70 Mdia Forte Correlao
80<||<90 Forte Correlao
||=1 Correlao Perfeita
=0 No Existe Correlao Linear
Se > 0 dados apresentam-se (x,y) com Reta Crescente;
Se < 0 dados apresentam-se (x,y) com Reta Decrescente;
Forma matemtica do
1 1 < I <
( ) ( ) ( )
( ) ( )
(
(

|
.
|

\
|

(
(

|
.
|

\
|

=


= = = =
= = =
2
n
1 i
i
n
1 i
2
i
2
n
1 i
i
n
1 i
2
i
n
1 i
i
n
1 i
i
n
1 i
i i
y y n . x x n
y x y x n

Exemplo: Considere 6 pares de valores dados na tabela


a seguir. Pode-se imaginar que cada par de valores so
as notas tiradas por um aluno em duas disciplinas:







Determine o nvel de correlao entre as variveis.
N Matemtica
(x
i
)
Portugus
(y
i
)
(x
i
y
i
) (x
i
) (y
i
)
1 4 6 24 16 36
2 5 7 35 25 49
3 6 6 36 36 36
4 6 8 48 36 64
5 8 7 56 64 49
6 9 8 72 81 64
Total
Exemplo: As observaes ao lado
apresentam a relao cliente (por
semana) e valor vendido (na escala de
mil R$). Determine o coeficiente de
correlao entre os dados.
Numa pesquisa objetivou-se estabelecer a relao entre o nvel de
escolaridade dos pas e filhos de uma determinada escola. Qual o
valor da correlao?
Criana Anos de Escola X
i
Y
i
X
i
Y
i

Pais (x
i
) Filho (y
i
)
A 12 12 144 144 144
B 10 8 80 100 64
C 6 6 36 36 36
D 16 11 176 256 121
E 8 10 80 64 100
F 9 8 72 81 64
G 12 11 132 144 121
Total
Exemplo: Abaixo temos relao entre nmero de clientes
(X
i
) e volume de informaes (Y
i
) de uma LanHouse em 1
dia de funcionamento. Verifique a correlao das variveis.
Observ Clientes MBytes Observ Clientes MBytes
1 18 680 10 13 513
2 16 624 11 12 436
3 17 661 12 14 570
4 20 762 13 21 834
5 10 405 14 21 799
6 17 650 15 19 579
7 15 597 16 10 603
8 19 701 17 17 671
9 20 796 18 14 614
Regresso Linear?
uma ferramenta estatstica que utiliza dados
coletados em campo de uma varivel e estes vo
dar suporta para as projees futuras de novos
dados;

A composio de uma regresso dada por uma
varivel resposta (y
i
) (varivel dependente) e
varivel independente (x
i
);

Aps realizados os clculos estabelecida uma
funo linear f(x) em que far as projees.
Ponto de Vista Matemtico
Y=f(x
1
, x
2
, ..., x
i
, x
i+1
, ..., x
i+m
)

Considere:
i seja o dado coletado em campo;
m seja o dado projetado pela funo.
Erro da Agregado -
i

Quando fazemos projees existe uma possibilidade
de erramos e por isso toda funo ou projeo ser
na forma matemtica:
Y
i
= f(X
i
) +
i

As caractersticas do erro:
Humano;
Coleta;
Instrumentos de medida;
Condies climticas;
Condies ambientais (local).
Principais Caracterstica FRLS
Experincia do pesquisador;

Comportamento dos dados:

Tabelas:
Diretamente proporcional (x
i
,y
i
);
Inversamente Proporcional (x
i
,y
i
).

Grficos:
Crescentes;
Decrescentes.
Modelo de Regresso Populacional
Dados n pares de valores de duas variveis, Xi, Yi (i =
1, 2, . . . , n), se admitirmos que Y funo linear de
X, podemos estabelecer uma regresso linear
simples, cujo modelo estatstico :
Y =
0
+
1
X + ,
Y = b
0
+ b
1
X + (amostral),
onde 0 e 1 so chamados de parmetros.


0
Coef. Linear da Reta;

1
Coef. Angular da Reta ou Coef. da Regresso;

Propriedades
1. A relao entre X e Y linear ou reta;

2. X uma varivel aleatria;

3. A esperana do erro nula;

4. O erro de uma observao no interfere na outra;

5. A funo da regresso tem distribuio normal;
Dados coletados
Coloc-lo em tabela;

Encontrar as estimativas (b
0
e b
1
);

Montar a funo f(x);

Fazer as projees;
Estimar
1

Estimar
0

Graficamente
Exemplo: Determine os estimadores da funo da
regresso para estimarmos o valor das vendas
quando a loja receber 1000 clientes por semana.
Exemplo: A tabela abaixo mostra a relao entre
peso e altura de 20 pessoas. Sendo X a altura e peso
Y. Determine o coeficiente de correlao,
estimadores da funo de regresso e, ao final,
determine o peso de uma pessoa com 1,50m e
1,90.
Anlise da Varincia - Anova
uma tcnica utilizada para estudar mais
profundamente as variaes que ocorrem dentro da
regresso e de outras pesquisas com amostragem;

Ela consistem em explicar as variaes dentro da
amostra e entre as amostras, ou seja, variaes da
amostra causadas pela prpria amostra e variao da
amostra causada pelas condies externas;

Resumidamente a ANOVA apresenta um RAIO-X da
situao da sua regresso atravs de suas principais
caractersticas.
Composio da ANOVA
Toda ANOVA composta por trs partes:
1. Total;
1.1 Grau de liberdade.
2. Regresso;
2.1 Grau de liberdade.
2.2 Valor da Regresso prximo do total indica boa
adequabilidade dos dados.
3. Resduos (erros aleatrios);
3.1 Grau de liberdade;
3.2 a relao entre o valor observado e valor estimado, espera-
se que seja o mais prximo possvel de zero.
4. Quadrado Mdio: a diviso de qualquer valor acima
pelo seu respectivo grau de liberdade.

Quadro da ANOVA
Fonte de
Variao
Soma de
Quadrados
G.L. Quadrado
Mdio
Regresso SQT
regresso
1 QM
regresso

Resduo SQT
resduo
n-2 QM
resduo

Total SQT
total
n-1
Frmulas
Fonte de
Variao
Soma de
Quadrados
G.L. Quadrado Mdio
Regresso b
1
.S
xy
1 b
1
.S
xy

Resduo S
yy
b
1
.S
xy
n-2 (S
yy
b
1
.S
xy
)/(n-2)
Total S
yy
n-1
Coeficiente de Explicao R
a razo entre dois valores obtidos atravs da
ANOVA que indica o comportamento (relao(
entre os dados de 0 at 100%

R=SQ
reg
/ SQ
total

Exemplo: As importaes de uma determinada matria
prima (em toneladas), no perodo 1999/2009
encontram-se na tabela a seguir:
Ano (X) 1999 2001 2003 2005 2007 2009
Importaes (Y) 120 117 105 100 84 80
Veja o comportamento dos dados de acordo com ANOVA
e coeficiente de explicao dos dados.
Exemplo: Uma empresa fez o
levantamento do total de
vendas de um produto em
funo das despesas com
propaganda, expressos em R$
1.000,00, obtendo os dados da
tabela ao lado. Supondo uma
relao linear entre as variveis,
estabelea a ANOVA e o
coeficiente de explicao.

Exemplo: A tabela abaixo mostra a relao entre
peso e altura de 20 pessoas. Sendo X a altura e peso
Y. Faa o quadro da ANOVA para estes dados:
Teste de Hiptese da Regresso
Intervalo de Confiana dos Estimadores
necessrio para saber como os dados esto se
comportando em relao aos seus limites de
confiana;
Intervalo de Confiana para b ou b
1

Intervalo de Confiana para a ou b
0

Intervalo de Confiana para y
i-cal

Exemplo: As importaes de uma determinada matria
prima (em toneladas), no perodo 1999/2009
encontram-se na tabela a seguir:
Ano (X) 1999 2001 2003 2005 2007 2009
Importaes (Y) 120 117 105 100 84 80
Encontre os intervalos de confiana para os
estimadores.
Exemplo: A tabela abaixo mostra a relao entre
peso e altura de 20 pessoas. Encontre os intervalos
de confiana dos estimadores:
Software R Statistical
Software de aplicao gratuita na rea de estatistica;

Pacotes so as ferramentas distribudas gratuitamente
pelos seus desenvolvedores;

O R um script e no um compilador de aes;

No necessrio memorizar os cdigos, mas sim saber
as ferramentas de aplicao nas suas apostilas.
Exemplo:
Um engenheiro civil coleta dados em um laboratrio estudando a dilatao de um
pilar de concreto segundo a temperatura ambiente no local onde est o pilar. Veja os
dados (fictcios):
T(C) - x
18 16 25 22 20 21 23 19 17
Dilatao Linear (mm) - Y
5 3 10 8 6 7 9 6 5
Regresso Linear (Intrnsica)
Aplica-se em dados nos quais a forma da plotagem
(grfico) lembra uma funo logartica ou
exponencial ou hiprbole.
Os dados so transformados para exponencial ou
logartimica...
Funo Potncia
x X b b
a b w Y
x b a w
x a w
b
log ;
; log ; log
log . log log
.
1
0
= =
= =
+ =
=
Funo Hiprbole
x X b b
a b w Y
x b a w
x a w
b
log ;
; log ; log
log . log log
.
1
0
= =
= =
=
=

Funo Exponencial
x X b b
a b w Y
x b a w
b a w
x
= =
= =
+ =
=
); log(
; log ; log
). log( log log
.
1
0
Exemplo: A tabela mostra a rea (W) e a renda bruta (R$),
de 10 propriedades empenhadas na lavoura de cana.
Vamos estudar um modelo para essa regresso (linear
simples ou as intrnsecas):
W R$
7,3 1,291
9,7 1,484
12,7 1,429
15,1 1,628
21,2 1,406
26,6 3,163
29 1,937
38,7 7,461
39,3 8,322
45,4 9,783
Regresso Linear: Mltipla
Toda regresso em que K variveis influenciam
diretamente no resultado de Y
estimado
;
f(x
1
,x
2
,...,x
k
)=b
0
+b
1
x
1
+b
2
x
2
+...+b
k
x
k

Cada coeficiente calculado por frmula
estabelecida;

Anlise da Regresso Mltipla - ANOVA
Fonte
Variao
Soma de
Quadrado
Grau
Liberd
Quadrado
Mdio
F
Explicada b
1
S
Y1
+ b
2
S
Y2
p 1 b
1
S
Y1
+ b
2
S
Y2
/2
Resduo S
YY
-b
1
S
Y1
+ b
2
S
Y2
n p S
YY
-b
1
S
Y1
+ b
2
S
Y2

/n-p
Total S
YY
n 1
R=b
1
S
Y1
+ b
2
S
Y2
/ S
yy

Anlise do Melhoramento
At que ponto X
1
, X
2
, ..., X
k
Realmente contribui ou
contribuem para melhor explicar o modelo;
Vejamos as funes:
f( x
1
) = b
0
+ b
1
x
1
;
f( x
1
, x
2
) = b
0
+ b
1
x
1
+ b
2
x
2
;
f( x
1
, x
2
, ..., x
k
) = b
0
+ b
1
x
1
+ b
2
x
2
+ ... + b
k
x
k
;
Existe um limite para inserir variveis na
determinao de Y, seja precisa ou no;
Exemplo: Comparem as trs funes e escolha
que melhor projeta o nmero de veculos na
cidade de A para 2013.
1. f(x
1
) = 20 + 2x
1
;
2. f(x
1
,x
2
) = 20 + 2x
1
+ 3x
2
;
3. f(x
1
,x
2
,x
3
) = 20 + 2x
1
+ 3x
2
+ 4x
3
;
Os dados dos ltimos 4 anos so:
Ano Pop (x1)*10
3
N Resid(x2) N Fin(x3) *10
3
N Vec (Y) *10
3

2008
272 135 361 1001
2009
278 163 483 1065
2010
281 175 390 1130
2011
283 183 120 1149
Melhoramento Estatisticamente
Exemplo: Num certo fenmeno
foram observadas os seguintes
resultados:
a) Calcule a ANOVA: X1 e X2;
b) Calcule a ANOVA X1;
c) Calcule a ANOVA X2;
d) Aplique teste F.
e) Qual varivel explica melhor o
modelo?

X1 X2 Y
8 57 64
10 59 71
6 49 53
11 62 67
8 51 55
Exemplo: Verifique se existe relao entre o nmero de
veculos de passeio registrados na cidade de Ferraz-PI (Y
i
),
o nmero de multas aplicadas no Estado de Pi (X
1
) e o
ICMS arrecado pela Receita Estadual (X
2
). Caso exista ou
no exista determine o grau de contribuio entre as
variveis.
Ano 2012 Infraes ICMS Frota
Jan 69.662 970,52 27335
Fev 63.855 797,34 27543
Mar 70.328 824,67 27749
Abr 62.041 855,31 28015
Mai 61.953 813,17 28245
Jun 57.215 871,31 28552
Jul 65.999 848,42 28847
Ago 80.194 846,14 29264
FIM

Вам также может понравиться