Вы находитесь на странице: 1из 44

6- Regresso

Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161


1
Correlao
Procedimentos Gerais Y=f(X)
Regresso linear
Ajuste da Regresso
Regresso linear Mltipla
Best Subsets
nA anlise de regresso uma tcnica estatstica usada para
modelar e investigar a relao entre duas ou mais variveis. O
modelo freqentemente usado para previses.
nRegresso um teste de hiptese
H
a
: O modelo permite significativamente prever a resposta.
Anlise de Regresso
6- Regresso
Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161
2
Coeficiente de
Correlao
Ex.: Suponha que o nosso desejo
seja o de quantificar a
associabilidade entre duas
variveis relacionadas a cinco
agentes de uma seguradora.
Assim, temos:
X Anos de experincia do agente.
Y Nmero de clientes do agente.
8 7 6 5 4 3 2
70
60
50
Experincia
Anos de
C
l
i
e
n
t
e
s
72 8 E
60 6 D
64 5 C
56 4 B
48 2 A
y x Agente
(x, y) um par aleatrio
Dados emparelhados
Diagrama de
Disperso
6- Regresso
Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161
3
y
x
x x
y y
x x
s
z
x
x

y
y
z
s
y y

r=Correlao de Pearson
Srie de dados
originais (x e y)
so valores
quantitativos.
O conjunto de pontos
deslocado, tendo
agora como centro, os
valores mdios.
A escala de x e y
agora padronizada.
Isso torna os valores
independente da sua
unidade.


n
i
y x
i i
z z
n
Y X r
1
1
) , ( Corr
6- Regresso
Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161
4
4,75 0 0 0 0 300 25 Total
2,25 1.5 1.5 12 3 72 8 E
0 0 0.5 0 1 60 6 D
0 0.5 0 4 0 64 5 C
0,25 -0.5 -0.5 -4 -1 56 4 B
2,25 -1.5 -1.5 -12 -3 48 2 A
z
x
. z
y
z
y
z
x
y x Agente
x x y y
Coeficiente de Correlao
x 5
S
x
2
y 60
S
y
8
% 95 95 , 0
5
75 , 4
) , ( Y X r = Correlao
6- Regresso
Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161
5
r X Y
n
z z
n
x x
s
y y
s
x y
i
n
i
x
i
y
i
n
i i

_
,

_
,



Corr ( , )
1 1
1 1
( )( )
r
n
x x y y
s s
X Y
s s
i i
x y x y

1 Covarincia ( , )
1 1 r
A correlao apresentada aqui linear. Existem outros tipos de correlao!
P_value p/ Correlao
72 8 E
60 6 D
64 5 C
56 4 B
48 2 A
y x Agente
Pearson correlation of Anos Exp and Clientes = 0,950
P-Value = 0,013
Ex.: Clculo da correlao da tabela ao lado
Forte Correlao pois P-Value <0,05
6- Regresso
Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161
6
Faa a anlise de Correlao das
variveis ao lado na planilha
Bidimensional.mtw
Correlao no Minitab
O Coeficiente de
Correlao
tambm chamado
de Coeficiente de
Pearson.
6- Regresso
Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161
7
Recursos Adicionais:
<Estatis> <Correlat>
Desenvolvido por John Hattie
(Alguns recursos grficos mas roda
no modo DOS)
<Statgame>
<Statistical Inference>
<Correlation>
(Interessante para verificar o
conhecimento bsico)
Correlao no Statgame / Hattie
6- Regresso
Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161
8
A) Uma medi da de Cor r el ao for nece doi s ti pos de i nfor maes a respei to
do r el aci onamento de duas var i vei s. Quai s so el as?
B) Qual coefi ci ente de correl ao abai xo i ndi ca o mai s for te r el aci onamento?
a) 0. 70 b) 0. 03 c)-0. 77 d) 0. 10
C) Se a correl ao Rxy=0. 45, ent o Ryx=
D) Qual o val or do coefi ci ente de correl ao mel hor descr eve os segui ntes
val ores das varivei s X e Y, rel aci onadas abai xo:
X: 20 30 40 50 60
Y: 40 30 20 10 0
a) -1. 0
b) 0.0
c) 0.5
d) 1. 0
E) Qual a correlao do
grfico abaixo?
Algumas questes sobre Correlao:
6- Regresso
Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161
9
F) Se um coefi ci ente de correl ao for de +1. 4, o que ocorre?
a) O Rel aci onamento extr emamente f or te
b) O Rel aci onamento posi ti vo
c) Aa r espostas aci ma esto corretas
d) Um er r o computaci onal f oi cometi do
G) Um coefi ci ente de P er son de -0. 5 entre os val ores de Lei tura (X) e o
nmer o de di as ausentes da escol a (Y) i ndi ca que:
a) Metade dos val ores de Lei tura so menos do que o nmer o de di as
ausentes da escol a
b) Mai ores val ores de Lei tura so associ ados com menor aus nci a da
escol a
c)A soma do pr oduto XY i gual a -0. 5
d) Quase no exi ste rel aci onamento entre X e Y
Algumas questes sobre Correlao:
6- Regresso
Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161
10
comumassociar-se um defeito com uma varivel
que est sempre presente quando ele ocorre ( o caso
do operador que culpado, pois quando ele executa a
operao ocorre um defeito Toda operao
geralmente tem um operador).
1995 Six Sigma Academy Inc.
Dia Fator 1 Fator 2 Resultado
1 gua Whisky Ficou Bbado
2 gua Vodka Ficou Bbado
3 gua Rum Ficou Bbado
4 gua Bourbon Ficou Bbado
Concluso: a gua embebeda
Varivel Comum
6- Regresso
Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161
11
Se a histria servisse de base, os Republicanos deveriam estar vestindo a camisa
dos Yankees e dando uma fora para o New York vencer o campeonato. Desde a
Segunda Guerra Mundial, toda vez que os Yanks venceramem um ano de eleio,
o Partido Republicano assumiu a Casa Branca.
Yankees Republicanos
GANHARAM PERDERAM GANHARAM PERDERAM
1976
1964
1960
1956
1952
As armadilhas: correlaes casuais
Vari vel Comum
6- Regresso
Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161
12
As armadilhas: causa reversa
Um fator X tem influncia sobre um Y quando, na verdade, o que ele est vendo
a conseqncia do Y .
Um exemplo deste caso o do Departamento de Vendas que insatisfeito com as
Vendas resolve dar uma srie de descontos e faz promoes para atrair os clientes .
S que a verdadeira causa do problema o Servio de Atendimento ao Cliente .
Com os novos descontos e a nova promoo fica mais difcil
ainda administrar o Servio de Atendimento ao Cliente,
ocasionando num aumento da insatisfao do cliente e
diminuindo mais ainda as vendas (o tiro saiu pela culatra) .
6- Regresso
Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161
13
As armadilhas: fatores omitidos
Pesquisas continuamente demonstramque a medida que o tamanho dos hospitais
aumenta, a taxa de mortalidade dos pacientes aumenta dramaticamente. Portanto,
deveramos evitar hospitais grandes?
Esta anlise enganadora, pois omite um segundo X
2
(fator) importante -- a
gravidade da condio do paciente quando admitido ao hospital. Os casos mais
srios tendem a ser levados aos hospitais maiores!
Fumar cigarros causa cncer? E se eu dissesse que ...
(1) Mdicos franceses no encontram esta correlao;
(2) O tabaco dos EUA geralmente exposto a pesticidas, fertilizantes e
preservativos contendo substncias conhecidamente cancergenas, e;
(3) O tabaco francs raramente entra emcontato com tais substncias qumicas.
6- Regresso
Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161
14
Em 1950, um fazendeiro afirmou que suas rvores frutferas estavamsendo prejudicadas
pelas ondas de rdio de uma estao local prxima. Ele colocou uma tela de arame ao
redor de algumas das rvores para proteg-las destas ondas de rdio e, realmente, as
rvores protegidas se recuperaramrapidamente, enquanto que as desprotegidas ainda
sofriam.
Na mesma poca, muitas rvores ctricas em todo pas foram ameaadas por uma doena
chamada de folha pequena. Alguns fazendeiros Texanos descobriramque uma soluo
de sulfato de ferro curava a doena. No entanto, nemsempre funcionava no Texas, e
praticamente nunca funcionava na Flrida ou na Califrnia.
O mistrio foi desvendado quando o problema verdadeiro foi revelado -- deficincia de zinco
no solo. A cerca do fazendeiro Radiofbico era de tela galvanizada, sendo que traos do
zinco da galvanizao eram levados da tela para o solo.
O sulfato de ferro nada tinham a ver com a cura, mas sim os baldes de ferro galvanizados
usados para espalhar a substncia! Em outras regies, onde outros tipos de baldes eram
usados, as rvores continuaramdoentes.
Em 1950, um fazendeiro afirmou que suas rvores frutferas estavamsendo prejudicadas
pelas ondas de rdio de uma estao local prxima. Ele colocou uma tela de arame ao
redor de algumas das rvores para proteg-las destas ondas de rdio e, realmente, as
rvores protegidas se recuperaramrapidamente, enquanto que as desprotegidas ainda
sofriam.
Na mesma poca, muitas rvores ctricas em todo pas foram ameaadas por uma doena
chamada de folha pequena. Alguns fazendeiros Texanos descobriramque uma soluo
de sulfato de ferro curava a doena. No entanto, nemsempre funcionava no Texas, e
praticamente nunca funcionava na Flrida ou na Califrnia.
O mistrio foi desvendado quando o problema verdadeiro foi revelado -- deficincia de zinco
no solo. A cerca do fazendeiro Radiofbico era de tela galvanizada, sendo que traos do
zinco da galvanizao eram levados da tela para o solo.
O sulfato de ferro nada tinham a ver com a cura, mas sim os baldes de ferro galvanizados
usados para espalhar a substncia! Em outras regies, onde outros tipos de baldes eram
usados, as rvores continuaramdoentes.
O Fazendeiro Radiofbico
6- Regresso
Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161
15
As armadilhas: multicolinearidade
difcil saber o qu causa o qu, quando alguns fatores [Xs] tendem a
ocorrer juntos regularmente.
Tenho visto uma reduo dramtica nas perdas desde que comecei a
implementar as ferramentas estatsticas na fbrica! No entanto, foi
exatamente na mesma poca emque o RH introduziu seu novo sistema
de recompensa e reconhecimento. O que ocasionou a melhoria?
Em 1967, um artigo rotulou um determinado tipo de carro como sendo
inseguro. O modelo emquesto era um carro pequeno esportivo de alto
desempenho. Mas que tipo de motorista seria atrado a tal carro? E se eu
dissesse que a maioria dos proprietrios deste carro tendiam a ser
motoristas jovens menores de 25 anos com novas idias. Esta faixa etria
no paga prmios de seguro mais elevados devido a maior incidncia de
acidentes?
6- Regresso
Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161
16
y
x
Linha de Regresso
A varivel X dita varivel
independente (ou exgenas),
enquanto Y dita varivel
dependente (ou endgenas).
Y=f(x) Simples
Y=f(x,y,z...) Mltipla
Y=f(x)
6- Regresso
Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161
17
Vari vei s I ndi cat i vas
( para Xs Di scret os)
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
X
i
Y
X
a
X
b
X
c
Curvi l nea ( Um X)
X
Y
Li near Si mpl es ( Um X)
X
Y
Ml ti pl a (Doi s ou mai s Xs)
Y
X
2
X
1
Log st i ca ( Ys Di scret os)
1
0
%

y
e
s
X
Curvi l near (Doi s ou mai s Xs)
Y
X
1
X
2
Regresso
6- Regresso
Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161
18
x y +
y
x
x
1
x
2
x
3
,

bx a y +
Uma
importante
condio para
o uso de
regresso
simples que
os resduos (e)
sejam
independentes
de x. Porque?
Curva de
Resduos (e)
Resduos
6- Regresso
Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161
19
y
$
y
i
x
x
i
y
i
2
1 i
n
i
d

bx a y +

( ) ( )
2
1
2
1
2
1
min

min min
i i
n
i i i
n
i i
n
i
bx a y y y d

Regresso Linear
Simples
6- Regresso
Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161
20
2
1 i
n
i
d

bx a y +

( ) ( )
2
1
2
1
2
1
min

min min
i i
n
i i i
n
i i
n
i
bx a y y y d

. 0 e 0
1
2
1
2



n
i
i
n
i
i
d
b
d
a



n
i
i i i
n
i
i i
bx a y x
bx a y
1
1
, 0 ) ( 2
, 0 ) ( 2
A matemtica da Regresso Linear
6- Regresso
Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161
21

'

,
,
) (
) (
1
2
1
x b y a
S
S
x x
y x x
b
xx
xy
n
i
i
n
i
i i

'

n
i
n
i
n
i
i i i
n
i
n
i i
i
x b x a y x
i
x b na y
1 1
2
1
1
,
1
Ufa!
6- Regresso
Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161
22
Ex.: Obter a equao da reta (chamada de reta dos mnimos
quadrados) para os seguintes pontos experimentais:
x 1 2 3 4 5 6 7 8
y 0,5 0,6 0,9 0,8 1,2 1,5 1,7 2,0
Traar a reta no diagrama de disperso. Calcular o coeficiente de
correlao linear.
Qual o valor previsto para x=9?
Qual a Tolerncia de X para 1<Y<1.5?
Exemplo
6- Regresso
Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161
23
. 42 162 204
8
) 36 (
204
, 1 , 9 4 , 41 5 , 50
8
2 , 9 36
5 , 50
2


xx
xy
S
S
Regresso: By Hand
6- Regresso
Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161
24
. 42 162 204
8
) 36 (
204
, 1 , 9 4 , 41 5 , 50
8
2 , 9 36
5 , 50
2


xx
xy
S
S
. 174 , 0 976 , 0 150 , 1
8
36
217 , 0
8
2 , 9
, 217 , 0
42
1 , 9


x b y a
S
S
b
xx
xy
x y 217 , 0 174 , 0

+
Regresso: Clculos
6- Regresso
Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161
25
x y 217 , 0 174 , 0 +
y
x
1 2 3 4 5 6 7 8
2
1
Regresso: Grfico
6- Regresso
Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161
26
98 , 0
06 , 2 42
1 , 9
, 06 , 2 58 , 10 64 , 12
8
) 2 , 9 (
64 , 12
2



yy xx
xy
yy
S S
S
r
S
Relembre Correlao!
Regresso: Correlao
6- Regresso
Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161
27
Regresso. MTW
Regresso linear simples no Minitab
Previso
Ho: modelo no bom
Portanto rejeita-se Ho
6- Regresso
Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161
28
Ajuste da Regresso
Linear
nR-quadrado a
porcentagem da variao
explicada pelo seu modelo.
nR-quadrado (ajustado) a
porcentagem da variao
explicada pelo seu modelo,
ajustada para o nmero de
termos em seu modelo e o
nmero de pontos de dados.
nO valor-p para a
regresso para ver se o
modelo de regresso inteiro
significativo.
H
a
: O modelo permite
significativamente
prever a resposta.
6- Regresso
Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161
29
Quadrtico
Ajuste Quadrtico
6- Regresso
Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161
30
Cbico
Ajuste Cbico
6- Regresso
Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161
31
Intervalos de confiana e de previso
nUma faixa (ou intervalo) de
confiana uma medida da
certeza da forma da linha de
regresso ajustada. Em geral,
uma faixa de 95% implica em
uma chance de 95% de que
as linha verdadeira fique
dentro da faixa. [Linhas
vermelhas]
nUma faixa (ou intervalo) de
previso uma medida da
certeza da disperso dos
pontos individuais em torno da
linha de regresso. Em geral,
95% dos pontos individuais
(da populao em que a linha
de regresso se baseia)
estaro contidos dentro da
faixa. [Linhas azuis]
Ajuste da Regresso
6- Regresso
Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161
32
CTQ
1
2
Estreitando Tolerncias
6- Regresso
Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161
33
CTQ
1 1
2 2
Estreitando Tolerncias
6- Regresso
Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161
34
Pratique Regresso Linear Simples
Determine a funo de transferncia entre o Nmero de Setups
e o Tempo de Ciclo para diversas operaes em uma certa
empresa. Use a planilha cycletime.mtw.
Faa a anlise de Resduos.
Qual a previso do Tempo de Ciclo para uma operao que
consiste em 10 Setups de equipamento?
A equao final adequada? Se no for, como melhor-la?
6- Regresso
Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161
35
Uma reao Qumica foi realizada
sob seis pares de diferentes
condies de presso e
temperatura. Em cada caso foi
medido o tempo necessrio para
que a reao se completasse. Obter
a equao de regresso do tempo
em relao a presso e
temperatura.
Regresso
Mltipla
Regresso.mtw
6- Regresso
Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161
36
Menores
que 0,05
Maior melhor
Regresso Mltipla: Resultados
6- Regresso
Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161
37
92 estudantes americanos
participam de um simples
experimento. Cada estudante
registra o seu peso, altura,
gnero, pulso e se fumante
ou no. Todos eles jogam uma
moeda e sorteiam se vo dar
uma corrida (cara) ou no por
um minuto. Aps a corrida,
todos os alunos registram o
seu pulso novamente. Um
aluno sugere que seja inserida
a seguinte importante
considerao: Se a pessoa
pinta o cabelo ou no.
Deseja-se fazer uma regresso
do segundo pulso em relao a
todas as outras variveis.
Regresso.mtw
Best Subsets
6- Regresso
Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161
38
Equao de regresso
inicial. Muito complexa
Correlao muito alta.
Quem pinta cabelo
geralmente mulher
Best Subsets: Resultados
6- Regresso
Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161
39
Melhor
ajuste
Best Subsets: Resultados
6- Regresso
Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161
40
30 40 50
-3
-2
-1
0
1
2
3
Pred. Y
Residual
0 50 100
-3
-2
-1
0
1
2
3
Pred. Y
Residual
0 50 100
-3
-2
-1
0
1
2
3
Time Order
Residual
0 50 100
-3
-2
-1
0
1
2
3
Time Order
Residual
3 4 5 6 7 8 9 10 11 12
-3
-2
-1
0
1
2
3
X
Residual
10 20 30
-3
-2
-1
0
1
2
3
X
Residual
-3 -2 -1 0 1 2 3
-3
-2
-1
0
1
2
3
Residual
Nscore
-1 0 1 2 3 4
-3
-2
-1
0
1
2
3
Residual
Nscore
Bom Rui m
Nos casos ruins tente
uma transformao
em X,em Y ou
ambos. Use Box-Cox
Transformation
Considere a
possibilidade da
existncia de
variveis ocultas que
no foram
consideradas no
modelo (Lurking)
Residuals vs
Each X
Time Plot of
Residuals
Residuals vs
Predicted Y
(Fits)
Normal
Probability Plot
of Residuals
Anlise de Resduos
Entenda que X e Y no
precisam ser normalmente
distribudos. Os resduos,
contudo, deveriam ser.
6- Regresso
Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161
41
Regresso Curvilnea
200 250 300 350 400
1900
1950
2000
2050
2100
Temperature
Seal Strength
(g/cm2)
Um laboratrio est fazendo testes
em adesivos em funo da
temperatura. Quando a
temperatura aumenta a fora do
contato entre duas superfcies
aumenta Em um determinado
ponto, contudo a fora desse
contato comea a diminuir em
funo de propriedades trmicas
do adesivo. Qual o modelo
emprico da fora (Seal Strength)
em funo da temperatura?
Curve.mtw
6- Regresso
Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161
42
Termo quadrtico
Observe resduos
VIF
Armazena
resduos
Funo
quadrtica
Deve-se criar a varivel
quadrtica e em seguida rodar
o modelo em Regression
Termo quadrtico da regresso
6- Regresso
Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161
43
Regresso Curvilnea
X
X
2
The regression equation is
SealStrength = 923 + 7.45 Temperature - 0.0125 TempSqrd
Predictor Coef StDev T P VIF
Constant 922.98 72.33 12.76 0.000
Temperat 7.4469 0.5033 14.80 0.000 132.9
TempSqrd -0.0124596 0.0008499 -14.66 0.000 132.9
S = 25.18 R-Sq = 69.4% R-Sq(adj) = 68.7%
Analysis of Variance
Source DF SS MS F P
Regression 2 139321 69661 109.87 0.000
Residual Error 97 61498 634
Total 99 200819
Source DF Seq SS
Temperat 1 3051
TempSqrd 1 136270
Unusual Observations
Obs Temperat SealStre Fit StDev Fit Residual St Resid
32 250 2060.00 2005.99 3.38 54.01 2.16R
42 260 2070.00 2016.91 3.44 53.09 2.13R
78 210 1880.00 1937.37 5.58 -57.37 -2.34R
89 260 1960.00 2016.91 3.44 -56.91 -2.28R
X e X
2
so
fortemente
correlacionados.
Nenhuma
surpresa
Concluso: Existe uma curvatura
significativa
6- Regresso
Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161
44
Livro Texto: Montgomery/Runger
Captulo 10:
Exemplo 10.1
10.5, 10.7, 10.9, 10.21, 10.25, 10.33, 10.35,
10.43, 10.45, 10.61
Captulo 11:
Exemplo 11.1 (obter tabela 11.4)
11.5, 11.7, 11.9, 11.11, 11.17, 11.41, 11.47,
11.55
Penso, logo existo!

Похожие интересы