Вы находитесь на странице: 1из 44

6- Regresso

Anlise de Regresso

Correlao
Procedimentos Gerais Y=f(X)
Regresso linear
Ajuste da Regresso
Regresso linear Mltipla
Best Subsets

nA

anlise de regresso uma tcnica estatstica usada para


modelar e investigar a relao entre duas ou mais variveis. O
modelo freqentemente usado para previses.
n Regresso um teste de hiptese
Ha: O modelo permite significativamente prever a resposta.
Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161

6- Regresso

Coeficiente de
Correlao

Agente

48

Diagrama de
Disperso

70

Clientes

Ex.: Suponha que o nosso desejo


seja o de quantificar a
associabilidade entre duas
variveis relacionadas a cinco
agentes de uma seguradora.
Assim, temos:
X Anos de experincia do agente.
Y Nmero de clientes do agente.

60

50

56

64

60

72

Anos de
Experincia

(x, y) um par aleatrio


Dados emparelhados

Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161

6- Regresso

r=Correlao de Pearson

y y
= zy
sy

yy

y
x

Srie de dados
originais (x e y)
so valores
quantitativos.

xx

O conjunto de pontos
deslocado, tendo
agora como centro, os
valores mdios.

1 n
r = Corr ( X , Y ) = z xi z yi
n i =1

xx
= zx
sx

A escala de x e y
agora padronizada.
Isso torna os valores
independente da sua
unidade.

Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161

6- Regresso

Coeficiente de Correlao

xx yy

Agente

zx

zy

zx . zy

A
B

2
4

48
56

-3
-1

-12
-4

-1.5
-0.5

-1.5
-0.5

2,25
0,25

64

0.5

60

0.5

72

12

1.5

1.5

2,25

Total

25

300

4,75

x = 5 y = 60
4,75
S x = 2 S y = 8 r = Correlao ( X , Y ) = 5 = 0,95 = 95%
Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161

6- Regresso

P_value p/ Correlao

1 n
1 n xi x yi
r = Corr ( X , Y ) = z xi z yi =

n i =1
n i =1 s x s y

1 ( xi x )( y i y) Covarincia ( X , Y )
r=
=
n
sx s y
sx s y

1 r 1

A correlao apresentada aqui linear. Existem outros tipos de correlao!


Agente

48

56

64

60

72

Ex.: Clculo da correlao da tabela ao lado


Pearson correlation of Anos Exp and Clientes = 0,950
P-Value = 0,013

Forte Correlao pois P-Value <0,05

Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161

6- Regresso

Correlao no Minitab

Faa a anlise de Correlao das


variveis ao lado na planilha
Bidimensional.mtw
O Coeficiente de
Correlao
tambm chamado
de Coeficiente de
Pearson.

Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161

6- Regresso

Correlao no Statgame / Hattie

Recursos Adicionais:
<Estatis> <Correlat>
Desenvolvido por John Hattie
(Alguns recursos grficos mas roda
no modo DOS)

<Statgame>
<Statistical Inference>
<Correlation>
(Interessante para verificar o
conhecimento bsico)

Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161

6- Regresso

Algumas questes sobre Correlao:

A)

Uma medida de Correla o fornece dois tipos de informa es a respeito


d o r e l a c i o n a m e n t o d e d u a s v a r i v e i s . Q u a i s s o e l a s ?

B)

Qual coeficiente de correla o abaixo indica o mais forte relacionamento?


a) 0.70

b ) 0 . 0 3 c)-0 . 7 7 d ) 0 . 1 0

C)

Se a correla o Rxy=0.45, ent o Ryx =

D)

Qual o valor do coeficiente de correla o melhor descreve os seguintes


v a l o r e s d a s v a r i v e i s X e Y , r e l a c i o n a d a s a b a i x o :
X: 20 30 40 50 60
Y: 40 30 20 10 0
a)

-1.0

b)

0.0

c)

0.5

d)

E) Qual a correlao do
grfico abaixo?

1.0
Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161

6- Regresso

F)

Algumas questes sobre Correlao:

Se um coeficiente de correla o for de +1.4, o que ocorre?


a)

O Relacionamento extremamente forte

b)

O Relacionamento positivo

c)

Aa respostas acima est o corretas

d)

Um erro

computacional foi cometido

G) Um coeficiente de Person de -0.5 entre os valores de Leitura (X) e o


n mero de dias ausentes da escola (Y) indica que:
a) Metade dos valores de Leitura s o menos do que o n mero de dias
ausentes da escola
b) Maiores valores de Leitura s o associados com menor aus ncia da
escola
c)A soma do produto XY igual a -0.5
d) Quase n o existe relacionamento entre X e Y
Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161

6- Regresso

Dia
1
2
3
4

Varivel Comum

Fator 1
gua
gua
gua
gua

Fator 2
Whisky
Vodka
Rum
Bourbon

Resultado
Ficou Bbado
Ficou Bbado
Ficou Bbado
Ficou Bbado

Concluso: a gua embebeda


comum associar-se um defeito com uma varivel
que est sempre presente quando ele ocorre ( o caso
do operador que culpado, pois quando ele executa a
operao ocorre um defeito Toda operao
geralmente tem um operador).
1995 Six Sigma Academy Inc.

Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161

10

6- Regresso

As armadilhas: correlaes casuais

Se a histria servisse de base, os Republicanos deveriam estar vestindo a camisa


dos Yankees e dando uma fora para o New York vencer o campeonato. Desde a
Segunda Guerra Mundial, toda vez que os Yanks venceram em um ano de eleio,
o Partido Republicano assumiu a Casa Branca.
Vari v e l C o m u m

Yankees

Republicanos

GANHARAM PERDERAM

GANHARAM PERDERAM

1976
1964
1960
1956
1952

Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161

11

6- Regresso

As armadilhas: causa reversa

Um fator X tem influncia sobre um Y quando, na verdade, o que ele est vendo
a conseqncia do Y .
Um exemplo deste caso o do Departamento de Vendas que insatisfeito com as
Vendas resolve dar uma srie de descontos e faz promoes para atrair os clientes .
S que a verdadeira causa do problema o Servio de Atendimento ao Cliente .
Com os novos descontos e a nova promoo fica mais difcil
ainda administrar o Servio de Atendimento ao Cliente,
ocasionando num aumento da insatisfao do cliente e
diminuindo mais ainda as vendas (o tiro saiu pela culatra) .

Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161

12

6- Regresso

As armadilhas: fatores omitidos

Pesquisas continuamente demonstram que a medida que o tamanho dos hospitais


aumenta, a taxa de mortalidade dos pacientes aumenta dramaticamente. Portanto,
deveramos evitar hospitais grandes?
Esta anlise enganadora, pois omite um segundo X2 (fator) importante -- a
gravidade da condio do paciente quando admitido ao hospital. Os casos mais
srios tendem a ser levados aos hospitais maiores!

Fumar cigarros causa cncer? E se eu dissesse que ...


(1) Mdicos franceses no encontram esta correlao;
(2) O tabaco dos EUA geralmente exposto a pesticidas, fertilizantes e
preservativos contendo substncias conhecidamente cancergenas, e;
(3) O tabaco francs raramente entra em contato com tais substncias qumicas .
Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161

13

6- Regresso

O Fazendeiro Radiofbico

Em
Em1950,
1950,um
umfazendeiro
fazendeiroafirmou
afirmouque
quesuas
suasrvores
rvoresfrutferas
frutferasestavam
estavamsendo
sendoprejudicadas
prejudicadas
pelas
ondas
de
rdio
de
uma
estao
local
prxima.
Ele
colocou
uma
tela
de
pelas ondas de rdio de uma estao local prxima. Ele colocou uma tela dearame
arameao
ao
redor
redorde
dealgumas
algumasdas
dasrvores
rvorespara
paraproteg-las
proteg-lasdestas
destasondas
ondasde
derdio
rdioe,e,realmente,
realmente,as
as
rvores
rvoresprotegidas
protegidasse
serecuperaram
recuperaramrapidamente,
rapidamente,enquanto
enquantoque
queas
asdesprotegidas
desprotegidasainda
ainda
sofriam.
sofriam.
Na
Namesma
mesmapoca,
poca,muitas
muitasrvores
rvoresctricas
ctricasem
emtodo
todopas
pasforam
foramameaadas
ameaadaspor
poruma
umadoena
doena
chamada
de
folha
pequena.
Alguns
fazendeiros
Texanos
descobriram
que
uma
soluo
chamada de folha pequena. Alguns fazendeiros Texanos descobriram que uma soluo
de
desulfato
sulfatode
deferro
ferrocurava
curavaaadoena.
doena.No
Noentanto,
entanto,nem
nemsempre
semprefuncionava
funcionavano
noTexas,
Texas,ee
praticamente
praticamentenunca
nuncafuncionava
funcionavana
naFlrida
Flridaou
ouna
naCalifrnia.
Califrnia.
OOmistrio
mistriofoi
foidesvendado
desvendadoquando
quandoooproblema
problemaverdadeiro
verdadeirofoi
foirevelado
revelado----deficincia
deficinciade
dezinco
zinco
no
solo.
A
cerca
do
fazendeiro
Radiofbico
era
de
tela
galvanizada,
sendo
que
traos
do
no solo. A cerca do fazendeiro Radiofbico era de tela galvanizada, sendo que traos do
zinco
zincoda
dagalvanizao
galvanizaoeram
eramlevados
levadosda
datela
telapara
paraoosolo.
solo.
OOsulfato
sulfatode
deferro
ferronada
nadatinham
tinhamaaver
vercom
comaacura,
cura,mas
massim
simos
osbaldes
baldesde
deferro
ferrogalvanizados
galvanizados
usados
para
espalhar
a
substncia!
Em
outras
regies,
onde
outros
tipos
de
baldes
usados para espalhar a substncia! Em outras regies, onde outros tipos de baldeseram
eram
usados,
as
rvores
continuaram
doentes.
usados, as rvores continuaram doentes.

Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161

14

6- Regresso

As armadilhas: multicolinearidade

difcil saber o qu causa o qu, quando alguns fatores [Xs] tendem a


ocorrer juntos regularmente.
Tenho visto uma reduo dramtica nas perdas desde que comecei a
implementar as ferramentas estatsticas na fbrica! No entanto, foi
exatamente na mesma poca em que o RH introduziu seu novo sistema
de recompensa e reconhecimento. O que ocasionou a melhoria?
Em 1967, um artigo rotulou um determinado tipo de carro como sendo
inseguro. O modelo em questo era um carro pequeno esportivo de alto
desempenho. Mas que tipo de motorista seria atrado a tal carro? E se eu
dissesse que a maioria dos proprietrios deste carro tendiam a ser
motoristas jovens menores de 25 anos com novas idias. Esta faixa etria
no paga prmios de seguro mais elevados devido a maior incidncia de
acidentes?
Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161

15

6- Regresso

Y=f(x)
y

Linha de Regresso

A varivel X dita varivel


independente
(ou
exgenas),
enquanto Y dita varivel
dependente (ou endgenas).

Y=f(x) Simples
Y=f(x,y,z...) Mltipla
Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161

16

6- Regresso

Regresso
Linear Simples (Um X)

Mltipla (Dois o u mais Xs)

Curvilnea (Um X)

Y
Y

X
X

Curvilnear (Dois o u mais Xs)

Variveis I n d i c a t i v a s
(para Xs Discretos)

Logstica (Ys Discretos)


1

Y
x

x
x
x

x
x x

x
x

Xb

x
x

Xc

% yes

Xa

2
0

Xi

Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161

17

6- Regresso

Resduos

y = + x

y = a + bx,

Curva de
Resduos (e)

x1

x2

x3

Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161

Uma
importante
condio para
o uso de
regresso
simples que
os resduos (e)
sejam
independentes
de x. Porque?
18

6- Regresso

Regresso Linear
Simples

2
n
i=1 i

yi

y = a + bx

y$i

min d = min
n
i=1

2
i

n
i=1

( yi y i )2 = minin=1( yi a bxi )2
xi

Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161

19

6- Regresso

A matemtica da Regresso Linear

d
n
i=1

2
i

y = a + bx
2
2
n

min d = min ( yi yi ) = min i=1( yi a bxi )


n
2
i=1 i

n
i =1

n
2
2
d = 0 e i =1 d i = 0.

i =1 i
a
b
2i =1 ( yi a bxi ) = 0,
n

2i =1 xi ( yi a bxi ) = 0,
n

Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161

20

6- Regresso

Ufa!

n yi = na + bn xi ,
i =1
i =1
n
n
n
2
i =1 xi yi = a i =1 xi + bi =1 x i
n

(
x

x
)
y
S xy

i
i
i =1
b =
=
,
n
2

S
(
x

x
)
xx

i
i =1

a = y bx ,
Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161

21

6- Regresso

Exemplo

Ex.: Obter a equao da reta (chamada de reta dos mnimos


quadrados) para os seguintes pontos experimentais:
x
y

1
0,5

2
0,6

3
0,9

4
0,8

5
1,2

6
1,5

7
1,7

8
2,0

Traar a reta no diagrama de disperso. Calcular o coeficiente de


correlao linear.
Qual o valor previsto para x=9?
Qual a Tolerncia de X para 1<Y<1.5?
Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161

22

6- Regresso

Regresso: By Hand

36 9, 2
S xy = 50,5
= 50,5 41,4 = 9,1,
8
(36) 2
S xx = 204
= 204 162 = 42.
8
Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161

23

6- Regresso

Regresso: Clculos

36 9, 2
S xy = 50,5
= 50,5 41,4 = 9,1,
8
(36) 2
S xx = 204
= 204 162 = 42.
8

S xy

9,1
b=
=
0,217,
S xx 42
9,2
36
a = y bx
0,217
= 1,150 0,976 = 0,174.
8
8
y = 0,174 + 0,217 x
Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161

24

6- Regresso

y
2

Regresso: Grfico

y = 0,174 + 0,217 x

Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161

x
25

6- Regresso

Regresso: Correlao

(9,2) 2
S yy = 12,64
= 12,64 10,58 = 2,06,
8
S xy
9,1
r=
=
0,98
S xx S yy
42 2,06
Relembre Correlao!

Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161

26

6- Regresso

Regress o linear simples no Minitab

Ho: modelo no bom

Regresso. MTW

Portanto rejeita-se Ho

Previso
Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161

27

6- Regresso

Linear

Ajuste da Regress o

n R-quadrado

a
porcentagem da variao
explicada pelo seu modelo.
n R-quadrado

(ajustado) a
porcentagem da variao
explicada pelo seu modelo,
ajustada para o nmero de
termos em seu modelo e o
nmero de pontos de dados.
nO

valor-p para a
regresso para ver se o
modelo de regresso inteiro
significativo.
Ha: O modelo permite
significativamente
prever a resposta.

Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161

28

6- Regresso

Ajuste Quadrtico

Quadrtico

Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161

29

6- Regresso

Ajuste Cbico

Cbico

Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161

30

6- Regresso

Intervalos de confiana e de previso

Ajuste da Regress o
n Uma

faixa (ou intervalo) de


confiana uma medida da
certeza da forma da linha de
regresso ajustada. Em geral,
uma faixa de 95% implica em
uma chance de 95% de que
as linha verdadeira fique
dentro da faixa. [Linhas
vermelhas]
n Uma

faixa (ou intervalo) de


previso uma medida da
certeza da disperso dos
pontos individuais em torno da
linha de regresso. Em geral,
95% dos pontos individuais
(da populao em que a linha
de regresso se baseia)
estaro contidos dentro da
faixa. [Linhas azuis]
Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161

31

6- Regresso

Estreitando Toler ncias

CTQ

Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161

32

6- Regresso

Estreitando Toler ncias

CTQ

Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161

33

6- Regresso

Pratique Regress o Linear Simples

Determine a funo de transferncia entre o Nmero de Setups


e o Tempo de Ciclo para diversas operaes em uma certa
empresa. Use a planilha cycletime.mtw.
Faa a anlise de Resduos.
Qual a previso do Tempo de Ciclo para uma operao que
consiste em 10 Setups de equipamento?
A equao final adequada? Se no for, como melhor-la?

Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161

34

6- Regresso

Regresso
Mltipla

Uma reao Qumica foi realizada


sob seis pares de diferentes
condies de presso e
temperatura. Em cada caso foi
medido o tempo necessrio para
que a reao se completasse. Obter
a equao de regresso do tempo
em relao a presso e
temperatura.

Regresso.mtw

Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161

35

6- Regresso

Regress o Mltipla: Resultados

Menores
que 0,05
Maior melhor

Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161

36

6- Regresso

92 estudantes americanos
participam de um simples
experimento. Cada estudante
registra o seu peso, altura,
gnero, pulso e se fumante
ou no. Todos eles jogam uma
moeda e sorteiam se vo dar
uma corrida (cara) ou no por
um minuto. Aps a corrida,
todos os alunos registram o
seu pulso novamente. Um
aluno sugere que seja inserida
a seguinte importante
considerao: Se a pessoa
pinta o cabelo ou no.

Best Subsets

Regresso.mtw

Deseja-se fazer uma regresso


do segundo pulso em relao a
todas as outras variveis.
Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161

37

6- Regresso

Best Subsets: Resultados


Equao de regresso
inicial. Muito complexa

Correlao muito alta.


Quem pinta cabelo
geralmente mulher

Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161

38

6- Regresso

Best Subsets: Resultados

Melhor
ajuste

Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161

39

6- Regresso

Anlise de Resduos
Ruim

Bom

Residuals vs
Each X

Residual
3

Residual
3

-1

-1

-2

-2

-3

-3
3

9 10

11

12

10

20

Time Plot of
Residuals

Residual
3

Residual
3

-1

-1

-2

-2

-3

-3
0

50

100

Time Order

Residuals vs
Predicted Y
(Fits)

50

100

Time Order

Residual
3

Residual
3

-1

-1

-2

-2

-3

-3
30

40

50

50

Pred. Y

Normal
Probability Plot
of Residuals

30

100

Pred. Y

Nscore
3

Nscore
3

-1

-1

-2

-2

-3

-3

-3

-2

-1

Pedro Paulo
Balestrassi
Residual

Considere a
possibilidade da
existncia de
variveis ocultas que
no foram
consideradas no
modelo (Lurking)

Entenda que X e Y no
precisam ser normalmente
distribudos. Os resduos,
www.iem.efei.br/pedro
Residual35-3629-1161 contudo, deveriam ser.
40
2

Nos casos ruins tente


uma transformao
em X,em Y ou
ambos. Use Box-Cox
Transformation

-1

6- Regresso

Regresso Curvilnea
Um laboratrio est fazendo testesSeal Strength
(g/cm2)
em adesivos em funo da
2100
temperatura. Quando a
2050
temperatura aumenta a fora do
2000
contato entre duas superfcies
aumenta Em um determinado
1950
ponto, contudo a fora desse
1900
contato comea a diminuir em
funo de propriedades trmicas
200
250
300
do adesivo. Qual o modelo
Temperature
emprico da fora (Seal Strength)
em funo da temperatura?
Curve.mtw
Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161

350

400

41

6- Regresso

Termo quadrtico da regresso

Deve-se criar a varivel


quadrtica e em seguida rodar
o modelo em Regression

Termo quadrtico

Funo
quadrtica
Observe resduos

VIF

Armazena
resduos
Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161

42

6- Regresso

Regresso Curvilnea

The regression equation is


SealStrength = 923 + 7.45 Temperature - 0.0125 TempSqrd

X
X2

Predictor
Constant
Temperat
TempSqrd

Coef
922.98
7.4469
-0.0124596

S = 25.18

StDev
72.33
0.5033
0.0008499

R-Sq = 69.4%

T
12.76
14.80
-14.66

P
0.000
0.000
0.000

X e X 2 so
fortemente
correlacionados.
Nenhuma
surpresa

VIF
132.9
132.9

R-Sq(adj) = 68.7%

Analysis of Variance
Source
Regression
Residual Error
Total
Source
Temperat
TempSqrd

DF
1
1

DF
2
97
99

SS
139321
61498
200819

Concluso: Existe uma curvatura


significativa

MS
69661
634

F
109.87

P
0.000

Seq SS
3051
136270

Unusual Observations
Obs
Temperat
SealStre
Fit
StDev Fit
32
250
2060.00
2005.99
3.38
42
260
2070.00
2016.91
3.44
78
210
1880.00
1937.37
5.58
89
260
1960.00
2016.91
3.44
Pedro Paulo
Balestrassi www.iem.efei.br/pedro
35-3629-1161

Residual
54.01
53.09
-57.37
-56.91

St Resid
2.16R
2.13R
-2.34R
-2.28R
43

6- Regresso

Penso, logo existo!

Livro Texto: Montgomery/Runger


Captulo 10:
Exemplo 10.1
10.5, 10.7, 10.9, 10.21, 10.25, 10.33, 10.35,
10.43, 10.45, 10.61

Captulo 11:
Exemplo 11.1 (obter tabela 11.4)
11.5, 11.7, 11.9, 11.11, 11.17, 11.41, 11.47,
11.55
Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161

44

Вам также может понравиться