Академический Документы
Профессиональный Документы
Культура Документы
Thiago Magalhes
CORRELAO E REGRESSO LINEAR
Introduo Suponha que um inspetor de segurana queira determinar se existe uma relao entre o nmero de horas de treinamento para um funcionrio e o nmero de acidentes envolvendo este mesmo funcionrio. Ou suponha que uma psicloga queira saber se existe uma relao entre o nmero de horas que uma pessoa dorme a cada noite e o tempo de reao da pessoa. Como voc determinaria se a relao existe? Nesta etapa, voc estudar como descrever que tipo de relao, ou correlao, existe entre duas variveis quantitativas e como determinar se a correlao significante.
Definio Uma Correlao uma relao entre duas variveis. Os dados podem ser representados por pares ordenados (x,y), onde x a varivel independente (ou explanatria) e y a varivel dependente (ou resposta).
DIAGRAMA DE DISPERSO um grfico no qual cada ponto plotado representa um par observado de valores para as variveis estudadas (X ,Y), num sistema de eixos cartesianos. Atravs do diagrama de disperso podemos ter uma idia do tipo de relao entre as variveis estudadas. A varivel independente (explanatria) x medida pelo eixo horizontal, e a varivel dependente (resposta) y medida pelo eixo vertical. Um diagrama de disperso pode ser usado para determinar se existe uma correlao linear (linha reta) entre duas variveis. Os diagramas de disperso mostram diversos tipos de correlao. A seguir temos alguns exemplos de diagramas de disperso.
Estatstica e Probabilidade
Pgina 58
Consideremos uma amostra aleatria, formada por dez dos 60 alunos do 3 Perodo de Engenharia da Faculdade Pitgoras e pelas notas obtidas por eles em Clculo 2 e Estatstica: Notas No 01 02 03 04 05 06 07 08 09 10 Clculo 2 (X) 5,0 8,0 7,0 10,0 6,0 7,0 9,0 3,0 8,0 2,0 Estatstica (Y) 6,0 9,0 8,0 10,0 5,0 7,0 8,0 4,0 6,0 2,0
Estatstica e Probabilidade
Pgina 59
Construindo o diagrama de disperso Um gerente de marketing conduziu um estudo para determinar se h uma relao entre o dinheiro gasto com propaganda e as vendas da empresa. Os dados so mostrados na tabela. Coloque os dados em um diagrama de disperso e determine se parece haver uma correlao linear positiva ou negativa ou se parece no haver correlao linear.
Estatstica e Probabilidade
Pgina 60
Coeficiente de correlao Interpretar a correlao usando um diagrama de disperso pode ser subjetivo. Uma maneira mais precisa de se medir o tipo e a fora de uma correlao linear entre duas variveis calcular o coeficiente de correlao. Embora a frmula para o coeficiente de correlao amostral seja dada, mais conveniente usar uma ferramenta tecnolgica para calcular esse valor. O Coeficiente de Correlao uma medida da fora e direo de uma relao linear entre duas variveis. O smbolo r representa o coeficiente de correlao amostral. Uma frmula para r :
O nome formal de r "Coeficiente de Correlao de Pearson". Este nome em homenagem ao estatstico ingls Karl Pearson (1857-1936). Onde n o nmero de pares de valores . A partir dos valores de observados. Observe-se que
Estatstica e Probabilidade
Pgina 61
(X) 5 8 7 10 6 7 9 3 8 2 65
(Y) 6 9 8 10 5 7 8 4 6 2 65
XY 30 72 56 100 30 49 72 12 48 4 473
CORRELAO POSITIVA E CORRELAO NEGATIVA O valor de r est sempre entre Se as variveis x e y crescem no mesmo
sentido, isto , quando x cresce, y tambm cresce, diz-se que as duas variveis tm correlao positiva e o valor de r est prximo de 1. Ento, notas de Clculo 2 e notas de Estatstica dos alunos tem correlao positiva, porque quando uma das variveis cresce, a outra , em mdia, tambm cresce. Se as variveis x e y variam em sentido contrrio, isto , quando x cresce, em mdia y decresce, diz-se que as duas variveis tm correlao negativa e o valor de r est prximo de -1. Se r est prximo a 0, isso no significa que no h relao linear.
Estatstica e Probabilidade
Pgina 62
50 45 40 35 30 25 20 15 10 5 0 0 20 40 60
Estatstica e Probabilidade
Pgina 63
REGRESSO LINEAR O processo de regresso linear consiste em determinar a equao da reta que melhor se ajusta ao conjunto de pontos de uma distribuio. No processo de regresso linear aconselhvel expressar y em funo de x obtendo uma equao do tipo y = ax + b. Neste caso, x a varivel independente e y a varivel dependente, isto , y estimado em funo de x. A equao obtida denominada equao de regresso de y sobre x. Usa-se essa equao quando se deseja obter valores de y que correspondem a valores de x no constantes da tabela. A equao de uma reta de regresso para uma varivel independente x e
mx b , onde y o valor y previsto para um uma varivel dependente y y
onde
a mdia dos
Estatstica e Probabilidade
Pgina 64
Aplicaes das linhas de regresso Aps encontrar a equao de uma linha de regresso, voc pode usar a equao para prever valores y sobre a amplitude de dados se a correo entre x e y significante. Por exemplo, um executivo de publicidade poderia projetar as vendas da empresa com base nos gastos de propaganda. Para prever valores y, substitua o valor x dado na equao de regresso e ento calcule , o valor y previsto.
Estatstica e Probabilidade
Pgina 65
Use essa equao para prever as vendas esperadas da empresa para os seguintes gastos com propaganda.
Soluo Para prever as vendas esperadas pela empresa, substitua cada gasto com propaganda por x na equao de regresso. Depois, calcule .
Interpretao Quando os gastos com propaganda somam $ 1.500, as vendas da empresa so cerca de $180.155.
Quando os gastos com propaganda somam $ 1.800, as vendas da empresa so cerca de $195.373.
Estatstica e Probabilidade
Pgina 66
Estatstica e Probabilidade
Pgina 67
a) Construa o diagrama de disperso e interprete-o. b) Calcule o coeficiente de correlao linear entre X e Y. c) Determine a equao da reta de regresso para a relao entre as variveis Y: massa muscular (dependente) e X: idade (independente).
Estatstica e Probabilidade
Pgina 68
Ms Faturamento
JAN 2,1
MAI 3,1
JUN 3,5
a) Determinar o coeficiente de correlao de Pearson. b) Estimar o faturamento para julho, pela equao da reta de regresso
3 - Observou-se que o volume mensal de lixo gerado em uma cidade, em funo do nmero de dormitrios das residncias, o seguinte (em m 3): No Dormitrios
3 0,45
4 0,57
a) Calcular e interpretar o coeficiente de correlao. b) Representar o grfico de disperso dessa relao. c) Determinar a equao da reta de regresso. d) Estimar o volume de lixo para uma residncia com 5 dormitrios.
Estatstica e Probabilidade
Pgina 69
20
40
10
100
70
1.000
1950 1600
a) Determinar o coeficiente angular e linear da reta de regresso. b) Determinar a equao da reta de regresso. c) Calcular o coeficiente de correlao de Pearson. Interpretar esse valor. d) Estimar o volume de vendas para um gasto de R$ 150.000,00 em propaganda. e) Caso no se faa nenhum investimento em propaganda, qual o volume de vendas esperado? f) Se a expectativa de vendas for de R$ 1.500.000,00, quando se deve investir em propaganda para esse produto?
6 - Suponha que uma cadeia de supermercados tenha financiado um estudo sobres gastos com mercadorias para famlias de classe mdia. O estudo se limitou a famlias com renda lquida entre 8 e 20 salrios mnimos. Obteve-se a seguinte equao: , onde:
Estatstica e Probabilidade
Pgina 70
8 - Os dados abaixo forma colhidos de cinco fbricas diferentes de uma determinada indstria:
a) Calcule o coeficiente de correlao. b) Ajuste uma funo linear da forma indstria. para o custo total dessa
Estatstica e Probabilidade
Pgina 71
Gabarito
1. a) Massa Muscular
Idade No grfico de disperso entre a varivel massa muscular e idade, pode-se observar que h um forte indcio de relao linear decrescente entre as variveis em estudo. Nota-se que a massa muscular das pessoas diminui medida que a idade aumenta.
b)
uma forte correlao linear entre a varivel massa muscular e idade. Nota-se que medida que a idade da pessoa aumenta a massa muscular diminui, o que coerente com o grfico de disperso apresentada anteriormente.
c)
d)
2. a) 0,9717
b) 3,76
3. a) 0,9986
Estatstica e Probabilidade
Pgina 72
Volume do Lixo
b)
N de Dormitrios c)
d) 0,72
4. a) b)
Estatstica e Probabilidade
Custo Total
Pgina 73
8. a) b)
Estatstica e Probabilidade
Pgina 74