Estatstica Bsica Regresso Linear Simples e Correlao Linear Correlao Linear Simples Determina o grau de relacionamento ou ligao entre variveis - (X i , Y i );
Seu valor um coeficiente flutuante, entre 0 e 1 ou 0 e -1 ou -1 at 1;
-1 < < 1, no entanto =0 significa que no existe relao entre os dados na forma linear;
> |0.60| considerado j uma boa correlao. Tabela de Correlao || <20 Muito Fraca Correlao 20<||<50 Fraca Correlao 50<||<70 Mdia Forte Correlao 80<||<90 Forte Correlao ||=1 Correlao Perfeita =0 No Existe Correlao Linear Se > 0 dados apresentam-se (x,y) com Reta Crescente; Se < 0 dados apresentam-se (x,y) com Reta Decrescente; Forma matemtica do 1 1 < I < ( ) ( ) ( ) ( ) ( ) ( (
| . |
\ |
( (
| . |
\ |
=
= = = = = = = 2 n 1 i i n 1 i 2 i 2 n 1 i i n 1 i 2 i n 1 i i n 1 i i n 1 i i i y y n . x x n y x y x n
Exemplo: Considere 6 pares de valores dados na tabela
a seguir. Pode-se imaginar que cada par de valores so as notas tiradas por um aluno em duas disciplinas:
Determine o nvel de correlao entre as variveis. N Matemtica (x i ) Portugus (y i ) (x i y i ) (x i ) (y i ) 1 4 6 24 16 36 2 5 7 35 25 49 3 6 6 36 36 36 4 6 8 48 36 64 5 8 7 56 64 49 6 9 8 72 81 64 Total Exemplo: As observaes ao lado apresentam a relao cliente (por semana) e valor vendido (na escala de mil R$). Determine o coeficiente de correlao entre os dados. Numa pesquisa objetivou-se estabelecer a relao entre o nvel de escolaridade dos pas e filhos de uma determinada escola. Qual o valor da correlao? Criana Anos de Escola X i Y i X i Y i
Pais (x i ) Filho (y i ) A 12 12 144 144 144 B 10 8 80 100 64 C 6 6 36 36 36 D 16 11 176 256 121 E 8 10 80 64 100 F 9 8 72 81 64 G 12 11 132 144 121 Total Exemplo: Abaixo temos relao entre nmero de clientes (X i ) e volume de informaes (Y i ) de uma LanHouse em 1 dia de funcionamento. Verifique a correlao das variveis. Observ Clientes MBytes Observ Clientes MBytes 1 18 680 10 13 513 2 16 624 11 12 436 3 17 661 12 14 570 4 20 762 13 21 834 5 10 405 14 21 799 6 17 650 15 19 579 7 15 597 16 10 603 8 19 701 17 17 671 9 20 796 18 14 614 Regresso Linear? uma ferramenta estatstica que utiliza dados coletados em campo de uma varivel e estes vo dar suporta para as projees futuras de novos dados;
A composio de uma regresso dada por uma varivel resposta (y i ) (varivel dependente) e varivel independente (x i );
Aps realizados os clculos estabelecida uma funo linear f(x) em que far as projees. Ponto de Vista Matemtico Y=f(x 1 , x 2 , ..., x i , x i+1 , ..., x i+m )
Considere: i seja o dado coletado em campo; m seja o dado projetado pela funo. Erro da Agregado - i
Quando fazemos projees existe uma possibilidade de erramos e por isso toda funo ou projeo ser na forma matemtica: Y i = f(X i ) + i
As caractersticas do erro: Humano; Coleta; Instrumentos de medida; Condies climticas; Condies ambientais (local). Principais Caracterstica FRLS Experincia do pesquisador;
Comportamento dos dados:
Tabelas: Diretamente proporcional (x i ,y i ); Inversamente Proporcional (x i ,y i ).
Grficos: Crescentes; Decrescentes. Modelo de Regresso Populacional Dados n pares de valores de duas variveis, Xi, Yi (i = 1, 2, . . . , n), se admitirmos que Y funo linear de X, podemos estabelecer uma regresso linear simples, cujo modelo estatstico : Y = 0 + 1 X + , Y = b 0 + b 1 X + (amostral), onde 0 e 1 so chamados de parmetros.
0 Coef. Linear da Reta;
1 Coef. Angular da Reta ou Coef. da Regresso;
Propriedades 1. A relao entre X e Y linear ou reta;
2. X uma varivel aleatria;
3. A esperana do erro nula;
4. O erro de uma observao no interfere na outra;
5. A funo da regresso tem distribuio normal; Dados coletados Coloc-lo em tabela;
Encontrar as estimativas (b 0 e b 1 );
Montar a funo f(x);
Fazer as projees; Estimar 1
Estimar 0
Graficamente Exemplo: Determine os estimadores da funo da regresso para estimarmos o valor das vendas quando a loja receber 1000 clientes por semana. Exemplo: A tabela abaixo mostra a relao entre peso e altura de 20 pessoas. Sendo X a altura e peso Y. Determine o coeficiente de correlao, estimadores da funo de regresso e, ao final, determine o peso de uma pessoa com 1,50m e 1,90. Anlise da Varincia - Anova uma tcnica utilizada para estudar mais profundamente as variaes que ocorrem dentro da regresso e de outras pesquisas com amostragem;
Ela consistem em explicar as variaes dentro da amostra e entre as amostras, ou seja, variaes da amostra causadas pela prpria amostra e variao da amostra causada pelas condies externas;
Resumidamente a ANOVA apresenta um RAIO-X da situao da sua regresso atravs de suas principais caractersticas. Composio da ANOVA Toda ANOVA composta por trs partes: 1. Total; 1.1 Grau de liberdade. 2. Regresso; 2.1 Grau de liberdade. 2.2 Valor da Regresso prximo do total indica boa adequabilidade dos dados. 3. Resduos (erros aleatrios); 3.1 Grau de liberdade; 3.2 a relao entre o valor observado e valor estimado, espera- se que seja o mais prximo possvel de zero. 4. Quadrado Mdio: a diviso de qualquer valor acima pelo seu respectivo grau de liberdade.
Quadro da ANOVA Fonte de Variao Soma de Quadrados G.L. Quadrado Mdio Regresso SQT regresso 1 QM regresso
Resduo SQT resduo n-2 QM resduo
Total SQT total n-1 Frmulas Fonte de Variao Soma de Quadrados G.L. Quadrado Mdio Regresso b 1 .S xy 1 b 1 .S xy
Resduo S yy b 1 .S xy n-2 (S yy b 1 .S xy )/(n-2) Total S yy n-1 Coeficiente de Explicao R a razo entre dois valores obtidos atravs da ANOVA que indica o comportamento (relao( entre os dados de 0 at 100%
R=SQ reg / SQ total
Exemplo: As importaes de uma determinada matria prima (em toneladas), no perodo 1999/2009 encontram-se na tabela a seguir: Ano (X) 1999 2001 2003 2005 2007 2009 Importaes (Y) 120 117 105 100 84 80 Veja o comportamento dos dados de acordo com ANOVA e coeficiente de explicao dos dados. Exemplo: Uma empresa fez o levantamento do total de vendas de um produto em funo das despesas com propaganda, expressos em R$ 1.000,00, obtendo os dados da tabela ao lado. Supondo uma relao linear entre as variveis, estabelea a ANOVA e o coeficiente de explicao.
Exemplo: A tabela abaixo mostra a relao entre peso e altura de 20 pessoas. Sendo X a altura e peso Y. Faa o quadro da ANOVA para estes dados: Teste de Hiptese da Regresso Intervalo de Confiana dos Estimadores necessrio para saber como os dados esto se comportando em relao aos seus limites de confiana; Intervalo de Confiana para b ou b 1
Intervalo de Confiana para a ou b 0
Intervalo de Confiana para y i-cal
Exemplo: As importaes de uma determinada matria prima (em toneladas), no perodo 1999/2009 encontram-se na tabela a seguir: Ano (X) 1999 2001 2003 2005 2007 2009 Importaes (Y) 120 117 105 100 84 80 Encontre os intervalos de confiana para os estimadores. Exemplo: A tabela abaixo mostra a relao entre peso e altura de 20 pessoas. Encontre os intervalos de confiana dos estimadores: Software R Statistical Software de aplicao gratuita na rea de estatistica;
Pacotes so as ferramentas distribudas gratuitamente pelos seus desenvolvedores;
O R um script e no um compilador de aes;
No necessrio memorizar os cdigos, mas sim saber as ferramentas de aplicao nas suas apostilas. Exemplo: Um engenheiro civil coleta dados em um laboratrio estudando a dilatao de um pilar de concreto segundo a temperatura ambiente no local onde est o pilar. Veja os dados (fictcios): T(C) - x 18 16 25 22 20 21 23 19 17 Dilatao Linear (mm) - Y 5 3 10 8 6 7 9 6 5 Regresso Linear (Intrnsica) Aplica-se em dados nos quais a forma da plotagem (grfico) lembra uma funo logartica ou exponencial ou hiprbole. Os dados so transformados para exponencial ou logartimica... Funo Potncia x X b b a b w Y x b a w x a w b log ; ; log ; log log . log log . 1 0 = = = = + = = Funo Hiprbole x X b b a b w Y x b a w x a w b log ; ; log ; log log . log log . 1 0 = = = = = =
Funo Exponencial x X b b a b w Y x b a w b a w x = = = = + = = ); log( ; log ; log ). log( log log . 1 0 Exemplo: A tabela mostra a rea (W) e a renda bruta (R$), de 10 propriedades empenhadas na lavoura de cana. Vamos estudar um modelo para essa regresso (linear simples ou as intrnsecas): W R$ 7,3 1,291 9,7 1,484 12,7 1,429 15,1 1,628 21,2 1,406 26,6 3,163 29 1,937 38,7 7,461 39,3 8,322 45,4 9,783 Regresso Linear: Mltipla Toda regresso em que K variveis influenciam diretamente no resultado de Y estimado ; f(x 1 ,x 2 ,...,x k )=b 0 +b 1 x 1 +b 2 x 2 +...+b k x k
Cada coeficiente calculado por frmula estabelecida;
Anlise da Regresso Mltipla - ANOVA Fonte Variao Soma de Quadrado Grau Liberd Quadrado Mdio F Explicada b 1 S Y1 + b 2 S Y2 p 1 b 1 S Y1 + b 2 S Y2 /2 Resduo S YY -b 1 S Y1 + b 2 S Y2 n p S YY -b 1 S Y1 + b 2 S Y2
/n-p Total S YY n 1 R=b 1 S Y1 + b 2 S Y2 / S yy
Anlise do Melhoramento At que ponto X 1 , X 2 , ..., X k Realmente contribui ou contribuem para melhor explicar o modelo; Vejamos as funes: f( x 1 ) = b 0 + b 1 x 1 ; f( x 1 , x 2 ) = b 0 + b 1 x 1 + b 2 x 2 ; f( x 1 , x 2 , ..., x k ) = b 0 + b 1 x 1 + b 2 x 2 + ... + b k x k ; Existe um limite para inserir variveis na determinao de Y, seja precisa ou no; Exemplo: Comparem as trs funes e escolha que melhor projeta o nmero de veculos na cidade de A para 2013. 1. f(x 1 ) = 20 + 2x 1 ; 2. f(x 1 ,x 2 ) = 20 + 2x 1 + 3x 2 ; 3. f(x 1 ,x 2 ,x 3 ) = 20 + 2x 1 + 3x 2 + 4x 3 ; Os dados dos ltimos 4 anos so: Ano Pop (x1)*10 3 N Resid(x2) N Fin(x3) *10 3 N Vec (Y) *10 3
2008 272 135 361 1001 2009 278 163 483 1065 2010 281 175 390 1130 2011 283 183 120 1149 Melhoramento Estatisticamente Exemplo: Num certo fenmeno foram observadas os seguintes resultados: a) Calcule a ANOVA: X1 e X2; b) Calcule a ANOVA X1; c) Calcule a ANOVA X2; d) Aplique teste F. e) Qual varivel explica melhor o modelo?
X1 X2 Y 8 57 64 10 59 71 6 49 53 11 62 67 8 51 55 Exemplo: Verifique se existe relao entre o nmero de veculos de passeio registrados na cidade de Ferraz-PI (Y i ), o nmero de multas aplicadas no Estado de Pi (X 1 ) e o ICMS arrecado pela Receita Estadual (X 2 ). Caso exista ou no exista determine o grau de contribuio entre as variveis. Ano 2012 Infraes ICMS Frota Jan 69.662 970,52 27335 Fev 63.855 797,34 27543 Mar 70.328 824,67 27749 Abr 62.041 855,31 28015 Mai 61.953 813,17 28245 Jun 57.215 871,31 28552 Jul 65.999 848,42 28847 Ago 80.194 846,14 29264 FIM