Вы находитесь на странице: 1из 29

Aderncia Distribuio Normal ou de Gauss

PQNQC: Por que importante que as variveis possam ser descritas por uma distribuio normal?

Aderncia Distribuio Normal ou de Gauss

Motivo simples: Se as variveis respeitam uma distribuio normal, pode-se aplicar a grande maioria dos testes e mtodos estatsticos conhecidos. tem-se maior facilidade!

Aderncia Distribuio Normal ou de Gauss

O que uma distribuio normal ou gaussiana?

f (x) !

1 2TW
2

( x Q ) 2 2W
2

! Be

( x Q ) 2 2W2

Aderncia Distribuio Normal ou de Gauss

A mdia e o desviopadro caracterizam a funo.

Mdia, moda e mediana so coincidentes!

Aderncia Distribuio Normal ou de Gauss O passo mais simples seria construir um Histograma com a curva normal e verificar visualmente se ela normal de fato. Por exemplo: o grfico de vendas de autopeas de um fabricante de Detroit
200

100

Std. Dev = 994,59 Mean = 2516,6 0 N = 1488,00

0 0,

0 50 ,0

0 10

0 15

0 20

0 25

0 30

0 35

0 40

0 45

0 50

0 55

0 60

0 0,

0 0,

0 0,

0 0,

0 0,

0 0,

0 0,

0 0,

Vendas de auto peas

0 0,

0 0,

0 0,

Aderncia Distribuio Normal ou de Gauss Usou-se o mdulo grfico do SPSS:

Aderncia Distribuio Normal ou de Gauss

Aderncia Distribuio Normal ou de Gauss Ainda com os mesmos dados, podemos realizar o teste de KolmogorovSmirnov (KS) de uma amostra. O Teste KS compara um distribuio cumulativa observada (DO) com uma distribuio terica normal (DN). (Normal, Poisson, exponencial ou uniforme)

Aderncia Distribuio Normal ou de Gauss

Aderncia Distribuio Normal ou de Gauss


One- am le Kolmo oro - mirno Test
N Nor al ara eters Most Extreme Differences olmogorov- mirnov Z Asymp. ig. ( -tailed) a. Test distri tion is Normal. . Calculated from data.
a,

Mea t . eviati A sol te Positive Negative

Revenue 1488 $2,516.58 $994.59 ,019 ,019 -,010 ,750 ,627

O Teste de olmogorovmirnov compara um distri uio cumulativa observada (DO) com uma distribuio terica normal (DN). Absolute indica a diferena entre a DO e a DN. Valores elevados na significncia (>0,05) indicam que a DO corresponde DN.

Aderncia Distribuio Normal ou de Gauss O grfico abaixo representa os salrios de trabalhadores de uma grande empresa do setor automobilstico. V-se claramente que a distribuio no normal.
140

120

100

80

60

40 Std. Dev = 17075,66 Mean = 34419,6 0 N = 474,00

20

Current Salary

,0 00 50 13 0,0 0 50 12 0,0 0 50 11 0,0 0 50 10 ,0 0 00 95 ,0 0 00 85 ,0 0 00 75 ,0 0 00 65 ,0 0 00 55 ,0 0 00 45 ,0 0 00 35 ,0 0 00 25 ,0 0 00 15

Aderncia Distribuio Normal ou de Gauss

e fato o valor da significncia do teste menor que 0,0001 (p<0,0001). O que comprova que a distribuio no normal.
ne- am le olmogorov- mirnov est
Curre t alary
N Normal arameters Most xtreme ifferences olmogorov- mirnov s mp. ig. (2-taile ) a. Test distribution is Normal. b. alculate from data.
a,b

474 Mean td. eviation bsolute ositive Negative $34,419. 7 $17, 75. , , -,143 4,525 ,

Aderncia Distribuio Normal ou de Gauss Outro mtodo de estudo da aderncia DN a anlise dos ndices de Assimetria (IA) e de urtose (IC) de uma distribuio.

Aderncia Distribuio Normal ou de Gauss

Aderncia Distribuio Normal ou de Gauss Comparando as distribuies de vendas de autopeas (vap) com salrios (sal) vemos que: Os valores da Curtose so: ICvap = -0,099 e ICsal = 5,378 os valores da Assimetria: IAvap = 0,124 e IAsal= 2,125
Descri tive Statistics VEND S DE UTO E S
St tistic 1488 1488 ini um St tistic $13 Maximum St tistic $6,213 Mean St tistic $2,516.58 St . eviati n St tistic $994.59 Skewness St tistic St . rr r ,124 ,063 Kurt sis St tistic St . rr r -,099 ,127

Revenue Valid N (list ise)

Descriptive Statistics SALRI S


N Statistic 474 474 Minimum Statistic $15,750 Maximum Mean Statistic Statistic $135,000 $34,419.57 Std. Deviation Statistic $17,075.

Current Salar Valid N (listwise)

Skewness Statistic Std. Error 2,125 ,112

urtosis Statistic Std. Error 5,378 ,224

Aderncia Distribuio Normal ou de Gauss

Quando os mdulos dos ndices de Assimetria (valores calculados pelo SPSS) so: Menores que 0,15 distribuio simtrica 0,15<IA<1,0 Distribuio moderadamente assimtrica Maior que 1,0 Distribuio fortemente assimtrica

Aderncia Distribuio Normal ou de Gauss Nitidamente as distribuies so diferentes! Ainda podemos a partir dos dados obtidos no SPSS calcular os coeficientes de Assimetria de Pearson, dividindo o valor obtido pelo desvio-padro correspondente (tambm para a Curtose). Assim:

IC SPSS IA SPSS CC ! ou CA ! W curtose W assimetria

Calculando os coeficientes de Pearson: CCvap = -0,78 CAvap = 1,97 CCsal = 24.008,90 CAsal = 18.973,21

Aderncia Distribuio Normal ou de Gauss Ainda h maneiras grficas de avaliarmos a aderncia da DO DN: Grfico Normal Q-Q (Quantil Quantil)

Aderncia Distribuio Normal ou de Gauss

Aderncia Distribuio Normal ou de Gauss


No m

Q-Q P o

s A op s


No m

Q-Q P o

ios

No m

No m

Exp c

Exp c

Obs

Obs

Quando a DO normal, os valores ficam sobre a reta diagonal (log da DN).













  

 

     

Aderncia Distribuio Normal ou de Gauss


Detrended Normal Q-Q Plot Vendas de A topeas
1000 50000 40000 30000 600 800

Detrended Normal Q-Q Plot Sal rios

Deviation from Normal

Deviation from Normal

20000 10000 0 -10000 -20000 0 20000 40000 60000 80000 100000 120000 140000

400

200

0 -200 -1000 0 1000 2000 3000 4000 5000 6000 7000

Observed Val e

Observed Val e

Os grficos de resduos devem ter os seus valores distribudos de forma aleatria.

Aderncia Distribuio Normal ou de Gauss

O que so Resduos? Dado modelo Resduo

Aderncia Distribuio Normal ou de Gauss Outro mtodo o Normal P-P (normal probability plot). Idem Normal Q-Q.
Nor
,

l -P Plot

P
,

Nor
 

l P-P Plot

lrio

Prob

Prob
, ,

t
,

rv

Prob

rv

Prob







   











   

   

Aderncia Distribuio Normal ou de Gauss

D tr
" #$

N r

l t

A
" )

D tr

N r

l t

S l ri

l fr D vi ti
"! # "! $ " % " & " ' " # " $$ " #( " #( !" ( " $$

N r

D vi ti

fr

N r
" #( " #$ ( ! "( $

rv

rv

"! #

"! $

" %

" &

" '

" #

" $$

!"

" #

! " $ " $$ $

Aderncia Distribuio Normal ou de Gauss

O que fazer para aproximar a DO DN?

1. Aumentar o valor de n 2. Mudar a amostra coletar outra!

Aderncia Distribuio Normal ou de Gauss

Teorema do Limite Central


Distribuio qualquer Mdia = Q Varincia = W2 Distribuio normal Mdia = Q Varincia = W2/n

niverso (N)

Amostra (n)

Aderncia Distribuio Normal ou de Gauss

Se n for suficientemente grande, a mdia amostral X normalmente distribuda com mdia Q e desvio-padro W/n, isto :
(Q
ou

1 , 96

W n

Q  1 , 96

W ) ! 0 , 95 n

(X

1 , 96

W n

X  1 , 96

W ) ! 0 , 95 n

Na prtica se a distribuio da populao for normal e a amostra retirada for maior que 30 casos, vale afirmar que a distribuio da amostra tambm ser normal pode-se usar uma gama grande de testes e modelos estatsticos. Amostra n Populao N

Mesmo nessa situao: Pr(Binomial) ~ Pr(normal) para n=30 (0,1445 ~ 0,1457).

Aderncia Distribuio Normal ou de Gauss Referncias Bibliogrficas: AFIFI, A.A. e CLARK, V. Computer-Aided Multivariate Anal sis. Texts in Statistical Science Colletion. 3 dio. Boca Raton: Chapman & Hall/CRC, 1996. HAIR, J. F. et al. Multivariate data anal sis. Fifth dition. New jersey: Prentice Hall, 1998. SIEGEL, S. Estatstica No-Paramtrica: Para as Cincias do Comportamento. So Paulo: McGraw-Hill, 1979. SPIEGEL, M. R. Estatstica. Coleo Schaum. So Paulo: Mc Graw-Hill, 1977. SPSS - Statistical Package for the Social Sciences. Base 10.0 User's Guide. Chicago: SPSS, 1999.

Вам также может понравиться