Вы находитесь на странице: 1из 17

Prueba de normalidad

Prueba de Anderson-Darling

Lpez Beltrn Miguel Armando

Noviembre 2011

La prueba de Anderson-Darling es utilizada para probar si


un conjunto de datos mustrales provienen de una

poblacin con una distribucin de probabilidad continua


especfica (por lo general la distribucin normal). La prueba
de Anderson-Darling se basa en la comparacin de la
distribucin
(resultado

de
de

probabilidades
los

datos)

con

acumulada
la

emprica

distribucin

probabilidades acumulada terica (definida en H0).

de

HIPTESIS:

H0: Las variables aleatorias en un estudio siguen


una distribucin normal (, ).

Ha: Las variables aleatorias en un estudio no


siguen una distribucin normal (, ).

ESTADSTICO DE PRUEBA:

El estadstico de A2 esta dado por la siguientes formula:

EJEMPLO
Basado en Excel

Procedimiento:
20 nmeros al azar:

19
55
30
79
97
75
65
90
77
22

45
16
57
66
30
91
88
58
29
86

Sacar

media

desviacin

estndar:

= 58.75
= 26.83
= 0.05
Valor critico = 0.752

Creacin de la primera y segunda columna:


1
i

2
(2i-1)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

1
3
5
7
9
11
13
15
17
19
21
23
25
27
29
31
33
35
37
39

3
Yi

4
Yn+1-i

16
19
22
29
30
30
45
55
57
58
65
66
75
77
79
86
88
90
91
97

97
91
90
88
86
79
77
75
66
65
58
57
55
45
30
30
29
22
19
16

Los datos se ordenan de


menor a mayor (3) y de
mayor a menor (4).

Determinar

de

las

columnas 3 y 4.

-
_______
=

Donde:
: dato muestral.
: media muestral.
: desviacin estndar.
Nota: los valores de la columna 6 son los
mismos que la columna 5, solo estn
ordenados inversamente.

5
Zi

6
Zn+1-i

-1.5117
-1.4041
-1.2965
-1.0455
-1.0096
-1.0096
-0.4716
-0.1130
-0.0412
-0.0054
0.2457
0.2815
0.6043
0.6761
0.7478
0.9989
1.0706
1.1423
1.1782
1.3934

1.3934
1.1782
1.1423
1.0706
0.9989
0.7478
0.6761
0.6043
0.2815
0.2457
-0.0054
-0.0412
-0.1130
-0.4716
-1.0096
-1.0096
-1.0455
-1.2965
-1.4041
-1.5117

Los valores para las columnas de 7 y 8, son obtenidos de la


tabla de distribucin normal acumulada.

En Excel utiliza la funcin:


= DISTR.NORM (valor, media, desviacin estndar, Acum)

Valor: valor cuya distribucin se desea obtener.


Media: media aritmtica de la distribucin.

Desviacin estndar: desviacin estndar de la distribucin.


Acum: Valor lgico que determina la forma de la funcin.
Argumento

acumulada.

VERDADERO

para

obtener

la

distribucin

7
F(Yi)

8
F(Yn+1-i)

0.0653
0.0801
0.0974
0.1479
0.1563
0.1563
0.3186
0.4550
0.4836
0.4979
0.5970
0.6109
0.7272
0.7505
0.7727
0.8411
0.8578
0.8733
0.8806
0.9182

0.9182
0.8806
0.8733
0.8578
0.8411
0.7727
0.7505
0.7272
0.6109
0.5970
0.4979
0.4836
0.4550
0.3186
0.1563
0.1563
0.1479
0.0974
0.0801
0.0653

** Con la utilizacin de un

software

ya

no

es

necesario las columnas 5


y 6.

Las columna 9 y 10 se
determina con logaritmos
neperiano, para columna 9
se

determina

directo

(LN(<valor columna 7>)) y


columna 10 se determina
LN((1 - <valor columna 8>))
posteriormente

se

determina el resultado del


logaritmo neperiano.

9
LN(F(Yi))

10
LN(1-F(Yn+1-i))

-2.7288
-2.5240
-2.3290
-1.9112
-1.8557
-1.8557
-1.1438
-0.7874
-0.7266
-0.6974
-0.5158
-0.4929
-0.3186
-0.2870
-0.2579
-0.1731
-0.1534
-0.1354
-0.1271
-0.0853

-2.5041
-2.1256
-2.0662
-1.9507
-1.8393
-1.4815
-1.3883
-1.2990
-0.9438
-0.9089
-0.6889
-0.6608
-0.6070
-0.3836
-0.1700
-0.1700
-0.1601
-0.1025
-0.0835
-0.0675

11
Si
-0.2616
-0.6974
-1.0988
-1.3517
-1.6628
-1.8355
-1.6459
-1.5648
-1.4198
-1.5260
-1.2649
-1.3267
-1.1570
-0.9053
-0.6204
-0.5318
-0.5171
-0.4163
-0.3897
-0.2980

La ultima columna de la tabla se


determina con la siguiente formula:

10

11

(2i-1)

Yi

Yn+1-i

Zi

Zn+1-i

F(Yi)

F(Yn+1-i)

LN(F(Yi)) LN(1-F(Yn+1-i))

16

97

-1.5117

1.3934

0.0653

0.9182

-2.7288

-2.5041

-0.2616

19

91

-1.4041

1.1782

0.0801

0.8806

-2.5240

-2.1256

-0.6974

22

90

-1.2965

1.1423

0.0974

0.8733

-2.3290

-2.0662

-1.0988

29

88

-1.0455

1.0706

0.1479

0.8578

-1.9112

-1.9507

-1.3517

30

86

-1.0096

0.9989

0.1563

0.8411

-1.8557

-1.8393

-1.6628

11

30

79

-1.0096

0.7478

0.1563

0.7727

-1.8557

-1.4815

-1.8355

13

45

77

-0.4716

0.6761

0.3186

0.7505

-1.1438

-1.3883

-1.6459

15

55

75

-0.1130

0.6043

0.4550

0.7272

-0.7874

-1.2990

-1.5648

17

57

66

-0.0412

0.2815

0.4836

0.6109

-0.7266

-0.9438

-1.4198

10

19

58

65

-0.0054

0.2457

0.4979

0.5970

-0.6974

-0.9089

-1.5260

11

21

65

58

0.2457

-0.0054

0.5970

0.4979

-0.5158

-0.6889

-1.2649

12

23

66

57

0.2815

-0.0412

0.6109

0.4836

-0.4929

-0.6608

-1.3267

13

25

75

55

0.6043

-0.1130

0.7272

0.4550

-0.3186

-0.6070

-1.1570

14

27

77

45

0.6761

-0.4716

0.7505

0.3186

-0.2870

-0.3836

-0.9053

15

29

79

30

0.7478

-1.0096

0.7727

0.1563

-0.2579

-0.1700

-0.6204

16

31

86

30

0.9989

-1.0096

0.8411

0.1563

-0.1731

-0.1700

-0.5318

17

33

88

29

1.0706

-1.0455

0.8578

0.1479

-0.1534

-0.1601

-0.5171

18

35

90

22

1.1423

-1.2965

0.8733

0.0974

-0.1354

-0.1025

-0.4163

19

37

91

19

1.1782

-1.4041

0.8806

0.0801

-0.1271

-0.0835

-0.3897

20

39

97

16

1.3934

-1.5117

0.9182

0.0653

-0.0853

-0.0675

-0.2980

Si

Se suman los valores de Si (Columna 11):

= -20.4916

Aplicacin del estadstico de Anderson-Darling:


A2 = - N S
A2 = -(20) (-20.4916) = 0.491563

CONCLUSIONES:

El valor estadstico (A2 = 0.4916 ) es menor al valor critico


(A2critico = 0.752), por lo tanto no se rechaza la hiptesis
nula.

Por lo tanto los datos observados tienen una naturaleza de


distribucin normal.

Referencias:
http://es.scribd.com/doc/57801491/Metodos-de-ajuste-de-curvas

http://www.elosiodelosantos.com/sergiman/div/tablnorm.html
http://www.spcforexcel.com/anderson-darling-test-for-normality
http://www.theriac.org/DeskReference/viewDocument.php?id=60&Se

ctionsList=3
http://www.itl.nist.gov/div898/handbook/eda/section3/eda35e.htm
Marqus dos Santos, Mara Jos; Estadstica Bsica: un enfoque no

parametrico, Universidad Nacional Autonoma de Mxico, Facultad de


Estudios Superiores Zaragoza.

Вам также может понравиться