Вы находитесь на странице: 1из 18

Prueba de bondad de Ajuste

Luceny Guzman Acu~ na


29 de octubre de 2009
Luceny Guzman Acu~ na () Prueba de bondad de Ajuste 29 de octubre de 2009 1 / 18
Prueba de bondad de ajuste
Una prueba de bondad de ajuste se emplea para decidir cuando un
conjunto de datos se ajusta a una distribucion de probabilidad especca.
1
Continuas: Normal, Exponencial, Uniforme,etc.
2
Discretas: Binomial, Poisson, hipergeometrica,etc.
H
o
: Los datos se ajustan a la distribucion 1(r) con parametros 0
i
.
i = 1. .... :
H
1
: Los datos No se ajustan a la distribucion 1(r) con parametros 0
i
.
i = 1. .... :
Luceny Guzman Acu~ na () Prueba de bondad de Ajuste 29 de octubre de 2009 2 / 18
Prueba chi cuadrado
La prueba chi cuadrado esta basada en la estadstica
.
2
=
k
X
i=1
(o
i
c
i
)
2
c
i
que tiene una distribucion chi cuadrado con / 1 grados de libertad,
donde:
/ : n umero de clases o valores a considerar,
o
i
: frecuencias observadas,
c
i
: frecuencias esperadas.
Para utilizar esta estadstica es necesario que c
i
5. en algunos casos es
necesario combinar celdas adyacentes para superar este inconveniente o
formar las clases de tal manera que se satisfaga esta condicion.
[Para mayor informacion sobre el uso de esta estadstica de prueba
ver: Probabilidad y Estadstica, Aplicaciones y Metodos, Autor:
George Canavos, Cap. 10]
Luceny Guzman Acu~ na () Prueba de bondad de Ajuste 29 de octubre de 2009 3 / 18
Prueba chi cuadrado
Valores grandes de la estadstica .
2
indican que H
o
debe rechazarse.
La region crtica o de rechazo esta dada por los valores .
2
talque:
.
2
.
2
;k1
En el caso de estimar los parametros los grados de libertad son / j 1
donde j es el n umero de parametros que se estiman. Tambien es posible
calcular el valor 1 como:
\ a|or 1 = 1(.
2
k1
valor de la estadstica)
Luceny Guzman Acu~ na () Prueba de bondad de Ajuste 29 de octubre de 2009 4 / 18
Ejemplo: caso continuo
Determine si los contenidos de nicotina de cierta marca de cigarrillos se
ajustan a una distribucion normal de media j = 1.8 y desviacion estandar
o = 0.4. si una muestra aleatoria de contenidos arrojo los siguientes
valores:
0.7 1.4 1.6 1.7 1.8 1.9 2.1 2.3
0.9 1.5 1.6 1.7 1.8 1.9 2.1 2.3
1.1 1.5 1.7 1.7 1.8 1.9 2.1 2.4
1.2 1.6 1.7 1.8 1.9 1.9 2.1 2.5
1.4 1.6 1.7 1.8 1.9 1.9 2.2 2.6
Luceny Guzman Acu~ na () Prueba de bondad de Ajuste 29 de octubre de 2009 5 / 18
Ejemplo: caso continuo
H
o
: Los contenidos de nicotina se ajustan a una distribucion normal con
j = 1.8 y o = 0.4
H
1
:Los contenidos de nicotina no se ajustan a una distribucion normal
con j = 1.8 y o = 0.4
N umero de clases: C = 3.3 log(:) + 1 = 6
Precision: 1 = 0.1
Amplitud: =
Rango
C
=
2;60;7
6
= 0.32 0.40
L.I L.S Clase 1
0.7 1.0 0.65 1.05 2
1.1 1.4 1.05 1.45 4
1.5 1.8 1.45 1.85 17
1.9 2.2 1.85 2.25 11
2.3 2.6 2.25 2.65 6
2.7 3.0 2.65 3.05 0
Luceny Guzman Acu~ na () Prueba de bondad de Ajuste 29 de octubre de 2009 6 / 18
Ejemplo: caso continuo
Las frecuencias de clase corresponden a las frecuencias observadas o
i
. Las
frecuencias esperadas se calculan como:
c = probabilidad*N umero de datos
Las probabilidades se calculan teniendo en cuenta la hipotesis nula, de la
siguiente manera:
Para la primera clase:
1(A < 1.05) = 1

7 <
1.05 1.8
0.4

= 1(7 < 1.875) = 0.030


Luceny Guzman Acu~ na () Prueba de bondad de Ajuste 29 de octubre de 2009 7 / 18
Ejemplo: caso continuo
Para la segunda clase:
1(1.05 < A < 1.45) = 1

1.05 1.8
0.4
< 7 <
1.45 1.8
0.4

= 1(1.875 < 7 < 0.875) = 0.16.


De igual forma para las siguientes tres clases
Para la ultima clase:
1(A 2.65) = 1

7
2.65 1.8
0.4

= 1(7 2.125) = 0.017


Luceny Guzman Acu~ na () Prueba de bondad de Ajuste 29 de octubre de 2009 8 / 18
Ejemplo: caso continuo
Nos resulta la siguiente tabla:
Clase o
i
probabilidad c
i
= jro/ 40
0.65 1.05 2 0.03 1.2
1.05 1.45 4 0.16 6.4
1.45 1.85 17 0.36 14.4
1.85 2.25 11 0.32 12.8
2.25 2.65 6 0.11 4.4
2.65 3.05 0 0.02 0.8
Como la primera, quinta y sexta clase no cumplen con la condicion que
c
i
5, se agrupan clases adyacentes, resultando de la siguiente manera:
Luceny Guzman Acu~ na () Prueba de bondad de Ajuste 29 de octubre de 2009 9 / 18
Ejemplo: caso continuo
Clase o
i
c
i
1 y 2 6 7.6
3 17 14.4
4 11 12.8
5 y 6 6 5.2
El valor de la estadstica sera:
.
2
=
(6 7.6)
2
7.6
+
(17 14.4)
2
14.4
+
(11 12.8)
2
18
+
(6 5.2)
2
5.2
= 1.18
Luceny Guzman Acu~ na () Prueba de bondad de Ajuste 29 de octubre de 2009 10 / 18
Ejemplo: caso continuo
El punto crtico es .
2
3;0;05
= 7.81. El valor 1 esta dado por:
\ a|or 1 = 1(.
2
3
1.18) = 0.76
Como el valor de la estadstica es menor que el punto crtico o como valor
1 es muy grande no se rechaza H
o
, es decir , se puede armar con un
nivel de signicancia de 0.05 que el contenido de nicotina se distribuye de
forma normal con los parametros establecidos.
Es posible realizar las clases de tal manera que se cumpla con la condicion
que c
i
5
Luceny Guzman Acu~ na () Prueba de bondad de Ajuste 29 de octubre de 2009 11 / 18
Ejemplo: caso discreto
Se seleccionan 3 artculos (sin reemplazo) de un lote que contiene 5
artculos defectuosos y 3 artculos no defectusos, despues de registrar el
n umero A de artculos defectuosos, los artculos se reemplazan al lote y el
experimento se repite 112 veces. Los resultados obtenidos son los
siguientes:
r 0 1 2 3
1(r) 1 31 55 25
Con un nivel de signicancia de 0.05 pruebe la hipotesis que los datos
registrados se pueden ajustar mediante una distribucion hipergeometrica
con = 8. : = 3 y / = 5. r = 0. 1. 2. 3.
Luceny Guzman Acu~ na () Prueba de bondad de Ajuste 29 de octubre de 2009 12 / 18
Ejemplo: caso discreto
Bajo las condiciones en que se lleva a cabo el experimento las hipotesis
nula y alternativa se plantean como:
H
o
: El n umero de artculos defectuosos seleccionados se ajustan a una
distribucion hipergeometrica con = 8. : = 3 y / = 5. con r = 0. 1. 2. 3.
Las frecuencias dadas en la tabla anterior son las observadas, las esperadas
se calculan teniendo en cuenta la distribucion dada con los parametros
establecidos, es decir,
j(r) =

/
r

/
: r


:
=

5
r

3
3 r

8
3
. r = 0. 1. 2. 3
Reemplazando los valores de r se obtienen las siguientes probabilidades:
r 0 1 2 3
j(r) 156 1556 3056 1056
Luceny Guzman Acu~ na () Prueba de bondad de Ajuste 29 de octubre de 2009 13 / 18
Ejemplo: caso discreto
Las frecuencias esperadas se calculan como:
c = probabilidad # veces que se repite el experimento
Se obtiene entonces:
r j(r) c
i
= j(r) 112 o
i
0 156 2 1
1 1556 30 31
2 3056 60 55
3 1056 20 25
112 112
Observacion: Para que se cumpliera con la condicion que c
i
5 el
experimento se debio realizar como mnimo 280 veces.
Luceny Guzman Acu~ na () Prueba de bondad de Ajuste 29 de octubre de 2009 14 / 18
Ejemplo: caso discreto
Al juntar celdas adyacentes se tiene:
r c
i
o (o
i
c
i
)
2
c
i
1 32 32 0
2 60 55 0.78125
3 20 25 1.25
112 112 .
2
=
3
X
i=1
(o
i
c
i
)
2
c
i
= 2.03125
Luceny Guzman Acu~ na () Prueba de bondad de Ajuste 29 de octubre de 2009 15 / 18
Ejemplo: caso discreto
Decision:
Region crtica: Punto crtico: .
2
2;0;05
= 5.99 (Al nal se consideraron 3
celdas, los grados de libertad son / 1 = 3 1 = 2) como valor de la
estadstica (.
2
= 2.03125)
es menor que el punto crtico, la decision es no rechazar H
o
.
Valor P: Valor P= 1(.
2
2
2.03125) = 0.3622 valor P muy grande indica
que no se debe rechazar H
o
.
Es decir se puede considerar que el n umero de artculos defectuosos
seleccionados se ajustan a una distribucion hipergeometrica con los
parametros establecidos.
Luceny Guzman Acu~ na () Prueba de bondad de Ajuste 29 de octubre de 2009 16 / 18
Ejercicio
De acuerdo con el ejemplo anterior, suponga que la seleccion se realiza
uno por uno con reemplazo, realice el experimento 100 veces y determine
si el n umero de artculos seleccionados 1 se ajustan a una distribucion
binomial (Establezca cuales seran los parametros)
Luceny Guzman Acu~ na () Prueba de bondad de Ajuste 29 de octubre de 2009 17 / 18
Graco de probabilidad normal
La graca de probabilidad normal es un metodo graco para determinar
si los datos muestrales se ajustan a una distribucion propuesta, es una
evaluacion subjetiva del comportamiento de los datos.
Para construir la graca los datos se ordenan de menor a mayor, se
representa como r
(j)
, = 1. .... : donde : es el n umero de datos que se
consideran.
1
Es una graca de
j0;5
n
contra r
(j)
(Sobre papel normal)
2
Es una graca de .
(j)
contra r
(j)
(Sobre cualquier tipo de papel ),
.
(j)
se calcula teniendo en cuenta los parametros de la distribucion
normal establecidos.
Para que la normalidad se cumpla el graco debe aproximarse a una lnea
recta.
Luceny Guzman Acu~ na () Prueba de bondad de Ajuste 29 de octubre de 2009 18 / 18

Вам также может понравиться