Вы находитесь на странице: 1из 12

I.

INTRODUCCIN

Se entiende por bondad de ajuste, la asimilacin de datos observados de una


variable, a una funcin matemtica previamente establecida y reconocida. A
travs de sta es posible interpolar y extrapolar informacin; en otras palabras,
predecir el comportamiento de la variable en estudio (Pizarro et al, 1986).
Para la estimacin de la bondad de ajuste, existen variadas pruebas, las cuales
poseen distinto grado de efectividad.
En el presente documento se entrega el test de Kolmogorov-Smirnov. La prueba
de bondad de ajuste se aplica en diseos de investigacin en los que se estudia a
un nico grupo.
La prueba compara la distribucin de frecuencias observada (Fo) de una variable
usualmente cualitativa, pero que tambin puede ser cuantitativa, con la
distribucin de frecuencias de la misma variable medida en un grupo de
referencia.
El procedimiento de la prueba implica el clculo de una distribucin esperada (Fe)
en el grupo estudiado, usando como punto de partida a la distribucin de la
variable en el grupo de referencia.
El propsito de la prueba es averiguar si existen diferencias estadsticamente
significativas entre la distribucin observada (Fo) y la distribucin esperada (Fe).

II.

CUERPO O CONTENIDO

2.1 Prueba Kolmogorov Smirnov

Mtodo por el cual se comprueba la bondad de ajuste de las distribuciones,


asimismo permite elegir la ms representativa, es decir la de mejor ajuste.
Esta prueba consiste en comparar el mximo valor absoluto de la diferencia D
entre la funcin de distribucin de probabilidad observada Fo (xm) y la estimada F
(xm):
D = mx / Fo(xm) F(xm)/

Con un valor crtico d que depende del nmero de datos y el nivel de significancia
seleccionado (Tabla N 03). Si D<d, se acepta la hiptesis nula. Esta prueba tiene
la ventaja sobre la prueba de X2 de que compara los datos con el modelo
estadstico sin necesidad de agruparlos. La funcin de distribucin de probabilidad
observada se calcula como:
Fo(xm) = 1- m / (n+1) (13)

Donde m es el nmero de orden de dato xm en una lista de mayor a menor y n es


el nmero total de datos. (Aparicio, 1996)

2.2 Test de Kolmogorov-Smirnov en la Distribucin de Gumbel

Para la aplicacin del test sealado, es necesario determinar la frecuencia


observada acumulada.

Para la frecuencia observada en el caso especial de Gumbel, se ordena la


informacin de menor a mayor y se aplica:

donde:
Fn (x): frecuencia observada acumulada.
n: N total de orden
N: N total de datos.
En el caso de la frecuencia terica acumulada, sta se determina a travs de la
funcin de Gumbel.

Una vez determinadas ambas frecuencias, se obtiene el supremo de las


diferencias entre ambas, en la i-sima posicin de orden, que se denomina D.

Luego, asumiendo un valor de significancia, se recurre a la tabla de valores


criticos de D en la prueba de Bondad de ajuste de Kolmogorov-Smirnov, y
considerando el tamao de la muestra, se establece lo sieguiente:
Si D < D tabla, se acepta que (el ajuste es adecuado, coon el nive de confiabilidad
asumido.
Ajuste a Gumbel:

Se desea conocer la ley de distribucin de las precipitaciones mximas en 24


horas, de la estacin Monte Patria provincia de Limar. Para ello, se dispone de
los siguientes datos.

De lo expuesto, se deduce que se cuenta con una informacin de doce aos, y


adems que los montos denotan una extrema variabilidad.
En relacin al primer aspecto, es un denominador comn en muchas estaciones
del pas, la carencia de series hidrolgicas consistentes, por lo cual es difcil
soslayarlo. En cuanto a la variabilidad, es preciso destacar que las zonas ridas
se caracterizan por presentar este elemento como caracterstica de la distribucin
y monto de las precipitaciones.
No obstante lo anterior, y como se tiende a estimar valores mximos, se puede
obviar este ltimo aspecto considerando las dos o tres precipitaciones mximas
anuales, para con esta nueva serie de datos elegir un nmero mayor de aos a
considerar.

Luego, el enfrentamiento de este problema es resorte del criterio que el ingeniero


utilice para tomar la decisin, y la cual slo podr ser calificada a la luz de los
antecedentes que cada situacin denote. As, para el caso en cuestin, se
trabajar con la informacin deprecipitacin mxima anual en 24 horas, toda vez
que se trata de un ejercicio metodolgico.

Con los datos de la columna 1, se determina que:

Luego, los parmetros u y d quedan:

Por consiguiente, la funcin de Gumbel se define como:

De lo expuesto, se deduce que se cuenta con una informacin de doce aos, y


adems que los montos denotan una extrema variabilidad. Por otra parte,
aplicando la expresin n/N+1, se obtiene la frecuencia observada acumulada, la
cual se expresa en la columna (2) del cuadro N 2. Asimismo, reemplazando en la
ecuacin (1) los valores de x, se obtienen las frecuencias tericas acumuladas,
las cuales constituyen la columna (3) del cuadro N 2.

2.3 Aplicacin de Kolmogorov-Smirnov.

Con la informacin del cuadro N 2, se busca el

En este caso, corresponde a D = 0.073 en el tercer valor del cuadro mencionado.


Con un 95% de confiabilidad y n = 12, se obtiene un valor de tabla Dt = 0.375.
Luego D < Dt, por consiguiente se acepta con 95% de seguridad que el ajuste es
bueno.

2.4 SPSS: PRUEBAS NO PARAMTRICAS y Kolmogorov y smirnov

La prueba de Kolmogorov-Smirnov para una muestra es un procedimiento de


"bondad de ajuste", que permite medir el grado de concordancia existente entre la

distribucin de un conjunto de datos y una distribucin terica especfica. Su


objetivo es sealar si los datos provienen de una poblacin que tiene la
distribucin terica especificada, es decir, contrasta si las observaciones podran
razonablemente proceder de la distribucin especificada.

Ejemplo. Muchas pruebas paramtricas requieren que las variables se distribuyan


de forma normal. La prueba de Kolmogorov-Smirnov para una muestra se puede
utilizar para comprobar si una variable (por ejemplo notas) se distribuye
normalmente.
Estadsticos. Media, desviacin tpica, mnimo, mximo, nmero de casos no
perdidos y cuartiles.

Seleccionar:
Analizar
Pruebas no paramtricas
o K-S de 1 muestra...

Se pueden seleccionar una o ms variables de contraste numricas. Cada


variable genera una prueba independiente. En nuestro caso vamos a seleccionar t
para realizar la prueba.

Si lo deseas, puedes pulsar en Opciones para obtener estadsticos descriptivos,


cuartiles y controlar el tratamiento de los datos perdidos.

Pulsamos aceptar.

Comprobamos el nivel de significacin, si es menor que 0.05 la distribucin no es


normal, si es mayor que 0.05 la distribucin es normal.
En este caso la distribucin es normal (nivel de significacin 0.904).

III.

CONCLUSIONES

El Test de Kolmogorov-Smirnov se basa en la idea de comparar la funcin


de la distribucin acumulada de los datos observados con la de una
distribucin normal, midiendo la mxima distancia entre ambas curvas.

El

Tests

de

Kolmogorov-Smirnov

se

utilizan

para

verificar

si

una distribucin se ajusta o no a una distribucin esperada, en particular a


la distribucin normal.

La prueba de Kolmogrov-Smirnov se utiliza para determinar la bondad de


ajuste de dos distribuciones de probabilidad entre s y es bastante potente
con muestras grandes.

La prueba Kolmogrov-Smirnov es ms sensible a los valores cercanos a


la mediana que a los extremos de la distribucin.

IV.

REFERENCIA

PIZARRO, R.; NOVOA, P. 1986. Instructivo n 5. Determinacin de valores


probabilsticos

para

variables

hidrolgicas.

Elementos

tcnicos

Hidrologa. Corporacin Nacional Forestal (CONAF). Chile. 78 p.

de

http://eias.utalca.cl/Docs/pdf/Publicaciones/manuales/a_modulo_leyes.pdf

http://transparencia.mtc.gob.pe/idm_docs/normas_legales/1_0_2950.pdf

http://www.facmed.unam.mx/deptos/salud/censenanza/planunico/spii/antolo
gia2012/3.pdf

http://www.uv.es/innomide/spss/SPSS/SPSS_0802A.pdf

http://www-01.ibm.com/software/pe/analytics/spss/

http://www.mangrafias.com/trabajos11/docima/docima.shtml

http://www.math.epn.edu.ec/~sandra/TDE_2013_B/Tablas%20KS.pdf