Вы находитесь на странице: 1из 10

Pruebas de hiptesis no paramtricas de

Kolmogorov-Smirnov
Enviado por celorriosanchez



1.
2. Dcima de una muestra de Kolmogorov-Smirnov.
3. Dcima de Kolmogorov-Smirnov para dos muestras independientes.
4. Bibliografa

INTRODUCCIN
El uso de la Estadstica es de gran importancia en la investigacin cientfica. Casi todas
las investigaciones aplicadas requieren algn tipo de anlisis estadstico para que sea
posible evaluar sus resultados. En algunos casos, para resolver un problema de carcter
emprico, es preciso llevar a cabo un anlisis bastante complejo; otras veces, basta con
efectuar un anlisis muy simple y directo. La eleccin de uno u otro tipo de anlisis
estadstico depende del problema que se plantee en el estudio as como de la naturaleza
de los datos. Desde este punto de vista, la Estadstica constituye un instrumento de
investigacin y no un producto final de esta ltima.
El trabajo coherente, las acciones integradas, la no extrapolacin de elementos de un
lugar a otro, el verdadero diagnstico de la realidad han de ser prcticas permanentes en
el accionar del investigador y el estadstico aplicado.
Dentro de la estadstica se aplican en la investigacin los tests o dcimas paramtricos y
no paramtricos, el presente trabajo esta dedicado al estudio de dos pruebas no
paramtricas que por su importancia merecen ser tratadas de forma independiente, ellas
son las pruebas de Kolmogorov-Smirnov para una y dos muestras.
Entre los tests no paramtricos que comnmente se utilizan para verificar si una
distribucin se ajusta o no a una distribucin esperada, en particular a la distribucin
normal se encuentran el test de Kolmogorov-Smirnov. El test de Kolmogorov-Smirnov
es bastante potente con muestras grandes. El nivel de medicin de la variable y su
distribucin son elementos que intervienen en la seleccin del test que se utilizar en el
procesamiento posterior. De hecho, si la variable es continua con distribucin normal,
se podrn aplicar tcnicas paramtricas. Si es una variable discreta o continua no
normal, solo son aplicables tcnicas no paramtricas pues aplicar las primeras arrojara
resultados de dudosa validez.
Desarrollo
DCIMA DE UNA MUESTRA DE KOLMOGOROV-SMIRNOV.
Premisas
La nica premisa que se necesita es que las mediciones se encuentren al menos en una
escala de intervalo. Se necesita que la medicin considerada sea bsicamente continua.
Adems dicha prueba es aplicable cualquiera sea el tamao de la muestra.
Potencia-Eficiencia
La prueba de una muestra de K-S puede en todos los casos en que se aplique ser ms
poderosa que su prueba alternativa, la prueba de c 2 ( ji-cuadrado.
Caractersticas de la dcima
La prueba de K-S de una muestra es una dcima de bondad de ajuste. Esto es, se
interesa en el grado de acuerdo entre la distribucin de un conjunto de valores de la
muestra y alguna distribucin terica especfica. Determina si razonablemente puede
pensarse que las mediciones mustrales provengan de una poblacin que tenga esa
distribucin terica. En la prueba se compara la distribucin de frecuencia acumulativa
de la distribucin terica con la distribucin de frecuencia acumulativa observada. Se
determina el punto en el que estas dos distribuciones muestran la mayor divergencia.
Hiptesis
Ho: La distribucin observada se ajusta a la distribucin terica.
F(x) = Ft(x) para todo x.
H1: La distribucin observada no se ajusta a la distribucin terica.
Tambin:
F(x) Ft(x) para algn x
F(x): es funcin desconocida
Ft(x): es la funcin terica. Esta puede ser por ejemplo la funcin normal con cierta
media y varianzas conocidas.
Estadgrafo y distribucin muestral
D = mxima
Sn(x): es la funcin de distribucin emprica.
Ejemplo
El entrenador de salto de un grupo de atletas, desea conocer con vistas al procesamiento
de los datos por el obtenidos sobre salto de una muestra aleatoria de atletas de esa
especialidad en un CVD, si las mediciones realizadas por l estn distribuidas
normalmente. Los datos son los siguientes:
Salto_Largo
1 1.60
2 1.65 Ho: Los datos estn distribuidos normalmente
3 1 .55 H1: Los datos no estn distribuidos normalmente.
4 1.62
5 1.64
6 1.70
7 1.71
8 1.68
9 1.66
10 1.67
11 1.65
12 1.68
13 1.69
14 1.70
Salidas de la dcima

Conclusiones:
No se rechaza a Ho, por tanto la distribucin de los datos es normal.
Tcnicas adicionales a la dcima
Tabla de frecuencias
Histograma.
Estadgrafos que deben acompaar a los estadgrafos de la dcima
1-Tabla de frecuencias.
Tcnicas auxiliares para respaldar los resultados obtenidos en la conclusin.
1-Histogramas.


Dcima de Kolmogorov-Smirnov para dos muestras independientes.
Estructura de la base de datos
Normalmente la estructura que tiene la base de datos es la de utilizar una variable para
entrar los resultados de la medicin y la otra donde se particione a estos resultados en
los dos grupos.
Premisas
La nica premisa que se necesita es que las mediciones se encuentren al menos en una
escala ordinal. Adicionalmente se necesita que la medicin considerada sea bsicamente
continua.
Potencia-Eficiencia
Comparada ante la alternativa paramtrica de la t de student para dos muestras
independientes (o el modelo de Anlisis de Varianza clasificacin simple para dos
muestras), cuando las premisas paramtricas se cumplen, tiene una potencia eficiencia
de cerca del 96%, que tiende a decrecer ligeramente a medida que se aumentan los
tamaos de muestra.
Existen autores que plantean1 "que la dcima de Kolmogorov-Smirnov, para muestras
muy pequeas es ms potente que la dcima de la U de Mann-Whitney, pero que para
muestras de tamao grande ocurre lo contrario.
Caractersticas de la dcima
La dcima de Kolmogorov-Smirnov est construida, teniendo como base detectar las
discrepancias existentes entre las frecuencias relativas acumuladas de las dos muestras
objeto de estudio. Lo anterior propicia que esta dcima pueda advertir diferencias no tan
solo entre los promedios, sino que stas sean debidas a la dispersin, o la simetra o la
oblicuidad. Esta caracterstica la hace distintiva de aquellas en que solamente se ocupan
de analizar las diferencias entre los promedios.
La dcima admite que los tamaos de las muestras no sean iguales.
Hiptesis
Las hiptesis de esta dcima, expresadas en palabras son:
Ho: Las distribuciones poblacionales son iguales.
H1: Las distribuciones poblacionales son distintas.
Ahora bien se recomienda en general hacer el enunciado de las hiptesis de forma tal
que indique en un mayor grado la caracterstica que va a ser docimada.
Estadgrafo y distribucin muestral.
Designemos por T1 y por T2 las tablas de distribucin de frecuencias relativas
acumuladas, particionadas en k categoras. Donde el primer subndice corresponde al
nmero de la muestra y el segundo al orden de la clase.
TABLA1 TABLA2 DIFERENCIAS
Clase Frecuencia relativa acumulada Frecuencia relativa
acumulada
Diferencia de las
Frecuencias
1 p11 p21 p11-p21
2 p12 p22 p12-p21
... ... ... ...
I p1i p2i p1i-p2i
... ... ... ...
k p1k p2k p1k-p2k
Se analiza entonces en la columna de las diferencias de las frecuencias, en qu clases se
obtiene el valor mximo. Se tendr entonces en smbolos:
El estadgrafo de esta dcima se designa
por 2 y para tamaos de muestra suficientemente grandes, est distribuido segn chi-
cuadrado con dos grados los de libertad. En smbolos:
Goodman , ha demostrado que si los tamaos de muestra son
pequeos la dcima se comporta conservadoramente.
Salidas de la dcima
Las salidas usuales de la dcima son tres:
Mxima diferencia negativa. Donde se muestra cul es la mayor diferencia
negativa alcanzada.
Mxima diferencia positiva. Donde se muestra la mayor diferencia positiva
alcanzada.
Valor de la probabilidad para dos colas.
Es necesario sealar que las dos primeras opciones suministran informacin en los
casos en que sea conveniente realizar una dcima unilateral, adems de reflejar
informacin acerca de lo que est ocurriendo en la dcima.
Tcnicas adicionales a la dcima
Existe un grupo de tcnicas adicionales a la dcima, las que hemos dividido en los
siguientes grupos.
Estadgrafos que deben acompaar a los estadgrafos de la dcima.
Entre ellos se encuentran:
Tamaos en cada una de las muestras (casos vlidos en el anlisis)
Media aritmtica de cada una de las muestras.
Desviacin estndar de cada una de las muestras.
Tcnicas auxiliares para respaldar los resultados obtenidos en la conclusin
Diagrama de caja y bigotes de cada una de las muestras.
Histograma de cada una de las muestras.
Ejemplo
Se muestran las prdidas en peso (medidos en kilogramos), de dos grupos de personas
que han sido sometidas a dos tipos diferentes de medicamentos, designado por Grupo1
y Grupo2. Los resultados obtenidos se muestran en la siguiente tabla:
GRUPO1 (n1=10) GRUPO2 (n2=12
5.49 3.76
3.08 4.22
4.13 4.17
5.03 5.03
7 4.85
6.03 2.09
4.45 4.45
5.13 3.58
4.26 3.86
4.62 4.13

4.4

2.81
Salida de la dcima
La salida bsica de la dcima muestra los valores mximos positivos, mximos
negativos y el valor de probabilidad, los que se muestran a continuacin.
medicin
mxima diferencia
negativa
mxima diferencia
positiva valor de probabilidad
perdida de peso 0 0.4666667 p > .10
Segn podemos observar, no existen diferencias significativas entre los resultados de la
medicin realizada a los dos grupos.
Estadgrafos que deben acompaar a los estadgrafos de la dcima.
Resulta conveniente incluir tambin, adems de los mencionados en la tabla anterior, el
tamao en cada una de las muestras, as como la media aritmtica de cada una de ellas y
su desviacin estndar. Las que se muestran en la siguiente tabla.
Tamaos de muestra Media aritmtica Desviacin. Estndar
GRUPO 1 10 4.73900 .8235661
GRUPO 2 12 3.945834 .8235661
Tcnicas auxiliares para respaldar los resultados obtenidos en la conclusin
Las tcnicas que ha continuacin se mencionan es conveniente su utilizacin:
Diagramas de Caja y Bigotes.
El siguiente diagrama muestra los resultados obtenidos tomando como promedio la
mediana, el rango intercuartlico para la caja y el mximo-mnimo para los bigotes.

En este diagrama observamos que.aunque en la segunda muestra ha existido una
disminucin en el valor mediano, las diferencias no son significativas. Obsrvese que en
la segunda muestra se ha producido una disminucin en la dispersin y los mximos y
mnimos han sido reducidos.
Histogramas
A continuacin se muestran los histogramas de las dos muestras. Los que pueden
proporcionar una mayor idea del proceso ocurrido.

BIBLIOGRAFA
Alvarez de Zayas, Carlos: (1995). Metodologa de la investigacin cientfica.
Santiago de Cuba. Centro de Estudio Superior "Manuel F. Grau".
Cerda Gutierrez, Hugo: (1993). Los elementos de la investigacin. Cmo
reconocerlos, cmo disearlos y construirlos?. Quito. Edit. El Buho.
Cols Bravo, Mara del Pilar: (1992). Investigacin educativa. Sevilla. Librera
Canaima.
Cu Muiz, Juan: (1987). Estadstica. Ciudad de la Habana: Empresa Nacional
de Produccin del Ministerio de Educacin Superior.
Friedrich, Walter: (1968). Mtodos de la investigacin social. La Habana:
Editorial Ciencias Sociales.
Garca, M.: (1993:16-18). Test para la evaluacin de habilidades visuales en
deportistas. Boletn de Informacin y Documentacin UNISPORT (Andaluca)
21(1).
Grau Avalos, Ricardo: (1994). Estadstica aplicada utilizando paquetes de
software. Centro de Documentacin e Investigacin, Facultad de Matemtica,
Fsica y Computacin. Universidad Central de Las Villas. Villa Clara, Cuba.
Guerra Bustillo, Caridad W.: (1987). Estadstica. Ciudad de La Habana.
Editorial Pueblo y Educacin.
Karpman, U. L.:(1988). Las pruebas en medicina deportiva. Mosc: Editorial
Fis.
Mesa Anoceto, Magda: (1998). Determinacin de la validez predictiva de los
tests en el deporte. En Memorias del II Simposio Internacional de Educacin
Fsica y Deporte Escolar. Cienfuegos, Cuba.
Norat Soto, Teresa:(1991:81-86). Estadstica aplicada al deporte: las pruebas de
comparacin mltiple. En revista cubana de Medicina del Deporte y la Cultura
Fsica. 2(2): abril-,junio..
Siegel, Sidney: (1986). Estadstica no paramtrica aplicada a las Ciencias de la
Conducta. Mxico, D.F., Editorial Trillas.




Ms.C: Arsenio Celorrio Snchez
E- mail:
Profesor de Estadstica, Matemtica y Econometra del Centro Universitario de Las
Tunas Cuba
21 ao de trabajo, dentro de ellos 19 aos en la Educacin Superior ,profesor Asistente.
Necesito si es seleccionado para ser publicado este trabajo me enven un documento que
lo certifique
Prximamente enviar nuevos trabajos en esta direccin de la Estadstica.
Muchas gracias.


Leer ms:
http://www.monografias.com/trabajos11/docima/docima.shtml#ixzz31NKBz45b

Вам также может понравиться