Вы находитесь на странице: 1из 4

Estadstica no paramtrica

La estadstica no paramtrica es una rama de la estadstica que estudia las pruebas y modelos estadsticos cuya distribucin subyacente no se ajusta a los llamados criterios paramtricos. Su distribucin no puede ser definida a priori, pues son los datos observados los que la determinan. La utilizacin de estos mtodos se hace recomendable cuando no se puede asumir que los datos se ajusten a una distribucin conocida, cuando el nivel de medida empleado no sea, como mnimo, de intervalo. Las principales pruebas no paramtricas son las siguientes:

Prueba de Pearson Prueba binomial Prueba de Anderson-Darling Prueba de Cochran Prueba de Cohen kappa Prueba de Fisher Prueba de Friedman Prueba de Kendall Prueba de Kolmogrov-Smirnov Prueba de Kruskal-Wallis Prueba de Kuiper Prueba de Mann-Whitney o prueba de Wilcoxon Prueba de McNemar Prueba de la mediana Prueba de Siegel-Tukey Prueba de los signos Coeficiente de correlacin de Spearman Tablas de contingencia Prueba de Wald-Wolfowitz Prueba de los rangos con signo de Wilcoxon

La mayora de estos test estadsticos estn programados en los paquetes estadsticos ms frecuentes, quedando para el investigador, simplemente, la tarea de decidir por cul de todos ellos guiarse o qu hacer en caso de que dos test nos den resultados opuestos. Hay que decir que, para poder aplicar cada uno existen diversas hiptesis nulas y condiciones que deben cumplir nuestros datos para que los resultados de aplicar el test sean fiables. Esto es, no se puede aplicar todos los test y quedarse con el que mejor convenga para la investigacin sin verificar si se cumplen las hiptesis y condiciones necesarias pues, si se violan, invalidan cualquier resultado posterior y son una de las causas ms frecuentes de que un estudio sea estadsticamente incorrecto. Esto ocurre sobre todo cuando el investigador desconoce la naturaleza interna de los test y se limita a aplicarlos sistemticamente. Es importante mencionar que si la distribucin de los datos se ajusta a un tipo de distribucin conocida, existen otras [pruebas] que, en la prctica, son ms aconsejables pero

que as mismo requieren otros supuestos. En este caso, la estadstica a emplear es la estadstica paramtrica, dentro de la cual muchas veces podemos encontrar equivalencias entre pruebas pero con diferencias en la potencia entre ambas siendo siempre la potencia de las pruebas no paramtricas menor que la potencia de las pruebas paramtricas equivalentes. Aun as, el uso adecuado de los tamaos muestrales disminuye la posibilidad de cometer un [error tipo II], puesto que aumenta al mismo tiempo la eficacia de la prueba . Es decir, a medida que se umenta el tamao de la muestra, disminuye la posibilidad de cometer un error tipo II (un falso negativo: No rechazar la hiptesis nula cuando sta en realidad es falsa).

La hipotesis nul a de interes es que en la poblacion en general no hay una tendencia general a preferir un producto al otro. Para evaluar esta hipotesis, comparamos los nmeros . que expresan una preferencia por cada producto, descartando los que valoran los productos por igual. En este ejemplo, los valores del estudiante G se omiten y el tamao efectivo de la muestra se reduce a n = 7. La unica informacion muestral en la que se basa nuestro contraste es que dos de los siete estudiantes prefieren el producto original.

Por 10 tanto, el estadfstico del contraste es S = 2. La hipotesis nula puede concebirse como la hipotesis de que la mediana poblacional de las diferencias es 0. Si la hipotesis nula fuera verdadera, nuestra secuencia de diferencias + y - podria concebirse como una muestra aleatoria extrafda de una poblacin en la que las probabilidades de + y - son 0,5 cada una. En ese caso, las observaciones constituirian una muestra aleatoria extrafda de una poblacion binomial en la que la probabilidad de + es 0,5. Por 10 tanto, si P representa la verdadera proporcion de + que hay en la poblacion (es decir, la verdadera proporcion de la poblacion que prefiere la salsa original), la hipotesis nul a es simplemente Ho: P = 0,5 No hay una tendencia general a preferir uno de los productos al otro Se utiliza un contraste de una cola para averiguar si existe una tendencia general a preferir la nueva salsa a la original. La alternativa de interes es que la mayoria de la poblacin prefiere el nuevo producto. Esta alternativa se expresa de la forma siguiente:

HI:P < 0,5 La mayorfa prefiere el nuevo producto (0 menos del 50% prefiere el producto original)

A continuacion, haHamos la probabilidad de observar en la muestra un resultado tan extremo 0 mas que el que se obtendrfa si la hipotesis nula fuera, en realidad, verdadera. Este valor es e! p-valor del contraste. Si representamos por medio de P(x) la probabilidad de observar x exitos (+) en n = 7 pruebas binomiales, cada una con una probabilidad de exito de 0,5, entonces la probabilidad binomial acumulada de observar dos o menos + puede obtenerse utilizando la formula binomial, una tabla binomial 0 un programa informatico como Microsoft Excel. El p-valor se halla por medio de la ecuacin 15.2: P-valor = P(x ~ 2) = P(x = 0) + P(x = 1) + P(x = 2) = 0,0078 + 0,0547 + 0,1641 = 0,2266 Con un p-valor tan grande, no podemos rechazar la hipotesis nula y concluimos que los datos no son suficientes para sugerir que los estudiantes prefieren la nueva salsa. Asimismo, podrfamos haber dicho que si adoptamos la regIa de decision rechazar Ho si hay dos 0 menos + en lamuestra, entonces la probabilidad de que la hipotesis nula se rechace cuando en realidad es verdadera es 0,2266. Por 10 tanto, ese contraste tiene un p-valor de 22,66 por ciento. Dado que el p-valor es el nive! de significacion mas bajo al que puede rechazarse la hipotesis nula, en este ejemplo la hipotesis nula puede rechazarse al 22,66 por ciento 0 mas. Es improbable que alguien estuviera dispuesto a aceptar un nivel de significacion tan alto. Una vez mas, concluimos que los datos no son estadfsticamente significativos para recomendar un cambio de salsa. Quiza nuestra decisin se debe a que tenemos un pequeno numero de observaciones muestrales. Para ilustrar un contraste de dos colas, supongamos que queremos averiguar si hay en la poblacion una preferencia general por cualquiera de los dos productos.

En ese caso, HI : P =F 0,5 y, por la ecuacion 15.3, el p-valor = 2P(x ~ 2) = 2(0,2266) = 0,4532.
Observese tambien que p-valor = P(x ~ 2) + P(x ~ S) = P(o) + P(l) + P(2) + P(S) + P(6) + P(7) = 0,4S32 Ese elevado p-valor sugerirfa que los datos no son suficientes para pensar que los estudiantes prefieren una de las salsas a la otra. Solo podrfamos rechazar la hipotesis nula y concluir que se prefiere una de las salsas con un nivel de significacion del 4S,32 por ciento.

Aproximacion normal
Como consecuencia del teorema del lfmite central, puede utilizarse la distribucion normal como aproximacion de la distribucion binomial si la el tamano de la muestra es grande. Los expertos discrepan sobre la definicion exacta de grande. Sugerimos que la aproximacin normal es aceptable si el tamano de la muestra es de mas de 20. Un factor de correccin de continuidad del estadfstico del contraste compensa la estimacion de datos discretos con una distribucion continua y permite aproximarse mas al p-valor.

EI contraste de signos: aproximacion normal (grandes muestras)


Si el numero n de observaciones muestrales no nulas es grande, el contraste de signos se basa en la aproximacion normal de la binomial de media y desviaci6n tfpica:

Media: J,l = nP = O,Sn Desviacion tfpica: (J=


EI estadfstico del contraste es

J nP(l - P) = J 0,2Sn = O,S vrn

S* - J,l Z=--(
J

S* - O,Sn
O,Svrn
(15.4) donde S* es el estadfstico del contraste corregido para tener en cuenta la continuidad y se define de la forma siguiente:

a) En un contraste de dos colas

S* = S + O,S si S < J,l 0 S* = S - O,S si S > J,l (15.5)


b) En un contraste de la cola superior S* = S - O,S (15.6) En un contraste de la cola inferior

S* = S + O,S (15.7)

Вам также может понравиться