Pruebas Parametricas y No Parametricas - Prueba de Signos, Aproximaciòn Normal A La Binomial y Prueba de Frank Wilcoxon Ejercicios Desarrollados

ESCUELA UNIVERSITARIA DE POSTGRADO
Curso : Estadistica
Profesor : Dr. Julio Damián Quispe Sánchez
Tema: Pruebas paramétricas y no paramétricas.
Integrantes: - Calle Hernandez, Gloris Emérita.

-Carranza Huarca, María Elizabeth.
-Ramirez Leon, Consuelo Herlinda.
-Sanchez Carruitero, Larry Alexander.
Julio 2015
Las pruebas de significación estadística pueden
clasificarse en:
PARAMETRICAS
-Las pruebas parametricas asumen los parametros de la
distribuciòn de la variable (media y varianza) y un tipo de
distribuciòn normal.
-Para usarlas deben cumplirse supuestos:
-Las variables tienen que ser cuantitativas y estar medidas en escalas de
intervalo o razón
-Los datos siguen una distribución normal
-Las varianzas son iguales
-Muestras grandes (n > 30)
-A veces se usa sin cumplir los supuestos pero debe usarse con cautela en
muestras màs pequeñas o con varianzas desiguales, en estos casos
prefiera usar pruebas noparametricas
Ejemplo:
NO PARAMETRICAS
Se deben usar con:
Datos de distribución libre (no necesariamente normal). Si un grupo tiene

distribución normal mientras el otro no.
Si se trata de datos cuantitativos, ordinales o nominales
Con varianza grande, un grupo con varianza 0 y el otro no
Al trabajar con muestras pequeñas.
Contrastan hipótesis que no son afirmaciones sobre parámetros y no

dependen de la forma de la distribución poblacional; por este hecho, se
denominan también pruebas de distribución libre. Ejemplos: Prueba signo
rango de Wilcoxon, prueba suma de rangos de Wilcoxon, prueba χ2 de Mc
Nemar,etc.
Las pruebas no parametricas no asumen acerca de los parametros de
distribuciòn ni se preocupa por el tipo de distribuciòn, sino trabajan con simple
ordenaciòn y recuento (asignando rankings) a los valores de la variable sin
importar la distribuciòn.
EJEMPLOS PRUEBAS PARAMETRICAS Y NO PARAMETRICAS
¿ QUÉ VENTAJAS TIENEN LAS
PRUEBAS PARAMETRICAS SOBRE
LAS NO PARAMETRICAS?
Las pruebas parametricas

tienen más poder de
contraste y pueden
analizar interacciones
entre variables
independientes
PASOS PARA LA PRUEBA DE HIPOTESIS
Paso 1: Establecer la hipótesis nula y la alternativa
Paso 2: Seleccionar el nivel de significación
Paso 3: Identificar el estadístico de prueba
Paso 4: Formular una regla de decisión
Paso 5: Tomar una muestra, llegar a una decisión
No rechzar la hipótesis nula Rechazar la nula y aceptar la alternativa

ALGUNAS DEFINICIONES
Hipótesis nula H0: Una afirmación acerca del

valor de un parámetro de la población.
Hipótesis Alternativa H1: Una afirmación que es

aceptada si la muestra provee la evidencia de que
la hipótesis nula es falsa.
Nivel de significación: La probabilidad de

rechazar la hipótesis nula cuando en realidad es
verdadera.
PRUEBA DE SIGNOS
RESEÑA HISTORICA
Es una de las pruebas no paramétricas más simples y la más antigua de
todas, pues está reportada en la literatura desde 1710 por John
Arbuthnott, quien hizo uso de este procedimiento, por primera vez, para
demostrar que la proporción de varones nacidos en Londres en un
determinado período de tiempo era significativamente mayor que la
proporción de mujeres. Se basa en los signos que generan la diferencia
de comparar los datos en una población con respecto a su media,
mediana o con respecto a otros datos tomados de la misma población,
presentándose así dos casos, el de una muestra sencilla (una sola
muestra) y el de una muestra en pares.
PRUEBA DE SIGNOS
La información muestral se transforma a un conjunto de signos + y -
Por lo general se usa para n<20.
Se usa para hacer pruebas de hipótesis acerca de la mediana de una

población de una variable continua.
Esta prueba esta basada en la distribución binomial con probabilidad de éxito de
p=1/2, puesto que la probabilidad de que el dato sea mayor o menor que la
mediana es ½.
Dada una muestra aleatoria simple de tamaño n definida por (X1,…,Xn) extraída de
una población con distribución continua, se requiere contrastar si su mediana es
igual a un cierto valor
Las distribuciones continuas son aquellas que

presentan un número infinito de posibles soluciones:
Ejemplo: El peso medio de los alumnos de una clase
puede tomar infinitos valores dentro de cierto intervalo
(42,37 kg, 42,3764 kg, 42,376541kg, etc); la esperanza
media de vida de una población (72,5 años, 72,513
años, 72,51234 años).
EJEMPLO 01
Las unidades ensambladas en un sistema rediseñado de ensamble de

productos será mayor que con el sistema antiguo, cuya mediana
poblacional es de 80 unidades por turno. No otorgando el beneficio de la
duda al sistema rediseñado, plantee la hipótesis nula y pruébela a un nivel
de significancia del 5%.
Nivel de significancia = Cantidad de error que estamos dispuestos a aceptar o dar como
valida la hipotesis del investigador.
0.05 se utiliza para proyectos de investigación de consumo
0.01 para el aseguramiento de la calidad
0.10 encuentas politicas
El cero no se
considera
diferentes
Media Arit: 86
Positivos: 9 Negativos: 2 Suma : 11=n
Resulta apropiada una prueba no paramétrica porque no se hacen suposiciones
con respecto a la forma de la distribución poblacional. Utilizando la prueba del
signo, las hipótesis nula y alternativa, en términos de la proporción de signos
positivos para las diferencias.
En la Tabla se observa que en el cuarto tumo muestreado, el número de

unidades ensambladas resultó ser exactamente igual que el valor hipotético de
la mediana poblacional. Por ello, esta observación se omite de cualquier
análisis ulterior, y se tiene una muestra de tamaño efectivo de n =11. De los
once signos de las diferencias que se reportan en la Tabla son positivos. La
prueba debe llevarse a cabo utilizando un nivel de significancia del 5%.
Como el tamaño de la muestra es n < 30, la base apropiada para esa prueba es
la distribución binomial.
Utilizando el enfoque del valor P para pruebas de hipótesis, como se describe
en la sección 10.6, se determina la probabilidad de observar 9 o más signos
positivos en 11 observaciones, dado que la proporción poblacional de signos
positivos es 0.50, utilizando el apéndice 2 para obtener las probabilidades
binomiales:
n=numero de ensayos
x = variable definida como el numero de exitos
= probabilidad de éxito de cada ensayo
Como el valor P correspondiente al resultado muestral es menor que 0.05,
se rechaza la hipótesis nula a un nivel de significancia del 5% para esta
prueba de un criterio de calificación. Es decir, la probabilidad de observar
un número tan grande (o mayor) de signos positivos cuando la hipótesis
nula es cierta es menor de 0.05 y, específicamente, la probabilidad es
0.0328. Por ello, se acepta la hipótesis alternativa y se concluye que la
producción mediana por tumo es mayor de 80 unidades para el nuevo
sistema de ensamble.
EJEMPLO 02
Los siguientes datos constituyen una muestra aleatoria de 15 lecturas del octanaj
e de cierta clase de gasolina.
Use la prueba de signos para probar la hipótesis nula u(media)=98.5 contra la hip
ótesis alternativa u<98.5, en el nivel de significancia 0.05.
Sustituya cada valor mayor que 98.5 con un signo positivo y cada valor meno
r que 98.5 con un signo negativo. El penúltimo valor es exactamente 98.5 y
éste se eliminará. Los valores de la muestra entonces dan:
El cálculo es precisamente x( numero de signos positivos); aquí, x=2.
Ya que uno de los valores equivale exactamente a 98.5, el tamaño de la mue

stra para la prueba de signo de una muestra en sólo n=14.
3.El estadistico de la prueba es x

4.Aquí, x=2. La tabla demuestra que para n=14 y p=0.5 la probabilidad de qu
e x≤2 es 0.001 + 0.006=0.007. Por tanto, el valor de p es 0.007.
5.Dado que 0.007 es menor que 0.05, se debe rechazar la hipótesis nula.
USO DE LA APROXIMACION NORMAL A LA
BINOMIAL
Es una distribución de probabilidad para variables discretas
Se tienen dos resultados posibles: éxito o fracaso
La información que se conoce en las situaciones es:
n: tamaño de la muestra
P: probabilidad de exito
q: probabilidad de fracaso
Las distribuciones discretas son aquellas en las que la

variable puede pude tomar un número determinado de
valores:
Ejemplo: si se lanza una moneda al aire puede salir cara o

cruz; si se tira un dado puede salir un número de 1 al 6;
en una ruleta el número puede tomar un valor del 1 al 32.
COMPARATIVO DIST. BINOMIAL Y NORMAL
VS
Se usa cuando la muestra es mayor a 10

EJEMPLO
El departamento de investigación de mercado de Cola Inc.,tiene la tarea de probar una nu

eva bebida. Se consideran dos versiones: un refresco más bien dulce y uno un tanto amar
go. La prueba de preferencia que se realizará consiste en una muestra de 64 consumidore
s. Cada uno de éstos degustará las dos bebidas de cola, la dulce (con la etiqueta A) y la a
marga (con la etiqueta B), e indicará su preferencia.
Realice una prueba de hipótesis para determinar si hay una diferencia entre las preferenci
as por el refresco dulce o por el amargo.
Utilice un nivel de significancia de 0.05.
USO DE LA APROXIMACION NORMAL A LA BINOMIAL
1.Se calcula la media
2.La desviación estandar
3.Nivel de significancia
4. Se reducen ecuaciones
5. El estadístico de prueba
6. Si el numero de signos “+” más o “-” menos es mayor que n/2, emplee la siguiente fórm
ula:
Si el numero de signos “+” más o “-” menos es menor que n/2, emplee la siguiente fórmula:
7. Se formula la hipótesis nula y la alternativa
8.Se selecciona el nivel de significancia . 0.05

9. Se selecciona el estadístico de prueba:
El estadistico de prueba es un valor obtenido de la información de la muestra

para compararlo con el criterio de contraste y rechazar o aceptar la hpótesis.
Un estadigrafo o estadistico en un valor calculado a partir de una muestra de
datos para determinar una estimación de un parametro de la población o para
extraer conclusiones de los datos. Por ejemplo para determinar una estimacion
de la media poblacional, calculamos la media muestral con los datos de una
muestra y a partir de ese valor estimamos el parametro real.
10. Se formula la regla de decisión: se trabajara con el valor critico 1.96 (para un nivel de si
gnificancia de 0.05), por lo tanto NO RECHACE Ho y ACEPTE H1.
11. A la preferencia por el refresco “A”, se le asigno un signo “+”, y al “B” un signo “-”. De la
s 64 personas de la muestra, 42 prefirieron el refresco “A”.
Por lo tanto, hay 42 signos mas, como 42 es mayor que n/2 = 64/2 se empleara:
Reemplazando:
El valor z calculado de 2.38 es mayor que el valor crítico 1.96.
En consecuencia se debe rechazar la Hipótesis nula de que no hay diferencia con un
nivel de significancia de 0.05
CONCLUSION: Los consumidores prefieren el refresco de cola dulce al otro, es decir el

refresco A.
Frank Wilcoxon (1892
1965) Nació el 2 de
septiembre de 1892 en
Cork, Irlanda fue un
químico y estadístico
estadounidense conocido
por el desarrollo de
diversas pruebas
estadísticas no
paramétricas.
 Modelo estadístico que corresponde a un
equivalente de la prueba t de student, pero se
aplica en mediciones en escala ordinal para
muestras dependientes .
 Esta prueba es más potente que la de los

signos, pues tiene en cuenta el aumento o
disminución de la variable y la magnitud del
cambio.
Se usa:
Para comparar dos muestras relacionadas; es decir, para
analizar datos obtenidos mediante el diseño antes-después
(cuando cada sujeto sirve como su propio control) o el
diseño pareado (cuando el investigador selecciona pares de
sujetos y uno de cada par, en forma aleatoria, es asignado a
uno de dos tratamientos). Pueden existir además otras
formas de obtener dos muestras relacionadas.
 Es el estadístico de elección cuando no se
cumplen los supuestos de la t de student y
se tienen medidas repetidas.
 Cuando el tipo de medición no cumpla con

los requisitos que la prueba t de student
exige, la de wilcoxon es una alternativa de
aceptable eficacia para contrastar hipótesis
 Las puntuaciones correspondientes a 15
alumnos antes y despues de realizar un
curso de estadistica son las siguientes :
 Antes : 5,6,6,8,7,5,4,3,7,5,6,6,3,5,5
 Despues : 6,6,7,9,6,4,6,3,8,8,4,7,2,7,8
 H0 W(+) = W(-)
 Ha W(+) ≠ W(-)
•H0 = las puntuaciones entre los 15 alumnos antes y

despues de realizar el curso de estadistica son iguales
•Ha = las puntuaciones entre los 15 alumnos antes y
despues de realizar el curso de estadistica son
diferentes
La prueba consiste en calcular las diferencias entre los
valores y ordenarlas de menor a mayor por valor
absoluto
Una vez ordenadas las diferencias, se numeran de 1
a n, siendo n el número de elementos de la muestra;
al número asignado se le denomina rango.
El rango 1 se asigna a la mínima diferencia observada en
valor absoluto, y así sucesivamente hasta n, cuyo rango
corresponde a la máxima diferencia. Si hay empate, se
asigna a cada diferencia empatada la media de los rangos
implicados en el empate
Se asigna el signo menos a las diferencias negativas y el signo más a las
diferencias positivas. El signo (-), en este caso, significa que la puntuación
ha aumentado, puesto que al restar ANTES-DESPUÉS las puntuaciones que
han aumentado tienen diferencia negativa. El signo en esta prueba es un
símbolo diferenciador y debe tenerse cuidado con su interpretación.
Una vez ordenados los datos, se suman los rangos de las diferencias
positivas, W+, y negativas, W-, y se elige el menor de los dos. Los casos en
los que la diferencia es cero se ignoran.
• W+ = 23,5 y los negativos W- = 67,5.
• Como valor W se considera el menor, es decir, 23,5.
• n = 15
• El punto crítico para una significación de ( 0,05) es
25, como el valor W obtenido' es 23,5 que es menor
se rechaza la hipótesis nula y se concluye que hay
diferencias estadísticamente significativas entre las
dos variables y, consecuentemente, el cursillo ha
tenido influencia en las puntuaciones. Observe que
con los mismos datos la prueba de los signos no
detectó diferencias estadísticamente significativas,
pero esto no es una contradicción, la prueba de
Wilcoxon es estadísticamente más potente porque
usa más información, tiene en cuenta el signo y la
magnitud de las diferencias.
• Para muestras mayores de 25 se puede hacer una
aproximación a la normal, con la media y desviación típica
definidas por las siguientes expresiones:
µw = σw =
A partir de las expresiones anteriores se deduce la expresión

para el cálculo de Z:
Z=
 Seleccione en el menú Análisis, Pruebas no paramétricas, y en el
listado de Pruebas disponible: 2 muestras relacionadas. Aparece la
pantalla siguiente:
En la primera tabla encabezada por rangos, se muestran los rangos
positivos, los rangos negativos y los empates.
En la tabla encabezada por estadísticos de contraste se indica el valor
Z obte. nido. SPSS ha realizado la aproximación a la normal, aunque el
tamaño de la muestra es menor que 25, en este caso la aproximación
no es adecuada, por eso el valor no es estadísticamente significativo.
Para muestras menores que 25 hay que consultar las tablas.
 En un estudio realizado con 10 atletas, a los cuales se les
suministro un energizante para aumentar su rendimiento
fisico, y ver el numero de vueltas que realizan en un test
de Cooper antes y despues de suministrado el
energizante.
 H0 W(+) = W(-)
 Ha W(+) ≠ W(-)
 H0= El numero de vueltas realizadas por

los 10 atletas antes y después de
suministrado el energizante son iguales.
 Ha= El numero de vueltas realizadas por
los 10 atletas antes y después de
suministrado el energizante son diferentes.
Ejemplo: Los datos corresponden a una muestra de 8
pacientes varones de 45 a 55 años de edad. Son lecturas
de colesterol total tomadas tras 12 horas de ayuno y
repetida una hora después de comer.¿Hubo un incremento
significativo de los niveles de colesterol después de la
comida?
Paciente Ayuno Después di Rango de rangos
(D-A) |di| + -
1 180 185 5 1 1
2 210 225 15 4 4
3 195 215 20 5 5
4 220 245 25 6 6
5 210 200 -10 2,5 2,5
6 190 220 30 7 7
7 225 235 10 2,5 2,5
8 215 250 35 8 8
33,5 2,5
Solución:
a.- Hipótesis
H0 : No hubo incremento significativo de colesterol total
después de la comida.
H1 : Hubo incremento significativo de colesterol total
después de la comida.
b.- Cálculo del contraste T:

T = 33,5 (ó T = 2,5)
c.- Cálculo de zT
Con:
En este caso n = 8 (ya que no hubo ningún par de datos iguales)
d.- Valor de p:
p = 1 – 0,9850
p = 0,015
e.- Decisión y Conclusión:
Siendo p = 0,015 (< 0,05), se rechaza la hipótesis nula.
Se concluye que hubo un incremento estadísticamente
significativo de los niveles de colesterol después de la comida (p
= 0,015).
2.- Prueba suma de rangos de
Wilcoxon.
Se usa:
Para comparar dos poblaciones independientes.
Cuando la variable es:
 Cuantitativa medida en escala ordinal.
 Cuantitativa medida en escala de intervalo o de
razón, pero la variable en una o en las dos
poblaciones no tiene distribución normal. En este
caso, se usa en lugar de la prueba t Student para
dos muestras independientes.
Prueba de la Suma de Rangos
de Wilcoxon
• Para comparar dos grupos
• Equivalente no paramétrico de la prueba T.
• Consiste de 3 pasos básicos…
Paso 1
• Asignar rangos ascendentemente para cada
grupo
• Si se dan valores iguales promediar sus rangos
Paso 2
• Sume los rangos en el grupo con el tamaño de
muestra más pequeño.
• Si los dos grupos tienen el mismo tamaño, se
debe elegir uno.
• W = suma de todos los rangos en el grupo con el
tamaño de muestra más pequeño.
Paso 3
• Compare esta suma con el valor hallado en la tabla de
Wilcoxon.
• Hallar la fila correspondiente al tamaño del grupo con la
muestra más pequeña (n).
• Si el valor de W es menor que el hallado en la tabla, se
rechaza la hipótesis nula, es decir, hay diferencias
significativas.
Ho: No existen diferencias significativas entre medias

Ha: Existen diferencias significativas entre medias
Ejemplo: Se tomó una muestra de 10 universitarias y otra de 10
universitarios para determinar si las mujeres tenían actitud más
positiva que los varones frente a la Iglesia católica. Los puntajes
en un cuestionario de actitudes fueron:( mayor puntaje, actitud
más positiva).
¿ La población de universitarias, tiene actitud más
positiva que los universitarios frente a la Iglesia católica?
Mujeres R1 Varones R2
25 17 20 11
28 20 15 4
26 18 16 5
20 11 12 2
18 7 19 8,5
24 16 23 15
22 14 11 1
20 11 13 3
21 13 17 6
19 8,5 27 19
Solución:
a.- Hipótesis:
H0 : mediana de puntajes de las mujeres  mediana de varones.
H1 : mediana de puntajes de las mujeres > mediana de varones.
En otros términos:
H0: Las mujeres no tienen actitudes más positivas que los
varones frente a la Iglesia Católica .
H1: Las mujeres tienen actitudes más positivas que los varones
frente a la Iglesia Católica.
b.- Suma de rangos (W)

W = suma de rangos.
W = 74,5
c.- Cálculo de zW
d.- Valor de p
Siendo la prueba unilateral:
p = 0,0104
e.- Decisión y Conclusión:

Decisión: Siendo p = 0,0104 ( < 0,05), se rechaza la
hipótesis nula.
Conclusión: Las mujeres tienen actitudes más positivas
que los varones frente a la Iglesia Católica (p = 0,0104).
La prueba explicada proporciona el mismo resultado que

la Prueba U de Mann-Whitney.
64
65
66
67
68
69
70
71
72
73
74

Pruebas Parametricas y No Parametricas - Prueba de Signos, Aproximaciòn Normal A La Binomial y Prueba de Frank Wilcoxon Ejercicios Desarrollados

Загружено:

Сведения о документе

Оригинальное название

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

Pruebas Parametricas y No Parametricas - Prueba de Signos, Aproximaciòn Normal A La Binomial y Prueba de Frank Wilcoxon Ejercicios Desarrollados

Загружено:

Авторское право:

Доступные форматы

ESCUELA UNIVERSITARIA DE POSTGRADO

Profesor : Dr. Julio Damián Quispe Sánchez

Tema: Pruebas paramétricas y no paramétricas.

Integrantes: - Calle Hernandez, Gloris Emérita.

Se deben usar con:

Datos de distribución libre (no necesariamente normal). Si un grupo tiene

Contrastan hipótesis que no son afirmaciones sobre parámetros y no

Las pruebas parametricas

Paso 1: Establecer la hipótesis nula y la alternativa

Paso 2: Seleccionar el nivel de significación

Paso 3: Identificar el estadístico de prueba

Paso 4: Formular una regla de decisión

Paso 5: Tomar una muestra, llegar a una decisión

No rechzar la hipótesis nula Rechazar la nula y aceptar la alternativa

Hipótesis nula H0: Una afirmación acerca del

Hipótesis Alternativa H1: Una afirmación que es

Nivel de significación: La probabilidad de

La información muestral se transforma a un conjunto de signos + y -

Por lo general se usa para n<20.

Se usa para hacer pruebas de hipótesis acerca de la mediana de una

Las distribuciones continuas son aquellas que

Las unidades ensambladas en un sistema rediseñado de ensamble de

En la Tabla se observa que en el cuarto tumo muestreado, el número de

El cálculo es precisamente x( numero de signos positivos); aquí, x=2.

Ya que uno de los valores equivale exactamente a 98.5, el tamaño de la mue

3.El estadistico de la prueba es x

La información que se conoce en las situaciones es:

Las distribuciones discretas son aquellas en las que la

Ejemplo: si se lanza una moneda al aire puede salir cara o

Se usa cuando la muestra es mayor a 10

El departamento de investigación de mercado de Cola Inc.,tiene la tarea de probar una nu

1.Se calcula la media

2.La desviación estandar

7. Se formula la hipótesis nula y la alternativa

8.Se selecciona el nivel de significancia . 0.05

El estadistico de prueba es un valor obtenido de la información de la muestra

CONCLUSION: Los consumidores prefieren el refresco de cola dulce al otro, es decir el

 Esta prueba es más potente que la de los

 Cuando el tipo de medición no cumpla con

•H0 = las puntuaciones entre los 15 alumnos antes y

A partir de las expresiones anteriores se deduce la expresión

 H0= El numero de vueltas realizadas por

b.- Cálculo del contraste T:

Ho: No existen diferencias significativas entre medias

b.- Suma de rangos (W)

e.- Decisión y Conclusión:

La prueba explicada proporciona el mismo resultado que

Вам также может понравиться