Вы находитесь на странице: 1из 41

PRUEBAS NO PARAMÉTRICAS

Se utilizan cuando no se conoce la distribución o no se cumplen los


supuestos de la distribución normal

DISTRIBUCIÓN CHI-CUADRADO

Permite relalizar pruebas de bondad de ajuste y pruebas de independencia

f(X2)
Chi Cuadrado de la muestra
gl =1

Alfa = Zona de rechazo

gl =10

X2
Distribución Chi-Cuadrado

PRUEBAS DE BONDAD DE AJUSTE

Medidas sobre que tan cerca se ajustan los datos muestrales observados a una forma
de distribución particular planteada como hipótesis
Si el ajuste es razonablemente cercano, puede concluirse que sí exite la forma de distribución
planteada como hipótesis

Por ejemplo:

Ho: La distribución poblacional es uniforme


Ha: La distribución poblacional no es uniforme

Se usa el estadístico Chi-Cuadrado

K
 Oi− Ei2
χ =∑
2
i=1 Ei

Oi = Frecuencia de los eventos observados en los datos muestrales

Ei = Frecuencia de los eventos esperados si la hipótesis nula es correcta


Para que la prueba sea confiable Ei >= 5. De otra forma se combinan las categorias para
cumplir con este requisito.
K = Número de categorías o clases

Ejemplo:

Se venden n = 48 botes en 4 meses. Si la demanda es uniforme se esperaría que se vendieran


12 botes / mes. La cantidad real que se vendió fue:

Ventas (Oi) Ventas (Ei)


Tipo de bote observadas esperadas
A 15 12
B 11 12
C 10 12
D 12 12
DISTR.CHI

Entonces el estadístico Chi Cuadrado de la muestra es = 1.17 el valor P corresp.= 0.76

El Chi Cuadrado de excel se determina con alfa = 0.05 y K - 1 grados de libetad = 3

Chi cuadrado de excel = 7.815

El estadístico Chi cuadrado calculado de 1.17 es menor al de excel de 7.815 por tanto se acepta
la hipótesis nula

PRUEBA.CHI.INV
Otro ejemplo:

Frecuencias
. esperadas
......... E i=npi
Ho: Se mantuvo el patrón de 60% créditos comerciales, 30% extranjeros y 10% personales
Ha: No se mantuvo el patrón deseado

Tipo de Frec. (Oi) Frec. (Ei)


Crédito Observada Esperada
Comercial 62 51 60%
Personal 10 8.5 10%
Extranjero 13 25.5 30%

TOTAL 85 85 DISTR.CHI

Estadístico Chi Cuadrado de la muestra = 8.76 Valor P = 0.01


Chi Cuadrado de excel con alfa 0.1 y
gl = K (Categorías) - 1 = 2 es 4.605 Ho se rechaza, no se mantuvo el patrón

PRUEBA.CHI.INV
PRUEBA DE NORMALIDAD

Ho: Los niveles de llenado se ditribuyen normalmente


Ha: Los niveles de llenado no se ditribuyen normalmente

La presión de llenado de tanques de immersión promedio debe ser de 600 lb con una desviación
estándar de 10 lb.
Se mide el nivel de llenado de 1000 tanques:

Frec. (Oi) Probabilidad Frec. (Ei)


PSI Observada de ocurrencia Esperada
0 - 579.9 20 0.02 228
580 - 589.9 142 0.14 135.9
590 - 599.9 310 0.34 341.3
600 - 609.9 370 0.34 341.3
610 - 619.9 128 0.14 135.9
620 - arriba 30 0.02 22.8

TOTAL 1000 1 1000

Por ejemplo para las frecuencias por debajo de 580:

Z = (X-Media) / Desv. Estándar = (580 - 600) / 10 = -2

P(Z<= -2) = 0.0228

Para el caso del área entre 580 y 590:

Z = (X -Media) / Desv. Estándar = (590 - 600) / 10 = -1

P(Z<=-1) = 0.16

P(580 < X < 590 ) = 0.1598 - 0.0228 = 0.14

Etcetera DISTR.CHI

El estadístico Chi Cuadrado de la muestra es = 8.63 Valor P = 0.12

El Chi Cuadrado de excel para alfa = 0.05 y K - 1 = 6 - 1 = 5 Gl. Es 11.07

Por tanto no se rechaza Ho y se sigue una distribución normal

NOTA: Si la media y desviación estándar poblacionales no fueran conocidas se hubieran


tenido que estimar de los datos muestrales entonces m = 2 y los gl. = K - m - 1 = 3

PRUEBA.CHI.INV

TABLAS DE CONTINGENCIA - PRUEBAS DE INDEPENDENCIA

Permite probar la hipótesis de independencia de dos variables, por ejemplo:


para probar la efectividad de un nuevo insecticida por 100 consumidores:
A - Clasifica- B - Ubicación
ción Urbano Rural Total f = Filas = 3
> Promedio 20 11 31 c = Columnas = 2
Promedio 40 8 48
< Promedio 15 6 21
Total 75 25 100

Las hipótesis son:

Ho: La clasificación y la ubicación son independientes


Ha: La clasificación y la ubicación no son independientes

Las frecuencias esperadas se determinan como sigue:

Eij = (Suma renglón i x Suma columna j ) / Total

E11 = 31 * 75 / 100 = 23.3


E12 =48 * 75 / 100 = 36
Etcetera

La tabla completa queda como sigue:

A - Clasifica- B - Ubicación
ción Urbano Rural Total
> Promedio 20 11 31
23.3 7.75

Promedio 40 8 48
36 12

< Promedio 15 6 21
15.8 5.25

Total 75 25 100
DISTR.CHI

El estadístico Chi Cuadrado de la muestra = 3.76 Valor P correspondiente = 0.15

El estadístico de excel se determina con alfa = 0.1 para (f-1)(c-1) gl = 2 gl. Dando 4.605

Por tanto no se rechaza Ho y la Ubicación y Clasificación son independientes

PRUEBA.CHI.INV
nto se acepta
na desviación

se hubieran
PRUEBA DEL SIGNO
Es una prueba de hipótesis que compara las distribuciones de dos poblaciones.

Se asume que se tienen datos de antes y después para una muestra y


se desea comparar estos conjuntos de datos correspondientes.
No se tiene interés en la diferencia sino únicamente en si resulta un signo + o -.

m = número de signos menos y p = número de signos más

Ho: m = p Ho: m <= p Ho: m >= p


Ha: m<> p Ha: m > p Ha: m < p

Por ejemplo se trata de probar la efectividad de un juego promocional en las ventas en tiendas:

Ventas antes Ventas con


Tienda del juego el juego Signo
1 42 40 + Los signos menos indican incremento
2 57 60 - de las ventas ya que se resta el Antes
3 38 38 0 menos el Después
4 49 47 +
5 63 65 -
6 36 39 -
7 48 49 -
8 58 50 +
9 47 47 0
10 51 52 -
11 83 72 +
12 27 33 -

Se trata de probar la hipótesis:

Ho: m <= p
Ha: m > p

Ignorando los 0's se tienen 6 signos más y 4 signos menos para un total de n = 10 signos.

Si probabilidad de ambos signos es de pi = 0.5. 0.02

De la tabla C del apéndice III o DISTR.BINOM, la probabilidad de 6 o más signos menos es:

P( m >= 6 | n = 10, pi = 0.5) = 1 - P( X <= 5) = 1 - 06230 = 0.3770

o P ( p <= 4 | n = 10, pi = 0.5) = 0.377 DISTR.BINOM(4,10,0.5,verdadero)

Como este valor de P = 0.377 es mayor que un alfa de 0.05 entonces no se rechaza Ho
indicando que el juego promocional no incremena las ventas
Para el caso de muestras grandes n >= 30 se puede aproximar al uso de Z, con k = número de
signos más o menos. Si k < n/2 se utiliza k + 0.5 y en caso contrario se usa k - 0.5 para
utilizar la distribución normal que es continua.

k ±0.5−0.5n
Z=
0. 5  n

Por ejemplo al comparar dos tipos de 10 bandas en su desgaste se obtuvieron,ignorando los 0s:

m = 8, p = 1

Si Ho: m = p
Ha: m<> p

Usando la tabla C del apéndice III o la función e Excel DISTR.BINOM

P (p <= 1 | n = 9, pi = 0.5) = 0.0195

o P (m >= 8 | n = 9, pi = 0.5) = 1 - P(m <= 7) = 1 - 0.9805 = 0.0195

Con Alfa /2 = 0.025 siendo mayor al valor P de la probabilidad se


rechaza la hipótesis Ho y el desgaste es diferente

Usando el estadístico Z se tiene:


rando los 0s:
Unidad 14 Pruebas no paramétricas
Pruebas Chi cuadrada
Ejercicio 1

Frecuencia (Oi)
Frecuencia (Ei)
Tipos de Créditoobservada esperadas Oi-Ei (Oi-Ei)2 (Oi-Ei)2 / Ei
Autos 55 66.66 -11.66 135.96 2.04
Estudiantes 47 66.66 -19.66 386.52 5.8
Propósitos
generales 98 66.66 31.34 982.2 14.73
200 199.98 22.57

Ho: Los tres tipos de crédito se conceden en la misma proporción


Ha: Los tres tipos de crédito no se conceden en la misma proporción

El Chi Cuadrado de excel se determina con alfa = 0.05 y K - 1 grados de libetad = 2


Chi cuadrado de excel = 5.99

Dado que el valor k1 = 22.57 > 5,99 se rechaza la Ho:

Ejercicio 2

Frecuencia (Oi)
Frecuencia (Ei)
Tipos de Créditoobservada esperadas Oi-Ei (Oi-Ei)2 (Oi-Ei)2 / Ei
Autos 55 50 5 25 0.5
Estudiantes 47 50 -3 9 0.18
Propósitos
generales 98 100 -2 4 0.04
200 200 0.72

Ho: Se mantuvo el patrón deseado para créditos generales el 50%, para autos el 25% y para estudiantes
Ha: No se mantuvo el patrón deseado para créditos generales el 50%, para autos el 25% y para estudiant

El Chi Cuadrado de excel se determina con alfa = 0.05 y K - 1 grados de libetad = 2


Chi cuadrado de excel = 5.99

Dado que el valor k1 = 0.72 menor que 5,99 no se rechaza la Ho:

PRUEBA DE SIGNOS
Ejercicio 6

Publicidad 1 Publicidad 2 Diferencia


8 7 1
9 3 6 Mas 11
5 2 3 Menos 3
7 8 -1
9 5 4
4 5 -1
3 7 -4
8 2 6
9 1 8
5 3 2
7 7 0
8 2 6
8 2 6
7 3 4
9 8 1

Ho:m= p
Ha: m≠ p
P  m≤3∣n=1 4, π=0.5 =0.2 8 7

P  m≥11∣n=14,π=0. 5 =1− p  m≤10 =1−0. 9713 =0 . 0287


Debido a queα= 0.10/2 = 0. 05  0.0287 Se rechaza la H
.

Ejercicio 7

Con grasa Sin grasa Diferencia


10 15 -5
12 13 -1 Mas 3p
14 12 2 Menos 6m
18 9 9
17 17 0
18 19 -1 n= 9
5 3 2
21 27 -6
6 12 -6
8 14 -6

Ho:m≥ p
Ha: m≻ p
P  m≻ 3∣n=9 ,π=0. 5 =0 .2 5 3 9
P  m≥6∣n=9,π=0. 5 =1− p  m≤5 =1−0. 7461 =0. 2539
D ebido a queα= 0.10/2= 0. 05 ≻ 0.253 N o se rechaza la .H

PRUEBA U DE MANN-WHITNEY
Ejercicio 10

Ho:U 1≥U 2
Ha :U 1 ≻ U 2
Mujeres Rango Hombres Rango
2.12 1
3.02 2
3.15 3
3.42 4
3.72 5
4.42 6
4.45 7
4.87 8
5.12 9.5 5.12 9.5
5.42 11
5.72 12
5.83 13
10∗10
6.43 14 μu= =50
6.49 15 2
8.17 16
8.79 17

66.5
8.89
9.02
9.73
18
19
20
143.5
σ u=
 10∗10  10101 
12
=13

∑ R1=6 6.5 11. 5−50


Z= =−2. 91
13. 22
∑ R 2=143 . 5
Para un valor de alfa del 10%
-1.28
1 0∗ 1 01 
U 1=1 0∗1 0 −66.5=8 8.5 Conclusiones: Dado que Z=-2.9 se encuentra en la zo
2 se rechaza la Ho y se acepta la Ha.

10∗ 101 
U2=10∗10 −143.5=11.5
2

Ejercicio 12

n1= 42
H o:U 1=U 2 n2= 35
42∗35
μ u= =735
H a:U 1≠U 2 2

σ u=
 42∗35  42351 
12
=97 . 74
930 . 5−735
∑ R1=1833 . 5 Z= =2
97 . 74
∑ R 2=1169. 5

Para un valor de alfa del 5% Z=1.96


4 2∗ 4 21 
U 1=4 2∗3 5 −18 3 3.5=5 3 9.5
2 Conclusiones: Dado que Z=1.96 se encuentra en la zo
se rechaza la Ho y se acepta la Ha.
35  351 
U 2=42∗35 −1169.5=930.5
2

CORRELACIÓN DE RANGOS DE SPERMAN


Ejercicio 14 α=5
Clasificación Clasificación
del ingreso X Consumo Y
Ingreso Consumo di= x-y x-ycuadrado ¿El coeficiente de correlación
97 55 1 3 -2 4 sugiere alguna relación?
58 63 6 2 4 16
69 54 3 4 -1 1
47 37 8 9 -1 1
58 45 6 7 -1 1
38 38 9 8 1 1
91 71 2 1 1 1
67 52 5 6 -1 1
68 53 4 5 -1 1
47 37 8 9 -1 1
48 37 7 9 -2 4
32

6 ∑ di2
H o: P s=0
rs=1− No existe relación entre las dos variables
n  n 2−1 
H a: P s≠0
632 192
rs=1− =1− =0 .85
Existe relación entre las dos variables
11  11 −1 
2 1320
De tabla n apendice 3
Para un valor alfa del 5% y n=11 r=0.6091

Dado que rs= 0.85 mayor que r= 0.6091 la Ho.se rechaza.

Ejercicio 15

Clasificación Clasificación
del Tiempo Nota Y
Tiempo Nota X di= x-y x-ycuadrado
21 67 2 2 0 0
18 58 3 4 -1 1 ¿El coeficiente de correlación
15 59 5 3 2 4 sugiere alguna relación?
17 54 4 5 -1 1
18 58 3 4 -1 1
25 80 1 1 0 0
18 14 3 9 -6 36
4 15 8 8 0 0
6 19 6 7 -1 1
5 21 7 6 1 1
45
H o: P s=0
645 270
rs=1− =1− =0.72
 2
10 10 −1  990
645 270 No existe relación entre las dos variables
rs=1− =1− =0.72
10  102−1  990
H a: P s≠0
Existe relación entre las dos variables

De tabla n apendice 3
Para un valor alfa del 10% y n=10 r=0.5515

Dado que rs= 0.72 mayor que r= 0.5515 la Ho.se rechaza.

PRUEBA DE KRUSKAL-WALLIS
Ejercicio 18

Planta 1 Rango Planta 2 Rango Planta 3 Rango


25 6 31 12.5 29 10.5
36 15 28 8.5 28 8.5
38 16 39 17 22 4
31 12.5 41 18 26 7
29 10.5 21 3 24 5
33 14 20 1.5 20 1.5
74 60.5 36.5

K=
12
n  n1  [∑ ] R 2i
ni
− 3  n1 

K=
12
1 8 1 81  6 [
7 42 6 0.5 2 3 6. 52

6

6 ]
− 3  1 81  =0.0 3 5 9 1 2. 6 66 1 0. 0 4 12 2 2.0 4−5 7=0.0
K=
12
1 8 1 81  6
 [
7 42 6 0.5 2 3 6. 52
6

6 ]
− 3  1 81  =0.0 3 5 9 1 2. 6 66 1 0. 0 4 12 2 2.0 4−5 7=0.0

Para un alfa de 5% k-1 gl

K 0.0 5,2 =5. 9 9 1

Dado que K =4.0 6≻ 5.9 9 1 la Ho no se rechaza.

Ejercicio 19

Mezcla 1 Rango Mezcla 2 Rango Mezcla 3 Rango Mezcla 4


3 2.5 3 2.5 10 25.5 8
6 7.5 4 4 8 14 10
9 21.5 8 14 9 21.5 11
5 5 9 21.5 8 14 8
6 7.5 7 9.5 7 9.5 8
44 51.5 84.5

K=
12
2 0 2 01  5 [
4 42 5 1.52 8 4.52 9 4.52

5

5

5 ]
−3  2 01=0 .0 2 8 3 8 7. 25 3 0. 4 51 4 2 .80 54 4 6 .51 2

K=0.0 268 8 .81 02−6 =3 1 2.77


Para un alfa de 5% k-1 gl

K 0 .0 5,3=7.8 1 5
K 0 .0 5,3=7.8 1 5

Dado que K =1 2 7.7≻ 7 ,8 1 5 la Ho se rechaza.

Determinación de diferencias estadísticamente significativas

44 5 1.5 8 4.5 9 4.5


R 1= =8.8 R 2 = =1 0.3 R 3= =1 6.9R 4 = =1 8.9
5 5 5 5
R 1− R 2=8. 8−10 . 3=−1. 5 R 2 −R 4=10.3−18.9=−8.6

R 1−R 3=8. 8−16. 9=−8. 1 R 3 − R 4 =16. 9−18. 9=−2


R 1− R 4=8 . 8−18. 9=−10. 1

R 2 −R3=10.3−16.9=−6.6

Valor critíco Ck


C k = 7.815 [ 20201 1 1
12 ][ ]
 = 10. 45
5 5

Dado que R 1−R 2=−1.5≻No1 0.4


hay5diferencia entre la Mezcla 1 y la Mezcla 2

Dado que R 1−R 3=−8.1≻No1 hay


0.4 5diferencia entre la Mezcla 1 y la Mezcla 3

Dado que R 1−R 4=−1 0.1≻No1 hay


0.4 5diferencia entre la Mezcla 1 y la Mezcla 4

Dado que R 2 −R3=−6 .6≻No1 hay


0.4 5diferencia entre la Mezcla 2 y la Mezcla 3

Dado que R 2 −R 4=−8.6≻No1 hay


0.4 5diferencia entre la Mezcla 2 y la Mezcla 4

Dado que R 3−R 4 =−2≻No1 0.4


hay5diferencia entre la Mezcla 3 y la Mezcla 4
métricas

el 25% y para estudiantes 25%


tos el 25% y para estudiantes 25%
3 =0 . 0287
e rechaza la H
. o
61 =0. 2539
se rechaza la .H o
∗10  10101 
=13 . 22

−50
=−2. 91
2

=-2.9 se encuentra en la zona de rechazo

351 
=97 . 74
=1.96 se encuentra en la zona de rechazo

El coeficiente de correlación de rangos de Spearman


ugiere alguna relación?
α =10

El coeficiente de correlación de rangos de Spearman?


ugiere alguna relación?
4 12 2 2.0 4−5 7=0.0 3 51 7 4 4.7 4 1−5 7=4. 0 6
4 12 2 2.0 4−5 7=0.0 3 51 7 4 4.7 4 1−5 7=4. 0 6

Ejercicio 19

Rango Mezcla 1 Rango Mezcla 2 Rango Mezcla 3


14 3 1.5 3 1.5 10
25.5 6 5.5 4 3 8
27 9 15 8 10.5 9
14 5 4 9 15 8
14 6 5.5 7 7 7
94.5 31.5 37

4 51 4 2 .80 54 4 6 .51 2−6 3= K=


12
2 0 2 01  5[
3 1.52 3 72 6 0.52 7 6.52
 
5 5

5 ]
−3  2 01 =0.0 2 8 1 9 8.4 52 7

K=0.0 228 3 .5−6


5 9 =3 3.0 6 6 Ho: Todas los incrementos en
Ha: No todos los incrementos

Para un alfa de 5% k-1 gl

K 0 .0 5,3=7.8 1 5
K 0 .0 5,3=7.8 1 5

Dado que K =3. 0 6 6≻ 7 ,8 1 5 la Ho no se rechaza.

Lo cual quiere decir que no se observó una diferencia significativa en los incre
Rango Mezcla 4 Rango
17.5 8 10.5
10.5 10 25.5
15 11 19
10.5 8 10.5
7 8 10.5
60.5 76

1 =0.0 2 8 1 9 8.4 52 7 3.87 3 2.0 51 1 5 .52−6 3=

Ho: Todas los incrementos en el peso permanecen iguales


Ha: No todos los incrementos en el peso permanecen iguales
ia significativa en los incrementos en peso de los cachorros al 5%
PRUEBA U DE MANN WHITNEY
Contrasta la igualdad de dos distribuciones poblacionales, se basa en la suposición de que dos
muestras aleatorias se sacan independientemente de variables continuas. Es la contraparte de
la prueba paramétrica t aunque no requiere que las diferencias de las muestras estén
distribuidas normalmente.

La prueba puede realizarse para analizar la igualdad de las dos medias o medianas
poblacionales. Para el caso de medias, se debe asumir que las poblaciones son simétricas
y que tienen la misma varianza, si el supuesto de simetría se elimina entonces la mediana
reemplaza a la media como estadístico de prueba.

Los datos se ordenan en forma ascendente:

Ejemplo: Se trata de probar si el tiempo de enfriamiento de piezas de barro después de ser


horneadas con dos métodos diferentes presenta los mismos resultados.

Método 1: 27, 31, 28, 29, 39, 40, 35, 33, 32, 36, 37, 43
Método 2: 34, 24, 38, 28, 30, 34, 37, 42, 41, 44

Ordenado los datos se tiene:

Método 1 Rango Método 2 Rango


24 1
27 2
28 3.5 28 3.5 Promedio de rangos correspondientes
29 5
30 6
31 7
32 8
33 9
34 10.5
34 10.5
35 12
36 13
37 14.5 37 14.5
38 16
39 17
40 18
41 19
42 20
43 21
44 22
Suma 130 123
rangos

Se calcula el estadístico U de Mann Whitney para la primera y segunda muestras,


así como la media y la distribución estándar de la distribución U:

n 1  n 11
Estadístico. Pr imera. muestra. . . . . U 1 =n1 n 2 −∑ R1
2
n  n 1
Estadístico. Segunda. muestra. . . . . U 2=n 1 n2  2 2 −∑ R 2
2
n n
Media. de . la. distribución. . U . . . . . . . . μ u= 1 2
2

 n n  n  n 1
Desviación. estándar. de .. . U . .. . . . . . . σ u= 1 2 1 2
12

U1 = (12)(10) + (12)(12 + 1) / 2 - 130 = 68

U2 = (12)(10) + (10)(10 + 1) / 2 -123 = 52

Media U = (12)(10) / 2 = 60

Desv. Est. U = 15.17

Valor de Z para normalizar U = (Ui - Media U ) / Desv. Est. U

Las hipótesis son:

Ho: Media 1 = Media 2


Ha: Media 1 <> Media 2

Se puede utilizar de manera arbitraria U1 o U2, escogiendo U2 se tiene:

Zu2 = (52 - 60) / 15.17 = - 0.53 Valor P = 0.3

SI alfa es 0.1 entonces Z de excel para alfa entre dos es -1.65

Por tanto no se rechaza Ho

NOTA: Para pruebas de una cola, si se trata de cola derecha, se utiliza el


valor de U que sea mayor y para cola izquierda el valor de U que sea menor.