Академический Документы
Профессиональный Документы
Культура Документы
TEXTO UNIVERSITARIO
ESTADISTICA NO PARAMETRICA
Estadística No Paramétrica
INTRODUCCIÓN
Estos supuestos se plantean fundamentalmente sobre el valor que toman los paráme-
tros poblacionales o sobre comparaciones de dos de ellos. Hasta ahora se ha trabajado
con magnitudes de tipo cuantitativas y continuas. A las magnitudes discretas se las ha
tratado como proporciones para poder usar los modelos, y cuando se usó el modelo de
Gauss distribución normal) se tuvo que hacer una corrección por continuidad. A esta
metodología de trabajo se la denomina Estadística Paramétrica, por contraposición a
otra donde lo que interesa es comparar distribuciones en lugar de parámetros. Mien-
tras los supuestos usados en la paramétrica especifican la distribución original (gene-
ralmente la gaussiana), hay otros casos en la práctica donde no se puede hacer esto,
donde no se puede especificar la forma de distribución original. Se requiere entonces
otra metodología de trabajo, una estadística de distribuciones libres, donde no se ne-
cesitan hacer supuestos acerca de la distribución poblacional, donde se puede compa-
rar distribuciones entre sí o verificar supuestos a cerca de la forma de la población.
Por ejemplo, verificar el supuesto de normalidad necesario para usar el modelo Stu-
dent. La solución para estos casos es el empleo de la Estadística no paramétrica.
3. Estudiar los casos donde los supuestos de la forma poblacional son débiles.
4. Aplicar el mismo modelo a casi todas las distribuciones en lugar a una sola;
Los modelos paramétricos tienen mayor capacidad para detectar diferencias muestra-
les que los no paramétricos. Es decir, son capaces de ver una diferencia significativa
en casos donde los otros no pueden.
1
Daniel Guzmán Rojas
Estadística No Paramétrica
Como su poder discriminador es mejor, siempre que se pueda, conviene usar modelos
paramétricos antes que los no paramétricos, por su mayor sensibilidad para detectar
diferencias significativas A menos que las diferencias sean tan grandes que con cual-
quier modelo pueden detectarse. Pero como los no paramétricos se aplican casi todos
los casos, son más fáciles de entender y no tienen tanta “complicación matemática”; se
están poniendo de moda en todas las especialidades cada vez más.
Por ejemplo, se pueden asignar rangos por textura, coloración, sabor, olor (magnitudes
organolépticas), clasificar por infección con cierto tipo de virus, y otros casos donde
no se cumpla el supuesto de homogeneidad de varianzas; acá el modelo de rangos pue-
de ser la salida. Cuando se comparan dos muestras, los modelos paramétricos hacen
hincapié en la comparación de las medias, mientras que los no paramétricos fijan su
atención en comparar medianas.
2
Daniel Guzmán Rojas
UNIVERSIDAD NACIONAL AGRARIA DE LA SELVA
FACULTAD DE CIENCIAS ECONÓMICAS Y ADMINISTRATIVAS
TEXTO UNIVERSITARIO
LA PRUEBA DE RACHAS DE UNA MUESTRA
LA PRUEBA DE RACHAS DE UNA MUESTRA Estadística No Paramétrica
La técnica que presentaremos aquí se basa en el número de rachas que la muestra ex-
hibe. Se define una racha como una sucesión de símbolos idénticos que pueden estar o
no estar separados por otros símbolos.
Por ejemplo, supongamos una serie de símbolos de “más” y “menos” ocurrida en este
orden:
++ --- + ---- ++ -
Esta muestra de puntajes empieza con una racha de dos “más”, la sigue otra racha de
tres “menos”, a continuación otra de un “más”, enseguida cuatro “menos”, dos “más”,
etc. Podemos agruparlos en rachas, contando las series de símbolos idénticos:
++ --- + ---- ++ - +
1 2 3 4 5 6 7
El número total de las rachas de una muestra de cualquier tamaño nos señala si la
muestra es o no es aleatoria. La escasez de rachas puede deberse a tendencias tem-
porales o a cierta falta de independencia. Por otra parte, al ocurrir rachas abundan-
tes, las fluctuaciones cíclicas sistemáticas de corto periodo pueden causar esta in-
fluencia en los puntajes.
Por ejemplo, supongamos que lanzamos al aire 20 veces una moneda y observamos la
siguiente secuencia de caras (C) y sellos (S):
C C C C C C C C C C S S S S S S S S S S
C S C S C S C S C S C S C S C S C S C S
Aquí se observan demasiadas rachas. En este caso, siendo R=20 cuando n=20, es otra
vez razonable rechazar la hipótesis de que la moneda es "legal". Ninguna de las fre-
cuencias anteriores parecen ser series al azar de C y S.
1
Daniel Guzmán Rojas
LA PRUEBA DE RACHAS DE UNA MUESTRA Estadística No Paramétrica
Nótese que el análisis basado en el orden de los eventos nos da una información que no
proviene de la frecuencia de los mismos. En ambos casos, ocurrieron 10 sellos y 10 ca-
ras. Si se analizaran los puntajes de acuerdo a sus frecuencias, por ejemplo, usando la
prueba Chi-Cuadrado o la prueba binomial, no tendríamos razón para sospechar que la
moneda no fuera "legal". La prueba de rachas solamente no atiende sino al orden de los
eventos, descubriendo en una fuerte falta de aleatoriedad de los puntajes y así, la po-
sible "legalidad" de la moneda.
Cuando los datos a probar, si provienen de un muestreo al azar, son valores numéricos,
se debe seguir el siguiente procedimiento para clasificarlos en dos categorías o cla-
ses:
2. Se asigna como categoría 1 (por ejemplo “A”) a cada valor muestral observado
que resulte ser menor que el valor de la mediana, se asigna como categoría 2
(por ejemplo “B”) a los valores que son mayores o igual que el valor de la media-
na.
3. Se ordena en orden secuencial por categoría o clases (“A” o “B”), tal como se
han observado los valores muestrales.
MÉTODO
Al usar la prueba de rachas de una muestra, se observan en primer lugar los eventos n 1
y n2 en el orden que han ocurrido y se determina el valor de R.
2
Daniel Guzmán Rojas
LA PRUEBA DE RACHAS DE UNA MUESTRA Estadística No Paramétrica
Se
acepta
H0
Se Se
acepta
1- acepta
Ha Ha
/2 /2
- Z(/2) Z(/2)
MUESTRAS PEQUEÑAS
Si tanto n1 como n2 son iguales o menores que 20, encontraremos en la tabla F (para
prueba de rachas) los valores críticos de R conforme a H0 considerando =0.05. Son
valores críticos de su distribución muestral: Si el valor observado de R está entre los
valores críticos, se acepta H0. Si el valor observado de R es igual o más extremo que
uno de los valores críticos, se rechaza H0.
Son dos las tablas, F I y FII. La tabla FI contiene valores de r tan pequeños, que la pro-
babilidad asociada con su ocurrencia conforme a H0 es p=0.025. La tabla F II contiene
valores de R tan grandes, que la probabilidad asociada con su ocurrencia conforme H0
es p=0.025.
Al considerar adecuada una prueba de una cola, es decir, al ser predeterminada la di-
rección de desviación de la aleatoriedad, solamente se necesita examinar una de las
dos tablas. Si se predice una observación de muy pocas rachas, la tabla F I abarca los
valores críticos de R. Si la R observada bajo la prueba de una cola es igual a o menor
que la de la tabla F I, H0 puede rechazarse en =0.025. Si se predice una observación
de demasiadas rachas, la tabla F II abarca los valores críticos de R significativos al ni-
vel 0.025.
3
Daniel Guzmán Rojas
LA PRUEBA DE RACHAS DE UNA MUESTRA Estadística No Paramétrica
EJEMPLO
TABLA
Puntaje de agresión en orden de ocurrencia
Clase de Clase de
puntaje puntaje
Niño Puntaje con res- Niño Puntaje con res-
pecto a la pecto a la
mediana mediana
1 31 B 13 15 A
2 23 A 14 18 A
3 36 B 15 78 B
4 43 B 16 24 A
5 51 B 17 13 A
6 44 B 18 27 B
7 12 A 19 86 B
8 26 B 20 61 B
9 43 B 21 13 A
lo 75 B 22 7 A
11 2 A 23 6 A
12 3 A 24 8 A
MEDIANA 25
4
Daniel Guzmán Rojas
LA PRUEBA DE RACHAS DE UNA MUESTRA Estadística No Paramétrica
1) HIPOTESIS:
MUESTRAS GRANDES
Si n1 o n2 es mayor que 20, la tabla F no puede usarse. Para muestras tan grandes, una
buena aproximación a la distribución muestral de R es la distribución normal, con
2n1 n2
R = +1
n1 + n2
2n1n2 (2n1n2 − n1 − n2 )
R =
(n1 + n2 )2 (n1 + n2 − 1)
Por tanto, cuando n1 o n2 es mayor que 20, H0 puede probarse así:
R − R
zc =
R
Las hipótesis nula y alternativa para una prueba de dos extremos son:
5
Daniel Guzmán Rojas
LA PRUEBA DE RACHAS DE UNA MUESTRA Estadística No Paramétrica
Se
acepta
H0
Se Se
acepta
1- acepta
Ha Ha
/2 /2
- Z(/2) Z(/2)
Los valores de z que son dados por la fórmula son, conforme a H 0 aproximadamente
distribuidos en forma normal con media de cero y varianza de uno; por tanto la signifi-
cación de cualquier valor observado de z calculado con esta fórmula puede determi-
narse por medio de la tabla de curva normal. Esto es, en la tabla distribución normal
estandarizada se encuentran las probabilidades de una cola asociadas con la ocurren-
cia conforme a H0 de valores tan extremos como el de cierta z observada.
EJEMPLO
TABLA
Orden de 30 hombres (M) y 20 mujeres (F) formados frente a la taquilla del cine
M F M F MMM FF M F M F
M F MMMM F M F M F MM FFF
M F M F M F MM F MM F
MMMM F M F MM
1) HIPOTESIS:
6
Daniel Guzmán Rojas
LA PRUEBA DE RACHAS DE UNA MUESTRA Estadística No Paramétrica
Se
acepta
H0
Se Se
acepta 0.95 acepta
Ha Ha
0.025 0.025
- 1.96 1.96
2 ( 30 )( 20 ) ( 2 ( 30 )( 20 ) − 30 − 20 )
R = = 3.3564
( 30 + 20 ) ( 30 + 20 − 1)
2
35 − 25
zc = = 2.98
3.3564
5) CONCLUSION: Como zc es mayor que z0.025 (2.98>1.96), entonces se acepta la
Ha, es decir, la serie de hombres y mujeres en la cola, no es al azar, a un nivel
de significancia del 5%.
METODO DE PROBABILIDAD
1) HIPOTESIS:
Se Se
acepta 0.95 acepta
Ha Ha
0.025 0.025
- 1.96 1.96
7
Daniel Guzmán Rojas
LA PRUEBA DE RACHAS DE UNA MUESTRA Estadística No Paramétrica
2 ( 30 )( 20 ) ( 2 ( 30 )( 20 ) − 30 − 20 )
R = = 3.3564
( 30 + 20 ) ( 30 + 20 − 1)
2
35 − 25
zc = = 2.98
3.3564
2 P Z 2.98 = ( 2 )( 0.0014 ) = 0.003
8
Daniel Guzmán Rojas
LA PRUEBA DE RACHAS DE UNA MUESTRA Estadística No Paramétrica
Se dan en los cuerpos de las tablas F I y FII diferentes valores críticos de R para
distintos valores de n1 y n2. Para la prueba de las rachas de una muestra, cual-
quier valor de R es igual o menor que el que aparece en la taba FI, o igualo ma-
yor que el que aparece en la tabla F II es significativo en el nivel 0.05.
9
Daniel Guzmán Rojas
LA PRUEBA DE RACHAS DE UNA MUESTRA Estadística No Paramétrica
10
Daniel Guzmán Rojas
UNIVERSIDAD NACIONAL AGRARIA DE LA SELVA
TEXTO UNIVERSITARIO
COEFICIENTE DE CORRELACIÓN DE LOS RANGOS DE SPEARMAN
COEFICIENTE DE CORRELACIÓN DE LOS RANGOS DE SPEARMAN Estadística No Paramétrica
Este coeficiente es una medida de asociación lineal que utiliza los rangos, números de
orden, de cada grupo de sujetos y compara dichos rangos. Existen dos métodos para
calcular el coeficiente de correlación de los rangos uno señalado por Spearman y otro
por Kendall (8). El r de Spearman llamado también rho de Spearman es más fácil de
calcular que el de Kendall. El coeficiente de correlación de Spearman es exactamente
el mismo que el coeficiente de correlación de Pearson calculado sobre el rango de ob-
servaciones. En definitiva la correlación estimada entre X e Y se halla calculado el
coeficiente de correlación de Pearson para el conjunto de rangos apareados. El coefi-
ciente de correlación de Spearman es recomendable utilizarlo cuando los datos pre-
sentan valores externos ya que dichos valores afectan mucho el coeficiente de corre-
lación de Pearson, o ante distribuciones no normales.
Los valores de los rangos se colocan según el orden numérico de los datos de la varia-
ble en forma individual por muestra, tal como se realiza en Mann-Whitney.
INTERPRETACIÓN
Si rS=1: Correlación por Rangos perfecta y positiva. La concordancia entre los rangos
es perfecta.
Si rS=-1: Correlación por Rangos perfecta y negativa. La concordancia entre los rangos
es perfecta.
Si 0<rS<1: Correlación por rangos positiva y -1<rS<0: Correlación por rangos negativa.
EJEMPLO
( 6 )( 2 − 8 )2 ( 6 )( 5 − 3)
2
( 6 )( 4 − 1) = 0.2727
2
rS = 1 − + + +
(10 ) (102 − 1) (10 ) (102 − 1) (10 ) (102 − 1)
TEXTO UNIVERSITARIO
LA PRUEBA DEL SIGNO PARA UNA MUESTRA
LA PRUEBA DEL SIGNO PARA UNA MUESTRA Estadística No Paramétrica
Puede utilizarse ¡a prueba del signo para probar una hipótesis nula sobre el valor de
una mediana poblacional. Por ello, es el equivalente no paramétrico de las pruebas de
hipótesis sobre el valor de una media poblacional. Se requiere que los valores de la
muestra aleatoria se encuentren cuando menos en escala ordinal, y no se hacen suposi-
ciones con respecto a la forma de la distribución poblacional.
PROCEDIMIENTO
1. Se asigna un signo positivo (+) a cada valor muestral observado que resulte ser
mayor que el valor hipotético de la mediana, un signo negativo (-) a los valores
que son menores que ese valor hipotético de la mediana, y no se asigna nada
cuando el valor muestral observado resulte ser igual que el valor hipotético de
la mediana.
2. Se obtiene por separado la suma de los signos, que serán los coeficientes de los
signos: x + , x − .
na = n− # empates
La menor de esas dos sumas de los signos para una prueba de dos criterios de califica-
ción.
x− 2 x+ 2
Cuando: Ha: Med Med 0 , se toma como x c = x + (la suma de signos positivos).
Para rechazar la H0, el valor que se obtiene de x c debe ser mayor que x+ cuan-
do la P X xc / B; n; .
x+
Cuando: Ha: Med Med 0 , se toma como x c = x + (la suma de signos positivos)
Para rechazar la H0, el valor que se obtiene de x c debe ser menor que x− cuan-
do la P X xc / B; n; .
x−
Las hipótesis nula y alternativa pueden designar pruebas de uno o de dos criterios de
calificación. Utilizando Med para representar la mediana de la población, y Med 0 para
representar el valor hipotético.
Las hipótesis nula y alternativa para una prueba de dos extremos son:
MUESTRAS PEQUEÑAS
Donde:
H0: = 0.05
Ha: 0.05
EJEMPLO
Sistema rediseñado
Signo de la
Turno Unidades
diferencia
muestreado ensambladas (X)
(X - 80)
1 75 -
2 85 +
3 92 +
4 80 0
5 94 +
6 90 +
7 91 +
8 76 -
9 88 +
10 82 +
11 96 +
12 83 +
1) HIPOTESIS:
H0: Med = 80
Ha: Med 80
25.00%
22.56% 22.56%
20.00%
PROBABILIDAD BINOMIAL (X)
16.11% 16.11%
15.00%
P X 9 = 0.0327 = 0.05
10.00%
11.33%
8.06% 8.06%
5.00%
3.27%
2.69% 2.69%
0.59%
0.54% 0.54% 0.05%
0.00% 0.05% 0.05%
0 1 2 3 4 5 6 7 8 9 10 11 12
9
VALORES DE X
METODO DE PROBABILIDAD
1) HIPOTESIS:
H0: Med = 80
Ha: Med 80
25.00%
22.56% 22.56%
20.00%
PROBABILIDAD BINOMIAL (X)
16.11% 16.11%
15.00%
P X 9 = 0.0327 = 0.05
10.00%
11.33%
8.06% 8.06%
5.00%
3.27%
2.69% 2.69%
0.59%
0.54% 0.54% 0.05%
0.00% 0.05% 0.05%
0 1 2 3 4 5 6 7 8 9 10 11 12
9
VALORES DE X
entonces se utiliza los valores que tienen signos positivos (+), por lo tanto xc = 9
y P X 9 / n = 11; = 0.5 = 0.0269 + 0.0054 + 0.0005 = 0.0327 = 3.3% .
MUESTRAS GRANDES
p = n
p == n (1 − )
xc cc − p
zc =
p
donde:
Las hipótesis nula y alternativa para una prueba de dos extremos son:
Se Se
acepta
1- acepta
Ha Ha
/2 /2
- Z(/2) Z(/2)
Se
acepta
1- Ha
Z()
Se
acepta
H0
Se
acepta 1-
Ha
- Z()
EJEMPLO
Utilizando los datos del ejemplo anterior, en donde el jefe de planta afirma que las
unidades ensambladas en un sistema rediseñado de ensamble de productos no será
igual que con el sistema antiguo, cuya mediana poblacional es de 80 unidades por turno.
En una muestra de 30 observaciones se determinó que 10 de las observaciones fueron
superior a la media poblacional (80). Otorgando el beneficio de la duda al sistema re-
diseñado, plantee la hipótesis nula y pruébela a un nivel de significancia del 5%.
1) HIPOTESIS:
H0: Med = 80
Ha: Med 80
Se
acepta
H0
Se Se
acepta 0.95 acepta
Ha Ha
0.025 0.025
- 1.96 1.96
p = ( 30 )( 0.5 ) = 15
p = (30)(0.5)(0.5) = 2.74
10 + 0.5 − 15
zc = = −1.64
2.74
5) CONCLUSION: Como − z0.025 zc z0.025 (-1.96<-1.64<1.96), entonces se acepta la
H0, es decir, el gerente no tiene razón al afirmar que no existe diferencia en el
número de ensambles con el sistema antiguo y el nuevo sistema, a un nivel de
confianza del 95%.
METODO DE PROBABILIDAD
1) HIPOTESIS:
H0: Med = 80
Ha: Med 80
Se
acepta
H0
Se Se
acepta 0.95 acepta
Ha Ha
0.025 0.025
- 1.96 1.96
p = ( 30 )( 0.5 ) = 15
TEXTO UNIVERSITARIO
LA PRUEBA DEL SIGNO PARA DOS MUESTRAS (DA-
TOS APAREADOS)
LA PRUEBA DEL SIGNO PARA DOS MUESTRAS (DATOS APAREADOS) Estadística No Paramétrica
Esta prueba se basa en los signos de las diferencias observadas entre valores aparea-
dos. La independencia se resguarda si la unidad de muestreo es el resultado de compa-
rar a las parejas entre sí, en lugar de usar las observaciones individuales. Cada pareja
de datos debe ser independiente de las otras, y la forma de lograrlo fácilmente es se-
leccionado al azar al elegir los componentes de las muestras. Una ventaja es que puede
usarse cuando las observaciones pareadas están simplemente ordenada por rangos. No
es necesaria la homogeneidad de las varianzas, ni que las muestras sean extraídas de
la misma población. Su desventaja es que elimina mucha información pues la reduce a
una dicotomía. Otras ventajas son: la facilidad de aplicación, la reducción de tiempo y
costo para el investigador. Los supuestos básicos para aplicar este modelo son:
PROCEDIMIENTO
Se asigna un signo positivo (+) a cada valor observado de la primera muestra que resul-
te ser mayor que el valor observado de la segunda muestra, y un signo negativo (-) a
cada valor observado de la primera muestra que resulte ser menor que el valor obser-
vado de la segunda muestra. Si un valor muestral de la primera muestra es exactamen-
te igual al valor de la primera muestra, no se registra ningún signo (inicialmente se le
puede asignar cero), y se reduce en forma correspondiente el tamaño efectivo de la
muestra, es decir se reduce la muestra solamente a los valores que contengan signos
positivos (+) y signos negativos (-).
1. Se asigna un signo positivo (+) a cada valor observado de la primera muestra que
resulte ser mayor que el valor observado de la segunda muestra, y un signo ne-
gativo (-) a cada valor observado de la primera muestra que resulte ser menor
que el valor observado de la segunda muestra, y no se asigna nada cuando el va-
lor observado de la primera muestra que resulte ser igual que el valor observa-
do de la segunda muestra.
2. Se obtiene por separado la suma de los signos, que serán los coeficientes de los
signos: x + , x − .
3. Si algún valor observado de la primera muestra que resulte ser igual que el valor
observado de la segunda muestra, se elimina del análisis la observación corres-
pondiente, y se reduce el tamaño efectivo de la muestra.
na = n− # empates
1
Daniel Guzmán Rojas
LA PRUEBA DEL SIGNO PARA DOS MUESTRAS (DATOS APAREADOS) Estadística No Paramétrica
La menor de esas dos sumas de los signos para una prueba de dos criterios de califica-
ción.
x− 2 x+ 2
Cuando: Ha: Med 1 Med 2 , se toma como x c = x + (la suma de signos positivos).
Para rechazar la H0, el valor que se obtiene de x c debe ser mayor que x+ cuan-
do la P X xc / B; n; .
x+
Cuando: Ha: Med 1 Med 2 , se toma como x = x + (la suma de signos positivos)
Para rechazar la H0, el valor que se obtiene de x c debe ser menor que x− cuan-
do la P X xc / B; n; .
x−
Las hipótesis nula y alternativa pueden designar pruebas de uno o de dos criterios de
calificación. Utilizando Med1 para representar la mediana 1, y Med 2 para representar
la mediana 2.
2
Daniel Guzmán Rojas
LA PRUEBA DEL SIGNO PARA DOS MUESTRAS (DATOS APAREADOS) Estadística No Paramétrica
Las hipótesis nula y alternativa para una prueba de dos extremos son:
Si es verdadera la hipótesis nula con respecto a los valores de las medianas, el número
de signos positivos debe ser aproximadamente igual al número de signos negativos. o,
en otros términos, la proporción de signos positivos (o de signos negativos) debe ser
de aproximadamente 0.50. Por ello, la hipótesis de una prueba de dos criterios de cali-
ficación es H0: p=0.50, en donde p es la proporción poblacional de signos positivos (o
negativos). Por ello, una hipótesis que se refiere al valor de la mediana se prueba, de
hecho, como una hipótesis sobre p.
MUESTRAS PEQUEÑAS
Donde:
H0: = 0.5
Ha: 0.5
3
Daniel Guzmán Rojas
LA PRUEBA DEL SIGNO PARA DOS MUESTRAS (DATOS APAREADOS) Estadística No Paramétrica
EJEMPLO
1) HIPOTESIS:
4
Daniel Guzmán Rojas
LA PRUEBA DEL SIGNO PARA DOS MUESTRAS (DATOS APAREADOS) Estadística No Paramétrica
25.00%
22.56%
20.00%
19.34% 19.34%
PROBABILIDAD BINOMIAL (X)
12.08% 12.08%
10.00%
7.30% 7.30%
5.37% 5.37%
5.00%
1.93% 1.93%
1.61% 1.61%
0.32% 0.32%
0.02% 0.29% 0.29% 0.02%
0.00% 0.02% 0.02%
0 1 2 3 4 5 6 7 8 9 10 11 12 13
2 10
VALORES DE X
METODO DE PROBABILIDAD
1) HIPOTESIS:
5
Daniel Guzmán Rojas
LA PRUEBA DEL SIGNO PARA DOS MUESTRAS (DATOS APAREADOS) Estadística No Paramétrica
25.00%
22.56%
20.00%
19.34% 19.34%
PROBABILIDAD BINOMIAL (X)
12.08% 12.08%
10.00%
7.30% 7.30%
5.37% 5.37%
5.00%
1.93% 1.93%
1.61% 1.61%
0.32% 0.32%
0.02% 0.29% 0.29% 0.02%
0.00% 0.02% 0.02%
0 1 2 3 4 5 6 7 8 9 10 11 12 13
2 10
VALORES DE X
6
Daniel Guzmán Rojas
LA PRUEBA DEL SIGNO PARA DOS MUESTRAS (DATOS APAREADOS) Estadística No Paramétrica
MUESTRAS GRANDES
p == n (1 − )
xc cc − p
zc =
p
donde:
Las hipótesis nula y alternativa para una prueba de dos extremos son:
Se
acepta
H0
Se
acepta Se
Ha 1- acepta
Ha
/2 /2
- Z(/2) Z(/2)
Se
acepta
1- Ha
Z()
7
Daniel Guzmán Rojas
LA PRUEBA DEL SIGNO PARA DOS MUESTRAS (DATOS APAREADOS) Estadística No Paramétrica
- Z()
EJEMPLO
1 20 16 + 21 23 22 +
2 24 26 - 22 23 22 +
3 28 18 + 23 20 23 -
4 24 17 + 24 24 20 +
5 18 19 - 25 28 23 +
6 29 21 + 26 21 22 -
7 19 23 - 27 20 23 -
8 27 22 + 28 29 20 +
9 20 23 - 29 19 18 +
10 30 20 + 30 27 21 +
11 18 19 - 31 20 17 +
12 28 21 + 32 24 25 -
13 26 17 + 33 24 16 +
14 24 26 - 34 28 26 +
15 28 16 + 35 30 18 +
16 25 26 - 36 29 17 +
17 29 18 + 37 25 20 +
18 25 17 + 38 26 21 +
19 26 20 + 39 22 23 -
20 24 21 + 40 29 26 +
8
Daniel Guzmán Rojas
LA PRUEBA DEL SIGNO PARA DOS MUESTRAS (DATOS APAREADOS) Estadística No Paramétrica
1) HIPOTESIS:
Se
acepta
0.95 Ha
0.05
1.65
4) DETERMINACIÓN DE zc: La muestra fue de 40, de los cuales 28 observacio-
nes de las calificaciones de la marca 1 fueron superior a las calificaciones de la
marca 2. Como la Ha: Med 1 Med 2 , por lo tanto el valor para xc = 28 y se de-
termina:
p = (40)(0.5) = 20
p = (40)(0.5)(0.5) = 3.16
28 − 0.5 − 20
zc = = 2.37
3.16
METODO DE PROBABILIDAD
1) HIPOTESIS:
9
Daniel Guzmán Rojas
LA PRUEBA DEL SIGNO PARA DOS MUESTRAS (DATOS APAREADOS) Estadística No Paramétrica
en consecuencia, se usa una región de rechazo de una cola (cola derecha). La re-
gión de rechazo, por tanto, incluye todos los valores de z iguales a o más extre-
mos que 1.65. Entonces si P Z zc = 0.05 se rechaza la H0.
Se
acepta
H0
Se
acepta
0.95 Ha
0.05
1.65
p = (40)(0.5)(0.5) = 3.16
28 − 0.5 − 20
zc = = 2.37
3.16
P Z 2.37 = 0.00885
10
Daniel Guzmán Rojas
UNIVERSIDAD NACIONAL AGRARIA DE LA SELVA
TEXTO UNIVERSITARIO
[Escriba el subtítulo del documento]
LA PRUEBA DE WILCOXON PARA UNA MUESTRA Estadística No Paramétrica
Puede utilizarse la prueba de Wilcoxon para probar una hipótesis nula sobre el valor
de una mediana poblacional. Al igual que en el caso de la prueba del signo, puede utili-
zarse la prueba de Wilcoxon para probar una hipótesis sobre el valor de una mediana
poblacional. Como la prueba de Wilcoxon considera la magnitud de la diferencia entre
cada uno de los valores muestrales y el valor hipotético de la mediana, es una prueba
más sensible que la prueba del signo. Por otro lado, como se determinan diferencias,
los valores deben estar dados, cuando menos, en escala de intervalo. No se requieren
suposiciones con respecto a la forma de la distribución poblacional.
PROCEDIMIENTO
Se determina la diferencia entre cada uno de los valores observados y el valor hipoté-
tico de la mediana, y esta diferencia, con signo aritmético, se designa d = X − Med 0 . Si
alguna de las diferencias es igual a cero, se elimina del análisis la observación corres-
pondiente, y se reduce el tamaño efectivo de la muestra. Después, se ordenan los va-
lores absolutos de la diferencia, de menor a mayor, asignando el rango de 1 a la dife-
rencia absoluta más pequeña. Cuando las diferencias absolutas son iguales, se asigna el
rango promedio a los valores que son iguales. Finalmente, se obtiene por separado la
suma de los rangos para las diferencias positiva y negativa.
d = ( X − Med 0 ) .
3. Se obtiene por separado la suma de los rangos, considerando el signo, que serán
los coeficientes de Wilcoxon: T + , T − .
na = n− # empates
La menor de esas dos sumas es la estadística T de Wilcoxon para una prueba de dos
criterios de calificación.
Cuando: Ha: Med Med 0 , se toma como Tc = min T + , T − .
Para rechazar la H0, el valor que se obtiene de Tc debe ser menor que Tn; ;2 .
Tn; ;2
Cuando: Ha: Med Med 0 , se toma como Tc = T + (el rango de signos positivos).
Para rechazar la H0, el valor que se obtiene de Tc debe ser mayor que Tn; ;1 .
Tn; ;1
Cuando: Ha: Med Med 0 , se toma como Tc = T + (el rango de signos positivos).
Para rechazar la H0, el valor que se obtiene de Tc debe ser menor que Tn; ;1 .
Tn; ;1
Las hipótesis nula y alternativa pueden designar pruebas de uno o de dos criterios de
calificación. Utilizando Med para representar la mediana de la población, y Med o para
representar el valor hipotético.
Las hipótesis nula y alternativa para una prueba de dos extremos son:
MUESTRAS PEQUEÑAS
Donde:
EJEMPLO
Para el problema de muestras pequeñas para la prueba del signo de una muestra, utili-
ce la prueba de Wilcoxon.
sistema rediseñado
Unidades
Diferencia Diferencia Rangos Rangos
Nº ensambladas Rangos Empates
(X-80) |X-80| + -
(X)
1 75 -5 5 4.5 4.5 5
2 85 5 5 4.5 4.5 5
3 92 12 12 9 9
4 80
5 94 14 14 10 10
6 90 10 10 7 7
7 91 11 11 8 8
8 76 -4 4 3 3
9 88 8 8 6 6
10 82 2 2 1 1
11 96 16 16 11 11
12 83 3 3 2 2
T c= 58.5 7.5
1) HIPOTESIS:
H0: Med = 80
Ha: Med 80
MUESTRAS GRANDES
(t − ti )
l
3
i
L= i =1
48
n(n + 1)
T =
4
n ( n + 1)( 2n + 1)
T = −L
24
Tc − T
zc =
T
Las hipótesis nula y alternativa para una prueba de dos extremos son:
Se
acepta
H0
Se Se
acepta
1- acepta
Ha Ha
/2 /2
- Z(/2) Z(/2)
Se
acepta
1- Ha
Z()
- Z()
EJEMPLO
Utilizando los datos del ejemplo anterior, en donde el jefe de planta afirma que las
unidades ensambladas en un sistema rediseñado de ensamble de productos no será
igual que con el sistema antiguo, cuya mediana poblacional es de 80 unidades por turno.
En una muestra de 30 observaciones se determinó que el rango para signos positivos
es de Tc = 228 (el menor valor de los dos rangos). Otorgando el beneficio de la duda al
sistema rediseñado, plantee la hipótesis nula y pruébela a un nivel de significancia del
5%.
Nº Unidades Diferencia Diferencia Rangos Rangos Rangos Empates
ensambladas (X-80) |X-80| + -
(X)
1 75 -5 5 19.5 19.5 5
2 79 -1 1 2.5 2.5 1
3 85 5 5 19.5 19.5 5
4 79 -1 1 2.5 2.5 1
5 94 14 14 29 29 14
6 78 -2 2 8 8 2
7 91 11 11 25.5 25.5 11
8 76 -4 4 16 16 4
9 88 8 8 22.5 22.5 8
10 75 -5 5 19.5 19.5 5
11 78 -2 2 8 8 2
12 77 -3 3 13 13 3
13 92 12 12 27 27
14 78 -2 2 8 8 2
15 94 14 14 29 29 14
16 76 -4 4 16 16 4
17 79 -1 1 2.5 2.5 1
18 78 -2 2 8 8 2
19 91 11 11 25.5 25.5 11
20 76 -4 4 16 16 4
21 78 -2 2 8 8 2
22 82 2 2 8 8 2
23 70 -10 10 24 24
24 72 -8 8 22.5 22.5 8
25 83 3 3 13 13 3
26 75 -5 5 19.5 19.5 5
27 77 -3 3 13 13 3
28 94 14 14 29 29 14
29 79 -1 1 2.5 2.5 1
30 78 -2 2 8 8 2
T c= 228 237
1) HIPOTESIS:
H0: Med = 80
Ha: Med 80
Se
acepta
H0
Se Se
acepta 0.95 acepta
Ha Ha
0.025 0.025
- 1.96 1.96
L=
(4
3
− 4 ) + ( 73 − 7 ) + ( 33 − 3) + ( 33 − 3) + ( 43 − 4 ) + ( 23 − 2 ) + ( 33 − 3)
= 11.25
48
30(30 + 1)
T = = 232.5
4
30 ( 30 + 1) ( 2 ( 30 ) + 1)
T = − 11.25 = 48.50
24
228 − 232.5
zc = = −0.0928
48.50
5) CONCLUSION: Como − z0.025 zc z0.025 (-1.96<-0.0928<1.96), entonces se acep-
ta la H0, es decir, el gerente no tiene razón al afirmar que no existe diferencia
en el número de ensambles con el sistema antiguo y el nuevo sistema, a un nivel
de confianza del 95%.
METODO DE PROBABILIDAD
1) HIPOTESIS:
H0: Med = 80
Ha: Med 80
Se
acepta
H0
Se Se
acepta 0.95 acepta
Ha Ha
0.025 0.025
- 1.96 1.96
L=
(4 3
− 4 ) + ( 73 − 7 ) + ( 33 − 3) + ( 33 − 3) + ( 43 − 4 ) + ( 23 − 2 ) + ( 33 − 3)
= 11.25
48
30(30 + 1)
T = = 232.5
4
30 ( 30 + 1) ( 2 ( 30 ) + 1)
T = − 11.25 = 48.50
24
228 − 232.5
zc = = −0.0928
48.50
2 P Z −0.0928 = ( 2 )( 0.46304 ) = 0.92608
TEXTO UNIVERSITARIO
LA PRUEBA DE WILCOXON PARA DOS MUESTRAS
(DATOS APAREADOS)
LA PRUEBA DE WILCOXON PARA DOS MUESTRAS (DATOS APAREADOS) Estadística No Paramétrica
2. Ordenar por rango las diferencias halladas (rango acá significa “ranking” u or-
den)
PROCEDIMIENTO
d = (X1 − X 2 ) .
3. Se obtiene por separado la suma de los rangos, considerando el signo, que serán
los coeficientes de Wilcoxon: T + , T − .
na = n− # empates
La menor de esas dos sumas es la estadística T de Wilcoxon para una prueba de dos
criterios de calificación.
Tn; ;2
Cuando: Ha: Med 1 Med 2 , se toma como Tc = T + (el rango de signos positivos).
Para rechazar la H0, el valor que se obtiene de Tc debe ser mayor que Tn; ;1 .
Tn; ;1
Cuando: Ha: Med 1 Med 2 , se toma como Tc = T + (el rango de signos positivos).
Para rechazar la H0, el valor que se obtiene de Tc debe ser menor que Tn; ;1 .
Tn; ;1
Las hipótesis nula y alternativa pueden designar pruebas de uno o de dos criterios de
calificación. Utilizando Med1 para representar la mediana 1, y Med 2 para representar
la mediana 2.
Las hipótesis nula y alternativa para una prueba de dos extremos son:
MUESTRAS PEQUEÑAS
Donde:
EJEMPLO
Para el problema de muestras pequeñas para la prueba del signo de dos muestras, uti-
lice la prueba de Wilcoxon.
Calificaciones asignadas por grupo de
consumidores a dos marcas de té
1) HIPOTESIS:
menor: Tc = 10.5 .
MUESTRAS GRANDES
(t − ti )
l
3
i
L= i =1
48
n(n + 1)
T =
4
n ( n + 1)( 2n + 1)
T = −L
24
Tc − T
zc =
T
Las hipótesis nula y alternativa para una prueba de dos extremos son:
Se Se
acepta
1- acepta
Ha Ha
/2 /2
- Z(/2) Z(/2)
Se
acepta
1- Ha
Z()
- Z()
EJEMPLO
1) HIPOTESIS:
Se
acepta
0.95 Ha
0.05
1.65
L=
(9
3
− 9 ) + ( 33 − 3) + ( 63 − 6 ) + ( 33 − 3) + ( 43 − 4 ) + ( 23 − 2 ) + ( 23 − 2 ) + ( 33 − 3) + ( 23 − 2 ) + ( 23 − 2 ) + ( 33 − 3)
= 23.125
48
40(40 + 1)
T = = 410
4
40 ( 40 + 1) ( 2 ( 40 ) + 1)
T = − 23.125 = 74.24
24
701.5 − 410
zc = = 3.9263
74.24
5) CONCLUSION: Como zc z0.05 (3.9263>1.65), entonces se acepta la Ha, es de-
cir, el gerente tiene razón al afirmar que la marca de te Nº 1 tiene mayor pre-
ferencia que el de la marca de te Nº 2, a un nivel de significancia del 5%.
METODO DE PROBABILIDAD
1) HIPOTESIS:
Se
acepta
H0
Se
acepta
0.95 Ha
0.05
1.65
L=
(9
3
− 9 ) + ( 33 − 3) + ( 63 − 6 ) + ( 33 − 3) + ( 43 − 4 ) + ( 23 − 2 ) + ( 23 − 2 ) + ( 33 − 3) + ( 23 − 2 ) + ( 23 − 2 ) + ( 33 − 3)
= 23.125
48
40(40 + 1)
T = = 410
4
40 ( 40 + 1) ( 2 ( 40 ) + 1)
T = − 23.125 = 74.24
24
701.5 − 410
zc = = 3.9263
74.24
5) CONCLUSION: Como P Z 3.9263 = 0.000043 es menor que = 0.05 , entonces
se acepta la Ha, es decir, el gerente tiene razón al afirmar que la marca de te
Nº 1 tiene mayor preferencia que el de la marca de te Nº 2, a un nivel de signi-
ficancia del 5%.
TEXTO UNIVERSITARIO
LA PRUEBA DE FRIEDMAN PARA K MUESTRAS
(MUESTRAS APAREADAS)
LA PRUEBA DE FRIEDMAN PARA K MUESTRAS (MUESTRAS APAREADAS) Estadística No Paramétrica
Esta prueba puede considerarse como una extensión de la prueba de Wilcoxon para el
caso de más de dos muestras. La prueba de Friedman, propuesta por el ganador del
premio Nobel, el economista Milton Friedman, es una prueba no parametrica para com-
parar las distribuciones de las mediciones de k tratamientos apareados, dispuestos en
n bloques, utilizando un diseño de bloques aleatorizados.
PROCEDIMIENTO
3. Se obtiene por separado la suma de los rangos C1, C2,…, Ck para cada una de las
muestras.
( t − tik )
n K
3
ik
L = 1− i =1 k =1
nk ( k 2 − 1)
k
12
nk ( k + 1) i =1
Ci2 − 3n ( k + 1)
X c2 =
L
5. Calcular los rangos de libertad: gl = k − 1 .
Las hipótesis nula y alternativa pueden designar pruebas de uno o de dos criterios de
calificación. Utilizando Med1 para representar la mediana 1, Med 2 para representar la
mediana 2, …, Med k para representar la mediana k.
EJEMPLO
Suponga que se quiere comparar las clasificaciones de los consumidores de seis dife-
rentes anuncios televisivos. Cuatro consumidores clasificaron cada anuncio en una es-
cala de 1 (malo) a 10 (excelente). El objetivo del experimento es determinar si existen
diferencias en los niveles de clasificación para los seis anuncios. Se presentan los da-
tos en la tabla. Utilice la prueba de Friedman para determinar si los datos presentan
suficiente evidencia para indicar diferencias en las clasificaciones de los seis anuncios
televisivos, utilizando un nivel de significancia del 5%.
ANUNCIO
SUJETO
A B C D E F
1 5 8 7 6 4 5
2 6 10 6 7 4 4
3 8 10 9 9 6 7
4 4 6 7 5 3 5
Rangos
ANUNCIO
SUJETO
A B C D E F
1 2.5 6 5 4 1 2.5
2 3.5 6 3.5 5 1.5 1.5
3 3 6 4.5 4.5 1 2
4 2 5 6 3.5 1 3.5
Rk= 11 23 19 17 4.5 9.5
1) HIPOTESIS:
3) REGIÓN DE RECHAZO:
Se
acepta
H0
Se
0.95 acepta
Ha
0.05
2
X 5;0.05 = 11.07
4) DETERMINACIÓN DE X c2 :
L = 1−
(2 3
− 2 ) + ( 23 − 2 ) + ( 2 3 − 2 ) + ( 2 3 − 2 ) + ( 2 3 − 2 )
= 0.964286
( 4 )( 6 ) ( 62 − 1)
12 2
(11) + ( 23) + (19 ) + (17 ) + ( 4.5 ) + ( 9.5 ) − 3 ( 4 )( 6 + 1)
2 2 2 2 2
( 4 )( 6 )( 6 + 1)
X c2 = = 17.3704
0.964286
METODO DE PROBABILIDAD
1) HIPOTESIS:
3) REGIÓN DE RECHAZO:
Se
acepta
H0
Se
0.95 acepta
Ha
0.05
2
X 5;0.05 = 11.07
4) DETERMINACIÓN DE X c2 :
L = 1−
(2 3
− 2 ) + ( 23 − 2 ) + ( 2 3 − 2 ) + ( 2 3 − 2 ) + ( 2 3 − 2 )
= 0.964286
( 4 )( 6 ) ( 62 − 1)
12 2
(11) + ( 23) + (19 ) + (17 ) + ( 4.5 ) + ( 9.5 ) − 3 ( 4 )( 6 + 1)
2 2 2 2 2
( 4 )( 6 )( 6 + 1)
X c2 = = 17.3704
0.964286
P X 2 17.3704 = 0.003848
Clasificaciones anuncios,
ordenado la mediana de mayor a menor
ANUNCIO
SUJETO
B C D A F E
1 8 7 6 5 5 4
2 10 6 7 6 4 4
3 10 9 9 8 7 6
4 6 7 5 4 5 3
MEDIANA 9.00 7.00 6.50 5.50 5.00 4.00
TEXTO UNIVERSITARIO
LA PRUEBA DE MANN − WHITNEY PARA DOS
MUESTRAS (MUESTRAS INDEPENDIENTES)
LA PRUEBA DE MANN − WHITNEY PARA DOS MUESTRAS (MUESTRAS INDEPENDIENTES) Estadística No Paramétrica
Este modelo de Mann−Whitney sirve para testear si dos muestras independientes han
sido tomadas de la misma población. Se tiene, por lo menos, una magnitud ordinal de la
misma. Este es el modelo no paramétrico más poderoso para comparar dos muestras
cuando no son apareadas. Es para el caso donde se tiene dudas acerca de la verifica-
ción de los supuestos que piden el modelo Student, o cuando las medidas son ordinales.
La hipótesis de trabajo (Ho), siempre es que ambas muestras provienen de la misma
población.
PROCEDIMIENTO
1. Ordenar las observaciones en rangos de los dos grupos, del más pequeño al ma-
yor.
3. Se obtiene por separado la suma de los rangos para cada una de las dos mues-
tras.
(t − ti )
l
3
i
L= i =1
12
6. Aplicar la ecuación L al estadístico U para obtener el ajuste:
n1n2 N 3 − N
U = − L
N ( N − 1) 12
Para rechazar la H0, el valor que se obtiene de U c debe ser menor que U n1 ;n2 ; ;2 .
U n1 ;n2 ; ;2
PRUEBA DE UNA COLA
Para rechazar la H0, el valor que se obtiene de U c debe ser mayor que U n1 ;n2 ; ;1 .
U n1 ;n2 ; ;1
Para rechazar la H0, el valor que se obtiene de U c debe ser menor que U n1 ;n2 ; ;1 .
U n1 ;n2 ; ;1
Las hipótesis nula y alternativa pueden designar pruebas de uno o de dos criterios de
calificación. Utilizando Med1 para representar la mediana 1, y Med 2 para representar
la mediana 2.
Las hipótesis nula y alternativa para una prueba de dos extremos son:
MUESTRAS PEQUEÑAS
Para una muestra combinada de 20 o menos, se usan tablas especiales para probar la
hipótesis nula de los dos grupos; estas tablas se encuentran en libros especializados
en métodos no parametritos, de los cuales se puede obtener el U crítico U n1 ;n2 ; ;#colas
para una prueba de una cola y de dos colas.
Donde:
EJEMPLO
U c = U 1 = (7 )(8) +
(7 )(8) − 61.5 = 22.5
2
5) CONCLUSION: Como U c es mayor que U 7;8;0.05;2 (22.510), entonces se acepta
la H0, es decir, la mediana de la método 1 es igual a la mediana de la método 2, a
un nivel de confianza del 95%.
MUESTRAS GRANDES
Si la muesta combinada es mayor que 20, se ha demostrado que la curva normal es una
buena aproximación de la distribución muestral. Esta curva normal tiene parámetros
que se encuentran en las ecuaciones que se presentaran a continuación. El estadístico
U de Mann−Whitney:
(t − ti )
l
3
i
L= i =1
12
n1n2
U =
2
n1n2 N 3 − N
U = − L
N ( N − 1) 12
U − U
zc =
U
Las hipótesis nula y alternativa para una prueba de dos extremos son:
Se Se
acepta
1- acepta
Ha Ha
/2 /2
- Z(/2) Z(/2)
Se
acepta
1- Ha
Z()
Se
acepta
H0
Se
acepta 1-
Ha
- Z()
EJEMPLO
Utilizando los datos del ejemplo anterior, en donde el Director de capacitación afirma
que el método 1 tiene mejores resultados. Obteniéndose los rangos: R1=190 y R2=161.
No otorgando el beneficio de la duda al Gerente de capacitación, plantee la hipótesis y
pruébela a un nivel de significancia del 5%.
Calificaciones asignadas a los aprendices
en los dos métodos de instrucción
Nº Método 1 Método 2 Rangos 1 Rangos 2 Empates
1 86 70 18.5 4 86
2 78 90 8 23.5 90
3 90 82 23.5 13 90 82
4 82 64 13 1 82
5 65 86 2 18.5 86
6 87 77 20 7
7 80 84 10 16
8 88 79 21 9
9 95 82 26 13 82
10 85 89 17 22
11 76 73 6 5
12 94 81 25 11
13 83 15
14 66 3
Rc= 190 161
1) HIPOTESIS:
Se
acepta
0.95 Ha
0.05
1.65
U c = U 2 = (12)(14) +
(14)(15) − 161 = 112
2
L=
(3 3
− 3) + ( 23 − 2 ) + ( 23 − 2 )
=3
12
U =
(12)(14) = 84
2
T =
(12 )(14 ) 263 − 26 − 3 = 19.42
( 26 )( 26 − 1) 12
112 − 84
zc = = 1.4416
19.42
5) CONCLUSION: Como zc z0.05 (1.4416<1.645), entonces se acepta la H0, es de-
cir, el gerente no tiene razón al afirmar que la método 1 es mejor que el método
2, a un nivel de confianza del 95%.
METODO DE PROBABILIDAD
1) HIPOTESIS:
Se
acepta
0.95 Ha
0.05
1.65
6) DETERMINACIÓN DE U c , U ca , zc y P Z zc : n1= 12 y n2=14, como la Ha:
Med 1 Med 2 , entonces se toma el rango R2=161. Posteriormente se determina:
U c = U 2 = (12)(14) +
(14)(15) − 161 = 112
2
L=
(3 3
− 3) + ( 23 − 2 ) + ( 23 − 2 )
=3
12
U =
(12)(14) = 84
2
T =
(12 )(14 ) 263 − 26 − 3 = 19.42
( 26 )( 26 − 1) 12
112 − 84
zc = = 1.4416
19.42
P Z 1.4416 = 0.0747
Prueba de un extremo
TEXTO UNIVERSITARIO
LA PRUEBA DE KRUSKAL - WALLIS PARA K
MUESTRAS (MUESTRAS INDEPENDIENTES)
LA PRUEBA DE MANN − WHITNEY PARA DOS MUESTRAS (MUESTRAS INDEPENDIENTES) Estadística No Paramétrica
PROCEDIMIENTO
1. Ordenar las observaciones en rangos de todos los grupos, del más pequeño al
mayor.
3. Se obtiene por separado la suma de los rangos para cada una de las muestras.
12 K Ri2
X = − 3 ( n + 1)
2
n ( n + 1) i =1 ni
c
5. Detectar las ligas o empates entre los rangos de cada grupo o muestra, en el
caso de que los hubiese, determinar la ecuación:
(t i3 − t i )
K
i =1
L = 1−
n3 − n
12 K Ri2
− 3 ( n + 1)
n ( n + 1) i =1 ni
X ca2 =
(t − ti )
K
3
i
1− i =1
n3 − n
Las hipótesis nula y alternativa pueden designar pruebas de uno o de dos criterios de
calificación. Utilizando Med1 para representar la mediana 1, Med 2 para representar la
mediana 2, …, Med k para representar la mediana k.
EJEMPLO
RANGOS
FÁRMACO
Nº
1 2 3 4
1 7.5 3 19.5 12
2 12 5 21 9.5
3 16.5 16.5 19.5 14
4 12 16.5 5
5 7.5 1 16.5
6 5 2 9.5
Rk= 60.5 44 60 66.5
1) HIPOTESIS:
3) REGIÓN DE RECHAZO:
Se
acepta
H0
Se
0.95 acepta
Ha
0.05
X 32;0.05 = 7.81
4) DETERMINACIÓN DE H c y H ca :
( 33 − 3) + ( 23 − 2 ) + ( 23 − 2 ) + ( 33 − 3) + ( 43 − 4 ) + ( 23 − 2 )
L = 1− = 0.98636
213 − 21
12 ( 60.5 ) ( 44 ) ( 60 ) ( 66.5 )
2 2 2 2
+ + + − 3 ( 21 + 1)
( 21)( 21 + 1) 6 6 3 6
X c2 = = 8.65701
0.98636
METODO DE PROBABILIDAD
1) HIPOTESIS:
3) REGIÓN DE RECHAZO:
Se
acepta
H0
Se
0.95 acepta
Ha
0.05
X 32;0.05 = 7.81
4) DETERMINACIÓN DE H c y H ca y P X 2 H ca :
( 33 − 3) + ( 23 − 2 ) + ( 23 − 2 ) + ( 33 − 3) + ( 43 − 4 ) + ( 23 − 2 )
L = 1− = 0.98636
213 − 21
12 ( 60.5 ) ( 44 ) ( 60 ) ( 66.5 )
2 2 2 2
+ + + − 3 ( 21 + 1)
( 21)( 21 + 1) 6 6 3 6
X c2 = = 8.65701
0.98636
P X 2 8.65701 = 0.03422
Se puede concluir que el fármaco 3 es el mejor, por cuanto el fármaco 3 con los fár-
macos 4, 1 y 2 respectivamente, sus P z zc 0.05 (sus medianas son diferentes).
1 18
2 7
3 3
4 ó más 1
3. Se piensa que las llamadas telefónicas de larga distancia a través de una cierta
centralista de una empresa grande se producen en forma aleatoria con tiempos
entre llamadas siguiendo una distribución exponencial. Las primeras llamadas
después de las 13 horas un lunes ocurrieron a las:
13:06 13:08 13:16 13:22 13:23 13:34 13:44 13:47 13:51 13:57
Los tiempos sucesivos entre llamadas, contando que el primer tiempo va desde
las 13:00 hasta las 13:06, son (en minutos):
6 2 8 6 1 11 10 3 4 6
Comprobar a un nivel de significación del 5% si la afirmación es correcta.
Tiempo (Segundos) 7.3 17.5 25.3 18.2 15.0 10.0 9.6 7.9 10.8 19.3 8.5
6. Dos policias de transito de la Ciudad de Tingo María llevan un control del núme-
ro de multas que han puesto durante siete días. Las observaciones apareadas
para cada día son:
PT1 17 15 12 9 17 18 14
PT2 14 14 15 7 16 18 10
a) Utilizando la Prueba del Signo, ¿puede asegurar que hay diferencias entre
el número de multas puestas por cada policia de transito? Utilice un nivel
de significancia del 10%.
Consumo en Consumo en
Individuo
el Trabajo la Casa
1 20 7
2 15 14
3 8 4
4 42 36
5 7 25
6 9 11
7 12 14
8 21 15
9 16 2
10 10 6
11 14 11
12 10 5
13 7 1
14 12 18
15 9 1
16 20 12
17 8 10
18 15 10
19 5 7
20 2 10
21 10 12
22 4 8
23 5 2
24 11 20
25 18 6
26 9 4
27 15 12
28 12 10
29 9 2
30 8 12
Una nueva máquina está siendo comprobada para ver si es menos variable que la
máquina actual, en cuyo caso se comprobará para remplazar la maquina vieja.
Varias cajas llenadas con cereal usando la máquina actual y la cantidad en cada
caja es medida. Lo mismo se hace con la máquina nueva para contrastar.
Máquina Actual 10.7 11.1 10.4 10.1 10.9
9. Una compañía que fabrica accesorios para cocinas montó la misma exhibición pa-
ra el producto en grandes almacenes en dos mercados diferentes, A y B. Se se-
leccionaron aleatoriamente en cada localidad a diez personas que vieron la exhi-
bición, y se les pidió que calificaran la exhibición en una escala de 1 a 20. Se
muestra las veinte calificaciones en la tabla siguiente:
Mercado A 15 11 20 14 9 12 5 17 13 18
Mercado B 17 6 15 10 6 8 10 16 8 7
¿Con los datos hay suficiente evidencia para indicar una diferencia en los nive-
les de calificaciones entre los dos mercados? Utilice un nivel de significancia
del 1%.
11. Una empresa consultora de administración realizó una encuesta para comparar
las estimaciones hechas por la administración a nivel superior, por la adminis-
tración a nivel medio y por un director financiero en jefe de la compañía del
crecimiento anual porcentual probable de las ganancias de la compañía. Se se-
lecciono una muestra aleatoria de diez compañías para el experimento y se eli-
gieron al azar representantes de la administración del nivel superior, del nivel
medio y del nivel de director financiero.
1 10 7 9
2 16 10 11
3 13 20 10
4 22 15 6
5 14 12 12
6 19 8 6
7 25 10 8
8 14 12 12
9 16 12 13
10 21 15 12
Años de Empleo 35 31 43 46 50 32 33 42