Вы находитесь на странице: 1из 33

8-1

CONTENI DO



Pg.
8.0 Mt odos est adst icos no paramt ricos

8-2
8. 1 Prueba de la mediana

8-4
8. 2 La prueba de signos

8-7
8. 3 Prueba de rachas de Wald- Wolfwit z

8-9
8. 4 Prueba de rangos y signos de Wilcoxon

8-10
8. 5 Prueba de suma de rangos de Wilcoxon

8-12
8. 6 Prueba de Mann- Whit ney

8-14
8. 7 Prueba de Kruskal Wallis

8-16
8. 8 Problemas de aplicacin de mtodos no parametricos

8-17
REFERENCI AS BI BLI OGRAFI CAS

8-26
ANEXO A8. Mtodos no paramtricos de correlacin lineal simple y
bondad del aj uste

8-27
ANEXO B8. Valores crticos de la prueba de rachas de Wald-
Wolfwitz

8-31
ANEXO C8 Valores crticos de la prueba de rangos y signos de
Wilcoxon

8-32
ANEXO D8 Valores crticos de la prueba de suma de rangos de
Wilcoxon- Mann-Wit hney

8-33



8-2
8.0 METODOS ESTAD STI COS NO PARAMTRI COS

Los mt odos est adst icos paramtricos suponen que los datos que se analizan siguen una
dist ribucin normal (Gaussiana). La validez de est a hipt esis se basa en el t eorema cent ral
del lmit e, que post ula que la dist ribucin muest ral de la media puede ser
aproximadamente normal aunque la poblacin de referencia tenga una distribucin muy
diferente. La aproximacin mej ora a medida que el tamao de la muestra aumenta.
Con frecuencia se presentan a los qumicos analistas situaciones donde no pueden
asumirse los supuest os requeridos por desconocerse la dist ribucin de la variable
est udiada, o bien, por ser la muest ra muy pequea de manera que incluso el t eorema
cent ral del lmit e sera de escasa relevancia. O bien, aunque se conozca la dist ribucin de
la variable y sea vlido tericamente hacer supuestos sobre la distribucin y sus
parmetros, no es razonable utilizar una prueba paramtrica ya que hay poca certeza de
que se cumplan en est e conj unt o de dat os. Tambin puede ocurrir que la variable no sea
continua por lo que no se cumplen las restricciones establecidas para las pruebas
paramt ricas.
En cualquiera de los casos ant eriores hay que buscar t cnicas alt ernat ivas que permit an
darle solucin a est as sit uaciones de forma eficient e. Surge as la necesidad de desarrollar
una serie de tcnicas est adst icas que t engan un mnimo de rest ricciones. A est as t cnicas
se les conoce como: Mtodos no paramtricos.
Segn WONNACOTT (1973) exist en dos indicaciones para preferir las pruebas no
paramt ricas:

1. Cuando la prueba clsica correspondiente no es vlida.
2. En aplicaciones en donde la prueba clsica es razonablement e vlida, pero un
est imador no paramt rico puede ser ms eficient e.

Entre las ventaj as del uso de mtodos no paramtricos se encuentran las siguientes (PRI A,
2001, cap. 1):
1. Tienen mayor eficiencia que los mtodos paramtricos en distribuciones
asimt ricas, o sea cuando hay valores at picos o dat os aberrant es.
2. Tienen validez en el sent ido de que su nivel de confiabilidad es realment e el
especificado en la mayora de las pruebas.


8-3
3. Generalment e son de cmput o mucho ms fcil que las t cnicas de las est adst icas
clsicas.
4. Son aplicables en situaciones donde los procedimientos clsicos no son aplicables.
5. An cuando se cumplan los requisit os para realizar una prueba paramt rica, si la
muest ra es pequea la eficiencia relativa de la prueba no paramtrica es alta.

Ent re las desvent aj as de la aplicacin de los mt odos no paramt ricos se cit an las
siguient es (PRI A, 2001, cap. 1):

1. Fundamentalmente cuando las muestras son muy grandes las pruebas no
paramtricas tienen una eficiencia relativa baj a con relacin a las paramtricas
cuando se cumplen los supuestos.
2. Las hipt esis que se plant ean en las pruebas no paramt ricas son menos precisas,
lo que hace que la interpretacin de los resultados sea ms ambigua.
3. Su aplicacin en muestras grandes se hace muy laboriosa.
4. Para un problema part icular pueden exist ir varias pruebas, por lo que en ocasiones
se hace difcil seleccionar la mej or.

En general, este tipo de pruebas deben utilizarse cuando no se cumplan los supuest os
para hacer una prueba paramtrica y cuando se duda sobre el cumplimiento de los
supuest os en una muest ra pequea. La principal vent aj a de las pruebas no paramt ricas
consist e en que pueden efect uarse inferencias exact as cuando las suposiciones
fundament ales de los mt odos est ndar no pueden cumplirse en su t ot alidad; su principal
desvent aj a radica en que exigen demasiada informacin y t ienen una eficiencia menor
cuando todas las suposiciones se satisfacen. Sin embargo, si se afirma que la eficie ncia de
ciert o mt odo no paramt rico es del 80%, se debe ent ender en realidad que es
relat ivament e valioso, dado que la eficiencia del correspondient e mt odo est ndar es
poco menos del 100% si todas las suposiciones no se cumplen con exactitud. En general
es verdad que cuanto menos se supone, tanto menos se puede inferir de un conj unto de
dat os, pero tambin es cierto que cuant o menos se supone, t ant o ms se ampla la
aplicabilidad de un mt odo (FREUD y WALPOLE, 1990, cap. 16).
Es posible comparar la conf iabilidad del uso de una prueba no paramtrica con respecto al
uso de una prueba paramtrica homloga a travs del concepto de potencia-eficiencia de


8-4
una prueba, que en general, se refiere al aument o porcent ual del t amao de muest ra que
se necesit a para obt ener los mismos result ados con una prueba X, no t an poderosa como
ot ra que es la prueba Y, que es la ms pot ent e que se conoce para resolver un problema
especfico cuando se cumplen los supuest os para efect uar la misma. La potencia-eficiencia
de la prueba X puede calcularse de la forma siguiente (PRI A, 2001, cap. 1):

Potencia Eficiencia de la prueba 100 x
N
N
X
x
Y


En donde N
Y
es el t amao de muest ra requerido para la prueba Y, y, N
X
el t amao de
muestra requerido para la prueba X.
Exist e una gran variedad de pruebas no paramt ricas t ant o para el anlisis de variables
cualit at ivas como cuant it at ivas. En el cuadro 8.1 se present a un list ado de dichas pruebas
y de su aplicacin.
En las secciones de la 8.1 a la 8.7 se describen con detalle las pruebas no paramt ricas
asociadas a variables de tipo cuantitativo de mayor aplicacin en anlisis qumico.
Adems de las pruebas expuest as en la t abla 8.1, exist en pruebas no paramt ricas para
correlacin y anlisis de regresin, cuyas bases se presentan en el anexo A8.

8.1 PRUEBA DE LA MEDI ANA

Esta prueba permite determinar si dos muestras independientes difieren con relacin a sus
medianas, o sea permite determinar si dos muestras independientes provienen de
poblaciones con la misma mediana siempre que la variable est al menos en escala ordinal
(PRI A, 2001, cap. 1). Existe una generalizacin de esta prueba que permite la
comparacin de las medianas de tres o ms muestras independientes que no ser obj eto
de estudio en esta seccin.
La hiptesis a probar es:
H
o
:
1
X
~
=
2
X
~

H
1
:
1
X
~

2
X
~


En donde
1
X
~
y
2
X
~
represent an las medianas de las dos muest ras que se est n
comparando.



8-5
CUADRO 8.1 DESCRI PCI ON DE PRUEBAS NO PARAMETRI CAS
PRUEBA TI PO DE VARI ABLE APLI CACI ON

Pr ueba
2
de i ndependenci a

Cualit at iva
Est a prueba permit e medir la
significacin de la asociacin ent re
dos variables de clasificacin.


Pr ueba
2
de homogenei dad

Cualit at iva

Cuando se t ienen varias muest ras
y se desea det erminar si son
homogneas con relacin a la
dist ribucin en las mismas de una
variable cualit at iva.


Pr ueba Kol mogor ov-Smi r nov


Cuant it at iva
Es una prueba no paramt rica que
se ut iliza para diferencias ent re
dist ribuciones acumuladas, es,
pues, una prueba de bondad de
aj ust e.




Prueba de l a medi ana



Cuant it at iva

Est a prueba permit e det erminar si
dos muest ras independient es
difieren con relacin a sus
medianas, o sea permit e
det erminar si dos muest ras
independient es provienen de
poblaciones con la misma
mediana.


Pr ueba de si gnos


Cuant it at iva

Est a prueba permit e la
comparacin de la mediana de
una serie de dat os con un valor
especif icado. Tambin permit e
indicar la exist encia de t endencias.


Prueba de rangos y si gnos de
Wi l coxon


Cuant it at iva
Permit e probar la aleat oriedad de
una secuencia de dat os. Tambin
permit e probar la simet ra de una
dist ribucin. Ot ra aplicacin de
est a prueba es comparar la
dist ribucin de una serie de dat os
con un valor especificado.


Prueba de l a suma de rangos
de Wi l coxon


Cuant it at iva
Const it uye la base para el rest o de
pruebas que ut ilizan rangos y
permit e det erminar si dos
muest ras proceden de la misma
dist ribucin, las muest ras deben
de ser del mismo t amao y no
necesariament e independient es.


Prueba de U-Man Whi t ney


Cuant it at iva
Est a prueba se ut iliza para
resolver el mismo caso que
resuelve la prueba de suma de
rangos de Wilcoxon con muest ras
no necesariament e del mismo
t amao.




Prueba de Kruskal Wall i s




Cuant it at iva
Es una generalizacin de la prueba
de suma de rangos de Wilcoxon,
permit iendo comparar ms de dos
muest ras con el propsit o de
conocer si proceden de la misma
poblacin o si hay diferencias
ent re las medidas de t endencia
cent ral de ms de dos
poblaciones.


8-6
Debe sealarse que en el caso de que las dist ribuciones de ambas poblaciones sean
simtricas, la mediana debe coincidir con la media aritmtica, convirtindose sta en una
prueba de comparacin de dos medias tambin (PRI A, 2001, cap. 1).
Como se est asumiendo que ambas muestras provienen de poblaciones con la misma
mediana, se determina el valor de la mediana general, o sea se combinan los valores de
ambos grupos para determinar el valor de la mediana.
Una vez det erminado st e valor se determina en cada una de las muestras cuntas
observaciones t ienen valores mayores que la mediana general y cunt as t ienen valores
inferiores a la misma.
Segn SI EGEL (1972) si hay valores que coincidan con los de la mediana general en las
muest ras est udiadas, se proceder de la siguiente forma:

1. Si la muest ra es grande y un nmero pequeo de observaciones coincide con est e
valor pueden excluirse del anlisis estas observaciones.
2. Si la muest ra no es grande o si el nmero de observaciones que coincide con est e
valor es grande entonces pueden contarse estos valores j unto con los valores
menores que la mediana.

La informacin se resumir en una t abla de cont ingencia de la forma siguient e (PRI A,
2001, cap. 1) :

Val or es/ Medi ana Muest r a 1 Muest r a 2 Tot al
Observaciones > Mediana General a b a+ b
Observaciones Mediana General c d c+ d
Tot al a+ c b+ d N


Para la prueba de hipt esis se necesit a un est adgrafo con una dist ribucin conocida para
det erminar si exist en diferencias significat ivas ent re las medianas de ambas poblaciones.
Para ello se utilizar la expresin (PRI A, 2001, cap. 1):
( )( )( )( ) d b c a d c b a
n
bc ad n
o
+ + + +

,
_



2
2
2



8-7
Este estadstico baj o el supuesto de que no existen diferencias entre las medianas de
ambas poblaciones se distribuye
2
con un grado de libertad.
Si
2 2
t abulada o
> con un grado de libert ad para un nivel de significacin det erminado, se
rechaza la hiptesis nula.
Al usar el est adgrafo
2
hay que tener en cuenta que se deben cumplir las restricciones
para la prueba
2
. En est e caso, como hay una t abla de cont ingencia de 2 x 2, debe
cumplirse que t odos los valores esperados sean mayores o iguales a 5, en caso de no
cumplirse est a rest riccin se deber ut ilizar la prueba de las probabilidades exact as de
Fisher (PRI A, 2001, cap. 1).
Segn SI EGEL y MOOD (1954) se ha demostrado que si la prueba de la mediana se aplica
a datos que pueden analizarse adecuadamente por una prueba paramtrica ms poderosa,
la prueba t en ste caso, su potencia-eficiencia sera de cerca de un 95% cuando n
1 +
n
2
=
6. Est e valor ira disminuyendo a medida que aument a el t amao muest ral llegando a
tener una eficiencia asinttica eventual de 63%.

8.2 LA PRUEBA DE SI GNOS

La prueba de signos es uno de los mtodos no paramtricos ms simples. La prueba t
supone que los dat os se dist ribuyen normalment e. La prueba del signo prescinde de t al
hiptesis y es mucho ms fcil de realizar. Se puede utilizar de diferentes formas, la ms
simple se describe a continuacin:
Para probar la hiptesis nula =
o
cont ra una alt ernat iva apropiada, basndose en una
muest ra aleat oria de t amao n, se reemplaza cada valor muest ral mayor que
o
por un
signo ms y cada valor muest ral menor que
o
por un signo menos (MI LLER y FREUND,
1986, cap. 10).
Se ignoran por complet o aquellos valores que son iguales a
o
. Para cont rast ar si la
preponderancia de signos menos, es significativa se utiliza la ley de la binomial acumulada.
Esta ley establece que la probabilidad de que aparezcan r signos menos ent re n signos
est dada por (MI LLER y MI LLER, 1993, cap. 6):

( )
r n r
r
q nC r p


donde:


8-8
nC
r
: indica el nmero de combinaciones de r element os de un t ot al de n
element os.
p: es la probabilidad de que aparezca un signo menos en uno de los resultados.
q: es la probabilidad de que no aparezca un signo menos en uno de los resultados,
es decir, q = 1 p.

Si la probabilidad experiment al es menor que un nivel de significacin , la hipt esis nula
debe rechazarse. Es decir, existe evidencia como para rechazar que los datos proceden de
una poblacin con =
o
(MI LLER y MI LLER, 1993, cap. 6).
La prueba de signos puede ut ilizarse t ambin como una alt ernat iva no paramt rica de la
prueba t por parej as para comparar dos grupos de resultados para las mismas muestras.
As, si se examinan n muest ras con cada uno de los dos mt odos, A y B se puede
contrastar si los dos proporcionan lecturas significativamente diferentes (MI LLER y
MI LLER, 1993, cap. 6).
Calculando para cada muest ra la diferencia en los result ados, es decir (MI LLER y MI LLER,
1993, cap. 6):

( ) [ ] ) ( B mtodo el por obtenido resultado mtodoA el por obtenido resultado

La hiptesis nula ser que los dos mtodos no proporcionan resultados significativamente
diferent es. En la prct ica est o significar que la probabilidad de obt ener un signo ms (o
un signo menos) es 0.5. La probabilidad o frecuencia de un nmero signos posit ivos sigue
una distribucin binomial de parmetros n, p = 0.5 (MI LLER y MI LLER, 1993, cap. 6).
El resumen de la prueba del signo para comparar dos poblaciones se present a en el
cuadro 8.2.
Cuando el nmero de pares en un experiment o de diferencias por parej as es grande, se
puede aproximar la dist ribucin de probabilidad para x, el nmero de veces que x
A
es
mayor que x
B
, por una distribucin normal. Por lo tanto, con ( )
B A
X X P p > se puede
probar H
O
: p = 0.5 utilizando la prueba para una proporcin binomial. (Ver cuadro 3.14,
captulo 3).
Ot ro uso de la prueba de signos es indicar una t endencia. En est a prueba al primer
resultado del primer grupo se le resta el primer resultado del segundo grupo, al segundo


8-9
result ado del primer grupo se le rest a el segundo result ado del segundo grupo y as
sucesivament e. Se obt iene de est a forma una serie de signos asociados a las diferencias
obtenidas e ignorando los ceros se calcula la probabilidad binomial de obtener r pares de
signos iguales. La hiptesis nula de que no exist e ninguna t endencia en los result ados, se
rechaza si la probabilidad calculada es menor que el nivel de significacin de la prueba
de dos colas (MI LLER y MI LLER, 1993, cap. 6).

CUADRO 8.2 RESUMEN DE LA PRUEBA DEL SI GNO APLI CADA AL ANALI SI S DE DOS
MUESTRAS

1. Hipt esis nula: H
o
: P( X
A
X
B
) = 0.5
2. Hipt esis alt ernat iva

Pr ueba de una col a
H
1
: P( X
A
X
B
) > 0.5
( o bien P( X
A
X
B
) < 0.5)
Pr ueba de dos col as
H
1
: P( X
A
X
B
) 0.5

3. Est adst ico de cont rast e: x = nmero de
pares de observaciones para los cuales X
A

excede a X
B
.

4. Regin de rechazo:
Pr ueba de una col a
Para: P( X
A
X
B
) > 0.5
Rechace H
o
para valores muy grandes de x.
Para: P( X
A
X
B
) < 0.5
Rechace H
o
para valores muy pequeos de x.


Pr ueba de dos col as
Rechace H
o
para valores muy grandes o muy
pequeo de x.
Bast a observar si la f recuencia observada de
signos posit ivos se desva signif icat ivament e de
la esperada n/ 2, en cuyo caso se rechaza H
o
.


Suposiciones: Las observaciones x
A
y x
B
se seleccionan aleatoria e independient ement e por pares.
Cuando los dat os de las observaciones de x
A
son iguales a las de x
B
se eliminan y con est o se
reduce el nmero de pares n.

8.3 PRUEBA DE RACHAS DE WALD WOLFWI TZ.

Las rachas son una secuencia de signos posit ivos seguida de una de signos negat ivos, y
luego otra de signos positivos. En algunos casos podra tener inters no slo investigar si


8-10
las observaciones generan signos positivos o negativos, si no tambin si stos aparecen en
una secuencia aleatoria.
En el caso de aj ust e de curvas, una secuencia no aleat oria de signos posit ivos y negat ivos
conducir a un nmero ms pequeo de rachas que una aleatoria. El mtodo de Wald
Wolfwitz prueba si el nmero de rachas es suficientemente pequeo para que se rechace
la hipt esis nula de una dist ribucin aleat oria de los signos (MI LLER y MI LLER, 1993, cap.
6) .
El nmero de rachas en los dat os experiment ales se compara con los nmeros de la t abla
del anexo B8, de prueba de rachas de Wald Wolfwit z , que se present a para un nivel de
significacin . En est a t abla los valores de N represent an el nmero de signos posit ivos y
M es el nmero de signos negativos. Si el nmero experimental de rachas es ms pequeo
que el valor tabulado, entonces se puede rechazar la hiptesis nula.
En relacin a la prueba de Wald-Wolfwit z, exist en ot ros punt os de int ers, por ej emplo,
permite comparar la mediana de una serie de datos con un valor especificado, al crear una
serie de signos a t ravs de la comparacin de cada valor de la serie con el valor
especificado y asignando un signo negativo a los datos inferiores al valor especificado y un
signo posit ivo a los superiores a dicho valor. I gnorando el nmero de ceros, se det ermina
el nmero de rachas obtenidas y se compara su valor con el propuesto en la tabla del
anexo B8.
Tambin cabe resaltar que se puede encontrar nmeros inusualmente grandes de rachas
cortas, as como tambin nmeros inusualmente pequeos de rachas largas. As por
ej emplo, como en el caso de 6 signos posit ivos y 6 signos negat ivos en el orden + - + - +
- + - + - + -, se podra sospechar que existe una secuencia no aleatoria. La tabla muestra
que, con N = M = 6, un t ot al de 11 12 rachas indica que la hipt esis nula de un orden
aleatorio se debera rechazar y sospechar una cie rta periodicidad en los datos (MI LLER y
MI LLER, 1993, cap. 6).

8.4 PRUEBA DE RANGOS Y SI NGOS DE WI LCOXON

La import ancia de la prueba de signos radica en los supuest os mnimos que se hacen
sobre los datos experimentales. No se supone que la poblacin de la cual se toma la
muest ra sea normal, ni incluso que sea simt rica. La nica informacin a priori necesaria
es el valor de la mediana. Una cierta desventaj a de la prueba de signos es que no utiliza


8-11
toda la informacin disponible. Slo es necesario saber si una medicin individual es ms
grande o ms pequea que la mediana, y la magnitud de esta desviacin no se utiliza en
absolut o (MI LLER y MI LLER, 1993, cap. 6).
En muchos casos un analist a t endr suficient es razones para creer que sus mediciones se
distribuyen simt ricament e pero no desea suponer que siguen una dist ribucin normal.
Este supuesto de datos simtricos, y la consecuencia de que la media y la mediana de la
poblacin sean iguales, permit e desarrollar pruebas de significacin ms pot ent es.
Wilcoxon cont ribuy con import ant es avances al respect o, y su prueba de rangos y signos
tienen varias aplicaciones (MI LLER y MI LLER, 1993, cap. 6).
La comparacin de la dist ribucin de una serie de dat os con un valor de referencia se
realiza mediante la obtencin de las diferencias entre cada dato de la muestra y el valor de
referencia (conservando los signos). Los valores absolut os de est as diferencias se ordenan
post eriorment e de menor a mayor y a cont inuacin se incorporan sus signos, los nmeros
entonces se j erarquizan, en est e proceso se mant ienen sus signos pero se les asignan
nmeros que indican su orden o rango.
Luego, asignando con X a la suma de los rangos posit ivos y con Y a la suma de rangos
negat ivos, se selecciona la menor de est as cifras (X Y) y se t oma como el est adst ico de
cont rast e. El t eorema binomial dar la probabilidad de que aparezca est e nmero. Si los
datos provienen de una poblacin con una mediana igual al valor especificado, se
esperara que la suma de rangos positivos y negativos sea aproximadamente igual.
La probabilidad de que aparezca una suma concreta est dada en la tabla que se presenta
en el anexo C8. En est a prueba se rechaza la hipt esis nula si el valor t abulado es menor
o igual que el valor experiment al, es decir, sit uacin opuest a de la observada en la
mayora de las pruebas de significacin.
Una vent aj a import ant e de la prueba de rangos y signos es que t ambin se puede ut ilizar
para dat os por parej as, ya que las diferencias ent re los dat os de las dos series se pueden
t ransformar en el t ipo de dat os como en el caso ant erior. De est a manera se puede
utilizar este mtodo no paramtrico como una alternativa a la prueba t por parej as
(MI LLER y MI LLER, 1993, cap. 6).
Si no hay diferencia entre las dos series de datos, entonces se esperara que las
diferencias ent re los result ados para cada muest ra, [ (result ado muest ra 1) (resultado
muestra 2)] debern distribuirse en torno a cero. Cuando hay posiciones empatadas, el
problema se resuelve asignando posiciones promedio a los valores empat ados, con signos


8-12
adecuados. Si la ordenacin es correcta, al calcular la suma de todos los valores sin tomar
en cuenta el signo, debe ser la misma que la suma de los ocho primeros nmeros
naturales (MI LLER y MI LLER, 1993, cap. 6).
Si la suma de los valores positivos es X y la de los valores negat ivos es Y, el estadstico de
prueba ser la menor de estas sumas. Este valor se compara con el valor obtenido de la
t abla del anexo C8, rechazando la hipt esis nula si el valor del est adst ico de prueba es
menor que el especificado en dicha tabla.
Es de hacer notar que la prueba de rangos y signos es un mtodo simple y de mucha
utilidad, aunque su principal limitacin radica en que no se puede aplicar a conj untos de
dat os muy pequeos, para el caso de prueba de dos colas con un nivel de significacin p
= 0.05, n tiene que ser al menos 6 (MI LLER y MI LLER, 1993, cap. 6).

8.5 PRUEBA DE SUMA DE RANGOS DE WI LCOXON

La prueba de rangos y signos descrit a ant eriorment e es vlida para el est udio de
conj untos individuales de mediciones y para conj untos de datos por parej as que se pueden
reducir con facilidad a conj unt os individuales. Sin embargo, en muchos casos es necesario
comparar dos muestras independientes que no se puedan reducir a un conj unto nico de
dat os, ya que pueden cont ener diferent es nmeros de mediciones. Exist en varias pruebas
no paramtricas que permiten abordar estas situaciones (MI LLER y MI LLER, 1993, cap. 6).
Sean A y B, dos muestras con M y N observaciones respectivamente, donde se cumple que
M

N, la prueba de suma de rangos de Wilcoxon para determinar si ambas muestras
proceden de la misma distribucin se describe a continuacin (PRI A, 2001, cap. 3):
1. Se ordenan todas las observaciones de ambas muestras, como si fuera una sola
muest ra, en orden ascendente y se asignan los rangos a los valores ordenados.
2. Se identifican los valores que pertenecen a cada muestra.
3. Se determina el estadgrafo que en esta prueba es: T
o =
Suma de rangos de B = (
rangos B) (en donde B es la muestra ms pequea)
4. La regla de decisin ser:
a) Se plantea la Hiptesis que se adecue a la situacin que se necesita resolver, y se
aplica la regla de decisin de acuerdo a lo que se presenta en el cuadro 8.3:




8-13
CUADRO 8.3 APLI CACI N DE LA REGLA DE DECI SI ON PARA LA PRUEBA DE SUMA
DE RANGOS DE WI LCOXON

Hi pt esi s

Regl a de deci si n
rechazar H
o
si :
ms
usados
H
o
: Me
B
= Me
A

H
1
: Me
B
Me
A

T
o


T
I


T
o


T
S

0.025
0.05
H
o
: Me
B
Me
A

H
1
: Me
B
< Me
A

T
o


T
I

0.05
0.01
H
o
: Me
B
Me
A

H
1
: Me
B
> Me
A

T
o


T
S

0.05
0.01

Donde T
I
y T
S
son los valores obtenidos en la tabla de Valores crticos para la estadstica
de prueba de la Suma de Rangos de Wilcoxon (ver anexo D8), considerando un tamao de
n
A
y n
B
y un nivel de significacin dado. Est a t abla sirve para t rabaj ar cuando el tamao de
la muest ra llega hast a 25 la muest ra menor y 50 la mayor. Me
B
y Me
A
representan los
parmetros de tendencia central de las distribuciones de ambas muestras.
Cuando el tamao de la muestra menor excede las 25 observaciones puede trabaj arse con
la aproximacin a la distribucin normal (PRI A, 2001, cap. 3).
Ot ra forma de rechazar la hipt esis nula es cuando se est t rabaj ando con un programa
estadstico que calcule T
o
y p que es la probabilidad de error de tipo I asociada a ese valor.
En ste caso si el valor de p es menor que el prefij ado se rechaza la hiptesis nula.
Deben aclararse los aspectos siguientes (PRI A, 2001, cap. 3):

1. Si n
A
= n
B
se seleccionar el est adgrafo rangos de la muest ra t omando en
consideracin las hiptesis alternativas, de la forma siguiente:

Si l a Hi pt esi s Al t er nat i va es: Se sel ecci onar l a muest r a:
H
1
: Me
B
Me
A
Cualquiera de las dos t iene igual
solucin
.
H
1
: Me
B
< Me
A


T
o
= la que t enga mayor suma de
rangos.
H
1
: Me
B
>

Me
A


T
o
= la que t enga menor suma de
rangos.


2. Las hipt esis deben plant earse t omando como primer parmet ro de referencia para
cont rast ar el de la muest ra ms pequea, en el caso de que sean de igual t amao podrn
plant earse de cualquier forma.


8-14

3. En caso de exist ir observaciones de igual valor se asignarn rangos promedios, por
ej emplo si los tres primeros valores son:

VALORES 15 15 15
LUGARES 1 2 3
RANGOS ( 1+ 2+ 3) / 3 =2 ( 1+ 2+ 3) / 3 =2 ( 1+ 2+ 3) / 3 =2

4. Potencia - Eficiencia:
Segn Siegel, si la prueba de la Suma de Rangos de Wilcoxon se aplica a datos que
pueden analizarse adecuadament e por una prueba paramt rica ms poderosa, la prueba t
de St udent en st e caso, su pot encia -eficiencia sera de cerca de un 95.5% y se acerca a
95% para muest ras de t amao moderado, por lo que es una excelent e alt ernat iva ant e la
prueba t .
Debe dest acarse que est a prueba es ms pot ent e que la prueba de la Mediana, pues est a
lt ima ut iliza solament e la informacin de cmo est n ubicadas las observaciones de cada
muest ra con relacin al valor de la mediana general, en cambio la prueba de suma de
rangos de Wilcoxon utiliza adems, la informacin relativa a la ubicacin de cada
observacin en las muestras, que se resume en el estadgrafo de la suma de rangos.

8.6 PRUEBA MANN-WHI TNEY

Ot ra prueba que se ut iliza para resolver el mismo caso que resuelve la prueba de la Suma
de Rangos de Wilcoxon es la prueba de Mann-Whit ney. El procedimient o seguido en
ambas es muy parecido. Las hipt esis que se cont rast an son las mismas y el est adgrafo
utilizado se parece aunque por supuest o no es igual. A cont inuacin se describe el
procedimient o para el cont rast e de hipt esis mediant e el uso de la prueba de Mann-
Whit ney:
I nicialment e se ident ifican ambas muest ras A y B, con M y N observaciones
respect ivament e, donde se cumple que M
N
. Todas las observaciones de ambas
muest ras se ordenan, como si fuera una sola muest ra, en orden ascendent e y se asignan
los rangos a los valores ordenados. Post eriorment e, se ident ifican los valores que


8-15
pert enecen a cada muest ra y se calculan las sumas de rangos de cada muest ra y se define
S, que es la suma de rangos de menor valor (PRI A, 2001, cap. 3).
El estadstico de contraste para esta prueba es (PRI A, 2001, cap. 3) :


2
1) ( +

N N
S T
o

La regla de decisin vendr dada en funcin del plant eamient o de la hipt esis que se
adecue a la sit uacin que se desea resolver, como se muest ra en el cuadro 8.4 (PRI A,
2001, cap. 3) :

CUADRO 8.4 APLI CACI N DE LA REGLA DE DECI SI ON PARA LA PRUEBA
DE MANN- WHI TNEY
Hi pt esi s

Regl a de deci si n
r echazar H
O
si:
ms
usados
H
o
: Me
B
= Me
A

H
1
: Me
B


Me
A

T
o


W
/2
o
T
o
W
1 - /2

0.025
0.005
H
o
: Me
B
Me
A

H
1
: Me
B
< Me
A

T
o


0.05
0.01
H
o
: Me
B
Me
A

H
1
: Me
B
> Me
A

T
o


W
1 -

donde
W
1 -
= NM - W


0.05
0.01

Donde W

y W
/ 2
son los valores crticos obtenidos en la tabla de valores crticos para la
est adst ica de prueba de Mann-Whitney presentada en el anexo D8, en la que se
consideran t amaos muest rales n
A,
n
B
y un nivel de significacin . Est a t abla sirve para
trabaj ar cuando los tamaos muestrales son de 20 para la muestra menor y 40 para la
mayor.
Cuando el tamao de la muestra menor excede las 20 observaciones puede trabaj arse con
la aproximacin a la distribucin normal (ver capt ulo 3.0).
Ot ra forma de rechazar la hipt esis nula es cuando se est t rabaj ando con un programa
estadstico que calcule T
o
y p que es la probabilidad de error de tipo I asociada a ese valor,
en est e caso se rechaza la hipt esis nula si p es menor al nivel de significacin tomado
para la prueba.





8-16
8.7 PRUEBA DE KRUSKAL WALLI S

Cuando se present a el problema de comparar ms de dos muest ras con el propsit o de
conocer si proceden de la misma poblacin, o bien, comparar si existen diferencias entre
las medidas de tendencia central de ms de dos poblaciones y no se j ustifica la suposicin
de normalidad y de igualdad de varianzas, el qumico analista podr recurrir a un
procedimiento alternativo al de la prueba F del anlisis de la variancia y que no depende
de est a suposicin. Kruskal y Wallis (1952) desarrollaron un procedimient o como
alt ernat iva para dar solucin a est e problema, conocido como la prueba de Kruskal
Wallis.
La prueba de KruskalWallis constituye una alternativa no paramtrica al anlisis de
varianza usual y se considera como una ext ensin del procedimient o de suma de rangos
de Wilcoxon como se ver en su desarrollo (MI LLER y FREUND, 1989, cap. 10).
La hiptesis nula para la prueba de Kruskal-Wallis es que no existe diferencia entre los
t rat amient os (
1
=
2
= . =
a
), mientras que la hiptesis alternativa es que exista
diferencia entre al menos un par de tratamientos ((
i

j
).
Para realizar la prueba de KruskalWallis los dat os pueden agruparse como se present a en
la tabla a continuacin (MONTGOMERY, 1991, cap. 4):

Tr at ami ent os Repet i ci ones
A B C
1
A
X
1

B
X
1

C
X
1

2
A
X
2

B
X
2

C
X
2

M M M M
n
nA
X
nB
X
nC
X
Donde
ij
X son las
observaciones
i = 1, 2, , n
j = A, B, C,
N = n
A
+ n
B
+ n
C


Las observaciones se organizan post eriorment e, en orden ascendent e y se asignan las
posiciones (o rangos) con el rango 1 correspondient e a la observacin ms pequea. En
caso de empat e (varias observaciones con el mismo rango o posicin), se asigna el rango
promedio a cada observacin empatada (MONTGOMERY, 1991, cap. 4).
El est adst ico de prueba de Kruskal-Wallis est dado por la expresin (MONTGOMERY,
1991, cap. 4):
1
]
1

a
i i
i
N N
n
R
S
H
1
2 2
2
4
1 1 ) (
.



8-17
En donde R
i.
es la suma de los rangos de las observaciones del i-simo t rat amient o y n
i
es
el nmero de observaciones del i-simo t rat amient o; N es el nmero t ot al de
observaciones y (MONTGOMERY, 1991, cap. 4)

1
]
1



a
i
ni
j
ij
N N
R
N
S
1
2
1
2 2
4
1
1
1 ) (

Debe not arse que S
2
es igual a la varianza de los rangos. Si no hay empat e, S
2
=
N(N+ 1)/ 12 y el est adst ico de prueba se simplifica a (MONTGOMERY, 1991, cap. 4):

1
]
1

a
i i
i
N
n
R
N
H
1
2
1 3
1
12
) (
.


Si n
i
es razonablement e grande, como sera el caso de n
i
5, entonces H tiene una
dist ribucin aproximadament e
2
1

a
( ver t abla del anexo C3) si la hipt esis nula es
verdadera. Por lo tanto, si (MONTGOMERY, 1991, cap. 4)
H
2
1

a ,

hay que rechazar la hiptesis nula.
Si H se calcula mediante un programa estadstico en una computadora se obtendr el valor
de H con la probabilidad exacta de error tipo I asociada a ese valor.
Debe sealarse que la potencia-eficiencia de est a prueba comparada con la prueba
paramt rica ms poderosa, la prueba F, considerando que se cumplen los supuest os para
la misma es de un 95.5% (PRI A, 2001, cap. 3).

8.8 PROBLEMAS DE APLI CACI N DE METODOS NO PARAMETRI COS

1. En relacin al ej ercicio 1 de la seccin 3.5.2 (cap. 3), que se refiere a la
determinacin del tanto por ciento del nquel de una muestra particular de acero de
referencia del NI ST por un nuevo mtodo espectrofotomtrico, determinar
mediante la prueba del signo para los niveles de significacin del 0.01 y 0.05 si =
1.12% .
Datos: 1.10, 1.08, 1.09, 1.12, 1.109



8-18
Solucin:

a) Hiptesis nula: = 1.12%
Hiptesis alterna: 1.12%

b) Nivel de significacin: = 0.01 y 0.05

c) Clculo:
Reemplazando cada valor mayor que 1.12% por un signo posit ivo y cada valor
menor que 1.12% por un signo menos, los cinco valores generados son:
- - - 0 -

d) Crit erio: el crit erio de decisin se basa en el nmero signos posit ivos (X) o en el
nmero de signos negativos (Y). Utilizando el nmero de signos menos frecuente,
se rechaza H
o
si la probabilidad de obt ener X Y o ms signos es menor o igual a
0.01 0.05 (dependiendo del nivel de significacin dado a la prueba.
As, para X = 0 que es el nmero de signos posit ivos, el clculo de la probabilidad
binomial para X 0 con parmetros n = 4 y p= 0.5 es:

P (X 0; n = 4 , p = 0.5 ) =
0 4 0
5 0 1 5 0
0
4

,
_

) . ( . = 0.0625

Para un nivel de significacin del 10%, puede rechazarse la hipt esis nula de que
= 1.12%, dado que P(= 0.0625) < 0.1. Mient ras que si se usa un nivel de
significacin del 5% no exist e evidencia como para rechazar H
o
. Se observa, en el
primer caso, que se coincide con los result ados obt enidos en la prueba
paramt rica, mient ras que en el segundo caso, no. La prueba paramt rica puede
volverse ms concluyente en la medida que se aumente el nmero de mediciones.

2. Los siguientes quince datos son mediciones del punto de ebullicin de un
compuesto de silicio en C: 166, 141, 136, 153, 170, 162, 155, 146, 183, 157, 148,
132, 160, 175, 150. Para un nivel de significacin de 0.05, utilizar las pruebas del
signo y de rangos y signos de Wilcoxon para probar la hiptesis de que = 158 C.

Solucin:

Prueba del signo

a) Hiptesis nula: = 158 C
Hiptesis alterna: 158 C

b) Nivel de significacin: = 0.05

c) Clculo:


8-19
Reemplazando cada valor mayor que 158 C por un signo positivo y cada valor
menor que 158 C por un signo menos, los quince valores generados son:

+ - - - + + - - + - - - + + -

d) Crit erio: el crit erio de decisin se basa en el nmero signos posit ivos (X) o en el
nmero de signos negativos (Y). Utilizando el nmero de signos menos frecuente,
se rechaza H
o
si la probabilidad de obt ener X Y o ms signos es menor o igual
0.05 (dependiendo del nivel de significacin dado a la prueba).
El signo menos frecuent e es el signo ms (+ ) y su nmero es X = 6, el clculo de
la probabilidad binomial para X 6, con parmetros n = 15 y p = 0.5 es:

P (X 6; n = 15, p = 0.5 ) =

,
_

6
0
15
5 0 5 0
15
X
X X
X
) . ( ) . ( = 0.3036

Dado que 0.3036 es mayor que el nivel de significacin de 0.05, no exist e
evidencia como para rechazar que el punt o de ebullicin del compuest o de silicio
sea de 158 C.

Suma de rangos y signos de Wilcoxon

a) Hiptesis nula: = 158 C
Hiptesis alterna: 158 C

b) Nivel de significacin: = 0.05

c) Clculo:
Comparando cada dato obtenido con 158 C, se obtiene:

8 -17 -22 -5 12 4 -3 -12 25 -1 -10 -26 2 17 -8

Ordenando los datos de menor a mayor sin tomar en cuenta los signos se tiene:

1 2 3 4 5 8 8 10 12 12 17 17 22 25 26

Colocando los rangos y los signos asociados a cada observacin se tiene:

-1 2 -3 4 -5 6.5 -6.5 -8 9.5 -9.5 11.5 -11.5 -13 14 -15

d) Criterio: el criterio de decisin se basa en la suma de los rangos con signo
posit ivo (X) o en la suma de los rangos con signo negat ivo (Y). Ut ilizando la suma
menor, se rechaza H
o
si al compararla con el valor obtenido de la tabla del anexo
B8 se observa que es menor o igual que este.
En este problema:

X (suma de rangos con signo positivo) = 47.5
Y (suma de rangos con signo negativo) = 72.5



8-20
Por lo que el estadstico de contraste es X = 47.5, de la tabla del anexo B8, se
obt iene el valor de 25 para n = 15 y = 0.05. Dado que el valor del estadstico de
contraste es mayor que el valor ledo en la tabla puede concluirse que no existe
evidencia significat iva al 5% como para afirmar que el punt o de ebullicin del
compuesto de silicio difiere de 158 C.
Como puede observarse est e result ado, coincide con el generado a part ir de la
aplicacin de la prueba del signo.


3. En relacin al ej ercicio 3 de la seccin 3.2.5(cap. 3) que se refiere a la
determinacin de la homogeneidad de una muestra patrn de cloruros mediante
anlisis de porciones de material, tomadas en la superficie y en el fondo del
contenedor, en el que los datos obtenidos fueron:

% de Cl or ur os en
l a super f i ci e
% de cl or ur os en
el f ondo
26.32 26.28
26.33 26.25
26.38 26.38
26.39

A partir de la prueba de la mediana, determinar si existe homogeneidad en el
material a un nivel de significacin del 5%.

Solucin:
a) Hiptesis nula: hay homogeneidad en el contenido de cloruros de la muestra
patrn, es decir: Me
f ondo
= Me
superficie


b) Hipt esis alt erna: no hay homogeneidad en el cont enido de cloruros de la
muestra patrn, es decir: Me
f ondo
Me
superficie


c) Nivel de significacin( ): 0.05

d) Procedimiento de prueba:

El primer paso consist e en ordenar la serie de dat os en orden
ascendente como si procedieran de la misma muestra, para los datos
del ej ercicio se tiene:

26.25 26.28 26.32 26.33 26.38 26.38 26.39



8-21
La mediana de la serie anterior es: 26.33
El resumen de la informacin del problema para la prueba de la
mediana se presenta en la tabla a continuacin:

Val or es/ medi ana Muest r a 1 Muest r a 2 Tot al
Obs. > mediana general 2(a) 2(b) 4
Obs. mediana general 2(c) 1(d) 3
Tot al es 4 3 7

El clculo del estadstico para el contraste es el siguiente:
( )( )( )( ) d b c a d c b a
n
bc ad n
o
+ + + +

,
_



2
2
2


109 0
144
75 15
3 4 3 4
2
7
2 2 1 2 7
2
2
.
.

,
_



x x x
x x
o



e) Criterio de decisin: si
2
o

2
t abulado
con un grado de libertad y para un = 0.05
(ver anexo C3, t abla de
2
) se rechaza la hiptesis nula. Dado que 0.109 < 3.84
(ver anexo C3), no exist e evidencia significat iva al 5% como para rechazar la
hiptesis nula. Por lo que se concluye que no existe evidencia a un nivel de
significacin de 0.05 de que las medianas de las distribuciones de los valores de
cloruro varien entre la superficie y el fondo del cont enedor. Como puede
observarse este resultado coincide con el obtenido mediante la prueba
paramt rica.


4. En el desarrollo de un nuevo mt odo para la det erminacin de niveles de alcohol
en la sangre, se analiz cinco veces una muest ra de sangre, con los resultados
siguientes: 64.5, 66.0, 63.9, 65.1 y 64.0 mg/ 100 ml. El mtodo de anlisis estndar
aplicado a la misma muestra proporciona los resultados 66.2, 65.8, 66.3, 65.6
mg/ 100ml. Ut ilizando las pruebas de U-Mann Whitney y la de suma de rangos de
Wilcoxon, probar si los mtodos difieren significativamente.

Solucin:
Prueba de U-Mann Whit ney

a) Hiptesis nula: Me
mt odo est ndar
= Me
mt odo nuevo


8-22
b) Hiptesis alterna: Me
mt odo est ndar
Me
mt odo nuevo


c) Nivel de significacin( ): 0.05

d) Procedimiento de prueba:

El primer paso consiste en asignar los rangos a los datos de ambas
muestras como si todos fueran una sola muestra, de la siguiente forma:


Mt odo nuevo Rango Mt odo est ndar Rango
65.5 4 66.2 8
66.0 7 65.8 6
63.9 1 66.3 9
65.1 3 65.6 5
64.0 2


La suma de rangos de cada muest ra es:

Muest ra del nuevo mt odo = 17
Muest ra del mt odo est ndar = 28

El estadstico viene dado por tanto como:

2
2
1 5 5
17
2
1

+

+

) ( ) (N N
S T
o


Para S = 17 (menor de las sumas de rangos) y N = 5 (nmero de dat os
para la muestra con la menor suma de rangos).
De esta forma T
o
= 2

e) Criterio de decisin:

El valor de W
/ 2,n1,n2
obtenido de la tabla del anexo D8 es:

W
0.05, 4, 5
= 1

Dado que T
o
= 2 > W
0.05, 4, 5
= 1, no existe evidencia a un nivel de significacin del
5% como para rechazar la hipt esis nula, o, en ot ras palabras, se concluye que no
existe evidencia significativa al 5% como para rechazar que los dos mtodos
producen result ados equivalent es.

Prueba de Suma de Rangos de Wilcoxon:
La variante de esta prueba con respecto a la prueba de U-Mann Whit ney


8-23
se encuentra nicamente en el estadstico de contraste empleado, pues en la
prueba de Suma de rangos de Wilcoxon, se calculan dos estadsticos que vienen
dados como:

18
2
1 4 4
28
2
1
2
2
1 5 5
17
2
1
2 2
2 2
1 1
1 1

+

+

+

+

) ( ) (
) ( ) (
N N
S T
N N
S T


Criterio de decisin:

El valor de W
/ 2,n1,n2
obtenido de la tabla del anexo D8 es:

W
0.05, 4, 5
= 1

Dado que la menor de est as sumas es 2 y supera al valor t abulado de 1, no exist e
evidencia significativa al 5% como para rechazar H
o
.


5. En relacin al ej ercicio 6 de la seccin 3.5.2, de la comparacin de los resultados
obt enidos en la aplicacin de un nuevo mt odo de det erminacin de I ndio en Zinc
y sus aleaciones y el valor report ado en el pat rn cert ificado. Est udiar con un nivel
de significacin del 5%, mediant e la prueba de rangos y signos de Wilcoxon, si
existe diferencia entre las mediciones con el nuevo mtodo y el valor certificado del
patrn. La tabla de datos se presenta a continuacin:

Pat rn Observaci n Cert i f i cado
CRM322
2 3
CRM323
6 5
CRM324
15 16
CRM325
44 46
CRM352
2 3
CRM353
1 3
CRM354
7 10
CRM357
6 3
CRM358
12 7
CRM359
16 16
CRM360
29 30

Solucin:
a) Hiptesis nula:
d
= 0
b) Hiptesis alterna:
d
0



8-24
c) Nivel de significacin( ): 0.05

d) Procedimiento de prueba:

En la t abla a cont inuacin se present an en la primera columna las diferencias
calculadas para cada par de datos, en la segunda columna se presentan estas
diferencias ordenadas en orden ascendente sin tomar en cuenta el signo y en la
columna tres se presenta el rango asignado a cada diferencia:

d
i
= obs- Cert . or den rango
-1 0 1
1 -1 -4
-1 -1 -4
-2 -1 -4
-1 -1 -4
-2 1 4
-3 -2 -7. 5
3 -2 -7.5
5 -3 -9.5
0 3 9.5
-1 5 11

La suma de los rangos con signo positivo y negativo son respectivamente:
X (suma de rangos con signo + ) = 25.50
Y (suma de rangos con signo -) = 40.50
Por lo tanto el estadstico de prueba es: X = 25.5

e) Criterio de decisin:

Al comparar el estadstico de prueba con el valor obtenido de la tabla del anexo C8,
para n = 11, se observa que X = 25.5 > 10, por lo tanto no existe evidencia de que
la mediana (media) de la diferencia sea dist int a de cero, es decir, no exist e
evidencia significat iva al 5% de la diferencia ent re las mediciones de la
concentracin del patrn por el nuevo mtodo y valor certificado del mismo.


6. Considere el ej ercicio 1 de la seccin 4.1.10 (cap. 4), en el que se quiere comparar
el trabaj o de cuatro analistas de un laboratorio en el ensayo de determinacin del
% de alcohol met lico en muest ras de un product o qumico, mediant e la t cnica de
cromat ografa lquida de alta resolucin (HPLC). Los analistas reportaron los
result ados siguient es:



8-25
Anal i st a % de al cohol met l i co
1 84.99 84.02 84.38
2 85.15 85.13 84.88
3 84.72 84.48 85.16
4 84.20 84.10 84.55

Mediant e la prueba no paramt rica de Kruskall-Wallis, det erminar si el t rabaj o de
los analistas difiere significativamente. Use un nivel de significacin de 0.05.

Solucin:
f ) Hiptesis nula: los cuat ro analist as t rabaj an de forma equivalent e, es decir: Me
1
= Me
2
= Me
3
= Me
4


g) Hiptesis alterna: al menos dos analistas trabaj an de forma diferente:

h) Nivel de significacin( ): 0.05

i) Procedimiento de prueba:

El primer paso consist e en ordenar la serie de dat os en orden
ascendent e como si procedieran de la misma muest ra, luego se
establecen los rangos. La asignacin de rangos se presenta en la
siguiente tabla:

Muest r a Anal i st a 1 Anal i st a 2 Anal i st a 3 Anal i st a 4
1 9 11 7 3
2 1 10 5 2
3 4 8 12 6


ij
R
14 29 24 11

El clculo del estadstico para el contraste es el siguiente:

Como no hay empates, el estadstico de prueba ser:

) (
) (
.
1 3
1
12
1
2
+
+

N
n
R
N N
H
a
i i
i


46 5 13 3
3
11
3
24
3
29
3
14
13 12
12
2 2 2 2
.

,
_

+ + + x
x
H



8-26
Criterio de decisin: si H >
2
1

a ,
se rechaza la hiptesis nula. En este caso
81 7
2
3 05 0
.
, .
(de t abla del anexo B3). Dado que 5.46 < 7.81, no exist e evidencia
significativa al 5% como para rechazar la hiptesis nula, por lo que se concluye que
no existe evidencia a un nivel de significacin de 0.05, como para afirmar que los
analist as t rabaj an de forma diferente.

REFERENCI AS BI BLI OGRAFI CAS

Fr eund, J.E. y Wal pol e, R.E. ( 1990) . Est adst ica mat emt ica con aplicaciones.
Cuart a edicin. Mxico: PRENTI CE HALL HI SPANOAMERI CANA S.A.

Mendenhal l , W. ( 1990) . Est adst ica para administ radores. Segunda edicin.
Mxico: Grupo Edit orial I beroamrica.

Mi l l er , I . y Fr eund, J.E. ( 1986) . Probabilidad y est adst ica para ingenieros.
Tercera edicin. Mxico: PRENTI CE HALL HI SPANOAMERI CANA S.A.

Mi l l er, J. C. y Mi l l er, J. N. ( 1993) . Est adst ica para qumica analt ica. Segunda
edicin. Wilmingt on, Delaware, E.U.A: Addison Wesley I beroamericana, S.A.

Pr ez, C. ( 2001) . Tcnicas est adst icas con SPSS. Espaa: Pearson Educat ion.

Pr i a Bar r os, M. C. ( 2001) . Mt odos no paramt ricos. [En lnea]. Cuba:
Universidad de La Habana. Disponible en Word Wide Web: ht t p: / / www.
Vcl.sld.cy/ 75 cm/ f acmedic/ webosalud/ mat eriales/ mnoparam. ht ml [cit ado 10 de
enero 2003]

Wal pol e, R. E. y Myer s, R. H. ( 1992) . Probabilidad y est adst ica. Cuart a
edicin. Mxico: Mc GRAW-HI LL.

Wayne, W. D. ( 1992) . Bioest adst ica. Base para el anlisis de las ciencias de la
salud. Cuart a edicin. Mxico: Limusa.















8-27
ANEXO A8: METODOS NO PARAMETRI COS DE CORRELACI ON,
REGRESI ON LI NEAL SI MPLE Y BONDAD DE AJUSTE
(PRI A, 2001, cap. 4)

1. COEFI CI ENTE DE CORRELACI ON DE SPEARMAN

En muchas ocasiones es import ant e conocer si dos variables est n relacionadas y si lo
estn, evaluar cul es la intensidad de dicha relacin.
En las estadsticas clsicas la medida de correlacin usada es el coeficiente de Pearson que
se estima por el mtodo de mnimos cuadrados que requiere:

1. Que las variables estn medidas en una escala continua
2. Si se quiere medir su significacin est adst ica es necesario que est as variables
tengan una distribucin normal bivariada.

Cuando estos supuestos no se cumplen pueden utilizarse medidas de correlacin no
paramt ricas, que permit en adems est ablecer una correlacin exist ent e, det erminar su
significacin est adst ica.
Existen varios coeficientes de correlacin no paramtricos, el que se expone aqu es el
coeficient e de correlacin de Spearman, que fue la primera est adst ica de rangos que se
desarroll y que requiere que ambas variables est n medidas al menos en una escala
ordinal de forma que las unidades experiment ales puedan colocarse en dos series y que
las observaciones se hayan extrado aleatoriamente de una poblacin.
Sean n observaciones de dos variables aleat orias x e y, medidas ambas al menos, en
escala ordinal de forma simult nea en una misma unidad de observacin. Los dat os as
obtenidos pueden presentarse de la forma siguiente:

Vari abl e El ement os
X Y
1
1
x 1
y
2
2
x 2
y
3
3
x 3
y
M M
M

n
n
x n
y

Cada element o queda represent ado por un par de valores de la variables x e y, es decir
por el punt o (x
i
, y
i
), que post eriorment e puede ser llevado a un grfico de dispersin que
se utiliza para explorar la relacin lineal entre las variables.
A cada valor de la variable x e y se asignan
j
R
1
,
j
R
2
respectivamente, convirtindose la
informacin en una matriz de rangos como la siguiente:

I ndi vi duos Var i abl e x Rango de x Var i abl e y Rango de y
j j ij
R R d
2 1

1 x
1
R
11
y
1
R
21
R
11
R
21

2 X
2
R
12
y
2
R
22
R
12
R
22

3 X
3
R
13
y
3
R
23
R
13
R
23

M M M M M M
N x
n
R
1n
y
n
R
2n
R
1n
R
2n



8-28
d
ij
mide las discrepancias que hay entre los rangos de x e y para cada individuo.
En el caso de existir observaciones de igual valor deben asignarse rangos promedios, por
ej emplo si los 3 primeros valores son:

Val or es 15 15 15
Lugares 1 2 3
Rangos ( 1+ 2+ 3) / 3= 2 ( 1+ 2+ 3) / 3= 2 ( 1+ 2+ 3) / 3= 2

La frmula del coeficient e de correlacin de Rangos de Spearman se deduce a part ir de la
del coeficiente de correlacin de Pearson, sustituyendo los valores de las observaciones de
cada variable por la de sus rangos, llegndose a obtener la siguiente expresin:


n n
di
R
n
i
s

3
1
2
6
1

De est a forma R
s
brinda una estimacin del grado de asociacin entre las variables x e y.
Debe recordarse que cuando se analiza un coeficiente de correlacin se deben considerar
dos aspect os:

1. Su magnitud: oscila entre 0 y 1, valores cercanos a 0 significan que no hay relacin
lineal ent re ambas variables, mient ras que los valores cercanos a 1 significan que
la relacin lineal entre las variables es muy intensa.

2. Su sentido. Est dado por el signo + o -, el signo significa que existe una
relacin inversamente proporcional; es decir, que a valores altos de una variable
corresponden valores baj os de la otra. El signo + significa que existe una relacin
directamente proporcional entre las variables o sea que a valores altos de una se
corresponden valores altos de la otra y viceversa.

Las hiptesis a plantear para resolver la situacin descrita son las siguient es:

Hi pt esi s Rechazar Ho Si ms usados
0 :
0 :
1
0

s
s
R H
R H

rabulada s
o tabulada s
R R
R R



0.025
0.005
0 :
0 :
1
0
<

s
s
R H
R H

tabulada s
R R 0.05
0.01
0 :
0 :
1
0
>

s
s
R H
R H

tabulada s
R R 0.05
0.01

Donde -R
t abulada
y R
t abulada
son los valores crt icos obt enidos en la t abla de valores crt icos
para el coeficient e de correlacin de rangos de Spearman R
s
, ver t abla F.8.1 al final del
anexo, para tamaos de muestra que oscilen entre 4 y 30 y un nivel de significacin dado.
Cuando el tamao de la muestra excede las 30 observaciones puede trabaj arse entonces
con la aproximacin a la distribucin normal:
1 n R Z
s
que se distribuye Normal (0, 1)


8-29

Ot ra forma de rechazar la hipt esis nula es cuando se est trabaj ando con un programa
est adst ico ent onces se calcula R
s
y p que es la probabilidad de error de t ipo I asociada a
ese valor. En est e caso si el valor de p es menor que el prefij ado se rechaza la hiptesis
nula.
Segn Siegel, si la prueba de correlacin de rangos de Spearman se aplica a dat os que
pueden analizarse adecuadament e por una prueba paramt rica ms poderosa, como la
prueba del coeficient e de correlacin de Pearson en st e caso, su pot encia eficiencia sera
de cerca de un 91%.


2. METODOS DE REGRESI ON NO PARAMETRI COS

En muchas ocasiones exist e int ers en realizar aproximaciones no paramt ricas cuando se
quiere aj ust ar una lnea rect a a un conj unt o de punt os. Theil desarroll dos mt odos: el
mt odo complet o de Theil y el mt odo incompleto de Theil, denominado de esta forma
para distinguirlo del otro mtodo y por ser quiz el ms simple, el cual se expone a
cont inuacin. Theil supone que un conj unt o de punt os (x
1
, y
1
), (x
2
, y
2
), et c., va a ser
aj ustado por una recta de la forma y = bx + a.
Para los clculos Theil desarrolla los siguientes pasos:

1. Disponer los puntos en orden de x creciente. Si el nmero de puntos x, es impar, el
punto medio, es decir, el valor mediano de x se borra, el clculo simple exige un
nmero par de puntos.
2. Para cualquier par de punt os (x
i
, y
i
), (x
j
, y
j
) donde x
j
< x
i
, la pendient e, b
ij
, de
la lnea que une los puntos es:
i
i i
ij
x x
y y
b
j

.
Se calculan las pendient es b
ij
para el par de punt os ( x
1
, y
1
) y el inmediatamente
posterior al valor mediano de la x, para (x
2
, y
2
) y el segundo punto despus del
valor mediano de la x, y as sucesivament e hast a que se calcula la pendient e para
la lnea que une el punto inmediatamente anterior a la mediana de x con el lt imo
punto.

3. Las estimaciones de la pendiente, se disponen en orden creciente y su valor
mediano, es la pendiente estimada de la lnea recta.

4. Con este valor de b, los valores a
i
se estiman para cada punto con la ayuda de la
ecuacin y = bx + a.

5. Las est imaciones de a se ordenan en forma creciente y el valor mediano se elige
con la mej or estimacin.


3. LA PRUEBA DE BONDAD DEL AJUSTE DE KOLMOGOROV

La bondad del aj uste surge cuando se necesita probar la procedencia de una muestra de
observaciones de una distribucin completa, como puede ser la distribucin normal. La
prueba Chi-cuadrada es ut ilizada para est e propsit o cuando los dat os se present an como


8-30
frecuencias, aunque la prueba normalmente no se utiliza para menos de cincuenta
observaciones, y es difcil usarla con datos continuos y ais lados.
El mt odo de Kolmogorov t iene dos aplicaciones frecuent es la prueba de aleat oriedad y la
prueba de normalidad de una distribucin.
Al utilizar la prueba de bondad del aj uste de Kolmogorov se hace una comparacin entre
alguna funcin de dist ribucin acumulada y t erica
( )
( )
x T
F , y la funcin de dist ribucin
acumulada de una muestra,
( ) x s
F el est adst ico a ut ilizar es:

( ) ( ) x T x s
F F Mx D . .

La hipt esis nula se rechaza al nivel de significacin si el valor calculado D excede al
valor mostrado en la tabla A8-1 al final del anexo, para 1 - .


TABLA A8- 1 VALORES CRI TI COS DE D PARA LA PRUEBA
DE KOLMOGOROV SMI RNOFF
( MI LLER y FREUND, 1986, pg. 542)













8-31


ANEXO B8: VALORES CRI TI COS PARA LA PRUEBA DE RACHAS DE WALD
WOLFOWI TZ
( MI LLER y MI LLER, 1993, pag. 202)























8-32


ANEXO C8: VALORES CRI TI COS DE LA PRUEBA DE RANGOS Y SI GNOS DE
WI LCOXON
(OSTLE, 1977, pag. 601)





* Para n > 25, T es aproximadament e estndar normal con media n(n + 1)/ 4
y varianza n(n + 1)(2n + 1)/ 24













8-33


ANEXO D8: VALORES CRI TI COS PARA LA PRUEBA DE SUMA DE RANGOS DE
WI LCOXON - MANN-WI THNEY
( JURAN y GRYNA, 1993, pg. A11- 29)

Вам также может понравиться