Вы находитесь на странице: 1из 73

11.

PRUEBA DE HIPTESIS
11.1 Hiptesis estadstica es una proposicin o supuesto sobre los parmetros de
una o ms poblaciones.
EJEMPLO 11.1.- Suponga que se tiene inters en la rapidez de combustin de un
agente propulsor slido utilizado en los sistemas de salida de emergencia para la
tripulacin de aeronaves. El inters se centra sobre la rapidez de combustin
promedio. De manera especfica, el inters recae en decir si la rapidez de combustin
promedio es o no 50 cm/s. Esto puede expresarse de manera formal como
Ho;

= 50 cm/s

H1;

50 cm/s

La proposicin Ho; = 50 cm/s, se conoce como hiptesis nula, mientras que la


proposicin H1;
50 cm/s, recibe el nombre de hiptesis alternativa. Puesto que
la hiptesis alternativa especifica valores de que pueden ser mayores o menores
que 50 cm/s, tambin se conoce como hiptesis alternativa bilateral. En algunas
situaciones, lo que se desea es formular una hiptesis alternativa unilateral, como
en
Ho;

= 50 cm/s

H1;

< 50 cm/s H1;

> 50 cm/s

Es importante recordar que las hiptesis siempre son proposiciones sobre la poblacin
o distribucin bajo estudio, no proposiciones sobre la muestra. Por lo general, el valor
del parmetro de la poblacin especificado en la hiptesis nula se determina en una de
tres maneras diferentes:
1. Puede ser resultado de la experiencia pasada o del conocimiento del proceso,
entonces el objetivo de la prueba de hiptesis usualmente es determinar si ha
cambiado el valor del parmetro.

2. Puede obtenerse a partir de alguna teora o modelo que se relaciona con el


proceso bajo estudio. En este caso, el objetivo de la prueba de hiptesis es
verificar la teora o modelo.
3. Cuando el valor del parmetro proviene de consideraciones externas, tales como
las especificaciones de diseo o ingeniera, o de obligaciones contractuales. En
esta situacin, el objetivo usual de la prueba de hiptesis es probar el
cumplimiento de las especificaciones.
Un procedimiento que conduce a una decisin sobre una hiptesis en particular recibe
el nombre de prueba de hiptesis. Los procedimientos de prueba de hiptesis
dependen del empleo de la informacin contenida en la muestra aleatoria de la
poblacin de inters. Si esta informacin es consistente con la hiptesis, se concluye
que sta es verdadera; sin embargo si esta informacin es inconsistente con la
hiptesis, se concluye que esta es falsa. Debe hacerse hincapi en que la verdad o
falsedad de una hiptesis en particular nunca puede conocerse con certidumbre, a
menos que pueda examinarse a toda la poblacin. Usualmente esto es imposible en
muchas situaciones prcticas. Por tanto, es necesario desarrollar un procedimiento de
prueba de hiptesis teniendo en cuenta la probabilidad de llegar a una conclusin
equivocada.
La hiptesis nula, representada por Ho, es la afirmacin sobre una o ms
caractersticas de poblaciones que al inicio se supone cierta (es decir, la "creencia a
priori").
La hiptesis alternativa, representada por H1, es la afirmacin contradictoria a Ho, y
sta es la hiptesis del investigador.
La hiptesis nula se rechaza en favor de la hiptesis alternativa, slo si la evidencia
muestral sugiere que Ho es falsa. Si la muestra no contradice decididamente a Ho, se
contina creyendo en la validez de la hiptesis nula. Entonces, las dos conclusiones
posibles de un anlisis por prueba de hiptesis son rechazar Ho o no rechazar Ho.
11.2 Prueba de una Hiptesis Estadstica
Para ilustrar los conceptos generales, considere el problema de la rapidez de
combustin del agente propulsor presentado con anterioridad. La hiptesis nula es que
la rapidez promedio de combustin es 50 cm/s, mientras que la hiptesis alternativa es
que sta no es igual a 50 cm/s. Esto es, se desea probar:
Ho;

= 50 cm/s

H1;

50 cm/s

Supngase que se realiza una prueba sobre una muestra de 10 especmenes, y que
se observa cual es la rapidez de combustin promedio muestral. La media muestral es
un estimador de la media verdadera de la poblacin. Un valor de la media muestral
que este prximo al valor hipottico = 50 cm/s es una evidencia de que el verdadero
valor de la media es realmente 50 cm/s; esto es, tal evidencia apoya la hiptesis
nula Ho. Por otra parte, una media muestral muy diferente de 50 cm/s constituye una
evidencia que apoya la hiptesis alternativa H1. Por tanto, en este caso, la media
muestral es el estadstico de prueba.
La media muestral puede tomar muchos valores diferentes. Supngase que si 48.5
51.5, entonces no se rechaza la hiptesis nula Ho; = 50 cm/s, y que si <48.5
>51.5, entonces se acepta la hiptesis alternativa H1;
50 cm/s.
Los valores de que son menores que 48.5 o mayores que 51.5 constituyen la regin
crtica de la prueba, mientras que todos los valores que estn en el intervalo 48.5
51.5 forman la regin de aceptacin. Las fronteras entre las regiones crtica y de
aceptacin reciben el nombre de valores crticos. La costumbre es establecer
conclusiones con respecto a la hiptesis nula Ho. Por tanto, se rechaza Ho en favor de
H1 si el estadstico de prueba cae en la regin crtica, de lo contrario, no se rechaza Ho.
Este procedimiento de decisin puede conducir a una de dos conclusiones errneas.
Por ejemplo, es posible que el valor verdadero de la rapidez promedio de combustin
del agente propulsor sea igual a 50 cm/s. Sin embargo, para todos los especmenes
bajo prueba, bien puede observarse un valor del estadstico de prueba que cae en la
regin crtica. En este caso, la hiptesis nula Ho ser rechazada en favor de la
alternativa H1cuando, de hecho, Ho en realidad es verdadera. Este tipo de conclusin
equivocada se conoce como error tipo I.
11.3 Error tipo I se define como el rechazo de la hiptesis nula Ho cuando sta es
verdadera. Tambin es conocido como
nivel de significancia.
Si tuviramos un nivel de confianza del 95% entonces el nivel de significancia sera del
5%. Anlogamente si se tiene un nivel de confianza del 90% entonces el nivel de
significancia sera del 10%.
Ahora supngase que la verdadera rapidez promedio de combustin es diferente de 50
cm/s, aunque la media muestral caiga dentro de la regin de aceptacin. En este
caso se acepta Ho cuando sta es falsa. Este tipo de conclusin recibe el nombre
de error tipo II.

11.4 Error tipo II error


sta es falsa.

se define como la aceptacin de la hiptesis nula cuando

Por tanto, al probar cualquier hiptesis estadstica, existen cuatro situaciones


diferentes que determinan si la decisin final es correcta o errnea.
Decisin

Ho es verdadera

Aceptar Ho

No hay error

Rechazar Ho

Error tipo I

Ho es falsa

Error tipo II

No hay error

1. Los errores tipo I y tipo II estn relacionados. Una disminucin en la probabilidad


de uno por lo general tiene como resultado un aumento en la probabilidad del
otro.
2. El tamao de la regin crtica, y por tanto la probabilidad de cometer un error tipo
I, siempre se puede reducir al ajustar el o los valores crticos.
3. Un aumento en el tamao muestral n reducir

de forma simultnea.

4. Si la hiptesis nula es falsa, es un mximo cuando el valor real del parmetro


se aproxima al hipottico. Entre ms grande sea la distancia entre el valor real y
el valor hipottico, ser menor
.
11.5 PASOS PARA ESTABLECER UN ENSAYO DE HIPTESIS
INDEPENDIENTEMENTE DE LA DISTRIBUCIN QUE SE ESTE TRATANDO
1. Interpretar correctamente hacia que distribucin muestral se ajustan los datos del
enunciado.

2. Interpretar correctamente los datos del enunciado diferenciando los parmetros


de los estadsticos. As mismo se debe determinar en este punto informacin
implcita como el tipo de muestreo y si la poblacin es finita o infinita.
3. Establecer simultneamente el ensayo de hiptesis y el planteamiento grfico del
problema. El ensayo de hiptesis est en funcin de parmetros ya que se
quiere evaluar el universo de donde proviene la muestra. En este punto se
determina el tipo de ensayo (unilateral o bilateral).
4. Establecer la regla de decisin. Esta se puede establecer en funcin del valor
crtico, el cual se obtiene dependiendo del valor de
(Error tipo I o nivel de
significancia) o en funcin del estadstico lmite de la distribucin muestral. Cada
una de las hiptesis deber ser argumentada correctamente para tomar la
decisin, la cual estar en funcin de la hiptesis nula o Ho.
5. Calcular el estadstico real, y situarlo para tomar la decisin.
6. Justificar la toma de decisin y concluir.

11.6

DECISIN ESTADSTICA

Suponiendo que H0 es cierta, podramos basarnos en la distribucin muestral del


estadstico de contraste para saber cul es el valor esperado para esa
distribucin. En la medida en que el valor observado para una muestra aleatoria
se aproxime al valor que cabra esperar si H 0 es cierta, habremos obtenido un
resultado compatible con H0. Si, por el contrario, encontramos para una muestra
aleatoria un valor del estadstico de contraste que se aleja del valor que cabra
esperar, habremos obtenido un resultado muy raro, poco probable bajo el
supuesto de que H0 sea cierta, y podramos dudar de la veracidad de sta.
Por tanto, en caso de que el valor generado por la muestra sea compatible con
H0, mantendremos la hiptesis nula como cierta. En caso contrario,
rechazaremos la hiptesis nula y aceptaremos la hiptesis alternativa. Es decir,
la decisin estadstica consiste en mantener o rechazar la hiptesis nula, en
funcin de los resultados obtenidos al calcular el valor de un estadstico de
contraste para una muestra aleatoria extrada de la poblacin.
Los valores del estadstico de contraste que se alejan mucho del valor
esperado bajo Ho constituyen la denominada regin de rechazo (o zona crtica).
En cambio, los valores que: no se alejan tanto de ese valor constituyen la regin

de aceptacin. Los valores del estadstico de contraste que delimitan la regin de


rechazo se denominan valores crticos.
La regin de rechazo puede presentar dos formas: cuando consideramos los
valores que se alejan de H0 por ser muy grandes y los valores que se alejan
por ser muy pequeos, estamos ante un contraste bilateral, puesto que la
regin de rechazo se encuentra a ambos extremos de los valores esperados
bajo H0; cuando consideramos que para rechazar la hiptesis nula nicamente
nos sirven los valores que se alejan de H 0 en un sentido, estaremos ante
un contraste unilateral. Si en un contraste unilateral, la regin de rechazo est
constituida por los valores que se distancian de H 0 por ser muy grandes,
hablaremos de un contraste unilateral derecho. Del mismo modo, cuando la
regin de rechazo corresponda a los valores que se distancian de H 0 por ser
muy pequeos, hablaremos de contraste unilateral izquierdo.
Puesto que conocemos la distribucin muestral del estadstico de
contraste, podemos hablar de las regiones de aceptacin y de rechazo en
trminos de probabilidad. A la probabilidad de que una muestra aleatoria
genere un valor para el estadstico de contraste que se encuentre dentro de la
regin de rechazo la llamamos nivel de significacin y suele nombrarse
mediante la letra . A la probabilidad de que la muestra genere un valor de
estadstico que se site fuera de la regin de rechazo se le denomina nivel de
confianza, y se representa mediante 1 - . Las probabilidades pueden
representarse mediante reas bajo la curva de la distribucin muestral del
estadstico de contraste. En el contraste unilateral, el rea se situar en la
parte derecha de la curva (ver figura 1) o en la parte izquierda, segn el caso.
Cuando el contraste es bilateral, el rea se reparte en dos reas iguales, de
una extensin correspondiente a /2, situadas en cada extremo de la curva
(ver figura 2).
Para tomar la decisin de rechazar o no la hiptesis nula es necesario
fijar un criterio, es decir, delimitar claramente cul va a ser el tamao de la
regin de rechazo. En general, en Ciencias Sociales se toman, de forma
convencional, los niveles de significacin de = 0.05 = 0.01. Es decir, se
fijan regiones de rechazo constituidas respectivamente por el 5% el 1% de
los valores ms alejados de H0.
Volviendo al ejemplo que hemos venido desarrollando, si establecemos un nivel
de significacin = 0.05, podemos delimitar la regin de rechazo y la regin de
aceptacin en la distribucin muestral de Z. Sabemos que Z se distribuye segn
N(0,1), por lo que su valor esperado es Z = 0. Si encontramos valores de Z que

se alejan de 0, cabe pensar que tal vez el valor esperado para


no sea 1 2 = 0, tal y como habamos supuesto al considerar Z como estadstico de
contraste, es decir, cabe dudar de que la hiptesis nula sea cierta. Los valores
ms incompatibles con la veracidad de H 0 sern los que se alejan del 0 por la
derecha y los que se alejan de 0 por la izquierda. Es decir, estaremos

Figura 1: Regin de rechazo en un


contraste unilateral derecho

Figura 2: Regin de rechazo en un contraste bilateral


ante un contraste bilateral. Como Z se distribuye normalmente N(O,1), el 2.5%
de los valores ms alejados por la derecha y el 2.5% de los valores ms
alejados por la izquierda son respectivamente los que se encuentran a la
derecha de z = 1.96 y a la izquierda de z = -1.96. Estos valores constituyen la
regin de rechazo, delimitada por los valores crticos 1.96 y -1.96. A la
probabilidad de que un valor se encuentre en esa regin corresponde un rea
total de = 0.05, distribuida en dos subreas de /2 = 0.025 en cada extremo
de la distribucin (ver figura 3).

Figura 3: Regin de rechazo para el ejemplo de diferencia de medias


En la figura 3 queda de manifiesto que el valor Z = 1.973 queda a la derecha
de 1.96, por lo que se encuentra dentro de la regin de rechazo. Por tanto,
podemos rechazar la hiptesis nula de que no existen diferencias entre las
medias poblacionales A y B, y aceptar la hiptesis alternativa de que existen
diferencias estadsticamente significativas entre A y B, con un nivel de
significacin a = 0.05.
A cualquier prueba de decisin estadstica debe proseguir una
interpretacin de los resultados en los trminos de la hiptesis cientfica que la
origin, de tal forma que podamos realizar algn tipo de afirmaciones respecto
a la misma.
As, por ejemplo, en el caso del nivel de atencin en alumnos y alumnas, el
rechazo de la hiptesis nula y la aceptacin de la hiptesis alternativa nos
dicen que hay diferencias significativas entre las medias poblacionales, y de
ello podemos hacer la siguiente interpretacin: la evidencia recogida permite
afirmar que los alumnos y las alumnas de primer ciclo de Educacin Primaria
presentan diferentes niveles de atencin, medidos por el Test de Atencin en
Educacin Primaria.

11.7 ESTADSTICO DE CONTRASTE


En la Estadstica Inferencial, para hacer inferencias sobre las poblaciones, es necesario basarse
en la informacin aportada por muestras. Por supuesto, esto es vlido tambin en el caso del
contraste de hiptesis. Para contrastar las hiptesis estadsticas, nos apoyamos en algn
estadstico calculado a partir de los datos que poseemos para muestras extradas de las
poblaciones estudiadas, Al estadstico utilizado se le denomina estadstico de contraste.

Siempre que se cumplan ciertos supuestos, podemos conocer la distribucin muestral del
estadstico de contraste. A partir de la distribucin muestral que presenta el estadstico de
contraste cuando consideramos a la hiptesis nula cierta, podremos tomar decisiones acerca de
la misma.
Como acabamos de afirmar, para conocer la distribucin muestral del estadstico de contraste es
necesario contar con ciertos supuestos. Habitualmente, estos supuestos se refieren a dos
aspectos:
a) Caractersticas de los datos. Se trata de condiciones que deben cumplir los datos, tales como,
por ejemplo, presentar un determinado nivel de medida o cumplir el supuesto de independencia,
al que nos referamos en el captulo 9.
b) Forma de la distribucin de partida. Es frecuente, en las pruebas de decisin estadstica,
suponer una determinada distribucin (generalmente la distribucin normal) en la poblacin
estudiada.
Cada estadstico de contraste requiere el cumplimiento de unos determinados supuestos, pues
slo de esta forma conoceremos cul es su distribucin muestral. Cuando se violan los supuestos
asumidos en el contraste de hiptesis, no podemos estar completamente seguros de que las
conclusiones que saquemos sern vlidas y, en consecuencia, es preferible no utilizar ese
estadstico de contraste. No obstante, en ciertos casos la violacin de los supuestos no acarrea
problemas demasiado importantes.
Para contrastar la hiptesis de que no hay diferencias significativas entre las medias de ambas
poblaciones, nos basaremos en la informacin aportada por sendas muestras aleatorias, de
tamaos nA y nB respectivamente, extradas de ellas. Si calculamos la media de cada una de las
muestras, obtendremos valores para
y .
De acuerdo con lo presentado en el captulo 9, conocemos la distribucin muestral del
estadstico
. Siempre que las poblaciones A y B sean normales e independientes, y siempre
que conozcamos las varianzas poblacionales A2 y B2 la diferencia de medias
sigue el
modelo de la curva normal, con los siguientes valores para la media y la desviacin tpica:

Por tanto, el valor tipificado de la diferencia


desviacin tpica

, que resulta de restarle la media y dividir por la

se distribuir segn la curva normal N(0,l). Considerando H 0 verdadera, tendremos A - B = 0, por


lo que generalmente se toma como estadstico de contraste

con una distribucin N(0,l).


Consideremos, que en el ejemplo de alumnos y alumnas, se ha trabajado con los siguientes
valores:
A2 = 180 y B2 = 170; nA = 36 y nB = 40. Por tanto, el valor alcanzado por el
estadstico de contraste Z, ser:

Resumiendo, conocemos cmo se distribuye el estadstico Z, siempre que se cumplan los


supuestos antes mencionados: poblaciones normales, varianzas poblacionales conocidas e
independencia. Adems, sabemos cul es el valor alcanzado por Z en el caso de las dos
muestras seleccionadas.

11.8
NIVEL
DE
SIGNIFICACIN

SIGNIFICACIN

GRADO

DE

Como hemos explicado anteriormente, el nivel de significacin es la probabilidad de que en una


muestra aleatoria, el estadstico de contraste alcance un valor que se encuentra incluido en la
regin de rechazo. Por tanto, es una probabilidad atribuida a la regin de rechazo, o lo que es

igual, al valor crtico: la probabilidad de que el estadstico de contraste asuma el valor crtico o un
valor ms extremo que ste.
Del mismo modo, podemos atribuir una probabilidad al valor observado para el estadstico de
contraste. Esta sera la probabilidad de que el estadstico de contraste asuma el valor observado
o un valor ms extremo que ste. A esta probabilidad se le denomina grado de significacin y
viene expresada por la letra minscula p.
Si en un contraste de hiptesis el valor observado V o entra en la regin de rechazo, podemos
asegurar que el valor observado se encuentra a la derecha del valor crtico Vc. En consecuencia,
la probabilidad de encontrar valores ms extremos que el valor observado (p) ser menor que la
probabilidad de encontrar valores ms extremos que el valor crtico (). Tanto a como a p, por
ser probabilidades, corresponden reas bajo la curva de la distribucin muestral del estadstico de
contraste. Por tanto, si el valor observado entra en la regin de rechazo, el rea correspondiente a
p ser menor que el rea correspondiente a (ver figura 4).
Por todo lo dicho anteriormente, la decisin estadstica tambin puede tomarse a partir de la
comparacin entre las probabilidades p (grado de significacin) y a (nivel de significacin). A cada
valor del estadstico de contraste se asocia una probabilidad p, a partir de la cual podremos
decidir sobre la hiptesis nula de acuerdo con el siguiente criterio:
si p < , rechazamos la hiptesis nula H0
si p > , mantenemos la hiptesis nula H0
Generalmente, los programas estadsticos ofrecen el grado de significacin, a partir del cual
podemos decidir si con un nivel de significacin previamente fijado es posible rechazar o no la
hiptesis nula.

[D]

Figura 4: reas correspondientes a p y cuando el valor observado para el estadstico de


contraste entra en la regin de rechazo.
En el ejemplo sobre nivel de atencin de alumnos y alumnas, obtenamos un valor observado Z =
1.973. Podemos determinar la probabilidad de obtener un valor tan extremo como ste, es decir,
la probabilidad de encontrar un valor igual o mayor que 1.973, o un valor igual o menor que
-1.973. Utilizando una tabla de valores de la curva normal, podremos llegar sin dificultad al
siguiente resultado:
P( z -1.973 z 1.973) = P(z -1.973) + P(z 1.973) = 2 * P(z -1.973) = 0.048
Es decir, la probabilidad asociada al valor observado Z = 1.973 es p = O.O48. Por tanto, bastar
comparar este grado de significacin con =0.05 para tomar la decisin. As, como 0.048 < 0.050,
podremos rechazar la hiptesis nula y llegamos, por tanto, a la misma decisin que cuando nos
basbamos en la comparacin del valor observado Z = 1.973 con el valor crtico Z c =1.96.

11.9 ERRORES
Si rechazamos una hiptesis nula por considerar que un valor tan extremo como el valor
observado en el estadstico de contraste es poco probable (P<), existe una posibilidad, aunque
pequea, de estar cometiendo un error Si como ocurra en nuestro ejemplo, la probabilidad
asociada al estadstico de contraste es p = 0.048, ello significa que los datos recogidos son poco
compatibles con H0. Puesto que es muy improbable que siendo H 0 cierta encontremos un valor tan
extremo como ste, nuestra postura es la de sospechar acerca de la veracidad de la hiptesis
nula y, en consecuencia, tomamos la decisin de rechazarla.
Sin embargo, siendo la hiptesis nula cierta, este resultado sera posible en un 4.8% de los casos.
Por ese motivo, cuando tomamos la decisin de rechazar la hiptesis nula estamos cometiendo
un error del 4.8%. A este error se le denomina error tipo I, y consiste en rechazar una hiptesis
nula que en realidad es cierta.
Al llevar a cabo una prueba de decisin estadstica, siempre tratamos de que el error cometido
sea lo ms pequeo posible. De ah, que habitualmente fijemos niveles de significacin de 0.05
0.01. Slo si la probabilidad p asociada al valor observado se encuentra por debajo de estos
niveles, rechazaremos H0. El grado de significacin p es el error cometido al rechazar la hiptesis
nula, y el nivel de significacin representar el mximo error tolerado al rechazar la hiptesis
nula.

Al riesgo de rechazar la hiptesis nula en el caso en que sta no es falsa se le denomina riesgo
La confianza en la decisin de rechazar H0, cuando trabajamos con un riesgo , es 1-.
Si fijamos = 0.05, significa que estamos dispuestos a asumir un error mximo del 5% al
rechazar la hiptesis nula. Y si rechazamos H 0 lo estaremos haciendo con una confianza del 95%.
Si el valor de p ascendi a 0.048, cometemos un error del 4.8%, que se encuentra por debajo del
5% de error mximo permitido en el rechazo de H 0.
En el caso en que la probabilidad asociada a H 0 resultara alta (mayor que 0.05) hubiramos
mantenido la hiptesis nula, por considerar que sta no parece muy improbable y que los
resultados obtenidos son compatibles con ella.
Si en realidad tal hiptesis es falsa y nosotros la mantenemos, habramos cometido un error tipo
II. El riesgo de cometer tal error se denomina riesgo .
Por tanto, son dos los tipos de errores que podemos cometer al mantener o rechazar, basndonos
en los datos de los que disponemos, una hiptesis nula:
ERROR TIPO I: Consiste en rechazar una hiptesis nula que es cierta.
ERROR TIPO II: Consiste en mantener una hiptesis nula que es falsa.
En la tabla 1, recogemos las situaciones en las que se cometen estos tipos de errores.
Tabla 1. Tipos de errores en la decisin estadstica
Rechazamos H0
H0 es verdadera

ERROR TIPO I

No rechazamos H0
No hay error

(Riesgo )
H0 es falsa

No hay error

ERROR TIPO II
(Riesgo )

A la probabilidad de rechazar una hiptesis nula cuando efectivamente es falsa, se le


denomina potencia de la prueba. Esta probabilidad es 1-.

11.10
PROCESO
ESTADSTICA

DE

UNA

PRUEBA

DE

DECISIN

Son los pasos que hay que dar para llevar a cabo una prueba de decisin estadstica. Tendremos
en cuenta que la decisin, propiamente dicha, se puede tomar a partir de la comparacin entre
dos valores del estadstico de contraste (valor observado y valor crtico) o entre dos
probabilidades (grado de significacin y nivel de significacin), por lo que habr dos procesos
.paralelos en algunas de las etapas.
1.

A partir de la hiptesis cientfica o del problema planteado, formular la hiptesis nula H 0 y la


hiptesis alternativa H1.

2.

Fijar el nivel de significacin , es decir, el error mximo que estamos dispuestos a tolerar
en el rechazo de H0.

3.

Elegir el estadstico de contraste adecuado, comprobando si se cumplen los supuestos


para su utilizacin, y calcular el valor observado para este estadstico de contraste.

4.

Determinar el valor o los valores crticos que delimitan' la regin de rechazo, sea sta
unilateral o bilateral.

5.

Comprobar si el valor observado se encuentra dentro de la regin de rechazo establecida.

6.

Tomar la decisin de mantener H0, o bien de rechazar H0 y aceptar H1.

7.

Interpretar la decisin de acuerdo con el problema inicial.

Si en lugar de comparar el valor observado y el valor crtico, nos basamos en la comparacin


entre grado de significacin y nivel de significacin, algunas de las etapas anteriores se veran
modificadas de la siguiente forma:
4.

Determinar la probabilidad p asociada al valor observado para el estadstico de contraste.

5.

Comparar el grado de significacin p con el nivel de significacin .

11.11 PRUEBAS PARAMTRICAS Y NO PARAMTRICAS


La utilizacin de ciertos estadsticos de contraste exige el cumplimiento de determinados
requisitos, referidos a los parmetros y a la distribucin poblacional. Estos requisitos son los
denominados supuestos paramtricos, entre los que se suelen encontrar los siguientes:
- Las variables consideradas son cuantitativas continuas, medidas por lo menos en una escala de
intervalos.
- Las muestras consideradas proceden de poblaciones en las que las variables se distribuyen
segn la ley normal.
- Se da homoscedasticidad (homogeneidad de varianzas) entre las distintas distribuciones
comparadas, es decir, las muestras proceden de poblaciones con varianzas similares.
- Las muestras consideradas tienen un tamao grande. Consideraremos grande, una muestra de
tamao superior a 30 individuos (n>30).
La significacin de los resultados que obtengamos depender del cumplimiento efectivo de tales
condiciones. Este tipo de pruebas de contraste reciben la denominacin de pruebas paramtricas.
En el caso de otra serie de pruebas no se hacen tantas suposiciones como en las anteriores
acerca de la poblacin, por lo que pueden ser aplicadas sin el cumplimiento rgido de tales
condiciones previas. Este tipo de pruebas se denominan pruebas no paramtricas.
Las pruebas no paramtricas no hacen ningn tipo de suposicin acerca de la forma exacta de la
poblacin en la que fueron extradas las muestras. A lo sumo, se precisa que la distribucin sea
continua, o simtrica, pero no se llega a predeterminar rgidamente la forma de la distribucin,
como ocurre cuando se exige que ste se adapte a la curva normal. Podemos relacionar las
ventajas asociados al uso de las pruebas no paramtricas:
1.

Simplicidad de deduccin. Mientras que la deduccin de los contrastes paramtricos


requiere a veces un nivel de conocimientos matemticos muy por encima del que suelen
poseer la mayora de los investigadores, los estadsticos no paramtricos se deducen de
expresiones ms sencillas.

2.

Facilidad de aplicacin. Los contrastes no paramtricos son ms sencillos de aplicar.


Frecuentemente, requieren slo operaciones como ordenar por rangos, contar, sumar y
restar.

3.

Rapidez de aplicacin. Siempre que el tamao de la muestra no sea demasiado grande, los
contrastes no paramtricos se realizan con mayor rapidez que los paramtrios.

4.

Menos exigentes respecto al nivel de medicin. Mientras que os contrastes paramtricos


suelen exigir mediciones en una escala de razn o de intervalos, los contrastes no
paramtricos requieren en general mediciones a nivel ordinal o nominal.

Siempre que se cumplan los supuesto exigidos, las pruebas paramtricas resultan de mayor
potencia que las no paramtricas, esto es, la probabilidad de rechazar una hiptesis nula
efectivamente falsa es mayor. Teniendo esto en cuenta, el criterio que habremos de seguir a la
hora de elegir entre pruebas paramtricas o no paramtricas es el de aplicar una del primer tipo
siempre que las condiciones exigidas para ello se cumplan. Pero si no se cumplen tales
condiciones, y especialmente si el tamao muestral es muy pequeo, es preferible recurrir a las
pruebas no paramtricas.

11.12 Contrastes paramtricos para dos muestras


1. Contrastes de medias para dos muestras
2. Contrastes de varianzas para dos muestras
3. Contrastes sobre coeficientes de correlacin

CONTRASTES PARA DOS MUESTRAS

Contrastes sobre 12/22

Contrastes sobre 1 - 2

Contrastes sobre 12 /22


Uno de los supuestos paramtricos es la homoscedasticidad de varianzas entre los
diversos grupos considerados para el contraste de hiptesis. Dos o ms
distribuciones presentan homoscedasticidad cuando las dispersiones respectivas
son equivalentes, es decir, cuando las diferencias observadas entre sus varianzas
poblacionales no son estadsticamente significativas. En caso contrario,
hablaramos de heteroscedasticidad
Supongamos que tenemos dos poblaciones normales N( 1, 1) y N(2, 2), y hemos
extrado dos muestras aleatorias independientes de tamaos n 1 y n2. El problema a

resolver es si a partir de las varianzas insesgadas observadas en las dos muestras


(S12 y S22) puede inferirse que las varianzas de las poblaciones de donde se
extrajeron las muestras (12 y 22) son distintas, o alguna de ellas es mayor que la
otra.
1. Hiptesis estadsticas.
a) H0: 12 22 (contraste unilateral)
H1: 12 < 22
b) H0: 12 22 (contraste unilateral)
H1: 12 > 22
c) H0: 12 = 22 (contraste unilateral)
H1: 12 22
2. Estadstico de contraste.
Utilizamos como estadstico de contraste el cociente entre las varianzas insesgadas
(S2n-1) en las dos muestras:

que se distribuye segn F con n1-1 y n2-1 grados de libertad.


3. Decisin estadstica.
1. Rechazar H0 si F Fn1-1,n2-1
2. Rechazar H0 si F 1-Fn1-1,n2-1
3. Rechazar H0 si F /2Fn1-1,n2-1 F 1- /2Fn1-1,n2-1

Ejemplo 11.2
Pretendemos determinar si dos tems A y B de un cuestionario detectan del mismo
modo las diferencias individuales en una poblacin de alumnos de EGB. Para ello
extraemos dos muestras de 31 y 30 alumnos a las que presentamos los tems A y B

respectivamente. Si las desviaciones tpicas observadas en ambas muestras son


SA = 0.56 y SB = 0.89, podemos afirmar que ambos tems difieren en su capacidad
de detectar las diferencias? ( = 0.05)
La capacidad de detectar las diferencias se traduce en que el tem es capaz de dar
puntuaciones diferentes para alumnos con distintos niveles en la capacidad medida.
Es decir, un tem que detecte diferencias ser el que arroje puntuaciones diferentes
entre s, puntuaciones dispersas. El modo en que medimos la dispersin de un
grupo de puntuaciones es calculando su varianza. Por tanto, para ver si ambos
tems detectan del mismo modo las diferencias individuales lo que haremos ser
comparar si las poblaciones de puntuaciones obtenidas mediante los mismos
poseen distinta varianza. Plantearemos las siguientes hiptesis estadsticas:
H0: 12 = 22
H1: 12 22
Utilizaremos como estadstico de contraste el cociente de varianzas insesgadas F =
S12/S22. En consecuencias, previamente habr que calcular las varianzas
insesgadas alcanzadas en ambas muestras de alumnos. Recurdese que podemos
calcular la varianza insesgada a partir de la varianza sesgada. Bastar para ello,
con dividir por el tamao n-1 y multiplicar por m. Vemoslo en el caso que nos
ocupa:

Sabemos que el estadstico F se distribuye segn F con n 1-1 y n2-1 grados de


libertad. Es decir, con 30 y 29 grados de libertad. Puesto que el contraste es
bilateral, habremos de buscar los valores que, bajo la curva de la distribucin F 30,29,
dejan a su izquierda y a su derecha reas de 0.025 y 0.975 respectivamente.

En las tablas encontramos el valor que delimita la zona de la regin de rechazo


situada a la derecha. Para 30 y 29 grados de libertad, tenemos:
F30,29 = 2.09

0.975

En el caso del otro valor crtico, el correspondiente a la regin de rechazo situada


en la parte izquierda de la curva, generalmente no tenemos tablas que nos lo
proporcionen. Sin embargo, podemos obtenerlos sirvindonos de la siguiente
equivalencia:

Fn1,n2 = 1/1-Fn2,n1

Es decir,
0.025

F30,29 = 1/0.975F29,30 = 1/2.1 = 0.48

Teniendo en cuenta estos valores crticos, el valor observado para el estadstico de


contraste F queda dentro de la regin de rechazo (ver figura 8).
Decidimos rechazar la hiptesis nula de que no hay diferencias entre las varianzas
de la poblacin, cometiendo un error mximo del 5%. O lo que sera

Figura8: Regin de rechazo y valor observado en un contraste bilateral sobre 12/22


igual, con una confianza del 95% podemos afirmar que existen diferencias
significativas entre las dos varianzas poblacionales. Interpretamos, en
consecuencia, que los tems A y B difieren en su capacidad para detectar las
diferencias individuales en la poblacin de alumnos de EGB.

Contrastes sobre 1 - 2
Distinguiremos entre los casos en que las dos muestras correspondan a
observaciones independientes o dependientes. Consideremos que las
observaciones pertenecientes a dos muestras son dependientes cuando se trata,
por ejemplo, de sujetos apareados o mediciones realizadas sobre un mismo grupo
de sujetos en dos momentos distintos. Si comparamos las puntuaciones obtenidas
por un grupo de sujetos antes de despus de la aplicacin de un determinado
programa de intervencin, estaremos ante muestras dependientes.
Otro ejemplo se dara cuando por determinadas razones los sujetos estn
apareados, cmo ocurrira si en lugar de medir las puntuaciones antes y despus de
la aplicacin de un programa, decidimos constituir un grupo experimental y otro de
control para comparar los resultados alcanzados tras el mismo asegurndonos de
que las posibles diferencias no son debidas a una diferente capacidad intelectual
entre los sujetos de ambos grupos. Para conseguir la igualdad de los grupos con la
variable inteligencia aparearamos a los sujetos, haciendo que por cada sujeto del
grupo experimental haya uno de igual C.I. en el grupo control.

11.13 Muestras independientes


Partiendo de que hemos extrado dos muestras aleatorias de sendas poblaciones
distribuidas normalmente, pretendemos comparar las medias poblacionales ( 1 y 2)
a partir de las medias encontradas en las muestras ( y ), determinando si los
parmetros de ambas poblaciones son distintos o si uno de ellos es superior al otro.
1. Hiptesis estadsticas.
Segn queramos comprobar si el valor de la media en una poblacin es menor,
mayor o distinto al valor de la media en la otra poblacin, plantearemos diferentes
hiptesis estadsticas:
a) H0: 1 2 (contraste unilateral)
H1: 1 < 2
b) H0: 1 2 (contraste unilateral)
H1: 1 > 2

c) H0: 1 = 2 (contraste unilateral)


H1: 1 2
(cualquiera de las hiptesis anteriores se podra haber formulado a partir de la
diferencia de medias; por ejemplo, la hiptesis nula para el primer caso quedara en
la forma H0: 1-2 0).
2. Estadstico de contraste.
Segn los supuestos que se verifiquen en cada situacin, existen diversos
estadsticos de contraste que pueden ser utilizados para llevar a cabo esta prueba
de decisin estadstica. Consultando la tabla de estadsticos de contraste que
aparece al final del captulo (tabla 3) puede determinarse cul es el que conviene
elegir en cada caso. A modo de ejemplo, supongamos que las varianzas en ambas
poblaciones son conocidas (12 y 22). El estadstico de contraste ser Z cuya
expresin es:

Este estadstico sigue la distribucin N(0,l).


3. Segn la hiptesis sometida a contraste, las tres formas de decidir seran las
siguientes:
a) Rechazar H0 si Z z
b) Rechazar H0 si Z z
c) Rechazar H0 si Z /2z Z z/2
En el primero de los casos, resulta evidente que si Z adopta un valor extremo de
signo negativo (a la izquierda del valor crtico z), el numerador de la expresin de
clculo de Z debe ser negativo, y por tanto, la media , es ms pequea que .
Suponiendo que H0 sea cierta, slo en un pequeo nmero de ocasiones
obtendramos valores negativos tan extremos. Es decir, asumiendo un riesgo
mximo de equivocamos, podremos rechazar la hiptesis nula y concluir que
1 es ms pequea que 2.
De modo similar razonaramos en el caso de las hiptesis planteadas en los dos

restantes casos.

Ejemplo 11.3
Para determinar si los efectos de dos programas A y B de entrenamiento en clculo mental son
similares, hemos utilizado cada uno de estos programas con una muestra de alumnos. Las
muestras tenan tamaos nA = 25 y nB = 28. Tras aplicar una prueba de rendimiento en
matemticas hemos obtenido en cada uno de los grupos medias
= 7.2 y
= 6.8, y varianzas
2
2
SA = 2.4 y SB = 1.7. Podemos afirmar que el programa A conduce a niveles de rendimiento
superiores que el programa B? ( = 0.05)
Puesto que se trata de comprobar si la poblacin de alumnos que siguen el programa A tiene
mejor rendimiento que la poblacin de alumnos que siguen el programa B, las hiptesis
estadsticas en este ejemplo son:
H0: A B
H1: A > B
Para elegir el estadstico de contraste adecuado, es preciso consultar la tabla de estadsticos.
Supondremos la normalidad de las poblaciones. Las varianzas poblacionales son desconocidas;
para elegir el estadstico adecuado convendr saber si se cumple o no el supuesto de
homoscedasticidad de varianzas. Por tanto, un paso previo consistir en comprobar el supuesto
de homoscedasticidad. Las hiptesis sern:
H0: A2 = B2
H1: A2 B2
Para calcular el valor del estadstico F, es necesario disponer de las varianzas insesgadas para
las dos muestras. A partir de las varianzas proporcionadas en el problema, obtendremos las
respectivas varianzas insesgadas y calcularemos F:

Comparando este valor observado con los valores crticos 0.025F24,27 y 0.975F24,27 . El segundo de
estos valores aparece en las tablas de la distribucin F, siendo 0.975F24,27 = 2.19. En cambio, no
tenemos los valores de F para reas tan pequeas como 0.025. Sin embargo, este valor puede
ser calculado con facilidad conociendo la equivalencia
Fn1,n2 = 1/1-Fn2,n1

A partir de esta equivalencia calcularemos


0.025

F24,27 = 1/0.975F27,24 = 1/2.2 = 0.45

Por tanto los valores crticos son 0.45 y 2.19. Puesto que el valor observado F = 1.42 se
encuentra fuera de la regin de rechazo, mantendremos H 0 y consideraremos que se da
homoscedasticidad de varianzas.
Con este resultado, podemos seleccionar el estadstico adecuado para llevar a cabo el contraste
de medias planteado inicialmente. Calcularemos el valor de T, que se distribuye con 51 grados de
libertad (nA+ nB-2).

La regin de rechazo se situar en el extremo derecho de la distribucin muestral, puesto que los
valores de T que resultan menos probables suponiendo H 0 cierta son aqullos que provienen de
numeradores
positivos (es decir, cuando
). En este caso, el valor crtico es 0.95T51 =
1.6.
Al comparar el valor observado T = 1 con el valor crtico, advertimos que aqul no se encuentra
incluido en la regin de rechazo, y por tanto, no podemos afirmar que los alumnos que siguieron
el mtodo A presenten un nivel de rendimiento mayor que los que siguieron el mtodo B.

11.14 Muestras dependientes


El problema que se plantea en este caso es el mismo del epgrafe anterior, con la
nica diferencia de que ahora las observaciones estn apareadas. Por tanto,
tendremos un mismo nmero n de puntuaciones en las dos muestras. A veces, las
muestras apareadas lo sern por tratarse valores diferentes medidos para un mismo
grupo de sujetos (en diferentes momentos, utilizando diferentes instrumentos de
medida etc), y otras por encontramos ante grupos de sujetos que aparecen
relacionados en parejas.
Las hiptesis planteadas coinciden con las anteriores. El estadstico de contraste
empleado, en cambio, difiere de los vistos hasta el momento.

donde D es la diferencia entre las medias observadas


, y Sd2es la varianza
insesgada de los valores D. El estadstico T se distribuye segn t n-1.

11.15
CONTRASTES
CORRELACIN

SOBRE

COEFICIENTES

DE

Este tipo de contrastes tiene por finalidad hacer inferencias acerca de la relacin
existente entre dos variables a partir del valor calculado para un coeficiente de
correlacin. En el caso general, suponemos que de una poblacin extraemos una
muestra para la que calculamos la correlacin entre las variables X e Y que
presentan una distribucin conjunta bivariada normal en la poblacin de referencia.
El problema planteado es determinar si, conocido el valor de la correlacin entre las
dos variables para los individuos de la muestra, podemos afirmar que el parmetro
p (valor de la correlacin en la poblacin) es distinto a un valor fijado.
Veamos el desarrollo de la correspondiente prueba estadstica para el caso en que
queremos comprobar si la relacin encontrada, calculada mediante el coeficiente de
correlacin de Pearson (rxy), permite afirmar que en la poblacin de donde fue
extrada la muestra existe una relacin entre ambas variables, es decir, si se verifica

0.
1. Hiptesis estadsticas.
La hiptesis nula afirmara que el coeficiente de correlacin es nulo, es decir, que
no existe una relacin lineal entre las dos variables y, en todo caso, la relacin
observada se debe al azar. Por el contrario, la hiptesis alternativa supondra
afirmar la existencia de una relacin entre X e Y. Por tanto:
H0: = 0
H1: 0
2. Estadstico de contraste.
En el caso del coeficiente de correlacin de Pearson, el estadstico de contraste
utilizado es

que bajo el supuesto de que H0 sea cierta, se distribuye segn tn-2.


3. Decisin estadstica.
Para decidir sobre el rechazo o no de la hiptesis nula bastara establecer la regin
de rechazo (bilateral) y comprobar si el valor observado para r xy supera al valor
crtico que deja a su derecha una regin /2, o si queda por debajo del valor crtico
que delimita una regin /2 a su izquierda.
Aunque el contraste que hemos presentado es bilateral, resultar fcil al lector
establecer los correspondientes contrastes unilaterales, en el caso en que
pretendamos comprobar si la relacin entre dos variables es distinta de cero pero
positiva (contraste unilateral derecho) o distinta de cero pero negativa (contraste
unilateral izquierdo).
Por ltimo, presentaremos los estadsticos de contraste y el modo en que stos se
distribuyen para el caso en que la relacin entre variables se mida por coeficientes
distintos al coeficiente de correlacin de Pearson.
Para el coeficiente de correlacin biserial puntual (r bp), el estadstico de contraste
viene dado por

que se distribuye segn t con n-2 grados de libertad.


El contraste sobre el coeficiente de correlacin biserial (r b) se apoya en el
estadstico

que se distribuye segn N(0,1). El significado de los valores p, q, y es el mismo que


le otorgbamos al presentar este coeficiente en el captulo 8.
Para el caso de coeficiente phi (), el estadstico de contraste adopta la expresin:

donde r es el coeficiente de correlacin phi. Este estadstico se distribuye segn el


modelo de la curva normal N(0,1).

Ejemplo 11.4
Para conocer la relacin existente entre la rapidez con que los alumnos de un
centro ejecutan las tareas (variable X) y el grado de correccin de la misma
(variable Y), se seleccion una muestra de 76 alumnos a los que se propuso una
serie de actividades que posteriormente fueron corregidas y se cronometro el
tiempo invertido en la realizacin de las mismas. Si el valor de la correlacin de
Pearson obtenido fue rxy = -0.35, podemos afirmar que existe una relacin
significativa entre las dos variables? ( = 0.01)
Para que exista una relacin estadsticamente significativa entre las variables,
tenemos que comprobar que en la poblacin de donde fue extrada la muestra, se
cumple que el coeficiente de correlacin entre las dos variables es distinto de cero.
Es decir:
H0: = 0

H1: 0
Suponiendo que las variables presentan una distribucin conjunta normal en la
poblacin, podemos utilizar como estadstico de contraste:
Puesto que T se distribuye segn t n-2, los valores crticos para la regin de rechazo
bilateral = 0.05, sern aproximadamente -2.6 y 2.6, por lo que podremos rechazar
la hiptesis nula.
En consecuencia, podemos afirmar que existe una relacin significativa entre las
variables rapidez y grado de correccin en la ejecucin de tareas escolares.
Tabla 4: Algunos estadsticos utilizados en contrastes paramtricos
ESTIMADOR

SUPUESTOS

DISTRIB.

1. 2 conocida
2. Muestra aleatoria

N(0, 1)

3. Poblacin normal
1. 2 desconocida
2. Muestra aleatoria

tn-1

3. Poblacin normal

S2n

1. Muestra aleatoria

2n-1

2. Poblacin normal

S2n-1

1. Muestra aleatoria

2. Poblacin normal
S12/S22

1. Poblaciones
normales

Fn1-1,n2-1

ESTADSTICO

2. Independencia
1. 12 y 22conocidas
2. Independencia

N(0, 1)

3. Poblaciones
Normales
1. 12 =
22desconocidas
2. Independencia

tn1+n2-2

3. Poblaciones
Normales
1. 12
22desconocidas
2. Independencia
3. Poblaciones
Normales

tg.1.

4. n1 y n2 pequeos
(30)
1. 12
22desconocidas
2. Independencia
3. Poblaciones
Normales
4. n1 y n2 pequeos

N(0, 1)

(>30)
5. Poblaciones
normales

tn-1

6. Datos apareados

Nota: Las varianzas maestrales que aparecen en la expresin de los estadsticos de


contraste situados en las filas 4, 5, 8, 9 y 10, y en la expresin de los grados de
libertad correspondientes al estadstico de la fila 8 son varianzas insesgadas (S n-12),
mientras que las restantes son varianzas no insesgadas (S n2).

Contrastes paramtricos para ms de dos muestras


1. Supuestos paramtricos en el anlisis de la varianza
2. Descomposicin de la suma de cuadrados
3. Grados de libertad y estimadores de la varianza
4. Prueba de decisin
5. Comparacin mltiple entre medias

11.16 CONTRASTES NO PARAMTRICOS

1. Introduccin.
2. Contrastes para una muestra (prueba de Kolmogorov).
3. Contrastes para dos muestras (pruebas de Wilcoxon y Mann-Whitney).
4. Contrastes para k muestras independientes (pruebas de chi-2 y KruskalWallis).
5. Contrastes para k muestras relacionadas (pruebas de Cochran y Friedman).

INTRODUCCIN
A lo largo de las siguientes pginas estudiaremos algunas de las pruebas no
paramtricas de mayor uso en la investigacin educativa. Debemos recordar que
dichas pruebas han de emplearse cuando no se cumplen los denominados
supuestos paramtricos. Teniendo en cuenta los criterios de uso ms frecuente,
toda prueba o contraste es considerado no paramtrico si se da alguna de las
siguientes situaciones:
- Los datos a analizar estn medidos en una escala nominal u ordinal.
- Se utilizan datos medidos a nivel de intervalo o razn, pero la hiptesis formulada
no est referida a parmetros de las distribuciones poblacionales.
- El estadstico de contraste empleado no asume supuestos de la poblacin que han
de cumplirse.
- El tamao de la muestra es muy pequeo.
Estudiaremos distintas pruebas de contraste, en el caso de que analizamos los
datos de una muestra, de dos y de varias, ya sean independientes o relacionadas.
CONTRASTE DE UNA MUESTRA
En el caso de una muestra, estudiaremos las pruebas de bondad de ajuste, que
consisten en el contraste de hiptesis sobre la forma que presenta la distribucin de

una determinada variable. Se trata de averiguar la distribucin de la variable que


estamos analizando se aproxima a la distribucin terica supuesta para la
poblacin.
Dentro de este conjunto de pruebas, encontramos la prueba deKolmorogovSmirnov, con la que intentamos averiguar cul es la distribucin de nuestra variable.
Para ello, partimos de un modelo concreto de distribucin: normal, binomial,
uniforme,... Para su comprobacin se extrae una muestra de la poblacin, y
comparamos la distribucin observada en la muestra con la distribucin terica. En
la medida en que existan diferencias entre tales distribuciones, podremos intuir que
la poblacin no presenta esa la forma inicial que estamos comprobando.
La forma de distribucin de mayor uso es la distribucin normal, por lo que es muy
frecuente que se emplee la prueba de Kolmorogov-Smirnov con el propsito de
averiguar si nuestros datos siguen tal distribucin.
Seguidamente, veremos el proceso en el caso de que deseemos comprobar si los
datos se distribuyen normalmente:
- Partimos de dos funciones:
F(xi): Funcin de distribucin de frecuencias acumuladas tericas. Es decir, es la
funcin que va a ser contrastada y que se asume como terica.
S(xi): Funcin de distribucin de frecuencias obtenidas. Esto es, proporcin
emprica de valores que, en la muestra observada, son iguales o menores a xi.
- Hiptesis estadsticas:
Hiptesis nula: No existen diferencias entre la distribucin observada y la
distribucin normal.
H0: F (xi) = S(xi)
Hiptesis alternativa: Hay diferencias entre la distribucin observada y la
distribucin normal.
H1: F(xi) S(xi)
- Estadstico de contraste
D = mx /F(xi) - S(xi)/
El estadstico D se define como la diferencia mxima entre la distribucin observada

y la terica.
- Valores crticos de la regin de rechazo
Estos valores se hallan en tablas ya construidas para la prueba de KolmorovSmirnov. Una de las tablas se puede encontrar en la obra de San Martn y Pardo
(1989: 549-550). La manera de interpretacin de dicha tabla es la siguiente:
conociendo el valor crtico para un nivel de significacin a, se trata de comparar el
valor de D observado con el valor crtico, y decidir as si se rechaza o no la
hiptesis nula.

CONTRASTES PARA DOS MUESTRAS


Al igual que en los contrastes paramtricos sobre referidos a la media, vamos a
diferenciar dos situaciones: cuando los sujetos de ambas muestras estn
relacionados y cuando no lo estn.
Muestras relacionadas. Prueba de Wilcoxon.
Esta prueba se utiliza cuando queremos averiguar si dos tratamientos o niveles de
la variable- independiente se diferencian entre s (prueba bilateral) o uno es mejor
que otro (prueba unilateral). En este caso, los sujetos han de ser los mismos
sujetos o estar apareados en los dos tratamientos. Puesto que no se cumplen
ciertos supuestos paramtricos (homogeneidad de varianzas, escala de medida,
normalidad de la poblacin), no es posible utilizar la prueba t de Student, siendo la
recomendable la prueba de Wilcoxon.
La nica condicin que debemos tener en cuenta para aplicar, esta prueba es que
tenemos que conocer cul de las dos puntuaciones de cada par es mayor y que
podamos ordenar las diferencias sin tener en cuenta su signo (valor absoluto).
1. Hiptesis:
Hiptesis nula: No existen diferencias entre los dos grupos o tratamientos.
Hiptesis alternativa: Hay diferencias entre los dos grupos.
2. Estadstico de contraste.
El estadstico de contraste es la W de Wilcoxon. Para su clculo, debemos seguir

los siguientes pasos:


a) Para cada par igualado, se calcula diferencia entre las dos puntuaciones.
b) Se ordenan de menor a mayor las diferencias, sin tener en cuenta el signo.
No se incluyen las diferencias con valor igual a cero.
c) A cada diferencia se le asigna un rango a partir de la clasificacin, y se coloca el
signo correspondiente.
d) Se calcula W como el valor ms pequeo posible al sumar todos los rangos
positivos (W+) y todos los negativos (W-).
En la prctica, no es necesario realizar todos estos clculos, puesto que ya existen
tablas construidas al efecto (Amn, 1988: 528), que ser la que utilizaremos.
3. Comparacin con el valor terico.
Una vez obtenido el valor de W se compara con el correspondiente valor crtico,
correspondiente al nmero de diferencias no nulas. En el caso de que se inferior a
l, podremos rechazar la hiptesis nula y aceptar la hiptesis alternativa.
Si estamos ante un contraste unilateral, nos interesa conocer si las puntuaciones de
una muestra (X) son superiores a las de la otra (Y), quedando formuladas las
correspondientes hiptesis de la siguiente forma:
Hiptesis nula: Las puntuaciones X son iguales o inferiores a las puntuaciones Y.
Hiptesis alternativa: Las puntuaciones X son superiores a las puntuaciones Y.
Si la hiptesis nula es cierta, esperarnos que las diferencias Y-X sean de signo
positivo, y que, por tanto, al sumar todos los rangos positivos obtendramos un valor
elevado. Para rechazar la hiptesis nula, tendramos que encontrar valores de
W+ que se alejen de los esperados de acuerdo con la hiptesis nula, o sea, valores
pequeos de W+.
Si la muestra es mayor que 20, es difcil encontrar tablas que recojan los valores
crticos, ya que la forma de obtenerlos se complica en demasa. No obstante, es
posible calcularlos partiendo del supuesto de que las muestras grandes siguen una
distribucin normal, con los siguientes parmetros media y desviacin tpica:

[D]
Por lo tanto, el estadstico W se transforma en una puntuacin tpica y sigue una
distribucin normal con media de 0 y desviacin tpica de 1, y podremos obtener la
probabilidad asociada al mismo a partir de la tabla de valores de la distribucin
normal.

Muestras independientes. Prueba de Mann-Whitney


La prueba de Mann-Whitney se emplea en aquellos casos en los que deseamos
contrastar si existen diferencias entre las poblaciones de donde se extranjeron dos
muestras, que han de ser aleatorias e independientes. La utilidad de esta prueba es
la misma que la de la prueba t, pero no parte de supuestos y puede ser aplicada a
datos medidos en escala ordinal.
El procedimiento es el siguiente:
1. Hiptesis:
Hiptesis nula: No existen diferencias entre los dos grupos.
Hiptesis alternativa: Hay diferencias entre los dos grupos.
2. Estadstico de contraste:
En este caso, el estadstico a emplear se denomina U de Mann-Whitney, que se
calcula siguiendo estos pasos:
a) Se procede a ordenar las puntuaciones de las dos muestras como si fueran una
sola.
b) A cada una de ellas se le asigna un rango.
c) Se calcula el estadstico T, a partir de la suma de los rangos de la muestra de
menor tamao.

d) Teniendo T, se calcula U:

donde n1 es el nmero de sujetos de la muestra de menor tamao, y n 2 el de la


muestra menor.
3. Como en el caso anterior, el valor observado es comparado con valores
tabulados.
En dicha tabla encontramos la probabilidad asociada a cada valor del estadstico
para una prueba unilateral. Si nuestro contraste es bilateral, slo tendremos que
multiplicar por dos el valor tabular correspondiente a una cola.

CONTRASTES PARA K MUESTRAS INDEPENDIENTES

Muestras independientes. Prueba de Chi Cuadrado

Muestras independientes. Prueba de Kruskal-Wallis

Muestras independientes. Prueba de Chi cuadrado


Quizs sea sta una de las pruebas ms conocidas y usada, siendo una prueba
idnea para valorar de forma estadstica las diferencias entre frecuencias de k
muestras independientes. Estas frecuencias son dos: las frecuencias observadas
(f0), tras la recogida de datos, y las frecuencias tericas o esperadas (f t) de acuerdo
con algn modelo terico.
Antes de continuar, debemos recordar que esta prueba no debe ser empleada
cuando se da alguna de las siguientes situaciones:
- Cuando ms del 20% de las casillas presentan frecuencias esperadas menores
que 5.
- Cuando alguna celda o casilla tiene una frecuencia esperada menor de 1.

En esta prueba, tos pasos a seguir son los siguientes:


1. Hiptesis:
Hiptesis nula: No existen diferencias entre los grupos.
Hiptesis alternativa: Hay diferencias entre los grupos.
2. Estadstico de contraste:
Antes de empezar, deberemos construir una tabla de contigencia de s filas por k
columnas en la que se crucen las muestras que van a ser comparadas con las
modalidades de respuesta de la variable medida en escala nominal.
El estadstico de contraste es chi cuadrado, que se define como:

donde f0 es la frecuencia observada y ft es la frecuencia terica o esperada. Este


estadstico se distribuye segn chi cuadrado con (s-l)(k-l) grados de libertad.
Normalmente, el valor de la frecuencia esperada se calcula partiendo de que los
sujetos se reparten de forma equitativa en cada categora o de forma proporcional a
las frecuencias marginales (suma de las frecuencias de las filas y de las columnas).
En este ltimo caso, el valor de la frecuencia esperada se determina de la siguiente
manera:

en la que fc es la frecuencia de la columna y ff es la frecuencia de la fila.


3. Comparacin con el valor crtico y decisin.
Una vez ms, procederemos a buscar en la tabla correspondiente el valor crtico
adecuado para nuestro nivel de significacin y los "grados de libertad, y decidir si
rechazamos o no la hiptesis nula.

Muestras independientes. Prueba de Kruskal-Wallis


La prueba de Kruskal-Wallis trata de contrastar si las diferencias entre las muestras
indican idnticas variaciones respecto de las poblaciones de las que fueron
extradas. La condicin necesaria para que pueda ser aplicada es que la variable
est medida, al menos, en una escala ordinal.
1. Hiptesis:
Hiptesis nula: No existen diferencias entre los grupos.
Hiptesis alternativa: Hay diferencias entre los grupos.
2. Estadstico de contraste:
Para calcular el estadstico de contraste, es necesario seguir los siguientes pasos:
a) Se ordenan las puntuaciones de menor a mayor como si fueran una sola
muestra.
b) A cada puntuacin se le asigna un rango.
c) Se obtiene la suma de rangos de cada una de la muestras (valor R).
d) Se determina el valor del estadstico de contraste H, definido como

3. Para muestras con n>5, el estadstico H sigue la distribucin de chi cuadrado con
k-1 grados de libertad. En ese caso, si el valor observado de H es mayor o igual que
el valor crtico de chi cuadrado para un nivel de significacin concreto, se rechaza la
hiptesis nula a ese nivel de significacin.
El valor de H se ve afectado por el nmero de puntuaciones ligadas, es decir,
puntuaciones que tienen el mismo valor y que, por tanto, se le asigna el rango
promedio. Para corregir este efecto, se divide el valor de H por:

CONTRASTES PARA K MUESTRAS RELACIONADAS

Muestras relacionadas. Prueba de Cochran

Muestras relacionadas. Prueba de Friedman

Muestras relacionadas. Prueba de Cochran


El objetivo de esta prueba es determinar si ms de dos series de puntuaciones
igualadas difieren o no significativamente. Se utiliza cuando las variables estn
medidas en una escala nominal u ordinal. Para su aplicacin, los pasos a seguir son
los siguientes:
1. Hiptesis:
Hiptesis nula: No existen diferencias entre los grupos.
Hiptesis alternativa: Hay diferencias entre los grupos.
2. Estadstico de contraste
Para su clculo, es preciso realizar los siguientes pasos:
a) A cada puntuacin favorable o de xito se le asigna 1, y un 0 a cada fracaso o
caso desfavorable.
b) Se colocan las puntuaciones en una tabla, en la que las filas son los sujetos y las
columnas son las muestras o grupos.
c) Se calcula el estadstico Q de Cochran:

Donde Gj es el nmero total de xitos (valor 1) en la columna j;


los valores G; y L es el nmero de xitos en la fila i.

es la media de

3. Se determina la regin de rechazo, teniendo en cuenta que el estadstico Q


distribuye segn chi cuadrado con k-1 grados de libertad. Para un nivel
significacin dado, se compara el valor observado con el valor tabular. Si Q
mayor que el valor crtico, se rechaza la hiptesis nula para ese nivel
significacin.

se
de
es
de

Muestras relacionadas. Prueba de Friedman


La prueba de Friedman permite contrastar si existen diferencias entre las
poblaciones de las que fueron extradas k muestras, cuando stas corresponden a
datos relacionados. stos han de estar medidos al menos en una escala ordinal.
1. Hiptesis:
Hiptesis nula: No existen diferencias entre los grupos.
Hiptesis alternativa: Hay diferencias entre los grupos.
2. Estadstico de contraste
El estadstico de contraste utilizado es r2, que se determina a partir de los
siguientes pasos:
a) En una tabla; se colocan todas las puntuaciones de forma que las filas son los
sujetos y las columnas son las muestras.
b) Se ordenan los sujetos en cada fila.
c) Se calculan las sumas de rangos Rj correspondientes a cada columna.
d) Se obtiene el estadstico de Friedman.

3. Consultamos la tabla correspondiente para obtener los valores crticos. En ella se


recogen las probabilidades asociadas a valores tan grandes como r2. Si el valor
observado es igual o mayor que el valor crtico para un nivel de significacin
determinado, podemos rechazar la hiptesis nula.

PROBLEMAS RESUELTOS
Problema 1
Una Escala de Inteligencia, en la que pueden obtenerse valores de 0 a 8, arroja
puntuaciones que se distribuyen normalmente N(4,l). Para confirmarlo, pasamos la
Escala a una muestra de 10 sujetos, obteniendo los resultados que aparecen a
continuacin. Podemos decir que estos resultados confirman la distribucin normal
en la poblacin?
Puntuaciones: 1 4 6 5 3 2 5 6 4 7

Solucin 1
1. Hiptesis estadsticas:
Hiptesis nula: No existen diferencias entre la distribucin observada y la
distribucin normal.
H0: F(xi) = S(xi)
Hiptesis alternativa: Hay diferencias entre la distribucin observada y la
distribucin normal.
H1: F(xi) S(xi)
2. Estadstico de contraste
En este caso, el estadstico de contraste es D, definido como la diferencia mxima
entre la distribucin de proporciones observada y la terica. Por tanto, hay que
construir las distribuciones F(xi) y S(xi). Los resultados se presentan en la tabla
siguiente, en las que la primera columna corresponde a las puntuaciones de los
sujetos, la siguiente a las puntuaciones tpicas, y seguidamente, los valores de F(x i)
y S(xi). La ltima columna presenta la distancia entre F(x i) y S(xi).

xi
7
6
5
4
3
2
1

z
3
2
1
0
-1
-2
-3

F(xi)
0.9986
0.9972
0.8413
0.5000
0.1587
0.0228
0.0014

S(xi)
1.0000
0.9000
0.7000
0.5000
0.3000
0.2000
0.1000

/F(xi) - S(xi)/
0.0014
0.0972
0.1413
0.0000
0.1413
0.1772
0.0986

Puesto que deseamos comprobar si la poblacin de donde fue extrada la muestra


presenta una distribucin normal, para hallar F(x i) lo nico que tendramos que
hacer sera consultar la probabilidad que le corresponde a cada valor de z en una
tabla normal. Los valores de la ltima columna se calcula del siguiente modo: para
hallar la proporcin de valores inferiores o iguales a z = 2, se divide el nmero de
puntuaciones de X que presentan un valor inferior o igual a 2 entre el nmero total
de puntuaciones, es decir, 9/10 = 0.9.
Observamos que, a partir de la ltima columna de la tabla anterior, la diferencia
mxima entre F(xi) y S(xi) es 0.1772, por tanto, D = 0.1772.
3. El siguiente paso consiste en consultar la tabla de los valores crticos que
corresponden a la prueba de Kolmorogov-Smirnov. Vemos que para n = 10 y a =
0.01, el valor crtico es 0.48893. Como 0.48893 > 0.1772, aceptamos la H 0. Es decir,
no existen diferencias significativas entre la distribucin observada y la distribucin
terica, y por tanto, la inteligencia no. sigue una distribucin normal en la poblacin
de la que fue extraa la muestra de nuestro ejemplo.

Problema 2
Un pedagogo desea probarla hiptesis de que el procedimiento psicolgico e
inductivo (trabajar ante ejemplos para, de ah, elevarse a la teora musical) es ms
eficaz que el lgico (primero la teora y luego las aplicaciones prcticas).
Como acta con dos grupos (A y B), selecciona a 10 sujetos del grupo A y otros 10
del B, emparejados en rendimiento musical previo, en actitud y en aptitudes
musicales. Decide al azar que en el A aplicar el procedimiento psicolgico y en el B
el lgico. Para la evaluacin de resultados utiliza un instrumento de medida que slo

denota que unas diferencias iguales entre los nmeros que no implican diferencias
idnticas en las cuantas de los atributos. Obtiene los siguientes datos (ficticios):
A
16
12
22
16
14
10
20
18
10
22

B
4
18
10
14
12
14
10
12
4
12

Puede afirmar que hay que diferencias entre los dos grupos? ( = 0.05)
Solucin 2
1. Hiptesis:
Hiptesis nula: El procedimiento psicolgico produce resultados inferiores o iguales
al procedimiento lgico.
Hiptesis alternativa: El procedimiento psicolgico produce resultados superiores al
procedimiento lgico.
2. Estadstico de contraste.
Para el clculo del estadstico W, deberemos calcular previamente las diferencias
entre las puntuaciones de los dos grupos. Estas diferencias o distancias quedan
recogidas en la tabla siguiente:
A
16
12
22

B
4
18
10

B-A
-12
6
-12

R(B-A)
9.5
5
9.5

R(+)

R(-)
9.5

5
9.5

16
14
10
20
18
10
22

14
12
14
10
12
4
12

-2
-2
4
-10
-6
-6
-10

1.5
1.5
3
7.5
5
5
7.5

1.5
1.5
3
7.5
5
5
7.5

En la tercera columna, aparece el rango de las diferencias con su signo


correspondiente. Y en las dos ltimas, los correspondientes rangos, para los que
tienen signo positivo y negativo.
As, la suma de los rangos positivos y negativos son:
W- = 47
W+ = 8
Por tanto, el estadstico de contraste en este ejemplo es W = 8 (el menor de los
valores obtenidos).
6. En el caso de que la hiptesis nula sea cierta, esperamos diferencias B-A con
signo positivo, por lo que la suma de rangos positivos W + tendra un valor alto. Para
rechazar la hiptesis nula tendremos que obtener valores bajos de W +, es decir, la
regin de rechazo se encuentra a la izquierda. Esto es, estamos ante un contraste
unilateral izquierdo. Ahora consultamos la tabla de valores crticos para la prueba
de Wilcoxon, y encontramos que para un contraste unilateral y con un nivel de
significacin de 0.05, el valor crtico es 8. Por tanto, rechazamos la hiptesis nula y
podemos afirmar con una confianza del 95% que el procedimiento psicolgico es
ms eficaz que el lgico.

Problema 3
Para determinar si la asistencia a un curso de ofimtica modifica el estilo cognitivo,
se seleccionan dos grupos de 10 alumnos, uno de los cuales sigui el curso (grupo
experimental) mientras que al otro no se le aplic ningn tratamiento (grupo control).
Tras la realizacin del curso, mediante una escala adecuada se medi el estilo

cognitivo de-ambos grupos,-variable que-no se distribuye normalmente en la


poblacin. Podemos afirmar que los dos grupos son diferentes en cuanto a estilo
cognitivo despus de haber finalizado el curso?
Grupo experimental
Grupo control

75 46
39 49

52 45 75
28 47 35

62 48
25 69

85
34

63
67

84
32

Solucin 3
Ya en el enunciado del problema, se nos dice que los datos son siguen
una distribucin normal por lo que utilizaremos un contraste no
paramtrico. Al tratarse de dos muestras independientes, la prueba ms
adecuada es la prueba de Mann-Whitney. Las hiptesis que vamos a
contrastar son:
H0: No existen diferencias entre el grupo experimental y el grupo control.
H1: Existen diferencias significativas entre el grupo experimental y el grupo
control.
Fijamos un nivel de significacin (0.05) y calculamos los estadsticos T y
U:
X
25
28
32
34
35
39
45
46
47
48
49
52
62
63

Rango
1
2
3
4
5
6
7*
8*
9
10*
11
12*
13*
14*

67
69
75
84
85

15
16
17.5*
19*
20*

La suma de rangos de la primera muestra o estadstico T es 120.5. Y por


tanto, U vale:
[D]
[D]
Buscamos en la tabla para la prueba Mann-Whitney, y encontramos que"
para tamaos de 10 sujetos en ambas muestras y T=120.5, la
probabilidad asociada es 0.124. Debemos tener en cuenta que nuestro
contraste es bilateral, por lo que la probabilidad buscada ser el doble de
la que se recoge en la tabla, esto es, 0.248. Como p>0.05 no podemos
rechazar la hiptesis nula con una confianza del 95%, es decir, los grupos
no son diferentes en estilo cognitivo.

Problema 4
En el marco de un estudio sobre las perspectivas de empleo en las mujeres se
recogen datos acerca de la situacin laboral de una muestra aleatoria formada por
89 mujeres y 71 hombres. Podemos afirmar con una confianza del 98% que la
situacin laboral de hombres y mujeres es distinta?
Mujeres
Hombres

Empleados
25
35

Subempleados
18
15

En paro
46
21

Solucin 4
Puesto que los datos nos vienen dados en forman de frecuencias, la
prueba ms adecuada en este caso es la prueba de chi cuadrado.
Tendremos que comparar las frecuencias observadas, recogidas en el

estudio, con las frecuencias que cabra esperar bajo el supuesto de que
no hubieran diferencias ente las proporciones de las dos muestras. Estas
frecuencias esperadas se calculan como el producto de las frecuencias
marginales dividido por el total de sujetos. A continuacin se reflejan las
frecuencias esperadas:
Empleado Subempleado
s
s
Mujeres
33.38
18.36
Hombres
26.63
14.64

En
paro
37.27
29.73

En primer lugar, debemos plantear las hiptesis:


H0: No existen diferencias entre hombres y mujeres en cuanto a la
situacin laboral.
H1: Existen diferencias significativas entre hombres y mujeres en cuanto a
la situacin laboral.
El nivel de significacin ya nos viene fijado en el problema (0.02). El
siguiente paso ser calcular el valor observado del estadstico de
contraste:
[D]

[D]
El estadstico de contraste chi cuadrado se distribuye segn (s-l)(k-l)
grados de libertad, siendo s y k respectivamente el nmero de filas y
columnas de la tabla de contingencia. Consultando la tabla
correspondiente, comprobamos que el valor crtico para a = 0.02 y para
(2-1) y (3-1) grados de libertad es
0.9822 = 7.824
Por tanto, dado que el valor observado es mayor que el valor crtico, y
queda incluido en la regin de rechazo, podemos rechazar la hiptesis
nula con una confianza del 98%. En consecuencia, podemos afirmar que

existen diferencias la situacin laboral entre hombres y mujeres.

Problema 5
Hemos recogido el tamao de los centros acogidos a tres programas de
experimentacin, que cuentan con la participacin de 4, 3 y 4 centros
respectivamente. Si el nmero de unidades de cada uno de estos centros es el que
se muestran a continuacin, podemos afirmar que el tamao no marca diferencias
entre los centros implicados en los tres programas? ( = 0.05)
Programa A
20
19
16
21

Programa B
24
22
28

Programa C
23
15
18
26

Solucin 5
Dado que el nmero de casos es muy pequeo, la prueba idnea ser una prueba
no parmetrica. Puesto que tenemos que tres muestras cuyos datos no se
encuentran relacionados, la prueba a utilizar ser la de Kruskal-Wallis. Las hiptesis
a contrastar son las siguientes:
H0: No existen diferencias entre los k grupos.
H1: Existen diferencias significativas entre los k grupos.
Para calcular el estadstico de contraste, debemos ordenar las puntuaciones, como
si fueran una sola muestra:
Programa A
5
4
2
6

Programa B
9
7
11

Programa C
8
1
3
10

Y calculamos la suma de rangos para cada una de las muestras:


R1 = 5 + 4 + 2 + 6 = 17
R2 = 9 + 7 + 11 = 27
R3 = 8 + 1 + 3 + 10 = 22
La expresin del estadstico U es la siguiente:

[D]
Sustituyendo, obtenemos que U es:

[D]
Buscamos en la tabla correspondiente la probabilidad asociada para n 1 = 4, n2 = 3 y
n3 = 4, y encontramos que es 0.102. Por tanto, no podemos rechazar la hiptesis
nula, puesto que la probabilidad observada es mayor que nuestro nivel de
significacin (0.05).

Problema 6
Se pretende estudiar si determinados factores inciden de distinto modo en no
presentarse a los exmenes parciales de una asignatura. Se eligen aleatoriamente
7 sujetos matriculados, registrando para ellos la presencia o ausencia de faltas de
asistencia reiteradas (factor A), el cumplimiento o incumplimiento de tareas (factor
B) y la asistencia o no a tutoras (factor C). Todos estos aspectos son codificados
con 1 en el caso positivo y 0 en el negativo. Podemos afirmar con una confianza
del 98% que los tres factores estn presentes de modo diferente en los alumnos
que no se presentaron a los exmenes parciales?

Solucin 6
En este problema, las muestras estn formadas por puntuaciones apareadas o
relacionadas de carcter dicotmico, por lo tanto, la prueba apropiada es la de
Cochran. El primer paso ser formular las hiptesis:

H0: No existen diferencias entre los tres factores.


H1: Existen diferencias significativas entre los tres factores.
El nivel de significacin ya nos viene fijado en el enunciado del problema: 98% de
confianza, por lo tanto, = 0.02. El estadstico de contraste que emplearemos ser
la Q de Cochran, que exige disponer la informacin de forma que los sujetos sean
las filas y los grupos o muestras sean las columnas.
Alumno Factor A
1
1
2
1
3
0
4
1
5
1
6
1
7
0
Gi
5

Factor B
0
0
0
0
1
0
1
2

Factor C
0
0
1
1
1
1
0
4

Li
1
1
1
2
3
2
1
11

Li2
1
1
1
4
9
4
1
21

En la tabla anterior hemos calculado los valores O (nmero de aciertos en las


columnas) y L (nmero de aciertos en las filas). Ya slo queda sustituir en la
expresin del estadstico Q:

[D]

[D]
El estadstico Q sigue una distribucin de chi cuadrado con k-1 grados de libertad.
Por lo tanto, el valor crtico que delimita la regin de rechazo ser
0.9822 = 7.824

Puesto que el valor observado Q = 2.33 no entra en la regin de rechazo,


mantenemos la hiptesis nula y no podemos afirmar con una confianza del 98% que
existan diferencias significativas entre los tres factores.

Problema 7
La asociacin de padres de un centro convoca sucesivamente tres reuniones
dirigidas a los padres de alumnos de un mismo grupo o clase, en las que se
abordaron respectivamente temas relacionados con el apoyo de la familia al estudio
(Tema A), el juego y el tiempo libre de los nios (Tema B), y la participacin de los
padres en el centro (Tema C). Si contamos los datos de asistencia a cada una de
las tres reuniones para los padres de alumnos de 6 clases, podemos afirmar que
los tres temas atrajeron de modo distinto a los convocados? ( = 0.05)
Tema A Tema B Tema C
3
2
1
3
2
1
3
1
2
2
3
1
3
2
1
3
2
1

Solucin 7
Dado que el nmero de sujetos es pequeo, deberemos utilizar una prueba no
paramtrica, y puesto que los casos se hayan relacionados, la prueba ms idnea
es el anlisis de la varianza de dos clasificaciones por rangos de Friedman. En
primer lugar, plantearemos las hiptesis:
H0: No existen diferencias entre en la atraccin a los tres temas.
H1: Existen diferencias significativas entre en la atraccin a los tres temas.
El estadstico de contraste que emplearemos ser:
[D]
Por lo tanto, calcularemos la suma de rangos para cada columna:
Tema A Tema B Tema C
3
2
1

3
3
2
3
3

2
1
3
2
2

1
2
1
1
1

RA = 17, RB = 12 y RC = 7. Sustituyendo:
[D]
Comparamos el valor observado con el que nos ofrece la tabla, teniendo en cuenta
que X2 sigue una distribucin de chi cuadrado con k-1 grados de libertad. Por tanto,
el valor crtico ser
0.9522 = 5.991
Puesto que el valor observado es mayor que el crtico, aqul entra en la regin de
rechazo, por lo que podemos rechazar con una confianza del 95% que existen
diferencias significativas en cuanto a la atraccin a los distintos temas.

Ejercicios resueltos de prueba de hiptesis


1) Una empresa est interesada en lanzar un nuevo producto al mercado. Tras
realizar una campaa publicitaria, se toma la muestra de 1 000 habitantes, de los
cuales, 25 no conocan el producto. A un nivel de significacin del 1% apoya el
estudio las siguientes hiptesis?

a. Ms del 3% de la poblacin no conoce el nuevo producto.

b. Menos del 2% de la poblacin no conoce el nuevo producto


Datos:

n = 1000
x = 25

Donde:
x = ocurrencias
n = observaciones
= proporcin de la muestra
= proporcin propuesta
Solucin:
a)

a = 0,01

H0 es aceptada, ya que zprueba (-0,93) es menor que ztabla (2,326), por lo que no
es cierto que ms del 3% de la poblacin no conoce el nuevo producto.
En Excel

b)

a = 0,01

H0 es rechazada, ya que zprueba (1,13) es menor que ztabla (2,326), por lo que es
cierto que menos del 2% de la poblacin no conoce el nuevo producto.
2) Cuando las ventas medias, por establecimiento autorizado, de una marca de
relojes caen por debajo de las 170,000 unidades mensuales, se considera razn
suficiente para lanzar una campaa publicitaria que active las ventas de esta marca.
Para conocer la evolucin de las ventas, el departamento de marketing realiza
una encuesta a 51 establecimientos autorizados, seleccionados aleatoriamente, que
facilitan la cifra de ventas del ltimo mes en relojes de esta marca. A partir de estas
cifras se obtienen los siguientes resultados: media = 169.411,8 unidades.,
desviacin estndar = 32.827,5 unidades. Suponiendo que las ventas mensuales
por establecimiento se distribuyen normalmente; con un nivel de significacin del 5
% y en vista a la situacin reflejada en los datos. Se considerar oportuno lanzar
una nueva campaa publicitaria?
Datos:

n = 51

Solucin:
H0: ( = 170000
H1: ( < 170000
a = 0,05

Se rechaza Ho, porque zprueba (-0,12) es menor que ztabla (1,645), por lo tanto se
acepta H1: ( < 170000, y se debe considerar oportuno lanzar una nueva campaa
publicitaria.
En Excel

3) Un gerente de ventas de libros universitarios afirma que en promedio sus


representantes de ventas realiza 40 visitas a profesores por semana. Varios de
estos representantes piensan que realizan un nmero de visitas promedio superior
a 40. Una muestra tomada al azar durante 8 semanas revel un promedio de 42
visitas semanales y una desviacin estndar de 2 visitas. Utilice un nivel de
confianza del 99% para aclarar esta cuestin.
Datos:
( = 40

n=8

Nivel de confianza del 99%


Nivel de significacin = (100%-99%)/2 = 0,5% = 0,005

Solucin:
H0: ( = 40
H1: ( > 40

Grados de libertad: n-1 = 8-1 =7


a = 0,005

H0 es aceptada, ya que tprueba (2,83) es menor que ttabla (3,499), por lo que no es
acertado pensar que estn realizando un nmero de visitas promedio superior a 40.
En Excel

4) Un investigador de mercados y hbitos de comportamiento afirma que


el tiempo que los nios de tres a cinco aos dedican a ver la televisin cada
semana se distribuye normalmente con una media de 22 horas y desviacin
estndar 6 horas. Frente a este estudio, una empresa de investigacin de
mercados cree que la media es mayor y para probar su hiptesis toma una muestra
de 64 observaciones procedentes de la misma poblacin, obteniendo como
resultado una media de 25. Si se utiliza un nivel de significacin del 5%. Verifique si
la afirmacin del investigador es realmente cierta.
Datos:

n = 64

a = 5% = 0,05

Solucin:
H0: ( = 22
H1: ( > 22
a = 0,05

Se rechaza Ho, porque zprueba (4) es mayor que ztabla (1,645), por lo tanto el
tiempo que los nios de tres a cinco aos dedican a ver la televisin es mayor de 22
horas, lo que implica que la empresa de investigacin de mercados tiene la razn.
En Excel

5) Una organizacin que provee de alimentos a centros escolares le encarga a


usted la siguiente investigacin de su mercado interno. Est interesada en comparar
los gastos resultantes de elaborar un plato muy usual, segn el tipo de batera de
cocina utilizado. Los gastos son de dos tipos: de energa, X1 (ya que
los materiales y el diseo de la batera pueden hacer variar el tiempo necesario de
coccin) y de condimentos, X2 (algunas bateras aconsejan la utilizacin de

cantidades ms pequeas de aceite, sal, lquidos). Se hicieron 5 pruebas con


cada tipo de batera obtenindose los siguientes resultados (gastos en dlares):

Utilizando un anlisis ANOVA, qu puede inferirse a partir de los datos recabados?


Solucin
1) Tomando los datos de la tabla a) con respecto a X1

Clculo de las medias aritmticas

Llenando la siguiente tabla para calcular la varianza muestral

Tomando en cuenta los clculos de las varianzas se evidencia que la batera B


es la que tiene menos varianza, por lo que para el gasto de energa, sta
batera es la mejor.
Estimacin interna de varianza (within estimate)

Estimacin intermediante de varianza (between estimate)

Donde

31

1,604

28,2 2,351
30

0,071

Total 4,026
Varianza de las medias aritmticas

Estimacin intermediante de varianza

Planteamiento de hiptesis
H0: Todas las proporciones de la poblacin son iguales.
H1: No todas las proporciones de la poblacin son iguales.

F tabla
Grados de libertad:
Numerador: k-1 = 3-1 =2
Denominador: k(n-1) = 3(5-1) =12

Nivel de significacin del 1%

Como Fprueba es menor que Ftabla , H0 se acepta, por lo tanto no existen


diferencias reales entre la bateras.
En Excel

2) Tomando los datos de la tabla a) con respecto a X2

Clculo de las medias aritmticas

Llenando la siguiente tabla para calcular la varianza muestral

Tomando en cuenta los clculos de las varianzas se evidencia que la batera C


es la que tiene menos varianza, por lo que para el gasto de condimentos, sta
batera es la mejor.
Estimacin interna de varianza (within estimate)

Estimacin intermediante de varianza (between estimate)

Donde

45,8 1,604
45

0,218

42,8 3,004
Total 4,827
Varianza de las medias aritmticas

Estimacin intermediante de varianza

Planteamiento de hiptesis
H0: Todas las proporciones de la poblacin son iguales.
H1: No todas las proporciones de la poblacin son iguales.

F tabla
Grados de libertad:
Numerador: k-1 = 3-1 =2
Denominador: k(n-1) = 3(5-1) =12
Nivel de significacin del 1%

Como Fprueba es menor que Ftabla , H0 se acepta, por lo tanto no existen


diferencias reales entre la bateras.
3) Tomando los datos de la tabla b) con respecto a X1

Clculo de las medias aritmticas

Llenando la siguiente tabla para calcular la varianza muestral

Tomando en cuenta los clculos de las varianzas se evidencia que la batera B


es la que tiene menos varianza, por lo que para el gasto de energa, sta
batera es la mejor.
Estimacin interna de varianza (within estimate)

Estimacin intermediante de varianza (between estimate)

Donde

30

0,071

30,4 0,444
28,8 0,871
Total 1,387
Varianza de las medias aritmticas

Estimacin intermediante de varianza

Planteamiento de hiptesis

H0: Todas las proporciones de la poblacin son iguales.


H1: No todas las proporciones de la poblacin son iguales.

F tabla
Grados de libertad:
Numerador: k-1 = 3-1 =2
Denominador: k(n-1) = 3(5-1) =12
Nivel de significacin del 1%

Como Fprueba es menor que Ftabla , H0 se acepta, por lo tanto no existen


diferencias reales entre la bateras.
4) Tomando los datos de la tabla b) con respecto a X2

Clculo de las medias aritmticas

Llenando la siguiente tabla para calcular la varianza muestral

Tomando en cuenta los clculos de las varianzas se evidencia que la batera B


es la que tiene menos varianza, por lo que para el gasto de condimentos, sta
batera es la mejor.
Estimacin interna de varianza (within estimate)

Estimacin intermediante de varianza (between estimate)

Donde

45,2 0,444
44,2 0,111
44,2 0,111
Total 0,667
Varianza de las medias aritmticas

Estimacin intermediante de varianza

Planteamiento de hiptesis
H0: Todas las proporciones de la poblacin son iguales.
H1: No todas las proporciones de la poblacin son iguales.

F tabla

Grados de libertad:
Numerador: k-1 = 3-1 =2
Denominador: k(n-1) = 3(5-1) =12
Nivel de significacin del 1%

Como F prueba es menor que F tabla , H0 se acepta, por lo tanto no existen


diferencias reales entre la bateras.
Resumen de las varianzas

Media aritmtica de las varianzas


A:

B:

C:

Respuesta: La batera B es la mejor opcin, porque tiene menos varianza promedio


de los gastos

Вам также может понравиться