Академический Документы
Профессиональный Документы
Культура Документы
PRUEBA DE HIPTESIS
11.1 Hiptesis estadstica es una proposicin o supuesto sobre los parmetros de
una o ms poblaciones.
EJEMPLO 11.1.- Suponga que se tiene inters en la rapidez de combustin de un
agente propulsor slido utilizado en los sistemas de salida de emergencia para la
tripulacin de aeronaves. El inters se centra sobre la rapidez de combustin
promedio. De manera especfica, el inters recae en decir si la rapidez de combustin
promedio es o no 50 cm/s. Esto puede expresarse de manera formal como
Ho;
= 50 cm/s
H1;
50 cm/s
= 50 cm/s
H1;
> 50 cm/s
Es importante recordar que las hiptesis siempre son proposiciones sobre la poblacin
o distribucin bajo estudio, no proposiciones sobre la muestra. Por lo general, el valor
del parmetro de la poblacin especificado en la hiptesis nula se determina en una de
tres maneras diferentes:
1. Puede ser resultado de la experiencia pasada o del conocimiento del proceso,
entonces el objetivo de la prueba de hiptesis usualmente es determinar si ha
cambiado el valor del parmetro.
= 50 cm/s
H1;
50 cm/s
Supngase que se realiza una prueba sobre una muestra de 10 especmenes, y que
se observa cual es la rapidez de combustin promedio muestral. La media muestral es
un estimador de la media verdadera de la poblacin. Un valor de la media muestral
que este prximo al valor hipottico = 50 cm/s es una evidencia de que el verdadero
valor de la media es realmente 50 cm/s; esto es, tal evidencia apoya la hiptesis
nula Ho. Por otra parte, una media muestral muy diferente de 50 cm/s constituye una
evidencia que apoya la hiptesis alternativa H1. Por tanto, en este caso, la media
muestral es el estadstico de prueba.
La media muestral puede tomar muchos valores diferentes. Supngase que si 48.5
51.5, entonces no se rechaza la hiptesis nula Ho; = 50 cm/s, y que si <48.5
>51.5, entonces se acepta la hiptesis alternativa H1;
50 cm/s.
Los valores de que son menores que 48.5 o mayores que 51.5 constituyen la regin
crtica de la prueba, mientras que todos los valores que estn en el intervalo 48.5
51.5 forman la regin de aceptacin. Las fronteras entre las regiones crtica y de
aceptacin reciben el nombre de valores crticos. La costumbre es establecer
conclusiones con respecto a la hiptesis nula Ho. Por tanto, se rechaza Ho en favor de
H1 si el estadstico de prueba cae en la regin crtica, de lo contrario, no se rechaza Ho.
Este procedimiento de decisin puede conducir a una de dos conclusiones errneas.
Por ejemplo, es posible que el valor verdadero de la rapidez promedio de combustin
del agente propulsor sea igual a 50 cm/s. Sin embargo, para todos los especmenes
bajo prueba, bien puede observarse un valor del estadstico de prueba que cae en la
regin crtica. En este caso, la hiptesis nula Ho ser rechazada en favor de la
alternativa H1cuando, de hecho, Ho en realidad es verdadera. Este tipo de conclusin
equivocada se conoce como error tipo I.
11.3 Error tipo I se define como el rechazo de la hiptesis nula Ho cuando sta es
verdadera. Tambin es conocido como
nivel de significancia.
Si tuviramos un nivel de confianza del 95% entonces el nivel de significancia sera del
5%. Anlogamente si se tiene un nivel de confianza del 90% entonces el nivel de
significancia sera del 10%.
Ahora supngase que la verdadera rapidez promedio de combustin es diferente de 50
cm/s, aunque la media muestral caiga dentro de la regin de aceptacin. En este
caso se acepta Ho cuando sta es falsa. Este tipo de conclusin recibe el nombre
de error tipo II.
Ho es verdadera
Aceptar Ho
No hay error
Rechazar Ho
Error tipo I
Ho es falsa
Error tipo II
No hay error
de forma simultnea.
11.6
DECISIN ESTADSTICA
Siempre que se cumplan ciertos supuestos, podemos conocer la distribucin muestral del
estadstico de contraste. A partir de la distribucin muestral que presenta el estadstico de
contraste cuando consideramos a la hiptesis nula cierta, podremos tomar decisiones acerca de
la misma.
Como acabamos de afirmar, para conocer la distribucin muestral del estadstico de contraste es
necesario contar con ciertos supuestos. Habitualmente, estos supuestos se refieren a dos
aspectos:
a) Caractersticas de los datos. Se trata de condiciones que deben cumplir los datos, tales como,
por ejemplo, presentar un determinado nivel de medida o cumplir el supuesto de independencia,
al que nos referamos en el captulo 9.
b) Forma de la distribucin de partida. Es frecuente, en las pruebas de decisin estadstica,
suponer una determinada distribucin (generalmente la distribucin normal) en la poblacin
estudiada.
Cada estadstico de contraste requiere el cumplimiento de unos determinados supuestos, pues
slo de esta forma conoceremos cul es su distribucin muestral. Cuando se violan los supuestos
asumidos en el contraste de hiptesis, no podemos estar completamente seguros de que las
conclusiones que saquemos sern vlidas y, en consecuencia, es preferible no utilizar ese
estadstico de contraste. No obstante, en ciertos casos la violacin de los supuestos no acarrea
problemas demasiado importantes.
Para contrastar la hiptesis de que no hay diferencias significativas entre las medias de ambas
poblaciones, nos basaremos en la informacin aportada por sendas muestras aleatorias, de
tamaos nA y nB respectivamente, extradas de ellas. Si calculamos la media de cada una de las
muestras, obtendremos valores para
y .
De acuerdo con lo presentado en el captulo 9, conocemos la distribucin muestral del
estadstico
. Siempre que las poblaciones A y B sean normales e independientes, y siempre
que conozcamos las varianzas poblacionales A2 y B2 la diferencia de medias
sigue el
modelo de la curva normal, con los siguientes valores para la media y la desviacin tpica:
11.8
NIVEL
DE
SIGNIFICACIN
SIGNIFICACIN
GRADO
DE
igual, al valor crtico: la probabilidad de que el estadstico de contraste asuma el valor crtico o un
valor ms extremo que ste.
Del mismo modo, podemos atribuir una probabilidad al valor observado para el estadstico de
contraste. Esta sera la probabilidad de que el estadstico de contraste asuma el valor observado
o un valor ms extremo que ste. A esta probabilidad se le denomina grado de significacin y
viene expresada por la letra minscula p.
Si en un contraste de hiptesis el valor observado V o entra en la regin de rechazo, podemos
asegurar que el valor observado se encuentra a la derecha del valor crtico Vc. En consecuencia,
la probabilidad de encontrar valores ms extremos que el valor observado (p) ser menor que la
probabilidad de encontrar valores ms extremos que el valor crtico (). Tanto a como a p, por
ser probabilidades, corresponden reas bajo la curva de la distribucin muestral del estadstico de
contraste. Por tanto, si el valor observado entra en la regin de rechazo, el rea correspondiente a
p ser menor que el rea correspondiente a (ver figura 4).
Por todo lo dicho anteriormente, la decisin estadstica tambin puede tomarse a partir de la
comparacin entre las probabilidades p (grado de significacin) y a (nivel de significacin). A cada
valor del estadstico de contraste se asocia una probabilidad p, a partir de la cual podremos
decidir sobre la hiptesis nula de acuerdo con el siguiente criterio:
si p < , rechazamos la hiptesis nula H0
si p > , mantenemos la hiptesis nula H0
Generalmente, los programas estadsticos ofrecen el grado de significacin, a partir del cual
podemos decidir si con un nivel de significacin previamente fijado es posible rechazar o no la
hiptesis nula.
[D]
11.9 ERRORES
Si rechazamos una hiptesis nula por considerar que un valor tan extremo como el valor
observado en el estadstico de contraste es poco probable (P<), existe una posibilidad, aunque
pequea, de estar cometiendo un error Si como ocurra en nuestro ejemplo, la probabilidad
asociada al estadstico de contraste es p = 0.048, ello significa que los datos recogidos son poco
compatibles con H0. Puesto que es muy improbable que siendo H 0 cierta encontremos un valor tan
extremo como ste, nuestra postura es la de sospechar acerca de la veracidad de la hiptesis
nula y, en consecuencia, tomamos la decisin de rechazarla.
Sin embargo, siendo la hiptesis nula cierta, este resultado sera posible en un 4.8% de los casos.
Por ese motivo, cuando tomamos la decisin de rechazar la hiptesis nula estamos cometiendo
un error del 4.8%. A este error se le denomina error tipo I, y consiste en rechazar una hiptesis
nula que en realidad es cierta.
Al llevar a cabo una prueba de decisin estadstica, siempre tratamos de que el error cometido
sea lo ms pequeo posible. De ah, que habitualmente fijemos niveles de significacin de 0.05
0.01. Slo si la probabilidad p asociada al valor observado se encuentra por debajo de estos
niveles, rechazaremos H0. El grado de significacin p es el error cometido al rechazar la hiptesis
nula, y el nivel de significacin representar el mximo error tolerado al rechazar la hiptesis
nula.
Al riesgo de rechazar la hiptesis nula en el caso en que sta no es falsa se le denomina riesgo
La confianza en la decisin de rechazar H0, cuando trabajamos con un riesgo , es 1-.
Si fijamos = 0.05, significa que estamos dispuestos a asumir un error mximo del 5% al
rechazar la hiptesis nula. Y si rechazamos H 0 lo estaremos haciendo con una confianza del 95%.
Si el valor de p ascendi a 0.048, cometemos un error del 4.8%, que se encuentra por debajo del
5% de error mximo permitido en el rechazo de H 0.
En el caso en que la probabilidad asociada a H 0 resultara alta (mayor que 0.05) hubiramos
mantenido la hiptesis nula, por considerar que sta no parece muy improbable y que los
resultados obtenidos son compatibles con ella.
Si en realidad tal hiptesis es falsa y nosotros la mantenemos, habramos cometido un error tipo
II. El riesgo de cometer tal error se denomina riesgo .
Por tanto, son dos los tipos de errores que podemos cometer al mantener o rechazar, basndonos
en los datos de los que disponemos, una hiptesis nula:
ERROR TIPO I: Consiste en rechazar una hiptesis nula que es cierta.
ERROR TIPO II: Consiste en mantener una hiptesis nula que es falsa.
En la tabla 1, recogemos las situaciones en las que se cometen estos tipos de errores.
Tabla 1. Tipos de errores en la decisin estadstica
Rechazamos H0
H0 es verdadera
ERROR TIPO I
No rechazamos H0
No hay error
(Riesgo )
H0 es falsa
No hay error
ERROR TIPO II
(Riesgo )
11.10
PROCESO
ESTADSTICA
DE
UNA
PRUEBA
DE
DECISIN
Son los pasos que hay que dar para llevar a cabo una prueba de decisin estadstica. Tendremos
en cuenta que la decisin, propiamente dicha, se puede tomar a partir de la comparacin entre
dos valores del estadstico de contraste (valor observado y valor crtico) o entre dos
probabilidades (grado de significacin y nivel de significacin), por lo que habr dos procesos
.paralelos en algunas de las etapas.
1.
2.
Fijar el nivel de significacin , es decir, el error mximo que estamos dispuestos a tolerar
en el rechazo de H0.
3.
4.
Determinar el valor o los valores crticos que delimitan' la regin de rechazo, sea sta
unilateral o bilateral.
5.
6.
7.
5.
2.
3.
Rapidez de aplicacin. Siempre que el tamao de la muestra no sea demasiado grande, los
contrastes no paramtricos se realizan con mayor rapidez que los paramtrios.
4.
Siempre que se cumplan los supuesto exigidos, las pruebas paramtricas resultan de mayor
potencia que las no paramtricas, esto es, la probabilidad de rechazar una hiptesis nula
efectivamente falsa es mayor. Teniendo esto en cuenta, el criterio que habremos de seguir a la
hora de elegir entre pruebas paramtricas o no paramtricas es el de aplicar una del primer tipo
siempre que las condiciones exigidas para ello se cumplan. Pero si no se cumplen tales
condiciones, y especialmente si el tamao muestral es muy pequeo, es preferible recurrir a las
pruebas no paramtricas.
Contrastes sobre 1 - 2
Ejemplo 11.2
Pretendemos determinar si dos tems A y B de un cuestionario detectan del mismo
modo las diferencias individuales en una poblacin de alumnos de EGB. Para ello
extraemos dos muestras de 31 y 30 alumnos a las que presentamos los tems A y B
0.975
Fn1,n2 = 1/1-Fn2,n1
Es decir,
0.025
Contrastes sobre 1 - 2
Distinguiremos entre los casos en que las dos muestras correspondan a
observaciones independientes o dependientes. Consideremos que las
observaciones pertenecientes a dos muestras son dependientes cuando se trata,
por ejemplo, de sujetos apareados o mediciones realizadas sobre un mismo grupo
de sujetos en dos momentos distintos. Si comparamos las puntuaciones obtenidas
por un grupo de sujetos antes de despus de la aplicacin de un determinado
programa de intervencin, estaremos ante muestras dependientes.
Otro ejemplo se dara cuando por determinadas razones los sujetos estn
apareados, cmo ocurrira si en lugar de medir las puntuaciones antes y despus de
la aplicacin de un programa, decidimos constituir un grupo experimental y otro de
control para comparar los resultados alcanzados tras el mismo asegurndonos de
que las posibles diferencias no son debidas a una diferente capacidad intelectual
entre los sujetos de ambos grupos. Para conseguir la igualdad de los grupos con la
variable inteligencia aparearamos a los sujetos, haciendo que por cada sujeto del
grupo experimental haya uno de igual C.I. en el grupo control.
restantes casos.
Ejemplo 11.3
Para determinar si los efectos de dos programas A y B de entrenamiento en clculo mental son
similares, hemos utilizado cada uno de estos programas con una muestra de alumnos. Las
muestras tenan tamaos nA = 25 y nB = 28. Tras aplicar una prueba de rendimiento en
matemticas hemos obtenido en cada uno de los grupos medias
= 7.2 y
= 6.8, y varianzas
2
2
SA = 2.4 y SB = 1.7. Podemos afirmar que el programa A conduce a niveles de rendimiento
superiores que el programa B? ( = 0.05)
Puesto que se trata de comprobar si la poblacin de alumnos que siguen el programa A tiene
mejor rendimiento que la poblacin de alumnos que siguen el programa B, las hiptesis
estadsticas en este ejemplo son:
H0: A B
H1: A > B
Para elegir el estadstico de contraste adecuado, es preciso consultar la tabla de estadsticos.
Supondremos la normalidad de las poblaciones. Las varianzas poblacionales son desconocidas;
para elegir el estadstico adecuado convendr saber si se cumple o no el supuesto de
homoscedasticidad de varianzas. Por tanto, un paso previo consistir en comprobar el supuesto
de homoscedasticidad. Las hiptesis sern:
H0: A2 = B2
H1: A2 B2
Para calcular el valor del estadstico F, es necesario disponer de las varianzas insesgadas para
las dos muestras. A partir de las varianzas proporcionadas en el problema, obtendremos las
respectivas varianzas insesgadas y calcularemos F:
Comparando este valor observado con los valores crticos 0.025F24,27 y 0.975F24,27 . El segundo de
estos valores aparece en las tablas de la distribucin F, siendo 0.975F24,27 = 2.19. En cambio, no
tenemos los valores de F para reas tan pequeas como 0.025. Sin embargo, este valor puede
ser calculado con facilidad conociendo la equivalencia
Fn1,n2 = 1/1-Fn2,n1
Por tanto los valores crticos son 0.45 y 2.19. Puesto que el valor observado F = 1.42 se
encuentra fuera de la regin de rechazo, mantendremos H 0 y consideraremos que se da
homoscedasticidad de varianzas.
Con este resultado, podemos seleccionar el estadstico adecuado para llevar a cabo el contraste
de medias planteado inicialmente. Calcularemos el valor de T, que se distribuye con 51 grados de
libertad (nA+ nB-2).
La regin de rechazo se situar en el extremo derecho de la distribucin muestral, puesto que los
valores de T que resultan menos probables suponiendo H 0 cierta son aqullos que provienen de
numeradores
positivos (es decir, cuando
). En este caso, el valor crtico es 0.95T51 =
1.6.
Al comparar el valor observado T = 1 con el valor crtico, advertimos que aqul no se encuentra
incluido en la regin de rechazo, y por tanto, no podemos afirmar que los alumnos que siguieron
el mtodo A presenten un nivel de rendimiento mayor que los que siguieron el mtodo B.
11.15
CONTRASTES
CORRELACIN
SOBRE
COEFICIENTES
DE
Este tipo de contrastes tiene por finalidad hacer inferencias acerca de la relacin
existente entre dos variables a partir del valor calculado para un coeficiente de
correlacin. En el caso general, suponemos que de una poblacin extraemos una
muestra para la que calculamos la correlacin entre las variables X e Y que
presentan una distribucin conjunta bivariada normal en la poblacin de referencia.
El problema planteado es determinar si, conocido el valor de la correlacin entre las
dos variables para los individuos de la muestra, podemos afirmar que el parmetro
p (valor de la correlacin en la poblacin) es distinto a un valor fijado.
Veamos el desarrollo de la correspondiente prueba estadstica para el caso en que
queremos comprobar si la relacin encontrada, calculada mediante el coeficiente de
correlacin de Pearson (rxy), permite afirmar que en la poblacin de donde fue
extrada la muestra existe una relacin entre ambas variables, es decir, si se verifica
0.
1. Hiptesis estadsticas.
La hiptesis nula afirmara que el coeficiente de correlacin es nulo, es decir, que
no existe una relacin lineal entre las dos variables y, en todo caso, la relacin
observada se debe al azar. Por el contrario, la hiptesis alternativa supondra
afirmar la existencia de una relacin entre X e Y. Por tanto:
H0: = 0
H1: 0
2. Estadstico de contraste.
En el caso del coeficiente de correlacin de Pearson, el estadstico de contraste
utilizado es
Ejemplo 11.4
Para conocer la relacin existente entre la rapidez con que los alumnos de un
centro ejecutan las tareas (variable X) y el grado de correccin de la misma
(variable Y), se seleccion una muestra de 76 alumnos a los que se propuso una
serie de actividades que posteriormente fueron corregidas y se cronometro el
tiempo invertido en la realizacin de las mismas. Si el valor de la correlacin de
Pearson obtenido fue rxy = -0.35, podemos afirmar que existe una relacin
significativa entre las dos variables? ( = 0.01)
Para que exista una relacin estadsticamente significativa entre las variables,
tenemos que comprobar que en la poblacin de donde fue extrada la muestra, se
cumple que el coeficiente de correlacin entre las dos variables es distinto de cero.
Es decir:
H0: = 0
H1: 0
Suponiendo que las variables presentan una distribucin conjunta normal en la
poblacin, podemos utilizar como estadstico de contraste:
Puesto que T se distribuye segn t n-2, los valores crticos para la regin de rechazo
bilateral = 0.05, sern aproximadamente -2.6 y 2.6, por lo que podremos rechazar
la hiptesis nula.
En consecuencia, podemos afirmar que existe una relacin significativa entre las
variables rapidez y grado de correccin en la ejecucin de tareas escolares.
Tabla 4: Algunos estadsticos utilizados en contrastes paramtricos
ESTIMADOR
SUPUESTOS
DISTRIB.
1. 2 conocida
2. Muestra aleatoria
N(0, 1)
3. Poblacin normal
1. 2 desconocida
2. Muestra aleatoria
tn-1
3. Poblacin normal
S2n
1. Muestra aleatoria
2n-1
2. Poblacin normal
S2n-1
1. Muestra aleatoria
2. Poblacin normal
S12/S22
1. Poblaciones
normales
Fn1-1,n2-1
ESTADSTICO
2. Independencia
1. 12 y 22conocidas
2. Independencia
N(0, 1)
3. Poblaciones
Normales
1. 12 =
22desconocidas
2. Independencia
tn1+n2-2
3. Poblaciones
Normales
1. 12
22desconocidas
2. Independencia
3. Poblaciones
Normales
tg.1.
4. n1 y n2 pequeos
(30)
1. 12
22desconocidas
2. Independencia
3. Poblaciones
Normales
4. n1 y n2 pequeos
N(0, 1)
(>30)
5. Poblaciones
normales
tn-1
6. Datos apareados
1. Introduccin.
2. Contrastes para una muestra (prueba de Kolmogorov).
3. Contrastes para dos muestras (pruebas de Wilcoxon y Mann-Whitney).
4. Contrastes para k muestras independientes (pruebas de chi-2 y KruskalWallis).
5. Contrastes para k muestras relacionadas (pruebas de Cochran y Friedman).
INTRODUCCIN
A lo largo de las siguientes pginas estudiaremos algunas de las pruebas no
paramtricas de mayor uso en la investigacin educativa. Debemos recordar que
dichas pruebas han de emplearse cuando no se cumplen los denominados
supuestos paramtricos. Teniendo en cuenta los criterios de uso ms frecuente,
toda prueba o contraste es considerado no paramtrico si se da alguna de las
siguientes situaciones:
- Los datos a analizar estn medidos en una escala nominal u ordinal.
- Se utilizan datos medidos a nivel de intervalo o razn, pero la hiptesis formulada
no est referida a parmetros de las distribuciones poblacionales.
- El estadstico de contraste empleado no asume supuestos de la poblacin que han
de cumplirse.
- El tamao de la muestra es muy pequeo.
Estudiaremos distintas pruebas de contraste, en el caso de que analizamos los
datos de una muestra, de dos y de varias, ya sean independientes o relacionadas.
CONTRASTE DE UNA MUESTRA
En el caso de una muestra, estudiaremos las pruebas de bondad de ajuste, que
consisten en el contraste de hiptesis sobre la forma que presenta la distribucin de
y la terica.
- Valores crticos de la regin de rechazo
Estos valores se hallan en tablas ya construidas para la prueba de KolmorovSmirnov. Una de las tablas se puede encontrar en la obra de San Martn y Pardo
(1989: 549-550). La manera de interpretacin de dicha tabla es la siguiente:
conociendo el valor crtico para un nivel de significacin a, se trata de comparar el
valor de D observado con el valor crtico, y decidir as si se rechaza o no la
hiptesis nula.
[D]
Por lo tanto, el estadstico W se transforma en una puntuacin tpica y sigue una
distribucin normal con media de 0 y desviacin tpica de 1, y podremos obtener la
probabilidad asociada al mismo a partir de la tabla de valores de la distribucin
normal.
d) Teniendo T, se calcula U:
3. Para muestras con n>5, el estadstico H sigue la distribucin de chi cuadrado con
k-1 grados de libertad. En ese caso, si el valor observado de H es mayor o igual que
el valor crtico de chi cuadrado para un nivel de significacin concreto, se rechaza la
hiptesis nula a ese nivel de significacin.
El valor de H se ve afectado por el nmero de puntuaciones ligadas, es decir,
puntuaciones que tienen el mismo valor y que, por tanto, se le asigna el rango
promedio. Para corregir este efecto, se divide el valor de H por:
es la media de
se
de
es
de
PROBLEMAS RESUELTOS
Problema 1
Una Escala de Inteligencia, en la que pueden obtenerse valores de 0 a 8, arroja
puntuaciones que se distribuyen normalmente N(4,l). Para confirmarlo, pasamos la
Escala a una muestra de 10 sujetos, obteniendo los resultados que aparecen a
continuacin. Podemos decir que estos resultados confirman la distribucin normal
en la poblacin?
Puntuaciones: 1 4 6 5 3 2 5 6 4 7
Solucin 1
1. Hiptesis estadsticas:
Hiptesis nula: No existen diferencias entre la distribucin observada y la
distribucin normal.
H0: F(xi) = S(xi)
Hiptesis alternativa: Hay diferencias entre la distribucin observada y la
distribucin normal.
H1: F(xi) S(xi)
2. Estadstico de contraste
En este caso, el estadstico de contraste es D, definido como la diferencia mxima
entre la distribucin de proporciones observada y la terica. Por tanto, hay que
construir las distribuciones F(xi) y S(xi). Los resultados se presentan en la tabla
siguiente, en las que la primera columna corresponde a las puntuaciones de los
sujetos, la siguiente a las puntuaciones tpicas, y seguidamente, los valores de F(x i)
y S(xi). La ltima columna presenta la distancia entre F(x i) y S(xi).
xi
7
6
5
4
3
2
1
z
3
2
1
0
-1
-2
-3
F(xi)
0.9986
0.9972
0.8413
0.5000
0.1587
0.0228
0.0014
S(xi)
1.0000
0.9000
0.7000
0.5000
0.3000
0.2000
0.1000
/F(xi) - S(xi)/
0.0014
0.0972
0.1413
0.0000
0.1413
0.1772
0.0986
Problema 2
Un pedagogo desea probarla hiptesis de que el procedimiento psicolgico e
inductivo (trabajar ante ejemplos para, de ah, elevarse a la teora musical) es ms
eficaz que el lgico (primero la teora y luego las aplicaciones prcticas).
Como acta con dos grupos (A y B), selecciona a 10 sujetos del grupo A y otros 10
del B, emparejados en rendimiento musical previo, en actitud y en aptitudes
musicales. Decide al azar que en el A aplicar el procedimiento psicolgico y en el B
el lgico. Para la evaluacin de resultados utiliza un instrumento de medida que slo
denota que unas diferencias iguales entre los nmeros que no implican diferencias
idnticas en las cuantas de los atributos. Obtiene los siguientes datos (ficticios):
A
16
12
22
16
14
10
20
18
10
22
B
4
18
10
14
12
14
10
12
4
12
Puede afirmar que hay que diferencias entre los dos grupos? ( = 0.05)
Solucin 2
1. Hiptesis:
Hiptesis nula: El procedimiento psicolgico produce resultados inferiores o iguales
al procedimiento lgico.
Hiptesis alternativa: El procedimiento psicolgico produce resultados superiores al
procedimiento lgico.
2. Estadstico de contraste.
Para el clculo del estadstico W, deberemos calcular previamente las diferencias
entre las puntuaciones de los dos grupos. Estas diferencias o distancias quedan
recogidas en la tabla siguiente:
A
16
12
22
B
4
18
10
B-A
-12
6
-12
R(B-A)
9.5
5
9.5
R(+)
R(-)
9.5
5
9.5
16
14
10
20
18
10
22
14
12
14
10
12
4
12
-2
-2
4
-10
-6
-6
-10
1.5
1.5
3
7.5
5
5
7.5
1.5
1.5
3
7.5
5
5
7.5
Problema 3
Para determinar si la asistencia a un curso de ofimtica modifica el estilo cognitivo,
se seleccionan dos grupos de 10 alumnos, uno de los cuales sigui el curso (grupo
experimental) mientras que al otro no se le aplic ningn tratamiento (grupo control).
Tras la realizacin del curso, mediante una escala adecuada se medi el estilo
75 46
39 49
52 45 75
28 47 35
62 48
25 69
85
34
63
67
84
32
Solucin 3
Ya en el enunciado del problema, se nos dice que los datos son siguen
una distribucin normal por lo que utilizaremos un contraste no
paramtrico. Al tratarse de dos muestras independientes, la prueba ms
adecuada es la prueba de Mann-Whitney. Las hiptesis que vamos a
contrastar son:
H0: No existen diferencias entre el grupo experimental y el grupo control.
H1: Existen diferencias significativas entre el grupo experimental y el grupo
control.
Fijamos un nivel de significacin (0.05) y calculamos los estadsticos T y
U:
X
25
28
32
34
35
39
45
46
47
48
49
52
62
63
Rango
1
2
3
4
5
6
7*
8*
9
10*
11
12*
13*
14*
67
69
75
84
85
15
16
17.5*
19*
20*
Problema 4
En el marco de un estudio sobre las perspectivas de empleo en las mujeres se
recogen datos acerca de la situacin laboral de una muestra aleatoria formada por
89 mujeres y 71 hombres. Podemos afirmar con una confianza del 98% que la
situacin laboral de hombres y mujeres es distinta?
Mujeres
Hombres
Empleados
25
35
Subempleados
18
15
En paro
46
21
Solucin 4
Puesto que los datos nos vienen dados en forman de frecuencias, la
prueba ms adecuada en este caso es la prueba de chi cuadrado.
Tendremos que comparar las frecuencias observadas, recogidas en el
estudio, con las frecuencias que cabra esperar bajo el supuesto de que
no hubieran diferencias ente las proporciones de las dos muestras. Estas
frecuencias esperadas se calculan como el producto de las frecuencias
marginales dividido por el total de sujetos. A continuacin se reflejan las
frecuencias esperadas:
Empleado Subempleado
s
s
Mujeres
33.38
18.36
Hombres
26.63
14.64
En
paro
37.27
29.73
[D]
El estadstico de contraste chi cuadrado se distribuye segn (s-l)(k-l)
grados de libertad, siendo s y k respectivamente el nmero de filas y
columnas de la tabla de contingencia. Consultando la tabla
correspondiente, comprobamos que el valor crtico para a = 0.02 y para
(2-1) y (3-1) grados de libertad es
0.9822 = 7.824
Por tanto, dado que el valor observado es mayor que el valor crtico, y
queda incluido en la regin de rechazo, podemos rechazar la hiptesis
nula con una confianza del 98%. En consecuencia, podemos afirmar que
Problema 5
Hemos recogido el tamao de los centros acogidos a tres programas de
experimentacin, que cuentan con la participacin de 4, 3 y 4 centros
respectivamente. Si el nmero de unidades de cada uno de estos centros es el que
se muestran a continuacin, podemos afirmar que el tamao no marca diferencias
entre los centros implicados en los tres programas? ( = 0.05)
Programa A
20
19
16
21
Programa B
24
22
28
Programa C
23
15
18
26
Solucin 5
Dado que el nmero de casos es muy pequeo, la prueba idnea ser una prueba
no parmetrica. Puesto que tenemos que tres muestras cuyos datos no se
encuentran relacionados, la prueba a utilizar ser la de Kruskal-Wallis. Las hiptesis
a contrastar son las siguientes:
H0: No existen diferencias entre los k grupos.
H1: Existen diferencias significativas entre los k grupos.
Para calcular el estadstico de contraste, debemos ordenar las puntuaciones, como
si fueran una sola muestra:
Programa A
5
4
2
6
Programa B
9
7
11
Programa C
8
1
3
10
[D]
Sustituyendo, obtenemos que U es:
[D]
Buscamos en la tabla correspondiente la probabilidad asociada para n 1 = 4, n2 = 3 y
n3 = 4, y encontramos que es 0.102. Por tanto, no podemos rechazar la hiptesis
nula, puesto que la probabilidad observada es mayor que nuestro nivel de
significacin (0.05).
Problema 6
Se pretende estudiar si determinados factores inciden de distinto modo en no
presentarse a los exmenes parciales de una asignatura. Se eligen aleatoriamente
7 sujetos matriculados, registrando para ellos la presencia o ausencia de faltas de
asistencia reiteradas (factor A), el cumplimiento o incumplimiento de tareas (factor
B) y la asistencia o no a tutoras (factor C). Todos estos aspectos son codificados
con 1 en el caso positivo y 0 en el negativo. Podemos afirmar con una confianza
del 98% que los tres factores estn presentes de modo diferente en los alumnos
que no se presentaron a los exmenes parciales?
Solucin 6
En este problema, las muestras estn formadas por puntuaciones apareadas o
relacionadas de carcter dicotmico, por lo tanto, la prueba apropiada es la de
Cochran. El primer paso ser formular las hiptesis:
Factor B
0
0
0
0
1
0
1
2
Factor C
0
0
1
1
1
1
0
4
Li
1
1
1
2
3
2
1
11
Li2
1
1
1
4
9
4
1
21
[D]
[D]
El estadstico Q sigue una distribucin de chi cuadrado con k-1 grados de libertad.
Por lo tanto, el valor crtico que delimita la regin de rechazo ser
0.9822 = 7.824
Problema 7
La asociacin de padres de un centro convoca sucesivamente tres reuniones
dirigidas a los padres de alumnos de un mismo grupo o clase, en las que se
abordaron respectivamente temas relacionados con el apoyo de la familia al estudio
(Tema A), el juego y el tiempo libre de los nios (Tema B), y la participacin de los
padres en el centro (Tema C). Si contamos los datos de asistencia a cada una de
las tres reuniones para los padres de alumnos de 6 clases, podemos afirmar que
los tres temas atrajeron de modo distinto a los convocados? ( = 0.05)
Tema A Tema B Tema C
3
2
1
3
2
1
3
1
2
2
3
1
3
2
1
3
2
1
Solucin 7
Dado que el nmero de sujetos es pequeo, deberemos utilizar una prueba no
paramtrica, y puesto que los casos se hayan relacionados, la prueba ms idnea
es el anlisis de la varianza de dos clasificaciones por rangos de Friedman. En
primer lugar, plantearemos las hiptesis:
H0: No existen diferencias entre en la atraccin a los tres temas.
H1: Existen diferencias significativas entre en la atraccin a los tres temas.
El estadstico de contraste que emplearemos ser:
[D]
Por lo tanto, calcularemos la suma de rangos para cada columna:
Tema A Tema B Tema C
3
2
1
3
3
2
3
3
2
1
3
2
2
1
2
1
1
1
RA = 17, RB = 12 y RC = 7. Sustituyendo:
[D]
Comparamos el valor observado con el que nos ofrece la tabla, teniendo en cuenta
que X2 sigue una distribucin de chi cuadrado con k-1 grados de libertad. Por tanto,
el valor crtico ser
0.9522 = 5.991
Puesto que el valor observado es mayor que el crtico, aqul entra en la regin de
rechazo, por lo que podemos rechazar con una confianza del 95% que existen
diferencias significativas en cuanto a la atraccin a los distintos temas.
n = 1000
x = 25
Donde:
x = ocurrencias
n = observaciones
= proporcin de la muestra
= proporcin propuesta
Solucin:
a)
a = 0,01
H0 es aceptada, ya que zprueba (-0,93) es menor que ztabla (2,326), por lo que no
es cierto que ms del 3% de la poblacin no conoce el nuevo producto.
En Excel
b)
a = 0,01
H0 es rechazada, ya que zprueba (1,13) es menor que ztabla (2,326), por lo que es
cierto que menos del 2% de la poblacin no conoce el nuevo producto.
2) Cuando las ventas medias, por establecimiento autorizado, de una marca de
relojes caen por debajo de las 170,000 unidades mensuales, se considera razn
suficiente para lanzar una campaa publicitaria que active las ventas de esta marca.
Para conocer la evolucin de las ventas, el departamento de marketing realiza
una encuesta a 51 establecimientos autorizados, seleccionados aleatoriamente, que
facilitan la cifra de ventas del ltimo mes en relojes de esta marca. A partir de estas
cifras se obtienen los siguientes resultados: media = 169.411,8 unidades.,
desviacin estndar = 32.827,5 unidades. Suponiendo que las ventas mensuales
por establecimiento se distribuyen normalmente; con un nivel de significacin del 5
% y en vista a la situacin reflejada en los datos. Se considerar oportuno lanzar
una nueva campaa publicitaria?
Datos:
n = 51
Solucin:
H0: ( = 170000
H1: ( < 170000
a = 0,05
Se rechaza Ho, porque zprueba (-0,12) es menor que ztabla (1,645), por lo tanto se
acepta H1: ( < 170000, y se debe considerar oportuno lanzar una nueva campaa
publicitaria.
En Excel
n=8
Solucin:
H0: ( = 40
H1: ( > 40
H0 es aceptada, ya que tprueba (2,83) es menor que ttabla (3,499), por lo que no es
acertado pensar que estn realizando un nmero de visitas promedio superior a 40.
En Excel
n = 64
a = 5% = 0,05
Solucin:
H0: ( = 22
H1: ( > 22
a = 0,05
Se rechaza Ho, porque zprueba (4) es mayor que ztabla (1,645), por lo tanto el
tiempo que los nios de tres a cinco aos dedican a ver la televisin es mayor de 22
horas, lo que implica que la empresa de investigacin de mercados tiene la razn.
En Excel
Donde
31
1,604
28,2 2,351
30
0,071
Total 4,026
Varianza de las medias aritmticas
Planteamiento de hiptesis
H0: Todas las proporciones de la poblacin son iguales.
H1: No todas las proporciones de la poblacin son iguales.
F tabla
Grados de libertad:
Numerador: k-1 = 3-1 =2
Denominador: k(n-1) = 3(5-1) =12
Donde
45,8 1,604
45
0,218
42,8 3,004
Total 4,827
Varianza de las medias aritmticas
Planteamiento de hiptesis
H0: Todas las proporciones de la poblacin son iguales.
H1: No todas las proporciones de la poblacin son iguales.
F tabla
Grados de libertad:
Numerador: k-1 = 3-1 =2
Denominador: k(n-1) = 3(5-1) =12
Nivel de significacin del 1%
Donde
30
0,071
30,4 0,444
28,8 0,871
Total 1,387
Varianza de las medias aritmticas
Planteamiento de hiptesis
F tabla
Grados de libertad:
Numerador: k-1 = 3-1 =2
Denominador: k(n-1) = 3(5-1) =12
Nivel de significacin del 1%
Donde
45,2 0,444
44,2 0,111
44,2 0,111
Total 0,667
Varianza de las medias aritmticas
Planteamiento de hiptesis
H0: Todas las proporciones de la poblacin son iguales.
H1: No todas las proporciones de la poblacin son iguales.
F tabla
Grados de libertad:
Numerador: k-1 = 3-1 =2
Denominador: k(n-1) = 3(5-1) =12
Nivel de significacin del 1%
B:
C: