Вы находитесь на странице: 1из 32

UTALCA

UNIVERSIDAD DE TALCA
INSTITUTO DE MATEMTICAS Y FSICA

LABORATORIO SPSS.
TEST DE HIPTESIS.
Octubre del 2015.

Prof.: Juan Barrera A.

PRIMERA PARTE:
Objetivo:
Resolver Test de Hiptesis e Intervalos de Confianza para la media poblacional

Contenido:
Activar SPSS 14.0 (versin existente en la Universidad de Talca).

En un curso de Estadstica se desea investigar si la nota media obtenida en la segunda


prueba parcial es diferente de 4,5. Concluya usando un nivel de significacin del 5%.
Para lo anterior, se tiene la siguiente muestra aleatoria de las notas obtenidas en la
segunda prueba parcial:
1,9 2,7 3,1 4,4 4,2 4,5 5,2 6,4 2,0 1,8 3,3 5,4 3,8 2,6 5,0

Solucin:

En SPSS, debemos seleccionar Introducir datos, Aceptar:

Los datos deben ser ingresados de la siguiente manera:

A la variable nota obtenida en la segunda prueba parcial la llamaremos NOTA.

En primer lugar, debemos construir un histograma para observar la variable NOTA.

3,0

2,5

Frecuencia

2,0

1,5

1,0

0,5

Media =3,753
Desviacin tpica =1,
4126
N =15
0,0
1,0

2,0

3,0

4,0

5,0

6,0

7,0

NOTA

Editando el grfico, se obtiene lo siguiente:

3,0

Nmero de Estudiantes

2,5

2,0

1,5

1,0

0,5

0,0
1,0

2,0

3,0

4,0

NOTA

5,0

6,0

7,0

Haciendo doble clic en el interior de las barras del histograma, aparece la ventana de
Propiedades.
Seleccione Ver la curva normal, luego Aplicar.

3,0

Nmero de Estudiantes

2,5

2,0

1,5

1,0

0,5

0,0
1,0

2,0

3,0

4,0

5,0

6,0

7,0

NOTA

En el grfico anterior, es posible observar que la distribucin de la NOTA se ajusta a una


curva Normal.
Sean X: nota obtenida por un estudiante en la segunda prueba parcial.
Segn el histograma, podemos mencionar que XNormal(,).

Por otra parte, en SPSS existen dos pruebas de hiptesis para probar si un determinado
grupo de datos se ajusta a una distribucin Normal:
Prueba de Kolmogorov-Smirnov y Prueba de Shapiro-Wilk.
El test de Kolmogorov-Smirnov es un test clsico y conocido. El test de Shapiro-Wilk es
ms nuevo y recomendado para tamaos muestrales mayores a 50. En todo caso, se
espera que las conclusiones con cualquiera de los dos test sean las mismas.
En ambos test, la hiptesis a plantear es como sigue:
H0: La respuesta del grupo tratamiento i distribuye Normal.
H1: La respuesta del grupo tratamiento i no distribuye Normal.
Por lo tanto, si el valor_p del correspondiente test es mayor que el nivel de significacin ,
aceptamos la hiptesis nula y concluimos que se cumple el supuesto de Normalidad.
En nuestro ejemplo:
H0: La nota obtenida en la segunda prueba parcial distribuye Normal.
H1: La nota obtenida en la segunda prueba parcial no distribuye Normal.

En SPSS para generar los pasos de la prueba de Normalidad:


Analizar > Estadsticos descriptivos > Explorar

SPSS desplegar la siguiente ventana:


En Ventana Explorar, en Dependientes seleccione la variable NOTA, luego seleccione la
opcin Grficos.

SPSS despliega la siguiente ventana:


En Explorar: Grficos, seleccione Grficos con pruebas de normalidad, Continuar.

Aceptar.
SPSS muestra la siguiente salida:
Pruebas de normalidad
a

NOTA

Kolmogorov-Smirnov
Estadstico
gl
Sig.
,105
15
,200*

Estadstico
,958

Shapiro-Wilk
gl
15

Sig.
,651

*. Este es un lmite inferior de la significacin verdadera.


a. Correccin de la significacin de Lilliefors

Como el tamao de muestra es 15, observamos el resultado proporcionado por la prueba


de Kolmogorov-Smirnov: valor_p=0,200. Es decir, con un nivel de significacin de 0,05
(5%), no se rechaza H0, es decir, la nota obtenida en la segunda prueba parcial distribuye
Normal.
Segn la prueba de Normalidad, podemos mencionar que XNormal(,).
Debemos plantear la siguiente hiptesis:

H : = 4,5
H : 4,5

En SPSS, debemos aplicar las siguientes instrucciones:


Analizar > Comparar medias > Prueba T para una muestra

SPSS desplegar la siguiente ventana de Prueba T para una muestra:

En Contrastar variables: seleccione la variable NOTA. Luego en Valor de prueba:


escriba 4,5, siendo ste el valor histrico. Luego, Aceptar.
SPSS entrega los siguientes resultados:

Estadsticos para una muestra


N
NOTA

15

Media
3,753

Desviacin
tp.
1,4126

Error tp. de
la media
,3647

La salida anterior, muestra algunos datos descriptivos tales como, la nota promedio es de
3,753 y una desviacin estndar muestral de 1,4126. El total de observaciones es de 15
estudiantes.
Adems, proporciona el siguiente cuadro:
Prueba para una muestra
Valor de prueba = 4.5

NOTA

t
-2,047

gl
14

Sig. (bilateral)
,060

Diferencia
de medias
-,7467

95% Intervalo de
confianza para la
diferencia
Inferior
Superior
-1,529
,036

Editando en el SPSS:
Prueba para una muestra
Valor de prueba = 4.5

NOTA

t
-2,047

gl
14

Sig. (bilateral)
,060

Ac se obtiene que el valor_p es 0,060 (es decir, 6%), es decir, para un nivel de
significacin del 5%, no se rechaza H0, es decir, no es posible afirmar que, la media de la
nota de estos alumnos difiera de 4,5.

Pero, como la nota promedio es de 3,753, siendo inferior a


hiptesis:

=4,5, podemos verificar la

H : = 4,5
H : < 4,5
El valor_p est dado por (0,060/2)=0,03 (3%), es decir, para un nivel de significacin del
5%, se rechaza H0, es decir, es posible afirmar que, la media de la nota de la segunda
prueba parcial es inferior a 4,5.

Observacin:
El valor_p proporcionado por el SPSS corresponde a una hiptesis del tipo bilateral, luego,
cuando se plantea una hiptesis unilateral adecuada, el valor_p corresponde a la mitad del
proporcionado por el SPSS.

Construya un intervalo de confianza del 95% para estimar la nota media en la segunda
prueba parcial de los estudiantes del curso de Estadstica.
Solucin:
En SPSS:

En la ventana anterior, para construir intervalos de confianza debemos dejar en 0 el


Valor de prueba. Despus de Aceptar, SPSS muestra la siguiente salida:

Estadsticos para una muestra


N
NOTA

15

Media
3,753

Desviacin
tp.
1,4126

Error tp. de
la media
,3647

Prueba para una muestra


Valor de prueba = 0

NOTA

t
10,290

gl
14

Sig. (bilateral)
,000

Diferencia
de medias
3,7533

95% Intervalo de
confianza para la
diferencia
Inferior
Superior
2,971
4,536

Editando la salida anterior:


Prueba para una muestra

NOTA

Valor de prueba = 0
95% Intervalo de
confianza para la
diferencia
gl
Inferior
Superior
14
2,971
4,536

De la salida anterior:

2,971 4,536
Mediante un intervalo del 95% de confianza, es posible afirmar que, la nota media de los
estudiantes en la segunda prueba parcial se encuentra entre 2,971 y 4,536.

Si deseamos cambiar la confianza al 90%, en Opciones del SPSS muestra la siguiente


ventana:

Cambiamos el valor del 95 (que aparece por defecto) por el nuevo valor 90:

Despus de Continuar y Aceptar, SPSS muestra la siguiente salida:


Prueba para una muestra
Valor de prueba = 0

NOTA

t
10,290

gl
14

Sig. (bilateral)
,000

Diferencia
de medias
3,7533

90% Intervalo de
confianza para la
diferencia
Inferior
Superior
3,111
4,396

Editando la salida anterior:


Prueba para una muestra

NOTA

Valor de prueba = 0
90% Intervalo de
confianza para la
diferencia
gl
Inferior
Superior
14
3,111
4,396

De la salida anterior:

3,111 4,396
Mediante un intervalo del 90% de confianza, es posible afirmar que, la nota media de los
estudiantes en la segunda prueba parcial se encuentra entre 3,111 y 4,396.

SEGUNDA PARTE:
Objetivo:
Resolver Test de Hiptesis para la diferencia de medias poblacionales
independientes.

1-2 en muestras

En un curso de Estadstica, se desea probar si existe una diferencia significativa en la


media de las notas obtenidas por los estudiantes en la cuarta prueba parcial entre las
secciones A y B. Concluya usando un nivel de significacin del 5%.
Para probar lo anterior, se tiene la siguiente muestra aleatoria:
Nota obtenida en la cuarta prueba parcial
Seccin A
Seccin B
6,8
3,3
2,3
5,3
4,0
6,6
4,2
3,1
2,1
5,4
4,2
1,8
5,2
2,2
5,5
6,4
2,0
5,6
3,1
1,9
4,8
3,8
3,5
4,0
1,2
2,8
6,6
6,0
5,6
4,2

Solucin:

En SPSS, debemos seleccionar Introducir datos, Aceptar:

Los datos deben ser ingresados de la siguiente manera:

En la columna de SECCION, el 1 representa a un estudiante de la seccin A y el 2


representa a un estudiante de la seccin B.

En Vista de Variables, en la columna Valores, seleccione la fila asociada a la variable


SECCION. Esto es para que en las salidas del SPSS muestre los resultados respectivos para
la seccin A y B (para que no muestre seccin 1 y 2).

En la ventana de Etiquetas de valor, en Valor escriba 1 y en Etiqueta escriba A, luego


Aadir, posteriormente, en Valor escriba 2 y en Etiqueta escriba B, luego Aadir,
Aceptar.

Ahora, realizaremos la prueba de normalidad para cada grupo:


En SPSS, Analizar > Estadsticos descriptivos > Explorar

En ventana Explorar, en Dependientes ingrese NOTA, y en Factores ingrese SECCION,


luego seleccione Grficos.

En ventana Explorar: Grficos, seleccione Grficos con pruebas de normalidad,


Continuar.

Luego, SPSS proporciona la siguiente salida:


Pruebas de normalidad
a

NOTA

SECCION
A
B

Kolmogorov-Smirnov
Estadstico
gl
Sig.
,119
14
,200*
,178
16
,185

Shapiro-Wilk
Estadstico
gl
,967
14
,932
16

Sig.
,830
,260

*. Este es un lmite inferior de la significacin verdadera.


a. Correccin de la significacin de Lilliefors

La prueba de normalidad a plantear es la siguiente:


H0: La nota obtenida por un estudiante de la seccin A distribuye Normal.
H1: La nota obtenida por un estudiante de la seccin A no distribuye Normal.
Como el tamao de la muestra de la seccin A corresponde a 14 estudiantes,
consideramos la prueba de Kolmogorov-Smirnov, en donde se tiene un valor_p=0,200. Es
decir, usando un nivel de significacin del 5%, no se rechaza H0, por lo tanto, la nota
obtenida en la cuarta prueba parcial por los estudiantes de la seccin A distribuye Normal.
H0: La nota obtenida por un estudiante de la seccin B distribuye Normal.
H1: La nota obtenida por un estudiante de la seccin B no distribuye Normal.
Como el tamao de la muestra de la seccin B corresponde a 16 estudiantes,
consideramos la prueba de Kolmogorov-Smirnov, en donde se tiene un valor_p=0,185. Es
decir, usando un nivel de significacin del 5%, no se rechaza H0, por lo tanto, la nota
obtenida en la cuarta prueba parcial por los estudiantes de la seccin B distribuye Normal.
Luego, se cumple el supuesto de Normalidad en ambos grupos.

La hiptesis a plantear para verificar si en trmino medio existe una diferencia significativa
en la nota obtenida entre las secciones A y B, es la siguiente:

H :   = 0
H :   0
Para resolver esta hiptesis, en SPSS, Analizar > Comparar medias > Prueba T para
muestras independientes

En ventana Prueba T para muestras independientes, en Contrastar variables


seleccionamos NOTA, y en Variable de agrupacin seleccionamos SECCION. Luego,
debemos seleccionar Definir grupos

En ventana Definir grupos, en Usar valores especificados, en Grupo 1 escribimos 1


(asociado a la seccin A), y en Grupo 2 escribimos 2 (asociado a la seccin B).
Continuar.

Luego de Aceptar, SPSS proporciona las siguientes salidas:


Estadsticos de grupo

NOTA

SECCION
A
B

N
14
16

Media
3,964
4,250

Desviacin
tp.
1,7185
1,6248

Error tp. de
la media
,4593
,4062

De la salida anterior, observamos que la nota promedio de los 14 estudiantes de la seccin


A es 3,964, la que es inferior a la de seccin B que corresponde a 4,25. En cambio, la
dispersin de las notas de la seccin B es 1,6248, la cual es inferior a la de la seccin A
que es 1,7185.

SPSS tambin muestra la siguiente salida:


Prueba de muestras independientes
Prueba de Levene
para la igualdad de
varianzas

F
NOTA

Se han asumido
varianzas iguales
No se han asumido
varianzas iguales

Prueba T para la igualdad de medias

Sig.

,006

,939

gl

Sig. (bilateral)

Diferencia
de medias

Error tp. de
la diferencia

95% Intervalo de
confianza para la
diferencia
Inferior
Superior

-,468

28

,644

-,2857

,6108

-1,5368

,9654

-,466

26,983

,645

-,2857

,6131

-1,5438

,9724

Pero estamos resolviendo un test de hiptesis para la diferencia de medias, en donde cada
X distribuye Normal con desviacin poblacional desconocida. Es decir, debemos probar si
las varianzas poblacionales las podemos asumir iguales distintas, para esto debemos
plantear la siguiente hiptesis:

H :  = 
H :  
El programa SPSS realiza un test para verificar si las varianzas poblacionales son iguales
diferentes (Test de Levene). Si el valor_p es mayor al nivel de significacin se acepta H0
de que las varianzas poblacionales son iguales, en caso contrario, si el valor_p es menor al
nivel de significacin se rechaza H0, y en este caso diremos que las varianzas
poblacionales son distintas.

Prueba de muestras independientes


Prueba de Levene
para la igualdad de
varianzas

F
NOTA

Se han asumido
varianzas iguales
No se han asumido
varianzas iguales

,006

Sig.
,939

Prueba T para la igualdad de medias

gl

Sig. (bilateral)

-,468

28

,644

-,466

26,983

,645

En nuestro ejemplo, en la salida anterior, observamos la Prueba de Levene que el


valor_p=0,939, es decir, con un nivel de significacin del 5%, no se rechaza H0, es decir,
podemos concluir que las varianzas poblacionales con iguales.

Ahora podremos concluir nuestra hiptesis de inters:

H :   = 0
H :   0
Prueba de muestras independientes
Prueba de Levene
para la igualdad de
varianzas

F
NOTA

Se han asumido
varianzas iguales
No se han asumido
varianzas iguales

En la salida
prueba t de
se rechaza
significativa
la seccin A

,006

Sig.
,939

Prueba T para la igualdad de medias

gl

Sig. (bilateral)

-,468

28

,644

-,466

26,983

,645

anterior, como sabemos, se asumen varianzas iguales, observamos que en la


Student el valor_p=0,644, es decir, con un nivel de significacin del 5%, no
H0, es decir, no existe evidencia para afirmar que hay una diferencia
en la nota media obtenida en la cuarta prueba parcial entre los estudiantes de
y B.

Observacin:
Si en la Prueba de Levene encontramos evidencia para rechazar H0, es decir, las varianzas
poblacionales son distintas, en la prueba t de Student para la diferencia de medias,
debemos considerar el valor_p=0,645.
Observacin:
El valor_p proporcionado por el SPSS corresponde a una hiptesis del tipo bilateral, luego,
cuando se plantea una hiptesis unilateral adecuada, el valor_p corresponde a la mitad del
proporcionado por el SPSS.

TERCERA PARTE:
Objetivo:
Resolver Test de Hiptesis e Intervalos de Confianza para la diferencia de medias pareadas
D en muestras dependientes.

Se desea investigar si los alumnos del curso de Estadstica, que rindieron la tercera
prueba parcial y la tercera prueba recuperativa obtuvieron en trmino medio una diferencia
significativa en sus resultados. Concluya usando un nivel de significacin del 5%. Para
probar la hiptesis, se tiene la siguiente muestra aleatoria:
Estudiante
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

Nota Prueba Parcial


2,4
3,5
3,4
3,1
3,4
3,2
3,7
3,2
3,7
3,2
3,3
1,6
3,2
1,0
1,0

Nota Prueba Recuperativa


4,2
4,4
5,0
4,6
4,2
4,6
4,6
4,2
4,4
3,8
4,0
4,2
3,8
2,4
2,8

Solucin:
Sean XP: nota obtenida por un estudiante en la tercera prueba parcial.
XR: nota obtenida por un estudiante en la tercera prueba recuperativa.
Sea d=XP-XR
Debemos plantear la siguiente hiptesis:

H :  = 0
H :  0

En SPSS, debemos seleccionar Introducir datos, Aceptar:

Los datos deben ser ingresados de la siguiente manera:

A la variable nota obtenida en la prueba parcial la llamaremos Parcial, y a la variable nota


obtenida en la prueba recuperativa la llamaremos Recuperativa.

En SPSS, para resolver la hiptesis planteada, debemos seleccionar Analizar > Comparar
medias > Prueba T para muestras relacionadas

SPSS mostrar la siguiente ventana, en la cual seleccionaremos nuestras dos variables de


inters:

Manteniendo la definicin inicial para la variable d (d=XP-XR), en Variables relacionadas


se observa la diferencia de Parcial Recuperativa, luego, Aceptar.

SPSS mostrar las siguientes salidas:


Estadsticos de muestras relacionadas

Par 1

Parcial
Recuperativa

Media
2,86
4,08

N
15
15

Desviacin
tp.
,919
,684

Error tp. de
la media
,237
,177

Prueba de muestras relacionadas


Diferencias relacionadas

Par 1

Parcial - Recuperativa

Media
-1,220

Desviacin
tp.
,573

Error tp. de
la media
,148

95% Intervalo de
confianza para la
diferencia
Inferior
Superior
-1,538
-,902

t
-8,240

gl
14

Sig. (bilateral)
,000

De sta ltima salida, es posible obtener un valor_p=0,000, es decir, para cualquier nivel
de significacin ser posible concluir que existe una diferencia significativa entre las notas
medias de la tercera prueba parcial y de la tercera prueba recuperativa.

De sta ltima salida, tambin es posible obtener un intervalo de confianza del 95% para
la diferencia de medias pareadas, dada por el siguiente resultado:

1,538  0,902
Mediante un intervalo del 95% de confianza, es posible afirmar que, en trmino medio, la
nota obtenida en la tercera prueba recuperativa supera a la nota obtenida en la tercera
prueba parcial.

Si se desea cambiar el nivel de confianza a un 90%:

En ventana Prueba T para muestras relacionadas, debemos seleccionar Opciones


En la nueva ventana Prueba T para muestras relacionadas: Opciones, en Intervalo
de confianza: es posible cambiar al nivel deseado. Continuar.

La nueva salida proporcionada estar dada por:


Prueba de muestras relacionadas

Par 1

Parcial - Recuperativa

Media
-1,220

Diferencias relacionadas
90% Intervalo de
confianza para la
diferencia
Desviacin
tp.
Inferior
Superior
,573
-1,481
-,959

De sta ltima salida, es posible obtener un intervalo de confianza del 90% para la
diferencia de medias pareadas, dada por el siguiente resultado:

1,481  0,959
Mediante un intervalo del 90% de confianza, es posible afirmar que, en trmino medio, la
nota obtenida en la tercera prueba recuperativa supera a la nota obtenida en la tercera
prueba parcial.

Вам также может понравиться