Академический Документы
Профессиональный Документы
Культура Документы
1. La siguiente tabla nos muestra la edad de 16 clientes que compraron un determinado producto en
una semana determinada. La variable edad es cuantitativa y mostramos sus valores, la variable sexo
es cualitativa y utilizamos una variable numrica (escala nominal: 1, hombre; 2, mujer). Los datos
son los siguientes:
Hombres
32
32
42
55
37
61
48 43
Mujeres
50
80
61
49
30
21
37
34
Se pide:
a. Crea un archivo con la definicin anterior de las variables y los datos y gurdalo con el nombre
Edad.sav
b. Crea una nueva variable denominada Unidades compradas y dale los siguientes valores
Hombres
Mujeres
REGION DE
MESES COMO
INGRESOS
PROCEDENCIA
REPRESENTANTE
MENSUALES en
Hombre
Andaluca (1)
60
1950
Mujer
Catalua (2)
72
1235
Mujer
Madrid (3)
48
2251
Hombre
36
3581
Mujer
Galicia (5)
60
1500
Mujer
Catalua (2)
24
2500
Hombre
36
5890
Hombre
Andaluca (1)
48
3510
Hombre
Madrid (3)
84
2456
Mujer
Andaluca (1)
84
2474
Hombre
48
3000
Mujer
Madrid (3)
36
2958
Mujer
Galicia (5)
24
1354
Hombre
Catalua (2)
12
1100
Hombre
Andaluca (1)
16
3581
Hombre
Galicia (5)
10
2456
Se pide:
a. Crear un archivo de datos con el nombre Representantes, en el que debes incluir los datos de la
tabla anterior, definiendo las variables de forma adecuada.
b. Inserta un nuevo caso entre los existentes con estos valores:
SEXO
Hombre
REGION DE
MESES COMO
INGRESOS
PROCEDENCIA
REPRESENTANTE
MENSUALES en
Catalua
48
1500
c. Inserta una nueva variable que ser el estado civil de los representantes con los siguientes
valores.
soltero
soltero
casado
soltero
divorciado
casado
casado
casado
soltero
soltero
viudo
casado
casado
casado
soltero
soltero
divorciado
d.
Obtenga el nmero medio de meses como representante y los valores mximo, mnimo y
CONTRASTES PARAMTRICOS
En SPSS, los contrastes paramtricos que se pueden estudiar son aquellos que en las hiptesis hacen
referencia a la media de una poblacin normal, cuando tenemos una muestra, dos independientes, o
dos relacionadas. Se denominan prueba T, y nosotros estudiaremos:
Analizar/Comparar medias/Medias
Este procedimiento calcula los estadsticos: media, desviacin tpica, varianza, suma y
nmero de individuos, para una o ms variables (Dependientes), para los distintos valores,
niveles o categoras de una o ms variables (Independientes). Dentro de los cuadros de
variables Dependientes e Independientes podemos insertar una o ms variables. En
Opciones, podemos dejar por defecto: media, desviacin tpica y n de casos, o seleccionar
otros.
N
Ingresos mensuales
* Sexo
Ingresos mensuales
* Estado civil
Incluidos
Porcentaje
Casos
Excluidos
N
Porcentaje
Total
Porcentaje
17
100,0%
,0%
17
100,0%
17
100,0%
,0%
17
100,0%
Media
2902,40
2038,86
2546,82
N
10
7
17
Desv. tp.
1364,08
670,50
1186,23
Media
2794,71
1500,00
2533,29
3000,00
2546,82
N
7
2
7
1
17
Desv. tp.
1604,64
,00
840,30
,
1186,23
cambiar el nivel de confianza (por defecto es del 95%) con el que se desea obtener el intervalo
de confianza para la diferencia entre la media muestral y la media poblacional (valor de
prueba).
Optar por dos formas diferentes de tratar los casos de valores perdidos:
o Excluir casos segn anlisis. Esta opcin excluye del anlisis (de cada prueba T) los casos
con valor perdido en la variable concreta que se est contrastando.
o Excluir casos segn lista. Esta opcin excluye de todos los anlisis los casos con algn
valor perdido en una cualquiera de las variables seleccionadas en la lista Contrastar variables.
Tabla 1
Estadsticos para una muestra
N
Ingresos mensuales
17
Media
2546,82
Desviacin
tp.
1186,23
Error tp. de
la media
287,70
Tabla 2
Prueba para una muestra
Valor de prueba = 2500
t
Ingresos mensuales
gl
,163
16
Sig. (bilateral)
,873
Diferencia
de medias
46,82
95% Intervalo de
confianza para la
diferencia
Inferior
Superior
-563,08
656,73
Notas:
t16;0975=212.
( 46 '82 [ 2 '12 287 '7] , 46 '82 + [ 2 '12 287 '7]) = ( 563'08 , 656 '73) , salvo errores de redondeo.
Intervalo de confianza para la media : ( 2500 563'08 , 2500 + 656 '73)
Con este procedimiento se quiere comprobar si las medias poblacionales de dos poblaciones
normales e independientes son iguales o no ( H 0 : x = y )
Para contrastar esta hiptesis existen distintos estadsticos segn las varianzas poblacionales sean
iguales o no, esto se estudia con la prueba de Levene, cuyo estadstico sigue una distribucin F-
Dicha variable aparecer seguida de dos interrogantes, para que definamos los grupos de la variable
que queremos que realice. Para ello pulsamos el botn Definir grupos. Hay dos opciones
excluyentes:
Usar valores especificados. Tendremos que escribir un valor para el grupo 1 y otro para
el 2. Los casos con otros valores quedan excluidos del anlisis.
Punto de Corte. Podemos escribir un nmero que divida los valores de la variable de
agrupacin en dos conjuntos.
En Opciones se puede:
Cambiar el nivel de confianza (por defecto es del 95%) con el que se desea obtener el
casos con valor perdido en la variable agrupacin o en la variable concreta que se est
contrastando en ese anlisis.
o Excluir casos segn lista. Esta opcin excluye de todos los anlisis los casos con
mensuales medios para los hombres y las mujeres son iguales o no.
Tabla 1
Estadsticos de grupo
Ingresos mensuales
Sexo
hombre
mujer
N
10
7
Media
2902,40
2038,86
Desviacin
tp.
1364,08
670,50
Error tp. de
la media
431,36
253,42
Tabla 2
Prueba de muestras independientes
Prueba de Levene
para la igualdad de
varianzas
F
Ingresos mensuales
Se han asumido
varianzas iguales
No se han asumido
varianzas iguales
Nota:
t=
863'54
= 1'539
561'08
t=
863'54
= 1'726
500 '30
1,662
Sig.
,217
gl
Sig. (bilateral)
Diferencia
de medias
Error tp. de
la diferencia
95% Intervalo de
confianza para la
diferencia
Inferior
Superior
1,539
15
,145
863,54
561,08
-332,36
2059,45
1,726
13,816
,107
863,54
500,30
-210,83
1937,91
La prueba T para dos muestras relacionadas permite contrastar hiptesis referidas a la diferencia
entre dos medias relacionadas.
Ahora se dispone de una poblacin de diferencias con media D obtenida al restar las
puntuaciones del mismo grupo de casos en dos variables diferentes o en la misma variable
medida en dos momentos diferentes (de ah que se hable de muestras relacionadas). De esa
T) los casos con valor perdido en cualquiera de las dos variables que estn siendo
contrastadas.
o Excluir casos segn lista. Esta opcin excluye de todos los anlisis los casos con
tpico de la media.
o Tabla 2: Contiene el coeficiente de correlacin de Pearson entre ambas variables junto con
variables. Toma valores entre -1 y 1: un valor de 1 indica relacin lineal perfecta positiva,
un valor de -1 indica relacin lineal perfecta negativa (en ambos casos los puntos del
correspondiente diagrama de dispersin se encuentran dispuestos en una lnea recta), un
valor de 0 indica relacin lineal nula. Un coeficiente de correlacin alto no implica
causalidad, es decir, dos variables pueden estar linealmente relacionadas sin que una
sea la causa de la otra.
o Tabla 3: En la primera mitad incluye tres estadsticos referidos a las diferencias entre cada
EJERCICIOS
1. (T, una muestra) Los valores sobre las longitudes en milmetros de 50 filamentos de la
98
93
100
98
105
115
110
99
120
115
130
100
86
95
103
105
92
99
134
116
118
89
102
128
99
119
128
110
130
112
114
106
114
100
116
108
113
106
105
120
106
110
100
106
117
109
108
105
106
2. (T, dos muestras independientes) Una central de productos lcteos recibe diariamente la leche
de dos granjas X e Y. Deseando estudiar la calidad de los productos recibidos se extraen dos
muestras, una de cada granja (independientes), y se analiza el contenido de materia grasa,
obteniendo los siguientes resultados:
X
0.32
0.29
0.30
0.28
0.33
0.31
0.30
0.29
0.33
0.32
0.30
0.28
0.30
0.32
0.29
0.31
0.29
0.33
0.32
0.29
0.32
0.31
0.29
0.32
0.31
0.32
0.33
0.29
Y
medias.
3. (T, dos muestras independientes) Con el archivo de datos Edad.sav, comparar la edad entre los
A (mg/muestra)
0,47
1,02
0,33
0,70
0,94
0,85
0,39
0,52
0,47
B (mg/muestra)
0,41
1,00
0,46
0,61
0,84
0,87
0,36
0,52
0,51
Crea un archivo con estos datos denominado testosterona.sav. Compara la concentracin media
de testosterona determinada por ambos mtodos.