Академический Документы
Профессиональный Документы
Культура Документы
FACULTAD DE INGENIERA
GUA DE SPSS
Statistical Package for the Social Sciences
2008.
INTRODUCCIN
ESTADSTICA DESCRIPTIVA (CONCEPTOS BSICOS)
La estadstica tiene como finalidad estudiar detalladamente las caractersticas de una muestra
de datos. Este estudio se realiza a travs de variables. Variables: Son cantidades que pueden
tomar distintos valores de un momento a otro, y son propiedades de los casos que pueden
tomar distintos valores. Ej. En la investigacin de ejemplo se estudian las caractersticas de una
muestra de 150 sujetos. Se estudian siete variables: Edad, sexo, estatus, regin, ci, estatura y
peso. La edad es una propiedad (tiempo vivido) de los casos (sujetos en este caso) que
pueden tomar distintos valores. Sexo es una variable porque puede tomar distintos valores:
hombre o mujer.
Variables y Casos:Todo conjunto de datos puede ser visto como una matriz. Las filas se
corresponden con los distintos sujetos o unidades de investigacin, sobre los que se han
realizado las distintas observaciones. sta ltimas se corresponden con las columnas. Los
sujetos (filas) suelen denominarse casos y las observaciones (columnas) suelen denominarse
variables. A modo de ejemplo, por caso, dependiendo del estudio, puede entenderse un
paciente, o bien una muestra de laboratorio, o una visita mdica o un episodio de recurrencia
de una enfermedad. Por variables, asociadas a los casos anteriores, puede entenderse el sexo
y la edad del paciente, la frmula leucocitaria de la muestra de laboratorio, la fecha y presin
arterial medidas en una determinada visita mdica. Es importante notar que, con frecuencia se
confunde, en este ltimo caso, cul es el sujeto de anlisis, si el paciente con varios episodios
de recurrencia o cada episodio de recurrencia es un caso en s, pudiendo haber varios
episodios para un mismo paciente. La distincin de la unidad de anlisis en cada situacin la
marcar el objetivo de la investigacin.
Tipo de variables
Cualitativas
Cuantitativas
Contienen informacin cualitativa de los sujetos Miden la magnitud de una medida sobre un
denotando la cualidad o la categora a la que individuo.
pertenece un sujeto.
Nominales
Las observaciones se
clasifican en categoras
(mutuamente
excluyentes y
colectivamente
exhaustivas) sin que
stas tengan un orden
especfico (por ejemplo
los grupos sanguneos).
Un caso particular de
datos nominales es el
caso de los datos
dicotmicos en los que
existen slo dos
categoras (como por
ejemplo en el sexo).
Ordinales
Escala
Pg. 1 de 70
Tipo de Variables
Cualitativas o
Cuantitativas
Sus valores son distintos y se pueden ordenar ( de mayor a menor).
Nominales
Sus valores son
distintos.
Se pueden ordenar.
Se pueden
Se pueden ordenar.
ordenar.
estudian
mediante:
comn.
Ej- CI
comn.
Existe un cero real.
Ej.
Peso,
edad,
estatura
valores distintos.
Descriptivos:
mediana,
mximo, Histograma
Descriptivos: media, desviacin tpica,
de frecuencias
analizan
de
de
sectores
como
variables
mnimo,
amplitud,
los
descriptivo: La
ndices
de
asimetra
apuntamiento
MODA.
de
mximo,
intervalo.
Un estadstico
Mediante:
La distribucin
socioeconmico:
grfica
estatus
Distribucin de frecuencias.
Regin: norte,
barras
Valores distintos.
Se estudian con:
mujer
De Razn
Valores distintos.
Medio, Bajo
Sexo: hombre,
La
De Intervalo
Valores distintos.
Ej-
Ej.
Se
Ordinales
de
contingencia
(Crosstabs),
Pg. 2 de 70
APLICANDO UN CUESTIONARIO
UNIVERSIDAD PRIVADA SAN PEDRO
Sr(a)(ta): Se solicita su valiosa colaboracin que nos permita recolectar datos para
analizarlos e interpretarlos de un Trabajo de Investigacin que favorecer a la ciudad
de Chimbote.
Escriba en el espacio en blanco o con la letra X segn corresponda.
GRACIAS POR SU COLABORACIN
Hombre (
Mujer ( )
Medio ( )
Bajo ( )
6.- De las alternativa dadas ubique, la regin o zona en que se ubica su domicilio:
Norte ( )
Este ( )
Oeste ( )
Sur ( )
Pg. 3 de 70
Nombre
Tipo
Anchura Decimales
Iden
Numerico
edad
Numerico
Sexo
Numerico
nombre
Cadena
Etiqueta
Nmero de
identificacin del sujeto
Numerico
regin
Numerico
ci
Numerico
Numerico
Numerico
3
3
5
1
0
1
Perdidos
-9
Ninguno
1 Hombre
10
Estatus
Valores
Ninguno
Estatus
socioeconmico
Alineacin
Medida
Derecha
Escala
-9
Derecha
Ordinal
Derecha
Ordinal
10
Derecha
Nominal
Derecha
Ordinal
Derecha
Ordinal
8
8
8
Derecha
Derecha
Derecha
Escala
Escala
Escala
2 Mujer
Ninguno
1 Alto
9
2 Medio
3 Bajo
1 Norte
Columnas
estatura
peso
Cociente Intelectual
2 Este
3 Oeste
4 Sur
Ninguno
-9.0
Ninguno
Ninguno
-9
-9.0
Pg. 4 de 70
CI
124
95
101
116
102
102
81
109
61
93
119
52
128
65
116
65
147
113
99
117
105
92
78
97
77
81
126
95
122
85
ESTATURA
154
154
156
184
173
170
176
188
169
175
177
181
164
160
162
156
172
175
168
159
178
174
178
163
180
174
137
153
168
161
PESO
57.9
56.7
52.8
104.2
87.5
71.5
93.3
99.2
76.6
87.9
80.3
82.3
61.8
75.0
60.3
53.9
78.6
85.7
75.4
73.0
87.6
74.2
100.9
77.1
74.6
70.2
99.3
62.1
77.4
67.9
Pg. 5 de 70
PESO
86.8
70.5
85.7
95.6
65.5
81.4
57.2
64.1
78.5
65.4
82.6
82.1
69.9
59.4
84.2
79.4
55.1
71.3
72.8
75.2
75.9
82.4
76.7
71.9
95.7
68.5
54.4
90.1
80.4
72.9
65.3
67.8
58.8
79.5
77.0
99.5
84.6
68.5
61.8
63.6
54.0
71.7
57.1
90.0
Pg. 6 de 70
Pg. 7 de 70
NOTA:
Deber tener una copia de seguridad de su archivo que contiene los 150 registros.
Cualquier error cometido por alguno de los integrantes de su grupo, se reflejar en
los resultados al trabajar en el programa SPSS.
Pg. 8 de 70
PRACTICA N 03
CREACIN Y TRANSFORMACIN DE VARIABLES
Abra el archivo MIAPELLIDO.sav: File Open. Busca el archivo: MIAPELLIDO.sav.
Luego Abrir.
FUNDAMENTO: Los datos directos necesitan en muchas ocasiones ser transformados
antes de llevar a cabo los anlisis estadsticos. Se pueden realizar con las opciones del
men Transformar (Transform) o con lenguaje de comandos SPSS.
RECODIFICACION DE VARIABLES (RECODE).
Pg. 9 de 70
f)
g) Repita los pasos d, e y f para los valores antiguos 2 y 3. Escriba como valor nuevo (New
value) 2 para ambos casos.
h) Repita los pasos d, e y f para el valor antiguo 4 y escriba 3 como nuevo valor.
i)
j)
Para las etiquetas, clic en la opcin LABEL (Etiqueta) y cambie los valores de esta
nueva variable as: Variable label: Nueva Regin. Value:1, Value label:Norte; Value:2,
Value label:Centro, Value:3, Value label:Sur. Clic en continuar y aceptar (OK).
m) Para missing values. Escriba: 9 dentro del recuadro de Discrete missing values. Corrija
en la tabla de datos, en caso de haber algn valor perdido, escribiendo: 9
n) Para hacer otra recodificacin diferente con otra variable. Clic en el botn Reset
o) File Save as: MIAPELLIDO.SAV.
Pg. 10 de 70
Del menor a 20
1
De 20 a 25
2
De 25 a 30
3
De 30 al mayor
4
Pg. 11 de 70
Pg. 12 de 70
Pg. 13 de 70
PRACTICA N 04
CLCULO CON VARIABLES TIPO FECHA
FUNDAMENTO: Para el clculo de la edad en aos de un individuo sabiendo la fecha
actual y su fecha de nacimiento, debemos recurrir a la funcin denominada
CTIME.DAYS(fecha).
Supongamos la fecha actual 15 de marzo del 2003, y la variable f_nacim
conteniendo la fecha de nacimiento de los casos. Introduciendo en la ventana de las
expresiones la siguiente:
(CTIME.DAYS(DATE.DMY(03,15,2003))-CTIME.DAYS(f_nacim))/365
Nota: El formato de fecha puede variar.
Como resultado obtendremos los aos transcurridos entre ambas fechas. Si
queremos un mayor grado de pulcritud podemos dividir entre 365.25 das para tomar en
cuenta los bisiestos o usar la funcin RND(exp_numrica) para redondear el resultado
al entero ms prximo.
La funcin DATE.DMY(da,mes,ao) transforma los argumentos da, mes y ao
a un dato tipo fecha para poder ser empleado, al igual que f_nacim, como argumento de
la funcin CTIME.DAYS(valorfecha)
1.- Crear el archivo: FECHAS.SAV.
File New Data.
a) Definir las siguientes variables. Doble clic sobre Var. Luego llenar segn Tabla:
Variable
Name
Type
Variable
Label
FNACIM
FINGRESO
Date dd.mm.yyyy
Date dd.mm.yyyy
Fecha
de Fecha de ingreso
nacimiento
FALTA
Date dd.mm.yyyy
Fecha de alta
1
2
3
4
5
Fnacim
07.12.1959
01.04.1956
01.01.1990
31.12.1980
28.02.1990
Fingreso
10.03.2003
01.03.2003
01.01.2002
31.12.1999
30.12.1999
Falta
14.03.2003
14.03.2003
01.01.2003
31.12.2002
05.05.2003
Pg. 14 de 70
Pg. 15 de 70
Resultados:
1
2
3
4
5
fnacim
07.12.1959
01.04.1956
01.01.1990
31.12.1980
28.02.1990
Fingreso
10.03.2003
01.03.2003
01.01.2002
31.12.1999
30.12.1999
Falta
14.03.2003
14.03.2003
01.01.2003
31.12.2002
05.05.2003
AOS
0
0
1
3
3
Solucin:
SEGUNDOS = falta fingreso
DAS = CTIME.DAYS(falta) CTIME.DAYS (fingreso)
DAS1 = (CTIME.DAYS(falta) CTIME.DAYS (fingreso) + 1
AOS = RND((CTIME.DAYS(falta) CTIME.DAYS (fingreso)) / 365)
OTRA FORMA DE CLCULO: Utilizando comandos en la ventana de sintaxis
(FILE Data Syntaxis). Escribir:
COMPUTE SEGUNDOS = falta - fingreso .
EXECUTE .
COMPUTE DAS = CTIME.DAYS(falta) - CTIME.DAYS(fingreso) .
EXECUTE .
COMPUTE DAS1 = RND(CTIME.DAYS(falta) - CTIME.DAYS(fingreso)) + 1 .
EXECUTE .
COMPUTE AOS = RND((CTIME.DAYS(falta) - CTIME.DAYS(fingreso)) / 365) .
EXECUTE .
Guardar como: File Save as. Escribir nombre del archivo: Fechas
Clic en Guardar.
Pg. 16 de 70
PRACTICA N 05
CREACIN O TRANSFORMACIN CONDICIONAL
DE VARIABLES (IF)
File Open. Abrir el archivo: MIAPELLIDO.SAV
1.- Se quiere hallar la variable IMC que tiene la frmula peso/(estatura/100)**3 pero
slo para las mujeres que midan ms de 1.60 m. El proceso es:
Elegir Transformar Calcular (TransformCompute). Clic en Reset.
Escribir el nombre de la nueva variable: IMC en la celdilla debajo de Variable de
destino (Target Variable).
Escribir la expresin peso/(estatura/100)**3 en la celdilla debajo de Expresin
numrica.
Peso; /; ( ); estatura; /; 100; **; 3
Pg. 17 de 70
Guardar como: File Save as. Escribir nombre del archivo: Condiciones
Clic en Guardar.
Pg. 18 de 70
SELECCION DE CASOS
(AnalyzeCorrelate
Pg. 19 de 70
Hombre
PESO
Pearson Correlation
Sig. (2-tailed)
N
ESTATURA
Pearson Correlation
Sig. (2-tailed)
N
Mujer
PESO
Pearson Correlation
Sig. (2-tailed)
N
ESTATURA
Pearson Correlation
Sig. (2-tailed)
N
** Correlation is significant at the 0.01 level (2-tailed).
PESO
ESTATURA
1.000
.
75
.595
.000
75
1.000
.
74
.594
.000
74
.595
.000
75
1.000
.
76
.594
.000
74
1.000
.
74
Pg. 20 de 70
SELECCIN DE CASOS
2.- Analizar slo los casos de estatus bajo (valor 3) que no sean del Norte (valores 2,3 y
4 de regin).
Clic en Datos Seleccionar casos (DataSelect cases)
Marcar el crculo al lado de Si se satisface la condicin (If condition is satisfied).
Pulsar el botn Si... (If...). Se accede al cuadro de dilogo Seleccionar casos: si.
(Select Cases: IF)
Escribir o componer la expresin: regin >=2 & estatus = 3. Transferir la variables y
utilizar los operadores necesarios.
Clic en Continue
Pg. 21 de 70
A partir de este momento slo se procesarn los casos que cumplan la condicin.
Observar que 1 equivale a caso seleccionado (Select) y los casos con valores
perdidos o que no cumplen la condicin (Valor 2) equivale a Not Select (No
seleccionado).
Pg. 22 de 70
Pg. 23 de 70
Nmero de NOMBRE
identificacin
del sujeto
1
1
Abigail
2
2
Carlos
3
3
Alberto
4
4
Adela
5
5
Luis
6
6
Adelina
7
7
Antonio
8
8
Juan
9
9
Adriana
10
10
Agata
Total
N
10
10
a Limited to first 10 cases.
PESO
57.9
56.7
52.8
104.2
87.5
71.5
93.3
99.2
76.6
87.9
10
ESTATUR
Estatus
A
socioeconmico
154
154
156
184
173
170
176
188
169
175
10
Alto
Alto
Alto
Medio
Alto
Medio
Alto
Alto
Medio
Medio
10
Pg. 24 de 70
Pg. 25 de 70
Trate de cambiar el color delas barras a AZUL y el color blanco para indicar el
nmero de casos. El titulo del grfico debe decir: Distribucin de casos segn
Regin.
Pg. 26 de 70
Para graficar clic en Chart y activar Pie Chart y en continue. Clic en OK.
Valid
Missing
Total
Estatus socioeconmico
Frequency
Percent
Valid
Percent
Alto
76
50.7
51.4
Medio
41
27.3
27.7
Bajo
31
20.7
20.9
Total
148
98.7
100.0
9
2
1.3
150
100.0
Cumulative
Percent
51.4
79.1
100.0
Comentario:
De estatus alto hay 76 casos. Son el 50,7% de todos los casos (76 / 150). Y suponen
un porcentaje vlido del 51,4% (76 /148).
Pg. 27 de 70
Comentarios:
La media del ci es 101,6, la desviacin tpica 22,6, el coeficiente de apuntamiento (curtosis) vale 0,41
(menos apuntada que la distribucin normal), el coeficiente de asimetra es 0,1 (ligeramente asimtrica
positiva), el valor mnimo es 52 yy el mximo 159, el rango de 107. Hay 149 casos vlidos y 1 caso
perdido. De estos estadsticos el que puede, de entrada, ofrecer menos informacin es la desviacin
tpica (medida de dispersin). Sin embargo, si se recuerda una de las propiedades de la distribucin
normal: que el 95% se encuentra entre dos desviaciones tpicas a cada lado de la media, se obtiene una
idea mejor de la dispersin del grupo: el95% de los casos estar entre 101,6 +- 45,3. La desviacin tpica
da una informacin ms intuitiva cuando se comparan las dispersiones de varios grupos.
Para construir el Histograma, el programa agrupa las puntuaciones en intervalo, el punto medio del
intervalo es su valor representativo. La anchura del intervalo, en esta grfica, es de 5 puntos y el valor
debajo de cada rectngulo del histograma es el punto medio del intervalo dado (slo se imprimen los
puntos medios de intervalos alternos).
Pg. 28 de 70
Resultados:
Cociente intelectual
Estatus
Mean
socioeconmico
Alto 101.645
Std.
Deviation
76
20.433
Medio 100.500
40
23.822
Bajo 101.774
31
26.823
Total 101.361
147
22.675
Comentario:
Se ofrece para cada grupo de estatus la media, desviacin tpica y el nmero de casos.
Se ofrecen estos estadsticos, tambin para la muestra total. El ci medio de los de
estatus alto es 101,64. Las desviaciones tpicas son muy similares.
Pg. 29 de 70
Pg. 30 de 70
Cociente intelectual
Estatus
SEXO
socioeconmico
Alto
Hombre
Mujer
Total
Medio
Hombre
Mujer
Total
Bajo
Hombre
Mujer
Total
Total
Hombre
Mujer
Total
Mean
100.098
103.457
101.645
99.235
101.435
100.500
99.063
104.667
101.774
99.676
103.068
101.361
N
41
35
76
17
23
40
16
15
31
74
73
147
Std. Deviation
18.116
22.991
20.433
24.692
23.674
23.822
29.188
24.729
26.823
22.108
23.264
22.675
Las mujeres de
estatus alto tienen
un ci medio de
103,45
y
una
desviacin tpica
de 22,9.
GRAFICAS
SIMPLES: Otra manera de describir es realizar grficas de los estadsticos de los
subgrupos.
3.- Hallar una grfica con las medias en ci (cociente intelectual) de los tres grupos
de estatus).
Grficos-Lneas (Graphs Line). Tipo: Simple. Summaries for groups cases. Clic en
Define.
Pg. 31 de 70
Repita los pasos anteriores. Pero antes de pulsar lel botn OK. Haga Clic en el
botn Opciones (Options) y desactive la casilla de display groups defined by
missing values (Mostrar grupos definidos por valores perdidos o datos en blanco)
para no incluirlos en el anlisis de los datos.
101.6
101.4
101.2
101.0
100.8
100.6
100.4
Alto
Medio
Bajo
Estatus socioeconmico
Pg. 32 de 70
Pg. 33 de 70
Para el caso de la variable sexo (Mujeres): Modificar el estilo de lnea (Line style).
105
104
103
102
101
100
SEXO
99
Hombre
98
Mujer
Alto
Medio
Bajo
Estatus socioeconmico
Pg. 34 de 70
Pg. 35 de 70
Editar el grfico: Color de relleno: blanco. Con framed (marcos con los valores)
Para el framed (Marco con valores). Clic en el icono: Bar Label Style. Seleccionar:
framed. Clic en Apply All. Clic en close (cerrar ventanita).
Para relleno de cada barra: Seleccionar la barra correspondiente. Clic en el icono Fill
pattern (patrn de relleno). Seleccionar el relleno correspondiente. Clic en Apply.
Proceder igual con la otra barra. Al concluir, clic en close (cerrar ventanita)
105
105
104
103
103
M
ea
n
C
oc
ie
nt
e
int
l
102
101
101
100
100
SEXO
99
99
99
Hombre
98
Mujer
Alto
Medio
Bajo
Estatus
Pg. 36 de 70
Pg. 37 de 70
Resultados:
Tabla de contingencia SEXO * Estatus socioeconmico
SEXO
Total
Hombre
Mujer
Estatus socioeconmico
Alto
Medio
Bajo
41
17
16
35
24
15
76
41
31
Total
74
74
148
En la tabla de Chi-cuadrado la pregunta que se plantea es: existe relacin entre el estatus y el sexo?. El
contraste de chi cuadrado de Pearson comprueba si existe independencia o no entre ambas variables.
X2(2)=1,701 p0,427 indica que no existe relacin entre ambas variables (probabilidad mayor que 0,05,
es decir, no hay asociacin sistemtica de determinados valores de estatus con determinados valores de
sexo.
Pruebas de Chi-cuadrado
Value
df
Asymp. Sig. (2-sided)
1,701
2
,427
Pearson Chi-Square
1,707
2
,426
Likelihood Ratio
,266
1
,606
Linear-by-Linear Association
148
N of Valid Cases
a 0 cells (.0%) have expected count less than 5. The minimum expected count is 15.50.
Pg. 38 de 70
Phi
Cramer's V
Contingency
Coefficient
,107
,107
,107
,427
,427
,427
N of Valid Cases
148
a Not assuming the null hypothesis. (No asumiendo la hiptesis nula)
b Using the asymptotic standard error assuming the null hypothesis.
(Empleando el error asinttico basado en la hiptesis nula)
GRFICA DE LA RELACIN
Se puede obtener una grfica de barras si en el cuadro de dilogo de Tablas de
contingencia se marca el casillero Mostrar los grficos de barras agrupadas (Display
clustered bar charts).
Pg. 39 de 70
40
41
35
30
R
E
C
U
E
N
T
O
Estatus socioeconmico
24
20
Alto
17
16
15
10
Medio
Bajo
Hombre
Mujer
SEXO
Estatus socioeconmico
Alto
Medio
Bajo
Total
SEXO
Total
41
Hombre Recuento
% de SEXO
55.4%
% de Estatus socioeconmico 53.9%
% del Total
27.7%
35
Mujer Recuento
% de SEXO
47.3%
% de Estatus
46.1%
socioeconmico
% del Total
23.6%
Count
76
% de SEXO
51.4%
% de Estatus socioeconmico
100.0%
% del Total
51.4%
17
23.0%
41.5%
11.5%
24
32.4%
58.5%
16
21.6%
51.6%
10.8%
15
20.3%
48.4%
74
100.0%
50.0%
50.0%
74
100.0%
50.0%
16.2%
41
27.7%
100.0%
27.7%
10.1%
31
20.9%
100.0%
20.9%
50.0%
148
100.0%
100.0%
100.0%
Pg. 40 de 70
Resultados:
Estatus socioeconmico
REGIN
Norte
SEXO
Este
Total
SEXO
Oeste
Total
SEXO
Sur
Total
SEXO
Hombre
Mujer
Hombre
Mujer
Hombre
Mujer
Hombre
Mujer
Total
Alto
17
6
23
11
8
19
10
10
20
3
11
14
Medio
6
7
13
3
7
10
5
9
14
3
1
4
Bajo
4
3
7
3
5
8
4
2
6
5
5
10
Total
27
16
43
17
20
37
19
21
40
11
17
28
Pg. 41 de 70
Pg. 42 de 70
Correlacin de Pearson
Sig. (bilateral)
N
Correlacin de Pearson
ESTATURA
Sig. (bilateral)
N
PESO
Correlacin de Pearson
Sig. (bilateral)
N
** Correlation is significant at the 0.01 level (2-tailed).
(La correlacin es significativa al nivel 0,01(bilateral)
Cociente intelectual
Cociente
intelectual
1.000
.
149
.081
.325
149
.001
.988
148
ESTATURA
PESO
.081
.325
149
1.000
.
150
.600
.000
149
.001
.988
148
.600
.000
149
1.000
.
149
Pg. 43 de 70
100
90
31
80
70
60
PESO
50
40
Rsq = 0.3606
120
140
160
180
200
220
240
260
280
ESTATURA
Pg. 44 de 70
Editar la grfica:
El botn ttulo se puede emplear para aadir ttulos (hasta dos lneas), subttulo, y
notas al pie (hasta dos lneas) a la grfica.
La relacin es claramente rectilnea y r es positivo. Lo que es evidente es la
presencia de algunos casos extremos, como el situado en la parte superior derecha,
el de un sujeto que mide ms de 2,70 m de altura. (Sujeto 31).
Para identificar el valor del caso extremo: Editar el grfico. Hacer clic en el icono
Point identification el cursor cambia de forma, mover el ratn hasta el sujeto y
hacer clic sobre l, automticamente se insertar el nmero de sujeto a su lado. Si
ahora se sita en la ventana de datos se comprobar que tiene una estatura de 270
cm.
Para incluir la recta de regresin: editar la grfica. Clic en el icono Chart Options
(Opciones de grfico). En la seccin Ajustar lnea (Fit line) marcar Total.
Si adems se desea que figure el valor del coeficiente de correlacin elevado al
cuadrado (R2) hacer clic en el botn Opciones de ajuste (Fit Options) y en el
siguiente cuadro de dilogo marcar Mostrar R-cuadrado en la leyenda (Display Rsquare in legende) en la seccin opciones de la regresin.
3.- Hallar la recta de regresin y el valor de R2 tal como se hizo antes. El ajuste mejora
notablemente hasta 0,4972 y tambin ha aumentado el valor de R2. Para hallar los
parmetros de la recta de regresin (constante y pendiente).
Men: File New Sintaxis. Escribir:
IF ($CASENUM EQ 31) estatura = 0.
FILTER BY estatura.
GRAPH SCATTERPLOT = estatura WITH peso.
Pg. 45 de 70
100
90
80
70
60
PESO
50
40
Rsq = 0.4972
130
140
150
160
170
180
190
200
ESTATURA
Model
1
(Constant)
ESTATURA
Unstandardized
Standardized
Coefficients
Coefficients
B
Std.
Beta
Error
11.054
-55.831
.066
.705
.788
a Dependent Variable: PESO
Sig.
-5.051
12.015
.000
.000
Pg. 46 de 70
Grficos de
Barras
180
50
100
160
90
40
Simples
(Simple)
80
140
70
Valor PESO
30
100
50
40
1
Norte
Este
Oeste
Sur
13
25
37
Nmero de caso
60
REGIN
Cociente intelectual
PESO
ESTATURA
108
180
106
104
102
140
100
120
SEXO
98
Hombre
96
94
Mujer
Norte
Este
Oeste
Sur
REGIN
100
Media
160
Agrupadas
(Clustered)
60
80
20
Media
Frecuencias
120
ESTATURA
80
Cociente intelectual
Norte
Este
Oeste
REGIN
Pg. 47 de 70
Sur
49
61
73
85
97
145
Apiladas
(Stacked)
300
200
100
SEXO
Mujer
Hombre
0
Norte
Este
Oeste
Sur
REGIN
Grficos de
Lneas
110
180
82
100
160
90
80
80
Simples
(Simple)
140
70
Valor PESO
78
76
100
60
50
40
1
80
74
Norte
Este
REGIN
Oeste
Sur
Media
Media PESO
120
60
Cociente intelectual
Pg. 48 de 70
13
25
37
Nmero de caso
PESO
ESTATURA
49
61
73
85
97
109
121
133
145
108
Mltiples
(Multiple
160
104
140
102
120
100
SEXO
100
98
Hombre
96
Mujer
Norte
Este
Oeste
106
Cociente intelectual
Este
Oeste
Sur
REGIN
104
102
100
SEXO
98
Hombre
Mujer
96
Norte
ESTATURA
80
Norte
Sur
REGIN
Lneas
verticales
(Drop-Line)
Media
106
Este
Oeste
Sur
REGIN
Grficos de
reas
Pg. 49 de 70
AREAS DE VARIABLES
82
180
80
160
Media PESO
* 3.-Agrupada de sujetos.
GRAPH
/LINE(AREA)=VALUE
(peso) by sexo .
140
78
Simples
(Simple)
* 2.-Simple de sujetos.
GRAPH /LINE(AREA)=VALUE
(peso) .
120
76
100
74
Norte
Este
Oeste
Sur
Media
80
REGIN
60
Cociente intelectual
PESO
ESTATURA
300
GRAPH
/LINE(DIFFEREN)=MEAN(ci) BY
regin BY sexo
/MISSING=exclude.
200
200
100
SEXO
Mujer
100
Hombre
0
Norte
Este
Oeste
REGIN
Sur
Media
300
Apiladas
(Stacked)
*DIFERENCIAS .
* 4.- Areas de diferencias
de grupos agrupada.
Cociente intel
ESTATURA
0
Norte
Este
REGIN
Pg. 50 de 70
Oeste
Sur
GRAPH
/LINE(DIFFEREN)=MEAN(peso
estatura) BY regin/
MISSING=LISTWISE .
* 6.- Diferencias de
sujetos.
GRAPH
/LINE(DIFFEREN)=N(peso
estatura) by sexo .
100
10000
120
8000
100
6000
80
4000
43
3481
40
38
PESO
Frecuencias
60
40
50
50
28
20
0
Norte
Oeste
Este
2000
0
0
Norte
REGIN
REGIN
Percent
100
140
120
100
80
50
Frecuencias
60
40
20
21
20
19
18
Oeste
Este
Mujer
17
27
0
Norte
11
Sur
REGIN
SEXO
Cumulative
16
2770
2087
Sur
160
3021
Pg. 51 de 70
Hombre
Oeste
Este
Sur
Percent
100
140
Percent
160
12000
GRAFICAS
DE CAJAS
180
300
31
160
140
200
120
100
Cociente intelectual
Simple
(Simples)
27
93
80
100
60
123
12
40
N=
43
38
39
28
Norte
Este
Oeste
Sur
REGIN
N=
148
148
148
Cociente intelectual
ESTATURA
PESO
300
180
31
160
200
140
120
27
Clustered
(Agrupadas)
Cociente intelectual
93
100
100
Cociente intelectual
80
ESTATURA
SEXO
PESO
60
Hombre
12
N=
76
76
Alto
76
40
40
Medio
Mujer
40
N=
27
16
18
Norte
20
Este
19
20
Oeste
11
Estatus socioeconmico
17
Sur
REGIN
Pg. 52 de 70
40
31
31
Bajo
31
GRAFICAS
DE
BARRAS
DE ERROR
Simple
(Simples)
120
110
100
90
80
N=
43
38
39
28
Norte
Este
Oeste
Sur
REGIN
Pg. 53 de 70
Scale
Define
variable
(Define
variable)
numeric
nombre
nominal
string
f_nacim
scale
f_inclus
Type
Width
(ancho)
Decimal
places
(Decimales)
0
Column Format
Text
Column
alignment
width
(Ancho) (alineacin)
Labels
Variable
Labels
(Rtulo)
Right
Clave de
aleatorizacin
11
Center
Date
Characters:
3
dd.mm.yyyy
11
Right
Fecha de
nacimiento
scale
Date
dd.mm.yyyy
11
Right
Fecha de
inclusin
sexo
nominal
Numeric
Right
altura
scale
Numeric
Right
0:Varn
1:Mujer
Altura (cm)
peso
Scale
Numeric
Right
Peso en kg.
pad_ini
Scale
Numeric
Right
pad_fin
Scale
Numeric
Right
pas_ini
Scale
Numeric
Right
pas_fin
scale
Numeric
Right
Presin
diastlica
inicial
Presin
diastlica
final
Presin
sistlica
inicial
Presin
sistlica final
Iniciales
Nota: En la variable sexo. Para Labels. Value: 0 Value label:Varn; Value: 1 Value label:Mujer
Pg. 55 de 70
Scale
FARMACO
nominal
Define
variable
(Define
variable)
Type
Width
(ancho)
numeric
numeric
Column Format
Decimal Column
Text
places
width
alignment
(Decimal (Ancho) (alineacin)
es)
Clave de aleatorizacin
Right
Labels
Variable Labels
(Rtulo)
Tratamiento aplicado
Value / Value label
0 / Placebo
1 / IECA
2 / Ca Antagonista+diurtico
Right
La Tabla con los datos relativos a los 10 de los pacientes enrolados en uno de los centros de
investigacin es la siguiente:
Tabla 1.3. Datos de los 10 pacientes reclutados en el centro con 10 pacientes
clave Nombre F_macim F_inclus
SGL
8-9-1941
JCG
13-7-1998
165
78
78
104
176
175
10-7-1957 9-5-1998
154
74
95
114
162
160
APZ
18-8-1967 1-4-2000
156
81
93
102
141
150
NDG
8-5-1956
181
82
86
91
162
161
CLO
2-11-1958 24-2-1999
184
78
89
94
165
162
LFZ
13-6-1953 16-3-2000
179
80
74
99
141
148
OAR
20-7-1961 21-8-1999
159
60
94
95
168
152
SGH
6-3-1970
16-12-1999
153
70
94
79
133
143
ZLZ
6-2-1962
21-6-2000
172
57
74
64
149
135
10
YSJ
5-4-1968
15-10-1998
154
54
89
87
147
155
13-11-1998
Pg. 56 de 70
1.
2.
3.
4.
Crear el fichero de datos (Tabla 1.1: Variables) definida con once variables. Luego
introducir los datos de la Tabla 1.3. Grabar este archivo asignndole el nombre
"Apellidos - Datos (1-10)". Revisar bien las 11 variables definidas
Unir o Fusionar (Merge Files) el archivo: "hipertens - Datos (1-100)": Activando el
men DATA MERGE FILES ADD CASES. Seleccionar el archivo: hipertens
Datos (11-100) y clic en Abrir. Observe si se unieron correctamente los datos.
Borrar los casos o filas en blanco del 11 al 21: Seleccionar la columna numerada en la
barra izquierda. Luego Edit Clear.
Grabar (File Save as) los datos fusionados (100 pacientes) a un archivo con el
nombre: "Apelidos - Datos (1-100)". Observe los resultados.
Con archivo: Apellidos-Datos (1-100) abierto o activo agregar el archivo "hipertens claves aleatorizacion" que contiene la variable Frmaco:
Activando Data Merge Files Add Variables. Seleccionar el archivo con las claves
denominado: "hipertens - claves aleatorizacion" y clic en abrir.
Grabar el archivo resultante con el nombre: "Apellidos - Datos+Claves" .
Grabar (o exportar) el archivo Apellidos-Datos+Claves que contiene los datos de
todo el estudio (100 pacientes) a diferentes formatos:
Formato Excel con el nombre: "Apellidos - excel.xls": FILE SAVE AS.
En el cuadro de texto desplegable: Guardar como archivo de tipo seleccionar
Excel (*.xls).
Formato con Texto delimitado por tabuladores con el nombre:
"Apellidos - tab.dat" .
En el cuadro de texto desplegable: Guardar como archivo de tipo seleccionar:
Tab-delimited (*.dat).
Formato Texto de ancho fijo con el nombre "Apellidos - fijo.dat"
En el cuadro de texto desplegable: Guardar como archivo de tipo seleccionar :
Fixed ASCII (*.dat).
Crear un archivo para cada uno de los grupos de tratamiento. Denominar a estos
archivos "Apellidos - placebo", "Apellidos - IECA" e "Apellidos - Ca", respectivamente.
(Sugerencia: Utilice la opcin:
Pg. 57 de 70
Una vez introducidos, grabados y fusionados los correspondientes archivos de datos, sobre
el archivo completo (con 100 pacientes con los datos clnicos y los frmacos administrados a
cada sujeto), realizar las siguientes operaciones con el archivo: ApellidosDatos+Claves.SAV:
5. Calcular, para cada paciente al momento del estudio, la edad en aos (redondeando al
entero ms prximo). Denominar la nueva variable "Edad" y etiquetarla
correspondientemente. Releer ejemplos de prcticas anteriores sobre clculo con fechas
para utilizar: CTIME.DAYS(fecha) y RDN (EXPRESIN NUMRICA). Ej.
RND ((CTIME.DAYS(F_INCLUS)-CTIME.DAYS(F_NACIM)) / 365 )
6.- Recodificar dicha edad de forma que la nueva variable, de nombre clasedad, tome los
siguientes valores. Luego colocar las etiquetas de valor.
Edad en aos
Clasedad
Etiquetas
(Labels)
Menores de 36
"Menores de 36 aos"
De 37 a 44
De 37 a 44
De 45 a 52
De 45 a 52
Mayores de 52
Mayores de 52
Altura est dada en centmetros. En la frmula se divide entre 100 para obtener
metros.
Pg. 58 de 70
8. Recodificar dicho ndice de masa corporal de forma que la nueva variable, de nombre
obesidad, tome los siguientes valores y etiquetas de valor segn el sexo del paciente.
Sexo
IMC
ObeMujer
Etiqueta
Menor de 19
19,01 a 24,94
24,95 a 29,94
29,95 a 39,94
Mayor de 39,95
1
2
3
4
5
Desnutrida
Normal
Sobre peso
Obesa
Muy obesa
Sexo
IMC
ObeVaron
Etiqueta
Menor de 21
21,01 a 26,94
26,95 a 32,94
32,95 a 43,94
Mayor de 43,95
1
2
3
4
5
"Desnutrido"
Normal
Sobre peso
Obeso
Muy obeso
Pg. 59 de 70
Estadstica descriptiva
Tras realizar las operaciones planteadas anteriormente, se obtienen los resultados relativos a
las caractersticas de los pacientes en el momento de la inclusin en el estudio.
Pg. 60 de 70
20
Frequencia
10
0
145.0
155.0
165.0
175.0
185.0
195.0
Altura (cm)
Pg. 61 de 70
Pg. 62 de 70
Por ltimo, este procedimiento genera grficos como el histograma y el diagrama de cajas y
patillas mostrados en las figuras siguientes.
Para editar el grfico anterior: Doble clic en el eje X, luego doble clic en el eje X de la ventana de
edicin.
Labels. Orientation: Horizontal. Continue
Custom Define . Cambiar: # of interval de 9 a 6. Interval width de 5 a 7.5.
Continue. OK.
Pg. 63 de 70
Pg. 64 de 70
Pg. 65 de 70
Sexo
Varn
Mujer
N
19
14
%
57,6%
42,4%
IECA
n
19
15
%
55,9%
44,1%
Ca Antagonista +
Diurtico
n
%
16
48,5%
17
51,5%
Pg. 66 de 70
2.-
Su vivienda es?
Propia ( )
Alquilada ( )
Otros1__________________
Especifique
El material de construccin
de su vivienda es?
Material Noble ( )
Adobe ( )
Caa ( )
Estera ( )
Triplay ( )
Otros2__________________
3.-
4.-
5.-
III
SERVICIOS BASICOS DE
SALUBRIDAD
6.-
NO ( )
de
su
Pg. 67 de 70
Puesto de Salud ( )
Centro de Salud ( )
Hospital ( )
Centro Particular ( )
Farmacia ( )
Botica ( )
Curandero ( )
Pg. 68 de 70
NUTRICION
24. Qu alimentos consumen durante
la semana?
Pescado ( ) Frutas ( )
Carne ( )
Mantequilla ( )
Pollo( )
Pan ( )
A
( ) (
L
)
C
( )
V. ASCTOS SOCIOECONMICOS
27. Pertenece a alguna asociacin de
base?
SI ( )
NO ( )
Club de Madres ( )
Vaso de Leche ( )
Comedor Popular ( )
Otros27
______________________
Especifique
28. Qu tipo de informacin escrita
prefiere?
Libro ( )
Revista ( )
Peridicos ( )
Otros28____________________
Pg. 69 de 70
Quincenal ( )
Mensual ( )
( ) _____
( ) _____
( ) _____
( ) _____
( )
Definir las variables y grabar el archivo como: XXXXXXXX ( Escriba un nombre mximo
con 8 caracteres). Luego realice el anlisis de los datos y los grficos que le faciliten
responder las siguientes preguntas:
Pg. 70 de 70
Pg. 71 de 70
Grupo: .............
Semestre: ....................
Instrucciones: Esta evaluacin para el manejo de un paquete informtico, slo tiene dos dominios de
evaluacin: Si cuando se tenga el manejo o dominio de la habilidad ( 1 punto cada S) y No cuando el manejo
sea deficiente o nulo (0 puntos)
S
No
I. Crea variables adecuadas para un cuestionario ya aplicado
1. Define en el computador las variables del cuestionario segn tipo, formato de columna,
etiqueta, valores perdidos o datos en blanco.
2. Describe la variable en los casos en que el nombre de la variable no sea autoexplicativo
o se requiera una explicacin ms detallada.
II. Introduce y reingresa datos de todo tipo como paso previo para realizar un anlisis
de los datos.
3. Registra los datos por filas o columnas
4. Toma decisiones para registrar o no los datos provenientes de cuestionarios que sean
dudosos o ilgicos, utilizando el valor definido en la variable definida para estos casos.
5. Evita errores al registrar datos
6. Une archivos aadiendo nuevos casos o nuevas variables
III. Realiza el anlisis de los datos.
Creando y transformando las variables, mediante la:
a) Recodificacin de variables
b) Creacin de nuevas o tranformando las ya existentes utilizando operadores
diversos
c) Creacin de nuevas variables o de nuevos valores a variables existentes si una
determinada condicin se cumple
8. Segmenta archivos para analizar datos de grupos por separado
9. Selecciona casos o una parte de los sujetos para realizar el anlisis
Pg. 72 de 70
Pg. 73 de 70