Академический Документы
Профессиональный Документы
Культура Документы
CON SPSS
Contenido
Prlogo. 5
Captulo 1: Introduccin al SPSS 7
Captulo 2: Estadstica Descriptiva . 11
Captulo 3: Intervalos y Contrastes bsicos . 17
Captulo 4: Anlisis de la Varianza ............. 19
Captulo 5: Regresin Lineal y Correlacin .. 31
Captulo 6: Tablas de Contingencia ............... 37
Captulo 7: Anlisis de Componentes Principales .. 47
Captulo 8: Anlisis de Correspondencias .... 51
Captulo 9: Anlisis de Discriminante ............ 57
Captulo 10: Anlisis de Conglomerados.... 63
Captulo 11: Anlisis de Series Temporales.......... 71
Captulo 12: Regresin Logstica .........79
Captulo 13: Regresin Poisson .............. 85
Captulo 14: Anl. Supervivencia sin covariables 93
Captulo 15: Anl. Supervivencia con covariables .103
Prlogo
Captulo 1
Introduccin al SPSS
1.1. Introduccin
Una de las caractersticas ms destacadas de SPSS (en especial con
respecto a R o SAS) es que no es necesario conocer un lenguaje de
programacin para utilizarlo (aunque lo tiene). Su exitosa presentacin de
Mtodos Estadsticos a ejecutar en forma de persianas, permite comenzar a
utilizarlo casi sin conocimientos previos del paquete.
Por esta razn, este texto ser simple y breve ya que, sin duda, la mejor
manera de aprende a manejar SPSS es utilizarlo.
Menores de 20 aos
Hombre Mujer
S fuma 11
3
No fuma
1
7
Entre 20 y 50 aos
Hombre Mujer
S fuma
1
4
No fuma
2
5
Mayores de 50 aos
Hombre Mujer
S fuma 13
1
No fuma
2
6
En determinados modelos, las variables deben ser categricas; es decir, deben
definir categoras en las que clasificar los datos. Nosotros, de momento,
utilizaremos datos de tipo numrico. Para ello, lo ms simple es ir introduciendo
los datos y ms tarde, modificar, si es necesario, sus propiedades.
Figura 1.1
Para el ejemplo en cuestin, incluiremos (por este orden) datos de las
tres variables: la variable Edad, con tres valores, 1 para los individuos
menores de 20 aos, 2 para los individuos entre 20 y 50 aos y 3 para los
individuos mayores de 50 aos.
Para la variable Sexo, dos valores, 0 para los hombres y 1 para las mujeres.
Y, finalmente, la variable Fumador, con dos valores, 0 para los individuos
que no fuman y 1 para los que s fuman.
As, los datos de los individuos de la tabla anterior sern los de la
Figura 1.2.
Figura 1.2
Con objeto de introducir el nombre de las variables, pincharemos con el Ratn
la pestaa de abajo Vista de variables, apareciendo un panel como el de la
Figura 1.3. Pinchando el 1, podremos teclear el nombre de las tres variables
as como sus principales caractersticas. Volveremos al editor de datos
pinchando en la pestaa inferior, Vista de datos.
Figura 1.3
En la barra de arriba (en Archivo) deberemos salvar nuestro fichero de datos.
Si nuestros datos estn ya en un archivo, debemos incluirlos en el Editor de
datos con la opcin: Archivo Abrir Datos (Figura 1.4)
10
Figura 1.4
11
Captulo 2
Estadstica Descriptiva
2.1. Distribuciones de Frecuencias, Representaciones Grficas,
Medidas de Posicin y Dispersin
El estudio de las tcnicas estudiadas aqu, puede seguirse en el Captulo 2
del texto CB.
Una de las ventajas de SPSS es que, de una vez, obtenemos la mayora de
los resultados en los que estamos interesados.
Ejemplo 2.1-CB ___________________________________________
Despus de introducir los datos, ejecutamos la secuencia
Analizar Estadsticos Descriptivos Frecuencias
Figura 2.1
12
Figura 2.2
Ahora, pasamos la variable en estudio, nivel, al cuadro de la derecha,
completamos lo estadsticos que queremos calcule en el botn Estadsticos,
que en nuestro caso hemos elegido segn la Figura 2.3
Figura 2.3
cerrando la ventana con el botn Continuar.
Lo mismo hacemos con el botn Grficos, con el que, en este caso, hemos
elegido las opciones que aparecen en la Figura 2.4,
13
Figura 2.4
Ya podemos ejecutar nuestras elecciones efectuadas con las anteriores
ventanas de dilogo, presionando el botn Aceptar. No obstante, queremos
sealar que, todo lo que hemos ido seleccionando, se ha ido traduciendo al
lenguaje SPSS dentro de lo que aparece en el botn Pegar, que si lo
presionamos aparecer, en este ejemplo,
FREQUENCIES
VARIABLES=nivel
/NTILES= 4
/STATISTICS=STDDEV VARIANCE RANGE MINIMUM MAXIMUM MEAN MEDIAN MODE
SKEWNESS
SESKEW KURTOSIS SEKURT
/HISTOGRAM NORMAL
/ORDER= ANALYSIS .
14
Estadsticos
nivel
N
Vlidos
34
Perdidos
Media
11,3529
Mediana
11,4500
Moda
12,50
Desv. tp.
1,87459
Varianza
3,514
Asimetra
,536
,403
Curtosis
,876
,788
Rango
8,70
Mnimo
7,80
Mximo
16,50
Percentiles
25
10,0500
50
11,4500
75
12,4000
nivel
Frecuencia
Vlidos
Porcentaje
Porcentaje
vlido
Porcentaje
acumulado
7,80
2,9
2,9
2,9
8,50
2,9
2,9
5,9
8,60
2,9
2,9
8,8
9,10
2,9
2,9
11,8
9,20
2,9
2,9
14,7
9,30
2,9
2,9
17,6
9,70
2,9
2,9
20,6
9,90
2,9
2,9
23,5
10,10
2,9
2,9
26,5
10,20
2,9
2,9
29,4
10,30
2,9
2,9
32,4
10,60
2,9
2,9
35,3
10,80
2,9
2,9
38,2
11,10
5,9
5,9
44,1
11,30
2,9
2,9
47,1
11,40
2,9
2,9
50,0
11,50
2,9
2,9
52,9
11,60
2,9
2,9
55,9
11,80
2,9
2,9
58,8
11,90
2,9
2,9
61,8
12,00
2,9
2,9
64,7
12,20
2,9
2,9
67,6
12,30
5,9
5,9
73,5
15
12,40
5,9
5,9
79,4
12,50
8,8
8,8
88,2
12,70
2,9
2,9
91,2
14,90
2,9
2,9
94,1
15,00
2,9
2,9
97,1
16,50
2,9
2,9
100,0
Total
34
100,0
100,0
Histograma
Frecuencia
Media =11,3529
Desviacin tpica =1,
87459
N =34
0
8,00
10,00
12,00
14,00
16,00
18,00
nivel
16
Figura 2.5
17
Captulo 3
Figura 3.1
18
Figura 3.2
El resultado obtenido es el siguiente:
Estadsticos para una muestra
N
Actividad
Desviacin
tp.
Media
35
,75300
,518283
Error tp. de
la media
,087606
Valor de prueba = 0
95% Intervalo de
confianza para la
diferencia
Actividad
t
8,595
gl
34
Sig. (bilateral)
,000
Diferencia
de medias
,753000
Inferior
,57496
Superior
,93104
19
Captulo 4
Anlisis de la Varianza
Figura 4.1
con lo que se abre la ventana de dilogo de la Figura 4.2
20
Figura 4.2
en la que seleccionamos definir, hacindolo segn la Figura 4.3
Figura 4.3
Ahora, con el botn Aceptar obtenemos los siguientes resultados,
21
dieta
Resumen del procesamiento de los casos
Casos
Vlidos
dieta
1
peso
Perdidos
Porcentaje
Total
Porcentaje
Porcentaje
100,0%
,0%
100,0%
100,0%
,0%
100,0%
100,0%
,0%
100,0%
peso
peso
36,00
33,00
30,00
dieta
22
Figura 4.4
La ventana de dilogo que aparece a continuacin se completa como se indica
Figura 4.5
23
N
dieta
Fuente
Modelo corregido
Suma de
cuadrados
tipo III
Media
cuadrtica
gl
Significacin
20,133(a)
10,067
1,144
,351
16800,267
16800,267
1909,121
,000
20,133
10,067
1,144
,351
Error
105,600
12
8,800
Total
16926,000
15
Interseccin
dieta
Total corregida
125,733
14
a R cuadrado = ,160 (R cuadrado corregida = ,020)
Fuente
Modelo corregido
Suma de
cuadrados
tipo III
154,920(a)
Interseccin
957,071
estimula
Media
cuadrtica
38,730
F
29,755
Significacin
,000
957,071
735,281
,000
29,755
,000
gl
154,920
38,730
Error
45,557
35
1,302
Total
1157,548
40
Total corregida
200,477
39
a R cuadrado = ,773 (R cuadrado corregida = ,747)
24
que indica rechazar la hiptesis nula de igualdad de los efectos medios de los
cinco estimulantes. Para ejecutar test de comparaciones mltiples elegimos el
botn Post hoc y completamos el cuadro de dilogo con varios de estos tests,
una vez trasladada la variable en estudio al cuadro de la derecha (Figura 4.6)
Figura 4.6
Los resultados as obtenidos (adems de la tabla ANOVA anterior) aparecen a
continuacin,
DHS de Tukey
(I) estimula
1
Diferencia
entre medias
(I-J)
-,0263
-2,2800(*)
Error tp.
,57045
,57045
Significacin
1,000
,003
Lmite inferior
-1,6663
-3,9201
Lmite
superior
1,6138
-,6399
-4,3900(*)
,57045
,000
-6,0301
-2,7499
-4,4363(*)
,57045
,000
-6,0763
-2,7962
,0263
,57045
1,000
-1,6138
1,6663
3
4
5
-2,2538(*)
-4,3638(*)
-4,4100(*)
,57045
,57045
,57045
,003
,000
,000
-3,8938
-6,0038
-6,0501
-,6137
-2,7237
-2,7699
2,2800(*)
,57045
,003
,6399
3,9201
2,2538(*)
,57045
,003
,6137
3,8938
-2,1100(*)
,57045
,006
-3,7501
-,4699
(J) estimula
2
3
5
4
Scheffe
25
1
2
-2,1563(*)
4,3900(*)
4,3638(*)
,57045
,57045
,57045
2,1100(*)
,57045
-,0463
,57045
4,4363(*)
,57045
2
3
4
4,4100(*)
2,1563(*)
,0463
2
3
4
5
,005
,000
,000
-3,7963
2,7499
2,7237
-,5162
6,0301
6,0038
,006
,4699
3,7501
1,000
-1,6863
1,5938
,000
2,7962
6,0763
,57045
,57045
,57045
,000
,005
1,000
2,7699
,5162
-1,5938
6,0501
3,7963
1,6863
-,0263
,57045
1,000
-1,8805
1,8280
-2,2800(*)
,57045
,009
-4,1342
-,4258
-4,3900(*)
,57045
,000
-6,2442
-2,5358
1
3
4
-4,4363(*)
,0263
-2,2538(*)
-4,3638(*)
,57045
,57045
,57045
,57045
,000
1,000
,010
,000
-6,2905
-1,8280
-4,1080
-6,2180
-2,5820
1,8805
-,3995
-2,5095
-4,4100(*)
,57045
,000
-6,2642
-2,5558
2,2800(*)
,57045
,009
,4258
4,1342
2,2538(*)
,57045
,010
,3995
4,1080
4
5
1
-2,1100(*)
-2,1563(*)
4,3900(*)
,57045
,57045
,57045
,018
,015
,000
-3,9642
-4,0105
2,5358
-,2558
-,3020
6,2442
4,3638(*)
,57045
,000
2,5095
6,2180
2,1100(*)
,57045
,018
,2558
3,9642
-,0463
,57045
1,000
-1,9005
1,8080
1
2
3
4,4363(*)
4,4100(*)
2,1563(*)
,57045
,57045
,57045
,000
,000
,015
2,5820
2,5558
,3020
6,2905
6,2642
4,0105
,0463
,57045
1,000
-1,8080
1,9005
Subconjuntos homogneos
insulina
Subconjunto
estimula
1
DHS de
Tukey(a,b)
N
8
1
2,6650
2,6913
Significacin
Scheffe(a,b)
4,9450
7,0550
7,1013
1,000
2,6650
2,6913
Significacin
1,000
1,000
4,9450
7,0550
7,1013
1,000
1,000
1,000
26
Figura 4.7
para completar luego el cuadro de dilogo como se indica en la Figura 4.8
27
Figura 4.8
Ahora con el botn Modelo elegimos la opcin Personalizado y, pasando las
variables a la ventana de la derecha, la opcin de Efectos principales, ya que
en el diseo por bloques no consideramos la posibilidad de interaccin entre
las variables. Con los botones Continuar y Aceptar obtenemos los siguientes
resultados,
Factores inter-sujetos
N
Vitamina
Raza
Fuente
Modelo corregido
Suma de
cuadrados
tipo III
Media
cuadrtica
gl
Significacin
165,000(a)
33,000
3,062
,103
94696,333
94696,333
8786,258
,000
Vitamina
84,667
42,333
3,928
,081
Raza
80,333
26,778
2,485
,158
Error
64,667
10,778
Total
94926,000
12
Interseccin
28
Total corregida
229,667
11
a R cuadrado = ,718 (R cuadrado corregida = ,484)
Figura 4.9
Hay muchas semejanzas con el caso anterior del diseo por bloques pero
ahora s se admite la interaccin entre variables, por lo que no hace falta
modificar el modelo; ahora lo requerimos completo. Por eso, presionando ya el
botn Aceptar, obtenemos los siguientes resultados, en donde la ltima tabla
es la misma de ANOVA obtenida en CB
29
Factores inter-sujetos
N
Estacin
Frmaco
12
12
12
12
16
16
16
Fuente
Modelo corregido
Suma de
cuadrados
tipo III
Media
cuadrtica
gl
Significacin
10488,167(a)
11
953,470
44,781
,000
93633,333
93633,333
4397,652
,000
Estacin
4132,167
1377,389
64,691
,000
Frmaco
6017,167
3008,583
141,303
,000
338,833
56,472
2,652
,031
Error
766,500
36
21,292
Total
104888,000
48
11254,667
47
Interseccin
Estacin * Frmaco
Total corregida
30
31
Captulo 5
Figura 5.1
32
Regresin lineal
6,00
cont_oxi
4,00
2,00
0,00
20,00
30,00
40,00
50,00
60,00
70,00
profund
33
Figura 5.2
Los resultados as obtenidos son los siguientes, en donde de nuevo destaca la
penltima tabla ANOVA y las estimaciones de los coeficientes de regresin de
la ltima tabla.
Regresin
Variables introducidas/eliminadas(b)
Modelo
1
Variables
introducidas
profund(a)
Variables
eliminadas
Mtodo
Introducir
Modelo
1
R cuadrado
R cuadrado
corregida
,896(a)
,803
a Variables predictoras: (Constante), profund
,763
Error tp. de la
estimacin
1,20444
ANOVA(b)
Modelo
1
Suma de
cuadrados
Regresin
Residual
Total
Media
cuadrtica
gl
29,481
29,481
7,253
1,451
36,734
Sig.
20,322
,006(a)
34
b Variable dependiente: cont_oxi
Coeficientes(a)
Coeficientes
estandarizado
s
Coeficientes no
estandarizados
Modelo
1
Error tp.
(Constante)
8,631
1,077
profund
-,108
,024
Beta
-,896
Sig.
8,010
,000
-4,508
,006
Figura 5.3
Las tres ltimas tablas que as se obtienen,
35
ANOVA(c)
Modelo
1
Media
cuadrtica
1251,195
440,543
12
36,712
Total
2942,933
14
Regresin
2502,373
2502,373
440,561
13
33,889
2942,933
14
Regresin
Residual
Residual
Total
Suma de
cuadrados
2502,390
gl
F
34,081
Sig.
,000(a)
73,840
,000(b)
Coeficientes(a)
Coeficientes
estandarizado
s
Coeficientes no
estandarizados
Modelo
1
B
2,086
Error tp.
6,739
,309
Sig.
,762
X1
,057
2,613
,006
,022
,983
X2
1,050
,326
,916
3,219
,007
(Constante)
1,977
1,057
4,373
,123
,922
,452
8,593
,659
,000
(Constante)
X2
a Variable dependiente: Y
Beta
Variables excluidas(b)
Estadsticos de
colinealidad
Modelo
2
Beta dentro
X1
Sig.
,006(a)
,022
a Variables predictoras en el modelo: (Constante), X2
b Variable dependiente: Y
Correlacin
parcial
,983
,006
Tolerancia
,154
36
37
Captulo 6
Tablas de Contingencia
Figura 6.1
38
Figura 6.2
Ahora ya podemos realizar el Anlisis de la tabla de contingencia ejecutando la
secuencia (Figura 6.3)
Analizar Estadsticos descriptivos Tablas de contingencia
Figura 6.3
Ahora debemos completar el cuadro de dilogo que se abre, teniendo en
cuenta cul variable forma las filas y cul las columnas. Adems, con el botn
Estadsticos, le pedimos el Chi-cuadrado de Pearson, que es el utilizado en
CB (Figura 6.4)
39
Figura 6.4
Por ltimo, en el botn Casillas le podemos pedir no slo las frecuencias
observadas sino las esperadas de cada casilla. (Figura 6.5)
Figura 6.5
40
Tablas de contingencia
Resumen del procesamiento de los casos
Casos
Vlidos
N
Comunidad * Fumador
300
Perdidos
Porcentaje
100,0%
N
0
Total
Porcentaje
,0%
N
300
Porcentaje
100,0%
Recuento
Frecuencia esperada
Recuento
Frecuencia esperada
Recuento
Frecuencia esperada
Total
Recuento
Frecuencia esperada
13
2
87
Total
100
16,0
84,0
100,0
17
83
100
16,0
84,0
100,0
18
82
100
16,0
84,0
100,0
48
252
300
48,0
252,0
300,0
Pruebas de chi-cuadrado
Valor
Chi-cuadrado de Pearson
Razn de verosimilitudes
Asociacin lineal por lineal
N de casos vlidos
1,042(a)
1,069
,927
Sig. asinttica
(bilateral)
gl
2
2
1
,594
,586
,336
300
a 0 casillas (,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada es 16,00.
destacando la ltima tabla en la que aparece el valor del estadstico chicuadrado de Pearson, 1042 y el p-valor del test, 0594, los mismos valores que
en CB.
41
Figura 6.6
ponderndolos en este caso con la variable frecuen. Ahora ya podemos
ejecutar el Anlisis de la tabla de contingencia ejecutando la secuencia (Figura
6.7)
Analizar Estadsticos descriptivos Tablas de contingencia
Figura 6.7
42
sin olvidar completar, como antes, los botones Estadsticos y Celdas. Los
resultados as obtenidos son los siguientes:
Tablas de contingencia
Resumen del procesamiento de los casos
Casos
Vlidos
N
deterior * depresio
100
Perdidos
Porcentaje
100,0%
N
0
Total
Porcentaje
,0%
N
100
Porcentaje
100,0%
,00
Recuento
Frecuencia esperada
1,00
Recuento
Frecuencia esperada
Total
31
53
16,4
36,6
53,0
38
47
14,6
32,4
47,0
Recuento
Frecuencia esperada
Total
1,00
22
31
69
100
31,0
69,0
100,0
Pruebas de chi-cuadrado
Valor
Chi-cuadrado de Pearson
Sig. asinttica
(bilateral)
gl
5,823(b)
,016
Correccin por
continuidad(a)
4,824
,028
Razn de verosimilitudes
5,975
,015
Estadstico exacto de
Fisher
Asociacin lineal por lineal
N de casos vlidos
Sig. exacta
(bilateral)
,018
5,764
Sig. exacta
(unilateral)
,013
,016
100
43
Figura 6.8
y ponderamos los datos de la variable CLASES con la variable FRECU.
Ahora ejecutamos la secuencia
Analizar -> Pruebas no paramtricas -> chi-cuadrado
apareciendo el cuadro de dilogo de la Figura 6.9 que completamos segn se
indica en ella,
44
Figura 6.9
Presionado el botn Aceptar se obtiene el valor del estadstico de Pearson,
047 como en el texto CB,
Prueba de chi-cuadrado
Frecuencias
CLASES
N observado
N esperado
Residual
315
312,8
2,3
108
104,3
3,8
101
104,3
-3,3
32
34,8
-2,8
Total
556
Estadsticos de contraste
CLASES
Chi-cuadrado
Gl
Sig. asintt.
,470
3
,925
Estadsticos de contraste
CLASES
Chi-cuadrado
Gl
Sig. asintt.
,470
3
,925
45
46
47
Captulo 7
Figura 7.1
Una vez incluidas todas las variables a utilizar en el Anlisis, incluyndolas
en el cuadro de la derecha con la flecha, es importante comprobar que en
Extraccin se utilice la opcin Componentes Principales y Grfico de
sedimentacin (Figura 7.2). Una vez seleccionadas stas, SPSS se ejecuta
con el botn Aceptar que aparece en dicha Figura 7.2.
48
Figura 7.2
A. factorial
Comunalidades
Inicial
Extraccin
X1
1,000
,973
X2
1,000
,747
X3
1,000
,817
X4
1,000
,862
X5
1,000
,945
X6
1,000
,597
X7
1,000
,781
X8
1,000
,969
49
Autovalores iniciales
Total
2,686
% de la
varianza
33,577
% acumulado
33,577
Total
2,686
% de la
varianza
33,577
% acumulado
33,577
1,862
23,275
56,852
1,862
23,275
56,852
1,112
13,905
70,757
1,112
13,905
70,757
1,030
12,881
83,637
1,030
12,881
83,637
,619
7,740
91,377
,367
4,591
95,968
,277
3,467
99,436
Componente
1
,045
,564
100,000
Mtodo de extraccin: Anlisis de Componentes principales.
[1]
[2]
Grfico de sedimentacin
3,0
2,5
Autovalor
2,0
1,5
1,0
0,5
0,0
1
Nmero de componente
50
Matriz de componentes(a)
Componente
1
X1
,753
,450
,445
-,070
X2
-,704
,363
,093
-,332
X3
-,113
,872
-,176
,118
X4
,064
,764
-,443
,279
X5
,803
,273
,470
-,078
X6
,629
-,159
-,392
,149
X7
-,719
,255
,445
,026
X8
-,222
-,140
,326
,891
Los resultados obtenidos al ejecutar SPSS son ficheros que pueden ser
salvados y reutilizados.
51
Captulo 8
Anlisis de Correspondencias
Figura 8.1
52
Figura 8.2
Ahora ya tenemos preparados los datos para realizar un Anlisis de
Correspondencias. Para ello ejecutaremos la secuencia:
Analizar Reduccin de datos Anlisis de correspondencias (Figura 8.3).
Figura 8.3
53
Figura 8.4
Con estas opciones obtenemos los siguientes resultados,
Correspondencias
Tabla de correspondencias
Bebe
Madre
jnf
jf
mnf
mf
Margen activo
pm
pv
Gcm
24
gcv
4012
Margen activo
4401
50
315
40
459
514
41
147
14
1594
1796
11
124
140
104
513
45
6189
6851
[1]
54
Resumen
Proporcin de inercia
Corre
Dimensin
1
Valor propio
Inercia
Chi-cuadrado
Sig.
Explicada
,050
,003
,908
,016
,000
,004
,000
Total
,003
19,109
,024(a)
Desviacin
tpica
Acumulada
,908
,013
,087
,995
,015
,005
1,000
1,000
1,000
a 9 grados de libertad
[2]
Puntuacin en la dimensin
Contribucin
De los puntos a la inercia
de la dimensin
Madre
jnf
Masa
,642
-,165
jf
,075
mnf
,262
mf
,020
Total activo
Inercia
-,015
,001
,347
,009
,997
,003
,190
,418
,000
,054
,840
,400
,599
,313
-,063
,001
,511
,066
,986
,012
,465
-,253
,000
,088
,084
,877
,081
,003
1,000
1,000
1,000
a Normalizacin Simtrica
Puntuacin en la dimensin
Contribucin
De los puntos a la inercia
de la dimensin
Bebe
pm
Masa
,015
1,562
pv
,075
gcm
,007
,903
gcv
Total activo
1,000
a Normalizacin Simtrica
Inercia
-,360
,002
,736
,126
,983
,016
,265
-,008
,000
,105
,000
,960
,000
,899
1,441
,000
,106
,873
,556
,443
-,055
-,004
,000
,054
,001
,994
,001
,003
1,000
1,000
55
Simtrica Normalizacin
1,5
gcm
Bebe
Madre
Dimensin 2
1,0
0,5
jf
jnf gcv
0,0
pv
mnf
mf
pm
-0,5
-0,2
0,0
0,2
0,4
0,6
0,8
1,0
1,2
1,4
1,6
Dimensin 1
[3]
En [1] puede comprobarse que la tabla de doble entrada ha sido bien
creada. La inercia acumulada puede verse en [2] . A continuacin aparecen
las coordenadas suministradas pos SPSS (algo distintas que las obtenidas con
el software del curso) y, por ltimo, en [3] , el grfico, principal objetivo del
Anlisis, ampliamente comentado en TA.
56
57
Captulo 9
Anlisis Discriminante
Figura 9.1
Ejemplo 6.1-TA ___________________________________________
Despus de introducir los datos ejecutamos la secuencia que aparece en la
Figura 9.1:
Analizar Clasificar Discriminante
58
Figura 9.2
Las otras variables, X1, ,X5 se incluyen en la ventana Independientes. Si se
quiere obtener la Funcin Discriminante lineal de Fisher, se debe seleccionar
esta opcin en el botn Estadsticos (Figura 9.3).
Figura 9.3
Con esta seleccin obtendramos los siguientes resultados,
59
Discriminante
Resumen del procesamiento para el anlisis de casos
Casos no ponderados
Vlidos
Excluidos
N
Cdigos de grupo
perdidos o fuera de
rango
Perdida al menos una
variable discriminante
Perdidos o fuera de
rango ambos, el
cdigo de grupo y al
menos una de las
variables
discriminantes.
Total excluidos
Casos Totales
Estadsticos de grupo
x6
1,0
2,0
Total
17
17,000
x2
17
17,000
x3
17
17,000
x4
17
17,000
x5
17
17,000
x1
15
15,000
x2
15
15,000
x3
15
15,000
x4
15
15,000
x5
15
15,000
x1
32
32,000
x2
32
32,000
x3
32
32,000
x4
32
32,000
x5
32
32,000
32
Porcentaje
100,0
,0
,0
,0
,0
32
100,0
60
Anlisis 1
Resumen de las funciones cannicas discriminantes
Autovalores
Funcin
1
Autovalor
% de varianza
Correlacin
cannica
% acumulado
,930(a)
100,0
100,0
,694
a Se han empleado las 1 primeras funciones discriminantes cannicas en el anlisis.
Lambda de Wilks
Contraste de
las funciones
1
Lambda de
Wilks
,518
Chi-cuadrado
18,083
gl
5
Sig.
,003
,367
x2
-,578
x3
-,017
x4
,405
x5
,627
Matriz de estructura
Funcin
1
x4
,830
x1
,759
x5
,578
x3
,246
x2
-,048
Correlaciones intra-grupo combinadas entre las variables discriminantes y las funciones discriminantes
cannicas tipificadas Variables ordenadas por el tamao de la correlacin con la funcin.
Funciones en los centroides de los grupos
Funcin
x6
1,0
1
-,877
2,0
,994
61
Estadsticos de clasificacin
Coeficientes de la funcin de clasificacin
x6
1,0
2,0
x1
1,468
1,558
x2
2,361
2,205
x3
2,752
2,747
x4
,775
,952
x5
(Constante)
,195
,372
-514,956
-545,419
[1]
Al final de dichos resultados, en [1] , aparecen los coeficientes cuya
diferencia son los obtenidos en TA: 1,468-1,558 = -009, 2,361-2,205=0156,
2,752-2,747=0005, 0,775-0,952=-0177, 0,195-0,372=-0177.
62
63
Captulo 10
Anlisis de Conglomerados
10.1. Introduccin
Como sabemos, existen, bsicamente, dos mtodos de Anlisis Cluster: uno
es el Anlisis Jerrquico y otro el Algoritmo k-medias. Analizaremos estos dos
mtodos en dos secciones separadas.
Figura 10.1
64
Figura 10.2
Para formar los clusters utilizando un Agrupamiento centroide, seleccionamos
en el botn Mtodo las tres opciones que aparecen en la Figura 10.3,
Figura 10.3
65
Conglomerados jerrquicos
Advertencia
La medida eucldea al cuadrado debera emplearse cuando se solicite el mtodo de
conglomeracin CENTROID, MEDIAN o WARD.
Perdidos
Porcentaje
5
100,0
a distancia eucldea usada
b Vinculacin de centroides
Total
Porcentaje
0
Porcentaje
,0
100,0
Vinculacin de centroides
Historial de conglomeracin
Etapa en la que el
conglomerado aparece
por primera vez
Conglomerado que se
combina
Etapa
1
Conglomer
ado 1
Conglomer
ado 2
Coeficientes
Conglomer
ado 1
Conglomer
ado 2
Prxima
etapa
10,770
11,180
10,701
62,556
[1]
[3]
66
Nmero de
conglomerados
1
2
X
Dendrograma
* * * * * * H I E R A R C H I C A L
* * * * *
C L U S T E R
A N A L Y S I S *
0
5
10
15
20
25
+---------+---------+---------+---------+---------+
67
Figura 10.4
Ejemplo 5.6-TA ___________________________________________
Despus de introducir los datos y ejecutar la secuencia anterior, incluimos las
dos variables en anlisis (Figura 10.5)
Figura 10.5
68
Con el botn Guardar seleccionamos las dos opciones que permite (Figura
10.6)
Figura 10.6
Con el botn Opciones seleccionamos las marcadas en la Figura 10.7
Figura 10.7
69
1
189,00
2
170,00
sueldo
100,00
180,00
Historial de iteraciones(a)
Cambio en los centros
de los conglomerados
Iteracin
1
5,385
8,333
,000
,000
a Se ha logrado la convergencia debido a que los centros de los conglomerados no presentan ningn
cambio o ste es pequeo. El cambio mximo de coordenadas absolutas para cualquier centro es de ,000.
La iteracin actual es 2. La distancia mnima entre los centros iniciales es de 82,225.
talla
187,00
175,00
sueldo
105,00
173,33
ANOVA
talla
sueldo
Conglomerado
Media
cuadrtica
gl
172,800
5603,333
1
1
Error
Media
cuadrtica
19,333
55,556
gl
3
F
8,938
Sig.
,058
100,860
,002
Las pruebas F slo se deben utilizar con una finalidad descriptiva puesto que los conglomerados han sido
elegidos para maximizar las diferencias entre los casos en diferentes conglomerados. Los niveles crticos
no son corregidos, por lo que no pueden interpretarse como pruebas de la hiptesis de que los centros de
los conglomerados son iguales.
70
Conglomerad
o
Vlidos
Perdidos
2,000
3,000
5,000
,000
71
Captulo 11
11.1. Introduccin
El Anlisis de Series Temporales se estudia en el Captulo 13 de TA y en el
7 de TAEA.
Figura 11.1
72
Obtenemos los siguientes resultados en donde se observa que los dos ltimos
grficos se corresponden exactamente con las Figuras 13.2 y 13.4 del texto TA,
funciones ACF y PACF respectivamente, con la excepcin del primer valor que,
como all dijimos, es siempre igual a 1 y que aqu desaparece.
Autocorrelaciones simples
MODEL:
MOD_2.
Autocorrelations:
niveles
Auto- Stand.
Lag Corr.
Err. -1 -.75 -.5 -.25
0
.25 .5
.75
1
Ljung Prob.
1
,576
,140
16,914
,000
2
,182
,138
18,639
,000
3 -,145
,137
19,756
,000
4 -,175
,135
21,423
,000
5 -,150
,134
22,673
,000
6 -,021
,132
22,698
,001
7 -,020
,131
22,722
,002
8 -,004
,129
22,723
,004
9 -,136
,127
23,856
,005
10 -,154
,126
25,351
,005
11 -,097
,124
25,964
,007
12
,049
,122
26,124
,010
13
,120
,121
27,104
,012
14
,087
,119
27,635
,016
15
,119
,117
28,663
,018
16
,151
,115
30,374
,016
Plot Symbols:
Total cases:
*****.******
**** .
. ***
. ***
. ***
. ***
. ***
**
**
**
*** .
Autocorrelations *
48
**
Box-
47
Partial Autocorrelations:
Lag
73
niveles
Pr-Aut- Stand.
Corr.
Err. -1 -.75 -.5 -.25
0
.25 .5
.75
1
*****.******
,576
,144
-,223
,144
. ****
-,227
,144
.*****
,103
,144
-,076
,144
,068
,144
7
8
9
10
11
-,104
,012
-,188
,003
,066
,144
,144
,144
,144
,144
.
**
.
*
. ****
.
*
.
*
.
.
.
.
.
12
13
14
,032
,022
-,093
,144
,144
,144
.
.
.
*
*
**
.
.
.
15
,230
,144
*****.
16
,044
,144
Plot Symbols:
Total cases:
Autocorrelations *
48
.
.
**
**
.
.
.
Two Standard Error Limits .
47
74
niveles
Coeficiente
1,0
Lmite superior
de confianza
Lmite inferior
de confianza
ACF
0,5
0,0
-0,5
-1,0
1
9 10 11 12 13 14 15 16
No de retardos
75
niveles
Coeficiente
1,0
Lmite superior
de confianza
Lmite inferior
de confianza
ACF parcial
0,5
0,0
-0,5
-1,0
1
9 10 11 12 13 14 15 16
No de retardos
76
Figura 11.2
Figura 11.3
Antes de preceder a ejecutar el Anlisis, es conveniente modificar un tanto
las Opciones, eligiendo las que aparecen en la Figura 11.4. En concreto, en lo
que se refiere al nmero de iteraciones (aumentndolo), a los niveles de
tolerancia (disminuyndolos) y a la eliminacin de los clculos intermedios, de
manera que slo nos d las estimaciones finales.
77
Figura 11.4
Con estas selecciones, pulsando los botones Continuar y luego Aceptar,
se obtuvieron los siguientes resultados, en donde pueden verse, en [1] , los
valores de las estimaciones obtenidas, las mismas que en TA pero con el signo
cambiado la del coeficiente de la Media Mvil. En [2] aparece el valor del
logaritmo de la verosimilitud alcanzada y, en [3] , el de la cantidad de
informacin de Akaike.
Arima
MODEL:
MOD_1
48
,45291761
-28,798731
63,597462
69,211065
[2]
[3]
78
Analysis of Variance:
Residuals
DF
Residual Variance
45
9,3163187
,20513437
AR1
MA1
CONSTANT
SEB
T-RATIO
APPROX. PROB.
,4478397
-,2041347
2,4100066
,22299179
,24527657
,13973742
2,008324
-,832263
17,246680
,05063335
,40965538
,00000000
[1]
The following new variables are being created:
Name
FIT_1
ERR_1
LCL_1
UCL_1
SEP_1
Label
Fit for niveles from ARIMA, MOD_1 CON
Error for niveles from ARIMA, MOD_1 CON
95% LCL for niveles from ARIMA, MOD_1 CON
95% UCL for niveles from ARIMA, MOD_1 CON
SE of fit for niveles from ARIMA, MOD_1 CON
79
Captulo 12
Regresin Logstica
Figura 12.1
80
Figura 12.2
Al correr ahora el programa, presionando el botn Aceptar, se obtienen los
siguientes resultados
Regresin logstica
Resumen del procesamiento de los casos
Casos no ponderados(a)
Casos seleccionados
N
Incluidos en el anlisis
Casos perdidos
Total
Casos no seleccionados
Total
50
Porcentaje
100,0
,0
50
100,0
,0
50
100,0
a Si est activada la ponderacin, consulte la tabla de clasificacin para ver el nmero total de casos.
Valor interno
0
1
81
[1]
presion
angina
Frecuencia
9
(1)
1,000
(2)
,000
1,00
12
,000
1,000
,000
2,00
19
,000
,000
1,000
3,00
10
,000
,000
,000
,00
24
1,000
1,00
26
,000
,00
1,000
1,00
43
,000
,00
(3)
,000
Pronosticado
infarto
,00
Paso 0
infarto
Porcentaje
correcto
1,00
,00
17
,0
1,00
33
100,0
Porcentaje global
66,0
Variables en la ecuacin
B
Paso 0
Constante
E.T.
,299
,663
Wald
4,936
gl
1
Sig.
,026
Exp(B)
1,941
Paso 0
Variables
Sig.
,398
activi(1)
2,273
,132
activi(2)
,570
,450
activi(3)
,806
,369
angina(1)
1,410
,235
presion(1)
3,566
,059
,230
,632
7,395
,286
Activi
Edad
Estadsticos globales
Puntuacin
2,957
gl
82
Paso
2(a)
Paso
3(a)
Paso
4(a)
gl
Sig.
Paso
8,441
,208
Bloque
8,441
,208
Modelo
8,441
,208
-2,171
,538
Bloque
6,270
,099
Modelo
6,270
,099
Paso
-,707
,400
Bloque
5,563
,062
Modelo
5,563
,062
Paso
Paso
-1,912
,167
Bloque
3,650
,056
Modelo
3,650
,056
a Un valor de chi-cuadrado negativo indica que ha disminuido el valor de chi-cuadrado con respecto al
paso anterior.
-2 log de la
verosimilitud
55,662(a)
R cuadrado de
Cox y Snell
,155
R cuadrado
de
Nagelkerke
,215
57,834(a)
,118
,163
58,541(a)
,105
,146
Paso
1
60,453(b)
,070
,097
a La estimacin ha finalizado en el nmero de iteracin 5 porque las estimaciones de los parmetros han
cambiado en menos de ,001.
b La estimacin ha finalizado en el nmero de iteracin 4 porque las estimaciones de los parmetros han
cambiado en menos de ,001.
Tabla de clasificacin(a)
Observado
Pronosticado
infarto
,00
Paso 1
infarto
Porcentaje
correcto
1,00
,00
12
29,4
1,00
32
97,0
Porcentaje global
Paso 2
infarto
74,0
,00
10
41,2
1,00
29
87,9
Porcentaje global
Paso 3
infarto
72,0
,00
12
70,6
1,00
10
23
69,7
,00
17
,0
1,00
33
100,0
Porcentaje global
Paso 4
infarto
Porcentaje global
70,0
66,0
83
Variables en la ecuacin
B
Paso
1(a)
gl
3
Sig.
,559
Exp(B)
-1,221
1,127
1,174
,279
,295
activi(2)
,017
1,036
,000
,987
1,017
activi(3)
,088
,919
,009
,924
1,092
2,111
1,408
2,248
,134
8,260
1,178
,703
2,812
,094
3,249
-,038
,039
,978
,323
,962
2,083
2,223
,877
,349
8,026
1,633
1,204
1,840
,175
5,120
1,328
,671
3,916
,048
3,773
-,030
,036
,691
,406
,971
1,429
1,808
,625
,429
4,174
,218
4,148
,054
3,500
,931
,964
,064
3,257
,695
1,167
presion(1
)
edad
Paso
3(a)
Wald
2,063
activi(1)
angina(1)
Paso
2(a)
E.T.
activi
Constant
e
angina(1)
presion(1
)
edad
Constant
e
angina(1)
1,423
1,154
1,520
presion(1
1,253
,651
3,699
)
Constant
-,036
,421
,007
e
Paso
presion(1
1,181
,638
3,423
4(a)
)
Constant
,154
,393
,154
e
a Variable(s) introducida(s) en el paso 1: activi, angina, presion, edad.
Variables que no estn en la ecuacin
Puntuacin
Paso 2(a)
Variables
2,187
,534
2,171
,141
activi(2)
,099
,753
,462
,497
Estadsticos globales
2,187
,534
Variables
Activi
1,894
,595
activi(1)
1,744
,187
activi(2)
,177
,674
activi(3)
,512
,474
Edad
,706
,401
2,816
,589
Activi
1,567
,667
activi(1)
1,163
,281
activi(2)
,153
,696
activi(3)
,631
,427
1,699
,192
,281
,596
4,107
,534
Estadsticos globales
Paso 4(c)
Sig.
activi(1)
activi(3)
Paso 3(b)
gl
Activi
Variables
angina(1)
Edad
Estadsticos globales
a Variable(s) eliminada(s) en el paso 2: activi.
84
b Variable(s) eliminada(s) en el paso 3: edad.
c Variable(s) eliminada(s) en el paso 4: angina.
[2]
85
Captulo 13
Regresin Poisson
Figura 13.1
86
.
Figura 13.2
A continuacin, en el botn Modelo, elegimos la opcin Personalizado y
completamos la ventana de la derecha desplazando las dos covariables como
Efectos principales (Figura 13.3).
Figura 13.3
87
Figura 13.4
Una vez aceptadas stas con el botn Continuar y ejecutando todas las
selecciones con el botn Aceptar de la ventana de dilogo principal,
obtenemos los resultados que aparecen a continuacin,
Loglineal general
Informacin sobre los datos
N
Casos
Vlidos
Perdidos
Casillas
Vlidos
ponderados
Casillas definidas
Categoras
Ceros
estructurales
Ceros de
muestreo
edad
6
6
0
0
3
sexo
20
,00100
88
Mxima diferencia
absoluta final
,00013(c)
Mxima diferencia
relativa final
,00078
Nmero de iteraciones
a Modelo: Poisson
b Diseo: Constante + edad + sexo
c La iteracin ha convergido ya que el mximo de cambios absolutos de las estimaciones de los
parmetros es inferior al criterio de convergencia especificado.
Contrastes de bondad de ajuste(a,b)
Razn de verosimilitudes
Valor
,004
Chi-cuadrado de Pearson
,004
gl
2
Sig.
,998
,998
[3]
a Modelo: Poisson
b Diseo: Constante + edad + sexo
Esperado
sexo
,00
Recuento
1
%
16,7%
Recuento
,976
%
16,3%
Residual
,024
Residuo
tipificado
,024
Residuo
corregido
,041
1,00
16,7%
1,024
17,1%
-,024
-,023
-,041
-,023
,00
16,7%
1,038
17,3%
-,038
-,037
-,066
-,038
1,00
16,7%
,962
16,0%
,038
,039
,066
,039
,00
16,7%
,985
16,4%
,015
,015
,025
,015
16,7%
1,015
16,9%
-,015
-,014
-,025
-,014
1,00
1
a Modelo: Poisson
b Diseo: Constante + edad + sexo
Estimacin
Error tpico
Sig.
Lmite
superior
Lmite inferior
2,540
,814
3,122
,002
,946
4,135
[edad = 1,00]
-,328
1,000
-,328
,743
-2,288
1,632
[edad = 2,00]
-,171
1,000
-,171
,864
-2,131
1,789
[edad = 3,00]
0(a)
[sexo = ,00]
-,029
,817
-,036
,972
-1,630
1,572
[sexo = 1,00]
0(a)
[1]
[2]
[edad = 1,00]
[edad = 2,00]
[sexo = ,00]
Desviacin
,024
Constante
[edad = 1,00]
[edad = 2,00]
89
-,616
-,604
-,616
,500
,004
-,604
,500
-,022
-,022
[sexo = ,00]
-,495
,004
a Modelo: Poisson
b Diseo: Constante + edad + sexo
c Los parmetros redundantes no se muestran.
-,495
[edad = 1,00]
-,501
[edad = 1,00]
-,501
1,000
,500
,003
[edad = 2,00]
-,491
,500
1,000
-,018
[sexo = ,00]
-,329
,003
-,018
,667
Constante
[edad = 2,00]
-,491
[sexo = ,00]
-,329
a Modelo: Poisson
b Diseo: Constante + edad + sexo
c Los parmetros redundantes no se muestran.
Residuos corregidos
Frecuencias ...
Frecuencias ...
Modelo de Poisson
Frecuencias ...
Frecuencias ...
Residuos corregidos
90
1,5
1,0
0,5
0,0
-0,5
-1,0
-1,5
-0,075
-0,050
-0,025
0,000
0,025
0,050
0,075
Residuos corregidos
0,3
Desviacin de normal
0,2
0,1
0,0
-0,1
-0,2
-0,3
-0,075
-0,050
-0,025
0,000
0,025
0,050
0,075
Residuos corregidos
91
92
93
Captulo 14
14.1. Introduccin
Para realizar cualquier anlisis, primero debemos incluir los datos en el
Editor de Datos de la forma habitual
Ejemplo 2.1. Cuadernos de Estadstica Aplicad: rea de la Salud (ratas.sav)
Primero incorporamos los datos utilizando tres variables: los Das, que es la
variable en observacin, el Grupo, 1 2, y el Estatus, de valores, 2 para los
individuos no censurados y el 1 para los censurados, como puede apreciarse
en la Figura 14.1.
Figura 14.1
94
Figura 14.2
con lo que nos aparecer el cuadro de dilogo de la Figura 14.3, que hemos
completado incluyendo en Hora, la variable en observacin Das. En Intervalos
de Tiempo elegimos el extremo superior, 400, y pedimos que los intervalos
tengan amplitud 5
Figura 14.3
95
Figura 14.4
Finalmente, con el botn Aceptar, obtenemos los siguientes resultados
Tabla de mortalidad
intervalo
Grupo
Nmero que
Nmero que
Nmero
Nmero de
entra en el
sale en el
expuesto a
eventos
Proporcin que
intervalo
intervalo
riesgo
terminales
termina
19
19,000
Proporci
sobre
,00
96
30
19
19,000
,00
60
19
19,000
,00
90
19
19,000
,00
120
19
19,000
,05
150
18
18,000
,06
180
17
17,000
,35
210
11
10,500
,57
240
3,500
,57
270
1,000
,00
300
1,000
1,00
21
21,000
,00
30
21
21,000
,00
60
21
21,000
,00
90
21
21,000
,00
120
21
21,000
,05
150
20
20,000
,10
180
18
17,500
,11
210
15
15,000
,47
240
8,000
,25
270
6,000
,67
300
2,000
,50
330
,500
,00
Tiempo med.
1
217,159
231,947
97
98
99
Comparaciones globales
Estadstico de Wilcoxon
(Gehan)
gl
2,571
Sig.
1
,109
Figura 14.5
con lo que aparece el cuadro de dilogo de la Figura 14.6, en el que hemos
100
Figura 14.6
incorporado en la ventana Horas la variable en observacin Das; en la ventana
Estado hemos incluido la variable que nos indica si el dato es censurado o no,
es decir, la variable Estatus, indicando que es 2 el valor de sta que nos
proporciona los Datos no censurados. Finalmente, en la ventana Factor, hemos
incorporado la variable que forma los grupos a comparar.
Con el botn Comparar Factores indicamos los estadsticos a utilizar en la
comparacin de los dos grupos. Hemos elegido los tres posibles (Figura 14.7).
Figura 14.7
Despus de elegir el botn Continuar, en el botn Opciones, le marcamos slo
la opcin de los Grficos de Supervivencia (Figura 14.8).
101
Figura 14.8
Ahora, presionando los botones Continuar, Aceptar, obtenemos los siguientes
resultados:
N total
N de eventos
Porcentaje
19
17
10,5%
21
19
9,5%
Global
40
36
10,0%
Comparaciones globales
Chi-cuadrado
Gl
Sig.
3,123
,077
2,651
,103
Tarone-Ware
2,977
,084
102
103
Captulo 15
15.1. Introduccin
Para realizar cualquier anlisis, primero debemos incluir los datos en el
Editor de Datos de la forma habitual.
Ejemplo 2.2. Cuadernos de Estadstica Aplicad: rea de la Salud (globulos.sav)
Primero incorporamos los datos como puede apreciarse en la Figura 15.1.
Figura 15.1
104
Figura 15.2
Completamos en cuadro de dilogo como se indica en la Figura 15.3
Figura 15.3
105
Regresin de Cox
Notas
Resultados creados
27-abr-2011 20:21:47
Comentarios
Entrada
Datos
G:\charlas\globulos.sav
Conjunto_de_datos1
Filtro
<ninguno>
Peso
<ninguno>
Segmentar archivo
<ninguno>
Definicin de perdidos
33
Los valores perdidos definidos por el usuario se
consideran perdidos.
Sintaxis
COXREG Tiempos
/STATUS=estatus(2)
/STRATA=Poblacion
/METHOD=BSTEP(WALD) globulos
/CRITERIA=PIN(.05) POUT(.10) ITERATE(20).
Recursos
Tiempo de procesador
00 00:00:00,016
Tiempo transcurrido
00 00:00:00,015
[Conjunto_de_datos1] G:\charlas\globulos.sav
Eventoa
33
100,0%
,0%
33
100,0%
,0%
,0%
,0%
,0%
33
100,0%
Censurado
Total
Casos excluidos
Porcentaje
ms temprano en un estrato
Total
Total
106
33
100,0%
,0%
33
100,0%
,0%
,0%
,0%
,0%
33
100,0%
Censurado
Total
Casos excluidos
Porcentaje
ms temprano en un estrato
Total
Total
a. Variable dependiente: Tiempos
Evento
Censurado
Porcentaje censurado
17
,0%
16
,0%
Total
33
,0%
verosimilitud
127,593
129,705
1
2
Global (puntuacin)
Chi-cuadrado
2,338
gl
Chi-cuadrado
,126
gl
Cambio desd
Sig.
Chi-cuadrado
2,112
,146
2,112
2,112
,146
,000
107
-2 log de la
Paso
verosimilitud
1a
127,593
129,705
Chi-cuadrado
gl
2,338
Chi-cuadrado
,126
gl
Cambio desd
Sig.
Chi-cuadrado
2,112
,146
2,112
2,112
,146
,000
Variables en la ecuacin
B
Paso 1
globulos
ET
,008
Wald
,005
gl
2,275
Sig.
1
Exp(B)
,132
1,008
globulos
2,338
gl
Sig.
1
,126
29,165
108
Figura 15.4
con lo que la matriz de datos es la de la Figura 15.5
Figura 15.5
Ahora repetimos el proceso anterior analizando si la nueva variable es
significativa para explicar la variable Tiempos. Primero completamos el cuadro
de dilogo, Figura 15.6,
109
Figura 15.6
obteniendo ahora los siguientes resultados, en donde se aprecia en el ltimo
test que s es significativa esta nueva covariable.
Regresin de Cox
Notas
Resultados creados
27-abr-2011 20:32:32
Comentarios
Entrada
Datos
G:\charlas\globulos.sav
Conjunto_de_datos1
Filtro
<ninguno>
Peso
<ninguno>
Segmentar archivo
<ninguno>
Definicin de perdidos
33
Los valores perdidos definidos por el usuario se
consideran perdidos.
Sintaxis
COXREG Tiempos
/STATUS=estatus(2)
/STRATA=Poblacion
/METHOD=BSTEP(WALD) logglo
/CRITERIA=PIN(.05) POUT(.10) ITERATE(20).
Recursos
Tiempo de procesador
00 00:00:00,016
Tiempo transcurrido
00 00:00:00,014
110
[Conjunto_de_datos1] G:\charlas\globulos.sav
Resumen del proceso de casos
N
a
Evento
33
100,0%
,0%
33
100,0%
,0%
,0%
,0%
,0%
33
100,0%
Censurado
Total
Casos excluidos
Porcentaje
ms temprano en un estrato
Total
Total
a. Variable dependiente: Tiempos
Evento
Censurado
Porcentaje censurado
17
,0%
16
,0%
Total
33
,0%
verosimilitud
122,403
Global (puntuacin)
Chi-cuadrado
Gl
7,424
Variables en la ecuacin
Chi-cuadrado
,006
7,302
gl
Cambio desd
Sig.
Chi-cuadrado
,007
7,302
B
Paso 1
logglo
111
ET
,378
Wald
,142
gl
7,056
Sig.
1
Exp(B)
,008
1,459
2,616
Figura 15.7
obteniendo los siguientes resultados,
Regresin de Cox
Notas
Resultados creados
27-abr-2011 20:58:25
Comentarios
Entrada
Datos
G:\charlas\globulos.sav
Conjunto_de_datos1
Filtro
<ninguno>
112
Peso
<ninguno>
Segmentar archivo
<ninguno>
Definicin de perdidos
33
Los valores perdidos definidos por el usuario se
consideran perdidos.
Sintaxis
COXREG Tiempos
/STATUS=estatus(2)
/CONTRAST (Poblacion)=Indicator
/METHOD=BSTEP(WALD) Poblacion logglo
/CRITERIA=PIN(.05) POUT(.10) ITERATE(20).
Recursos
Tiempo de procesador
00 00:00:00,015
Tiempo transcurrido
00 00:00:00,016
[Conjunto_de_datos1] G:\charlas\globulos.sav
Resumen del proceso de casos
N
Casos disponibles en el anlisis
Evento
33
100,0%
,0%
33
100,0%
,0%
,0%
,0%
,0%
33
100,0%
Censurado
Total
Casos excluidos
Porcentaje
ms temprano en un estrato
Total
Total
a. Variable dependiente: Tiempos
(1)
17
16
113
-2 log de la
Paso
verosimilitud
Chi-cuadrado
157,363
Gl
15,325
Chi-cuadrado
,000
gl
14,631
Cambio desd
Sig.
Chi-cuadrado
,001
Variables en la ecuacin
B
Paso 1
Poblacion
logglo
ET
Wald
gl
Sig.
Exp(B)
-1,018
,423
5,775
,016
,361
,360
,136
7,068
,008
1,434
,515
2,616
14,631
114
Figura 15.8
vemos grficamente la diferencia significativa en la Figura 15.9
Figura 15.9