Академический Документы
Профессиональный Документы
Культура Документы
142
Anlisis estadstico con el SPSS 10 M Dolores Paz Caballero
TCNICAS REDUCTIVAS :
VARIABLES
Nmero Nivel de medida
143
Anlisis estadstico con el SPSS 10 M Dolores Paz Caballero
TCNICAS PREDICTIVAS :
V. INDEPENDIENTE V. DEPENDIENTE
Nmero Nivel de Nmero Nivel de
medida medida
REGRESIN MLTIPLE (*) Varias Cuantitativas Una Cuantitativa
1. Determinar el efecto del tipo de antidepresivo y la dosis del mismo (10 o 20 mg) en la
reduccin de la depresin (medida con un test).
2. Determinar cuntos tipos de neurosis hay a partir de la presencia o no en una muestra
de sujetos de una serie de sntomas neurticos.
3. Determinar cuntos tipos de inteligencia miden los tests de una batera.
4. Determinar el efecto del mtodo de aprendizaje (la mitad de los alumnos aprenden con
un mtodo y la mitad con otro) en las notas de las asignaturas de un curso.
5. Ver qu variables predicen el rendimiento laboral en un determinado puesto de trabajo.
6. Analizar qu variables de personalidad (medidas por distintos tests) permiten predecir
una determinada enfermedad.
7. Determinar si el ser fumador depende de variables como el sexo, el nivel de ansiedad y
la depresin.
8. Elaborar una tipologa de pacientes de una determinada enfermedad en funcin de los
sntomas que presentan.
144
Anlisis estadstico con el SPSS 10 M Dolores Paz Caballero
SOLUCIONES
1. Puesto que las variables independientes (tipo de antidepresivo y dosis) son categricas y
la variable dependiente (depresin) se mide supuestamente en una escala de intervalos
(es cuantitativa) la tcnica a utilizar, siempre que se cumplan los supuestos
paramtricos, es el ANOVA factorial.
2. En este caso tenemos varias variables dicotmicas y queremos ver en cuntas
dimensiones se agrupan. Para ello utilizaramos el Anlisis de Homogeneidad.
3. Si consideramos que las puntuaciones de los tests estn en una escala de intervalos (son
cuantitativas) y se cumplen los supuestos necesarios para su aplicacin, utilizaramos la
tcnica del Anlisis Factorial.
4. Tenemos una variable independientes (mtodo de aprendizaje) categrica y varias
variables dependientes. La tcnica que se debe aplicar en este caso es el MANOVA.
5. Dependera del nivel de medida de las variables predictoras y de la forma en que se
mida el rendimiento laboral. Si todas las variables predictoras son cuantitativas y el
rendimiento se mide en una escala cuantitativa se podra aplicar la Regresin Mltiple
(siempre que se cumplan los supuestos paramtricos). Si el rendimiento es una variable
dicotomizada (eficiente o no eficiente), se aplicara el Anlisis Discriminante, si las
variables independientes son todas cuantitativas, o la Regresin Logstica si alguna o
todas las variables predictoras son categricas.
6. Puesto que la variable que queremos predecir es dicotmica (presencia o ausencia de la
enfermedad) y las variables predictoras cuantitativas, la tcnica estadstica a utilizar,
si se cumplen los supuestos paramtricos, es el Anlisis Discriminante. Caso de no
cumplirse los supuestos paramtricos se aplicara la Regresin Logstica.
7. La variable que se intenta predecir (ser fumador) se considera dicotmica. Las variables
predictoras son, unas cuantitativas (ansiedad y depresin) y otra dicotmica (sexo). Por
consiguiente, la tcnica estadstica apropiada en este caso sera la Regresin logstica.
8. Cuando lo que queremos agrupar son los sujetos, no las variables, se utiliza el Anlisis de
Clusters.
145
Anlisis de datos con SPSS M Dolores Paz Caballero
1
Se han marcado en negrita las correlaciones ms altas.
Variables C1 C2 C3 C4
V1 0.9 (0.81) 0.3 (0.09) 0.3 (0.09) 0.1 (0.01) (1)
V2 0.8 (0.64) 0.4 (0.16) 0.4 (0.16) 0.2 (0.04) (1)
V3 0.7 (0.49) 0.5 (0.25) 0.5 (0.25) 0,1 (0.01) (1)
V4 0.5 (0.25) 0.7 (0.49) 0.5 (0.25) 0,1 (0.01) (1)
(2.19) (0.99) (0.75) (0.07) (4)
2
2
Entre parntesis van los pesos al cuadrado. Los sumatorios de las filas y de las columnas se refieren a
estos valores.
Variables C1
V1 0.9 (0.81) (0.81)
V2 0.8 (0.64) (0.64)
V3 0.7 (0.49) (0.49)
V4 0.5 (0.25) (0.25)
(2.19) (2.19)
Estadsticos descriptivos
D esviacin N del
M edia tpica anlisis
AC C ESIB 3,9200 ,4638 50
C O M PR EN S 2,7960 ,5059 50
D O M IN IO 4,1360 ,5594 50
EVALU A 3,5920 ,3854 50
G LO BAL 3,0874 ,7200 50
PR EPAR 3,0132 1,1278 50
Como podemos ver, tanto el valor del ndice KMO (.721) como la prueba de
Bartlett (donde se rechaza la Ho de no correlacin con una significacin de .000),
nos indican que se cumplen las condiciones para la aplicacin del AF.
Comunalidades
Inicial Extraccin
ACCESIB 1,000 ,791
COMPRENS 1,000 ,690
DOMINIO 1,000 ,653
EVALUA 1,000 ,795
GLOBAL 1,000 ,837
PREPAR 1,000 ,705
Mtodo de extraccin: Anlisis de
Componentes principales.
Grfico de sedimentacin
3,5
3,0
2,5
2,0
1,5
1,0
,5
Autovalor
0,0
1 2 3 4 5 6
Nmero de componente
Cul utilizar?
Vamos a realizar a continuacin una rotacin con los datos del archivo
Factor2.sav, donde se han considerado las mismas variables pero en otra muestra
de sujetos.
a
Matriz de componentes
Componente
1 2
ACCESIB ,404 ,848
COMPRENS ,786 -,325
DOMINIO ,755 -,177
EVALUA ,733 ,497
GLOBAL ,924 -,133
PREPAR ,808 -,242
Mtodo de extraccin: Anlisis de
componentes principales.
a. 2 componentes extrados
Pedimos, pues, una rotacin para poder interpretar los componentes. Por las
razones antes expuesta, vamos a utilizar el procedimiento Oblimin.
a
Matriz de configuracin. Matriz de estructura
Componente Componente
1 2 1 2
ACCESIB -,134 ,971 ACCESIB ,161 ,931
COMPRENS ,877 -,107 COMPRENS ,844 ,160
DOMINIO ,764 3,38E-02 DOMINIO ,775 ,266
EVALUA ,357 ,710 EVALUA ,573 ,818
GLOBAL ,888 ,126 GLOBAL ,926 ,396
PREPAR ,848 -1,7E-02 PREPAR ,843 ,241
Mtodo de extraccin: Anlisis de Mtodo de extraccin: Anlisis de
componentes principales. componentes principales.
Metodo de rotacin: Normalizacin Metodo de rotacin: Normalizacin
Oblimin con Kaiser. Oblimin con Kaiser.
a. La rotacin ha convergido en 4
iteraciones.
Matriz de correlaciones de
componentes
Componente 1 2
1 1,000 ,304
2 ,304 1,000
Mtodo de extraccin: Anlisis de
componentes principales.
Metodo de rotacin: Normalizacin
Oblimin con Kaiser.
sera comparar las medias de los dos grupos en todos los items. Sin embargo,
puesto que a partir del AF parece claro que la escala mide un componente de
aptitud y otro actitudinal, se podra reducir el problema calculando para cada
sujeto su puntuacin en cada componente (puntuacin factorial), con lo que
quedaran solamente dos variables a comparar. Hacindolo as, adems de ahorrar
tiempo en los anlisis, evitamos en gran medida el problema del aumento de error
tipo I que ocurre cuando hacemos mltiples comparaciones, y, por otra parte,
aumentamos la fiabilidad de los resultados, puesto que, al utilizar varias medidas
de una misma variable, el error de medida es menor que si utilizramos slo una.
Hay que tener en cuenta que las puntuaciones factoriales varan en funcin
de si hemos pedido o no rotacin y del tipo de rotacin realizado. Cuando es
necesaria la rotacin para interpretar los componentes tambin es necesaria
pedirla para obtener puntuaciones factoriales si queremos que stas sean
interpretables. Por otra parte, si se van a utilizar en posteriores anlisis, conviene,
siempre que sea posible, realizar una rotacin ortogonal. En este caso concreto, si
vamos a comparar titulares y catedrticos en los dos componentes, es preferible
que stos sean independientes para asegurarnos de que las diferencias entre los
grupos en una variable (puntuacin factorial) no se deben a lo que tiene en comn
con la otra.
E s ta d s tic o s d e l g ru p o
E rro r tp .
D e s via c i n d e la
CATEGORI N M e d ia tp . m e d ia
R E G R fa c to r s c o re T itu la r 24 -,1 6 9 1 6 2 6 1 ,0 6 1 4 5 8 7 ,2 1 6 6 6 9 3
1 fo r a n a lys is 1 C a te d r tic o 26 ,1 5 6 1 5 0 1 ,9 3 3 0 6 5 7 ,1 8 2 9 8 9 2
R E G R fa c to r s c o re T itu la r 24 9 ,3 7 E -0 2 1 ,0 6 3 1 5 3 9 ,2 1 7 0 1 5 4
2 fo r a n a lys is 1 C a te d r tic o 26 -8 ,7 E -0 2 ,9 5 0 7 4 4 0 ,1 8 6 4 5 6 2
A C C E S IB T itu la r 24 4 ,0 5 7 1 ,8 2 6 9 ,1 6 8 8
C a te d r tic o 26 4 ,0 3 0 8 ,7 7 2 4 ,1 5 1 5
COMPRENS T itu la r 24 2 ,7 7 9 2 ,5 1 6 7 ,1 0 5 5
C a te d r tic o 26 2 ,8 1 1 5 ,5 0 5 4 9 ,9 1 E -0 2
D O M IN IO T itu la r 24 3 ,9 4 5 8 ,5 8 0 8 ,1 1 8 6
C a te d r tic o 26 4 ,3 1 1 5 ,4 8 6 1 9 ,5 3 E -0 2
EVALUA T itu la r 24 3 ,5 2 8 8 ,8 1 2 4 ,1 6 5 8
C a te d r tic o 26 3 ,3 5 9 6 ,7 0 0 9 ,1 3 7 4
PREPAR T itu la r 24 2 ,8 8 0 4 1 ,0 4 7 2 ,2 1 3 8
C a te d r tic o 26 3 ,1 3 5 8 1 ,2 0 4 9 ,2 3 6 3
G LO BAL T itu la r 24 2 ,9 8 6 3 ,8 0 5 1 ,1 6 4 3
C a te d r tic o 26 3 ,1 3 0 8 ,6 6 0 8 ,1 2 9 6
Prueba de Levene
para la igualdad de
varianzas Prueba T para la igualdad de medias
95% Intervalo de
confianza para la
Diferencia Error tp. de diferencia
F Sig. t gl Sig. (bilateral) de medias la diferencia Inferior Superior
REGR factor scor Se han asumido
1,522 ,223 -1,153 48 ,255 -,3253126 ,2821219 -,8925568 ,2419315
1 for analysis 1 varianzas iguales
No se han asumido
-1,147 45,987 ,257 -,3253126 ,2836030 -,8961801 ,2455549
varianzas iguales
REGR factor scor Se han asumido
,852 ,361 ,633 48 ,530 ,1802174 ,2848173 -,3924462 ,7528810
2 for analysis 1 varianzas iguales
No se han asumido
,630 46,286 ,532 ,1802174 ,2861147 -,3956056 ,7560405
varianzas iguales
Prueba de Levene
para la igualdad de
varianzas Prueba T para la igualdad de medias
95% Intervalo de
confianza para la
Diferencia Error tp. de diferencia
F Sig. t gl Sig. (bilateral) de medias la diferencia Inferior Superior
PREPAR Se han asumido
1,639 ,207 -,797 48 ,429 -,2554 ,3205 -,8997 ,3890
varianzas iguales
No se han asumido
-,801 47,838 ,427 -,2554 ,3186 -,8961 ,3854
varianzas iguales
DOMINIO Se han asumido
1,246 ,270 -2,421 48 ,019 -,3657 ,1510 -,6694 -6,20E-02
varianzas iguales
No se han asumido
-2,404 45,034 ,020 -,3657 ,1521 -,6721 -5,93E-02
varianzas iguales
COMPRENS Se han asumido
,031 ,861 -,224 48 ,824 -3,2372E-02 ,1446 -,3231 ,2584
varianzas iguales
No se han asumido
-,224 47,490 ,824 -3,2372E-02 ,1447 -,3235 ,2587
varianzas iguales
ACCESIB Se han asumido
,703 ,406 ,116 48 ,908 2,631E-02 ,2262 -,4284 ,4811
varianzas iguales
No se han asumido
,116 46,950 ,908 2,631E-02 ,2268 -,4300 ,4826
varianzas iguales
EVALUA Se han asumido
1,418 ,240 ,790 48 ,433 ,1691 ,2141 -,2613 ,5996
varianzas iguales
No se han asumido
,785 45,640 ,436 ,1691 ,2154 -,2645 ,6028
varianzas iguales
GLOBAL Se han asumido
1,958 ,168 -,696 48 ,490 -,1445 ,2076 -,5620 ,2729
varianzas iguales
No se han asumido
-,691 44,623 ,493 -,1445 ,2093 -,5661 ,2771
varianzas iguales
a
Comunalidades
Inicial Extraccin
ACCESIB ,444 ,326
COMPRENS ,679 ,717
DOMINIO ,463 ,420
EVALUA ,623 ,999
GLOBAL ,809 ,950
PREPAR ,631 ,543
Mtodo de extraccin: Mxima
verosimilitud.
a. Se han encontrado una o ms
estimaciones de la comunalidad
mayores que 1,0 durante las
iteraciones. La solucin
resultante debe interpretarse
con precaucin.
a
Matriz factorial
Factor
1 2
ACCESIB ,561 -,102
COMPRENS ,359 ,766
DOMINIO ,358 ,540
EVALUA ,999 -1,1E-02
GLOBAL ,597 ,770
PREPAR ,554 ,486
Mtodo de extraccin: Mxima
verosimilitud.
a. 2 factores extrados.
Requeridas 9 iteraciones.
En la siguiente tabla se pone a prueba el ajuste del modelo a los datos. Este
ajuste se calcula teniendo en cuenta la matriz residual que aparece despus de la
prueba de ajuste. Ntese como en la matriz residual hay valores altos (el 20% de
las diferencias entre las correlaciones iniciales y las reproducidas es superior a
0.05). Este es el motivo de que no se produzca un buen ajuste, la significacin
menor que 0.05 nos lleva a rechazar la Ho de que no existe diferencia entre la
matriz de correlaciones observada y la matriz de correlaciones reproducida. Puesto
que el modelo no ajusta a los datos, todos los resultados deben ser interpretados
con precaucin. En un caso as se recomienda la utilizacin del ACP.
En otros casos en los que se trabaja con ms variables, para mejorar el
ajuste es necesario aumentar el nmero de factores a extraer (cambiaramos la
opcin autovalores mayores que uno por la de nmero de factores = k). Con los
datos que tenemos es imposible pedir tres factores, pues los grados de libertad en
ese caso seran 0 y no podramos analizar el ajuste. La frmula para calcular los
grados de libertad del estadstico chi-cuadrado de bondad de ajuste es la
siguiente :
C hi-cuadrado gl Sig.
11,676 4 ,020
Correlaciones reproducidas
PREPAR DOMINIO COMPRENS ACCESIB EVALUA GLOBAL
Correlacin reproducida PREPAR ,543b ,461 ,571 ,261 ,549 ,705
DOMINIO ,461 ,420b ,543 ,146 ,352 ,630
COMPRENS ,571 ,543 ,717b ,123 ,351 ,805
ACCESIB ,261 ,146 ,123 ,326b ,562 ,256
EVALUA ,549 ,352 ,351 ,562 ,999b ,588
GLOBAL ,705 ,630 ,805 ,256 ,588 ,950b
Residuala PREPAR ,118 -3,541E-02 -,199 1,703E-04 -2,75E-03
DOMINIO ,118 -1,512E-02 7,543E-02 -1,29E-04 -4,83E-03
COMPRENS -3,54E-02 -1,51E-02 -7,90E-03 1,956E-05 3,303E-03
ACCESIB -,199 7,543E-02 -7,896E-03 7,804E-05 1,063E-02
EVALUA 1,703E-04 -1,29E-04 1,956E-05 7,804E-05 -6,74E-06
GLOBAL -2,75E-03 -4,83E-03 3,303E-03 1,063E-02 -6,74E-06
Mtodo de extraccin: Mxima verosimilitud.
a. Los residuos se calculan entre las correlaciones observadas y reproducidas. Hay 3 (20,0%) residuos no
redundantes con valores absolutos > 0,05.
b. Comunalidades reproducidas
a
Matriz de configuracin.
Factor
1 2
ACCESIB ,586 -3,7E-02
COMPRENS -,138 ,899
DOMINIO 4,44E-04 ,648
EVALUA ,938 ,125
GLOBAL 8,11E-02 ,936
PREPAR ,217 ,614
Mtodo de extraccin: Mxima
verosimilitud.
Metodo de rotacin: Normalizacin
Oblimin con Kaiser.
a. La rotacin ha convergido en 4
iteraciones.
Matriz de estructura
Factor
1 2
ACCESIB ,570 ,225
COMPRENS ,263 ,837
DOMINIO ,289 ,648
EVALUA ,993 ,543
GLOBAL ,498 ,972
PREPAR ,491 ,711
Mtodo de extraccin: Mxima
verosimilitud.
Metodo de rotacin: Normalizacin
Oblimin con Kaiser.
F a c tor 1 2
1 1 ,00 0 ,4 4 6
2 ,4 4 6 1 ,0 0 0
M to d o d e ex trac c i n : M x im a
ve ros im ilitu d .
M e to d o d e ro tac i n : N o rm a lizac i n
O b lim in c o n K a is e r.
Para los datos de este ejemplo, sin embargo, debemos quedarnos con los
resultados del anlisis de Componentes Principales, puesto que el anlisis de
Mxima Verosimilitud no nos ofrece un ajuste satisfactorio. En general, el mtodo
de extraccin de Componentes Principales es el que debemos utilizar si nos
interesa explorar la dimensionalidad de un conjunto de variables o si queremos
obtener las puntuaciones factoriales para reducir datos. Cuando partimos de alguna
hiptesis acerca del nmero de dimensiones resulta ms adecuado el mtodo de
extraccin de Mxima Verosimilitud, que nos da la probabilidad de ajuste de
nuestro modelo hipotetizado a los datos empricos. Veamos un ejemplo :
a
Comunalidades
Inicial Extraccin
AGRESIV ,559 ,722
LIDERAZ ,472 ,582
CONTROL ,495 ,611
SENSIBIL ,245 ,999
DEPENDEN ,166 ,157
Mtodo de extraccin: Mxima verosimilitud.
a. Se han encontrado una o ms estimaciones de la
comunalidad mayores que 1,0 durante las iteraciones.
La solucin resultante debe interpretarse con
precaucin.
a
Matriz factorial
Factor
1 2
AGRESIV -,306 ,793
LIDERAZ -,198 ,736
CONTROL -,275 ,732
SENSIBIL ,999 1,666E-03
DEPENDEN ,352 ,182
Mtodo de extraccin: Mxima verosimilitud.
a. 2 factores extrados. Requeridas 5 iteraciones.
P ru e b a d e la b o n d a d d e a ju s te
C h i-c u a d ra d o gl S ig .
,6 6 8 1 ,4 1 4
M atriz factorial a
Factor
1
AG R ESIV ,849
LID ER AZ ,756
CONTROL ,785
SEN SIBIL -,330
D EPEN D EN 3,109E-02
M todo de extraccin: M xim a verosim ilitud.
a. 1 factores extrados. R equeridas 5 iteraciones.
P r u e b a d e la b o n d a d d e a ju s t e
C h i- c u a d r a d o gl S ig .
7 ,2 7 2 5 ,2 0 1
Treinta pacientes con edades superiores a los 55 aos han acudido a una
consulta psiquitrica. Se les ha aplicado un cuestionario para que contesten si
presentan o no cada uno de los 7 sntomas que aparecen a continuacin:
- Prdida de atencin
- Insomnio
- Sopor diurno
- Prdida de memoria
- Cambios en las relaciones afectivas
- Torpeza motora
- Depresin
Lo que nos interesa es ver qu relacin hay entre estos sntomas, es decir,
si todos forman parte del mismo sndrome o si se agrupan en distintos
subconjuntos cada uno de ellos indicativo de un trastorno distinto.
Para ello, y teniendo en cuenta que el tamao de la muestra es pequeo y que
las variables son todas categricas, utilizamos el "Anlisis de homogeneidad". Esta
tcnica est incluida en Reduccin de datos - Escalamiento ptimo.
En el cuadro de dilogo que nos aparece dejamos las opciones marcadas por
defecto.
Varianza explicada
Alfa de Total % de la
Dimensin Cronbach (Autovalores) Inercia varianza
1 ,780 3,019 ,431 43,125
2 ,745 2,764 ,395 39,490
Total 5,783 ,826
Media ,763(a) 2,892 ,413 41,308
Medidas de discriminacin
Dimensin
1 2
Atencin disminuida ,997 ,001
Insomnio ,009 ,520
Sopor diurno ,001 ,781
Prdida de memoria ,016 ,678
Cambio en las relaciones ,997 ,001
Torpeza motora ,001 ,781
Tristeza ,997 ,001
RESUMEN
El Anlisis Factorial (AF) es una de las tcnicas multivariadas que analizan las
relaciones de interdependencia entre varias variables. Estas variables deben:
9 Ser cuantitativas
9 Tener distribucin normal
9 Estar correlacionadas entre s
Por ltimo, cuando las variables cuya interrelacin queremos analizar son
categricas, se debe utilizar alguna alternativa no paramtrica al AF, como es el
Escalamiento ptimo.