Академический Документы
Профессиональный Документы
Культура Документы
NDICE
NDICE
INTRODUCCIN
II.- OBJETIVOS
III. METODOLOGA
1) Bases de Datos
10
12
1) Escalamiento ptimo
12
12
3) Grficos de transformacin
14
17
17
2) Diseo de la investigacin
18
19
19
19
22
30
36
42
43
44
44
44
45
46
48
54
58
62
65
65
66
68
70
71
75
76
77
78
80
82
88
BIBLIOGRAFA
90
Introduccin
Introduccin
El presente texto se realiza con el fin de explorar la estructura de las
tcnicas de reduccin de datos del mdulo categoras del programa estadstico
SPSS. Dicha exploracin permitir potenciar futuros anlisis y mejorar la
complementacin de la informacin digital y analgica de las tcnicas.
El documento se divide en cuatro partes generales: La primera parte
corresponde al planteamiento del problema, objetivos y metodologa utilizada en
este texto.
La segunda parte contiene el desarrollo del anlisis de correspondencias
mltiple. Para ello, se utiliza un esquema de flujo que representa los principales
momentos de decisin del analista en la aplicacin. El esquema de flujo se
complementa con la aplicacin concreta de la tcnica a datos reales.
La tercera parte contiene el desarrollo del anlisis de componentes
principales categricos (no lineal). Para ello, se utiliza el mismo procedimiento al
anlisis de correspondencia mltiple.
La cuarta parte muestra las conclusiones del estudio. Las conclusiones se ha
divido en dos partes: la primera parte muestra una recurrencia operativa
descubierta durante la construccin de este texto, que es la ubicacin de las
variables independientes e incorrelacionadas en el modelo; la segunda parte
muestra las conclusiones generales del texto segn los objetivos investigados.
1
2
Juan Javier Snchez Carrin, (1995), Manual de anlisis de datos, Alianza Editorial.
Los software estadsticos ms conocidos son: SPSS, MINITAB, WINR+, EPIINFO, etc.
5
3
4
5
II.- Objetivos
Objetivo General
Objetivos Especficos
Metodologa
III. Metodologa
1) Bases de Datos
La investigacin utiliz datos secundarios provenientes de La Encuesta
Nacional de Juventud 2003, y bases de datos generadas especficamente para este
estudio. La generacin de bases de datos posibilita la exploracin de modelos de
anlisis especficos, permitiendo probar lineamientos de interpretacin que servirn
de base para aplicaciones concretas futuras.
1.a) Encuesta Nacional de Juventud
Descripcin General
La Encuesta Nacional de Juventud, consiste en un estudio que permite
conocer tanto las condiciones socioeconmicas como las percepciones subjetivas y
estilos de vida de los jvenes, y ha sido aplicada cada tres aos (1993, 1996, 2000
y 2003).
Para los efectos del presente estudio se trabajo con la base de datos de la
IV Encuesta. De ella se escogieron las variables ms significativas de acuerdo a
nuestros objetivos.
Poblacin
La poblacin estudiada estuvo compuesta por jvenes (mujeres y hombres)
de entre 15 y 29 aos, pertenecientes a todos los niveles socioeconmicos, y
residentes en todas las regiones del pas, tanto en zonas urbanas y rurales.
Tipo de Muestreo
El tipo de muestreo es estratificado, por conglomerados y polietpico. En
cada estrato se obtuvo una muestra independiente que lo representara. El
conjunto de ellos representa la poblacin de jvenes del pas, tal como se defini
en el grupo objetivo.
Metodologa
Tamao de la Muestra
El nmero de casos de la muestra final fue de 7.189, distribuidos en las
regiones del pas segn se expresa en la tabla 3.1.
Tabla 3.1
Regin
I Regin
II Regin
III Regin
IV Regin
V Regin
VI Regin
VII Regin
VIII Regin
IX Regin
X Regin
XI Regin
XII Regin
XIII Regin
Total
Area Urbana-Rural
Urbana
Rural
520
519
425
100
435
119
420
100
425
102
434
100
434
105
424
109
422
101
531
523
741
100
6253
936
Total
520
519
525
554
520
527
534
539
533
523
531
523
841
7189
Metodologa
Base
Modelos de
regresin
Modelos avanzados
Tablas
Tendencias
Anlisis conjunto
Pruebas exactas
Categoras
(Categories)
10
Metodologa
Para trabajar con SPSS debemos seguir los 4 pasos bsicos que se muestran
en la figura 3.1:
Figura 3.1
I
Obtencin de
Datos
II
Seleccin de
procedimiento
III
IV
Seleccin de
variables y
opciones
Examen de
resultados
11
Escalamiento ptimo
Escalamiento ptimo
Valid
Nunca
Ocasionalemnte
Casi Siempre
Total
Frequency
5903
1177
102
7182
Percent
82,1
16,4
1,4
99,9
Valid Percent
82,2
16,4
1,4
100,0
Cumulative
Percent
82,2
98,6
100,0
13
Escalamiento ptimo
Figura 4.1
Se ha sentido
discriminado por: Edad
Nunca
Ocasionalemnte
Casi Siempre
Total
Media
Media
Media
N
Edad
Quantification
3 Variables
Nominal
-,44872
1,88570
4,21852
7182
Edad
Quantification
3 Variables
Ordinal
-,44872
1,88570
4,21852
7182
Edad
Quantification
3 Variables
Numerico
-,44870
1,88549
4,21969
7182
Edad
Quantification
10 Variables
Ordinal
-,44832
1,88530
4,22305
7182
Edad
Quantification
10 Variables
Numrico
-,44837
1,88582
4,22002
7182
Report
Se ha sentido
discriminado por: Edad
Nunca
Ocasionalemnte
Casi Siempre
Total
Media
Media
Media
N
Edad
Quantification
10 Variables
Nominal
-,44832
1,88530
4,22305
7182
3) Grficos de transformacin
Los diferentes niveles a los que se puede escalar cada variable imponen
distintas restricciones en las cuantificaciones. Una manera de validar las
transformaciones realizadas, es travs de los grficos de transformacin. Los
grficos de transformacin, para cada variable, despliegan en el eje horizontal el
cdigo de la categora original, y en eje vertical las cuantificaciones ptimas. El
objetivo de los grficos de transformacin es ilustrar la relacin entre las
cuantificaciones y las categoras originales resultantes del escalamiento ptimo
seleccionado.
A continuacin se expondr los diferentes resultados de los grficos de
transformacin con sus interpretaciones correspondientes. Para ello se utiliza una
variable ficticia compuesta de tres categoras:
Si el grfico de transformacin genera una lnea (casi recta), puede ser
interpretado la transformacin como numrica (Figura 4.2).
14
Escalamiento ptimo
Figura 4.2
2,5
2
1,5
Cuantificaciones
1
0,5
0
-0,5
-1
-1,5
-2
-2,5
Categoras
0,5
Cuantificaciones
-0,5
-1
-1,5
-2
-2,5
Categoras
15
Escalamiento ptimo
Cuantificaciones
0,8
0,6
0,4
0,2
Categoras
2,5
Cuantificaciones
1,5
0,5
Categoras
16
17
En la figura 5.1 se muestra un mapa perceptual6 en que los ejes son las dos
primeras dimensiones, y los puntos en el plano representan las categoras de las
variables. Cada punto es la interseccin de las coordenadas numricas de las
dimensiones 1 y 2 para cada categora.
Figura 5.1
Quantifications
1,0
Si
,5
No
No
Si
Si
0,0
-,5
Pide ayuda caundo ti
ene problemas
Dimension 2
-1,0
Si tiene problemas l
os cuenta a alguien
-1,5
No
-2,0
s quienes se junta f
-1,0
-,5
0,0
,5
1,0
1,5
2,0
Dimension 1
6
7
8
9
19
10
Figura 5.2
No
P59
S
S
S
P62
S
S
S
P64
S
S
S
1 Dimensin
-0,79
-0,79
-0,79
No
No
S
S
S
S
-0,17
-0,17
No
0,6
No
No
S
S
No
No
1,05
1,05
S
S
No
No
No
No
1,83
1,83
No
No
No
2,44
P59
S
S
S
S
No
No
No
No
Ca sos
3 675
848
394
636
882
255
176
318
Tota l S
Tota l No
P64
Si
Si
Si
Si
No
No
No
No
Total S
Total No
Pu nta je
Cuan tifica ci n
Obj eto
de Catego ras
-0,7 855
-0,200
0,4 425
0,6 045
1,8 324
-0,1 732
1,0 547
1,2 168
2,4 447
0,679
848
255
636
318
5127
2057
No
No
No
No
To ta l S
Tota l No
5 553
1 631
Casos
3675
882
394
176
P6 2
S
S
S
S
Puntaje
Cu an tificacin
Ob jeto
de Categoras
-0,7855
-0 ,505
-0,1732
0,6045
1,2168
0,4425
1,0547
1,8324
2,4447
1 ,258
Caso s
367 5
84 8
88 2
25 5
39 4
63 6
17 6
31 8
Pun ta je
Cu antifi caci n
Obj eto
de Categ ora s
-0,785 5
-0,42 3
0,442 5
-0,173 2
1,054 7
0,604 5
1,832 4
1,216 8
2,444 7
1,57 2
566 0
152 4
Cuantificacin de
Categoras
Promedio Ponderado de
Puntajes Objetos para cada
categora.
21
Modelo de Anlisis
Propuesto para SPSS
Mapa Perceptual
Medidas de
Discriminacin
Medidas de
Discriminacin
Mapa Perceptual
22
relaciones entre las variables?. En la figura 5.4 se muestran las principales etapas
del anlisis digital, para terminar con el anlisis perceptual.
Figura 5.4
Medidas de Discriminacin
23
Figura 5.5
FIT =
Categorias
Variables
FIT =
6
1= 1
3
Iteration History
Iteration
3a
Fit
1,000000
Difference
from the
Previous
Iteration
,000000
24
Figura 5.6
Eigenvalues
Dimension
1
2
3
Eigenvalue
,478
,319
,203
Dimensiones
= n de categoras - n de variables
Los dos coeficientes anteriores, Ajuste del modelo y valores propios,
dependen directamente del nmero de categoras involucradas en el modelo.
Dicha situacin tiene una importancia no menor, ya que el nmero de variables en
el anlisis no es lo crucial, sino el nmero de categoras. Para ilustrar dicha
situacin, los siguientes cuadros muestran modelos con el mismo nmero de
categoras (12 16), pero con distinto nmero de variables.
Figura 5.7
12 Categoras con (2 - 3 - 4 - 5 - 6) Variables
N de
Categoras
N de Variables
2
3
4
5
6
Promedio de
categoras por
variable
12
12
12
12
12
5
3
2
1,4
1
N
Dimensiones
Posibles
10
9
8
7
6
7
4,3
3
2,2
1,7
1,3
1
N
Dimensiones
Posibles
14
13
12
11
10
9
8
FIT
6
4
3
2,4
2
Figura 5.8
16 Categoras con (2 - 3 - 4 - 5 - 6 - 7 -8) Variables
N de
Categoras
N de Variables
2
3
4
5
6
7
8
16
16
16
16
16
16
16
Promedio de
categoras por
variable
8
5,3
4
3,2
2,7
2,3
2
FIT
25
30
27
30
24
25
21
18
20
15
12
15
10
5
0
12c - 3v
16c - 4v
20c - 5v
24c - 6v
28c - 7v
32c - 8v
36c - 9v
40c - 10v
C =Categoras / V= Variables
26
Eigenvalues
Dimension
1
2
3
Eigenvalue
,478
,319
,203
27
Figura 5.11
Discrimination Measures
Dimension
2
1
Tiene grupo de
amigos quienes se
junta frecuentemente
Si tiene problemas
los cuenta a alguien
Pide ayuda caundo
tiene problemas
,135
,860
,004
,665
,024
,311
,635
,072
,293
Eigenvalue dim1 =
Medidas de Discriminacin
Se entiende por medida de discriminacin la variacin de la variable
cuantificada. Su valor mximo es igual a la unidad, que se consigue si todas las
puntuaciones de los sujetos caen en grupos mutuamente excluyentes y a su vez
dentro de cada grupo estas puntuaciones son idnticas. Es decir, si en una variable
para cada categora los puntajes objetos son idnticos.
Figura 5.12
Medidas de Dis criminac in
Dimens ion
Tiene grupo de
amigos quienes se
junta frecuentemente
Si tiene problemas
los cuent a a alguien
Pide ay uda c aundo
tiene problemas
Eigenvalue
Tot al de
informacin
por variable
0, 135
0, 860
0, 004
1, 000
0, 665
0, 024
0, 311
1, 000
0, 635
0, 072
0, 293
1, 000
0, 478
0, 319
0, 203
1, 000
= categorias 1
= 2 1= 1
28
S
No
5660
1524
Tot al
7184
Cuantificacin de Categoras al
Cuadrado
Dimension
1
2
3
0,179
0,007
0,084
0,090
1,154
2,470
Cuantificac in de Categoras
Dimension
1
2
-0,423 -0,081
1,572 0,300
3
-0,289
1,074
Suma
Ponderada
0,665
0,024
0,311
29
Figura 5.14
S
No
700
4000
600
3000
500
400
2000
300
1000
Casos
Casos
200
-,79
-,17
,44
100
1,05
,60
Dimension 1
1,22
1,83
2,44
Dimension 1
Eigenvalues
Iteration History
Iteration
3a
Fit
1,000000
Dimension
1
2
3
Difference
from the
Previous
Iteration
,000000
Eigenvalue
,478
,319
,203
Discrimination Measures
1
Tiene grupo de
amigos quienes se
junta frecuentemente
Si tiene problemas
los cuenta a alguien
Pide ayuda caundo
tiene problemas
Dimension
2
,135
,860
,004
,665
,024
,311
,635
,072
,293
30
31
Valores Propios
0,6
0,478
0,5
0,4
0,319
0,3
0,203
0,2
0,1
0
1
Dimensiones
FIT
N de dimensione s totales
1
= = 0,333
3
=
32
Total
Total
Si
88,9%
53,6%
78,8%
80,5%
19,5%
100,0%
No
11,1%
46,4%
21,2%
37,4%
62,6%
100,0%
100,0%
100,0%
100,0%
71,4%
28,6%
100,0%
81,4%
69,7%
Total
Si
No
78,8%
20,1%
Total
100,0%
18,6%
30,3%
21,2%
67,6%
32,4%
100,0%
100,0%
100,0%
100,0%
77,3%
22,7%
100,0%
Total
73,3%
64,9%
Total
71,4%
20,6%
Total
100,0%
26,7%
35,1%
28,6%
72,1%
27,9%
100,0%
100,0%
100,0%
100,0%
77,3%
22,7%
100,0%
33
Object Scores
1,5
1,0
,5
0,0
-,5
Dimension 2
-1,0
-1,5
-2,0
-2,5
-1,0
-,5
0,0
,5
1,0
1,5
2,0
2,5
Dimension 1
Cases weighted by number of objects.
implican
34
Quantifications
1,0
Si
,5
No
No
Si
Si
0,0
-,5
Pide ayuda caundo ti
ene problemas
Dimension 2
-1,0
Si tiene problemas l
os cuenta a alguien
-1,5
No
-2,0
s quienes se junta f
-1,0
-,5
0,0
,5
1,0
1,5
2,0
Dimension 1
El anlisis digital permite describir el mapa con mayor seguridad y validar lo que
nos muestra, ya que no hay que olvidar que la tcnica es una transformacin de
variables y que para una correcta interpretacin de las nuevas variables es
necesario analizar todas las dimensiones que participan en la solucin.
35
1,00
VAR00001
2,00
Total
VAR00001
3,00
Total
VAR00001
1,00
2,00
3,00
10
10
10
30
10
10
10
30
10
10
10
30
1,00
2,00
3,00
1,00
2,00
3,00
Total
VAR00002
2,00
10
10
10
30
10
10
10
30
10
10
10
30
3,00
Total
30
30
30
90
30
30
30
90
30
30
30
90
10
10
10
30
10
10
10
30
10
10
10
30
Figura 5.16
Eigenv alues
Iteration History
Iteration
3a
Fit
2,000000
Dimension
1
2
3
4
5
6
Difference
from the
Previous
Iteration
,000000
Eigenvalue
,333
,333
,333
,333
,333
,333
Discrimination Measures
VAR00001
VAR00002
VAR00003
1
,874
,099
,027
2
,053
,160
,787
Dimension
3
4
,072
,659
,321
,132
,606
,209
5
,267
,683
,050
6
,074
,604
,321
36
1,00
VAR00001
2,00
Total
VAR00001
3,00
Total
VAR00001
Total
1,00
2,00
3,00
1,00
2,00
3,00
1,00
2,00
3,00
21
4
5
30
16
9
5
30
18
7
5
30
VAR00002
2,00
3
22
5
30
5
20
5
30
7
18
5
30
3,00
Total
6
4
20
30
5
5
20
30
5
5
20
30
30
30
30
90
26
34
30
90
30
30
30
90
37
Figura 5.17
Eigenvalues
Iteration History
Iteration
3a
Fit
2,000000
Difference
from the
Previous
Iteration
,000000
Dimension
1
2
3
4
5
6
Eigenvalue
,502
,481
,333
,333
,185
,165
Discrimination Measures
VAR00001
VAR00002
VAR00003
1
,752
,752
,001
2
,722
,713
,009
Dimension
3
4
,000
,000
,007
,006
,993
,994
5
,278
,275
,003
6
,248
,247
,000
38
Figura 5.18
1,5
1,00
1,00
1,0
,5
3,00
1,00
Dimension 2
0,0
2,00
3,00
3,00
VAR00003
-,5
2,00
2,00
VAR00002
VAR00001
-1,0
-1,5
-1,0
-,5
0,0
,5
1,0
1,5
Dimension 1
Dimensin 4
Dimensin 3
39
VAR00002
2,00
1,00
VAR00001
Total
VAR00001
Total
VAR00001
Total
1,00
3,00
90
90
2,00
90
90
3,00
90
90
Total
90
90
90
90
90
90
Figura 5.20
Iteration History
Iteration
3a
Fit
2,000000
Difference
from the
Previous
Iteration
,000000
Eigenvalues
Dimension
1
2
Eigenvalue
1,000
1,000
Discrimination Measures
VAR00001
VAR00002
VAR00003
Dimension
1
2
1,000
1,000
1,000
1,000
1,000
1,000
3,00
1,0
1,00
,5
0,0
Dimension 2
-,5
VAR00003
-1,0
VAR00002
2,00
VAR00001
-1,5
-1,5
-1,0
-,5
0,0
,5
1,0
1,5
Dimension 1
41
13
VARIABLES
ORIGINALES
VARIABLES
TRANFORMADAS
ESCALAMIENTO
OPTIMO
Nominal
Ordinal
Numrica
Cuantificacin
COMPONENTES
SELECCIONADOS
COMPONENTES
44
variable escalada ptimamente. Cuando todas las variables estn a nivel numrico,
el anlisis es anlogo al anlisis de componentes principales tpico.
b) Transformacin de las variables escaladas en componentes.
La segunda transformacin que involucra el anlisis es la transformacin de
las variables escaladas ptimamente en componentes. Los Componentes consisten
en nuevas variables que recogen la variacin y/o asociacin de la informacin
total. La obtencin de las nuevas variables depender del nivel de escalamiento de
las variables analizadas. Un mbito operativo a destacar, es la salida de resultados
del programa estadstico que difiere segn la combinacin de escalamientos
involucrados en el anlisis.
En el mbito de esta segunda transformacin emergen dos interrogantes: la
primera, Cuantas dimensiones se generan?, y la segunda, Cul es la cantidad de
informacin total del modelo?.
Para contestar las interrogantes, debemos comprender que este anlisis es
una combinacin entre el anlisis de correspondencia mltiple y el anlisis de
componentes principales.
Si todas las variables son escaladas nominalmente (dicotmicas), ordinal o
numricas, el comportamiento de la tcnica es semejante al anlisis de
componentes principales.
Al contrario, si todas las variables son escaladas nominalmente mltiples, el
comportamiento de la tcnica es semejante al anlisis de correspondencia mltiple.
Estos extremos se entienden debido a que se encuentran en contraposicin
dos conceptos claves: En las variables nominales mltiples, la asociacin se
relaciona con categoras semejantes categoras diferentes, es decir la asociacin
se relaciona con grupos de casos que comparten las mismas categoras, sin
importar el orden de dichas agrupaciones. Mientras en las variables nominales,
ordinales o numricas, la asociacin se relaciona con la covariacin de las
categoras, es decir, la direccin de la relacin15.
15
La tendencia de variacin conjunta de las variables es a que los valores altos de una
variable se correspondan con los valores altos de la segunda variable, cabe hablar de la
existencia de una asociacin positiva. Por el contrario, cuando los valores superiores de
una variable se corresponden con los valores bajos de aquella, se dice entonces que la
direccin de la asociacin es negativa. Garca Ferrado, M, Socioestadstica, CIS, 1994, Pag
221.
46
1,00
VAR00001
2,00
Total
VAR00001
3,00
Total
VAR00001
Total
1,00
2,00
3,00
1,00
2,00
3,00
1,00
2,00
3,00
21
4
5
30
16
9
5
30
1
29
30
VAR00002
2,00
3
22
5
30
5
20
5
30
7
18
5
30
3,00
6
4
20
30
5
5
20
30
5
5
20
30
Total
30
30
30
90
26
34
30
90
13
23
54
90
En la tabla se muestran las variables identificadas como 001, 002 y 003. Las
variables 001 y 002 muestran una asociacin entre ellas. La variable 003 para sus
categoras 1 y 2 muestra una independencia con respecto al resto de las variables,
mientras en la categora 3 se observa una mayor agrupacin de casos en la
categora 3 de la variable 001, y en la categora 1 y 3 de la variable 002. Una
caracterstica especifica de esta base de datos es que posee asociacin e
independencia entre las variables.
A continuacin se muestra cada modelo con su escalamiento
correspondiente:
Los dos primeros modelos muestran soluciones ideales extremas de
la tcnica, soluciones basadas desde el anlisis de correspondencia mltiple
hasta el anlisis de componentes principales
1 Modelo: Todas las variables son escaladas nominal mltiple.
2 Modelo: Todas las variables son escaladas ordinalmente.
47
48
Figura 6.3
Iteration History
Variance Accounted
For
Iteration Number
3a
Total
1,00000
Increase
,00000
Loss
Total
2,00000
Centroid
Coordinates
2,00000
Restriction of
Centroid to
Vector
Coordinates
,00000
a. The iteration process stopped because the convergence test value was reached.
Dimension
1
2
3
4
5
6
Mean
Cronbach's
Alpha
,532
,368
,000
,000
-,721
-1,835
,000a
Dimensiones
= n de categoras - n de variables
Una observacin bsica muestra que las seis dimensiones recogen el 200%
de la varianza, es decir, 2 veces la informacin total. A diferencia, del anlisis de
49
Modelo de Anlisis
Propuesto para Ajuste de Modelo
con Categoras Mltiple
Cuantificacin de
Categoras
Medidas de
Discriminacin
Valor Propio
Figura 6.7
VAR00001a
Category
1,00
2,00
3,00
Frequency
69
87
114
1
,146
-1,213
,837
2
-1,383
,370
,555
Centroid Coordinates
Dimension
3
4
,000
,000
,000
,000
,000
,000
5
-,987
,264
,396
6
,078
-,653
,451
Cuantificacin de Categoras
Dimension
Dimension
0,146
-1,383
0,000
0,000
,466
131,881
0,000
0,000
2 87
-1,213 0,370
0,000
0,000
127,920
11,902
0,000
0,000
3 114
0,837
0,000
0,000
79,899
35,053
0,000
0,000
0,555
Medidas de
Discriminacin
0,775
0,662
0,000
0,000
51
Figura 6.9
VAR00002
Frecuencia
Cuantificacin de Categoras
Dimension
Category
Dimension
3
90
0,453
-0,893
-0,528
-0,503
18,453
71,795
25,048
22,751
90
-1,171
0,334
-0,022
-0,246
123,496
10,064
0,044
5,438
90
0,719
0,559
0,550
0,749
46,473
28,098
27,187
50,435
0,698
0,407
0,194
0,291
Medidas de
Discriminacin
Figura 6.10
VAR00003
Frecuencia
Cuantificacin de Categoras
Dimension
Category
Dimension
90
-0,139
-0,470
1,261
-0,224
1,742
19,906
143,191
4,508
90
-0,249
-0,230
-0,758
1,125
5,573
4,779
51,762
113,833
90
0,388
0,701
-0,503
-0,901
13,546
44,193
22,769
73,034
0,077
0,255
0,806
0,709
Medidas de
Discriminacin
Var 0001
0,775
0,662
0,000
0,000
Var 0002
0,698
0,407
0,194
0,291
Var 0003
0,077
0,255
0,806
0,709
1,550
1,325
1,000
1,000
0,517
0,442
0,333
0,333
52
Figura 6.12
Var 0001
Var 0002
Var 0003
Total Eigenvalue
0,775
0,698
0,077 =
1,550
0,517
0,662
0,407
0,255 =
1,325
0,442
0,000
0,194
0,806 =
1,000
0,333
0,000
0,291
0,709 =
1,000
0,333
53
Figura 6.13
Autovalore s Aditivo
N de dimensione s totales
6
= =1
6
=
Iteration Number
1a
Total
3,00000
Increase
,00000
Loss
Total
6,00000
Centroid
Coordinates
5,95975
Restriction of
Centroid to
Vector
Coordinates
,04025
a. The iteration process stopped because the convergence test value was reached.
54
Figura 6.15
Model Summary
Dimension
1
2
3
Total
Cronbach's
Alpha
,376
,000
-,753
1,000 a
Los valores propios son equivalentes a los valores propios del anlisis de
componentes principales clsico. Es decir, el valor propio muestra el porcentaje de
informacin retenida para cada dimensin.
Cuntos componentes necesitamos?
Como el modelo genera tantos componentes como variables son incluidas,
en este caso, 3 componentes. Y el objetivo principal del anlisis de componentes
es reducir informacin, es necesario determinar un nmero menor de
componentes, el problema radica en Cuntos componentes necesitamos?.
Cmo este modelo es semejante al anlisis de Componentes Principales, se
puede utilizar la serie de procedimientos clsicos para determinar el nmero
correcto de componentes, por ejemplo:
Criterio de raz latente: cualquier componente individual
debera justificar la varianza de por lo menos de una nica variable.
Criterio a priori: Un nmero determinado de componentes.
Criterio de porcentaje de varianza: un porcentaje acumulado
especificado.
Criterio de contraste de cada: el nmero de componentes que
prima en la varianza comn.
La literatura recomienda que para modelos en que se han incluidos variables
nominal simple, ordinales o numricas se debe utilizar el criterio de raz latente, es
decir, operativamente se seleccionan todos los componentes que tengan un valor
superior a 1. Un elemento a no olvidar es el porcentaje de informacin retenida, en
55
x2
y2
z2
x2 + y2 + z2
Variable 2
x2
y2
z2
x2 + y2 + z2
Variable 3
x2
y2
z2
x2 + y2 + z2
Variable 4
Valor Propio
56
Figura 6.17
Component Loadings
Valores al Cuadrado
Dimension
2
VAR00001
0,817
0,000
0,577
0,667
0,000
0,333
VAR00002
0,591
0,690
-0,418
0,349
0,476
0,174
VAR00003
0,564
-0,724
-0,398
0,318
0,524
0,159
1,334
1,000
0,666
Valor Propio
Comunalidad
Estos dos primeros modelos nos muestran dos soluciones con ajustes
diferentes.
El nmero de dimensiones generadas difiere, es decir al cambiar el nivel de
escalamiento, de nominal mltiple a ordinal, la base del nmero de dimensiones
pasa del nmero de categoras al nmero de variables.
Pero no todo es diferencia, debido al modelo, y al nmero de categoras, la
cantidad de informacin distribuida en los componentes es la misma. En el caso
del escalamiento nominal mltiple la informacin se encuentra replicada.
A partir del esquema de los modelos anteriores, a continuacin
generaremos modelos con escalamiento combinado.
57
3 Modelo
En el tercer modelo se analiza la misma base, pero dos variables son
escaladas ordinalmente, y la tercera nominal mltiple. Las variables escaladas
ordinalmente son las asociadas, y la tercera variable escalada nominal mltiple es
la independiente.
Figura 6.18
Iteration History
Variance Accounted
For
Iteration Number
1a
Total
2,50000
Increase
,00000
Loss
Total
6,50000
Centroid
Coordinates
6,46753
Restriction of
Centroid to
Vector
Coordinates
,03247
a. The iteration process stopped because the convergence test value was reached.
Dimension
1
2
3
4
Total
Total
% of Variance
(Eigenvalue)
1,351
45,035
1,000
33,333
1,000
33,333
,649
21,632
2,500 c
83,333 c
58
59
Cuantificacin de Categoras
Dimension
Dimension
90
-0,484
-0,446
1,206
0,335
21,083
17,874
130,916
10,127
90
-0,355
1,209
-0,593
0,246
11,338
131,537
31,679
5,446
90
0,839
-0,763
-0,613
-0,581
63,343
52,435
33,796
30,426
0,355
0,748
0,727
0,170
Medidas de
Discriminacin
Variables No
Mltiple
Total
(Eigenvalue)
Total
+
+
+
+
0,996
0,252
0,273
0,479
=
=
=
=
Totales
1,35105
1
1
0,64895
60
Figura 6.22
Modelo 3 Variables
1
33%
Dimension
1
2
3
4
2
66%
1 Componente
61
4 Modelo
En el cuarto modelo se analiza la misma base, pero dos variables son
escaladas nominal mltiples, y la tercera ordinal. Las variables escaladas nominal
mltiples son las asociadas, y la tercera variable escalada ordinalmente es la
independiente.
Figura 6.23
Iteration History
Variance Accounted
For
Iteration Number
1a
Total
1,80000
Loss
Increase
,00000
Total
5,20000
Centroid
Coordinates
5,17841
Restriction of
Centroid to
Vector
Coordinates
,02159
a. The iteration process stopped because the convergence test value was reached.
Dimension
1
2
3
4
5
Total
Total
% of Variance
(Eigenvalue)
1,539
51,313
1,318
43,924
1,000
33,333
,682
22,743
,461
15,353
1,800c
60,000c
62
63
Figura 6.25
VAR00001
Frecuencia
Cuantificacin de Categorias
Dimension
Category
Dimensin
69
0,201
-1,373
0,000
0,988
-0,11
2,794
130,038
0,000
67,332
0,836
87
-1,222
0,327
0,000
-0,235
0,6687
130,018
9,277
0,000
4,803
38,902
114
0,811
0,582
0,000
-0,419
-0,444
75,007
38,576
0,000
19,974
22,443
0,770
0,659
0,000
0,341
0,230
Medidas de
Discriminacin
VAR00002
Frecuencia
Cuantificacin de Categoras
Dimension
Category
Dimensin
90
0,482
-0,883
0,719
-0,635
0,2635
20,892
70,099
46,462
36,296
6,251
90
-1,198
0,270
0,156
0,194
-0,655
129,190
6,570
2,182
3,402
38,655
90
0,716
0,612
-0,874
0,441
0,3918
46,178
33,747
68,784
17,474
13,817
0,727
0,409
0,435
0,212
0,217
Medidas de
Discriminacin
64
Figura 6.26
Modelo 3 Variables
2
66%
1
33%
Variables Multiple
Variables No
Total
Nominal
Multiple
(Eigenvalue)
Dimension % of Variance
% of Variance
% of Variance
1
74,830
4,281
51,313
2
53,390
24,990
43,924
3
21,746
56,508
33,333
4
27,645
12,940
22,743
5
22,390
1,281
15,353
1 Componente
65
2,00
2,00
0,0
2,00
1,00
Dimension 2
-,5
1,00
VAR00003
-1,0
VAR00002
1,00
VAR00001
-1,5
-1,5
-1,0
-,5
0,0
,5
1,0
Dimension 1
Variable Principal normalization.
2 Modelo
66
Component Loadings
VAR00001
VAR00002
VAR00003
1
,817
,591
,564
Dimension
2
,000
,690
-,724
3
,577
-,418
-,398
67
Figura 6.29
Componente 2
Variable 002
Variable 001
Variable 003
Componente 1
Segn este procedimiento el componente 1 se asocia principalmente con la
variable 001, y las tres muestran una relacin positiva entre las variables. Se
observa que las variables 002 y 003 se relacionan con la variable 001, pero entre
ellas existe independencia, ya que se distribuyen en forma perpendicular.
3 Modelo
La interpretacin de un modelo combinado implica la utilizacin de dos
matrices y de un mapa perceptual. El analista debe ser capaz de combinar
informacin originada a partir de dos fuentes diferentes. Por un lado, para las
variables nominales mltiples se deben utilizar la matriz de coeficientes de
discriminacin y el mapa perceptual. Mientras para la variable ordinal se utiliza la
matriz de saturacin.
68
Figura 6.30
Component Loadings
Dimension
VAR00001
VAR00002
VAR00003
1
,822
,566
2
,000
,502
3
,000
,522
4
,570
-,393
Var 0003
0,355
0,748
0,727
0,17
Figura 6.31
Variable 0002
Variable 0001
Variable 0003
69
4 Modelo
La interpretacin de un modelo combinado implica la utilizacin de dos
matrices y de un mapa perceptual. El analista debe ser capaz de combinar
informacin originada a partir de dos fuentes diferentes. Por un lado, para las
variables nominales mltiples se deben utilizar la matriz de coeficientes de
discriminacin y el mapa perceptual. Mientras para la variable ordinal se utiliza la
matriz de saturacin, y si es necesario el mapa perceptual.
Figura 6.32
Medidas de Discriminacin
1
Var 0001
0,770
0,659
0,000
0,341
0,230
Var 0002
0,727
0,409
0,435
0,212
0,217
Component Loadings
1
VAR00001
VAR00002
VAR00003
Dimension
3
,207
,500
,752
,360
,113
Componente 2
Figura 6.33
Variable 003
Variable 002
Variable 001
Componente 1
70
18
La aplicacin de la tcnica fue con los datos sin ponderar, ya que slo acepta enteros, y
muchos valores ponderados poseen decimales, y son excluidos del anlisis.
19
Se excluyeron del anlisis, todos los casos que tuviesen a lo menos un caso perdido en
alguna de las variables utilizadas.
71
2,0
2,0
1,5
1,5
1,0
1,0
,5
Quantifications
0,0
-,5
-1,0
De acuerdo
En desacuerdo
0,0
-,5
-1,0
De acuer do
Categories
Categories
En desacuer do
2,0
,5
1,5
0,0
1,0
-,5
,5
Quantifications
Quantifications
Quantifications
,5
- 1,0
- 1,5
- 2,0
De acuerdo
En desacuerdo
0,0
-,5
-1,0
De acuerdo
Categories
Categories
En desacuerdo
72
Transformation
Plot Mantener econmicament
Transformation Plot La existencia de diferentes opiniones
po
1,0
1,5
,5
1,0
0,0
,5
Quantifications
Quantifications
-,5
0,0
-,5
-1,0
De acuerdo
-1,0
-1,5
-2,0
De acuerdo
En desacuerdo
En desacuerdo
Categories
Categories
1,0
,5
1,5
0,0
1,0
-,5
-1,0
Quantifications
Quantifications
,5
0,0
-,5
-1,0
De acuerdo
En desacuerdo
-1,5
-2,0
-2,5
-3,0
De acuerdo
En desacuerdo
Categories
Categories
3,0
,5
2,5
2,0
0,0
1,5
-,5
Quantifications
-1,5
-2,0
-2,5
De acuerdo
En desacuerdo
,5
0,0
-,5
-1,0
De acuer do
En desacuer do
Categories
Categories
Quantifications
Quantifications
1,0
-1,0
0
-1
De acuerdo
En desacuerdo
Categories
Optimal scaling level: Or dinal.
Variable Principal normalization.
73
Figura 6.35
Resumen del modelo
Varianza explicada
Dimensin
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Total
Alfa de
Cronbach
,430
,211
,155
,104
,069
,007
-,003
-,017
-,052
-,126
-,161
-,183
-,226
-,293
-,767
,994a
Variables nominales
mltiples
% de la
Total
varianza
,145
14,486
,053
5,285
,102
10,197
,452
45,219
,309
30,926
,449
44,938
,859
85,867
,500
49,965
,475
47,499
,068
6,814
,184
18,374
,130
13,006
,267
26,708
,006
,608
,001
,107
,267b
26,667b
Variables no mltiples
% de la
Total
varianza
1,505
13,681
1,188
10,797
1,064
9,671
,653
5,941
,759
6,896
,557
5,061
,138
1,259
,485
4,411
,479
4,358
,828
7,530
,687
6,250
,726
6,601
,561
5,104
,782
7,112
,586
5,329
11,000
100,000
Total
(Autovalores)
1,650
1,241
1,166
1,106
1,068
1,006
,997
,985
,954
,896
,871
,856
,829
,788
,587
11,267c
% de la
varianza
13,748
10,338
9,715
9,214
8,898
8,384
8,310
8,207
7,953
7,470
7,260
7,134
6,904
6,570
4,894
93,889c
Figura 6.36
Saturaciones en componentes
Dimensin
1
0,003
0,231
-0,202
0,495
0,091
0,444
-0,127
0,186
-0,095
0,507
-0,187
-0,426
0,103
-0,423
-0,093
-0,027
0,562
-0,080
0,302
0,225
-0,463
-0,110
0,224
-0,268
0,006
0,548
0,193
-0,177
-0,203
0,045
0,709
0,070
0,302
0,151
0,171
-0,106
-0,473
-0,061
0,330
0,024
0,200
-0,064
-0,253
-0,323
0,610
0,223
-0,006
-0,075
0,673
0,112
0,333
0,183
0,211
-0,104
-0,314
0,422
0,242
-0,003
0,254
-0,253
-0,211
0,516
0,108
-0,024
0,360
0,041
0,145
0,053
0,102
0,452
0,309
0,449
Medidas de discriminacin
Frase con la que est ms de acuerdo
75
ambas variables, poseen una relacin negativa con permitir el aborto por
problemas de sobrevivencia. El mapa perceptual del homals confirma la
distribucin de las categoras. Este componente se podra bautizar como roles
diferenciados en la familia.
Figura 6.37
1,0
De acuerdo
acuerdo
DeDe
acuerdo
,5
Endesacuerd
desacuerd
0,0 En
Dimension 2
Mantener econmicame
nte a la familia es
-,5
-1,0
En desacuerd
-1,5
-1,0
-,5
0,0
,5
1,0
ar permitido realiza
1,5
2,0
Dimension 1
2 Componente
La existencia de diferentes opiniones polticas es un obstculo para el
avance del pas
La discriminacin afecta el desarrollo del pas
En Chile es difcil divorciarse
En Chile los jvenes tienen espacios para dar su opinin.
A partir de los coeficientes se observa una relacin positiva entre las tres
primeras variables, y dichas variables se relacionan negativamente con la variable
En Chile los jvenes tienen espacios para dar su opinin. Un punto a recalcar es
la relacin de la variable La existencia de diferentes opiniones polticas es un
obstculo para el avance del pas, ya que se comportan en forma inversa a lo
esperado en esta dimensin. El mapa perceptual del homals confirma la
distribucin de las categoras. Este componente se podra bautizar como
diversidad de y espacios de opinin.
76
Figura 6.38
2,5
2,0
1,5
De acuerdo
1,0
En desacuerd
De
Deacuerdo
acuerdo
,5
0,0
ecta el desarrollo d
De acuerdo
En desacuerd
-,5
Dimension 2
La disrciminacin af
En Chile es difcil
divorciarse
En desacuerd
-1,0
En desacuerd
-1,5
-2,0
La existencia de dif
erentes opiniones po
En Chile los jvenes
-2,5
-2,5
-1,5
-2,0
-,5
-1,0
,5
0,0
1,5
1,0
2,5
2,0
Dimension 1
3 Componente
En Chile debera estar permitido realizar un aborto a toda mujer que lo
desee
El matrimonio es un compromiso para toda la vida
Ambas variables poseen una
relacin negativa o inversa. El mapa
perceptual del homals confirma la distribucin de las categoras. Este componente
se podra bautizar como tradicionalismo liberalismo en el mbito familiar.
77
Figura 6.39
2,0
De acuerdo
1,5
1,0
De acuerdo
,5
Dimension 2
0,0
En desacuerd
En Chile debera est
-,5
ar permitido realiza
En desacuerd
-1,0
El matrimonio es un
compromiso para toda
-1,5
-2,0
-1,5
-1,0
-,5
0,0
,5
1,0
1,5
2,0
Dimension 1
4 componente
Los jvenes deberamos preocuparnos de las violaciones a los DDHH
El servicio militar debera ser voluntario
Frase de democracia con la que est ms de acuerdo.
Se observa que entre las variables Los jvenes deberamos preocuparnos
de las violaciones a los DDHH y El servicio militar debera ser voluntario existe
una relacin positiva.
Las personas que declaran estar de acuerdo con las afirmaciones se asocian
en mayor grado con categoras relacionadas con democracia, mientras las
personas que se declaran estar en desacuerdo con las afirmaciones likert se
relacionan con categoras de indiferencia a la democracia o a favor del sistema
autoritario. Un anlisis complementario con tablas de contingencia muestra, que
aunque existe una mayora de personas que declaran estar de acuerdo con las
afirmaciones, las personas que declaran estar en desacuerdo con las afirmaciones
se relacionan con la categora En algunas circunstancias es mejor un gobierno
autoritario que uno democrtico (Ver Figura 6.41). El componente se podra
bautizar como Aspectos polticos y Derechos Humanos
78
Figura 6.41
Acuerdo
Desacuerdo
2,5
No estoy de
2,0
1,5
1,0
En desacuerd
,5
acuerdo
LaDedemocraci
De acuerdo
0,0
Dimension 2
-,5
En desacuerd
La democraci
-1,0
En algunas c
Da lo mismo
ms de acuerdo
El servicio militar
-1,5
debera s er v oluntar
-2,0
-2,5
os preocuparnos de l
-2,5
-1,5
-2,0
-,5
-1,0
,5
0,0
1,5
1,0
Democracia
2,5
2,0
No Democracia
Dimension 1
Figura 6.42
100,00%
95,00%
DE ACUERDO
90,00%
85,00%
80,00%
75,00%
70,00%
65,00%
60,00%
55,00%
50,00%
La democracia es
preferible a otro
sistema de gobierno
En algunas
circunstancias es
mejor gobierno
autoritario ...
Da lo mismo un
La democracia es
gobierno
preferible, pero se
democratico que un debe perfeccionar
gobierno ...
No estoy de
acuerdo con
ninguna de estas
frases
79
5 y 6 componentes
Lo comn que poseen ambos componentes, es la mayor participacin de la
variable nominal mltiple es su constitucin.
El quinto componente asocia la variable Frase de democracia con la que
est ms de acuerdo y En Chile los jvenes tienen espacios para dar su opinin.
Figura 6.43
Quantifications
3
Da lo mismo
2
La democraci
1
En desacuerd
De acuerdo
La democraci
No estoy de
Dimension 2
-1
En Chile los jvenes
En algunas c
-2
-3
-3,0
-2,0
-2,5
-1,0
-1,5
0,0
-,5
1,0
,5
2,0
1,5
3,0
2,5
Dimension 1
80
50
45
40
35
30
25
20
15
10
5
0
La democracia es
preferible a otro
sistema de gobierno
La democracia es
preferible, pero se
debe perfeccionar
En algunas
circunstancias es
mejor gobierno
autoritario ...
Da lo mismo un
No estoy de acuerdo
gobierno democratico con ninguna de estas
que un gobierno ...
frases
81
82
1 Ejemplo
Se aplica el anlisis de correspondencia mltiple. El modelo incluye dos
variables asociadas y una variable independiente.
VAR00001 * VAR00002 * VAR00003 Crosstabulation
Count
VAR00003
1,00
VAR00001
1,00
2,00
Total
VAR00001
3,00
Total
VAR00001
1,00
2,00
3,00
20
5
5
30
20
5
5
30
20
5
5
30
1,00
2,00
3,00
1,00
2,00
3,00
Total
VAR00002
2,00
5
20
5
30
5
20
5
30
5
20
5
30
3,00
Total
5
5
20
30
5
5
20
30
5
5
20
30
30
30
30
90
30
30
30
90
30
30
30
90
Figura 7.1
Eigenvalues
Dimension
1
2
3
4
5
6
Eigenvalue
,500
,500
,333
,333
,167
,167
Variable
Independiente
Discrimination Measures
VAR00001
VAR00002
VAR00003
1
,750
,750
,000
2
,750
,750
,000
Dimension
3
4
,000
,000
,000
,000
1,000
1,000
5
,250
,250
,000
6
,250
,250
,000
Variable
Independiente
83
VAR00001
1,00
2,00
Total
VAR00001
3,00
Total
VAR00001
Total
1,00
2,00
3,00
1,00
2,00
3,00
1,00
2,00
3,00
21
4
5
30
16
9
5
30
1
29
30
VAR00002
2,00
3
22
5
30
5
20
5
30
7
18
5
30
3,00
Total
6
4
20
30
5
5
20
30
5
5
20
30
30
30
30
90
26
34
30
90
13
23
54
90
84
Figura 7.2
Correlations
Spearman's rho
VAR00001
VAR00002
VAR00003
Cronbach's
Alpha
,376
,000
-,753
1,000 a
VAR00001
VAR00002
VAR00003
1
,817
,591
,564
Dimension
2
,000
,690
-,724
3
,577
-,418
-,398
3 Ejemplo
Se aplica el anlisis de componentes principales clsico. Se asume que se
estn alterando una serie de condiciones de aplicacin, pero el objetivo de este
ejercicio es observar la distribucin de la informacin en las nuevas variables, para
ello se obtiene la salida por defecto del programa. El modelo incluye un para de
variables incorrelacionadas.
85
VAR00001
1,00
2,00
Total
VAR00001
3,00
Total
VAR00001
1,00
2,00
3,00
21
4
5
30
16
9
5
30
1
1,00
2,00
3,00
1,00
2,00
3,00
29
30
Total
VAR00002
2,00
3
22
5
30
5
20
5
30
7
18
5
30
3,00
Total
6
4
20
30
5
5
20
30
5
5
20
30
30
30
30
90
26
34
30
90
13
23
54
90
Figura 7.3
Correlations
VAR00001
VAR00002
VAR00003
Pearson Correlation
Sig. (2-tailed)
N
Pearson Correlation
Sig. (2-tailed)
N
Pearson Correlation
Sig. (2-tailed)
N
VAR00001
VAR00002
VAR00003
1,000
,242**
,231**
,
,000
,000
270
270
270
,242**
1,000
,000
,000
,
1,000
270
270
270
,231**
,000
1,000
,000
1,000
,
270
270
270
Component
1
2
3
Total
1,334
1,000
,666
I nitial Eigenvalues
% of Variance Cumulative %
44,476
44,476
33,333
77,809
22,191
100,000
Component Matrixa
VAR00001
VAR00002
VAR00003
Component
1
2
,817 1,201E-15
,591
-,690
,564
,724
86
87
Conclusiones Finales
88
Conclusiones Finales
89
Bibliografa
Bibliografa
Crivisqui, E. Anlisis factorial de correspondencia un instrumento de investigacin
en ciencias sociales, Universidad Catlica de Asuncin, Paraguay.
Del Rincn, D. Tcnicas de investigacin en ciencias sociales, 1995, Editorial
DYKINSON, Espaa.
Escofier, B. Anlisis factoriales simples y mltiples. Objetivos, mtodos e
interpretacin, 1995, Editorial de la Universidad del Pas Vasco, Bilbao, Espaa.
Hair, J. Anlisis Multivariante, 1998, Printice Hall, Espaa.
INJUV, Resultados preliminares cuarta encuesta nacional de juventud 2003, 2004,
Departamento de Estudios y Evaluacin, Chile.
Joaristi, L. Anlisis de Correspondencias, Cuaderno de estadstica, 2000, Editorial
La Muralla, Espaa.
Meulman, J. SPSS Categoras 11.0, 2001, SPSS Inc, EEUU.
Prez, C. Tcnicas Estadsticas con SPSS, 2001, Printice Hall, Espaa.
Snchez C, J. Introduccin a las tcnicas de anlisis multivariable aplicadas a las
ciencias sociales, 1984, CIS, Espaa.
Van De Geer, J. Homals, Leiden, 1985, Universidad de Leiden, Holanda.
Visauta V., B. Anlisis estadistico con SPSS para Windows, Volumen II, Estadstica
Multivariante, 1999, Mc Graw Hill, Espaa.
Vivanco, M. Anlisis estadstico multivariable. Teora y Practica, 1999, Editorial
Universitaria, Chile.
Vivanco, M. Anlisis Multivariante, 1996, Editorial Tierra Ma, Chile.
90