Вы находитесь на странице: 1из 11

Captulo 7

Analisis de correspondencias

El Analisis de Correspondencias es una tecnica de reduccion de dimension y elaboracion de


mapas percentuales. Los mapas percentuales se basan en la asociacion entre objetos y un con-
junto de caractersticas descriptivas o atributos especificados por el investigador. Su aplicacion
es muy directa y su beneficio es la capacidad para representar filas y columnas en un mismo
espacio. En este sentido la finalidad sera determinar la posicion de una serie de objetos segun
una serie de caractersticas a traves de un espacio vectorial en dos, tres o mas dimensiones.

En su forma basica, el Analisis de Correspondencias examina las relaciones entre categoras


de datos nominales mediante la medida de asociacion de la chi-cuadrado. Este analisis realiza
una reduccion de la dimension del problema en donde la proximidad, en sentido matematico,
entre los individuos indicara el nivel de asociacion.

El Analisis de Correspondencias tiene dos objetivos basicos:

Asociacion entre categoras de columnas o filas: se usa para medir la asociacion de solo
una fila o columna, para ver, por ejemplo si las modalidades de una variable pueden ser
combinadas

Asociacion entre categoras de filas y columnas: se usa para estudiar si existe relacion
entre categoras de las filas y columnas.

El analisis de correspondencias solo requiere que los datos representen las respuestas a una
serie de preguntas y que estan organizadas en categoras. Dependiendo si existen dos o mas
variables el analisis sera simple o multiple.

7.1. Analisis de correspondencias


Uno de los objetivos del Analisis de Correspondencias es describir las relaciones existentes
entre dos variables nominales, recogidas en una tabla de correspondencias, sobre un espacio
de pocas dimensiones, mientras que al mismo tiempo se describen las relaciones entre las cate-
goras de cada variable. Para cada variable, las distancias sobre un grafico entre los puntos de
categoras reflejan las relaciones entre las categoras, con las categoras similares representadas

91
Analisis de correspondencias 92

proximas unas a otras.

El analisis de las tablas de contingencia a menudo incluye examinar los perfiles de fila y
de columna, as como contrastar la independencia a traves del estadstico de chi-cuadrado.
Sin embargo, el numero de perfiles puede ser bastante grande y la prueba de chi-cuadrado no
revelara la estructura de la dependencia. El procedimiento Tablas de contingencia ofrece varias
medidas y pruebas de asociacion pero no puede representar graficamente ninguna relacion en-
tre las variables.

7.2. Aplicacion mediante SPSS


Para poder realizar un analisis de correspondencias tendremos que seleccionar los menus:
Analizar
Reduccion de datos
Analisis de Correspondencias
En este ejemplo vamos a trabajar con el fichero correspondencias en el cual se mide a
1200 individuos dos variables, el Estado Civil, clasificado en tres grupos, Solteros, Casados y
Otros y sus Preocupaciones mas importantes, en cuatro categoras, la Vida Afectiva, el Dinero,
la Armona Familiar y la Salud.

Una vez seleccionado el analisis obtendremos el siguiente menu, en donde hemos de selec-
cionar las variables con las trabajar y las categoras que tiene cada una. En este ejemplo la
variable Fila sera estado civil, la cual tiene tres categoras (ordenadas de la 1 a la 3) por lo que
el rango tomara como valor maximo el 3 y el mnimo el 1. La variable columna sera preocupa-
ciones, el rango sera de 1 a 4.

Figura 7.1: Seleccion del analisis

A la hora de indicar las categoras de cada variable tenemos una serie de opciones sobre
ellas que son:
1. Las categoras deben ser iguales. Utilizaremos esta opcion si existen dos categoras que
son iguales o las queremos agrupar.

ANALISIS MULTIVARIANTE PARA SOCIOLOGOS MEDIANTE SPSS.


Analisis de correspondencias 93

2. La categora es suplementaria si no influye en el analisis pero se representan.

Boton Modelo
Con este boton especificaremos el numero de dimensiones, la medida de distancia, el metodo
de estandarizacion y el metodo de normalizacion.
Dimensiones en la solucion: tendremos que tener en cuenta que el numero de dimensiones
optimo sera el menor numero de dimensiones que necesitaremos para explicar la mayor
parte de la variacion. Evidentemente intentaremos que este valor sea el mnimo posible,
de tal manera que el numero maximo de dimensiones sera el mnimo del numero de filas
menos uno (en este caso 4-1=3) y el de columnas menos uno (3-1=2), es decir, en nuestro
ejemplo usaremos dos dimensiones.
Medida de distancia: por defecto usaremos la distancia chi-cuadrado.
Metodo de normalizacion: esta es una de las decisiones mas importantes, ya que de-
pendiendo del metodo, se produciran soluciones que, aunque equivalentes, pueden ser
diferentes. Usaremos:
1. Simetrico: en este caso la inercia se reparte igualmente entre filas y columnas. Us-
aremos este metodo para examinar las diferencias entre las categoras de las dos
variables.
2. Principal: usaremos este metodo si deseamos examinar las diferencias entre las cate-
goras de una o de ambas variables en lugar de las diferencias entre las dos variables.
3. Principal por fila: este metodo se usa para examinar las diferencias entre las cate-
goras de la variable de filas.
4. Principal por columna: para examinar las diferencias entre las categoras de la vari-
able de columnas.
5. Personalizado.

Figura 7.2: Boton Modelo

En nuestro ejemplo elegiremos la medida de la chi-cuadrado y como metodo de normal-


izacion el simetrico. Como ya hemos visto el numero de ejes o dimensiones apropiado sera de
dos.

ANALISIS MULTIVARIANTE PARA SOCIOLOGOS MEDIANTE SPSS.


Analisis de correspondencias 94

7.2.1. Boton Estadsticos


Con este boton podremos obtener las siguientes salidas:

Tabla de correspondencias: tabla de contingencia de las variables con los totales marginales
de filas y columnas.

Inspeccion de los puntos de fila: resumen de cada categora de filas, las puntuaciones,
la masa, la inercia, la contribucion a la inercia de la dimension y la contribucion de la
dimension a la inercia del punto.

Inspeccion de los puntos de columna: igual que para las filas pero para cada columna.

Perfiles de fila: marginales por filas.

Perfiles de columna: marginales por columnas.

Permutaciones de la tabla de correspondencias.

Estadsticos de confianza para puntos de fila.

Estadsticos de confianza para puntos de columna.

Figura 7.3: Boton estadsticos

Aplicacion en SPSS
Vamos a seleccionar todas las opciones disponibles con este boton.

1. Tabla de correspondencias: simplemente es la tabla de doble entrada de resumen de los


datos; en ella podemos ver que por ejemplo existen 26 solteros cuya preocupacion mas
importante es la vida afectiva o 111 que es el dinero.

ANALISIS MULTIVARIANTE PARA SOCIOLOGOS MEDIANTE SPSS.


Analisis de correspondencias 95

Figura 7.4: Tabla de contingencia

2. Perfiles por fila y columna: son las distribuciones marginales. Los perfiles por fila son el
resultado de dividir cada valor por el total de su fila mientras que los perfiles por columna
es el valor de cada casilla entre el total su columna.

3. Tabla resumen: en esta tabla destacaremos varios aspectos:

a) Valor propio.
b) Inercia: raz cuadrada del valor propio. Mide la importancia de un eje; 0.043 el
primero y 0.05 el segundo.
c) Inercia total: explicacion total de los ejes. Los ejes explican un total de 0.048.
d ) Proporcion de inercia: aunque el valor de la inercia poda parecer pequeno, 0.0403
y 0.005, entre ambos ejes explican el 100 de la varianza y mas concretamente el
primero el 90.4 % y el segundo el 9.06 %.
e) Chi-cuadrado: con este valor obtenemos el contraste de independencia entre am-
bas variables, como vimos en la seccion ?? el contraste de la chi-cuadrado en las
Tablas de Contingencia contrasta la independencia como hipotesis nula frente a la
dependencia. En este caso al ser el p-valor 0,3 103 aceptaramos la hipotesis de
dependencia entre variables. Destacamos que en el caso en que dos variables fuesen
independientes, el analisis de correspondencias podra realizarse, pero no tendra
logica.

Figura 7.5: Estadsticos

f ) Examen de los puntos fila:

ANALISIS MULTIVARIANTE PARA SOCIOLOGOS MEDIANTE SPSS.


Analisis de correspondencias 96

Las puntuaciones en la dimension son los valores que toma cada punto en la repre-
sentacion que hayamos calculado. Con inercia vemos lo que aporta cada categora
al total de inercia, por ejemplo, del total de inercia (0.048) los Solteros aportan 0.028.

Con contribucion de los puntos a la inercia de la dimension se mide la importancia


de un punto a la hora de explicar un eje, por ejemplo Soltero es el valor mas impor-
tante para la orientacion del primer eje y Otro para el segundo.

Con contribucion de la dimension a la inercia del punto vemos el porcentaje de cada


modalidad explicado por cada eje, el primer eje explica el 98.30 % de la modalidad
Soltero frente a solo el 1,7 % del segundo eje.
g) Examen de los puntos columna:
Igual que el caso anterior, ademas de los valores para representar en los ejes, pode-
mos ver que el primer eje viene muy determinado por el Dinero frente al segundo
que lo hace por la Armona Familiar. Tambien podemos ver que el primer eje explica
el 99.9 % de la varianza de la modalidad de Dinero y el 93 % de Salud.

Figura 7.6: Puntos fila y columna

7.2.2. Boton graficos


Dentro del boton de graficos podremos especificar las siguientes opciones:

Diagramas de dispersion: produce los graficos por parejas de las dimensiones. Entre ellos:

1. Diagrama de dispersion biespacial: diagramas conjuntos de los puntos de filas y de


columnas.
2. Puntos de fila.
3. Puntos de columna.

ANALISIS MULTIVARIANTE PARA SOCIOLOGOS MEDIANTE SPSS.


Analisis de correspondencias 97

Grafico de lneas. Para obtener los siguientes graficos unidimensionales:

1. Categoras de fila transformadas: produce un grafico de los valores originales para


las categoras de fila frente a las puntuaciones de fila.
2. Categoras de columna transformadas: produce un grafico de los valores originales
para las categoras de columna frente a las puntuaciones de columna.

Dimensiones del grafico.

1. Muestra todas las dimensiones de la solucion.


2. Restringe el numero de dimensiones

Figura 7.7: Boton graficos

Vamos a seleccionar todos los graficos posibles.

Aplicacion en SPSS
Si seleccionamos todos los graficos posibles obtendremos:;

Diagramas de dispersion:

Con esta opcion obtenemos los graficos en dos dimensiones (si hubiera mas dimensiones
obtendramos las combinaciones de las dimensiones) para filas y columnas a la vez y por
separado.
Si analizamos los perfiles fila, observamos que los tres grupos, Solteros, Casados y Otros
son bastante diferentes (lejanos). Si observamos los puntos columna, en estos parece que
existe semejanza entre Dinero y Vida Afectiva y Salud y Armona Familiar.

ANALISIS MULTIVARIANTE PARA SOCIOLOGOS MEDIANTE SPSS.


Analisis de correspondencias 98

Figura 7.8: Graficos de filas y grafico de columnas

Con el grafico de filas y columnas podemos sacar las conclusiones finales, que son que
los Casados prefieren la Armona Familiar y la Salud frente a los Solteros que prefieren
el Dinero y la Vida Afectiva.

Figura 7.9: Grafico conjunto

Graficos de lneas: muestras los valores de las componentes de las filas y columnas uni-
dimensionalmente.

7.3. Analisis de correspondencias multiple


Para este caso vamos a usar el fichero correspondencias2, que contiene los 50 primeros
individuos del ejemplo anterior, pero a los que ademas se les ha estudiado el Sexo. Los pro-
cedimientos son los mismos solo que un poco mas amplios.

7.3.1. Aplicacion en SPSS


Para obtener un analisis de correspondencias multiple, tendremos que elegir los menus:

ANALISIS MULTIVARIANTE PARA SOCIOLOGOS MEDIANTE SPSS.


Analisis de correspondencias 99

Analizar
Reduccion de Datos
Escalamiento optimo

y en la ventana del modelo seleccionar:

Todas las variables son nominales multiples


Un conjunto
Definir

Dentro de este analisis podramos obtener todos los resultados equivalentes al analisis de
correspondencias simple. Nosotros solo nos centraremos en las siguientes opciones:

Opciones: cambiaremos metodo de normalizacion a simetrico.

Boton resultados: seleccionaremos

1. Medidas discriminantes
2. Correlaciones de las variables originales
Con estas dos opciones podemos ver la relacion entre las variables. La correlacion
mas baja es entre la variable Sexo con las otras dos, lo que implicara que no existe
mucha relacion entre ellas. Con respecto a la segunda dimension los valores aumen-
tan pero sigue la variable Sexo sin estar muy relacionada. Tambien podemos ver esta
circunstancia en el grafico de discriminacion, en donde las variables Estado Civil y
Preocupaciones estan muy relacionadas. La tabla de Medidas de discriminacion son
las coordenadas de las variables en las dos dimensiones.

Figura 7.10: Correspondencias multiples

ANALISIS MULTIVARIANTE PARA SOCIOLOGOS MEDIANTE SPSS.


Analisis de correspondencias 100

3. Cuantificaciones y contribuciones de las categoras:

Las cuantificaciones son los valores de los individuos son las representaciones opti-
mas en el sentido que esten separadas unas de otras en las dimensiones estudiadas y
dentro de cada categora los individuos esten juntos entre si. Estas cuantificaciones
son graficadas posteriormente y sera esos valores los que estudiemos.

Boton Graficos de variable:

1. Graficos por categoras: introduciremos las tres variables. Con esta opcion nos
mostrara los graficos bidimensionales de las variables marginalmente.
2. Graficos de categoras conjuntas: tambien introduciremos las tres variables. En este
caso obtendremos un grafico bidimensional con todas las variables juntas.

Figura 7.11: Graficos

En ellos podemos ver como los Hombres se posicionan cerca de preferencia por
la Salud, las Mujeres por Casadas y Armona Familiar y los Solteros por la Vida
Afectiva.
3. Graficos de objeto: con este grafico obtenemos la representacion de todos los indi-
viduos pudiendo buscar aquellos que sean anomalos o extremos, que sera aquellos
que tengan un comportamiento distinto al resto.

ANALISIS MULTIVARIANTE PARA SOCIOLOGOS MEDIANTE SPSS.


Analisis de correspondencias 101

Figura 7.12: Puntos objeto

7.4. Ejercicios obligatorios


7.4.1. Ejercicio primero
El fichero correspondencias3, contiene los datos para 1519 individuos, agrupados en
categoras profesionales (numeradas del 1 al 5), y su consumo de tabaco (categoras 1 a 4). Se
pide:

1. Cual sera el numero de dimensiones maximo posible?

2. Se podra realizar una analisis de dos dimensiones?, por que?

3. Realizar una analisis de correspondencias con dos dimensiones. Sera admisible agru-
par alguna modalidad de la variable consumo de tabaco? Y de categora profesional?
Comentar el grafico bidimensional.

7.4.2. Ejercicio segundo


Se quiere analizar la influencia de la raza en cada una de las regiones de America del
Norte. Para ello se selecciona una muestra de tal manera que a esos individuos se analiza su
region en donde viven y la raza a la que pertenecen. Los resultados aparecen en el fichero
correspondencias4. Se desea realizar un analisis de correspondencias completo (incluido el
analisis de independencia y el estudio de las tablas de frecuencias marginales) en el que se
analice esta hipotesis.

ANALISIS MULTIVARIANTE PARA SOCIOLOGOS MEDIANTE SPSS.

Вам также может понравиться