1 Tema3 ACS PDF

Analisis Multivariante
R. Gutierrez, R. Gutierrez-S anchez, A. Gonzalez

Departamento de Estadstica e I.O.
Universidad de Granada
24 de octubre de 2012
Indice general
1. Analisis de Correspondencias Simple. 1
1.1. Analisis de Correspondencias Simple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1.1. Transformacion de una tabla de contingencia bruta . . . . . . . . . . . . . . . . . . . . . 1
1.1.2. Nubes de puntos en R
p
y en R
n
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.1.3. Distancias en R
p
y R
n
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.1.4. Ajustes a la nube de perles en R
p
y en R
n
. . . . . . . . . . . . . . . . . . . . . . . . . 6
1.1.5. Relaciones entre las nubes ajustadas en R
p
y en R
n
. . . . . . . . . . . . . . . . . . . . 15
1.1.6. Reconstruccion de la Tabla inicial en el Analisis de Correspondencias Simple . . . . . . 18
1.1.7. Elementos Suplementarios en el Analisis de Correspondencias Simple . . . . . . . . . . . 20
1.1.8. Ayudas a la interpretacion en el Analisis de Correspondencias Simple . . . . . . . . . . 21
1.2. Analisis de Correspondencias Simple Matricial . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
1.2.1. Deniciones basicas del Analisis de Correspondencias Simple en formulacion matricial . 25
1.2.2. Espacios Eucldeos Ponderados y estructuracion de los espacios de perles la y perles-
columna del AC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
1.2.3. Otros elementos en el Analisis de Correspondencias Simple ligados a la estructuracion
eucldea ponderada de los espacios de perles . . . . . . . . . . . . . . . . . . . . . . . . 27
1.2.4. Descomposiciones en Valores Singulares basicas en el Analisis de Correspondencias Simple 30
1.2.5. Sobre las coordenadas de los perles-la y perles-columna y la relacion entre ellas. . . 32
1.2.6. El principio Baricentrico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
1.2.7. Resultados sobre las descomposiciones de la Inercia . . . . . . . . . . . . . . . . . . . . . 34
1.2.8. Una simplicacion en el calculo de la estructura factorial en Analisis de Correspondencias
Simple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
1.2.9. Una forma alternativa de encontrar F y G, a partir de las matrices R y C . . . . . . . . 39
1.2.10. Formulas de Reconstruccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
1.2.11. Otro sistema de coordenadas en el Analisis de Correspondencias: Las coordenadas tipi-
cadas (estandars). Representaciones asimetricas en Analisis de Correspondencias Simple 42
I Aplicaci on a SPSS y R 44
2. Analisis de Correspondencias. 45
2.1. Introduccion al analisis de correspondencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
2.2. Aplicacion mediante SPSS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
2.2.1. Boton Estadsticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
2.2.2. Boton gracos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
2.3. Analisis de correspondencias multiple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
2.3.1. Aplicacion en SPSS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
2.4. Aplicacion mediante R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
2.4.1. Paquete dudi.coa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
2.4.2. Paquete scatter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
2.4.3. Ejemplo de aplicacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
i
Tema 1
Analisis de Correspondencias Simple.
1.1. Analisis de Correspondencias Simple
Supongamos una Tabla Estadstica del tipo Tabla de Contingencia. En este tipo de tabla se miden fre-
cuencias (en principio, hoy da se consideran tambien tablas de contingencia mas generales en este sentido), es
decir n umero de individuos k
ij
pertenecientes a la clase i de la caracterstica I y a la clase j de la caractersti-
ca J. Tanto I como J clasican o particionan una misma poblacion. La tabla bruta inicial, pues, es del tipo (k
ij
).
Como ocurre en general con cualquier tipo de tabla, (de contingencia, de rangos, de medidas, booleanas,
etc), la tabla bruta inicial hay que transformarla adecuadamente, teniendo en cuenta su naturaleza y carac-
tersticas, de manera que se transforme en otra sobre la que las nociones y metodos generales del Analisis
Factorial General puedan ser aplicados y sean utiles para analizar la tabla respectiva.
En una Tabla de Contingencia, por otra parte, no tiene sentido distinguir entre variables e individuos.
Aqu ambos juegan un papel simetrico.
1.1.1. Transformacion de una tabla de contingencia bruta
Dada un tabla de contingencia con elementos k
ij
Modalidad I
Modalidad J
1 j p
1
.
.
.
.
.
.
.
.
.
i k
ij

.
.
.
.
.
.
n
.
.
.
Consideramos la tabla transformada siguiente, llamada a veces tabla (matriz) de correspondencias:
1
Analisis de Correspondencias Simple. 2
Modalidad I
Modalidad J
1 j p Total
1
.
.
.
.
.
.
.
.
.
i
k
ij
K
f
i
.
.
.
.
.
.
n
.
.
.
Total f
j
1
K =
ij
k
ij
(1.1)
f
ij
=
k
ij
K
(1.2)
f
i
=
p
j=1
f
ij
=
p
j=1
k
ij
K
(1.3)
f
j
=
n
i=1
f
ij
=
n
i=1
k
ij
K
(1.4)
La razon, en principio, de introducir la nueva tabla transformada es la siguiente. Supongamos una tabla de
contingencia bruta, inicial, en la que, por ejemplo, dos puntos-la fueran:
(783; 1114; 387; 4052; 497; 1464; 525; 387)
que constituye el reparto de 9209 individuos en 8 categoras. Y supongamos que, respecto de esas mismas ocho
categoras, se reparten 583 individuos, obteniendose otro punto-la:
(65; 43; 21; 294; 79; 57; 18; 6)
Si calcularamos la distancia eucldea entre estos dos puntos-la, su valor no hara mas que conrmar la
gran diferencia de efectivos que hay en los puntos-la considerados; pero no mediramos la distancia entre los
dos tipos de comportamiento que se reejan en dichas las. Habra, pues, que hacer una transformacion sobre
los datos brutos iniciales, k
ij
, de manera que se eliminara el efecto de los efectivos totales de cada la. Y lo
mismo cabra decir de las columnas (puntos-columna). No olvidemos que en una tabla de contingencia, las y
columnas juegan un papel simetrico. Aqu no hay columnas-variables y las-individuos, como por ejemplo en
las tablas de medidas tratadas por Analisis de Componentes Principales.
1.1.2. Nubes de puntos en R
p
y en R
n
En primer lugar, insistamos en que aunque aqu no tiene sentido distinguir entre las y columnas desde el
punto de vista de la naturaleza de la Tabla de Contingencia, nos vamos a colocar en la situacion general de
una matriz de datos, n p, supuesto entonces que hemos jado las las (n) y las columnas (p).
Con objeto de eliminar, como antes decamos, el efecto de los efectivos totales, denimos los Perles-la
y Perles-columna.
Estos perles se denen as:
Perles-la
__
f
ij
f
i
_
; j = 1, , p
_
i
afectados de masas f
i
. Hay, pues, n perles-las, cada uno afectado de
la masa f
i
respectiva (i = 1, , n). Y estos puntos-perles-la tienen de coordenadas las indicadas.
R. Gutierrez, R. Gutierrez-Sanchez, A. Gonzalez
Perles-columna
__
f
ij
f
j
_
; i = 1, , n
_
j
, donde la masa de cada perl es f
j
.
Tenemos pues las Tablas Transformadas de perles:
1. Tabla de Perles-Fila
1 j p Masas
1
f
11
f
1

f
1j
f
1

f
1p
f
1
f
1
.
.
.
.
.
.
i
f
i1
f
i

f
ij
f
i

f
ip
f
i
f
i
.
.
.
.
.
.
n
f
n1
f
n

f
nj
f
n

f
np
f
n
f
n
2. Tabla de Perles-Columna
1 j p
1
f
11
f
1

f
1j
f
j

f
1p
f
p
.
.
.
.
.
.
i
f
i1
f
1

f
ij
f
j

f
ip
f
p
.
.
.
.
.
.
n
f
n1
f
1

f
nj
f
j

f
np
f
p
Masas f
1
f
j
f
p
As pues tenemos dos nubes de puntos: una constituida por n puntos en R
p
de coordenadas:
_
f
i1
f
i
;
f
i2
f
i
; ,
f
ij
f
i
; ;
f
ip
f
i
_
; i = 1, , n (1.5)
_
f
1j
f
j
;
f
2j
f
j
; ,
f
ij
f
j
; ;
f
nj
f
j
_
; j = 1, , p (1.6)
Y estos puntos estan afectados de masa: f
i
y f
j
respectivamente.
Por otra parte, los n puntos-la anteriores (o perles-la) estan situados en realidad en un subespacio p 1
dimensional de R
p
, ya que existe entre las coordenadas de cualquiera de ellos la relacion baricentrica:
p
j=1
_
f
ij
f
i
_
= 1 ; i = 1, , n
Y lo mismo cabe decir de los p puntos-columna (perles-columna)
n
i=1
_
f
ij
f
j
_
= 1 ; j = 1, , p
de modo que estos p puntos en R
n
, lo estan en un subespacio (n 1) dimensional de R
n
.
1.1.3. Distancias en R
p
y R
n
En analisis factorial se considera la distancia entre puntos-la o entre puntos-columna, se utiliza la distancia
eucldea habitual para medir la distancia entre puntos de R
p
o de R
n
respectivamente.
Como ahora, en Analisis de Correspondencias Simple, consideramos los perles-la y perles-columna, que
siguen siendo puntos de R
p
y R
n
respectivamente, pero que estan afectados de masas, la forma de medir
distancias entre ellos ha de modicarse. As, para medir la distancia entre dos perles-la, correspondientes a
los individuos i e i
, se puede utilizar, por ejemplo, la distancia

2
(chi-cuadrado):
d
2
(i, i
) =
p
j=1
_
f
ij
f
i
f
i
j
f
i
_
2
1
f
j
(1.7)
(distancia ponderada).
Y en el caso de la distancia entre perles-columna, j y j
:
d
2
(j, j
) =
n
i=1
_
f
ij
f
j
f
ij
f
j
_
2
1
f
i
(1.8)
Este tipo de distancia
2
, no es, naturalmente, la unica que cabe considerar. Tradicionalmente se viene
considerando como habitual en el analisis de correspondencias clasico y, como es sabido, entre otras ventajas,
este tipo de distancia cumple lo que ya Bencekri denomino Principio de Equivalencia Distribucional, que
desde luego tambien verican otras distancias. En realidad es una cuestion de invarianza lo que implica dicho
Principio: Si dos puntos-la se confunden en uno solo, en R
p
y se consideran englobados en un solo punto con
masa la suma de las masas de ambos, entonces son invariantes las distancias entre los demas en R
p
y en R
n
.
(Y lo mismo si se confunden puntos en R
n
).
Esta invarianza que hace cumplirse el citado principio, tiene una profunda trascendencia en el analisis de
correspondencia de una tabla de contingencia. En efecto, cuando se establecen las clases de las caractersticas
I y J que denen la Tabla, hay un grado de arbitrariedad mas o menos grande, de modo que podran en un
principio denirse clases en I o/y en J muy proximas entre s. Bien podra ocurrir entonces que clases denidas
en un principio, se refundieran (o agregraran) en una sola por otros diversos motivos. En estos casos, es claro
que la distancia que utilizasemos debera ser lo menos sensible ante esas refundiciones de clases, en el sentido
de que no se alterasen las distancias entre puntos ya calculadas y que son entre puntos a los que no afecta en
principio esas refundiciones. La distancia chi-cuadrado dada por [1.7] y [1.8] cumple estas cualidades.
Nota 1. La distancia chi-cuadrado es la natural considerando el espacio de puntos de los perles la (o el
de las columnas) como un espacio eucldeo ponderado con metrica denida por la matriz D
1
c
= diag
_
1
f
j
_
,
estando los puntos del correspondiente espacio afectados por las masas (ponderaciones) asociadas a cada punto,
y antes indicadas.
Sobre el Principio de equivalencia distribucional en el analisis de correspondencias. En el desarrollo del
Analisis de Correspondencias Simple, la distancia adoptada entre puntos-la o puntos-columna, en R
p
y en R
n
respectivamente, dotados de masas, habida cuenta del manejo a traves de los respectivos perles que de ellos
hacemos, viene dada por la metrica
2
en R
p
y R
n
respectivamente (expresiones [1.7] y [1.8] del parrafo 1.1.3):
d
2
(i, i
) =
p
j=1
_
f
ij
f
i
f
i
j
f
i
_
2
1
f
j
d
2
(j, j
) =
n
i=1
_
f
ij
f
j
f
ij
f
j
_
2
1
f
i
(1.9)
En un lenguaje propio de la teora de Espacios Eucldeos Ponderados, estas distancias al cuadrado no son mas
que, obviamente, las distancias al cuadrado entre puntos de los eucldeos R
p
y R
n
ponderados, respectivamente,
dadas por:
d
2
(i, i
) = (i i
D
1
R
p (i i
) ; D
R
p = diag (f
j
)
d
2
(j, j
) = (j j
D
1
R
n(j j
) ; D
R
n = diag (f
i
)
(aqu i y i
son puntos-vectores de R
p
y j y j
de R
n
y D
1
R
p y D
1
R
n denen las metricas en R
p
y R
n
respectiva-
mente).
En el parrafo 1.1.3 comentado el llamado Principio de Equivalencia Distribucional y su trascendencia en
el Analisis de Correspondencias Simple. Vamos a comprobar ahora que se verica con las distancias de tipo [1.9].
Supongamos que los puntos-la i e i
estan superpuestos (se confunden) en R

p
. Entonces ello quiere decir
que:
f
ij
f
i
=
f
i
j
f
i
j = 1, , p
puesto que estar superpuestos implica que tienen iguales perles en R
p
. Por tanto, sus perles deben coincidir
con el de un punto-la, i
, con un perl superposicion de ambos, y tal que

f
ij
f
i
=
f
i
j
f
i
=
f
i
j
f
i
(1.10)
Obviamente, entonces si consideramos un punto-la i
, con masa la suma de las masas, f

i
+f
i
= f
i
de
los anteriores, ello equivale a considerar que i
es la suma de las dos las de aquellos. En efecto, de [1.10] se

deduce que:
f
ij
+f
i
j
f
i
+f
i
=
f
i
j
f
i
de modo que al ser los denominadores iguales (f

i
+f
i
= f
i
), los numeradores han de serlo f

ij
+f
i
j
= f
i
j
,
es decir, introducir el punto i con masa la suma de las sumas de i e i
, equivale a considerar el punto-suma de

las las correspondiente a los puntos i e i
en la matriz de correspondencias f
ij
.
As pues, supongamos que sustituimos dos las (i e i
) de la matriz original (de las f

ij
) por la la unica
que es la suma de ambas las, considerando que esta la resultante tiene la masa dada por la suma de las
masas correspondientes. Entonces La superposicion realizada altera las distancias entre puntos-la en R
p
, o/y
la distancia entre puntos-columna en R
n
?.
1. Las distancias entre puntos-la en R
p
no se ven afectadas por la superposicion. En efecto, si se consi-
deran dos puntos-la cualesquiera, la distancia al cuadrado
2
dada por [1.7], no se altera, ya que las
ponderaciones f
j
=
i
f
ij
no cambian si, en efecto, dos las se han sustituido por la la suma de ellas.
2. En cuanto a las distancias al cuadrado en R
n
ocurre lo siguiente: d
2
(j, j
) contiene, entre otros sumandos,

los correspondientes a las dos las que se han confundido en una unica (las i e i
). Estos dos sumandos

son:
1
f
i
_
f
ij
f
j
f
ij
f
j
_
2
+
1
f
i
_
f
i
j
f
j
f
i
f
j
_
2
[*]
Pero esta expresion es igual a
f
i
_
f
ij
f
i
f
j
f
ij
f
i
f
j
_
2
+f
i
_
f
i
j
f
i
f
j
f
i
f
i
f
j
_
2
= f
i
B +f
i
B = (f
i
+f
i
)B = f
i
B
Observese que las cantidades entre parentesis son en efecto iguales dado que
f
ij
f
i
=
f
i
j
f
i
. Pero los dos

terminos [*] se reemplazan, en la superposicion, por
1
f
i
_
f
i
j
f
j
f
i
f
j
_
2
Este ultimo es, por otra parte, igual a
f
i
_
f
i
j
f
i
f
j
f
i
f
i
f
j
_
2
que es igual a f
i
B.
Luego, en el proceso de superposicion, al calcular d
2
(j, j
) lo que se hace es sustituir los dos sumandos [*]

por su suma y los demas sumandos de d
2
(j, j
) no se ven afectados por la superposicion; luego d

2
(j, j
)
es invariante.
Finalmente, cabe decir que un resultado analogo se puede obtener cuando la superposicion se hace en los
puntos-columna, sustituyendo dos cualesquiera perles-columna por una nueva columna que tiene de masa la
suma de las masas respectivas. Esta superposicion de puntos-columna no afecta a la geometra de las las, ni
al resto de distancias
2
, entre los restantes puntos columna, en R
n
.
1.1.4. Ajustes a la nube de perles en R
p
y en R
n
Una vez que hemos denido las nubes de puntos perles (la de perles-la y la de perles-columna, en R
p
y R
n
respectivamente) y recordando que hemos jado las las y las columnas (descritas por los ndices i y j
respectivamente) pero que en una tabla de contingencia los papeles desempe nados por los ndices i y j (es decir,
las y columnas de la tabla) son simetricos, vamos a proceder al ajuste a ambas nubes de los correspondientes
subespacios optimos.
Para conseguir esto, cabra pensar que se aplicara directamente, por ejemplo a la nube en R
p
, lo que se hace
en analisis de componentes principales. Pero hay una dicultad inicial para aplicar el analisis de componentes
principales a nuestra situacion del Analisis de Correspondencias Simple, y es que la distancia entre perles-la
(perles-columna) no es una suma de cuadrados, ya que en Analisis de Correspondencias Simple, R
p
y R
n
no
son eucldeos sino eucldeos ponderados.
Analizamos a continuacion la forma de realizar los ajustes factoriales, primero en el caso de R
p
y luego en
el de R
n
.
Ajuste, en R
p
, de la nube de perles-la
Los n puntos, perles-la, en R
p
que constituyen la nube respectiva, son los de coordenadas
_
f
ij
f
i
; j = 1, , p
_
; i = 1, , n
Estos puntos pueden ser tratados en la forma siguiente: Se podran manejar a traves de las coordenadas
_
f
ij
f
i
_
f
j
; j = 1, , p
_
; i = 1, , n
Estas coordenadas transformadas, son tales que la distancia eucldea al cuadrado entre dos de esos puntos:
d
2
(i, i
) =
p
j=1
_
f
ij
f
i
_
f
j
f
i
j
f
i

_
f
j
_
2
(1.11)
coincide con la distancia
2
entre ellos, es decir, con la distancia seg un la metrica de la que anteriormente
hemos dotado al espacio R
p
como de perles-la.
Pero que signica manejar los puntos (perles-la) en R
p
, por las coordenadas
_
f
ij
f
i
_
f
j
; j = 1, , p
_
?. Evidentemente lo que hacemos al pasar de las coordenadas
f
ij
f
i
a las
f
ij
f
i
_
f
j
, no es otra cosa que un cambio
de escala en los ejes de R
p
_
f
ij

f
ij
_
f
j
_
.
Por tanto la dicultad antes planteada de que el analisis de componentes principales no se poda aplicar
directamente al analisis de la nube de perles-la en R
p
, queda obviada si manejamos dichos perles a traves
de las coordenadas transformadas
f
ij
f
i
_
f
j
: la distancia eucldea entre puntos transformados equivale a la
2
entre perles-la.
Por tanto, a continuacion, vamos a aplicar el analisis de componentes principales a la nube de puntos dados
por las coordenadas
_
f
ij
f
i
_
f
j
; j = 1, , p
_
; i = 1, . . . , n (1.12)
en R
p
, dotado de la distancia eucldea habitual.
Al aplicar el analisis de componentes principales , como previamente hemos visto, es preciso a su vez trans-
formar adecuadamente la situacion, trasladando el origen del sistema de referencia al centro de gravedad de
la respectiva nube de puntos en R
p
(recuerdese que, a su vez, el analisis de componentes principales se re-
solvio aplicando el Analisis Factorial General, por lo tanto, ajustando subespacios vectoriales, lo que requiere
obviamente el centramiento en media).
Cual es el centro de gravedad de la nube de puntos [1.12]?. Como estan afectados de una masa f
i
,
f
ij
f
i
_
f
j
1
f
i
f
ij
_
f
j
dicho centro de gravedad viene dado por:
_
n
i=1
f
i
_
f
ij
f
i
_
f
j
_
=
_
f
j
; j = 1, , p
_
(1.13)
Por tanto, al trasladar el origen al centro de gravedad, las coordenadas de los puntos-perles la, en R
p
,
pasan a ser
_
f
ij
f
i
_
f
j
_
f
j
; j = 1, , p
_
; i = 1, , n (1.14)
Siguiendo la metodologa del Analisis Factorial General al proyectar esta nube de puntos transformados
dada por [1.14] sobre el subespacio vectorial denido por el vector unitario u, uno de los puntos de ella, digamos
el i-esimo, con i = 1, , n, proporcionar una proyeccion

i
dada as:
i
=
p
j=1
_
f
ij
f
i
_
f
j
_
f
j
_
u
j
(1.15)
en donde u
j
es la j-esima componente del vector unitario u en R
p
. Pero el punto i-esimo esta dotado de una
masa f
i
. Por tanto, la inercia de la nube [1.14], es decir, la suma ponderada por f
i
de todas las proyecciones
al cuadrado, valdra:
n
i=1
f
i
2
i
(1.16)
Por tanto, el subespacio denido por aquel vector u tal que se verica
Max
u
n
i=1
f
i
2
i
dene la primera componente principal seg un la metodologa del Analisis Factorial General. Continuando
dicha metodologa, se llega a la conclusion de que la matriz de covarianzas a diagonalizar para obtener todas
las componentes principales es la de termino general
t
jj
=
n
i=1
f
i
_
f
ij
f
i
_
f
j
_
f
j
_
_
_
f
ij
f
i
_
f
j
_
f
j
_
_
(1.17)
que dene la matriz p p, digamos T.
Nota 2. Es facil ver que esta matriz T que resuelve el problema puede ponerse como T = X
X, donde X es
una matriz n p, con termino general x
ij
dado por
x
ij
=
f
ij
f
i
f
j
_
f
i
f
j
(1.18)
En efecto, seg un [1.15], se tiene para la proyeccion del i-esimo punto sobre u:
i
=
p
j=1
_
f
ij
f
i
_
f
j
_
f
j
_
u
j
=
_
f
i1
f
i
f
1
_
f
1
, ,
f
ij
f
i
_
f
j
_
f
j
, ,
f
ip
f
i
_
f
p
_
f
p
_
1p
(u
1
, , u
p
)
p1
Podemos considerar globalmente las proyecciones de todos los puntos, en i = 1, , n, englobandolas en la
expresion matricial:
_
_
_
_
_
_
_
_
_
_
_
_
_
_
f
11
f
1
f
1
_
f
1

f
1j
f
1
_
f
j
_
f
j

f
1p
f
1
_
f
p
_
f
p
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
f
i1
f
i
f
1
_
f
1

f
ij
f
i
_
f
j
_
f
j

f
ip
f
i
_
f
p
_
f
p
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
f
n1
f
n
f
1
_
f
1

f
nj
f
n
_
f
j
_
f
j

f
np
f
n
_
f
p
_
f
p
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
u
1
.
.
.
u
j
.
.
.
u
p
_
_
_
_
_
_
_
_
= Hu
en donde H
np
u
p1
es el vector columna n-dimensional que contiene las n proyecciones

i
i = 1, , n, de
los n puntos de la nube de puntos. Por lo tanto, si consideramos
(Hu)
(Hu)
obtenemos la suma de los cuadrados de todas las proyecciones

i
. Para obtener, nalmente, la expresion [1.16],
es decir, la suma ponderada de las proyecciones al cuadrado que constituye la Inercia de la nube de puntos,
tendremos que efectuar la operacion
n
i=1
f
i
2
i
=
_
_
f
i
Hu
_ _
_
f
i
Hu
_
= (H
u)
(H
u)
en donde la matriz H
np
tiene por elementos:
h
ij
=
_
f
ij
f
i
_
f
j
_
f
j
_
_
f
i
i = 1, , n ; j = 1, , p
Observese que
h
ij
=
_
f
ij
f
i
_
f
j
_
f
j
_
_
f
i
=
f
ij
f
i
f
j
f
i
_
f
j
_
f
i
=
f
ij
f
i
f
j
_
f
i
f
j
con lo que queda demostrado [1.18] con H
= X.
Nota 3. Por otra parte, probemos [1.17], expresion que denota el termino general j, j
de la matriz T, cuyos
autovalores resuelven el problema de Componentes Principales.
Es claro que la matriz X
X, en notacion del Analisis Factorial General, es la matriz que ha de resolver

el problema, en donde X es la matriz nal de los datos, sobre la que se realiza la tecnica factorial, obtenida
despues de las transformaciones necesarias aplicadas a la matriz inicial de datos brutos.
En nuestro caso del ACS, la matriz X sera la H
, de tal manera que hemos de considerar (H
(H
) en
virtud de que la inercia est a afectada por las masas de los perles, f
i
, todo ello seg un la expresion [1.16].
En efecto, el termino j, j
de la matriz T = (H
(H
) que es de dimension p p, vendra dado por:

la j-
sima de (H
columna j
sima de H
=
_
f
1j
f
1
_
f
j
_
f
j
_
_
f
1
_
_
f
1j
f
1
_
f
j
_
f
j
_
_
_
f
1
+ +
_
f
ij
f
i
_
f
j
_
f
j
_
_
f
i
_
_
f
ij
f
i
_
f
j
_
f
j
_
_
_
f
i
+ +
+
_
f
nj
f
n
_
f
j
_
f
j
_
_
f
n
_
_
f
nj
f
n
_
f
j
_
f
j
_
_
_
f
n
Esta expresion del termino (j, j
) puede ponerse en la forma

n
i=1
_
f
i
_
f
i
_
f
ij
f
i
_
f
j
_
f
j
_
_
_
f
ij
f
i
_
f
j
_
f
j
_
_
= t
jj
que coincide con la expresi on [1.17], como pretendamos demostrar.

Calculados por la teora general los autovalores
de la matriz simetrica T dada por [1.17], la proyeccion

de un punto i sobre el eje factorial -esimo v
vendra dada por:
i
=
p
j=1
_
f
ij
f
i
_
f
j
_
f
j
_
u
j
(1.19)
en donde u
es el autovector de T asociado a
, con = 1, , p
Simplicacion en los calculos de las proyecciones

i
Hay, pues, que calcular los autovalores de la matriz T = (H
(H
) X
pn
X
np
.
Pueden comprobarse los hechos siguientes:
1. El vector u
p
=
_
f
1
, ,
_
f
j
, ,
_
f
p
_
es un vector propio de T, con respecto al autovalor 0.

En efecto, esto quiere decir que (T I)u = 0 es cierto para
T
pp
u
p(p1)
= 0
p1
Es decir
T =
_
_
f
1
, ,
_
f
j
, ,
_
f
p
_
= 0
p1
lo cual es facilmente comprobable.
2. El hecho de que u
p
=
__
f
j
; j = 1, , p
_
sea autovalor de T trae consecuencias interesantes que permiten
simplicar los calculos para obtener las proyecciones de los puntos sobre los ejes factoriales. En efecto,
notese en primer lugar que dado cualquiera otro de los autovectores u
, y denotando por u
j
a su j-esima
componente, se verica:
p
j=1
u
j
_
f
j
= 0 (1.20)
en virtud de la ortogonalidad entre autovectores.
En segundo lugar, si consideramos la proyeccion del punto i-esimo de la nube sobre el eje ,

i
, dada
por [1.19], esta expresion se puede simplicar. En efecto
i
=
p
j=1
_
f
ij
f
i
_
f
j
_
f
j
_
u
j
=
p
j=1
f
ij
f
i
_
f
j
u
j

p
j=1
_
f
j
u
j
de donde
i
=
p
j=1
_
f
ij
f
i
_
f
j
_
u
j
(1.21)
3. Por otra parte puede comprobarse lo siguiente: si u
es autovector de T, distinto del antes denotado u

p
,
lo es tambien de T
= X
, donde
X
= (x
ij
) x
ij
=
f
ij
_
f
i
f
j
(1.22)
y respecto del mismo autovalor.
As pues, X
no es centrada en contraposicion de la X que lo era. Pero es mas facil manejar X
, de tal
forma que mas simple realizar el analisis de correspondencias sobre T
= X
que sobre T = X
X.
Observese que hay que tener en cuenta, no obstante, que ello es cierto para todos los autovectores excepto
para el denotado u
p
, que lo era de T respecto del autovalor 0. Este autovector u
p
lo es tambien de la
nueva matriz, T
, pero en cambio lo es respecto del autovalor unidad.

Nota 4. Si denimos x
ij
=
f
ij
_
f
i
f
j
en lugar de x
ij
=
f
ij
f
i
f
j
_
f
i
f
j
vamos a comprobar que T
= X
cumple respecto de los autovectores la propiedad dicha.

Primero veamos que forma tiene T
:
T
=
_
_
_
_
_
_
_
_
_
_
_
_
_
_
f
11
f
1
f
1

f
i1
f
i
f
1

f
n1
f
n
f
1
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
f
1j
_
f
1
f
j

f
ij
_
f
i
f
j

f
nj
_
f
n
f
j
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
f
1p
_
f
1
f
p

f
ip
_
f
i
f
p

f
np
_
f
n
f
p
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
f
11
f
1
f
1

f
1j
_
f
1
f
j

f
1p
_
f
1
f
p
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
f
i1
f
i
f
1

f
ij
_
f
i
f
j

f
ip
_
f
i
f
p
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
f
n1
f
n
f
1

f
nj
_
f
n
f
j

f
np
_
f
n
f
p
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
luego el termino generico jj
de la matriz T
= X
se expresa as:
t
jj
=
f
1j
f
1j
f
1
_
f
j
_
f
j
+ +
f
ij
f
ij
f
i
_
f
j
_
f
j
+ +
f
nj
f
nj
f
n
_
f
j
_
f
j
es decir
t
jj
=
n
i=1
f
ij
f
ij
f
i
_
f
j
_
f
j
Observese que tambien puede ser expresado as:

t
jj
=
n
i=1
f
ij
f
ij
f
2
i
_
f
j
_
f
j
f
i
=
n
i=1
f
i
_
f
ij
f
i
_
f
j
_
_
_
f
ij
f
i
_
f
j
_
_
(1.23)
Comparando con la expresion [1.17] se ve que t
jj
es analogo a t
jj
, salvo que no esta centrado, es decir, no
esta restado el centro de gravedad dado por las coordenadas
_
_
f
j
; j = 1, , p
_
Por tanto podemos decir que X
es una matriz no centrada (respecto de la X que si lo era).

En segundo lugar, veamos lo siguiente: Todos los autovectores v
de la matriz T, excepto el u
p
, lo son
tambien de T
y respecto de los mismos autovalores. En cambio el u

p
es autovector tambien de T
pero en
lugar de ser respecto del autovalor nulo de T lo es del autovalor unidad de T
.
En efecto, supongamos un autovector u
= u
p
, de componentes u
j
. Si v
es autovector de T, respecto del

autovalor
y u
lo es de T
respecto del mismo autovalor, entonces

Tu
Luego se trata de comprobar que Tv
= T
. Se tiene: Tu
es un vector (p 1), cuya j-esima componente

se obtendra multiplicando la j-esima la de T por el vector u
, de componentes u
j
, o sea:
p
=1
t
jj
u
j
Analogamente, se llegara a
p
=1
t
jj
u
j
como expresion de la j-esima componente del vector (T
).
Por tanto se trata de comprobar
p
=1
t
jj
u
j
=
p
=1
t
jj
u
j
(1.24)
En efecto, utilizando [1.17] y [1.23]
p
=1
_
_
_
n
i=1
f
i
_
f
ij
f
i
_
f
j
_
f
j
_
_
_
f
ij
f
i
_
f
j
_
f
j
_
_
_
_
_
u
j
=
=
p
=1
_
_
_
n
i=1
f
i
_
f
ij
f
i
_
f
j
_
_
_
f
ij
f
i
_
f
j
_
_
u
j

n
i=1
f
i
f
ij
f
i
_
f
j
_
f
j
u
j

n
i=1
f
i
_
f
j
f
ij
f
i
_
f
j
u
j
+
n
i=1
f
i
_
f
j
_
f
j
u
j
_
_
_
y permutando las sumas queda solo el primer termino del segundo, con lo que se prueba [1.24], puesto que,
aplicando la expresion anterior [1.20]
p
j=1
u
j
_
f
j
= 0
se tiene:
1.
p
=1
_
n
i=1
f
i
f
ij
f
i
_
f
j
_
f
j
_
u
j
=
p
=1
_
n
i=1
f
ij
_
f
j
_
f
j
_
u
j
=
n
i=1
f
ij
_
f
j
_
_
p
=1
_
f
j
u
j
_
_
= 0
2.
p
=1
_
_
_
n
i=1
f
i
_
f
j
f
ij
f
i
_
f
j
_
_
_
u
j
=
p
=1
_
_
_
n
i=1
_
f
j
f
ij
_
f
j
_
_
_
u
j
=
=
p
=1
_
f
j
_
f
j
f
j
_
n
i=1
f
ij
_
u
j
=
p
=1
_
f
j
_
f
j
u
j
=
_
f
j
p
=1
_
f
j
u
j
= 0
3.
p
=1
n
i=1
_
f
i
_
f
j
_
f
j
_
u
j
=
n
i=1
f
i
_
f
j
_
_
p
=1
_
f
j
u
j
_
_
= 0
Nota 5. En cuanto al estudio del vector u
p
=
__
f
j
; j = 1, , p
_
, se tiene lo siguiente:
t
jj
_
f
j
= elemento j-esimo del vector Tu
p
=
p
u
p
= 0
En efecto:
p
=1
n
i=1
f
i
_
f
ij
f
i
_
f
j
_
f
j
_
_
_
f
ij
f
i
_
f
j
_
f
j
_
_
_
f
j
=
=
p
=1
_
_
n
i=1
f
i
f
ij
f
i
_
f
j
f
ij
f
i
_
f
j
_
f
j

n
i=1
f
i
f
ij
f
i
_
f
j
_
f
j
_
f
j

n
i=1
f
i
_
f
j
f
ij
f
i
_
f
j
_
f
j
+
n
i=1
f
i
_
f
j
_
f
j
_
f
j
_
_
=
=
p
=1
_
n
i=1
f
ij
f
ij
f
i
_
f
j
i=1
f
ij
_
f
j
f
j

n
i=1
f
ij
_
f
j
+
n
i=1
f
i
_
f
j
f
j
_
=
=
n
i=1
f
ij
f
i
_
f
j
_
_
p
=1
f
ij
_
_
i=1
f
ij
_
f
j
_
_
p
=1
f
j
_
_
i=1
_
f
j
_
_
p
=1
f
ij
_
_
+
n
i=1
f
i
_
f
j
_
_
p
=1
f
j
_
_
=
=
n
i=1
f
ij
f
i
_
f
j
f
i
i=1
f
ij
_
f
j
i=1
_
f
j
f
i
+
n
i=1
f
i
_
f
j
= 0
As pues, el vector u
p
es autovector de T, respecto del autovalor 0. En cambio, este autovector u
p
, que lo
es tambien de T
, lo es respecto del autovalor 1 de dicha matriz T
.
Es decir, se verica:
T
u
p
= u
p
;
p
=1
t
jj
u
pj
= u
pj
O sea, en virtud de [1.23],
p
=1
n
i=1
f
ij
f
ij
f
i
_
f
j
_
f
j
_
f
j
=
_
f
j
En efecto:
p
=1
n
i=1
f
ij
f
ij
f
i
_
f
j
_
f
j
_
f
j
=
p
=1
n
i=1
f
ij
f
ij
f
i
_
f
j
=
n
i=1
f
ij
f
i
_
f
j
_
_
p
=1
_
f
ij
_
_
=
n
i=1
f
ij
f
i
_
f
j
f
i
=
n
i=1
f
ij
_
f
j
=
1
_
f
j
n
i=1
f
ij
=
f
j
_
f
j
=
_
f
j
Ajuste a la nube de puntos-columna, en R
n
, constituida por los perles-columna
Para construir este ajuste, con la metodologa empleada en el ajuste en R
p
, basta, en Analisis de Corres-
pondencias Simple, efectuar una permutacion de los ndices generales i, j a todo lo realizado en el citado ajuste
en R
p
. Que esto es cierto en el Analisis de Correspondencias Simple, es obvio: estamos aplicando tecnicas
factoriales (el Analisis Factorial General o el Analisis de Componentes Principales) a una matriz inicial de
datos que constituye estadsticamente hablando, una tabla de contingencia, en la que el papel de las y colum-
nas es intercambiable, y al contrario que ocurre en otras tablas, como por ejemplo en las tablas de medidas
(variables-observaciones) a las que les hemos aplicado el Analisis de Componentes Principales, los papeles de
la/columna son intercambiables.
Nota 6. Observese que al expresar que los ndices son intercambiables, no se quiere decir que al hacer el ajuste
en R
n
a los perles- columna, aparezca el mismo ajuste. Lo que queremos decir es que, tecnicamente hablando,
el ajuste en R
n
se puede obtener intercambiando i, j simplemente.
Ahora consideramos los puntos j de la nube en R
n
, que tienen por coordenadas:
_
f
ij
f
j
f
i
i = 1 , n ; f
j
_
j = 1, , p
en donde f
j
es la masa de cada punto.
El centro de gravedad de los p puntos anteriores es el punto de coordenadas
_
f
i
i = 1, , n
_
, centro
de gravedad de la nube en R
n
. A partir de esta nube y centro de gravedad todo el desarrollo es paralelo al
realizado en el caso de la nube en R
p
.
En concreto el Analisis Factorial General (o el Analisis de Componentes Principales si se quiere) se aplicara
en este caso a una matriz S (la antes denotada T), cuyos autovalores y autovectores resuelven la cuestion. Esta
matriz S tendra como elemento generico
s
ii
=
p
j=1
f
j
_
f
ij
f
j
f
i
_
f
i
_
_
f
i
j
f
j
_
f
i
_
f
i
_
i, i
= 1, , n
S es, evidentemente, de dimension n n, mientras que T lo era p p.
Como todo lo del caso anterior en R
p
, es analogo. Por ejemplo el escribir S como producto de la forma X
X,
que ahora sera en terminos de una matriz analoga a la dada por [1.18] pero permutando i por j, llamemosla
X
, y por otro lado, seg un el Analisis Factorial General y/o Analisis de Componentes Principales considerando
XX
en lugar de X
X. En denitiva:
S
nn
= H
= X
np
X
pn
Nota 7. Observese que:
H
np
= ((h
ij
)) ; h
ij
=
f
ij
f
j
f
i
_
f
j
f
i
= h
ij
= x
ij
por lo que H
= X. Basta tener en cuenta la observacion 2 anterior. En denitiva, en lugar de considerar

T = X
X, consideramos S = XX
.
Igual que en el caso de la nube en R
p
, aqu puede simplicarse el calculo de autovalores y autovectores,
porque, como es facil comprobar, podemos calcularlo sobre una matriz no centrada, S
mas facil de manejar,

que tiene los mismos autovalores y autovectores que la matriz S y que es del tipo no centrado:
S
= X
en donde X
= (x
ij
), siendo
x
ij
=
f
ij
_
f
i
f
j
Nota 8. Observese que x
ij
= x
ij
. Por tanto, S = X
en la misma forma en que T = X
en la
observacion 4 anterior referida a la simplicacion en los calculos sobre la nube en R
p
de perles-la.
Una vez que hemos jado las matrices sobre las que actuar para el calculo del subespacio ajustado a la
nube de perles-columna, a saber S = XX
o bien S
= X
en el caso de actuar con la matriz no centrada

simplicada, se procedera al calculo de los autovalores y autovectores de dicha matriz base de los calculos. Sean
(
; v
) las parejas autovalores-autovectores de S. Una aplicacion obvia de lo visto al respecto en el Analisis

Factorial General, conduce a las conclusiones siguientes:
1. Los autovalores no nulos de S coinciden con los de la matriz T (utilizada en el ajuste de los perles-la).
De modo que
; = 1, , q ; en donde q son los no nulos de los = 1, , p autovalores
.
2. Los correspondientes autovectores v
, que denen la estructura factorial ajustada a la nube de perles-

columna en R
n
, se obtendran a partir de la solucion del sistema (S I) v = 0 para =
; =
1, , p.
3. Finalmente, a los autovalores y autovectores (
; v
) le son aplicados respecto de las matrices S o S
antes denidas, todas las propiedades vistas para T y T
en la observacion 4 anterior, considerando que

el autovector equivalente al u
p
=
__
f
j
; j = 1, , p
_
es ahora el v
p
=
_
f
i
; i = 1, , n
_
.
En funcion de estas consideraciones, se dene la Conclusion Final sobre el ajuste en R
n
siguiente:
Sean

j
las coordenadas-proyeccion sobre el -esimo eje v
en R
n
, del punto-perl-columna j-esimo.
Entonces:
j
=
n
i=1
_
f
ij
f
j
f
i
_
v
i
(1.25)
en donde v
i
es la i-esima componente del autovector v
de la matriz S, siendo v
el -esimo vector unitario

factorial en R
n
cuyo soporte es el -esimo eje factorial en R
n
.
1.1.5. Relaciones entre las nubes ajustadas en R
p
y en R
n
En el parrafo anterior hemos ajustado a las nubes de puntos-la y punto-columna, en R
p
y en R
n
respecti-
vamente, los respectivos subespacios optimos, seg un la teora general del analisis factorial general aplicada al
tipo de tabla objeto del analisis de correspondencias. Ahora, siguiendo con la adaptacion del Analisis Facto-
rial General al Analisis de Correspondencias Simple, vamos a analizar como se formulan, en este ultimo, las
relaciones entre los subespacios ajustados y las subsiguientes relaciones entre las coordenadas de los puntos-
la y puntos-columna cuando estos se reeren al sistema de referencia dado por los ejes factoriales en ambos
subespacios ajustados.
Relaciones generales entre los dos espacios ajustados en R
p
y en R
n
Cuando se analizo este tipo de relacion en el Analisis Factorial General, se obtuvo el siguiente resultado
general:
1. Las dos nubes ajustadas (perles-la en R
p
; perles-columna en R
n
), son denidas a partir, respectiva-
mente, de las matrices (X
X)
pp
y (XX
)
nn
2. Sean (
, u
) y (
, v
) las parejas autovalores-autovectores de X
X y XX
respectivamente. Recuerdese
del Analisis Factorial General que
, para todos aquellos autovalores que no son nulos.

3. Los autovectores u
y v
, que constituyen, respectivamente, vectores unitarios cuyos soportes son los ejes
factoriales en R
p
y en R
n
, estan relacionados entre s, mediante las relaciones
u
=
1
=
1
Xu
(1.26)
Se trata, pues, de ver como las expresiones [1.26] se particularizan al Analisis de Correspondencias Simple.
Recuerdese que en el parrafo 1.1.4 anterior, hemos concluido cuales son las matrices X
X y XX
sobre las que

se obtienen los ejes factoriales en R
p
y en R
n
, en el Analisis de Correspondencias Simple. Recuerdese que seg un
los parrafos 1.1.4 y 1.1.4, en ultima instancia, por ser mas simples los calculos, se act ua sobre las matrices
X
y X
, en donde
X
=
_
x
ij
_
x
ij
=
f
ij
_
f
j
f
i
En consecuencia, las relaciones [1.26] se transcriben as
v
=
1
=
1
(1.27)
Relaciones entre las coordenadas de los puntos sobre los ejes factoriales en ambos espacios
Como es sabido del AFG, las coordenadas de los puntos-la (puntos-columna) en el sistema de ejes facto-
riales u
(v
), establecido en R
p
(R
n
) vienen dadas por las relaciones Xu
(X
).
En nuestro caso del Analisis de Correspondencias Simple, y actuando con la formulacion simplicada pro-
veniente de manejar X
, estas coordenadas son, respectivamente X
(X
)
Nota 9. Observese que X
es un vector n 1 (X
es n p y u
, vector unitario en R
p
es (p 1)); sus
componentes nos dan las coordenadas de los n puntos-la respecto del u
que se vaya considerando. Si denota-

mos por

i
a la i-esima componente de ese vector n-dimensional X
i
indica la coordenada del i-esimo
punto-la, respecto del eje factorial en R
p
.
Analogamente, X
es un vector p 1, resultado de multiplicar la matriz X
, p n, por v
, autovector
unitario seg un el eje factorial -esimo en R
n
, es decir un vector n1. Las p componentes, denotadas

j
, de
ese vector X
, son las coordenadas del j-esimo punto-columna respecto del -esimo eje factorial ajustado
en R
n
.
As pues, las coordenadas citadas son:
i
=
p
j=1
_
f
ij
f
i
_
f
j
_
u
j
i = 1, , n (1.28)
j
=
n
i=1
_
f
ij
f
j
f
i
_
v
i
j = 1, , p (1.29)
Que relacion existir entre las

i
y

j
?
Para encontrar esta relacion el camino es obvio: las expresiones anteriores [1.28] y [1.29] dan dichas coordena-
das en terminos de u
y v
respectivamente. Y por otro lado las relaciones entre u
y v
estan dadas por [1.27].

Combinando ambas relaciones se concluye lo siguiente: La componente i-esima de v
, a partir de [1.27] es
v
i
=
1
j=1
_
f
ij
_
f
i
f
j
_
u
j
de donde
v
i
=
1
_
f
i
i
(1.30)
Analogamente se deduce que
u
j
=
1
_
f
j
j
(1.31)
Por consiguiente:
i
=
p
j=1
f
ij
f
i
_
f
j
1
_
f
j
j
=
1
j=1
f
ij
f
i
j
(1.32)
Y analogamente
j
=
n
i=1
f
ij
f
j
f
i
1
_
f
i
i
=
1
i=1
f
ij
f
j
i
(1.33)
La conclusion es evidente: las coordenadas, por ejemplo, de los puntos-la (las

i
) se obtienen, con la ho-
motecia
1
, mediante una combinacion baricentrica de coecientes

f
ij
f
i
, de todas las coordenadas, respecto
del eje -esimo, de los puntos-columna.
De manera equivalente, ello equivale a manejar la matriz de componentes
f
ij
f
i
, que en la practica suele
construirse en la forma
f
ij
f
i
100, de modo que si tenemos esta ultima, dividiendola por 100, tenemos la matriz
que hay que emplear para calcular la relacion [1.33].
Por otra parte la combinacion baricentrica
p
j=1
f
ij
f
i
j
, dene el baricentro de las coordenadas

j
de todos
los puntos-columna (j = 1, , p) respecto del eje , con la ponderacion f
i
del punto-la i-esimo del que se
trate ( Principio Baricentrico del calculo de las Coordenadas en Analisis de Correspondencias Simple).
Analogamente, cabra razonar sobre las

j
.
Nota 10. De las relaciones [1.27] cabe obtener la siguiente conclusion valida en Analisis de Correspondencias
Simple: Todos los autovalores
son iguales o menores que la unidad. Recuerdese que el autovalor unidad,

= 1, es autovalor de T
= X
y su autovector asociado es u
p
= (
_
f
j
; j = 1, , p) (seg un vimos en
el parrafo 1.1.4). Por tanto, probar lo que aqu proponemos equivale a probar que el mayor autovalor de T
es
precisamente
1
= 1.
A continuacion resumimos esquematicamente lo analizado en este parrafo 1.1.5
R
p
R
n
Observaciones
u
=
1
=
1
Xu
Relaciones generales en el AFG

u
=
1
=
1
Particularizacion al Analisis de Correspondencias Simple con

X
Coordenadas de los puntos-la y columna en el Analisis de

Correspondencias Simple
i
=
p
j=1
f
ij
f
i
_
f
j
u
j

j
=
n
i=1
f
ij
f
j
f
i
u
i
i
= coordenada del i-esimo punto-la en el eje -esimo en R
p
i = 1, , n j = 1, , p
j
= coordenada del j-esimo punto-columna en el
-esimo eje en R
n
i
=
1
j=1
f
ij
f
i
j
=
1
i=1
f
ij
f
j
i
Relaciones analticas entre las coordenadas
Nota 11. En Analisis de Correspondencias Simple se tiene
X
= (x
ij
) con x
ij
=
f
ij
_
f
j
f
i
1.1.6. Reconstruccion de la Tabla inicial en el Analisis de Correspondencias Sim-
ple
Como se vio en el Analisis Factorial General, en realidad lo que pretenden las tecnicas factoriales en general
es resolver, con arreglo a determinados criterios, un problema de aproximacion de la matriz inicial de datos
X, (a partir de la que act ua la respectiva tecnica factorial en cada caso: por ejemplo, ya hemos visto los casos
del Analisis en Componentes Principales y del Analisis de Correspondencias Simple. En ambos casos no es
la matriz bruta inicial de datos sino ciertas matrices transformadas de esa), mediante un n umero menor de
valores numericos.
En terminos tecnicos esta aproximacion tiene lugar mediante matrices de bajo rango, en el contexto del
problema general de obtener, mediante un criterio de mnimos cuadrados, la aproximacion de una matriz dada.
Y ello se consigue, desde un punto de vista general, mediante la descomposicion de valores singulares.
De una manera directa, esta cuestion fue resuelta en el Analisis Factorial General mediante, como sabemos,
los autovalores-autovectores de X
X y de XX
de tal manera que, como ya se vio, en denitiva X se aproxima

por X
=
q
=1
_
; X(n p) ; v
(n 1) ; u
(p 1) (1.34)
en donde q p, indica el n umero de los primeros autovalores
1
, ,
q
seleccionados de entre los
1
, ,
p
que en general tendra X
X. Recuerdese que los que no sean nulos de esos

1
, ,
p
, digamos r de ellos (con
r mn(p; n)), tambien son autovalores de XX
.
Pero, al margen de esta aproximacion de X por X
en terminos de esos
1
, ,
q
, lo que es cierto es que
X =
p
=1
_
(1.35)
lo que permite, teoricamente, la reconstruccion exacta de X a partir de los subespacios ajustados en R
p
y R
n
.
Formula de Reconstruccion en el Analisis de Correspondencias Simple
Veamos como la formula de reconstruccion dada por [1.35] de Analisis Factorial General se adec ua al
Analisis de Correspondencias Simple. En este caso, continuando bajo la suposicion de que actuamos con la
matriz simplicada X
denida en el parrafo 1.1.4, expresion [1.21], se tendra obviamente

X
=
p
=1
_
; X
= (x
ij
) ; x
ij
=
f
ij
_
f
i
f
j
(1.36)
Nota 12. Denotamos aqu por X
a la matriz simplicada. No confundir con la denotada tambien X
en
el contexto del Analisis Factorial General, en donde as se ha denotado a la matriz aproximada de X, en la
expresion [1.34] anterior.
Aqu pretendemos expresar X
mediante las coordenadas

i
y

j
, coordenadas de los puntos-la, puntos-
columna, respectivamente, en los sistemas factoriales ajustados en R
p
y R
n
. Para conseguir esto, sustituimos
en [1.36], v
y u
, por las expresiones respectivas en funcion de las coordenadas (dadas por [1.30] y [1.31] del
parrafo 1.1.5 anterior).
En efecto:
x
ij
=
f
ij
_
f
i
f
j
=
p
=1
_
_
1
_
f
i
i
_
. .
vi
_
1
_
f
j
j
_
. .
uj
=
p
=1
1
j
_
_
f
i
f
j
de donde
f
ij
=
_
p
=1
1
j
_
f
i
f
j
(1.37)
Otra forma de escribir la formula de reconstruccion
Se acostumbra a escribir la ultima expresion [1.37], simplicada, en el sentido siguiente: Como hemos visto
en la seccion 1.1.4,
1
= 1 es el mayor autovalor de X
y de X
, lo que se puede hacer constar de manera

explcita en la formula de reconstruccion [1.37]. En tal caso, ademas, sabemos que u
1
= u
p
= (
_
f
j
; j =
1, , p) y v
1
= (
f
i
; i = 1, , n), son los autovectores asociados a
1
= 1 =
1
en X
y X
respectivamente. Por lo tanto u

1j
=
_
f
j
y v
1i
=
f
i
, con lo que
f
ij
= f
i
f
j
_
1 +
p
=2
1
j
_
(1.38)
ya que, en efecto, el primer termino de la suma de [1.37] es
1
1i
1j
=

1i
1j
que en virtud de [1.30] y [1.31], parrafo 1.1.5, es igual a
1i
1j
=
_
v
1i
_
1
1
f
i
_
_
u
1j
_
1
1
_
f
j
_
= 1
de donde se obtiene la expresion [1.38].
Finalmente, la expresion [1.38] se puede tambien escribir as:
f
ij
= f
i
f
j
_
1 +
p
=2
1
j
_
(1.39)
en terminos de
i
=
1
i

j
=
1
j
Estos
i
y
j
son los llamados factores normalizados (de norma la unidad). En efecto, consideremos el
vector constituido por todos los

i
, es decir, por todas las coordenadas respecto del eje factorial soporte de
u
factor de los n puntos-la

_
1
, ,
n
_
Sabemos que este vector columna n1 es por otra parte X
. Por tanto, si consideramos las coordenadas

dadas por
(
1
, ,
n
)
=
_
1
1
, ,
1
n
_
se tiene:
(
1
, ,
n
) (
1
, ,
n
)
= ||
||
Pero
(
1
, ,
n
) (
1
, ,
n
)
=
1
1
, ,
n
__
1
, ,
n
_
=
=
1
_
u
_
(X
) =
1
=
1
= 1
Es decir, ||
|| = 1. De ah que en efecto los

i
son normalizados a la unidad.
Analogamente se obtendra para los
j
.
1.1.7. Elementos Suplementarios en el Analisis de Correspondencias Simple
Cuando estudiabamos, como primer ejemplo de tecnica factorial, el Analisis de Componentes Principales,
vimos la necesidad de, una vez realizada la aplicacion del Analisis de Componentes Principales, ubicar, posi-
cionar, en las nubes ajustadas de las y columnas, posibles nuevos puntos-la o puntos-columna.
En Analisis de Correspondencias Simple el problema es analogo. Las las o columnas suplementarias en la
tabla bruta inicial conduciran a puntos-la y puntos-columna en perles respectivos
_
k
+i,j
k
+i
_
; k
+i
=
p
j=1
k
+ij
_
k
+
i,j
k
+
j
_
; k
+
j
=
n
i=1
k
+
ij
que corresponden, respectivamente a las situaciones siguientes
i = 1 k
11
k
1p
k
1
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
i = n k
n1
k
np
k
n
i = + k
+ij
k
1p
k
+i
_
R
R
+
_
Puntos-la suplementarios
j = +
i = 1 k
11
k
1p
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
. k
+
ij
i = n k
n1
k
np
.
.
.
k
1
k
p
k
+
j
Columnas suplementarias
(R|R
+
)
Dados pues los perles-la o perles-columna correspondientes a las las o columnas suplementarias, se
procede a situarlos en sus nubes correspondientes, ajustadas en base a la tabla inicial (sin las las y/o columnas
suplementarias). Y la ubicacion en esas nubes vienen dadas aplicandoles a las matrices suplementarias R
+
o
R
+
, previo su paso a las correspondientes en perles, las expresiones que antes fueron deducidas ([1.32] y [1.33],
parrafo 1.1.5, de modo que, por ejemplo, aplicando [1.32] que en la tabla inicial es
i
=
1
j=1
f
ij
f
i
j
coordenadas del punto-la i-esimo, en terminos de los

j
, se deduce
+i
=
1
j=1
k
+ij
k
+i
j
para las coordenadas de las las suplementarias.
En el caso de tener que ubicar una columna suplementaria, sus coordenadas

+
j
se obtendran a partir de
[1.33] del parrafo 1.1.5
+
j
=
1
i=1
k
+
ij
k
+
j
j
1.1.8. Ayudas a la interpretaci on en el Analisis de Correspondencias Simple
Desde los inicios del Analisis de Datos por Bencekri y colaboradores, al tratar cualquiera de sus tecnicas,
se incluye como etapa nal, una vez terminado su desarrollo, una serie de cuestiones que se engloban bajo el
ttulo generico de Ayudas a la interpretacion. Estas ayudas no son mas que una serie de consecuencias deriva-
das del propio desarrollo de la tecnica correspondiente, que sirven en la practica, en efecto, de ayuda para la
interpretacion de los resultados obtenidos.
En concreto, a nivel de las tecnicas factoriales asociadas al Analisis Factorial General del Analisis de Datos,
las ayudas expresan interpretaciones, normalmente interpretables tambien gracamente, asociadas a ciertas
propiedades de los factores deducidos en cada caso, de modo que podamos medir e interpretar la importancia
de los factores y lo que ellos signican.
En el Analisis de Componentes Principales, como caso especial del Analisis Factorial General, ya vimos una
medida asociada a los factores obtenidos, que mide la importancia de ellos en la estructura factorial construida.
Recordemos la tasa de inercia general del Analisis Factorial General y su version en el Analisis de Componentes
Principales, por ejemplo normalizado, en donde
p
j=1
= tr
_
X
X
_
= tr
_
XX
_
= tr(matriz de correlaciones) =
j
x
2
ij
= p
De tal modo que se dene la tasa de inercia asociada a los primeros q factores como:
q
=
q
i=1
i=1
A continuacion vamos a desarrollar esta cuestion en el Analisis de Correspondencias Simple.

Medidas basicas para la interpretacion en el Analisis de Correspondencias Simple
Se manejan en la practica del Analisis de Correspondencias Simple dos medidas dirigidas a facilitar la
interpretacion de la estructura factorial que el Analisis de Correspondencias Simple asocia al espacio de puntos-
la y al de puntos-columna. Estas dos medidas son, en cierto sentido, duales en la interrelacion punto-factor.
Veamoslas a continuacion.
1. Dado un eje factorial cualquiera, digamos el -esimo, los n puntos-la, proyectados sobre dicho eje,
denen sobre el un conjunto de n valores proyectados, los

i
obviamente, cuya dispersion vamos a
medir mediante su varianza. Esta varianza, si el origen esta en el centro de gravedad, vendra dada por
la expresion reducida:
n
i=1
f
i
2
i
(1.40)
En efecto, sabemos que los puntos-la son manejados por los perles correspondientes, de masa f
i
y si
el origen esta, en efecto, en el centro de gravedad, entonces la media (ponderada) sera:
i
=
n
i=1
f
i
i
= 0
En efecto:
n
i=1
f
i
i
=
n
i=1
f
i
p
j=1
f
ij
f
i
_
f
j
u
j
=
p
j=1
u
j
_
f
j
n
i=1
f
ij
=
p
j=1
u
j
_
f
j
f
j
=
p
j=1
u
j
_
f
j
= 0
La ultima igualdad se da en virtud de lo visto en el parrafo 1.1.4 anterior.
Por tanto, la varianza considerada es la dada por [1.40]. Si esta expresion se calcula explcitamente, se
tendra:
n
i=1
f
i
2
i
=
n
i=1
f
i
_
v
i
f
i
_
2
=
n
i=1
v
2
i
=
i=1
v
2
i
=
sin mas que tener en cuenta la ecuacion [1.30] del parrafo 1.1.5 y el hecho de ser unitario el vector v
, en
la direccion del eje factorial -esimo.
En denitiva, en Analisis de Correspondencias Simple, la inercia (varianza) de los puntos-la proyectados,
en el eje -esimo, vale el respectivo autovalor
asociado al autovector u
que dene a dicho eje. Es

decir:
n
i=1
f
i
2
i
=
Nota 13. Comparese este resultado son el del Analisis Factorial General, en donde la importancia de un
eje viene medida en terminos de la varianza (inercia) asociada a dicho eje que, por otra parte, es igual
al autovalor correspondiente. En funcion de esto denamos la tasa de inercia explicada por cada eje, o
por el conjunto de los q primeros ejes factoriales
q
.
Lo anterior da pie a introducir una medida de la contribucion de un punto-la cualquiera, el i-esimo, a
la inercia asociada al eje factorial -esimo, denida as:
Ca
(i) =
_
f
i
2
i
_
(1.41)
sumando debido al punto i-esimo en [1.40] que suele llamarse contribucion absoluta del elemento i-esimo,
a la inercia (varianza) explicada por el eje -esimo.
Nota 14. Otros autores llaman a Ca
(i) la contribucion relativa del punto i al momento -esimo de

inercia (o, si se quiere, a la varianza explicada por el eje -esimo). Se denota CTR
(i), seg un estos

autores.
Una repeticion de los calculos anteriores, para el j-esimo punto-columna, de masa f
j
, conduce a denir
la Contribucion de dicho punto-columna a la inercia asociada al -esimo eje factorial en R
n
. En efecto,
sin mas que tener en cuenta ahora la expresion [1.31] del parrafo 1.1.5, se llega a
Ca
(j) =
_
f
j
2
j
_
(1.42)
Nota 15. Tanto [1.41] como [1.42] se suelen expresar en la pr ctica en porcentajes, multiplicandolos por
100. A veces se multiplican por 1000.
2. Con las contribuciones absolutas medimos la importancia de una la o de una columna, a la hora de
explicar la inercia a su vez explicada por un determinado factor (por decirlo de otra manera, en las
expresiones [1.41] y [1.42] de las contribuciones absolutas, se ja un y se analiza variando i o j,
la contribucion de ellos al ). Cabe plantear la situacion al reves, es decir, tratar de medir el efecto
(contribucion) de los factores en la posicion de un punto-la o de un punto-columna determinados. Estas
medidas se realizan mediante unos coecientes denominados contribuciones relativas del factor -esimo
en el punto-la i-esima (o punto-columna j-esimo).
Veamos como se construyen estas contribuciones relativas.
1. Consideremos en primer lugar la nube de puntos-la y sea el i-esimo punto. Se sabe que el centro de
gravedad de esta nube es el punto de coordenadas
_
_
f
j
; j = 1, , p
_
en R
p
. Entonces la distancia al
cuadrado de dicho punto i al centro de gravedad viene dada por
d
2
(i; cg) =
p
j=1
_
f
ij
f
i
_
f
j
_
f
j
_
2
=
p
j=1
_
f
ij
f
i
f
j
_
2
1
f
j
(1.43)
(recu
rdese, parrafo 1.1.4 ,expresion [1.11], la distancia entre dos puntos-la en R

p
y la expresion [1.13]
que da el centro de gravedad de la nube de puntos-la).
Denimos entonces
Cr
(i) =
2
i
d
2
(i; cg)
; R
p
(1.44)
que es llamada contribucion relativa del eje factorial -esimo al punto la i. Se suele denotar tambien
COR
(i).
De modo que Cr
(i) puede interpretarse como el coseno al cuadrado del punto i con el eje .
Por otra parte es facil probar que la suma de la contribucion relativa de todos los ejes factoriales al punto
i vale la unidad. En efecto:
p
=1
Cr
(i) =
p
=1
2
i
d
2
(i; cg)
=
1
d
2
(i; cg)
p
=1
2
i
Calculemos
p
=1
2
i
. Seg un la expresi on [1.19] de 1.1.4 se tiene
p
=1
2
i
=
p
=1
_
_
p
j=1
_
f
ij
f
i
_
f
j
_
f
j
_
u
j
_
_
2
=
=
p
=1
_
_
p
j=1
_
f
ij
f
i
_
f
j
_
f
j
_
u
j
_
_
_
_
p
=1
_
_
f
ij
f
i
_
f
j
_
f
j
_
_
u
j
_
_
=
p
=1
_
_
_
p
j=1
_
f
ij
f
i
_
f
j
_
f
j
_
2
u
2
j
_
_
_
+
p
=1
_
_
p
j,j
=1
j=j
_
f
ij
f
i
_
f
j
_
f
j
_
_
_
f
ij
f
i
_
f
j
_
f
j
_
_
u
j
u
j
_
=
=
_
_
_
p
j=1
_
f
ij
f
i
_
f
j
_
f
j
_
2
_
_
_
p
=1
u
2
j
+
_
_
p
j,j
=1
j=j
_
f
ij
f
i
_
f
j
_
f
j
_
_
_
f
ij
f
i
_
f
j
_
f
j
_
_
_
_
p
=1
j=j
u
j
u
j
Pero teniendo en cuenta que, dados los autovectores u
(unitarios en la direccion del eje factorial res-

pectivo F
), estos son ortogonales (son correspondientes a raices caractersticas distintas), entonces la

matriz que los contiene como columnas es ortogonal. Es decir
(u
1
|u
2
|, , |u
|, , |u
p
) (u
1
|u
2
|, , |u
|, , |u
p
)
= I
pp
De aqu, mediante faciles calculos, se comprueba que:
p
=1
u
2
j
= 1 ;
p
=1
j=j
u
j
u
j
= 0
En resumen
p
=1
2
i
=
p
j=1
_
f
ij
f
i
_
f
j
_
f
j
_
2
= d
2
(i; cg)
Por tanto, en efecto:
p
=1
Cr
(i) = 1
Nota 16. Otra interpretaci on de la Cr
(i) es como coeciente de correlacion al cuadrado entre el eje

y el punto i-esimo jado
2. Analogamente, cabe actuar de manera paralela, en R
n
, con la nube de puntos-columna. En denitiva, se
establecen la contribuciones relativas de los ejes factoriales en R
n
a cada punto-columna (j = 1, , p):
Cr
(j) =
2
j
d
2
(j; cg)
; R
n
(1.45)
con analogas interpretaciones que las Cr
(i). Aqu el centro de gravedad, cg, es el da la nube de puntos-

columna y obviamente nos situamos en R
n
, donde los puntos-columna son los puntos considerados
1.2. Analisis de Correspondencias Simple Matricial
1.2.1. Deniciones basicas del Analisis de Correspondencias Simple en formula-
ci on matricial
En todo lo que sigue, suponemos que se dispone de una tabla de datos, constituida por n umeros no negativos,
de tal forma que la suma de cada la y de cada columna no es cero en ning un caso. Se denota dicha tabla as:
N
IJ
= (n
ij
) ; n
ij
0 ; i = 1, , I ; j = 1, , J (1.46)
Designamos por n
a la suma de todos los elementos de N, de tal forma que expresado matricialmente:

n
iI
jJ
n
ij
= 1
1I
N
IJ
1
J1
(1.47)
en donde 1 y 1
son vectores constituidos por unos y de las dimensiones indicadas.

Denicion 1. Se llama matriz de correspondencias a la denida por
P
IJ
=
1
n
N (1.48)
Sobre esta matriz dada por [1.48] consideraremos la suma de cada una de sus las y de sus columnas.
Interesa, en coherencia con el desarrollo matricial que adoptamos en este Captulo, considerar los vectores
constituidos por dichas sumas. As:
r
I1
= P
IJ
1
J1
; c
J1
= P
JI
1
I1
(1.49)
son, respectivamente, el vector de las sumas por las y el de las sumas por columnas. Es claro, por lo exigido
al comienzo, que los elementos r
i
de r, verican r
i
> 0 i = 1, , I. Y analogamente los elementos c
j
de c
verican c
j
> 0 j = 1, , J.
Por otra parte, para denir mas tarde las metricas que se necesitaran, consideramos las matrices diagonales:
D
r
= diag(r)
II
; D
c
= diag(c)
JJ
(1.50)
que obviamente, por lo indicado antes, son denidas positivas.
Nota 17. Si la matriz N fuese una tabla de contingencia, sobre la matriz de correspondencia P, cuyos ele-
mentos en general suman 1, podra considerarse una distribucion de probabilidad, cuyas marginales seran las
distribuciones de las sumas por las o por columnas. Pero observese que esta interpretacion no es valida en
general con una matriz N como la denida por [1.46]. As pues tengase presente a lo largo de esta captulo
que vamos a desarrollar un Analisis de Correspondencias sobre un tipo de tabla de datos que son tablas de
contingencia en sentido amplio, tal como hoy da es habitual en el Analisis de Datos.
Denicion 2. Se denominan perles-la y perles-columna, respectivamente, de la matriz P, a los vectores
constituidos por las las de P divididos todos sus elementos por la suma respectiva y a las columnas de P
divididos todos sus elementos por la suma respectiva. Los perles-la tienen asociadas sus respectivas masas
que son las respectivas sumas de cada la, y analogamente los perles-columna.
Nota 18. Estos perles constituyen el elemento caracterstico del Analisis de Correspondencias. Las deni-
ciones anteriores pueden hacerse, equivalentemente, sobre la matriz N inicial, como se comprueba obviamente,
en lugar de con P.
Denidos los perles, interesa considerarlos todos, globalmente: los I perles-la, cada uno un vector J-
dimensional, constituyen una matriz de perles-la, que se expresa as:
R
IJ
= D
1
r
P (1.51)
Y analogamente tendramos la matriz de perles-columna:
C
JI
= D
1
c
P
(1.52)
de modo que las I las de R son los I perles-la y las J las de C son los J perles-columna.
Nota 19. Que las matrices R y C, dadas por [1.51] y [1.52] respectivamente, contienen en sus las los perles-
las y perles-columna dados por la denicion 2 anterior, se comprueba facilmente.
Demostracion. Los elementos de los vectores dados en la denicion 2 son, respectivamente:
r
i
=
_
p
i1
r
i
,
p
i2
r
i
, ,
p
iJ
r
i
_
; i = 1, , I
c
j
=
_
p
1j
c
j
,
p
2j
c
j
, ,
p
Ij
c
j
_
; j = 1, , J
(1.53)
Por tanto, por construccion, las matrices [1.51] y [1.52] son respectivamente:
R =
_
_
_
_
_
_
_
_
r
1
r
2
.
.
.
.
.
.
r
I
_
_
_
_
_
_
_
_
IJ
C =
_
_
_
_
_
_
_
_
c
1
c
2
.
.
.
.
.
.
c
J
_
_
_
_
_
_
_
_
JI
(1.54)
Teniendo en cuenta [1.50], es claro que
D
1
r
= diag
_
1
r
1
, ,
1
r
I
_
y D
1
c
= diag
_
1
c
1
, ,
1
c
J
_
de donde se comprueba que R y C pueden escribirse, respectivamente, como [1.51] y [1.52].
1.2.2. Espacios Eucldeos Ponderados y estructuracion de los espacios de perles
la y perles-columna del AC
Disponemos ya de un conjunto de perles-la as como de otro conjunto de perles-columna (dados por los
vectores [1.53]) que pueden expresarse globalmente seg un las matrices dadas por [1.51] y [1.52]. Recuerdese por
otra parte (denicion 2) que estos perles tienen asociadas unas masas.
Los perles-la son vectores J 1 y los perles-columna son vectores I 1. Son, respectivamente, consi-
derados como puntos en un espacio eucldeo J-dimensional, y en un espacio eucldeo I-dimensional. Pero estos
puntos tienen sus masas respectivas asociadas. Por tanto a la hora de estructurar adecuadamente los espacios
eucldeos referidos, tendremos que considerar espacios eucldeos ponderados que representen bien la naturaleza
de la situacion. Por otra parte, la metrica en el espacio de los perles-la, habra de medir distancias entre
perles-la teniendo en cuenta que estos son puntos en el espacio J-dimensional. Y al contrario, los perles-
columna son puntos en el espacio I-dimensional, entre los cuales mediremos distancias.
Estas metricas se denen pesando cada dimension del espacio respectivo de la siguiente forma:
1. Sobre el espacio J-dimensional: Metrica denida por D
1
c
con
D
1
c
= diag
_
1
c
1
, ,
1
c
j
, ,
1
c
J
_
, siendo D
1
c
de dimension J J (1.55)
2. Sobre el espacio I-dimensional: Metrica denida por D
1
r
con
D
1
r
= diag
_
1
r
1
, ,
1
r
i
, ,
1
r
I
_
, siendo D
1
r
de dimension I I (1.56)
As pues la distancia al cuadrado, en el espacio J-dimensional, entre dos puntos perles-la, r
i
; r
m
, viene
dada por:
( r
i
r
m
)
D
1
c
( r
i
r
m
) (1.57)
Y analogamente, la distancia al cuadrado, en el espacio I-dimensional, entre dos cualesquiera puntos perles-
columna c
j
; c
s
vendra dada por:
(c
j
c
s
)
D
1
r
(c
j
c
s
) (1.58)
En resumen, la estructura que consideramos es la siguiente:
1. Sobre la nube de puntos perles-la: Un espacio eucldeo ponderado J-dimensional, de tal manera que
cada uno de los i = 1, , I puntos perles-la tiene una masa que es la suma de la correspondiente la
de P; los pesos en la metrica correspondiente, ponderan cada dimension j = 1, , J, del espacio, con el
inverso,
1
c
j
, de la suma j-esima, de la columna j-esima de P.
2. Sobre la nube de puntos perles-columna: Un espacio eucldeo ponderado I-dimensional, en el que cada
punto, j = 1, , J, es un perl-columna con masa la suma de la columna respectiva de P (es decir c
j
);
los pesos en la metrica correspondiente, ponderan cada dimension i = 1 , I del espacio, con el inverso
1
r
i
de la suma de la la i-esima de I.
1.2.3. Otros elementos en el Analisis de Correspondencias Simple ligados a la
estructuraci on eucldea ponderada de los espacios de perles
En el desarrollo posterior del Analisis de Correspondencias Simple juegan un importante papel los centros
de gravedad y las inercias de las dos masas de puntos perles: la de perles-la (en el espacio J-dimensional) y
la de perles-columna (en el espacio I-dimensional). La primera nube esta formada por I puntos y la segunda
por J puntos.
Estos conceptos basicos han de ser denidos logicamente en el contexto de la estructura eucldea ponderada
con la que hemos dotado a los dos espacios de perles.
A continuacion denimos y obtenemos expresiones matriciales para los dos centros de gravedad y para las
inercias respectivas de las dos nubes.
Denicion 3. (Centros de Gravedad)
1. Dados los puntos perles-la, denidos por los vectores J-dimensionales r
1
, , r
I
, con masas respectivas
r
i
, el centro de gravedad de esta nube se dene, en el espacio eucldeo ponderado respectivo, como el punto
denido por el vector
I
i=1
r
i
r
i
I
i=1
r
i
=
I
i=1
r
i
r
i
= c
J1
(1.59)
esta ultima igualdad en base a que
I
i=1
r
i
= 1.
2. Dados los puntos I-dimensionales, perles-columna, denidos por los vectores c
1
, , c
J
, se dene el
centro de gravedad de la nube constituida por dichos perles, como el punto en el espacio I-dimensional,
dado por:
J
j=1
c
j
c
j
J
j=1
c
j
=
J
j=1
c
j
c
j
= r
I1
(1.60)
Es facil encontrar expresiones matriciales para los centros de gravedad c y r. En efecto, en primer lugar
Observese que no es casual la notacion utilizada (c y r), sino que lo que ocurre es que las expresiones de las
deniciones dadas en [1.59] y [1.60] coinciden respectivamente con los vectores ya introducidos
c
J1
= P
JI
1
I1
; r
I1
= P
IJ
1
J1
Pero:
c = P
1 = P
D
1
r
r =
_
D
1
r
P
_
r = R
r (1.61)
r = P1 = PD
1
c
c =
_
D
1
c
P
_
c = C
c (1.62)
en donde R y C son las matrices ya denidas en [1.51] y [1.52].
Denicion 4. (Inercias de las nubes de perles-la y perles-columna) En general, en un espacio eucldeo
ponderado, se dene la Inercia Total de una nube de puntos como la suma ponderada de los cuadrados de las
distancias de los puntos al centro de gravedad de la nube, en el espacio metrico correspondiente (con la metrica
correspondiente)
As pues, aplicando este concepto a las nubes de perles-la y de perles-columna, encontramos sendas
Inercias totales.
1. Inercia Total de la nube de perles-la, de centro de gravedad el vector (punto) c: Metrica dada por D
1
c
:
IN(I) =
I
i=1
r
i
( r
i
c)
D
1
c
( r
i
c) = tr
_
D
r
(R 1c)
D
1
c
(R 1c
_
(1.63)
2. Inercia Total de la nube de perles-columna, de centro de gravedad el vector (punto) r. Metrica dada por
D
1
r
:
IN(J) =
J
j=1
c
j
(c
j
r)
D
1
r
(c
j
r) = tr
_
D
c
(C 1r
)D
1
r
(C 1r
_
(1.64)
Un resultado facil de probar es el siguiente
Teorema 1. La inercia total es la misma en ambas nubes.
Demostracion. Para probar que las expresiones [1.63] y [1.64] son iguales, partimos de la inercia total de la
nube de perles-la ([1.63]):
IN(I) =
I
i=1
r
i
( r
i
c)
D
1
c
( r
i
c)
Consideremos el termino ( r
i
c)
D
1
c
( r
i
c). Se tiene
( r
i
c)
D
1
c
( r
i
c) =
_
_
_
_
_
_
_
_
_
_
_
_
p
i1
r
i
c
1
p
i2
r
i
c
2
.
.
.
.
.
.
p
iJ
r
i
c
J
_
_
_
_
_
_
_
_
_
_
_
_
1J
_
_
_
_
_
_
_
_
_
_
1
c
1
1
c
2
.
.
.
1
c
J
_
_
_
_
_
_
_
_
_
_
JJ
_
_
_
_
_
_
_
_
_
_
_
_
p
i1
r
i
c
1
p
i2
r
i
c
2
.
.
.
.
.
.
p
iJ
r
i
c
J
_
_
_
_
_
_
_
_
_
_
_
_
J1
=
=
_
_
_
p
i1
r
i
c
1
c
i
, ,
p
iJ
r
i
c
J
c
J
_
_
_
1J
_
_
_
_
_
_
_
_
_
_
_
_
p
i1
r
i
c
1
p
i2
r
i
c
2
.
.
.
.
.
.
p
iJ
r
i
c
J
_
_
_
_
_
_
_
_
_
_
_
_
J1
=
J
j=1
_
p
ij
r
i
c
j
_
2
c
j
Por tanto:
IN(I) =
I
i=1
J
j=1
r
i
_
p
ij
r
i
c
j
_
2
c
j
=
I
i=1
J
j=1
(p
ij
r
i
c
j
)
2
r
i
c
j
Por otro lado, si se parte de la inercia total de la nube de perles-columna, dada por [1.64], se tiene
analogamente
IN(J) =
J
j=1
c
j
I
i=1
_
p
ij
c
j
r
i
_
2
r
i
=
J
j=1
I
i=1
(p
ij
r
i
c
j
)
2
r
i
c
j
Luego queda probado que ambas inercias son iguales.
1.2.4. Descomposiciones en Valores Singulares basicas en el Analisis de Corres-
pondencias Simple
Descomposiciones en Valores Singulares para P rc
El resultado basico, global, para las Descomposiciones en Valores Singulares en el Analisis de Correspon-
dencias Simple viene dado por el siguiente teorema
Teorema 2. La estructura factorial en el Analisis de Correspondencias Simple viene determinada por la
Descomposicion en Valores Singulares de P rc
, dada en la forma:
P rc
= AD
_
_
_
A
D
1
r
A = I
B
D
1
c
B = I
(1.65)
donde
1

K
> 0 son los K valores singulares no nulos.
Entonces las columnas de A y B denen los ejes principales de las columnas y las respectivamente (nubes de
puntos-columna y de puntos-la que en el Analisis de Correspondencias Simple son los puntos perles-columna
y puntos perles-la, respectivamente).
Demostracion. Sea el espacio de puntos-la, denido por los perles-las, es decir, por las las de R = D
1
r
P
(as pues, el espacio de puntos-la, con la metrica eucldea ponderada en R
J
denida por D
1
c
, y con masas
dadas por la diagonal de D
r
).
Los ejes principales de este espacio de perles-la, as como las respectivas coordenadas de los perles-la
respecto de dichos ejes se obtienen con la descomposicion de valores singulares generalizada de R1c
(matriz
centrada de perles-la). Es decir
R 1c
= D
1
r
P 1c
= LD
_
L
D
r
L = I
M
D
1
c
M = I
(1.66)
donde D
contiene los valores singulares de R 1c
: (
1
, ,
K
).
Ademas, se sabe del Analisis Factorial General, que las columnas de M son los ejes principales y las las
de LD
son las coordenadas de las proyecciones de la nube de puntos-la sobre los citados ejes factoriales que
denen el subespacio ajustado.
Por otra parte
D
r
(D
1
r
P 1c
) = P D
r
1c
= P rc
= (D
r
L)D
(1.67)
en donde
(D
r
L)
D
1
r
(D
r
L) = L
D
r
L = I
M
D
1
c
M = I
por [1.66]
Esto quiere decir que las columnas de M (los ejes factoriales) en [1.67], son identicas a las columnas de M
en [1.66] respecto de R 1c
. Las coordenadas cambiaran de LD
a (D
r
L)D
). Es decir que para calcular los

ejes principales del espacio de perles-la, puedo considerar las columnas de M en [1.66], descomposicion de
valores singulares de R1c
, o las columnas de M en [1.67], descomposicion de valores singulares de P rc
.
En resumen, en el espacio de perles-las, los ejes principales vienen dados por la descomposicion de va-
lores singulares generalizada de P rc
= AD
, con A = D
r
L; B
= M
; D
= D
y con las condiciones

A
D
1
r
A = I y B
D
1
c
B = I (en efecto, (D
r
L)
D
1
r
D
r
L = I y M
D
1
c
M = I).
De manera similar, supongamos ahora el espacio de perles-columna C = D
1
c
P, con los pesos (masas)
dadas por D
1
c
y con la metrica D
1
r
.
Los ejes principales en este espacio son las columnas de Z, en la descomposicion de valores singulares de
C 1r
(matriz centrada de perles-columna). Es decir,

C 1r
= Y D
con
_
_
_
Y
D
c
Y = I
Z
D
1
r
Z = I
(1.68)
Pero
D
1
c
P
1r
= Y D
Multiplicando ambos miembros por D

c
D
c
_
D
1
c
P
1r
_
= D
c
Y D
de donde
P
D
c
1r
= P
cr
= (D
c
Y )D
y ahora se verica (D
c
Y )
D
1
c
(D
c
Y ) = Y
D
c
Y = I en virtud de [1.68] y Z
D
1
r
Z = I.
Luego es equivalente la descomposicion de valores singulares generalizada de
C 1r
= Y D
con las condiciones

_
_
_
Y
D
c
Y = I
Z
D
1
r
Z = I
a la descomposicion de valores singulares generalizada de
P
cr
= (D
c
Y ) D
con las condiciones

_
_
_
(D
c
Y )
D
1
c
(D
c
Y ) = I
Z
D
1
r
Z = I
(1.69)
Los ejes principales del espacio de perles-columnas son, pues, las columnas de Z (y lo mismo es calcularlas
en [1.68] que en [1.69]).
Obviamente, por otro lado,
P
cr
=
_
P rc
_
=
_
(D
c
Y )D
_
=
_
ZD
(D
c
Y )
_
=
_
(D
r
L)D
_
= MD
(D
r
L)
es decir, que los ejes factoriales son las columnas de D

r
L, que es A.
Nota 20. Hemos demostrado que si se trata el problema de calcular la descomposicion de valores singulares de
R1c
(para tener los ejes factoriales de la nube de puntos-la) por un lado y por otro se trata de calcular la
descomposicion de valores singulares de C1r
(para obtener los ejes factoriales de la nube de puntos-columna),

ambos calculos se pueden englobar en la DVS de P rc
de tal forma que si

P rc
= AD
con
_
_
_
A
D
1
r
A = I
B
D
1
c
B = I
entonces las columnas de A son los factores en R
I
del espacio (nube) de los puntos-columna y las columnas de
B son los factores de la nube de puntos-la (en R
J
).
Observese que
P
IJ
r
I1
c
1J
= A
IK
(D
)
KK
B
KJ
; K = rg(P rc
)
de modo que
1

2

K
> 0 son los valores singulares de P rc
.
Por otra parte estan los conjuntos de valores singulares, por un lado de R 1c
= D
1
r
P 1c
, es decir,
1

K
> 0 y por otro lado los valores singulares de C1r
= D
1
c
P
1r
, es decir,
1

K
> 0.
Estos conjuntos de valores singulares claramente son iguales.
1.2.5. Sobre las coordenadas de los perles-la y perles-columna y la relaci on
entre ellas.
Consideremos los perles-la. Las coordenadas de estos perles-la, I en total, respecto de los ejes factoriales
calculados en R
J
, vienen dadas por las proyecciones de la nube sobre los ejes que son ortonormales. Es decir, las
coordenadas son los productos escalares, de los perles-la centrados, por B (que es la matriz cuyas columnas
son los ejes factoriales respectivos). Hay que tener en cuenta que este producto escalar es en el R
J
ponderado,
con metrica denida por D
1
c
. Es decir, en denitiva, las coordenadas citadas son
(R 1c
)D
1
c
B =
_
D
1
r
P 1c
_
IJ
(D
1
c
)
JJ
B
JK
= F
IK
(1.70)
Analogamente, las coordenadas de la nube de puntos-columna, respecto de los ejes factoriales correspon-
dientes sera:
(C 1r
)D
1
r
A =
_
D
1
c
P
1r
_
JI
(D
1
r
)
II
A
IK
= G
JK
(1.71)
As, pues las matrices F
IK
y G
JK
, son las matrices que contienen las coordenadas de la nube de puntos-
la respecto del subespacio ajustado por los K ejes factoriales de R
J
y de la nube de puntos-columna respecto
del subespacio ajustado por los K ejes factoriales de R
I
, respectivamente.
Pero observese que las anteriores expresiones [1.70] y [1.71] se han obtenido por separado, es decir, razonan-
do, respectivamente, sobre R1c
y C1r
, matrices por separado asociadas a las dos situaciones (perles-la,

perles-columna). Pero hemos visto en el resultado global anterior, que ambos aspectos parciales pueden en-
globarse en un unico resultado, sobre la descomposicion de valores singulares de P rc
= AD
, de modo
que las columnas de A denen los ejes que denen el subespacio ajustado a la nube de puntos-columna, y las
columnas de B a la nube de puntos-la.
En coherencia pues, con este resultado anterior, deberamos expresar F y G en terminos de A y B. Veamos
cuales son las expresiones correspondientes.
Por ejemplo, consideremos F, coordenadas de perles-la respecto de los ejes factoriales que denen el
subespacio ajustado a la nube de puntos-la en R
J
. Hemos visto que
F =
_
R 1c
_
D
1
c
B =
_
D
1
r
P 1c
_
D
1
c
B = D
1
r
(P D
r
1c
)D
1
c
B = D
1
r
(P rc
)D
1
c
B
Pero P rc
= AD
(descomposicion de valores singulares de P rc
), luego
(P rc
)D
1
c
B = AD
D
1
c
B = AD
Luego
F = D
1
r
AD
(1.72)
Analogamente se prueba que
G = D
1
c
BD
(1.73)
Nota 21. Tambien se puede demostrar este resultado basandonos en los pasos de la demostraci on del resultado
anterior, pues es claro que F = LD
, siendo A = D
r
L ( L = D
1
r
A) luego F = D
1
r
AD
, pero como
D
, tambien se obtiene [1.72].

Formulas de transicion
Hemos obtenido expresiones de las coordenadas de los perles-la y perles-columna, respecto de los ejes
factoriales respectivos (que denen en cada caso el subespacio ajustado a las sendas nubes, en ambos casos de
rango K =dimension del subespacio). Exploremos que relacion existe entre ambas coordenadas.
Partimos, por ejemplo, de G, dada por [1.71]:
G
JK
=
_
D
1
c
P
1r
_
D
1
r
A = D
1
c
(P
cr
)D
1
r
A = D
1
c
(P
cr
)FD
1
=
D
1
c
P
FD
1
D
1
c
cr
FD
1
= D
1
c
P
FD
1
FD
1
= (D
1
c
)
JJ
P
JI
F
IK
(D
1
)
KK
todo ello en virtud de las expresiones anteriores [1.72] y [1.73] y teniendo en cuenta que r
F = 0
.
Nota 22. Que r
F = 0
se deduce facilmente as:

r
F = r
_
D
1
r
P 1c
_
D
1
c
B = (1P c
)D
1
c
B = 0
En denitiva
G = D
1
c
P
FD
1
de donde
GD
= D
1
c
P
F (1.74)
Analogamente se deduce que
FD
= D
1
r
PG (1.75)
Estas formulas suelen llamarse formulas de transicion de las coordenadas contenidas en G a las de F y
viceversa.
Nota 23. Se suelen introducir las matrices (D
1
c
)
JJ
P
JI
= C
JI
(columnas) y (D
1
r
)
II
P
IJ
= R
IJ
(las), denidas respectivamente en [1.51] y [1.52], con lo que las relaciones [1.74] y [1.75] se escriben:
G
JK
= C
JI
F
IK
(D
1
)
KK
; F
IK
= R
IJ
G
JK
(D
1
)
KK
(1.76)
1.2.6. El principio Baricentrico
Este principio ya fue enunciado anteriormente, cuando desarrollabamos el Analisis de Correspondencias
Simple por metodo no matricial. Veamos aqu su version en el contexto matricial. Partimos de las formu-
las de transicion entre coordenadas que se acaban de obtener. Por ejemplo, razonemos con la expresion
G
JK
= C
JI
F
IK
_
D
1
_
KK
.
Es claro que la j-esima la de G, verica:
((j-esima la de G))
1K
= ((j-esima la de C))
1I
F
IK
_
D
1
_
KK
=
_
c
j
F
_
1K
_
D
1
_
KK
Que signica
_
c
j
_
1I
F
IK
?. En primer lugar, es un vector la (1K), cuyas componentes (K en n umero),
son combinaciones lineales de las columnas de F, combinaciones lineales que pueden ponerse, por otra parte,
como c
j1
f
1
+ +c
jK
f
K
, en donde f
1
, , f
K
son las las de F. En efecto:
(c
j1
, , c
jI
)
1I
_
_
_
_
_
_
f
11
f
12
f
1K
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
f
I1
f
I2
f
IK
_
_
_
_
_
_
IK
= (c
j1
f
11
+ +c
jI
f
I1
, , c
j1
f
1K
+ +c
jI
f
IK
)
1K
=
= c
j1
(f
11
, , f
1K
) +c
j2
(f
21
, , f
2K
) + +c
jI
(f
I1
, , f
IK
)
Es decir, que la j-esima la de G, vector la 1 K, que no es otra cosa que las coordenadas del j-esimo
perl-columna respecto del subespacio denido por los ejes factoriales ajustados a la nube de perles-columna
(en R
I
), es una combinacion baricentrica de las las de F, que son vectores K-dimensionales que, por otra
parte, indican las coordenadas respecto del subespacio denido por los K ejes factoriales asociados a la nube
de perles-la.
En resumen, volviendo a la expresion G = CFD
1
, en la cual G, J K, tiene en cada la las coordenadas

de los perles-columna respecto del correspondiente sistema de ejes factoriales, resulta que cada una de sus
las se puede escribir como una combinaci on lineal baricentrica de las las de F (las que por otra parte,
en F, I K, signican las coordenadas de los perles-la en su subespacio correspondiente), seguida de una
expansion en escala de magnitud
1
K
(K-esimo elemento diagonal de D
1
) asociada a cada dimension es decir

a cada componente de la combinacion lineal baricentrica (que tiene K sumandos).
Nota 24. Expresando lo anterior analticamente se tiene, para j = 1, , J
((j-esima la de G)) =
_
c
j1
f
1
+ +c
jK
f
K
_
D
1
=
_
c
j1
f
1
+ +c
jK
f
K
_
En efecto esto es cierto ya que el primer miembro es igual a:
(c
j1
f
11
+ +c
jI
f
I1
, , c
j1
f
1K
+ +c
jI
f
IK
) D
1
=
=
_
(c
j1
f
11
+ +c
jI
f
I1
)
1
1
, , (c
j1
f
1K
+ +c
jI
f
IK
)
1
K
_
= c
j1
_
f
11
1
, ,
f
1K
K
_
+ +c
jI
_
f
I1
1
, ,
f
IK
K
_
lo que, en efecto, se puede interpretar as: Las las de G se obtienen mediante una combinacion lineal baric
etri-
ca (un baricentro) de las las de F, seguida de una expansion de magnitud
1
k
aplicada a cada dimension (de
las K) dimensiones que hay.
Analogamente cabe razonar partiendo de F en lugar de G, llegandose a analoga conclusion para las coor-
denadas de los perles-la (es decir las las de F).
Nota 25. Observese que en ambos casos aparecen combinaciones lineales baricentricas. Que lo son es claro
porque
n
i=1
c
ji
= 1
p
h=1
r
ih
= 1 (1.77)
es decir, la suma de los elementos de cada la de C vale 1, y la suma de los elementos de cada la de R tambien
vale 1. En efecto, sabemos que
C
JI
=
_
D
1
c
_
JJ
P
JI
; R
IJ
=
_
D
1
r
_
II
P
IJ
de donde se deducen las expresiones reejadas en [1.77].
1.2.7. Resultados sobre las descomposiciones de la Inercia
Ya hemos utilizado antes (ver nota 22) el hecho de que r
F = 0
cuyo signicado es evidente: Ajustado

el subespacio a las nubes de perles-la, con sus respectivos ejes factoriales, ocurre que el centroide de las
coordenadas de las proyecciones de los perles-la sobre el subespacio, es el origen.
En efecto, r
1I
F
IK
es el producto del vector (1 I) que contiene las masas asociadas a los perles-la
por la matriz F, cuyas I las son las coordenadas de los perles-la sobre el subespacio ajustado en R
J
. Y
como ya se vio, r
F = 0
(0
es 1 K).
Analogamente cabe razonar y comprobar que
c
G = 0
centroide de las las de G, es decir de las coordenadas K-dimensionales de los perles-columna sobre el subes-
pacio K-dimensional ajustado.
Inercias Principales
Veamos a continuacion las consecuencias que tiene en las Inercias de los perles-la y perles-columna, el
ajuste de los subespacios (o lo que podramos decir, inercias principales de los perles respectivos). Concreta-
mente:
Denicion 5. Se denomina k-esima inercia principal, a lo largo del k-esimo eje factorial del subespacio ajus-
tado, a la suma ponderada de los cuadrados de las coordenadas de los puntos sobre el k-esimo eje considerado.
Es pues la varianza ponderada, dado que como hemos visto los centroides son vectores nulos.
Nota 26. Recuerdese que ya habamos denido las Inercias Totales de las dos nubes de puntos (perles-la y
perles-columna), en los respectivos espacios eucldeos ponderados en R
J
y R
I
. El resultado que a continuaci on
se da permite descomponer estas inercias totales mediante las inercias principales que acabamos de introducir
y otras (residuales) entre los puntos.
Denicion 6. Las inercias principales de la nube de perles-la son dadas por
D
= D
2
= F
D
r
F
y las de los perles-columna por
D
= D
2
= G
D
c
G
D
es una matriz diagonal con elementos

k
que son las inercias principales.
Demostracion. Tomemos en primer lugar la nube de las. Partimos de la expresion F
D
r
F con (D
r
)
II
=
diag(r), r
I1
= P
IJ
1
J1
(ponderaciones).
Es claro que esta matriz KK contiene todas las inercias principales respecto de los K ejes factoriales que
denen el subespacio K-dimensional ajustado a la nube de puntos (perles)-la. Tambien contiene los terminos
cruzados (covarianzas ponderadas).
Ahora bien, utilizando las relaciones de las coordenadas principales de la nube de puntos-la con los ejes
principales de la otra nube de columnas, se tiene:
F
D
r
F =
_
D
1
r
AD
D
r
_
D
1
r
AD
_
= D
D
1
r
D
r
D
1
r
AD
= D
D
1
r
AD
= D
ID
= D
2
dado que A
D
1
r
A = I en virtud del resultado general de la descomposicion de valores singulares.
En denitiva, que los productos cruzados en F
D
r
F son nulos. Por tanto, los elementos de D
2
son iguales
a los de D
.
De la misma forma razonamos sobre la nube de puntos (perles)-columna, que conducen a identico resultado:
G
D
c
G =
_
D
1
c
BD
D
c
_
D
1
c
BD
_
= D
D
1
c
D
c
D
1
c
BD
= D
D
1
c
BD
= D
ID
= D
2
Nota 27. Observese que, en ambos casos, (ambas nubes), las inercias principales respecto de los ejes, son
iguales para cada eje.
Tabla de descomposicion de las Inercias
Acabamos de ver que las inercias principales, a lo largo de los ejes principales se expresan as:
F
D
r
F = D
2
D
2
= G
D
c
G (1.78)
siendo F
D
r
F la matriz que contiene las inercias de la nube de las y G
D
c
G la matriz de las inercias de la
nube de columnas.
Los elementos de F
D
r
F, desglosados por las se expresaran as:
k
=
2
k
= r
1
f
2
1k
+r
2
f
2
2k
+ +r
I
f
2
Ik
k = 1, , K (1.79)
es decir que estos elementos para k = 1, , K son las inercias respecto de los ejes factoriales. En efecto, los
terminos de la matriz F
D
r
F que no son nulos, que son los correspondientes a la diagonal principal, tienen la
forma [1.79].
Y, obviamente, seg un [1.78], es cierto que, por otra parte:
k
=
2
k
= c
1
g
2
1k
+c
2
g
2
2k
+ +c
J
g
2
Jk
k = 1, , K (1.80)
es el k-esimo elemento de la diagonal de G
KJ
(D
c
)
JJ
G
JK
. Y estos elementos son las inercias principales
respecto de los ejes k = 1, , K. Estos dos hechos podemos recogerlos en forma de una tabla doble de la
forma siguiente
Ejes
1 2 k K Totales
1 r
1
f
2
11
r
1
f
2
12
r
1
f
2
1k
r
1
f
2
1K
r
1
k
f
2
1k
2 r
2
f
2
21
r
2
f
2
22
r
2
f
2
2k
r
2
f
2
2K
r
2
k
f
2
2k
las
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
I r
I
f
2
I1
r
I
f
2
I2
r
I
f
2
Ik
r
I
f
2
IK
r
I
k
f
2
Ik
Totales
1

2
1

2

2
2

k

2
k

K

2
K
2
k
1 c
1
g
2
11
c
1
g
2
12
c
1
g
2
1k
c
1
g
2
1K
c
1
k
g
2
1k
2 c
2
g
2
21
c
2
g
2
22
c
2
g
2
2k
c
2
g
2
2K
c
2
k
g
2
2k
columnas
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
J c
J
g
2
J1
c
J
g
2
J2
c
J
g
2
Jk
c
J
g
2
JK
c
J
k
g
2
Jk
Nota 28. Tal como esta dispuesta la tabla, en la zona de las, la inercia de cada eje (inercia principal k-esima,
con k = 1, , K) se descompone en las contribuciones debida a cada la. Las proporciones
r
i
f
2
ik
k
; i = 1, , I ; k = 1, , K (1.81)
nos dan la proporcion de inercia principal k-esima (eje k-esimo) debida a la la i-esima (perl-la i-esimo).
Analogamente
c
j
g
2
jk
k
; j = 1, , J ; k = 1, , K (1.82)
nos da la proporcion de la inercia principal k-esima, debida a la columna j-esima (perl-columna j-esimo).
Estas contribuciones [1.81] y [1.82] se llaman Contribuciones absolutas en general.
Estas cantidades son obviamente las mismas que ya habamos deducido cuando vimos el desarrollo del
Analisis de Correspondencias Simple, sin aparato matricial.
Por otra parte, si nos jamos en las sumas de cada la de la tabla doble anterior, vemos que, para las las,
tenemos los totales:
r
i
k
f
2
ik
i = 1, , I (1.83)
y analogamente, para las columnas:
c
j
k
g
2
jk
j = 1, , J (1.84)
Estos elementos [1.83] y [1.84], de cada la de la tabla doble, tanto para las las, como para las columnas,
se pueden interpretar como las Contribuciones de cada eje factorial, a la inercia de cada la o columna, es decir
a cada perl-la o perl-columna. Tambien se pueden considerar las proporciones
r
i
f
2
ik
r
i
k
f
2
ik
i = 1, , I (1.85)
c
j
g
2
jk
c
j
k
g
2
jk
j = 1, , J (1.86)
que se denominan contribuciones relativas y que fueron obtenidas anteriormente.
Si estas sumas por las se suman a su vez, obtenemos:
I
i=1
K
k=1
r
i
f
2
ik
;
J
j=1
K
k=1
c
j
g
2
jk
(1.87)
y es claro que ambas expresiones son iguales e iguales a
1
+ +
K
=
2
1
+ +
2
K
= tr
_
D
2
_
= tr (D
) (1.88)
Que son, por otra parte, las sumas [1.88], es decir tr
_
D
2
_
= tr (D
)?
La contestacion es clara: Ambos sumandos, que son iguales, son las inercias totales de las nubes de perles-
las y perles-columna.
En efecto, se probo en el teorema 1 que las inercias totales de ambas nubes de perles, son iguales e iguales
a
IN(I) = IN(J) =
I
i=1
r
i
( r
i
c)
D
1
c
( r
i
c) =
J
j=1
c
j
(c
j
r)
D
1
r
(c
j
r) = tr
_
D
1
r
(P rc
)D
1
c
(P rc
_
= tr
_
D
r
(R 1c
)D
1
c
(R 1c
_
= tr
_
D
c
(C 1r
)D
1
r
(C 1r
_
Tomemos pues la suma de la ultima columna de la Tabla. Se tiene, actuando por ejemplo para las las:
I
i=1
r
i
K
k=1
f
2
ik
=
1
+ +
K
=
2
1
+ +
2
K
= tr
_
D
2
_
= tr
_
F
D
r
F
_
= tr
_
__
D
1
r
P 1c
_
D
1
c
B
_
D
r
__
D
1
r
P 1c
_
D
1
c
B
_
_
= tr
_
D
r
_
D
1
r
P 1c
_
D
1
c
B
__
D
1
r
P 1c
_
D
1
c
B
_
_
=
= tr
_
D
r
_
D
1
r
P 1c
_
D
1
c
BB
D
1
c
_
D
1
r
P 1c
_
_
= tr
_
D
r
_
D
1
r
P 1c
_
D
1
c
_
D
1
r
P 1c
_
_
=
= tr
_
_
P D
r
1c
_
D
1
c
_
D
1
r
_
P D
r
1c
__
_
= tr
_
_
P D
r
1c
_
D
1
c
_
P D
r
1c
_
D
1
r
_
=
= tr
_
D
1
r
_
P D
r
1c
_
D
1
c
_
P D
r
1c
_
_
= tr
_
D
1
r
_
P rc
_
D
1
c
_
P rc
_
_
= IN(I)
donde se ha empleado, por un lado que tr(AB) = tr(BA) y por otro que B
D
1
c
B = I lo cual implica que
BB
D
1
c
BB
= BB
, de donde se deduce que BB
D
1
c
= I.
Lo mismo se probara facilmente, para las sumas por las, de la tabla de columnas.
En consecuencia, la tabla doble construida no hace mas que expresar la descomposicion de la inercia total
de las nubes de perles-la y perles-columnas (que sabemos que son iguales seg un el teorema 1) en terminos
de las inercias principales por un lado, y en terminos de las contribuciones de las y columnas por otro.
1.2.8. Una simplicacion en el calculo de la estructura factorial en Analisis de
Correspondencias Simple
Cuando vimos el desarrollo del Analisis de Correspondencias Simple por una via no matricial, se observo que
es posible realizar los calculos de los ejes factoriales apoyandose en una matriz no centrada, que contena toda
la estructura factorial y ademas un autovalor-autovector adicional.
Ahora, en el desarrollo matricial del Analisis de Correspondencias Simple vamos a volver a obtener aquellos
resultados, apoyandonos en la descomposici on de valores singulares de la propia matriz P de correspondencias,
en lugar de en la descomposicion de valores singulares de la matriz centrada P rc
en la que hasta ahora, y

despues del teorema [2], nos hemos venido usando.
Sea pues la matriz P, matriz de correspondencias, denida en la forma P =
N
n
; n
= 1
N1, con N
IJ
=
(n
ij
) una matriz inicial de datos. Y consideremos su descomposicion de valores singulares
P = AD
; A
D
1
r
A = I ; B
D
1
c
B = I (1.89)
Por otra parte sea la DVS de P rc
P rc
= AD
; A
D
1
r
A = I ; B
D
1
c
B = I (1.90)
Si consideramos P en lugar de P rc
se tiene lo siguiente: la matriz rc
, que es de rango la unidad, es la

matriz que ajusta (en sentido optimo) a P, con rango 1.
En efecto, esto quiere decir que
P = (rc
)(rc
; r
D
1
r
r = 1 = c
D
1
c
c
Observese que
P rc
= AD
de donde
P = rc
+AD
= AD
puesto que
[r|A]
_
1 0
0 D
_
[c|B]
= [r|AD
] [c|B]
= [r|AD
]
_
c
_
= rc
+AD
Lo unico que hay que probar para ver que A y B
es realmente la descomposicion de valores singulares de

P, es que los r y c a nadidos estan normalizados y son ortogonales a las columnas de A y B respectivamente,
es decir, que hay que comprobar que no solo P = rc
+ AD
= AD
, sino que realmente AD
es una
descomposicion de valores singulares de P.
Proposicion 1. Dadas las dos descomposiciones [1.89] y [1.90], se verica
A = [r|A] ; B = [c|B] ; D
=
_
1 0
0 D
_
Demostracion. Probar lo anterior queda reducido a probar en primer lugar que r y c son ortogonales a las
matrices A y B respectivamente, es decir que son en s mismos, r y c, autovectores de P.
En efecto, se sabe (ver nota [22]) que
r
F = centroide de las de F = 0
G = centroide de las de G = 0
De aqu que
r
F = r
D
1
r
AD
= 0
en virtud de [1.72]
c
G = c
D
1
c
BD
= 0
en virtud de [1.73]
Pero estas ecuaciones implican que r y c son ortogonales, en las metricas respectivas a Ay B respectivamente.
En segundo lugar, comprobemos que est an estandarizados respecto de sus metricas respectivas. En efecto:
r
D
1
r
r = r
1 = 1 ; c
D
1
c
c = c
1 = 1
En denitiva, por ahora sabemos que r y c son vectores normalizados (estandarizados) y ortogonales respecto
de A y B, respectivamente, en las metricas correspondientes. Por tanto, A = [r|A] y B = [c|B] son dos matrices
con columnas ortogonales que contienen una columna adicional sobre A y B respectivamente.
De camino se obtiene que 1 es el autovalor a nadido. Este es ademas el mayor de los autovalores de P.
1.2.9. Una forma alternativa de encontrar F y G, a partir de las matrices R y C
Vimos antes que las matrices F y G, de dimensiones respectivas I K y J K, son las que contienen en
sus las (1 K en ambos casos) las coordenadas de los I perles-la (en el caso de F) respecto del subespacio
factorial ajustado y las coordenadas de los J perles-columna (en el caso de G) respecto de los ejes factoriales
correspondientes. O dicho de otra forma, F (G) contiene en sus las las coordenadas de los perles-la (columna)
respecto de los ejes principales que constituyen la matriz B (la A), en la metrica D
1
c
(D
1
r
). Ademas sabemos
(ver [1.70] y [1.71]) que:
F
IK
=
_
D
1
r
P 1c
_
IJ
(D
1
c
)
JJ
B
JK
G
JK
=
_
D
1
c
P 1r
_
JI
(D
1
r
)
II
A
IK
y tambien que
F = D
1
r
AD
; G = D
1
c
BD
Por otra parte (formulas de transicion, vistas en [1.74], [1.75] y [1.76])

G = D
1
c
P
FD
1
= CFD
1
; F = D
1
r
PGD
1
= RGD
1
o bien
GD
= D
1
c
P
F ; FD
= D
1
r
PG
En consecuencia, C
JI

_
D
1
c
_
JJ
P
JI
, que es la matriz de los perles-columna, puede considerarse
como la que dene una transformacion (aplicacion) de las columnas de F a las columnas de G, contraida por
los cuadrados de los autovalores correspondientes a las inercias principales (es decir, los elementos de D
2
).
En efecto:
_
D
1
c
P
_
F = GD
; CF = GD
(1.91)
_
D
1
r
P
_
_
D
1
c
P
_
F = D
1
r
PGD
= FD
= FD
2
Es decir
RCF = FD
2
(1.92)
Ademas:
F
D
r
F =
_
D
1
r
AD
D
r
_
D
1
r
AD
_
= D
D
1
r
D
r
D
1
r
AD
= D
= D
2
(1.93)
Analogamente, si se parte de FD
= D
1
r
PG se tiene
_
D
1
r
P
_
G = FD
; RG = FD
(1.94)
_
D
1
c
P
_
_
D
1
r
P
_
G = D
1
c
P
FD
= GD
2
es decir:
(CR) G = GD
2
(1.95)
Ademas:
G
D
c
G =
_
D
1
c
BD
D
c
_
D
1
c
BD
_
= D
D
1
c
D
c
D
1
c
BD
= D
= D
2
En resumen, las matrices R y C verican:

1. CF = GD
; RG = FD
2. (RC)F = FD
2
; (CR)G = GD
2
3. F
D
r
F = D
2
; G
D
c
G = D
2
Nota 29. Este resultado viene a decirnos que las columnas de F y las columnas de C son autovectores no
triviales (no nulos) de las matrices RC y CR respectivamente, normalizados en el sentido de F
D
r
F = D
=
G
D
c
G.
De este resultado se desprende que para calcular las matrices F y G de coordenadas respecto de los ejes fac-
toriales, puede actuarse sobre las matrices RC y CR respectivamente, buscando sus autovectores normalizados
seg un el tercer apartado anterior. No obstante, como recomiendan diversos autores (ver Greenacre (1984), pag.
93), no debe utilizarse por separado las ecuaciones del apartado 2, porque, ademas de aumentar los problemas
computacionales, se pueden producir (de hecho es inevitable) cambios de signos en los autovectores solucion de
dichas ecuaciones. En efecto, observese que los autovectores no triviales correspondientes a los autovectores que
constituyen F y G, respecto de RC y CR, son iguales e iguales a los elementos diagonales de la matriz diagonal
D
D
2
, que son las inercias principales. Por tanto autovectores diferentes en signos pueden corresponder a
iguales autovalores.
1.2.10. F ormulas de Reconstruccion
Ya vimos f ormulas que permiten reconstruir la matriz de correspondencias inicial P. All fueron deducidas
sin la formulacion matricial que aqu seguimos. Por tanto el objetivo de este parrafo es llegar a ellas, expresadas
matricialmente en el contexto en el que venimos formulando el Analisis de Correspondencias Simple Matricial.
En efecto: sabemos que
P rc
= AD
(1.96)
y que
F = D
1
r
AD
; G = D
1
c
BD
De aqu que:
A = D
r
FD
1
; B = D
c
GD
1
; B
= D
1
D
c
Por tanto, sustituyendo en [1.96] se tiene:
P rc
= D
r
FD
1
D
1
D
c
de donde:
P = rc
+D
r
FD
1
D
c
(1.97)
Si se utiliza una aproximacion de rango bajo K
, obviamente:
P rc
+D
r
F
(K
)
D
1
(K
)
D
c
(1.98)
Seg un la losofa y resultados de una aproximacion mnimo-cuadratica de bajo rango K
< K, con F
(K
)
y
G
(K
)
las correspondientes matrices que contienen las coordenadas respecto de los K
ejes principales factoriales

asociados a las K
mayores raices caractersticas escogidas.

Nota 30. La aproximacion [1.98] puede emplearse, entre otras cosas, para reconstruir valores que faltan (mis-
sing) en la matriz de correspondencias P.
Nota 31. Las expresiones [1.97] y [1.98] pueden escribirse, para cada elemento (i, j) de la matriz P de
correspondencias, obteniendose respectivamente:
p
ij
= r
i
c
j
_
1 +
K
k=1
f
ik
g
jk
k
_
(1.99)
p
ij
r
i
c
j
_
1 +
K
k=1
f
ik
g
jk
k
_
(1.100)
expresiones de reconstruccion de la matriz P que ya se obtuvieron por via no matricial.
1.2.11. Otro sistema de coordenadas en el Analisis de Correspondencias: Las
coordenadas tipicadas (estandars). Representaciones asimetricas en Anali-
sis de Correspondencias Simple
Ya se ha visto un sistema de coordenadas en el Analisis de Correspondencias Simple, basado en las matrices
F y G, las cuales, respectivamente, dan las coordenadas principales de los perles-la y perles-columna. Estas
matrices que tienen la forma
F
IK
=
_
D
1
r
_
II
A
IK
(D
)
KK
; G
JK
=
_
D
1
c
_
JJ
B
JK
(D
)
KK
son tales que estan tipicadas (normalizadas) en el sentido que:
F
D
r
F = D
2
= G
D
c
G
Estas normalizaciones obviamente son las naturales en la estructura geometrica que se ha supuesto. Notese
que esta tipicacion o normalizacion es simetrica como corresponde a la dualidad y simetra de dicha estructura
geometrica en los espacios de perles-la y perles-columna.
Pero es posible manejar normalizaciones distintas a esa, sobre todo en lo que respecta al no mantenimiento
de la simetra. En este sentido vamos a denir un nuevo sistema de coordenadas.
Denicion 7. Se llaman coordenadas tpicas (estandar) las denidas as:
1. De los perles-las: = FD
1
2. De los perles-columna: = GD
1
con la tipicacion
D
r
= I,
D
c
= I
Nota 32. Observese que
D
1
D
r
FD
1
= D
1
D
2
D
1
= I
D
c
= D
1
D
c
GD
1
= I
Es decir que en realidad estamos deniendo una normalizacion que implica considerar inercias unidad
respecto de los ejes principales.
Representaciones Asimetricas
Se habla de representacion asimetrica en Analisis de Correspondencias Simple, para referirse a la situacion
en la que las tipicaciones exigidas en cada espacio (perles-la; perles-columna) son diferentes.
Obviamente, en este caso las formulas de transicion (vistas en el parrafo 1.2.5) se alteran, as como las
interpretaciones gr cas deducidas de ellas.
Los siguientes resultados precisamente, nos proporcionan un tipo de formulas de transicion asimetricas entre
las matrices F y y y G, para el caso en que cada espacio se use una tipicacion distinta, de las dos que
hemos introducido: coordenadas principales (dadas por F y G) y coordenadas tipicadas (dadas por y ).
Resultado:
Proposicion 2. Sea la situacion asimetrica descrita antes para F y . Las formulas de transicion asimetricas
son
1. De las a columnas
= D
1
c
P
FD
2
; D
2
= D
1
c
P
F (1.101)
2. De columnas a las
F = D
1
r
P (1.102)
Demostracion. Sabemos, por un lado, que en el espacio de las las, con normalizacion natural, en coordenadas
principales, se tiene:
FD
= D
1
r
PG
Por otro lado, en el espacio de columnas, con coordenadas-estandar
= GD
1
Luego, en denitiva,
FD
= D
1
r
PD
; F = D
1
r
P
que demuestra el segundo de los resultados.
Por otra parte, si = GD
1
y GD
= D
1
c
P
F (seg un [1.74]) se tiene

= D
1
c
P
FD
1
D
1
= D
1
c
P
FD
2
que demuestra el primer resultado.

Analogamente, para la situacion descrita por y G, se obtiene el siguiente resultado:
Proposicion 3. Sea la situacion asimetrica descrita por y G (coordenadas-estandars en las las y coorde-
nadas principales en las columnas). Las formulas de transicion asimetricas correspondientes son:
1. De las a columnas
G = D
1
c
P
(1.103)
2. De columnas a las
= D
1
r
PGD
2
; D
2
= D
1
r
PG (1.104)
Demostracion. El espacio de columnas esta normalizado en el sentido natural (coordenadas principales). Luego:
GD
= D
1
c
P
F ; G = D
1
c
P
FD
1
= D
1
c
P
lo que demuestra el primero de los resultados.

Por otra parte:
= FD
1
= D
1
r
PGD
1
D
1
= D
1
r
PGD
2
lo cual demuestra el segundo resultado.

Nota 33. Supongamos que hacemos una representacion graca respecto de ejes principales, en donde las las
se representan mediante coordenadas principales (F
D
r
F = D
2
), y las columnas en coordenadas-estandars

(
D
c
= I). Hemos visto que F = D
1
r
P, relaciona entonces ambas coordenadas de las y columnas.
En esta expresion F aparece pues, como baricentro de los puntos-columna, ya que D
1
r
P es una combinacion
baricentrica. Pero ademas, R = D
1
r
P, es decir, que los coecientes del baricentro son los elementos perles-la
(las de R). En denitiva:
F = R
lo que nos dice que: las coordenadas principales de los puntos-la, son baricentros de los puntos-columna
(en coordenadas estandars), siendo los coecientes baricentricos los perles-las correspondientes.
Este hecho tiene ventajas a la hora de representar gracamente situaciones en las que las inercias son muy
grandes, por ejemplo en las columnas. Entonces, en lugar de normalizar normalmente, es decir en coordena-
das principales, las columnas, conviene hacerlo en coordenadas-estandars, lo cual reduce las gracas. Si una
representacion asimetrica de este tipo se lleva a cabo, deben interpretarse las gracas con sumo cuidado, a la
luz de lo comentado antes.
Parte I
Aplicacion a SPSS y R
44
Tema 2
Analisis de Correspondencias.
El Analisis de Correspondencias es una tecnica de reduccion de dimension y elaboracion de mapas per-
centuales. Los mapas percentuales se basan en la asociacion entre objetos y un conjunto de caractersticas
descriptivas o atributos especicados por el investigador. Su aplicacion es muy directa y su benecio es la
capacidad para representar las y columnas en un mismo espacio. En este sentido la nalidad sera determinar
la posicion de una serie de objetos seg un una serie de caractersticas a traves de un espacio vectorial en dos,
tres o mas dimensiones.
En su forma basica, el analisis de correspondencias examina las relaciones entre categoras de datos nomi-
nales mediante la medida de asociacion de la chi-cuadrado. Este analisis realiza una reduccion de la dimension
del problema en donde la proximidad, en sentido matematico, entre los individuos indicara el nivel de asociacion.
El analisis de correspondencias tiene dos objetivos basicos:
Asociacion entre categoras de columnas o las: se usa para medir la asociacion de solo una la o columna,
para ver, por ejemplo si las modalidades de una variable pueden ser combinadas
Asociacion entre categoras de las y columnas: se usa para estudiar si existe relacion entre categoras de
las las y columnas.
El analisis de correspondencias solo requiere que los datos representen las respuestas a una serie de preguntas
y que estan organizadas en categoras. Dependiendo si existen dos o mas variables el analisis sera simple o
m ultiple.
2.1. Introducci on al analisis de correspondencias
Uno de los objetivos del analisis de correspondencias es describir las relaciones existentes entre dos variables
nominales, recogidas en una tabla de correspondencias, sobre un espacio de pocas dimensiones, mientras que al
mismo tiempo se describen las relaciones entre las categoras de cada variable. Para cada variable, las distancias
sobre un graco entre los puntos de categoras reejan las relaciones entre las categoras, con las categoras
similares representadas proximas unas a otras.
El analisis de las tablas de contingencia a menudo incluye examinar los perles de la y de columna, as como
contrastar la independencia a traves del estadstico de chi-cuadrado. Sin embargo, el n umero de perles puede
ser bastante grande y la prueba de chi-cuadrado no revelara la estructura de la dependencia. El procedimiento
Tablas de contingencia ofrece varias medidas y pruebas de asociacion pero no puede representar gracamente
ninguna relacion entre las variables.
45
Analisis de Correspondencias. 46
2.2. Aplicacion mediante SPSS
Para poder realizar un analisis de correspondencias tendremos que seleccionar los men us:
Analizar
Reduccion de datos
Analisis de Correspondencias
En este ejemplo vamos a trabajar con el chero correspondencias.sav en el cual se mide a 1200 indi-
viduos dos variables, el estado civil, clasicado en tres grupos, Solteros, Casados y Otros y sus preocupaciones
mas importantes, en cuatro categoras, la Vida Afectiva, el Dinero, la Armona Familiar y la Salud.
Una vez seleccionado el analisis obtendremos el siguiente men u, en donde hemos de seleccionar las variables
con las trabajar y las categoras que tiene cada una. En este ejemplo la variable Fila sera estado civil, la cual
tiene tres categoras (ordenadas de la 1 a la 3) por lo que el rango tomara como valor maximo el 3 y el mnimo
el 1. La variable columna sera preocupaciones, y el rango sera de 1 a 4.
Figura 2.1: Men u de analisis de correspondencias
A la hora de indicar las categoras de cada variable tenemos una serie de opciones sobre ellas que son:
1. Las categoras deben ser iguales. Utilizaremos esta opcion si existen dos categoras que son iguales o las
queremos agrupar.
2. La categora es suplementaria si no inuye en el analisis pero se representan.
Boton Modelo
Con este boton especicaremos el n umero de dimensiones, la medida de distancia, el metodo de estandari-
zacion y el metodo de normalizacion.
Dimensiones en la solucion: tendremos que tener en cuenta que el n umero de dimensiones optimo sera el
menor n umero de dimensiones que necesitaremos para explicar la mayor parte de la variacion. Eviden-
temente intentaremos que este valor sea el mnimo posible, de tal manera que el n umero maximo de
dimensiones sera el mnimo del n umero de las menos uno (en este caso 4-1=3) y el de columnas menos
uno (3-1=2), es decir, en nuestro ejemplo usaremos dos dimensiones.
Medida de distancia: por defecto usaremos la distancia chi-cuadrado.
Metodo de normalizacion: esta es una de las decisiones mas importantes, ya que dependiendo del metodo,
se produciran soluciones que, aunque equivalentes, pueden ser diferentes. Usaremos:
1. Simetrico: en este caso la inercia se reparte igualmente entre las y columnas. U- saremos este
metodo para examinar las diferencias entre las categoras de las dos variables.
2. Principal: usaremos este metodo si deseamos examinar las diferencias entre las categoras de una o
de ambas variables en lugar de las diferencias entre las dos variables.
3. Principal por la: este metodo se usa para examinar las diferencias entre las categoras de la variable
de las.
4. Principal por columna: para examinar las diferencias entre las categoras de la variable de columnas.
5. Personalizado.
Figura 2.2: Boton Modelo
En nuestro ejemplo elegiremos la medida de la chi-cuadrado y como metodo de normalizacion el simetrico.
Como ya hemos visto el n umero de ejes o dimensiones apropiado sera de dos.
2.2.1. Bot on Estadsticos
Con este boton podremos obtener las siguientes salidas:
Tabla de correspondencias: tabla de contingencia de las variables con los totales marginales de las y
columnas.
Inspeccion de los puntos de la: resumen de cada categora de las, las puntuaciones, la masa, la inercia,
la contribucion a la inercia de la dimension y la contribucion de la dimension a la inercia del punto.
Inspeccion de los puntos de columna: igual que para las las pero para cada columna.
Perles de la: marginales por las.
Perles de columna: marginales por columnas.
Permutaciones de la tabla de correspondencias.
Estadsticos de conanza para puntos de la.
Estadsticos de conanza para puntos de columna.
Aplicacion en SPSS
Vamos a seleccionar todas las opciones disponibles con este boton.
1. Tabla de correspondencias: simplemente es la tabla de doble entrada de resumen de los datos; en ella
podemos ver que por ejemplo existen 26 solteros cuya preocupacion mas importante es la vida afectiva o
111 que es el dinero.
Figura 2.3: Boton estadsticos
Figura 2.4: Tabla de contingencia
2. Perles por la y columna: son las distribuciones marginales. Los perles por la son el resultado de
dividir cada valor por el total de su la mientras que los perles por columna es el valor de cada casilla
entre el total su columna.
3. Tabla resumen: en esta tabla destacaremos varios aspectos:
a) Valor propio.
b) Inercia: raz cuadrada del valor propio. Mide la importancia de un eje; 0.043 el primero y 0.05 el
segundo.
c) Inercia total: explicacion total de los ejes. Los ejes explican un total de 0.048.
d) Proporcion de inercia: aunque el valor de la inercia poda parecer peque no, 0.0403 y 0.005, entre
ambos ejes explican el 100 de la varianza y mas concretamente el primero el 90.4 % y el segundo el
9.06 %.
e) Chi-cuadrado: con este valor obtenemos el contraste de independencia entre ambas variables, el
contraste de la chi-cuadrado en las Tablas de Contingencia contrasta la independencia como hipotesis
nula frente a la dependencia. En este caso al ser el p-valor 0,3 10
3
aceptaramos la hipotesis de
dependencia entre variables. Destacamos que en el caso en que dos variables fuesen independientes,
el analisis de correspondencias podra realizarse, pero no tendra logica.
f ) Examen de los puntos la:
Las puntuaciones en la dimension son los valores que toma cada punto en la representacion que
hayamos calculado. Con inercia vemos lo que aporta cada categora al total de inercia, por ejemplo,
del total de inercia (0.048) los Solteros aportan 0.028.
Con contribucion de los puntos a la inercia de la dimension se mide la importancia de un punto a
la hora de explicar un eje, por ejemplo Soltero es el valor mas importante para la orientacion del
primer eje y Otro para el segundo.
Con contribucion de la dimension a la inercia del punto vemos el porcentaje de cada modalidad
explicado por cada eje, el primer eje explica el 98.30 % de la modalidad Soltero frente a solo el 1,7 %
del segundo eje.
Figura 2.5: Estadsticos
g) Examen de los puntos columna:
Igual que el caso anterior, ademas de los valores para representar en los ejes, podemos ver que
el primer eje viene muy determinado por el Dinero frente al segundo que lo hace por la Armona
Familiar. Tambien podemos ver que el primer eje explica el 99.9 % de la varianza de la modalidad
de Dinero y el 93 % de Salud.
Figura 2.6: Puntos la y columna
2.2.2. Bot on gracos
Dentro del boton de gracos podremos especicar las siguientes opciones:
Diagramas de dispersion: produce los gracos por parejas de las dimensiones. Entre ellos:
1. Diagrama de dispersion biespacial: diagramas conjuntos de los puntos de las y de columnas.
2. Puntos de la.
3. Puntos de columna.
Graco de lneas. Para obtener los siguientes gracos unidimensionales:
1. Categoras de la transformadas: produce un graco de los valores originales para las categoras de
la frente a las puntuaciones de la.
2. Categoras de columna transformadas: produce un graco de los valores originales para las categoras
de columna frente a las puntuaciones de columna.
Dimensiones del graco.
1. Muestra todas las dimensiones de la solucion.
2. Restringe el n umero de dimensiones
Figura 2.7: Boton gracos
Vamos a seleccionar todos los gracos posibles.
Aplicacion en SPSS
Si seleccionamos todos los gracos posibles obtendremos:
Diagramas de dispersion:
Con esta opcion obtenemos los gracos en dos dimensiones (si hubiera mas dimensiones obtendramos
las combinaciones de las dimensiones) para las y columnas a la vez y por separado.
Si analizamos los perles la, observamos que los tres grupos, Solteros, Casados y Otros son bastante
diferentes (lejanos). Si observamos los puntos columna, en estos parece que existe semejanza entre Dinero
y Vida Afectiva y Salud y Armona Familiar.
Figura 2.8: Gracos de las y graco de columnas
Con el graco de las y columnas podemos sacar las conclusiones nales, que son que los Casados preeren
la Armona Familiar y la Salud frente a los Solteros que preeren el Dinero y la Vida Afectiva.
Figura 2.9: Graco conjunto
Gracos de lneas: muestras los valores de las componentes de las las y columnas unidimensionalmente.
2.3. Analisis de correspondencias multiple
Para este caso vamos a usar el chero correspondencias2.sav, que contiene los 50 primeros individuos
del ejemplo anterior, pero a los que ademas se les ha estudiado el Sexo. Los procedimientos son los mismos solo
que un poco mas amplios.
2.3.1. Aplicaci on en SPSS
Para obtener un analisis de correspondencias m ultiple, tendremos que elegir los men us:
Analizar
Reduccion de Datos
Escalamiento optimo
y en la ventana del modelo seleccionar:
Todas las variables son nominales m ultiples
Un conjunto
Denir
Dentro de este analisis podramos obtener todos los resultados equivalentes al analisis de correspondencias
simple. Nosotros solo nos centraremos en las siguientes opciones:
Opciones: cambiaremos metodo de normalizacion a simetrico.
Boton resultados: seleccionaremos
1. Medidas discriminantes.
2. Correlaciones de las variables originales.
Con estas dos opciones podemos ver la relacion entre las variables. La correlacion mas baja es entre la
variable Sexo con las otras dos, lo que implicara que no existe mucha relacion entre ellas. Con respecto
a la segunda dimension los valores aumentan pero sigue la variable Sexo sin estar muy relacionada.
Figura 2.10: Correspondencias multiples
Tambien podemos ver esta circunstancia en el graco de discriminacion, en donde las variables
Estado Civil y Preocupaciones estan muy relacionadas. La tabla de Medidas de discriminacion son
las coordenadas de las variables en las dos dimensiones. En la Tabla de resumen del modelo, vemos
tambien como con dimensiones explicamos el 91.7 % de la varianza total.
Figura 2.11: Correspondencias multiples2
3. Cuanticaciones y contribuciones de las categoras:
Las cuanticaciones son los valores de los individuos son las representaciones optimas en el sentido
que esten separadas unas de otras en las dimensiones estudiadas y dentro de cada categora los
individuos esten juntos entre si. Estas cuanticaciones son gracadas posteriormente y sera esos
valores los que estudiemos.
Boton Gracos de variable:
1. Gracos por categoras: introduciremos las tres variables. Con esta opcion nos mostrara los gracos
bidimensionales de las variables marginalmente.
2. Gracos de categoras conjuntas: tambien introduciremos las tres variables. En este caso obtendremos
un graco bidimensional con todas las variables juntas.
Figura 2.12: Gracos
En ellos podemos ver como los Hombres se posicionan cerca de preferencia por la Vida Afectiva,
solteros por Armona Familiar, Otro con Salud y Mujer con Casadas.
3. Gracos de objeto: con este graco obtenemos la representacion de todos los individuos pudiendo
buscar aquellos que sean anomalos o extremos, que sera aquellos que tengan un comportamiento
distinto al resto.
Figura 2.13: Puntos objeto
2.4. Aplicacion mediante R
Para realizar Analisis de Correspondencias (y de componentes principales), vamos a usar el paquete ADE4
(Analisis de Datos Ecologicos y Medioambientales) implementado por el grupo de Bioestadstica de la Uni-
versidad de Lyon (http : //pbli.univ lyon1.fr/ADE 4/ADE 4.html). Este paquete va a ser utilizado
para la ejecuci on de metodos factoriales descriptivos: analisis de componentes principales (ACP), analisis de
correspondencias simple (ACS) y analisis de correspondencias multiple (ACM).
En primer lugar tenemos que instalar el paquete ADE4, para ello, seleccionaremos el men u desplegable
paquetes y la opcion instalar paquetes; seleccionaremos un mirror desde donde descargarlo (Spain(Madrid))
y descargaremos el paquete ade4 apareciendo en la consola de R:
--- Please select a CRAN mirror for use in this session ---
probando la URL http://cran.es.r-project.org/bin/windows/contrib/2.7/ade4_1.4-9.zip
Content type application/zip length 3023138 bytes (2.9 Mb)
URL abierta
downloaded 2.9 Mb
package ade4 successfully unpacked and MD5 sums checked
The downloaded packages are in
C:\Documents and Settings\User\Configuracion local\Temp\downloaded_packages
updating HTML package descriptions
Una vez descargado, siempre que vayamos a utilizar este paquete hay que cargarlo con la orden:
> library(ade4)
o desde el men u paquete.
2.4.1. Paquete dudi.coa
Para realizar un analisis de correspondencias simple usaremos el paquete dudi.coa. La sintaxis de este
paquete es:
dudi.coa(df, scannf = TRUE, nf = 2)
donde
df : chero de datos. Lo mas importante es que este chero debe contener la tabla de contingencia de los
datos.
scannf : valor logico que indica si dibuja el graco con los autovalores.
nf : si scannf es falso, es un entero que indica el n umero de ejes.
y los objetos de este paquete, que podemos obtener con la orden objeto$nombre son:
cw: pesos de las columnas.
lw: pesos de las las.
eig: inercia.
tab: la tabla de contingencia modicada.
li: coordenadas de las las.
l1: coordenadas de las las normalizadas.
co: coordenadas de las columnas.
co: coordenadas de las columnas normalizadas.
2.4.2. Paquete scatter
La sintaxis de este paquete que nos permitira obtener las representaciones gracas es:
scatter(x, xax = 1, yax = 2, method = 1:3, clab.row = 0.75,
clab.col = 1.25, posieig = "top", sub = NULL, csub = 2, ...)
donde x tiene que ser del tipo coa y method es un entero entre 1 y 3 de tal manera que
1: graco de las y columnas.
2: graco de las las.
3: graco de las columnas.
2.4.3. Ejemplo de aplicacion
En este caso vamos a abrir el chero correspondencias.txt que contiene la tabla de contingencia de
ejemplo que hemos tratado en SPSS:
> datos<-read.table("correspondencias.txt", header=TRUE)
> datos
x1 x2 x3
1 26 32 5
2 111 166 13
3 59 197 24
4 105 348 72
y usamos la orden acs<-dudi.coa(datos). Al aplicar este procedimiento, R nos consulta con cuantas dimen-
siones queremos trabajar, para ello nos facilita el graco de los autovalores. En este caso decidiremos quedarnos
con dos componentes.
Figura 2.14: Graco de los autovalores
Y sin mas que ejecutar la salida nos proporciona los objetos del analisis:
> acs
Duality diagramm
class: coa dudi
$call: dudi.coa(df = datos)
$nf: 2 axis-components saved
$rank: 2
eigen values: 0.04332 0.004576
vector length mode content
1 $cw 3 numeric column weights
2 $lw 4 numeric row weights
3 $eig 2 numeric eigen values
data.frame nrow ncol content
1 $tab 4 3 modified array
2 $li 4 2 row coordinates
3 $l1 4 2 row normed scores
4 $co 3 2 column coordinates
5 $c1 3 2 column normed scores
other elements: N
En primer lugar, nos proporciona los valores de inercia, 0.04332 y 0.004576, por lo que concluiramos que
el primer eje tiene mucho mas poder clasicatorio que el segundo.
> acs$cw
x1 x2 x3
0.2599309 0.6416235 0.0984456
> acs$lw
[1] 0.05440415 0.25043178 0.24179620 0.45336788
Son los pesos, respectivamente de las las y columna. Podemos observar que dentro de las columnas, la mas
inuyente es la modalidad X2 (casados) y en las las es la cuarta (Salud).
Finalmente las ultimas salidas son las coordenadas por las y columnas:
> acs$li
Axis1 Axis2
1 0.32069103 -0.13599675
2 0.30751878 0.01189229
3 -0.07881471 0.10360800
4 -0.16631593 -0.04550706
> acs$l1
RS1 RS2
1 1.5407792 -2.0103934
2 1.4774923 0.1757997
3 -0.3786700 1.5316015
4 -0.7990748 -0.6727153
> acs$co
Comp1 Comp2
x1 0.3249752 -0.04327934
x2 -0.0782064 0.04370218
x3 -0.3483348 -0.17055823
> acs$c1
CS1 CS2
x1 1.5613625 -0.6397837
x2 -0.3757473 0.6460344
x3 -1.6735954 -2.5213039
Es conveniente realizar tambien el contraste de la chi-cuadrado para comprobar la dependencia de las
variables:
> chisq.test(datos)
Pearsons Chi-squared test
data: datos
X-squared = 55.4642, df = 6, p-value = 3.735e-10
donde podemos ver que el p valor = 3,73e
10
< = 0,05 las variables son dependientes y por lo tanto tiene
sentido realizar este analisis.
Con respecto a los gracos, haremos:
scatter.coa(acs, method=1)
Obteniendo:
Figura 2.15: Gracos de las, columnas y las y columnas

1 Tema3 ACS PDF

Загружено:

Сведения о документе

Оригинальное название

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

1 Tema3 ACS PDF

Загружено:

Авторское право:

Доступные форматы

Analisis Multivariante

R. Gutierrez, R. Gutierrez-S anchez, A. Gonzalez

, se puede utilizar, por ejemplo, la distancia

estan superpuestos (se confunden) en R

, con un perl superposicion de ambos, y tal que

, con masa la suma de las masas, f

es la suma de las dos las de aquellos. En efecto, de [1.10] se

de modo que al ser los denominadores iguales (f

), los numeradores han de serlo f

, equivale a considerar el punto-suma de

) de la matriz original (de las f

) contiene, entre otros sumandos,

). Estos dos sumandos

. Pero los dos

) lo que se hace es sustituir los dos sumandos [*]

) no se ven afectados por la superposicion; luego d

X, en notacion del Analisis Factorial General, es la matriz que ha de resolver

, de tal manera que hemos de considerar (H

) que es de dimension p p, vendra dado por:

) puede ponerse en la forma

que coincide con la expresi on [1.17], como pretendamos demostrar.

de la matriz simetrica T dada por [1.17], la proyeccion

vendra dada por:

es un vector propio de T, con respecto al autovalor 0.

es autovector de T, distinto del antes denotado u

no es centrada en contraposicion de la X que lo era. Pero es mas facil manejar X

, pero en cambio lo es respecto del autovalor unidad.

cumple respecto de los autovectores la propiedad dicha.

Observese que tambien puede ser expresado as:

es una matriz no centrada (respecto de la X que si lo era).

y respecto de los mismos autovalores. En cambio el u

es autovector de T, respecto del

respecto del mismo autovalor, entonces

Luego se trata de comprobar que Tv

es un vector (p 1), cuya j-esima componente

como expresion de la j-esima componente del vector (T

, lo es respecto del autovalor 1 de dicha matriz T

= X. Basta tener en cuenta la observacion 2 anterior. En denitiva, en lugar de considerar

mas facil de manejar,

en la misma forma en que T = X

en el caso de actuar con la matriz no centrada

) las parejas autovalores-autovectores de S. Una aplicacion obvia de lo visto al respecto en el Analisis

; = 1, , q ; en donde q son los no nulos de los = 1, , p autovalores

, que denen la estructura factorial ajustada a la nube de perles-

) le son aplicados respecto de las matrices S o S

antes denidas, todas las propiedades vistas para T y T

en la observacion 4 anterior, considerando que

el -esimo vector unitario

) las parejas autovalores-autovectores de X

, para todos aquellos autovalores que no son nulos.

sobre las que

, estas coordenadas son, respectivamente X

que se vaya considerando. Si denota-

es un vector p 1, resultado de multiplicar la matriz X

respectivamente. Y por otro lado las relaciones entre u

estan dadas por [1.27].

, mediante una combinacion baricentrica de coecientes

son iguales o menores que la unidad. Recuerdese que el autovalor unidad,

Relaciones generales en el AFG

Particularizacion al Analisis de Correspondencias Simple con

Coordenadas de los puntos-la y columna en el Analisis de

de tal manera que, como ya se vio, en denitiva X se aproxima

X. Recuerdese que los que no sean nulos de esos