Вы находитесь на странице: 1из 74

UNIVERSIDAD CATLICA

SANTO TORIBIO DE MOGROVEJO

FACULTAD DE INGENIERA
DEPARTAMENTO ACADMICO DE CIENCIAS EXACTAS
DIRECCIN DE INFORMACIN ESTADSTICA

Programa de
Especializacin

ANLISIS DE
DATOC
SON SPSS

Versi
n 15.0
en
Espao

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

MDULO AVANZADO

Preparado por
Estad. Manuel Hurtado Snchez

Chiclayo, 2008

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

ANALISIS DE CORRESPONDENCIAS CON EL SPSS 16

El anlisis de correspondencias es una tcnica de interdependencia que facilita tanto la


reduccin dimensional de una clasificacin de objetos (productos, personas, etc.) sobre
un conjunto de atributos y el mapa perceptual de objetos relativos a estos atributos. Los
investigadores se enfrentan constantemente a la necesidad de cuantificar

datos

cualitativos que encuentran en variables nominales. Una de las ventajas del anlisis de
correspondencias es que permite acomodar tanto datos no mtricos como relaciones
no lineales.

En su forma ms bsica el anlisis de correspondencias emplea una tabla de


contingencia, que es la tabulacin cruzada de dos variables categricas. A continuacin
transforma los datos no mtricos en un

nivel mtrico y realiza una reduccin

dimensional (similar al anlisis factorial) y un mapa perceptual (Similar al anlisis


multidimensional). Por ejemplo, la preferencia por una marca de los encuestados
pueden ser tabulados de forma cruzada con variables demogrficas (sexo, categoras
de rentas, ocupacin) indicando cuanta gente que prefiere cada una de las marcas,
entra dentro de cada categora demogrfica. A travs del anlisis de correspondencias,
la asociacin o correspondencia de marcas

y las caractersticas distintivas de

aquellos que prefieren cada marca se muestran en un mapa bi o tridimensional, tanto


de marcas como caractersticas de los encuestados. Las marcas percibidas como
similares estn localizadas estn localizadas en una cercana unas de otras. De la
misma forma las caractersticas ms distintivas de los encuestados que prefieren cada
marca estn determinadas tambin por la proximidad de las categoras de de las
variables demogrficas respecto de la posicin de la marca. El anlisis de

las

correspondencias proporciona una representacin multivariante de la interdependencia


de datos no mtricos que no es posible realizar con otros mtodos.

Examinemos a continuacin una situacin simple de CA para lograr cierta perspectiva


de sus principios bsicos. A continuacin, discutiremos cada uno de los seis pasos en
el proceso de toma de decisiones. Se pondr especial nfasis en aquellos elementos

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

nicos del CA en comparacin con los mtodos de descomposicin del anlisis


multidimensional.

Un ejemplo sencillo
Examinemos una situacin sencilla como introduccin al CA. En su forma ms bsica,
CA examina las relaciones entre categoras d datos nominales en una tabla de
contingencia, la tabulacin cruzada de dos variables categricas. Por ejemplo,
supongamos que las cifras de ventas de los productos A, B y C se dividen en tres
categoras de edades (adultos jvenes, con edades comprendidas entre los 18 y los 35
aos; adultos con edades comprendidas entre 36 y los 55 aos; y tercera edad,
mayores de 56 aos). Los datos de tabulacin cruzada se muestran en la siguiente
tabla.

Tabla N 1 Ventas por producto segn edad


Categora de
edad

Ventas del producto


A

Total

Jvenes
Adultos
Tercera Edad

20
40
20

20
10
10

20
40
40

60
90
70

Total

80

40

100

220

Lo datos muestran que las unidades vendidas varan sustancialmente por productos (El
producto C tiene las mayores ventas totales, el producto B las ms bajas) y por grupos
de edad (los adultos de edades medias compran ms unidades, los jvenes los que
menos). Pero queremos identificar cualquier patrn de ventas de tal forma que
podamos afirmar que los jvenes compran ms el producto X o que los adultos
compran ms el producto Z. Para hacer esto, necesitamos una medida de
estandarizacin de unidades de ventas que considere simultneamente las diferencias
en las ventas para una combinacin de producto especfico-categora de edad. A
continuacin, si todava vemos que un cierto grupo de edad compra ms unidades de
un producto que las esperadas, podemos asociar ese grupo de edad con ese producto.
En una representacin grfica, los grupos edad se localizaran ms cerca de productos
con los cuales estn altamente asociados y ms lejos de grupos con asociaciones ms

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

bajas. Del mismo modo, queremos ser capaces de ver cualquier producto y ver sus
asociaciones con varios grupos de edad.

Clculo de una medida de asociacin


El anlisis de correspondencias utiliza uno de los conceptos estadsticos ms bsicos,
la Chi cuadrado, para estandarizar las ventas (valores de frecuencia) y formar las
bases de las asociaciones. La Chi cuadrado es una medida estandarizada de las
frecuencias observadas de cada celda contiene las frecuencias esperadas de celdas.
En nuestros datos de tabulacin cruzada, cada celda contiene las ventas para una
combinacin producto grupo de edad. El procedimiento de la Chi cuadrado procede a
continuacin en tres pasos para calcular un valor de Chi cuadrado para cada celda:
1. Clculo de las ventas esperadas. El primer paso es calcular las ventas
esperadas para una celda como si no existiese asociacin. Las ventas
esperadas se definen como la probabilidad conjunta de la combinacin de
columna (producto) y fila (grupo de edad). Esta se calcula como la probabilidad
marginal para el producto (ventas de ese producto para todos los grupos de
edad / ventas totales para todos los grupos de edad y producto) por la
probabilidad marginal para el grupo de edad (ventas de ese grupo de edad para
todos los productos / ventas totales para todos los grupos de edad). A
continuacin este valor se multiplica por las ventas totales para todos los grupos
de edad y todos los productos. Puede simplificarse cancelando trminos de tal
forma que la ecuacin es:

Ventas _ esperadas =

(Ventas _ totales _ por _ categora _ de _ edad ) x (ventas _ totales _ del _ tipo _ de _ producto)
conjunto _ de _ las _ ventas _ totales

En nuestro ejemplo, las ventas esperadas de los jvenes que compran el producto
A son de 21,28 unidades como se muestra en el siguiente clculo:
Ventas _ esperadas jvenes , producto _ A =

60 80
= 21,82
220

Este clculo se realiza para cada celda, con los resultados que se muestran en la
tabla 2.

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

Tabla N 2 Clculo de los valores de similitud de la chi cuadrado para datos


de la tabulacin cruzada
Ventas del producto
Categora de edad

Total

20
25
33.33
21.82
1.82
0.152
-0.15

20
50
33.33
10.91
-9.09
7.58
7.58

20
20
33.33
27.27
7.27
1.94
-1.94

60
27.27
100
60

40
50
44.44
32.73
-7.27
1.616
1.62

10
25
11.11
16.36
6.36
2.47
-2.47

40
40
44.44
40.91
0.91
0.02
-0.02

90
40.91
100
90

20
25
28.57
25.45
5.45
1.17
-1.17

10
25
14.29
12.73
2.73
0.58
-0.58

40
40
571.43
31.82
-8.18
2.10
2.10

70
31.82
100.0
70.0

80
100
36.36
80

40
100
18.18
40

100
100
45.45
100

220
100
100
220

2.94

10.63

4.06

17.63

Jvenes
Ventas
Porcentaje de columna
Porcentaje de fila
Ventas esperadas
Diferencia
Valor Chi cuadrado
Similitud

9.67

Adultos
Ventas
Porcentaje de columna
Porcentaje de fila
Ventas esperadas
Diferencia
Valor Chi cuadrado
Similitud

4.11

Tercera Edad
Ventas
Porcentaje de columna
Porcentaje de fila
Ventas esperadas
Diferencia
Valor Chi cuadrado
Similitud

3.86

Total
Ventas
Porcentaje de columna
Porcentaje de fila
Ventas esperadas
Diferencia
Valor Chi cuadrado

ventas _ esperadas( jvenes _ producto _ A) =

(Total _ de _ fila ) (total _ de _ columna) 60 80


=
= 21.82
Total _ general
220

Diferencia Jvenes , producto _ A = (Ventas _ esperadas ) (Ventas _ reales ) = 21,82 20 = 1,82

Valor _ Chi Cuadrado Jvenes, producto _ A =

(Diferencia )2
Vantas _ Esperadas

2
(
1,82 )
=

21,82

= 0,15

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

2. Diferencia entre valores observados y esperados. El siguiente paso es calcular


la diferencia entre las ventas esperadas y las observadas como sigue:
Diferencia = (Ventas _ Esperadas ) (Ventas _ Observadas) , Para nuestro ejemplo de

la celda para los jvenes que compran el producto A, la diferencia es


1.82 = 21.82 20 . Una gran diferencia positiva significara que la combinacin

producto grupo de edad tiene menos ventas que las que cabra esperar (una
asociacin negativa) y una gran diferencia negativa indicara asociaciones
positivas (laceada de las ventas observadas mayor que las ventas esperadas).
Las diferencias para cada celda se muestran tambin en la tabla 2.
3. Calcular el valor de la Chi-Cuadrado: El paso final es estandarizar las diferencias
entre las celdas de tal forma que se puedan realizar fcilmente las
comparaciones. La estandarizacin es necesaria porque sera mucho ms fcil
que se presenten diferencias si las frecuencias (ventas) fueran mucho ms altas
comparadas con una celda con slo unas pocas ventas. As que,
estandarizamos las diferencias para formar un valor de una Chi-Cuadrado
dividiendo cada diferencia al cuadrado por el valor esperado de las ventas. Por
tanto, el valor de la Chi-Cuadrado para una celda se calcula de la siguiente
forma:

( )
2

Valor _ Chi Cuadrado de _ una _ celda =

(Diferencia )2
Ventas _ esperadas

Para nuestro ejemplo, el valor de la Chi-Cuadrado sera:

( )

Chi Cuadrado

jvenes , producto _ A

2
(
1,82 )
=

21,82

= 0,15

Los valores de la Chi-Cuadrado pueden convertire en medidas de similitud


aplicando el signo opuesto de la diferencia. Por tanto para nuestro ejemplo
anterior de la celda, el valor Chi-Cuadrado de 0,15 podra decirse que es u valor
de similitud de -0,15, dado que la diferencia era positiva. Esto es necesario
porque el clculo de la Chi-Cuadrado eleva al cuadrado las diferencias y los
signos negativos, de tal forma que se eliminen. Los valores negativos indican
menos asociacin (similitud) y los valores positivos indican una mayor
asociacin. Los valores de la Ch-Cuadrado para cada celda se muestran en la
tabla 2.

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

Las celdas con Grandes valores de similitud positivos (indicando una asociacin
positiva) son los jvenes, producto B (+7,58), Adultos, producto A (+1,62) y
tercera edad, producto C (+2,10). Cada uno de estos pares estaran muy
cercanos en un mapa perceptual. Las cldas con grandes valores de similitud
(que significan que las ventas esperadas exceden a las reales, o una asociacin
positiva) seran los jvenes, producto C (-1,94), Adultos, producto B (-2,47) y
tercera edad, producto A (-1,17). Donde sea posible, estas categoras deberan
estar alegadas en el mapa.

Creacin del mapa perceptual


Los valores de similitud (denominados Chi-Cuadrado) ofrecen una medida
estandarizada de la asociacin, con estas medidas de asociacin, CA crea una
medida de distancia mtrica y crea dimensiones ortogonales sobre las cuales se
pueden colocar las categoras para tener ms en cuenta la fortaleza de la
asociacin representada por las distancias de la Chi-Cuadrado. Podemos
considerar en primer lugar una solucin unidimensional, a continuacin
aumentar a dos dimensiones y seguir hasta que alcancemos l mximo nmero
de dimensiones. El mximo es uno menos el menor nmero de las fila o
columnas. En este ejemplo solo podemos tener dos dimensiones (nmero de
filas menos nmero de columnas menos uno = 3-1=2). El mapa perceptual es
bidimensional y se muestra en la figura 1.
De acuerdo con nuestro examen de ls distancias Chi-Cuadrado, el grupo de
edad de los adultos jvenes est ms cerca del producto B, los de la edad
mediana estn ms cerca del producto A y los de la edad ms avanzada estn
cerca al producto C.

Asimismo, se representan tambin las asociaciones

negativas en las posiciones y de los productos y grupos de edad. El investigador


puede examinar el mapa perceptual para entender las preferencias del producto
entre los grupos de edad basndose en sus patrones de venta Pero no
conocemos por qu existen los patrones de venas, sino slo cmo identificarlos.

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

Grfico N 1 Mapa perceptual del anlisis de


correspondencias
Personas de la
tercera edad

16
14
Producto B

Producto C

Dimensin II

12
Jvenes

10
8

Adultos

6
4
Producto B

2
0
0

10

12

14

16

Dimensin I

Primer paso: OBJETIVOS DEL ANLISIS DE CORRESPONDENCIAS (CA)


El CA puede tener dos objetivos bsicos:
1. Asociacin entre categoras de columna o fila. El CA puede utilizarse para
examinar la asociacin entre las categoras de slo una fila o una columna. Un
uso tpico es el examen de las categoras de una escala, como la escala de
Likert (cinco categoras que van del totalmente de acuerdo al totalmente en
desacuerdo) u otras escalas cualitativas (es decir, excelente, bueno, regular,
malo). Las categoras pueden compararse para ver si dos de ellas pueden ser
combinadas (es decir, estn muy prximas en el mapa) o si se ofrecen
discriminacin (es decir, estn muy prximas en el mapa) o si ofrecen
discriminacin (es decir, estn localizadas separadamente en el mapa
perceptual).
2. Asociacin entre categoras de filas y columnas. En esta aplicacin, el inters
est en representar la asociacin entre categoras de filas y columnas, de la
misma forma que por ejemplo producto por grupo de edad.

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

El investigador debe determinar los objetivos especficos del anlisis debido a que
ciertas decisiones se basan en el tipo de objetivo elegido. El CA ofrece una
representacin multivariante de interdependencia para datos no mtricos que no es
posible realizar con otros mtodos. El investigador debe asegurarse incluir a todas
las variables relevantes apropiadas.

Segundo

paso:

Diseo

de

la

investigacin

mediante

anlisis

de

correspondencias (CA)
El anlisis de correspondencias solo requiere de una matriz de datos rectangular
(Tabulacin cruzada) de entradas no negativas. Las filas y las columnas no tienen
significados predeterminados(es decir los atributos no siempre tienen que ser filas)
pero en su lugar representan las respuestas de una o ms variables categricas.
Las categoras para una fila o una columna no tienen que ser necesariamente una
nica variable sino que pueden representar cualquier conjunto de relaciones. Como
ejemplo principal tenemos el mtodo de escoja cualquiera en el que se da a los
encuestados un conjunto de objetos y caractersticas. Los encuestados indican a
continuacin los objetos, si es que hay alguno, estn descritos por esas
caractersticas. Ntese que el encuestado pede elegir cualquier nmero de objetos
para cada caracterstica, en lugar de un nmero ya especificado (es decir, elegir
slo el objeto que mejor se describe o el mejor de los objetos). En esta situacin, la
tala de tabulacin cruzada sera el nmero total de veces que cada objeto est
descrito por cada caracterstica.
La tabulacin cruzada de ms de dos variables bajo la forma de una matriz
multientrada se conoce como el anlisis de correspondencias mltiple. En un
procedimiento bastante similar al anlisis de dos entradas, las variables adicionales
son ajustadas, de forma que todas las categoras estn situadas en el mismo
espacio multidimensional.

Tercer Paso: Supuestos del anlisis de correspondencias.


El anlisis de correspondencias comparte

con las tcnicas de anlisis

multidimensional ms tradicionales una relativa libertad respecto a sus supuestos


bsicos. El uso de daos estrictamente no mtricos en su forma ms simple (datos

10

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

de tabulacin cruzada) representa igualmente bien relaciones lineales y no lineales.


La falta de supuestos, sin embargo, no debe llevar al investigador a no esforzarse
en conseguir la comparabilidad de los objetos y, dado que es una tcnica de
composicin, a considerar la generalidad de los atributos utilizados.

Curto paso: Obtencin de resultados con anlisis de correspondencias y


valoracin del ajuste conjunto
Con una tabulacin cruzada, las frecuencias para cualquier combinacin de filas y
columnas de las categoras estn relacionadas con otras combinaciones basadas
en frecuencias marginales. Este procedimiento proporciona una expectativa
condicionada (un valor Chi-cuadrado). Una vez obtenido, estos valores de la Chicuadrado se estandarzan y se convierten en una distancia mtrica, y a continuacin
en un proceso mucho ms parecido al anlisis multidimensional, se definen
soluciones de dimensiones reducidas. Estos factores relacionan simultneamente
filas y columnas en un nico grafico conjunto. El resultado es una representacin de
categoras de filas y/o columnas (es decir arcas y atributos) en el mismo grfico.
Existen varios programas que realizan el anlisis de correspondencias, entre los
que podemos citar el SPSS.
Para evaluar el ajuste conjunto, el investigador debe identificar en primer lugar el
nmero apropiado de dimensiones y su importancia. El nmero mximo de
dimensiones que pueden ser estimadas es uno menos el nmero ms pequeo de
filas o columnas. Por ejemplo con seis columnas y ocho filas, el nmero mximo de
dimensiones sera cinco, dado que seis (nmero de columnas) menos uno. Los
autovalores tambin conocidos como valores singulares, se obtienen para cada
dimensin, e indican la contribucin relativa de cada dimensin en la explicacin de
la variacin en las categoras. El SPSS introduce una medida denominada inercia,
que tambin mide la variacin explicada y est directamente desarrollada con el
autovalor. El investigador selecciona el nmero de dimensiones basndose en el
nivel conjunto de explicacin deseada de la variacin y el aumento de explicacin
ganado por la adicin de otra dimensin. Se puede decir como norma general, que
aquellas dimensiones con inercia (autovalores) mayor que 0.2 deberan ser

11

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

incluidas en el anlisis. Utilizar una representacin tridimensional o menor facilita la


interpretacin.

Quinto paso: Interpretacin de los resultados.


Una vez que se ha establecido la dimensionalidad, el investigador puede identificar
una asociacin de categoras con otras categoras por su proximidad despus de
hacer la normalizacin apropiada. El investigador debe seleccionar el tipo de
normalizacin, y determinar si las comparaciones se van ha hacer entre categoras
de filas, categoras de columnas o categoras de filas y columnas. En muchos
casos, se desean comparar categoras de filas y columnas. Pueden existir muchos
casos, sin embargo, en los cuales el inters se centra slo en filas o columnas,
como cuando se examinan las categoras de una escala para ver si pueden ser
combinadas. Hasta este momento, hay debate acerca de si es apropiado comparar
entre categoras de filas y columnas. Algunos programas informticos ofrecen un
procedimiento de normalizacin que permite esta comparacin directa. Si slo se
dispone de un fila o columna normalizada, se proponen procedimientos alternativos
para hacer todas las categoras comparables, pero todava hay desacuerdo en su
xito. En los casos para los cuales no se pueden hacer comparaciones directas, la
correspondencia general todava se mantiene y pueden distinguirse patrones
especficos.

Si el investigador est interesado en definir el carcter de una o ms dimensiones


en trminos de las categoras de filas y columnas, existen medidas descriptivas que
indican la asociacin de cada categora con una dimensin especfica. De carcter
similar a las cargas de los factores, estas medidas detallan la medida de la
asociacin individualmente para cada dimensin as como colectivamente. De las
medidas colectivas, se puede hacer una evaluacin del ajuste para cada categora.

Sexto paso: Validacin de los resultados


La naturaleza composicional del anlisis de correspondencias ofrece al investigador
ms posibilidades de validar los resultados. Como con todas las tcnicas del
anlisis multidimensional, hay que hacer ms nfasis en asegurar la generalizacin

12

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

mediante anlisis split o multimuestra Sin embargo como con otras tcnicas de
elaboracin de mapas preceptales, debe establecerse la generalidad de los
objetos (individualmente y como un conjunto). Puede evaluarse la sensibilidad de
los resultados a la adicin o sustraccin de un atributo. El objetivo es evaluar si el
anlisis es dependiente de slo unos pocos objetos y/o atributos. En cada caso el
investigador debe entender el verdadero significado de los resultados en trminos
de os objetos y los atributos.

Visin de conjunto del anlisis de correspondencias


El anlisis de correspondencias ofrece al investigador varias ventajas. En primer
lugar, puede presentarse en un espacio perceptual la tabulacin cruzada simple de
variables categricas mltiples, tales como atributos de los productos versus
marcas. Este enfoque permite al investigador analizar las respuestas existentes o
conseguir respuestas con el tipo de medida menos restrictivo, al nivel nominal o
categrico. Por ejemplo en encuestado solo necesita decir si no para un nmero de
objetos sobre un nmero de atributos. A continuacin, estas respuestas se pueden
incluir en una tabla de tabulacin cruzada y ser analizadas. Otras tcnicas, como el
anlisis factorial necesitan requieren clasificaciones de intervalo de cada atributo
para cada objeto.
En segundo lugar, CA representa no solo las relaciones entre filas y columnas, sino
tambin las relaciones entre categoras tanto de filas como de columnas. Por
ejemplo s las columnas fueran atributos, muchos atributos cercanos tendran todos
perfiles similares para todos los productos. Con ello se forma un grupo de atributos
bastante similar al factor obtenido mediante anlisis de componentes principales.
Finalmente lo ms importante, CA puede ofrecer una representacin conjunta de
categoras de filas y columnas en la misma dimensionalidad.
Sin embargo el CA tambin tiene desventajas o limitaciones. La primera es que la
tcnica y no del todo apropiada para la contrastacin de hiptesis. Si se desea la
relacin cuantitativa de categoras, se sugieren mtodos tales como modelos no
lineales. El anlisis de correspondencias es ms apropiado para anlisis
exploratorio d los datos. En segundo lugar el CA, como ocurre con muchos otros
mtodos de reduccin de la dimensionalidad, no cuenta con un mtodo para

13

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

determinar concluyentemente el nmero de dimensiones apropiado. Como ocurre


con otros mtodos similares, el investigador debe sopesar la interpretabilidad con la
parsimonia de la representacin de los datos. Finalmente, a tcnica es muy sensible
a los casos atpicos, en trminos tanto de filas como de columnas. Tambin a
efectos de generalizacin, se pueden presentar problemas si s omiten algn objeto
o atributo relevante.

Anlisis de correspondencias con el SPSS15

14

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

Uno de los objetivos del anlisis de correspondencias es describir las relaciones


existentes entre dos variables nominales, recogidas en una tabla de correspondencias,
sobre un espacio de pocas dimensiones, mientras que al mismo tiempo se describen
las relaciones entre las categoras de cada variable. Para cada variable, las distancias
sobre un grfico entre los puntos de categoras reflejan las relaciones entre las
categoras, con las categoras similares representadas prximas unas a otras. La
proyeccin de los puntos de una variable sobre el vector desde el origen hasta un
punto de categora de la otra variable describe la relacin entre ambas variables.
El anlisis de las tablas de contingencia a menudo incluye examinar los perfiles de fila y
de columna, as como contrastar la independencia a travs del estadstico de chicuadrado. Sin embargo, el nmero de perfiles puede ser bastante grande y la prueba
de chi-cuadrado no revelar la estructura de la dependencia. El procedimiento Tablas
de contingencia ofrece varias medidas y pruebas de asociacin pero no puede
representar grficamente ninguna relacin entre las variables.
El anlisis factorial es una tcnica tpica para describir las relaciones existentes entre
variables en un espacio de pocas dimensiones. Sin embargo, el anlisis factorial
requiere datos de intervalo y el nmero de observaciones debe ser cinco veces el
nmero de variables. Por su parte, el anlisis de correspondencias asume que las
variables son nominales y permite describir las relaciones entre las categoras de cada
variable, as como la relacin entre las variables. Adems, el anlisis de
correspondencias se puede utilizar para analizar cualquier tabla de medidas de
correspondencia que sean positivas.
Ejemplo. El anlisis de correspondencias se puede utilizar para representar
grficamente la relacin entre la categora laboral y el hbito de fumar. Observar que,
en relacin al tabaco, el comportamiento de los subdirectores difiere del de las
secretarias, pero el comportamiento de stas no difiere del de los directores. Asimismo
observar, que el tabaquismo pronunciado se encuentra asociado a los subdirectores,
mientras que el tabaquismo leve se encuentra asociado a las secretarias.
Estadsticos y grficos. Medidas de correspondencia, perfiles de fila y de columna,
valores propios, puntuaciones de fila y de columna, inercia, masa, estadsticos de
confianza para las puntuaciones de fila y de columna, estadsticos de confianza para
los valores propios, grficos de transformacin, grficos de los puntos de fila, grficos
de los puntos de columna y diagramas de dispersin biespaciales.
Consideraciones sobre los datos
Datos. Las variables categricas que se van a analizar se encuentran escaladas a nivel nominal.
Para los datos agregados o para una medida de correspondencia distinta de las frecuencias,
utilice una variable de ponderacin con valores de similaridad positivos. De manera alternativa,
para datos tabulares, utilice la sintaxis para leer la tabla.
Supuestos. El mximo nmero de dimensiones utilizado en el procedimiento depende del
nmero de categoras activas de fila y de columna y del nmero de restricciones de igualdad. Si
no se utilizan criterios de igualdad y todas las categoras son activas, la dimensionalidad mxima
es igual al nmero de categoras de la variable con menos categoras menos uno. Por ejemplo, si

15

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

una variable dispone de cinco categoras y la otra de cuatro, el nmero mximo de dimensiones
es tres. Las categoras suplementarias no son activas. Por ejemplo, si una variable dispone de
cinco categoras, dos de las cuales son suplementarias, y la otra variable dispone de cuatro
categoras, el nmero mximo de dimensiones es dos. Considere todos los conjuntos de
categoras con restriccin de igualdad como una nica categora. Por ejemplo, si una variable
dispone de cinco categoras, tres de las cuales tienen restriccin de igualdad, dicha variable se
debe tratar como si tuviera tres categoras en el momento de calcular la dimensionalidad
mxima. Dos de las categoras no tienen restriccin y la tercera corresponde a las tres categoras
restringidas. Si se especifica un nmero de dimensiones superior al mximo, se utilizar el valor
mximo.

Procedimientos relacionados. Si hay implicadas ms de dos variables, utilice el anlisis de


correspondencias mltiple. Si se deben escalar las variables de forma ordinal, utilice el anlisis
de componentes principales categrico.

Para obtener un anlisis de correspondencias


Elija en los mens:
Analizar
Reduccin de datos
Anlisis de correspondencias...

Seleccione una variable de filas.


Seleccione una variable de columnas.
Defina los rangos para las variables.
Pulse en Aceptar.

Definir rango de filas en Anlisis de correspondencias

16

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

Debe definir un rango para la variable de filas. Los valores mnimo y mximo
especificados deben ser nmeros enteros. En el anlisis, se truncarn los valores de
los datos fraccionarios. Se ignorar en el anlisis cualquier valor de categora que est
fuera del rango especificado.

Inicialmente, todas las variables estarn sin restringir y activas. Puede restringir las
categoras de fila para igualarlas a otras categoras de fila o puede definir cualquier
categora de fila como suplementaria.

Las categoras deben ser iguales. Las puntuaciones de las categoras deben
ser iguales. Utilice las restricciones de igualdad si el orden obtenido para las
categoras no es el deseado o si no se corresponde con lo intuitivo. El mximo
nmero de categoras de fila que se puede restringir para que sean
consideradas iguales es el nmero total de categoras de fila activas menos 1.
Utilice la sintaxis para imponer restricciones de igualdad a diferentes conjuntos
de categoras. Por ejemplo, utilice la sintaxis para imponer la restriccin de que
sean consideradas iguales las categoras 1 y 2 y, por otra parte, que sean
consideradas iguales las categoras 3 y 4.
La categora es suplementaria. Las categoras suplementarias no influyen en
el anlisis pero se representan en el espacio definido por las categoras activas.
Las categoras suplementarias no juegan ningn papel en la definicin de las
dimensiones. El nmero mximo de categoras de fila suplementarias es el
nmero total de categoras de fila menos 2.

Para definir el rango de una fila en anlisis de correspondencias


Seleccione la variable de fila en el cuadro de dilogo Anlisis de correspondencias.
Pulse en Definir rango.
Introduzca los valores mnimo y mximo para las variables de fila.

17

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

Pulse en Actualizar.
Pulse en Continuar.
Si lo desea, puede especificar restricciones de igualdad entre las categoras de la variable de
fila y definir algunas categoras como suplementarias. Para cada categora que se deba
restringir o definir como suplementaria, seleccione la categora de la lista de categoras
generada por Actualizar y seleccione La categora es suplementaria o Las categoras deben ser
iguales. Para las restricciones de igualdad, se deben designar, al menos, dos categoras como
iguales.

Definir rango de columnas en Anlisis de correspondencias


Debe definir un rango para la variable de columnas. Los valores mnimo y mximo
especificados deben ser nmeros enteros. En el anlisis, se truncarn los valores de
los datos fraccionarios. Se ignorar en el anlisis cualquier valor de categora que est
fuera del rango especificado.

Inicialmente, todas las variables estarn sin restringir y activas. Puede restringir las
categoras de columna para igualarlas a otras categoras de columna o puede definir
cualquier categora de columna como suplementaria.

Las categoras deben ser iguales. Las puntuaciones de las categoras deben ser
iguales. Utilice las restricciones de igualdad si el orden obtenido para las
categoras no es el deseado o si no se corresponde con lo intuitivo. El nmero
mximo de categoras de columna al que se puede imponer la restriccin de
igualdad es el nmero total de categoras de columna activas menos 1. Utilice la
sintaxis para imponer restricciones de igualdad a diferentes conjuntos de

18

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

categoras. Por ejemplo, utilice la sintaxis para imponer la restriccin de que


sean consideradas iguales las categoras 1 y 2 y, por otra parte, que sean
consideradas iguales las categoras 3 y 4.
La categora es suplementaria. Las categoras suplementarias no influyen en el
anlisis pero se representan en el espacio definido por las categoras activas.
Las categoras suplementarias no juegan ningn papel en la definicin de las
dimensiones. El nmero mximo de categoras de columna suplementarias es el
nmero total de categoras de columna menos 2.

Para definir un rango de columnas en anlisis de correspondencias


Seleccione la variable de columna en el cuadro de dilogo Anlisis de correspondencias.
Pulse en Definir rango.
Escriba los valores mnimo y mximo para las variables de columna.
Pulse en Actualizar.
Pulse en Continuar.
Si lo desea, puede especificar restricciones de igualdad entre las categoras de la variable de
columna y definir algunas categoras como suplementarias. Para cada categora que se deba
restringir o definir como suplementaria, seleccione la categora de la lista de categoras
generada por Actualizar y seleccione La categora es suplementaria o Las categoras deben ser
iguales. Para las restricciones de igualdad, se deben designar, al menos, dos categoras como
iguales.

Anlisis de correspondencias: Modelo


El cuadro de dilogo Modelo permite especificar el nmero de dimensiones, la medida de
distancia, el mtodo de estandarizacin y el mtodo de normalizacin.

19

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

Dimensiones en la solucin. Especifique el nmero de dimensiones. En general,


seleccione el menor nmero de dimensiones que necesite para explicar la mayor parte
de la variacin. El mximo nmero de dimensiones depende del nmero de categoras
activas utilizadas en el anlisis y de las restricciones de igualdad. El mximo nmero de
dimensiones es el menor entre:

El nmero de categoras de fila activas menos el nmero de categoras de fila


con restriccin de igualdad, ms el nmero de conjuntos de categoras de fila
que se han restringido.

El nmero de categoras de columna activas menos el nmero de categoras de


columna con restriccin de igualdad, ms el nmero de conjuntos de categoras
de columna que se han restringido.

Medida de distancia. Puede seleccionar la medida de distancia entre las filas y


columnas de la tabla de correspondencias. Seleccione una de las siguientes opciones:

Chi-cuadrado. Utiliza una distancia ponderada entre los perfiles, donde la


ponderacin es la masa de las filas o de las columnas. Esta distancia es
necesaria para el anlisis de correspondencias tpico.

Eucldea. Utiliza la raz cuadrada de la suma de los cuadrados de las diferencias


entre los pares de filas y entre los pares de columnas.

Mtodo de estandarizacin. Seleccione una de las siguientes opciones:

Se eliminan las medias de filas y columnas. Se centran las filas y las columnas.
Este mtodo es necesario para el anlisis de correspondencias tpico.

Se eliminan las medias de filas. Slo se centran las filas.

Se eliminan las medias de columnas. Slo se centran las columnas.

Se igualan los totales de fila y se eliminan las medias. Antes de centrar las filas,
se igualan los mrgenes de fila.

Se igualan los totales de columna y se eliminan las medias. Antes de centrar las
columnas, se igualan los mrgenes de columna.

Mtodo de normalizacin. Seleccione una de las siguientes opciones:

20

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

Simtrico. Para cada dimensin, las puntuaciones de fila son la media


ponderada de las puntuaciones de columna divididas por el valor propio
coincidente y las puntuaciones de columna son la media ponderada de las
puntuaciones de fila divididas por el valor propio coincidente. Utilice este mtodo
si desea examinar las diferencias o similaridades entre las categoras de las dos
variables.

Principal. Las distancias entre los puntos de fila y los puntos de columna son
aproximaciones de las distancias en la tabla de correspondencias de acuerdo
con la medida de distancia seleccionada. Utilice este mtodo si desea examinar
las diferencias entre las categoras de una o de ambas variables en lugar de las
diferencias entre las dos variables.

Principal por fila. Las distancias entre los puntos de fila son aproximaciones de
las distancias en la tabla de correspondencias de acuerdo con la medida de
distancia seleccionada. Las puntuaciones de fila son la media ponderada de las
puntuaciones de columna. Utilice este mtodo si desea examinar las diferencias
o similaridades entre las categoras de la variable de filas.

Principal por columna. Las distancias entre los puntos de columna son
aproximaciones de las distancias en la tabla de correspondencias de acuerdo
con la medida de distancia seleccionada. Las puntuaciones de columna son la
media ponderada de las puntuaciones de fila. Utilice este mtodo si desea
examinar las diferencias o similaridades entre las categoras de la variable de
columnas.

Personalizado. Debe especificar un valor entre 1 y 1. El valor 1 corresponde


a Principal por columna. El valor 1 corresponde a Principal por fila. El valor 0
corresponde a simtrico. Todos los dems valores dispersan la inercia entre las
puntuaciones de columna y de fila en diferentes grados. Este mtodo es til para
generar diagramas de dispersin biespaciales a medida.

Para especificar el modelo en anlisis de correspondencias


Elija en los mens:
Analizar
Reduccin de datos
Anlisis de correspondencias...

21

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

En el cuadro de dilogo Anlisis de correspondencias, pulse en Modelo.

Anlisis de correspondencias: Estadsticos


El cuadro de dilogo Estadsticos permite especificar los resultados numricos
producidos.

Tabla de correspondencias. Es la tabla de contingencia de las variables de entrada


con los totales marginales de fila y columna.
Inspeccin de los puntos de fila. Para cada categora de fila, las puntuaciones, la
masa, la inercia, la contribucin a la inercia de la dimensin y la contribucin de la
dimensin a la inercia del punto.
Inspeccin de los puntos de columna. Para cada categora de columna, las
puntuaciones, la masa, la inercia, la contribucin a la inercia de la dimensin y la
contribucin de la dimensin a la inercia del punto.
Perfiles de fila. Para cada categora de fila, la distribucin a travs de las categoras
de la variable de columna.
Perfiles de col. Para cada categora de columna, la distribucin a travs de las
categoras de la variable de fila.
Permutaciones de la tabla de correspondencias. La tabla de correspondencias
reorganizada de tal manera que las filas y las columnas estn en orden ascendente de
acuerdo con las puntuaciones en la primera dimensin, Si lo desea, puede especificar
el nmero de la dimensin mxima para el que se generarn las tablas permutadas. Se
generar una tabla permutada para cada dimensin desde 1 hasta el nmero
especificado.
Estadsticos de confianza para puntos de fila. Incluye la desviacin tpica y las
correlaciones para todos los puntos de fila no suplementarios.
Estadsticos de confianza para puntos de columna. Incluye la desviacin tpica y las
correlaciones para todos los puntos de columna no suplementarios.

22

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

Para seleccionar estadsticos en anlisis de correspondencias


Elija en los mens:
Analizar
Reduccin de datos
Anlisis de correspondencias...
En el cuadro de dilogo Anlisis de correspondencias, pulse en Estadsticos.

Anlisis de correspondencias: Grficos


El cuadro de dilogo Grficos permite especificar qu grficos se van a generar.

Diagramas de dispersin. Produce una matriz de todos los grficos por parejas de las
dimensiones. Los diagramas de dispersin disponibles incluyen:

Diagrama de dispersin biespacial. Produce una matriz de diagramas


conjuntos de los puntos de fila y de columna. Si est seleccionada la
normalizacin principal, el diagrama de dispersin biespacial no estar
disponible.
Puntos de fila. Produce una matriz de diagramas de los puntos de fila.
Puntos de columna. Produce una matriz de diagramas de los puntos de
columna.

23

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

Si lo desea, puede especificar el nmero de caracteres de etiqueta de valor que se va a


utilizar al etiquetar los puntos. Este valor debe ser un entero no negativo menor o igual
que 20.
Grfico de lneas. Produce un grfico para cada dimensin de la variable
seleccionada. Los grficos de lneas disponibles incluyen:

Categoras de fila transformadas. Produce un grfico de los valores originales


para las categoras de fila frente a las puntuaciones de fila correspondientes.
Categoras de columna transformadas. Produce un grfico de los valores
originales para las categoras de columna frente a las puntuaciones de columna
correspondientes.

Si lo desea, puede especificar el nmero de caracteres de etiqueta de valor que se va a


utilizar al etiquetar los ejes de categoras. Este valor debe ser un entero no negativo
menor o igual que 20.
Dimensiones del grfico. Permite controlar las dimensiones que se muestran en los
resultados.

Muestra todas las dimensiones de la solucin. Todas las dimensiones de la


solucin se muestran en un diagrama de dispersin matricial.
Restringe el nmero de dimensiones. Las dimensiones mostradas se
restringen a los pares representados. Si restringe las dimensiones, deber
seleccionar las dimensiones menor y mayor que se van a representar. La
dimensin menor puede variar desde 1 hasta el nmero de dimensiones de la
solucin menos 1 y se representa respecto a las dimensiones mayores. El valor
de la dimensin mayor puede oscilar variar desde 2 hasta el nmero de
dimensiones de la solucin e indica la dimensin mayor que se utilizar al
representar los pares de dimensiones. Esta especificacin se aplica a todos los
grficos multidimensionales solicitados.

Para crear grficos en anlisis de correspondencias


Elija en los mens:
Analizar
Reduccin de datos
Anlisis de correspondencias...
En el cuadro de dilogo Anlisis de correspondencias, pulse en Grficos.

Funciones adicionales del comando CORRESPONDENCE


Se puede personalizar el anlisis de correspondencias si se pegan las selecciones en
una ventana de sintaxis y se edita la sintaxis del comando CORRESPONDENCE
resultante. El lenguaje de comandos de SPSS tambin permite:

24

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

Especificar datos tabulares como entrada en lugar de utilizar datos por caso
(mediante el subcomando TABLE = ALL).
Especificar el nmero de caracteres de etiqueta de valor que se utilizan al
etiquetar los puntos para cada tipo de diagrama de dispersin matricial o
diagrama de dispersin biespacial matricial (mediante el subcomando PLOT).
Especificar el nmero de caracteres de etiqueta de valor que se utilizan al
etiquetar los puntos para cada tipo de grfico de lneas (mediante el
subcomando PLOT).
Escribir una matriz de puntuaciones de fila y de columna en un archivo de datos
matriciales de SPSS (mediante el subcomando OUTFILE).
Escribir una matriz de estadsticos de confianza (varianzas y covarianzas) para
los valores propios y las puntuaciones en un archivo de datos matriciales
(mediante el subcomando OUTFILE).
Especificar varios conjuntos de categoras para igualar (mediante el
subcomando EQUAL).

EJEMPLO DE ANALISIS DE CORRESPONDECIAS SIMPLES

25

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

Partimos de los datos recogidos en una encuesta realizada a 105 personas. El


cuestionario preguntaba por las caractersticas principales asociadas a una serie de
productos de consumo muy habitual.
La finalidad del estudio es identificar con qu caractersticas se asocian los distintos
productos para posesionarlos en funcin de su aceptabilidad. Tambin se busca
encontrar asociaciones entre productos en virtud de la valoracin de sus
caractersticas por los encuestados.
En el cuestionario se consideraron 12 productos, y para cada uno de ellos se
presentaron 12 caractersticas, pidiendo al encuestado que reflejara para cada
producto las caractersticas que consideraba adecuadas al mismo. Los resultados
obtenidos se presentan en la siguiente tabla de correspondencias.
CARACTERSTICA
PRODUCTO

MODERNO AMIGABLE SOLIDARIO JUVENIL EXPORTABLE ELEGANTE CONFIABLE CREATIVO ECONMICO DIVERTIDO CLSI

LEVIS

56

LOIS

31

58

BENNETTON

35

25

59

31

ZARA

52

23

45

OPEL

12

14

VOLKSWAGEN

27

SEAT

18

19

AUDI

35

COCACOLA

32

41

KAS

19

25

PEPSICOLA

31

19

13

51

74

31

26

17

11

17

61

21

38

29

30

16

18

40

23

23

15

56

29

47

21

27

22

19

16

56

64

55

16

23

50

81

19

12

36

10

25

38

49

11

10

20

18

21

13

10

17

13

65

12

15

29

25

24

50

12

22

44

35

19

31

35

16

32

23

13

13

26

21

13

CASERA

19

16

37

53

SUPLEMENTO

44

59

28

55

20

24

37

30

33

49

19

La ltima fila de la tabla de datos representa una categora suplementaria


introducida en el cuestionario y que no se considerar activa en el anlisis.
Como buscamos asociaciones y dependencias entre las categoras de dos variables
cualitativas,

podemos

asociar

nuestro

problema

con

un

anlisis

de

correspondencias simples. Para llevarlo a cabo, comenzaremos introduciendo los


datos como se muestra en la figura E1.1 en la cual aparecen los cdigos de los
productos y las caractersticas, en cambio si visualizamos sus etiquetas la base
podra apreciarse como en la figura E1.2.

26

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

Figura E1.1

Figura E1.2

27

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

El siguiente paso es ponderar los casos por las frecuencias absolutas. Para ello se
elige en el men del SPSS Datos Ponderar _ casos tal como aparece en las figuras
E1.3 y E1.4 y se pulsa Aceptar .

Figura E1.3

Figura E1.4

28

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

Para realizar un anlisis de correspondencias simples, elija en los mens


Analizar Re duccin _ de _ datos Anlisis _ de _ correspondencias como se muestra
en la figura E1.5 y seleccione las variables y las especificaciones para el anlisis,
como aparece en la figura E1.6.

Figura E1.5

Figura E1.6

29

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

Previamente hemos debido cargar la base de datos

corresps

mediante

Archivo Abrir Datos . Esta base contiene los datos sobre determinados

productos del mercado y las variables a analizar son la Marca del Producto
(Producto) y sus caractersticas (Caracterstica). En nuestro caso hemos introducido
una categora suplementaria de nombre Suplemento para la variable Producto.
En cuanto a los datos, las variables categricas que se van ha analizar se
encuentran escaladas a nivel nominal. Para los datos agregados o para una medida
de correspondencia distinta de frecuencias, utilice una variable de ponderacin con
valores de similaridad positivos. De manera alternativa, para datos tabulares, utilice
la sintaxis para leer la tabla.
En cuanto a los supuestos, el mximo nmero de dimensiones utlizado en el
procedimiento depende del nmero de categoras activas de fila y de columna y del
nmero de restricciones de igualdad. Si no se utilizan criterios de igualdad y todas
las categoras son activas, la dimensionalidad mxima es igual al nmero de
categoras de la variable con menos categoras menos uno. Por ejemplo, Si una
variable dispone de cinco categoras y la otra de cuatro, el nmero mximo de
dimensiones es tres.
Las categoras suplementarias no son activas. Por ejemplo, si una variable dispone
de dispone de 5 categoras, dos de las cuales son suplementarias, y la otra variable
dispone de 4 categoras, el nmero mximo de dimensiones es 2.
En los campos Fila y Columna de la figura E1.6 se introduce las dos variables a
cruzar en la tabla de contingencia. En los botones Definir rango un rango para la
variables de Fila (Fig. E1.7) y columnas (Fig. E1.8). Los valores mnimo y mximo
deben ser nmeros enteros. En el anlisis se truncaran los valores de los datos
fraccionarios. Se ignorar en el anlisis cualquier valor de categora que est fuera
del rango especificado. Inicialmente todas las variables estarn sin restringir y
activas. Se puede restringir las categoras de fila para igualarlas a otras categoras
de fila (campo Restricciones para las categoras) o puede definir cualquier categora de
fila como suplementaria. Las categoras deben ser iguales es una restriccin que indica
que las puntuaciones de las categoras deben ser iguales. Utilice las restricciones
de igualdad si el orden obtenido para las categoras no es el deseado o si no se
corresponde con lo intuitivo. El mximo nmero de categoras de fila que se puede

30

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

restringir para que sean consideradas iguales es el nmero total de categoras de


fila activas menos uno.
La categora es suplementaria, es una restriccin que indica que las categoras
suplementarias no influyen en el anlisis pero se representan en el espacio definido
por las categoras activas. Las categoras suplementarias no juegan ningn papel
en la definicin de las dimensiones. El nmero mximo de categoras de fila
suplementaria es el nmero total de categoras de fila menos 2.
Al pulsar Continuar en la figura E1.8 ya tenemos definidas las variables y sus
categoras.

Fig. E1.7

31

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

Fig. E1.8

El botn Modelo de la figura E1.9 nos lleva al cuadro de dilogo Modelo (Figura
E1.10) que permite especificar el nmero de dimensiones, a medida de la distancia,
el mtodo de estandarizacin y el mtodo de normalizacin.

Figura E1.9

32

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

Figura E1.10
En la opcin dimensiones en la solucin especifique el nmero de dimensiones. En
general, seleccione el menor nmero de dimensiones que necesite para explicar la
mayor parte de la variacin. El mximo nmero de dimensiones depende del
nmero de categoras activas utilizadas en el anlisis y de las restricciones de
igualdad. El mximo nmero de dimensiones es el menor entre el nmero de las
categoras de fila activas menos el nmero de categoras de fila con restriccin de
igualdad, ms el nmero de conjuntos de categoras de fila que se han restringido y
el nmero de categoras de columna activas menos el nmero de categoras de
columna con restriccin de igualdad, ms el nmero de conjuntos de categoras de
columna que se han restringido.
En el cuadro Medida de distancia puede seleccionar la media de distancia entre las
filas y columnas de la tabla de correspondencias. Seleccione Chi-cuadrado (utiliza
una distancia ponderada entre los perfiles, donde la ponderacin es la masa de las
filas o de las columnas siendo una distancia necesaria para el anlisis de
correspondencias tpico) o Eucldea (utiliza la raz cuadrada de la suma de los
cuadrados de las diferencias entre los pares de filas y entre los pares de columnas).

33

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

En el cuadro Mtodo de estandarizacin seleccione la opcin Se eliminan las medias de


filas y columnas para centrar las filas y las columnas (este mtodo es necesario para

el anlisis de correspondencias tpico), seleccione Se eliminan las medias de filas slo


para centrar las filas, seleccione Se eliminan las medias de columnas slo para centrar
las columnas, seleccione Se igualan los totales de fila y se eliminan las medias para
igualar los mrgenes de fila antes de centrar las filas. Seleccione Se igualan los
totales de columnas y se eliminan las medias para igualar los mrgenes de columna

antes de centrar las columnas.


En el cuadro Mtodo de normalizacin seleccione una de las siguientes opciones:

Simtrico: Para cada dimensin, las puntuaciones de fila son la media ponderada de

las puntuaciones de columnas divididas por el valor propio coincidente y las


puntuaciones de columna son la media ponderada de las puntuaciones de fila
divididas por el valor propio coincidente. Utilice este mtodo si desea examinar las
diferencias o similaridades entre las categoras de las dos variables.

Principal: Las distancias entre los puntos de fila y los puntos de columna son

aproximaciones de las distancias en la tabla de correspondencias de acuerdo con la


medida de distancia seleccionada. Utilice este mtodo si desea examinar las
diferencias entre las categoras de una o de ambas variables en lugar de las
diferencias entre dos variables.

Principal por fila: Las distancias entre los puntos de fila son aproximaciones de las

distancias en la tabla de correspondencias de acuerdo con la medida de distancia


seleccionada. Las puntuaciones de fila son la media ponderada de las puntuaciones
de columna. Utilice este mtodo si desea examinar las diferencias o similaridades
entre las categoras de la variable de filas.

Principal por columna: Las distancias entre los puntos de columna son

aproximaciones de las distancias en la tabla de correspondencias de acuerdo con la


medida de distancia seleccionada. Las puntuaciones de columna son la media
ponderada de las puntuaciones de fila. Utilice este mtodo si desea examinar las
diferencias o similaridades entre las categoras de la variable de columnas.

34

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

Personalizado: Debe especificar un valor entre -1 y 1. El valor -1 corresponde a


Principal por columna. El valor 1 corresponde a Principal por fila. El valor 0

corresponde a Simtrico. Todos los dems valores dispersan la inercia entre las
puntuaciones de columna y de fila en diferentes grados. Este mtodo es til para
generar diagramas de dispersin biespaciales a medida.
El botn Estadsticos de la figura E1.9 nos lleva al cuadro de dilogo Estadsticos
(E1.11), que permite especificar los resultados numricos producidos. Las opciones
posibles son: Tabla de correspondencias, que ofrece la tabla de contingencia de las
variables de entrada con los totales marginales de fila y columna; Inspeccin de los
puntos de fila, que ofrece para categora de fila las puntuaciones, la masa, la inercia, la

contribucin a la inercia de la dimensin y la contribucin de la dimensin de la inercia


del punto; Inspeccin de los puntos de columna, que ofrece para categora de columna de
puntuaciones, la masa, la inercia, la contribucin a la inercia de la dimensin y la
contribucin de la dimensin a la inercia del punto; Perfiles de fila, que ofrece para cada
categora de fila la distribucin a travs de las categoras de la variable de columna;
Perfiles de col., que ofrece para cada categora de columna la distribucin a travs de

las categoras de la variable de fila y Permutaciones de la tabla de correspondencias, que


ofrece la tabla de correspondencias reorganizada de tal manera que las filas y las
columnas estn en orden ascendente de acuerdo con las puntuaciones en la primera
dimensin.

Si lo desea, puede especificar el nmero de la dimensin mxima para el que se


generarn las tablas permutadas. Se generar una tabla permutada para cada
dimensin desde 1 hasta el nmero especificado. La opcin Estadsticos de confianza
para puntos de fila incluye la desviacin tpica y las correlaciones para todos los puntos

de fila no suplementarios y la opcin Estadsticos de confianza para puntos de columna


incluye la desviacin tpica y las correlaciones para todos los puntos de columna no
suplementarios.

35

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

Figura E1.11

36

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

Figura E1.12
El botn Grficos de la figura N E1.9 nos lleva al cuadro de dilogo Grficos de la
figura E1.12 que permite especificar que grficos se van a generar. La opcin
Diagramas de dispersin produce una matriz de todos los grficos por parejas de las

dimensiones.
Los diagramas de dispersin disponibles incluyen: Diagramas de dispersin
biespacial (produce una matriz de diagramas conjuntos de los puntos de fila y de

columna y si est seleccionada la normalizacin principal, el diagrama de dispersin


biespacial no estar disponible), Puntos de fila (produce una matriz de diagramas de los
puntos de fila), Puntos de columna (produce una matriz de diagramas de los puntos de
columna). Si lo desea, puede especificar el nmero de caracteres de etiqueta de valor
que se va a utilizar al etiquetar los puntos. Este valor debe ser un entero no negativo
menor o igual que 20.
La opcin Grfico de lneas produce un grfico para cada dimensin de la variable
seleccionada. Los grficos de lneas disponibles incluyen: Categoras de fila
transformadas (produce un grfico de los valores originales para las categoras de fila

frente a las puntuaciones de fila correspondientes) y Categoras de columna transformadas


(produce un grfico de los valores originales para las categoras de columna frente a
las puntuaciones de columna correspondientes). Si lo desea, puede especificar el
nmero de caracteres de etiqueta de valor que se va a utilizar al etiquetar los ejes de
categoras. Este valor debe ser un entero no negativo menor o igual a 20.
En todas la figuras el botn Restablecer permite restablecer todas las opciones
por efecto del sistema y elimina del cuadro de dilogo todas las asignaciones hechas
con las variables.
Una vez elegidas las especificaciones, se pulsa el botn Aceptar en la figura
E1.9 para obtener los resultados del anlisis de correspondencias segn se muestra en
la Figura E1.13. En la parte izquierda de la Figura podemos ir

seleccionando los

distintos tipos de resultados haciendo clic sobre ellos. Tambin se ven los resultados
desplazndose a los largo de la pantalla.

37

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

En las figuras E1.14 a E1.17 se presentan varias salidas tabulares de entre las
mltiples que ofrece el procedimiento y en las figuras E1.18 a E1.20 se presentan
varias salidas grficas de entre las mltiples que ofrece el procedimiento.

La figura E1.13 muestra la tabla de contingencia para las dos variables con sus
marginales. La figura E1.14 muestra los perfiles de la fila y columna, que son las
proporciones en cada fila y columna de cada celda basadas en los totales marginales.
Los grficos de puntos fila y columna de las figuras E1.18 a E1.20 representan estas
proporciones para la localizacin geomtrica de los puntos.

La figura E1.15 muestra un cuadro resumen con la solucin factorial que


representa la relacin entre las variables fila y columna en tan pocas dimensiones
como es posible. En nuestro caso las dos primeras dimensiones explican un 66,4 de la
inercia total de la nube de puntos. La primera dimensin presenta un valor propio

de valor 0,403 (inercia = = 0,4032 = 0,163), que expresada en relacin a la inercia total
de la nube 0,395, presenta un 41,2%. La segunda dimensin presenta una inercia de
0,100, lo que supone un 25,2% de la inercia total de la nube, lo que la hace menos
importante que la primera. Los valores propios pueden interpretarse como la
correlacin entre las puntuaciones de filas y columnas. Para cada dimensin, el
cuadrado del valor propio es igual a la inercia y por tanto es otra medida de la
importancia de esa dimensin. Como los dos primeros ejes explican slo el 66,4% de la
inercia total de la nube, podra ser conveniente considerar tambin el tercero para
alcanzar el 81,2%(el 90,4% con el cuadro).
En la figura E1.15 tambin aparece el valor del estadstico Chi-cuadrado con un pvalor menor que 0,01, lo que nos lleva a rechazar la hiptesis nula de independencia entre
las dos variables al 99%. Para los dos ejes retenidos tambin se ve su desviacin tpica y el
coeficiente de correlacin entre ellos.

En le examen de los puntos fila y columna (Figuras E1.16 y E1.17) se ofrecen las
contribuciones a la inercia total de cada punto fila y columna. Los puntos fila y columna que

38

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

contribuyen sustancialmente a la inercia de una dimensin son importantes para esa dimensin.
La primera columna de las tablas de examen presenta las etiquetas de las modalidades de las
variables. La segunda columna presenta las masas (frecuencia marginal relativa). Las dos
columnas siguientes presentan las coordenadas de cada punto en los dos factores retenidos
(puntuaciones en la dimensin). La columna siguiente muestra inercia de cada punto. Las cuatro
columnas siguientes presentan las contribuciones absolutas y relativas a los ejes retenidos. La
ltima columna presenta la calidad de la presentacin en el subespacio considerado (plano de los
dos primeros ejes).
A la hora de interpretar los ejes factoriales hay que determinar qu puntos son los que
generan buscando aquellas filas y columnas que presenten contribuciones absolutas ms
importantes. Las modalidades de las variables mejor representadas en cada eje se determinan a
travs de las contribuciones relativas.

Figura E1.13

39

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

Figura E1.14

Inercia
acumulada de las

Figura E1.15

33.9%

40

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

46.6%

Figura E1.16

29.3%

Figura E1.17

41

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

De la observacin de las tablas de las figuras E1.16 y E1.17 y los grficos de las figuras
E1.18 a E1.20, se infiere que el Primer eje factorial viene generado por la oposicin de las
caractersticas elegantes y confiables, que se sitan en el extremo negativo (figura E1.19) y que
contribuyen conjuntamente a un 50,3% de la inercia explicada para el primer eje, frente a los
tributos amigable, divertida y juvenil, situados en el extremo positivo y que aportan el 26,9% de
la inercia de eje (figura E1.17).

En cuanto a los productos, un 68,6% de la inercia procede de Audi, Volkswagen y Opel


(situadas en el extremo negativo segn las figuras E1.18 y E1.20), frente a las marcas Kas,
Pepsicola y Lois, situadas en el extremo positivo y que contribuyen conjuntamente con un 21,6%
de la inercia del eje (figura E1.16).

En cuanto a los productos y caractersticas que mejor estn representados sobre este primer
eje factorial, que sern las de contribuciones relativas ms elevadas, se observa que se corrobora
lo expuesto en los prrafos anteriores. Los productos ms importantes son Audi (94,5%),
Volkswagen (88,7%), Kas (81,5%), Pepsicola (59,2%) y Opel (51,6%). Las caractersticas ms
importantes son: confiable (85,8%), elegante (80,8%), divertido (78%), y amigable (73%).
Este primer eje factorial identifica conceptos ms serios (elegancia, fiabilidad, etc.) con
los refrescos.
En cuanto al segundo eje factorial

observamos que las caractersticas econmico y

clsico se sitan en el extremo negativo y contribuyen conjuntamente a un 60,4% de la inercia


del eje, frente a las caractersticas solidario y exportable, que se sitan en el extremo positivo y
aportan un 29,3% de la inercia del eje. En cuanto a los productos, destacan por su contribucin
negativa Casera y Seat (46,6% entre ambas), y por su contribucin positiva Levis y Bennetton
(33,9% conjuntamente), que tienen las mayores contribuciones absolutas. Los puntos que mejor
estn representados en este segundo eje factorial corresponden a los productos Seat (63,8%),
Casera (56,7) y Bennetton (46,6%) y a las caractersticas econmico (67,7%), creativo (48,3%),
exterior (47,2%) y clsico (49,5%). Por tanto, este segundo eje factorial identifica productos
nacionales (Casera, Seat, etc.) con caractersticas como clsico y econmico. Por otro lado,
asocia los productos de ropa Bennetton con caractersticas como solidario, exterior o creativo.

42

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

Puntos de fila para PRODUCTO

Simtrica Normalizacin

1,0

BENNETTON
LEVIS

Dimensin 2

0,5

PEPSICOLA
VOLKSWAGEN

0,0

COCACOLA

LOIS

AUDI
SUPLEMENTO

KAS

ZARA

OPEL
-0,5

SEAT

-1,0
CASERA
-1,5
-1,5

-1,0

-0,5

0,0

0,5

1,0

Dimensin 1

Figura E1.18

43

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

Puntos de columna para CARACTERSTICA

Simtrica Normalizacin
SOLIDARIO

1,0
EXPORTABLE

Dimensin 2

0,5

CREATIVOJUVENIL
MODERNO DIVERTIDO

0,0

ELEGANTE
CONFIABLE

DIFERENTE
AMIGABLE

-0,5
CLSICO
-1,0

ECONMICO

-1,5
-1,5

-1,0

-0,5

0,0

0,5

1,0

Dimensin 1

Figura E1.19

44

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

Puntos de columna y de fila

Simtrica Normalizacin
SOLIDARIO

1,0

CARACTERSTICA
PRODUCTO

BENNETTON

Dimensin 2

0,5

0,0

CREATIVO
PEPSICOLA
JUVENIL
MODERNO
DIVERTIDO
COCACOLA
VOLKSWAGENSUPLEMENTO LOIS
ELEGANTE
CONFIABLE
DIFERENTE
KAS
AUDI
AMIGABLE
ZARA
OPEL
EXPORTABLELEVIS

-0,5
CLSICO

SEAT

-1,0
ECONMICO
CASERA
-1,5
-1,5

-1,0

-0,5

0,0

0,5

1,0

Dimensin 1

Figura E1.20

En cuanto al primer plano factorial, que forman los dos primeros ejes factoriales, estn
bien representados casi todas las marcas (salvo acaso Zara y Lois) Destacando Audi,
Volstwaguen, Kas, Pepsicola y Seat (calidad de representacin superior al 75%). Las
caractersticas estn tambin bien representadas en el primer plano factorial (salvo acaso
diferente y moderno) destacando confiable, econmico, elegante, divertido y amigable
(representacin superior al 75%)

Si observamos la situacin de las modalidades sobre el plano sobre el plano (figura E1.20)
vemos que los productos extranjeros de automviles (Audi, Volkswagen y Opel) Se asocian a las

45

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

caractersticas de fiabilidad y elegancia. Casera y Seat se caracterizan por ser productos clsicos
y econmicos. Las marcas de refrescos (Kas y Pepsicola) se identifican con los conceptos de
diversin, amistad o juventud. Esta zona tambin pertenece la modalidad suplementaria y tenda
estas mismas caractersticas. Los productos de moda Benetton y Levis se asocian con
caractersticas como la creatividad, la solidaridad

o el carcter internacional (exterior). El

producto Cocacola se asocia con caractersticas propias de los dos grupos antes citados.

46

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

ANLISIS DE CORRESPONDENCIAS MLTIPLES


El anlisis de correspondencias mltiple cuantifica los datos nominales (categricos)
mediante la asignacin de valores numricos a los casos (objetos) y a las categoras,
de manera que los objetos de la misma categora estn cerca los unos de los otros y
los objetos de categoras diferentes estn alejados los unos de los otros. Cada objeto
se encuentra lo ms cerca posible de los puntos de categora para las categoras que
se aplican a dicho objeto. De esta manera, las categoras dividen los objetos en
subgrupos homogneos. Las variables se consideran homogneas cuando clasifican
objetos de las mismas categoras en los mismos subgrupos.
Por ejemplo, el anlisis de correspondencias mltiple se puede utilizar para representar
grficamente la relacin entre la categora laboral, la clasificacin tnica y el sexo.
Puede que encontremos que la clasificacin tnica y el sexo son capaces de
discriminar entre las personas, pero no as la categora laboral. Tambin puede que
encontremos que las categoras Latino y Afro-americano son similares entre s.
Estadsticos y grficos. Puntuaciones de objetos, medidas de discriminacin,
historial de iteraciones, correlaciones de las variables originales y transformadas,
cuantificaciones de categoras, estadsticos descriptivos, grficos de puntos de objetos,
grficos de dispersin biespacial, grficos de categoras, grficos de categoras
conjuntas, grficos de transformacin y grficos de medidas de discriminacin.
Datos. Los valores de las variables de cadena se convierten en enteros positivos por
orden alfabtico ascendente. Los valores perdidos definidos por el usuario, los valores
perdidos del sistema y los valores menores que 1 se consideran valores perdidos; se
puede aadir una constante o recodificar las variables con valores inferiores a 1 para
evitar que se pierdan los mismos.
Supuestos. Todas las variables tienen un nivel de escalamiento nominal mltiple. Los
datos deben contener al menos tres casos vlidos. El anlisis se basa en datos enteros
positivos. La opcin de discretizacin categorizar de forma automtica una variable

47

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

con valores fraccionarios, agrupando sus valores en categoras con una distribucin
casi normal y convertir de forma automtica los valores de las variables de cadena en
enteros positivos. Se pueden especificar otros esquemas de discretizacin.
Procedimientos

relacionados.

Para

dos

variables,

el

anlisis

de

correspondencias mltiple es anlogo al anlisis de correspondencias. Si piensa que


las variables poseen propiedades ordinales o numricas, se debe utilizar el anlisis de
componentes principales categrico. Si hay conjuntos de variables que son de inters,
se debe utilizar el anlisis de correlacin cannica no lineal.

Para obtener un anlisis de correspondencias mltiple


Elija en los mens:
Analizar
Reduccin de datos
Escalamiento ptimo...

Mostrar detalles

Seleccione: Todas las variables son nominales mltiples.


Seleccione Un conjunto.

48

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

Pulse en Definir.
Mostrar detalles

Seleccione al menos dos variables de anlisis y especifique el nmero de dimensiones en la


solucin.
Pulse en Aceptar.

Si lo desea, puede especificar variables suplementarias, que sern ajustadas sobre la


solucin encontrada, o variables de etiqueta para los grficos.
Este procedimiento pega la MULTIPLE CORRESPONDENCE sintaxis de comandos.

49

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

Para estudiar cmo funciona el anlisis de correspondencia mltiple, se usar los datos
de Hartigan1. Este conjunto de datos contiene informacin sobre las caractersticas de
los pernos, clavos, tornillos, y tacos. El siguiente cuadro muestra el nombre de las
variables, etiquetas de las variables, y el valor asignado a las categoras de cada
variable en el conjunto de datos.
Nombre de
variable

Etiqueta de
Valor de los niveles
Variable

Rosca

Rosca
Forma de la
cabeza
Muesca de
la cabeza
Forma de
punta
Cobre
Longitud en
milmetros

Cabeza
Muesca
Punta
Cobre
Long

Objeto

Objeto

1= No Rosca, 2=Si Rosca


1=Plana, 2=Cono, 3=Redonda, 4=Copa, 5=Cilinfro
1=Ranura, 2=Ninguna, 3=estrella
1=Plana, 2=Punta
1=No Cobre, 2=Si Cobre
1=13mm, 2=25mm, 3=38mm, 4=51mm, 5=64mm
1=perno1, 2=perno2, 3=perno3, 4=perno4, 5=perno5, 6=perno6, 7=clavo1,
8=clavo2, 9=Clavo3, 10=Clavo4, 11=clavo5, 12=clavo6, 13=clavo7,
14=clavo8, 15=clavoc, 16=Tornillo1, 17=tornillo2, 18=tornillo3, 19=tornillo4,
20=tornillo5, 21=tornilloc, 22=taco, 23=taco1, 24=taco2

Para obtener un anlisis de correspondencias mltiples, desde a barra de mens,


escoja: Analizar reduccin de datos Escalamiento ptimo

Hartigan, J.A. 1975. Clustering Algorithms. New Cork: John Wiley and Sons.

50

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

Seleccione Todas las


variables son nominales
mltiples.

Seleccione
Conjunto.

Un

Pulse en Definir.

Si lo desea, puede especificar variables suplementarias, que sern ajustadas sobre la solucin
encontrada, o variables de etiqueta para los grficos.
Select Thread through Length in half-inches as analysis variables.
Select object as a labeling variable.

51

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

Click Object in the Plots group.

Seleccione a menos
dos
variables
de
anlisis (pudiendo ser
todas) y trasldelo al
lado derecho en el
grupo
Anlisis
de
variables
Seleccione objeto como
una variable de etiquetado.
Haga Click en Objeto en
el grupo Grficos
Pulse en Aceptar.

Select thread through object as labeling variables.


Click Continue, and then click Variable in the Plots group of the Multiple Correspondence
Analysis dialog box.

En Etiquetar Objetos, elija


Variable.
Traslade las variables que
aparecen en el recuadro
centra Disponibles al
recuadro Seleccionadas de
la derecha.
Haga clic en continuar
Haga clic nuevamente en
Variable.

52

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

Click

Traslade todas las variables que


aparecen en el recuadro de la
izquierda al recuadro Grfico de
categoras conjuntas.
Haga click en Continuar
Finalmente hacer Click en
Aceptar en la ventana de Anlisis
de correspondencias mltiples,
con lo cual se obtienen todos los
resultados del Anlisis de
Correspondencia Mltiples.

Click

53

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

RESULTADOS OBTENIDOS

El anlisis de Homogeneidad puede calcular una solucin para varias dimensiones. El


nmero mximo de dimensiones es igual al menor entre el nmero de categoras
menos el nmero de variables con datos faltantes o el nmero de observaciones
menos uno. Sin embargo, rara vez se debe utilizar el mximo nmero de dimensiones.
Un nmero ms pequeo de dimensiones es ms fcil de interpretar, y despus de un
cierto nmero de dimensiones, la cantidad adicional de la asociacin tiene
representaciones insignificantes. En el anlisis de homogeneidad, es comn obtener
una, dos, o tres dimensiones solucin.
Resumen del modelo
Alfa de
Varianza explicada
Dimensin Cronbach Total (Autovalores) Inercia
% de la varianza
1
0.878
3.727
0.621
62.123
2
0.657
2.209
0.368
36.809
Total
5.936
0.989
Media
0.796
2.968
0.495
49.466
a
El Alfa de Cronbach Promedio est basado en los autovalores promedio.

Casi la totalidad de la variabilidad de los datos se debe a la solucin, el 62,1%


contenida en la primera dimensin y el 36,8% por la segunda.

Resumen del modelo


Varianza explicada
Alfa de
Dimensin Cronbach Total (Autovalores) Inercia
% de la varianza
1
0.878
3.727
0.621
62.123
2
0.657
2.209
0.368
36.809
Total
5.936
0.989
Media
0.796
2.968
0.495
49.466
a
El Alfa de Cronbach Promedio est basado en los autovalores promedio.

Las dos dimensiones en conjunto proporcionan una interpretacin en trminos de


distancias. Si una variable discrimina as, los objetos estarn cerca de las categoras a
las que pertenecen. Idealmente, los objetos de la misma categora estarn muy cerca
unos de otros (es decir, deben tener similares resultados), y las categoras de las

54

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

diferentes variables se acercan si pertenecen a los mismos objetos (es decir, dos
objetos que tienen los mismos resultados para una variable tambin resultaran muy
cerca unos de otros para el resto de variables en la solucin).

Dimensin
1
2
Total
Media
a

Alfa de
Cronbach
0.878
0.657
0.796

Varianza explicada
Total (Autovalores)
Inercia
% de la varianza
3.727
0.621
62.123
2.209
0.368
36.809
5.936
0.989
2.968
0.495
49.466

El Alfa de Cronbach Promedio est basado en los autovalores promedio.

Despus de examinar el resumen del modelo, debemos mirar los resultados de los
objetos. Podemos especificar la etiqueta de una o ms variables en el grfico de
puntuaciones de objeto. Cada variable de etiquetado produce una trama etiquetada con
los valores de esa variable. Vamos a echar un vistazo al grfico de puntuaciones de
las etiquetas de la variable objeto. Este es slo un caso de identificacin de la variable
y no se utiliz en ningn clculo.
La distancia de un objeto a la variacin de origen refleja el "promedio" de respuesta
patrn. Este patrn de respuesta promedio corresponde a la categora ms frecuente
para cada variable. Objetos con muchas de las caractersticas correspondientes a las
categoras ms frecuentes se encuentran cerca del origen. En cambio, los objetos de
caractersticas nicas que se encuentran lejos del origen.

Examinando el grfico, se puede ver que la primera dimensin (el eje horizontal)
discrimina los tornillos y pernos (que tienen rosca o hilo) de los clavos y tachuelas (que
no tienen rosca o hilos). Esto es fcilmente visto en el grfico los tornillos y pernos
estn en un extremo del eje horizontal y tachuelas (tacos) y clavos en la otra. En menor
medida, tambin la primera dimensin separa los tornillos (que tienen extremo plano)
de todos los dems (que tienen extremo en punta).
La segunda dimensin (el eje vertical) parece tornillo1 y clavo6 separado de todos los
otros objetos. Qu tienen en comn tornillo1 y clavo6?, sus valores de la variable
longitud, que son los objetos ms largos. Adems, tornillo1 se encuentra mucho ms

55

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

lejos del origen que los otros objetos, lo que sugiere que, en su conjunto, muchas de
las caractersticas de este objeto no son compartidos por los otros objetos.
El grfico de puntuaciones de los objetos es particularmente til para la deteccin de
valores atpicos. El tornillo1 se considera como atpico. Ms adelante podemos ver lo
que ocurre si separamos este objeto.

Antes de examinar el resto de grficos de las puntuaciones de los objetos, vamos a ver
si las medidas de discriminacin estn de acuerdo con lo que hemos dicho hasta
ahora. Para cada variable, una medida de discriminacin, que puede considerarse
como un componente de la carga al cuadrado, se calcula para cada dimensin. Esta
medida es tambin la diferencia de las variables cuantificadas en esa dimensin. Tiene
un valor mximo de 1, que se logra si los objetos se dividen en las puntuaciones de los

56

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

grupos mutuamente excluyentes y las puntuaciones de todos los objetos dentro de una
categora son idnticos. (Nota: Esta medida podra tener un valor superior a 1 si faltan
datos.)
Las medidas grandes de discriminacin corresponden a una gran dispersin entre las
categoras de la variable y, por consiguiente, indican un alto grado de discriminacin
entre las categoras de una variable a lo largo de esa dimensin.
El promedio de las medidas de discriminacin para cualquier dimensin es igual al
porcentaje de variacin que represent dimensin. En consecuencia, las dimensiones
estn ordenadas segn el promedio de la discriminacin. La primera dimensin tiene la
mayor media de la discriminacin, la segunda dimensin tiene el segundo mayor
promedio de la discriminacin, y as sucesivamente, de todas las dimensiones en la
solucin.

Como se observa en el grfico de puntuaciones de objetos, El eje muestra las medidas


de discriminacin que la primera dimensin se relaciona con las variables de la rosca y
la forma del extremo o punta. Estas variables tienen grandes medidas de
discriminacin en la primera dimensin y pequeas medidas de discriminacin en la
segunda dimensin. As, para estas dos variables, las categoras estn muy separadas
repartidas a lo largo de la primera dimensin solamente.

La Longitud - milmetros tiene un gran valor en la segunda dimensin, y un pequeo


valor en la primera dimensin. Resulta que la longitud es ms cercana a la segunda
dimensin, de acuerdo con la observacin del grfico de puntuaciones de objetos, la
segunda dimensin parece separar a los objetos ms largos del resto. Muesca de la
cabeza y la forma de la forma de punta tienen valores relativamente grandes en ambas
dimensiones, lo que indica la discriminacin tanto en la primera y segunda dimensin.
La variable cobre, que se encuentra muy cerca del origen, no discrimina en absoluto en
las primeras dos dimensiones. Esto tiene sentido, ya que todos los objetos pueden ser
hechos de cobre o no hechos de cobre.

57

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

Recordemos que una medida de discriminacin es la diferencia de las variables


cuantificadas a lo largo de una dimensin particular. El grfico de las medidas de
discriminacin contiene estas diferencias, lo que indica que las variables que
discriminan a lo largo de la dimensin. Sin embargo, la misma diferencia podra
corresponder a la totalidad de las categoras que se ha diseminado o moderadamente
alejadas a la mayora de las categoras estar muy juntos, con pocas diferencias de las
categoras de este grupo. El grfico de discriminacin no pueden diferenciar entre estas
dos condiciones.

Los grficos de cuantificacin Categrica proporcionan un mtodo alternativo de


mostrar la discriminacin de las variables que pueden determinar la categora de
relaciones. En estos grficos, se muestran las coordenadas de cada categora en cada
dimensin. Por lo tanto, podemos determinar qu categoras son similares para cada
variable.

58

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

La longitud (en mm.) tiene cinco categoras, tres de las cuales se agrupan cerca de la
parte superior del grfico. Las otras dos categoras se encuentran en la mitad inferior
del grfico, con la categora 64 mm. muy lejos del grupo. La gran discriminacin de
longitud a lo largo de dimensin 2 es un resultado de esta una categora muy diferente
de las dems categoras de longitud. Del mismo modo, en la forma de punta, la
categora ESTRELLA est muy lejos de las otras categoras y el rendimiento de una
gran medida de la discriminacin a lo largo de la segunda dimensin. Estos patrones
no pueden ser ilustrados en un grfico de las medidas de discriminacin.

La propagacin de cuantificaciones de categora para una variable refleja la diferencia


y, por tanto, indica tambin la manera en que se discrimina variable en cada dimensin.
Centrndose en la dimensin 1, la rosca (o el hilo) de las categoras estn muy
alejados. Sin embargo, a lo largo de dimensin 2, las categoras de esta variable son
muy estrechas. As, la Rosca (o Hilo) discrimina mejor en la dimensin 1 que en
dimensin 2. Por el contrario, las categoras de forma de punta muy distantes se
propagan a lo largo de las dos dimensiones, lo que sugiere que esta variable discrimina
bien en ambas dimensiones.

Adems de la determinacin de las dimensiones a lo largo de una variable que


discrimina y la forma en que la variable discrimina, la categora tambin se compara la
cuantificacin parcela variable discriminacin. Una variable con categoras que estn
muy alejadas discrimina mejor que una variable con categoras que estn muy juntos.
Por ejemplo, a lo largo de la dimensin 1, las dos categoras de COBRE estn mucho
ms cerca entre s que las dos categoras de Rosca (hilo), lo que indica que la rosca de
cobre discrimina mejor a lo largo de esta dimensin. Sin embargo, a lo largo de
dimensin 2, las distancias son muy similares, lo que sugiere que estas variables
discriminan en la misma medida a lo largo de esta dimensin. El grfico de las medidas
de discriminacin discutido previamente identifica esas mismas relaciones mediante el
uso de diferencias para reflejar la propagacin de las categoras.

59

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

Un mayor conocimiento de los datos que pueden obtenerse mediante el examen de los
resultados de los grficos objeto de la etiqueta de cada variable. Idealmente, objetos
similares deben formar grupos exclusivos, y de esos grupos debera ser mucho unos
de otros.

La trama etiquetada con Rosca muestra que la primera dimensin separa SI ROSCA y
No ROSCA perfectamente. Todos los objetos con ROSCA tienen resultados negativos
objeto, mientras que todos los objetos NO ROSCADOS tienen resultados positivos.
Aunque las dos categoras no forman grupos compactos, la perfecta diferenciacin
entre las categoras que por lo general se considera un buen resultado.

60

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

La trama etiquetada con la forma de la punta, muestra que esta variable discrimina en
ambas dimensiones. El grupo de objetos con forma de punta PLANA aparecen juntos
en la esquina inferior derecha del grfico, mientras que el grupo de objetos cuya forma
de cabeza es Copa aparecen agrupados en la parte superior derecha. Los objetos con
forma de cabeza en CONO se encuentran en la parte superior izquierda. Sin embargo,
estos objetos son ms diseminada que de los otros grupos y, por lo tanto, no son tan
homogneos. Por ltimo, la forma de cabeza CILINDRICA de objetos no puede
separarse de los objetos con forma de cabeza RONDA, que se encuentran en la
esquina inferior izquierda de la parcela.

61

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

62

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

El grfico con las etiquetas de Longitud-mm. en la mitad indica que esta variable no
discrimina en la primera dimensin. Sus cuadros no tienen agrupacin cuando se
proyecte sobre una lnea horizontal. Sin embargo, Longitud-mm. en la mitad no
discriminar en la segunda dimensin. Los objetos ms cortos corresponden a
resultados positivos, y los objetos ms grandes corresponden a resultados negativos.

63

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

La trama etiquetada con cobre demuestra que esta variable tiene categoras que no se
pueden separar muy bien en la primera o segunda dimensiones. Los escores de los
objeto se encuentran ampliamente distribuidos en todo el espacio. Los objetos de cobre
no puede diferenciarse de los objetos No cobre.

64

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

REGRESIN NO LINEAL
Manuel Hurtado S.

Regresin no lineal es un mtodo para encontrar un modelo no lineal para la relacin


entre la variable dependiente y un conjunto de variables independientes. A diferencia
de la regresin lineal tradicional, que est restringida a la estimacin de modelos
lineales, la regresin no lineal puede estimar modelos con relaciones arbitrarias entre
las variables independientes y las dependientes. Esto se lleva a cabo usando
algoritmos de estimacin iterativos. Tenga en cuenta que este procedimiento no es
necesario para los modelos polinmicos simples de la forma Y = A + BX**2. Definiendo
W = X**2, obtenemos un modelo lineal simple, Y = A + BW, que se puede estimar
usando mtodos tradicionales como el procedimiento Regresin lineal.
Ejemplo. Puede pronosticarse la poblacin basndose en el tiempo Un diagrama de
dispersin muestra que parece haber una estrecha relacin entre la poblacin y el
tiempo, pero la relacin es no lineal y por eso exige la utilizacin de los mtodos de
estimacin especiales del procedimiento Regresin no lineal. Creando una ecuacin
adecuada, como la del modelo logstico de crecimiento poblacional, podemos obtener
una buena estimacin del modelo, lo que nos permitir hacer predicciones sobre la
poblacin para pocas que no se han sido medidas.
Estadsticos. Para cada iteracin: estimaciones de los parmetros y suma de
cuadrados residual. Para cada modelo: suma de cuadrados para regresin, residual,
total corregido y no corregido, estimaciones de los parmetros, errores tpicos
asintticos y matriz de correlaciones asintticas de estimaciones de los parmetros.
Consideraciones sobre los datos

65

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

Datos. Las variables dependiente e independientes deben ser cuantitativas. Las variables
categricas, como la religin, la mayora de edad o el lugar de residencia, han de recodificarse
como variables binarias (dummy) o como otro de los tipos de variables de contraste.
Supuestos. Los resultados son vlidos slo si se ha especificado una funcin que describa con
precisin la relacin entre las variables independientes y las dependientes. Adems, la eleccin
de buenos valores iniciales es muy importante. Incluso si se ha especificado la forma funcional
correcta para el modelo, si no utiliza valores iniciales adecuados, puede que su modelo no logre
converger o puede que obtenga una solucin que sea ptima localmente en vez de una que sea
ptima globalmente.
Procedimientos relacionados. Muchos modelos que en un principio parecen ser no lineales
pueden ser transformados en un modelo lineal, el cual pueda ser analizado usando el
procedimiento Regresin lineal. Si no est seguro de cul es el modelo adecuado, el
procedimiento Estimacin curvilnea puede ayudarle a identificar relaciones funcionales tiles
que estn presentes en los datos.

Para obtener un anlisis de regresin no lineal


Elija en los mens:
Analizar
Regresin
No lineal...
Seleccione una variable numrica dependiente de la lista de variables del conjunto de datos
activo.
Para construir una expresin para el modelo, introduzca la expresin en el campo
Expresin del modelo o bien pegue en el campo los componentes (variables, parmetros,
funciones).

Identifique los parmetros del modelo pulsando en Parmetros.


Un modelo segmentado (uno que adquiere diferentes formas en distintas partes de su dominio) se
debe especificar usando la lgica condicional dentro de la declaracin nica del modelo.

Lgica condicional (Regresin no lineal)


Se puede especificar un modelo segmentado utilizando la lgica condicional. Para usar
la lgica condicional dentro de la expresin del modelo o de la funcin de prdida, debe

66

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

construir la suma de una serie de trminos, uno para cada condicin. Cada trmino se
compone de una expresin lgica (entre parntesis) multiplicada por la expresin que
resultar cuando esa expresin lgica es verdadera.
Por ejemplo, considere un modelo segmentado que sea igual a 0 para X<=0, X para
0<X<1 y 1 para X>=1. La expresin para este ejemplo es:
(X<=0)*0 + (X>0 & X < 1)*X + (X>=1)*1.
Todas las expresiones lgicas entre parntesis deben ser evaluables como 1
(verdadero) o 0 (falso). As:
Si X<=0, la anterior se reduce a 1*0 + 0*X + 0*1 = 0.
Si 0<X<1, se reduce a 0*0 + 1*X + 0*1 = X.
Si X>=1, se reduce a 0*0 + 0*X + 1*1 = 1.
Se pueden construir con facilidad ejemplos ms complicados reemplazando diferentes
expresiones lgicas y expresiones de resultado. Recuerde que las desigualdades
dobles, como 0<X<1, deben escribirse como expresiones compuestas, de la forma
(X>0 & X < 1).
Se pueden utilizar variables de cadena dentro de las expresiones lgicas:
(ciudad='Madrid')*costliv + (ciudad='Guadalajara')*0.59*costliv
Esto da lugar a una expresin (el valor de la variable costliv) para los madrileos y a
otra (el 59% de ese valor) para los habitantes de Guadalajara. Las constantes de
cadena deben ir entre comillas o apstrofos, como se muestra aqu.

Regresin no lineal: Parmetros


Los parmetros son las partes del modelo que son estimadas por el procedimiento
Regresin no lineal. Los parmetros pueden ser constantes aditivas, coeficientes
multiplicativos, exponentes o valores usados para evaluar funciones. Todos los

67

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

parmetros que hayan sido definidos aparecern (con sus valores de inicio) en la lista
Parmetros del cuadro de dilogo principal.
Nombre. Debe especificarse un nombre para cada parmetro. Debe ser un nombre de
variable de SPSS vlido y debe ser el nombre utilizado en la expresin del modelo del
cuadro de dilogo principal.
Valor inicial. Permite especificar un valor de inicio para el parmetro, preferiblemente lo
ms prximo posible a la solucin final esperada. Los valores iniciales no adecuados
pueden dar como resultado un fallo de convergencia o una convergencia sobre una
solucin local (en vez de global) o fsicamente imposible.
Usar los valores iniciales del anlisis previo. Si ya se ha ejecutado una regresin no
lineal desde este cuadro de dilogo, puede seleccionar esta opcin para obtener los
valores iniciales de los parmetros a partir de sus valores en la ejecucin previa. De
esta forma podr continuar buscando cuando el algoritmo est convergiendo
lentamente. Los primeros valores iniciales seguirn apareciendo en la lista Parmetros
del cuadro de dilogo principal.
Nota: Esta seleccin persistir en este cuadro de dilogo durante el resto de la sesin.
Si cambia el modelo, asegrese de desactivarla.

Modelos comunes de regresin no lineal


La tabla que se muestra ms abajo proporciona ejemplos de la sintaxis del modelo para
muchos modelos de regresin no lineal publicados. Es probable que los modelos
seleccionados al azar no se ajusten bien a sus datos. Son necesarios valores iniciales
adecuados para los parmetros; algunos modelos requieren restricciones para llegar a
converger.
Ejemplos de sintaxis de modelo
Nombre

Expresin del modelo

Regresin asinttica

b1 + b2 *exp( b3 * x )

Regresin asinttica

b1 ( b2 *( b3 ** x ))

68

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

Nombre

Expresin del modelo

Densidad

( b1 + b2 * x )**(1/ b3 )

Gauss

b1 *(1 b3 *exp( b2 * x **2))

Gompertz

b1 *exp( b2 * exp( b3 * x ))

Johnson-Schumacher

b1 *exp( b2 / ( x + b3))

Log-modificado

( b1 + b3 * x ) ** b2

Log-logstico

b1 ln(1 + b2 * exp(b3 * x))

Ley de Metcherlich de devoluciones


decrecientes

b1 + b2 *exp( b3 * x )

Michaelis Menten

b1* x /( x + b2 )

Morgan-Mercer-Florin

( b1 * b2 + b3 * x ** b4 )/( b2 + x ** b4 )

Peal-Reed

Razn de cbicas

b1 / (1+ b2 * exp((b3 * x + b4 * x **2 + b5 *


x ** 3)))
(b1 + b2 * x + b3 * x ** 2 + b4 * x ** 3) / (b5 *
x ** 3)

Razn de cuadrticas

( b1 + b2 * x + b3 * x **2)/( b4 * x **2)

Richards

b1 / ((1 + b3 * exp(b2 * x)) ** (1 / b4))

Verhulst

b1 /(1 + b3 * exp( b2 * x ))

Von Bertalanffy

( b1 ** (1 - b4 ) - b2 * exp( -b3 * x )) ** (1/(1 b4 ))

Weibull

b1 b2 *exp( b3 * x ** b4 )

Densidad de rendimiento

(b1 + b2 * x + b3 * x **2)**(1)

Regresin no lineal: Funcin de prdida


La funcin de prdida en regresin no lineal es la funcin que es minimizada por el
algoritmo. Seleccione Suma de los residuos al cuadrado para minimizar la suma de los
residuos al cuadrado o bien Funcin de prdida definida por el usuario para minimizar
una funcin diferente.

69

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

Si selecciona Funcin de prdida definida por el usuario, debe definir la funcin de


prdida cuya suma (en todos los casos) deber minimizarse por la eleccin de los
valores de los parmetros.

La mayora de las funciones de prdida incluyen la variable especial RESID_,


que representa el residuo. La funcin de prdida por defecto Suma de los
residuos al cuadrado se podra introducir explcitamente como RESID_**2. Si
tiene que utilizar el valor pronosticado en la funcin de prdida, ste es igual a la
variable dependiente menos el residuo.

Se puede especificar una funcin de prdida condicional utilizando la lgica


condicional.

Puede escribir una expresin en el campo Funcin de prdida definida por el usuario, o
bien pegar en el campo los componentes de la expresin. Las constantes de cadena
deben ir entre comillas o apstrofos y las constantes numricas deben escribirse en
formato americano, con el punto como separador de la parte decimal.
Para definir una funcin de prdida
Elija en los mens:
Analizar
Regresin
No lineal
En el cuadro de dilogo Regresin no lineal, seleccione uno o ms parmetros y pulse en
Prdida.
Puede escribir una expresin en el campo Funcin de prdida definida por el usuario, o
bien pegar en el campo los componentes de la expresin.

Regresin no lineal: Restricciones para los parmetros


Una restriccin es una limitacin sobre los valores permitidos para un parmetro
durante la bsqueda iterativa de una solucin. Las expresiones lineales se evalan

70

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

antes de realizar un paso, de modo que se puedan utilizar restricciones lineales para
omitir los pasos que pueden provocar desbordamientos. Las expresiones no lineales se
evalan despus de realizar el paso.
Cada ecuacin o desigualdad requiere los siguientes elementos:

Una expresin que incluya al menos un parmetro del modelo. Escriba la


expresin o bien utilice el teclado, que le permita pegar nmeros, operadores o
parntesis en la expresin. Puede escribir el parmetro o parmetros requeridos
junto con el resto de la expresin o bien pegarlos de la lista de Parmetros
situada a la izquierda. No se pueden usar variables ordinarias en una restriccin.

Uno de los tres operadores lgicos <=, =, o bien >=.

Una constante numrica, con la que se compara la expresin utilizando el


operador lgico. Escriba la constante. Las constantes numricas deben
escribirse en formato americano, con el punto como separador de la parte
decimal.

Para especificar restricciones para los parmetros de la regresin no lineal


Elija en los mens:
Analizar
Regresin
No lineal

En el cuadro de dilogo Regresin no lineal, pulse en Restricciones.


Para cada restriccin, defina los siguientes elementos:

Una expresin que incluya al menos un parmetro del modelo. Escriba la expresin o
bien utilice el teclado, que le permita pegar nmeros, operadores o parntesis en la
expresin. Puede escribir el parmetro o parmetros requeridos junto con el resto de la
expresin o bien pegarlos de la lista de Parmetros situada a la izquierda. No se pueden
usar variables ordinarias en una restriccin.
Uno de los tres operadores lgicos <=, =, o bien >=.
Una constante numrica, con la que se compara la expresin utilizando el operador
lgico. Escriba la constante. Las constantes numricas deben escribirse en formato
americano, con el punto como separador de la parte decimal.

71

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

Una vez definida cada restriccin, pulse en Aadir para aadirla a la lista de restricciones.

Regresin no lineal: Guardar variables nuevas


Puede guardar una serie de variables nuevas en el archivo de datos activo. Las
opciones disponibles son: Valores pronosticados, Residuos, Derivadas y Valores de la
funcin de prdida. Estas variables se pueden utilizar en anlisis subsiguientes para
contrastar el ajuste del modelo o para identificar casos problemticos.

Valores pronosticados (Regresin no lineal, Guardar). Guarda los valores pronosticados,


con el nombre de variable pred_.
Residuos (Regresin no lineal, Guardar). Guarda los residuos, con el nombre de variable
resid.
Derivadas (Regresin no lineal, Guardar). Se guarda una derivada para cada parmetro
del modelo. Los nombres de las derivadas se construyen aadiendo como prefijo una "d."
a los primeros seis caracteres de los nombres de los parmetros.
Valores de la funcin de prdida (Regresin no lineal, Guardar). Esta opcin est
disponible si especifica su propia funcin de prdida. Se asigna el nombre de variable
loss_ a los valores de la funcin de prdida.

Para guardar variables nuevas


Elija en los mens:
Analizar
Regresin
No lineal
En el cuadro de dilogo Regresin no lineal, pulse en Guardar.

Regresin no lineal: Opciones


Este cuadro de dilogo permite controlar diversos aspectos del anlisis de regresin no
lineal:

72

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

Estimaciones bootstrap. Mtodo para la estimacin del error tpico de un estadstico


que usa muestras repetidas del conjunto original de datos. Esto se lleva a cabo
mediante muestreo (con reposicin) para obtener muchas muestras de tamao igual al
conjunto de datos original. Se estima la ecuacin no lineal para cada una de estas
muestras. A continuacin, se calcula el error tpico de cada estimacin del parmetro
como la desviacin tpica de las estimaciones creadas por el mtodo bootstrap. Se
utilizan los valores de los parmetros obtenidos a partir de los datos originales como los
valores de inicio para las estimaciones bootstrap. Tambin se denominan estimaciones
autodocimantes.
Mtodo de estimacin. Permite seleccionar un mtodo de estimacin, si esto es
posible. (Determinadas opciones de ste y otros cuadros de dilogo requieren el
algoritmo de programacin cuadrtica secuencial.) Entre las alternativas disponibles se
encuentran Programacin cuadrtica secuencial y Levenberg-Marquardt.

Programacin cuadrtica secuencial (Regresin no lineal). Est mtodo est disponible


para los modelos restringidos y los no restringidos. La programacin cuadrtica
secuencial se utiliza automticamente si especifica un modelo restringido, una funcin de
prdida definida por el usuario o el muestreo bootstrap.
Levenberg-Marquardt. Algoritmo por defecto para los modelos no restringidos. El
mtodo de Levenberg-Marquardt no est disponible si especifica un modelo restringido,
una funcin de prdida definida por el usuario, o el muestreo bootstrap (autodocimante).
Se pueden introducir nuevos valores para el N mximo de iteaciones y cambiar las
selecciones de las listas desplegables de la Convergencia de la suma de cuadrados y la
Convergencia en los parmetros.

Para especificar las opciones en regresin no lineal


Elija en los mens:
Analizar
Regresin
No lineal
En el cuadro de dilogo Regresin no lineal, pulse en Opciones.

73

Anlisis de datos con SPSS


Mdulo Avanzado

Departamento de Ciencias Exactas


Direccin de Estadstica

Regresin no lineal: Interpretacin de los resultados


Los problemas de la regresin no lineal presentan con frecuencia dificultades de clculo:

La eleccin de valores iniciales para los parmetros influye en la convergencia. Intente


elegir valores iniciales que sean razonables y, si es posible, prximos a la solucin final
esperada.
A veces, un algoritmo se ejecuta mejor que otro en un determinado problema. En el
cuadro de dilogo Opciones, seleccione el otro algoritmo si est disponible. Si especifica
una funcin de prdida o ciertos tipos de restricciones, no podr utilizar el algoritmo de
Levenberg-Marquardt.
Cuando la iteracin se detiene slo porque se ha dado el nmero mximo de iteraciones,
el modelo "final" probablemente no sea una buena solucin. Seleccione Usar los valores
iniciales del anlisis previo del cuadro de dilogo Parmetros para continuar la iteracin
o, mejor an, elija otros valores iniciales.
Los modelos que requieren la exponenciacin de o por valores de datos grandes pueden
causar desbordamientos (nmeros demasiado grandes o demasiado pequeos para que su
equipo los represente). A veces esto se puede evitar eligiendo los valores iniciales
adecuados o imponiendo restricciones sobre los parmetros.

Funciones adicionales del comando NLR


El lenguaje de comandos de SPSS tambin permite:

Nombrar un archivo del cual leer valores iniciales para las estimaciones de los
parmetros.
Especificar ms de una instruccin de modelo y de funcin de prdida. Con ello se
facilita la tarea de especificacin de un modelo segmentado.
Suministrar sus propias derivadas en vez de utilizar las calculadas por el programa.
Especificar el nmero de muestras bootstrap que se van a generar.
Especificar criterios de iteracin adicionales, incluyendo el establecer un valor crtico
para la comprobacin de las derivadas y definir un criterio de convergencia para la
correlacin entre los residuos y las derivadas.

Los criterios adicionales para el comando CNLR (regresin no lineal restringida) permiten:

Especificar el nmero mximo de iteraciones secundarias permitidas dentro de cada


iteracin principal.
Establecer un valor crtico para la comprobacin de las derivadas.
Establecer un lmite para los pasos.

Especificar una tolerancia de colapso para determinar si los valores iniciales estn dentro de los
lmites especificados.

74