Вы находитесь на странице: 1из 8

STATGRAPHICS Rev.

9/14/2006

Correlaciones Cannicas
Resumen
El procedimiento Correlaciones Cannicas esta diseado para ayudar a identificar asociaciones
entre dos conjuntos de variables. Esto lo hace encontrando combinaciones lineales de las
variables en los dos conjuntos que exhiban correlaciones fuertes. El par de combinaciones
lineales con la correlacin ms fuerte forman el primer conjunto de variables cannicas. El
segundo conjunto de variables cannicas es el par de combinaciones lineales que muestran la
siguiente correlacin ms fuerte entre todas las combinaciones que no estn correlacionadas con
el primer conjunto. Frecuentemente, un nmero pequeo de pares puede ser usado para
cuantificar la relacin que existe entre los dos conjuntos.

Ejemplo StatFolio: canonical.sgp


Datos del Ejemplo:
El archivo 93cars.sf6 contiene informacin acerca de 26 variables para n = 93 marcas y modelos
de automviles, tomadas de Lock (1993). La siguiente tabla muestra una lista parcial de los datos
de este archivo:
Make
(Marca)

Model
(Modelo)

MPG City
Mid
(MPG en
Price
(Precio) Ciudad)

Acura
Acura
Audi
Audi
BMW
Buick
Buick
Buick
Buick
Cadillac
Cadillac
Chevrolet

Integra
Legend
90
100
535i
Century
LeSabre
Roadmaster
Riviera
DeVille
Seville
Cavalier

15.9
33.9
29.1
37.7
30
15.7
20.8
23.7
26.3
34.7
40.1
13.4

25
18
20
19
22
22
19
16
19
16
16
25

Engine
Size
(Tamao
del Motor)
1.8
3.2
2.8
2.8
3.5
2.2
3.8
5.7
3.8
4.9
4.6
2.2

Horsepower
(Caballos de
fuerza)

Length
(Longitud)

140
200
172
172
208
110
170
180
170
200
295
110

177
195
180
193
186
189
200
216
198
206
204
182

Las variables sern divididas en dos conjuntos. El primer conjunto de p = 7 variables que
caracterizan las caractersticas fsicas de los vehculos:
Engine Size
Horsepower
Length
Wheelbase
Width
Rear seat
Weight
El segundo conjunto de q = 4 variables que caracterizan el precio y el funcionamiento de los
automviles:
2006 por StatPoint, Inc.
Correlaciones Cannicas - 1

STATGRAPHICS Rev. 9/14/2006


Mid Price
1 / MPG Highway
1 / MPG City
U Turn Space
Note que las millas observadas por galn han sido reexpresadas como galones por milla, de aqu
que las 4 variables se espera que se incrementen con el tamao del automvil.
Un grfico de matriz de las 11 variables muestra correlaciones positivas consistentes entre todas
las variables:
Engine Size
Horsepower
Length
Wheelbase
Width
Rear seat
Weight
Mid Price
1/MPGCity
1/MPG Highway
U Turn Space

2006 por StatPoint, Inc.

Correlaciones Cannicas - 2

STATGRAPHICS Rev. 9/14/2006

Entrada de Datos
La caja de dialogo de entrada requiere los nombres de las columnas que contiene los datos en los
dos conjuntos

Primer Conjunto de Variables: Los nombres de las p variables en el conjunto mas grande.

Segundo Conjunto de Variables: Los nombres de las q variables en el conjunto ms


pequeo.

Etiquetas de Puntos: Etiquetas opcionales para cada observacin.

Seleccin: Seleccin de un subconjunto de los datos.

Note que los conjuntos deben ser seleccionados tal que p q.

2006 por StatPoint, Inc.

Correlaciones Cannicas - 3

STATGRAPHICS Rev. 9/14/2006

Modelo Estadstico
El objetivo de la correlacin cannica es construir combinaciones lineales de las variables en los
dos conjuntos tal que tengan las correlaciones ms grandes. El primer conjunto de variables
cannicas toma la forma
U 1 = a11 X 1 + a12 X 2 + ... + a1 p X p

(1)

V1 = b11Y1 + b12Y2 + ... + b1q Yq

(2)

donde X y Y representan los valores estandarizados de las variables en el primer y segundo


conjunto respectivamente. La correlacin entre el primer conjunto de combinaciones lineales es
llamada la primera correlacin cannica y ser denotada por 1* .
Adicionales q 1 variables cannicas pueden ser construidas de manera similar. Las q
correlaciones cannicas son encontradas determinando los eigenvalores de

111 / 2 12 221 21 111 / 2

(3)

donde las s representan las matrices de correlacin entre variables en cada conjunto y entre
conjuntos. Los coeficientes de las variables cannicas pueden ser derivados de los eigenvectores.

2006 por StatPoint, Inc.

Correlaciones Cannicas - 4

STATGRAPHICS Rev. 9/14/2006

Resumen del Anlisis


La tabla del Resumen del Anlisis es mostrada enseguida:
Correlaciones Cannicas
Variables en el conjunto 1:
Engine Size (liters)
Horsepower (maximum)
Length (inches)
Wheelbase (inches)
Width (inches)
Rear seat (inches)
Weight (pounds)
Variables en el conjunto 2:
Mid Price (average of min and max prices in $1,000)
1/MPG Highway
1/MPG City
U Turn Space (feet)
Nmero de casos completos: 91
Correlacions Cannicas
Nmero
1
2
3
4

Eigenvalor
0.895275
0.495819
0.462885
0.0291608

Correlacin
Cannica
0.94619
0.704144
0.680356
0.170765

Lambda de
Wilks
0.0275328
0.262906
0.521453
0.970839

Chi-Cuadrada
301.76
112.22
54.6955
2.48593

G.L.
28
18
10
4

Valor-P
0.0000
0.0000
0.0000
0.6472

Coeficientes de Variables Cannicas del Primer Conjunto


Engine Size
0.261726
0.698443
-0.0737052 2.04984
Horsepower
0.127466
0.404309
1.23884
-0.784463
Length
0.0241777
1.06291
0.279635
-0.0542533
Wheelbase
0.0411746
0.344853
0.710682
-1.45037
Width
-0.0676957
0.292913
-1.51189
-1.08908
Rear seat
0.00425793 -0.0929359 -0.0789944 -0.261572
Weight
0.657779
-2.42508
-0.470777
1.19131
Coeficientes de Variables Cannicas del Segundo Conjunto
Mid Price
0.256618
0.15463
1.21063
-0.401701
1/MPG Highway
-0.0971257 -2.20547
0.175652
-1.51504
1/MPG City
0.652062
1.42486
-0.796365 2.80861
U Turn Space
0.32219
0.454982 -0.340661 -1.33714

Desplegada en la parte superior de la tabla estn:

Variables de Datos: Los nombres de las p+q columnas de entrada.

Numero de casos completos: El numero de casos n para los cuales ninguna de las
observaciones esta perdida.

La seccin de la salida etiquetada con Correlaciones Cannicas tabula:

Numero: El ndice de la correlacin cannica j.

1
Eigenvalor: Los eigenvalores de 111 / 2 12 22
21 111 / 2 .

2006 por StatPoint, Inc.

Correlaciones Cannicas - 5

STATGRAPHICS Rev. 9/14/2006

Correlacin Cannica: Las correlaciones cannicas .

Lambda de Wilk: Un estadstico calculado de las correlaciones cannicas de acuerdo a

*
j

j = 1 i*
i= j

(4)

Chi-Cuadrada: Una prueba estadstica usada para probar la hiptesis de que todas las
correlaciones cannicas de j y mas grandes son igual a 0. es calculada de
1

2 = n 1 ( p + q + 1) ln j
2

(5)

G.L.: Los grados de libertad (p-j+1)(q-j+1) asociados con el estadstico Chi-cuadrada.

P-Valor: Un P-Valor de una cola para el estadstico Chi-cuadrada observada. P-valores


pequeos (menos de 0.05 si se opera en un nivel de 95% de confianza) corresponden a
correlaciones cannicas que son significativamente diferentes de cero.

Las ultimas dos tablas muestran los coeficientes a y b en la construccin de las variables
cannicas U y V.
En el ejemplo, las primeras 3 correlaciones cannicas son estadsticamente significantes. La
primera correlacin, con una magnitud de 0.94, es particularmente fuerte. Las correlaciones
cannicas asociadas son
U1 = 0.262 Engine Size + 0.127 Horsepower + 0.024 Length + 0.041 Wheelbase
- 0.068 Width + 0.004 Rear Seat + 0.658 Weight
V1 = 0.257 Mid Price 0.097 * GPM Highway + 0.652 GPM City + 0.322 U Turn Space
donde las variables de entiende que han sido estandarizadas sustrayendo su media y dividiendo
entre la desviacin estndar. Esto parece ser primariamente una relacin entre pesos de vehculos
y galones por milla (GPM) usados en cuidad, con algunas contribuciones del tamao de la
maquina, precio, y espacio requerido para hacer una vuelta U.
La segunda correlacin cannica es tan bien fuerte 0.70. La variable cannica para X es un
contraste de Engine Size, Horsepower y Length contra el Weight del vehiculo. Este contraste es
correlacionado con algn parecido a la diferencia entre millas por galn observadas en la ciudad
versus carretera.
La tercera correlacin cannica es igual a 0.68. La variable cannica para X es un contraste de
Horsepower y Wheelbase contra el Width del vehiculo. Esto es correlacionado con algn
parecido a un contraste de Price del vehiculo versus GPM ciudad y U Turn Space.

2006 por StatPoint, Inc.

Correlaciones Cannicas - 6

STATGRAPHICS Rev. 9/14/2006

Tabla de Datos
El panel de la Tabla de Datos despliega los valores de las variables cannicas para cada una de
n observaciones. Una porcin de la tabla es mostrada enseguida:
Tabla de Variables Cannicas
Conjunto-Variable
1-1
Fila
Etiqueta
1
2
3
4
5
6
7

Integra
Legend
90
100
535i
Century

-0.633815
0.89817
0.479834
0.509327
1.06715
-0.390542

Conjunto-Variable

Conjunto-Variable

Conjunto-Variable

2-1
-0.68972
0.829715
0.246904
0.659087
0.245875
0.0756147

1-2
0.252376
0.341564
-1.41249
-0.251631
-0.723874
0.625743

2-2
-0.191381
-0.320696
-0.794373
-0.2627
0.732446
1.1806

El orden de las columnas es U1, V1, U2, V2, , Uq, Vq.

Grfico de Variables Cannicas


El Grfico de Variables Cannicas despliega n valores de un conjunto seleccionado de variables
cannicas
Grfica de Variables Cannicas #1
2.7

Conjunto 2

1.7
0.7
-0.3
-1.3
-2.3
-2.2

-1.2

-0.2
0.8
Conjunto 1

1.8

2.8

U es graficado en el eje horizontal, mientras que V es graficado en el eje vertical. Note las muy
fuertes correlaciones para las primeras variables cannicas.
Opciones del Panel

2006 por StatPoint, Inc.

Correlaciones Cannicas - 7

STATGRAPHICS Rev. 9/14/2006


Numero de Variable: Especifica 1 para graficar el primer conjunto de variables cannicas, 2
para graficar el segundo conjunto, hasta q para el ultimo conjunto.

Una variacin interesante de este grafico es en la cual las variables cannicas son codificadas de
acuerdo a otra columna, tal como el tipo de vehiculo:
Grfico de CVARB_1 vs CVARA_1
Type
Compact
Large
Midsize
Small
Sporty
Van

2.7

CVARB_1

1.7
0.7
-0.3
-1.3
-2.3
-2.2

-1.2

-0.2
0.8
CVARA_1

1.8

2.8

Para producir la grafica anterior:


1. Presionar el botn Guardar Resultados y guardar las Variables Cannicas en nuevas
columnas de hoja de datos.
2. Seleccione el procedimiento Grafico X-Y de la parte superior del men e introduzca las
primeras variables cannicas para cada conjunto.
3. Seleccione Opciones del Anlisis y especifique Tipo en le campo Cdigos de Puntos.
Note el agrupamiento de automviles por tipo

Guardar Resultados
Los siguientes resultados pueden ser guardados en una hoja de datos:
1. Coeficientes Primer Conjunto q columnas que contienen los p coeficientes a de las
variables cannicas correspondientes a X.
2. Coeficientes Segundo Conjunto q columnas que contienen los q coeficientes b de las
variables cannicas correspondientes a Y.
3. Variables Cannicas - Primer Conjunto q columnas que contienen los valores de las
variables cannicas U correspondientes a cada una de n observaciones en X.
4. Variables Cannicas Segundo Conjunto q columnas que contienen los valores de las
variables cannicas U correspondientes a cada una de las n observaciones en Y.

2006 por StatPoint, Inc.

Correlaciones Cannicas - 8

Вам также может понравиться