Академический Документы
Профессиональный Документы
Культура Документы
9/14/2006
Correlaciones Cannicas
Resumen
El procedimiento Correlaciones Cannicas esta diseado para ayudar a identificar asociaciones
entre dos conjuntos de variables. Esto lo hace encontrando combinaciones lineales de las
variables en los dos conjuntos que exhiban correlaciones fuertes. El par de combinaciones
lineales con la correlacin ms fuerte forman el primer conjunto de variables cannicas. El
segundo conjunto de variables cannicas es el par de combinaciones lineales que muestran la
siguiente correlacin ms fuerte entre todas las combinaciones que no estn correlacionadas con
el primer conjunto. Frecuentemente, un nmero pequeo de pares puede ser usado para
cuantificar la relacin que existe entre los dos conjuntos.
Model
(Modelo)
MPG City
Mid
(MPG en
Price
(Precio) Ciudad)
Acura
Acura
Audi
Audi
BMW
Buick
Buick
Buick
Buick
Cadillac
Cadillac
Chevrolet
Integra
Legend
90
100
535i
Century
LeSabre
Roadmaster
Riviera
DeVille
Seville
Cavalier
15.9
33.9
29.1
37.7
30
15.7
20.8
23.7
26.3
34.7
40.1
13.4
25
18
20
19
22
22
19
16
19
16
16
25
Engine
Size
(Tamao
del Motor)
1.8
3.2
2.8
2.8
3.5
2.2
3.8
5.7
3.8
4.9
4.6
2.2
Horsepower
(Caballos de
fuerza)
Length
(Longitud)
140
200
172
172
208
110
170
180
170
200
295
110
177
195
180
193
186
189
200
216
198
206
204
182
Las variables sern divididas en dos conjuntos. El primer conjunto de p = 7 variables que
caracterizan las caractersticas fsicas de los vehculos:
Engine Size
Horsepower
Length
Wheelbase
Width
Rear seat
Weight
El segundo conjunto de q = 4 variables que caracterizan el precio y el funcionamiento de los
automviles:
2006 por StatPoint, Inc.
Correlaciones Cannicas - 1
Correlaciones Cannicas - 2
Entrada de Datos
La caja de dialogo de entrada requiere los nombres de las columnas que contiene los datos en los
dos conjuntos
Primer Conjunto de Variables: Los nombres de las p variables en el conjunto mas grande.
Correlaciones Cannicas - 3
Modelo Estadstico
El objetivo de la correlacin cannica es construir combinaciones lineales de las variables en los
dos conjuntos tal que tengan las correlaciones ms grandes. El primer conjunto de variables
cannicas toma la forma
U 1 = a11 X 1 + a12 X 2 + ... + a1 p X p
(1)
(2)
(3)
donde las s representan las matrices de correlacin entre variables en cada conjunto y entre
conjuntos. Los coeficientes de las variables cannicas pueden ser derivados de los eigenvectores.
Correlaciones Cannicas - 4
Eigenvalor
0.895275
0.495819
0.462885
0.0291608
Correlacin
Cannica
0.94619
0.704144
0.680356
0.170765
Lambda de
Wilks
0.0275328
0.262906
0.521453
0.970839
Chi-Cuadrada
301.76
112.22
54.6955
2.48593
G.L.
28
18
10
4
Valor-P
0.0000
0.0000
0.0000
0.6472
Numero de casos completos: El numero de casos n para los cuales ninguna de las
observaciones esta perdida.
1
Eigenvalor: Los eigenvalores de 111 / 2 12 22
21 111 / 2 .
Correlaciones Cannicas - 5
*
j
j = 1 i*
i= j
(4)
Chi-Cuadrada: Una prueba estadstica usada para probar la hiptesis de que todas las
correlaciones cannicas de j y mas grandes son igual a 0. es calculada de
1
2 = n 1 ( p + q + 1) ln j
2
(5)
Las ultimas dos tablas muestran los coeficientes a y b en la construccin de las variables
cannicas U y V.
En el ejemplo, las primeras 3 correlaciones cannicas son estadsticamente significantes. La
primera correlacin, con una magnitud de 0.94, es particularmente fuerte. Las correlaciones
cannicas asociadas son
U1 = 0.262 Engine Size + 0.127 Horsepower + 0.024 Length + 0.041 Wheelbase
- 0.068 Width + 0.004 Rear Seat + 0.658 Weight
V1 = 0.257 Mid Price 0.097 * GPM Highway + 0.652 GPM City + 0.322 U Turn Space
donde las variables de entiende que han sido estandarizadas sustrayendo su media y dividiendo
entre la desviacin estndar. Esto parece ser primariamente una relacin entre pesos de vehculos
y galones por milla (GPM) usados en cuidad, con algunas contribuciones del tamao de la
maquina, precio, y espacio requerido para hacer una vuelta U.
La segunda correlacin cannica es tan bien fuerte 0.70. La variable cannica para X es un
contraste de Engine Size, Horsepower y Length contra el Weight del vehiculo. Este contraste es
correlacionado con algn parecido a la diferencia entre millas por galn observadas en la ciudad
versus carretera.
La tercera correlacin cannica es igual a 0.68. La variable cannica para X es un contraste de
Horsepower y Wheelbase contra el Width del vehiculo. Esto es correlacionado con algn
parecido a un contraste de Price del vehiculo versus GPM ciudad y U Turn Space.
Correlaciones Cannicas - 6
Tabla de Datos
El panel de la Tabla de Datos despliega los valores de las variables cannicas para cada una de
n observaciones. Una porcin de la tabla es mostrada enseguida:
Tabla de Variables Cannicas
Conjunto-Variable
1-1
Fila
Etiqueta
1
2
3
4
5
6
7
Integra
Legend
90
100
535i
Century
-0.633815
0.89817
0.479834
0.509327
1.06715
-0.390542
Conjunto-Variable
Conjunto-Variable
Conjunto-Variable
2-1
-0.68972
0.829715
0.246904
0.659087
0.245875
0.0756147
1-2
0.252376
0.341564
-1.41249
-0.251631
-0.723874
0.625743
2-2
-0.191381
-0.320696
-0.794373
-0.2627
0.732446
1.1806
Conjunto 2
1.7
0.7
-0.3
-1.3
-2.3
-2.2
-1.2
-0.2
0.8
Conjunto 1
1.8
2.8
U es graficado en el eje horizontal, mientras que V es graficado en el eje vertical. Note las muy
fuertes correlaciones para las primeras variables cannicas.
Opciones del Panel
Correlaciones Cannicas - 7
Una variacin interesante de este grafico es en la cual las variables cannicas son codificadas de
acuerdo a otra columna, tal como el tipo de vehiculo:
Grfico de CVARB_1 vs CVARA_1
Type
Compact
Large
Midsize
Small
Sporty
Van
2.7
CVARB_1
1.7
0.7
-0.3
-1.3
-2.3
-2.2
-1.2
-0.2
0.8
CVARA_1
1.8
2.8
Guardar Resultados
Los siguientes resultados pueden ser guardados en una hoja de datos:
1. Coeficientes Primer Conjunto q columnas que contienen los p coeficientes a de las
variables cannicas correspondientes a X.
2. Coeficientes Segundo Conjunto q columnas que contienen los q coeficientes b de las
variables cannicas correspondientes a Y.
3. Variables Cannicas - Primer Conjunto q columnas que contienen los valores de las
variables cannicas U correspondientes a cada una de n observaciones en X.
4. Variables Cannicas Segundo Conjunto q columnas que contienen los valores de las
variables cannicas U correspondientes a cada una de las n observaciones en Y.
Correlaciones Cannicas - 8