Академический Документы
Профессиональный Документы
Культура Документы
Captulo IV:
BOOTSTRAP EN EL ANLISIS FACTORIAL (AF)
Abrace a sus datos no al modelo
John Tukey
Introduccin
En muchos estudios de marketing, se desean analizar conceptos como
imagen de marca, estilo de vida, percepcin sobre canales de distribucin,
actitud ante el producto, etc, los cuales muchas veces no son observables
directamente. Sin embargo, se puede aproximar a tales conceptos de manera
indirecta midiendo un conjunto de variables que sean observables y que
conduzcan a una sntesis e interpretacin de tales conceptos.
Existen diferentes procedimientos que permiten lo anteriormente
mencionado, entre estos tenemos: el Anlisis de Componentes Principales y
el Anlisis Factorial.
El objetivo del Anlisis de Componentes Principales es explicar la mayor
parte de la variabilidad total de un conjunto de variables con el menor nmero
de componentes posible, en el Anlisis Factorial, los factores son
seleccionados para explicar las interrelaciones entre variables.
El Anlisis Factorial es un mtodo de interdependencia, esto es, no hace
distincin entre variables dependientes e independientes. Parte de un gran
nmero de variables para tratar de averiguar si tienen un nmero pequeo de
factores en comn que expliquen, bsicamente, lo mismo que las variables
observables de partida.
El Anlisis Factorial comprende diferentes mtodos que permiten examinar la
estructura subyacente en un conjunto de variables y condensar la informacin
que contienen, revelando las dimensiones fundamentales y por tanto,
simplificando las relaciones existentes entre las variables observables. En
suma, agrupan variables observables para formar otras nuevas denominadas
factores o factores latentes, que son combinaciones lineales de las anteriores
con la menor perdida de la informacin.
El Anlisis Factorial puede ser exploratorio o confirmatorio, en el anlisis
exploratorio se caracteriza porque no se conoce a priori el nmero de
factores y es en la aplicacin emprica donde se determina este nmero. Por
el contrario, en el anlisis de tipo confirmatorio los factores estn fijados a
priori, utilizndose contrastaciones empricas para su corroboracin.
En general, este mtodo se caracterizan por:
Ser mtodos descriptivos y de interdependencia
Reducir la dimensionalidad de un fenmeno tratando de perder la menor
informacin posible.
Trata toda la informacin disponible, son exhaustivos
Las escalas han de ser mtricas: de intervalos o de razn.
Ser de inters la representacin grafica que generan para la interpretacin.
La utilizacin del Anlisis Factorial se resume en dos trminos clave: reducir
e interpretar.
El objetivo de este captulo es desarrollar la aplicacin del Anlisis Factorial
con el Bootstrap y entender sus condiciones de aplicacin e interpretacin de
resultados.
MS Jaime Carlos Porras Cerrn
jaimepc@lamolina.edu.pe
61
KMO
r
i 1 j i
r
i 1 j i
2
ij
2
ij
aij2
i 1 j i
El valor de KMO vara entre 0 y 1. Para valores de 0.8 y 0.9 es bueno o muy
bueno; 0.7 es un valor intermedio, y 0.5 es el lmite por debajo del cual se
considera inaceptable el anlisis puesto que las correlaciones se daran entre
pares de variables, de tal forma que en tales correlaciones no intervendran
otras variables y no habra estructura de correlacin.
La prueba de esfericidad de Bartlett
Es una forma consistente de comprobar que la matriz de correlaciones es
significativamente distinta de la matriz identidad (cuya diagonal es la unidad y
los dems trminos son ceros). En caso que la matriz de correlaciones fuera
una matriz identidad no habra correlacin entre variables y no tendra sentido
seguir con el anlisis factorial. Una prueba que nos permite esta
comprobacin es el test de esfericidad de Bartlett, que es una transformacin
de la 2 y supone una poblacin normal multivariante.
2 p 5 ln R ~ 2
2 n 1
p 2 p 2
6
Donde:
n: Tamao de la muestra
p: Nmero de variables observadas
H1 : R I
Si no se rechaza la hiptesis nula, y H0 : R I , entonces las p variables
observadas son mutuamente no correlacionadas. Por lo tanto no tendra
sentido aplicar el Anlisis Factorial.
El ndice MSA
Otro indicador es la medida de adecuacin de la muestra para cada variable
(MSA), este ndice es similar al KMO, pero para cada variable. Si el valor del
MSA fuera pequeo, no se aconsejara el AF. Por el contrario, valores
prximos a 1 indicaran que la variable Xj es adecuada para incluirla con el
resto en un AF.
Su expresin es:
rij2
j i
MSAi
rij2
j i
aij2
j i
En muchas ocasiones, se eliminan las variables con MSA muy bajo. (diagonal
principal de la matriz de correlacin anti-imagen).
y p u p1 x1 u p 2 x 2 u pp x p
tr j
tr R j p
j 1
o
Si se utiliza la matriz de correlaciones esta suma es igual a p, dado que la
matriz de correlacin es de dimensin pxp y en la diagonal presenta p unos.
j 1
i
p i o
tr R p
tr
j
j 1
Autovalor
0
1
Nmero de componente
La Comunalidad
Es la proporcin de variabilidad de una variable explicada por el conjunto de k
primeros factores. Dado que, en el caso particular de la solucin inicial, dicho
conjunto coincide con el de todos los posibles, la variabilidad de todas y cada
una de las variables est totalmente explicada y, en consecuencia, todas las
comunalidades son iguales a uno.
La matriz de Componentes
Muestra la correlacin existente entre cada variable con cada uno de los
componentes extrados.
La matriz de componentes es til para determinar que variables tienen mayor
incidencia (o peso) en la formacin de cada factor y esto ayudara a dar un
nombre al factor extrado.
Si se eleva al cuadrado los elementos de cada factor y se suma por
Fila: Se obtienen las comunalidades de cada variable
Columna: Se obtiene los autovalores correspondientes a cada factor
X2
X3
X4
X5
X6
X7
1,000
,508
-,300
,268
,220
,228
,840
,508
1,000
-,487
,272
,513
,186
,470
-,300
-,487
1,000
-,116
,067
-,034
-,448
,268
,272
-,116
1,000
,299
,788
,200
,220
,513
,067
,299
1,000
,241
-,055
,228
,186
-,034
,788
,241
1,000
,177
,840
,470
-,448
,200
-,055
,177
1,000
Se puede observar una alta correlacin entre las variables X1 con X2, X7; X2
con X5 y X6 con X6.
Al analizar el determinante de la matriz de correlaciones (0.021) es menor a
0.4, lo que indica que las variables se encuentran mutuamente
correlacionadas.
Matrices anti-imagen
Matrices anti-imagen
X1
X2
X3
X4
X5
X6
X7
,217
,006
-,047
-,014
-,117
,007
-,169
,006
,375
,221
-,011
-,249
,017
-,068
-,047
,221
,598
,046
-,139
-,041
,062
-,014
-,011
,046
,354
-,041
-,278
,005
-,117
-,249
-,139
-,041
,440
-,016
,141
,007
,017
-,041
-,278
-,016
,372
-,019
-,169
-,068
,062
,005
,141
-,019
,189
,022
-,129
-,050
-,378
,025
-,834
,022
,467
-,030
-,613
,044
-,257
,099
-,271
-,087
,184
-,104
-,767
,021
-,040
,489
-,072
,622
,604
-,129
,467
-,050
-,030
,099
,598
-,378
-,613
-,271
-,104
,356
,025
,044
-,087
-,767
-,040
,569
-,834
-,257
,184
,021
,489
-,072
adicionales
Correlacin anti-imagen
,588
a. Determinante = .047
,536
Conclusin
Existe suficiente evidencia estadstica para afirmar que las variables
observadas son mutuamente correlacionadas; es decir se debe realizar el AF.
KMO y prueba de Bartlett
Medida de adecuacin muestral de Kaiser-Meyer-Olkin.
Prueba de esfericidad de
Chi-cuadrado aproximado
Bartlett
gl
Sig.
,602
293,413
15
,000
extraccin
% de la
Componente
Total
varianza
% de la
% acumulado
Total
varianza
% acumulado
2,830
47,167
47,167
2,830
47,167
47,167
1,532
25,529
72,696
1,532
25,529
72,696
,803
13,380
86,076
,496
8,266
94,342
,207
3,454
97,796
,132
2,204
100,000
Segn este anlisis solo se deben considerar dos factores porque sus
autovalores son mayores a 1 (Regla de Kaiser)
Con dos factores se explica el 72.696% de la variabilidad total.
La suma de los autovalores (2.83++0.132) debe ser igual a p (nmero de
variables) dado que se est trabajando con la matriz de correlaciones.
El valor 47.167% se obtiene de dividir 2.83 entre 6, es decir la variabilidad
explicada por cada uno de los factores se obtiene de dividir su autovalor entre
p dado que p es la suma total de los autovalores.
Si se quiere conservar como mnimo un 80% de variabilidad total se debe
considerar utilizar tres factores.
Si se quiere conservar como mnimo un 95% de variabilidad total se debe
considerar utilizar cinco factores.
Comunalidades
Comunalidades
Inicial
Extraccin
1,000
,733
1,000
,581
1,000
,485
1,000
,885
1,000
,894
1,000
,785
Matriz de componentes
Componente
1
,825
-,229
,733
-,210
-,578
,388
,579
,741
,517
,791
,822
-,331
Grfico de componentes
Se puede apreciar que las variables X1, X2 y X7 esta relacionadas
positivamente con el factor 1 y la variable X3 negativamente con el factor 1.
Las variables X4 y X6 se encuentran asociadas positivamente con el factor 2.