Вы находитесь на странице: 1из 13

Captulo 2 Estadstica Superior

1

Captulo 2: Anlisis factorial

Definicin Anlisis Factorial:
Es una tcnica especialmente adecuada para analizar las pautas de relaciones complejas y
multidimensionales encontradas por los investigadores. Define y explica los aspectos
fundamentales de las tcnicas de anlisis factorial en trminos amplios y conceptuales.

-
Se puede usar para examinar las pautas subyacentes o las relaciones para un amplio
nmero de variables y para determinar si la informacin puede ser condensada o resumida
en una seria de factores o componentes ms pequeos.


Definicin: es una clase de mtodos estadsticos multivariantes cuyo propsito principal es
definir la estructura subyacente en una matriz de datos. Aborda el problema de cmo analizar
la estructura de las interrelaciones entre un gran nmero de variables con la definicin de una
serie de dimensiones subyacentes comunes, conocidas como factores.

-
El investigador puede identificar primero las dimensiones separadas de la estructura y
entonces determinar el grado en que se justifica cada variable por cada dimensin


Objetivos:

-
El resumen: a la hora de resumir datos, con el anlisis factorial se obtienen unas
dimensiones subyacentes, que cuando son interpretadas y comprendidas, describen los
datos con un nmero de conceptos mucho ms reducido que las variables individuales
originales.

-
La reduccin de datos


El anlisis factorial es una tcnica de interdependencia en la que se consideran todas las
variables simultneamente, cada una relacionada con todas las dems y empleando todava el
concepto de valor terico. En el anlisis factorial, los valores tericos se forman para
maximizar su explicacin de la serie de variables entera, y no predecir una variable
dependiente.
Se puede considerar cada factor como una variable dependiente que es funcin del conjunto
entero de las variables observadas.







Captulo 2 Estadstica Superior
2

El proceso de decisin del anlisis factorial:
1.-Objetivos del anlisis factorial:

El propsito general es encontrar una manera de condensar la informacin contenida en una
serie de variables originales en una serie ms pequea de dimensiones compuestas o valores
tericos nuevos con una mnima prdida de informacin


Pueden satisfacer cualquiera de estos dos objetivos:

o
La identificacin de estructura mediante el resumen de datos.

o
La reduccin de datos

a) Identificacin de la estructura mediante resumen de datos:

El anlisis factorial puede identificar la estructura de las relaciones entre las variables o los
encuestados mediante la investigacin de las correlaciones entre las variables o bien las
correlaciones entre los encuestados.

Si el objetivo de la investigacin fuera el resumen de las caractersticas, se aplicara el
anlisis factorial a una matriz de correlacin de las variables. Este es el tipo de anlisis
ms comn y se denomina anlisis factorial R

o
El anlisis factorial R: analiza una serie de variables para identificar las
dimensiones que son latentes (son fcilmente observadas).

Tambin se puede aplicar el anlisis a la matriz de correlacin de los encuestados individuales
basada en sus caractersticas, se denomina anlisis factorial Q
o
El anlisis factorial Q: es un mtodo para combinar o condensar grandes
grupos de personas en grupos claramente diferentes dentro de una poblacin
mayor, no se usa la aproximacin del anlisis factorial Q con mucha frecuencia.
En su lugar, la mayora de los investigadores utilizan algn tipo de anlisis
Cluster para agrupar los encuestados individuales.

b) Identificacin de la estructura mediante reduccin de datos:

El anlisis tambin puede identificar las variables suplentes de una serie de variables ms
grande para su utilizacin en anlisis multivariantes posteriores, o crear una serie de variables
completamente nueva, mucho ms pequea en nmero, para reemplazar parcial o
completamente la serie original de variables para su inclusin en tcnicas posteriores.

En ambos casos el propsito es retener la naturaleza y el carcter de las variables originales,
pero reducir su nmero para simplificar el anlisis multivariante posterior. La reduccin de
datos depende tambin de las cargas de factores, no obstante, las utiliza como la base para
identificar las variables para su anlisis subsiguiente con otras tcnicas o bien para hacer
estimaciones de los factores mismos.



Captulo 2 Estadstica Superior
3

c) El uso del anlisis factorial con otras tcnicas multivariantes:

El anlisis factorial proporciona la base para crear una nueva seria de variables que incorporan
el carcter y naturaleza de las variables originales en una cantidad de nuevas variables ms
reducida, sea con la utilizacin de variables suplentes, sea con la puntuacin de factores o las
escalas aditivas. El anlisis factorial puede determinar tambin la estructura y/o crear nuevas
puntuaciones compuestas a partir de las variables originales. El anlisis factorial se puede
utilizar para valorar la naturaleza de una dimensin propuesta.

El uso del anlisis factorial como una tcnica de resumen de datos no excluye la necesidad de
una base conceptual para cualquiera de las variables analizadas. Incluso si se usa meramente
para la reduccin de datos, el anlisis factorial es ms eficiente cuando las dimensiones
definidas conceptualmente pueden ser representadas por los factores obtenidos.



2.- El diseo de un anlisis factorial:

El diseo de un anlisis factorial implica tres decisiones bsicas:

o El clculo de los datos de entrada (matriz de correlacin) para alcanzar los objetivos
especficos de la agrupacin de variables o encuestados.
o El diseo del estudio en trminos de nmeros de variables, las propiedades de
medicin de las variables y los tipos de las variables permisibles.
o El tamao de muestra necesario, tanto en trminos absolutos como para la funcin del
nmero de variables en el anlisis.

a) Correlaciones entre las variables o los encuestados:

La primera decisin se concentra en la aproximacin que se usa para calcular la matriz de
correlacin tanto para el anlisis factorial tipo R como para el de tipo Q. el investigador puede
utilizar la matriz de datos de entrada a partir del clculo de las correlaciones entre las
variables, empleando, por tanto, un anlisis factorial de tipo R. El investigador tambin puede
elegir la matriz de correlacin de las correlaciones entre los encuestados individuales.
A partir de los resultados del anlisis tipo Q, se pueden identificar grupos o Clusters de
individuos que muestran una pauta similar sobre las variables que se incluyen en el anlisis.

El anlisis factorial tipo Q se basa en las intercorrelaciones entre los encuestados, mientras
que le anlisis Cluster forma grupos que se basan en una medida de similitud basada en la
distancia entre las puntuaciones de los encuestados sobre las variables analizadas

b) La seleccin de variables y cuestiones de medicin

Se supone, por regla general, que las variables a incluir en el anlisis factorial tienen escala
mtrica. En algunos casos, se pueden utilizar variables ficticias, aunque se consideran como no
Captulo 2 Estadstica Superior
4

mtricas. Si todas las variables son ficticias, entonces las formas especializadas del anlisis
factorial, tales como el anlisis factorial Boolean, son ms apropiadas. Adems, el investigador
debe intentar minimizar el nmero de variables que se incluyen, no obstante, debe mantener
un nmero razonable de variables por factor.

El poder del anlisis factorial se basa en encontrar pautas entre grupos variables y resulta de
poca utilidad en la identificacin de factores compuestos de una nica variable.

c) Tamao muestral
El investigador no usar el anlisis factorial para una muestra inferior a 50 observaciones, y
preferiblemente el tamao muestral debera ser 100 o ms grande. Como regla general, el
mnimo es tener por lo menos un nmero de observaciones cinco veces mayor que el nmero
de variables a ser analizadas, siendo el tamao aceptable un ratio diez a uno.

3.- Supuestos en el anlisis factorial:

Desde un punto de vista estadstico, se pueden obviar los supuestos de normalidad,
homocedasticidad y linealidad siendo conscientes de que su incumplimiento produce una
disminucin en las correlaciones observadas.

Slo es necesaria la normalidad cuando se aplica una prueba estadstica a la significacin de los
factores; es deseable que haya cierto grado de multicolinealidad, dado que el objeto es
identificar series de variables interrelacionadas.

-
Si la inspeccin visual revela que no hay un nmero sustancial de correlaciones mayores
que 030, entonces el anlisis factorial es probablemente inapropiado. Las correlaciones
entre las variables tambin pueden ser analizadas con el clculo de las correlaciones
parciales entre las variables.
-
Las correlaciones entre variables cuando se tienen en cuenta los efectos de otras
variables:
-
Si los factores verdaderos existen en los datos, la correlacin parcial ser
pequea.
-
Si las correlaciones parciales son altas, entonces no existen factores
subyacentes verdaderos y el anlisis factorial es inapropiado.
Las correlaciones parciales o anti-imagen mayores son indicativas de una matriz de datos que
no es quiz adecuada para el anlisis factorial

Otra manera de determinar la conveniencia del anlisis factorial es examinar la matriz de
correlacin entera:


El contraste de esfericidad de Bartlett: es una prueba estadstica para la presencia de
correlaciones entre las variables. Proporciona la probabilidad estadstica de que la matriz
de correlacin de las variables sea una matriz identidad. El investigador debe tener en
cuenta, que el incremento del tamao muestral da lugar a que la prueba de contraste de
Bartlett sea ms sensible a la deteccin de correlaciones entre las variables.
Captulo 2 Estadstica Superior
5




Medida de suficiencia de muestreo (MSA): este ndice se extiende de 0 a 1, llegando a 1
cuando cada variable es perfectamente predicha sin error por las otras variables. La
medida puede ser interpretada con las siguientes directrices:
-
080 o superior: SOBRESALIENTE
-
070 o superior: REGULAR
-
060 o superior: MEDIOCRE
-
050 o superior: DESPRECIABLE
-
Por debajo de 050: INACEPTABLE
El MSA aumenta conforme:
-
Aumenta el tamao muestral
-
Aumentan las correlaciones medias
-
Aumenta el nmero de variables
-
Desciende el nmero de factores
Las mismas directrices de MSA pueden extenderse tambin a las variables individuales. El
investigador debera examinar primero los valores de MSA para cada variable y excluir aquellos
que caen en la gama de inaceptables. Una vez que las variables individuales logran un nivel
aceptable, se puede valorar el MSA general y se puede tomar una decisin sobre la
continuacin del anlisis factorial

Un supuesto bsico del anlisis factorial es que existe una estructura subyacente en la serie de
variables seleccionadas.

4.- La estimacin de los factores y la valoracin del ajuste general:

Es necesario tomar decisiones con relacin a:
-
El mtodo de extraccin de los factores (anlisis factorial comn frente al anlisis
de componentes principales).
-
El nmero de factores seleccionados para representar la estructura subyacente en
los datos.
La seleccin del mtodo de extraccin depende del objeto del investigador. Se utiliza el anlisis
de componentes principales cuando el objetivo es resumir la mayora de la informacin
original (varianza) en una cantidad mnima de factores con propsitos de prediccin. Por el
contrario, se utiliza el anlisis factorial comn para identificar los factores subyacentes o las
dimensiones que reflejan qu es lo que las variables comparten en comn. El investigador
tiene que determinar tambin el nmero de factores que representan la serie de variables
originales. Tanto las cuestiones conceptuales como empricas afectan a esta decisin.

a) Criterios para el clculo del nmero de factores a ser extrados:


En primer lugar el mtodo extrae las combinaciones de las variables que explican la
cantidad mayor de la varianza y despus contina con combinaciones que justifican
cantidades de varianza cada vez menores.

Despus de estimar la solucin inicial, se calculan varia soluciones de prueba adicionales
Captulo 2 Estadstica Superior
6


En funcin de la informacin que se obtiene de estos anlisis previos, se examinan las
matrices de factores y se escoge el nmero de factores que represente mejor los datos.
a. Criterio de raz latente: es la tcnica que se utiliza ms frecuentemente,
cualquier factor individual debera justificar la varianza de por lo menos una
nica variable.
i. Cada variable contribuye con un valor de 1 para el autovalor total. Por
tanto, slo se consideran los factores que tienen races latentes o
autovalores mayores que 1; explican al menos una variable.
ii. Se considera que todos los factores von races latentes menores a 1 no
son significativas y por tanto, se desestiman a la hora de incorporarlos
a la interpretacin.
El uso del autovalor para establecer un corte es ms fiable cuando el nmero
de variables est entre 20 t 50. Si el nmero de variables es menor que 20, hay
una tendencia a que este mtodo extraiga un nmero de factores conservador
(demasiado poco), sin embargo, si hay ms de 50 variables, lo ms comn es
que se extraigan demasiados factores.

b. Criterio a priori: el investigador ya sabe cuntos factores hay que extraer
antes de iniciar el anlisis factorial. El investigador simplemente instruye al
computador para parar el anlisis cuando se haya extrado el nmero de
factores deseado.
c. Criterio de porcentaje de la varianza: se basa en obtener un porcentaje
acumulado especificado de la varianza total extrada. El propsito es asegurar
una significacin prctica de los factores derivados, asegurando que explican
por lo menos una cantidad especificada de la varianza. El procedimiento de
factores normalmente no debera ser detenido hasta que los factores
extrados cuenten por lo menos con un 95% de la varianza o hasta que el
factor justifique solamente una porcin pequea (5%).
d. Criterio de contraste de cada: se utiliza para identificar el nmero ptimo de
factores que pueden ser extrados antes de que la cantidad de varianza nica
empiece a dominar la estructura de la varianza comn. Se estima el contraste
de cada con el trazo de races latentes en funcin del nmero de factores en
su orden de extraccin y se utiliza la forma de la curva consiguiente para
evaluar el punto de corte.
i. Se considera que el punto en que la curva empieza a rectificarse indica
el mximo nmero de factores a extraer- se incluirn los primeros 10
factores. Por encima de 10, se incluira una proporcin de la varianza
nica demasiado grande, por lo que estos factores no son aceptables.
ii. El contraste de cada normalmente tiene como resultado que se
incluyan uno y a veces dos o ms factores adicionales que cuando se
utiliza el criterio de raz latente.
e. Heterogeneidad de la muestra: un supuesto subyacente es que la varianza se
extiende a lo largo de toda la muestra. Si la muestra es heterognea al menos
con respecto a un subconjunto de variables, los primeros factores
Captulo 2 Estadstica Superior
7

representarn aquellas variables, los primeros factores representarn aquellas
variables que son ms homogneas a lo largo de toda la muestra.
-
Las variables con mayor capacidad de discriminar entre subconjuntos
muestrales cargarn sobre los ltimos factores.
-
Cuando el objetivo sea identificar factores que discriminen entre
subconjuntos muestrales, el investigador deber extraer factores
adicionales entre aquellos sealados por los mtodos anteriormente
expuestos y examinar la capacidad de los factores adicionales para
discriminar entre grupos. Si resultan peores al discriminar, la solucin
puede estar en proceder de nuevo y eliminar estos ltimos factores.

5.- Interpretacin de los factores:

a) Primero se calcula la matriz inicial de factores no rotados que se nos d una indicacin
preliminar acerca del nmero de factores a extraer. La matriz de factores contienen las
cargas factoriales para cada variable sobre cada factor. Al calcular la matriz de factores
no rotada, el investigador simplemente est interesado en la mejor combinacin lineal
de variables, es decir, en encontrar aquella combinacin particular de las variables
originales que cuenta con el mayor porcentaje de varianza de datos.
b) El segundo factor se define como la segunda mejor combinacin lineal de las variables,
sujeta a la restriccin de que sea ortogonal al primer factor.
a. Para ser ortogonal al primer factor, el segundo factor debe derivarse de la
varianza restante tras la extraccin del primer factor. As, el segundo factor
puede definirse como la combinacin lineal de las variables que da cuenta del
mayor porcentaje de varianza residual una vez se ha eliminado de los datos el
efecto del primer factor.
La carga factorial es el medio para interpretar la funcin que cada variable
desempea al definir cada factor. Las cargas factoriales son las correlaciones entre
cada variable y el factor.
1. Generalmente, la rotacin es deseable porque simplifica la estructura de los
factores, y habitualmente es difcil determinar si los factores no rotados sern
significativos. Por tanto, el segundo paso hace uso de un mtodo de rotacin
para lograr soluciones factoriales ms simples y tericamente ms
significativas.

c) El investigador valora la necesidad de especificar de nuevo el modelo de factores
debido a:
a. La eliminacin de variables en el anlisis
b. El deseo de emplear un mtodo de rotacin diferente para la interpretacin
c. La necesidad de extraer un nmero diferente de factores
d. El deseo de cambiar de un mtodo de extraccin a otro.
La especificacin nueva del modelo factorial viene acompaada de la vuelta a la etapa
de extraccin, rotacin de factores y de nuevo su interpretacin.


Captulo 2 Estadstica Superior
8

5.1.- Rotacin de factores:
El trmino rotacin significa exactamente lo que indica, se gira en el origen los ejes de
referencia de los factores hasta alcanzar una determinada posicin.
-
El primer factor tiende a ser un factor general por el que casi toda
variable se ve afectada significativamente dando cuenta del mayor
porcentaje de varianza.
-
El segundo factor y siguientes factores se basan en la varianza
residual. Cada uno explica porcentajes de varianza cada vez menores.
5.1.1 Tipos:

a) Rotacin ortogonal: en la que los ejes se mantienen formando un ngulo de 90
grados
b) Oblicua: cuando no se limita a ser ortogonal.

El objetivo ltimo de toda rotacin es obtener algunos factores tericamente
significativos y, si es posible, la estructura de factores ms simple. La rotacin
ortogonal se emplea con ms frecuencia dada su presencia en todos los programas
informticos de anlisis factorial. Adems, las rotaciones ortogonales se utilizan con
ms frecuencia porque los procedimientos analticos para llevar a cabo rotaciones
oblicuas no estn totalmente desarrollados y estn todava sujetos a controversia.

Mtodos de rotacin ortogonal: el objetivo de todos los mtodos de rotacin es
simplificar las filas y columnas de la matriz de factores para facilitar la interpretacin.
En una matriz de factores, las columnas representan los factores, con cada fila
correspondiendo a las cargas de variables para cada uno de los factores.
-
Simplificando las filas, queremos aproximar lo ms posible a cero
tantos valores como sea posible.
-
Simplificando las columnas, queremos aproximar lo ms posible a cero
tantos valores como sea posible.

QUARTIMAX: el objetivo es simplificar las filas de una matriz de factores. QUARTIMAX
se centra en rotar los factores iniciales de tal forma que una variable cargue alto sobre
un factor y tan bajo como sea posible sobre los otros factores. Su dificultad est en
que tiende a producir un factor general, como el primer factor, sobre el que la mayor
parte, si no todas las variables, tiene cargas mayores.
VARIMAX: se centra en simplificar las columnas de la matriz de factores. Con VARIMAX
se alcanza la mxima simplificacin posible si slo hay ceros y unos en una columna.
Este mtodo maximiza la suma de las varianza de las cargas requeridas de la matriz de
factores. Con esta aproximacin rotacional, tiende a haber altas cargas factoriales y
algunas cargas cerca d e0 en cada columna de la matriz. Si la lgica est en que la
interpretacin es ms fcil cuando las correlaciones variable factor estn:
o Cercanas a -1 o +1, indicando as una clara asociacin positiva o negativa entre
la variable y el factor.
o Cercanas a 0 sealando una clara ausencia de asociacin. Esta estructura
resulta esencialmente sencilla.
Captulo 2 Estadstica Superior
9

VARIMAX parece suministrar una separacin ms clara de factores.

EQUIMAX: est a medio camino entre las aproximaciones QUARTIMAX Y VARIMAX.

Seleccin del mtodo de seleccin:
si el objetivo del investigador es reducir el nmero de variables originales, con
independencia de la significacin resultante de los factores, la solucin apropiada
debera ser ortogonal. Adems, si el investigador desea reducir un gran nmero de
variables a un conjunto pequeo de variables incorrelacionada para un uso posterior
en el anlisis de regresin u otras tcnicas de prediccin, la solucin ortogonal resulta
la ms adecuada.
Sin embargo, si el objetivo ltimo es obtener varios factores tericamente
significativos, resulta apropiada una solucin oblicua

5.2.- Criterios para la significacin de las cargas factoriales

Asegurar la significacin prctica:
o Las cargas factoriales mayores a 30, se considera que estn en el nivel
mnimo.
o 40 se consideran ms importante
o 50 o mayores, se consideran prcticamente significativas
Cuanto mayor sea el tamao absoluto de la carga factorial, ms importante resulta la
carga al interpretar la matriz factorial. Dado que la carga factorial es la correlacin
entre la variable y el factor, el cuadrado de la carga es la cuanta de la varianza total de
la variable de la que da cuenta el factor. As, una carga de 030 implica
aproximadamente una explicacin de un 10%, y una carga de 050 quiere decir que un
25% de la varianza es debida al factor. Para que un factor explique un 50% de la
varianza ha de contar con una carga que supere el 70%.

Valoracin de la significacin estadstica: al determinar el nivel de significacin para la
interpretacin de las cargas, se debera emplear una aproximacin similar a la utilizada
para la significacin estadstica de los coeficientes de correlacin.
Ajustes basados en el nmero de variables: se ha comprobado que, a medida que el
investigador se mueve del primer factor a los ltimos, debe incrementarse el grado
aceptable para considerar a una carga como significativa. Segn el nmero de
variables analizadas, se incrementa el nivel aceptable para considerar significativa una
carga que decrece. El ajuste por nmero de variables crece en importancia segn uno
se mueve del primer factor extrado a los ltimos.
o a mayor tamao muestral, menor puede ser la carga para ser considerada
como significativa.
o A mayor nmero de variables analizadas, menor ha de ser la carga para ser
considerada como significativa
o A mayor nmero de factores, mayor ha de ser el tamao de la carga de los
ltimos factores para considerarse como significativa en la interpretacin.

Captulo 2 Estadstica Superior
10

5.3.- Interpretacin de la matriz de factores

El examen de la matriz de cargas factoriales: cada columna de nmeros en la matriz
de factores representa un factor aislado. Las columnas de nmeros son las cargas
factoriales de cada variable sobre cada factor. El investigador debera escribir el
nombre de cada variable en el margen izquierdo al lado del nmero de cada variable.
o Si se ha utilizado una rotacin oblicua, se presentan dos matrices de cargas
factoriales:
La primera es la matriz de patrones factoriales, que contiene las
cargas que representan la contribucin nica de cada variable al
factor.
La segunda es la matriz de estructura factorial, que contiene las
correlaciones simples entre variables y factores, pero estas cargas
contienen tanto la varianza nica entre variables y factores como la
correlacin entre factores.
Identificacin de la mayor carga para cada variable: la interpretacin debera
comenzar con la primera variable sobre el primer factor y moverse horizontalmente de
izquierda a derecha, observando la mayor carga para cada variable sobre cada factor.
o el objetivo es minimizar el nmero de cargas significativas sobre cada fila y la
matriz de factores. Una variable con varias cargas altas es candidata a ser
eliminada.
Valoracin de la comunalidad: el investigador debera examinar la matriz de factores
para identificar variables que no hayan sido incluidas en ningn factor. La comunalidad
representa la proporcin de la varianza con la que contribuye cada variable a la
solucin final.
o Si hay variables que no cargan sobre ningn factor o cuyas comunalidades se
juzgan demasiado bajas, caben dos alternativas:
Interpretar la solucin final tal cual es y simplemente prescindir de
esas variables.
Evaluar cada una de esas variables para su supresin eventual
Prescindir puede resultar apropiado si el objetivo es nicamente la reduccin de datos,
pero el investigador todava debe percatarse de que las variables en cuestin estn
pobremente representadas en la solucin factorial. La consideracin sobre su
eliminacin debe depender de la contribucin conjunta de las variables para el
investigador adems del ndice de comunalidad, si la variable en cuestin es de escasa
importancia para el objetivo del estudio o cuenta con una comunalidad inaceptable,
podra ser eliminada y se procedera posteriormente a especificar el modelo factorial
excluyendo esa variable.

Etiquetacin de los factores: las variables con mayores cargas se consideran ms
importantes y tienen mayor influencia sobre el nombre o etiqueta seleccionada para
representar el factor. El investigador examinar todas las variables agrupadas en un
factor particular y, poniendo mayor nfasis en las variables con mayor carga factorial,
intentar asignar un nombre o etiqueta al factor que refleje con precisin las variables
cargadas sobre el factor.
Captulo 2 Estadstica Superior
11

o Los signos se interpretan como otros coeficientes de correlacin.
Sobre cada factor, signos iguales significan que las variables estn
positivamente relacionadas
o Signos opuestos significan que las variables estn negativamente
relacionadas.
En soluciones ortogonales los factores son independientes unos de otros. Por tanto,
los signos de las cargas factoriales se relacionan slo con el factor en el cual aparecen,
no con otros factores en la solucin.

6.- Validacin del anlisis factorial

Comprende la evaluacin del grado de generalidad de los resultados para la poblacin
y la influencia potencial de causas o individuos sobre los resultados globales
el mtodo ms directo de validacin de los resultados consiste en adoptar una
perspectiva de confirmacin, valorando la replicabilidad de los resultados, bien
dividiendo la muestra con los datos originales, bien con la muestra adicional
Estos mtodos cuentan con un uso ocasional, debido en parte a:
la percepcin de ausencia de sofisticacin.
La no disponibilidad de software o programas analticos que automaticen las
comparaciones
La estabilidad de los resultados del modelo factorial, esta estabilidad factorial depende
primeramente del tamao muestral y del nmero de casos por variable. El investigador
siempre est obsesionado por contar con el mayor tamao muestral posible y
desarrollar modelos parsimoniosos que incrementen la ratio-casos-por-variable. Si el
tamao muestral lo permite, el investigador puede dividir aleatoriamente la muestra
en dos subconjuntos y estimar modelos factoriales de cada uno.

Adems de la generalidad, otro aspecto de importancia para la validacin del anlisis
factorial es la deteccin de observaciones influyentes. El investigador procura estimar
el modelo con y sin observaciones identificadas como atpicas para valorar su
influencia sobre los resultados.

7.-Usos adicionales de los resultados del anlisis factorial

Si el objetivo simplemente consiste en identificar combinaciones lgicas de
variables y una mejor comprensin de las relaciones entre variables, entonces
basta con la interpretacin de los factores.
Si el objetivo es identificar variables apropiadas para aplicaciones
subsiguientes de otras tcnicas estadsticas, se emplear alguna forma de
reduccin de datos. Las alternativas consisten en:
o Examinar la matriz de factores y seleccionar la variable con mayor
carga factorial como un representante de una dimensin particular.
o Reemplazar el conjunto original de variables por uno totalmente
nuevo con menos variables creado a partir de escalas aditivas o de la
puntuacin de factores
Captulo 2 Estadstica Superior
12

a) Seleccin de variables suplentes para el anlisis subsiguiente:
Si el objetivo del investigador es sencillamente identificar variables apropiadas para la
aplicacin subsiguiente de otras tcnicas estadsticas, cuenta con la alternativa de
examinar la matriz factorial y seleccionar la variable con la mayor carga factorial sobre
cada factor que acte como variable suplente del factor.

La aproximacin de seleccionar una variable como representativa del factor cuenta
con varios inconvenientes potenciales:
1- No orienta sobre el error de medida que aparece cuando se emplean medidas
nicas y se corre, adems, el riesgo de confundir potencialmente los resultados
seleccionando slo una nica variable para representar un resultado
posiblemente ms complejo.
2- En casos donde varias cargas elevadas complican la seleccin de una nica
variable, el investigador puede no tener otra eleccin que la de emplear el
anlisis factorial como la base para calcular una escala aditiva o la puntuacin
de factores para usar como variables suplentes.
b) Creacin de escalas aditivas:
La escala aditiva est formada por la combinacin de varias variables individuales
dentro de una nica medida compuesta. Se combinan todas las variables que cargan
alto sobre un factor, y el total se emplea como variable de sustitucin. Una escala
aditiva cuenta con dos ventajas concretas:
1- Es una forma de eludir en alguna forma el error de medida inherente a todas
las variables observadas. El error de medida es el grado en el cual los valores
observados no son representativos de los valores verdaderos debido a cierto
nmero de razones, desde errores reales (errores de entrada de datos) a la
incapacidad de los individuos de suministrar informacin con precisin. El error
de medida enmascara cualquier relacin y hace ms difcil la estimacin en los
modelos multivariantes. La escala aditiva reduce el error de medida utilizando
indicadores mltiples para reducir la desconfianza sobre una nica respuesta.
2- Su capacidad para representar los mltiples aspectos de un concepto en una
nica medida.
Cuatro aspectos bsicos en la construccin de cualquier escala aditiva: la definicin
conceptual, la Dimensionalidad, la fiabilidad y la validacin:
Definicin conceptual: especifica las bases tericas de la escala aditiva
definiendo el concepto que est representado en trminos aplicables al
contexto de investigacin. La definicin conceptual es la que orienta y
concreta el carcter y tipo de tems que son candidatos a ser incluidos en la
escala
La validacin del contenido es la evaluacin de la correspondencia de las
variables incluidas en la escala aditiva con su definicin conceptual. Esta forma
de validacin, tambin conocida como validacin aparente, sirve para apreciar
subjetivamente la correspondencia entre los tems individuales y el concepto a
travs de evaluaciones de expertos, contrastes precios con mltiples
subpoblaciones, u otros medios. El objetivo es asegurar que los tems de la
Captulo 2 Estadstica Superior
13

escala abarquen algo ms que aspectos empricos, tambin consideraciones
tericas y prcticas.
Dimensionalidad: los tems sean unidimensionales, lo que significa, que estn
fuertemente asociados unos con otros representando un nico concepto. El
contraste de unidimensionalidad consiste en que en una escala aditiva los
tems carguen de forma elevada en un nico factor
Fiabilidad: es el grado de consistencia entre mltiples medidas de una variable.
Una forma de fiabilidad es el test-retest por el cual la consistencia se mide
entre las respuestas de un individuo en dos momentos del tiempo. El objetivo
es asegurar que las respuestas no varan demasiado a lo largo de perodos
temporales por lo que una medida tomada en cualquier momento del tiempo
es certera. Una segunda medida de la fiabilidad ms utilizada es la consistencia
interna que se aplica a la consistencia entre las variables en una escala aditiva.
o Alfa de Cronbach: es el coeficiente de fiabilidad que valora la
consistencia de la escala entera, es la medida ms extensamente
usada.
Lmite inferior es de 070, aunque puede bajar a 060 en la
investigacin explanatoria.
Un aspecto en la valoracin del alfa de Cronbach es su relacin positiva
con el nmero de tems de la escala. Debido a que al aumentar el
nmero de tems, incluso con el mismo grado de intercorrelaciones, se
incrementar el valor de la fiabilidad, los investigadores deben
imponer requisitos ms restrictivos para escalas con un mayor nmero
de tems. Tambin estn disponibles medidas de fiabilidad derivadas
del anlisis factorial confirmatorio. Dentro de ellas estn la fiabilidad
compuesta y la varianza media extrada.
Validacin: es la medida en que una escala o conjunto de medidas representa con
precisin el concepto de inters. Las tres formas ms extensamente admitidas de
validacin son la convergente, la discriminante y la nomolgica:
o La validacin convergente valora el grado en el cual dos medidas del mismo
concepto estn correlacionadas. Altas correlaciones indican que la escala est
midiendo el concepto que s epretenda. La validacin discriminante es el grado
en el cul dos conceptos conceptualmente parecidos difieren. El contraste
emprico de nuevo es la correlacin entre las medidas, pero esta vez la escala
aditiva est correlacionada con una medida parecida.
o La validacin nomolgica refleja el grado en que la escala aditiva hace
predicciones precisas de otros conceptos en un modelo basado en la teora.