Академический Документы
Профессиональный Документы
Культура Документы
Introduccin
En diferentes campos del conocimiento, el anlisis numrico de la informacin frecuentemente se realiza por medio de distintos clculos estadsticos.
Actualmente, se encuentran disponibles mtodos que otorgan nuevas posibilidades de tratamiento cuantitativo, que ciertamente no sera posible realizar con los procedimientos tradicionales uni y bivariantes. Estos mtodos,
integrados por una serie de tcnicas de anlisis de datos que forman parte
Enfoques XXV, 1 (Otoo 2013): 65-92
66
Closas y otros
W. R. Dillon y M. Goldstein, Multivariate Analysis. Methods and Applications (New York: Wiley
& Sons, 1984).
67
68
Closas y otros
R. J. Harris, A Primer of Multivariate Statistics (Orlando, FL: Academic Press, 1985, 2 ed.).
A. H. Closas, Ecuaciones estructurales, una tcnica estadstica para formular y contrastar
modelos de relaciones causa-efecto, Actualidad y Prospectiva 1, n 7 (Noviembre, 2011):
175-189.
5
6
Clasificacin
Las tcnicas multivariantes pueden ser clasificadas de acuerdo con Uriel
y Alds en dos grandes grupos:7
Tcnicas explicativas o de dependencia
69
70
Closas y otros
A modo de ejemplo, un investigador puede querer establecer cmo influyen las variables antes mencionadas nivel educativo, edad y gnero no slo
sobre el nivel de ingresos, medido en pesos, sino tambin sobre el nivel de satisfaccin con el empleo actual, medido mediante una escala tipo Likert en la que
las opciones se valoran de 1 (totalmente insatisfecho) a 5 (totalmente satisfecho) puntos, por lo que ambas variables dependientes resultan mtricas.
En vista del ejemplo presentado, es fcil ver que la regresin lineal mltiple
conforma un caso particular del anlisis de correlacin cannica cuando
slo se dispone de una variable dependiente.
71
72
Closas y otros
En este anlisis se consideran simultneamente varias variables dependientes que supuestamente estn relacionadas entre s. Se utiliza en situaciones en las que la muestra total est dividida en varios grupos basados en
una o varias variables independientes (factores) no mtricas, mientras que las
dependientes son mtricas. Su objetivo (similar al que persigue la correlacin
cannica) es averiguar si hay diferencias significativas entre dichos grupos en
cuanto a las variables dependientes se refiere.
Ecuaciones estructurales
La totalidad de los mtodos expuestos hasta el momento permiten evaluar de qu manera se presenta una relacin entre dos conjuntos de variables.
Sin embargo, existen otras alternativas (utilizan mltiples ecuaciones) que se
emplean en aquellos casos en los que se deben analizar varias relaciones. El
siguiente esquema simplificado, refleja el objetivo de estas tcnicas:
En efecto, el estudio del conjunto de relaciones que anteceden es el objeto del mtodo denominado sistemas de ecuaciones estructurales, el cual est
conformado en esencia por dos tcnicas: (a) anlisis factorial confirmatorio,
y (b) modelos de estructuras de covarianza.
El propsito de este mtodo reside en analizar las relaciones existentes
entre un grupo de variables representadas por sistemas de ecuaciones simultneas en las que se supone que algunas de ellas (denominadas constructos,
factores subyacentes o variables latentes) se miden con error a partir de otras
variables observables o manifiestas denominadas indicadores. Los modelos
utilizados constan de dos partes: un modelo estructural que especifica las
relaciones de dependencia existente entre las variables latentes y un modelo
de medida que especifica cmo los indicadores se relacionan con sus correspondientes constructos.
En caso de encontrase ante una situacin en la que sea imposible distinguir conceptualmente entre variables dependientes e independientes, y
lo que interesa es determinar cmo y por qu las variables estn correlacionadas entre s; entonces, se debe recurrir a los mtodos estadsticos de
interdependencia, pues son los que abordan estas cuestiones. Las tcnicas de
anlisis de interdependencia son las que se observan en la Figura 2.
Seguidamente, se brindan algunos aspectos de los mtodos de interdependencia explicitados en la Figura 2 que, como se ha dicho, no distinguen
entre variables dependientes e independientes y su objetivo reside en identificar qu variables estn relacionadas, cmo lo estn y por qu.
73
74
Closas y otros
Esta tcnica estadstica pretende representar en un espacio multidimensional reducido la relacin existente entre las categoras de dos variables
no mtricas. En el anlisis de correspondencias, el mapa perceptual que se
obtiene muestra las distancias entre los distintos niveles de dos variables,
por lo que suele decirse que este anlisis sirve para visualizar tablas de contingencia. Por ejemplo, si se desea saber si existe relacin entre dos variables
(tipo de ocupacin de un sujeto y universidad donde se gradu), cada una de las cuales
tiene 15 niveles. La tabla que se obtendra, de 15x15, impedira distinguir
con facilidad lo que se desea conocer; sin embargo, el anlisis de correspondencias permitira mostrar un mapa, probablemente bidimensional, en el
cual una universidad estar tanto ms cerca de un tipo de ocupacin, cuanto
mayor sea la frecuencia de esa celda en la tabla de contingencia. Esta tcnica,
cuya teora data de principios del siglo XX, pese a su innegable utilidad, no
ha sido tan utilizada como otras en investigacin en ciencias sociales. Este
hecho curioso, posiblemente sea debido a que fue en los trabajos realizados
El anlisis de escalamiento multidimensional (MDS, multidimensional scaling) es una tcnica de reduccin de datos, como lo es el anlisis factorial o el
anlisis de componentes principales. El objetivo principal de esta tcnica es
representar N objetos en un espacio dimensional reducido (q dimensiones,
siendo q < N), de tal forma que la distorsin causada por la reduccin de la
dimensionalidad sea la menor posible; es decir, que las distancias entre los
objetos representados en el espacio q dimensional, sean lo ms parecidas
posible a las distancias en el espacio N dimensional.
A efectos de evaluar la proximidad de estas distancias, se utiliza un indicador que suele denominarse stress o s-stress. Un clsico ejemplo que se
emplea para ilustrar la aplicacin y objetivos de esta tcnica, es la reconstruccin del mapa de un pas con la posicin aproximada de sus ciudades,
a partir de una matriz conformada por las distancias en kilmetros entre
aquellas ms importantes de dicho pas.
75
76
Closas y otros
Las tcnicas multivariantes son, en su mayora, herramientas muy poderosas que permiten al investigador extraer abundante informacin de los
datos disponibles. Estas tcnicas son, en s mismas, relativamente complejas
y requieren para su utilizacin un conocimiento profundo de sus fundamentos y condiciones de aplicabilidad. Sin embargo, el notable desarrollo de programas informticos de manejo sencillo y el invariable avance de la tecnologa estn provocando que, en muchas reas de conocimiento, y de manera
especial en el campo de las ciencias sociales, las tcnicas de anlisis multivariante estn siendo ampliamente empleadas. El problema que de inmediato
se presenta es que el uso indiscriminado de los paquetes estadsticos genera,
muchas veces, que no se utilicen adecuadamente, puesto que el usuario con
frecuencia carece del suficiente respaldo terico que el escenario requiere.
En virtud de lo que precede, en este apartado se brinda una gua para
la correcta aplicacin de las tcnicas multivariantes y el posterior arribo a
conclusiones razonables. El desarrollo que a continuacin se expone sigue
el proceso planteado por Hair et al.9
1. Definicin del problema que se est investigando, sus objetivos y decisin sobre la tcnica multivariante que debe utilizarse: para ello se
debe realizar una adecuada aproximacin terica al problema que se
aborda; esto es, analizar conceptualmente el objeto de investigacin,
especificar los objetivos e identificar las relaciones fundamentales que
se pretenden investigar. Slo despus de haber realizado lo anterior,
se pueden seguir los esquemas representados en el apartado previo
para seleccionar la tcnica ms conveniente.
2. Desarrollo del plan de anlisis: una vez establecido el modelo conceptual, el nfasis debe centrarse en aplicar correctamente la tcnica
elegida, por lo que ser necesario observar que la muestra posea un
tamao que permita su aplicacin. Tambin, debe asegurarse que los
instrumentos que se usan en el procedimiento de recogida de datos
(e.g., cuestionarios, escalas, tests) midan las variables con las escalas
pertinentes (mtricas y/o no mtricas).
3. Anlisis de las condiciones de aplicabilidad de la tcnica elegida: tras
haber recogido los datos, es necesario evaluar las hiptesis subyacentes
J. F. Hair, R. E. Anderson, R. L. Tatham y W. Black, Multivariate Data Analysis (Englewood
Cliffs, NJ: Prentice-Hall, 1995, 4 ed.).
77
78
Closas y otros
M. de aprendizaje
CI
CP
AA
.188**
.148**
.235**
M. de logro
.014
.011
.106*
M. de refuerzo social
.064
.017
.001
El propsito de esta investigacin fue elaborar un modelo ajustado y representativo de las relaciones que se establecen entre ciertas variables de tipo
personal y contextual que explique de qu manera las mismas influyen en el
rendimiento en Matemticas. La muestra estuvo compuesta por 441 alumnos (176 hombres y 265 mujeres) de la Facultad de Ciencias Econmicas de
la Universidad Nacional del Nordeste de Argentina, con una edad promedio
de 20 aos y desviacin estndar de 2.94.
El desarrollo de este trabajo presenta la estructura clsica que tienen las
investigaciones de este tipo. En el mismo fueron previstas dos partes, la primera corresponde al anlisis terico (permiti identificar las variables que,
segn la apreciacin del autor de este trabajo, explican y modulan de manera
significativa el rendimiento en Matemticas) y la segunda se relaciona con el
estudio emprico, en cuyo marco se plantea la discusin de resultados y las
conclusiones.
En principio, se propone un modelo terico integral y jerrquico mediante el
cual se pretende explicar la varianza del problema que se investiga. En la
etapa emprica, el proceso de anlisis estadstico de datos revelados fases
claramente diferenciadas: los anlisis previos (descriptivos, de varianza, correlacionales, de regresin y factorial exploratorio) y los anlisis confirmatorios (modelos de ecuaciones estructurales). Los primeros, situados en el
dominio de la estadstica descriptiva e inferencial, permitieron observar que,
en general, el comportamiento de las variables, por un lado, armoniza aceptablemente con la propuesta inicial del modelo y, por otro, se encuentra en
consonancia con los aportados por distintas investigaciones anlogas. Los
segundos, en cambio, pusieron en evidencia que si bien existe, casi siempre,
validez de constructo de las variables latentes consideradas, se presentan
79
80
Closas y otros
sealar que el anlisis electrnico de los datos,12 se realiz con ayuda de los
programas SPSS (anlisis previos) y EQS (anlisis confirmatorios).
Investigaciones en Psicometra
Desarrollo y validacin de un Cuestionario
de Toma de Decisiones (Decision-Making
Questionnaire)
12
81
82
Closas y otros
Fig. 4. Confirmatory factor analysis of the Decision-Making Questionnaire (DMQ) [Anlisis factorial
confirmatorio del Cuestionario de Toma de Decisiones (CTD)].
Note. ns = non significant effect, *p < .05.
Fuente: Sanz de Acedo et al. (2009)
83
84
Closas y otros
A efectos de juzgar el ajuste global del modelo se ha asumido inicialmente, siguiendo a Schermelleh-Engel, Moosbrugger y Mller,15 una estrategia
basada en cuatro ndices: el estadstico c2, junto con la razn entre c2 y los
grados de libertad (c2/df), y otros indicadores descriptivos, que no dependen tanto del tamao de la muestra, como CFI, NNFI y RMSEA, todos
los cuales fueron citados en el trabajo presentado en segundo lugar en el
apartado anterior. El tests chi-cuadrado result estadsticamente significativo, c2(32) = 58.05, p = .002, lo que, en principio, podra hacer pensar en una
posible inadecuacin del modelo (si = .05); no obstante, el cociente c2/
df, que suele acompaar al estadstico c2 debido a la especial sensibilidad de
ste al tamao muestral, siguiendo a Jreskog y Srbom,16 fue de 1.81. Los
ndices CFI y NNFI adoptaron valores .98 y .97, respectivamente; mientras
que el lmite inferior del intervalo confidencial para la RMSEA fue .02 y su
estimacin puntual, .04, indicativos todos ellos de un buen ajuste entre el
modelo y los datos.
Por ltimo, se aaden, a los ndices de comparacin estimados en primer
trmino, los restantes estadsticos prcticos que proporciona EQS, entre los
que se encuentran Normed Fit Index (NFI) = .95, Incremental Fit Index (IFI)
= .98 y Mc Donalds Fit Index (MFI) = .97. Estos indicadores tambin dejan
en evidencia que el modelo alcanz bondad de ajuste, dado que superan
el criterio de .90 recomendado por Bentler.17 En resumen, ha sido posible
comprobar que la matriz de varianzas y covarianzas observada, y la predicha
por el modelo especificado de acuerdo con las relaciones tericas asumidas
no son significativamente diferentes; por lo tanto, el modelo seleccionado se
ajusta al modelo emprico.
Conceptualmente puede decirse que los anlisis psicomtricos revelaron
una consistencia interna satisfactoria y estructura factorial de primer orden
compuesta por diez escalas: incertidumbre, presin tiempo/dinero, informacin y metas, consecuencias de la decisin, motivacin, autorregulacin,
cognicin, emocin, presin social, y presin en el trabajo. A su vez, estas
escalas han producido una estructura factorial de segundo orden, compuesta
por: tarea, sujeto, y contexto. Los resultados de esta investigacin ponen de
K. Schermelleh-Engel, H. Moosbrugger y H. Mller, Evaluating the fit of structural
equation models: Tests of significance and descriptive goodness-of-fit measures, Methods
of Psychological Research Online 8, n 2, (August, 2003): 23-74.
16
K. G. Jreskog y D. Srbom, Lisrel 8: Structural Equation Modeling with the SIMPLIS Command
Language (Hillsdale, NJ: Scientific Software International, 1993).
17
P. M. Bentler, EQS Structural equations program manual (Encino, CA: Multivariate Software,
2006).
15
manifiesto las formas en que los jvenes, los adultos y las personas mayores
se ven influidas por diversos factores al tomar decisiones. Tambin sugieren
que los hombres son ms propensos que las mujeres a buscar y analizar
informacin, mientras que las mujeres dan ms valor a la disponibilidad de
tiempo y dinero. El artculo concluye que el DMQ examina los factores que
tienen mayor influencia en las decisiones profesionales y que podra guiar a
los adolescentes en el proceso de decisin vocacional.
Validacin de un cuestionario sobre estrategias
de aprendizaje para estudiantes universitarios
18
19
85
86
Closas y otros
de cada una de las subescalas y de cada uno de los tems que componen las
categoras de la prueba aplicada; y, por otro, determinar la validez predictiva
del instrumento, as como la ecuacin de prediccin que mejor describa la
relacin entre la variable criterio (Rendimiento acadmico) y las variables
predictoras (dimensiones de las ACRA). En todos los casos, el procesamiento y anlisis de los datos fue realizado con ayuda del programa informtico
SPSS 15.0.
En efecto, se comienza por sealar que los resultados relativos a los estudios descriptivos de los distintos tems fueron muy similares a los informados por los autores del cuestionario simplificado,20 lo que era de esperar
en atencin a que no se realizaron modificaciones de ningn tipo en las
preguntas, ni en la estructura de la prueba. Los ndices de consistencia interna hallados tanto para el total de la prueba ( de Cronbach = .93), como para
cada una de las dimensiones fueron correctos en todos los casos (van de .70
a .91). Ms an, respecto de los indicadores de Cronbach cuando se excluye
el tem, se puede sealar que se observan valores aceptables en la dimensin
Estrategias de adquisicin (oscilan entre .66 y .70), valores correctos en las
subescalas Estrategias de codificacin (van de .76 a .80) y Estrategias de recuperacin (varan entre .74 y .77), mientras que los ms altos se encuentran
en la categora Estrategias de apoyo (se hallan entre .89 y .91), todo lo cual
sugiere que el cuestionario utilizado puede considerarse un instrumento con
una fiabilidad aceptable.
En la Tabla 2 pueden apreciarse los valores de la media, la desviacin tpica, la
correlacin tem-total y el coeficiente alfa de Cronbach, obtenidos por los individuos
de la muestra en cada uno de los tems del cuestionario utilizado. Los dos
primeros estadsticos (media y desviacin tpica) son de mucha utilidad, puesto
que el conocimiento de ambas medidas ayuda a comprender, entre otras cosas, la distribucin de los datos de la muestra. El tercero de los estadsticos
nombrados (correlacin tem-total), recoge el grado de relacin que cada uno
de los tems posee con el total de la dimensin a la que pertenece, lo que
puede considerarse un indicador de su grado de discriminacin. La fiabilidad
es una de las caractersticas fundamentales de un test, una de las forma de
evaluarla es mediante el cuarto estadstico (coeficiente alfa de Cronbach) el cual
sitarios, Revista La UTN en el NEA: Investigacin y Desarrollo en la Regional Resistencia 1, n 1
[Julio, 2012]: 75-86).
20
J. De la Fuente y F. Justicia, Escala de estrategias de aprendizaje ACRA-Abreviada para
alumnos universitarios, Revista electrnica de investigacin educativa y psicopedaggica 2, n 1 (Octubre, 2003): 139-158.
Estrategias de
adquisicin
Media = 25.28
DT = 5.11
= .70
Estrategias de
codificacin
Media = 26.73
DT = 5.84
= .80
Estrategias de
recuperacin
Media = 36.90
DT = 6.61
= .77
tem
tem 1
tem 2
tem 3
tem 4
tem 5
tem 6
tem 7
tem 8
tem 9
tem 1
tem 2
tem 3
tem 4
tem 5
tem 6
tem 7
tem 8
tem 9
tem 10
tem 1
tem 2
tem 3
tem 4
tem 5
tem 6
tem 7
tem 8
tem 9
tem 10
tem 11
tem 12
tem 13
Media
DT
Correlacin
tem-total
de Cronbach
2.66
2.82
2.57
2.40
2.67
3.25
3.33
2.77
2.80
2.82
3.03
2.72
3.23
2.82
2.30
2.46
2.23
2.67
2.45
2.96
2.89
2.82
2.69
2.61
3.15
2.93
3.01
3.17
2.69
2.24
2.81
2.73
.97
1.11
1.18
1.16
1.10
.93
.88
1.06
.97
.89
1.02
.96
.85
.96
1.02
1.09
1.13
.95
.93
.88
.92
.90
1.00
1.03
.90
.94
.97
.84
.97
1.01
.94
.95
.22
.46
.31
.45
.42
.49
.44
.29
.32
.40
.45
.31
.44
.55
.55
.59
.56
.36
.47
.51
.45
.36
.39
.30
.41
.43
.36
.43
.43
.30
.42
.38
.70
.66
.69
.66
.67
.66
.67
.69
.69
.79
.78
.80
.78
.77
.77
.76
.77
.79
.78
.74
.75
.76
.76
.77
.75
.75
.76
.75
.75
.77
.75
.76
sin el tem
87
88
Closas y otros
Tabla 2. Estadsticos descriptivos y de correlacin de los tems medidos en pruebas (cont.)
Dimensin
Estrategias
de apoyo
Media = 58.85
DT = 14.35
= .91
tem
tem 1
tem 2
tem 3
tem 4
tem 5
tem 6
tem 7
tem 8
tem 9
tem 10
tem 11
tem 12
tem 13
tem 14
tem 15
tem 16
tem 17
tem 18
tem 19
tem 20
tem 21
Media
DT
Correlacin
tem-total
de Cronbach
2.68
2.78
2.74
2.97
2.78
2.52
2.51
2.54
2.89
2.62
3.09
2.82
2.51
2.74
3.15
3.05
3.18
2.86
3.04
3.08
2.55
1.00
.97
1.04
1.05
1.04
1.07
1.18
1.20
.97
1.01
1.13
1.07
1.17
1.30
1.16
1.18
1.05
1.19
1.06
1.16
1.21
.57
.60
.56
.63
.51
.51
.41
.41
.55
.49
.57
.49
.53
.45
.64
.58
.60
.55
.61
.61
.37
.90
.89
.90
.89
.90
.90
.91
.91
.90
.90
.89
.90
.90
.90
.89
.89
.89
.90
.89
.89
.91
sin el tem
Estrat. de
adquisicin
Estrat. de
codificacin
Estrat. de
recuperacin
Estrat. de
apoyo
Rendimiento
acadmico
.68**
.59**
.45**
.03
.60**
.39**
.06
.53**
.04
.16*
Estrat. de apoyo
Rendimiento
acadmico
89
90
Closas y otros
Discusin y conclusiones
En este trabajo se haba propuesto, por una parte, brindar un panorama
introductorio sobre distintos conceptos del anlisis multivariante y, por otra,
proporcionar informacin en forma breve acerca de algunas aplicaciones
en el rea de Psicologa Educativa y Psicometra, las cuales fueron implementadas con el fin de lograr los objetivos planteados en cada una de las
investigaciones presentadas y en las que, de diferente manera, se ha tenido la
oportunidad de intervenir.
Pues bien, en atencin tanto al desarrollo de los conceptos, como a la
presentacin de las aplicaciones realizadas del tema objeto de estudio, se
considera que la meta perseguida, ms all de algunas debilidades que difcilmente puedan evitarse en este tipo de elaboraciones, ha sido razonablemente lograda.
El anlisis multivariante es, en esencia, un conjunto de tcnicas orientadas al estudio de varias variables de modo simultneo, con el objeto de
comprender mejor el fenmeno o evento que se analiza. Esta situacin se
presenta debido a que mediante los mtodos disponibles es posible generar
una explicacin ms rica y cercana a la realidad, lo que deriva, a su vez, en un
mayor conocimiento del fenmeno y, por lo tanto, en un escenario apropiado para la seleccin optima de la decisin o respuesta de inters.
En vista de ello, y de las diferentes apreciaciones realizadas en distintos
momentos de este trabajo, se podra sealar que el desarrollo de la teora
multivarianteque se inici realmente en el siglo XX, junto con sus aplicacionessurgidas en la dcada del treinta, as como el notable y sostenido
progreso de la tecnologa y de programas estadsticos, son componentes de
un mismo conjunto que usados en forma complementada permiten llevar
adelante numerosas investigaciones, explicar muchos fenmenos, alcanzar
diversos objetivos y probar diversidad de hiptesis, todo lo cual de otra manera no hubiera resultado posible.
Evidentemente, las tcnicas que conforman el anlisis multivariante poseen
en la actualidad una enorme importancia puesto que, adems de la utilidad
que tradicionalmente han tenido, forman parte del grupo de mtodos, ms o
menos sofisticados, que se encuentran englobados en el concepto de minera
de datos (DM, Data Mining). Este hecho, en razn de la vigencia y utilizacin de
la DM en diferentes reas, como Educacin, Psicologa, Biometra, Ecologa,
Economa, Marketing, etc., a efectos de abordar problemas de prediccin,
91
92
Closas y otros