Академический Документы
Профессиональный Документы
Культура Документы
Carlos Camacho
Ana Mara Lpez
INDICE
____________________________________________________________________________
1.- Introduccin
X1
r21
X2
rk1
rk2
Xk
Figura 1.1
Se observa que existen k variables independientes y una nica variable dependiente. La
variable Y queda explicada por las distintas variables X, como se refleja en la flecha
unidireccional, mientras que las X presentan flechas bidireccionales, indicndose que las
correlaciones entre ellas muestran tan slo covariacin o concomitancia y no el sentido de
explicacin o produccin.
Aunque este tipo de modelos es ampliamente utilizado, adolece de una cierta simplicidad en
su estructura. Ms realista resultan otros planteamientos donde se entremezclan variables
dependientes e independientes, donde ciertas variables que explican son a su vez, explicadas
por otras, constituyndose de esta forma cadenas de causa-efecto que evidentemente se
acomoda mejor a la naturaleza de los fenmenos. Supongamos, en este sentido, que
deseamos estudiar la incidencia que sobre el Exito profesional (Y) tienen las variables: Nivel
de estudios (X1 ), Clase social (X2 ) e Inteligencia (X3 ). Si aplicsemos el modelo de
Regresin mltiple utilizado hasta ahora, tendramos la siguiente estructura de relacin:
e
X1
r21
X2
r31
r32
X3
Figura 1.2
No obstante, pueden plantearse otras alternativas. Si suponemos que la Clase social y el Nivel
de estudios son los condicionantes de la Inteligencia, que a su vez, es la que determina el
xito profesional, tendremos la siguiente estructura:
X1
X3
r21
X2
Figura 1.3
O bien, podemos suponer, que el Nivel de estudios ejerce un efecto exclusivo sobre la
Inteligencia, mientras que la Clase social afecta, por un lado, independientemente sobre el
xito profesional y, por otro, a travs e la Inteligencia. Segn esta lgica el diagrama sera:
X1
X3
r21
X2
Figura 1.4
Con estas variables podramos sugerir otros muchos modelos alternativos, cosa que no haremos
para no aburrir al lector. No obstante, dejamos en sus manos, como ejercicio intelectual, la
bsqueda de algn otro modelo que estime ms razonable.
Los modelos aqu tratados reciben en la literatura estadstica el nombre genrico en ingls de
Path Analysis. Fue desarrollado en sus orgenes con este nombre por Sewall Wright (1921) en
el campo de la biologa. Podemos traducir la palabra "path" como "camino", "va" o
"sendero". En castellano el trmino Path Analysis quedara traducido como Anlisis de caminos
(vas o senderos) por cuanto en estos modelos se especifican los caminos por donde se cursan las
relaciones de influencia entre unas variables y otras. Obsrvese a ttulo de ejemplo, las figuras
1.3 y 1.4 cmo el hecho diferencial entre ambas radica precisamente en el conjunto flechas o
relaciones establecidas.
Por nuestra parte preferimos denominar a este tipo de modelos modelos estructurales con
variables observadas. Decimos "modelos estructurales" por cuanto el conjunto de conexiones o
relaciones puede entenderse como la estructura de relacin establecida entre las variables. Nos
parece un trmino ms genrico y clarificador de lo que se quiere expresar. Decimos "con
variables observadas" para distinguirlo de otros tipos de modelos de mayor complejidad
donde se trata adems variables no observables o latentes.
No obstante, y a nuestro pesar, utilizaremos el trmino Path anlisis (mescolanza de ingls y
espaol), que es la forma ms usual de referirse a tales modelos en nuestro pais. Hemos de decir
a este respecto, que el Path anlisis se considera un submodelo del LISREL (LInear Structural
RELationship), de propsito ms general, que contempla casusticas tales como error de medida
y variables latentes, que no trataremos por el momento. En estas pginas trataremos el Path
anlisis desde la perspectiva LISREL.
Este tipo de modelos se encuentran tambin en la literatura con el nombre de modelos
causales por cuanto parece determinarse, por la estructura de relacin establecida, las
variables causa y las variables efecto. A este respecto, convienen indicarse (aunque sobre este
punto nos extenderemos ms adelante) que este tipo de modelos no sirve para "detectar" las
causas de un cierto fenmeno, sino ms bien su objetivo es bastante ms limitado; el
investigador propone, segn su especial conceptualizacin del fenmeno estudiado, una
determinada estructura de relacin. Todo el aparato estadstico consecuente sirve tan slo para
mostrar la viabilidad del modelo propuesto con la informacin de partida(matrices de
varianzas-covarianzas o de correlaciones) sin que con ello se descarten otros posibles modelos,
igualmente viables.
En las siguientes pginas profundizaremos en estas ideas. Expondremos, en primer lugar, las
condiciones de aplicacin existentes sobre los modelos de Path anlisis. A continuacin
desarrollaremos las distintas fases en el proceso de elaboracin de un determinado modelo. Por
ltimo, discutiremos el problema de la identificacin de los modelos y del ajuste de los
mismos a la realidad estudiada.
d) Incorrelacin de los errores. Esta condicin es doble. Por un lado los errores no
deben correlacionar con las variables independientes. Esto es:
reixi = 0
Y por otro lado, los errores no deben correlacionar entre s. Es decir:
reiej = 0
en
la elaboracin de un
X1
11
21
21
Y1
Y2
12
X2
22
Figura 1.5
Se distinguen variables exgenas y endgenas. Las variables exgenas
(o tambin,
predeterminadas) son aquellas que se encuentran en el lmite del modelo. En otro contexto
es lo que conocemos como variables explicativas o independientes. Transmiten su
variabilidad al interior del modelo, pero queda sin especificar la fuente de variacin que da
lugar a ellas. Son "causa", en sentido restringido, en la medida que explican -hasta cierto
punto- el comportamiento del sistema. En la figura 1.5 las variables X1 y X2 son variables
exgenas.
Por el contrario, las variables endgenas se caracterizan por quedar explicada su variabilidad
en trminos de otras variables (exgenas o endgenas a su vez) Son lo que en otro
contexto hemos denominado variables explicadas o dependientes. Son "efecto" de ciertas
variables, aunque a su vez, pueden hacer el papel de "causa" de otras. En la figura 1.5
corresponden a las variables Y1 e Y2 . Se observa que la variable Y1 es causa de Y2 , pero que
a su vez es causada por X1 y X2 . Hace el papel de variable independiente y dependiente
simultneamente.
Observamos, de esta forma, que la notacin es diferente bien se trate de variables exgenas o
endgenas. Para las primeras
se utiliza genricamente la terminologa Xi , y para las
segundas, Yi . Por otro lado, las variables endgenas van ordenadas de menor a mayor segn
el grado de proximidad que presenten respecto a las variables exgenas. Aquellas variable
endgenas que son explicativas de otras variables endgenas tendrn menor rango que
aquellas variables que son exclusivamente explicadas. En el grfico anterior se contempla
que la variable Y1 , aunque endgena, es a su vez explicativa de Y2 , que no afecta a ninguna
otra variable; por esta razn, la primera tiene un subndice menor que la segunda.
El efecto de las variables exgenas sobre las variables endgenas viene indicado por los
parmetros ji (gamma). El primer subndice expresa la variable receptora Yj, y el segundo
subndice, la variable emisora Xi . En relacin a las variable endgenas, el efecto entre ellas
viene reflejado por los parmetros ji (beta) cuya interpretacin en cuanto a los subndices es
equivalente a la expresada anteriormente con ji ; esto es, ji muestra el efecto de la variable Yi
sobre Yj.
Las variables exgenas carecen de efectos entre ellas, ya que no se conciben como causadas
por ninguna otra. Por esta razn, la relacin que puedan mantener con otra variable exgena
queda expresada por su coeficiente de correlacin sobre una lnea curva con flechas en sus dos
extremos. Se indica con ello que la relacin no se analiza, y que entre ellas existe tan slo
covariacin, sin que se especifique la fuente de variabilidad. Esta es la relacin existente entre
las variables X1 y X2 .
Aqu, las correlaciones entre las variables exgenas se especifican mediante ji
(phi). Ya
que en este caso se supone que las variables Xj y Xi comparten informacin sin que haya
ninguna relacin de causalidad entre ellas, el primer y el segundo subndice hacen referencia a
tales variables sin que haya ningn orden establecido; esto es, hubiera sido igualmente vlido
ji . Hay que decir que cuando operamos con puntuaciones directas los valores ji hacen
referencia a las covarianzas entre las variables exgenas. En estos casos tiene sentido mencionar
ii como la varianza de la variable Xi.
Por lo que respecta a los trmino de error, se denominan i (zeta), coincidiendo el subndice
con el de la variable Yj a la que afecta dicho error. Por el momento no nos extenderemos ms
sobre los distintos parmetros. Ya hablaremos ms adelante de los tipos de matrices en que
pueden utilizarse para mencionar tales parmetros, y cmo de la estructura de dichas matrices
pueden deducirse, a su vez, la estructura de los diferentes modelos de Path anlisis.
12
X2
Figura 1.6
Y1
21
Y1
Y2
Figura 1.7
b) Efecto indirecto
Existe efecto indirecto entre dos variables cuando una de ellas ejerce influencia sobre la otra a
travs de una o ms variables intermedias. Por ejemplo, en el caso que estamos tratando, el
Clase social (X2 ) ejerce un efecto indirecto sobre el xito profesional (Y2 ) a travs de la
Inteligencia (Y1 ). Esto es:
Y1
21
Y2
X2
Figura 1.8
c) Efecto conjunto
Hace referencia a aquellas variables exgenas que presentan covariacin (una flecha curva
uniendo dichas variables con puntas en ambos extremos), donde no puede establecerse
claramente en qu direccin se encamina la relacin de influencia. Cuando algn recorrido se
realiza a travs de esta flecha curva, decimos que el efecto es conjunto (entre las variables de
ambos extremos de la flecha) al no poder especificar la relacin existente entre ambas variables.
Un caso de efecto conjunto es el que ejerce la variable Nivel de estudios (X1 ) sobre la
Inteligencia (Y1 ) cuando involucramos la variable Clase social (X2 ):
X1
21
Y1
12
X2
Figura 1.9
10
d) Efecto espreo
Existe efecto espreo entre dos variables cuando la covariacin existente entre ambas es
debida a una causa comn. Un ejemplo clsico de relacin esprea es la que se presentan
cuando sobre una muestra de nios de diferentes edades se estudia la relacin entre
Estatura e Inteligencia, donde sucede que la variable Edad es la causa de las dos variables
anteriores. El grfico de relacin es:
Estatura
Edad
Inteligencia
Figura 1.10
En el caso que estamos tratando, toda la relacin entre Inteligencia (Y1 ) y xito Profesional
(Y2 ) que no es efecto directo, es efecto espreo. Esto es, si descartamos el camino:
21
Y1
Y2
Figura 1.11
todos los dems caminos entre ambas variables sern efectos espreos al ser debidos a causas
comunes. Por ejemplo:
Y1
Y2
12
X2
22
Figura 1.12
Y tambin:
X1
11
Y1
21
Y2
X2
22
Figura 1.13
11
11
X1
21
Y1
Figura 1.14
Y2
12
11
Y1
Y2
X1
21
Figura 1.15
Una de las ventajas del LISREL (que supone un cierto esfuerzo al principio) reside en que
obliga a definir las matrices con las que se va a trabajar. A partir del conocimiento de stas es
posible deducir la estructura de relacin del modelo causal. Por estas razones conviene
familiarizarse con este tipo de matrices en aras de una mayor comprensin del modelo.
13
Retomando el modelo expresado en la figura 1.5, tenemos, como se sabe, que sus ecuaciones
correspondientes son:
y 1 = 11x1 + 12x 2 + 1
y 2 = 21y1 + 22x2 + 2
(1.2)
Si en estas ecuaciones reflejamos todas las variables del sistema, y no nicamente aquellas que
presentan enlaces, tendremos, entonces:
y 1 = 0 y1 + 0 y 2 + 11 x 1 + 12 x 2 + 1
y 2 = 21 y 1 + 0 y 2 + 0 x1 + 22 x 2 + 2
(1.3)
En notacin matricial:
y1 0
y =
2 21
0 y1 11
+
0 y 2 0
12 x1 1
+
22 x2 2
(1.4)
y = y + x +
(1.5)
donde:
y ( p*1) : vector constituido por las p variables endgenas
( p*p ) : matriz de coeficientes
x (q*1) : vector constituido por las q variables exgenas
( p*q ) : matriz de coeficientes
( p*1) : vector constituido por los p trminos de error
Adems de estas matrices, se suelen incorporar algunas ms que aaden carcter explicativo al
modelo. En este sentido, recordemos la matriz (Phi) que especifica las correlaciones entre
las variables exgenas, y que es conveniente para conocer el grado de relacin entre ellas. Por
otro lado, hemos de aadir una nueva matriz, la matriz (Psi), que expresa las correlaciones
entre los trminos de error. Aunque los modelos que estamos tratando son una restriccin del
planteamiento LISREL general y no se contemplan correlaciones entre distintos trminos de
error, sin embargo s es interesante conocer los elementos de la diagonal de la matriz , que
hacen referencia a las distintas proporciones de variacin no explicadas ligados a los diferentes
errores.
14
De esta forma, en relacin al modelo que estamos tratando, sus matrices relevantes, explicativas
del modelo en cuestin, seran:
Donde las diferentes matrices a considerar sern:
0
=
21
0
0
= 11
0
12
22
= 11
21 22
= 11
0
22
0
X1
11
21
Y1
12
X2
Figura 1.16
y 1 = 11x 1 + 12 x 2 + 1
= [ 11
12 ]
= 11
21
22
= [ 11 ]
15
11
21
X1
Y2
Y1
Figura 1.17
Calcular: a) ecuaciones estructurales, y b) las matrices de dicho sistema.
SOL:
Las ecuaciones del sistema sern:
y 1 = 11x 1 + 1
y 2 = 21y 1 + 2
En notacin matricial:
y 1 = 0
y 2 21
0 y1 11
[ ] 1
0 y 2 + 0 x1 + 2
0
=
21
0
0
= 011
= 11
21
22
= 0 11
0
22
Ejemplo 1.4.- Dada las siguientes matrices que configuran un determinado sistema:
0
=
21
0
0
= 011
12
0
13
0
11
= 21
31
22
32
33
= 0 11
0
22
16
SOL:
Por la matriz ? se deduce que es un modelo compuesto por las variables endgenas
Y1 e Y2 Por la matriz ? y sabemos que hay tres variables exgenas: X1 , X2 y X3 .
Adems, por la matriz ?deducimos que slo es afectada la variable Y1 por las distintas
variables exgenas. Por ltimo, la matriz nos indica que los errores estn
incorrelacionados. Por tanto, la estructura del modelo ser:
1
11
X1
21
12
X2
31
32
21
Y
13
Xk
Figura 1.18
17
21
X1
11
21
21
Y1
Y2
12
22
X2
Figura 1.19
Considerando que entre las variables X1 y X2 no existe relacin de causalidad, y por tanto,
slo se considera la correlacin entre ellas, tendremos que la reproduccin de los distintos
coeficientes de correlacin mediante la regla del trazado ser:
r y 1x1 = 11 + 12 21
ED
EC
(1.6)
11
X1
Y1
Y2
X2
Figura 1.20
Y un efecto conjunto con X (EC) a travs de 12 21 :
X1
21
Y1
12
X2
Figura 1.21
Y2
18
Para reproducir ry1x2 se observa una situacin equivalente que en ry1x1 . Existe un efecto directo
proporcionado por 12 y un efecto conjunto en el producto 11 21 :
r y 1x 2 = 12 + 11 21
ED
EC
(1.7)
Efecto directo ( 12 ):
X1
12
Y1
Y2
X2
Figura 1.22
Efecto conjunto ( 11 21 ):
X1
11
21
Y1
Y2
X2
Figura 1.23
En relacin a ry2 x1 :
r y 2 x 1 = 21 + 22 21 + 21 11 + 21 12 21
ED EC
EI
EC
(1.8)
19
Efecto directo ( 21 ):
21
X1
Y1
Y2
X2
Figura 1.24
Efecto conjunto ( 22 21 ):
X1
21
Y1
Y2
22
X2
Figura 1.25
Efecto indirecto ( 21 11 ):
X1
11
Y1
X2
Figura 1.26
21
Y2
20
Efecto conjunto ( 21 12 21 ):
X1
21
Y1
12
21
Y2
X2
Figura 1.27
En relacin a ry2 x2 :
ry 2 x2 = 22 + 12 21 + 21 12 + 21 11 21
ED
EC
EI
EC
(1.9)
Efecto directo ( 22 ):
X1
Y1
Y2
22
X2
Figura 1.28
Efecto conjunto ( 21 21 ):
X1
21
21
Y1
X2
Figura 1.29
Y2
21
Efecto indirecto ( 21 12 ):
X1
Y1
21
Y2
12
X2
Figura 1.30
Efecto conjunto ( 21 11 21 ):
X1
11
21
Y1
21
Y2
X2
Figura 1.31
En relacin a ry2 y1 :
r y 2y 1 = 21 + 12 11 + 22 12 + 21 21 12 + 22 21 11
ED EE
EE
EE
EE
(1.10)
Efecto directo ( 21 )
X1
Y1
X2
Figura 1.32
21
Y2
22
Efecto espreo ( 21 11 ):
21
X1
11
Y1
Y2
X2
Figura 1.33
Efecto espreo ( 22 12 ):
X1
Y1
12
Y2
22
X2
Figura 1.34
Efecto espreo ( 21 21 12 ):
21
X1
21
Y1
12
X2
Figura 1.35
Y2
23
11
21
Y1
Y2
22
X2
Figura 1.36
Como consecuencia de ello, tras haber aplicado la regla del trazado obtendremos el siguiente
sistema de ecuaciones:
rx 2x1
ry1x1
ry1x2
ry 2x1
ry 2x 2
ry 2y 1
= 21
= 11 + 12 21
= 12 + 11 21
= 21 + 22 21 + 21 11 + 21 12 21
= 22 + 21 21 + 21 12 + 21 11 21
= 21 + 12 11 + 22 12 + 21 21 12 + 22 21 11
Obsrvese que disponemos de seis ecuaciones, cuyos valores nos lo ofrecen las distintas
correlaciones, y seis incgnitas -los seis parmetros del modelo-, por lo que dicho sistema
ser resoluble y tendr solucin nica -modelos exactamente identificados-. Ya veremos en el
prximo apartado que pueden plantearse otras alternativas, tal como ms ecuaciones que
incgnitas -modelos sobreidentificados- o bien menos ecuaciones que incgnitas -modelos
subidentificados-.
Adems de los parmetros mencionados se suelen calcular los valores ii correspondientes a
las diferentes proporciones de variacin no explicada de las distintas variables endgenas del
modelo. As, en este modelo:
11 = 1 R y21.x1x2
22 = 1 R y22 .y1x1x2
En relacin a los valores de R2 puede demostrarse que su valor corresponde a la suma de
las correlaciones de todas las variables que inciden sobre la variable endgena en cuestin
por el valor de los coeficientes estandarizados que ligan estas mismas variables. De esta
forma tenemos:
24
Ejemplo 1.5.- Un determinado investigador desea estudiar las relaciones existentes entre las
variables Inteligencia (X1 ), Clase social (Y1 ) y Rendimiento (Y2 ). Para ello propone el
siguiente modelo:
X1
21
11
21
Y1
Y2
Figura 1.37
ry 2 x1 = 0. 8
ry 2y 1 = 0 . 6
Esto supuesto, determinar: a) las ecuaciones estructurales, b) los parmetros del modelo y, c)
los distintos efectos y su cuantificacin.
a) Las ecuaciones estructurales sern:
y 1 = 11x1 + 1
y 2 = 21 y 1 + 21x1 + 2
25
Haciendo operaciones:
21 = 0 .267
21 = 0.667
En relacin a 11 y 22 :
X1
0.667
0.5
0.307
0.75
0.267
Y1
Y2
Figura 1.38
11 21 = 0 . 8
EI = 0 . 5 * 0. 267 = 0 . 134
+
11 21 = 0 . 6
EE = 0 . 5 * 0 . 667
26
C
A
D
B
Y2
21
X1
32
11
21
31
Y1
Y3
Figura 1.40
27
t=
i 0
S i
i
S i
Siendo:
S i =
1 R2
q
N k 1 jj
28
ij 0
S ij
un
ij
S ij
Siendo:
S ij =
1 R2
q jj =
N k 1
ii
q jj
N k 1
donde:
ii : Proporcin de variabilidad no explicada de la variable endgena Yi
Ejemplo 1.7.- Suponiendo que hemos trabajado con una muestra de 100 sujetos, determinar
la significacin de los coeficientes path del ejemplo 1.5.
SOL:
Como se recuerda, el modelo era:
X1
21
11
Y1
21
Figura 1.41
Y2
29
En relacin a 11 :
11
q
N k 1 11
S 11 =
11
q =
N k 1 11
0 .75
*1 = 0.087
98
Por tanto:
t=
11
S 11
0. 5
= 5.715
0. 087
El valor de t obtenido es superior al de las tablas, luego puede considerarse 11 = 0.5 como
significativamente diferente de cero. Si recurrimos a las tablas on-line, para un valor de t=5.715
y 98 grados de libertad, su probabilidad asociada es inferior a 0.00001.
Para determinar 21 y 21 calculemos en primer lugar R-1 :
1 0.5
R 1 = 0.5 1
1 .333
= 0 .667
0.667
1.333
Luego:
S 21 =
S 21 =
22
q 11 =
N k 1
22
q =
N k 1 22
0 .307
* 1.333 = 0 .065
97
0 .307
* 1.333 = 0.065
97
30
t2 =
21
S 21
21
S 21
0.667
= 10.321
0.065
0.267
= 4.128
0.065
31
32
21
11
Y1
Figura 1.42
21
Y2
33
Se cumple que el nmero de correlaciones -ecuaciones del sistema- coincide con el nmero
de parmetros del modelo. En consecuencia gl=0. As, en relacin a este caso, tenemos las
siguientes ecuaciones bsicas:
ry1x1 = 11
ry2 x1 = 21 + 11 21
ry2 y1 = 21 + 11 21
Las correlaciones son: rx2 x1 , ry1x1 y ry1x2 . Las
mismas
que los coeficientes path del
modelo: 11 , 21 y 21 . Habr, pues, tantas ecuaciones como incgnitas. (Obsrvese que los
parmetros 11 y 22 hacen referencia a las varianzas residuales y pueden ser conocidos a
partir de la informacin que suministran las correlaciones del modelo). De aqu se deduce
que la solucin del sistema es nica. En base a la estructura definida slo son posibles unos
valores nicos para los parmetros del modelo.
Esta circunstancia implica, en base al criterio comentado anteriormente de ajuste, que las
correlaciones reproducidas a partir de los parmetros del modelo son precisamente las
correlaciones reales, con lo que tal criterio carece de utilidad en este tipo de modelos. No es
posible saber segn dicho criterio qu modelo entre varios alternativos ajusta mejor con la
realidad observada. Se dice que tales modelos no son verificables por cuanto, en trminos
estadsticos, no puede establecerse entre varios de ellos cual es preferible.
Supongamos en este sentido que tres investigadores, con posiciones tericas muy
distintas, quieren estudiar el efecto que sobre el xito profesional (EP) ejercen las variables
Inteligencia (IN) y Nivel social (NS). A este respecto, establecen los siguientes modelos:
IN
NE
Modelo A
IN
EP
NE
Modelo B
IN
EP
NE
EP
Modelo C
Figura 1.43
En el modelo A se parte de una postura, diramos genetista; es la Inteligencia -heredada- la
causa del Nivel social. En el modelo B se parte, por el contrario, de una postura
ambientalista; es el Nivel social -la educacin- lo que determina la Inteligencia. Por ltimo,
en el modelo C, se supone que ambas variables covaran -comparten informacin- pero no
se especifica el sentido de la causalidad.
Si nos tomramos la molestia de calcular los parmetros de estos tres modelos observaramos
que en todos ellos las ecuaciones sern las mismas, tal como se indica en (4.1), y en
consecuencia, los parmetros seran, igualmente, los mismos. La proporcin de varianza
explicada por los modelos seran
exactamente
iguales,
la significacin de
los
34
IN
IN
NE
N
E
PS
Modelo A
PS
Modelo B
Figura 1.44
35
Modelo A
Modelo B
IN X1
NE Y1
PS Y2
IN Y1
NE Y2
PS X 1
X1
Y1
Y1
21
11
21
Y2
11
Y2
X1
Modelo A
Modelo B
Figura 1.42
Supongamos que las correlaciones entre las distintas variables son las siguientes:
rNI = 0 .7
rPI = 0.5
rNP = 0.6
para
ry1x1 = 11
ry2 x1 = 11 21
ry2 y1 = 21
Podemos elegir las ecuaciones referentes a ry1x1 y ry 2x1 para determinar los parmetros 11 y
21 (el valor 21 ha sido fijado a cero). As pues:
ry 1x1 = 11
ry 2y 1 = 21
11 = 0 .7
21 = 0 .6
36
11 = 1 ry21.x1 = 1 0 .7 2 = 0 .51
22 = 1 ry22.y1 = 1 0 .6 2 = 0.64
X1
0.7
0.68
1
0.51
0.6
Y1
Y2
Modelo A
Figura 1.46
A partir de los parmetros 11 y 21 podemos reproducir ry 2x1 :
ry*2x 1 = 21 11 = 0 .6 * 0 .7 = 0 .42
Se observa que entre la correlacin real ry 2x1 y la correlacin reproducida ry*2x1 a partir de
los parmetros 11 y 21 existe una cierta discrepancia:
ry 2x 1 ry*2x 1 = 0.5 0.42 = 0.08
Consideremos
ahora
el modelo B. Disponemos de las
mismas
correlaciones que
anteriormente, pero en este caso, para estimar los parmetros 11 y 21 de la figura 1.47.
ry1x1 = 11
ry 2y1 = 21
11 = 0 .5
21 = 0 .7
Calculemos 11 y 22 :
11 = 1 ry21.x1 = 1 0 .5 2 = 0. 75
22 = 1 ry22 .y1 = 1 0 .7 2 = 0 .51
37
El modelo quedar:
0.75
Y1
0.5
0.7
0.5
X1
Y2
Figura 1.47
A partir de los parmetros 11 y 21 podemos reproducir ry 2x1 :
ry*2x1 = 21 11 = 0.7 * 0.5 = 0.35
Se observa que entre la correlacin real ry 2x1 y la correlacin reproducida ry*2x1 a partir de
los parmetros 11 y 21 existe la discrepancia:
ry 2 x1 r y*2 x1 = 0 .6 0 .35 = 0 . 25
Comparando ambos modelos deduciremos grosso modo (ya veremos el proceso estadstico
riguroso en el prximo tema) que el modelo B se ajusta peor a los datos de observacin que
el modelo A. En consecuencia, preferiremos el modelo A al B.
Y2
Y1
12
Figura 1.48
38
Slo disponemos de la correlacin ry1y2 (que por razones de simetra equivale a ry 2y1 ), y
hemos de determinar a partir de este valor los parmetros 12 y 21 . Tenemos una unidad
de informacin y dos incgnitas a resolver.
Igualmente puede darse el caso de que aunque el sistema sea recursivo no se den los supuestos
del modelo de path anlisis en relacin a los trminos de error, y presenten correlacin entre
ellos, tal como se contempla en el siguiente modelo donde estn relacionados los trminos de
error 1 y 2 :
11
1
Y1
21
11
21
22
2
21
Y2
X1
Figura 1.49
O bien que exista relacin entre alguna variable explicativa y el trmino de error:
11
1
Y1
11
21
22
2
r1X1
21
X1
Y2
Figura 1.50
O cualquier combinacin de estos casos. Son modelos, por ello, no susceptibles de ser
resueltos en trminos de sus parmetros. Como hemos indicado, no es nuestra intencin, por el
momento, de entrar en la casustica de este tipo de modelos y su posible abordaje si no tan
slo mostrar la existencia de tales modelos al lector.
39
1.10.- Introduccin
Es nuestra intencin en este apartado retomar algunos de los ejemplos tratados en pginas
anteriores y resolverlos mediante el programa informtico LISREL 8.7. Ser, pues, la
ocasin de introducirnos (muy brevemente) en la programacin LISREL.
Trataremos, en una primera instancia, el ejemplo 1.5 (modelo exactamente identificado) donde
determinaremos la estimacin de los parmetros y su significacin estadstica. A continuacin
abordaremos la cuestin de los modelos sobreidentificados. Retomaremos el ejemplo 1.6 y
volveremos a su anlisis, esta vez, con mayor rigor formal.
X1
21
11
Y1
21
Y2
Figura 1.51
Y las correlaciones:
ry1x1 = 0.5
ry2 x1 = 0.8
ry 2y1 = 0 .6
40
La primera lnea hace referencia al ttulo del problema. Podemos hacerlo tan largo como
queramos (varias lneas). El ttulo finalizar cuando se encuentre con la sentencia DA.
La sentencia DA (DAta and problem parameters) permite introducir la informacin bsica
del problema. Aqu hemos contemplado las siguientes especificaciones: NI (Number of Input
variables), NO (Number of Observations) y MA (type of MAtriz to be Analyzed). En relacin
a la instruccin MA hemos indicado que la matriz de entrada es la matriz de correlaciones,
cuya especificacin aqu es KM.
A continuacin viene precisamente la informacin de partida. Tras un encabezamiento
indicndole que la matriz a considerar es la matriz de correlaciones (KM) se ofrecen las
distintas
correlaciones
(solamente submatriz diagonal inferior, ya que dicha matriz es
simtrica). Por otro lado, la estructura de dicha matriz es:
Y1
Y2
Y2
0.6
X1
0.5
0.8
Y1
X1
esto es, en primer lugar se colocan las variables endgenas y a continuacin las exgenas.
41
BE=FU,FI
Puede parecer esta sentencia una contradiccin, ya que sabemos que hemos de calcular el
parmetro 21 . Esto no es problema porque en la sentencia PA (PAttern matrix) que viene a
continuacin le especificamos exactamente qu parmetros deseamos estimar: son aquellos
que vienen representados por un 1. De esta forma le indicaremos:
PA
0
1
BE
0
0
Y1
Y2
21
Y2
12
22
PS=DI,FR
42
Para las matrices GAMMA y PHI no hace falta especificar nada. En relacin a la matriz
GAMMA se contemplan todas las conexiones posibles. Y esta matriz por defecto es
precisamente FU,FR. Igualmente la matriz PHI por defecto es una matriz simtrica, como es el
caso aqu. Por tanto, tampoco hemos de especificar PH=SY,FR.
Resumiendo, las matrices contempladas en el modelo, junto con sus coeficientes, son las
siguientes:
GAMMA ( ):
INT
CSOCIAL
REN
11
12
CSOCIAL
REN
BETA ( ):
CSOCIAL
REN
21
PHI ( ):
INT
11
INT
PSI ( ):
CSOCIAL
CSOCIAL
REN
REN
11
22
La sentencia PATH DIAGRAM indica que se represente grficamente los resultados del anlisis.
Se representa el diagrama causal, as como sus coeficientes (y su significacin) asociados.
Por ltimo, en la sentencia OU (OUtput request) se indican las salidas que deseamos. Entre una
serie de opciones aqu solicitamos SE (Standard Errors) y TV (t-Values) asociados a dichos
errores tpicos.
43
0.27
(0.06)
4.13
- -
CSOCIAL
CSOCIAL
-------- -
REN
GAMMA
INT
-------0.50
(0.09)
5.72
CSOCIAL
REN
0.67
(0.06)
10.32
PHI
INT
-------1.00
(0.14)
7.00
PSI
Note: This matrix is diagonal.
CSOCIAL
-------0.75
(0.11)
7.00
REN
-------0.31
(0.04)
7.00
REN
-------0.69
44
X1
0.667
0.5
0.307
0.75
Y1
0.267
Y2
Figura 1.52
Como puede comprobarse todos los resultados son coincidentes con los obtenidos en el
ejemplo 1.5 (clculo de los parmetros) y el ejemplo 1.7 (significacin estadstica de los
mismos).
En cuanto a la bondad de ajuste:
45
IN
PS
NE
Modelo A
NE
PS
Modelo B
Figura 1.53
46
1.12.1.- Modelo A
En el modelo A suponamos que los Ingresos condicionaba el Nivel de estudios, y ste a su vez,
el Prestigio social. Por el contrario en el modelo B, era el Prestigio social lo que condicionaba
los Ingresos, y estos, el Nivel educativo. Este tipo de modelos los modelos sobreidentificados-,
como se ha indicado, son los nicos susceptibles (al margen de otras consideraciones) de ser
verificados estadsticamente.
Comencemos por el modelo A. Le indicamos lo siguiente:
MODELO SOBREIDENTIFICADO A
DA NI=3 NO=100 MA=KM
KM
1
0.7 1
0.5 0.6
1
LA
INGRESOS NEDUC PSOCIAL
SE
2 3 1
MO NY=2 NX=1 BE=FU,FI
PS=DI,FR
PA GA
1
0
PA BE
0
0
1
0
PATH DIAGRAM
OU SE TV
Las instrucciones son prcticamente las mismas que las indicadas en la tabla 1, a excepcin de
que la seleccin de las variables es:
SE
2 3 1
Esto es, las variables endgenas (por orden) son Nivel educativo y Prestigio social, y la variable
exgena, Ingresos.
Por otro lado, la variable Ingresos slo enlaza con Nivel educativo (y no con Prestigio social),
as pues, la estructura de la matriz GAMMA ser:
PA GA
1
0
47
Un primer resultado grfico, muy sencillo, el que nos proporciona la sentencia PATH
DIAGRAM, ser:
El valor de Chi-Cuadrado (que nos marca la discrepancia entre R y R* ) para 1 grado de libertad
es 1.94. Su probabilidad asociada es 0.16354, que nos indica precisamente la probabilidad de
obtener tal matriz R* a partir de una supuesta poblacin con R. Es mayor que los valores
convencionales de 0.05 o 0.01, por o que nada se opone a aceptar que el modelo propuesto se
ajusta a los datos de observacin.
Tambin se nos indica en esta tabla que el valor de RMSEA (Root Mean Square Error of
Approximation) es 0.098. En castellano, el Error cuadrtico medio de aproximacin, que deriva
de la Chi-Cuadrado, y que a diferencia de sta, constituye un estimador insesgado del error de
aproximacin. Se define (Browne y Cudeck, 1993) como:
RMSEA =
2 gl
N * gl
siendo gl los grado de libertad del modelo y N el total de individuos. En este caso:
RMSEA =
1. 94 1
= 0.098
100 *1
Se acepta que para un buen modelo, RMSEA < 0.05. Por lo que en este caso, rechazaremos la
hiptesis de un buen ajuste.
48
Si deseamos conocer los distintos estimadores, junto a sus errores tipo y el valor de t de Student
asociado:
NEDUC
NEDUC
-------- -
PSOCIAL
-------- -
0.60
(0.08)
7.42
- -
PSOCIAL
GAMMA
NEDUC
INGRESOS
-------0.70
(0.07)
9.70
PSOCIAL
- -
PHI
INGRESOS
-------1.00
(0.14)
7.00
PSI
Note: This matrix is diagonal.
NEDUC
-------0.51
(0.07)
7.00
PSOCIAL
-------0.64
(0.09)
7.00
PSOCIAL
-------0.36
49
comparando
la
matriz
de
Correlation Matrix
NEDUC
PSOCIAL
INGRESOS
NEDUC
-------1.00
0.60
0.70
PSOCIAL
--------
INGRESOS
--------
1.00
0.50
1.00
NEDUC
PSOCIAL
INGRESOS
NEDUC
-------1.00
0.60
0.70
PSOCIAL
--------
INGRESOS
--------
1.00
0.42
1.00
Obsrvese que en el enlace que falta entre Prestigio social e Ingresos, la correlacin reproducida
por el modelo es 0.42, siendo la real 0.5. Valores coincidentes con los obtenidos manualmente
en el ejemplo 1.6.
Adems el LISREL 8 nos ofrece una infinidad ms de indicadores de ajuste:
50
b2 2
b2
donde 2 es el valor de Chi-Cuadrado del modelo propuesto, y b2 el del modelo que tomamos
como referencia. Convencionalmente este valor se refiere al denominado modelo de
independencia o nulo, que asume las covarianzas (o correlaciones) como cero. Este indicador
oscila entre 0 y 1. Como el modelo base presentar una gran discrepancia con los datos de
observacin, se exige valores de NFI superiores a 0.95. No es un buen indicador, ya que depende
en exceso del nmero de parmetros del modelo.
51
Alternativas a este ndice es el ndice de ajuste no normado, NNFI (Non-Normed Fit Index), que
intenta compensar los inconveniente del ndice anterior. Para ello trabaja con el cociente de los
distintos valores de Chi-Cuadrado y sus grados de libertad correspondientes:
b2 / glb 2 / gl
NNFI =
b2 / gl b
Por ltimo, tenemos un par de ndices, AIC y CAIC. No estn acotados entre 0 y 1, lo que
dificulta su interpretacin. Todo lo que se puede decir es que cuanto menores son, mejor es el
ajuste. Presentan frmulas equivalente, y son especialmente tiles cuando se tratan de comparar
distintos modelos referidos a la misma realidad. Aunque sus valores no estn estandarizados, s
son comparables entre distintos modelo de la misma realidad, en cuanto una disminucin de ol s
mismos implica una mayor mejora. El ndice AIC se expresa:
AIC = 2 2 gl
Y el ndice CAIC:
CAIC = 2 gl (ln( N ) + 1)
1.12.1.- Modelo B
las instrucciones para el modleo B son muy parecidas a las del modelo A. Son las siguientes
MODELO SOBREIDENTIFICADO B
DA NI=3 NO=100 MA=KM
KM
1
0.7 1
0.5 0.6
1
LA
INGRESOS NEDUC PSOCIAL
SE
1 2 3
MO NY=2 NX=1 BE=FU,FI
PS=DI,FR
PA GA
1
0
PA BE
0
0
1
0
PATH DIAGRAM
OU SE TV
52
SE
1 2 3
53
INGRESOS
INGRESOS
-------- -
NEDUC
-------- -
0.70
(0.07)
9.70
- -
NEDUC
GAMMA
INGRESOS
PSOCIAL
-------0.50
(0.09)
5.72
NEDUC
- -
PHI
PSOCIAL
-------1.00
(0.14)
7.00
PSI
Note: This matrix is diagonal.
INGRESOS
-------0.75
(0.11)
7.00
NEDUC
-------0.51
(0.07)
7.00
NEDUC
-------0.49
NEDUC
-------0.12
54
Correlation Matrix
INGRESOS
NEDUC
PSOCIAL
INGRESOS
-------1.00
0.70
0.50
NEDUC
--------
PSOCIAL
--------
1.00
0.60
1.00
INGRESOS
NEDUC
PSOCIAL
INGRESOS
-------1.00
0.70
0.50
NEDUC
--------
PSOCIAL
--------
1.00
0.35
1.00
El enlace que falta entre Prestigio social y Nivel educativo, cuya correlacin observada es 0.6,
muestra una correlacin reproducida por le modelo de 0.35. Una discrepancia superior al modelo
A.
55
Obsrvese que todos los indicadores indican un mal ajuste. Peor que en modelo A, como se
refleja en los indicadores AIC y CAIC, en donde se obtienen valores superiores.
Bibliografa
56
James, L. R. (1982). Causal Analysis: Assumptions, Models And Data. Beverly Hills: Sage.
Joreskog, K. G. And D.Sorbom (1988). LISREL VII: A guide to the program and
applications. Chicago: Spss, Inc.
Jreskog K. G. & Srbom, D. (1996) LISREL 8. User's reference guide. Mooresville, Indiana:
Scientific Software.
Jaccard, J. And Wan, C.K. (1996). LISREL approaches to interaction effects in multiple
regression. Beverly Hills: Sage
Kelloway, E. K. .(1998). Using LISREL for structural equation modeling: A Researcher's Guide.
Thousand Oaks, Ca: Sage
Kenny, D. (1979). Correlation and Causality. New York: John Wiley And Sons.
Loehlin, J. (1998). Latent variable models (3rd Ed). Hillsdale, Nj: Erlbaum.
Li, C.C. (1975). Path Analysis -A Primer. Pacific Grove Ca.: Boxwood Press.
Maruyama, G.M. (1998). Basics of structural equation modeling. Thousand Oaks, Ca: Sage.
Marcoulides, G.A. & Schumacker, R.E. (2001). New developments and techniques in structural
equation modeling. Mahwah, NJ: L. Erlbaum.
Marcoulides, G.A. And Schumacker, R.E. (Eds; 1996). Advanced structural equation
modelling: Issues and techniques. Hillsdale, NJ: Erlbaum.
Mulaik, Stanley A.; James,Lawrence R. (1982). Causal analysis: assumptions, models and
data. Beverly Hills: Sage Publications.
Mueller, R.O. (1998). Basic principles of structural equation modeling. New York: Springer
Pedhazur, E. J (1982). Multiple Regresion In Behavioral Research. Explanation And
Prediction (2nd Ed.). New York: Halt Rinehart and Winston.
Schumacker, R.E. and Lomax, R.G. (1996). A Beginner's Guide to Structural Equation
Modeling. Hillsdale, NJ: Erlbaum.
Schumacker, R.E. & Marcoulides, G.A. (eds.) (1998). Interaction and nonlinear effects in
structural equation modeling. Mahwah, NJ: L. Erlbaum.
Saris, W. E. And Stronkhorst, L. H. (1984). Causal modelling in nonexperimental research.
Amsterdam: Sociometric Research Foundation.
Viladrich I Segues, M.C. (1985). Models d'ecuacions Estructurals en recerca no experimental.
Barcelona: Universidad Autonoma de Barcelona.
Visauta, B. (1986). Modelos causales. Barcelona: Hispano Europea.
Wonnacott, T.H and Wonnacott, R.J. (1981). Regression: A Second Course in Statistics.
New york: wiley.
Yang Jonsson, F. (1997). Non-linear structural equation models: simulation studies of the
Kenny-Judd model. Acta Universitatis Upsalensis.