Modelo Estructural

1
MODELOS ESTRUCTURALES CON VARIABLES OBSERVADAS
Carlos Camacho
Ana Mara Lpez
INDICE
____________________________________________________________________________
1.1.- Introduccin ....................................................................................................................... 4

1.2.- Condiciones de aplicacin ................................................................................................. 7
1.3.- Fases en la elaboracin de un modelo ............................................................................... 8
1.3.1.- Elaboracin del diagrama causal ...................................................................................... 9
1.3.2.- Tipos de relaciones ........................................................................................................ 11
1.4.- Determinacin de las ecuaciones estructurales ................................................................. 14
1.4.1.- Expresin matricial de la ecuaciones estructurales ....................................................... 17
1.5.- Estimacin de parmetros ................................................................................................. 22
1.6.- Significacin de los parmetros ........................................................................................ 27
1.7.- Validacin de modelos ..................................................................................................... 30
1.8.- Identificacin de modelos ................................................................................................. 32
1.8.1.- Modelos exactamente identificados ............................................................................... 32
1.8.2.- Modelos sobreidentificados ........................................................................................... 34
1.8.3.- Modelos subdentificados ............................................................................................... 37
1.9.- Aplicacin informtica ..................................................................................................... 39
1.10.- Introduccin .................................................................................................................... 39
1.11.- Modelo exactamente identificado ................................................................................... 39
1.12.- Modelo sobreidentificado ............................................................................................... 45
1.12.1.- Modelo A...................................................................................................................... 46
1.12.1.- Modelo B ..................................................................................................................... 51
Bibliografa ............................................................................................................................... 55
____________________________________________________________________________
1.- Introduccin
Hasta ahora los modelos estudiados de regresin corresponden a la ecuacin general:
Y = b0 + b1X1 + b2X 2 + L L + bkX k

Cuya estructura de relacin es:
e
X1
r21
X2
rk1
rk2
Xk
Figura 1.1
Se observa que existen k variables independientes y una nica variable dependiente. La
variable Y queda explicada por las distintas variables X, como se refleja en la flecha
unidireccional, mientras que las X presentan flechas bidireccionales, indicndose que las
correlaciones entre ellas muestran tan slo covariacin o concomitancia y no el sentido de
explicacin o produccin.
Aunque este tipo de modelos es ampliamente utilizado, adolece de una cierta simplicidad en
su estructura. Ms realista resultan otros planteamientos donde se entremezclan variables
dependientes e independientes, donde ciertas variables que explican son a su vez, explicadas
por otras, constituyndose de esta forma cadenas de causa-efecto que evidentemente se
acomoda mejor a la naturaleza de los fenmenos. Supongamos, en este sentido, que
deseamos estudiar la incidencia que sobre el Exito profesional (Y) tienen las variables: Nivel
de estudios (X1 ), Clase social (X2 ) e Inteligencia (X3 ). Si aplicsemos el modelo de
Regresin mltiple utilizado hasta ahora, tendramos la siguiente estructura de relacin:
e
X1
r21
X2
r31
r32
X3
Figura 1.2
No obstante, pueden plantearse otras alternativas. Si suponemos que la Clase social y el Nivel
de estudios son los condicionantes de la Inteligencia, que a su vez, es la que determina el
xito profesional, tendremos la siguiente estructura:
X1
X3
r21
X2
Figura 1.3
O bien, podemos suponer, que el Nivel de estudios ejerce un efecto exclusivo sobre la
Inteligencia, mientras que la Clase social afecta, por un lado, independientemente sobre el
xito profesional y, por otro, a travs e la Inteligencia. Segn esta lgica el diagrama sera:
X1
X3
r21
X2
Figura 1.4
Con estas variables podramos sugerir otros muchos modelos alternativos, cosa que no haremos
para no aburrir al lector. No obstante, dejamos en sus manos, como ejercicio intelectual, la
bsqueda de algn otro modelo que estime ms razonable.
Los modelos aqu tratados reciben en la literatura estadstica el nombre genrico en ingls de
Path Analysis. Fue desarrollado en sus orgenes con este nombre por Sewall Wright (1921) en
el campo de la biologa. Podemos traducir la palabra "path" como "camino", "va" o
"sendero". En castellano el trmino Path Analysis quedara traducido como Anlisis de caminos
(vas o senderos) por cuanto en estos modelos se especifican los caminos por donde se cursan las
relaciones de influencia entre unas variables y otras. Obsrvese a ttulo de ejemplo, las figuras
1.3 y 1.4 cmo el hecho diferencial entre ambas radica precisamente en el conjunto flechas o
relaciones establecidas.
Por nuestra parte preferimos denominar a este tipo de modelos modelos estructurales con
variables observadas. Decimos "modelos estructurales" por cuanto el conjunto de conexiones o
relaciones puede entenderse como la estructura de relacin establecida entre las variables. Nos
parece un trmino ms genrico y clarificador de lo que se quiere expresar. Decimos "con
variables observadas" para distinguirlo de otros tipos de modelos de mayor complejidad
donde se trata adems variables no observables o latentes.
No obstante, y a nuestro pesar, utilizaremos el trmino Path anlisis (mescolanza de ingls y
espaol), que es la forma ms usual de referirse a tales modelos en nuestro pais. Hemos de decir
a este respecto, que el Path anlisis se considera un submodelo del LISREL (LInear Structural
RELationship), de propsito ms general, que contempla casusticas tales como error de medida
y variables latentes, que no trataremos por el momento. En estas pginas trataremos el Path
anlisis desde la perspectiva LISREL.
Este tipo de modelos se encuentran tambin en la literatura con el nombre de modelos
causales por cuanto parece determinarse, por la estructura de relacin establecida, las
variables causa y las variables efecto. A este respecto, convienen indicarse (aunque sobre este
punto nos extenderemos ms adelante) que este tipo de modelos no sirve para "detectar" las
causas de un cierto fenmeno, sino ms bien su objetivo es bastante ms limitado; el
investigador propone, segn su especial conceptualizacin del fenmeno estudiado, una
determinada estructura de relacin. Todo el aparato estadstico consecuente sirve tan slo para
mostrar la viabilidad del modelo propuesto con la informacin de partida(matrices de
varianzas-covarianzas o de correlaciones) sin que con ello se descarten otros posibles modelos,
igualmente viables.
En las siguientes pginas profundizaremos en estas ideas. Expondremos, en primer lugar, las
condiciones de aplicacin existentes sobre los modelos de Path anlisis. A continuacin
desarrollaremos las distintas fases en el proceso de elaboracin de un determinado modelo. Por
ltimo, discutiremos el problema de la identificacin de los modelos y del ajuste de los
mismos a la realidad estudiada.
1.2.- Supuestos del modelo

Si se entiende el Path anlisis como una extensin del modelo de Regresin mltiple
mantendr las mismos supuestos de aplicacin que este tipo de modelos, ya estudiados. Otras
condiciones derivadas de su mayor complejidad habrn de especificarse. Destacamos las
ms relevantes:
a) Relacin lineal ente las variables. Condicin de linealidad.
b) Las variables independientes afectan a la variable dependiente de forma aditiva. Sus
efectos se suman. Condicin de aditividad
c) Los modelos han de ser recursivos. Esto implica que la causalidad fluye en
una nica direccin, descartndose causalidad recproca entre dos variables.
d) Incorrelacin de los errores. Esta condicin es doble. Por un lado los errores no
deben correlacionar con las variables independientes. Esto es:
reixi = 0
Y por otro lado, los errores no deben correlacionar entre s. Es decir:
reiej = 0
e) Se opera con variables observadas. Esta condicin ya ha sido especificada. En cierto

sentido no debera mencionarse ya que hasta ahora hemos trabajado con este tipo de
variables. Sin embargo, desde
la
perspectiva
general
de
los
modelos
estructurales ocupa un lugar relevante los modelos con variables latentes. Por esta
razn, desde este enfoque, esta restriccin tiene su importancia. Por otro lado, una
variable observada implica que ha sido medida directamente sin error.
1.3.- Fases en la elaboracin de un modelo
Exponemos a continuacin los momentos ms

relevantes
modelo estructural basado en el Path anlisis. A saber:
en
la elaboracin de un
a) Elaboracin del diagrama causal

b) Determinacin de las ecuaciones estructurales
c) Estimacin de los parmetros del modelo
d) Ajuste del modelo a la realidad
1.3.1.- Elaboracin del diagrama causal
El primer paso, aunque no estrictamente necesario, consiste en expresar grficamente la

estructura de relacin concebida por el investigador. Tiene inters porque es una primera
aproximacin -sencilla- que permite una cierta conceptualizacin del fenmeno a estudiar.
Los grfico utilizados se denominan diagramas causales o tambin diagramas path, por
cuanto se especifican en ellos los caminos a seguir en las relaciones de influencia. Bsicamente
consiste en situar las diferentes variables y unirlas por flechas segn la direccin de la
relacin indicada. A este respecto, tomemos la figura 1.4 y completmosla de acuerdo
con la lgica de los diagramas causales. Tendremos:
X1
11
21
21
Y1
Y2
12
X2
22
Figura 1.5
Se distinguen variables exgenas y endgenas. Las variables exgenas
(o tambin,
predeterminadas) son aquellas que se encuentran en el lmite del modelo. En otro contexto
es lo que conocemos como variables explicativas o independientes. Transmiten su
variabilidad al interior del modelo, pero queda sin especificar la fuente de variacin que da
lugar a ellas. Son "causa", en sentido restringido, en la medida que explican -hasta cierto
punto- el comportamiento del sistema. En la figura 1.5 las variables X1 y X2 son variables
exgenas.
Por el contrario, las variables endgenas se caracterizan por quedar explicada su variabilidad
en trminos de otras variables (exgenas o endgenas a su vez) Son lo que en otro
contexto hemos denominado variables explicadas o dependientes. Son "efecto" de ciertas
variables, aunque a su vez, pueden hacer el papel de "causa" de otras. En la figura 1.5
corresponden a las variables Y1 e Y2 . Se observa que la variable Y1 es causa de Y2 , pero que
a su vez es causada por X1 y X2 . Hace el papel de variable independiente y dependiente
simultneamente.
Observamos, de esta forma, que la notacin es diferente bien se trate de variables exgenas o
endgenas. Para las primeras
se utiliza genricamente la terminologa Xi , y para las
segundas, Yi . Por otro lado, las variables endgenas van ordenadas de menor a mayor segn
el grado de proximidad que presenten respecto a las variables exgenas. Aquellas variable
endgenas que son explicativas de otras variables endgenas tendrn menor rango que
aquellas variables que son exclusivamente explicadas. En el grfico anterior se contempla
que la variable Y1 , aunque endgena, es a su vez explicativa de Y2 , que no afecta a ninguna
otra variable; por esta razn, la primera tiene un subndice menor que la segunda.
El efecto de las variables exgenas sobre las variables endgenas viene indicado por los
parmetros ji (gamma). El primer subndice expresa la variable receptora Yj, y el segundo
subndice, la variable emisora Xi . En relacin a las variable endgenas, el efecto entre ellas
viene reflejado por los parmetros ji (beta) cuya interpretacin en cuanto a los subndices es
equivalente a la expresada anteriormente con ji ; esto es, ji muestra el efecto de la variable Yi
sobre Yj.
Las variables exgenas carecen de efectos entre ellas, ya que no se conciben como causadas
por ninguna otra. Por esta razn, la relacin que puedan mantener con otra variable exgena
queda expresada por su coeficiente de correlacin sobre una lnea curva con flechas en sus dos
extremos. Se indica con ello que la relacin no se analiza, y que entre ellas existe tan slo
covariacin, sin que se especifique la fuente de variabilidad. Esta es la relacin existente entre
las variables X1 y X2 .
Aqu, las correlaciones entre las variables exgenas se especifican mediante ji
(phi). Ya
que en este caso se supone que las variables Xj y Xi comparten informacin sin que haya
ninguna relacin de causalidad entre ellas, el primer y el segundo subndice hacen referencia a
tales variables sin que haya ningn orden establecido; esto es, hubiera sido igualmente vlido
ji . Hay que decir que cuando operamos con puntuaciones directas los valores ji hacen
referencia a las covarianzas entre las variables exgenas. En estos casos tiene sentido mencionar
ii como la varianza de la variable Xi.
Por lo que respecta a los trmino de error, se denominan i (zeta), coincidiendo el subndice
con el de la variable Yj a la que afecta dicho error. Por el momento no nos extenderemos ms
sobre los distintos parmetros. Ya hablaremos ms adelante de los tipos de matrices en que
pueden utilizarse para mencionar tales parmetros, y cmo de la estructura de dichas matrices
pueden deducirse, a su vez, la estructura de los diferentes modelos de Path anlisis.
1.3.2.- Tipos de relaciones

Aunque este aspecto ser desarrollado ms adelante desde una perspectiva matemtico-formal,
pasaremos a exponer en una primera aproximacin, al hilo de los grficos que nos proporciona
los diagramas causales, los distintos tipos de relaciones o efectos que pueden establecerse
entre las variables que conforman un modelo estructural. Estos posibles efectos son:
a) Efecto directo
b) Efecto indirecto
c) Efecto conjunto
d) Efecto espreo
a) Efecto directo
El efecto directo hace referencia al existente entre las variables que se encuentran en ambos
extremos de una determinada flecha. Por ejemplo, en base a la figura 1.5, algunas de las
relaciones de tipo directo seran: a) la existente entre el Clase social (X2 ) y la Inteligencia
(Y1 ):
12
X2
Figura 1.6
Y1
Y el efecto que mantiene la Inteligencia (Y1 ) con el xito profesional (Y2 ):
21
Y1
Y2
Figura 1.7
b) Efecto indirecto
Existe efecto indirecto entre dos variables cuando una de ellas ejerce influencia sobre la otra a
travs de una o ms variables intermedias. Por ejemplo, en el caso que estamos tratando, el
Clase social (X2 ) ejerce un efecto indirecto sobre el xito profesional (Y2 ) a travs de la
Inteligencia (Y1 ). Esto es:
Y1
21
Y2
X2
Figura 1.8
c) Efecto conjunto
Hace referencia a aquellas variables exgenas que presentan covariacin (una flecha curva
uniendo dichas variables con puntas en ambos extremos), donde no puede establecerse
claramente en qu direccin se encamina la relacin de influencia. Cuando algn recorrido se
realiza a travs de esta flecha curva, decimos que el efecto es conjunto (entre las variables de
ambos extremos de la flecha) al no poder especificar la relacin existente entre ambas variables.
Un caso de efecto conjunto es el que ejerce la variable Nivel de estudios (X1 ) sobre la
Inteligencia (Y1 ) cuando involucramos la variable Clase social (X2 ):
X1
21
Y1
12
X2
Figura 1.9
10
d) Efecto espreo
Existe efecto espreo entre dos variables cuando la covariacin existente entre ambas es
debida a una causa comn. Un ejemplo clsico de relacin esprea es la que se presentan
cuando sobre una muestra de nios de diferentes edades se estudia la relacin entre
Estatura e Inteligencia, donde sucede que la variable Edad es la causa de las dos variables
anteriores. El grfico de relacin es:
Estatura
Edad
Inteligencia
Figura 1.10
En el caso que estamos tratando, toda la relacin entre Inteligencia (Y1 ) y xito Profesional
(Y2 ) que no es efecto directo, es efecto espreo. Esto es, si descartamos el camino:
21
Y1
Y2
Figura 1.11
todos los dems caminos entre ambas variables sern efectos espreos al ser debidos a causas
comunes. Por ejemplo:
Y1
Y2
12
X2
22
Figura 1.12
Y tambin:
X1
11
Y1
21
Y2
X2
22
Figura 1.13
11
1.4.- Determinacin de las ecuaciones estructurales
Los modelos estructurales contemplan varias variables

dependientes.
En consecuencia,
podremos expresar cada una de ellas en funcin de sus respectivas variables independientes.
As, en relacin al modelo que estamos tratando:
y 1 = 11x1 + 12x 2 + 1
y 2 = 21y1 + 22x2 + 2
(1.1)
As pues, se observa que deben haber tantas ecuaciones como variables endgenas contenga el
modelo. Por otro lado, en cada ecuacin participan las variables exgenas directamente ligadas
con la variable endgena a explicar.
Ejemplo 1.1.- Un investigador maneja dos posibles hiptesis en el estudio de la relacin

entre Ingresos, Nivel educativo y Prestigio Social: a) Los Ingresos determinan el Nivel
educativo y ste el Prestigio social, y b) El nivel educativo determina los Ingresos y el
Prestigio social.
Esto supuesto, dibujar los diagramas causales correspondientes a ambas hiptesis, as como sus
ecuaciones estructurales. Especifica, en cada uno de los modelos, el tipo de relacin existente
entre las variables Ingresos y Prestigio social.
SOL:
a) Utilicemos la siguiente nomenclatura:
X1 : Ingresos
Y1 : Nivel educativo,
Y2 : Prestigio social
Segn la primera hiptesis el diagrama causal correspondiente ser:
1
11
X1
21
Y1
Figura 1.14
Y2
12
Y sus ecuaciones estructurales:

y 1 = 11 x1 + 1
y 2 = 21 y 1 + 2
Se observa, en base a la figura 1.14 que los Ingresos (X1 ) ejercen un efecto indirecto sobre el
Prestigio social (Y2 ).
b) En relacin a la segunda hiptesis, utilizaremos la siguiente nomenclatura:
X : Nivel educativo
Y : Ingresos
Y : Prestigio social
Cuyo diagrama causal ser:
11
Y1
Y2
X1
21
Figura 1.15
Y las ecuaciones correspondientes:

y 1 = 11 x1 + 1
y 2 = 21 x1 + 2
Como se observa, el efecto de la variable Ingresos (Y1 ) sobre Prestigio social (Y2 ) es un efecto
espreo, ya que la relacin entre tales variables viene mediatizada por el Nivel educativo
(X1 ) que es la variable causante de ambas.
1.4.1.- Expresin matricial de la ecuaciones estructurales
Una de las ventajas del LISREL (que supone un cierto esfuerzo al principio) reside en que
obliga a definir las matrices con las que se va a trabajar. A partir del conocimiento de stas es
posible deducir la estructura de relacin del modelo causal. Por estas razones conviene
familiarizarse con este tipo de matrices en aras de una mayor comprensin del modelo.
13
Retomando el modelo expresado en la figura 1.5, tenemos, como se sabe, que sus ecuaciones
correspondientes son:
y 1 = 11x1 + 12x 2 + 1
y 2 = 21y1 + 22x2 + 2
(1.2)
Si en estas ecuaciones reflejamos todas las variables del sistema, y no nicamente aquellas que
presentan enlaces, tendremos, entonces:
y 1 = 0 y1 + 0 y 2 + 11 x 1 + 12 x 2 + 1
y 2 = 21 y 1 + 0 y 2 + 0 x1 + 22 x 2 + 2
(1.3)
En notacin matricial:
y1 0
y =
2 21
0 y1 11
+
0 y 2 0
12 x1 1
+
22 x2 2
(1.4)
En trminos generales, si tenemos p variables endgenas y q variables exgenas, podremos

expresar en forma compacta, la estructura de relacin:
y = y + x +
(1.5)
donde:
y ( p*1) : vector constituido por las p variables endgenas
( p*p ) : matriz de coeficientes
x (q*1) : vector constituido por las q variables exgenas
( p*q ) : matriz de coeficientes
( p*1) : vector constituido por los p trminos de error
Adems de estas matrices, se suelen incorporar algunas ms que aaden carcter explicativo al
modelo. En este sentido, recordemos la matriz (Phi) que especifica las correlaciones entre
las variables exgenas, y que es conveniente para conocer el grado de relacin entre ellas. Por
otro lado, hemos de aadir una nueva matriz, la matriz (Psi), que expresa las correlaciones
entre los trminos de error. Aunque los modelos que estamos tratando son una restriccin del
planteamiento LISREL general y no se contemplan correlaciones entre distintos trminos de
error, sin embargo s es interesante conocer los elementos de la diagonal de la matriz , que
hacen referencia a las distintas proporciones de variacin no explicadas ligados a los diferentes
errores.
14
De esta forma, en relacin al modelo que estamos tratando, sus matrices relevantes, explicativas
del modelo en cuestin, seran:
Donde las diferentes matrices a considerar sern:
0
=
21
0
0
= 11
0
12
22
= 11
21 22
= 11
0
22
0
Ejemplo 1.2.- Tengamos el siguiente diagrama causal:
X1
11
21
Y1
12
X2
Figura 1.16
Calcular: a) la ecuacin estructural de dicho modelo, y b) las matrices que lo conforman.

SOL:
La ecuacin estructural ser:
y 1 = 11x 1 + 12 x 2 + 1
Y las matrices correspondientes:
= [ 11
12 ]
= 11
21
22
= [ 11 ]
15
Ejemplo 1.3.- Tengamos el siguiente diagrama causal:

1
11
21
X1
Y2
Y1
Figura 1.17
Calcular: a) ecuaciones estructurales, y b) las matrices de dicho sistema.
SOL:
Las ecuaciones del sistema sern:
y 1 = 11x 1 + 1
y 2 = 21y 1 + 2
En notacin matricial:
y 1 = 0
y 2 21
0 y1 11
[ ] 1
0 y 2 + 0 x1 + 2
Y las matrices correspondientes:
0
=
21
0
0
= 011

= 11
21
22
= 0 11
0
22
Ejemplo 1.4.- Dada las siguientes matrices que configuran un determinado sistema:
0
=
21
0
0
= 011
12
0
13
0
11
= 21
31
Determinar la estructura del modelo al que hacen referencia.
22
32
33
= 0 11
0
22
16
SOL:
Por la matriz ? se deduce que es un modelo compuesto por las variables endgenas
Y1 e Y2 Por la matriz ? y sabemos que hay tres variables exgenas: X1 , X2 y X3 .
Adems, por la matriz ?deducimos que slo es afectada la variable Y1 por las distintas
variables exgenas. Por ltimo, la matriz nos indica que los errores estn
incorrelacionados. Por tanto, la estructura del modelo ser:
1
11
X1
21
12
X2
31
32
21
Y
13
Xk
Figura 1.18
1.5.- Estimacin de parmetros

La estimacin de parmetros exige que el modelo cumpla previamente la condicin de
identificacin; esto es, que el sistema de ecuaciones elaborado en el clculo de los
parmetros -incgnitas a determinar- sea igual o superior al nmero de tales incgnitas. En este
apartado daremos por supuesto que tal condicin de identificacin queda satisfecha y nos
limitaremos, en consecuencia, al procedimiento de clculo en
la estimacin de los
parmetros. Dejaremos para ms adelante el problema de la identificacin, que por su inters
merece un tratamiento aparte, y que en nuestra opinin exige una cierta familiaridad con el
path anlisis.
Se utilizan dos procedimientos en la estimacin de los parmetros de un determinado modelo: a)
la primera ley y b) la regla del trazado. La primera ley ofrece un planteamiento riguroso,
vlido para cualquier tipo de modelos (recursivos y no recursivos), mientras que la regla del
trazado, de carcter intuitivo, slo es vlido para modelos recursivos.
Aqu nos limitaremos a tratar la ley del trazado, que permite igualmente determinar los
parmetros del modelo. Se considera una regla
intuitiva, no matemtica, aunque puede
demostrarse su coincidencia con la primera ley del path anlisis. La regla del trazado indica
que la correlacin entre dos variables equivale a la suma de todos los posibles efectos entre
ambas variables (efectos directos, indirectos, conjuntos y espreos). Por otro lado, los efectos se
miden mediante los productos entre todos los coeficientes "path" existentes en los distintos
caminos que puedan establecerse dos variables dadas. Por ejemplo, tomemos como referencia
la estructura de relacin del siguiente modelo:
17
21
X1
11
21
21
Y1
Y2
12
22
X2
Figura 1.19
Considerando que entre las variables X1 y X2 no existe relacin de causalidad, y por tanto,
slo se considera la correlacin entre ellas, tendremos que la reproduccin de los distintos
coeficientes de correlacin mediante la regla del trazado ser:
r y 1x1 = 11 + 12 21
ED
EC
(1.6)
Se contempla un efecto directo (ED) a travs de 11 :
11
X1
Y1
Y2
X2
Figura 1.20
Y un efecto conjunto con X (EC) a travs de 12 21 :
X1
21
Y1
12
X2
Figura 1.21
Y2
18
Para reproducir ry1x2 se observa una situacin equivalente que en ry1x1 . Existe un efecto directo
proporcionado por 12 y un efecto conjunto en el producto 11 21 :
r y 1x 2 = 12 + 11 21
ED
EC
(1.7)
Efecto directo ( 12 ):
X1
12
Y1
Y2
X2
Figura 1.22
Efecto conjunto ( 11 21 ):
X1
11
21
Y1
Y2
X2
Figura 1.23
En relacin a ry2 x1 :
r y 2 x 1 = 21 + 22 21 + 21 11 + 21 12 21
ED EC
EI
EC
(1.8)
19
21
X1
Y1
Y2
X2
Figura 1.24
X1
21
Y1
Y2
22
X2
Figura 1.25
Efecto indirecto ( 21 11 ):
X1
11
Y1
X2
Figura 1.26
21
Y2
20
Efecto conjunto ( 21 12 21 ):
X1
21
Y1
12
21
Y2
X2
Figura 1.27
En relacin a ry2 x2 :
ry 2 x2 = 22 + 12 21 + 21 12 + 21 11 21
ED
EC
EI
EC
(1.9)
X1
Y1
Y2
22
X2
Figura 1.28
X1
21
21
Y1
X2
Figura 1.29
Y2
21
Efecto indirecto ( 21 12 ):
X1
Y1
21
Y2
12
X2
Figura 1.30
Efecto conjunto ( 21 11 21 ):
X1
11
21
Y1
21
Y2
X2
Figura 1.31
En relacin a ry2 y1 :
r y 2y 1 = 21 + 12 11 + 22 12 + 21 21 12 + 22 21 11
ED EE
EE
EE
EE
(1.10)
Efecto directo ( 21 )
X1
Y1
X2
Figura 1.32
21
Y2
22
Efecto espreo ( 21 11 ):
21
X1
11
Y1
Y2
X2
Figura 1.33
X1
Y1
12
Y2
22
X2
Figura 1.34
Efecto espreo ( 21 21 12 ):
21
X1
21
Y1
12
X2
Figura 1.35
Y2
23

X1
11
21
Y1
Y2
22
X2
Figura 1.36
Como consecuencia de ello, tras haber aplicado la regla del trazado obtendremos el siguiente
sistema de ecuaciones:
rx 2x1
ry1x1
ry1x2
ry 2x1
ry 2x 2
ry 2y 1
= 21
= 11 + 12 21
= 12 + 11 21
= 21 + 22 21 + 21 11 + 21 12 21
= 22 + 21 21 + 21 12 + 21 11 21
= 21 + 12 11 + 22 12 + 21 21 12 + 22 21 11
Obsrvese que disponemos de seis ecuaciones, cuyos valores nos lo ofrecen las distintas
correlaciones, y seis incgnitas -los seis parmetros del modelo-, por lo que dicho sistema
ser resoluble y tendr solucin nica -modelos exactamente identificados-. Ya veremos en el
prximo apartado que pueden plantearse otras alternativas, tal como ms ecuaciones que
incgnitas -modelos sobreidentificados- o bien menos ecuaciones que incgnitas -modelos
subidentificados-.
Adems de los parmetros mencionados se suelen calcular los valores ii correspondientes a
las diferentes proporciones de variacin no explicada de las distintas variables endgenas del
modelo. As, en este modelo:
11 = 1 R y21.x1x2
22 = 1 R y22 .y1x1x2
En relacin a los valores de R2 puede demostrarse que su valor corresponde a la suma de
las correlaciones de todas las variables que inciden sobre la variable endgena en cuestin
por el valor de los coeficientes estandarizados que ligan estas mismas variables. De esta
forma tenemos:
11 = 1 R y21.x1x2 = 1 11ry1x1 + 12ry1x2

22 = 1 R y2 2.y1x1x 2 = 1 21ry 2 x1 + 21ry 2 y1 + 22ry 2x 2
24
Ejemplo 1.5.- Un determinado investigador desea estudiar las relaciones existentes entre las
variables Inteligencia (X1 ), Clase social (Y1 ) y Rendimiento (Y2 ). Para ello propone el
siguiente modelo:
X1
21
11
21
Y1
Y2
Figura 1.37
Las correlaciones observadas son:

ry1x1 = 0. 5
ry 2 x1 = 0. 8
ry 2y 1 = 0 . 6
Esto supuesto, determinar: a) las ecuaciones estructurales, b) los parmetros del modelo y, c)
los distintos efectos y su cuantificacin.
a) Las ecuaciones estructurales sern:
y 1 = 11x1 + 1
y 2 = 21 y 1 + 21x1 + 2
b) Para determinar sus parmetros, apliquemos la regla del trazado:

ry 1x1 = 11
ry 2 x1 = 21 + 11 21
ry 2 y 1 = 21 + 11 21
Segn las correlaciones obtenidas tendremos:

11 = ry1x1 = 0 .5
Y en relacin a 21 y 21 :
0 .8 = 21 + 0 .5 21
0 .6 = 21 + 0.5 21
25
Haciendo operaciones:
21 = 0 .267
21 = 0.667
En relacin a 11 y 22 :
11 = 1 R y2 2.x1 = 1 11ry1x1 = 1 0 .5 2 = 0 .75

22 = 1 R y2 2.y1x1 = 1 21ry 2 x1 + 21ry 2 y1 = 1 (0 .667 * 0 .8 + 0.267 * 0.6 ) = 0 .307
De esta forma, el diagrama causal quedara:
X1
0.667
0.5
0.307
0.75
0.267
Y1
Y2
Figura 1.38
c) En relacin a las variables X1 e Y1 slo se contempla un efecto directo:

r y 1x 1 = 11 = 0 . 5
En relacin a las variables X1 e Y2 , se contemplan un efecto directo y otro indirecto:

ry2 x1 =
21
ED = 0 . 667
11 21 = 0 . 8
EI = 0 . 5 * 0. 267 = 0 . 134
Y en relacin a Y1 e Y2 , se contemplan un efecto directo y otro espreo:

ry2 y 1 =
21
ED = 0. 267
+
11 21 = 0 . 6
EE = 0 . 5 * 0 . 667
26
Ejemplo 1.6.- Tengamos las variables A, B , C y D relacionadas segn la siguiente estructura:
C
A
D
B
Utilizando nomenclatura LISREL reelabora el anterior diagrama causal y expresa la correlacin

entre las variables A y D mediante la regla del trazado.
SOL:
El diagrama causal utilizando terminologa LISREL ser:
Y2
21
X1
32
11
21
31
Y1
Y3
Figura 1.40
Aplicando la regla del trazado para determinar la correlacin entre Y3 y X1 :

ry3 x1 = 11 31 + 11 21 32 + 21 32
Se observa que todos son efectos indirectos.
27
1.6.- Significacin de los parmetros

Una vez estimados los parmetros interesa conocer la significacin de los mismos; esto es,
si se cumplen las relaciones establecida por el investigador. Pudiera ocurrir que uno o
varios de los coeficientes path no fueran estadsticamente diferentes de cero, con lo que los
enlaces que ligan determinadas variables pudieran eliminarse simplificndose con ello el
modelo.
El planteamiento de la significacin de los parmetros ha de situarse, no obstante, en el
contexto -ms amplio- de la bondad de ajuste del modelo establecido. Aqu, como en el
modelo de la regresin mltiple existe un doble cometido. Por un lado se procede a un
anlisis global que permita comprobar si un determinado modelo da cuenta de una
proporcin significativa en cuanto variabilidad de la realidad estudiada. Por otro lado, se
realiza un anlisis en detalle para cada uno de los coeficientes path a efectos de comprobar
si la relacin especfica establecida es correcta o no. Ambos tipos de anlisis son
complementarios y convienen realizarse. Globalmente un modelo puede ser aceptable y sin
embargo esconder deficiencias concretas que induzcan a conclusiones graves.
La primera cuestin -la validez global del modelo- ser tratada ms adelante. Por su
importancia y porque obliga a profundizar en otros aspectos tales como los relacionados
con los problemas de identificacin, preferimos darle un trato aparte.
Conviene indicar que la elaboracin de un modelo es un proceso dinmico que
frecuentemente no acaba con la realizacin de un nico modelo. Lo habitual es que stos
se vayan puliendo hasta que el investigador logre un cierto grado de satisfaccin. Esta labor
implica tanto desechar relaciones no significativas y repetir el
modelo eliminando
ciertos enlaces, como tantear relaciones donde originalmente no hayan sido contempladas, a
efectos de comprobar si efectivamente no fueron necesarias en un principio. Al final, cuando se
haya logrado un cierto ajuste global aceptable, al mismo tiempo que todas y cada una de las
relaciones sean factibles, podremos dar por concluido el modelo.
La comprobacin de la significacin de los coeficientes path sigue la misma lgica, ya
conocida, de la significacin de los coeficientes de regresin estandarizados. Se trata de
aplicar la prueba t de Student a efectos de comprobar si un determinado coeficiente path
procede una poblacin caracterizada por un valor igual a cero. Como se recuerda, en la
regresin mltiple:
t=
i 0
S i
i
S i
Siendo:
S i =
1 R2
q
N k 1 jj
28
En los modelos estructurales tendremos igualmente sobre

ejemplo ij :
t=
ij 0
S ij
un
determinado parmetro, por
ij
S ij
Siendo:
S ij =
1 R2
q jj =
N k 1
ii
q jj
N k 1
donde:
ii : Proporcin de variabilidad no explicada de la variable endgena Yi
N : Nmero de sujetos de la muestra

k : Nmero de variables que inciden sobre la variable endgena
qjj : Elemento j de la diagonal de la matriz R-1 formada por las variables que afectan a la
variable endgena mencionada.
El valor de t obtenido se compara con el valor de las tablas de la t de Student para N-k-1
grados de libertad y el nivel correspondiente. Esto es: t(N k 1,) . Si el valor de t es superior,
se rechaza la Hiptesis nula al
nivel
de significacin ; el coeficiente ij es
significativamente distinto de cero. Por el contrario, si el valor de t es igual o inferior, nada
se opone a aceptar la Hiptesis nula. Mejor que esto, recurrir a las tablas on-line, donde se nos
indica la probabilidad exacta de que ocurra tal acontecimiento desde la perspectiva de la
Hiptesis nula.
Ejemplo 1.7.- Suponiendo que hemos trabajado con una muestra de 100 sujetos, determinar
la significacin de los coeficientes path del ejemplo 1.5.
SOL:
Como se recuerda, el modelo era:
X1
21
11
Y1
21
Figura 1.41
Y2
29
En relacin a 11 :
11
q
N k 1 11
S 11 =
Como slo hay una variable independiente:

Diag (R-1 ) = 1-1 = 1
As pues:
S 11 =
11
q =
N k 1 11
0 .75
*1 = 0.087
98
Por tanto:
t=
11
S 11
0. 5
= 5.715
0. 087
Buscando en las tablas:

t(98,0.05) = 1.96 .
El valor de t obtenido es superior al de las tablas, luego puede considerarse 11 = 0.5 como
significativamente diferente de cero. Si recurrimos a las tablas on-line, para un valor de t=5.715
y 98 grados de libertad, su probabilidad asociada es inferior a 0.00001.
Para determinar 21 y 21 calculemos en primer lugar R-1 :
1 0.5
R 1 = 0.5 1
1 .333
= 0 .667
0.667
1.333
Luego:
S 21 =
S 21 =
22
q 11 =
N k 1
22
q =
N k 1 22
0 .307
* 1.333 = 0 .065
97
0 .307
* 1.333 = 0.065
97
30
Calculemos los valores de t:

t1 =
t2 =
21
S 21
21
S 21
0.667
= 10.321
0.065
0.267
= 4.128
0.065
Buscamos en las tablas para:

t(97,0. 05) = 1.96 .
Se deduce que ambos coeficientes son estadsticamente significativos.
1.7.- Validacin del modelo

Veremos en este apartado alguna de las tcnicas estadsticas que permiten comprobar la
adecuacin de un modelo a la realidad estudiada. La validacin de un modelo guarda una
estrecha relacin con la significacin de los coeficientes, estudiado en el apartado anterior.
Aqu se contrasta en una nica prueba la totalidad del modelo mientras que en el caso de los
coeficientes se contrastaba en diferentes pruebas la significacin estadstica de cada uno de
tales coeficientes. Ambos tipos de contrastes son complementarios y han de realizarse en
todo proceso de elaboracin de un modelo.
Como se recuerda, en los modelos de regresin mltiple se estudiaba la validez de los mismos
merced a la prueba de bondad de ajuste; esto es, una vez especificadas las variables
independientes y dependiente del modelo se trataba de determinar el porcentaje de variancia
explicada de la variable dependiente por el modelo establecido.
En este tipo de modelos, una vez definidas las variables, slo haba una nica estructura de
relacin posible. No caban otras alternativas. Exista, no obstante, una cierta capacidad de
maniobra consistente en introducir las variables segn un determinado orden (Stepwise,
Forward o Backward) de manera que las variables irrelevantes -frecuentemente redundantesquedaran eliminadas del modelo. Podamos operar con el orden de entrada y el nmero de
variables a considerar, pero no con la estructura de relacin que vena fijada de antemano.
En los modelos estructurales, adems de la relevancia de las variables se contempla la
relevancia de la estructura. Dadas unas ciertas variables, que se suponen pertinentes para
el modelo, se trata de determinar la estructura idnea que refleje el juego real de relaciones
existente entre las variables en liza.
De esta forma, en los modelos estructurales la bondad de ajuste tiene un doble cometido, por
un lado hemos de determinar las variables adecuadas que expliquen una proporcin de varianza
suficiente del modelo, y por otro, hemos de fijar la estructura que mejor se adecue al
mecanismo causal de la realidad observada.
31
Ambos propsitos exigen especialmente fundamentacin terica del tema en cuestin. Ha de

conocerse, en primer lugar, lo ms exhaustivamente posible, la literatura cientfica en torno
al aspecto de la realidad estudiada. Despus, sobre esta base de conocimientos, la
estadstica, como instrumento, puede
resultar
particularmente til. En
concreto
nos
limitaremos, tomando como referencia, un cierto modelo que se toma como partida y que
responde a los conocimientos que hemos adquirido sobre un tema concreto, (y que en
principio, se supone razonable), a aplicar procedimientos que permitan de una manera
progresiva ir depurando el modelo hasta encontrar aquel que por razones de parsimonia
refleje de una manera aceptable la realidad observada con un mecanismo causal lo ms
simple posible. En trminos matemticos, el criterio de ajuste que utilizaremos ser funcin de
las discrepancias existentes entre la matriz de correlaciones de las variables estudiadas, que
se toma como ndice de la informacin del fenmeno real, y la matriz de correlaciones
reproducida a partir de los parmetros del modelo, y que se entiende que es la informacin que
de la realidad retiene el modelo elaborado.
Conviene recordar a este respecto que la validacin de un modelo es frecuentemente un
camino de ida y vuelta. No se progresa en ellos de manera lineal sino diramos en espiral.
Modificaciones puntuales que mejoran ciertas parcelas del modelo pueden alterar otras y
obligar a retomar cuestiones aparentemente resueltas que incluso den lugar a replantear la
totalidad del modelo. Una vez reelaborado el modelo se procede a un nuevo estudio en
detalle, que de nuevo podra alterar la totalidad del modelo. Y as sucesivamente, hasta
alcanzar un punto de plausibilidad del modelo, donde el investigador, si no es demasiado
neurtico, lo d por concluido.
La elaboracin de un modelo -hemos de insistir en ello- es una labor principalmente de
fundamentacin terica. Un modelo puede estar mal conceptualizado y ser, al mismo tiempo,
intachable desde el punto de vista estadstico. Nada puede hacer la estadstica frente a tal
modelo como no sea abundar (de una manera rigurosa, eso s) en el error. Los modelos han de
ser, en primer lugar, correctos y adems precisos. Hay un aspecto formal, cualitativo, de
especial importancia a la hora de enjuiciar un modelo y que escapa al dominio de la
estadstica.
No obstante, las tcnicas estadstica son un procedimiento nada desdeable de ayuda al
investigador en su proceso de construccin de un modelo. Detecta incongruencias que hacen
incompatible el modelo con
las hiptesis de partida, lo simplifica, consigue aumentar la
proporcin de varianza explicada del modelo ..etc. Y lo que en nuestra opinin es ms
importante; en todo este proceso el investigador se va familiarizando ms y ms con aquello
que desea modelar. Y en este sentido, conviene insistir en la conveniencia de no limitarse en
estos casos a la mecnica del Path anlisis, o como veremos ms adelante, a la del LISREL,
sino que adems son muy tiles aplicar tcnicas exploratorias de datos, procedimientos
grficos, pequeos contrastes bivariantes .. etc, que permiten al investigador a maximizar
la informacin del fenmeno estudiado y, por lo tanto, le ayudan en la toma de decisiones
adecuadas.
Antes de introducirnos en el proceso de depuracin de un determinado modelo
expondremos algunos criterios de tipo estadstico que pueden ayudarnos a tomar la decisin
adecuada a la hora de elegir el mejor modelo entre varios posibles. Trataremos el tema de la
identificacin de los modelos.
32
1.8.- Identificacin de modelos

Una condicin necesaria, previa a la validez del modelo, hace referencia a la identificacin
del mismo; esto es, a la posibilidad de que los parmetros del modelo sean susceptibles de
ser calculados. Como se sabe, la determinacin de los parmetros obedece a la solucin de un
sistema de ecuaciones, donde existen tantas ecuaciones como correlaciones posibles entre
las diferentes variables del sistema. De aqu se deduce que para que tal sistema sea resoluble
debe haber como mnimo tantos parmetros a estimar -incgnitas- como ecuaciones
existentes. En trminos matemticos, si tenemos un modelo de n variables, el nmero de
correlaciones posibles entre ellas ser igual a n(n-1)/2. As, si tenemos un modelo con tres
variables, tal como X1 , X2 e Y1 el nmero de correlaciones posibles ser 3*2/1 = 3. A saber,
rx2 x1 , ry1x1 y ry1x2
Estas unidades de informacin -matriz de correlaciones- marcan, como se ha indicado, el
nmero de ecuaciones posibles en la determinacin de los parmetros del modelo. Puede
ocurrir, como en los casos vistos hasta ahora, que el nmero de parmetros a estimar
coincida con el nmero de correlaciones del modelo. En este caso, la solucin del sistema
de ecuaciones es nica y diremos que el modelo es exactamente identificado. Puede ocurrir, por
otro lado, que el nmero del parmetros del modelo sea inferior al nmero de ecuaciones
-modelo sobreidentificado-. Aqu hay redundancia de informacin. Existen varias
soluciones posibles del sistema y es necesario arbitrar en este caso criterios para elegir la
mejor opcin. Por ltimo, el nmero de ecuaciones puede ser inferior al nmero de parmetros
del modelo. En este caso, no existe informacin suficiente, no es posible encontrar solucin
alguna al sistema de ecuaciones y diremos que el modelo es subidentificado.
En trminos ms formales, el criterio matemtico utilizado hace referencia a los grados de
libertad del modelo (gl). Si definimos tal concepto como la diferencia entre el nmero de
ecuaciones del sistema (E) y el nmero de parmetros a estimar (P), tendremos que:gl = E P .
As, los modelos exactamente identificados sern aquellos donde gl=0, los modelos
sobreidentificados, aquellos donde gl>0, y, por ltimo, los modelos subidentificado, donde
gl<0.
1.8.1.- Modelos exactamente identificados

Todos los modelos vistos hasta ahora han sido exactamente identificados. Ocurre, como se
ha indicado, cuando todas las variables del modelo estn enlazadas entre s, tal como se refleja
en el siguiente grfico:
X1
21
11
Y1
Figura 1.42
21
Y2
33
Se cumple que el nmero de correlaciones -ecuaciones del sistema- coincide con el nmero
de parmetros del modelo. En consecuencia gl=0. As, en relacin a este caso, tenemos las
siguientes ecuaciones bsicas:
ry1x1 = 11
ry2 x1 = 21 + 11 21
ry2 y1 = 21 + 11 21
Las correlaciones son: rx2 x1 , ry1x1 y ry1x2 . Las
mismas
que los coeficientes path del
modelo: 11 , 21 y 21 . Habr, pues, tantas ecuaciones como incgnitas. (Obsrvese que los
parmetros 11 y 22 hacen referencia a las varianzas residuales y pueden ser conocidos a
partir de la informacin que suministran las correlaciones del modelo). De aqu se deduce
que la solucin del sistema es nica. En base a la estructura definida slo son posibles unos
valores nicos para los parmetros del modelo.
Esta circunstancia implica, en base al criterio comentado anteriormente de ajuste, que las
correlaciones reproducidas a partir de los parmetros del modelo son precisamente las
correlaciones reales, con lo que tal criterio carece de utilidad en este tipo de modelos. No es
posible saber segn dicho criterio qu modelo entre varios alternativos ajusta mejor con la
realidad observada. Se dice que tales modelos no son verificables por cuanto, en trminos
estadsticos, no puede establecerse entre varios de ellos cual es preferible.
Supongamos en este sentido que tres investigadores, con posiciones tericas muy
distintas, quieren estudiar el efecto que sobre el xito profesional (EP) ejercen las variables
Inteligencia (IN) y Nivel social (NS). A este respecto, establecen los siguientes modelos:
IN
NE
Modelo A
IN
EP
NE
Modelo B
IN
EP
NE
EP
Modelo C
Figura 1.43
En el modelo A se parte de una postura, diramos genetista; es la Inteligencia -heredada- la
causa del Nivel social. En el modelo B se parte, por el contrario, de una postura
ambientalista; es el Nivel social -la educacin- lo que determina la Inteligencia. Por ltimo,
en el modelo C, se supone que ambas variables covaran -comparten informacin- pero no
se especifica el sentido de la causalidad.
Si nos tomramos la molestia de calcular los parmetros de estos tres modelos observaramos
que en todos ellos las ecuaciones sern las mismas, tal como se indica en (4.1), y en
consecuencia, los parmetros seran, igualmente, los mismos. La proporcin de varianza
explicada por los modelos seran
exactamente
iguales,
la significacin de
los
34
coeficientes tambin .. etc. En definitiva, no habra forma, en base a criterios puramente

estadsticos de determinar qu modelo es preferible a cual. Tan slo en base a criterios de
ndole terico (con las precauciones necesarias de todo trabajo no experimental) podra
establecerse alguna decisin a este respecto.
1.8.2.- Modelos sobreidentificados

Todos los modelos contemplados en el Path anlisis- recursivos con variables observadascuando carece de algn enlace entre algunas de las variables son modelos sobreidentificados.
Como se ha indicado, las ecuaciones vienen marcadas por el nmero de correlaciones todas las relaciones posibles entre las variable-, por tanto, baste que se suprima algn enlace (o
lo que es lo mismo, restrinjamos el parmetro en cuestin a cero) para que el nmero de
parmetros a estimar sea inferior al de correlaciones, y en consecuencia, el sistema tenga ms
ecuaciones que incgnitas. Desde una perspectiva formal, son aquellos modelos cuyos grados de
libertad son superiores a cero (gl>0).
En estos casos existen varias soluciones posibles para los parmetros del modelo, lo que
permite elegir, en base al criterio de ajuste -discrepancia entre las correlaciones
reproducidas por el modelo y las correlaciones observadas- aquel modelo que presente mejor
bondad de ajuste. Se dice, por ello, que tales tipos de modelos son verificables por cuanto
pueden ser contrastados y comprobar si las restricciones realizadas son o no viables en el
sentido de que los parmetros estimados satisfagan aquellas ecuaciones no utilizadas en
la determinacin de estos mismos parmetros, o lo que es lo mismo, los parmetros estimados
verifiquen tales ecuaciones.
Consideremos, en este sentido, los modelos A y B reflejados en la figura 4.3. Ambos modelos
operan con las mismas variables: Ingresos (IN), Nivel educativo (NE) y Prestigio social (PS).
No obstante, la estructura de relacin indicada para cada uno de dichos modelos es bien
diferente. En el modelo A se supone que los Ingresos inciden sobre el Nivel educativo,
que a su vez, afecta el Prestigio social. Por el contrario, en el modelo B, es el Prestigio social lo
que incide sobre los Ingresos, y stos sobre el Nivel educativo. As:
IN
IN
NE
N
E
PS
Modelo A
PS
Modelo B
Figura 1.44
35
En trminos ms formales y estableciendo las siguientes identidades para los modelos A y B

respectivamente:
Modelo A
Modelo B
IN X1
NE Y1
PS Y2
IN Y1
NE Y2
PS X 1
obtendremos los modelos:
X1
Y1
Y1
21
11
21
Y2
11
Y2
X1
Modelo A
Modelo B
Figura 1.42
Supongamos que las correlaciones entre las distintas variables son las siguientes:
rNI = 0 .7
rPI = 0.5
rNP = 0.6
Elijamos el modelo A. Disponemos de tres correlaciones

parmetros, tal como se reflejan en las siguientes ecuaciones:
para
determinar tan slo dos
ry1x1 = 11
ry2 x1 = 11 21
ry2 y1 = 21
Podemos elegir las ecuaciones referentes a ry1x1 y ry 2x1 para determinar los parmetros 11 y
21 (el valor 21 ha sido fijado a cero). As pues:
ry 1x1 = 11
ry 2y 1 = 21
11 = 0 .7
21 = 0 .6
36
Completemos el modelo calculando 11 y 22 :
11 = 1 ry21.x1 = 1 0 .7 2 = 0 .51
22 = 1 ry22.y1 = 1 0 .6 2 = 0.64
El modelo resultante ser:
X1
0.7
0.68
1
0.51
0.6
Y1
Y2
Modelo A
Figura 1.46
A partir de los parmetros 11 y 21 podemos reproducir ry 2x1 :
ry*2x 1 = 21 11 = 0 .6 * 0 .7 = 0 .42
Se observa que entre la correlacin real ry 2x1 y la correlacin reproducida ry*2x1 a partir de
los parmetros 11 y 21 existe una cierta discrepancia:
ry 2x 1 ry*2x 1 = 0.5 0.42 = 0.08
Consideremos
ahora
el modelo B. Disponemos de las
mismas
correlaciones que
anteriormente, pero en este caso, para estimar los parmetros 11 y 21 de la figura 1.47.
ry1x1 = 11
ry 2y1 = 21
11 = 0 .5
21 = 0 .7
Calculemos 11 y 22 :
11 = 1 ry21.x1 = 1 0 .5 2 = 0. 75
22 = 1 ry22 .y1 = 1 0 .7 2 = 0 .51
37
El modelo quedar:
0.75
Y1
0.5
0.7
0.5
X1
Y2
Figura 1.47
A partir de los parmetros 11 y 21 podemos reproducir ry 2x1 :
ry*2x1 = 21 11 = 0.7 * 0.5 = 0.35
Se observa que entre la correlacin real ry 2x1 y la correlacin reproducida ry*2x1 a partir de
los parmetros 11 y 21 existe la discrepancia:
ry 2 x1 r y*2 x1 = 0 .6 0 .35 = 0 . 25
Comparando ambos modelos deduciremos grosso modo (ya veremos el proceso estadstico
riguroso en el prximo tema) que el modelo B se ajusta peor a los datos de observacin que
el modelo A. En consecuencia, preferiremos el modelo A al B.
1.8.3.- Modelos subidentificados

Aunque dentro del path anlisis, como se ha indicado, no es posible la existencia de modelos
subidentificados, expondremos, nicamente con nimo ilustrativo, las caractersticas de
tales tipo de modelo. Hemos de decir que dichos modelos son tratados en un contexto ms
general -LISREL- (fuera de nuestro propsito actual), donde las restricciones especficas
del path anlisis quedan ampliamente
superadas, contemplndose entre otros aspectos
(error de medida, variables latentes ..etc) la posibilidad de causalidad recproca entre las
distintas variables, as como correlaciones con los trminos de error.
Los modelos subidentificados se
caracterizan
por
no
contener informacin
suficiente para estimar los parmetros. En trminos matemticos se traduce en la
existencia de ms incgnitas que ecuaciones; esto es, se caracterizan por tener un nmero de
grados de libertad menor de cero (gl<0). Un caso elemental de modelo subidentificado
es el siguiente modelo no recursivo:
21
Y2
Y1
12
Figura 1.48
38
Slo disponemos de la correlacin ry1y2 (que por razones de simetra equivale a ry 2y1 ), y
hemos de determinar a partir de este valor los parmetros 12 y 21 . Tenemos una unidad
de informacin y dos incgnitas a resolver.
Igualmente puede darse el caso de que aunque el sistema sea recursivo no se den los supuestos
del modelo de path anlisis en relacin a los trminos de error, y presenten correlacin entre
ellos, tal como se contempla en el siguiente modelo donde estn relacionados los trminos de
error 1 y 2 :
11
1
Y1
21
11
21
22
2
21
Y2
X1
Figura 1.49
O bien que exista relacin entre alguna variable explicativa y el trmino de error:
11
1
Y1
11
21
22
2
r1X1
21
X1
Y2
Figura 1.50
O cualquier combinacin de estos casos. Son modelos, por ello, no susceptibles de ser
resueltos en trminos de sus parmetros. Como hemos indicado, no es nuestra intencin, por el
momento, de entrar en la casustica de este tipo de modelos y su posible abordaje si no tan
slo mostrar la existencia de tales modelos al lector.
39
1.9.- Aplicacin informtica
1.10.- Introduccin
Es nuestra intencin en este apartado retomar algunos de los ejemplos tratados en pginas
anteriores y resolverlos mediante el programa informtico LISREL 8.7. Ser, pues, la
ocasin de introducirnos (muy brevemente) en la programacin LISREL.
Trataremos, en una primera instancia, el ejemplo 1.5 (modelo exactamente identificado) donde
determinaremos la estimacin de los parmetros y su significacin estadstica. A continuacin
abordaremos la cuestin de los modelos sobreidentificados. Retomaremos el ejemplo 1.6 y
volveremos a su anlisis, esta vez, con mayor rigor formal.
1.11.- Modelo exactamente identificado

Retomemos el ejemplo 1.5. Como se recuerda, el diagrama causal correspondiente era:
X1
21
11
Y1
21
Y2
Figura 1.51
Las variables en cuestin:

X1 : Inteligencia
Y1 : Clase social
Y2 : Rendimiento
Y las correlaciones:
ry1x1 = 0.5
ry2 x1 = 0.8
ry 2y1 = 0 .6
40
La determinacin de los parmetros de este modelo junto a la significacin estadstica de

los mismos, merced al recurso de la programacin LISREL, vendr indicado en las
siguientes sentencias:
MODELO EXACTAMENTE IDENTIFICADO

DA NI=3 NO=100 MA=KM
KM
1
0.6 1
0.5 0.8
1
LA
CSOCIAL REN INT
SE
1
2 3
MO NY=2 NX=1 BE=FU,FI
PS=DI,FR
PA BE
0
0
1
0
PATH DIAGRAM
OU SE TV
La primera lnea hace referencia al ttulo del problema. Podemos hacerlo tan largo como
queramos (varias lneas). El ttulo finalizar cuando se encuentre con la sentencia DA.
La sentencia DA (DAta and problem parameters) permite introducir la informacin bsica
del problema. Aqu hemos contemplado las siguientes especificaciones: NI (Number of Input
variables), NO (Number of Observations) y MA (type of MAtriz to be Analyzed). En relacin
a la instruccin MA hemos indicado que la matriz de entrada es la matriz de correlaciones,
cuya especificacin aqu es KM.
A continuacin viene precisamente la informacin de partida. Tras un encabezamiento
indicndole que la matriz a considerar es la matriz de correlaciones (KM) se ofrecen las
distintas
correlaciones
(solamente submatriz diagonal inferior, ya que dicha matriz es
simtrica). Por otro lado, la estructura de dicha matriz es:
Y1
Y2
Y2
0.6
X1
0.5
0.8
Y1
X1
esto es, en primer lugar se colocan las variables endgenas y a continuacin las exgenas.
41
La sentencia LA (LAbels) muestra el nombre de las variables, que se expresan en la siguiente

lnea. Estas son: INT (Inteligencia), CSOCIAL (Clase social) y REN (Rendimiento).
La sentencia SE (SElect) nos indica el orden en el que van a ser ledas las variables de entrada.
El LISREL obliga a leer primero las variables endgenas y a continuacin la exgenas. Como
las variables endgenas son CSOCIAL (Y1 ) y REN (Y2 ), indicaremos estas en primer lugar,
seguida de la variable exgena INT (X1 ). El orden ser 1 2 3.
En la sentencia MO (Model parameters) se indica primeramente el
nmero de variables
endgenas observadas del modelo (NY) y el nmero de variables exgenas observadas
(NX). A continuacin hay que especificar la estructura de las matrices a utilizar y los
parmetros contenidos en ellas que hay que estimar. Como se sabe, las matrices contempladas
en este tipo de modelos son: BETA ( ), GAMMA ( ), PHI ( ) Y PSI ( ). En relacin a
la matriz BETA le indicamos que es una matriz completa (FULL) y que todos los parmetros
estn fijados (FIXED) a cero. De esta forma le indicaremos:
BE=FU,FI
Puede parecer esta sentencia una contradiccin, ya que sabemos que hemos de calcular el
parmetro 21 . Esto no es problema porque en la sentencia PA (PAttern matrix) que viene a
continuacin le especificamos exactamente qu parmetros deseamos estimar: son aquellos
que vienen representados por un 1. De esta forma le indicaremos:
PA
0
1
BE
0
0
Esto es, de la siguiente matriz:

Y1
11
Y1
Y2
21
Y2
12
22
slo hemos de calcular 21

.
En relacin a la matriz PSI, como se suponen que los errores no estn correlacionados entre s,
se especifica dicha matriz como diagonal y a estimar sus parmetros; esto es, libres a estimar
(FREE). As:
PS=DI,FR
42
Para las matrices GAMMA y PHI no hace falta especificar nada. En relacin a la matriz
GAMMA se contemplan todas las conexiones posibles. Y esta matriz por defecto es
precisamente FU,FR. Igualmente la matriz PHI por defecto es una matriz simtrica, como es el
caso aqu. Por tanto, tampoco hemos de especificar PH=SY,FR.
Resumiendo, las matrices contempladas en el modelo, junto con sus coeficientes, son las
siguientes:
GAMMA ( ):
INT
CSOCIAL
REN
11
12
CSOCIAL
REN
BETA ( ):
CSOCIAL
REN
21
PHI ( ):
INT
11
INT
PSI ( ):
CSOCIAL
CSOCIAL
REN
REN
11
22
La sentencia PATH DIAGRAM indica que se represente grficamente los resultados del anlisis.
Se representa el diagrama causal, as como sus coeficientes (y su significacin) asociados.
Por ltimo, en la sentencia OU (OUtput request) se indican las salidas que deseamos. Entre una
serie de opciones aqu solicitamos SE (Standard Errors) y TV (t-Values) asociados a dichos
errores tpicos.
43
Exponemos a continuacin la salida de este programa LISREL. Para mayor comodidad en su

lectura entresacamos las partes que hemos estimado ms relevante: los parmetros del modelo,
bondad de ajuste, errores tpicos asociados a tales parmetros y la prueba t de Student. En
relacin a los parmetros del modelo el listado es el siguiente:
LISREL Estimates (Maximum Likelihood)

BETA
REN
-------- -
0.27
(0.06)
4.13
- -
CSOCIAL
CSOCIAL
-------- -
REN
GAMMA
INT
-------0.50
(0.09)
5.72
CSOCIAL
REN
0.67
(0.06)
10.32
PHI
INT
-------1.00
(0.14)
7.00
PSI
Note: This matrix is diagonal.
CSOCIAL
-------0.75
(0.11)
7.00
REN
-------0.31
(0.04)
7.00
Squared Multiple Correlations for Structural Equations

CSOCIAL
-------0.25
REN
-------0.69
44
De aqu se deduce que el diagrama causal ser:
X1
0.667
0.5
0.307
0.75
Y1
0.267
Y2
Figura 1.52
Como puede comprobarse todos los resultados son coincidentes con los obtenidos en el
ejemplo 1.5 (clculo de los parmetros) y el ejemplo 1.7 (significacin estadstica de los
mismos).
En cuanto a la bondad de ajuste:
Goodness of Fit Statistics

Degrees of Freedom = 0
Minimum Fit Function Chi-Square = 0.0 (P = 1.00)
Normal Theory Weighted Least Squares Chi-Square = 0.0 (P = 1.00)
The Model is Saturated, the Fit is Perfect !
Se observa que el modelo, al ser exactamente identificado, ajusta perfectamente, y en

consecuencia, todos los valores referidos a las puntuaciones residuales valdrn cero.
La inclusin de la sentencia PATH DIAGRAM permite, entre otros, los siguientes grficos:
45
Si deseamos los valores de t de Student asociados:
1.12.- Modelo sobreidentificado

Retomamos aqu el ejemplo 1.6, realizado manualmente, y que por dificultades de calculo slo
pudimos comprobar grosso modo las discrepancias entre la matriz R (observada) y R*
(reproducida). Procedemos de nuevo a su ejecucin, esta vez con los recursos del programa
LISREL. Como se recuerda, se trataba de comparar los siguientes modelos sobreidentificados:
IN
IN
PS
NE
Modelo A
NE
PS
Modelo B
Figura 1.53
46
1.12.1.- Modelo A
En el modelo A suponamos que los Ingresos condicionaba el Nivel de estudios, y ste a su vez,
el Prestigio social. Por el contrario en el modelo B, era el Prestigio social lo que condicionaba
los Ingresos, y estos, el Nivel educativo. Este tipo de modelos los modelos sobreidentificados-,
como se ha indicado, son los nicos susceptibles (al margen de otras consideraciones) de ser
verificados estadsticamente.
Comencemos por el modelo A. Le indicamos lo siguiente:
MODELO SOBREIDENTIFICADO A
KM
1
0.7 1
0.5 0.6
1
LA
INGRESOS NEDUC PSOCIAL
SE
2 3 1
PS=DI,FR
PA GA
1
0
PA BE
0
0
1
0
PATH DIAGRAM
OU SE TV
Las instrucciones son prcticamente las mismas que las indicadas en la tabla 1, a excepcin de
que la seleccin de las variables es:
SE
2 3 1
Esto es, las variables endgenas (por orden) son Nivel educativo y Prestigio social, y la variable
exgena, Ingresos.
Por otro lado, la variable Ingresos slo enlaza con Nivel educativo (y no con Prestigio social),
as pues, la estructura de la matriz GAMMA ser:
PA GA
1
0
47
Un primer resultado grfico, muy sencillo, el que nos proporciona la sentencia PATH
DIAGRAM, ser:
El valor de Chi-Cuadrado (que nos marca la discrepancia entre R y R* ) para 1 grado de libertad
es 1.94. Su probabilidad asociada es 0.16354, que nos indica precisamente la probabilidad de
obtener tal matriz R* a partir de una supuesta poblacin con R. Es mayor que los valores
convencionales de 0.05 o 0.01, por o que nada se opone a aceptar que el modelo propuesto se
ajusta a los datos de observacin.
Tambin se nos indica en esta tabla que el valor de RMSEA (Root Mean Square Error of
Approximation) es 0.098. En castellano, el Error cuadrtico medio de aproximacin, que deriva
de la Chi-Cuadrado, y que a diferencia de sta, constituye un estimador insesgado del error de
aproximacin. Se define (Browne y Cudeck, 1993) como:
RMSEA =
2 gl
N * gl
siendo gl los grado de libertad del modelo y N el total de individuos. En este caso:
RMSEA =
1. 94 1
= 0.098
100 *1
Se acepta que para un buen modelo, RMSEA < 0.05. Por lo que en este caso, rechazaremos la
hiptesis de un buen ajuste.
48
Si deseamos conocer los distintos estimadores, junto a sus errores tipo y el valor de t de Student
asociado:

BETA
NEDUC
NEDUC
-------- -
PSOCIAL
-------- -
0.60
(0.08)
7.42
- -
PSOCIAL
GAMMA
NEDUC
INGRESOS
-------0.70
(0.07)
9.70
PSOCIAL
- -
PHI
INGRESOS
-------1.00
(0.14)
7.00
PSI
NEDUC
-------0.51
(0.07)
7.00
PSOCIAL
-------0.64
(0.09)
7.00
Tambin los valores de R2 para las distintas variables endgenas:

NEDUC
-------0.49
PSOCIAL
-------0.36
49
Podemos hacernos una idea de la discrepancia

correlaciones observada y reproducida:
comparando
la
matriz
de
Correlation Matrix
NEDUC
PSOCIAL
INGRESOS
NEDUC
-------1.00
0.60
0.70
PSOCIAL
--------
INGRESOS
--------
1.00
0.50
1.00

Covariance Matrix of Y and X
NEDUC
PSOCIAL
INGRESOS
NEDUC
-------1.00
0.60
0.70
PSOCIAL
--------
INGRESOS
--------
1.00
0.42
1.00
Obsrvese que en el enlace que falta entre Prestigio social e Ingresos, la correlacin reproducida
por el modelo es 0.42, siendo la real 0.5. Valores coincidentes con los obtenidos manualmente
en el ejemplo 1.6.
Adems el LISREL 8 nos ofrece una infinidad ms de indicadores de ajuste:

Estimated Non-centrality Parameter (NCP) = 0.94
90 Percent Confidence Interval for NCP = (0.0 ; 9.23)
Minimum Fit Function Value = 0.020
Population Discrepancy Function Value (F0) = 0.0096
90 Percent Confidence Interval for F0 = (0.0 ; 0.094)
Root Mean Square Error of Approximation (RMSEA) = 0.098
90 Percent Confidence Interval for RMSEA = (0.0 ; 0.31)
P-Value for Test of Close Fit (RMSEA < 0.05) = 0.21
Expected Cross-Validation Index (ECVI) = 0.12
90 Percent Confidence Interval for ECVI = (0.11 ; 0.21)
ECVI for Saturated Model = 0.12
ECVI for Independence Model = 1.17
Chi-Square for Independence Model with 3 Degrees of Freedom = 108.90
Independence AIC = 114.90
Model AIC = 11.94
Saturated AIC = 12.00
Independence CAIC = 125.72
50
Model CAIC = 29.97

Saturated CAIC = 33.63
Normed Fit Index (NFI) = 0.98
Non-Normed Fit Index (NNFI) = 0.97
Parsimony Normed Fit Index (PNFI) = 0.33
Comparative Fit Index (CFI) = 0.99
Incremental Fit Index (IFI) = 0.99
Relative Fit Index (RFI) = 0.95
Critical N (CN) = 336.06
Root Mean Square Residual (RMR) = 0.033

Standardized RMR = 0.033
Goodness of Fit Index (GFI) = 0.99
Adjusted Goodness of Fit Index (AGFI) = 0.92
Parsimony Goodness of Fit Index (PGFI) = 0.16
El valor de Chi-Cuadrado 2 hace referencia a indicadores globales de bondad de ajuste, que en

trminos generales, marca la diferencia entre R y R* , esto es, la magnitud de los residuales. Estos
valores dependen de las restricciones que hayamos impuesto; cuanto menos, menor el nmero de
correlaciones discrepantes, lo que puede dar lugar a la ilusin de un buen modelo cuando no lo
es. En el lmite, todos los modelos saturados, sean como sean, ajustan perfectamente. Tambin la
Chi-Cuadrado se ve afectado por le tamao N de la muestra, lo que penaliza el ajuste para
muchos sujetos. Es por ello, que resulta conveniente otros indicadores de ajuste relativamente
independiente del nmero de parmetros y de sujetos..
En este sentido, una solucin consiste en calcular la raiz del residuo estandarizado cuadrtico
medio, o bien SRMR (Standardized Root Mean square Residual), que es un valor promedio.
Este estadstico es muy utilizado, y su valor ha de estar por debajo de 0.05, lo que no ocurre
aqu.
Frecuentemente se comparan distintos modelos, con lo que interesa compararlos entre s y ver la
mejora relativa. Son los denominados ndices de ajuste incremental, donde se contrastan la ChiCuadrado de diferentes modelos. A este respecto tenemos el ndice de ajuste normalizado, NFI
(Normed Fit Index). Se calcula de la siguiente manera:
NFI =
b2 2
b2
donde 2 es el valor de Chi-Cuadrado del modelo propuesto, y b2 el del modelo que tomamos
como referencia. Convencionalmente este valor se refiere al denominado modelo de
independencia o nulo, que asume las covarianzas (o correlaciones) como cero. Este indicador
oscila entre 0 y 1. Como el modelo base presentar una gran discrepancia con los datos de
observacin, se exige valores de NFI superiores a 0.95. No es un buen indicador, ya que depende
en exceso del nmero de parmetros del modelo.
51
Alternativas a este ndice es el ndice de ajuste no normado, NNFI (Non-Normed Fit Index), que
intenta compensar los inconveniente del ndice anterior. Para ello trabaja con el cociente de los
distintos valores de Chi-Cuadrado y sus grados de libertad correspondientes:
b2 / glb 2 / gl
NNFI =
b2 / gl b
Por ltimo, tenemos un par de ndices, AIC y CAIC. No estn acotados entre 0 y 1, lo que
dificulta su interpretacin. Todo lo que se puede decir es que cuanto menores son, mejor es el
ajuste. Presentan frmulas equivalente, y son especialmente tiles cuando se tratan de comparar
distintos modelos referidos a la misma realidad. Aunque sus valores no estn estandarizados, s
son comparables entre distintos modelo de la misma realidad, en cuanto una disminucin de ol s
mismos implica una mayor mejora. El ndice AIC se expresa:
AIC = 2 2 gl
Y el ndice CAIC:
CAIC = 2 gl (ln( N ) + 1)
1.12.1.- Modelo B
las instrucciones para el modleo B son muy parecidas a las del modelo A. Son las siguientes
MODELO SOBREIDENTIFICADO B
KM
1
0.7 1
0.5 0.6
1
LA
INGRESOS NEDUC PSOCIAL
SE
1 2 3
PS=DI,FR
PA GA
1
0
PA BE
0
0
1
0
PATH DIAGRAM
OU SE TV
52
Tan slo hay que especificar que el orden de entrada es:
SE
1 2 3
Se entiende entonces que Ingresos es Y1 , Nivel educativo Y2 , y xito social X1 . La salida

proporcionada por PATH DIAGRAM:
La probabilidad asociada al valor de Chi-Cuadrado indica ausencia de ajuste, as como el valor

de RMSEA, muy superior a 0.05.
Respecto a los parmetros:
53

BETA
INGRESOS
INGRESOS
-------- -
NEDUC
-------- -
0.70
(0.07)
9.70
- -
NEDUC
GAMMA
INGRESOS
PSOCIAL
-------0.50
(0.09)
5.72
NEDUC
- -
PHI
PSOCIAL
-------1.00
(0.14)
7.00
PSI
INGRESOS
-------0.75
(0.11)
7.00
NEDUC
-------0.51
(0.07)
7.00

INGRESOS
-------0.25
NEDUC
-------0.49
Squared Multiple Correlations for Reduced Form

INGRESOS
-------0.25
NEDUC
-------0.12
54
Obsrvese la discrepancia entre la matriz de correlaciones observadas y

reproducidas:
Correlation Matrix
INGRESOS
NEDUC
PSOCIAL
INGRESOS
-------1.00
0.70
0.50
NEDUC
--------
PSOCIAL
--------
1.00
0.60
1.00
Covariance Matrix of Y and X
INGRESOS
NEDUC
PSOCIAL
INGRESOS
-------1.00
0.70
0.50
NEDUC
--------
PSOCIAL
--------
1.00
0.35
1.00
El enlace que falta entre Prestigio social y Nivel educativo, cuya correlacin observada es 0.6,
muestra una correlacin reproducida por le modelo de 0.35. Una discrepancia superior al modelo
A.
Y en relacin a los restantes ndices de ajuste:

Estimated Non-centrality Parameter (NCP) = 15.18
90 Percent Confidence Interval for NCP = (5.65 ; 32.11)
Minimum Fit Function Value = 0.18
Population Discrepancy Function Value (F0) = 0.15
90 Percent Confidence Interval for F0 = (0.058 ; 0.33)
Root Mean Square Error of Approximation (RMSEA) = 0.39
90 Percent Confidence Interval for RMSEA = (0.24 ; 0.57)
P-Value for Test of Close Fit (RMSEA < 0.05) = 0.00021
Expected Cross-Validation Index (ECVI) = 0.27
90 Percent Confidence Interval for ECVI = (0.17 ; 0.44)
ECVI for Saturated Model = 0.12
ECVI for Independence Model = 1.17
Chi-Square for Independence Model with 3 Degrees of Freedom = 108.90
Independence AIC = 114.90
Model AIC = 26.18
55
Saturated AIC = 12.00

Independence CAIC = 125.72
Model CAIC = 44.20
Saturated CAIC = 33.63
Normed Fit Index (NFI) = 0.84
Non-Normed Fit Index (NNFI) = 0.53
Parsimony Normed Fit Index (PNFI) = 0.28
Comparative Fit Index (CFI) = 0.84
Incremental Fit Index (IFI) = 0.85
Relative Fit Index (RFI) = 0.51
Critical N (CN) = 38.19
Root Mean Square Residual (RMR) = 0.10

Standardized RMR = 0.10
Goodness of Fit Index (GFI) = 0.90
Adjusted Goodness of Fit Index (AGFI) = 0.41
Parsimony Goodness of Fit Index (PGFI) = 0.15
Obsrvese que todos los indicadores indican un mal ajuste. Peor que en modelo A, como se
refleja en los indicadores AIC y CAIC, en donde se obtienen valores superiores.
Bibliografa
Asher, H.B. (1984). Causal Modeling. Beverly Hills: Sage.

Birnbaum, I (1981). An introduction to causal analysis in sociology. London: Mcmillan
Press.
Bollen, K. A. (1989). Structural Equations with latent variables. New York: Wiley
Bollen, K.A. And Long, J.S. (Eds.; 1993). Testing structural equation models. Thousan Oaks
Sage.
Brett, J. M.; James, L. R. (1982). Causal Analysis: Assumtions, Models And Data. Beverly
Hills: Sage.
Browne, M. W., y Cudeck, R. (1993): Alternative ways of assessing model fit en Bollen, K. A.
y Long, J. S. (Eds.), Testing structural equation models. Thousan Oaks: Sage
Byrne, B.M. (1998). Structural Equation Modelling with Lisrel, Prelis, And Simplis: Basic
Concepts, Applications, and Programming. Mahwah, Nj: L. Erlbaum
Davis, A. J. (1987). The logic of causal order. Beverly Hills: Sage.
Diamantopoulos, A. & Siguaw, J. A. (2000). Introducing LISREL: A Guide for the uninitiated.
Thousand Oaks, Ca : Sage.
Duncan, O. D. (1975). Introduction to structural equation models. New York: Academic Press.
Hayduk, L. A. (1996). LISREL: Issues, debates and strategies. Baltimore, Mariland: Johns
Hopkins U.P.
Heise, D. R. (1975). Causal Analysis. New York: Wiley.
Hoyle, R.H., (Ed.) (1995). Structural Equation Modeling: Concepts, Issues And Applications.
Thousand Oaks, Ca: Sage Publications
56
James, L. R. (1982). Causal Analysis: Assumptions, Models And Data. Beverly Hills: Sage.
Joreskog, K. G. And D.Sorbom (1988). LISREL VII: A guide to the program and
applications. Chicago: Spss, Inc.
Jreskog K. G. & Srbom, D. (1996) LISREL 8. User's reference guide. Mooresville, Indiana:
Scientific Software.
Jaccard, J. And Wan, C.K. (1996). LISREL approaches to interaction effects in multiple
regression. Beverly Hills: Sage
Kelloway, E. K. .(1998). Using LISREL for structural equation modeling: A Researcher's Guide.
Thousand Oaks, Ca: Sage
Kenny, D. (1979). Correlation and Causality. New York: John Wiley And Sons.
Loehlin, J. (1998). Latent variable models (3rd Ed). Hillsdale, Nj: Erlbaum.
Li, C.C. (1975). Path Analysis -A Primer. Pacific Grove Ca.: Boxwood Press.
Maruyama, G.M. (1998). Basics of structural equation modeling. Thousand Oaks, Ca: Sage.
Marcoulides, G.A. & Schumacker, R.E. (2001). New developments and techniques in structural
equation modeling. Mahwah, NJ: L. Erlbaum.
Marcoulides, G.A. And Schumacker, R.E. (Eds; 1996). Advanced structural equation
modelling: Issues and techniques. Hillsdale, NJ: Erlbaum.
Mulaik, Stanley A.; James,Lawrence R. (1982). Causal analysis: assumptions, models and
data. Beverly Hills: Sage Publications.
Mueller, R.O. (1998). Basic principles of structural equation modeling. New York: Springer
Pedhazur, E. J (1982). Multiple Regresion In Behavioral Research. Explanation And
Prediction (2nd Ed.). New York: Halt Rinehart and Winston.
Schumacker, R.E. and Lomax, R.G. (1996). A Beginner's Guide to Structural Equation
Modeling. Hillsdale, NJ: Erlbaum.
Schumacker, R.E. & Marcoulides, G.A. (eds.) (1998). Interaction and nonlinear effects in
structural equation modeling. Mahwah, NJ: L. Erlbaum.
Saris, W. E. And Stronkhorst, L. H. (1984). Causal modelling in nonexperimental research.
Amsterdam: Sociometric Research Foundation.
Viladrich I Segues, M.C. (1985). Models d'ecuacions Estructurals en recerca no experimental.
Barcelona: Universidad Autonoma de Barcelona.
Visauta, B. (1986). Modelos causales. Barcelona: Hispano Europea.
Wonnacott, T.H and Wonnacott, R.J. (1981). Regression: A Second Course in Statistics.
New york: wiley.
Yang Jonsson, F. (1997). Non-linear structural equation models: simulation studies of the
Kenny-Judd model. Acta Universitatis Upsalensis.

Modelo Estructural

Загружено:

Сведения о документе

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

Modelo Estructural

Загружено:

Авторское право:

Доступные форматы

1

MODELOS ESTRUCTURALES CON VARIABLES OBSERVADAS

1.1.- Introduccin ....................................................................................................................... 4

Hasta ahora los modelos estudiados de regresin corresponden a la ecuacin general:

Y = b0 + b1X1 + b2X 2 + L L + bkX k

1.2.- Supuestos del modelo

e) Se opera con variables observadas. Esta condicin ya ha sido especificada. En cierto

1.3.- Fases en la elaboracin de un modelo

Exponemos a continuacin los momentos ms

a) Elaboracin del diagrama causal

1.3.1.- Elaboracin del diagrama causal

El primer paso, aunque no estrictamente necesario, consiste en expresar grficamente la

1.3.2.- Tipos de relaciones

Y el efecto que mantiene la Inteligencia (Y1 ) con el xito profesional (Y2 ):

1.4.- Determinacin de las ecuaciones estructurales

Los modelos estructurales contemplan varias variables

Ejemplo 1.1.- Un investigador maneja dos posibles hiptesis en el estudio de la relacin

Y sus ecuaciones estructurales:

Cuyo diagrama causal ser:

Y las ecuaciones correspondientes:

1.4.1.- Expresin matricial de la ecuaciones estructurales

En trminos generales, si tenemos p variables endgenas y q variables exgenas, podremos

Ejemplo 1.2.- Tengamos el siguiente diagrama causal:

Calcular: a) la ecuacin estructural de dicho modelo, y b) las matrices que lo conforman.

Y las matrices correspondientes:

Ejemplo 1.3.- Tengamos el siguiente diagrama causal:

Y las matrices correspondientes:

Determinar la estructura del modelo al que hacen referencia.

1.5.- Estimacin de parmetros

Se contempla un efecto directo (ED) a travs de 11 :

Efecto espreo ( 2221 11 ):

11 = 1 R y21.x1x2 = 1 11ry1x1 + 12ry1x2

Las correlaciones observadas son:

b) Para determinar sus parmetros, apliquemos la regla del trazado:

Segn las correlaciones obtenidas tendremos:

11 = 1 R y2 2.x1 = 1 11ry1x1 = 1 0 .5 2 = 0 .75

De esta forma, el diagrama causal quedara:

c) En relacin a las variables X1 e Y1 slo se contempla un efecto directo:

En relacin a las variables X1 e Y2 , se contemplan un efecto directo y otro indirecto:

Y en relacin a Y1 e Y2 , se contemplan un efecto directo y otro espreo:

Ejemplo 1.6.- Tengamos las variables A, B , C y D relacionadas segn la siguiente estructura:

Utilizando nomenclatura LISREL reelabora el anterior diagrama causal y expresa la correlacin

Aplicando la regla del trazado para determinar la correlacin entre Y3 y X1 :

1.6.- Significacin de los parmetros

En los modelos estructurales tendremos igualmente sobre

determinado parmetro, por

N : Nmero de sujetos de la muestra

Como slo hay una variable independiente:

Buscando en las tablas:

Calculemos los valores de t:

Buscamos en las tablas para:

Se deduce que ambos coeficientes son estadsticamente significativos.

1.7.- Validacin del modelo

Ambos propsitos exigen especialmente fundamentacin terica del tema en cuestin. Ha de

1.8.- Identificacin de modelos

1.8.1.- Modelos exactamente identificados

coeficientes tambin .. etc. En definitiva, no habra forma, en base a criterios puramente

1.8.2.- Modelos sobreidentificados

En trminos ms formales y estableciendo las siguientes identidades para los modelos A y B

obtendremos los modelos:

Elijamos el modelo A. Disponemos de tres correlaciones

determinar tan slo dos

Completemos el modelo calculando 11 y 22 :

El modelo resultante ser: