Вы находитесь на странице: 1из 12

ANLISE BAYESIANA PARA MODELOS

DE EQUAES ESTRUTURAIS

Jorge Alberto ACHCAR1


RESUMO: Neste artigo introduzimos uma anlise Bayesiana para modelos de equaes
estruturais usando mtodos Monte Carlo em Cadeias de Markov (MCCM). Em especial, usamos
o algoritmo de Metropolis-Hastings para gerar amostras da distribuio a posteriori conjunta para
os parmetros do modelo. Ilustramos a metodologia com um conjunto de dados reais.
PALAVRAS-CHAVE: Modelos de equaes estruturais; anlise Bayesiana; mtodos de Monte
Carlo em cadeias de Markov.

1 Introduo
Os modelos de equaes estruturais (MEE) incluem anlise de trajetrias e anlise
fatorial. Tambm temos classificados em modelos MEE os modelos economtricos de
equaes simultneas (ver, por exemplo, Kenny,1979).
A anlise de trajetrias foi desenvolvida como um mtodo para decompor
correlaes em diferentes componentes para a interpretao de efeitos (por exemplo,
como a educao dos pais pode influenciar os rendimentos dos filhos depois de 40 anos).
A anlise de trajetrias relacionada com regresso mltipla (ver, por exemplo,
Blalock,1969; Duncan,1975; Maruyama,1998 ou Ullman,1996) usando modelos lineares
padronizados,isto , onde todas as variveis tem mdia zero e varincia um. A anlise de
trajetrias foi primeiramente desenvolvida pelo geneticista Sewall Wright (1921). As
trajetrias nos modelos representam hipteses dos pesquisadores.
Os componentes bsicos da anlise de trajetrias so o diagrama de trajetrias, a
primeira lei e a lei de traos.
Como um caso especial, o conjunto de equaes estruturais (1) pode ser sumarizado
graficamente no diagrama da Figura 1.
X3 = p31X1 + p32X2 + p3UU,
(1)
X4 = p41X1 + p42X2 + p43X3 + p4V V,
onde U e V so distrbios aleatrios (erros).
No diagrama de trajetrias, setas mostram supostas relaes causais.Uma seta
unidirecional mostra relaes de causas para efeitos. Uma seta curva bidirecional indica
que as variveis esto correlacionadas; neste caso no h suposio de relao causal. As
1 Departamento de Medicina Social, Faculdade de Medicina de Ribeiro Preto, Universidade de So Paulo USP, CEP: 14049-900, Ribeiro Preto, SP. E-mail: achcar@fmrp.usp.br
Rev. Mat. Estat., So Paulo, v.22, n.1, p.113-124, 2004

113

variveis independentes so chamadas variveis exgenas e as variveis dependentes so


chamadas variveis endgenas. Um coeficiente de trajetrias indica o efeito direto de uma
varivel suposta como a causa em outra varivel suposta como um efeito.

FIGURA 1 - Um modelo de trajetrias.

Algumas suposies so usualmente consideradas para uma anlise de trajetrias:


Todas as relaes so lineares e aditivas. As suposies causais (o que causa o que) so

mostradas no diagrama causal.

As variveis so medidas sem erros.


Os resduos (termos de erros) no so correlacionados com as variveis no modelo e

entre si.

O fluxo causal unidirecional.


As variveis so medidas numa escala contnua.

1.1 Primeira lei


Dado o modelo estrutural padronizado, a correlao entre quaisquer duas variveis
pode ser determinada pela seguinte regra, chamada primeira lei de anlise de trajetrias:

YZ =

pYX i X i Z

(2)

onde p YX i o parmetro de trajetria ou parmetro causal da varivel Xi em Y, X i Z a


correlao entre Xi e Z, e o conjunto de variveis Xi inclui todas as causas da varivel Y.
Como um caso especial, a correlao entre X1 e X3 para o modelo na Figura 1 dada
por 31 = p3111 + p3212 + p3U1U. Como 11=1 e 1U=0, temos 31 = p31 + p3212. As
correlaes restantes na Figura 1 so dadas por:
32 = p32 + p3112,

41 = p41 + p4212 + p4313,


42 = p42 + p4112 + p4323,

(3)

43 = p43 + p4113 + p4223,


34 = p3114 + p3224 + p3UU4.

114

Rev. Mat. Estat., So Paulo, v.22, n.1, p.113-124, 2004

Observar que existem duas expresses para 34 pois cada uma das variveis X3 ou X4
pode ser considerada como uma varivel endgena. Observar que UV = 0, mas U4 0.

1.2 Lei de traos


A lei de traos uma regra no matemtica simples: a correlao entre Xi e Xj igual
soma do produto de todas as trajetrias obtidas de cada um dos possveis traos entre i e
j. O conjunto de traos inclui todas as rotas possveis de Xi a Xj dado que: (a) a mesma
varivel no entra duas vezes e (b) uma varivel no pode entrar a partir de uma seta
direita e de uma seta esquerda simultaneamente. Observando a Figura 1, obtemos, 31 =
p31 + p3212. Existem dois traos possveis: primeiro, um caminho direto de X1 para X3, e,
segundo, um trao de X1 a X2 da para X3. Observar que as correlaes entre variveis
puramente exgenas no so tratadas de forma diferente. Um trao no permitido de X1
a X4 e da para X3, pois X4 entra no modelo por duas setas unidirecionais simultneas da
esquerda para a direita (ver Figura 1). As correlaes restantes para a Figura 1 so:

32 = p32 + p3112,
41 = p41 + p4212 + p43p31 + p43p3212 ,
42 = p42 + p31p4312 + p4112 + p43p32,
43 = p43 + p31p41 + p31p4212 + p32p4112 + p32p42,

(4)

3U = p3U,
4V = p4V.
Das equaes (4) relativas ao diagrama da Figura 1, encontramos interpretaes
simples e teis para os efeitos diretos e indiretos de uma varivel exgena em uma
varivel endgena. Como um caso especial, observar que o coeficiente de trajetrias p41
no diagrama de trajetrias da Figura 1 mede o efeito direto da varivel X1 em X4 e o efeito
indireto da varivel X1 em X4 via as outras variveis X2 e X3 dado por

41-p41 = p4212+p43p31+p43p3212.
Similarmente, encontramos as decomposies de efeitos diretos e indiretos para as
outras correlaes no diagrama de trajetrias da Figura 1.
Neste artigo, exploramos o uso de mtodos Bayesianos para obter inferncias para os
coeficientes de trajetrias. Considerando alguns casos especiais de diagramas de
trajetrias encontramos sumrios a posteriori de interesse usando mtodos Monte Carlo
em Cadeias de Markov (MCCM) baseados no algoritmo de Metropolis-Hastings (ver, por
exemplo, Chib e Greenberg, 1995; ou Roberts e Smith, 1993).
O uso de mtodos MCCM tem se tornado rotina para anlise Bayesiana de modelos
economtricos (ver por exemplo, Chib e Hamilton, 2000).

Rev. Mat. Estat., So Paulo, v.22, n.1, p.113-124, 2004

115

2 Estimao dos coeficientes de trajetrias


Vamos considerar o diagrama de trajetrias dado na Figura 2.

FIGURA 2 - Um diagrama de trajetrias.

Associado Figura 2, temos a seguinte equao estrutural:


X3 = p31X1 + p32X2 + cU

(5)

onde U o termo erro.


Da primeira lei, temos,

31 = p31 + 12p32

(6)

32 = p32 + 12p31
Das equaes (6), encontramos os estimadores,
2
p 31 = (r 31 - r 12 r 32 ) / (1 - r12 )

(7)
2
12

p 32 = (r 32 - r 12 r 31 ) / (1- r )
onde rij a correlao amostral entre as variveis Xi e Xj.
Observar que todas variveis tm mdia zero e varincia um (variveis
padronizadas).
Os estimadores (7) tambm so os Estimadores de Mnimos Quadrados (EMQ)
usuais de p31 e p32. Para obter um estimador para c2 (varincia do erro =cU), observar que
como Var(X3) = 1, temos,
1 = Var(X3) = Var (p31X1 + p32X2 + cU),
isto ,
2
2
1 = p 31
Var(X1) + p 32
Var(X2) + 2p31 p32Cov(X1,X2) + c2Var(U).

Assim, temos uma restrio para os parmetros p31 , p32 e c2 dada por,

116

Rev. Mat. Estat., So Paulo, v.22, n.1, p.113-124, 2004

2
2
1 = p 31
+ p 32
+ 2p31p3212 + c2

(8)

De (8), encontramos um estimador para c2 dado por,


2
2
- p 32
- 2 p 31 p 32 r12
c 2 = 1 - p 31

(9)

Resultados similares so obtidos para outros diagramas de trajetrias.


Assumindo uma distribuio normal N{0,c2} para o erro = cU no modelo (5),
podemos encontrar os Estimadores de Mxima Verossimilhana (EMV) para os
parmetros p31 , p32 e c2.
A funo de verossimilhana para p31, p32 e c2 dada por,
n

L(p31, p32, c2 ) = exp{-i2 / 2c2 } /


i =1

2 c2

(10)

onde i = cUi = X3i - p31X1i - p32X2i.


Os estimadores de mxima verossimilhana para p31 , p32 e c2 so obtidos por
2
2
+ p 32
+ 2p31p32r12
maximizao da funo de verossimilhana (10) sujeita restrio p 31
2
+ c = 1. Esses estimadores podem ser obtidos usando multiplicadores de Lagrange para
maximizao com restrio.

2.1 Uma anlise Bayesiana


Assumindo independncia a priori para os parmetros p31 e p32, vamos considerar as
seguintes densidades a priori para p31 e p32:
p31 ~ N{1,12}
p32 ~ N{2,22}

(11)

onde N{,2} denota uma distribuio normal com mdia e varincia 2; 1, 2, 12 e


22 so constantes conhecidas.
Essas densidades a priori so escolhidas porque elas so flexveis o suficiente para
expressar opinio a priori nos parmetros. Quando no temos conhecimento suficiente a
priori sobre os parmetros, podemos considerar as densidades a priori (11) com mdias
iguais a zero e varincia grande (por exemplo, varincia igual a 106) o que leva a
distribuies a priori no-informativas. Similarmente, poderamos considerar
distribuies a priori uniformes num intervalo de grande amplitude (por exemplo, no
intervalo (-100,100)).
A intensidade a posteriori conjunta para p31 e p32 (ver por exemplo, Zellner (1971)
dada por,
(p31,p32/dados) = exp{-(p31-1)2/212-(p32-2)2/222}(p31,p32)
onde (p31,p32) = exp{-(n/2)log(c2) -

n
i =1

(12)

(x3i - p31x1i - p32x2i)2 / 2c2},

2
2
c2 = 1 - p 31
- p 32
- 2p31p32r12.

Rev. Mat. Estat., So Paulo, v.22, n.1, p.113-124, 2004

117

Usando o algoritmo de Metropolis-Hastings (ver, por exemplo, Chib e Greenberg,


1995), encontramos a densidade a posteriori conjunta (12) aproximada pelas amostras de
Gibbs obtidas das seguintes densidades condicionais:
(i)

(p31/p32,dados) = exp{- (p31-1)2/212}(p31,p32)

(ii)

(p32/p31,dados) = exp{- (p32-2)2/222}(p31,p32)

(13)

onde (p31,p32) dada em (12).


Uma amostra de valores da densidade a posteriori conjunta (10) pode agora ser
obtida sucessivamente amostrando p31 de (p31/p32,dados), e dado este valor de p31,
simulando p32 de
(p32/p31,dados).
Observar que o valor de p31 simulado como: na s-sima iterao (dado o valor atual
( s 1)
(s)
p 32
) gerar um candidato p32
de uma densidade normal N{1,12}; mover a este ponto
com probabilidade,
( s 1)

(s)

mnimo{ ( p 31 , p 32

( s 1)

) / (p 31

( s 1)

, p 32

) , 1}

(14)

( s 1)

(s)

De outra parte, fazer p 31 = p 31 .


Similarmente, o valor de p32 simulado como: na s-sima iterao (dado o valor
(s)

(S)

atual p 31 ) gerar um candidato p 32 de uma densidade normal N{2,22}; mover a este


ponto com probabilidade,
(s)

(S)

(s)

( s 1)

mnimo {( p 31 , p 32 ) / ( p 31 , p 32

) , 1}

(15)

( s 1)

(S )
De outra parte, fazer p 32
= p 32 .
Convergncia de algoritmos de simulao via cadeias de Markov so introduzidos
por vrios autores (ver, por exemplo, Raftery e Lewis, 1992).
Dessa forma, podemos examinar grficos de sries temporais de seqncias
simuladas ou usar o mtodo de Gelman e Rubin (1992) baseado na tcnica de anlise de
varincia para determinar se iteraes adicionais so necessrias.
Podemos usar as amostras geradas de Gibbs para obter inferncias em funes de
interesse dos parmetros p31 e p32. Um estimador Bayesiano de c2 (ver (12)) com respeito a
funo de perda quadrtica dada por,

E(c2/dados)=

( 1 - p 31 - p 32 - 2p31p32r12)

(p31,p32 /dados)dp31dp32

(16)

(S )
Sejam p 31 e p 32
os valores de p31 e p32 obtidos na s-sima iterao, onde S o
nmero total de iteraes do amostrador de Gibbs.
Assim, um estimador de Monte Carlo de (16) dado por,
(s)

c 2 =

S
s =1

118

(s)2

(s)2

(s)

(S)

(1-p 31 -p 32 -2 p 31 p 32 r12) / S

(17)

Rev. Mat. Estat., So Paulo, v.22, n.1, p.113-124, 2004

3 Uma anlise Bayesiana para empresas de energia eltrica


Na Tabela 1, temos um conjunto de dados introduzidos por Johnson e Wishern
(1992, p.592). Esses dados foram selecionados de 22 empresas de energia eltrica
americanas, para o ano 1975.
Na Tabela 2, temos as correlaes entre pares de variveis para os dados de
empresas de energia eltrica da Tabela 1.
Como uma primeira ilustrao, vamos assumir o diagrama de trajetrias da Figura 2,
com a equao estrutural (5), isto ,
X3 = p31X1 + p32X2 +

(18)

onde X3 o custo por KW local, X1 a taxa de lucro (ganho/dbito) e X2 a taxa de


retorno de capital. Das correlaes dadas na Tabela 2, temos r12=0,643, r13= -0,103 e
r23=-0,348. Os EMQ (ver (7)) so dados por p 31 = 0,205 e p 32 = -0,480.
De (9), obtemos um estimator para c2 dado por c 2 = 0,85412.
Usando as equaes (6) e o diagrama de trajetrias da Figura 2, encontramos
interpretaes simples para as correlaes r31 e r32 em termos de efeitos diretos e indiretos.
Assim, p31=0,205 estima o efeito direto de X1 (taxa de lucro) em X3 (custo por KW local)
e r12p32 = (0,643)(-0,48) = -0,30864 estima o efeito da varivel X1 em X3, atravs da
varivel X2 (taxa de retorno).
Assumindo as densidades a priori (11) para p31 e p32 com 1 = 0,1 = 1.000, 2 = 0 e
2 = 1.000 (distribuies a priori no informativas), geramos S = 11.000 amostras de
Gibbs das densidades condicionais (13) usando o algoritmo de Metropolis-Hastings, onde
as 1.000 amostras iniciais foram descartadas para eliminarmos o efeito dos valores iniciais
considerados (burn-in samples) e da foram escolhidas amostras de 10 em 10 o que
totaliza uma amostra final de tamanho 1.000. Na gerao das amostras de Gibbs usamos o
software WinBUGS (Spiegelhalter et al., 1999). Na Tabela 3, temos os sumrios a
posteriori para os parmetros p31 e p32.
De (17), obtemos um estimador de Monte Carlo para c2 baseado nas S = 1.000
amostras geradas de Gibbs dado por c 2 = 0,90011.
A convergncia do algoritmo foi verificada graficamente (grficos - sries temporais
das amostras simuladas) e usando alguns ndices usuais para verificar a convergncia.
2
2
Observar que se no considerarmos as restries (8), isto , c2 = 1 - p31
- p32
2
2p31p32r12 , obteramos estimadores diferentes para p31, p32 e c . Assumindo as mesmas
densidades a priori para p31 e p32 (11) e uma densidade gama inversa IG(a1,a2) com a1 e a2
conhecidos para c2 (se v IG(a,b), temos (v) v-(a+1)e-b/v, v>0), as densidades a posteriori
condicionais para p31, p32 e c2 necessrias para o amostrador de Gibbs so dadas por:
(i) (p31/ p32, c2 , dados)

N{1,12}1(p31,p32,c2),

onde 1(p31, p32, c2) = exp{(ii) (p32/ p31, c2, dados)


(iii) (c2/ p31, p32, dados)

n
i =1

(x3i-p31x1i-p32x2i)2 / 2c2},

N{2,22} 1(p31,p32,c2),
IG{n/2 + a1 ; a2+

Rev. Mat. Estat., So Paulo, v.22, n.1, p.113-124, 2004

n
i =1

(19)

(x3i-p31x1i-p32x2i)2 / 2}

119

Tabela 1 - Dados de empresas de energia eltricas


Empresa
Arizona (S)
Boston (E)
Louziana
Edison
Edison NY
Florida
Hawai
Idaho
Kentucky
Madison
Nevada
N. England
Northern
Oklahoma
Pacific
Puget
S. Diego
Southern
Texas
Wisconsin
United
Virginia

X1
1,06
0,89
1,43
1,02
1,49
1,32
1,22
1,10
1,34
1,12
0,75
1,13
1,15
1,09
0,96
1,16
0,76
1,05
1,16
1,20
1,04
1,07

X2
9,2
10,3
15,4
11,2
8,8
13,5
12,2
9,2
13,0
12,4
7,5
10,9
12,7
12,0
7,6
9,9
6,4
12,6
11,7
11,8
8,6
9,3

X3
151
202
113
168
192
111
175
245
168
197
173
178
199
96
164
252
136
150
104
148
204
174

X4
54,4
57,9
53,0
56,0
51,2
60,0
67,6
57,0
60,4
53,0
51,5
62,0
53,7
49,8
62,2
56,0
61,9
56,7
54,0
59,9
61,0
54,3

X5
1,6
2,2
3,4
0,3
1,0
-2,2
2,2
3,3
7,2
2,7
6,5
3,7
6,4
1,4
-0,1
9,2
9,0
2,7
-2,1
3,5
3,5
5,9

X6
9077
5088
9212
6423
3300
11127
7642
13082
8406
6455
17441
6154
7179
9673
6468
15991
5714
10140
13507
7287
6650
10093

X7
0,0
25,3
0,0
34,3
15,6
22,5
0,0
0,0
0,0
39,2
0,0
0,0
50,2
0,0
0,9
0,0
8,3
0,0
0,0
41,1
0,0
26,6

X8
0,628
1,555
1,058
0,700
2,044
1,241
1,652
0,309
0,862
0,623
0,768
1,897
0,527
0,588
1,400
0,620
1,920
1,108
0,636
0,702
2,116
1,306

X1: taxa de lucro (ganho/dbito); X2: taxa de retorno de capital; X3: custo por KW local; X4: fator de carga anual;
X5: pico de demanda em crescimento de KWH de 1974 a 1975; X6: vendas (uso de KWH por ano); X7:
porcentagem nuclear; X8: custo total de combustvel (centavos por KWH).

Observar que c2 pode ser gerado usando o amostrador de Gibbs (ver, por exemplo,
Gelfand e Smith,1990), mas p31 e p32 poderiam ser geradas pelo algoritmo de MetropolisHastings.
Com 1=0, 1=1.000, 2=0, 2=1.000, a1=1 e a2=1, geramos S=11.000 amostras de
Gibbs das densidades condicionais (19) usando o algoritmo de Metropolis-Hastings, onde
as 1.000 amostras iniciais foram descartadas para eliminarmos o efeito dos valores iniciais
considerados (burn-in samples) e da foram escolhidas amostras de 10 em 10 o que
totaliza uma amostra final de tamanho 1.000. Na Tabela 4, temos os sumrios a posteriori
para os parmetros p31, p32 e c2.
Neste caso, o estimador obtido para c2 no satisfaz restrio (8).
Agora, vamos considerar o diagrama de trajetrias da Figura 3 para os dados de
empresas de energia eltrica da Tabela 1. Este diagrama construdo pelo pesquisador a
partir de uma formulao terica mostrando relaes causas-efeitos para as variveis do
sistema.
Associado ao diagrama de trajetrias da Figura 3, temos as seguintes equaes
estruturais:
120

Rev. Mat. Estat., So Paulo, v.22, n.1, p.113-124, 2004

(i) X1=p12X2+p13X3+p15X5+p16X6+c1U1
(ii) X2=p23X3+p24X4+p25X5+c2U2
(iii) X3=p34X4+p35X5+p37X7+c3U3
(iv) X4=p46X6+p48X8+p47X7+c4U4
(v) X5=p54X4+p56X6+p57X7+c5U5
(vi) X6=p67X7+p68X8+c6U6
(vii) X7=p78X8+c7U7
Tabela 2 - Correlaes entre pares de variveis (dados de energia eltrica)
X1
1,0000
0,643
-0,103
-0,082
-0,259
-0,152
0,045
-0,013

X2
0,643
1,0000
-0,348
-0,086
-0,260
-0,010
0,211
-0,328

X3
-0,103
-0,348
1,0000
0,100
0,435
0,028
0,115
0,005

X4
-0,082
-0,086
0,100
1,0000
0,034
-0,288
-0,164
0,486

X5
-0,259
-0,260
0,435
0,034
1,0000
0,176
-0,019
-0,007

X6
-0,152
-0,010
0,028
-0,288
0,176
1,0000
-0,374
-0,561

X7
0,045
0,211
0,115
-0,164
-0,019
-0,374
1,0000
-0,185

X8
-0,013
-0,328
0,005
0,486
-0,007
-0,561
-0,185
1,0000

Tabela 3 - Sumrios a posteriori (dados de energia eltrica)


Mdia a posteriori
0,1717
-0,3978

p31
p32

Desvio padro
0,2274
0,2181

Interv. credib. 95%


(-0,2869;0,5954)
(-0,7690;0,0626)

Tabela 4 - Sumrios a posteriori (dados de energia eltrica)


Mdia a posteriori
0,2097
-0,4814
1,1030

p31
p32
c2

Desvio padro
0,2837
0,2840
0,3331

Interv. credib. 95%


(-0,3436;0,7644)
(-1,0310;0,0786)
(0,5521;1,8310)

Na Tabela 5, temos os EMQ para os parmetros das equaes estruturais (20) (ver
por exemplo, Draper e Smith, 1981).
Para obter estimadores de c 2j , j =1, ..., 7 (varincia do erro j=cjUj), observar que
como todas as variveis tm varincia igual a um e do resultado,
Var(Xj)=Var{

m
l =1

pjlXl+cjUj} =

m
l =1

p 2jl Var(Xl) + 2

l <k

pjlpjkCov(Xl,Xk) + c j ,

onde m o nmero de variveis exgenas na equao estrutural e j = 1, ..., 7, temos,


1=

m
l =1

p 2jl + 2

l <k

Rev. Mat. Estat., So Paulo, v.22, n.1, p.113-124, 2004

pjlpjkrlj+ cj2

(20)

121

FIGURA 3 - Um diagrama de trajetrias para os dados de energia eltrica.

De (21), vemos que a variabilidade total de Xj pode ser decomposta na forma:

Assim, para cada equao estrutural (20) , temos:


c12=1-p122-p132-p152-p162-2p12p13r23-2p12p15r25-2p12p16r26-2p13p15r352p13p16r36-2p15p16r56
2
c2 =1-p232-p242-p252-2p23p24r34-2p23p25r35-2p24p25r45
c32=1-p342-p352-p372-2p34p35r45-2p34p37r47-2p35p37r57
c42=1-p462-p482-p472-2p46p48r68-2p46p47r67-2p48p47r78
c52=1-p542-p562-p572-2p54p56r46-2p54p57r47-2p56p57r67
c62=1-p672-p682-2p67p68r78
c72=1-p782

(21)

Assumindo independncia a priori entre os parmetros, consideramos densidades a


priori normais para os coeficientes de trajetrias, isto ,
pjl ~ N{jl,jl2}

(22)

com jl e jl conhecidos; j = 1, ..., 7; l o l-simo coeficiente de trajetria na j-sima


equao estrutural dada por (20).
As densidades condicionais necessrias para o amostrador de Gibbs para cada
parmetro na equao estrutural (20), so dadas por,
2

(plj/p(lj),dados) exp{-(plj-lj)2/2jl2}j(p)

122

(23)

Rev. Mat. Estat., So Paulo, v.22, n.1, p.113-124, 2004

onde j(p)=exp{-(n/2)log(cj2)-

i =1

ij2/2cj2}, ij=cjUij , cj2 so dados em (22) para j =1 ,..., 7

e p(1j) o vetor de todos os coeficientes de trajetrias no incluindo p1j.


Considerando jl =0 e jl=1.000 na densidade a priori (23), geramos S=11.000
amostras de Gibbs das densidades condicionais (24) usando o algoritmo de MetropolisHastings, onde 1.000 amostras iniciais foram descartadas para eliminar os efeitos dos
valores iniciais ( burn-in samples) e da foram escolhidas amostras de 10 em 10 o que
totaliza uma amostra final de tamanho 1.000. Na Tabela 5, temos os sumrios a posteriori
para os parmetros de trajetrias das equaes estruturais (20).
Dos intervalos de credibilidade 95% dados na Tabela 5, observamos quais variveis
tem efeitos diretos significativos nas variveis endgenas.
Tabela 5 - Sumrios a posteriori (dados de energia eltrica)
Modelo
estrutural
(i)

(ii)

(iii)

(iv)

(v)
(vi)
(vii)

Coeficientes
de trajetrias
p12
p13
p15
p16
p23
p24
p25
p34
p35
p37
p46
p47
p48
p54
p56
p57
p67
p68
p78

EMQ
0,672
0,199
-0,149
-0,124
-0,283
-0,053
-0,135
0,109
0,434
0,141
-0,117
-0,135
0,395
0,119
0,245
0,092
-0,494
-0,652
-0,185

Mdia a
posteriori
0,5677
0,1651
-0,1243
-0,1068
-0,2467
9,46.10-6
-0,0962
5,5. 10-6
0,3628
0,1148
-2,2. 10-6
-9,5. 10-6
1,2. 10-6
-3,8. 10-6
0,1468
0,0327
-0,4545
-0,5981
-0,155

D.P.
0,1403
0,1717
0,1682
0,1501
0,1919
1,38.10-5
0,1953
1,3. 10-5
0,1635
0,1711
2,2. 10-5
1,9. 10-5
2,1. 10-5
1,4. 10-7
0,1930
0,1967
0,1321
0,1189
0,1878

Interv. de crd.
95%
(0,2412;0,7919)
(-0,1841;0,4883)
(-0,4422;0,2167)
(-0,3876;0,1967)
(-0,5848;0,1603)
(-1,1.10-5;3,6.10-5)
(-0,4622;0,2934)
(-2,1.10-5;3,1. 10-5)
(-0,0036;0,6308)
(-0,2334;0,4283)
(-4,5. 10-5;4,1.10-5)
(-4,6. 10-5;2,7.10-5)
(-2,9. 10-5;5,2.10-5)
(-3,2.10-5;2,4. 10-5)
(-0,2423;0,4920)
(-0,3492;0,4056)
(-0,6734;-0,1593)
(-0,7799;-0,3180)
(-0,4904;0,2336)

Concluses
O uso de mtodos MCCM para uma anlise Bayesiana de modelos de equaes
estruturais pode ser uma boa alternativa para obter estimadores precisos para os
parmetros do modelo sujeito a algumas restries. Tambm observamos que a obteno
das amostras simuladas de Gibbs para a distribuio a posteriori conjunta dos parmetros
do modelo no exige um grande conhecimento computacional e as amostras de Gibbs so
facilmente obtidas usando softwares estatsticos disponveis no mercado. Intervalos de
credibilidade Bayesianos com grande preciso so facilmente obtidos das amostras
geradas de Gibbs para a distribuio a posteriori conjunta dos parmetros. Outras
distribuies a priori tambm poderiam ser consideradas para os coeficientes de
trajetrias.
Rev. Mat. Estat., So Paulo, v.22, n.1, p.113-124, 2004

123

ACHCAR, J.A . Bayesian analysis for structural equation models. Rev. Mat. Estat., So
Paulo, v.22, n.1, p.113-124, 2004.
ABSTRACT: In this paper, we introduce a Bayesian analysis for structural equation models,
using MCMC (Markov Chain Monte Carlo).In special, we use the Metropolis-Hastings algorithm
to obtain samples for the joint posterior distribution for the models parameters. We illustrate the
proposed methodology with a real data set.
KEYWORDS: Structural equations; Bayesian analysis; Markov Chain Monte Carlo methods.

Referncias
BLALOCK, H.M. Theory construction: from verbal to mathematical formulations. New
Jersey: Prentice-Hall, 1969. 232 p.
CHIB, S; GREENBERG, E. Understanding the metropolis-hastings algorithm. Am. Stat.,
Washington, v.49, n.4, p.327-35, 1995.
CHIB, S.; HAMILTON, B.H. Bayesian analysis of cross-section and clustered data
treatment models, J. Econom., Lausanne, v.97, p.25-50, 2000.
DRAPER, N.R.; SMITH, H. Applied regression analysis. NewYork: Wiley, 1981. 709 p.
DUNCAN, O.D. Introduction to structural equation models. NewYork: Academic Press,
1975. 320p.
GELFAND, A.E.; SMITH, A.F.M. Sampling-based approaches to calculating marginal
densities. J. Am. Stat. Assoc., Alexandria, v.85, p.398-409, 1990.
GELMAN, A.; RUBIN, D. Inference from iterative simulation using multiple sequences.
Stat. Sci., Hay Ward, v.7, p.457-72, 1992.
JOHNSON, R.; WICHERN, D. Applied multivariate statistical analysis. New Jersey:
Prentice Hall, 1982. 642p.
KENNY, D.A. Correlation and causality. New York: Wiley, 1979. 277p.
MARUYAMA, G.M. Basics of structural equation modeling. Thousand Oaks: SAGE,
1998. 328p.
RAFTERY, A.E.; LEWIS, S.M. How many iterations in the Gibbs sampler? In:
BERNARDO, J.M. et al. (Ed.) Bayesian statistics. 4.ed. Oxford: Oxford University Press,
1992. p.765-76.
ROBERTS, G.O.; SMITH, A.F.M. Bayesian methods via the Gibbs sampler and related
Markov Chain Monte Carlo methods. J. R. Stat. Soc., B, Cambridge, v.55, n.1, p.3-23,
1993.
SPIEGELHALTER, D.A.; THOMAS, A.; BEST, N.G. WinBUGS: Bayesian inference
using Gibbs sampling. Cambridge: MRC Biostatistics Unit., 1999. 220p.
ULLMAN, J.B. Structural equation modeling. In: TABACHNICK; B.G.; FIDELLIS, L.S.
(Ed.) Using multivariate statistics. 3.ed. New York: Harper Collins College, 1996. 746p.
WRIGHT, S. Correlation and causation. J. Agric. Res., Lahore, v.20, p.557-85, 1921.
ZELLNER, A. An introduction to Bayesian inference in econometrics. New York: Wiley,
1971. 523p.
Recebido em 14.01.2003.
Aprovado aps reviso em 28.12.2003.

124

Rev. Mat. Estat., So Paulo, v.22, n.1, p.113-124, 2004