Вы находитесь на странице: 1из 78

Modelagem de Equaes Estruturais

(Structural Equations Modeling - SEM)


Mtodos e Tcnicas de Pesquisa
Prof. Dr. Carlos Alberto Gonalves

Sandro Medeiros

Modelagem de Equaes Estruturais


A Modelagem de Equaes Estruturais (MEE) uma famlia de mtodos estatsticos para modelar relaes entre variveis (Hoyle,2012). A MEE utiliza vrios tipos de modelos para descrever relaes causais entre variveis observadas e no observadas. A caracterstica fundamental da MEE a testagem de uma teoria que estabelece relaes causais entre variveis.

Organizao dos Mtodos Multivariados


(Hair, Hair, Jr. et al, 2014) Exploratria
Anlise de clusters Anlise fatorial exploratria Escalonamento multidimensional

Confirmatria
Anlise de varincia Regresso logstica Regresso mltipla

Tcnicas de 1 gerao

Tcnicas de 2 gerao

Modelagem de equaes estruturais com mnimos quadrados parciais (PLS)

Modelagem de equaes estruturais com covarincia (CB (CB-SEM), incluindo Anlise fatorial confirmatria

Breve histrico
Regresso Linear Anlise Fatorial
1904 Charles Spearman Uso de correlaes entre itens para determinar um modelo fatorial. 1940 D. N. Lawley e L. L. Thurstone Aplicaes para modelos fatoriais e baterias de itens que produziram escores para determinados fatores (constructos) inferidos. 1955 (Howe (Howe) ) 1956 (Anderson e Rubin) 1958 ( Lawley Lawley) ) Anlise Fatorial Confirmatria (AFC) 19601960 -1963 Karl Jreskog 1969 primeiro artigo sobre AFC.Refinamento da AFC, possibilitando o desenvolvimento do primeiro software para AFC.

1896 Karl Person Formulao matemtica para relacionar duas variveis (correlao).

Breve histrico
Modelo de Caminho
1918/1921/1934 SewellWright Sewell Wright (Bilogo)
Desenvolveu o modelo de caminho (path model). model ). Combina o uso de coeficientes de correlao e anlise de regresso para modelar relaes complexas entre variveis observadas. Permaneceu pouco usado at ser redescoberto por economistas (anos 50) e socilogos (anos 60).

Modelagem de Equaes Estruturais 1969/1973 Karl Jreskog 1972 Ward Keesling 1973 David Wiley
JKW model model LISREL
(LInear Structural RELations Model Model) )

Anlise de caminho Anlise Fatorial Confirmatria

Incorpora variveis observadas e latentes.

Pressupostos
(Kline in Hoyle Hoyle, , 2012)

Precedncia temporal - a causa presumida (x) deve ocorrer antes do efeito presumido (Y). Associao (ou covariao observada) entre X eY. Isolamento no existem outras explicaes plausveis (fatores estranhos) para a covariao entre X e Y (a associao estatstica consegue manter o controle de outras variveis que tambm poderiam afetarY). A distribuio dos dados conhecida (a distribuio observada se adequa distribuio assumida pelo mtodo para a estimao das associaes). A direo da relao causal corretamente especificada.

Desenvolver um modelo terico Construir um diagrama de caminho Converter o diagrama de caminho Escolher o tipo de matriz de entrada de dados Problema de pesquisa Avaliar a identificao do modelo Avaliar a estimativa do modelo e a qualidade do ajuste Interpretao do modelo Modificao do modelo

Especificar as relaes causais e evitar erros de especificao.

N
Modelo final

Reespecificar o modelo

Desenvolver um modelo terico Construir um diagrama de caminho Converter o diagrama de caminho Escolher o tipo de matriz de entrada de dados Problema de pesquisa Avaliar a identificao do modelo Avaliar a estimativa do modelo e a qualidade do ajuste Interpretao do modelo Modificao do modelo

N
Modelo final

Reespecificar o modelo

Especificar as relaes causais e evitar erros de especificao. Definir os construtos endgenos e exgenos e estabelecer as relaes entre eles.

Desenvolver um modelo terico Construir um diagrama de caminho Converter o diagrama de caminho Escolher o tipo de matriz de entrada de dados Problema de pesquisa Avaliar a identificao do modelo Avaliar a estimativa do modelo e a qualidade do ajuste Interpretao do modelo Modificao do modelo

N
Modelo final

Especificar as relaes causais e evitar erros de especificao. Definir os construtos endgenos e exgenos e estabelecer as relaes entre eles. Traduzir as equaes estruturais, especificar o modelo de mensurao, determinar o nmero de indicadores, a confiabilidade do construto (medidas de itens isolados, uso de escalas, validadas e anlise de dois estgios), identificar as correlaes dos construtos (fatores) e das variveis observadas (indicadores).

Reespecificar o modelo

Desenvolver um modelo terico Construir um diagrama de caminho Converter o diagrama de caminho Escolher o tipo de matriz de entrada de dados Problema de pesquisa Avaliar a identificao do modelo Avaliar a estimativa do modelo e a qualidade do ajuste Interpretao do modelo Modificao do modelo

Especificar as relaes causais e evitar erros de especificao. Definir os construtos endgenos e exgenos e estabelecer as relaes entre eles. Traduzir as equaes estruturais, especificar o modelo de mensurao, determinar o nmero de indicadores, a confiabilidade do construto (medidas de itens isolados, uso de escalas, validadas e anlise de dois estgios), identificar as correlaes dos construtos (fatores) e das variveis observadas (indicadores). Verificar os pressupostos da MEE, normalidade dos dados, remoo dos outliers, adequao do tamanho da amostra, possveis erros de especificao do modelo; selecionar o mtodo de estimao do modelo (mxima verossimilhana para quando a suposio de normalidade multivariada atendida; mnimos quadrados ponderados, mnimos quadrados generalizados e estimao assintoticamente livre de distribuio, todas para casos em que a suposio de normalidade no verificada). Reespecificar o modelo

N
Modelo final

Desenvolver um modelo terico Construir um diagrama de caminho Converter o diagrama de caminho Escolher o tipo de matriz de entrada de dados Problema de pesquisa Avaliar a identificao do modelo Avaliar a estimativa do modelo e a qualidade do ajuste Interpretao do modelo Modificao do modelo

Especificar as relaes causais e evitar erros de especificao. Definir os construtos endgenos e exgenos e estabelecer as relaes entre eles. Traduzir as equaes estruturais, especificar o modelo de mensurao, determinar o nmero de indicadores, a confiabilidade do construto (medidas de itens isolados, uso de escalas, validadas e anlise de dois estgios), identificar as correlaes dos construtos (fatores) e das variveis observadas (indicadores). Verificar os pressupostos da MEE, normalidade dos dados, remoo dos outliers, adequao do tamanho da amostra, possveis erros de especificao do modelo; selecionar o mtodo de estimao do modelo (mxima verossimilhana para quando a suposio de normalidade multivariada atendida; mnimos quadrados ponderados, mnimos quadrados generalizados e estimao assintoticamente livre de distribuio, todas para casos em que a suposio de normalidade no verificada). Reespecificar o modelo

N
Modelo final

Desenvolver um modelo terico Construir um diagrama de caminho Converter o diagrama de caminho Escolher o tipo de matriz de entrada de dados Problema de pesquisa Avaliar a identificao do modelo Avaliar a estimativa do modelo e a qualidade do ajuste Interpretao do modelo Modificao do modelo

Determinar os graus de liberdade, verificar e corrigir problemas de identificao.

N
Modelo final

Reespecificar o modelo

Desenvolver um modelo terico Construir um diagrama de caminho Converter o diagrama de caminho Escolher o tipo de matriz de entrada de dados Problema de pesquisa Avaliar a identificao do modelo Avaliar a estimativa do modelo e a qualidade do ajuste Interpretao do modelo Modificao do modelo

N
Modelo final

Reespecificar o modelo

Determinar os graus de liberdade, verificar e corrigir problemas de identificao. Identificar e corrigir estimativas transgressoras, fazer o ajuste do modelo estrutural e, se necessrio ou desejvel, compar-lo com modelos concorrentes.

Desenvolver um modelo terico Construir um diagrama de caminho Converter o diagrama de caminho Escolher o tipo de matriz de entrada de dados Problema de pesquisa Avaliar a identificao do modelo Avaliar a estimativa do modelo e a qualidade do ajuste Interpretao do modelo Modificao do modelo

N
Modelo final

Determinar os graus de liberdade, verificar e corrigir problemas de identificao. Identificar e corrigir estimativas transgressoras, fazer o ajuste do modelo estrutural e, se necessrio ou desejvel, compar-lo com modelos concorrentes. Verificar se h modificaes indicadas (caso haja justificativa terica).

Reespecificar o modelo

Definir os constructos individuais Desenvolver e especificar o modelo de mensurao

Avaliar o modelo estrutural

Avaliar o modelo de mensurao

O modelo estrutural vlido?

Refinar as medidas e planejar novo estudo

O modelo de mensurao vlido?

S
Concluses

S
Especificar o modelo estrutural

Classificao da aplicao da tcnica:


Estratgia de modelagem confirmatria quando o pesquisador verifica a significncia de um modelo prestabelecido. sem no entanto testar modelos alternativos que poderiam ter melhor ajuste que o modelo proposto. Estratgia de modelos concorrentes quando o pesquisador sugere teorias alternativas a fim de verificar as que possuem melhor ajuste aos dados. Pode ser implementando atravs da busca de modelos equivalentes no nmero de relaes ou modelos aninhados. Estratgia de desenvolvimento de modelos adequada quando o objetivo do pesquisador ajustar uma teoria a um novo meio de mensurao ou estrutura, devendo ser usada somente com forte suporte terico.

Teorias de Lealdade

Tipos de relacionamentos causais


X Y
Direto

Indireto
(Mediao completa)

Bidirecional

Tipos de relacionamentos causais


X Z Y
Mediao completa

X Z

Mediao parcial

Tipos de relacionamentos causais

Q X Z Y
Mediao completa

Tipos de relacionamentos causais

Q X Z Y
Mediao parcial

Exemplos
Qualidade do relacionamento com a me Uso de droga pelo adolescente

Qualidade do relacionamento com a me

tica do trabalho escolar

Uso de droga pelo adolescente

Qualidade do relacionamento com a me Tempo da me com a criana Tempo da me com a criana

tica do trabalho escolar

Uso de droga pelo adolescente

Especificao reflexiva e formativa


x1 Reflexivo 1 2 3

Y1

x2 x2 x1

Formativo

Y2

x2 x2

Modelo de mensurao e modelo estrutural


z3
x1 x2 x2 x4 x5 x6 x7

1 2 3

Y1

Y3

x8 x9

Y2

Y4
z4

x10

Especificao do modelo estrutural (modelo de caminhos) Especificao do modelo de mensurao Coleta, exame e tratamento dos dados Estimao do modelo estrutural Avaliao dos resultados do modelo de mensurao (medidas reflexivas) Avaliao dos resultados do modelo de mensurao (medidas formativas) Avaliao dos resultados do modelo estrutural e qualidade do ajuste Interpretao dos resultados e concluses

Tang1 Tang2 Tang3 Conf1 Conf2 Conf3 Conf4 Conf5 Resp1 Resp2 Resp3 Resp4 Segu1 Segu2 Segu3 Segu4 Empa1 Empa2 Empa3 Empa4 Empa5 EMPA RESP QUAL CONF Tang4 TANG PRE

Pre1

SATI

Sati1

SEGU

PRE

QUAL

SATI

PRE TANG

CONF

RESP

QUAL

SATI

SEGU

EMPA

Tang1 Tang2 Tang3 Conf1 Conf2 Conf3 Conf4 Conf5 Resp1 Resp2 Resp3 Resp4 Segu1 Segu2 Segu3 Segu4 Empa1 Empa2 Empa3 Empa4 Empa5 0,80 0,80 0,80 0,80 0,80 EMPA 0,80 0,80 0,80 0,80 0,80 Tang4

0,80 0,80 0,80 0,80 TANG

PRE

Pre1

CONF

0,80

0,80

0,80 0,80 0,80 0,80 0,80 RESP 0,80 QUAL 0,80 SATI Sati1

0,80 0,80 0,80 0,80 0,80

SEGU
0,80

Tang1 Tang2 Tang3 Conf1 Conf2 Conf3 Conf4 Conf5 Resp1 Resp2 Resp3 Resp4 Segu1 Segu2 Segu3 Segu4 Empa1 Empa2 Empa3 Empa4 Empa5 EMPA RESP QUAL CONF Tang4 TANG PRE

Pre1

SATI

Sati1

SEGU

Tang1 Tang2 Tang3 Conf1 Conf2 Conf3 Conf4 Conf5 Resp1 Resp2 Resp3 Resp4 Segu1 Segu2 Segu3 Segu4 Empa1 Empa2 Empa3 Empa4 Empa5 EMPA RESP QUAL CONF Tang4 TANG PRE

Pre1

SATI

Sati1

SEGU

Tang1 Tang2 Tang3 Conf1 Conf2 Conf3 Conf4 Conf5 Resp1 Resp2 Resp3 Resp4 Segu1 Segu2 Segu3 Segu4 Empa1 Empa2 Empa3 Empa4 Empa5 EMPA RESP QUAL SATI Sati1 CONF Tang4 TANG Pre1

PRE

SEGU

Tang1 Tang2 Tang3 Conf1 Conf2 Conf3 Conf4 Conf5 Resp1 Resp2 Resp3 Resp4 Segu1 Segu2 Segu3 Segu4 Empa1 Empa2 Empa3 Empa4 Empa5 EMPA RESP QUAL SATI Sati1 CONF Tang4 TANG Pre1 PRE Pre1

PRE

SEGU

Personalidade

Composio do comercial1 Composio do comercial2 Composio do comercial3 Composio do comercial4 Composio do comercial5 Avaliao do comercial

Composio do comercial Imagem da empresa

Inteno de compra

Comunicao bocaboca -a-boca

Preparao dos Dados


Dados ausentes Outliers Normalidade Linearidade

Preparao dos dados


Diagnstico de dados ausentes
Recusa de resposta Erro na entrada dos dados Dados ausentes no aleatrios podem comprometer a generalizao dos resultados se existirem dados ausentes, estes devem ser aleatrios.
Utilizar o teste Littless MCar, que analisa o padro de dados ausentes em todas as variveis e compara com o padro esperado para um processo de dados perdidos aleatrios. Diferenas significativas indicam que os dados no so completamente ao acaso, exigindo algum tipo de tratamento.

Substituio pela mdia Imputao por regresso

Preparao dos dados


Diagnstico de outliers uni e multivariados
Outlier univariado caso extremo em uma nica varivel (KLINE, 2011).
casos que esto nos extremos dos intervalos da distribuio, por meio da verificao dos escores padronizados z. Considera-se outlier o valor absoluto de z superior a |4|, para amostras superiores a 80 observaes.

Preparao dos dados


Diagnstico de outliers uni e multivariados
Outlier multivariado caso com escores extremos em duas ou mais variveis ou cujo padro de escores atpico (KLINE, 2011).
estatstica D de Mahalanobis, que indica a distncia entre um conjunto de escores para um caso individual (vetor) e as mdias amostrais para todas as variveis (centride). Em amostras grandes, avalia-se a medida D/df. Os nveis de referncia para as medidas D/df devem ser conservadoras (p0,005 ou p0,001), resultando em valores entre 3 e 4 para amostras maiores.

Preparao dos dados


Diagnstico de normalidade
Pressupe que cada varivel e todas as combinaes lineares de variveis so normalmente distribudas. A no existncia de normalidade multivariada pode criar vieses na determinao de significncia de coeficientes. A distribuio normal das variveis um pressuposto da anlise multivariada (HAIR et al, 2009). Se a variao em relao distribuio normal for suficientemente grande, os testes estatsticos F e t so invlidos, j que eles pressupem dados que seguem uma distribuio normal (HAIR et al., 2009). Guia a escolha do mtodo de anlise fatorial e de estimao dos parmetros na modelagem de equaes estruturais. Os mtodos escolhidos devem ser os mais robustos no normalidade. Teste de Kolmogorov-Smirnov, usado para decidir se a distribuio da varivel em estudo numa determinada amostra provm de uma populao com uma distribuio especfica, neste caso, uma distribuio normal. A hiptese nula estabelece que a distribuio da varivel na populao normal.

Preparao dos dados


Diagnstico de linearidade
Tambm consiste em um pressuposto para as tcnicas multivariadas e baseia-se em medidas correlacionadas de associao linear entre as variveis (HAIR et al., 2009).

Verificao da correlao das variveis par a par. Se a correlao apresenta um coeficiente significativo, isso indica que os dados so lineares (HAIR et al., 2005). Coeficiente de Pearson Coeficiente de Spearman

Anlise de Dimensionalidade
Anlise Fatorial Exploratria Anlise de confiabilidade
de Cronbach Varincia Mdia Extrada (AVE) Confiabilidade composta

Varincia Mdia Extrada e Confiabilidade Composta


O alfa de Cronbach uma medida que pode apresentar limitaes, uma vez que no considera o erro nos indicadores. Uma soluo alternativa o clculo da confiabilidade composta (CC) e da varincia mdia extrada (AVE) mediante a realizao de uma anlise fatorial confirmatria (AFC). A AVE indica o percentual mdio de varincia compartilhada entre o construto latente e seus indicadores. Como valor de referncia, adota-se AVE > 0,50. A confiabilidade composta uma estimativa do coeficiente de confiabilidade e representa o percentual de varincia dos construtos, a qual livre de erros aleatrios. Deve ser superior a 0,70.

Confiabilidade e Validade
Confiabilidade grau em que um experimento, teste ou qualquer procedimento de mensurao produz os mesmos resultados em diferentes tentativas. Validade grau em que um instrumento de medida mede exatamente aquilo que pretende medir.

Confiabilidade e Validade

Validade das Medidas


Validade convergente Validade discriminante Validade nomolgica

Validade convergente
Busca avaliar se os indicadores de um constructo so, de fato, adequados para medir o constructo. Anlise Fatorial Confirmatria verificar se os indicadores esto significativamente relacionados aos constructos de interesse. Significncia das cargas fatoriais, por meio de testes t bicaudais (t = 1,65 => = 0,05; t = 2,236 => = 0,01). Anlise de regresso.

Validade discriminante
Enquanto a validade convergente busca atestar que os itens de um constructo so suficientemente correlacionados de forma a medir um constructo, a validade discriminante busca provar que os constructos do modelo correspondem a conceitos distintos . Critrio de Fornell e Larcker consiste em fazer a anlise fatorial confirmatria (por meio do mtodo dos mnimos quadrados generalizados) e comparar o quadrado do coeficiente de correlao entre os pares de constructos, com a varincia mdia extrada (AVE) dos constructos.

Validade nomolgica
Verifica se os constructos se comportam de acordo com a rede de relacionamentos hipotetizada, conhecida como cadeia nomolgica, que consiste na representao terica de um fenmeno composto por constructos tericos, variveis observveis e latentes, e as relaes entre esses componentes. Verificada com modelagem de equaes estruturais.

Composio do comercial1 Composio do comercial2 Composio do comercial3 Composio do comercial4 Composio do comercial5 Avaliao do comercial

Composio do comercial Imagem da empresa

Inteno de compra

Comunicao bocaboca -a-boca

Outros exemplos de modelos estruturais

Medidas de qualidade de ajuste global


Medidas de ajuste absoluto
Determinam o grau em que o modelo global estima a matriz de covarincias ou de correlaes observada. Em outras palavras, em funo dos dados observados indicam se o modelo testado plausvel

Medidas de ajuste incremental


Comparam o modelo proposto com o modelo bsico (modelo nulo), em que no h relaes entre os construtos e do qual derivam todos os modelos

Medidas de ajuste parcimonioso


Relacionam a qualidade do ajuste do modelo ao nmero necessrio de parmetros a serem estimados para se obter esse nvel de ajuste. Maiores nveis de parcimnia so desejados.

Medidas de qualidade de ajuste global


Medida de ajuste absoluto
Qui-quadrado - Verifica se as matrizes de covarincias, esperada e estimada, diferem consideravelmente. Em caso negativo, indica que o modelo terico plausvel, pois se ajusta matriz observada. Principais desvantagens: sensibilidade ao tamanho amostral, a afastamentos da normalidade multivariada e mesmo complexidade do modelo.

Estimativa 2 = (N 1) FML

Medidas de qualidade de ajuste global


Medida de ajuste absoluto
Raiz do Erro Quadrtico Mdio (RMSR) Raiz quadrada da mdia dos resduos ajustados. Deve ser usada quando todas as variveis observadas esto padronizadas. No possui ponto de corte para definir nveis de ajuste aceitveis.
q RMSR = 2 i =1 ( p + q )( p + q + 1) j =1
i 1/ 2

(sij est )

Medidas de qualidade de ajuste global


Medida de ajuste absoluto
Raiz do Erro Quadrtico Mdio de Aproximao (RMSEA) Semelhante a RMSR, porm, a discrepncia medida em relao populao, e no em relao amostra (HOJO, 2004). Representa a qualidade de ajuste que seria esperada se o modelo fosse ajustado usando toda a populao. S recentemente esse ndice tem sido reconhecido com um dos mais informativos na modelagem de estruturas de covarincia (BYRNE, 1980). So desejveis valores que se aproximem de zero, sendo valores 0,8 indicativos de um razovel erro de aproximao.

F 1 = max ,0 df (N 1

Medidas de qualidade de ajuste incremental


ndice de Qualidade de Ajuste Ajustado (AGFI) Extenso do ndice GFI, ajustando-o pelos graus de liberdade do modelo nulo. ndices abaixo de zero so tratados como zero e podem ir at um, indicao de ajuste perfeito (THOMPSON, 2000). Segundo esse autor, a maioria dos pesquisadores considera valores de AGFI > 0,9 como indicativos de modelos com ajuste satisfatrio.

( p + q )( p + q + 1) AGFI = 1 (1 GFI ) 2df

Medidas de qualidade de ajuste parcimonioso


Qui-Quadrado Normalizado Razo entre a estatstica qui-quadrado e os respectivos graus de liberdade. Embora essa medida tambm esteja sujeito aos efeitos do tamanho de amostra, ela fornece duas formas de identificar modelos no adequados: (1) modelos possivelmente superajustados (valores de quiquadrado nomado menores do que um) e (2) modelos que precisam de aperfeioamentos (valores maiores do que dois ou trs).

Referncias Bibliogrficas
HAIR Jr., J. F. et al. A primer on partial least squares structural equation modeling (PLS-SEM). Los Angeles, Sage, 2014. HAIR Jr., J. F. et al. Anlise multivariada de dados. 5. ed. Porto Alegre, Bookman, 2005. HOYLE, R. H. (ed.). Handbook of structural equation modeling. NovaYork, Guilford Press, 2012. KLINE, R. B. Principles and practice of structural equation modeling. 3. ed. NovaYork, Guilford Press, 2011. MALHOTRA, N. K. Pesquisa de marketing; uma orientao aplicada. 6. ed. Porto Alegre, Bookman, 2012. SCHUMACKER, R. E.; LOMAX, R. G. A beginners guide to structural equation modeling. 3. ed. NovaYork, Routledge, 2010.