You are on page 1of 11

XIX Congresso da Sociedade Portuguesa de Estatstica

Anlise

de

Dados

Longitudinais
M. Salom Cabral
M. Helena Gonalves

SOCIEDADE PORTUGUESA
DE ESTATSTICA

28 Setembro - 1 Outubro
Nazar 2011

XIX Congresso Anual da Sociedade Portuguesa de Estat


stica
Nazar, 28 de Setembro a 1 de Outubro de 2011
e

Anlise de Dados
a
Longitudinais
M. Salom Cabral
e

M. Helena Gonalves
c

Edies SPE
co

Ficha Tcnica:

Ttulo: Anlise de Dados Longitudinais


Autores: M. Salom Cabral e M. Helena Gonalves
Editora: Sociedade Portuguesa de Estatstica
Capa: Instituto Nacional de Estatstica
Impresso: Instituto Nacional de Estatstica
Tiragem: 500 exemplares
ISBN: 978-972-8890-24-7
Depsito Legal: 332365/11

Prefcio
a

Os dados longitudinais surgem sempre que observaes repetidas da


co
varivel resposta so obtidas ao longo do tempo para cada indiv
a
a
duo,
num ou mais grupos em estudo. Este tipo de investigao referido
ca e
como estudos longitudinais e desempenham um papel fundamental
nas mais variadas reas de conhecimento na medida em que poss
a
e
vel caracterizar as alteraes dentro do indiv
co
duo e relacionar essas
alteraes com um conjunto de factores que no o tempo.
co
a
Os estudos longitudinais constituem, assim, uma importante estratgia na investigao, como o caso da investigao cl
e
ca
e
ca
nica em que
fornecem conhecimentos quer sobre o desenvolvimento e a persistne
cia da doena quer sobre os factores que podem alterar o curso do
c
desenvolvimento dessa doena.
c
Existe uma grande variedade de desaos na anlise de dados longia
tudinais. Por um lado, devido ` sua natureza, as medies repetidas
a
co
provenientes de estudos longitudinais so multivariadas e tm uma
a
e
estrutura complexa de autocorrelao cuja modelao desempenha
ca
ca
um papel fundamental na anlise deste tipo de dados. Por outro, a
a
natureza da varivel resposta pode ser cont
a
nua ou discreta. Alm
e
disso, os estudos longitudinais permitem a introduo de covariveis
ca
a
que variam ao longo do tempo, o que torna mais complexa a sua
anlise. Finalmente, em estudos longitudinais a existncia de daa
e

ii
dos omissos frequente; a modelao correcta quando existem dados
e
ca
omissos continua a ser um dos maiores desaos da anlise de dados
a
longitudinais.
A importncia deste tema no s prtica mas tambm terica,
a
e a o a
e
o
tendo-se assistido nos ultimos 20 anos a um grande desenvolvimento

das metodologias estat


sticas para analisar dados longitudinais.
O objectivo deste texto o de apresentar os diferentes mtodos de
e
e
anlise usados nos diversos tipos de dados numa linguagem mais desa
critiva do que orientada para a investigao, de forma a constituir
ca
no s um texto de apoio para o mini-curso bem como uma base de
a o
trabalho para todos aqueles que queiram utilizar estas metodologias.
Os diferentes mtodos de anlise descritos requerem o uso de proe
a
gramas estat
sticos apropriados. Neste livro usado o programa R
e
que permite no s a utilizao dos diferentes modelos apresentados
a o
ca
assim como o acesso aos dados dos exemplos analisados.
Ao longo do livro so feitas diversas referncias com o objectivo de
a
e
fornecer ao leitor uma base bibliogrca de trabalho nesta rea.
a
a
No queremos terminar sem agradecer ao Presidente da SPE, Proa
fessor Doutor Carlos Braumann e ` Comisso Organizadora de XIX
a
a
Congresso Anual da SPE o convite que nos zeram para realizar o
mini-curso em Anlise de Dados Longitudinais assim como a possibia
lidade de publicar este livro. Por ultimo, a primeira autora agradece

A
ao Francisco Saldanha da Gama pelo encorajamento e pelos L TEX

technical advices que muito contribu


ram para a realizao deste
ca
trabalho.

Lisboa, Maio de 2011


M. Salom Cabral e M. Helena Gonalves
e
c


Indice

1 Conceitos Bsicos e Exemplos


a

1.1

Introduo
ca

1.2

Objectivos e Caracter
sticas

1.3

Exemplos

1.4

Perspectiva Histrica
o

1.4.1

Dados Longitudinais Gaussianos

1.4.2

Dados Longitudinais no-Gaussianos


a

1.5
1.6

Terminologia e Notao
ca
Modelos para a Anlise de Dados Longitudinais
a

12
14
16

1.7

Dados Omissos em Estudos Longitudinais

19

1.8

Organizao do Livro
ca

22

2 Modelo Linear Misto

23

2.1

Introduo
ca

23

2.2

O Modelo

24

2.3

Estimao dos Parmetros no Modelo Marginal


ca
a

28

2.3.1

28

Mtodo da Mxima Verosimilhana


e
a
c

iv
Indice
2.3.2

Mtodo da Mxima Verosimilhana Restrita


e
a
c

2.3.3

Mxima Verosimilhana versus Mxima Veroa


c
a
similhana Restrita
c

2.4

31

34

Predio dos Efeitos Aleatrios


ca
o

34

2.4.1

Melhor Preditor Linear Centrado (BLUP)

35

2.4.2

Estimao de Bayes Emp


ca
rica

36

2.4.3

Shrinkage

37

2.4.4

Equaes do Modelo Misto


co

38

2.5

Algoritmos de Optimizao
ca

40

2.6

Inferncia Estat
e
stica para o Modelo Marginal

43

2.6.1

Distribuies Assintticas
co
o

43

2.6.2

Inferncia para os Efeitos Fixos


e

45

2.6.3

Inferncia para as Componentes da Varincia


e
a

48

2.7

Inferncia Estat
e
stica para os Efeitos Aleatrios
o

52

2.8

Anlise de Res
a
duos

53

2.8.1

Vericao das Condies sobre os Erros Aleaca


co
trios
o

2.8.2

54

Vericao das Condies sobre os Efeitos Aleca


co
atrios
o

55

3 Modelao da Matriz de Varincia - Covarincia dos


ca
a
a
Erros Aleatrios
o

57

3.1

Introduo
ca

57

3.2

O Modelo Linear Misto Geral

58

3.3

Decomposio da Matriz de Varincia-Covarincia


ca
a
a

60

3.4

Modelao da Heterocedasticidade
ca

60


Indice v
3.4.1

Modelao da Dependncia
ca
e

63

Estruturas de Correlao Serial


ca

63

3.5.2

Estruturas de Correlao Espacial


ca

68

3.5.3
3.6

62

3.5.1

3.5

Seleco do Modelo
ca

Seleco do Modelo
ca

72

Efeitos Aleatrios versus Estrutura de Correlao dos


o
ca
73

Erros
3.7

Modelo Linear Geral para Dados Longitudinais Gaussianos


3.7.1

74
Modelo Linear Misto versus Modelo Linear Geral 76

4 Equaes de Estimao de Generalizadas


co
ca

79

4.1

Introduo
ca

79

4.2

Estrutura do Modelo Marginal

81

4.3

Equaes de Estimao Generalizadas


co
ca

86

4.4

Propriedades dos Estimadores GEE

89

4.5

Inferncia Estat
e
stica com base nos Estimadores GEE

91

4.6

GEE e Valores Omissos

92

4.7

Anlise de Res
a
duos

93

4.8

Distribuio Conjunta no Modelo Marginal. Mxima


ca
a
Verosimilhana
c

5 Modelo Linear Generalizado Misto

93
95

5.1

Introduo
ca

95

5.2

Estrutura do Modelo Linear Generalizado Misto

96

5.3

Interpretao dos Coecientes do Modelo


ca

98

vi
Indice
5.4

Estimao
ca

100

5.4.1

Mtodo de Aproximao dos Dados


e
ca

101

5.4.2

Mtodo de Aproximao da Funo a Integrar


e
ca
ca

102

5.4.3

Mtodo de Aproximao do Integral


e
ca

103

5.5

Inferncia
e

107

5.6

Anlise de Res
a
duos

108

5.7

Modelo Marginal versus Modelo com Efeitos Aleatrios 108


o

6 Exemplos de Aplicao
ca

113

6.1

Introduo
ca

113

6.2

BodyWeight

114

6.2.1

Modelo Linear Misto

114

6.2.2

Modelo Linear Geral para Dados Longitudinais 129

6.3

Seizure

130

6.3.1

132

6.3.2
6.4

Modelo Marginal. Mtodo GEE


e
Modelo Linear Generalizado Misto

136

Locust

139

6.4.1

Modelo Marginal

140

6.4.2

Modelo Linear Generalizado Misto

144

Bibliograa

146