Академический Документы
Профессиональный Документы
Культура Документы
log(i )
yi i
log(1/yi )
log(1/
yi )
yi /
yi
log(1/yi )
log(1/
yi )
) ]
yi i = 2
]
( )
yi yi
log
1
yi yi
i =
1+
O script a seguir ajusta o modelo no R:
e0 +1 xi
x=c(0,1,10,50,100,200)
y=c(13,5,5,3,4,18)
m=c(391,205,156,50,35,51)
modelo=glm(cbind(y,m-y)~x,family="binomial")
Figura 2:
Os resultados do modelo so mostrados a seguir
> summary(modelo)
Call:
glm(formula = cbind(y, m - y) ~ x, family = "binomial")
Deviance Residuals:
1
2
3
0.41428 -0.48994 -0.13991
4
0.02835
5
0.00048
6
0.00269
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -3.488973
0.204062 -17.098 < 2e-16 ***
x
0.014410
0.001817
7.932 2.15e-15 ***
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 54.35089
Residual deviance: 0.43206
AIC: 26.097
on 5
on 4
degrees of freedom
degrees of freedom
1
1+
e3.488+0.014xi
0.35
0.30
0.25
0.20
0.15
0.10
0.05
50
100
150
200
i
1 i
(
xi = (log
)
= 3.488 + 0.014xi
i
1 i
)
+ 3.488)/0.014 .
0, 1
1 0, 1
)
+ 3.488)/0.014 = 92.19 .
Portanto a dose tal que espera-se que 10% das pessoas morram por leucemia de 92,19.
6. Entre os conjuntos de dados disponveis no pacote MASS encontra-se a data frame
menarche. Trata-se dos resultados dum estudo efetuado na Polnia (veja- a referncia
bibliogrca atravs do comando help(menarche)) em 1965, no qual se registou a
idade mdia da primeira menstruao (menarca) em grupos (homogneos) de jovens
de Varsvia. A tabela contm trs colunas, indicando a idade mdia do grupo, o
nmero total de jovens no grupo e, nalmente, o nmero de jovens j com perodos
menstruais.
a) Construa um grco de idades mdias (eixo horizontal) vs. a proporo de jovens
psmenarca (eixo vertical). Discuta a forma da relao obtida.
5
0.6
0.4
0.0
0.2
Menarche/Total
0.8
1.0
10
12
14
16
Age
Figura 4:
b) Ajuste uma regresso logstica aos dados. Trace a curva ajustada por cima da
nuvem de pontos que obteve na alnea anterior. Teste a signicncia da varivel
e verique se o modelo est bem ajustado atravs da Deviance e do grco.
Resposta: O comando e o resultado do modleo so apresentados a seguir.
glm(cbind(Menarche,Total-Menarche)~Age, data=menarche, family="binomial")
6
3Q
0.7780
Max
1.3675
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -21.22639
0.77068 -27.54
<2e-16 ***
Age
1.63197
0.05895
27.68
<2e-16 ***
--(Dispersion parameter for binomial family taken to be 1)
Null deviance: 3693.884
Residual deviance:
26.703
AIC: 114.76
on 24
on 23
degrees of freedom
degrees of freedom
1.0
0.8
0.6
0.4
0.0
0.2
Menarche/Total
10
12
14
16
Age
Figura 5:
d) Refaa o ajuste anterior, mas agora usando as ligaes probit e complemente loglog. Adicione no grco anterior a curva com o ajuste desses dois novos modelos.
Compare os resultados. Qual das ligaes voc escolheria?
Resposta: Os comandos utilizados para ajustar o modelo e traar a curva se
encontram a seguir.
legend("topleft",c("Logit","Probit","C-log-log"),fill=c("black","blue","red")
Logit
Probit
Cloglog
0.6
0.4
0.0
0.2
Menarche/Total
0.8
1.0
A Figura ?? as curvas ajustadas usando os trs tipos de funo de ligao. Notamos que os ajustes so semelhantes entre si. Porm a curva logstica parece se
ajustar melhor aos dados. Alm disso, como o modelo logstico o nico para o
qual podemos interepretar os parmetros, esse o modelo mais adequado.
10
12
14
16
Age
Figura 6:
7. No pacote MASS encontra-se a data frame Trac, com os resultados dum estudo sobre
9
10