Вы находитесь на странице: 1из 17

REGRESSO BETA E APLICAES

BETA REGRESSION AND APLICATIONS







Galarza, Christian
Mestrando em Estatstica IMECC / UNICAMP




RESUMO

Este trabalho apresenta uma introduo ao Modelo de Regresso Beta simples com disperso
varivel calculando seus estimadores de Mxima Verossimilhana pelo Mtodo Newton-
Raphson e Scoring de Fisher. Alm disso, tem-se a aplicao dos modelos nos dados Gasoline
Yield Data de Prater (1956), onde se testam diferentes condies como modelos e funes
de ligao, isto utilizando o pacote betareg do software estatstico R.

Palavras-chave: Modelo de regresso Beta simples, Modelo de regresso Beta com disperso
varivel, Newton-Rapson, Scoring de Fisher, Aplicaes.


ABSTRACT

This paper presents an introduction to the Simple and Varying dispersion Beta Regression
Model calculating the Maximum likelihood estimators through Newton-Raphson and Fishers
Scoring Methods. Futhermore, has an application of the models with the Gasoline Yield Data
of Prater (1956), where we test different conditions like models and link functions, all using
the betareg package of statistical R software.

Keywords: Simple Beta Regression, Varying dispersion beta regression model, Newton-Raphson,
Fishers Scoring, Aplications.


2

1. INTRODUO


Nos modelos de regresso, muitas vezes a varivel y resposta uma varivel que apenas toma
valores no intervalo contnuo [0,1], de modo que necessrio considerar algumas alternativas
para ajustar o modelo de regresso sob esta condio. Alguns exemplos de variveis so os
seguintes:

Porcentagem do tempo dedicado a alguma atividade.
Taxa de pobreza, taxa de desemprego.
Pontuao de uma prova.
Proporo de um composto qumico numa mistura.
Frao da superfcie colhida de uma floreta.

Pode-se aplicar algumas transformaes varivel de resposta, mas pelo geral se precisa
supor normalidade. Alis, s vezes os parmetros no podem ser interpretados facilmente
em termos da resposta original e no vivel arrumar problemas de heterocedasticidade ou
assimetria.

Uma melhor alternativa supor que a varivel de resposta y segue uma distribuio contnua
com suporte (0,1), tal como a distribuio Beta, a qual ligada s variveis preditoras por
uma funo de ligao. Os modelos de regresso Beta usam um tipo de parametrizao em
termos de sua mdia e a preciso (disperso) porque assim muito mais fcil fazer as
interpretaes das estimativas.

O modelo de regresso Beta fornece estimaes precisas e seguras em relao aos coeficientes,
independentemente da tendncia dos dados (valores prximos de zero o de um) ou do
tamanho da amostra.

Vale mencionar que a Distribuio Beta no pertence famlia exponencial de funes, pois
sua distribuio no pode ser escrita da forma cannica; ela tem sua prpria famlia que
comtempla as distribuies Uniforme, Arco-Seno e Dirichlet segundo Sant Anna, Catten
(2009).

Em geral, o modelo de regresso Beta e muito til para diversas aplicaes prticas, alm de
que h um campo grande de pesquisa onde se tem desenvolvido muita literatura sobre este
tema nos ltimos anos. A Sua aplicao foi implementada no pacote betareg no software R
(www.r-project.org).

3


2. MODELO DE REGRESSO BETA


Uma varivel aleatria Y segue uma Distribuio Beta com parmetros o, [ > u denotado
por ~B(o, [) se a distribuio de Y tem densidade:

(y; o, [) = _
(o + [)
(o)([)
y
u-1
(1 - y)
[-1
, u y 1
u, cc


sendo () a funo gama e sua mdia e varincia dadas por

E|] =
o
o + [

Ior|] =
o[
(o + [)
2
(o + [ + 1)


Ferrari and Cribari-Neto (2004) apresentaram uma parametrizao diferente para a funo
densidade dos modelos de regresso Beta, isto em termos da mdia e um parmetro de
preciso . Seja p = o(o + [) e = o + [, i.e., o = p e [ = (1 - p); sob a nova
parametrizao ~B(p, ) e sua densidade em (2.1) pode ser escrita como,

(y; p, ) = _
()
(p)((1 - p))
y
q-1
(1 -y)
(1-)q-1
, u y 1
u, cc


com mdia e varincia

E|] = p
Ior|] =
p(1 -p)
1 +


Pode-se perceber que o parmetro faz o papel de um parmetro de preciso dado que para
p fixo, a maior valor de , menor varincia da varivel de resposta. Veja-se no grfico 1
densidades betas com diferentes medias mas com mesma preciso, no quadro esquerda com
preciso de 5 e direita com preciso de 15 unidades.

Considere-se uma amostra independente y
1
, . . , y
n
onde y

tem distribuio Beta com mdia


p

e preciso desconhecida , i.e., y

~B(p

, ). Seja g() uma funo (u,1) R, estritamente


montona e duas vezes diferenvel. A funo g() chamada funo de ligao dada por

(2.1)
(2.2)
(2.3)
(2.4)
(2.5)
4

g(p

) = x

T
= p



Grfico 1. Beta densities for different values of(p,). Fonte: [4] Beta regression in R.

onde x

o vetor de covariaveis de dimenso p e = ([


1
, . , [
p
)
1
o vetor de parmetros
da regresso, i = 1, . . . , n. tem-se diferentes propostas de funes de ligao g() podendo
ser escolhida a que leve para um bom ajuste. As funes de ligao mais comuns so as
funes inversas acumuladas das distribuies Logstica, Normal padro, Valor mnimo
extremo, Valor mximo extremo e Cauchy. Veja-se tabela 1 para mais detalhe.

DISTRIBUIO NOME FUNO DE LIGAO
Logstica Logit g(p) = log |p (1 - p )]
Normal padro Probit g(p) =
-1
(p)
Valor mnimo extremo Complementrio log-log g(p) = log |-log(1 - p)]
Valor mximo extremo Log-log g(p) = -log |-log(p)]
Cauchy Cauchit g(p) = tan |n(p - u.S)]


Ramalho, Ramalho & Murteira (2010) apresento sugestes para diferentes funes de ligao.
A funo de Log verossimilhana (, |y
obs
) pode ser calculada como

(, |y
obs
) =

(p

, |y
obs
)
n
=1
,
onde

(p

, |y
obs
) = log|()] - log|(p

)] - log|((1 - p

))]
(2.6)
5

+(p

- 1) log|y

] + {(1 - p

) - 1] log|1 - y

]
Note que p

= g
-1
(x

1
) uma funo de , o vetor de parmetros de regresso. O vetor de
parmetros 0 = (
1
, )
1
calculado por Mxima Verossimilhana (ML), usando o logit como
funo de ligao temos

p

= logit |p

] = log _
p

1 - p

_ = x

1


p

= g
-1
(x

1
) =
exp(p

)
1 + exp (p

)


y

= logit |y

] = log _
y

1 -y

_

obtendo as derivativas temos

o(0)
o

=
o

(0)
op



Jp

Jp



op

o

n
=1

onde,
o

(0)
op


= -
o
op


log|(p

)] -
o
op


log|((1 - p

))] +log|y

] + log|1 -y

]
= - (p

) + ((1 - p

)) + log|y

] + log|1 - y

]
= (y

-p

)
Jp

Jp


=
Jg
-1
(p

)
Jp

=
1
g(p

)
=
1
logit(p

)
= p

(1 - p

)
op

o

=
ox

o

= x



sendo () a funo digama
1
, p

= (p

) - ((1 - p

)) e y

definido em (2.9), pelo que a


derivada fica
o(0)
o

= (y

- p

)|p

(1 -p

)]x

n
=1


que pode ser escrito de maneira matricial como X
T
T(y

) onde X a matriz de desenho


e T uma matriz diagonal que contm os elementos p

(1 - p

). Do mesmo jeito pode ser


calculada a derivada
(2.7)
(2.8)
(2.9)
(2.10)
6

o(0)
o
=
o

(0)
o

n
=1

o(0)
o
= |p

(y

- p

) + log(1 - y

) -((1 - p

)) + ()]
n
=1


Os estimadores de mxima verossimilhana so obtidos pela soluo do seguinte sistema

`
1
1
1
1
o(0)
o

= u
o(0)
o
= u


A soluo deste sistema no possui uma forma fechada, fazendo-se necessrio o uso de
algoritmos de otimizao no-linear, como o algoritmo quasee-Newton BFGS. Para detalhes,
ver Press et al. (1992). O algoritmo Newton-Raphson precisa da matriz de Informao
Observada "(0), sendo o negativo da matriz Hessiana v
2
(0) dada por

v
2
(0) =
l
l
l
l
l

o
2
(0)
oo
1
o
2
(0)
oo

o
2
(0)
oo
1
o
2
(0)
o
2

1
1
1
1
1

e seus elementos so
o
2
(0)
oo
1
= __
o

2
(0)
op

2

_
Jp

Jp


_
2

op

o


op

o
1
_ + _
o

(0)
op


_
o
op



Jp

Jp


_
op

o


op

o
1
__
n
=1

o
2
(0)
oo
=
o

(0)
op

o


Jp

Jp



op

o

n
=1

o
2
(0)
o
2
=
o

2
(0)
o
2

n
=1


onde calculando as derivadas parciais usando (2.10) e (2.11) tem se que

o
2
(0)
oo
1
= -]
2

(p

(1 - p

))
2
x

1
- (y

- p

) (1 - 2p

)x

n
=1

o
2
(0)
oo
= -{|c

- (y

- p

)] p

(1 -p

)x

]
n
=1

o
2
(0)
o
2
= -|(1 -p

)
2

i
((1 - p

)) + p

i
(p

) - ()|
n
=1

(2.11)
1
Em geral, a funo poligama est definida para m = 0, 1, . . . , como
(m)
(x) = (J
m+1
Jx
m+1
) log (x) , x > u. Para
maior detalhe ver Dishon & Weiss (1980).
7

onde

=
i
(p

) +
i
((1 - p

)) e c

= |p

-
i
((1 -p

))]. Aplicando valor esperado


se obtm a matriz de Informao Esperada de Fisher _(0) dada por

_(0) = _
J

J
q

J
q
1
J
qq
_
e seus elementos so

J

=
2

(p

(1 - p

))
2
x

1
n
=1

J
q
= c

(1 - p

)x

n
=1

J
qq
= |(1 -p

)
2

i
((1 - p

)) + p

i
(p

) - ()|
n
=1


elementos que podem ser expressados de forma matricial como

_(0) = _
X
T
WX X
1
Tc

(X
1
Tc)
1
ti(D)
_

onde T = uiag{t
1
, , t
n
], W = uiag{w
1
, , w
n
], c = |c
1
, , c
n
]
1
e D = uiag{J
1
, , J
n
] com
elementos

t

= p

(1 - p

),
w

2
,
c

= |p

-
i
((1 - p

))],
J

= (1 - p

)
2

i
((1 - p

)) + p

i
(p

) -
i
().

As estimativas de Mxima Verossimilhana para 0 podem ser calculadas iterativamente pelos
algoritmos:

Newton-Raphson Escoring de Fisher
0
(t+1)
= 0
(t)
+|"(0)]
-1
v(0
(t)
|y
obs
) 0
(t+1)
= 0
(t)
+|Q(0)]
-1
v(0
(t)
|y
obs
)

at alcanar convergncia, isto

[0
(t+1)
- 0
(t)
[ < e, e = 1u
-6
,
(2.12)
8

onde sugestes para os valores iniciais dos parmetros foram apresentados por Ferrari &
Cribari-Neto (2004). Para amostras grandes, e sob condies de regularidade, os estimadores
de Mxima Verossimilhana

e
`
, tm aproximadamente distribuio de densidade conjunta
normal (p+1) multivariada, i.e.,

_

`
_ ~J
p+1
_ _

_ , |Q(0)]
-1
]

onde os erros padres dos estimadores podem ser obtidos da matriz de varincias e covarincias
|Q(0)]
-1
como

EP(0

) = uiag
1 2
(|Q(0)]
-1
).

Uma extenso do modelo de regresso Beta simples foi apresentado formalmente por Simas
et al. (2010) o modelo de regresso Beta com disperso varivel, i.e., considerando um
parmetro de preciso no fixo para todas as variveis, mas que pode ser modelado de um
jeito parecido mdia por covariaveis. Mais especificamente y

~B(p

) para cada i
independentemente, com funes de ligao:

g(p

) = x

T
= p
1

g(

) = z

T
y = p
2


sendo e y vetores dos coeficientes de regresso, p
1
e p
2
preditores lineares e x

e z

vetores
de regressores. A funo de ligao mais comum para

log, forando que seja sempre


positivo. As estimativas de ML so feitas do mesmo jeito que no caso do modelo simples, mas
s se tem que substituir por

na equao (2.6).




(2.13)
9

3. IMPLEMENTAO E APLICAES


3.1. Modelo de Regresso Beta Simples

Com os dados Gasoline Yield Data tomados de Prater (1956) ser aplicado um modelo bsico
de regresso Beta sugerido por Ferrari e Cribari-Neto (2004). tem-se 32 observaes onde a
varivel de interesse yield, a proporo de petrleo bruto convertida em gasolina depois
dos processos de destilao e fracionamento, onde y pode ser estimado naturalmente pelo
modelo de regresso Beta.

As covariveis so dois: temp temperatura (em graus Fahrenheit) a qual toda a gasolina
evaporada, e batch que um fator que contm dez nveis correspondentes a diferentes lotes,
os quais foram sometidos a diferentes condies experimentais. Veja-se o grfico 2.
Inicialmente proponhamos um modelo simples com funo de ligao logit para p

e parmetro
de preciso constante.


> data("GasolineYield", package = "betareg")
> BR_logit = betareg(yield ~ batch + temp, data = GasolineYield)
> summary(BR_logit)
Call:
betareg(formula = yield ~ batch + temp, data = GasolineYield)

Standardized weighted residuals 2:
Min 1Q Median 3Q Max
-2.8750 -0.8149 0.1601 0.8384 2.0483

Coefficients (mean model with logit link):
Estimate Std. Error z value Pr(>|z|)
(Intercept) -6.1595710 0.1823247 -33.784 < 2e-16 ***
batch1 1.7277289 0.1012294 17.067 < 2e-16 ***
batch2 1.3225969 0.1179020 11.218 < 2e-16 ***
batch3 1.5723099 0.1161045 13.542 < 2e-16 ***
batch4 1.0597141 0.1023598 10.353 < 2e-16 ***
batch5 1.1337518 0.1035232 10.952 < 2e-16 ***
batch6 1.0401618 0.1060365 9.809 < 2e-16 ***
batch7 0.5436922 0.1091275 4.982 6.29e-07 ***
batch8 0.4959007 0.1089257 4.553 5.30e-06 ***
batch9 0.3857930 0.1185933 3.253 0.00114 **
temp 0.0109669 0.0004126 26.577 < 2e-16 ***

Phi coefficients (precision model with identity link):
Estimate Std. Error z value Pr(>|z|)
(phi) 440.3 110.0 4.002 6.29e-05 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Type of estimator: ML (maximum likelihood)
Log-likelihood: 84.8 on 12 Df
Pseudo R-squared: 0.9617
Number of iterations: 51 (BFGS) + 3 (Fisher scoring)


10






Observe-se que a covarivel temp e o fator batch so significativos para explicar a varivel
de interesse yield, alm disso, obtm-se um valor alto da preciso de 440,3, e o seu valor
determinante para um bom ajuste.


3.2. Modelo de Regresso Beta com preciso varivel

Embora o modelo de regresso Beta j incorpora informao da disperso dos dados de um
jeito natural (ver equao 2.4b), considerando o parmetro de preciso como no fixo,
podemos modelar a heterocedasticidade, isto utilizando uma funo de ligao log e a varivel
temp como covarivel como na equao (2.13).


> BR_logitV = betareg(yield ~ batch + temp|temp, data = GasolineYield)
> summary(BR_logitV)
Call:
betareg(formula = yield ~ batch + temp | temp, data = GasolineYield,
link = "logit")

Standardized weighted residuals 2:
Min 1Q Median 3Q Max
-2.5399 -0.7792 -0.1167 0.8621 2.9419

Coefficients (mean model with logit link):
Grfico 2. Temperatura em graus Fahrenheit onde a gasolina evaporada Vs. proporo de petrleo bruto
convertida em gasolina depois dos processos de destilao e fracionamento. As observaes ligadas por nmeros
iguais representam um nvel do fator batch.
11

Estimate Std. Error z value Pr(>|z|)


(Intercept) -5.9232361 0.1835262 -32.275 < 2e-16 ***
batch1 1.6019877 0.0638561 25.087 < 2e-16 ***
batch2 1.2972663 0.0991001 13.090 < 2e-16 ***
batch3 1.5653383 0.0997392 15.694 < 2e-16 ***
batch4 1.0300720 0.0632882 16.276 < 2e-16 ***
batch5 1.1541630 0.0656427 17.582 < 2e-16 ***
batch6 1.0194446 0.0663510 15.364 < 2e-16 ***
batch7 0.6222591 0.0656325 9.481 < 2e-16 ***
batch8 0.5645830 0.0601846 9.381 < 2e-16 ***
batch9 0.3594390 0.0671406 5.354 8.63e-08 ***
temp 0.0103595 0.0004362 23.751 < 2e-16 ***

Phi coefficients (precision model with log link):
Estimate Std. Error z value Pr(>|z|)
(Intercept) 1.364089 1.225781 1.113 0.266
temp 0.014570 0.003618 4.027 5.65e-05 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Type of estimator: ML (maximum likelihood)
Log-likelihood: 86.98 on 13 Df
Pseudo R-squared: 0.9519
Number of iterations: 33 (BFGS) + 28 (Fisher scoring)


e com isto se tem evidencia de melhora ao incluir a temperatura de evaporao da gasolina
como covarivel do parmetro de preciso . Agora os dois modelos (com preciso constante
e no) so comparados pelo Teste de Rao de Verossimilitudes.


> lrtest(BR_logit, BR_logitV)
Likelihood ratio test

Model 1: yield ~ batch + temp
Model 2: yield ~ batch + temp | temp
#Df LogLik Df Chisq Pr(>Chisq)
1 12 84.798
2 13 86.977 1 4.359 0.03681 *
---
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1



sendo evidencia de que o Modelo 2 (com preciso no constante) melhor do que o Modelo
1. Note-se que o mesmo que testar uma hiptese nula de igual disperso vs. disperso
varivel, i.e.,
E
0
: y

~B(p

, ) IS E
1
: y

~B(p

)

cuja hipteses nula rejeitada a favor da hipteses alternativa. O critrio AIC tambm
comprovou que o modelo 2 melhor.


> AIC(BR_logit,BR_logitV)


df AIC
BR_logit 12 -145.5951
BR_logitV 13 -147.9541
12










3.3. Propostas de funes de ligao

Ramalho & Murteira (2010) fala dos critrios de seleo de diferentes funes de ligao para
o modelo de regresso Beta, onde uma simples escolha de uma delas pode melhorar
significativamente o ajuste, especialmente quando se tem dados pertos aos valores extremos
zero e um. Com o objetivo de comparar o ajuste, utilizaremos trs modelos com igual preciso
e diferentes funes de ligao: logit, probit e loglog.


> BR_logit = betareg(yield ~ batch + temp, GasolineYield,link="logit")
> BR_probit = betareg(yield ~ batch + temp, GasolineYield,link="probit")
> BR_loglog = betareg(yield ~ batch + temp, GasolineYield,link="loglog")
> AIC(BR_logit, BR_probit, BR_loglog)

df AIC
BR_logit 12 -145.5951
BR_probit 12 -155.6575
BR_loglog 12 -168.3101


Com o modelo com funo de ligao loglog proposto tambm em Cribari-Neto and Lima
(2007), obtido o menor valor do critrio, sendo no s melhor do que o modelo logit com
Grfico 3. Curvas de predio da proporo de petrleo bruto convertida em gasolina depois dos processos de
destilao e fracionamento dada a temperatura em graus Fahrenheit onde a gasolina evaporada. Cada curva com
diferente cor representa um nvel do fator batch.
13

preciso fixa, mas ainda melhor do que o modelo com modelao da disperso proposto em
linhas anteriores. Olhe-se o grfico 4.










4. MODELOS DE REGRESSO BETA MAIS GERAIS


Varying dispersion beta regression models: Smithson & Verkuilen (2006).

A general class of beta regression models: Simas, Barreto-Souza & Rocha (2010).

Inflated beta regression models: Cook, Kieschnick, McCullough (2008), Ospina & Ferrari
(2010,2012a), Calabrese (2012).

Truncated inflated beta regression models: Pereira, Botter & Sandoval (2011, 2013).

Semi-parametric beta regression: Branscum, Jonhson & Thurmond (2007), Weihua et al
(2012).

Time series: Rydlewski (2007), Rocha & CribariNeto (2009), Billio & Casarin (2011),
Casarin, Dalla Valle, Leisen (2012); da-Silva, Migon & Correia (2011), da-Silva & Migon
(2012), Guolo & Varin (2012).

Multivariate beta regression: Souza & Moura (2012a, 2012b)

Grfico 4. Curvas mdias de predio da proporo de petrleo bruto convertida em gasolina depois dos processos
de destilao e fracionamento dada a temperatura em graus Fahrenheit onde a gasolina evaporada. Cada curva
representa a funo mdia ajustando os dados com modelos com funes de ligao logit, probit e loglog.
14

Mixed beta regression: Zimprich (2010), Verkuilen & Smithson (2012), FigueroaZiga,
Arellano Valle & Ferrari (2013), Bonat, Ribeiro Jr & Zeviani (2013).

Errors-in-variables beta regression models: Carrasco, Ferrari, ArellanoValle (2012) (more
later).

Beta rectangular regression models: Bayes, Bazn & Garca (2012).


5. PESQUISAS


Alm, so apresentados diferentes pesquisas e aplicaes do Modelo Beta:

Johnson et al. (1995, p. 235). The beta distributions are among the most frequently
employed to model theoretical distributions.

Bury (1999). Applications of the beta distribution in engineering.

Janardan and Padmanabhan (1986). Modelling of hydrological variables using the beta
distribution.

McNally (1990). Use of the beta distribution in the study of reproducibility of cows.

Graham e Hollands (1990) e Milyutin e Yaromenko (1991). Use the beta distribution
in studies of indices related to the transmission of solar radiation

Maffet and Wackerman (1991). Power of radar signals is modeled by using the beta law.

Wiley et al. (1989). Develop a beta model to estimate the probability of HIV
transmission during sexual intercourse involving infected and non-infected individuals.
15

ANEXOS


Implementao do Scoring de Fisher para o Modelo de Regresso Beta
Simples.


library(betareg)
library(lmtest)

y = GasolineYield$yield
X = model.matrix(gy_logit)

EFBeta = function(x,y,th)
{
#Contas iniciais
b = th[1:p]
phi = exp(th[p+1])
eta = X%*%b
y. = log(y/(1-y))
mu = exp(eta)/(1+exp(eta))
mu. = digamma(mu*phi)-digamma((1-mu)*phi)

#Contas Adicionais
t = as.numeric(mu*(1-mu))
om = psigamma(mu*phi,2)+psigamma((1-mu)*phi,2)
c = phi*(mu*om-psigamma((1-mu)*phi,2))
w = as.numeric(phi*om*t^2)
d = as.numeric(((1-mu)^2)*psigamma((1mu)*phi,2)+(mu^2)
*psigamma(mu*phi,2)-psigamma(phi,2))
TT = diag(t)
W = diag(w)
D = diag(d)

#Gradiente
G_bet = phi*(t(X)%*%TT%*%(y.-mu.))
G_phi = sum(mu*(y.-mu.)+log(1-y)-digamma((1-mu)*phi)+digamma(phi))
GG = rbind(G_bet,G_phi)

#Matriz Esperada de Fisher
M_bb = phi*(t(X)%*%W%*%X)
M_bp = t(X)%*%TT%*%c
M_pb = t(M_bp)
M_pp = sum(diag(D))
MIEF = cbind(rbind(M_bb,M_pb),rbind(M_bp,M_pp))

return(list(GG = GG, MIEF = MIEF))

}


#Funo de Log-Verossimilhana
logverB<-function(param,y,X)
{
p = ncol(X)
eta = X%*%param[1:p]
mu = exp(eta)/(1+exp(eta))

vero = sum(lgamma(param[p+1])-lgamma(mu*param[p+1])-lgamma((1-mu)
*param[p+1])+((mu*param[p+1])-1)*log(y)+(((1-mu)*param[p+1])-1)
*log(1-y))

return(-vero)
}
16

#Regresso Beta
RegBeta = function(X,y,b,phi,MaxIter=200,error=0.0001)
{

n = nrow(X)
p = ncol(X)
thv = c(b,phi)
count = 0
criterio = 1

while(criterio > error)
{
count = count + 1
GM = EFBeta(x,y,thv)
ite = solve(GM$MIEF)%*%GM$GG
thn = thv + ite
criterio = sqrt(t(thv-thn)%*%(thv-thn))
thv = thn
npar = p+1

if (count==MaxIter)
{
break
}
}

EPbeta = sqrt(diag(solve(GM$MIEF)))
loglik = logverB(param,y,X)

#Criterios
AIC<- -2*loglik +2*npar
BIC <- -2*loglik +log(n)*npar
HQ <- -2*loglik +2*log(log(n))*npar

return(list(iter=count, theta = thn, EPbeta = EPbeta ,AIC = AIC, BIC =
BIC, HQ = HQ))

}


17

REFERNCIAS


1. Bayer, F.M. (2011) Modelagem e Inferncia em Regresso Beta, Tese de Doutorado,
Universidade Federal de Pernambuco, Recife, Brasil.

2. Biguelini, C.B.,(2009). Modelo de Regresso Beta para a Anlise da Origem dos Problemas
de Sistemas Prediais. Monografia. Universidade Federal do Rio Grande do Sul.

3. Branscum, A.J., Johnson, W.O. & Thurmond, M.C. (2007). Bayesian beta regression:
applications to household expenditure data and genetic distance between foot-and-mouth
disease viruses. Australian and New Zealand Journal of Statistics, 49, 287301.

4. CribariNeto, F. & Zeiles, A. (2010). Beta regression in R. Journal of Statistical Software,
34, 124.

5. Espinheira, P.L., Ferrari, S.L.P. & CribariNeto, F. (2008a). Influence diagnostics in beta
regression. Computational Statistics and Data Analysis, 52, 44174431.

6. Ferrari, S.L.P. & CribariNeto, F. (2004). Beta regression for modelling rates and
proportions. Journal of Applied Statistics, 31, 799815.

7. Ferrari, S.L.P., Espinheira, P.L. & CribariNeto, F. (2011). Diagnostic tools in beta
regression with varying dispersion. Statistica Sinica, 65, 337351.

8. Ospina, R., CribariNeto, F. & Vasconcellos, K.L.P. (2006). Improved point and interval
estimation for a beta regression model. Computational Statistics and Data Analysis, 51,
960981. Erratum at Computational Statistics and Data Analysis, 55, 2445.

Вам также может понравиться