Вы находитесь на странице: 1из 46

ECONOMETRIA

Prof. Patricia Maria Bortolon, D. Sc.


Modelos de Escolha Qualitativa

Fonte: GUJARATI; D. N. Econometria Bsica: 4 Edio.


Rio de Janeiro. Elsevier- Campus, 2006
Modelos de escolha qualitativa
Varivel dependente: binria
Varivel independente: mtricas ou binrias
Exemplos:
Probabilidade de falncia
Probabilidade de sinistro
Probabilidade de aderir a segmento diferenciado de
governana corporativa
Probabilidade de abrir capital
Modelos de escolha qualitativa
Quando Y quantitativo, atravs dos modelos de
regresso linear estimamos o valor esperado ou
valor mdio, dados os valores das variveis
independentes

E (Yi X 1i , X 2i ,..., X ki )

Quando Y qualitativo, o objetivo encontrar a


probabilidade de que algo acontea
Modelos de Probabilidade
O que vamos estudar:
Como estimar modelos de escolha qualitativa?
Podemos usar MQO?
H problemas especiais de inferncia?
Como medir a qualidade do ajustamento?
Podemos usar o R2?
Como interpretar os coeficientes do modelo?
O que no vamos estudar...
... mas so extenses do assunto:
Dados contveis ou eventos raros como varivel dependente =
processos de probabilidade de Poisson. ex.: no. de artigos
publicados por um docente, no. de patentes registradas por uma
empresa, etc...
Modelos logit e probit ordinais. Ex.: quando a varivel dependente
nvel de escolaridade, ou variveis em termos de escala do tipo
Likert (concordo totalmente a discordo totalmente)
Modelos logit e probit multinomiais: quando a varivel de resposta
tem mais de duas categorias mas no so ordenadas ou
hierarquizadas.
Modelos de durao: ex.: o que determina a durao de uma
lmpada; a sobrevivncia de micro-empresas. Esses casos so
tratados em Anlise de Sobrevivncia.
Modelos de Escolha Qualitativa
H trs abordagens para formular um modelo
probabilstico para uma varivel de escolha
binria:
O modelo de probabilidade linear
O modelo logit
O modelo probit
Modelo de Probabilidade Linear

Yi 1 2 X i ui

1 = tem casa prpria Renda familiar


0 = c. c.

um modelo linear de probabilidade porque:

E Yi X i PrYi 1 | X i
Modelo de Probabilidade Linear
Supondo E(ui)=0, para obter estimadores no
tendenciosos. A varincia de Yi tem a seguinte distribuio
de probabilidade:
Yi Prob.
0 1 Pi Se Pi = probabilidade de que Yi = 1
1 Pi
Total 1

Dist. de Probabilidade Binomial


(np ; np(1-p))

0 E (Yi | X i ) 1
Podemos usar MQO?
Modelo de probabilidade linear
Problemas na utilizao de MQO
1. Ausncia de normalidade dos termos de erro ui. Porque
assim como Yi, ui tambm assumem dois valores:
ui Yi 1 2 X i

Yi ui Prob.
Qdo. Yi = 1 1 1 2Xi Pi
Qdo. Yi = 0 1 2Xi 1 - Pi

Tambm segue distribuio binomial

=> ui no se distribuem normalmente


Modelo de probabilidade linear
Problemas na utilizao de MQO
Entretanto, lembre que a medida que o tamanho
da amostra aumenta a distribuio binomial
converge para a Normal.
Portanto, no caso de grandes amostras, a
inferncia estatstica dos modelos de
probabilidade linear segue os procedimentos
habituais de MQO sob premissa de normalidade.
Modelo de probabilidade linear
Problemas na utilizao de MQO
2. Varincias heterocedsticas dos termos de erro.
Como ui segue distribuio binomial com mdia Pi e varincia
igual a Pi(1-Pi), vemos que a varincia depende da mdia
var(ui ) Pi (1 Pi )
Pi E (Yi | X i ) 1 2 X i

A varincia de ui depende, em ltima instncia, dos valores de X e,


portanto, no homocedstica.
Estimadores de MQO no tendenciosos, porm no so
eficientes.
Soluo: mnimos quadrados ponderados (MQP)
Yi 1 2 X i ui

wi wi wi wi
onde wi E(Yi | X i )1 E(Yi | X i ) Pi 1 Pi
Modelo de probabilidade linear
Problemas na utilizao de MQO
3. Impossibilildade de satisfazer 0 E(Yi | Xi) 1
Problema real da estimativa por MQO!!!
No h como garantir que Yi se situe entre 0 e 1.
Duas formas de agir:
Calcular os Yi e os que forem < 0 considerar = 0 e
os que forem > 1 considerar = 1
Usar tcnica que garanta que as probabilidades
condicionais de Yi se situem entre 0 e 1 (logit e
probit)
Modelo de probabilidade linear
Problemas na utilizao de MQO
4. O valor de R2 como medida da qualidade do
ajustamento questionvel
Yest.

R2 estar muito abaixo de 1


(em geral entre 0,2 e 0,6)
X

Do ponto de vista lgico o Modelo de Probabilidade Linear pressupe que


Pi = E(Y = 1| X) aumenta linearmente com X, isto , o efeito marginal ou
incremental de X permanece constante.
Modelo de probabilidade linear
Problemas na utilizao de MQO
No exemplo da amostra de 40 famlias e os dados de
renda e casa prpria (Gujarati, Cap. 15) temos:

Yi 0,9457 0,1021X i
Quando X aumenta uma unidade (US$ 1.000) a prob. de
ter casa prpria aumenta sempre na mesma quantia de
0,10.
Independe da renda ser US$8.000, US$10.000 ou
US$22.000
O que seria esperado?
Que a nveis muito baixos ou muito altos a probabilidade de ter
casa prpria no fosse to afetada.
Modelo de probabilidade linear
Problemas na utilizao de MQO
Precisamos de um modelo de probabilidade que
tenha duas caractersticas:
1. A medida que Xi aumenta Pi = E(Yi = 1| Xi) aumenta
mas nunca sai da faixa 0 1
2. A relao entre Pi e Xi no linear, se aproxima de
zero a taxas cada vez menores medida que Xi se
reduz, e se aproxima de 1 a taxas cada vez menores
medida que Xi aumenta muito.
Modelo de probabilidade linear
Problemas na utilizao de MQO
Precisamos de uma curva sigmide, ou em S,
semelhante a FDA de uma v.a.:
1 FDA

0 X
Em geral so escolhidos os modelos (1) logstico
e (2) normal, o primeiro dando origem ao modelo
logit e o sengundo ao probit (ou normit).
Modelo Logit
O modelo de probabilidade linear no caso da casa
prpria era:

Pi E (Yi 1 | X i ) 1 2 X i

A Funo de Distribuio Logstica

1
Pi E (Yi 1 | X i ) ( 1 2 X i )
1 e
Modelo Logit
Resumindo e chamando Zi = 1 + 2Xi teremos:
1 eZ
Pi Z

1 e 1 eZ
1
quando Z i Pi
0
1 e
1
quando Z i Pi 1
1
1
e
0 Pi 1
Problema: Pi no linear em X e em => no podemos
usar MQO
Soluo: linearizar
Modelo Logit
Z
e e Zi
1 Pi 1
1 eZ Pi 1 e Zi
e Zi
1 1 Pi 1
1 Pi
1 e Zi 1 e Zi
A razo de chances a favor da
Tirando o logaritmo: posse da casa prpria.
Pi = 0,8 => h 4 chances contra 1
Pi
Li ln Z i a favor de a famlia possuir casa

1 Pi
prpria.

Pi
Li ln 1 2 X i
1 Pi
Denominado Logit
Modelo Logit - Caractersticas
1. Quando passa de 0 a 1 (isto , quando Z varia de - a
+), o logit L varia de - a +. As probabilidades so
limitadas entre 0 e 1, os logits no.
2. Embora L seja linear em X as probabilidades no o so.
3. Podemos incluir quantos regressores forem necessrios.
4. O coeficiente angular mede a variao de L em resposta
a uma unidade de variao em X, isto , nos diz o
quanto o logaritmo das chances favorveis ao evento de
interesse variam em resposta a uma unidade de variao
na varivel independente.
5. O intercepto d as chances favorveis quando a varivel
independente igual a zero. Como na regresso linear
pode no ter sentido prtico.
Modelo Logit - Caractersticas
6. Se quisermos no as chances favorveis ao
evento de interesse mas a prpria probabilidade
do evento isso pode ser feito pela expresso:
Z
1 e
Pi Z

1 e 1 e Z

7. A relao linear no entre Pi e Xi, e sim entre o


logaritmo da razo de chances e Xi.
Modelo Logit - Estimao
1. Dados em nvel individual
A estimativa por MQO invivel
Imagine Pi = 1 se a famlia tem casa prpria
Pi = 0 c.c.
Ao calcular os logits para estimar o modelo
Pi
Li ln 1 2 X i ui
1 Pi
1
Li ln se a famlia tem casa prpria
0 Expresses no
0 fazem sentido
Li ln c.c.
1
Ao invs de MQO usar Mxima Verossimilhana para
estimar os parmetros
Modelo Logit Dados Agrupados - Estimao

1. Dados agrupados ou replicados


X Ni ni
US$ mil
ni
6 40 8 Pi a frequncia relativa
8 50 12 Ni
10 60 18
... ... ...

Com os Pi possvel obter os logits estimados


Podemos usar MQO?
No!!
Modelo Logit Dados Agrupados - Estimao

possvel demonstrar que, se Ni for


suficientemente grande e cada observao em
uma dada classe de renda Xi se distribui
independentemente como uma varivel binomial,
ento:
1
ui ~ N 0,
N P
i i (1 Pi
)

Usar MQP
Estimativa da varincia:
1

2

N i Pi (1 Pi )
Modelo Logit Dados Agrupados - Estimao
Etapas para estimao da regresso logit:
1. Para cada nvel de renda:
ni
P
Ni

2. Para cada nvel de renda obter o logit:

P
Li ln i

1 Pi
Modelo Logit Dados Agrupados - Estimao
Etapas para estimao da regresso logit:
3. Transformamos:
Pi
Li ln 1 2 X i ui
1 Pi
em
wi Li 1 wi 2 wi X i wi ui
L*i 1 wi 2 X i* vi
onde :
wi N i Pi (1 Pi )
L*i Li transformado
X i* X i transformado
vi termo de erro transformado
Modelo Logit Dados Agrupados - Estimao
Etapas para estimao da regresso logit:
4. Estimamos por MQO sem intercepto.
5. Avaliar coeficiente pelos mtodos tradicionais de
intervalo de confiana ou teste de hipteses.
Lembrando que as concluses sero vlidas se as
amostras forem grandes.

Exemplo da casa prpria com dados agrupados na pag.


485 do Gujarati.
Modelo Logit Dados Agrupados - Interpretao
L*i 1,59474 wi 0,07862 X i*
ep (0,11046) (0,00539)
t (14,43619) (14,56675)
R 2 0,9642

Interpretao do logit: para uma unidade (US$1000) de aumento na


renda o logaritmo ponderado das chances favorveis posse da casa
prpria aumenta em 0,08 unidade.
Interpretao das chances: tomando o antilogaritmo do logit estimado,
obtemos Pi / (1 Pi), isto , a razo de chances.

Pi 1, 59474 wi 0 , 07862X i*
e
1 Pi
1, 59474 wi 0 , 07862X i*
e e
Modelo Logit Dados Agrupados - Interpretao

Pi 1, 59474 wi 0 , 07862X i*
e
1 Pi
1, 59474 wi 0 , 07862X i*
e e

e0,07862 = 1,0817
Para cada unidade de aumento da renda ponderada, as chances
ponderadas favorveis a posse da casa prpria aumentam em cerca
de 8,17%.

Se tomarmos o anti-logaritmo do j-simo coeficiente angular, subtramos 1 dele


e multiplicamos o resultado por 100, obtemos a variao percentual das chances
em favor de um aumento de uma unidade no j-simo regressor.
Modelo Logit Dados Agrupados - Interpretao
Clculo das probabilidades: no nosso exemplo, se
quisermos calcular a probabilidade de ter casa prpria
se a renda X = 20 (US$20.000).
L*i 1,59474 wi 0,07862 X i*
wi 4,1825
X i* 83,6506
L*i 1,59474 4,1825 0,07862 83,6506
L*i 0,09311
L*i
Li 0,02226
wi
Modelo Logit Dados Agrupados - Interpretao
Clculo das probabilidades: no nosso exemplo, se
quisermos calcular a probabilidade de ter casa prpria
se a renda X = 20 (US$20.000).
L*i
Li 0,02226
wi
Pi
0,02226 ln Dada a renda de US$20.000, a
probabilidade de que a famlia tenha
1 Pi uma casa prpria de cerca de 49%.
Portanto,
Pi
e 0, 02226 1,0225
1 Pi
0 , 02226
e
Pi 0 , 02226
0,4944
1 e
Modelo Logit Dados Agrupados - Interpretao
Clculo da variao da probabilidade: envolve no
apenas 2, mas tambm o nvel de probabilidade em
relao ao qual a variao medida.
dP
2 Pi (1 Pi )
dX i
Para o nvel de renda de US$20.000 teremos dP/dX =
0,01965
Modelo Logit Dados No Agrupados
Como Yi = 1 ou 0, nestes casos, teremos que
recorrer a procedimentos de estimao no
lineares usando o mtodo da mxima
verossimilhana.
um mtodo para grandes amostras, e os erros-
padro estimados so assintticos
Ao invs da estatstica t usamos a estatstica z.
O R2 no adequado como medida de
ajustamento.
O Eviews apresenta o R2 de McFadden que tambm
varia entre 0 e 1.
Outra medida de ajustamento o Count R2.
Modelo Logit Dados No Agrupados
Fvero et. al. apresentam outras medidas de
ajustamento:
Pseudo R2
Cox & Snell R2
Nagelkerke R2
Teste qui-quadrado: para avaliar se h diferenas
significativas entre o esperado e o observado
Hosmer Lemeshow Goodness of fit Test: outra
medida do poder preditivo do modelo
Modelo Logit Dados No Agrupados
Para testar a significncia do modelo como um
todo o equivalente ao teste F da regresso
mltipla a estatstica da razo de
verossimilhana. Esta estatstica segue a
distribuio qui-quadrado com g.l. igual ao no. de
variveis explanatrias (o intercepto no conta).
Modelo Logit Dados No Agrupados -
Interpretao
Gujarati usa um exemplo sobre previso de notas de
alunos, com Y =1 se a nota A e Y = 0 c.c.
GPA = pontuao mdia; TUCE = pontuao no incio do
curso; PSI = 1 se utilizado novo mtodo de ensino.
O modelo e os resultados foram:
Pi
Li 1 2GPAi 3TUCEi 4 PSI i ui
1 Pi
Li 13,0213 2,8261GPAi 0,0951TUCEi 2,3786 PSI i
p values 0,0082 0,0252 0,5014 0,0255
McFaddenR 2 0,3740 LRstatisti c(3df ) 15,40419
Modelo Logit Dados No Agrupados -
Interpretao
Pi
Li 1 2GPAi 3TUCEi 4 PSI i ui
1 Pi
Li 13,0213 2,8261GPAi 0,0951TUCEi 2,3786 PSI i
p values 0,0082 0,0252 0,5014 0,0255
McFaddenR 2 0,3740 LRstatisti c(3df ) 15,40419

Os regressores em conjunto tem impacto positivo sobre a nota final


pois LR = 15,40 cujo valor p de cerca de 0,0015, muito pequeno.
As trs variveis tm efeito positivo sobre o logit embora TUCE seja
no significativo.
O coeficiente 2,8261 de GPA signfica que para cada aumento de 1 na
nota mdia o logit estimado aumenta, em mdia cerca de 2,83 un.
A interpretao em relao s chances faz-se tomando o
antilogaritmo dos coeficientes. Ex.: o antilog. de PSI 10,7897
(e2,3786). Estudantes submetidos ao novo mtodo de ensino tm cerca
de dez vezes mais chances de tirar uma nota A.
Modelo Logit Dados No Agrupados -
Interpretao
Pi
Li 1 2GPAi 3TUCEi 4 PSI i ui
1 Pi
Li 13,0213 2,8261GPAi 0,0951TUCEi 2,3786 PSI i
p values 0,0082 0,0252 0,5014 0,0255
McFaddenR 2 0,3740 LRstatisti c(3df ) 15,40419

Para obter a probabilidade de um estudante ter nota A, observa-se os


dados deste estudante (GPA, TUCE e PSI) e calcula-se Li, ou seja, o
logit estimado. Ex.: logit estimado igual a 0,8178
Para obter a probabilidade usa-se a expresso:
1 eZ A probabilidade estimada do estudante tirar
Pi Z
nota A aproximadamente 69%.
1 e 1 eZ Como o observado foi Y = 1 para este estudante
1 podemos assumir que a previso est prxima.
Pi 0 ,8178
0,6937
1 e
Modelo Probit
Utiliza ao invs da funo logstica acumulada a
funo de distribuio acumulada (FDA) da
normal.
( X )2
X0 1
F(X ) e 2 2

2 2

Para o exemplo da casa prpria:


Pi P(Y 1 | X ) P(Zi 1 2 X i ) F (1 2 X i )
Modelo Probit Dados Agrupados -
Interpretao
Resultados do modelo probit para o exemplo da casa
prpria: 1 = -1,0166 e 2 = 0,04846
Para conhecer o efeito de uma variao unitria em X
sobre a probabilidade de Y = 1, isto , ter casa prpria
derivamos a equao anterior e:
dPi
f ( 1 2 X i ) 2
dX i

Onde f (1 2 X i ) a funo de densidade de


probabilidade normal padro em 1 2 X i
Portanto, essa avaliao depender do valor de X
Modelo Probit Dados Agrupados -
Interpretao
Resultados do modelo probit para o exemplo da casa
prpria: 1 = -1,0166 e 2 = 0,04846
Para X = 6 teremos na funo de densidade normal
f[-1,0166+0,04846(6)] = f(-0,72548).
Para Z = -0,72548 a densidade normal de cerca de
0,3066, que multiplicado por 2 , dar 0,01485.
Ou seja, partindo de um nvel de renda de US$6.000,
quando a renda aumenta US$1.000 a probabilidade de
uma famlia ter casa prpria aumenta em 1,4%.
Efeito marginal de uma variao unitria de um
regressor nos vrios modelos de regresso
Modelo de Regresso O coeficiente angular mede a variao do valor
Linear mdio do regressando para uma variao unitria no
valor de um regressor, mantidas constantes as
demais variveis.
Modelo de Probabilidade O coeficiente angular mede diretamente a variao
Linear da probabilidade de ocorrncia de um evento em
consequncia de uma variao unitria no valor de
um regressor, tudo o mais constante.
Modelo Logit O coeficiente angular nos d a variao no logaritmo
das chances dada uma variao unitria de um
regressor. Entretanto, a taxa de variao na
probabilidade de ocorrncia do evento dada por
jPi(1-Pi), onde j o coeficiente do j-simo regressor
e a avaliao de Pi leva em conta todas as variveis
do modelo.
Modelo Probit A taxa de variao da probabilidade mais
complicada. Dada por jf(Zi), onde f(Zi) a funo de
densidade da normal padro e Zi = 1+2X2i+...+kXki,
ou seja, o modelo de regresso usado na anlise.
Entre os modelos logit e probit, qual o
prefervel?
Na maioria das aplicaes so bastante parecidos
A distribuio logstica tem caudas mais gordas
=> a prob. condicional Pi aproxima-se de 0 ou 1
mais lentamente
Logit mais simples para interpretar!!
Os coeficientes dos dois modelos no podem ser
comparados diretamente. Embora a distribuio
logstica padro e a normal padro tenham ambas
mdia zero, suas varincias so diferentes.
Modelo Tobit
No exemplo da casa prpria, se estivssemos
interessados no na probabilidade da famlia ter
casa prpria, mas sim na relao entre o
montante gasto para adquiri-la em relao a
variveis scio-econmicas.
Dilema: se a famlia no tem casa prpria no h
dados sobre o montante gasto!!
Amostra censurada: quando em parte da
amostra s temos informaes sobre os
regressores, mas no sobre o regressando.
Tambm denominados modelos de regresso
com varivel dependente limitada
Modelo Tobit - Estimao
Yi 1 2 X i ui se LD 0
0 c. c.
Podemos estimar a regresso usando apenas a
parte da amostra para a qual temos dados da
varivel dependente?
No! Os estimadores seriam tendenciosos e
inconsistentes.
Soluo: mtodo da mxima verossimilhana
Exemplo: pag. 498 Gujarati modelo dos casos
extraconjugais de Ray Fair