Вы находитесь на странице: 1из 74

Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

Introduccin a los modelos de eleccin


discreta

Santiago A. Galln
Departamento de Matemticas y Estadstica Departamento de Economa
Grupo de Econometra Aplicada
Universidad de Antioquia, Medelln

II Escuela de Verano
Centro de Estadstica Aplicada a Estudios Socioeconmicos CEAES
Agosto 46 de 2009

logo
Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

Contenido
1 Motivacin
2 Definiciones
3 Probabilidades de eleccin
Modelo de probabilidad lineal
Modelo Logit
Modelo Probit
4 Estimacin e inferencia
5 Modelos de mltiple respuesta
Modelo logit multinomial -MNL-
Modelo logit condicional -CL-
Modelo probit multinomial -MNP-
Modelo logit anidado -NLOGIT-
Modelos multinomiales ordenados -OMM-
6 Estimacin en Stata y R
logo
7 Tpicos
Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

Contenido
1 Motivacin
2 Definiciones
3 Probabilidades de eleccin
Modelo de probabilidad lineal
Modelo Logit
Modelo Probit
4 Estimacin e inferencia
5 Modelos de mltiple respuesta
Modelo logit multinomial -MNL-
Modelo logit condicional -CL-
Modelo probit multinomial -MNP-
Modelo logit anidado -NLOGIT-
Modelos multinomiales ordenados -OMM-
6 Estimacin en Stata y R
logo
7 Tpicos
Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

Motivacin I
En la prctica se requiere explicar y predecir el comportamiento de las
decisiones que realizan los individuos.
En muchas situaciones las elecciones de los individuos son hechas
sobre un continuo de posibilidades, por ejemplo:
Cunto gastar en la compra de un bien?
Cunto trabajar?
En otras situaciones las elecciones son hechas sobre un nmero
limitado de posibilidades o alternativas elecciones discretas.
Trabajar o no trabajar
Estudiar o no estudiar
Dnde vivir?
Cul marca comprar?
Cul modo de transporte utilizar?,
Por cul candidato votar?, etctera.
El conocimiento de los determinantes de este tipo de decisiones es
importante en el diseo de polticas socioeconmicas. logo
Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

Motivacin II
Qu es un modelo discreto?
Son modelos en los cuales la variable dependiente toma valores discretos
(Maddala, 1983).

Modelos de eleccin discreta


Modelos discretos que buscan describir el proceso de comportamiento de las
elecciones de un agente (unidad) tomador(a) de decisiones entre un conjunto
de alternativas.

Tambin se conocen como:


Modelos categricos
Modelos cuantles
Modelos de eleccin discreta
Modelos de eleccin cualitativa
Modelos de respuesta cualitativa logo
Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

Aplicaciones:
Participacin laboral
Agremaciones laborales
Localizacin de firmas y lugares de trabajo
Prestamos bancarios
Finanzas
Energa
Migracin
Eleccin de modos de transporte
Compra de bienes durables
Decisiones de inversin
Investigacin de mercados
Localizacin de hogares
Matrimonios
Decisiones de nacimientos
Educacin
logo
Legislacin y votaciones
Criminologa
Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

Contenido
1 Motivacin
2 Definiciones
3 Probabilidades de eleccin
Modelo de probabilidad lineal
Modelo Logit
Modelo Probit
4 Estimacin e inferencia
5 Modelos de mltiple respuesta
Modelo logit multinomial -MNL-
Modelo logit condicional -CL-
Modelo probit multinomial -MNP-
Modelo logit anidado -NLOGIT-
Modelos multinomiales ordenados -OMM-
6 Estimacin en Stata y R
logo
7 Tpicos
Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

Definiciones, notacin y propiedades I


Unidad (individuo, familia, firma, banco,...) tomadora de decisiones,
indexada por i = 1, . . . , n.
Ci , conjunto de eleccin de la unidad conformado por Ji alternativas u
opciones, indexadas por j = 1, . . . , Ji donde las alternativas deben ser:
Mutuamente exclusivas (elegir una alternativa implica no elegir
ninguna de las dems alternativas).
Exahutivas (todas las posibles alternativas son includas).
Finitas (el conjunto de eleccin es un conjunto contable
finitamente).
xij , vector de variables observadas relacionadas con la j-sima
alternativa, conocidas como atributos, a las que se enfrenta la i-sima
unidad.
si , vector de variables observadas relacionadas con la unidad tomadora
de decisiones (constantes para las alternativas).
logo
Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

Definiciones, notacin y propiedades II


Uij , nivel de utilidad (bienestar, felicidad) de la i-sima unidad
obtenido a partir de la eleccin de la j-sima alternativa. Dicha utilidad
no es conocida por el investigador.
Bajo el supuesto de que la unidad se comporta como un agente
maximizador de su utilidad, entonces ste elige la alternativa j s y slo
s Uij > Uik , j 6= k.
Vij = V (xij , si , ), funcin observada por el investigador que
relaciona los factores observables xij y si con la utilidad de la unidad
tomadora de decisiones.
Dado que existen factores no observados por el investigador, sto es
Uij 6= Vij , entonces

Uij = Vij + ij


(1)
= V (xij , si , ) + ij

donde ij es una secuencia de variables aleatorias i.i.d. con funcin de logo

densidad, f (ij ).
Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

Definiciones, notacin y propiedades III


Probabilidad de eleccin de la j-sima alternativa, j 6= k

Pr j = Pr ij = Pr(Uij > Uik )


= Pr(Vij + ij > Vik + ik )
= Pr(ik ij < Vij Vik )
(2)
ikj < Vij Vik )
= Pr(
Z Vij Vi1 Z Vij Vi2 Z Vij ViJ
= g(ij )dij

donde ij = ( i1j , . . . , iJj )0 es un vector de dimensin (J 1), con


. . . sobre todas las alternativas excepto la j-sima alternativa; y
g(ij ) su funcin de densidad.

logo
Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

Definiciones, notacin y propiedades IV


Otra manera de derivar los modelos de eleccin discreta

yij = h(xij , , ij ) (3)

donde h() usualmente se define como h(xij , , ij ) = x0ij + ij


donde x0ij es conocida como funcin ndice.
El individuo i elige la alternativa j, s max(y i ) = yij

> 0 y no s
0
max(y i ) 0, donde y i = (yi1 , . . . , yiJ ) .

En la prctica yij es no observable (latente), para lo cual se define una
variable dummy, yij , dada por
(
j, s max(y i ) = yij
>0
yi =
0, s max(y i ) 0

logo
Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

Definiciones, notacin y propiedades V


Las probabilidades de eleccin para j = 1, . . . , J

Pr ij = Pr(yi = j|xij ) = Pr(yij > 0|xij )
= Pr(h(xij , , ij ) > 0|xij )
= Pr(x0ij + ij > 0|xij )
= Pr(ij > x0ij |xij ) (4)
= 1 F (x0ij |xij )
= F (x0ij )
= Fij

donde F es la funcin de distribucin acumulada de  (simtrica).


XJ
0 < Fij < 1, Fij = 1.
j=1

logo
Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

Modelos de eleccin binaria I

Objetivo
Modelar el comportamiento de eleccin de los individuos cuando solamente
existen dos (J = 2) alternativas.

logo
Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

Modelos de eleccin binaria II


Maximizacin de la utilidad aleatoria
Utilidades derivadas de las elecciones (j = 1, 2)

Ui1 = Vi1 + i1 = V (xi1 , s1 , ) + i1


Ui2 = Vi2 + i2 = V (xi2 , s2 , ) + i2

Probabilidades de eleccin
Pr 1 = Pr i1 = Pr(Ui1 > Ui2 )
= Pr(Vi1 + i1 > Vi2 + i2 )
= Pr(i2 i1 < Vi1 Vi2 )
= F (Vi1 Vi2 )
Pr 2 = Pr i2 = 1 Pr 1
= 1 F (Vi1 Vi2 )
logo
Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

Modelos de eleccin binaria III


Funcin ndice

yi = h(xi , , i ) = x0i + i

con yi = 1 s yi > 0 y yi = 0 s yi 0.
Probabilidades de eleccin
Pr(yi = 1|xi ) = Pr(yi > 0|xi )
= Pr(x0i + i > 0|xi )
= Pr(i > x0i |xi )
= 1 F (x0i |xi )
= F (x0i )

Pr(yi = 0|xi ) = Pr(yi 0|xi ) = 1 F (x0i ) logo


Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

Contenido
1 Motivacin
2 Definiciones
3 Probabilidades de eleccin
Modelo de probabilidad lineal
Modelo Logit
Modelo Probit
4 Estimacin e inferencia
5 Modelos de mltiple respuesta
Modelo logit multinomial -MNL-
Modelo logit condicional -CL-
Modelo probit multinomial -MNP-
Modelo logit anidado -NLOGIT-
Modelos multinomiales ordenados -OMM-
6 Estimacin en Stata y R
logo
7 Tpicos
Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

Para calcular las probabilidades de eleccin se deben evaluar las integrales


que las definen. Existen tres posibilidades:
Expresin de forma cerrada completa: Para ciertas especificaciones de
f (x0i ) la integral puede calcularse de manera exacta (expresada a
partir de una frmula de forma cerrada).
Simulacin completa: Cuando la integral no puede resolverse
analticamente, entonces sta puede aproximarse por medio de tcnicas
de simulacin
Simulacin y expresin de forma cerrada parcial: combinacin de las
anteriores.

logo
Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

Modelo de probabilidad lineal

Modelo de probabilidad lineal

Pr(yi = 1) = F (xi , ) + i
yi = x0i + i

con E(i ) = 0 y yi es una variable binaria que toma el valor de 1 si el evento


ocurre y 0 en otro caso.
El valor ajustado, yi = x0i , puede tener valores fuera del rango (0, 1).
El modelo es heterocedstico:
V ar(i |xi ) = x0i (1 x0i )2 + (1 x0i )(x0i )2
= x0i (1 x0i )
= E(yi )[1 E(yi )]

El modelo supone que la probabilidad de ocurrencia del evento siempre


es la misma ante cambios en xi .
logo
Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

Modelo de probabilidad lineal

logo
Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

Modelo de probabilidad lineal

logo
Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

Modelo Logit

Funcin logstica
Sabemos que

Pr j = Pr ij = Pr(ik ij < Vij Vik )


ikj < Vij Vik )
= Pr(

Asumiendo que ij distribuye independiente e identicamente como una


Gumbel (o de valor extremo tipo I) con f.d.p. y funcin de distribucin
dadas por:

f (ij ) = exp(ij ) exp( exp(ij ))


F (ij ) = exp( exp(ij )
entonces ikj = ik ij sigue una distribucin logistica:

exp(
ikj )
F (
ikj ) = (
ikj ) =
1 + exp(
ikj )
logo
Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

Modelo Logit

Probabilidades de eleccin logit


Despus de algunas manipulaciones algebricas (vase, Train (2003),
Maddala (1983), y Cameron y Trivedi (2005)) se tiene que:

exp(x0i )
Pr ij = F (x0i ) = (x0i ) =
1 + exp(x0i )
1
=
1 + exp(x0i )

donde la f.d.p est dada por

exp(x0i )
f (x0i ) = (x0i )[1 (x0i )] = 2
[1 + exp(x0i )]

logo
Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

Modelo Probit

Modelo Probit
Asumiendo que ij distribuye i.i.d. como una normal estndar y dado
que la diferencia entre variables aleatorias normales es normal,
entonces:
Z Vij Vik
F (Vij Vik ) = (Vij Vik ) = (
ikj )d
ikj

donde
1
f (
ikj ) = ( 2ikj /2)
ikj ) = exp(
2
Probabilidades de eleccin probit (asumiendo Vij Vik = x0i )
Z x0i
Pr ij = F (x0i ) = (x0i ) = (z)dz

donde (z) = 1 exp(z 2 /2)


2
logo
Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

Modelo Probit

logo
Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

Efectos marginales
Uno de los objetivos de los modelos de eleccin discreta consiste en
determinar los efectos marginales de los cambios de las variables
regresoras sobre la probabilidad condicional:

dF (x0i )
 
E(yi |xi )
= = f (x0i )
xi d(x0i )

Los efectos marginales difieren en el punto de evaluacin xi y con la


forma funcional F ()
Modelo Probabilidad F () Efecto marginal
Lineal x0i
exp(x0i )
Logit (x0i ) = 1+exp(x 0 ) (x0i )[1 (x0i )]
i
R x0i
Probit (x0i ) = (z)dz (x0i )

Efectos marginales promedio:


Xn
n1 f (x0i ) f (x0i ) logo

i=1
Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

Contenido
1 Motivacin
2 Definiciones
3 Probabilidades de eleccin
Modelo de probabilidad lineal
Modelo Logit
Modelo Probit
4 Estimacin e inferencia
5 Modelos de mltiple respuesta
Modelo logit multinomial -MNL-
Modelo logit condicional -CL-
Modelo probit multinomial -MNP-
Modelo logit anidado -NLOGIT-
Modelos multinomiales ordenados -OMM-
6 Estimacin en Stata y R
logo
7 Tpicos
Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

El resultado del modelo de eleccin binaria distribuye Bernoulli:

f (yi |x) = Pr i yi (1 Pr i )1yi , yi = 0, 1


= [F (x0i )]yi [1 F (x0i )]1yi

Funcin de verosimilitud
Y Y
L() = Pr(Y1 = y1 , , Yn = yn ) = F (x0i ) [1 F (x0i )]
yi =1 yi =0
Yn
= [F (x0i )]yi [1 F (x0i )]1yi
i=1

Funcin log verosimil


n
X
ln L() = {yi ln F (x0i ) + (1 yi ) ln[1 F (x0i )]}
i=1

logo
Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

ML tal que sea solucin de la ecuacin (no lineal)


n
ln L() X yi F (x0i ) 0
= 0 )[1 F (x0 )] f (xi )xi = 0
i=1
F (x i i

dF (x0i )
donde f (x0i ) = dx0i
Matriz de segundas derivadas del ln L() (Hessiana)
n 
2 ln L()

X yi 1 yi 2 0 0
= + 0 )]2 f (xi )xi xi
0 i=1
F 2 (x0 )
i [1 F (xi
n 
yi F (x0i )
X 
0 0
+ 0 )[1 F (x0 )] f (xi )xi xi
i=1
F (x i i

con esperanza
n 
2 ln L() f 2 (x0i )
  X 
E = xi x0i
0 i=1
F (x0i )[1 F (x0i )] logo
Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

Matriz de varianzas y covarianzas asinttica de ML


1
2 ln L()

V ( ML ) = E
0
n  1
X f 2 (x0i )
= xi x0i
i=1
0
F (xi )[1 F (x0i )]

a
ML es consistente y ML N (, V ( ML )).

logo
Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

Relacin entre los modelos LP, logit y probit I

Relacin entre los modelos Logit y probit

logit 1.6probit

Relacin entre los modelos LP y probit

LP 0.4probit excepto para la constante


LP 0.4probit + 0.5 para la constante

Relacin entre los modelos LP y logit

LP 0.25logit excepto para la constante


LP 0.25logit + 0.5 para la constante
logo
Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

Mtodos iterativos para la estimacin ML


Mtodo de Newton-Raphson
" #1 
2 ln L()
 
ln L()
t+1 = t
0 = t = t

Mtodo Scoring
"  #1 
2 ln L()
 
ln L()
t+1 = t E
0 = t = t

Otros mtodos:
Algortmo de Berndt-Hall-Hall-Hausman (BHHH).
Algortmo de Davidon-Fletcher-Powell (DFP).
Algortmo de Broyden-Fletcher-Goldfarb-Shanno (BFGS).

logo
Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

Medidas de bondad de ajuste e inferencia

ln L()
R2 = 1
ln L(y)
Pn n 0 0
o
i=1 y i ln F (x i ) + (1 y i ) ln[1 F (xi )]
=1
n[y ln y + (1 y) ln(1 y)]
Pn
donde y = n1 i=1 yi .
Pn
y)(Fi (x0i ) F )
i=1 (yi
yi ,Fi = Pn Pn
2 0 2
i=1 (yi y) i=1 (Fi (xi ) F )
Inferencia

H0 : Q = c

donde Q y c son una matriz y vector de constantes conocidas de


dimensiones q K y q, respectivamente. logo
Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

Para q = 1
Q c a
q tnK
QV ( ML )Q0
Para q > 1
a
W ald = (Q c)0 [QV ( ML )Q0 ]1 (Q c) 2q

a
LR = 2[ln L( ML ) ln L( CML )] 2q

donde CML denota el estimador de mxima verosimilitud restringido


obtenido de maximizar la funcin ln L sujeto a la restriccin Q = c.

logo
Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

Contenido
1 Motivacin
2 Definiciones
3 Probabilidades de eleccin
Modelo de probabilidad lineal
Modelo Logit
Modelo Probit
4 Estimacin e inferencia
5 Modelos de mltiple respuesta
Modelo logit multinomial -MNL-
Modelo logit condicional -CL-
Modelo probit multinomial -MNP-
Modelo logit anidado -NLOGIT-
Modelos multinomiales ordenados -OMM-
6 Estimacin en Stata y R
logo
7 Tpicos
Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

Modelos multinomiales
Modelos donde existen ms de dos elecciones, (J > 2).
Existen diferentes modelos de mltiple respuesta dependiendo de la
especificacin de la forma funcional de las probabilidades de eleccin y
del tipo de variables regresoras que determinan la eleccin:
1 Regresores que varan entre las alternativas para un individuo
(tiempo, color, tamao y costos,...), xij .
2 Regresores invariantes entre las alternativas (edad, gnero,
ingreso, nivel educativo,...), xi .

logo
Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

Modelo logit multinomial -MNL-

Modelo logit multinomial -MNL-


Probabilidades de eleccin
Pr ij = Pr(yi = j)
exp(x0i j )
= J
, j = 1, . . . , J
0
P
exp(xi k )
k=1

PJ
Como j=1 Pr ij = 1 se requiere de la restriccin 1 = 0 para
garantizar la identificacin del modelo.

Funcin de verosimilitud
n Y
Y J
yij
L= (Pr ij )
i=1 j=1

logo
Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

Modelo logit multinomial -MNL-

Funcin log-verosmil
n X
X J
ln L = yij ln Pr ij
i=1 j=1
n X
J
!
X exp(x0i j )
= yij ln PJ
i=1 j=1 k=1 exp(x0i k )

l,MNL tal que sea solucin de la ecuacin (no lineal)

n J
ln L X X yij Pr ij
=
l i=1 j=1
Pr ij l
n
X
= (yil Pr il )xi = 0, l = 1, . . . , J
i=1

logo
Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

Modelo logit multinomial -MNL-

Matriz de segundas derivadas


n X J
2 ln L X Pr ij
0 = xi
j l i=1 j=1
0l
n
X
= Pr ij (ijl Pr il )xi x0i , j, l = 1, . . . , J.
i=1

donde ijl = 1 s j = l y ijl = 0 s j 6= l.


MNL es consistente y
  2 1 !
a ln L
MNL N , E
0

logo
Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

Modelo logit multinomial -MNL-

Efectos marginales
J
Pr ij exp(x0i j ) exp(x0i j ) X
= J j  2 exp(x0i k ) k
xi J

exp(x0i k )
P
exp(x0i k ) k=1
P
k=1 k=1
J
X
= Pr ij j Pr ij Pr ik k
k=1

= Pr ij j i
PJ
donde i = k=1 Pr ik k

logo
Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

Modelo logit condicional -CL-

Modelo logit condicional -CL-

Pr ij = Pr(yi = j)
exp(x0ij )
= J
, j = 1, . . . , J
exp(x0ik )
P
k=1

logo
Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

Modelo logit condicional -CL-

Funcin de verosimilitud
n Y
Y J
yij
L= (Pr ij )
i=1 j=1

Funcin log-verosmil
n X
X J
ln L = yij ln Pr ij
i=1 j=1
n X
J
!
X exp(x0ij )
= yij ln PJ
i=1 j=1 k=1 exp(x0ik )

logo
Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

Modelo logit condicional -CL-

CL tal que sea solucin de la ecuacin (no lineal)


n J
ln L X X yij Pr ij
=
i=1 j=1
Pr ij
n X J
X yij
= Pr ij (xij xi )
i=1 j=1
Pr ij
n X
X J
= yij (xij xi ) = 0
i=1 j=1

PJ
donde xi = k=1 Pr ik xik

logo
Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

Modelo logit condicional -CL-

Matriz de segundas derivadas


n X J
2 ln L X xi
0 = yij 0
i=1 j=1

n X
X J
= Pr ij (xij xi )(xij xi )0
i=1 j=1

CL es consistente y
  2 1 !
a ln L
CL N , E
0

logo
Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

Modelo logit condicional -CL-

Efectos marginales

Pr ij exp(x0ij ) exp(x0ij ) 0
= J  2 exp(xij )
xij J
exp(x0ik )
P
exp(x0ik )
P
k=1 k=1
= Pr ij (1 Pr ij )

Pr ij exp(x0ij ) 0
=  2 exp(xil )
xil J
exp(x0ik )
P
k=1
= Pr ij Pr il

logo
Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

Modelo logit condicional -CL-

Independencia de las alternativas irrelevantes -IIA-


Razones (cocientes) de disparidad (Odds ratio)
PJ
Pr ij exp(x0ij )/ j=1 exp(x0ij )
= PJ
Pr ik exp(x0ik )/ j=1 exp(x0ij )
exp(x0ij )
=
exp(x0ik )
= exp(x0ij x0ik )

Interpretacin: cuntas veces es ms probable de que ocurra el evento


yi = j relativo al evento yi = k.
Los cocientes de disparidad tiene la propiedad de no afectarse en
presencia de alternativas adicionales o del cambio en los atributos de las
dems alternativas = Propiedad de independencia de las alternativas
irrelevantes -IIA-
Esto se debe al supuesto de independencia de ij . logo
Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

Modelo logit condicional -CL-

Ejemplo
Supngase que un individuo es indiferente entre las opciones de viajar
en auto o en bus (de color azul): Pc = Pba = 1/2 Pc /Pba = 1.
Ahora supngase que hay una nuevo bus (de color rojo) y que el
individuo considera ambos buses iguales tal que: Pba /Pbr = 1.
En el modelo logit los cocientes entre las probabilidades son iguales
independientemente de la presencia o no de otra alternativa, as las
nicas probabilidades para las cuales Pc /Pba = 1 y Pbr /Pba = 1 son
Pc = Pba = Pbr = 1/3.
En la vida real se esperara que el cociente Pba /Pc cambie con la
introduccin de una nueva alternativa (bus de color rojo). Supngase
que el individuo es indiferente de viajar en carro o bus Pc = Pb = 1/2
y que es indiferente de entre el bus azul o rojo Pba = Pbr = 1/4. Esto
implica que Pba /Pbr = 1 y Pba /Pc = (1/4)/(1/2) = 1/2, violando el
supuesto IIA.

logo
Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

Modelo probit multinomial -MNP-

Modelo probit multinomial -MNP-


Funcin de densidad multivariada de i = (i1 , . . . , iJ )0 con media
cero y matriz de varianzas y covarianzas , i N (0, ):
1/2
f (i ) = (i ) = (2)J/2 || exp 12 0i 1 i
 

donde || es el determinante de .
Probabilidad de eleccin de la j-sima alternativa, j 6= k

Pr ij = Pr(Uij > Uik )


= Pr(Vij + ij > Vik + ik )
= Pr(ik ij < Vij Vik )
ikj < Vij Vik )
= Pr(
Z Vij Vi1 Z Vij Vi2 Z Vij ViJ
= g(ij )dij

i1j , . . . , iJj )0 vector de dimensin (J 1) y funcin de


con ij = ( logo

densidad g(ij ).
Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

Modelo probit multinomial -MNP-

Modelo probit multinomial -MNP-


Como la diferencia de normales es normal, entonces
Z Vij1 Z VijJ
1/2
Pr ij = (2)(J1)/2 |j | exp 21 z 0i 1
 
j z i dz

donde Vijk = Vij Vik , k = 1, . . . , J (k 6= j), y j es la matriz de


varianzas y covarianzas de ij de dimensin (J 1).
Con el fin de facilitar el clculo de las probabilidades y asegurar la
identificacin de los parmetros se requiere de la imposicin de
restricciones sobre j (estructuras de varianza).
Train (2003) propone un procedimiento de normalizacin fijando la
varianza de una de las diferencias de los errores con respecto a la
alternativa j, ikj = ik ij . Usualmente se asumen las diferencias
con respecto a la primera alternativa, ik1 = ik i1 .
La reduccin del nmero de parmetros es una normalizacin que
elimina aspectos irrelevantes de la matriz . logo
Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

Modelo probit multinomial -MNP-

Ejemplo
J = 3 con errores i = (i1 , i2 , i3 )0 y matriz de varianzas y
covarianzas

11 12 13
= 12 22 23
13 23 33
Considrese la probabilidad de elegir la alternativa j = 1:
Pr(i2 i1 < Vi1 Vi2 y i3 i1 < Vi1 Vi3 ), entonces
 
11 + 22 212
1 =
11 13 12 + 23 11 + 33 213
Normalizacin
" #
1
1 = (11 13 12 +23 ) 11 +33 213
(11 +22 212 ) (11 +22 212 )
logo
Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

Modelo logit anidado -NLOGIT-

Modelo propuesto por McFadden (1978) para relajar el supuesto de


independencia de las alternativas irrelevantes -IIA- de los modelos
multinomiales logsticos (logit multinomial y logit condicional).
Modelo apropiado cuando el conjunto de alternativas puede
particionarse en subconjuntos, llamados nidos (nests). Es decir, cuando
existe una clara estructura de anidacin que consiste en:
1 En un primera etapa, el individuo elige entre un conjunto de eleccin
conformado por L alternativas indexadas por l = 1, , L.
2 Luego, condicionado a la eleccin de la l-sima alternativa, el individuo
elige entre un conjunto de eleccin conformado por Jl alternativas
indexadas por j = 1, , Jl (conjunto de alternativas anidadas en la
l-sima alternativa).
3 Y as sucesivamente...
La estructura de anidacin se acostumbra ilustrarla por medio de un
diagrama de rbol de decisiones.

Diagrama de rbol de decisin con dos niveles de anidacin


logo
Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

Modelo logit anidado -NLOGIT-

Eleccin
z }| {
1 l L
z }| { z }| { z }| {
1 J1 1 Jl 1 JL
Propiedades:
1 Para cualquier par de alternativas que pertenecen al mismo nido, el
cociente de las propabilidades es independiente de los atributos o
existencia de todas las otras alternativas. Es decir, el supuesto de IIA se
cumple dentro de cada nido.
2 Para cualquier par de alternativas en diferentes nidos, el cociente de las
propabilidades puede depender de los atributos de las otras alternativas en
los dos nidos. Es decir, en general el supuesto de IIA no se cumple para
alternativas en diferentes nidos.

logo
Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

Modelo logit anidado -NLOGIT-

Modelo logit anidado -NLOGIT-


Utilidad de la i-sima unidad obtenida a partir de la eleccin de la
j-sima alternativa perteneciente a la l-sima eleccin (nido).

Uijl = Vijl + ijl


= (x0ij|l l + z 0il ) + ijl , j = 1, . . . , Jl , l = 1, . . . , L.

donde i sigue una f.d. conjunta de valor extremo generalizada (GEV):


l
X L XJl
F (i ) = exp exp {ij /l }

l=1 j=1

l mide el grado de independencia entre los componentes no


observados de la utilidad para alternativas dentro del l-simo nido.
1 l puede emplearse como una medida de correlacin.
Cuando l = 1, l implica completa independencia entre todas las
alternativas en todos los nidos. logo
Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

Modelo logit anidado -NLOGIT-

Modelo logit anidado -NLOGIT-


Probabilidad conjunta de que la i-sima unidad elija la j-sima
alternativa perteneciente a la l-sima eleccin

Pr ijl = Pr ij|l Pr il , j = 1, . . . , Jl , l = 1, . . . , L

Probabilidad de eleccin de la alternativa j condicionada a la eleccin l

Pr ij|l = Pr(yi = j|l)


exp(x0ij|l l /l )
= Jl
, j = 1, . . . , Jl , l = 1, . . . , L
exp(x0ik|l l /l )
P
k=1

Probabilidad (marginal) de eleccin de la alternativa l

Pr il = Pr(yi = l)
exp(z 0il + l Iil )
= L
, l = 1, . . . , L logo

exp(z 0im + m Iim )


P
m=1
Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

Modelo logit anidado -NLOGIT-

Modelo logit anidado -NLOGIT-


nP o
Jl 0
Iil = ln k=1 exp(x
ik l / l ) son los valores inclusivos para la
categora l.
Iil relaciona las probabilidades marginal y condicional trayendo
informacin desde la probabilidad condicional hacia la probabilidad
marginal.
l Iil tiene la interpretacin de la utilidad esperada que el i-simo
individuo recibe de la eleccin entre las alternativas en el nido l.

logo
Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

Modelos multinomiales ordenados -OMM-

Modelo multinomial ordenado


Modelos en los cuales existe un ordenamiento de la variable
dependiente (discreta).
Aplicaciones:
Clasificacin del riesgo de activos financieros (bajo, medio y
alto riesgo).
Calificacin de instituciones financieras (AAA, AAB, AA2,
A, BBB, B,...)
Test de gustos.
Encuestas de opinin (niveles de satisfaccin).
Nivel de habilidades laborales.
Nivel de cubrimiento de programas sociales.

logo
Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

Modelos multinomiales ordenados -OMM-

Modelo multinomial ordenado


El punto de partida de los modelos multinomiales ordenados es el
modelo de variable latente:

yi = x0i + i

Para J alternativas se define la variable

yi = j s j1 < yi j , j = 1, . . . , J.

donde j son parmetros de umbral con 0 = y J = .


Probabilidades de eleccin
Pr(yi = j) = Pr(j1 < yi j )
= Pr(j1 < x0i + i j )
= Pr(j1 x0i < i j x0i )
= F (j x0i ) F (j1 x0i )
logo

donde F () es la funcin de distribucin acumulada de i .


Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

Modelos multinomiales ordenados -OMM-

Modelo logit ordenado


Probabilidades de eleccin
Pr(yi = j) = F (j x0i ) F (j1 x0i )
= (j x0i ) (j1 x0i )
exp(j x0i ) exp(j1 x0i )
=
1 + exp(j x0i ) 1 + exp(j1 x0i )

donde () es la funcin de distribucin acumulada logstica.

Modelo probit ordenado


Probabilidades de eleccin
Pr(yi = j) = F (j x0i ) F (j1 x0i )
= (j x0i ) (j1 x0i )

donde () es la funcin de distribucin acumulada normal estndar. logo


Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

Modelos multinomiales ordenados -OMM-

logo
Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

Modelos multinomiales ordenados -OMM-

La funcin ln L(, 1 , . . . , J1 ) es
n X
X J
ln L(, ) = Ij (yi ) ln Pr ij
i=1 j=1
n X
X J
= Ij (yi ) ln [F (j x0i ) F (j1 x0i )]
i=1 j=1

donde (
1, s yi = j;
Ij (yi ) =
0, en otro caso
Efectos marginales

Pr(yi = j)
= [f (j1 x0i ) f (j x0i )]
xi
donde f (z) = dF (z)/dz
logo
Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

Contenido
1 Motivacin
2 Definiciones
3 Probabilidades de eleccin
Modelo de probabilidad lineal
Modelo Logit
Modelo Probit
4 Estimacin e inferencia
5 Modelos de mltiple respuesta
Modelo logit multinomial -MNL-
Modelo logit condicional -CL-
Modelo probit multinomial -MNP-
Modelo logit anidado -NLOGIT-
Modelos multinomiales ordenados -OMM-
6 Estimacin en Stata y R
logo
7 Tpicos
Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

Comandos de Stata:
logit, logistic: Modelo logit
probit: Modelo probit
clogit: Modelo logit condicional
mlogit: Modelo logit multinomial
asmprobit, amprobit: Modelo probit multinomial
nlogit: modelo logit anidado
ologit: modelo logit ordenados
oprobit: modelo probit ordenados
Paquetes de R:
stats: incluye los modelos logit y probit
mlogit: Modelo logit multinomial y logit condicional
MNP: Modelo probit multinomial y probit ordenado
Otros software: Limdep, SAS, DCM bajo Ox, Eviews, etc.

logo
Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

Factores de riesgo asociados con el bajo peso al nacer


189 observaciones, n = 189.
Variables:
1 Peso al nacer (low): peso < 2500 gramos (low =1) y peso 2500
gramos (low = 0)
2 Raza (race): blanca (race = 1), negra (race = 2), u otra (race = 3)
3 Edad de la madre (age)
4 Peso ltimo perido mestrual (lwt)
5 Fum durante el embarazo (smoke)
6 Historia laboral prematura (ptl)
7 Historia de hipertensin (ht): s (ht = 1) y no (ht = 0)
8 Irritabilidad uterina (ui): s (ui = 1) y no (ui = 0)
Modelo especificado

Pr ij =F (age agei + lwt lwti + smoke smokei + ptl ptli + ht hti


+ ui uii + race2 di,race=2 + race3 di,race=3 )

logo
Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

Determinantes de tener carro propio


437 observaciones, n = 437.
Variables:
1 Carro propio (owncar): 1 s el estudiante tiene carro propio
2 Edad del estudiante (age)
3 Ingreso mensual (income)
4 Gnero (male): masculino (male = 1) y femenino (male = 0)
Modelo especificado

Pr ij =F (income incomei + age agei + male malei )

logo
Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

Eleccin de modos de transporte


Anlisis de eleccin de modos de transporte para viajar entre Sydney y
Melbourne, Australia (Hensher y Greene, 1995).
210 observaciones, n = 210.
Modos de transporte (J = 4 alternativas): aire, tren, bus o carro.
Variables:
1 Eleccin de transporte (Mode)
2 Medida de costo generalizado del viaje (GC).
3 Costo en el vehculo (INVC).
4 Tiempo de espera en el terminal de transporte, 0 para el carro (TTME).
5 Tiempo de viaje (INVT).
6 Ingreso familiar (HINC).

logo
Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

Eleccin de modos de transporte


rbol de decisin de dos niveles

Modelo especificado
Uij =avin di,avin + tren di,tren + bus di,bus
+ GC GCij + TTME TTMEij + HINC di,aire HINCi + ij
donde di,j son constantes correspondientes a las elecciones.
logo
Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

Eleccin de restaurantes
Anlisis de eleccin de tipos de restaurantes.
Tipos de restaurantes (L = 3 alternativas): restaurantes de comida
rpida, restaurantes familiares y restaurantes lujosos.
300 familias, n = 210 para 3100 observaciones (n L).
Variables:
1 Variable identificadora de la familia (id)
2 Eleccin (chosen): s (chosen = 1) y no (chosen = 0)
3 Elecciones de restaurantes (restaurant)
4 Ingreso familiar (income).
5 Costo promedio de la comida por persona (cost).
6 Nmero de nios en la familia (kids).
7 Calificacin en la gui de restaurantes locales (rating).
8 Distancia entre el hogar y el restaurante (distance).

logo
Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

Eleccin de restaurantes
rbol de decisin de dos niveles

Modelo especificado
Pr(restaurant|type) = Pr(cost cost + rating rating + distance distance)
Pr(type) = Pr(iFast incFast + iFancy incFancy + kFast kidFast
+ kFancy kidFancy + fast Ifast + family Ifamily + fancy Ifancy ) logo
Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

Registro de reparacin de autos


66 observaciones, n = 66.
Variables:
1 Registro de reparacin en 1977 (rep77): poor, fair, average, good
y excellent.
2 Nacionalidad del auto (foreign): domstico (foreign = 0) y extranjero
(foreign = 1)
3 Variable proxy del tamao del vehculo (length)
4 Millas por galn (mpg)
Modelo especificado
Pr(yi = j) = Pr(j1 < yi j )
= Pr(j1 < fore foreign + length length + mpg mpg + i j )

logo
Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

Contenido
1 Motivacin
2 Definiciones
3 Probabilidades de eleccin
Modelo de probabilidad lineal
Modelo Logit
Modelo Probit
4 Estimacin e inferencia
5 Modelos de mltiple respuesta
Modelo logit multinomial -MNL-
Modelo logit condicional -CL-
Modelo probit multinomial -MNP-
Modelo logit anidado -NLOGIT-
Modelos multinomiales ordenados -OMM-
6 Estimacin en Stata y R
logo
7 Tpicos
Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

Tpicos I
Modelos multivariados
Panel de datos
Modelos de funcin ndice no lineal
Modelos de coeficientes aleatorios
Modelos discretos-continuos
Modelos de autoseleccin
Modelos truncados y censurados
Modelos de supervivencia (modelos de duracin)
Modelos semi y no paramtricos
Modelos de conteo

logo
Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

Bibliografia I

Amemiya, T., 1985.


Advanced Econometrics
Harvard University Press.
Cameron, C. and P. Trivedi, 2005.
Microeconometrics: Methods and Applications
Cambridge University Press.
Gourieroux, C. and P. Klassen, 2000.
Econometrics of Qualitative Dependent Variables
Cambridge University Press.
Hensher, D., J. Rose and W. Greene, 2005.
Applied Choice Analysis: A Primer
Cambridge University Press.
Maddala, G.S. 1983.
Limited-Dependent and Qualitative Variables in Econometrics
Cambridge University Press, Cambridge
McFadden, D. and Manski, C. (Editors), 1981.
Structural Analysis of Discrete Data and Econometric Applications logo
Cambridge: The MIT Press.
Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

Bibliografia II
Train, K., 1986.
Qualitative Choice Analysis: Theory, Econometrics, and an Application to Automobile
Demand
Cambridge: The MIT Press.
Train, K., 2003.
Discrete Choice Methods with Simulation
Cambridge University Press.
Amemiya, T., 1981.
Qualitative Response Models: A Survey
Journal of Economic Literature, 19, 1483-1536.
McFadden, D., 1974.
Conditional Logit Analysis of Qualitative Choice Behaviour
in P. Zarembka (ed.), Frontiers in Econometrics, 105-142, Academic Press: New York.
McFadden, D., 1978.
Modeling the Choice of Residencial Location
in A. Karlqvist, L. Lundqvist, F. Snickars, and J. Weibull (eds.), Spacial Interaction
Theory and Planning Models, 75-96, North-Holland: Amsterdam.
logo
Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

Bibliografia III
McFadden, D., 1984.
Econometric Analysis of Qualitative Response Models
in: Z. Griliches and M. Intriligator. (eds.), Handbook of Econometrics, Vol. 2,
Amsterdam: North-Holland
McFadden, D., 2001.
Economic Choices
American Economic Review, 91, 351-378.

logo
Motivacin Definiciones Probabilidades de eleccin Estimacin e inferencia Modelos de mltiple respuesta Estimacin en Stata y R Tpicos

GRACIAS!!!

logo

Вам также может понравиться