Вы находитесь на странице: 1из 28

11.

EconometradeVariablesDiscretas

11.1.Introduccin
Losfenmenos estudiadoseneconoma porlogeneraltienen quevercon situaciones que pueden modelarse desde el punto de vista cuantitativo y cualitativo. Por ejemplo, las observaciones sobre los precios de un bien y sus cantidades transadas en el mercado pueden ser usadas para estimar una ecuacin de demanda del bien que sirva para la estimacin del excedente del consumidor. Este tipo de variables por lo general son de naturaleza continua. Sin embargo, los fenmenos econmicos tambin pueden ser de naturaleza cualitativa. As, para estimar la demanda por sitios de recreacin o para analizar el mercado laboral, los economistas han recurrido a modelos donde emplean variables de tipo discreto tales comoocupacin,educacinyotrasvariablessocioeconmicasquetienen comoobjetivolacategorizacindeestosfenmenos. El siguiente escrito presenta la descripcin general de los aspectos a considerar y los tipos de modelos ms utilizados en los trabajos relacionados con el uso de variables discretas de acuerdo con Maddala (1997).

11.2.ModelosconVariablesDependientesCualitativas
Se dice que una variable Y es discreta si toma valores enteros, Y Z = {0, 1, 2, 3, 4, ...., n}. Por consiguiente, los modelos de regresin discreta son modelosenloscualeslavariabledependienteasumevaloresdiscretos.En la forma ms simple de estos modelos la variable Y es llamada binaria1. Ejemplos: LavariableYtomaelvalorde1sielindividuoespartedelafuerza laboraly0deotramanera.

1 Una variable binaria asume solamente dos valores, 0 o 1. Estas variables tambin son llamadas en la literatura, variables discretas o dicotmicas.

222

La variable Y toma el valor de 1 si el individuo esta asociado a un sindicatoy0deotramanera. Existen otras situaciones en las que Y puede asumir ms de dos valores. Enestecasolavariabledependienteseclasificaen: 1.VariablesCategricas 2.VariablesNoCategricas Como ejemplos de variables categricas se puede mencionar el caso en que Y representa a individuos categorizados segn diferentes niveles de ingreso,esdecir: Y=1,sielindividuoganamenosde$10000. Y=2,sielindividuoganaentre$10000y$30000. Y=3,sielindividuoganamsque$30000. Como ejemplo de variables no categricas se tiene el caso en que Y representa el nmero de patentes de una compaa en un ao. Aqu se asume que lavariable tomalos valores de0,1, 2, 3 ...,n;pero Y no esuna variablecategrica,sinodiscreta. Lasvariablescategricasasuvezseencuentranclasificadasen: 2.1. NoOrdenadas. 2.2. Secuenciales. 2.3. Ordenadas En las variables categricas no ordenadas podemos definir la variable en cualquier orden que deseemos. Como ejemplo se puede mencionar el casoenquelavariableYtomalossiguientesvalores: Y=1,sielmododetransporteesautomvil. Y=2,sielmododetransporteesautobs. Y=3,sielmododetransporteestren. Un ejemplo de variables categricas secuenciales es el caso en que Y puedetomarlosvalores:

223

Y=1,selindividuonohaterminadosecundaria. Y=2,sielindividuotienesecundariaperonoacompletadouniversidad. Y=3,sielindividuotieneuniversidadperonoarealizadopostgrado. Y=4,sielindividuotienepostgrado. Es decir que en este caso se tiene en cuenta la secuencia de la variable. El individuonopuedeestarenuniversidadsinantespasarporsecundaria. En estudios relacionados con mercadeo, a menudo se miden preferencias de productos por medio de una escala: 1, 2, 3, 4, 5. El siguiente es un ejemplodevariablecategricaordenada: Y=1,sinogustaintensamente. Y=2,sinogustamoderadamente. Y=3,siesneutral. Y=4,sigustamoderadamente. Y=5,sigustaintensamente. Otroejemplodevariablecategricaordenadaeselcasoenquelavariable Y representa los gastos en automviles para un conjunto de personas, es decir: Y=1,sielindividuogastamenosde$1000. Y=2,sielindividuogastamsque$1000ymenosque$2000. Y=3,sielindividuogastamsque$2000ymenosde$4000. Y=4,sielindividuogastamsque$4000.

11.3.ModelosdeRegresinTruncados
Incrementando el nivel de complejidad del tema, en los estudios econmicos relacionados con variables cualitativas se pueden tener modelostruncados.Eltrminoregresintruncadaestarelacionadoconla consideracin de modelos cuya variable dependiente esta limitada en un rango de valores. Como ejemplo, asumamos el siguiente modelo en el cualelniveldeingresosparaunconjuntodepersonasestaenfuncindel niveldeeducacin,delaedadydelaexperiencia.

224

Ingreso=f(educacin,edad,experiencia)(11.1)

En este modelo se asume que la variable dependiente se encuentra restringida en sus valores hasta cierto punto. El planteamiento de un modelo economtrico en donde el ingreso se encuentre dependiendo del niveldeeducacinestaradadocomo: Yi = X i + u i Conuigualaltrmino delerrordistribuidonormalmente con media cero yvarianza2.ParaestecasoYiesobservado,slosiYic,dondecesuna constante dada. Es decir, s Yi c implica que Xi + ui c ui c Xi . Para este caso E(ui |ui c Xi) es diferente de cero, esto implica que los errores estn correlacionados con la variable explicativa (ui esta en funcin de Xi), por lo tanto utilizar estimadores de Mnimos Cuadrados Ordinarios (MCO) no resulta aconsejable, ya que se obtendran estimacionessesgadaseinconsistentesparaloss. El resultado de esto es que E(ui| ui c Xi) decrecer a medida que aumente Xi, y s se espera positivo, como en el caso del ejemplo mencionado antes se tendran unos s por MCO sesgados subestimados. Es decir, el efecto de la educacin sobre el ingreso estara subestimndose. Las principales causas del sesgamiento de los s con MCOson: 1. Elaumentodeltruncamientodelavariabledependiente. 2. La clasificacin de observaciones sobre la base de los valores de la variabledependiente. 3. La agregacin de observaciones sobre la base de los valores de la variabledependiente. En estos modelos tenemos una variable dependiente continua pero solo miramos un rango. Por ejemplo, nos puede interesar nicamente las observaciones de ingreso que estn por encima (o por debajo) de la lnea depobrezac:Y*=x+ucuandoY*>c.CuandoY*=c,entoncessabemos queY*c.

225

Ingreso Y Senda Y/X Lnea de Pobreza c X Grfica 11.1: Modelos de Regresin Truncados Para el ejemplo anterior podemos ilustrar la funcin de distribucin normaltruncada: Funcin de Distribucin Normal Y*/X c Funcin de Distribucin Normal Trucada en c Grfico 11.2: Distribuciones del Error Sin y Con Truncamiento

226

Asumimosque: uiN(0,2) Y*N(Xi,2) Entonces,

Prob(Xi+ui>c)=Prob(ui>cXi)= 1

c Xi

Donde, (.) es la funcin de distribucin de la normal estndar. La funcindedensidaddelafuncinnormaltruncada,estadadapor: 1 Y * X i f (Y * > c) = c X I 1 Donde, es la funcin de densidad de la distribucin normal estndar. Con, (c Y* +). La funcin de verosimilitud para este modelo, nos da laprobabilidaddeobservarlamuestraparticularyestadadapor: 1 Y * X i n 2 L( X i , , y1 , y 2 ,......, y n ) = c X i =1 i 1

11.4.ModelosdeRegresinCensurados
Este caso se presenta cuando en un conjunto de observaciones, una parte de la muestra se encuentra concentrada alrededor de un valor. Un ejemplo, podra ser el caso de una encuesta dirigida a familias preguntando cul es su gasto en automviles o bienes durables. Algunas deestasfamiliasreportancerogastos,mientrasqueotraspuedenreportar algn nivel de gasto en este tipo de bienes. Esto conducir a dos situaciones: 1.Lapresenciadeunampliorangodevariacin. 2.Laconcentracindeobservacionesalrededordecero. Cuando la variable dependiente esta censurada, entonces los valores de unciertorangosetransformaenunvalornico.Tobin(1958),analizaeste problemaypresentaelsiguientemodeloderegresin:

227


Y = X + u si Y f 0 Y = 0 de otra manera

Donde, Y es el nivel de gasto proporcionado por el individuo y X representa a un conjunto de variables explicativas. Una manera alternativadeformularelmodeloes: Y = X + u Y * = Z + v Donde,YeselgastoproporcionadoporelindividuoyY*eselumbralde gasto, es decir, el precio ms barato del bien aceptable para el individuo. Porconsiguiente,losgastosobservadosson:
Y siY f Y * 0 de otra manera

En la segunda formulacin Y* no necesariamente es cero y puede variar deindividuoaindividuo. Green(2000),mencionaotrosestudiosempricosdondeseutilizandatos censurados:2 1. Nmeroderelacionesextramaritales. 2. Nmerodehorastrabajadasporunamujerenlafuerzadetrabajo. 3. Nmerodearrestosdespusdeliberacionesdeprisin. 4. Gastodehogaressobrevariosgruposdebienes. 5. Gastosenvacaciones. Enestosmodelosseutilizandatoscensuradosparaanalizarlavariable dependientequeesigualaceroparaunaproporcinsignificantedelas observaciones.

Ver Green (2000), Chapter 20, Limited Dependent Variables and Duration Models. Pp 959-966.

228

11.5.VariablesDicotmicasEndgenas
Esta situacin se presenta cuando una variable discreta exgena en un modelo, en realidad es endgena debido a causas del estudio. Esto origina un problema de auto selectividad. Un ejemplo de esto puede ser el caso en que se necesite estimar el efecto de los sindicatos sobre el salariodelostrabajadores,esdecir: Salario=f(edad,sexo,raza,educacin) Yenfuncindeunavariabledicotmica(D)quesedefinecomo: D=1,sielindividuoestaasociadoaunsindicato. D=0,deotramanera. En este caso, la variable discreta es exgena. Este no es el mejor mtodo debido a que la variable discreta no es exgena sino por el contrario endgena. En trminos del ejemplo, la decisin de estar asociado a un sindicatodependedelagananciaesperadadeestehecho. Otroejemplomuycuriosoacercadevariablesendgenas,eselcasodelos estudios de demanda por viviendas, en donde es usual el estudio por separado de la demanda de viviendas ocupadas por propietarios y la demanda de viviendas ocupadas por arrendatarios. Este caso tambin se puede estudiar por medio del planteamiento de una regresin de gastos en vivienda, eliminando la renta para el caso de propietarios que ocupen suvivienda,enfuncindeunconjuntodevariablesexplicativasydeuna variablediscretadefinidacomo: D=1,sielocupantedelaviviendaespropietariodeella. D=0,deotramanera. Este es un caso tpico de autoselectividad. Algunos individuos son propietarios de las viviendas y otros eligen rentarla. En la funcin de demanda esta eleccin debera ser tomada en cuenta. Otros ejemplos en quesepuedepresentaresteproblemason: Efectosdelegislacionesjustassobreelempleo. Leyesdeatencinobligatoriaaescuelas.

229

Retornosoriginadosdetenereducacinuniversitaria.

11.6.ModelosAplicados
Para estos casos se han aplicado un amplio rango de modelos de variables dependientes limitadas. Nerlove y Press (1973, 1976), discutieron la aplicacin de modelos loglineal multivariados. McFadden (1974), por otra parte, es uno de los pioneros en aplicar el modelo LOGIT condicionalaestetipodecasos.

11.7.FormasFuncionalesSugeridasparaDistribucionesde Probabilidad
1. DistribucinLogstica:Estaesladistribucinacumulativadeuna distribucinhiperblicasecantecuadrada(sech2)cuyafuncinde densidadestadadapor:
f (u ) = eu du con < u < (1 + e u ) 2

Lafuncindedistribucinacumulativaes:
F (Z ) = eZ 1+ eZ

Lacualeslafuncinlogstica. 2. DistribucindeCauchy:Lafuncindedensidadparaestadistribucin es:


f (u ) = 1 1+ u2 .
230

Lafuncindedistribucinacumulativaes:
F (Z ) = 1 1 + tan 1 Z 2

Laformageneraldef(u)es:
f (u ) =

[1 + ( x ) / ]2

3.DistribucindeBurr:Sufuncindedensidadestadadapor:
f (u ) = cku c 1 con (c, k > 0, u > 0) (1 + u c ) k +1

Ylafuncindedistribucinacumulativaiguala:
F (Z ) = 1 1 con (c, k > 0) (1 + Z c ) k

Esta distribucin presenta la ventaja de que se pueden manejar variables aleatorias que solo presentan valores positivos. Con las distribuciones normales y logsticas uno puede manejar tales variables considerando transformaciones logartmicas adecuadas, es decir, asumiendo que el log de u en lugar de u, tiene una distribucin normal o hiperblica secante cuadrada (sech2). Otras alternativas factibles, son las distribuciones gamma, beta y Weibull cuyas funciones de densidad se describen a continuacin: 4.DistribucinGamma: P x P 1 f (v ) = e x ,x 0
( P )

5.DistribucinBeta: Paravaloresentre0yc>0,

231

( + ) x f ( x) = ( ) ( ) c

x 1 c

1 c

6.DistribucinWeibull:

f ( x ) = x 1 e x con x > 0 ,,>0


Se pueden obtener resultados similares con modelos Logit y Probit, para el caso de muestras grandes y con observaciones que ejercen una gran influenciasobrelacoladeladistribucin. AlcompararlosresultadosdelosmodelosLogityProbitsetiene: En el Probit, suponemos una distribucin normal estndar con varianza igual 1, mientras que en el Logit la varianza de la sech2 es 2/3. Al multiplicar los coeficientes Logit por (3/)1/2 se obtienen coeficientes comparables con los coeficientes estimados a partir del modelo Probit. Amemiya(1981),recomiendamultiplicarloscoeficientesLogitpor1/1.6 0.625paraobtenercoeficientescomparablesconlosdelmodeloProbit. Enlassiguientesseccionesveremosqueconelfindecompararelmodelo deprobabilidadlinealconelmodeloLogit,semultiplicanloscoeficientes del modelo Logit por 0.25, excepto los coeficientes de las variables discretas. Si se quiere comparar la constante y las discretas, los coeficientessemultiplicanpor0.25yselesuma0.5. Las comparaciones entre modelos se realizan para ver si el modelo es estable. En el caso de una variable, no existe mucha diferencia entre la distribucin acumulativa normal y logstica. Pero para el caso de distribuciones de dos variables y de mltiples variables, la funcin de distribucin logstica multivariable tiene propiedades ms restrictivas quelanormalmultivariables.
232

11.8.ModelosdeProbabilidadLineal
Este trmino es utilizado para denotar un modelo de regresin en el cual la variable dependiente Y es una variable discreta tomando el valor de 1 seleventoocurrey0deotramanera.Ejemplos: Compradebienesdurablesenunaodado. Participacinenlafuerzadetrabajo. Ladecisindecasarse. Ladecisindetenerhijos. Supongaelsiguientemodeloderegresin: Supongaelsiguientemodeloderegresin: Y = X i + ui Con E(ui) = 0 y con la probabilidad de ocurrencia del evento dado Xi, E(Yi/Xi)=Xi.ElYestimadoseralaprobabilidadestimadadeocurrencia del evento dado un valor particular de X. En la prctica estas probabilidades estimadas pueden resultar por fuera del rango permisible [0, 1]. En este modelo la probabilidad de ocurrencia de un evento y el errorestadadocomo: ProbabilidaddeOcurrenciadelEvento Errorui f(ui) 1 X i X i
X i

(1 X i )

Dondelavarianzadeltrminoaleatorioestardadapor:

Var ( u i ) = X i (1 X i ) 2 + (1 X i )( X i ) = X i (1 X i ) = E (Y i )[1 E (Y i ) ]

Debido al problema de heterocedasticidad, la estimacin de por MCO noeseficiente.Goldberger(1964),sugiereelsiguienteprocedimiento: Calcular,


(1 Y ) 1/ 2 wi = Y i i

233

Para luego regresar Yi/wi en funcin de Xi/wi, es decir, utilizar mnimos cuadradosponderados.Esteprocedimientopresentaalgunosproblemas: (1 Y ) , en la prctica puede ser negativo, aunque en muestras 1. Y i i grandes la probabilidad de que esto pase es muy pequea. (1 Y ) es un estimador McGillivray (1970) ha demostrado que Y i i
) 1 E (Y ) . consistentede E (Y i i

2. Debido a que los residuos no estn obviamente distribuidos de manera normal, el mtodo de MCO no es completamente eficiente. ExistenprocedimientosnolinealesmseficientesqueelMCO. 3. La crtica ms importante es que la formulacin de E(Yi/Xi) pueda ser interpretada como la probabilidad de ocurrencia de un evento. En muchoscasoselE(Yi/Xi)salefueraderango(0,1).

11.9.ModelosProbityLogit
Goldberger (1964), propuso el modelo Probit, asumiendo que la variable derespuestaYi*siguelasiguienteforma: Yi * = ' X i + ui (11.1) En la prctica Yi* es una variable no observable, lo que se observa es una variablediscretadefinidacomo: Y=1siYi*>0 (11.2) Y=0deotramanera Por ejemplo, podemos observar si una persona participa o no en la fuerza laboral, es decir observamos Y = 1 o Y = 0. Sin embargo, no podemosobservarlafuncindeutilidaddelindividuoenlacualpondera el costo de oportunidad del tiempo y tampoco podemos observar si el individuo realiza o no un anlisis costo beneficio a la hora de buscar trabajo. Todo esto que no observamos esta representado por la variable latente Y*. Bajo este modelo Xi no es E(Yi| Xi) como en el modelo de

234

probabilidad lineal, sino ms bien es E(Yi*| Xi). De las expresiones anterioresobtenemos: Pr ob(Yi = 1) = Pr ob(u i > X i ) = 1 F ( X i ) (11.3) Donde, F es la funcin de distribucin acumulativa de u. En este caso los valores de Y son exactamente las realizaciones de un proceso binomial con probabilidad dada por (10.3). La funcin de verosimilitud para este modeloes: L = F ( ' X i ) [1 F ( ' X i )] (11.4)
yi = 0 yi =1

La forma funcional para F en (11.4) depender de los supuestos que se tenganparaladistribucindeltrminodelerroruien(11.1).Silafuncin de distribucin de ui es logstica, tenemos un modelo Logit, cuya forma funcionalesiguala: exp( ' X i ) 1 = F ( ' X i ) = (11.5) 1 + exp( ' X i ) 1 + exp( ' X i ) Porconsiguiente; exp( ' X i ) 1 F ( ' X i ) = (11.6) 1 + exp( ' X i ) De otra parte, el modelo Probit (tambin llamado Normit) asume que la distribucin de los errores ui se distribuyen como una normal con IN(0, 2).Enestecaso:
F ( ' X i ) =

X i

t2 1 exp 2 dt (11.7) ( 2 ) 1 / 2

la funcin de verosimilitud para esta ltima funcin se diferencia de la del Logit,solamente enque / debenestimarseconjuntamente,nocomo en el caso de la funcin de verosimilitud para el Logit en que y se estiman por separado. Se puede asumir que = 1 para iniciar con el anlisis.

235

Debido a que la distribucin normal acumulativa y la distribucin Logit son muy parecidas, probablemente los resultados estimados no se diferencien mucho entre s. Sin embargo, la comparacin de los parmetros s de los de los modelos no puede realizarse directamente. Debido a que la distribucin logstica tiene una variacin 2/3, el obtenidoapartirdeunmodeloLogittienequesermultiplicadopor31/2/ para poder compararlo con el estimado a partir del modelo Probit, donde se normaliza el parmetro por igual a 1. Amemiya (1981) sugiere que las estimaciones Logit pueden ser multiplicadas por 1/1.6 = 0.625, diciendo que con esta transformacin se obtiene una aproximacin cercana entre la distribucin logstica y la funcin de distribucin normal estndar. Tambin sugiere que los coeficientes del modelo de probabilidad lineal, s, pueden ser comparados por medio de las relaciones: LP0.25L,exceptoparaeltrminoconstanteylasvariablesdiscretas. LP0.25L+0.5paraeltrminoconstanteylasdiscretasdelaregresin. Por lo tanto, si necesitamos hacer comparable LP con los coeficientes Probit, necesitamos multiplicar por 2.5 y sustraer 1.25 del trmino constante. Una forma alternativa de comparar estos modelos debera hacersesiguiendolossiguientespasos: a. Calcular la suma de cuadrados de las desviaciones a partir de las probabilidadesproyectadas. b. Compararlosporcentajescorrectamenteproyectados. c. Mirar las derivadas de las probabilidades con respecto a una variable independienteenparticular. Si Xik es el k simo elemento del vector de variables explicatorias Xi, y si k es el k simo elemento de . Entonces las derivadas de las probabilidades dadas para un modelo de probabilidad lineal, un modelo ProbityunmodeloLogitsonrespectivamente:

236

X X X
ik

( X 'i ) = k ( X 'i ) = ( X 'i ) k


ik

(11.8)

L ( X 'i ) =
ik

exp( X ' i ) [1 + exp( X ' i ) ]2 k

Estasderivadassonnecesariasparapredecirlosefectosdecambiosenlas variables independientes sobre la probabilidad depertenecer a un grupo. En el caso de modelo de probabilidad lineal, estas derivadas son constantes. En cambio, para el caso de modelos Probit y Logit se necesita calcularlosdiferentesnivelesdelasvariablesexplicatoriasparateneruna idea del rango de variacin de los cambios resultantes en las probabilidades.

11.9.1.ClculodelaProbabilidadapartirdeModelosProbity Logit
La funcin de verosimilitud presentada en la ecuacin (11.4) puede escribirsedelasiguientemanera:
1 L = i =1 1 + exp( ' X i )
n 1Yi

exp( ' X i ) 1 + exp( ' X i )

Yi

[1 + exp( ' X )]
n i =1 i

exp( ' ) i =1 X i Yi
n

(11.9)y(11.10)

Si definimos t* = XiYi. Para encontrar el estimador de mxima verosimilitudde,tenemos:


ni=1

log L = ' t * log 1 + exp( ' X i ) (11.11)


i =1

Entonces,logL/=0,resultaen: n exp( ' X i ) S ( ) = X i + t * = 0 (10.12) i =1 1 + exp( ' X i ) Dadoquetenemosunaecuacinnolinealen ,necesitamosutilizar mtodosnolinealestalescomolosalgoritmosdeNewtonRaphson.Para estodefinimoslamatrizdeinformacinlacualestadadapor:
237

I( ) =

[1 +
i=1

Exp ( x i ) x i x i, 2 exp( x i ) ]

Iniciando con alguno de los valores de , por decir 0, estimamos el valor deS(0)ydeI(0).Porconsiguiente,lanuevaestimacindees:
1 = 0 + [ I ( 0 )] S ( 0 ) (11.13)
1

En la prctica se divide S(0) y I(0) se divide por n, el tamao de la muestra. Este procedimiento iterativo se repite hasta lograr la convergencia. Si al final se produce la convergencia, los estimadores son $ ,ylamatrizdeconvarianzaasintticaesestimadapor denotadoscomo
$ )]1. La varianza y la covarianza estimadas deberan servir para [I(

$ . comprobarhiptesisacercadelosdiferenteselementosde Despusdelaestimacinde,podemostenerlosvaloresestimadosdela probabilidaddequelaisimaobservacinseaiguala1.Denotandoestos $ i ,tenemos: valoresestimadospor p $' X ) exp( i $i = (11.14) p $ 1 + exp( ' X i ) Conestolaecuacin(11.12)esiguala: $ i X i = Yi X i (11.15) p

Por lo tanto, si Xi incluye un trmino constante, entonces la sumatoria de las probabilidades estimadas es igual a la Yi o el nmero de observaciones en la muestra para el cual Yi = 1. En otras palabras, la frecuenciaproyectadaesigualalafrecuenciaobservada.Similarmente,si Xi incluye una variable discreta, por ejemplo, 1 si es femenino y 0 si es masculino, entonces la frecuencia proyectada debera ser igual a la frecuenciaobservadaparacadaunodelosgruposdesexos.Conclusiones similaressalendelmodelodeprobabilidadlinealporvirtuddelefectode la ecuacin (11.15) las cuales son para este caso ecuaciones normales por mnimoscuadrados.

238

$ y de p $ i por el modelo En cualquier caso, despus de la estimacin de Logit, siempre es bueno chequear si la condicin impuesta por la ecuacin (11.15) es satisfecha o no. Para el modelo Probit, sustituimos la expresin presentada en la ecuacin (11.7) en la ecuacin (11.4). Si denotamos (.) y (.) como la funcin de densidad y de distribucin, respectivamente, de la distribucin normal estndar. Entonces para el modeloProbitlafuncindeverosimilitudcorrespondientea(11.9)es:

L = ( ' X i )
i =1

] [1 ( ' X )]
Yi i

1Yi

(11.16)

Yellogaritmodeverosimilitudes:
log L = Yi log ( ' X i ) + (1 Yi ) log[1 ( ' X i )] (11.17)
i =1 i =1 n n

DerivandologLconrespectoaresulta: [Yi ( ' X i )] ( ' X ) X (11.18) log L n S ( ) = = i i i =1 ( ' X i )[1 ( ' X i ) ] $ puedeserobtenidocomo Elestimadordemximaverosimilitudpara ML unasolucindelaecuacinS()=0.Estasecuacionessonnolinealesen, y por lo tanto tienen que ser resueltas mediante un proceso iterativo. La matrizdeinformacines:
n ( ' X i ) 2 log L I ( ) = E X X ' (11.19) = ' i =1 ( ' X ) 1 ( ' X ) 2 i i i i

As como con el modelo Logit, iniciamos con un valor inicial de , por decir 0, y estimamos el valor de S(0) y de I(0). Por lo tanto, la nueva estimacindees:
1 = 0 + [ I ( 0 )] S ( 0 ) (11.20)
1

Note que la matriz I(0) es definida positiva para cada una de las etapas de la iteracin. Por consiguiente, el procedimiento iterativo debera converger al mximo de la funcin de verosimilitud sin importar el valor $ , entonces la inicial. Si la estimacin final converge se denotar por

239

$ )]1. Esta puede ser matriz de covarianza asinttica ser estimada por [I( utilizadaparalaestimacindeunapruebadesignificancia.

11.10.UnaAplicacindelosModelosLogityProbit:ElModelode ReferndumparaelClculodelaDisponibilidadaPagar.
Siguiendo a Hanemann (1984) , se supone que el entrevistado posee una funcin de utilidad U(Q,Y;S), que depende del ingreso Y y de la mejora de la calidad del agua (estado actual Q = 0 final Q = 1), teniendo como parmetros el vector S de caractersticas socioeconmicas del individuo. Dado que el investigador (evaluador) desconoce la funcin U(Q,Y;S), entoncesseplanteaunmodeloestocsticodelaforma: U(Q,Y;S)=V(Q,Y;S)+(Q) donde, (Q) es la variable aleatoria, con media cero, y V es la parte determinstica. Si el entrevistado acepta pagar $ P para disfrutar de la mejoraenlacalidaddelagua,debecumplirseque, V(1,YP;S)V(0,Y;S)>(0)(1) Donde, (0) y (1) son variables aleatorias independientemente e idnticamentedistribuidos.Simplificandolanotacin,sedenomina; V=V(1,YP;S)V(0,Y;S)y=(0)(1) Aestenivel,larespuestadelentrevistadoSI/NOesunavariablealeatoria para el evaluador. La probabilidad de una respuesta afirmativa (SI) est dadapor: Prob(decirSI)=Pr(V>)=F(V)4,
3

Hanemann, W. M. (1984). Welfare evaluation in contingent valuation experiments with discrete responses. Amer. of Agric. Econ. 66(3):332-341.
V

F(V) =

f() d ,con f() la funcin de densidad de , indica la probabilidad que sea menor o igual a V.

Ver Ardila, S.(1993). Gua para la utilizacin de modelos economtricos en aplicaciones del mtodo de valoracin contingente. Documento de trabajo BID.

240

Donde, F es la funcin de probabilidad acumulada de . Si suponemos unaformafuncionalpara:Vi=i+Y,linealenelingreso,dondei=(0,1), yunadistribucindeprobabilidadpara,seobtienen: (1)V=(10)P=P Donde, > 0, ya que el valor esperado de la utilidad (V) aumenta con el ingreso, implicando que cuanto ms alto sea P en la encuesta menor ser V y por tanto, menor ser la probabilidad de que un individuo responda SI. De igual forma, este modelo solo permite estimar la diferencia 1 0 = , representando el cambio de utilidad por la mejora de la calidad del agua y , representa la utilidad marginal del ingreso (constante).Severificaentoncesqueelpago(P*)quedejaraindiferenteal entrevistado (V = 0) es igual al cambio en utilidad () dividido por la utilidadmarginaldelingreso().Esdecir, P*=/ Si a (1) se le asocia una distribucin de probabilidad normal para , con media cero y varianza constante, es decir, N ( 0,2), se obtiene un modeloProbit,cuyaprobabilidadderespuestaSImodelacomo: Prob(decirSI)=Prob((P)/>/)=
/

N(e)de,donde,e=/.

Si a (1) se le asocia una distribucin de probabilidad logstica para , se obtiene un modelo Logit, cuya probabilidad de respuesta SI modela como: Prob(decirSI)=Prob(P>)=(1+exp(+P))1 Si el investigador est interesado en encontrar la variacin compensada (VC), que es la respuesta a la pregunta de DAP, puede definir en un modelolinealVicomo: V(1,YC;S)V(0,Y;S)=(0)(1)

241

SimplificandoSmomentneamente, 1+(YC)+1=0+Y+0 Si los errores se distribuyen con un modelo Probit, la variacin compensadaes: VC+=DAP=(/)/(/) Si los errores se distribuyen con un modelo Logit, la variacin compensadaes: VC+=DAP=/ que vienen a ser la primera medida delbienestar, es decir, la media (VC+) de la distribucin. La magnitud de las diferencias en las medidas del bienestar tanto para el modelo Probit como el Logit, son irrelevantes. Por ello, los investigadores prefieren el modelo Logit porque admite mayor varianza en la distribucin del trmino error. En un modelo de utilidad lineal tal como Vi, la media (VC+) y la mediana (VC*) son iguales. Si el investigadornopermitieravaloresnegativosparaVC,entonceslamedida monetaria del cambio de bienestar a travs de la media (VC+) est dada por: VC=VC+= (1Gc(P))dP=log(1+e)/,
0

Donde, Gc(P) da la probabilidad que VC sea menor o igual que P, que es la probabilidad de obtener una respuesta negativa, y 1 Gc(P) da la probabilidadqueVCseamayorqueP.Sisegeneralizaelprocedimientoy seincluyeelvectorS,lamedidadelbienestarestdadapor: VC =VC*=DAP=S/= ( 0 +
+

i =1

i Si ) /,

Donde, Si es el conjunto de caractersticas socioeconmicas, que no incluye el ingreso, es la transpuesta del vector de parmetros, y es el coeficiente del precio P (utilidad marginal del ingreso). Para el caso de
242

modelos de utilidad no lineales se sugiere revisar a Hanemann (1984) y Ardila (1993). Estos modelos Probit y Logit se regresionan por el mtodo de mxima verosimilitud, a travs del programa economtrico LIMDEP WIN7.02.

11.11.UnaAplicacinconelModelodePoisson:Clculodel ExcedentedelConsumidor
Este modelo contiene especificaciones estocsticas, en este modelo se supone que la distribucin de probabilidad para la variable dependiente donde esta variable es la probabilidad del nmero de viajes esperados al sitio,dadapor: ex Prob ( x ) =
x!

Donde x es el nmero de eventos ocurridos y es un parmetro que define la funcin de distribucin de probabilidad siguiendo una distribucinPoisson. Prob(Evento) Nmero de Eventos Grfico 10.3: Distribucin de Probabilidad Poisson Cualserialaprobabilidaddeceroeventos? Pr ob ( 0) = e

243

Parax=0,1,.....,.Laformadelafuncindependeexclusivamentedel valorde.Ademssetienequeincluirvariablesindependientesdentro lafuncindelModelodePoisson.Elvaloresperadodeseriguala: xe x E ( ) = =


x=0

x!

Donde,representaelcomportamientodelavariabledependientedela distribucindeprobabilidaddelafuncin.Asumimosque: V = e Siendo esta la funcin determinstica del modelo. Todas las alternativas deben ir especificadas en la funcin. Ahora escribimos la funcin de mxima verosimilitud para estimar los betas. La probabilidad de que ocurraeleventoes: x i x1 x2 x3 exp( Vi ) Vi ne e e e e . . L( x1 , x2 , x3 , ) = L = i ,V , =
( x1 )! ( x2 )! ( x3 )!

i =1

xi !

ComopuedeapreciarseLestaenfuncindelasvariablesindependientes. Dondelaprobabilidaddeiestardadapor:
V exp e i

P ( i ) =

exp Vi Xi !

[ ]

Xi

Con lo cual estimamos los coeficientes `s. Por consiguiente, la demanda deterministaestardadapor: X = exp[0 + 1 X i ] Por ejemplo, para el caso de la estimacin de una funcin de demanda por recreacin donde el nmero de viajes esperados es una funcin del precio propio del sitio, del precio de sitios sustitutos, del ingreso del individuo y de otras variables tales como las caractersticas socioeconmicas del individuo y caractersticas especficas del sitio de recreacin,elmodeloquedaradelasiguienteforma:
244

X = exp 0 + 1 ( precio propio) + 2 ( precio sustituto) + 3 (ingreso) +......+ n (resto VI )

Alfinalqueda: Donde:

X = exp * 0 + 1 ( c1 + t1w)

0* = 0 1 + 2 (c2 + t 2 w) + 3 ( wT + y 0 ) +......+ nVn

Cual es la relacin entre las variables dependientes e independientes en el problema? Todo esto se hace para saber cual es el excedente del consumidor, a partir de la estimacin de la demanda determinista. Por consiguiente,elexcedentedelconsumidorestarrepresentadocomo: = exp( )
* 0

S =

P0

exp[

* 0

+ 1 P dP = exp( ) exp[ 1 P]dP


* 0

P0

exp( 1 P )

P =

=
P= P
0

0 exp( 0* + 1 P 0

Puestoqueexp[0*+1P0]eslademanda.Entonces,elexcedentedel consumidorseriguala:
S = X

$ pchoque EC XM(p*) x

p*

x*

Grfica 10.4: Excedente del Consumidor como un Aproximacin de la Variacin Compensatoria.

245

Para hallar la variacin compensada y la variacin equivalente, se puede utilizar cualquiera de los dos mtodos que hemos visto. La evidencia ha mostrado que no hay gran diferencia entre las tres medidas. Este es un modeloindirecto,derevelacindepreferencias. En la valoracin contingente, lo ms importante es formular correctamente la pregunta sobre la disponibilidad a pagar; el resto es trivial, y no hay cabida para errores en las estimaciones. En este modelo, por contraste, formular los cuestionarios es ms fcil, pero existe gran cabida para errores en el momento de la estimacin economtrica. Por consiguiente, hay que tener en cuenta las variables explicativas que se vanatomaryespecificarelmodelocuidadosamente.

11.12.UnaAplicacindelosModelosTobit.
ElmodeloTobitsedefinecomo: Yi = ' X i + u silasvariablesdelladoderechosonmayoresquecero (1) Yi = 0 deotraforma Donde,esunvectorkx1deparmetrosnoconocidos,Xiesunvectorkx1 de constantes conocidas; y ui son los errores normal e independientementedistribuidos,conmediaceroyvarianza2. Elproblemaesestimary2sobrelabasedelasNobservacionesdeYiy de Xi. El modelo Tobit es un tipo de modelo de regresin censurado y como tal se encuentra relacionado con la estimacin de distribuciones normales censuradas y truncadas. Tobin (1958), fue el primero en descubrir el problema de los modelos censurados en el contexto del anlisisderegresin. Considere la ecuacin (1) , si N0 es el nmero de observaciones para el cual Yi = 0, N1 es el nmero de observaciones para el cual Yi > 0. Asumiendo tambin que las observaciones diferentes de cero N1, ocurren primero.Porconveniencia,definimos:

246

Fi = F ( ' X i , ) =
2

' Xi

1 t 2 / 2 2 dt (2) 1/ 2 e ( 2)

f i = f ( ' X i , 2 ) =

1 (1/ 2 2 )( ' X i ) 2 (3) 1/ 2 e ( 2 )

' X i /

= Fi =

1 t 2 /2 dt (4) 1/ 2 e (2)


= Fi =
1 ( ' X i ) 2 / 2 2 (5) 1/ 2 e ( 2)

Donde, i y i son, respectivamente, la funcin de densidad y la funcin dedistribucinnormalestndarevaluadaenXi/.Con, i i = (6)


1 i

Con Y1 = (Y1, Y2,....,YN1), representando un vector 1xN1 de observaciones N1paraYidiferentesdecero.ConX1=(X1,X2,....,XN1)unamatrizkxN1de valores de Xi para observaciones Yi diferentes de cero. Con X0 = (XN1+1,....,XN) como una matriz kxN0 de valores de Xi para las observaciones Yi iguales a cero. Con 0 = (N1+1,.....,N) como un vector de valores de i para observaciones Yi iguales a cero. Para las observaciones Yiquesoncero,sabemosque5: Prob(Yi=0)=Prob(ui<Xi)=(1Fi)(7) ParalasobservacionesYimayoresquecero,tenemos: f (Yi ' X i , 2 ) 1 e (1/ 2 )(Y ' X ) (8) = Prob(Yi>0).f(Yi|Yi>0)= Fi Fi (2 2 ) 1/ 2 Porconsiguiente,lafuncindeverosimilitudes:
2 2 i i

Debido a que u tiene una distribucin simtrica:

Pr ob(ui < ' X i ) =

' Xi

f (u)du =

' Xi

f (u)du = 1 F ( ' X ) = 1 F
i

247


L = (1 Fi )
0 1

1 ( 2 )
2 1/ 2

e (1/ 2

)( Yi ' X i ) 2

(9)

Donde el primer producto corresponde a las N0 observaciones para las cuales Yi = 0 y el segundo producto para las N1 observaciones para las cualesYi>0.
1 1 log L = log(1 Fi ) + log (Y ' X i ) 2 (10) 2 1/ 2 (2 ) 1 2 2 i 0 1

En lo que sigue, la sumatoria 0 ser para las observaciones N0 , para las cuales Yi = 0 y la sumatoria 1 ser para las observaciones N1 para las cualesYi>0.AcontinuacinsepresentanlasprimerasderivadasdellogL conrespectoay2. Fi = fi Xi Fi 1 ' Xi fi 2 = 2 2 (11) f i 1 = 2 ' Xi fi Xi f i ( ' X i ) 2 2 fi 2 4 2 Una aplicacin del modelo Tobit, se da en el caso de la estimacin de demandas por recreacin para recursos naturales, como es el caso de playas, ros o reservas. En principio, este modelo se encuentra dentro de la categora de los modelos censurados, los cuales corresponden a valores que se concentran alrededor de un valor especfico. Volviendo al ejemplo de la estimacin de una demanda por recreacin, si se parte del hecho de que las entrevistas no son hechas en el sitio de recreacin si no en otros lugares, por ejemplo, en las principales ciudades del pas, muy seguramente al dirigir esta encuesta hacia esos lugares, se presentar la posibilidad de que muchas personas respondan que no visitan el sitio, debido a que no lo conocen, no saben donde se encuentra ubicado, o simplemente por que no tienen informacin perfecta sobre los flujos de serviciosquepuedeofrecerelrecurso.
248

Por consiguiente, existir gran nmero de observaciones con valor cero y convalorescercanosaceroymuypocosconvaloresmayores.Paraevitar el problema de la presencia excesiva de valores cero, se emplea un modelo censurado como el Tobit, el cual considera estrictamente valores mayores a cero, de esta manera se elimina el problema de la presencia de muchasobservacionesconvalorceroenlamuestra. Finalmente en los anexos economtricos veremos algunas aplicaciones de modelosquesecorrieronconelprogramaLIMDEPWIN7.02.

249

Вам также может понравиться