Вы находитесь на странице: 1из 28

T4.

Modelos con variables cualitativas


Ana J. Lpez y Rigoberto Prez o e
Dpto Econom Aplicada. Universidad de Oviedo a

Curso 2010-2011

Ana J. Lpez y Rigoberto Prez (Dpto Econom T4. Modelos con variables Oviedo) o e a Aplicada. Universidad de cualitativas

Curso 2010-2011

1 / 28

Indice

Las variables cualitativas en el mbito econmico a o

La trampade las variables cticias

Variables cualitativas dependientes Modelos Logit

Ana J. Lpez y Rigoberto Prez (Dpto Econom T4. Modelos con variables Oviedo) o e a Aplicada. Universidad de cualitativas

Curso 2010-2011

2 / 28

Modelos con variables cualitativas


Competencias

Este tema analiza la posibilidad de incorporar caracter sticas cualitativas para mejorar la capacidad explicativa de los modelos y presenta a t tulo introductorio los modelos de variable cualitativa dependiente. Se pretende que a su nalizacin los alumnos hayan adquirido las siguientes o competencias: Denir e interpretar las variables dummy Comprender las razones que impiden plantear modelos de regresin o con variables dependientes cualitativas Interpretar los coecientes estimados de un modelo logit

Ana J. Lpez y Rigoberto Prez (Dpto Econom T4. Modelos con variables Oviedo) o e a Aplicada. Universidad de cualitativas

Curso 2010-2011

3 / 28

Las variables cualitativas en el mbito econmico a o

Las variables cualitativas en el mbito econmico a o

Algunas variables econmicas pueden depender de caracter o sticas tales como el gnero, el sector de actividad, el lugar de residencia, la e ideolog pol a tica...
Ejemplos: Discriminacin salarial por gnero, impacto sobre el gasto del o e tipo de gobierno

En el anlisis temporal pueden existir efectos asociados a la a estacionalidad, o cambios de tendencia que tambin sern recogidos e a mediante variables cualitativas
Ejemplos: Estacionalidad en el turismo, impacto de la ampliacin de la o Unin Europea, ... o

Ana J. Lpez y Rigoberto Prez (Dpto Econom T4. Modelos con variables Oviedo) o e a Aplicada. Universidad de cualitativas

Curso 2010-2011

4 / 28

Las variables cualitativas en el mbito econmico a o

Incorporacin de variables cualitativas o

Ana J. Lpez y Rigoberto Prez (Dpto Econom T4. Modelos con variables Oviedo) o e a Aplicada. Universidad de cualitativas

Curso 2010-2011

5 / 28

Las variables cualitativas en el mbito econmico a o

Incorporacin de variables cualitativas o

Introduccin de variable dummy: D = o

1 0

si el trabajador es hombre si el trabajador es mujer


Curso 2010-2011 6 / 28

Ana J. Lpez y Rigoberto Prez (Dpto Econom T4. Modelos con variables Oviedo) o e a Aplicada. Universidad de cualitativas

Las variables cualitativas en el mbito econmico a o

Modelos con variable dummy: Y = 1 + 2 X + 3 D + u

Ana J. Lpez y Rigoberto Prez (Dpto Econom T4. Modelos con variables Oviedo) o e a Aplicada. Universidad de cualitativas

Curso 2010-2011

7 / 28

Las variables cualitativas en el mbito econmico a o

Modelos con variable dummy: Y = 1 + 2 X + 3 D + 4 DX + u

Ana J. Lpez y Rigoberto Prez (Dpto Econom T4. Modelos con variables Oviedo) o e a Aplicada. Universidad de cualitativas

Curso 2010-2011

8 / 28

Las variables cualitativas en el mbito econmico a o

Modelos con variable dummy: Y = 1 + 2 X + 3 D + 4 DX + u

En estos grcos, 3 y 4 son signicativos? a


Ana J. Lpez y Rigoberto Prez (Dpto Econom T4. Modelos con variables Oviedo) o e a Aplicada. Universidad de cualitativas Curso 2010-2011 9 / 28

La trampade las variables cticias

La trampade las variables cticias


DA = 1 0 1 0 1 0 1 0 si el trabajador pertenece al sector agricultura en otro caso si el trabajador pertenece al sector industria en otro caso si el trabajador pertenece al sector construccin o en otro caso si el trabajador pertenece al sector servicios en otro caso

DI =

DC =

DS =

Y = 1 + 2 X + 3 DA + 4 DI + 5 DC + 6 DS + u
Ana J. Lpez y Rigoberto Prez (Dpto Econom T4. Modelos con variables Oviedo) o e a Aplicada. Universidad de cualitativas Curso 2010-2011 10 / 28

La trampade las variables cticias

La trampade las variables cticias


Y = 1 + 2 X + 3 DA + 4 DI + 5 DC + 6 DS + u DAi + DIi + DCi + DSi = 1 , i = 1, . . . , n 1 X1 DA1 DI 1 DC 1 DS1 1 X2 DA2 DI 2 DC 2 DS2 X = . . . . . . . . . . . . . . . . . . 1 Xn DAn DIn DCn DSn Relacin lineal o Multicolinealidad entre las variables explicativas o (rango no pleno (X) = k; |X X| = 0 X X no es invertible, EMC no denidos ) SOLUCION: Excluir una de las r categor consideradas, deniendo as r-1 variables dummy (la categor excluida es la referencia para la a interpretacin de coecientes). o
Ana J. Lpez y Rigoberto Prez (Dpto Econom T4. Modelos con variables Oviedo) o e a Aplicada. Universidad de cualitativas Curso 2010-2011 11 / 28

La trampade las variables cticias

Modelo salarial en funcin de experiencia y sector o econmico: Y = 1 + 2 X + 3 DI + 4 DC + 5 DS + u o


1 + 2 X + 5 1 + 2 X + 4 1 + 2 X + 3 1 + 2 X

Ana J. Lpez y Rigoberto Prez (Dpto Econom T4. Modelos con variables Oviedo) o e a Aplicada. Universidad de cualitativas

Curso 2010-2011

12 / 28

La trampade las variables cticias

Ilustracin: Variable dummy asociada al gnero o e


Modelo 1: MCO, usando las observaciones 1--50 Variable dependiente: salario Coeficiente const experiencia 831.818 36.5540 Desv. Tpica 310.984 9.19926 2010.320 20997328 0.247523 15.78935 394.6440 797.1120 Estadstico t 2.6748 3.9736 Valor p 0.0102 0.0002 754.6359 661.3958 0.231847 0.000237 793.2880 794.7442

Media de la vble. dep. Suma de cuad. residuos R2 F (1, 48) Log-verosimilitud Criterio de Schwarz

D.T. de la vble. dep. D.T. de la regresin o R2 corregido Valor p (de F ) Criterio de Akaike Hannan--Quinn

Ana J. Lpez y Rigoberto Prez (Dpto Econom T4. Modelos con variables Oviedo) o e a Aplicada. Universidad de cualitativas

Curso 2010-2011

13 / 28

La trampade las variables cticias

Ilustracin: Variable dummy asociada al gnero o e


Modelo 2: MCO, usando las observaciones 1--50 Variable dependiente: salario Coeficiente const experiencia masculino 185.252 33.8524 1264.94 Desv. Tpica 89.3293 2.52513 52.0198 Estadstico t 2.0738 13.4062 24.3165 Valor p 0.0436 0.0000 0.0000 754.6359 181.3726 0.942234 2.98e30 664.8555 667.0398

Media de la vble. dep. Suma de cuad. residuos R2 F (2, 47) Log-verosimilitud Criterio de Schwarz

2010.320 1546114 0.944592 400.6285 329.4277 670.5915

D.T. de la vble. dep. D.T. de la regresin o R2 corregido Valor p (de F ) Criterio de Akaike Hannan--Quinn

Ana J. Lpez y Rigoberto Prez (Dpto Econom T4. Modelos con variables Oviedo) o e a Aplicada. Universidad de cualitativas

Curso 2010-2011

14 / 28

La trampade las variables cticias

Ilustracin: Variable dummy asociada al gnero o e


Modelo 3: MCO, usando las observaciones 1--50 Variable dependiente: salario Coeficiente const experiencia masculino exp masc 857.022 12.6705 225.344 32.4578 Desv. Tpica 64.4528 1.95120 80.9078 2.41534 2010.320 313882.3 0.988751 1347.808 289.5657 594.7795 Estadstico t 13.2969 6.4937 2.7852 13.4382 Valor p 0.0000 0.0000 0.0077 0.0000 754.6359 82.60465 0.988018 8.19e45 587.1314 590.0438

Media de la vble. dep. Suma de cuad. residuos R2 F (3, 46) Log-verosimilitud Criterio de Schwarz

D.T. de la vble. dep. D.T. de la regresin o R2 corregido Valor p (de F ) Criterio de Akaike Hannan--Quinn

Los trabajadores de gnero MASCULINO ven aumentado su salario e esperado y tambin el efecto marginal de la experiencia sobre el salario e
Ana J. Lpez y Rigoberto Prez (Dpto Econom T4. Modelos con variables Oviedo) o e a Aplicada. Universidad de cualitativas Curso 2010-2011 15 / 28

La trampade las variables cticias

Ilustracin: Variable dummy asociada a la estacionalidad o


700000

600000

500000

turismo

400000

300000

200000

100000

1960

1970

1980

1990

2000
Curso 2010-2011 16 / 28

Ana J. Lpez y Rigoberto Prez (Dpto Econom T4. Modelos con variables Oviedo) o e a Aplicada. Universidad de cualitativas

La trampade las variables cticias

Ilustracin: Variable dummy asociada a la estacionalidad o

Ana J. Lpez y Rigoberto Prez (Dpto Econom T4. Modelos con variables Oviedo) o e a Aplicada. Universidad de cualitativas

Curso 2010-2011

17 / 28

La trampade las variables cticias

Ilustracin: Variable dummy asociada a la estacionalidad o


Modelo 3: MCO, usando las observaciones 1983:3--2004:4 (T = 86) Variable dependiente: turismo Coeficiente const dq2 dq3 dq4 239171. 74095.4 75382.9 108457. Desv. Tpica 28294.6 40014.7 39557.3 39557.3 248803.2 1.38e+12 0.262667 9.737208 1132.432 2282.681 0.528413 Estadstico t 8.4529 1.8517 1.9057 2.7418 Valor p 0.0000 0.0677 0.0602 0.0075 148313.1 129662.3 0.235691 0.000014 2272.864 2276.815 0.942326

Media de la vble. dep. Suma de cuad. residuos R2 F (3, 82) Log-verosimilitud Criterio de Schwarz

D.T. de la vble. dep. D.T. de la regresin o R 2 corregido Valor p (de F ) Criterio de Akaike Hannan--Quinn Durbin--Watson

Respecto al primer trimestre el turismo aumenta sistemticamente el a segundo trimestre y tambin el tercero. Por el contrario en el cuarto se e reduce
Ana J. Lpez y Rigoberto Prez (Dpto Econom T4. Modelos con variables Oviedo) o e a Aplicada. Universidad de cualitativas Curso 2010-2011 18 / 28

Variables cualitativas dependientes

Modelos de variable cualitativa dependiente

En algunas ocasiones nuestro objetivo es explicar una variable dependiente cualitativa: Con dos modalidades: Modelos binomiales Con ms de dos modalidades: Modelos multinomiales a Con varias modalidades que presentan un orden natural: Modelos ordenados Con modalidades asociadas a una decisin que condiciona las o siguientes: Modelos secuenciales

Ana J. Lpez y Rigoberto Prez (Dpto Econom T4. Modelos con variables Oviedo) o e a Aplicada. Universidad de cualitativas

Curso 2010-2011

19 / 28

Variables cualitativas dependientes

Modelos de variable cualitativa dependiente


El modelo lineal y = X + u no es aplicable para variables dependientes dicotmicas o Las perturbaciones u son dicotmicas y por tanto no normales o Al ser y dicotmica se cumple E (y) = p o No est garantizado que E (y) = X adopte valores entre 0 y 1 a
1 Y = 0.473 + 0.000478t

0.8

0.6

0.4

0.2

1985

1990

1995

2000

2005

2010

Ana J. Lpez y Rigoberto Prez (Dpto Econom T4. Modelos con variables Oviedo) o e a Aplicada. Universidad de cualitativas

Curso 2010-2011

20 / 28

Variables cualitativas dependientes

Modelos de variable cualitativa dependiente


SOLUCION:

Introducir una variable auxiliar ( variable ndice ) Z continua que se interpreta como propensin a la categor investigada (encontrar o a empleo, aliarse a un sindicato, realizar una compra, ...) Y = pi 1 pi 1, 0, si Z > 0 si Z 0

= P(Y = 1) = P(Z > 0) = P(x + u > 0) = P(u > x ) = 1 Fu (x ) = P(Y = 0) = P(Z 0) = P(x + u 0) = P(u x ) = Fu (x )

Asumiendo ciertas distribuciones probabil sticas para u (log stica, Normal, uniforme, ... ) es posible conocer la distribucin de probabilidad de la o variable Y.
Ana J. Lpez y Rigoberto Prez (Dpto Econom T4. Modelos con variables Oviedo) o e a Aplicada. Universidad de cualitativas Curso 2010-2011 21 / 28

Variables cualitativas dependientes

Modelos Logit, Probit y Uniforme

Ana J. Lpez y Rigoberto Prez (Dpto Econom T4. Modelos con variables Oviedo) o e a Aplicada. Universidad de cualitativas

Curso 2010-2011

22 / 28

Variables cualitativas dependientes

Modelos Logit

Modelos Logit
Funcin log o stica de distribucin de los errores: Fu (x) = o pi = P(Yi = 1) = 1 Fu (xi ) = 1

1 1 + e x

e xi 1 = 1 + e xi 1 + e xi pi 1 pi

pi 1 + e xi = e xi e xi =

ln e xi = ln

pi 1 pi

= xi

ln

pi 1 pi

= 1 + 2 X2i + + k Xki

Logit expresados como funcin lineal de las variables explicativas o


Ana J. Lpez y Rigoberto Prez (Dpto Econom T4. Modelos con variables Oviedo) o e a Aplicada. Universidad de cualitativas Curso 2010-2011 23 / 28

Variables cualitativas dependientes

Modelos Logit

Ilustracin: Modelo logit para el empleo o

Modelo logit para explicar si una persona est ocupada en funcin a o de sus estudios

Ana J. Lpez y Rigoberto Prez (Dpto Econom T4. Modelos con variables Oviedo) o e a Aplicada. Universidad de cualitativas

Curso 2010-2011

24 / 28

Variables cualitativas dependientes

Modelos Logit

Ilustracin: Modelo logit para el empleo o

Iteracin 0: log-verosimilitud = -504.571221559 o Iteracin 1: log-verosimilitud = -491.183952849 o Iteracin 2: log-verosimilitud = -491.172320140 o Iteracin 3: log-verosimilitud = -491.172320124 o Criterio de parada basado en Log-Verosimilitud

Modelo 2: Logit, usando las observaciones 1--740 Variable dependiente: empleo Coeficiente const estudios 1.74855 0.168757 Desv. Tpica 0.429247 0.0347109 z 4.0735 4.8618 Pendiente . 0.0410787 0.243419 0.021094 986.3446 989.8969

Media de la vble. dep. R 2 de McFadden Log-verosimilitud Criterio de Schwarz

0.578378 0.025064 491.1723 995.5579

D.T. de la vble. dep. R 2 corregido Criterio de Akaike Hannan--Quinn

Ana J. Lpez y Rigoberto Prez (Dpto Econom T4. Modelos con variables Oviedo) o e a Aplicada. Universidad de cualitativas

Curso 2010-2011

25 / 28

Variables cualitativas dependientes

Modelos Logit

Ilustracin: Modelo logit para el empleo o


402 403 404 405 423 424 429 430 431 432 433 434 435 436 437 438 1.000000 1.000000 1.000000 1.000000 1.000000 1.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.401674 0.648864 0.568697 0.568697 0.754049 0.484760 0.568697 0.721430 0.568697 0.568697 0.568697 0.568697 0.609520 0.568697 0.568697 0.484760 0.598326 0.351136 0.431303 0.431303 0.245951 0.515240 -0.568697 -0.721430 -0.568697 -0.568697 -0.568697 -0.568697 -0.609520 -0.568697 -0.568697 -0.484760 Falso negativo

Falso negativo Falso Falso Falso Falso Falso Falso Falso Falso Falso positivo positivo positivo positivo positivo positivo positivo positivo positivo

Ana J. Lpez y Rigoberto Prez (Dpto Econom T4. Modelos con variables Oviedo) o e a Aplicada. Universidad de cualitativas

Curso 2010-2011

26 / 28

Variables cualitativas dependientes

Modelos Logit

Bondad de los modelos Logit


Medida basada en razn de verosimilitudes o 2 ln LNR LR ln LNR ln LR

Medida de Mc Fadden (1974)

R2 = 1

Proporcin de aciertos o

Nm, predicciones correctas u Nm. observaciones u

LNR: Mx de L respecto a todos los parmetros a a LR: Mximo de L restringido (con i = 0, i) a La razn de verosimilitudes contrasta la nulidad de o
Ana J. Lpez y Rigoberto Prez (Dpto Econom T4. Modelos con variables Oviedo) o e a Aplicada. Universidad de cualitativas Curso 2010-2011 27 / 28

Variables cualitativas dependientes

Modelos Logit

Ilustracin: Modelo logit para el empleo o


Coeficiente const estudios 1.74855 0.168757 Desv. Tpica 0.429247 0.0347109 z 4.0735 4.8618 Pendiente . 0.0410787 0.243419 0.021094 986.3446 989.8969

Media de la vble. dep. R 2 de McFadden Log-verosimilitud Criterio de Schwarz

0.578378 0.025064 491.1723 995.5579


Evaluado

D.T. de la vble. dep. R 2 corregido Criterio de Akaike Hannan--Quinn

en la media

Nmero de casos correctamente predichos = 442 (59.7 percent) u f ( X ) en la media de las variables independientes = 0.243 Contraste de razn de verosimilitudes: 2 (1) = 25.254 [0.0000] o Predicho 0 1 64 248 50 378

Observado

0 1

Este modelo logit clasifica correctamente 442 casos (casi el 60 %). Hay 248 falsos positivos (34 %) y 50 falsos negativos (6 %)
Ana J. Lpez y Rigoberto Prez (Dpto Econom T4. Modelos con variables Oviedo) o e a Aplicada. Universidad de cualitativas Curso 2010-2011 28 / 28

Вам также может понравиться