Вы находитесь на странице: 1из 47

Diego Alejandro Castro Llanos

Facultad de Ingeniería
Escuela de Estadística
Asignatura: Econometría
Universidad del Valle
(Parte 4)
Modelo Logístico Ordinal
Se pueden presentar casos en los que la variable endógena es discreta y
toma al menos tres categorías. Si entre éstos hay un orden natural o
jerárquico en la variable endógena, tal como es el caso de las
calificaciones que se le asignan a las firmas o personas naturales por su
comportamiento de pago. Se deben emplear modelos que capturen esta
característica, denominados modelos logísticos ordenados.

Recordemos las calificaciones de riesgo que se le asignan a los clientes vista


en la clase No 2 de los modelos de elección discreta:

 Calificación A: Se considera un riesgo normal; menor a 30 días de


vencido.
 Calificación B: Riesgo aceptable; entre 30 y 90 días de vencido.
 Calificación C: Riesgo apreciable, entre 90 y 180 días de vencido.
 Calificación D: Riesgo considerable; entre 180 y 360 días de vencido.
 Calificación E: Riesgo de incobrabilidad; más de 360 días de vencido.
Modelo Logístico Ordinal
La formulación del modelo en forma reducida viene dada por:

Y*  XT 

Se tiene:
A ; 0 Y *  A

B ; A  Y *  B
Y* 
  ; 
E ; D  Y *

Donde 𝜖 es el error del modelo, 𝜇𝐴 , 𝜇𝐵 , 𝜇𝐶 , 𝜇𝐷 , 𝜇𝐸 son los parámetros que


representan los valores de los umbrales y se estiman a la vez que 𝛽.

1
Recordemos que: ( f ( x)) 
1  e f ( x)
La probabilidad de pertenecer a cada una de las categorías o modalidades
de la variable endógena se expresan a continuación:
Modelo Logístico Ordinal

1 1
P(Y  A X )  (  A  X  ) 
T
(   A  X T  )
 (A  X T  )
1 e 1 e

1 1
P(Y  B X )  (  A  X  )  (  B  X  ) 
T T
(  A  X T  )
 (  B  X T  )
1 e 1 e

1 1
P(Y  C X )  (  B  X T  )  ( C  X T  )  (  B  X T  )
 ( C  X T  )
1 e 1 e

1 1
P(Y  D X )  ( C  X  )  (  D  X  ) 
T T
( C  X T  )
 (  D  X T  )
1 e 1 e
Modelo Logístico Ordinal
1
P(Y  E X )  (  D  X T  )  (  D  X T  )
1 e
La probabilidad de ocurrencia de la última categoría también suele
calcularse como:
P(Y  E X )  1  P(Y  A X )  P(Y  B X )  P(Y  C X )  P(Y  D X )

Para que todas las probabilidades estimadas por el modelo econométrico


sean positivas, se debe cumplir que 𝜇𝐴 < 𝜇𝐵 < 𝜇𝐶 < 𝜇𝐷 < 𝜇𝐸 .

Para estimar un modelo logístico ordinal con 𝑚 categorías se tiene:

P(Y  1 X )  ( 1  X T  )

P(Y  j X )  (  j 1  X T  )  (  j  X T  ) ; j  2, 3, ..., m  1

P(Y  m X )  (  m 1  X T  )
Modelo Logístico Ordinal
En este tipo de modelos, los coeficientes estimados en cada una de las
ecuaciones de regresiones correspondientes a cada modalidad de la
c
variable endógena son iguales. Tal como se aprecia en cada una de las
categorías, los únicos parámetros que son diferentes son los umbrales.

Al igual que el modelo logístico y probit binario, el efecto marginal


expresa el cambio de la variable endógena provocado por un cambio
unitario en cada una de las variables exógenas, manteniendo constantes el
resto de las variables.

En caso que se quiera expresar el cambio por cada 10 unidades, es


necesario multiplicar el efecto marginal por 10, de tal manera que la
interpretación sea adecuada.
Modelo Logístico Ordinal
El cálculo de los efectos marginales permite conocer la dinámica
de cada una de las variables explicativas sobre las diferentes
categorías. Los efectos se pueden calcular en Stata con misma
instrucción del modelo logit y probit binario “mfx”.

Los efectos de las variables 𝑥𝑖 sobre la probabilidad de ocurrencia están


definidos como:

P(Yi  j )
xi
 
 F ' (  j 1  xi  )  F ' (  j  xi  ) *  ; j  2, 3, ..., m  1
T T

Generalmente se estiman los efectos marginales para cada una de las


categorías de la variable endógena, cuando una de las variables regresoras
cambia, permaneciendo las demás variables en ceteris paribus.
Supuestos del Modelo Logístico Ordinal
Williams (2006), en su trabajo de investigación, señala que es necesario
validar el supuesto de líneas paralelas o proportional odds que implica un
único coeficiente en cada una de las variables exógenas, en las diferentes
c
modalidades de la variable dependiente, donde cada uno de los pares
ordenados que se pueden formar entre categorías adyacentes de las
categorías debe ser la misma.

Para validar este supuesto se emplea la prueba de Brant. Si no fuera así, se


necesitaría un modelo distingo para c cada una de las categorías, con
diferentes coeficientes estimados para las variables regresoras.

Williams (2009) señala que si el supuesto


c
de regresiones paralelas no se
cumple estadísticamente, los estimadores serán sesgados e ineficientes.
Supuestos del Modelo Logístico Ordinal

Para determinar si todas las variables exógenas consideras en el modelo


cumplen con el supuesto de líneas paralelas,
c se considera la distribución
Chi-Cuadrado como distribución de referencia.

En caso que al menos uno de los parámetros asociados a una de las


variables no cumpla con el supuesto c mencionado, se hace necesaria la
estimación de los modelos logísticos ordenados generalizados.

Otro de los supuestos a ser validados es que no existe problemas de


c
multicolinealidad entre las variables exógenas del modelo econométrico.
Ejemplo de Aplicación: Riesgo de Crédito
Retomando el ejemplo visto en la Parte 2 del capítulo, se estimó la
probabilidad condicional de que un cliente incumpla con el pago de sus
obligaciones.

Ahora el propósito es modelar la calificación de riesgo otorgada a los


clientes (A, B, C, D, E), es decir estimar la probabilidad de que a un
individuo se le asigne cada una de las categorías de la variable de
respuesta.

La suma de las probabilidades de ocurrencia de cada una de las categorías


debe ser igual al valor unitario, es decir:
P(Yi  A)  P(Yi  B)  P(Yi  C )  P(Yi  D)  P(Yi  E )  1

Para estimar este tipo de modelos se debe tener suficiente información


histórica, puesto que es necesario estimar 𝑘 + 𝑚 − 1 parámetros, siendo
𝑘 el número de variables exógenas y 𝑚 el número de categorías de la
variable endógena.
Ejemplo de Aplicación en Riesgo
El modelo se estima fácilmente en el programa Stata con la siguiente
“ologit”.
c

Se aprecia
c que todas las
variables
exógenas son
significativas.
Medida de Bondad de Ajuste del Modelo
De manera similar al modelo logístico binario, se debe validar el modelo.
Se pueden emplear las mismas medidas de bondad de ajuste Desvianza,
Accuracy-Ratio, Komogorov-Smirnov y Hosmer-Lemeshow.

Para la Desvianza del modelo, las hipótesis vienen dadas por:

Ho: El modelo ajustado no es adecuado en la probabilidad de ocurrencia


de cada una de las categorías.

Ha: El modelo es adecuado en la estimación de la probabilidad de


ocurrencia en las diferentes categorías.

Para contrastar la hipótesis nula se emplea la Distribución Chi-Cuadrado,


como distribución de referencia, con 𝑘 grados de libertad, siendo 𝑘 el
número de variables exógenas.
Medida de Bondad de Ajuste del Modelo

Se aprecia que el valor p es menor que un alpha del 5%, por lo que hay
suficiente evidencia para rechazar Ho, en consecuencia el modelo es
adecuado en la estimación de la probabilidad de ocurrencia de cada una de
las categorías.

Como el objetivo principal es estimar la probabilidad de que un cliente


incumpla con sus obligaciones financieras, se debe sumar la probabilidad
de que un cliente pertenezca a la categoría D y E.

Posteriormente con estás probabilidades se verifica si el modelo


discrimina de manera adecuada un cliente cumplido sobre un cliente
incumplido, empleando las mismas medidas de bondad del logit y probit:
0 ; si el clie nte pertenece a la categoría A, B o C
Y 
1 ; si el cliente pertenece a la categoría D o E
Medida de Bondad de Ajuste del Modelo
Para estimar los efectos marginales se requiere instalar un paquete
“mfx2”, para ello se deben realizar los siguientes pasos:

findit(mfx2)

c
Distribución de frecuencia de la variable endógena

Se aprecia que el 69,90% de los clientes fueron calificados al cabo de un año


en la categoría A. Por su parte el 14,10% de las firmas se les otorgó la
categoría B.

Se aprecia que el 90,32% de las empresas fueron calificadas en A, B o C y


tan sólo el 9,68% se les asignó alguna de las dos peores calificaciones de
riesgo.
Estimación de Efectos Marginales P(Yi = A)
Probabilidad promedio de que
una empresa sea calificada en
A.

Si la variable de crecimiento económico del país se incrementa en una


unidad porcentual, se espera que la probabilidad de que sea calificado en A
aumenté en un 3,86% (0,0386*100), estando las demás variables constantes.
Se aprecia que la interpretación es acorde con la teoría económica.
Estimación de Efectos Marginales P(Yi = A)

Si la actividad económica de la firma es industrial, se espera que la


probabilidad de que sea calificado en la mejor categoría de riesgo se
incremente en un 6,477% (0,06477*100), en relación a las empresas
comerciales, teniendo en cuenta las demás variables en ceteris paribus.
Estimación de Efectos Marginales P(Yi = A)

Si la variable de comportamiento de pago aumenta en 30 días, se espera


que la probabilidad de que la empresa sea calificada en A disminuya en un
19,405% (0,006468*30*100), estando las demás variables en ceteris paribus.
Estimación de Efectos Marginales P(Yi = A)

Si la empresa analizada es pequeña, se espera que la probabilidad de que sea


calificada en A disminuirá en un 8,13% (0,0813*100), respecto a las
empresas grandes, teniendo en cuenta las demás variables constantes.
Estimación de Efectos Marginales P(Yi = B)
Probabilidad promedio de que
una empresa sea calificada en
B.

Si la empresa es mediana, se espera que la probabilidad de que sea


calificado en B disminuye en un 2,1244% (0,021244*100) respecto a las
empresas grandes, estando las demás variables constantes.
Estimación de Efectos Marginales P(Yi = C)
Probabilidad promedio de que
una empresa sea calificada en
C.

Si el nivel de endeudamiento de la firma aumenta en 10 puntos


porcentuales, se espera que la probabilidad de que sea calificada en la
categoría C disminuirá en un 0,3131% (0,0003121*10*100), teniendo en
cuenta las demás variables constantes.
Estimación de Efectos Marginales P(Yi = D)
Probabilidad promedio de que
una empresa sea calificada en
D.

Si la variable de rentabilidad aumenta en 20 puntos porcentuales, entonces


la probabilidad de que sea calificado en la categoría de incumplimiento D
disminuirá en un 0,9054%, considerando las demás variables constantes.
Esta interpretación es acorde con la teoría económica.
Estimación de Efectos Marginales P(Yi = E)
Probabilidad promedio de que
una empresa sea calificada en
E.

Se aprecia que a medida que la categoría de riesgo se va deteriorando, la


probabilidad de que pertenezca a cada una de las categorías va
disminuyendo, por la sencilla razón de que la mayoría de los clientes de la
muestra pertenecen a la categoría A. Todos los efectos marginales son
significativos en este modelo a diferencia del logístico binario.
Estimación de Efectos Marginales P(Yi = E)

La variable tamaño de empresa es muy importante en la estimación de la


probabilidad de incumplimiento, puesto que si una empresa es pequeña la
probabilidad de sea calificado en la peor categoría de riesgo aumentará en
un 1,1421% estando las demás variables constantes.
Test de Brant
En el test de Brant se estiman 𝑚 − 1 ecuaciones de regresión logísticas
binarias, siendo 𝑚 el número de categorías de la variable endógena. Para el
c
caso de las calificaciones de riesgo se estiman cuatro ecuaciones logísticas
correspondientes a 𝑃 𝑌 > 𝐴 , 𝑃 𝑌 > 𝐵 , 𝑃 𝑌 > 𝐶 𝑦 𝑃 𝑌 > 𝐷 .

Posterior a la estimación del parámetro asociado a cada una de las


variables exógenas en las diferentes ecuaciones de regresión logística se
procede a realizar una prueba Chi-Cuadrado.
c En esta prueba se comparan
si los parámetros son estadísticamente iguales en las diferentes
modalidades de la variable endógena del modelo.

Por ejemplo, en la variable macroeconómica se compara si el parámetro


c
en la calificación A es estadísticamente igual en la calificación B, C y D.
Test de Brant
La hipótesis nula y alterna vienen dadas por:

H 0 :  A( k )   B ( k )   C ( k )   D ( k )

H a : al menos un  i ( k )   j ( k ) donde i, j  A, B, C , D i j

Para una determinada variable exógena, Brant demostró que bajo la


hipótesis nula, el estadístico de asemeja a una distribución chi-cuadrado
con 𝑚 − 2 grados de libertad.

El test de Brant, también se puede realizar para todos los parámetros en


conjunto. En este caso los grados de libertad son iguales a k ∗ 𝑚 − 2 .
Para validar este supuesto se deben considerar al menos tres variables
exógenas.

Esta prueba se ejecuta en el programa Stata con la instrucción “brant,


detail”
Test de Brant

Se aprecia que el valor p (0,000) es menor que un alpha del 5%, por lo
tanto en al menos una de las variables exógenas los parámetros
asociados en las diferentes categorías son estadísticamente diferentes,
por lo que el supuesto de líneas paralelas no se cumple, esto hace
que los parámetros sean sesgados e ineficientes (Williams, 2009).
Test de Brant

Para la variable macroeconómica PIB se tiene:


H 0 :  A( macroeconómica )   B ( macroeconómica )   C ( macroeconómica )   D ( macroeconómica )
H a : al menos un  i ( macroeconómica )   j ( macroeconómica ) ; i  j

Se observa que el valor p es mayor que un alpha del 5%, por lo que hay
suficiente evidencia para no rechazar la hipótesis nula, por lo que se
puede inferir de que los parámetros en cada una de las categorías
asociadas a esta variable son estadísticamente iguales.
Test de Brant

Para las demás variables regresoras se observa que el valor p es menor


que un alpha del 5%, incluso al 1%, por lo que hay evidencia estadística
para señalar que los parámetros en cada una de las categorías en las
variables de actividad económica, liquidez, endeudamiento, rentabilidad,
mediana, pequeña y comportamiento no son iguales.

Por lo descrito anteriormente, es necesario estimar un parámetro


para cada una de las categorías en las variables mencionadas, de
tal manera que los estimadores sea insesgados y eficientes.
Modelo Logístico Ordinal Generalizado
Se propusieron nuevas metodologías para estimar los parámetros
del modelo, bajo la hipótesis alternativa de que todos o algunos de
c
los coeficientes son diferentes para cada una de las categorías de
la variable endógena.

Basándose en el trabajo académico de Williams (2006), la estructura


c
matemática del modelo viene dada por:

exp ( j  X i β j )
P(Yi  j )   (  j  X j )  ; j  1,2,.., m  1
1  exp ( j  X i β j )

Para el ejemplo aplicado en riesgo, será:

exp ( j  X i β j )
P(Yi  j )  (  j  X j )  ; j  A, B, C , D
1  exp ( j  X i β j )
Modelo Logístico Ordinal Generalizado
En la estructura matemática de este modelo, se deben estimar 𝑚 − 1
ecuaciones de regresión logística. La probabilidad de pertenecer a cada una
de las categorías de la variable dependiente se pueden estimar a partir de:

P(Y  A X )  (  A  X T  A )  1  (  A  X T  A )
P(Y  j X )  (  j 1  X T  j 1 )  (  j  X T  j ) ; j  2,3,..., m  1

P(Y  E X )  (  D  X T  D )
Aplicado al ejemplo de riesgo se tiene:
P(Y  A X )  (  A  X T  A )  1  (  A  X T  A )

P(Y  j X )  (  j 1  X T  j 1 )  (  j  X T  j ) ; j  B, C , D

P(Y  E X )  (  D  X T  D )
Los efectos marginales se estiman de manera similar al modelo logístico
ordinal.
Modelo Logístico Ordinal Generalizado
El modelo es equivalente a una serie de regresiones logísticas binarias donde
las categorías de la variable dependiente están combinadas según el orden
c
intrínseco que está tenga y en la que se deben estimar cuatro ecuaciones de
regresión.

En la primera ecuación, la categoría de riesgo de crédito A se compara con


una que reúne el resto de las categorías. En esta ecuación la variable
c
dependiente toma el valor unitario si la calificación de la firma es A y
tomará el valor cero en otro caso

En la segunda ecuación de regresión, la variable endógena tomará el valor


unitario si la calificación asignada al cliente
c es A o B, y tomará el valor cero
si la calificación crediticia de la empresa es C, D o E
Modelo Logístico Ordinal Generalizado
En la tercera ecuación de regresión logística, la variable dependiente tomará
el valor unitario si la calificación de lac firma es A, B o C y se le asignará el
valor cero si su calificación es D y E

Finalmente, en la cuarta ecuación, la variable dependiente toma el valor


unitario si la calificación del clientec es A, B, C o D y será cero si la
calificación es E.

El modelo descrito anteriormente se utiliza cuando el supuesto de líneas


paralelas no se cumple para todas las variables exógenas. Sin embargo, es
común que se presenten casos en losc que el supuesto se cumple sólo para
algunas de las variables por lo que se debe hacer una modificación, de tal
manera que los parámetros sean iguales a cero en caso de ser necesario.
Modelo Logístico Ordinal Generalizado
Se debe estimar un modelo que cumpla el supuesto de líneas paralelas de
c
manera parcial, donde su estructura matemática viene dada por:

exp (α j  X i β lp  Z i  jnlp )
P(Yi  j )  ; j  1,2,..., m  1
1  exp (α j  X i β  Z i 
lp nlp
j )

donde 𝑋 corresponde a la matriz de las variables explicativas que cumplen


estadísticamente el supuesto de líneas paralelas y 𝛽 𝑙𝑝 es el vector de
parámetros respectivos, mientras quec Z incluye las variables que no
cumplen con este supuesto y el vector de coeficientes correspondientes está
representado por 𝛽 𝑛𝑙𝑝 .

Este modelo relaja el supuesto de líneas paralelas con el propósito de que


los efectos de las variables exógenas puedan
c variar entre las categorías, para
aquellas donde el supuesto se viole.
Modelo Logístico Ordinal Generalizado P(Y = A)
Se estima el modelo considerando un mismo parámetro en la variable
macroeconómica, en las diferentes categorías de la variable endógena.

Se aprecia que los parámetros estimados son significativos al 5%.


Modelo Logístico Ordinal Generalizado P(Y = B)

Se aprecia que la constante no es significativa al 5%, al igual que


el parámetro que acompaña a la variable de pequeña empresa.
Modelo Logístico Ordinal Generalizado P( Y = C)

En la estimación la probabilidad de ocurrencia de la categoría C, la única


variable que no es significativa al 10% es el tamaño de empresa.
Modelo Logístico Ordinal Generalizado P( Y = D)

Finalmente, en la estimación de la probabilidad de ocurrencia de la


categoría D el parámetro asociado a la variable nivel de endeudamiento no
es significativa, bajo un nivel de significancia del 10%.

Recordemos que para estimar este modelo, se debe contar con suficiente
información historica.
Estimación de los Efectos Marginales en la
Categoría A

Si la variable de crecimiento económico del país aumenta en un punto


porcentual, se espera que la probabilidad de que un cliente pertenezca a la
categoría A al cabo de un año aumenta en un 3,7941% aproximadamente,
estando las demás variables en ceteris paribus.
Estimación de los Efectos Marginales en la
Categoría A

Si una empresa pertenece a la actividad económica industrial, se espera


que la probabilidad de ser calificado en la mejor categoría de riesgo se
incrementa en un 4,4457% en relación a las empresas comerciales,
teniendo las demás variables como constantes.
Estimación de los Efectos Marginales en la
Categoría B

Si dos clientes (M y N) presentan los mismos indicadores a excepción del


nivel de endeudamiento del cliente, donde el cliente N presenta un
endeudamiento mayor en 20 pp, se espera que la probabilidad de que sea
calificado en la categoría B disminuirá en un 0,5832% (0,0002916*20*100)
en relación al cliente M.
Estimación de los Efectos Marginales en la
Categoría B

Supongamos ahora que el único indicador que varia entre el cliente M y N


es la variable de comportamiento de pago. Si el cliente N registra 50 días
más de mora en relación al cliente M, entonces la probabilidad de que el
cliente N pertenezca a la categoría B se incrementará en 11,8695%
respecto al cliente M.
Estimación de los Efectos Marginales en la
Categoría C

Si la variable de liquidez se incrementa en una unidad, se espera que la


probabilidad de que durante el transcurso de un año sea calificado en la
categoría C disminuirá en un 1,8912%, considerando las demás variables
en ceteris paribus. Esto tiene sentido en la teoría, puesto que a medida que
este indicador aumenta, la empresa tendrá una mejor liquidez.
Estimación de los Efectos Marginales en la
Categoría D

Si la variable de rentabilidad para un determinado cliente se incrementa en


20 pp, se espera que la probabilidad de que sea calificado en la categoría
de incumplimiento D disminuye en un 1,3322% (0,0006661*20*100),
teniendo en cuenta las demás variables constantes.
Estimación de los Efectos Marginales en la
Categoría E

Si una empresa es mediana, tendrá como consecuencia una disminución


en la probabilidad de que pertenezca a la categoría E en relación a las
empresas grandes en un 1,18% aproximadamente, estando las demás
variables en ceteris paribus. Lo descrito anteriormente tiene sentido.
Estimación de los Efectos Marginales en la
Categoría E

Si una empresa es pequeña, la probabilidad de que sea calificada al cabo


de un año en la peor categoría de riesgo aumentará en un 4,1753% en
relación a las empresas grandes, considerando las demás variables en ceteris
paribus. Por lo descrito anteriormente, las empresas pequeñas son más
riesgosas en relación a las empresas grandes o medianas.
Resumen del Modelo Logístico Ordinal y
Generalizado
No se requiere validación del supuesto de normalidad del
término de perturbación aleatoria,
c
tampoco homocedasticidad
ni autocorrelación serial de ningún tipo entre los residuales del
modelo econométrico.

Para el modelo logístico ordinal se debe cumplir el supuesto de


c
líneas paralelas (test de Brant) para todas las variables exógenas.

En caso que sea violado el supuesto de líneas paralelas sea


violado estadísticamente se debe
c estimar un modelo logístico
ordinal generalizado.

Вам также может понравиться