Вы находитесь на странице: 1из 6

Nota de Clase 1

Modelos de Duracin: Generalidades


1. Por qu modelos de duracin?
Los modelos de duracin utilizados en economa tienen su origen en las ciencias
biomdicas y en la ingeniera. De ah adoptan su nombre original: modelos de
sobrevivencia (survival models). El objetivo general de estos modelos es estudiar el
tiempo que tarda un determinado fenmeno en ocurrir o el tiempo en que un
determinado individuo permanece en un determinado estado. Para ello, debe definirse
un grupo de individuos en un estado inicial para quienes un determinado evento
claramente definido puede ocurrir en el futuro. Dicho evento se conoce como falla
(failure), el cual ocurre luego de un tiempo (failure time) y puede darse una sola vez por
individuo. El ejemplo tpico en esta tradicin es el fallecimiento de un paciente luego de
una determinada intervencin quirrgica o procedimiento mdico. As, la falla sera la
muerte del individuo y se trata de estudiar el tiempo que sobrevivi desde la
intervencin realizada (duracin). Este tipo de informacin resulta sumamente valiosa
para la medicina ya que permite predecir la esperanza de vida de los pacientes o las
consecuencias de ciertos procedimientos mdicos.
En economa tambin estamos interesados en estudiar los fenmenos en trminos de su
duracin. Por ejemplo, nos interesa saber el tiempo en que dura el desempleo. As, el
estado inicial de los individuos es estar sin trabajo, la falla sera el momento en que
encuentran empleo (cambia de estado) y el tiempo de falla los meses o semanas en que
el individuo se encuentra desempleado (duracin en un mismo estado). Las
conclusiones que ofrece un anlisis sobre la duracin del desempleo (y sus
determinantes) tiene importantes implicancias en la ciencia econmica en la medida que
permitira disear polticas orientadas a reducir el periodo de inactividad, calcular tasas
ptimas de seguro de desempleo o identificar cuanto tarda un individuo en cambiarse de
un empleo a otro. Este ltimo factor asociado a polticas de reconversin laboral, por
ejemplo.
Es posible pensar en otros fenmenos que pueden ser estudiados mediante modelos de
duracin. As, por ejemplo, aquellos interesados en gestin de programas sociales
estaran interesados en analizar el tiempo en que un pobre deja de utilizar un
determinado programa. De modo similar, existen aplicaciones en el mundo de los
negocios para predecir el momento de quiebra de una empresa o en el mundo bancario
para estudiar demoras en el pago de crdito o cuanto demora un deudor en entrar en
default. En economa de la regulacin podra utilizarse para estudiar el tiempo que
demora que las tarifas locales (por ejemplo, precios locales de los derivados del
petrleo) se ajustan ante un cambio en el precio de referencia internacional (WTI, por
ejemplo). Incluso, recientemente las ciencias polticas han adoptado este tipo de
modelos para predecir reelecciones o duracin de conflictos sociales y el marketing para
estudiar el tiempo que le toma a un comprador decidir su compra. Finalmente, en
macroeconoma recientes aplicaciones han demostrado que son muy tiles para analizar
la efectividad de los esquemas de metas explcitas de inflacin. En tal contexto, se
intenta estudiar cuanto tiempo tarda la inflacin en converger al rango meta dado que un
pas adopta tal esquema.

En resumen, los modelos de duracin tienen una amplia aplicabilidad en economa ya


que pueden considerarse una forma alternativa (y ciertamente complementaria) de
analizar los fenmenos sociales frente a lo que ofrecen los modelos de corte transversal
tradicionales o aquellos de series de tiempo. As, en un modelo de corte transversal el
investigador est interesado en estudiar los determinantes de estar en un determinado
estado. Su naturaleza esttica permite estudiar los eventos tal y como aparecen en la
realidad en un momento determinado en el tiempo a partir de las diferencias entre
individuos en diferentes estados. Mientras tanto, los modelos de series de tiempo
analizan los determinantes de los cambios de estado que presenta un determinado
individuo a lo largo del tiempo. Su naturaleza dinmica le permite estudiar individuos
en continuo movimiento. Por contraste, un modelo de duracin estudia el tiempo en que
un individuo permanece en un determinado estado o dicho de otro modo la
probabilidad de que cambie de estado, condicionado a que ha permanecido cierto
tiempo en un estado diferente.
En las siguientes secciones de estas notas de clase se definirn los conceptos asociados a
los modelos de duracin. El entendimiento de tales conceptos y su mbito de aplicacin
en el presente contexto permitir guiar la discusin de las prximas notas de clase. As,
interesa definir: tiempo de falla (failure time), censura, funcin de superviviencia
(survivor), funcin de riesgo (hazard) y funcin de riesgo acumulado.
2. Tiempo de falla (failure time)
El tiempo de falla es el tiempo en que un individuo se mantiene en un determinado
estado o lapso de tiempo en que un fenmeno toma lugar. Existen tres requisitos para
definirlo de manera precisa:
a) El origen debe estar bien definido o estar establecido sin ambigedades. Se
considera que el origen es la entrada de un individuo al estado de la naturaleza
inicial. Por ejemplo, el momento en que pierde el trabajo, cuando la huelga se
inicia o cuando el pobre comienza a recibir ayuda estatal. Esta representado por
un punto especfico en el calendario. No es necesario que el origen o entrada de
cada individuo sea el mismo, pero para cada uno de ellos debe estar identificado
precisamente.
b) La escala temporal debe ser precisa y comn para todos los individuos.
Normalmente se utiliza tiempo real: minutos, horas, das, semanas, meses, aos,
dcadas. Sin embargo existen otras opciones (algn vector dimensin que
reemplace al tiempo) dependiendo de la aplicacin. En estadstica aplicada, por
ejemplo, una escala podra ser el nmero de re-muestreos necesarios para que un
determinado parmetro converja o en la industria automovilstica se ha utilizado
los kilmetros que recorre un auto antes que una pieza falle. En economa
normalmente es el tiempo real y el investigador solo debe tener cuidado en que
sea la misma escala para cada individuo y que no cambie a lo largo de todo el
experimento.
c) El concepto de falla debe estar claramente establecido. Al igual que en el caso
del origen o entrada, las condiciones de falla o salida deben ser precisas, claras y
factibles para todo individuo en el estado de la naturaleza original. Por ejemplo,
en el caso de duracin del desempleo, la salida puede darse porque el individuo

encontr trabajo, porque inicio estudios, porque falleci, porque se desanim y


se retir del mercado de trabajo. El investigador debe ser claro en que categoras
incluir en su anlisis de modo que sus resultados sean interpretables.
Grficamente lo que nos interesa establecer es
Tiempo de falla

mes 1

mes n

Origen o entrada

Falla o salida

3. Censura
Los datos econmicos utilizados en los modelos de duracin por naturaleza estn
censurados. De este modo, en la modelacin y en las estimaciones resultantes estarn
presentes las consecuencias economtricas de este problema (sesgo) si es que no se
resuelve adecuadamente. El problema surge porque la observacin en este tipo de
aplicaciones es la duracin de un evento y tpicamente la data es recogida en un
momento en el tiempo cuando para algunos individuos el proceso estar completo
(observaciones no censuradas), pero para otros individuos no (observaciones
censuradas).
Por ejemplo, en el caso de desempleo imaginemos que se dispone de una encuesta en
Lima Metropolitana que ha recogido informacin acerca de la participacin en el
mercado laboral de 100 individuos desempleados durante el ao 2008. Luego,
supongamos que 10 de estos individuos logran encontrar empleo en marzo, 40 de ellos
en julio y 20 en noviembre. Los 30 restantes continan desempleados en diciembre
cuando la encuesta dej de ser aplicada. De este modo, para 70 individuos el proceso
completo puede observarse (datos no censurados), pero para 30 de ellos no (datos
censurados). Analizar la duracin de desempleo para los 100 individuos bajo estas
condiciones dar como resultado, estimadores sesgado; problema que debe resolverse
durante la estimacin. Ms adelante en el curso se discute la correccin, la cual como ya
intuy el alumno es mediante un procedimiento similar a los modelos Tobit o Heckman.

Individuo 1
t1

T1

Individuo 2
t2

T2
C

Se puede definir la censura de modo ms formal con ayuda del grfico anterior. En la
ausencia de censura, el individuo i presenta un tiempo de falla Ti , la cual es una
variable aleatoria. Luego, definimos un momento C i que es el momento en que los
datos para i dejan de ser observados. Si es que para ese momento el proceso se ha
completado (caso de individuo 2) el dato no est censurado. Si es que el proceso no ha
sido completado (caso del individuo 1), la observacin presenta censura en C i . De este
modo, las observaciones son realmente de la forma X i min [Ti , Ci ] donde X i es lo
que realmente observa el investigador junto con la variable yi 1 si es que Ti Ci (el
set de observaciones no censuradas; el caso del individuo 2) e yi 0 cuando Ti Ci (el
set de observaciones censuradas, el caso del individuo 1).
4. La funcin de riesgo (hazard)
En base a la discusin anterior, se define como duracin a la variable aleatoria continua
T (se han eliminado los subndices por conveniencia). As, un determinado individuo
entra a un estado inicial en el momento T 0 siendo T el tiempo en que el individuo
se mantiene en dicho estado. Luego, es posible definir a una persona que ha venido
perteneciendo al estado inicial por un lapso de tiempo t y que cambiar de estado en un
periodo de tiempo muy pequeo definido como t , luego de t . De este modo interesa
investigar la siguiente probabilidad:

Pr ob[t T t t | T t ]

(1)

Es decir interesa investigar la probabilidad que el tiempo de falla sea entre t y t t


( t T t t ) condicionado a que el individuo continua en el estado inicial al
momento t ( T t ). En simple, la condicin implica que el individuo no ha salido
antes de t . Es posible dividir esta probabilidad entre t para obtener la probabilidad
promedio de salida por unidad de tiempo luego de t . Adems interesa que esta unidad
de tiempo sea muy pequea para introducir el concepto instantneo. As, se calcula

(t ) lim

t 0

Pr ob[t T t t | T t ]
t

(2)

donde (t ) se conoce como la funcin de riesgo (hazard function) o ratio de riesgo


(hazard rate) y se define como el ratio instantneo de salida por unidad de tiempo en el
momento t . Luego, (t )t (o lo que es lo mismo (t)dt , para intervalos muy cercanos
a cero) es la probabilidad de salida del estado inicial en un intervalo de tiempo corto t
luego de t condicionado a que en t , el individuo continua en el estado inicial. Ntese
que es posible definir tambin una probabilidad no condicionada, si es que se deja de
lado la condicin T t . Este concepto es claramente diferente a la funcin de riesgo
definida previamente.
5. La funcin de supervivencia (survivor)
Definamos la probabilidad Pr ob[T t ] F (t ) , donde F (t ) representa una probabilidad
acumulada, y Pr ob[T t ] 1 F (t ) . Esta ltima es conocida como la funcin de

supervivencia e indica la probabilidad de que un determinado individuo se mantiene en


el estado inicial al menos t periodos o en trminos de frecuencias (y utilizando el
ejemplo mdico anterior) indica la proporcin de individuos que sobreviven al menos
t periodos o que para el periodo t continan vivos. Por su significado, conviene darle
una notacin especial. As, se define
S (t ) 1 F (t )

(3)

6. Relacin entre la funcin de supervivencia y la funcin de riesgo


Recordemos que la derivada de la acumulada es la densidad, por lo tanto
F (t ) / t f (t ) , donde f (t ) es la densidad y estableciendo la nomenclatura de la
probabilidad condicional f ( x | y) f ( x, y) / f ( y) , podemos establecer

Pr ob[t T t t | T t ]

Pr ob[t T t t , T t ]
Pr ob[T t ]

(4)

El numerador de (4) es la probabilidad conjunta de la salida del estado inicial en el


intervalo de tiempo determinado y de que la duracin sea T t . Para operar
conviene tomar en cuenta las siguientes propiedades probabilsticas:
Pr ob( A | B) Pr ob( A, B) / Pr ob( B)
Pr ob( B | A) Pr ob( A, B) / Pr ob( A)
Pr ob( A, B) Pr ob( B | A) * Pr ob( A) ,

En el caso planteado esto implica que


Pr ob[t T t t , T t ] Pr ob[T t | t T t t ] * Pr ob[t T t t ]

(5)

Ntese que el primer mltiplo del lado derecho de la expresin (5) es necesariamente
igual a 1, de modo que dicha expresin queda expresada como
Pr ob[t T t t , T t ] Pr ob[t T t t ]

(6)

Esto permite reescribir (4) de la siguiente forma

Pr ob[t T t t | T t ]

Pr ob[t T t t ]
Pr ob[T t ]

(7)

que en trminos de las distribuciones acumuladas es

Pr ob[t T t t | T t ]

F (t t ) F (t )
1 F (t )

la cual conviene dividirla entre t y tomar el lmite de modo que se obtiene

(8)

Pr ob[t T t t | T t ]
F (t t ) F (t )
1
lim
t 0
t 0
t
t
1 F (t )

(t ) lim

(9)

Ntese que la primera expresin del lado derecho de la expresin (9) es la derivada de
F (t ) con respecto a t que es igual a f (t ) . De este modo,

(t )

f (t )
f (t )

1 F (t ) S (t )

(10)

De modo que (10) es una versin ms corta de la funcin de riesgo.


7. La funcin de riesgo acumulado
Podemos definir el logaritmo de la funcin de supervivencia log[ S (t )] y hallar su
d log[1 F (t )]
1
derivada con respecto al argumento t . As,

[ f (t )] (t ) ;
dt
1 F (t )
lo que conlleva a la expresin general

(t )

d log[ S (t )]
dt

(11)

Por lo tanto se puede definir una funcin (t ) como la integral de (t ) en (11), que
evidentemente dar como resultado:
t

(t ) (t )dt log[ S (t )]

(12)

Es importante establecer que la funcin (t ) sigue una distribucin de valor extremo,


propiedad que resultar de importancia ms adelante en el curso.

Вам также может понравиться