Академический Документы
Профессиональный Документы
Культура Документы
mes 1
mes n
Origen o entrada
Falla o salida
3. Censura
Los datos econmicos utilizados en los modelos de duracin por naturaleza estn
censurados. De este modo, en la modelacin y en las estimaciones resultantes estarn
presentes las consecuencias economtricas de este problema (sesgo) si es que no se
resuelve adecuadamente. El problema surge porque la observacin en este tipo de
aplicaciones es la duracin de un evento y tpicamente la data es recogida en un
momento en el tiempo cuando para algunos individuos el proceso estar completo
(observaciones no censuradas), pero para otros individuos no (observaciones
censuradas).
Por ejemplo, en el caso de desempleo imaginemos que se dispone de una encuesta en
Lima Metropolitana que ha recogido informacin acerca de la participacin en el
mercado laboral de 100 individuos desempleados durante el ao 2008. Luego,
supongamos que 10 de estos individuos logran encontrar empleo en marzo, 40 de ellos
en julio y 20 en noviembre. Los 30 restantes continan desempleados en diciembre
cuando la encuesta dej de ser aplicada. De este modo, para 70 individuos el proceso
completo puede observarse (datos no censurados), pero para 30 de ellos no (datos
censurados). Analizar la duracin de desempleo para los 100 individuos bajo estas
condiciones dar como resultado, estimadores sesgado; problema que debe resolverse
durante la estimacin. Ms adelante en el curso se discute la correccin, la cual como ya
intuy el alumno es mediante un procedimiento similar a los modelos Tobit o Heckman.
Individuo 1
t1
T1
Individuo 2
t2
T2
C
Se puede definir la censura de modo ms formal con ayuda del grfico anterior. En la
ausencia de censura, el individuo i presenta un tiempo de falla Ti , la cual es una
variable aleatoria. Luego, definimos un momento C i que es el momento en que los
datos para i dejan de ser observados. Si es que para ese momento el proceso se ha
completado (caso de individuo 2) el dato no est censurado. Si es que el proceso no ha
sido completado (caso del individuo 1), la observacin presenta censura en C i . De este
modo, las observaciones son realmente de la forma X i min [Ti , Ci ] donde X i es lo
que realmente observa el investigador junto con la variable yi 1 si es que Ti Ci (el
set de observaciones no censuradas; el caso del individuo 2) e yi 0 cuando Ti Ci (el
set de observaciones censuradas, el caso del individuo 1).
4. La funcin de riesgo (hazard)
En base a la discusin anterior, se define como duracin a la variable aleatoria continua
T (se han eliminado los subndices por conveniencia). As, un determinado individuo
entra a un estado inicial en el momento T 0 siendo T el tiempo en que el individuo
se mantiene en dicho estado. Luego, es posible definir a una persona que ha venido
perteneciendo al estado inicial por un lapso de tiempo t y que cambiar de estado en un
periodo de tiempo muy pequeo definido como t , luego de t . De este modo interesa
investigar la siguiente probabilidad:
Pr ob[t T t t | T t ]
(1)
(t ) lim
t 0
Pr ob[t T t t | T t ]
t
(2)
(3)
Pr ob[t T t t | T t ]
Pr ob[t T t t , T t ]
Pr ob[T t ]
(4)
(5)
Ntese que el primer mltiplo del lado derecho de la expresin (5) es necesariamente
igual a 1, de modo que dicha expresin queda expresada como
Pr ob[t T t t , T t ] Pr ob[t T t t ]
(6)
Pr ob[t T t t | T t ]
Pr ob[t T t t ]
Pr ob[T t ]
(7)
Pr ob[t T t t | T t ]
F (t t ) F (t )
1 F (t )
(8)
Pr ob[t T t t | T t ]
F (t t ) F (t )
1
lim
t 0
t 0
t
t
1 F (t )
(t ) lim
(9)
Ntese que la primera expresin del lado derecho de la expresin (9) es la derivada de
F (t ) con respecto a t que es igual a f (t ) . De este modo,
(t )
f (t )
f (t )
1 F (t ) S (t )
(10)
[ f (t )] (t ) ;
dt
1 F (t )
lo que conlleva a la expresin general
(t )
d log[ S (t )]
dt
(11)
Por lo tanto se puede definir una funcin (t ) como la integral de (t ) en (11), que
evidentemente dar como resultado:
t
(t ) (t )dt log[ S (t )]
(12)