Вы находитесь на странице: 1из 9

UNIVERSIDAD AUTÓNOMA DEL ESTADO DE

MÉXICO

FACULTAD DE ECONOMÍA

LICENCIATURA EN ACTUARÍA

MODELOS Y SIMULACIÓN

PROYECTO

ESTIMACIÓN DE LA FUNCIÓN DE SOBREVIVENCIA


A TRAVÉS DEL MODELO DE REGRESIÓN DE COX
APLICADO EN PACIENTES QUE PRESENTAN
CANCER DE OVARIO

EMMANUEL VALADEZ AGUILAR


Introducción

El archivo “ovarian” incluido en R dentro de la librería “survival” muestra los datos


de sobrevivencia de un ensayo aleatorio clínico comparando dos tratamientos para
cáncer de ovario presente en 26 pacientes, realizado por el Eastern Cooperative
Oncology Group. Los pacientes tenían carcinoma de ovarios avanzado (estados
IIIB y IV), y fueron tratados con ciclofosfamida (1g/m2), o ciclofosfamida
(500mg/m2) más adriamicina (40mg/m2), cada 3 semanas.

El problema se centra en encontrar qué variables afectan el tiempo de


sobrevivencia y calcular su respectivo estimador.

Descripción de las variables dentro de la base de datos:

 futime: Tiempo desde el inicio del estudio hasta que el paciente murió o fue
censurado medido en días.
 fustat: Estatus de la censura, sólo por la derecha (1=murió, 0=censurado).
 age: Edad en años.
 resid.ds: Si hay células cancerígenas residuales presentes (1=no,2=si).
 rx: Grupo de tratamiento (1= ciclofosfamida, 2= ciclofosfamida +
adriamicina).
 ecog.ps: Estatus del desempeño de la enfermedad (ECOG 1 es mejor que
2).

De acuerdo con Comis, R. (1982), el ECOG es una escala usada con el objeto de
evaluar como la enfermedad afecta las habilidades del paciente para realizar
actividades de su vida diaria como trabajo de oficina, trabajo ligero, etc. En el caso
particular de la base de datos. 1 implica que los pacientes no pueden realizar
actividades extenuantes, pero sí trabajo ligero, mientras que 2 significa que los
pacientes no pueden realizar ninguna actividad de trabajo.

Planteamiento inicial
Primero se redondearon todas las edades al entero más cercano. Después, se
seleccionó la edad mínima y se le restó a los demás datos, de manera la variable
edad se estandarice y sea más fácil de manejar.
Bajo un primer intento por estimar la función de sobrevivencia se calcula el
estimador Kaplan-Meier a través de la función
survfit(Surv(tiempo,event=censura)~X,data=base) incluida en la librería de
“survival”.

Donde los parámetros son:


 tiempo = variable que contiene los tiempos de sobrevivencia en la base de
datos.
 censura = variable que contiene el estatus de la censura.
 X= si no hay otras variables se pone 1, caso contrario poner la variable
sobre la que se desea estimar la función de sobrevivencia en específico.
 base= de donde se obtienen los datos.

Una variable explicativa interesante sería ver cuál es el tratamiento más efectivo,
por lo que aplicando la función anterior con variable explicativa “rx”, la cual parte a
la muestra en dos grupos definidos por el tratamiento recibido, se obtiene el
siguiente gráfico.
Es entonces que el tratamiento 1, consistente en el uso ciclofosfamida, pareciera
ser menos efectivo que el tratamiento 2, donde se trató a los pacientes con
ciclofosfamida y adriamicina. El estimador Kaplan-Meier es un estimador discreto
no paramétrico que no asume nada sobre la distribución de los tiempos de
sobrevivencia, excepto que son observaciones provenientes de variables i.i.d. por
lo cual es muy útil si no se tiene algún otro tipo de información. Sin embargo, no es
un estimador preciso por lo que es recomendable aplicar algún otro tipo de
modelo.

Para este caso se aplicará el modelo de regresión de Cox, el cual asume que los
tiempos de sobrevivencia para las observaciones son independientes, pero ya no
idénticamente distribuidos, sino que dependen de variables explicativas Xi propias
de cada individuo.

Planteamiento del modelo de Cox o proporcional de tasas de riesgo

Para encontrar el modelo de regresión de Cox se utilizará la siguiente función:

mcox<-coxph(Surv(tiempo,event=censura)~X1+X2+..+Xn,data=base)

En general, se ocupan los mismos parámetros que la función anterior excepto


porque la función cambia a coxph (cox proportional hazards) y se le agregan
variables explicativas x1,…Xn. La función aplicada con las variables explicativas
propuestas en el estudio quedaría como:

mcox<-coxph(Surv(futime,event=fustat)~age+resid.ds+rx+ecog.ps,data=datos)

Así mismo el modelo planteado, respetando la notación de las variables en la base


de datos, tendría la siguiente expresión matemática:

ℎ𝑇𝑖 (𝑡) = ℎ0 (𝑡) ∗ 𝑒 𝐵1∗𝑎𝑔𝑒𝑖 +𝐵2∗𝑟𝑒𝑠𝑖𝑑.𝑑𝑠𝑖 +𝐵3∗𝑟𝑥𝑖 +𝐵4∗𝑒𝑐𝑜𝑔.𝑝𝑠𝑖 ∀𝑖 = 1, . . ,26

Donde:

ℎ𝑇𝑖 (𝑡) = 𝑇𝑎𝑠𝑎 𝑑𝑒 𝑚𝑜𝑟𝑡𝑎𝑙𝑖𝑑𝑎𝑑 𝑑𝑒𝑙 𝑖𝑛𝑑𝑖𝑣𝑖𝑑𝑢𝑜 𝑖 𝑎𝑙 𝑡𝑖𝑒𝑚𝑝𝑜 𝑡

ℎ0 (𝑡) = 𝑇𝑎𝑠𝑎 𝑑𝑒 𝑚𝑜𝑟𝑡𝑎𝑙𝑖𝑑𝑎𝑑 𝑏𝑎𝑠𝑒 𝑝𝑎𝑟𝑎 𝑡𝑜𝑑𝑜𝑠 𝑙𝑜𝑠 𝑝𝑎𝑐𝑖𝑒𝑛𝑡𝑒𝑠

𝐵𝑖 = 𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒𝑠 𝑎 𝑠𝑒𝑟 𝑒𝑠𝑡𝑖𝑚𝑎𝑑𝑜𝑠


Aplicando la función “summary”, y modificando el modelo eliminando las variables
menos significativas una por una de manera iterada, se obtiene finalmente el
siguiente resultado:

coef exp(coef) se(coef) z Pr(>|z|)


age 0.15479 1.16741 0.04825 3.208 0.00134

Por lo que se concluye que no hay evidencia suficiente para rechazar la hipótesis
nula de que las variables “resid.ds”, “rx” y “ecog.ps” son estadísticamente iguales a
0 y que la variable age es la única estadísticamente significante, a un nivel de
confianza del 5%.

Es entonces que el tratamiento 1 y el tratamiento 2 no afectan la probabilidad de


sobrevivencia por lo que ambos son ineficaces, lo cual es contrataste con la
estimación Kaplan-Meier propuesta al inicio. Así mismo, se observa que tampoco
es afectada por el hecho de presentar células cancerígenas residuales ni por el
desempeño actual de la enfermedad sobre el paciente. La única variable que
afecta la probabilidad de muerte y por consecuencia, la probabilidad de
sobrevivencia es la “edad”, la cual incrementa la tasa de riesgo conforme esta es
más grande. El modelo final quedaría de la siguiente forma:

ℎ̂ ̂
𝑇𝑖 (𝑡) = ℎ0 (𝑡) ∗ 𝑒
.15479∗𝑎𝑔𝑒𝑖

Para obtener el estimador de la función de sobrevivencia S(t) se aplica la función


survfit(mcox,newdata=data.frame(age=0)

El valor de age es 0 para ver cuál sería la función de sobrevivencia base S0(t), sin
embargo, age puede tomar cualquier valor dentro del intervalo [0,36] en edad
estandarizada o [39,75] en edad original. Exportando los datos a Excel en el
archivo simulación, es posible observar cómo cambia la función de sobrevivencia
conforme se varía (simula) la edad, ejecutando la macro “Ver todas las edades”,
De igual forma se puede calcular el estimador para una edad en particular
ejecutando la macro “Ver por edad individual”.

Se calculó la función de sobrevivencia STi(t) con el uso de la fórmula:


𝐵∗𝑎𝑔𝑒𝑖
𝑆𝑇𝑖 (𝑡) = 𝑆0 (𝑡)𝑒

Pero también se podría calcular con la función “survfit” dándole valores a “age”.

A través de un análisis gráfico de las funciones de sobrevivencia para diferentes


edades, es posible notar que para edades menores o iguales a 53, las
probabilidades de sobrevivencia son muy altas, por lo que se infiere que las
probabilidades bajaran sólo hasta edades mucho mayores. De igual forma, para
pacientes con edad dentro del intervalo (53,55], la probabilidad de sobrevivir los
siguientes dos años baja, pero sigue estando por arriba de .6. Sin embargo,
después de 59, baja más esporádicamente hasta que la probabilidad de sobrevivir
los siguientes dos años está por abajo del 40%. Finalmente, edades mayores o
iguales a 71 tienen muy baja probabilidad de sobrevivir el siguiente año.

Algunas de las gráficas para las edades anteriores son:

A edad de 49

Función de Sobrevivencia
1.0000
0.9000
0.8000
0.7000
0.6000
S(t)

0.5000
0.4000
0.3000
0.2000
0.1000
0.0000
0 200 400 600 800 1000 1200 1400
t (días)
A edad de 55

Función de Sobrevivencia
1.0000
0.9000
0.8000
0.7000
0.6000
S(t)

0.5000
0.4000
0.3000
0.2000
0.1000
0.0000
0 200 400 600 800 1000 1200 1400
t (días)

A edad de 59

Función de Sobrevivencia
1.0000
0.9000
0.8000
0.7000
0.6000
S(t)

0.5000
0.4000
0.3000
0.2000
0.1000
0.0000
0 200 400 600 800 1000 1200 1400
t (días)
A edad de 71

Función de Sobrevivencia
1.0000
0.9000
0.8000
0.7000
0.6000
S(t)

0.5000
0.4000
0.3000
0.2000
0.1000
0.0000
0 200 400 600 800 1000 1200 1400
t (días)

De acuerdo con la American Cancer Society, existe una tasa de supervivencia


promedio para los siguientes 5 años en pacientes con cáncer de ovario tipo IV, a
edad de 54 años. La probabilidad de tener esa tasa es del 17%. Sin embargo, con
el modelo planteado no es posible verificar este dato pues la duración del estudio
es sólo de casi 4 años y no es posible inferir como se distribuye la función de
sobrevivencia para periodos mayores. No obstante, el modelo evaluado en edad
54 tampoco rechaza la posibilidad de que se cumpla esa tasa de supervivencia
por lo que el modelo hasta este punto pareciera ser congruente con dichos
resultados. Sin embargo, podría inferirse que la probabilidad de sobrevivir a los
siguientes 5 años del 17% para edades mayores a o iguales a 61 no se cumple
pues, de acuerdo con el modelo, esta probabilidad es mucho más baja.
Bibliografía

 American Cancer Society.Tasas de supervivencia para el cáncer de ovario,


por etapa. Recuperado de: https://www.cancer.org/es/cancer/cancer-de-
ovario/deteccion-diagnostico-clasificacion-por-etapas/tasas-de-
supervivencia.html
 Collet, D. (1994). Modeling Survival data in medical research. Springer. UK.
 Comis, R. (1982). ECOG Performance Status. Eastern. Cooperative
Oncology Group. Group Chair.
 Edmonson JH, Fleming TR, Decker DG, Malkasian GD, Jorgensen EO,
Jefferies JA, Webb MJ, Kvols LK. (1979). Different chemotherapeutic
sensitivities and host factors affecting prognosis in advanced ovarian
carcinoma versus minimal residual disease.
 Forster, J. (2016). Survival Models. Lecture Notes. University of
Southampton, UK.
 Hinde, A. (1998). Demographic Methods. Routledge. UK.
 Hosmer, D., Lemeshow, S. y May, S. (2008). Applied Survival Analysis.
Wiley-Interscience. New Jersey.
 Klein, J. y Moeschberger, M. (2003). Survival analysis. Techniques for
Censored and Truncated Data. Springer. UK.
 Lee, E. y Wenyu, J. (2003). Statistical Methods for Survival Data Analysis.
Wiley-Interscience. Oklahoma.

Вам также может понравиться