Вы находитесь на странице: 1из 14

CAPTULO

5
Conceptos bsicos de anlisis multivariable
Miguel ngel Martnez-Gonzlez, Estefana Toledo Atucha

Introduccin de alcohol y a la vez condicionen el riesgo de sufrir un


accidente. En este ejemplo:
Nuestro universo es multivariable y rara vez existe un
solo predictor para cualquier suceso. Los fenmenos de Los accidentes de trfico son la variable dependiente.
inters para la salud pblica tambin tienen habitualmente El alcohol es la variable independiente principal
mltiples causas. Los anlisis estadsticos actuales intentan (exposicin).
explicar un fenmeno teniendo en consideracin varias El sexo, los kilmetros conducidos de media al ao y
variables simultneamente y por eso se llaman anlisis la edad sern potenciales factores de confusin.
multivariables*. Casi toda la estadstica que se usa en Los modelos multivariables se usan sobre todo para
salud pblica consiste hoy en anlisis multivariables. controlar tales factores de confusin. Se dice entonces que
Corresponden a diversos modelos de regresin. Lo ms se usa el modelo multivariable para intentar ajustar las
habitual es que se trate de valorar un desenlace o resultado estimaciones por posibles factores de confusin.
relevante para la salud pblica en funcin de una o ms La existencia de factores de confusin es omnipresente
variables predictoras (covariables). Se tiene en cuenta, ade- en la investigacin epidemiolgica.
ms, el posible papel de otras variables llamadas factores
de confusin que sesgaran el anlisis si no se controlasen Los factores de confusin son variables distintas a la
adecuadamente. Es clave distinguir: exposicin (variable x o independiente) y al efecto
(variable y o dependiente), pero asociadas con ambas
Variable dependiente (outcome, variable y): resultado (comparten causas comunes)1-6.
o desenlace de inters. Los factores de confusin cuando no se tienen en
Variables independientes (predictors, variables x): cuenta pueden distorsionar las medidas de asocia-
factores ms fciles de medir o recoger y que, segn la cin que se estimen y hacerlas invlidas de modo que
hiptesis de estudio, pueden relacionarse con el resultado desaparezcan asociaciones que s existen en realidad,
de inters. Las variables independientes pueden ser: o viceversa, es decir, que emerjan espuriamente asocia-
Variable independiente principal: exposicin (exposure) ciones que son en realidad inexistentes. Es ms, pueden
bajo estudio. llegar a hacer que una determinada asociacin cambie
Variables de confusin (confounding factors): otras totalmente de sentido: que lo realmente perjudicial
variables independientes que se relacionan tanto con aparente ser protector o viceversa.
la variable dependiente como con la exposicin y Cuando se dice que se ha ajustado un anlisis (p. ej., por
que pueden distorsionar la relacin entre ambas1-6. sexo, edad, tabaco, etc.) es que se ha tratado de impedir
El modo de controlarlas o de ajustar por ellas es que estos factores (sexo, edad, tabaco, etc.) provoquen
introducirlas en un modelo como un trmino o va- tales despropsitos.
riable independiente ms (otra xi), que se aade Por todos estos motivos, y aunque la edad y el sexo no
junto con la exposicin de inters. siempre introducirn confusin necesariamente, hoy en
da los anlisis estadsticos siempre se suelen presentar
Por ejemplo, si se realiza un estudio prospectivo para ajustados al menos por la edad y el sexo.
conocer la influencia del consumo de alcohol sobre acci-
dentes de trfico, es posible que diversos factores como ser Al leer lo anterior se comprender por qu es importante
hombre o mujer, conducir ms o menos kilmetros al ao, conocer el anlisis multivariable. Los modelos multivariables
o tener ms o menos edad, se relacionen con el consumo tambin son tiles para valorar si los efectos de una variable
independiente se modifican por otra (interaccin) y para es-
*Vase: www.unav.es/departamento/preventiva/sp-mv tudiar mejor la forma de las relaciones dosis-respuesta.
2013. Elsevier Espaa, S.L. Reservados todos los derechos 33
Descargado de ClinicalKey.es desde Universidad Nacional Autonoma de Mexico febrero 12, 2017.
Para uso personal exclusivamente. No se permiten otros usos sin autorizacin. Copyright 2017. Elsevier Inc. Todos los derechos reservados.
34 CONCEPTOS DE SALUD PBLICA Y ESTRATEGIAS PREVENTIVAS

Por eso a=2,30.


La calidad de un anlisis multivariable depende, en gran parte,
En cambio en los bebedores, la variable x=1 y el modelo
de la calidad de los datos recogidos. Se suele decir que si se
ser:
introduce basura en un modelo, por sofisticado que ste sea,
el resultado tambin ser basura (garbage in, garbage out). ln(odds1) = a + b

Como la odds en los bebedores es 0,6, su logaritmo


neperiano ser:
Ejemplo sencillo de regresin ln(0,6) = 0,5108
logstica
De aqu se deduce que b=+1,7918, ya que:
Supongamos que se comparan 16 bebedores de alcohol ln(odds1) = a + b = 2,3026 + 1,7918 = 0,5108
(x=alcohol=1) frente a 44 abstemios (x=alcohol=0).
En los 16 bebedores ocurren 6 accidentes de trfico Pero decamos que la regresin logstica sirve para es-
(y=AT=1), pero en los abstemios ocurren slo 4. La ta- timar OR.
bla de frecuencias sera la que aparece en la figura 5-1. Se Si restamos ambas ecuaciones y trabajamos algebrai-
muestra en la figura cmo se podran incluir los datos en camente con ellas:
un programa informtico (Stata, en este caso). ln(odds1) ln(odds0) = (a + b) a = b
Para calcular una odds se divide el nmero de quienes
tienen una caracterstica entre el nmero de quienes no la ln(odds1/odds0) = b
tienen. As, podemos calcular sencillamente que la odds de
ln(OR) = b
tener un accidente es 6/10=0,6 en bebedores y 4/40=0,1 en
abstemios. No se debe uno equivocar y dividir entre el total OR = exp(b)
(p. ej., 4/44 para los no bebedores, porque hemos dicho que
la odds resulta de dividir los que s entre los que no tuvieron Puede comprobarse numricamente en el ejemplo:
el acontecimiento, por lo que hay que descontar en el deno- OR = exp(1,79) = 6
minador a los 4 que s lo tuvieron y quedar 4/40)*.
Si dividimos una odds entre otra odds tendremos una Ya casi al principio del ejemplo habamos dicho que
odds ratio (OR) o razn de odds4-7: OR=6=0,6/0,1.
odds
Todo esto puede parecer complicado la primera vez que
0,6
1=6/10
OR = ____ ____= ___
4/40 0,1
= 6 se ve, pero hay que tener en cuenta que habitualmente se
odds0
La OR=6 se interpreta como que la odds de tener un realiza con ordenador y resulta bastante sencillo; adems,
accidente es 6 veces superior en bebedores que en abs- proporcionar los intervalos de confianza y la significacin
temios. estadstica (valor p) para la OR. La figura 5-1 presenta
El modelo de regresin logstica sirve para estimar odds esquemticamente los pasos que hay que dar con un soft-
ratios y se expresa as: ware convencional para obtener una regresin logstica.
Se puede pensar que para llegar a este resultado bas-
ln(odds) = a + bx tara dividir 0,6 entre 0,1 y obtener OR=6 sin tanto reco-
donde ln significa logaritmo neperiano. rrido. Pero la ventaja del modelo de regresin logstica es
Salvo por el logaritmo, esto recuerda a la ecuacin sim- que permite ampliar la ecuacin y ajustar as por posibles
ple de una lnea recta (y=a+bx). Aqu tambin a es una (i) factores de confusin:
constante u ordenada en el origen y b es la pendiente ln(odds) = a + b1x1 + b2x2 + b3x3 + b4x4 + bixi
de la lnea de regresin8-14. La variable x representa la
Esto ya no se puede hacer a mano. Por ejemplo, si
exposicin al alcohol (x=0 para abstemios y x=1 para
quisisemos ajustar por sexo, kilmetros conducidos en
bebedores).
un ao y edad, definiramos as el modelo8-14:
En el ejemplo anterior, a valdra 2,30 y b, 1,79.
Esto es as porque en los abstemios (x=0) y al multiplicar ln(oddsdeAT) = a + b1alcohol + b2sexo + b3kilmetros + b4edad
por 0 la b, el modelo queda reducido slo a la ordenada As se podra obtener una OR ajustada por sexo, kil-
en el origen: metros conducidos al ao y edad.
ln(odds0) = a
ORajustada = exp(b1)
Como la odds en los abstemios es 0,1, su logaritmo Esta OR ajustada equivaldra a comparar la odds de
neperiano ser: accidente de trfico (AT) entre dos personas que son del
ln(0,1) = 2,3026 mismo sexo, conducen el mismo nmero de kilmetros
al ao y tienen la misma edad, pero una es bebedora y la
*Matemticamente podra decirse que odds = p/(1-p) donde p otra es abstemia1-6.
es la proporcin (en una proporcin el numerador siempre estar Hay que recurrir al ordenador para hacerlo, pero
incluido en el denominador). esto da una visin ms realista (menos confundida) del

Descargado de ClinicalKey.es desde Universidad Nacional Autonoma de Mexico febrero 12, 2017.
Para uso personal exclusivamente. No se permiten otros usos sin autorizacin. Copyright 2017. Elsevier Inc. Todos los derechos reservados.
CAPTULO 5 Conceptos bsicos de anlisis multivariable 35

Figura 5-1 Ejemplo sencillo de regresin logstica.

v erdadero efecto del alcohol como causante de accidentes est en el correspondiente quintil y 0 en caso contrario.
de trfico. No obstante, esa nueva OR as obtenida toda- Como la variable original quintiles tena 5 categoras, el
va puede estar confundida por otros factores no medidos programa ha introducido 4 trminos o variables dummies
o no incluidos en la ecuacin y se dira que es posible que en el modelo (todas las categoras menos una). Por ejemplo,
haya confusin residual. para los quintiles de edad, tendramos (tabla 5-3):
El ejemplo de la tabla 5-1 corresponde a un anlisis de
la misma hiptesis pero realizado con un tamao muestral _Ied5_2: segundo quintil de edad.
muy superior y ajustando por numerosas variables. _Ied5_3: tercer quintil de edad.
_Ied5_4: cuarto quintil de edad.
_Ied5_5: quinto quintil de edad.
Variables con ms de dos
categoras: variables dummy La categora que no se introduce es la que queda como
estrato de referencia frente al cual se realizarn todas las
Cuando se desea introducir como independiente una va- comparaciones. Aqu, en el ejemplo, la referencia son
riable cualitativa que tenga 3 o ms categoras, se debe los participantes del primer quintil de edad, que sera:
elegir primero cul ser la categora de referencia (el suelo _Ied5_1: primer quintil de edad.
frente al que se compararn las dems) y crear una nueva Lo mismo se hace con la variable kilmetros conducidos
Elsevier. Fotocopiar sin autorizacin es un delito.

variable para cada una de las dems categoras, es decir, se al ao, que se categoriza en quintiles y se toma la categora
crearn tantas variables como categoras tenga la variable inferior (los que menos conducen) como referencia frente a
original menos una. A este procedimiento se lo denomina a la cual se comparan los riesgos de cada uno de los dems
veces factorizacin y a las variables derivadas se las llama quintiles de kilmetros conducidos al ao.
variables indicadoras o variables dummy8-14.
Por ejemplo, en la tabla 5-2 se comparan 5 categoras
(quintiles) de edad y tambin 5 quintiles de kilmetros Variables independientes continuas
conducidos al ao. La variable cualitativa de agrupacin
tendr, por tanto, estos 5 niveles o categoras. Se considerar Trabajar con quintiles haciendo 4 variables dummies suele
el primer quintil como categora de referencia y se crearn ser un primer paso para valorar la relacin entre una varia-
cuatro nuevas variables (quintiles 2 a 5). Esto sirve para ble independiente continua (edad, kilmetros conducidos) y
comparar cada una de ellas frente a un grupo control que se- el acontecimiento de resultado (variable dependiente).
ra el primer quintil. Las nuevas variables, que suele crearlas Slo cuando se comprueba que a medida que aumenta
automticamente el software correspondiente (Stata las crea la variable independiente se produce un cambio cada vez
llamndolas _Ivariable) valdrn 1 cuando el participante mayor en la OR, y que adems siempre va en la misma

Descargado de ClinicalKey.es desde Universidad Nacional Autonoma de Mexico febrero 12, 2017.
Para uso personal exclusivamente. No se permiten otros usos sin autorizacin. Copyright 2017. Elsevier Inc. Todos los derechos reservados.
36 CONCEPTOS DE SALUD PBLICA Y ESTRATEGIAS PREVENTIVAS

Ta b la 5- 1 Ejemplo de un listado de salida de regresin logstica

.logistic AT alcohol
Logistic regression Number of obs = 1099
LR chi2(1) = 59.51
Prob>chi2 = 0.0000
Log likelihood=351.29593 Pseudo R2 = 0.0781

AT Odds Ratio Std. Err. z P>|z| [95% Conf. Interval]


Alcohol 4.753549 1.029193 7.20 0.000 3.109739 7.266278
.logistic AT alcohol sexo edad
Alcohol 2.761893 1.099546 2.55 0.011 1.265705 6.026723
Sexo .8846457 .1755921 0.62 0.537 .5995364 1.305339
Edad .9482616 .032287 1.56 0.119 .8870455 1.013702
.logistic AT alcohol edad sexo km1000
Alcohol 2.936105 1.186451 2.67 0.008 1.329871 6.482369
Sexo .9048947 .1817199 0.50 0.619 .610465 1.341329
Edad .9484529 .0328276 1.53 0.126 .8862459 1.015026
Km1000 1.342067 .0960019 4.11 0.000 1.166502 1.544056

La base de datos contiene 1.099 sujetos. La variable dependiente es accidente de trfico (AT). Hay tres modelos. El primero, que se llama univariante, bruto o
crudo, contiene una sola variable independiente, el consumo de alcohol (dicotmica: 1=bebedor; 0=abstemio), que es la exposicin o variable independiente
principal. La ORcruda=4,75 (IC del 95%: 3,11-7,27). As estimada, puede estar confundida por otros factores. Al ajustar por edad y sexo se atena la asociacin
entre alcohol y AT (OR=2,76; IC del 95%: 1,27-6,03). La edad se mide en aos y el modelo indica que se reduce el riesgo por cada ao adicional de edad en un
5% aproximadamente (OR=0,95), pero debera testarse si realmente hay o no una relacin lineal entre edad y AT (se probarn quintiles de edad). La OR para
la variable sexo (1=varn; 0=mujer) indica un mayor riesgo (no significativo) en las mujeres, ya que vale 0,88.
El tercer modelo ajusta, adems, por la media de kilmetros conducidos al ao. La variable km1000 mide los kilmetros de 1.000 en 1.000. Por tanto, por cada
1.000km ms que se conducen, el riesgo (odds) aumenta en un 34% (OR=1,34; IC del 95%: 1,17-1,54). Habra que comprobar tambin, mediante quintiles, si
la relacin entre kilmetros conducidos y riesgo de accidente es lineal.

Ta b la 5- 2 Modelo de regresin logstica con variables dummy (indicadoras)

.xi: logistic AT alcohol sexo i.ed5 i.km5


i.ed5 _Ied5_1-5 (naturally coded; _Ied5_1 omitted)
i.km5 _Ikm5_1-5 (naturally coded; _Ikm5_1 omitted)
Logistic regression Number of obs = 1099
LR chi2(10) = 77.28
Prob>chi2 = 0.0000
Log likelihood=342.41118 Pseudo R2 = 0.1014

AT Odds Ratio Std. Err. z P>|z| [95% Conf. Interval]


Alcohol 2.755379 1.23279 2.27 0.023 1.146419 6.62246
Sexo .8867196 .181663 0.59 0.557 .5934715 1.324868
_Ied5_2 .7664645 .1927881 1.06 0.290 .4681556 1.254856
_Ied5_3 .65549 .2917018 0.95 0.343 .2740122 1.568058
_Ied5_4 .2831052 .180236 1.98 0.047 .0812904 .9859534
_Ied5_5 .441689 .2501623 1.44 0.149 .1455513 1.340347
_Ikm5_2 1.968029 .7213672 1.85 0.065 .9594659 4.036765
_Ikm5_3 2.193913 .8137023 2.12 0.034 1.060514 4.538604
_Ikm5_4 2.609235 .9319344 2.69 0.007 1.295661 5.254542
_Ikm5_5 3.021071 1.067705 3.13 0.002 1.511227 6.039375

Para no tener que asumir que la relacin entre edad y riesgo de accidente es continuamente decreciente, ni que la relacin entre kilmetros conducidos y riesgo
es continuamente creciente, se han creado quintiles de las variables edad y kilmetros conducidos (ed5 y km5, respectivamente). Estas variables tienen valores
desde 1 para el primer quintil y as sucesivamente hasta ed5=5 para el quinto quintil de edad y km5=5 para el de kilmetros conducidos. Como hay 5 categoras,
STATA crea automticamente 4 variables indicadoras (dummy) que permiten contrastar el riesgo de cada uno de los 4 quintiles superiores frente al quintil inferior
(que queda siempre como referencia), sin asumir ninguna forma particular de la relacin dosis-respuesta. La categora de referencia ser el primer quintil, que
tendr, por definicin, OR=1, y por eso no aparece en el listado.

Descargado de ClinicalKey.es desde Universidad Nacional Autonoma de Mexico febrero 12, 2017.
Para uso personal exclusivamente. No se permiten otros usos sin autorizacin. Copyright 2017. Elsevier Inc. Todos los derechos reservados.
CAPTULO 5 Conceptos bsicos de anlisis multivariable 37

Ta b la 5- 3 Creacin de variables dummy (indicadoras) en un ensayo con tres brazos de intervencin


(PREDIMED)

Variables DUMMY Control MeDiet+Aceite de oliva MeDiet+frutos secos


_DUMMY1 (aceite) 0 1 0
_DUMMY2 (frutos secos) 0 0 1

Modelo general: ln(odds)=a+b1 _DUMMY1+b2 _DUMMY2


Modelo si aceite de oliva: ln(oddsACEITE)=a+b1 _DUMMY1
Modelo si frutos secos: ln(oddsF. SECOS)=a+b2 _DUMMY2
Modelo si control: ln(oddsCONTROL)=a
b1=ln(oddsACEITE)ln(oddsCONTROL)=ln (oddsACEITE/oddsCONTROL) = ln (OR1)
b2=ln(oddsF. SECOS)ln(oddsCONTROL)=ln (oddsF. SECOS/oddsCONTROL) = ln (OR2)

direccin (siempre creciente o siempre descendente), sera de alcohol, pero uno conduce 1.000km al ao ms que el
permisible introducir la variable como continua, cosa que otro. Se asume que este cociente (1,34) es invariable para
no sucede en el ejemplo para la edad (el riesgo va bajan- todo el rango de posibles kilmetros conducidos por cada
do hasta el quintil 4, pero luego sube en el quinto quintil unidad de cambio, es decir, por cada 1.000km/ao ms
respecto al cuarto), pero s sucede con los kilmetros con- que se conduzcan siempre se multiplicar la odds por 1,34,
ducidos (tendencia siempre creciente)8-14. independientemente de que se estn comparando 2.000km/
En la tabla 5-4 se vuelve a repetir el ejemplo, pero esta ao con 1.000km/ao o 25.000 frente a 24.000km/ao.
vez introduciendo los kilmetros conducidos al ao (en Si se desease estimar qu OR correspondera a conducir
miles) como variable continua (km1000). La OR resulta 10.000km ms, se debera elevar a 10 la OR encontrada:
ser 1,34 y se interpreta como el cociente entre dos odds, las de
dos participantes que tienen igual edad, sexo y consumo OR+10.000km = (OR+1.000km)10 = (1,34)10 = 18,7

Ta b la 5- 4 Modelo de regresin logstica con una variable independiente cuantitativa continua (km1000)

.xi: logistic AT alcohol sexo i.ed5 km1000


i.ed5 _Ied5_1-5 (naturally coded; _Ied5_1 omitted)
Logistic regression Number of obs = 1099
LR chi2(7) = 82.59
Prob>chi2 = 0.0000
Log likelihood=339.75666 Pseudo R2 = 0.1084

AT Odds Ratio Std. Err. z P>|z| [95% Conf. Interval]


Alcohol 2.810513 1.265433 2.30 0.022 1.162873 6.792645
Sexo .897807 .1846576 0.52 0.600 .5999445 1.343553
_Ied5_2 .7674293 .19386 1.05 0.295 .4677531 1.259099
_Ied5_3 .6580495 .294754 0.93 0.350 .2735191 1.583177
_Ied5_4 .2792784 .1785164 2.00 0.046 .0797892 .9775306
_Ied5_5 .4480651 .2550841 1.41 0.158 .1468084 1.367513
Km1000 1.34069 .0961784 4.09 0.000 1.164836 1.543092
Elsevier. Fotocopiar sin autorizacin es un delito.

AT Coef. Std. Err. z P>|z| [95% Conf. Interval]


.xi: logit AT alcohol sexo i.ed5 km1000
Alcohol 1.033367 .4502499 2.30 0.022 .1508933 1.91584
Sexo .1078001 .2056762 0.52 0.600 .5109181 .2953179
_Ied5_2 .2647089 .2526096 1.05 0.295 .7598146 .2303968
_Ied5_3 .4184751 .4479207 0.93 0.350 1.296384 .4594334
_Ied5_4 1.275546 .6392059 2.00 0.046 2.528367 .0227257
_Ied5_5 .8028168 .5693014 1.41 0.158 1.918627 .3129934
Km1000 .2931844 .071738 4.09 0.000 .1525806 .4337882
_cons 2.973304 .5358451 5.55 0.000 4.023542 1.923067

Se siguen usando cuatro variables indicadoras (dummy) para la edad (v. tabla 5-3). En cambio, ahora se usa una sola variable (km1000) para los kilmetros
conducidos (en miles). Su OR (1,34) indica que el riesgo (odds) aumenta relativamente en un 34% por cada 1.000km ms que se conduzcan al ao. El modelo
asume que da igual pasar de 0 a 1.000km al ao que de 4.000 a 5.000, la OR en ambos casos sera la misma.
La parte inferior de la tabla presenta un modo alternativo de obtener el modelo, basado en los coeficientes (coeficiente=ln[OR]) en vez de estar basado en OR.
En este modelo aparece la constante a.

Descargado de ClinicalKey.es desde Universidad Nacional Autonoma de Mexico febrero 12, 2017.
Para uso personal exclusivamente. No se permiten otros usos sin autorizacin. Copyright 2017. Elsevier Inc. Todos los derechos reservados.
38 CONCEPTOS DE SALUD PBLICA Y ESTRATEGIAS PREVENTIVAS

Con mucha frecuencia se introduce la edad como varia-


ble cuantitativa continua en los modelos multivariables,
pero antes debera comprobarse que hay un patrn de
riesgo sistemticamente creciente con cada ao ms de
edad. Si no fuese as, no sera vlido introducir la edad
como variable cuantitativa continua.
Otra consecuencia de introducir la edad como continua
es que la OR que se obtiene suele estar muy prxima a 1
(p. ej., OR=1,03). Esta estimacin da una falsa impresin
de que la edad no influye casi nada en el riesgo. Pero no debe
olvidarse que esa OR corresponde a la comparacin entre
dos personas que slo se diferencian en un ao de edad.
Podra elevarse a 10 y entonces s se vera que esa OR
corresponde a un 34% ms de riesgo (OR=1,34) al com-
parar personas cuya edad se diferencia en 10 aos8-14. Una
variable continua que se mantiene en su escala de medicin
original tendr mayor potencia estadstica en comparacin
con la misma variable si se recodifica en estratos de inter- Figura 5-2 Modelo de regresin logstica: probabilidades predi-
chas (pred) de accidente de trfico en funcin de los kilmetros
valo, como, por ejemplo, cuartiles o quintiles. conducidos.

un rango ms bien estrecho de kilmetros conducidos; a


Predicciones y probabilidades partir de ese rango, los incrementos en los kilmetros con-
absolutas ducidos ya no aumentan mucho la probabilidad predicha
porque podra decirse que est tocando techo. Esta curva
La regresin logstica permite hacer predicciones sobre pro- en forma de S se adapta bien al patrn dosis-respuesta de
babilidades absolutas de presentar un acontecimiento8-14. muchos fenmenos biolgicos.
Si miramos la tabla 5-4 e imaginamos un varn (sexo=1)
que tiene 26 aos (est en el quintil inferior de la edad), que
Nunca deben usarse los modelos multivariables para hacer
conduce 5.000km al ao y que es bebedor (alcohol=1),
predicciones fuera del rango de valores observados para las
su ecuacin sera:
variables independientes.
ln(oddsdeAT) = a + b1alcohol + b2sexo + b3km1000 + b4edad(dummy_i)

Tomando los coeficientes de la tabla 5-4, resultara:


Modelo de regresin
ln(oddsdeAT) = 2,973 + 1,033 + 0,1078 + 0,2932 5 linealmltiple
ln(oddsdeAT) = 0,5818
Las cosas se simplifican mucho cuando la variable de-
Por tanto: pendiente es cuantitativa (peso, colesterol total, presin
Odds = exp( 0,5818) = 0,5589 arterial). Entonces el modelo queda as:

Para pasar de una odds a una probabilidad, se debe y = a = b1x1 + b2x2 + b3x3 + b4x4 + bixi
aplicar la frmula: Los coeficientes bi representaran simples diferencias
0,5589
odds
p = _______ = _________

= 0,359 de medias (entre valores sucesivos de xi).
1 + odds 1 + 0,5589
Por ejemplo, el siguiente modelo (tabla 5-5) predice la
Se estimar que la probabilidad de tener un acciden- presin arterial sistlica (PAS) a partir de sexo (1=varn,
te segn estos valores para las variables independientes 0=mujer), edad (aos) e ndice de masa corporal (IMC
(edad, sexo, km1000 y alcohol) es del 35,9%. en kg/m2):
Esta estimacin de probabilidades absolutas es factible
cuando el diseo es transversal o de seguimiento, pero no PAS = a + b1sexo + b2edad + b3IMC
lo es en estudios de casos y controles.
PAS = 84,5 + 7,17sexo + 0,28edad + 0,77IMC
En la figura 5-2 se representan grficamente las pre-
dicciones del modelo en funcin de los kilmetros con- Este modelo predecira:
ducidos para un varn del quintil inferior de edad y que
est expuesto al alcohol. Puede apreciarse que el modelo Para un varn de 40 aos con un IMC=25, una
logstico predice la probabilidad entre los lmites de 0 y PAS=122,12mmHg.
1 y adems produce una curva en forma de S, donde Para una mujer de 20 aos con un IMC=20, una
el cambio de probabilidad de tener un accidente se da en PAS=105,5mmHg.

Descargado de ClinicalKey.es desde Universidad Nacional Autonoma de Mexico febrero 12, 2017.
Para uso personal exclusivamente. No se permiten otros usos sin autorizacin. Copyright 2017. Elsevier Inc. Todos los derechos reservados.
CAPTULO 5 Conceptos bsicos de anlisis multivariable 39

Ta b la 5- 5 Modelo de regresin lineal mltiple

Sin interaccin
Source SS df MS
.regress tas sex age bmi
Model 468582.642 3 156194.214 Number of obs=8530
Residual 1241605.86 8526 145.625834 F(3,8526)=1072.57
Total 1710188.51 8529 200.514539 Prob>F=0.0000
R-squared=0.2740
Adj R-squared=0.2737
Root MSE=12.068
tas Coef. Std. Err. t P>|z| [95% Conf. Interval]
sex 7.171474 .311738 23.00 0.000 6.560392 7.782556
age .2794623 .0118846 23.51 0.000 .2561657 .302759
bmi .7682575 .0451839 17.00 0.000 .6796861 .8568289
_cons 84.50656 .9853465 85.76 0.000 82.57504 86.43807
Con interaccin
Source SS df MS
Model 474627.833 4 118656.958 Number of obs=8530
Residual 1235560.67 8525 144.933803 F(4,8525)=818.70
Total 1710188.51 8529 200.514539 Prob>F=0.0000
R-squared=0.2775
Adj R-squared=0.2772
Root MSE=12.039
tas Coef. Std. Err. t P>|z| [95% Conf. Interval]
sex 13.15265 .9769408 13.46 0.000 11.23761 15.06769
age .3514267 .0162707 21.60 0.000 .3195322 .3833212
bmi .7516654 .0451496 16.65 0.000 .6631614 .8401695
sexage .1473337 .022813 -6.46 0.000 .1920526 .1026147
_cons 82.29236 1.041074 79.05 0.000 80.2516 84.33312

Se interpreta que 7,17 es la diferencia de PAS entre La ltima variable (sexoedad) valdr 0 en las mu-
varones y mujeres (a igualdad de edad e IMC) y que jeres (0edad=0) y, en cambio, equivaldr a la edad
0,28mmHg/ao es el aumento que experimenta la PAS (1edad=edad) en los varones. Los coeficientes aparecen
por cada ao ms de edad. De la misma manera, por en la parte inferior de la tabla 5-5. Puesto que los trmi-
Elsevier. Fotocopiar sin autorizacin es un delito.

cada unidad ms (kg/m 2) de IMC la PAS aumenta en nos que van multiplicados por sexo desaparecen en las
0,77 mmHg8-11,13,14. La ordenada en el origen (constante mujeres (sexo=0) y simplemente multiplican por 1 en los
a, o intercept en ingls) representar el valor de la varones, se pueden deducir realmente dos modelos, uno
PAS en el caso imposible de que sexo, edad e IMC tuvie- para varones y otro para mujeres:
sen todos el valor 0.
Pero cabra preguntarse: es igual el aumento por cada
Mujeres: PAS=82,3+0,35edad+0,75IMC
ao de edad entre varones y mujeres, o es posible que en
Varones: PAS= 82,3+ 13,5+ 0,35edad 0,15
las mujeres el aumento de la PAS con la edad sea superior?
edad+0,75IMC = PAS=95,8+0,20 edad+0,75IMC
Esto correspondera al concepto de interaccin o modifi-
cacin del efecto, ya que supondra que el sexo modifica
Es decir, la ordenada en el origen es superior para el
el efecto de la edad4-6,13,15.
modelo masculino, mientras que la pendiente es superior
Para eso se introduce un trmino multiplicativo en el
para el modelo femenino.
modelo y quedara as:
Esta interaccin muestra una realidad biolgica y es que
PAS = a + b1sexo + b2edad + b3IMC + b4sexo edad el incremento de PAS con la edad es mayor en la mujer.

Descargado de ClinicalKey.es desde Universidad Nacional Autonoma de Mexico febrero 12, 2017.
Para uso personal exclusivamente. No se permiten otros usos sin autorizacin. Copyright 2017. Elsevier Inc. Todos los derechos reservados.
40 CONCEPTOS DE SALUD PBLICA Y ESTRATEGIAS PREVENTIVAS

deben parecerse a los retenidos; aunque lo mejor siem-


Todo anlisis multivariable debe precederse de un concienzudo
pre es minimizar las prdidas y hacer un seguimiento
trabajo de tabulacin y descripcin de los datos. De lo con-
exhaustivo.
trario, es fcil cometer errores por perder el contacto con los
datos. Casi todos los errores se producen al codificar o etique- Cuando se emplea el modelo de regresin de Cox se
tar variables o al transformar una variable en otra. El anlisis asume que la razn de tasas instantneas es constante a
multivariable puede parecer fcil con el software actual, pero lo largo del tiempo (las hazards son proporcionales, de
tambin esto hace que sea ms fcil equivocarse. ah su nombre en ingls: proportional hazards model).
Hay mtodos para verificar si es cierta esta suposicin y
tambin hay tcnicas que permiten trabajar con modelos
de riesgos no proporcionales cuya descripcin y anlisis
Regresin de cox requeriran mucha ms extensin que la que permite este
captulo.
La regresin de Cox, tambin llamada modelo de ries- La interpretacin de una regresin de Cox es muy
gos proporcionales (proportional hazards model), es una parecida a la de la regresin logstica. El parmetro de
tcnica muy difundida, que se parece mucho a la regresin asociacin que se obtiene con la regresin logstica es la
logstica, pero requiere tener en cuenta, adems, los tiem- odds ratio; en cambio, el que se obtiene en la regresin de
pos variables de seguimiento de cada participante en un Cox es una hazard ratio8-11,13,14,16.
estudio8-11,13,14,16. No se aplica, por tanto, en estudios que Para entender una hazard ratio17 es preciso entender an-
no hayan hecho seguimiento. tes qu es una hazard. El trmino hazard (l) corresponde
Est indicado su uso cuando la variable dependiente es- a una tasa instantnea, que conceptualmente slo requiere
t relacionada con la supervivencia de un grupo de sujetos una duracin de tiempo infinitesimal (instantnea) para
o, en general, con el tiempo que trascurre hasta que se que ocurra el suceso.
produce en ellos un determinado acontecimiento. Como Se entender esto si se piensa en dos grupos de pacientes
para otras tcnicas de anlisis de supervivencia (p. ej., (a y b) que se representan en la figura 5-3. En cada grupo
Kaplan-Meier), no es necesario que el acontecimiento de hay 6 pacientes, seguidos hasta un mximo de 5 aos, pero
inters sea la muerte; puede ser otro suceso, por ejemplo, el tiempo de seguimiento vara de uno a otro paciente y
el fallo de una prtesis, la incidencia de una enfermedad este seguimiento de cada uno se representa por una lnea
o la ocurrencia de una complicacin en quien ya tiene horizontal. Una D significa el momento en que ocurre la
una patologa de base. Lo importante es que se trate de muerte de un paciente y una A significa el final del segui-
un suceso que slo ocurra una vez. Para sucesos o com- miento para un paciente que estaba vivo al final del estudio.
plicaciones que se repiten ms de una vez en algunos pa- Se usa el signo de interrogacin para aquellos pacientes
cientes durante el seguimiento, sera dudosamente vlida que se perdieron, pero de quienes la ltima noticia que se
la regresin de Cox y probablemente habra que recurrir tiene es que seguan vivos.
a la regresin de Poisson. En el grupo a se ha producido una muerte a los 2 aos
La regresin de Cox se usa para valorar simultnea- y haba 5 pacientes en riesgo de morir en ese momento
mente el efecto independiente de una serie de variables (el primero slo haba permanecido un ao y medio en el
explicativas o factores pronsticos sobre la tasa de ocu- estudio y por eso a los 2 aos ya no estaba en riesgo).
rrencia del acontecimiento de inters tras un perodo de La hazard se calcula simplemente dividiendo los sucesos
tiempo variable en cada sujeto. ocurridos en ese instante (tiempo=2 aos) entre el total
La regresin de Cox es la extensin multivariable del de sujetos en riesgo.
anlisis de supervivencia para evaluar de manera general
variables dependientes del tipo tiempo hasta un suceso
o acontecimiento, y usa modelos de regresin, prximos
al modelo de regresin logstica. El modelo de regresin
de Cox tambin permite predecir las probabilidades de
supervivencia (o, en general, de permanencia libre del
acontecimiento o enfermedad) para un determinado sujeto
a partir del patrn de valores que presenten sus variables
pronsticas.
Debe tenerse en cuenta que la regresin de Cox
asume algunos de los mismos supuestos que el mtodo
de Kaplan-Meier: el suceso debe ser irreversible, debe
poder ocurrir una sola vez y la censura no debe ser in-
formativa. Desde el punto de vista prctico, este ltimo
supuesto puede interpretarse en el sentido de que los
que se pierdan por el camino mientras se est haciendo Figura 5-3 Clculo de la hazard a 2 aos (l2) en dos grupos (a
el seguimiento no deben ser sujetos peculiares, sino que y b) de 6 pacientes.

Descargado de ClinicalKey.es desde Universidad Nacional Autonoma de Mexico febrero 12, 2017.
Para uso personal exclusivamente. No se permiten otros usos sin autorizacin. Copyright 2017. Elsevier Inc. Todos los derechos reservados.
CAPTULO 5 Conceptos bsicos de anlisis multivariable 41

sucesosocurridosenelinstantet
hazardt = lt_____________________
se pueden hacer ms comparaciones, pues en esta base de
sucesosenriesgoenelinstantet
d
datos slo hay muertes a los 2, 3,5 y 5 aos. Obviamente,
sucesosocurridosenelinstantet
hazardt = lt_____________________ = __
nt si no se observan muertes no se pueden comparar sus
sucesosenriesgoenelinstantet t

d 1
riesgos de mortalidad.
Grupoa) hazard2aos=l2/a) = __n = __
2
5= 0,2 Lo que hace el modelo de Cox es promediar de manera
2

d ponderada las hazard ratios de los diversos momentos en


Grupob) hazard2aos=l2/b) = __ 26= 0,33
n2= __
2 los que se produce alguna muerte. Viene a ser como hacer
La hazard a los 2 aos ser 0,2 en el grupo a y 0,33 muchas regresiones logsticas, una para cada momento en
en el grupo b. se observa alguna muerte y, posteriormente, ponderarlas
Se sabe que una odds ratio es una razn de odds. Una y promediarlas.
hazard ratio es simplemente una razn de hazards. Para Al final, desde el punto de vista prctico, se obtendrn
comparar ambos grupos (a y b) se dividir una hazard hazard ratios, como en la regresin logstica se obtenan
entre otra. Si se toma como referencia el grupo a, la hazard odds ratios, y la interpretacin es muy parecida.
ratio para el grupo b respecto al a ser:
hazard 0,33
hazardratio = HR = ______
b
= ____
0,2= 1,67
hazarda
Ejemplo sencillo de regresin de Cox
El grupo b tiene una mortalidad que es 1,67 veces En la tabla 5-6 se exponen unos datos sencillos donde cada
mayor que la del grupo b, es decir, la mortalidad es un participante proporciona tres datos: a) si es fumador
67% superior en el grupo b. Pero esta comparacin slo o no; b) si falleci o no, y c) cunto tiempo estuvo en
se refiere a los 2 aos. observacin hasta su fallecimiento o bien hasta el final del
Si se los comparase a los 3,5 aos, su hazard ratio sera estudio en el caso de los pacientes que no fallecieron. Ha-
1. Si se los comparase a los 5 aos, tambin sera 1. No ba 10.000 fumadores y 10.000 no fumadores. Murieron

Ta b la 5- 6 Ejemplo sencillo de regresin de Cox

Muertes a los
14 meses 17 meses 28 meses Vivos a 44 meses
Fumadores 4 4 4 9.988
No fumadores 1 1 1 9.997
Introduccin datos en STATA
Fumar Acontecimiento Tiempo N
1 1 14 4
1 1 17 4
1 1 28 4
1 0 44 9.988
0 1 14 1
0 1 17 1
0 1 28 1
Elsevier. Fotocopiar sin autorizacin es un delito.

0 1 44 9.997
Anlisis con STATA
.expand n
.stset tiempo, failure(acontecimiento=1)
.stcox fumar
Resultados
No. of subjects=20000 Number of obs=20000
No. of failures=15
Time at risk=879635
LR chi2(1)=5.79
Log likelihood=145.65604 Prob>chi2=0.0162
_t Haz. ratio Std. err. z P>|z| [95% Conf. interval]
Fumar 4.001201 2.582764 2.15 0.032 1.129125 14.17877

Como podra intuirse al ver los datos, el riesgo de fallecer en cada instante es 4 veces superior en los fumadores. Por eso la hazard ratio vale 4. Es ligeramente
superior a 4 porque los denominadores son cada vez menores en los fumadores.

Descargado de ClinicalKey.es desde Universidad Nacional Autonoma de Mexico febrero 12, 2017.
Para uso personal exclusivamente. No se permiten otros usos sin autorizacin. Copyright 2017. Elsevier Inc. Todos los derechos reservados.
42 CONCEPTOS DE SALUD PBLICA Y ESTRATEGIAS PREVENTIVAS

12 fumadores y 3 no fumadores. El riesgo relativo sera


4. La hazard ratio supone ir valorando en cada tiempo en
que fallece alguien los riesgos especficos de cada uno de
esos momentos (hazards) para los fumadores (4/10.000;
4/9.996 y 4/9.992) y dividirlos entre los riesgos del mismo
tipo en no fumadores (1/10.000; 1/9.999; 1/9.998). Luego
se busca un modo de promediar estos cocientes, pondera-
damente, en funcin de la masa de informacin que exista
para cada tiempo. Al final, la hazard ratio es el promedio
de este cociente y asume que no hay grandes diferencias
en los cocientes instantneos de riesgo entre los diferentes
momentos, sino que bsicamente los cocientes son homo-
gneos y, por tanto, las hazards son proporcionales. Si
las hazards no fuesen proporcionales, los cocientes iran
cambiando con el tiempo de seguimiento y entonces habra
que complicar el modelo aplicando regresin de Cox con
variables dependientes del tiempo8-11,13,14,16.

Figura 5-4 Usos de los modelos multivariables.


Tres usos principales
del anlisis multivariable
res a medida que aumenta la edad). A esto se lo llama
Los usos principales de estos modelos de regresin mul- interaccin. As como la confusin es un error sistem-
tivariable son tres y se representan esquemticamente en tico o sesgo que debe corregirse, la interaccin no es
la figura 5-45,8-14,16: ningn error, sino una realidad biolgica que debe
valorarse y describirse de la mejor manera posible. Se va
El uso ms importante y ms frecuente es el de controlar lora la interaccin mediante trminos de producto (mul-
la confusin. En el panel superior de la figura 5-4, la tiplicacin). La significacin estadstica (valor p) del
y correspondera, por ejemplo, a la funcin cognitiva coeficiente b3 propio del trmino de producto indicar si
(Mini-Mental Test [MMSE], variable dependiente), el apartamiento del paralelismo de ambas lneas es sig-
la lnea superior a los no fumadores (x1=0), la inferior nificativo o no. Cuando sea significativo se podr hablar
a fumadores (x1=1), y en el eje x estara la edad co- de que hay interaccin o modificacin del efecto.
mo variable cuantitativa (x2). Una simple comparacin El tercer uso es introducir trminos cuadrticos o c-
de la media del MMSE entre fumadores y no fuma- bicos que permitan que las relaciones sean en forma de
dores (t de Student) no sera vlida, puesto que si los U o sigan cualquier otro modelo distinto de la rgida
fumadores son ms jvenes, tendrn mejor memoria, a lnea recta (panel inferior de la fig. 5-4). En el ejemplo
pesar de que el tabaco les produzca deterioro cognitivo. de la figura 5-4 (panel inferior) se ha introducido un
Se soluciona el problema introduciendo la variable trmino cuadrtico (x2) para recoger una relacin en
x2 (edad) en el modelo como variable independiente. forma de U. ste sera el caso de lo que sucede, por
Entonces el coeficiente de regresin b1 que acompaa ejemplo, en la relacin entre el consumo de alcohol y
a x1 dar la diferencia entre fumadores y no fumadores el riesgo coronario.
a igualdad de edad, es decir, se consigue comparar un
fumador frente a un no fumador que tenga su misma Los coeficientes de todos estos modelos (bi) no se pue-
edad. Si se introducen otras variables xi (sexo, nivel den calcular a mano, los proporciona el ordenador tras
educativo, antecedentes familiares, alelo de la apoE, introducir los datos y darle las instrucciones adecuadas.
etc.) se puede conseguir reducir la posible confusin
por dichos factores. Se consigue ajustar por todo factor
que se haya introducido en la ecuacin.
Bibliografa
El segundo uso es valorar la interaccin o modificacin
del efecto. En el panel intermedio de la figura 5-4 se 1. Greenland S, Morgenstern H. Confounding in health research.
aprecia que el deterioro cognitivo se acelera ms con la Annu Rev Public Health. 2001;22:189-212.
edad en los fumadores que en los no fumadores. Las 2. De Irala J, Martnez-Gonzlez MA, Guilln Grima F. Qu es
diferencias segn el tabaco no son homogneas sino que una variable de confusin? Med Clin (Barc). 2001;117:377-85.
aumentan con la edad. El tabaco modificara el efecto (Med Clin [Barc]. 2001;117:775).
3. Hernn MA, Hernndez-Diaz S, Werler MM, Mitchell
de la edad (mayor deterioro cognitivo asociado a la edad AA. Causal knowledge as a prerequisite for confounding
en fumadores) y la edad modificara el efecto del taba- evaluation: an application to birth defects epidemiology. Am J
co (mayores diferencias entre fumadores y no fumado- Epidemiol. 2002;155:176-84.

Descargado de ClinicalKey.es desde Universidad Nacional Autonoma de Mexico febrero 12, 2017.
Para uso personal exclusivamente. No se permiten otros usos sin autorizacin. Copyright 2017. Elsevier Inc. Todos los derechos reservados.
CAPTULO 5 Conceptos bsicos de anlisis multivariable 43

4. De Irala J, Martnez-Gonzlez MA, Segu-Gmez M. 12. Hosmer DW, Lemeshow S. Applied logistic regression, 2. ed.
Epidemiologa aplicada. 2. ed. Barcelona: Ariel; 2008. Hoboken: John Wiley & Sons; 2000.
5. Rothman KJ, Greenland S, Lash TL. Modern Epidemiology. 13. Katz MH. Multivariable Analysis: A Practical Guide for
3. ed. Filadelfia: Lippincott Williams & Wilkins; 2008. Clinicians and Public Health Researchers, 3. ed. Cambridge:
6. Gordis L. Epidemiology, 4. ed. Filadelfia: Saunders Elsevier; Cambridge University Press; 2011.
2009. 14. Ware JH, Mosteller F, Delgado F, Donnelly C, Ingelfinger JA.
7. Martnez-Gonzlez MA, de Irala J, Guilln-Grima F. Qu es P Values. En: Bailar JC III, Hoaglin DC, eds. Medical uses of
una odds ratio? Med Clin (Barc). 1999;112:416-22. statistics, 3. ed. Boston: New England Journal of Medicine; 2009.
8. Martnez-Gonzlez MA, Snchez-Villegas A, Fauln Fajardo 15. De Irala J, Martnez-Gonzlez MA, Guilln-Grima F. Qu
FJ, eds. Bioestadstica amigable, 2. ed. Madrid: Daz es una variable modificadora del efecto? Med Clin (Barc).
deSantos; 2006. 2001;117:297-302.
9. Sents J, Pardell H, Cobo E, Canela J. Bioestadstica. 2. ed. 16. Hosmer DW, Lemeshow S, May S. Applied Survival Analysis:
Barcelona: Masson; 1995. Regression Modeling of Time to Event Data (Wiley Series in
10. Carrasco JL, Hernn MA, Martn-Hortelano C. El mtodo Probability and Statistics). 2. ed. Hoboken: John Wiley &
estadstico en la investigacin mdica. Madrid: Ciencia; 1995. Sons; 2008.
11. Kleinbaum DG, Kupper LL, Nizam A, Muller KE. Applied 17. Martnez-Gonzlez MA, Alonso A, Lpez-Fidalgo J. Qu
regression analysis and multivariable methods (Duxbuy es una hazard ratio? (nociones de anlisis de supervivencia).
applied), 4. ed. Belmont: Thomson Higher Education; 2008. Med Clin (Barc). 2008;131:65-72.
Elsevier. Fotocopiar sin autorizacin es un delito.

Descargado de ClinicalKey.es desde Universidad Nacional Autonoma de Mexico febrero 12, 2017.
Para uso personal exclusivamente. No se permiten otros usos sin autorizacin. Copyright 2017. Elsevier Inc. Todos los derechos reservados.
Descargado de ClinicalKey.es desde Universidad Nacional Autonoma de Mexico febrero 12, 2017.
Para uso personal exclusivamente. No se permiten otros usos sin autorizacin. Copyright 2017. Elsevier Inc. Todos los derechos reservados.
A utoevaluaci n

1. Si se observa que la odds ratio (OR) cruda de c-HDL bajo es de 2,5 para la cardiopata isqumica, pero al
ajustar este resultado por el nmero de cigarrillos fumados al da la OR es de 1,3. Es cierto que:
a) Existe interaccin entre c-HDL y tabaco
b) El c-HDL modifica la relacin entre consumo de tabaco y cardiopata isqumica
c) El c-HDL causa un sesgo de informacin
d) La verdadera OR es 2,5
e) La verdadera OR es 1,3
Correcta: e. Cuando se dice que se ha ajustado un anlisis (p. ej., por sexo, edad, tabaco, etc.) es que se ha
tratado de impedir que estos factores (sexo, edad, tabaco, etc.) distorsionen la medida de asociacin. Por tanto,
la OR vlida es la ajustada, es decir, la que tiene en cuenta el efecto del nmero de cigarrillos fumados.

2. Se pretende predecir las cifras de c-LDL a partir del sexo, la edad, las cifras de presin arterial y la actividad
fsica. Se recurrir a:
a) t de Student para muestras independientes
b) Ji al cuadrado de tendencia lineal
c) Modelo de regresin lineal mltiple
d) Modelo de regresin logstica
e) Modelo de regresin de Cox
Correcta: c. Los modelos multivariables son tiles para predecir el valor de una variable a partir de los valores
de otras, o la probabilidad absoluta de presentar un desenlace. Como la variable dependiente (c-LDL) es continua,
recurriremos a un modelo de regresin lineal mltiple.

3. En un estudio sobre deterioro cognitivo, los resultados del anlisis multivariable muestran que el deterioro
cognitivo se acelera ms con la edad en los fumadores que en los no fumadores. Las diferencias segn el tabaco
no son homogneas sino que aumentan con la edad, de manera que hay un mayor deterioro cognitivo asociado
a la edad en fumadores y hay mayores diferencias entre fumadores y no fumadores a medida que aumenta la
edad. Con esta informacin usted concluye que:
a) Hay interaccin entre el tabaco y el deterioro cognitivo
b) nicamente se ha ajustado por edad y no por tabaco
c) La edad y el tabaco son factores de confusin en este estudio
d) En el anlisis multivariable se ha introducido un trmino de producto edad*tabaco
e) Se ha cometido un sesgo de seleccin, ya que la distribucin de fumadores segn la edad no es homognea
Correcta: d. Para saber el efecto de la edad en el deterioro cognitivo ser necesario conocer si se es o no fumador,
pues el efecto de la edad depende del tabaco. Es decir, hay una interaccin entre las dos exposiciones. Para evaluar
la interaccin, introducimos en el modelo multivariable un trmino de producto (edad*tabaco).

2013. Elsevier Espaa, S.L. Reservados todos los derechos e-13


Descargado de ClinicalKey.es desde Universidad Nacional Autonoma de Mexico febrero 12, 2017.
Para uso personal exclusivamente. No se permiten otros usos sin autorizacin. Copyright 2017. Elsevier Inc. Todos los derechos reservados.
C asos clnicos

Caso
Recibe un mensaje del consejero de Sanidad de su regin. Han detectado ms de 300 casos de una gripe atpica,
ms virulenta y mortal de lo esperado para la gripe estacional clsica. Estn considerando la posibilidad de que
sea una variacin antignica mayor (antigenic shift) de un virus de la gripe A. Gracias a la base de datos del Sis-
tema Nacional de Salud, disponen de abundante informacin de los pacientes que han sufrido este nuevo tipo de
gripe (sexo, edad, lugar de origen, enfermedades, embarazo, educacin, medicacin) y de la evolucin clnica
que han tenido (analtica, placa de trax, lugar de ingreso, constantes vitales, tiempo hasta la recuperacin).
Le remite la base de datos y le solicita lo siguiente:

1. Defina cules son los factores de riesgo de mortalidad, para concentrar el esfuerzo preventivo y teraputico en
los grupos de alto riesgo. Para ello, lo ms adecuado sera emplear en el anlisis:
a) Regresin lineal simple
b) Regresin lineal mltiple
c) Regresin logstica
d) Regresin de Cox
e) Nada de lo anterior
Correcta: c.

2. Adems, sera importante realizar el anlisis estratificado por sexo porque:


a) El sexo es un importante factor de confusin en los estudios epidemiolgicos
b) La mayor parte de los autores prefieren hacerlo as
c) Es mejor estratificar el anlisis que introducirlo en el modelo para su ajuste
d) No es necesario porque es un estudio de prediccin, no de asociacin causa-efecto
e) Sera mejor realizar el estudio slo en varones o slo en mujeres (se usara la restriccin para controlar la
confusin)
Correcta: d.

3. Adems han detectado que algunos pacientes tienen leucocitosis. Le piden que especifique qu factores deter-
minan los niveles de leucocitos en sangre. Para ello, lo ms adecuado sera emplear en el anlisis:
a) Regresin lineal simple
b) Regresin lineal mltiple
c) Regresin logstica
d) Regresin de Cox
e) Nada de lo anterior
Correcta: b.

Discusin
Cuando la variable dependiente o evento en estudio es dicotmica (muerte s o no), lo normal es usar la regresin
logstica. Si se hubiese definido el tiempo hasta que se produjo el evento, podra considerarse emplear la regresin de
Cox, pero en una epidemia aguda eso no tiene mucho sentido.
Cuando la variable dependiente es continua (leucocitos en sangre), lo normal es usar la regresin lineal, aunque
quiz habra que considerar la transformacin logartmica de la variable dependiente para adaptarla mejor a la
distribucin normal. Si se desea valorar el efecto de ms de una variable (como en este ejemplo), lo correcto es
emplear la regresin lineal mltiple.
Al ser un estudio predictivo, no hace falta realizar un ajuste por todos los factores de confusin. Por tanto, no es
necesario, a priori, efectuar un anlisis estratificado por sexo. Bastara con introducir sexo en el modelo.

e-14 2013. Elsevier Espaa, S.L. Reservados todos los derechos


Descargado de ClinicalKey.es desde Universidad Nacional Autonoma de Mexico febrero 12, 2017.
Para uso personal exclusivamente. No se permiten otros usos sin autorizacin. Copyright 2017. Elsevier Inc. Todos los derechos reservados.

Вам также может понравиться