Вы находитесь на странице: 1из 26

Anlisis estadstico de datos

epidemiolgicos

Curso pre-congreso
Congreso de Microbiologa
Universidad de Antioquia
Contenido
CLASIFICACIN DE VARIABLES SEGN ESCALA Y USO .................................................................. 3
Clasificacin de variables segn escala ..................................................................................... 3
Variables cualitativas............................................................................................................. 3
Variables numricas .............................................................................................................. 3
Clasificacin de variables segn uso ......................................................................................... 4
Variables de respuesta .......................................................................................................... 4
Variables independientes ...................................................................................................... 4
OPERACIONALIZACIN DE VARIABLES .......................................................................................... 5
Definicin conceptual................................................................................................................ 5
Definicin operacional .............................................................................................................. 5
CONSTRUCCIN DE BASES DE DATOS ........................................................................................... 6
ESTUDIOS EPIDEMIOLGICOS ....................................................................................................... 7
Definicin de epidemiologa, incidencia y prevalencia ............................................................. 7
Epidemiologa ........................................................................................................................ 7
Incidencia y prevalencia ........................................................................................................ 7
Medidas de riesgo ..................................................................................................................... 7
Tablas 22 ............................................................................................................................. 8
Riesgo relativo ....................................................................................................................... 8
Razn de odds ....................................................................................................................... 9
Tipos de estudios epidemiolgicos ......................................................................................... 10
Estudios observacionales .................................................................................................... 10
Estudios de intervencin ..................................................................................................... 20
Grupos paralelos ................................................................................................................ 21
Cross-over .......................................................................................................................... 22
Estudios secuenciales ........................................................................................................ 22
PRESENTACIN DE RESULTADOS EPIDEMIOLGICOS ................................................................ 23
VARIABLES DE CONFUSIN E INTERACCIN ............................................................................... 24
ANLISIS DE REGRESIN LOGSTICA ........................................................................................... 26
Modelo de regresin logstica con dos variables .................................................................... 26
Sin interaccin ..................................................................................................................... 26
Con interaccin ................................................................................................................... 26
CLASIFICACIN DE VARIABLES SEGN ESCALA Y USO

El trmino variable se define como las caractersticas o atributos que que admiten diferentes
1
valores como por ejemplo la estatura, edad, el cociente intelectual, la temperatura, la presin
sistlica, etc. Existen diferentes formas para clasificar variables. A continuacin se ofrece una
clasificacin segn la escala y otra segn el uso.

Clasificacin de variables segn escala

Variables cualitativas
Si sus valores o niveles no se pueden asociar naturalmente a un nmero y por tanto no es
posible realizar operaciones algebraicas con ellos. Este tipo de variables representan una
cualidad o atributo que clasifica a cada elemento de estudio en una de varias categoras o
niveles. La situacin ms sencilla corresponde a las variables dicotmicas o binarias donde se
clasifica a cada elemento en una u de las dos posibles categoras. Por ejemplo el sexo
(hombre/mujer), estatus de enfermedad (enfermo/sano),
(enfermo/ uso de cigarrillo (fumador/no
(fumador/
fumador), etc. Enn muchas ocasiones
ocas este tipo de clasificacin
n no es suficiente exigiendo mayor
nmero de categoras (color
color de los ojos,
ojos grupo sanguneo, neo, calidad de un servicio
bueno/regular/malo, etc.).
). A su vez, las
l variables cualitativas se pueden ser de dos tipos:

1. Variables nominales: cuando las categoras no mantienen una relacin


relaci de orden entre
s. Ejemplo: color de los ojos, sexo, profesin,
profesin, presencia o ausencia de un factor de
riesgo o enfermedad, etc.
2. Variables ordinales: cuando las categoras guardan un orden entre s. Ejemplo: calidad
de un servicio (bueno/regular/malo), efectividad de un tratamiento (efectivo/no
efectivo), calificacin del desempeo (alto/medio/bajo), etc. Entre este tipo de
variables se encuentran escalas empleadas para medir caractersticas intangibles. Una
de stas es por ejemplo la escala tipo Likert.

Variables numricas
Corresponde a variables que pueden medirse, cuantificarse o expresarse numricamente y por
tanto tiene sentido realizar operaciones algebraicas con sus valores. Las variables de escala
numrica pueden ser de dos tipos:

1
DAry
Ary L, Jacobs Ch y Razavieh A (1982). Introduccin a la investigacin pedaggica, 2da Ed.
Interamericana, Mxico.
1. Variables discretas: si toman valores enteros y en ningn caso tiene sentido un valor
intermedio entre dos enteros consecutivos. Ejemplo: nmero de hijos nacidos vivos,
nmero de embarazos durante toda la vida, nmero de hermanos, etc.
2. Variables continuas: si admiten cualquier valor real. Ejemplo: estatura, dimetro,
velocidad, presin, peso, etc. Entre dos enteros consecutivos existen infinitos
nmeros.

Clasificacin de variables segn uso

Variables de respuesta
Se relacionan directamente con el
e objetivo de la investigacin.. Este tipo de variables se
conocen tambin como variables dependientes y suelen ser denotadas con la letra y.

Variables independientes
Corresponden a caractersticas asociadas a la variable respuesta. Tambin se conocen como
variables explicativas y en ciertas ocasiones pueden ser consideradas como las causantes de la
respuesta. Suelen ser denotadas con la letra x.

En muchos estudios el objetivo principal es comprobar cundo ndo una o ms variables


independientes influyen o alteran
alteran a la variable respuesta, es decir, si la variable independiente
produce algn cambio significativo en la variable respuesta.

En el siguiente diagrama se esquematiza la relacin entre las variables de respuesta e las


explicativas:

Donde k representa el nmero total de variables explicativas incluidas en el estudio.


OPERACIONALIZACIN DE VARIABLES

Una vez planteado el problema y establecido la(s) pregunta(s) de investigacin, es


imprescindible definir las variables que sern analizadas en el estudio. Al respecto se debe
clarificar lo que son definiciones conceptuales y definiciones operacionales.

Definicin conceptual
Las definiciones conceptuales o constitutivas corresponden a las contenidas en un diccionario
o que se derivan de las teoras o de la literatura cientfica.

Ejemplo. Inteligencia: (del latn intelligenta). 1) Capacidad de entender o comprender. 2)


Capacidad de resolver problemas. 3) Conocimiento, comprensin, acto de entender.

Definicin operacional
Corresponde al significado de la variable en el contexto del estudio. La definicin operacional
ayuda a especificar los procedimientos que describen las actividades que se deben registrar
para obtener el dato de la variable. Con esto, se deja claro qu se est entendiendo por cada
variable, qu tipo de variable se trata y cul sera la manera de resumir sus valores
(cuantitativos o cualitativos).

Ejemplo. Inteligencia (en determinado estudio): coeficiente intelectual medido con la prueba
Stanfortd Binet.

La operacionalizacin se puede completar ofreciendo informacin adicional como fuente de


informacin, escala de medida, codificacin, tipo de variable segn el uso, momento de la
medicin, etc. Ejemplo:

Id Variable Defincin operacional Escala Codificacin Tipo


0: Femenino
1 Sexo Sexo del encuestado. Nominal Explicativa
1: Masculino
Valor entero
2 Edad Edad en aos cumplidos del encuestado. Discreta Explicativa
positivo

Clasificacin de la persona segn su condicin en cuanto a


la realizacin de actividad fsica. Siendo activo quien 0: Activo
3 Estado Nominal Explicativa
realice actividad fsica por lo menos tres veces a la semana, 1: Sedentario
y sedentario en otro caso.

Altura en centmetros, medida desde el taln hasta la parte Valor real


4 Estatura Continua Explicativa
ms distal de la cabeza. positivo
Valor real
5 Peso Peso corporal en kilogramos. Continua Explicativa
positivo

Nmero de pulsaciones radiales en un minuto, tomadas en


Valor entero
6 Pulsaciones-Izq estado de reposo con los dedos ndice y corazn, por Discreta Respuesta
positivo
debajo del dedo pulgar de la mano izquierda.
CONSTRUCCIN DE BASES DE DATOS

Una base de datos (BD) es un arreglo de    datos, donde  corresponde al nmero de filas
(normalmente igual al nmero de individuos2) y  al nmero de columnas (normalmente igual
al nmero de variables del estudio). A cada columna se le suele llamar vector y a cada fila
registro. De este modo dos o ms vectores conforman una matriz llamada base de datos.

En primer lugar, cada columna lleva el nombre corto de la respectiva variable o vector. En la
primera columna se suele ubicar el identificador (Id) del individuo. ste puede ser un
consecutivo o un registro nico para cada individuo. Los nicos valores contenidos en las BD
corresponden a los definidos en la operacionalizacin de las variables (ver codificacin en el
apartado anterior).

Las BD suelen administrarse en archivos tipo MS Excel, MS Access, SPSS, bloc de notas, etc. El
uso de un tipo de archivo determinado depende del tamao de la BD y de la habilidad de los
usuarios para administrarla.

Es muy comn, como es el caso del SPSS, anexar a las BD una hoja aparte con las definiciones
operacionales de las variables. En el ejemplo, la hoja activa corresponde a la matriz de datos y
la siguiente a la definicin de las variables:

2
Cuando son estudios que involucran medidas repetidas, varias filas pueden corresponder a un mismo
individuo y en este caso  no coincide con el nmero de individuos.
ESTUDIOS EPIDEMIOLGICOS

Definicin de epidemiologa, incidencia y prevalencia3


Epidemiologa
La epidemiologa es el estudio de la distribucin y determinantes de enfermedades en
poblaciones humanas. La distribucin de enfermedades se refiere a la carga de estas segn
caractersticas como edad, sexo, clase social, estado civil, grupo racial, ocupacin, entre otras.
Los determinantes son los factores que causan la enfermedad o se relacionan con sta.
Estudiar la distribucin de la enfermedad es una descripcin de la misma, mientras que
estudiar los determinantes se refiere a su etiologa. Por ejemplo, el hallazgo de que el nmero
elevado de parejas sexuales se asocia al cncer cervical (descripcin) conlleva a investigar el
porqu de esta asociacin descubrindose que la infeccin por el virus del papiloma humano
(VPH) es el agente causal de este cncer (etiologa). En general los factores estudiados son
particulares de cada enfermedad y stos pueden ser de diversas caractersticas como la
polucin atmosfrica, estilos de vida (uso del cigarrillo, hbitos alimenticios, comportamiento
sexual, etc.) o aspectos biolgicos (como el colesterol o la presin sangunea).

Incidencia y prevalencia
La incidencia es el nmero de de casos nuevos de la enfermedad dentro de un periodo
especfico de tiempo. La prevalencia es el nmero de casos existentes de la enfermedad en
punto determinado del tiempo. La prevalencia es una medida de la morbilidad mientras que la
incidencia puede medir tanto la morbilidad como la mortalidad. Normalmente estas medidas
suelen presentarse en forma relativa. Por ejemplo:

 
     
         

           

                    




            

Medidas de riesgo
En epidemiologa a menudo se tiene el inters de evaluar el chance de que un individuo que
presenta cierto atributo tenga una enfermedad especfica. La medida epidemiolgica ms
bsica es la probabilidad condicional de que un individuo tenga la enfermedad dado que
presenta dicho atributo. Esa probabilidad es llamada riesgo ( ) de la enfermedad y el atributo
factor de riesgo. Aunque el riesgo es una medida muy utilizada en la relacin entre el factor de
riesgo y la enfermedad, no es suficiente para determinar la importancia del factor de riesgo

3
Tomado de Woodward M (2004). Epidemiology: Study Design and Data Analysis, 2th Ed. Chapman &
Hall CRC, USA. (Acceso parcial en http://books.google.com/books?id=SD_-
61g8orgC&pg=PP1&dq=epidemiology+and+woodward&hl=es#v=onepage&q&f=false)
sobre el desarrollo de la enfermedad. Como en muchos procedimientos en epidemiologa, se
requiere un grupo de comparacin el cual suele ser el grupo sin el factor de riesgo (los no
expuestos). As, es posible definir el riesgo relativo (o razn de riesgo) como el cociente entre
el riesgo de la enfermedad en el grupo expuesto al factor de riesgo y el grupo no expuesto. Si
el riesgo relativo () es mayor a 1, entonces el factor considerado incrementa el riesgo de
enfermedad, de lo contrario (si es menor a 1) reduce dicho riesgo. Un factor que tiene un
riesgo relativo menor a 1 suele ser llamada factor protector. En muchos casos se har uso
general del trmino factor de riesgo sin especificar la direccin de su efecto. El clculo del
riesgo y del riesgo relativo es muy simple si usando una tabla 22.

Tablas 22
En una tabla 22 (dos filas por dos columnas) se cruza el estatus del factor de riesgo
(expuesto/no expuesto) vs. el estatus de la enfermedad (enfermo/no enfermo):

Estatus del factor de Estatus de enfermedad


Total
riesgo Enfermo No enfermo
Espuesto a b a+b
No expuesto c d c+d
Total a+b b+d n

De la tabla se puede observar que    individuos tienen la enfermedad y que    no. En


cuanto al estatus del factor de riesgo,    estn expuestos, mientras que   no lo estn.
El nmero de personas enfermas pero no expuestas es c, y el nmero de personas no
enfermas pero expuestas es , etc. Ntese que        .

Riesgo relativo
#   

#
   

A partir de esta expresin es posible calcular el riesgo de enfermedad ( ) segn estatus del
factor de riesgo. Por ejemplo, el riesgo de enfermedad en los expuestos es /!  " y en los
no expuestos /!  ". El riesgo relativo de enfermedad comparado entre los expuestos vs.
no expuestos est dado por

/!  " !  "


  
/!  " !  "

Un intervalo de confianza aproximado al 95% para el RR est dado por

# $% &&'(.*+,-!$% &&" , $% &&/(.*+,-!$% &&" 0

donde se!ln "  51 8 1!  "  1 8 1!  "

El RR no es siempre una medida adecuada. Tal es el caso de los estudios caso-control, donde el
RR no debe ser calculado. Sin embargo, es posible obtener una medida indirecta del riesgo (en
cualquier caso), llamada odss.
Razn de odds
El  mide el nmero de veces que la respuesta ocurre por cada vez que no ocurre. La
respuesta ocurre con una probabilidad , y no ocurre con una probabilidad 1 8 . Luego, el
odds de que ocurra dicha respuesta (en este caso enfermedad) est dada por

  !1 8 "

A partir de esta expresin, es fcil demostrar que

 !1  "

Igual que con el riesgo, el odds se calcula tanto para el grupo de los expuestos como los no
expuestos. El clculo de los odds se hace ms fcil a partir de la tabla 22. As, para los
expuestos, el odds de enfermedad est dado por , y para los no expuestos por . De
forma similar, la razn de odds (9) que compara el riesgo de enfermedad en expuestos vs.
no expuestos est dada por

 
9  
 

La OR tambin se conoce como la razn de productos cruzados por la forma de calcularse a


partir de una tabla 22.

Un intervalo de confianza aproximado al 95% para la OR est dado por

# $% :&'(.*+,-!$% :&" , $% :&/(.*+,-!$% :&" 0

donde se!ln 9"  51  1  1  1.

En resumen, al comparar el riesgo/odds (de ahora en adelante sinnimos) de enfermedad


entre expuestos vs. no expuestos para cierto factor de riesgo, la interpretacin ser:

RR OR Interpretacin
>1 >1 Asociacin (factor confiere riesgo)
=1 =1 No asociacin (factor no confiere riesgo ni proteccin)
<1 <1 Asociacin (factor confiere proteccin)

Para probar la hiptesis nula de que el RR o la OR es igual a uno vs. diferente, se puede
proceder de dos maneras:

1. Chequeando si el intervalo de confianza para el RR o la OR contiene el uno (si lo


contiene no se rechaza Ho, de lo contrario se rechaza).
2. Realizando bien sea una prueba Chi-cuadrado o una prueba exacta de Fisher.
Tipos de estudios epidemiolgicos
En el siguiente esquema se presenta un resumen de los tipos de estudios epidemiolgicos ms
comunes. Posteriormente, se comentan.

Estudios observacionales

Estudios descriptivos

Caso
Este tipo de estudio consiste en realizar una descripcin, a veces exhaustiva, de las
caractersticas de un individuo que padece cierta enfermedad normalmente rara o muy poco
frecuente (enfermedades nuevas por ejemplo). Los datos que se recolectan son de un solo
paciente y cuando ste se monitorea en el tiempo, suelen sacarse estadsticas de mediciones
repetidas. Por ejemplo: presin arterial media, estimada a partir de la observacin del
paciente una vez por mes, durante un ao.

Series de caso
Se estudian 2, 3 ms individuos que padecen cierta enfermedadenfermedad normalmente poco
frecuente en la poblacin. Un tipo de muestreo comnmente empleado en este tipo de
estudio es el de bola de nieve el cual consiste en recolectar individuos contactados por medio
de otros ya incluidos en el estudio.

Mtodos bsicos de anlisis


Los anlisis consisten bsicamente a la descripcin de variables de los casos (edad, sexo, peso,
etc.), empleando medidas de tendencia central, dispersin y posicin para las variables de
escala numrica y porcentajes para las de escala cualitativa.
cualitati
Corte transversal
Este tipo de estudio consiste en la observacin de las caractersticas de un conjunto de
personas (en algunas veces una muestra aleatoria de cierta poblacin4) por medio de
cuestionarios con el fin de buscar informacin sobre la exposicin a factores de riesgo o el
padecimiento de cierta enfermedad. Usualmente estn enfocados a la estimacin de
prevalencias segn caractersticas de la poblacin.

Mtodos bsicos de anlisis


Los anlisis se realizan mediante el riesgo relativo5 o la razn de odds estimados a partir de
tablas 22 (anlisis crudo) o empleando regresin logstica (ante la necesidad de ajustar por
variables de confusin o chequear interaccin).

Ejemplo. A continuacin se presentan los datos del consumo de licor en hombres y mujeres
recolectados en una muestra no probabilstica por estudiantes de Bioestadstica de la Escuela
de Microbiologa:

Consumo de alcohol
Total
S No
Hombres 62 18 80
Mujeres 50 33 83
Total 112 51 163

Estime la razn de prevalencias y la razn de odds con sus respectivos intervalos de confianza
del 95% para el consumo de alcohol comparado en hombres vs. mujeres. Concluya al respecto

Ejemplo. De la base de datos Ejemplo Pulso Cardaco.xls tome el consumo de tinto como
variable respuesta y relacinelo con el consumo de cigarrillo. Estime la razn de odds con su
respectivo intervalo de confianza del 95% para el consumo de tinto comparando consumidores
de cigarrillo vs. no consumidores y realice una prueba chi-cuadrado para dicha relacin.

Ecolgicos
Las unidades de anlisis son regiones (barrios, comunas, municipios, departamentos, pases,
etc.) de donde se obtienen medidas ya resumidas como tasas o medias.

Mtodos bsicos de anlisis


En este tipo de estudios es muy comn relacionar las medidas resumidas de las regiones con
otros indicadores mediante regresin lineal.

Ejemplo. Se cuentan con las tasas de mortalidad (por 100 mil mujeres) ajustadas por edad6
durante el periodo comprendido entre 2000-2006 y el porcentaje de poblacin en miseria,
para cada subregin de Antioquia:

4
Conocidos como estudios de base poblacional.
5
Llamado en este caso razn de prevalencias.
6
Utilizando el mtodo de estandarizacin directo.
Subregin Tasa % Miseria
Magdalena Medio 21.8 58.6
Bajo Cauca 21.3 75.5
Urab 18.5 68.3
Nordeste 15.1 49.3
Occidente 14.2 50.5
Suroeste 12.7 25.5
Norte 9.4 36.2
Oriente 7.7 17.9
Valle de Aburr 7.2 8.2

Qu podra concluirse a partir de estos datos?

Falacia ecolgica
sta consiste en presumir que una relacin encontrada a partir de datos agrupados
(ecolgicos), es decir, hallada entre las regiones de estudio, se mantenga individualmente. Por
ejemplo, se ha observado que las tasas de mortalidad por cncer cervical ms altas se
presentan en las regiones de mayor pobreza. As pues, es una falacia ecolgica inferir que ser
pobre es causante de este cncer.

Estudios analticos

Cohorte
Un estudio de cohorte consiste en observar a un grupo de individuos libres del evento de
inters, clasificados en expuestos y no expuestos al factor de riesgo. Al trmino del periodo de
seguimiento, se observa cuntos (en cada grupo) desarrollaron el evento (incidencia).

Ventajas
1. Ideales para mostrar causalidad.
2. Pueden estudiarse mltiples desenlaces (enfermedades) a la vez.

Desventajas
1. Suelen ser costos.
2. No son adecuados cuando para estudiar enfermedades cuyo tiempo de desarrollo es
largo.
3. No son adecuados para estudiar enfermedades muy raras (poco frecuentes) ya que
requieren de cohortes muy grandes.
4. Las personas pueden cambiar estilos/hbitos de vida por el hecho de ser observadas lo
que dificulta estudiar el riesgo de exposicin.
5. Se pueden presentar prdidas (no adherencia) lo que podra contribuir a sesgos.

Existen dos tipos de cohortes: fijas y variables. En el primer caso, todos los individuos ingresan
al estudio a la vez y son seguidos durante un tiempo x igual para todos. En el segundo caso, los
individuos ingresan en momentos diferentes y el tiempo de seguimiento es variable entre
ellos.
Mtodos bsicos de anlisis
1. Los anlisis para las cohortes fijas se realizan mediante el riesgo relativo o la razn de
odds estimados a partir de tablas 22 (anlisis crudo) o empleando regresin logstica
(ante la necesidad de ajustar por variables de confusin o chequear interaccin).

Ejemplo.7 Shaper et al. (1988) describen un estudio de cohorte de una muestra


aleatoria de 7729 hombres britnicos adultos. Cada hombre fue interrogado, al ingreso
al estudio, sobre su consumo de alcohol (entre otras cosas). Durante los siguientes 7.5
aos fueron recolectados los certificados de defuncin de los hombres de la cohorte
que murieron. Los datos se presentan a continuacin:

Consumo de alcohol Muertes No muertes Total


No consumo 41 425 466
Ocasionalmente 142 1703 1845
Levemente 143 2401 2544
Moderadamente 116 1926 2042
Empedernidamente 62 770 832
Total 504 7225 7729

Tomando el no consumo como grupo de referencia, estime el RR y la OR con sus


respectivos intervalos de confianza del riesgo de morir.

2. En el caso de las cohortes variables, se emplea el anlisis de supervivencia que consiste


bsicamente en el uso de curvas de supervivencia Kaplan-Meier8 o el mtodo
persona-ao9 (anlisis crudo) o de modelos de regresin Cox (ante la necesidad de
ajustar por variables de confusin o chequear interaccin). Los anlisis para cohortes
variables tienen en cuenta datos censurados.

Ejemplo. Realizar anlisis de supervivencia para la base de datos de estudios de


cohorte Ejemplo supervivencia.

Caso-control
Lo primero en este tipo de estudios es detectar a las personas con la enfermedad de inters
(casos) y luego seleccionar cierta cantidad de personas libres de la enfermedad (controles). Los
casos y los controles son estudiados para investigar cules factores difieren entre ellos. La
principal diferencia entre los estudios de cohorte y caso-control es que en estos ltimos los
participantes se seleccionan segn el estatus de enfermedad y se mira en retrospectiva qu
pudo haberla causado mientras que en los de cohorte se seleccionan participantes libres de la
enfermedad y se mira si sta se desarrolla o no. (Woodward 2004).

7
Tomado de Woodward 2004.
8
Prueba log-rank para probar si existen diferencias entre los niveles del factor de exposicin.
9
Se recomienda artculo de Fracisco Javier Daz Ceballos: Introduccin a los estudios de cohorte en
epidemiologa y al anlisis de supervivencia, 2005.
Ejemplo.10 Autier et al. (1996) describen un estudio de melanoma cutneo en el que 420 casos
adultos (seleccionados de cinco centros hospitalarios en Blgica, Francia y Alemania) fueron
comparados con 447 controles adultos (seleccionados de las comunidades locales atendidas
por los centros hospitalarios). 75% de los casos reportaron no haber recibido proteccin solar
alguna (uso de gorras o bloqueador solar) durante la niez. Este porcentaje excede a lo
reportado por los controles (69%). De este modo, ser un caso parece estar ms asociado a la
falta de proteccin solar en la niez que ser un control, y la exposicin solar podra ser un
factor de riesgo para melanoma.

En la siguiente figura se esquematiza un diseo clsico de casos y controles11:

Ventajas
1. Son ms econmicos y ms rpidos especialmente en el estudio de enfermedades
cuyo tiempo de desarrollo es muy largo (p. ej., enfermedades crnicas).
2. Muchos factores de riesgo pueden estudiarse simultneamente.
3. Son adecuados para estudiar enfermedades raras (muy poco frecuentes).
4. Generalmente requieren tamaos muestrales ms pequeos que en los estudios de
cohorte.
5. Usualmente son ms balanceados que los estudios de cohorte lo cual permite manejar
o controlar mejor las variables de confusin.

10
Tomado de Woodward.
11
Tomado de Lazcano-Ponce E, Salazar-Martnez E, Hernndez-vila M. Estudios Epidemiolgicos de
casos y controles. Fundamento terico, variantes y aplicaciones. Rev Salud Pbicla de Mxico 2001;
43(2):135-150.
Desventajas
1. No es posible mostrar causalidad porque no siempre se conoce la secuencia del evento
en el tiempo.
2. Un caso (enfermo) puede ser el resultado de un proceso de supervivencia y no uno de
morbilidad.
3. Slo permiten investigar una enfermedad a la vez.
4. No permiten estimar riesgos, odds ni riesgos relativos pero s razones de odds
(recordar: cuando la enfermedad es rara la razn de odds es un buen estimador del
riesgo relativo).
5. Son propensos a generar errores por sesgo (p. ej., seleccin de controles).

Cuntos controles por cada caso?


De la siguiente grfica12 se puede observar que hasta 4 controles por caso es lo mximo que se
debe tomar, ya que se alcanza una adecuada potencia estadstica y ms de all sta no se
incrementa significativamente.

Potencia vs. razn controles/casos. En la figura se muestra la potencia para


detectar un riesgo relativo aproximadamente igual a 2 cuando el factor de
riesgo tiene una prevalencia del 30%, en una prueba de dos colas con un
nivel de significancia de 0.05 y 188 casos disponibles.

Seleccin de casos13
1. Utilizacin de casos incidentes con periodos de exposicin o latencia prolongados. La
razn de odds tiende a parecerse al riesgo relativo cuando los casos del estudio son
incidentes y la exposicin que la precede es de larga duracin.
2. Utilizacin de casos prevalentes con periodos de exposicin prolongados. La razn de
odds se parece al riesgo relativo si, a pesar de utilizar casos prevalentes, el periodo de
exposicin es muy largo y la enfermedad no afecta el estado de exposicin. Los casos
prevalentes pueden ser incluidos especialmente cuando no se dispone de casos
nuevos porque la enfermedad es muy rara y tiene baja letalidad, y cuando la
exposicin no modifica el curso clnico (sobrevida) de la enfermedad, como es el caso
de enfermedades de predisposicin gentica.
3. Utilizacin de casos prevalentes. La razn de odds se aproxima al riesgo relativo
cuando la prevalencia de casos es muy pequea, slo si el evento resultado no est
relacionado con la sobrevida antes de la seleccin, condicin o exposicin, y si la
enfermedad no afecta el estado de exposicin.

12
Tomada de Woodward.
13
Tomado de Lazcano-Ponce et al. 2001.
4. Utilizacin de casos o controles fallecidos. La inclusin de sujetos muertos slo se
justifica en algunas exposiciones que se puedan cuantificar mediante el uso de fuentes
secundarias de datos de alta calidad, como pudiera tratarse de historias clnicas o
registros de fuentes de informacin ocupacional.

Seleccin de controles14
1. Los controles deben ser seleccionados de la misma base poblacional de donde se
originaron los casos.
2. Los controles deben ser seleccionados independientemente de su condicin de
expuestos o no expuestos para garantizar que representen adecuadamente a la
poblacin base. Esto ltimo se logra siempre y cuando la condicin de exposicin no
determine la posibilidad de que un individuo sea o no incluido en el estudio como
control.
3. La probabilidad de seleccin para los controles debe ser proporcional al tiempo que el
sujeto permaneci elegible para desarrollar el evento o enfermedad en estudio. As,
un individuo que migr o que falleci durante el estudio dejar de ser elegible como
control. Una manera de operacionalizar este concepto es seleccionando un control del
grupo de individuos elegibles cada vez que se detecta o selecciona un caso.
4. En la seleccin de los controles se debe evitar, en lo posible, factores de confusin. Se
espera que el grupo control sea similar al grupo de casos en lo que se refiere a otras
variables que pudieran ser factores de riesgo para el desarrollo del evento y al mismo
tiempo estar asociados con la exposicin. Una estrategia frecuentemente utilizada
para lograr este requisito es el apareamiento. La medicin de variables debe ser
comparable entre los casos y los controles. Todos los procedimientos para medir la
exposicin o los factores de confusin potenciales deben ser aplicados, reportados y
registrados de la misma manera en casos y controles.

Tipos de controles15
1. Controles poblacionales. Si los casos representan una muestra de todos los casos que
ocurren en una poblacin identificada y definida claramente en tiempo y espacio, y los
controles se muestrean directamente de esta misma poblacin.
2. Controles vecindarios. Si despus de que se identifica un caso se seleccionan al azar
uno o ms controles que vivan en la misma zona de residencia que los casos.
3. Controles hospitalarios. Corresponden a controles que acuden al mismo hospital
donde se realiz la seleccin de los casos, pero por un padecimiento diferente.

Mtodos bsicos de anlisis


Los anlisis se realizan mediante la razn de odds estimados a partir de tablas 22 (anlisis
crudo) o empleando regresin logstica (ante la necesidad de ajustar por variables de
confusin o chequear interaccin).

Ejemplo.16 En un estudio caso-control sobre el uso de anticonceptivos orales (ACO) y cncer de


seno en Nueva Zelanda, Paul et al. (1986) identific casos para un periodo de 2 aos usando el
14
Tomado de Lazcano-Ponce et al. 2001.
15
Tomado de Lazcano-Ponce et al. 2001.
registro poblacional de tumores y seleccion controles aleatoriamente a partir de los padrones
electorales. A partir de la informacin que se dispone en la siguiente tabla, estima la razn de
odds de cncer de seno que compara a mujeres que usan vs. no usan ACO, con sus respectivos
intervalos de confianza del 95%:

Uso de ACO Casos Controles Total


S 310 708 1018
No 123 189 312
Total 433 897 1330

Ejemplo.17 De la base de datos Infert estime la razn de odds con su respectivo intervalo de
confianza del 95% y el valor P para el riesgo de infertilidad comparado entre mujeres con 4-6
hijos vs. 1-3 hijos.

Estudios caso-control apareados


En muchos estudios los controles se escogen de forma que sean similares a los casos con
respecto a posibles variables de confusin. Por ejemplo, si la variable edad es una potencial
variable de confusin, para cada caso se escoge uno o ms controles que tenga(n) edad similar
a la del caso. Si se escogen c controles por cada caso, el apareamiento se llama 1:c (c=1, 2, ).

Ventajas del apareamiento


1. Control directo de las posibles variables de confusin.
2. Seguridad de que se puede ajustar con respecto a las variables de confusin. Aunque
en un estudio caso-control no apareado las variables de confusin pueden controlarse
en la etapa de anlisis (regresin logstica), no siempre es posible hacerlo. Por ejemplo,
cuando todos los casos son de edad avanzada y todos los controles son muy jvenes y
la variable edad es de confusin.
3. Bajo ciertas condiciones de apareamiento se mejora la eficiencia del estudio. En
general, el apareamiento mejora la eficiencia siempre y cuando la(s) variable(s) de
apareamiento sea(n) de confusin. Si la o las variables de apareamiento no son de
confusin, se puede perder eficiencia estadstica (aumenta el error).

Desventajas del apareamiento


1. La recoleccin de los datos es ms compleja.
2. El anlisis de los datos debe tener en cuenta el apareamiento. El mtodo ms utilizado
para este tipo de anlisis es la regresin logstica condicional. Una desventaja es que
no todos los paquetes estadsticos ofrecen este procedimiento.
3. El ajuste proporcionado por la o las variables de apareamiento no puede ser removido
y a veces el contraste del riesgo crudo vs. ajustado es de importancia epidemiolgica.
4. Puede presentarse sobre-apareamiento (overmatching) debido a que ste se realiz
de manera incorrecta o innecesariamente (aparear por una variable que en realidad no
era de confusin o de serlo, que estuviese altamente correlacionada con otra variable
de apareamiento).

16
Tomado de Woodward 2004.
17
Base de datos infert tomada de la librera survival, del paquete estadstico R.
Mtodos bsicos de anlisis
En los estudios caso-control apareados, la presentacin tabular es diferente al igual que la
estimacin de la razn de odds. Sin embargo, las hiptesis nula y alternativa son las mismas.
Una estrategia es utilizar la regresin logstica condicional.

El aspecto de la tabla en este tipo de estudios es:

Est el caso Est el control expuesto?


Total
expuesto? S No
S c1 d1 c1+d1
No d2 c2 c2+d2
Total c1+d2 d1+c2 n

d(
9 
d<

Para probar la hiptesis nula de que la OR=1, se emplea la prueba de McNemar.

Ejemplo.18 Un estudio de casos y controles de leucemia linfoblstica aguda entre nios


espaoles hall 128 casos menores de 15 aos a partir de registros hospitalarios (Infante-
Rivard et al. 1991). Cada caso fue apareado a un control segn fecha de nacimiento, sexo y
municipio. Los controles fueron poblacionales, seleccionados aleatoriamente usando las listas
censales. En la siguiente tabla se presenta un anlisis de la exposicin de las madres a polvo de
algodn, lana o fibras sintticas durante el embarazo:

Caso expuesto Control expuesto al polvo?


Total
al polvo? S No
S 1 11 12
No 2 114 116
Total 3 125 128

Encuentre la razn de odds estimada que compara el riesgo de leucemia entre los expuestos
vs. no expuestos. Pruebe la hiptesis nula de que la exposicin al polvo no est asociada a
leucemia.

Apareamiento en otro tipo de estudios


Hasta ahora se ha comentado sobre las bondades de aparear segn variables de confusin en
estudios de casos y controles. Esta estrategia tambin puede ser til o implementada en
estudios de cohorte o de intervencin.

Estudios caso-control anidados


Es un estudio de caso-control realizado en el marco de un estudio de cohorte en ejecucin. Los
casos son identificados en la medida que los individuos de la cohorte presentan el evento de
inters (la enfermedad), y los controles un subconjunto de individuos que en el mismo
momento no han presentado el evento.

18
Tomado de Woodward 2004.
Reproducibilidad
Un estudio de reproducibilidad evala el grado de concordancia entre dos o ms lecturas
independientes realizadas sobre el mismo objeto de estudio. El resultados de la lectura puede
ser de escala cualitativa (positivo/negativo) o numrica.

Mtodos bsicos de anlisis


1. Cuando la lectura es cualitativa, se suele calcular el porcentaje de concordancia y el
ndice kappa. ste ltimo valora el grado de reproducibilidad (o concordancia). Segn
Fleiss (1981), un ndice kappa menor a 0.4, la reproducibilidad es pobre, entre 0.4 y
0.75 es aceptable, y mayor a 0.75 es excelente. Una prueba de McNemar puede ser
empleada para probar la hiptesis nula de que las 2 lecturas son equivalentes. Los
datos se presentan en una tabla 22 como se muestran a continuacin:

Resultado lectura 1
Resultado lectura 2 Positivo Negativo Total
Positivo a b a+b
Negativo c d c+d
Total a+c b+d n

Donde  representa los pares concordantes con resultado positivo,  los pares
concordantes con resultado negativo,  y los pares discordantes. El porcentaje de
concordancia ser !  "/!  "  100%. Entre tanto tienda a 100, mayor ser el
grado de reproducibilidad. Por otro lado, la estimacin del ndice kappa se realizar
mediante software.

Ejemplo.19 Dos patlogos leen placas de forma independiente y confidencial con el fin
de clasificarlas en positivas o negativas para cierta condicin. De 294 placas, 79 fueron
clasificadas como positivas y 167 como negativas por ambos patlogos, y 37 fueron
clasificadas como positivas segn el patlogo 2 pero negativas segn el patlogo 1.
Estime el porcentaje de concordancia y el coeficiente kappa. A partir de estos
resultados, concluya si la lectura entre los dos patlogos es reproducible.

2. Cuando el resultado de la lectura es de escala numrica, se suele emplear el


coeficiente de correlacin intraclase (CCI) y grficos tipo Bland-Altman20. Entre tanto
el CCI est prximo a 1.0, mayor es la reproducibilidad entre el par de lectores.

Pruebas diagnsticas
En este tipo de estudios, se evala la capacidad de una prueba/estrategia para clasificar a un
individuo en enfermo o sano. Esto se logra contrastando los resultados de la estrategia con la
prueba de oro la cual se presume clasifica correctamente a los individuos.

Mtodos bsicos de anlisis


A partir de una tabla 22 como la presentada a continuacin, se estiman los parmetros
sensibilidad (S), especificidad (E), valor predictivo positivo (VPP) y valor predictivo negativo
(VPN). Entre tanto S, E, VPP y VPN tiendan a 1.0, mejor ser la capacidad de clasificacin de la
prueba bajo estudio.

19
Tomado de Woodward 2004.
20
Para ms detalle, remitirse a Epidemiologa intermedia: conceptos y aplicaciones de Szklo M y Nieto J.
Resultado prueba de oro
Resultado prueba bajo estudio Positivo Negativo Total
Positivo a b a+b
Negativo c d c+d
Total a+c b+d n

Donde  representa los pares concordantes con resultado positivo,  los pares concordantes
con resultado negativo,  y los pares discordantes. De este modo, ?  /!  ", @ 
/!  ", A  /!  ", y A  /!  ".

Ejemplo.21 Ditchburn & Ditchburn (1990) describen un nmero de pruebas para el diagnstico
rpido de infecciones del tracto urinario (UTIs). Tomaron muestras de orina de 200 pacientes
con sntomas de UTI las cuales fueron enviadas a un laboratorio microbiolgico para cultivo. A
continuacin se presentan los resultados de la valoracin de una de las pruebas rpidas
(prueba de tirilla para detectar piuria):

Tirilla Positivo Negativo Total


Positivo 84 43 127
Negativo 10 92 102
Total 94 135 229

Estime S, E, VPP y VPN. Qu podra concluirse de la prueba rpida?

Estudios de intervencin
Un estudio de intervencin o ensayo clnico es un experimento aplicado en pacientes con el fin
de valorar el efecto de una terapia, o en personas sanas para valorar el efecto de una
estrategia de prevencin. Estos experimentos implican asignar sujetos (participantes) a
diversos tratamientos o grupos que representan las diferentes condiciones para las cuales se
desea valorar su efecto. Por ejemplo, en la prevencin de cncer de cuello uterino se puede
estudiar la eficacia de la vacunacin de mujeres menores de 12 aos en cierta poblacin
vacunando contra el VPH a la mitad de una cohorte y a la otra mitad contra hepatitis B
(placebo), y al trmino de cierto tiempo comparar la incidencia en ambos grupos. La prueba
estadstica depender del parmetro que se estime el cual a su vez depende de la escala de la
variable de estudio (variable respuesta). En el ejemplo de la vacuna, por tratarse de una escala
nominal (previene/no previene infeccin por el VPH), el parmetro de inters es una
proporcin (incidencia).

Ventajas
Los estudios de intervencin son los ms apropiados para estudiar causalidad porque:
1. Hay seguridad de que la causa precede el efecto
2. Hay mayor control sobre las variables de confusin debido a la asignacin aleatoria de
los sujetos a los diferentes grupos o tratamientos. Al ser aleatoria dicha asignacin, se
espera que haya una distribucin uniforme de sesgos entre los grupos.

21
Tomado de Woodward 2004.
Desventajas
1. Por tratarse de estudios prospectivos, muchas de las desventajas expuestas en
estudios de cohorte aplican para este tipo de estudios.
2. Algunas intervenciones pueden ir en contra de aspectos ticos.
3. Si el estudio es muy controlado, puede que las conclusiones no sean aplicables en la
vida real. Las conclusiones de un estudio de intervencin se mencionan en el marco de
las condiciones que ste fue realizado.

Consideraciones ticas
Consultar Declaracin de Helsinki22.

Control de sesgos23
1. Uso de un grupo control. Como en los estudios de cohorte, los de intervencin deben
ser comparativos. El grupo control podra tratarse de un grupo placebo o una
estrategia estndar que exista en el momento.
2. Cegamiento. Se trata de evitar que alguien conozca cul es el tratamiento asignado.
Un estudio de intervencin es ciego simple (single-blind) cuando el participante no
sabe cul tratamiento le fue asignado. Es doble ciego cuando tanto el sujeto como el
mdico, enfermero o quien est a cargo de evaluar la respuesta desconocen el
tratamiento asignado. Triple ciego cuando no slo los anteriores sino tambin quien o
quienes realizan los anlisis de los resultados desconocen cules son los tratamientos
asignados. Por ejemplo, entre dos tratamientos A y B, se desconoce cul es el
tratamiento control. No siempre es posible realizar estudios ciegos.
3. Aleatorizacin. Los sujetos deberan ser asignados a los tratamientos por medio de un
mecanismo de aleatorizacin (generalmente una distribucin uniforme). Cuando esto
ocurre, el estudio es llamado ensayo clnico controlado. La aleatorizacin es necesaria
para evitar sesgos sistemticos.

Grupos paralelos
Son los ms comunes. Consisten en asignar aleatoriamente individuos que no presenten el
evento de inters (respuesta) a los diferentes brazos o tratamientos. Al trmino de la
intervencin se observan las respectivas incidencias.

Mtodos bsicos de anlisis


El anlisis se hace tal cual en los estudios de cohorte.

Ejemplo.24 Un ensayo clnico fue realizado para valorar el efecto del suplemento mineral y
vitamnico sobre el mejoramiento del racionamiento verbal y no verbal en escolares. Varias
pruebas de razonamiento (IQ) fueron aplicadas a dos grupos de escolares con edades entre 11
y 13 aos. Un grupo (de tamao 42) recibi tabletas que contenan el suplemento mineral y
vitamnico, y el otro (de tamao 44) recibi tabletas inactivas indistinguibles de las del primer
grupo. Las tabletas fueron consumidas durante 7 meses. Al trmino de la intervencin se
realizaron nuevamente las pruebas IQ. Los resultados se encuentran en el archivo Estudios de

22
Se anexa archivo Declaration of Helsinki - 2008.pdf
23
Se remite al lector al texto del Woodward, pgina 344 para ampliar esta informacin.
24
Modificado de Woodward 2004.
intervencin - Ejemplo 1.xls. Recomienda el uso de suplementos minerales y vitamnicos
para mejorar el racionamiento verbal o no verbal en escolares entre 11 y 13 aos?

Cross-over
Considere dos grupos de tratamiento A y B. Al trmino de las intervenciones, los sujetos del
grupo A pasan al tratamiento B y viceversa, ejecutando el experimento nuevamente. As, todos
los sujetos pasan tanto por el tratamiento A como por el B. El anlisis de este tipo de diseo no
es tan sencillo como en los grupos paralelos ya que se tienen medidas repetidas.

Estudios secuenciales
Probar la hiptesis alternativa en la medida que entran sujetos hasta que se tome la decisin
de rechazar o no la hiptesis nula.
PRESENTACIN DE RESULTADOS EPIDEMIOLGICOS

Se presentan los formatos de las tablas para presentar resultados de estudios epidemiolgicos.
Bsicamente, se proponen dos tablas:

1. La primera que describe la distribucin de las caractersticas (variables explicativas) de


la muestra.
2. La segunda que cruza la variable respuesta con las caractersticas de la muestra. Este
cruce depende de la escala de la respuesta.
Si es de escala cualitativa/categrica, el cruce consiste en tablas de
contingencia y se calculan razones de odds o riesgos relativos (si es posible)
con sus respectivos intervalos de confianza y valores p de pruebas para tablas
de contingencia.
Si es de escala numrica, el cruce consiste en estimar la media, mediana,
desviacin estndar, y se calculan intervalos de confianza para la media con
sus respectivos valores p del anlisis de varianza.

Es obvio que posteriores anlisis conllevan a presentar otros tipos de tablas segn sea el caso.

Para ilustrar este punto, se construirn las tablas 1 y 2 para:

1. La base de datos de estudios de corte transversal, tomando como respuesta:


El consumo de licor (s/no), y
Las pulsaciones por minuto de la mano izquierda
2. La base de datos de estudios de caso-control, tomando como respuesta: la infertilidad
VARIABLES DE CONFUSIN E INTERACCIN

A continuacin se ilustrar la definicin de variable de confusin25. Para ello, denotemos

1. D: enfermedad
2. F: factor de riesgo
3. C: variable de confusin

C ser variable de confusin si se relaciona tanto con la enfermedad (pero no como


consecuencia de la enfermedad) como con el factor de riesgo (pero no como consecuencia del
factor de riesgo).

En la siguiente grfica se ilustran casos en que C no es variable de confusin:

25
Segn Woodward 2004.
Si en algn momento se identifica una variable de confusin, sta debe ser medida y tenida en
cuenta en los anlisis.

En la siguiente grfica se ilustra el efecto de la interaccin entre dos factores de riesgo:

Determinar si existe interaccin significativa entre dos o ms factores, es mucho ms fcil si se


emplea el anlisis de regresin logstica.
ANLISIS DE REGRESIN LOGSTICA

Este es un anlisis de regresin donde la respuesta es una variable dictoma. La forma del
modelo es:

D
donde B  ln C('DE.

Si F representa el estatus del factor de riesgo (1: expuesto, 0: no expuesto), entonces


9  GH , y un intervalo de confianza del 95% para la OR est dado por

GH'(.*+,-!GH " , GH/(.*+,-!GH"


Modelo de regresin logstica con dos variables
Sin interaccin

Con interaccin

Si IJ es significativo, entonces la interaccin tambin lo es y los resultados del riesgo de


enfermedad deben separarse/estratificarse.

En SPSS, el anlisis de regresin logstica se ejecuta mediante el procedimiento


Analizar/Regresin/Logstica binaria

Ejemplo. Realizar anlisis de estudio de caso-control (base de datos Infert) mediante un


modelo de regresin logstica entre la infertilidad y los diferentes factores de riesgo. Primero,
hacerlo crudo para el factor nmero de hijos (1-3 vs. 4-6) y comparar con el ejemplo realizado
previamente. Luego, hacer el anlisis mltiple.

Вам также может понравиться