2003 Mauricio Hernndez Avila / Francisco Garrido / Eduardo Salazar Martnez SESGOS EN ESTUDI OS EPI DEMI OLGI COS Salud Pblica de Mxico, septiembre-octubre, vol. 42, nmero 5 Instituto Nacional de Salud Pblica Cuernavaca, Mxico pp.438-446
http://redalyc.uaemex.mx
ACTUALIZACIONES 438 salud pblica de mxico / vol.42, no.5, septiembre-octubre de 2000 Hernndez-Avila M y col. (1) Centro de Investigacin en Salud Poblacional, Instituto Nacional de Salud Pblica (INSP), Cuernavaca, Morelos, Mxico. (2) Centro de Investigacin en Sistemas de Salud, INSP, Cuernavaca, Morelos, Mxico. Solicitud de sobretiros: Mauricio Hernndez Avila. Centro de Investigacin en Salud Poblacional, Instituto Nacional de Salud Pblica. Avenida Universidad 655,colonia Santa Mara Ahuacatitln, 62508 Cuernavaca, Morelos, Mxico. Correo electrnico:mhernan@insp3.insp.mx U n objetivo en todo estudio epidemiolgico, en el que se desea conocer la frecuencia con la que ocu- rre un evento o estimar la asociacin entre un factor de riesgo y una enfermedad, debe ser el de medir y calcu- lar con la mayor precisin y exactitud posibles dichas determinaciones. En otras palabras, la validez del co- nocimiento derivado de cualquier estudio epidemio- lgico depender, en gran medida, de la ausencia de error y de la capacidad de estimar o predecir el pa- rmetro verdadero en la poblacin blanco. En el con- texto de la epidemiologa, la validez se refiere a la ausencia de sesgo o error. A lo largo del presente tra- bajo se hace referencia a dos tipos de validez: a) la validez interna, que se refiere principalmente a los errores cometidos durante el proceso de seleccin de la poblacin de estudio, durante las mediciones que se realizan en dicha poblacin o a errores ocasiona- dos por la falta de comparabilidad de los grupos es- tudiados, y b) la validez externa, que se refiere a la capacidad del estudio de generalizar los resultados observados en la poblacin en estudio hacia la po- blacin blanco. Es importante notar que la validez ex- terna depende de que exista la interna, es decir, es necesario cumplir con los requisitos necesarios de va- lidez interna para poder extrapolar lo resultados, por esta razn en los diferentes estudios epidemiolgicos se privilegian acciones que maximizan la validez in- terna, aun comprometiendo, en cierta medida, la vali- dez externa. Sesgos en estudios epidemiolgicos Mauricio Hernndez-Avila, Ph.D., (1) Francisco Garrido, M.C., M. en C., (2) Eduardo Salazar-Martnez, Dr. en C. (1) Todo estudio epidemiolgico est sujeto a un cierto margen de error, por lo que ser muy impor- tante conocer cules son sus fuentes principales y los diferentes procedimientos que pueden ser utiliza- dos para minimizar su impacto en los resultados. Los errores se pueden clasificar en dos grandes tipos: los errores no aleatorios o sistemticos y los errores aleatorios (no sistemticos); ambos tipos de error, de no controlarse adecuadamente, pueden comprometer la validez del estudio. El error aleatorio (no sistem- tico) ocurre cuando las mediciones repetidas, ya sean en un mismo sujeto o en diferentes miembros de la po- blacin en estudio, varan de manera no predecible, mientras que el error sistemtico (no aleatorio) ocurre cuando estas medidas varan de manera predecible y, por lo tanto, se tiende a sobre o subestimar el valor verdadero en medidas repetidas. La analoga que se utiliza para describir ambos conceptos es la prctica de tiro al blanco donde el punto medio del objetivo es el valor verdadero en la poblacin blanco y los disparos son las diferentes mediciones que se rea- lizan en la poblacin en estudio para estimar dicho valor verdadero. Un buen tirador cuya arma no est bien calibrada apuntar al blanco equivocado, podr ser muy preciso (todos los disparos dan en el mismo lugar), pero ninguno de ellos da en el blanco correcto. Esto corresponde al error sistemtico. Por otra parte, un tirador con mano temblorosa, pero con un arma bien calibrada, estar apuntando al blanco correcto 439 salud pblica de mxico / vol.42, no.5, septiembre-octubre de 2000 Sesgos en estudios epidemiolgicos ACTUALIZACIONES corresponde a la media verdadera de 12.2 g/dl, en los pneles C y D se estimara una media de 15.4 g/dl, y 27.7 g/dl, respectivamente. La utilizacin de laboratorios con resultados como los que se mues- tran en los pneles C y D para determinar las con- centraciones de plomo en sangre en la poblacin en estudio arrojara resultados claramente errneos al sobrestimar el valor real, lo que nos llevara a con- cluir equivocadamente que existen concentraciones de plomo en sangre ms elevadas que las reales. En los estudios epidemiolgicos analticos en los que se pone a prueba una hiptesis comparando dos o ms grupos de estudio, los errores tambin pueden ser tanto aleatorios o no sistemticos como sistemti- cos. El error sistemtico o sesgo se ha definido como cualquier error diferencial en relacin con los grupos que se comparan en que se puede incurrir durante el diseo, conduccin o anlisis del estudio y que inva- riablemente resulta en una conclusin errnea, ya sea proporcionando una estimacin ms baja o ms alta del valor real de la asociacin que existe en la poblacin blanco. FIGURA 1. VALORES DE PLOMO EN SANGRE REPORTADOS EN CUATRO LABORATORIOS CON DIFERENTES CONDICIONES DE PRECISIN Y VALIDEZ A 35 30 25 20 15 10 5 0 L a b o r a t o r i o
d e
r e f e r e n c i a Promedio estimado=12.2g/dl 0 5 10 15 20 25 30 35 Laboratorio 1 B 35 30 25 20 15 10 5 0 L a b o r a t o r i o
d e
r e f e r e n c i a Promedio estimado=12.2g/dl 0 5 10 15 20 25 30 35 Laboratorio 2 C 35 30 25 20 15 10 5 0 L a b o r a t o r i o
d e
r e f e r e n c i a Promedio estimado=15.4g/dl 0 5 10 15 20 25 30 35 Laboratorio 3 D 35 30 25 20 15 10 5 0 L a b o r a t o r i o
d e
r e f e r e n c i a Promedio estimado=27.7g/dl 0 5 10 15 20 25 30 35 Laboratorio 4 aun cuando sus disparos no den en el punto medio del blanco seleccionado. Se puede aplicar la analoga descrita en el contexto de un estudio epidemiolgico cuyo principal objetivo es determinar las concentra- ciones de plomo en sangre en la poblacin general. Suponga que en este estudio participan cuatro la- boratorios y un laboratorio de referencia en el cual se repite un cierto porcentaje de las determinaciones de plomo. Los resultados se muestran en la figura 1. En el panel A se muestra un laboratorio cuyas determi- naciones son vlidas y precisas respecto de las medicio- nes que realiza el laboratorio de referencia (situacin ideal) ya que el valor estimado corresponde muy cer- canamente al valor real; en el panel B se muestran resultados de un laboratorio cuyas mediciones son v- lidas pero con precisin intermedia; en el laboratorio del panel C la validez es cuestionable, pero la precisin es aceptable; mientras que en el panel D las mediciones son imprecisas y no vlidas. Mientras que en los dos primeros escenarios el parmetro estimado en la po- blacin en estudio es el mismo, en ambos laboratorios se estima una media poblacional de 12.2 g/dl, que ACTUALIZACIONES 440 salud pblica de mxico / vol.42, no.5, septiembre-octubre de 2000 Hernndez-Avila M y col. Dependiendo de la etapa del estudio en que se originan, los sesgos que interfieren con la validez in- terna de un estudio se han clasificado en tres grandes grupos: a) los sesgos de seleccin, que se refieren a los errores que se introducen durante la seleccin o el seguimiento de la poblacin en estudio; b) los ses- gos de informacin, que son errores en los que se in- curre durante los procesos de medicin en la poblacin en estudio, y c) los sesgos de confusin, que se origi- nan por la imposibilidad de asignar la exposicin de manera aleatoria en los estudios observacionales y que bsicamente se originan por una no comparabili- dad de los grupos en estudio. Todo diseo epidemio- lgico no experimental, en mayor o menor medida, es susceptible de este tipo de sesgos por lo que es un im- perativo para los investigadores planear adecua- damente cada una de las etapas de un estudio con el propsito de evitar o disminuir al mximo la posibili- dad de incurrir en dichos errores. Sin duda, la etapa ms crtica de un estudio corresponde a la del diseo ya que resulta casi imposible corregir a posteriori los sesgos introducidos durante esta etapa. Sesgos de seleccin Son errores sistemticos que se introducen durante la seleccin o el seguimiento de la poblacin en estudio y que propician una conclusin equivocada sobre la hiptesis en evaluacin. Los errores de seleccin pue- den ser originados por el mismo investigador o ser el resultado de relaciones complejas en la poblacin en estudio que pueden no ser evidentes para el investi- gador y pasar desapercibidas. En este contexto, una posible fuente de sesgo de seleccin puede ser cual- quier factor que influya sobre la posibilidad de los su- jetos seleccionados de participar o permanecer en el estudio y que, adems, est relacionado con la expo- sicin o con el evento en estudio. Los sesgos de seleccin pueden ocurrir en cual- quier estudio epidemiolgico, sin embargo, ocurren con mayor frecuencia en estudios retrospectivos y, en particular, en estudios transversales o de encuesta. En los estudios de cohorte prospectivos los sesgos de seleccin ocurren raramente ya que el reclutamiento y seleccin de la poblacin en estudio se da antes de que ocurra el evento en estudio, as que se puede su- poner que la seleccin de los participantes se realiza de manera independiente del evento y, en general, la participacin en el estudio no puede ser influida por el evento, ya que ste an no ha ocurrido. En contraste, la permanencia de los participantes en el estudio s puede ser determinada por el evento, cuando esto ocurre, y es de diferente magnitud para los grupos expuesto y no expuesto, existir la posibilidad de que los resultados se vean distorsionados por esta per- manencia diferencial. Por esta razn, se recomienda maximizar las tasas de permanencia y seguimiento en los estudios de cohorte. En los estudios retrospectivos los sesgos de se- leccin pueden ocurrir cuando los participantes po- tenciales o los investigadores conocen la condicin de exposicin y/o de enfermedad, y este conocimiento influye diferencialmente la participacin en el estu- dio. Suponga que se llevar a cabo un estudio de una cohorte retrospectiva y que el resultado de este es- tudio servir para fijar una posible compensacin econmica si se logra comprobar que los sujetos que recibieron cierta exposicin estn en mayor riesgo de desarrollar la enfermedad en estudio. Si esta infor- macin fuera del conocimiento de los posibles parti- cipantes podra condicionar que los sujetos que se saben expuestos y que desarrollaron la enfermedad en estudio participaran ms frecuentemente que aque- llos que desarrollaron la enfermedad y que se identi- fican como no expuestos. La participacin diferencial antes mencionada se reflejara en un dficit de eventos en el grupo de no expuestos, ya que los sujetos no ex- puestos que desarrollaron la enfermedad no tendran la misma motivacin para participar en el estudio y participaran en menor proporcin. Esta participacin diferencial condicionara una subestimacin de la fre- cuencia del evento en el grupo no expuesto y una so- brestimacin de la diferencia real. Los estudios de casos y controles son particu- larmente susceptibles a este tipo de sesgo ya que en la mayora de sus aplicaciones se trata de estudios re- trospectivos. En el contexto de este tipo de estudios, cualquier factor que influya sobre la probabilidad de seleccin, ya sea como caso o control, y que a su vez est relacionado con la exposicin en estudio, ser una posible fuente de sesgo de seleccin. Este tipo de ses- go se ha propuesto como una de las explicaciones a la asociacin reportada entre el consumo de caf y el cn- cer de pncreas por McMahon y colaboradores. 1 En este estudio los casos de cncer de pncreas se se- leccionaron de diferentes hospitales, mientras que los controles fueron seleccionados del mismo grupo m- dico de donde se haba originado el diagnstico de los casos. Al elegir este mecanismo de seleccin de con- troles los investigadores incluyeron como controles a diferentes sujetos con patologa gastrointestinal, dado que la mayora de los casos de cncer de pn- creas se haban notificado por el servicio de gastro- enterologa. As, los controles representan un sector 441 salud pblica de mxico / vol.42, no.5, septiembre-octubre de 2000 Sesgos en estudios epidemiolgicos ACTUALIZACIONES de la poblacin con un consumo menos frecuente de caf, lo que pudo haber condicionado una subesti- macin de la prevalencia de exposicin en el grupo control y, por lo tanto, una asociacin espuria entre el consumo de caf y el cncer de pncreas. La deteccin diferencial es un tipo particular de sesgo de seleccin, se origina cuando la prueba diag- nstica para detectar el evento se realiza con mayor frecuencia en el grupo expuesto. Un ejemplo de este sesgo se present en un estudio de casos y controles en el que se observ una fuerte asociacin entre el uso de estrgenos de remplazo y el cncer de endometrio. 2 Los casos en este estudio no representaban adecua- damente los casos originados en la poblacin base, ya que las mujeres con sntomas sugestivos de cncer de endometrio, y que eran usuarias de estrgenos, eran hospitalizadas para diagnstico con mayor frecuen- cia que las mujeres con los mismos sntomas pero que no eran usuarias de estrgenos. Esta conducta de los mdicos gener una sobreseleccin de casos ex- puestos a estrgenos, lo que ocasion una asociacin falsa positiva entre el uso de estrgenos y el riesgo de cncer de endometrio en el estudio. La no respuesta, por parte de los participantes en un estudio, puede tambin introducir sesgo de selec- cin, siempre y cuando est relacionada con la expo- sicin o el evento en estudio, es decir, que la tasa de participacin sea diferente para expuestos y no ex- puestos en los estudios de cohorte, o para casos y con- troles en el contexto de un estudio de casos y controles. Sin embargo, no siempre la falta de respuesta se asocia con un sesgo de este tipo. Por ejemplo, si en un estu- dio de casos y controles 10% de los casos elegidos y 30% de los controles rehusan participar no se incurri- r en sesgo de seleccin, a menos que la proporcin de expuestos en los casos y en los controles que no acepta- ron participar sea diferente a la del grupo respectivo. La no respuesta es un problema que tiene mayor rele- vancia para la validez externa. Los estudios transversales, y de casos y controles que se basan en casos existentes (prevalentes), pre- sentan importantes limitaciones relacionadas con los sesgos de seleccin, en particular cuando la en- fermedad en estudio tiene una alta letalidad cercana al diagnstico inicial ya que los casos existentes tien- den a sobrerrepresentar a los sujetos con cursos ms benignos de la enfermedad. Si el factor en estudio se asocia con la letalidad, la medida de efecto derivada de un estudio de prevalencia ser sesgada, dado que los casos en estudio corresponden a sobrevivientes de la enfermedad, por lo que representarn despro- porcionadamente a los casos no expuestos. Sesgos de informacin El sesgo de informacin se refiere a los errores que se introducen durante la medicin de la exposicin, de los eventos u otras covariables en la poblacin en estudio, que se presentan de manera diferencial entre los grupos que se comparan, y que ocasionan una con- clusin errnea respecto de la hiptesis que se inves- tiga. Una posible fuente de sesgo de medicin puede ser cualquier factor que influya de manera diferencial sobre la calidad de las mediciones que se realizan en los grupos expuesto y no expuesto en el contexto de los estudios de cohorte o entre los casos y controles en el contexto de los estudios de casos y controles. Es importante mencionar que aunque prctica- mente no existen procedimientos libres de error de medicin, no todos los errores de medicin son fuente de sesgo de informacin. Es conveniente recordar que los errores de medicin pueden ser no diferenciales (aleatorios) cuando el grado de error del instrumento o tcnica empleada es el mismo para los grupos que se comparan y diferenciales (no aleatorios) cuando el grado de error es diferente para los grupos estudia- dos, el sesgo de informacin se refiere particularmente a este ltimo tipo. Para comprender mejor la diferen- cia entre ambos errores de medicin se analiza el si- guiente ejemplo. En un estudio hipottico de casos y controles para evaluar la asociacin entre tabaquismo e infarto agudo del miocardio, los casos se identifica- ron en las salas de urgencias, del Instituto Mexicano del Seguro Social al momento de su ingreso y los con- troles fueron seleccionados al azar entre los dere- chohabientes que son vecinos de cada caso. Suponga que, en un primer escenario, la exposicin al tabaco se evala determinando la presencia de un marca- dor biolgico de exposicin que se mide en sangre. En este primer escenario, puede existir cierto grado de error en las determinaciones del biomarcador en sangre, sin embargo es posible suponer que el error es similar para los dos grupos, por lo que se consi- dera no diferencial o aleatorio. En contraste, si la ex- posicin al tabaco se hubiera evaluado mediante un cuestionario, la calidad de la informacin depen- dera, en parte, de la memoria de los participantes. Si los casos, dado que sufrieron el evento, tuvieran un estmulo mayor para recordar o participar entonces la calidad de la informacin sera mejor en este grupo que la que se podra obtener en el grupo control, si- tuacin que introducira un error diferencial o no aleatorio. En general, el impacto de este ltimo tipo de error es difcil de predecir ya que puede subestimar o sobrestimar la asociacin real, a diferencia del error ACTUALIZACIONES 442 salud pblica de mxico / vol.42, no.5, septiembre-octubre de 2000 Hernndez-Avila M y col. aleatorio que en general tiende a subestimar las aso- ciaciones reales. En el cuadro I se ofrece una clasificacin general de las diferentes fuentes de error de medicin. Es im- portante hacer notar que durante el diseo de un estu- dio se deben establecer todas aquellas caractersticas que se habrn de medir para responder una pregunta de investigacin. Una de las dificultades con las que se topa el investigador en esta etapa se deriva de la brecha o diferencia que se establece entre una enti- dad conceptual de una variable y su definicin em- prica que es, finalmente, la forma en que ser medida. Esta diferencia estriba en la imposibilidad, la mayor parte de las ocasiones, de medir directamente la ca- racterstica de inters. Por ejemplo, la exposicin in- voluntaria al humo del tabaco podra ser definida tericamente como la exposicin de las clulas del tejido pulmonar a agentes carcinognicos que resulta de la inhalacin del humo del tabaco proveniente de las emisiones de fumadores activos, en la prctica esta definicin terica se tendra que medir mediante la utilizacin de algn indicador cercano de dicha con- dicin, tal como tiempo que pasa el sujeto de estudio junto a personas fumadoras. Estas definiciones em- pricas son utilizadas y plasmadas por los epidemi- logos y por investigadores de otras disciplinas, en los instrumentos de medicin que se elaboran ex profeso para un estudio y que pueden ser medidas ya sea por un cuestionario o un biomarcador. En este ltimo ejemplo, la exposicin involuntaria se podra tambin medir mediante la determinacin de cotinina (un me- tabolito de la nicotina) en la sangre de los sujetos en estudio. Mientras que las estimaciones de exposi- cin realizadas mediante un cuestionario estarn su- jetas a diferentes tipos de error como lo seran la memoria de los participantes y la comprensin de las preguntas, en el caso del biomarcador, sern fuentes de error los procedimientos utilizados para obtener la muestra, el transporte y conservacin de la misma, as como los diferentes procedimientos de laboratorio que se necesiten utilizar para su medicin. Para ilustrar el impacto que pueden tener los di- ferentes tipos de error de informacin en la estimacin de las medidas de efecto, es necesario mencionar bre- vemente los conceptos de sensibilidad y especificidad de los instrumentos de medicin que se utilizan. La sensibilidad de un cuestionario o prueba diagnstica mide la habilidad del instrumento para clasificar co- rrectamente a los sujetos que tienen verdaderamente la condicin en estudio. As, un cuestionario para iden- tificar fumadores involuntarios que tiene una sensi- bilidad de 90%, podr identificar correctamente a 90% de los sujetos que estn expuestos al humo del tabaco, mientras que 10% sern clasificados errnea- mente como no fumadores involuntarios. En contraste, la especificidad indica la habilidad del instrumento para clasificar correctamente a los sujetos que no tienen la condicin de estudio. Para este ejemplo, una especi- ficidad de 99% indicara que se clasificara adecua- damente a 99% de los sujetos y que restara un 1% que sera clasificado como expuesto involuntariamente al tabaco, cuando en realidad no lo est. La sensibilidad y especificidad de nuestros instrumentos puede ser evaluada en estudios de validacin cuando se cuenta con un estndar de oro, el cuadro II indica cmo se podran estimar estos parmetros. Los sujetos de estudio se pueden clasificar err- neamente con relacin a la exposicin o al evento, como se mencion, el error puede ser de dos tipos: no dife- rencial y diferencial. Los estudios epidemiolgicos incurren en un error de clasificacin no diferencial de la exposicin cuando sta se realiza por igual en los grupos que se Cuadro II ESTIMACIN DE SENSIBILIDAD Y ESPECIFICIDAD PARA UNA VARIABLE DICOTMICA Clasificacin verdadera de la exposicin o de la enfermedad Clasificacin de la exposicin o de la enfermedad por el instrumento de medicin S No S a b No c d a d a+c b+d Sensibilidad= ; Especificidad = Cuadro I CLASIFICACIN DEL ERROR DE MEDICIN SEGN SU ORIGEN a) El observador b) Sistema de medicin c) Los sujetos de estudio Memoria Entrenamiento Fatiga d) El instrumento e) Errores en las variables proxy f) El procesamiento de datos Errores de codificacin Formulacin errnea de modelos estadsticos g) Errores que dependen del tiempo 443 salud pblica de mxico / vol.42, no.5, septiembre-octubre de 2000 Sesgos en estudios epidemiolgicos ACTUALIZACIONES comparan. Es decir, la condicin de enfermedad de los sujetos de estudio no influye en la clasificacin de los mismos respecto de la exposicin. En esta situacin, siempre y cuando el error no sea de gran magnitud, la medida de efecto estimada con error aleatorio tiende a subestimar la asociacin real en la poblacin blanco, por lo que se podra suponer que el valor estimado en la poblacin en estudio, bajo el supuesto de que el error es aleatorio, tiende o se aproxima al valor de no asociacin. La dificultad para medir correctamente la exposicin involuntaria al humo del tabaco puede servir para ilustrar este tipo de error. Dado que no es factible medir directamente la cantidad de humo que inhala un no fumador se podra utilizar un monitor personal que registre en forma acumulada la con- centracin de nicotina ambiental a la que el sujeto es- tuvo expuesto durante el tiempo relevante para el evento en estudio. Supongamos un estudio longitu- dinal para examinar la asociacin entre enfermedad respiratoria y exposicin involuntaria al humo del ta- baco. En este caso, el error de clasificacin no dife- rencial en la medicin de la exposicin estara dado por la habilidad del sujeto de llevar consigo el mo- nitor, del tipo de ropa que utilice y de la conservacin y trato que d al instrumento de medicin. En este caso se podra suponer que el grado de error ser el mismo para los sujetos con y sin exposicin al humo de ta- baco y que el impacto de dicho error ser el de sub- estimar cualquier asociacin real que exista en la poblacin blanco. Otro ejemplo que permite ilustrar el contexto en el que ocurre el error de medicin aleatorio o no diferencial es cuando la exposicin en estudio no con- sidera el periodo de riesgo relevante en la ocurrencia de una enfermedad. Si se estudia una enfermedad que tiene un periodo de latencia prolongado, como es el caso de la gran mayora de las enfermedades crnicas, y el factor de exposicin que se cree asociado con dicha enfermedad se mide en una sola ocasin, sin tomar en consideracin la variabilidad de dicho factor durante el tiempo, se incurrir en un error de clasificacin no diferencial. De manera ms explcita, se puede decir que si se desea medir la asociacin entre el consumo de colesterol y enfermedad coronaria para lo cual medimos la ingesta de colesterol en un solo da, no se puede asegurar que se haya medido correctamente la exposicin dado que la ingesta vara considerable- mente a travs del tiempo en un mismo sujeto y, por lo tanto, una sola medicin no reflejara adecuada- mente la ingesta de colesterol durante el periodo de riesgo relevante. A continuacin se ofrece un ejemplo hipottico para ilustrar el efecto del error aleatorio o no diferen- cial. En el cuadro III se resumen los datos de un estu- dio de seguimiento por 12 aos en hombres de 45-64 aos (n= 7 221) en el que se relacion el ejercicio fsico con el riesgo de enfermedad coronaria. Los expuestos fueron quienes no hacan ejercicio fsico o lo hacan moderadamente. Asumamos que la medida de efecto en este primer escenario se estima sin error aleatorio y corresponde a una razn de incidencia acumulada de 1.41. Supongamos ahora que la determinacin del even- to se realiza con una prueba diagnstica que tiene una sensibilidad de 0.80 y especificidad de 1.0 y que la prue- ba se aplica de igual manera en expuestos y en no ex- puestos. Los resultados se presentan en el cuadro III-A, donde se puede observar que existe un subestimacin del riesgo real, la razn de incidencia acumulada dis- minuye de 1.41 a 1.38. Sin embargo, si se supone una especificidad de 98%, entonces el error es de mayor impacto ya que la razn de incidencia estimada bajo este supuesto sera de 1.28. Cuadro III RELACIN ENTRE EJERCICIO FSICO Y RIESGO DE ENFERMEDAD CORONARIA, ESTIMADA SIN ERROR ALEATORIO Realiza ejercicio fsico Evento coronario No Si Total S 299 107 406 No 4 503 2 312 6 815 Total 4 802 2 419 7 221 Razn de incidencia acumulada=299/4 802107/2 419=1.41 Cuadro III-A RELACIN ENTRE EJERCICIO FSICO Y RIESGO DE ENFERMEDAD CORONARIA, ESTIMADA CON UNA PRUEBA DIAGNSTICA CUYA SENSIBILIDAD ES DE 0.80 Y ESPECIFICIDAD DE 1.0 Realiza ejercicio fsico Enfermedad No S Total S 239 87 406 No 4 563 2 332 6 815 Total 4 802 2 419 7 221 Razn de incidencia acumulada=239/4 80287/2 419=1.38 239 se deriva de 299 casos de los cuales nicamente 80%(299x0.80) fueron clasificados correctamente como eventos 4 563 corresponde a 4 503 sujetos sin eventos y a 60 sujetos con evento que fueron clasificados errneamente como sanos ACTUALIZACIONES 444 salud pblica de mxico / vol.42, no.5, septiembre-octubre de 2000 Hernndez-Avila M y col. Como se mencion, cuando el error de medicin se realiza de manera diferencial entre los grupos que se comparan, entonces se introduce un sesgo de informacin que, a diferencia del error aleatorio que condiciona una subestimacin, puede introducir error en cualquier direccin, condicionando ya sea una sobre o una subestimacin de la asociacin real. Exis- ten varias situaciones que se pueden asociar con este sesgo. En la etapa de diseo del estudio se puede favorecer la introduccin del sesgo cuando se deci- de recoger la informacin sobre la exposicin despus que se han identificado los casos de la enfermedad de inters y la presencia de la enfermedad modifica el reporte de la exposicin (exagerndola o minimi- zndola). En el caso del estudio de exposicin in- voluntaria al humo del tabaco antes referido, si los investigadores utilizaran un cuestionario como instru- mento para la evaluacin de tipo retrospectivo, no es difcil suponer que las madres cuyos hijos tuvieron problemas respiratorios tratarn de recordar con ma- yor detalle y exactitud la exposicin al humo del ta- baco comparadas con aquellas madres cuyos hijos permanecieron sanos durante el periodo de estudio; o que las madres fumadoras cuyos hijos tuvieron en- fermedad respiratoria informaran una menor expo- sicin como un mecanismo compensatorio de culpa. En ambas situaciones es claro que se puede incurrir en sesgos de informacin diferencial. El sesgo de clasificacin diferencial de la expo- sicin ocurre tambin con frecuencia durante la fase de campo. El sesgo del entrevistador, un caso de ses- go de informacin, se puede introducir cuando el per- sonal de campo conoce la condicin de enfermo o de no enfermo del entrevistado y si, adems, tiene co- nocimiento de las hiptesis u objetivos del estudio. Ante este hecho, el entrevistador puede hacer ms n- fasis en aquellas preguntas que miden la exposicin o bien inducir las respuestas de los entrevistados me- diante lenguaje corporal o la aportacin de informa- cin adicional sobre dichas preguntas. En este sentido es recomendable realizar un buen entrenamiento de los entrevistadores y mantenerlos ciegos tanto en lo que respecta a la hiptesis del estudio como a la con- dicin de caso-control o de expuesto-no expuesto de los participantes del estudio. El uso de informantes sustitutos (proxy) puede tambin dar lugar a un sesgo de clasificacin dife- rencial de la exposicin. Como se mencion, con cierta frecuencia los estudios epidemiolgicos deben re- currir a informantes que no son los sujetos de estu- dio ya sea por alguna incapacidad de stos o bien porque ya fallecieron. Dependiendo del tipo de rela- cin que tiene o tuvo el informante sustituto con el sujeto de estudio, las respuestas que stos proporcio- nan sobre la exposicin de inters pueden oscilar en- tre la negacin o la exageracin. Es probable que si la exposicin se refiere a una caracterstica considera- da negativa y el informante sustituto es la esposa(o) del sujeto de estudio, las respuestas que se proporcio- nen se pueden modificar con base en la relacin exis- tente entre ambos. Para ilustrar el impacto del error diferencial, su- pongamos ahora que la relacin descrita en el ejemplo anterior entre ejercicio y enfermedad coronaria se eva- la mediante un estudio de casos y controles. En este estudio se identificaran 406 casos y para cada caso se seleccionaran dos controles, los resultados hipot- ticos se presentan en el cuadro IV. La razn de mo- mios (RM) estimada del estudio es de 1.40. Ahora, supongamos que los casos, dado que su- frieron el evento coronario, hacen un mejor esfuerzo por recordar y reportar el patrn de ejercicio que rea- lizaban y que la sensibilidad con que informan la ex- posicin es de 95%, mientras que los controles reportan con una sensibilidad de 80%. Los resultados se pre- sentan en el cuadro IV-A. En este escenario, el sesgo introducido por la menor calidad de reporte en los Cuadro IV RELACIN ENTRE EJERCICIO FSICO Y RIESGO DE ENFERMEDAD CORONARIA, ESTIMADA SIN ERROR DIFERENCIAL Hace ejercicio Exposicin No S Total Casos 299 107 406 Controles 540 272 812 Total 839 379 1 218 Razn de momios=299x272/540x107=1.40 Cuadro IV-A RELACIN ENTRE EJERCICIO FSICO Y RIESGO DE ENFERMEDAD CORONARIA, ESTIMADA A PARTIR DE UN INFORME DE LA EXPOSICIN CON SENSIBILIDAD DE 95%EN LOS CASOS Y DE 80%EN LOS CONTROLES Ejercicios No S Casos 304 102 Controles 594 218 Sensibilidad en casos=0.95 en controles=0.80 Especificidad en casos=1.0 en controles=1.0 Razn de momios=304x218/594x102=1.09 445 salud pblica de mxico / vol.42, no.5, septiembre-octubre de 2000 Sesgos en estudios epidemiolgicos ACTUALIZACIONES Cuadro IV-B RELACIN ENTRE EJERCICIO FSICO Y RIESGO DE ENFERMEDAD CORONARIA, ESTIMADA A PARTIR DE UN INFORME DE LA EXPOSICIN CON SENSIBILIDAD DE 70% EN LOS CASOS Y DE 90%EN LOS CONTROLES Ejercicios No S Casos 331 75 Controles 563 249 Sensibilidad en casos=0.70 en controles=0.90 Especificidad en casos=1.0 en controles=1.0 Razn de momios=1.95 evento en estudio y que se encuentre distribuida de manera diferencial entre los grupos que se comparan, ya sea entre expuestos y no expuestos en el contexto de los estudios de cohorte o entre casos y controles en el mbito de los estudios de casos y controles. En los estudios observacionales el sesgo de con- fusin se puede entender como un problema de comparabilidad cuyo origen est ligado a la imposi- bilidad de realizar una asignacin aleatoria de la ex- posicin en los sujetos de estudio. El objetivo de la asignacin al azar de los tratamientos (de la exposicin) en los estudios experimentales es lograr la formacin de grupos homogneos en lo que se refiere a todas las caractersticas que puedan influir en el riesgo de de- sarrollar el evento (edad, sexo, masa corporal u otras caractersticas que no se puedan medir), lo que se busca lograr es que los grupos sean similares en todo excepto en la exposicin que se busca evaluar. Analicemos el siguiente ejemplo, cuando Doll y Hill publicaron sus primeros resultados derivados del seguimiento de cerca de 40 000 mdicos y reportaron que el cncer de pulmn era considerablemente ms frecuente en los fumadores, 3,4 las crticas no se hicie- ron esperar. Se argument que la asociacin obser- vada por estos investigadores entre el tabaquismo y el cncer de pulmn se deba muy probablemente a la accin de una tercera variable, a una susceptibilidad gentica que predispona tanto al cncer de pulmn como al gusto por el tabaco, con este argumento se des- cartaba el posible efecto carcinognico del humo de tabaco. La crtica anterior implica que el gusto por fumar no se da al azar sino que coexiste un factor gentico y que este factor es la verdadera causa de cncer de pulmn. Para poder separar el efecto del ciga- rrillo del de la susceptibilidad gentica tendramos que realizar un experimento, se podran seleccionar 40 000 individuos y asignarlos aleatoriamente a dos tratamientos experimentales: fumadores (expuesto) y no fumadores (no expuesto). Al asignarlos al azar se puede suponer que la distribucin del factor gentico que causa cncer de pulmn en los grupos formados mediante la aleatorizacin ser la misma, es decir, si la aleatorizacin se realiz de manera correcta en pro- medio el porcentaje de sujetos genticamente sus- ceptibles al cncer de pulmn sera la misma en ambos grupos, por lo tanto, si observramos diferencias en la ocurrencia de cncer de pulmn entre los fumadores y no fumadores sta no podra ser atribuida al factor gentico ya que ste afectara de igual manera a los dos grupos. Sin embargo, es claro que este tipo de ex- perimento sera imposible de realizar. A diferencia de los estudios experimentales, en que los sujetos en estudio son asignados al azar a los casos condiciona una subestimacin de la razn de momios. Supongamos ahora que los casos tienden a subes- timar el reporte de ejercicio y que la sensibilidad en este grupo es de 70% mientras que en el grupo control el cuestionario utilizado clasifica adecuadamente la exposicin en 90% de los sujetos. Bajo los supuestos en este escenario, el sesgo diferencial de reporte con- dicionara una sobrestimacin del efecto de no hacer ejercicio (cuadro IV-B). Como se puede apreciar, el efecto puede condicionar desviaciones hacia cual- quier direccin, por esta razn es necesario evitar en la medida de lo posible introducir errores diferenciales. Sesgos de confusin Todos los resultados derivados de estudios observa- cionales estn potencialmente influenciados por este tipo de sesgo. El sesgo de confusin puede resultar en una sobre o subestimacin de la asociacin real. Existe sesgo de confusin cuando observamos una asocia- cin no causal entre la exposicin y el evento en estu- dio o cuando no observamos una asociacin real entre la exposicin y el evento en estudio por la accin de una tercera variable que no es controlada. Esta(s) va- riable(s) se denomina(n) factor(es) de confusin o confusor(es). Los resultados de un estudio estarn con- fundidos cuando los resultados obtenidos en la pobla- cin en estudio apoyan una conclusin falsa o espuria sobre la hiptesis en evaluacin, debido a la influencia de otras variables, que no fueron controladas ade- cuadamente ya sea durante la fase de diseo o de an- lisis. En este contexto, son fuente posible de sesgo de confusin cualquier variable asociada con la exposi- cin que, adems, est causalmente asociada con el ACTUALIZACIONES 446 salud pblica de mxico / vol.42, no.5, septiembre-octubre de 2000 Hernndez-Avila M y col. grupos experimentales y, por lo tanto, los posibles con- fusores quedan igualmente distribuidos entre los gru- pos en contraste, en los estudios observacionales los sujetos reciben la exposicin por muy diferentes mo- tivos que dependen importantemente de patrones culturales y socioeconmicos. Entonces qu es una variable confusora o confusor? Se trata de variables que estn asociadas con el evento en estudio de ma- nera causal, es decir, son factores de riesgo para el even- to en estudio, adems esta asociacin debe ser por un mecanismo causal diferente al que acta la exposi- cin en estudio y debe ser independiente de esta mis- ma. Esto ltimo quiere decir que el confusor debe ser un factor de riesgo tanto para el grupo expuesto como para el no expuesto. Los sesgos de confusin en estu- dios de cohorte ocurren principalmente cuando los grupos expuesto y no expuesto no son comparables. Por ejemplo, si fuera de inters evaluar en un estudio de cohorte el efecto del consumo de caf sobre el ries- go de infarto del miocardio y se establecieran dos grupos de contraste, uno conformado por bebedores de caf y otro por no bebedores de caf, se tendra que considerar el tabaquismo como un posible confusor ya que est asociado con el consumo de caf y es un fac- tor de riesgo para infarto de miocardio. En este es- tudio hipottico ignorar las diferencias en el consumo de tabaco podra hacernos concluir que existe una fal- sa asociacin positiva entre el consumo de caf y el riesgo de infarto del miocardio. En el contexto de los estudios de casos y controles ocurre cuando hay dife- rencias entre casos y controles en relacin con una tercera variable, lo que puede ocurrir simplemente por la existencia de confusin en la poblacin fuente o ser generada por el mismo proceso de seleccin. Qu podemos hacer para prevenir la ocurrencia de sesgos de confusin? En el cuadro V se listan los diferentes procedimientos tanto en la fase de diseo como en la de anlisis que nos permiten prevenir o corregir el efecto del sesgo de confusin, como se puede deducir de los diferentes procedimientos utilizados, el comn denominador de todos es hacer los grupos de contraste lo ms comparable posible con relacin a variables externas, el objetivo es lograr que la nica diferencia entre los grupos sea la caracterstica en es- tudio. Referencias 1. MacMahon B, Yen S, Trichopoulos D et al. Coffee and cancer of the pancreas. N Engl J Med 1981;304:630-633. 2. Feinstein HR, Horowitz RI. A critique of the statiscal evidence associating estrogens with endometrial cancer. Cancer Res 1978;38: 4001-4005. 3.Doll R, Hill AB. Mortality in relation to smoking:Ten years observations of British doctors. BMJ 1964;1:1399-1410. 4.Doll R,Hill AB. Mortality in Relation to Smoking:Ten years observations of British doctors (Concluded). BMJ 1964;1:1460-1467. Cuadro V ESTRATEGIAS PARA EL CONTROL DE LA CONFUSIN EN LOS ESTUDIOS EPIDEMIOLGICOS Fase Estrategia Efecto Diseo Aleatorizacin Permite que las variables se distribu- yan similarmente en los grupos de es- tudio hacindolos comparables en todo, excepto en la variable de ex- posicin Restriccin Limita la participacin en el estudio a sujetos que son similares respecto a la variable de confusin Pareamiento Iguala en el proceso de seleccin a los grupos de comparacin con re- lacin a los factores de confusin Anlisis Estandarizacin Permite comparar los grupos de es- tudio si la distribucin del confusor fuera la misma en ambos Estratificacin Estima la medida de efecto en sub- grupos que son similares con relacin a los factores de confusin Modelos multivariados Estima el efecto de la exposicin, manteniendo constantes los valores del factor confusor