Вы находитесь на странице: 1из 12

Artculo de Revisin

Revista de la Sociedad Cientfica de la Escuela de Medicina Humana UNSCH 2014; 1(1)

ESTUDIO DE COHORTE
DISEO Y TAMAO DE MUESTRA
Jimmy Ango

1a 2b

, Diego Alca1c Josu Aguilar 1c Kevin Guillen 1c ,

RESUMEN

En este artculo, se hace una introduccin elemental a los conceptos y los mtodos estadsticos usados en estos diseos. Se
enfoca en las herramientas estadsticas ms elementales usadas en los estudios de cohorte variables. Estas herramientas
hacen parte de lo que se conoce como anlisis de supervivencia. Se explica entonces el concepto de censura y se describen
las tablas de vida, las funciones de supervivencia, el estimador de Kaplan-Meier
Palabras clave: anlisis de supervivencia, estimador de Kaplan-Meier,

IDENTIFYING, REVIEWING AND DEFINITION OF RESEARCH


TOPIC: HUMAN PAPILLOMAVIRUS IN THE CERVICAL

CANCER

ABSTRACT
In this article, an elementary introduction to the concepts and statistical methods used in these designs is introduced. It focuses
on the most basic statistical tools used in the study cohort variables. These tools are part of what is known as "survival
analysis." It then explains the concept of censorship and life tables describe the functions of survival, Kaplan-Meier estimator
Keywords: survival analysis, Kaplan-Meier estimator,

INTRODUCCIN

Un estudio de cohorte consiste en hacerle un seguimiento a grupos de personas para monitorear su salud. El
diseo ms simple consiste en seguir dos grupos (llamados cohortes), los dos grupos deben tener
caractersticas similares. Despus de determinado perodo de tiempo, llamado perodo de seguimiento, la
incidencia de cierta enfermedad se compara entre los dos grupos. El comienzo del estudio se llama tiempo
de referencia. Al finalizar este perodo de tiempo se comparan las incidencias de los dos grupos. Estos son
entonces observados durante un perodo de tiempo, registrndose aquellos individuos que muestren la
enfermedad durante ese perodo de tiempo. Luego se compara la aparicin de la enfermedad coronaria en los
dos grupos.

1 EFP de Medicina Humana de la Universidad Nacional de San Cristbal de Huamanga


a

Profesor Auxiliar TP, responsable del rea Acadmica de Investigacin y Salud Pblica.

2 Centro de Investigaciones Biolgicas Biocientfica


b

Mdico Cirujano UNMSM, especialista en Administracin de Salud UPCH

Estudiante serie 200

Rev SOCEMH UNSCH. 2014;1(1)

Helicobacter pylori

DISEO COHORTE
Un estudio de cohorte es un estudio epidemiolgico, observacional, analtico, longitudinal, prospectivo o
retrospectivo (histrico) en el que se selecciona a los individuos que componen los grupos de estudio en funcin de
que se produjera o no determinada exposicin o caracterstica y se los sigue durante cierto tiempo. (1) Estos
estudios se han de utilizar de manera clsica para determinar la ocurrencia de un evento especfico en un grupo
de individuos inicialmente libres del evento o enfermedad en estudio. (2)
Es muy importante establecer una definicin operacional y objetiva del efecto en estudio. Antes de identificar a las
personas expuestas, es necesario definir explcitamente los grados y la duracin mnima de la exposicin. El
criterio de evaluacin ha de ser uniforme en todos los participantes en el estudio. Los 2 grupos de comparacin,
expuestos y no expuestos, pueden seleccionarse de poblaciones diferentes; para la recogida de la informacin, se
ha de usar las mismas fuentes de informacin y los mismos criterios en los individuos expuestos y no expuestos
para no comprometer la validez del estudio. Dicha informacin se ha de obtener de la misma manera y con mtodos
comparables en todos los participantes para lograr una clasificacin no sesgada con relacin a la exposicin. (3)
Los individuos no expuestos han de ser similares a los expuestos excepto en que no han estado sometidos a la
exposicin en estudio. Deben tener, tambin, el mismo riesgo potencial de sufrir el efecto y las mismas
oportunidades que los expuestos de ser diagnosticados del efecto en estudio. (1)
Adems, pueden fijarse criterios de inclusin; en el estudio los individuos de la cohorte son clasificados de acuerdo
con las caractersticas (Factores de riesgo) que podran guardar relacin con el resultado. (3) Un factor de riesgo
es una variable relacionada con una alta probabilidad de aparicin de la enfermedad. Un factor pronstico es una
variable relacionada con el curso y el resultado de la enfermedad, que en general depende de la intervencin
teraputica a la que se encuentra sometido el paciente durante el curso de la enfermedad. (1)
Al presentar el efecto, el individuo deja de estar en riesgo, por lo que ya no cumple con el criterio de permanencia
en la cohorte (su seguimiento termina). El perodo de seguimiento depende de la duracin de la latencia y la
frecuencia del efecto en estudio, lo que puede abarcar das, semanas, meses o aos. Dos momentos clave definen
el perodo de seguimiento: el examen inicial (medicin basal) y el final del seguimiento. El seguimiento, en funcin
del efecto en estudio, puede ser activo (en el que se utilizan contactos repetidos por diversos medios: nueva
entrevista y obtencin de muestras, cuestionarios auto- aplicables o llamadas telefnicas) o pasivo (se realiza
mediante bsqueda sistemtica de sistemas de informacin en registros preestablecidos de morbilidad y
mortalidad). (3) La prdidas durante el seguimiento pueden originarse por varias razones (abandono del estudio,
muerte por causa distinta del efecto en estudio), pero deben ser cuantificadas para evaluar la validez del estudio (su
distribucin debera ser similar en el grupo de expuestos y en el de no expuestos). (2)

Helicobacter pylori

Rev SOCEMH UNSCH. 2014;1(1)

Figura 1 : Diseo de clsico de un estudio de cohorte


Los estudios de cohorte tienen ciertas ventajas y desventajas respecto a otro tipo de estudios epidemiolgicos(5).

Ventajas
Permite mejor establecer relacin de
causalidad
Permite obtener incidencias y riesgo
relativo
Puede combinar el estudio de varios
daos a la salud

Desventajas
Tiempo prolongado de estudio
Frecuentemente costoso
Requiere un mayor nmero de sujetos
No es adecuado para enfermedades
de baja frecuencia
Adolece el problema de prdida de
sujetos durante el seguimiento

Con relacin al tipo de poblacin, las cohortes construidas pueden ser fijas, tambin llamadas cerradas, y
dinmicas, (3) una cohorte es fija cuando, una vez seleccionados los sujetos que formaran parte de ella, no se
permite la incorporacin de nuevos individuos a la misma. Por lo contrario, es dinmica si se aceptan nuevos
participantes a lo largo del tiempo, conforme los sujetos van reuniendo los criterios de elegibilidad para ser
introducidos en la investigacin. La eleccin de la poblacin de estudio se realiza mediante la seleccin de una
muestra de los sujetos de la poblacin de referencia que renen las caractersticas adecuadas para poder ser
elegidos (poblacin elegibles), los que participen de estos formaran la poblacin de estudio. (2)
La utilidad de los diseos de cohortes se resume en: a) la descripcin de la historia natural de la enfermedad; b) el
contraste de hiptesis sobre factores causales; c) el estudio de tendencias seculares de los factores de riesgo y su
relacin con la morbilidad y; d) la evaluacin pronostica de la enfermedad, y e) la observacin de la efectividad de
las intervenciones y los procedimientos a escala poblacional. (1)
CLASIFICACIN DE LOS ESTUDIOS DE COHORTE
Dependiendo de la relacin temporal del inicio del estudio respecto a la ocurrencia del evento, los estudios de
cohorte se han clasificado como: prospectivos, y retrospectivos (o histricos) y ambispectivos(o bidireccionales). (3)
La principal ventaja de los estudios de cohorte prospectivos es que, cuando son bien controlados, se puede
establecer una relacin de causa-efecto entre el factor de riesgo y la enfermedad investigada, al inicio del estudio la
exposicin al factor puede haber ocurrido o no, pero lo que an no ha sucedido es la aparicin del efecto en estudio,
por lo que se requiere un perodo de seguimiento en el futuro para determinar su frecuencia. En ellas, los
investigadores pueden controlar la calidad de las mediciones, lo cual facilita la interpretacin de los resultados. (1)
Los estudios de cohorte retrospectivos reconstruyen la experiencia de la cohorte en el tiempo, por esta razn
dependen de la disponibilidad de registros para establecer exposicin y resultado, la validez del estudio depender
en gran medida de la calidad de los registros utilizados. (3) Estos estudios, tienen limitaciones debidas a la
dificultad que los individuos pueden tener para recordar fechas y para recordar la presencia de factores de riesgo en

Rev SOCEMH UNSCH. 2014;1(1)

Ango J, et al

su pasado. Adems, puede ocurrir que algunos de los individuos que hayan estado sometidos a cierto factor de
riesgo ya hayan muerto a causa de ese factor, lo cual impide que pertenezcan a la muestra que se est recogiendo
actualmente, lo cual produce una subestimacin del riesgo debido a ese factor.(5) Sin embargo, los estudios de
cohorte retrospectivos son tiles en ciertos casos, por ejemplo, cuando el factor de riesgo slo puede identificarse
varios aos despus del tiempo de referencia. Es el caso de muchos factores de riesgo genticos, los cuales se
manifiestan fenotpicamente slo aos despus de haber nacido el individuo (en este caso, la fecha de nacimiento
sera el tiempo de referencia. (1)
Una aplicacin frecuente de una cohorte histrica son los estudios de exposicin ocupacional, donde se reconstruye
la exposicin y frecuencia de eventos en un grupo ocupacional o empresa durante un periodo determinado. En
contraste, en las cohortes prospectivas es el investigador quien documenta la ocurrencia del evento en tiempo
venidero en la poblacin en estudio, por lo que la exposicin y resultado se valoran de manera concurrente, y la
calidad de las mediciones puede ser controlada por los investigadores(3) , los diseos retrospectivos, al igual que
en los prospectivos, la expresin tiempo de referencia (baseline) se refiere al instante de tiempo a partir del cual se
comienza a contar el tiempo de supervivencia.(2)
En las cohortes bidireccionales los datos se recogen de forma retrospectiva y prospectiva simultneamente.
Respecto al tipo de poblacin seleccionada, las cohortes(1)

SESGOS:
Todo estudio epidemiolgico est sujeto a un cierto margen de error (sesgo), por lo que ser muy importante
conocer cules son sus fuentes principales y los diferentes procedimientos que pueden ser utilizados para
minimizar su impacto en los resultados.(6) A pesar de reconocer que los estudios de cohorte representan un diseo
menos sujeto a error sistemtico o sesgo en comparacin con otros estudios observacionales, no es menos cierto
que se deben tener en consideraciones algunas fuentes que pueden distorsionar los resultados que se deriven de
ellos.(7)
Existen un gran nmero de sesgos definidos, caractersticos del diseo de cohorte. Sin embargo, la mayora puede
incluirse: de seleccin, de medicin y de confusin:

SESGOS DE SELECCIN: Estos sesgos pueden introducirse en un estudio cuando hay diferencias
sistemticas entre los participantes en los grupos de tratamiento diferentes.
Estos sesgos relacionado con el procedimiento utilizado para conformar la cohorte o poblacin en estudio: cuando
la poblacin en estudio se constituye con voluntarios, la representatividad que este grupo pueda tener de la
poblacin blanco (de la poblacin a la cual se pretende generalizar los resultados) puede estar limitada por el hecho
de que los voluntarios son diferentes en algunos aspectos de la poblacin general. (7)
Los sesgos de seleccin pueden ocurrir en cualquier estudio epidemiolgico, sin embargo, ocurren con mayor
frecuencia en estudios retrospectivos (6)

SESGOS DE SEGUIMIENTO: estos sesgos consisten principalmente por el problema de las prdidas a lo largo
de la duracin del estudio y por la observacin deferencial en las distintas cohortes.
Cuando las personas que se pierden difieren de aquellas que quedan con respecto a la exposicin y al desenlace,
cualquier asociacin observada puede estar sesgada; adems, si no se siguen los pacientes por un tiempo
adecuado hasta la aparicin del desenlace, la asociacin puede estar subestimada. (7)

SESGOS DE CONFUNCIN: Es detectado por la existencia de factores de confusin. Un factor de confusin es


un variable que acta como factor de riesgo para la enfermedad sometida a estudio, muestra una asociacin con el
factor de riesgo que se est valorando y no es una variable intermediaria en la cadena causal del factor de riesgo
sometido a estudio. El factor de confusin es, con mayor frecuencia, el resultado de relaciones especficas
existentes entre las variables de una base de datos. El factor de confusin est con frecuencia presente a pesar de
los esfuerzos que se hacen para evitarlo. Una misma variable (p. ej., el sexo) puede ser un factor de confusin en
una base de datos (de un estudio determinado) y no serlo en otra. (8)
SESGOS DE INFORMACIN: Estos sesgo se presenta cuando la informacin se obtiene de manera diferente en
los grupos estudiados(9). Una posible fuente de sesgo de medicin puede ser cualquier factor que influya de
manera diferencial sobre la calidad de las mediciones que se realizan en los grupos expuesto y no expuesto en el

Rev SOCEMH UNSCH. 2014;1(1)

Helicobacter pylori

contexto de los estudios de cohortes (7)

ANALISIS DE SUPERVIVENCIA
Se denomina anlisis de supervivencia al conjunto de tcnicas que permiten estudiar la variable tiempo hasta que
ocurre un evento y su dependencia de otras posibles variables explicativas teniendo en cuenta la informacin
parcial contenida en las censuras. (10) La palabra sobrevivir no necesariamente se refiere a no morir, sino que
tambin se puede referir a no experimentar la enfermedad que se estudia. En general, sobrevivir significa no
experimentar el evento de inters en el estudio. Un sujeto que no experimente el evento de inters antes de concluir
el estudio se llama censurado, y los datos suministrados por dicho sujeto se llaman datos censurados. As,
aquellos sujetos que terminan el estudio en buen estado de salud son censurados. (11).
El anlisis de la supervivencia es una tcnica muy apropiada para analizar respuestas binarias en estudios
longitudinales o de seguimiento que se caractericen por:
1.

2.

Duracin variable del seguimiento: los estudios de seguimiento tienen fechas muy bien definidas de inicio
y de
cierre, pero los sujetos se
incorporan al estudio en
momentos diferentes.
En
cuanto al anlisis, a pesar de
que la
variable tiempo hasta un
evento
es continua, su anlisis suele
presentar dos dificultades que
impiden realizarlo con las
tcnicas estadsticas generales
para
las variables continuas, tales
como
la t de Student, el anlisis de
la
varianza, o los modelos de
regresin lineal. En primer
lugar,
en la mayor parte de los
estudios, la variable tiempo no
tiene
la distribucin normal que esas
tcnicas exigen, ms bien suele tener una distribucin asimtrica, en la que tpicamente los eventos
ocurren con mayor frecuencia al principio que al final del perodo de seguimiento y en segundo lugar y
ms relevante, en general, al final del perodo de seguimiento siempre hay individuos en los que no se ha
podido observar el evento y, por tanto, en los que el tiempo hasta su ocurrencia es desconocido, si bien se
tiene una informacin parcial sobre l, es mayor o igual que el tiempo observado.(10)

EL CENSURADO HACE AL ANLISIS DE SUPERVIVENCIA DIFERENTE:


El anlisis de supervivencia tiene una caracterstica que lo diferencia claramente de otros anlisis estadsticos, y es
que algunos individuos experimentan el evento terminal y otros no, lo que hace que el tiempo de supervivencia de
los que no lo han experimentado sea un tiempo desconocido.(12) explicado como tiempo censurado; existen tres
motivos por los que pueden aparecer las censuras: por fin del estudio, prdida del seguimiento y la ltima causa
de censura es la ocurrencia de un evento competitivo que impida la observacin del evento, por ejemplo, muerte
por alguna otra causa ajena al estudio. Es sta la causa de censura a la que hay que prestar ms atencin en el
diseo de los estudios, como se comentar ms adelante. Todos estos tiempos censurados infraestiman el tiempo
hasta el evento, que siempre ocurrir, asumiendo que ocurra, en un tiempo posterior.

Rev SOCEMH UNSCH. 2014;1(1)

Ango J, et al

Figura 3. Esquema temporal de un estudio para observar tiempos de espera para un evento, por ejemplo,
supervivencia tras un diagnstico de cncer. El estudio empez el 1 de enero de 1990 y acab el 1 de
enero de 2002. En A el eje temporal representa aos de calendario y en B aos desde el diagnstico. Con
el crculo en blanco se representan los tiempos censurados y con el cuadrado negro las muertes
(ocurrencia del evento). El individuo A al que se le diagnostic en enero de 1990, desaparece del estudio
en enero de 1993 (sera una censura a los 3 aos por prdida de seguimiento). El B, tambin
diagnosticado en enero de 1990, fallece en junio de 1992 (muerte a los 2,5 aos). El C sigue vivo al acabar
el estudio (sera un dato censurado a los 12 aos por fin del estudio). El D, al que se le diagnostica en
febrero de 1991, fallece en marzo de 1999, el tiempo de supervivencia sera de 8 aos. El E, que fue
diagnosticado en noviembre de 1993, fallece en accidente de trfico en julio de 1997 (sera una muerte, o
un dato censurado, a los 3,7 dependiendo de la definicin de evento de inters vase texto). El F, al que
se le diagnostic al principio de 1996, sigue vivo al cabar el estudio, sera un dato censurado a los 6 aos

La forma ms directa de estudiar el anlisis de supervivencia sera conformar una cohorte de sujetos con el EI que
se encuentren en un mismo punto del curso de ste y someterlos a observacin hasta que todos presenten el
resultado de inters, graficando dicha informacin en una curva; lo que resulta impracticable. Para ello, existen los
denominados anlisis de supervivencia, cuyo mtodo habitual se conoce como curvas de Kaplan-Meier; y que
pueden aplicarse a cualquier variable dicotmica que se produzca una sola vez durante el seguimiento (por ejemplo
muerte, recurrencia, etc.). Estas curvas, representan de forma grfica el anlisis de supervivencia (Figura 4); de tal
forma que en el eje de ordenadas se muestra la probabilidad de supervivencia estimada y en el eje de abscisas el
perodo de tiempo transcurrido desde el inicio de la observacin. De este modo, la probabilidad de sobrevivir en un
punto del tiempo se calcula a partir de la probabilidad acumulada de sobrevivir en cada uno de los intervalos de
tiempo que lo precedieron (Tabla 1). Ahora bien, si en el curso del seguimiento se pierden sujetos por razones
distintas al resultado de inters, estos se consideran "censurados" y dejan de contabilizarse en el denominador De
este modo, el eje de las ordenadas representa la probabilidad estimada de SV de los integrantes de una cohorte
hipottica y no el porcentaje de supervivientes de una cohorte real; entendiendo que los puntos de una curva
representan la mejor estimacin de un conjunto de datos, de la probabilidad de SV de los integrantes de una
cohorte, dependiendo del nmero de sujetos en estudio (precisin de la estimacin). Por lo que la precisin a la
izquierda de la curva tiende a ser mayor que a la derecha de la curva cuando existe un mayor nmero de individuos
en riesgo. (Figura 4). (13)

Tabla 1. Mtodo para calcular curva de supervivencia de Kaplan-Meier


Figura 4. Curva de Kaplan-Meier graficada con los valores de la
Tabla 1, en que se aprecia la probabilidad de SV en el tiempo,
medida en meses.

Rev SOCEMH UNSCH. 2014;1(1)

Helicobacter pylori

TABLAS DE VIDA Y FUNCIONES DE SUPERVIVENCIA:


Una tabla de vida es una presentacin tabular del progreso de una cohorte a travs del tiempo. El primer paso para
construir una tabla de vida es dividir el perodo de seguimiento en intervalos consecutivos de tiempo. Luego se
calculan las siguientes cantidades:
nt = nmero de sobrevivientes en el tiempo t.
et = nmero de eventos que ocurren en el intervalo de tiempo que comienza en el tiempo t.
pt = probabilidad de sobrevivir durante el intervalo de tiempo que comienza en el tiempo t.
qt = probabilidad de que ocurra el evento de inters durante el intervalo que comienza en el tiempo t.
st = probabilidad de sobrevivir desde el comienzo del estudio hasta el final del intervalo que comienza en t
probabilidad de supervivencia acumulada).
Note que el tiempo de referencia (comienzo del estudio) es t = 0 y n0 es entonces el tamao muestral. Adems, los
intervalos de tiempo no tienen que tener la misma longitud. Observe que
qt = et /nt
Pt =1- qt
st = p0 p1 p2.... p t.
Un problema de la frmula anterior para st es que no tiene en cuenta el nmero de retiros en cada intervalo.
Una manera de corregir este problema es calcular qt con la frmula alternativa (11)
EL ESTIMADOR DE KAPLAN-MEIER
Otra de las sorpresas cuando se explica el anlisis de supervivencia es que no es sinnimo de Kaplan-Meyer.
La probabilidad de supervivencia se puede estimar de manera no paramtrica basndose en los tiempos de
observacin (censurados y no censurados) usando el mtodo de Kaplan-Meyer (12). Pero tambin puede
estimarse la Probabilidad de supervivencia con otros mtodos como el actuarial. En esencia, este estimador se
halla construyendo una tabla de vida con los intervalos ms pequeos posibles. En efecto, suponga que el evento
de inters ocurre en los D tiempos distintos t1 < t2 << tD-1 < tD. El estimador KM es una curva de supervivencia
calculada en la forma descrita en la seccin 2, usando los intervalos semiabiertos [t1 , t2 ), [ t2 , t3 ), , [ tD-1 , tD).
Sin embargo, el estimador de KM no realiza ninguna correccin debida a censura. (11)
La Figura 5 muestra resultados de un anlisis de Kaplan- Meier de SPSS para la edad de comienzo del fumar
diariamente en los pacientes esquizofrnicos. Obsrvese que el despliegue tabular es muy grande, lo cual es el
resultado de trabajar con los intervalos ms pequeos posibles. La figura 5 muestra el estimador de KaplanMeier de la funcin de supervivencia. Los crculos negros sobre la curva muestran los puntos donde se presentaron
censuras

Rev SOCEMH UNSCH. 2014;1(1)

Ango J, et al

Figura
5.
Probabilidades de supervivencia
acumuladas versus la edad de comienzo de fumar
diariamente en 50 pacientes esquizofrnicos. Las
probabilidades fueron calculadas usando el mtodo de
Kaplan-Meier.

TAMAO DE MUESTRA
El objetivo de estos estudios es la comparacin de 2 grupos distintos, el cual uno de ellos es sometido a un factor o
variable de exposicin. La comparacin se basa en la principal variable respuesta, ntimamente ligada al objetivo del
estudio. En particular, se desea comparar un parmetro que resuma la variable respuesta principal del estudio (14).
El clculo del tamao muestra, por tanto, permite al investigador precisar el nmero de pacientes a estudiar para
detectar como significativos el efecto de la magnitud del parmetro determinado. El no hacerlo, o el no conocer
cuntos pacientes necesitamos para detectar un efecto como significativo podra llevarnos a no encontrar
diferencias cuando s las hay (15). Fallas en detectar diferencias entre tratamientos con bastante frecuencia se
relacionan con un tamao inadecuado del estudio. Se suele advertir sobre el riesgo de efectuar estudios con
muestras muy grandes, donde puede ocurrir que pequeas diferencias, probablemente sin trascendencia clnica,
sern detectadas como significativas (16). En principio, hay que rechazar la idea demasiado extendida de que la
muestra debe ser proporcional al tamao de la poblacin. El tamao de la muestra (representada generalmente con
n) est en relacin directa con la desviacin tpica de las puntuaciones en las caractersticas de la variable que se
investiga. Cuanto ms se agrupen los valores individuales de la variable estudiada alrededor de un valor central, se
requerir un menor tamao de la muestra (14). En general, en todo estudio ocurre que hay elementos
seleccionados para la muestra de los que no se obtiene la informacin requerida segn los objetivos; por este
motivo, una vez que se ha realizado el clculo del tamao de la muestra, se corrige frecuentemente para
contemplar que un determinado porcentaje de elementos no fueron entrevistados. Tambin es preciso detallar los
datos a estimar para nuestras formulas; y para ello es necesario examinar la bibliografa adecuada y observar los
resultados que se obtuvieron en estudios similares, aproximarlos con nuestros criterios de seguimiento y con la
duracin.
Como ya se ha comentado, el clculo del tamao muestral est relacionado con la estimacin. Debemos considerar
entonces dos situaciones, los dos problemas fundamentales que estudia la Inferencia Estadstica que nos permitir
extraer conclusiones vlidas de la poblacin a partir de los resultados muestrales: estimacin de parmetros
(depender de la variabilidad del parmetro) y el contraste de hiptesis (bsicamente para estudios comparativos)
(17). La estimacin de parmetros es el clculo aproximado del valor poblacional de cierto parmetro de inters a
partir de los valores observados en la muestra, mientras que el contraste de hiptesis se detallara a continuacin:
Para llevar a cabo dicha prueba debemos plantear dos hiptesis, la hiptesis nula H0, que recoge las opciones:
no existe diferencia o asociacin, o cualquier diferencia observada se debe al azar, y la hiptesis alternativa H1,
existe diferencia o asociacin, la diferencia observada no se debe al azar. Un aspecto muy importante a
considerar es si el tamao de la muestra se est estimando para la verificacin de una hiptesis uni o bilateral.
Esto se refiere a que si al comparar dos grupos los resultados diferirn sin poder predecir de seguro cul grupo
resulta mejor o ms favorable (bilateral, porque A puede ser mejor que B o viceversa), o definitivamente se
postula que, especficamente, uno de los grupos dar mejores resultados (18) (19). Cuando realizamos una
prueba de hiptesis podemos cometer dos tipos de errores: el error tipo I o nivel alfa, que se produce cuando
rechazamos la hiptesis nula cuando es cierta en la poblacin, y el error tipo II o nivel beta, que se comete
cuando se acepta H0 siendo falsa en la poblacin. Se denomina potencia estadstica al valor 1-, que representa
la probabilidad de observar en la muestra una diferencia o asociacin que existe en la poblacin (17).
En primer lugar se describe cmo calcular el tamao muestral mnimo necesario para detectar un determinado
riesgo relativo cuando se dispone de informacin acerca del estatus final del paciente pero no de su tiempo de
seguimiento. Posteriormente, se detalla una manera de calcular el tamao muestral en estudios de supervivencia
(anlisis de las proporciones acumuladas de supervivencia) cuando la importancia pronstica del factor a estudio se
investiga por medio de un modelo de regresin de Cox. La regresin de Cox es el mtodo apropiado para realizar el

Rev SOCEMH UNSCH. 2014;1(1)

Helicobacter pylori

anlisis cuando existen datos censurados (el paciente censurado es el que durante este seguimiento no ha
presentado el evento de inters) permitiendo, a partir de los coeficientes estimados, calcular el riesgo relativo
asociado a cada uno de los factores incluidos en el modelo (15).
CALCULO DEL TAMAO MUESTRAL PARA LA ESTIMACIN DE RIESGOS RELATIVOS
Se utiliza la frmula de comparacin de proporciones independientes en un contraste bilateral. La caracterstica que
la distingue est en la forma de calcular la proporcin P1 (grupos expuestos) y la proporcin P2 (grupos no
expuestos) a partir del riesgo relativo (RR) (14), as como el nivel de confianza (1-), generalmente de 95% y la
precisin (), que es la oscilacin mnima (error muestral) con la que se quiere estimar el RR correspondiente,
expresada como porcentaje del valor real esperado para ese riesgo. Con estos datos, el clculo del tamao
muestral se puede realizar mediante la frmula (14):

Como ejemplo, se planea realizar un estudio prospectivo en el que se recoger el estatus de los sujetos (vivos o
muertos) al cabo de un ao de ser tratados. Si se desea probar la hiptesis nula (RR = 3, IC del 95% y potencia de
la prueba del 80%), la pregunta es cuntos sujetos debern estudiarse en cada grupo? A partir de experiencias
previas, se estima que la probabilidad de fallecer entre los sujetos expuestos es de un 10%. En cada grupo son
necesarios 55 sujetos.
CALCULO DEL TAMAO MUESTRAL EN ESTUDIOS DE SUPERVIVENCIA
Esta seccin se refiere a los estudios diseados para probar la hiptesis de que las tasas reales de incidencia de un
trastorno o una caracterstica en dos grupos de individuos son iguales. Los sujetos tienen en comn la fecha de
inclusin en el estudio y son seguidos hasta que presentan la caracterstica investigada o hasta que no se los puede
seguir ms o son incluidos en el estudio cuando se puede pero slo son objeto de seguimiento hasta una fecha
determinada (20). Si se dispone de informacin no slo acerca del estatus final de los pacientes en cada uno de los
dos grupos, sino que adems estamos en condiciones de conocer el tiempo de supervivencia de cada uno de ellos.
Si, con este procedimiento, deseamos calcular el tamao muestral mnimo necesario para detectar un determinado
riesgo relativo, deberemos conocer (15):
Una idea del valor aproximado del riesgo relativo que se desea detectar (RR), la proporcin de expuestos al factor
de estudio (p), es decir, en nuestro caso, la proporcin de enfermos habitualmente tratados o expuestos, el
porcentaje de observaciones censuradas que se espera en el total de la muestra (), el nivel de confianza o
seguridad con el que se desea trabajar (1-), el poder que se quiere para el estudio (1-).
Con estos datos, el clculo del tamao muestral puede abordarse mediante la frmula (21):

Supngase que se planea estudiar un tratamiento contra el cncer de pulmn (exposicin) y que suele aplicarse al
70% de los sujetos que presentan ese tipo de cncer. As, para detectar un RR de 3, con un porcentaje de
observaciones censuradas de 20%, con un IC del 95% y con una potencia de la prueba del 80%, se necesitaran
recoger informacin de 47 sujetos.

Ango J, et al

Rev SOCEMH UNSCH. 2014;1(1)

El factor
, normalmente llamado factor de inflacin de la varianza, donde
denota al coeficiente de
correlacin de Pearson entre el factor a estudio y aquella otra variable que incluiremos en el modelo de regresin de
cox. En el caso en el que se ajuste por ms de otro factor en el modelo, lo ms sencillo es considerar
como el
mayor coeficiente de correlacin entre el factor a estudio y todas las variables incluidas. Este coeficiente de
correlacin, cuanto mayor sea, ms incrementar el valor del factor de inflacin de la varianza y, por tanto, se
incrementar el tamao de la muestra a estudiar (15).
En este supuesto, la frmula para el clculo del tamao muestral vendr dada por (13)(14):

MANEJO DEL SOFTWARE ESTADISTICO EPIDAT 4.1


En Epidat 4, el clculo del tamao de muestra para estudiar si existe asociacin entre la exposicin y la enfermedad
en un estudio de cohortes se basa en la prueba ji-cuadrado de Pearson, con o sin correccin de Yates; se aplica
cuando aproximamos una variable discreta a una distribucin continua, la correccin consiste en aadir y substraer
0,5 a la variable en cuestin (23g). Las herramientas de clculo asociados a las formulas en el presente artculo
precisan del Nivel de confianza y la potencia. Los factores que intervienen en el clculo son:
ESTUDIO DE COHORTE

10

Riesgo en expuestos (P1).


Riesgo en no expuestos (P2).
Razn entre el nmero de no expuestos
y el de expuestos (R)

ESTUDIO DE SUPERVIVENCIA

Nmero de curvas que se comparan.

Probabilidad de supervivencia para cada curva, en


porcentaje.

Proporcin de prdidas en el seguimiento de los


pacientes.

Razn entre los tamaos de los grupos, en el caso


de dos curvas. Si se comparan tres o ms curvas,
se asume que los tamaos de los grupos son
iguales.

Nivel de confianza de la prueba: complemento del


error de primer tipo que se estara dispuesto a
admitir (en porcentaje).

Rev SOCEMH UNSCH. 2014;1(1)

Helicobacter pylori

BIBLIOGRAFIA
1.

Bel Ferr MN, Ingls Novell M, Piol Moreso JL. Estudios de cohorte. Fisioterapia. septiembre de
2009;31(5):218-23.

2.

Bueno Cavanillas, A. GV R. MEDICINA PREVENTIVA Y SALUD PUBLICA [Internet]. 1992 [citado 30 de


noviembre de 2014]. Recuperado a partir de:
http://www.facmed.unam.mx/deptos/salud/censenanza/planunico/spii/antologia2012/7.pdf

3.

Lazcano-Ponce E, Fernndez E, Salazar-Martnez E, Hernndez-Avila M. Estudios de cohorte. Metodologa,


sesgos y aplicacin. Salud Pblica Mxico. junio de 2000;42(3):230-41.

4.

OPS. Manual sobre el enfoque de riesgo en la atencion maternoinfantil. OPS (Organizacion Panamericana de
la Salud); 1999. 265 p.

5.

Ceballos D, Javier F. Introduccin a los estudios de cohorte en epidemiologa y al anlisis de supervivencia.


MedUNAB. 2005;8(1):43-53.

6.

8-sesgo.pm - ContentServer.pdf [Internet]. [Citado 30 de noviembre de 2014]. Recuperado a partir de:


file:///D:/SESGOS/salsa%20vernis/ContentServer.pdf

7.

Revista Septiembre - v33n3a07.pdf [Internet]. [Citado 30 de noviembre de 2014]. Recuperado a partir de:
http://www.scielo.org.co/pdf/rcp/v33n3/v33n3a07.pdf

11

Rev SOCEMH UNSCH. 2014;1(1)

Ango J, et al

8.

Jokin de Irala MM-G. Qu es una variable de confusin? Med Clnica. 2001;117(10).

9.

Lazcano-Ponce E, Fernndez E, Salazar-Martnez E, Hernndez-Avila M. Estudios de cohorte.


Metodologa, sesgos y aplicacin. Salud Pblica Mxico. junio de 2000;42(3):230-41.

10.

Anlisis del tiempo hasta un evento (supervivencia) - 10.1016_S1138-3593(04)74306-3.pdf [Internet].


[citado 30 de noviembre de 2014]. Recuperado a partir de:
http://lib.gen.in/next/MTAuMTAxNi9zMTEzOC0zNTkzKDA0KTc0MzA2LTM=/10.1016_S11383593%2804%2974306-3.pdf

11.

Ceballos D, Javier F. Introduccin a los estudios de cohorte en epidemiologa y al anlisis de


supervivencia. MedUNAB. 2005;8(1):43-53.

12.

Rebasa P. Conceptos bsicos del anlisis de supervivencia. Cir Esp. Octubre de 2005;78(4):222-30.

13.

Manterola D C, Santander A C, Otzen H T. Cmo valorar e interpretar un artculo sobre pronstico. Rev
Chil Cir. febrero de 2013;65(1):77-84.

14.

Araya Alpzar C, Galindo Villardon MP. Tamao de la muestra en investigacin clnica. Med Clnica. 2009
Jun;133(1):2630.

15.

Daz SP, Fernndez SP. Clculo del tamao muestral para la determinacin de factores pronsticos. Cad
Aten Primaria. 2002;9(1):303.

16.

Edmiston CE, Josephson A, Pottinger J, Ciacco-Tsivitis M, Palenik C. The numbers game: Sample-size
determination. Am J Infect Control. 1993 Jun 1;21(3):1514.

17.

Seoane T, Martn JLR, Martn-Snchez E, Luruea-Segovia S, Alonso Moreno FJ. Captulo 5: Seleccin de la
muestra: tcnicas de muestreo y tamao muestral. SEMERGEN - Med Fam. 2007 Agosto;33(7):35661.

18.

Duffau T. G. Tamao muestral en estudios biomdicos. Rev Chil Pediatra. 1999 Jul;70(4):31424.

19.

Dennis RJ. Como estimar el tamano de la muestra en investigacion con humanos. Acta Md Colomb. 1989
Apr;14(2):929.

20.

Lwanga SK, Lemeshow S, Organization WH. Determinacin del tamao de las muestras en los estudios
sanitarios: manual prctico. Sample size determination in health studies: a practical manual [Internet]. 1991
[cited 2014 Nov 30]; Available from: http://apps.who.int//iris/handle/10665/37589

21.

Schoenfeld DA. Sample-size formula for the proportional-hazards regression model. Biometrics. 1983
Jun;39(2):499503.

22.

Schmoor C, Sauerbrei W, Schumacher M. Sample size considerations for the evaluation of prognostic
factors in survival analysis. Stat Med. 2000 Feb 29;19(4):44152.

23

Correccin de Yates [Internet]. Wikipedia, la enciclopedia libre. 2014 [cited 2014 Nov 30]. Available from:

http://es.wikipedia.org/w/index.php?title=Correcci
%C3%B3n_de_Yates&oldid=64783139

El anlisis de supervivencia es un conjunto de mtodos estadsticos muy apropiado cuando lo que


estamos investigando es el tiempo hasta que algo ocurre. Precisa recoger como mnimo dos
variables: el tiempo y la ocurrencia o no del evento terminal. Los datos pueden presentarse como
funcin de supervivencia y como funcin de riesgo. Disponemos de pruebas que permiten comparar
dos curvas de supervivencia.

12