Вы находитесь на странице: 1из 26

TEMAS 10 Y 11.

ESTUDIOS
EXPERIMENTALES. EL ENSAYO
CLINICO (I Y II): ETAPAS DEL
DISENO BASICO. ANALISIS DE DATOS
Y ALTERNATIVAS DE DISENO.
INTRODUCCIÓN
Los estudios experimentales son aquellos caracterizados por la existencia de manipulación
(el investigador decide qué parte de la población recibe la intervención y quién no). Por
definición siempre son longitudinales, con sentido hacia delante y prospectivos. La base de un
estudio experimental es comparar la frecuencia de un cierto efecto o desenlace (analítico)
entre, al menos, dos grupos:
- Grupo de intervención (porque recibe la intervención cuyo efecto se desea valorar).
- Grupo control, que no recibe dicha intervención.
Si la intervención produce el efecto esperado, la frecuencia de éste será diferente en los
sujetos que reciben la intervención con respecto a los que no la reciben.
La validez del estudio dependerá de que los dos grupos sean comparables, es decir,
semejantes en todo salvo en la intervención. Si ésa es la única diferencia existente entre
ambos grupos, las diferencias observadas entre ellos con respecto a la frecuencia del efecto
sólo se podrán atribuir a la intervención.
La existencia de manipulación hace que los estudios experimentales estén sujetos a
importantes restricciones éticas, que en muchos casos dificultan o impiden su puesta en
marcha. Por eso, la utilidad de los estudios experimentales en epidemiología se restringe a la
evaluación de medidas de tipo preventivo, diagnóstico y terapéutico.
Los estudios experimentales tienen tres grandes aplicaciones:
1. Valorar el efecto beneficioso de una intervención. Es su aplicación principal. La
intervención puede ser preventiva, diagnóstica o terapéutica. En ocasiones el tipo de
intervención es compleja, abarcando varios de los aspectos anteriores: política
sanitaria, programas de salud, sistemas de administración y gestión de servicios
sanitarios, etc.
2. Valorar el efecto metabólico de una intervención. Se refiere a intervenciones
terapéuticas, principalmente y su estudio inicial antes de su aplicación al paciente. Está
relacionada fundamentalmente con el estudio de la seguridad y farmacocinética de
una intervención (absorción, distribución, metabolismo, biotransformación,
biodisponibilidad y excreción).
3. Valorar los posibles efectos adversos de una intervención. Por razones de tipo ético
este difícilmente puede ser un objetivo primario de un estudio experimental; su
valoración suele ser secundaria al estudio de los efectos beneficiosos de dicha
intervención.
ESTUDIO EXPERIMENTAL
Aquel en el que una o más personas son voluntariamente expuestas a una intervención con el
objeto de cuantificar la aparición de uno o más efectos causalmente relacionados con ella.
Es habitual clasificar los estudios experimentales en tres grandes grupos:
1. Se habla de ensayos clínicos cuando un tratamiento u otra intervención se aplican a
sujetos enfermos con una intención diagnóstica, terapéutica o de prevención
secundaria (diagnóstico y tratamiento precoz) o terciaria (rehabilitación y reinserción
del sujeto).
2. Ensayos no controlados: No hay grupo control interno o concurrente.
3. Ensayos no aleatorizados (estudios semi-experimentales): Los sujetos asignados a los
grupos por un procedimiento no aleatorio.
4. Se habla de ensayos de campo cuando una medida de prevención primaria (destinada
a que no se produzca la enfermedad) se aplica a sujetos sanos. En los ensayos de
campo también pueden evaluarse medidas de prevención secundaria destinadas al
cribado y diagnóstico precoz de la enfermedad durante una fase preclínica.
5. Los ensayos comunitarios, son estudios experimentales en los que la intervención se
aplica de forma conjunta a grupos de individuos, agregados por circunstancias muy
diferentes: municipios, distritos, provincias, colegios, clases, hospitales, etc. Por
ejemplo, para estudiar la posible asociación entre flúor y caries, se escogen dos
comunidades (Granada y Málaga) y se comienza a fluorar el agua de una de ellas
(Granada) de forma sistemática. Al cabo de unos años se comprueba si la incidencia de
caries en los niños de Granada es menor que la de los de Málaga. Si es así, podría
deberse al efecto protector del flúor.
De los tres grupos anteriores, el más empleado es, sin duda, el ensayo clínico. Por ello, aunque
la mayoría de los conceptos que se expongan seguidamente son igualmente aplicables a los
otros dos grupos, de aquí en adelante vamos a referirnos específicamente a los ensayos
clínicos, como modelo de estudio experimental en seres humanos.

EL ENSAYO CLÍNICO
1. CONCEPTOS GENERALES
En un sentido amplio, un ensayo clínico (EC) es un estudio experimental en el que una o más
personas enfermas son voluntariamente expuestas a una intervención con el objeto de
cuantificar la aparición de uno o más efectos causalmente relacionados con ella. En todo EC
subyace una hipótesis de causalidad:
Intervención --- causa  efecto

Es importante diferenciar la intervención propia de un EC de la intervención propia de la


práctica clínica. Esta última se basa en la administración a pacientes de sustancias u otras
intervenciones, legalmente autorizadas, con el fin de obtener un beneficio para ellos. Sin
embargo, en un ensayo clínico, la finalidad no es obtener un beneficio para los pacientes que
participan en él, sino demostrar y cuantificar que ese beneficio existe para pacientes con
características similares a los incluidos en el EC.
En teoría, las intervenciones propias de la práctica clínica deberían ser la consecuencia natural
de los EC, como se representa en el siguiente esquema:

HIPÓTESIS VERIFICACIÓN APLICACIÓN

Intervención causa efecto ENSAYO CLÍNICO PRÁCTICA CLÍNICA

Habitualmente, la definición anterior de EC suele restringirse a aquel estudio en el que se


incluyen al menos dos grupos de enfermos: unos que reciben la intervención objeto de
estudio y otros que reciben una intervención alternativa o no reciben intervención alguna
(grupo control o grupo de comparación interno). Algunos autores hablan en este caso de EC
controlado.

Finalmente, la definición más restrictiva es la que habla de EC sólo cuando la asignación de los
sujetos a los grupos de comparación se hace de forma aleatoria. Algunos autores hablan
entonces de EC controlado aleatorizado (en inglés, RCT: randomized controlled trial). La
asignación aleatoria es el mejor procedimiento para lograr grupos de sujetos intercambiables
(comparables).

El diseño de un EC debe ser capaz de dar una respuesta a una pregunta de investigación.
Esta pregunta, a su vez, se plantea a partir de una hipótesis causal previa, que es el punto de
partida de todo EC (no puede diseñarse un EC sin una hipótesis causal previa). La pregunta de
investigación de todo EC debe contener cinco elementos:
1. (P) Población: A qué población quiero aplicar los resultados del estudio.
2. (I) Intervención: Para qué intervención quiero demostrar su efecto sobre los sujetos
de la población.
3. (C) Comparación: Con respecto a qué alternativa se compara el efecto de la
intervención (grupo control).
4. (O) Desenlace (Outcome, en inglés): Cuál es el desenlace cuya magnitud quiero
comparar entre los dos grupos (el de intervención y el control).
5. (T) Tiempo: Durante cuánto tiempo he de observar a los dos grupos de sujetos para
poder comparar los resultados entre ambos.
Las iniciales en inglés de los cinco elementos anteriores forman el acrónimo PICOT, que debe
aparecer en toda pregunta de investigación de un EC bien formulada.

Es importante resaltar que el grupo control, por definición, es aquél que no recibe la
intervención objeto de estudio. Ello no quiere decir que no reciban intervención alguna, pues,
si existe una intervención alternativa cuya eficacia está reconocida, no sería ético privar a los
sujetos del grupo control de dicha intervención. Por ello, es muy frecuente que los EC
comparen la “intervención novedosa” (administrada al grupo de intervención), frente a la
“intervención tradicional o estándar” (administrada al grupo control). Sólo cuando no existe
dicha intervención estándar está justificado no someter al grupo control a intervención
alguna, o administrarle un placebo (ver más adelante).

Ventaja: Los EC son el mejor instrumento para demostrar una hipótesis de causalidad sobre
seres humanos, pues reducen al mínimo la presencia de sesgos. Para algunos autores, los RCT
son el único diseño para demostrar causalidad. Pero, por desgracia, la asignación aleatoria no
“garantiza” la comparabilidad de los grupos, si fuera un procedimiento perfecto, sería tan
bueno como el estudio contrafáctico. Cuanto más homogénea sea la muestra y mayor el
tamaño muestral, más eficaz será la asignación aleatoria a la hora de repartir la muestra en
grupos comparables. Es imprescindible “comprobar” si la asignación aleatoria ha cumplido
correctamente su cometido.
Los principales inconvenientes de los EC son su escasa factibilidad (derivada de la necesidad
de salvaguardar los principios éticos y de su elevado coste), la generalmente baja validez
externa de sus resultados (al trabajar con poblaciones muy seleccionadas, es difícil extrapolar
los resultados a otras poblaciones más amplias) y las limitaciones éticas.

2. LEGISLACIÓN Y ÉTICA
Una vez que se tienen la hipótesis y objetivos de trabajo y se ha decidido realizar un EC, es
necesaria la aprobación del protocolo de estudio por los Comités Éticos de Investigación de
los centros en los que se va a llevar a cabo la investigación, así como por la Agencia Española
de Medicamentos y Productos Sanitarios, tal y como establece el Real Decreto 223/2004, de 6
de febrero, por el que se regulan los Ensayos Clínicos con Medicamentos.
Este Real Decreto incorpora las directrices de la Directiva 2001/20/CE del Parlamento Europeo
y del Consejo sobre la aplicación de buenas prácticas clínicas en la realización de ensayos
clínicos de medicamentos en seres humanos.

El principio ético fundamental que debe regir todo estudio experimental en humanos es el de
equidad, también llamado clinical equipoise (equilibrio clínico): la existencia de una total
incertidumbre, establecida por un panel de expertos (que tiene que ser independiente de los
que financian y promueven el ensayo) sobre cuál de las diferentes estrategias es preferible
para obtener el máximo beneficio en los participantes del estudio. Así, antes del inicio del
estudio, no debería haber razones fundadas para preferir pertenecer a uno u otro grupo de
estudio (el de intervención o el control), porque, a priori, no se sabe cuál de las dos estrategias
dará un mejor resultado.
En consonancia con este principio se sitúan los demás requisitos éticos que deben ser
refrendados por el comité ético de evaluación:
1. Justicia: todas las personas merecen ser tratadas con consideración y respeto, sin
diferencias entre ellas, con especial protección a los menos favorecidos.
2. No maleficencia: No realizar prácticas dañinas, aunque el paciente lo pida. Es
maleficencia la realización de un EC que no va a tener validez científica.
3. Beneficencia: Las personas deben ser tratadas protegiéndolas de los daños y
asegurando su bienestar, lo cual implica no perjudicar, maximizando el beneficio y
minimizando los riesgos.
4. Autonomía: Tratar a las personas como seres autónomos y proteger a las personas
con autonomía disminuida (por ignorancia, inmadurez o incapacidad psíquica). Para
cumplir este principio es preciso obtener el consentimiento de los posibles
participantes en el estudio, antes de incluirlos. El consentimiento a participar en un EC
debe ser:
a. Informado: Verbalmente y por escrito.
b. Comprendido: La información debe adaptarse a la capacidad de comprensión
del paciente. Después de informar, hay que dejarle un período de reflexión al
paciente.
c. Competente (legalmente): Para sujetos menores de edad e incapacitados, se
requiere el consentimiento de un representante legal.
d. Voluntario: En ausencia de controles externos (coerción, manipulación o
persuasión), y auténtico (que no contradiga el sistema de valores del que lo
da).
En 1964, la Asociación Médica Mundial (AMM) promulgó la llamada Declaración de
Helsinki: un cuerpo de principios éticos que deberían guiar la experimentación con seres
humanos. Desde entonces, este documento ha sido objeto de siete revisiones, la última de las
cuales fue realizada en la 64 Asamblea General de la AMM, en Fortaleza (Brasil) (2013).
Aunque sus principios no son de obligado cumplimiento, es unánimemente reconocido por la
comunidad científica como el principal instrumento a tener en cuenta para garantizar el
cumplimiento de los principios éticos en la investigación con seres humanos.

3. TIPOS DE ENSAYOS CLÍNICOS.


Los EC Controlados (con grupo de control interno) pueden clasificarse atendiendo a distintos
criterios:

3.1. EN FUNCIÓN DE LAS CARACTERÍSTICAS DEL GRUPO CONTROL


Bajo una perspectiva amplia, podemos asumir que en todo EC existe, al menos, un grupo
experimental o de intervención (sometido a la intervención bajo estudio), cuyos resultados se
comparan con los obtenidos en otro grupo de personas, denominado grupo control (sobre el
que no se aplica la intervención bajo estudio).
Hay dos premisas fundamentales que garantizan la validez interna del EC:
1. Que los dos grupos sean comparables entre sí. Ello quiere decir que todos los factores
pronósticos de la enfermedad (conocidos y desconocidos) deben estar igualmente
repartidos entre los distintos grupos antes de iniciar el tratamiento. La existencia de
diferencias entre ambos grupos, en cuanto a la distribución de los factores pronósticos
depende de dos factores:
a. Que existan sesgos (errores sistemáticos).
b. Que existan errores aleatorios (que, simplemente por azar, los dos grupos son
diferentes).
2. Que las mediciones de todas las variables de interés en los dos grupos han de tener
el mismo grado de fiabilidad y validez.

ENSAYOS CON GRUPOS PARALELOS:


Los sujetos siempre pertenecen al mismo grupo de comparación. Pueden ser:
1. Simples: sólo hay dos grupos de comparación (el experimental y el control).

2. Factoriales. Valoran el efecto de dos o más intervenciones, sin necesidad de aumentar


excesivamente el tamaño muestral que se requeriría para evaluar por separado el
efecto de cada intervención.
En la situación más sencilla (dos intervenciones: A y B), los participantes son aleatorizados dos
veces (aunque en la práctica se hace en un único proceso); una con respecto a la intervención
A y otra con respecto a la intervención B. El resultado de la doble asignación aleatoria es que
los participantes pueden quedar adscritos a uno de cuatro posibles grupos:
1. Los que sólo reciben la intervención A (y un placebo de B)
2. Los que sólo reciben la intervención B (y un placebo de A).
3. Los que reciben las dos intervenciones.
4. Los que no reciben ninguna (y los placebos de A y B).
Si A y B son dos intervenciones independientes, el efecto de A se valora comparando los
grupos 1+3 frente a los grupos 2+4; por su parte, el efecto de B se valora comparando los
grupos 2+3 frente a los grupos 1+4.
Estas comparaciones son válidas si no hay interacción entre las intervenciones; es decir, si la
magnitud del efecto de una de ellas no cambia en función de la presencia de la otra. No
obstante, este estudio también permite cuantificar la posible interacción entre las dos
intervenciones, en caso de haberla.
Un ejemplo de estudio factorial es el llevado a cabo en el Physician Health Study. En él se
evaluaron simultáneamente dos intervenciones para reducir el riesgo de cáncer y de
enfermedad cardiovascular: la aspirina y el uso de un suplemento con beta carotenos. Este
ejemplo ilustra otra de las ventajas de los diseños factoriales: si se decide interrumpir una de
las intervenciones (por ejemplo, por haber quedado claramente manifiesta su eficacia o sus
efectos adversos antes del fin previsto del estudio), puede continuarse el estudio con la otra
intervención.

ENSAYOS CRUZADOS:
Los sujetos van perteneciendo sucesivamente a los distintos grupos de comparación. Por
ejemplo, si inicialmente se establecen dos grupos de comparación A y B, al final de un primer
período de estudio, los sujetos asignados inicialmente al grupo A pasan a pertenecer al grupo
B, y viceversa. Entre los dos períodos de estudio se intercalan períodos de blanqueo, con
placebo, con objeto de que el efecto del primer tratamiento desaparezca antes de iniciar el
segundo.
En realidad, en estos estudios, se comparan los distintos efectos producidos por los
diferentes tratamientos en el mismo sujeto, aunque en todo momento se dispone de los
grupos de comparación de forma concurrente.
Esta estrategia sólo es útil cuando la enfermedad es estable a lo largo del tiempo, o se
presenta de forma episódica o recurrente (por ejemplo, crisis epilépticas, ataques de artritis o
jaqueca, trastornos menstruales, etc.).
Son ensayos más largos que los paralelos, con el consiguiente problema de pérdidas, pero
permiten a cambio reclutar menos pacientes y disminuir la variabilidad intersujetos (ruido de
fondo).
Es más fácil desenmascarar el cegamiento y es difícil descartar la existencia de efectos
residuales del tratamiento precedente.

ENSAYOS EN UN SOLO PACIENTE:


En este diseño, un único paciente es alternativamente sometido a, al menos, dos
intervenciones diferentes (o una intervención frente a un placebo), con una secuencia
temporal asignada aleatoriamente.
El objetivo es comparar la eficacia de ambas intervenciones en un paciente en concreto, y no
en un grupo de pacientes, bajo el razonamiento de que lo que es bueno en promedio (para un
grupo de personas) no tiene por qué serlo para todos los sujetos que componen el grupo.
En este diseño, la unidad de estudio no es la persona, sino los períodos de estudio,
comparados por pares: cada par consta de un período en el que se administra una
intervención y otro en el que se administra la otra intervención (o un placebo). El estudio debe
hacerse con asignación aleatoria de las intervenciones en cada par y, si es posible, con
cegamiento doble.

Los requisitos para la aplicación de este diseño son:


1. Que se aplique para valorar el efecto de intervenciones sobre enfermedades crónicas
y estables
2. Que estas enfermedades presenten síntomas fácilmente reconocibles por el
paciente, repetibles y reversibles
3. Que respondan de forma rápida a tratamientos que, por otra parte, no dejen efectos
prolongados sobre el paciente tras su interrupción.
Este diseño está especialmente indicado para enfermedades raras, en las que se desconoce la
mejor alternativa terapéutica, y en aquellas para las que existe constancia de una gran
variabilidad intraindividual en la respuesta a las posibles intervenciones. También está
indicado para valorar la eficacia de diferentes intervenciones orientadas a paliar
sintomatología subjetiva (por ejemplo, dolor), de pacientes con enfermedades crónicas
(asma, fibromialgia, insomnio, etc.).

3.2. EN FUNCIÓN DEL MÉTODO DE ASIGNACIÓN DE LOS PARTICIPANTES A LOS GRUPOS DEL
ESTUDIO.
En todos los EC controlados, independientemente de que sean en paralelo o cruzados, siempre
se dispondrá, al menos, de dos grupos, experimental y control. La forma de asignar los sujetos
del estudio a ambos grupos determina que hablemos de EC controlado con asignación
aleatoria o EC controlado sin asignación aleatoria.

ASIGNACIÓN NO ALEATORIA:
Los sujetos son asignados a los grupos de estudio por un método que no depende del azar.
Estos no son ensayos clínicos en sentido estricto.
En general, la asignación no aleatoria dificulta que se cumpla la premisa de comparabilidad de
los grupos de estudio. Los métodos de asignación no aleatoria son variados:
- Sistemática: Según un orden preestablecido (por ejemplo, la alternancia, el día de la
semana, la fecha de nacimiento del paciente, etc.).
- A juicio del investigador.
- Voluntaria: A elección del paciente: Da lugar al sesgo del voluntario.

Ensayos pre post.


Son aquellos en los que se evalúa la frecuencia del defecto antes y después de la intervención.
En sentido estricto, no hay un grupo control en paralelo, sino que los propios sujetos antes del
ensayo actúan como grupo control. El sesgo está en que no podemos saber si los cambios que
observamos se deben exclusivamente a la intervención y qué parte se debe a todo lo que haya
cambiado. Además tienen un error intrínseco que se puede controlar, pero lo tienen y es el
fenómeno de regresión a la media.

ASIGNACIÓN ALEATORIA:
Los sujetos son asignados a los grupos de estudio por un método que depende del azar. La
probabilidad de cada sujeto de pertenecer a cada grupo de comparación se fija de antemano y
se aplica por igual a cada uno de los sujetos del estudio. La asignación aleatoria es, en general,
la mejor estrategia para lograr la comparabilidad de los grupos de estudio y garantiza que, si
existen diferencias en la distribución de factores pronósticos, éstas serán debidas
exclusivamente al azar. Para realizar la asignación aleatoria hay que tener en cuenta dos
factores:
- El tamaño deseado para cada grupo: En el caso más sencillo (dos grupos:
experimental y control), se puede desear que ambos grupos tengan igual tamaño, en
cuyo caso pexp=pcon=0,5; o bien preferir que ambos grupos tengan tamaños
desiguales (pexp ≠ pcon). Por ejemplo, si queremos que las 2/3 partes de la muestran
pertenezcan al grupo experimental, entonces pexp=0,66 y pcon=0,33.

- El método de asignación aleatoria. Hay varias posibilidades:


a. Asignación aleatoria simple: Se suele hacer mediante tablas de números
aleatorios o empleando el ordenador. Presenta varios inconvenientes:
i. No garantiza que los tamaños finales de los grupos de comparación
sean los deseados.
ii. No garantiza que no existan diferencias en los factores pronósticos
debidas al azar. Estos dos inconvenientes se mitigan a medida que el
tamaño de los grupos es mayor.
iii. No elimina la probabilidad de que varios pacientes se asignen
consecutivamente al mismo grupo. No evita las rachas.

b. Asignación aleatoria por bloques: Se divide el tamaño total de la muestra en


“n” bloques. Dependiendo del tamaño de los bloques se dispone de un
número fijo de posibles combinaciones. Por ejemplo, si el tamaño de cada
bloque es de cuatro sujetos y pexp=pcon=0,5, existen seis posibles tipos de
bloques:
i. Tipo 1: AABB
ii. Tipo 2: BBAA
iii. Tipo 3: ABAB
iv. Tipo 4: BABA
v. Tipo 5: ABBA
vi. Tipo 6: BAAB
Se obtiene, de forma aleatoria, una secuencia de bloques, que será la que se
aplicará a la serie de pacientes del estudio.
Por ejemplo, si queremos una muestra final de 40 sujetos, 20 en el grupo
experimental y 20 en el control, podemos dividir el total en 10 bloques de 4
sujetos cada uno. Si obtenemos la siguiente secuencia aleatoria de los 10
bloques: 3,2,4,4,1,6,3,4,2,5, la asignación de los sujetos a los dos grupos será la
siguiente: ABAB BBAA BABA BABA AABB BAAB ABAB BABA BBAA ABBA.

El tamaño de los bloques puede ser fijo (igual para todos), o variable. Esta
asignación elimina el primer y tercer inconvenientes de la asignación aleatoria
simple, pero no afecta al segundo.

c. Asignación aleatoria estratificada: Antes de efectuar la aleatorización,


generalmente por bloques, se clasifica a la muestra de pacientes en varios
estratos, definidos en función de la magnitud de uno o varios factores
pronósticos conocidos. Este tipo de muestreo elimina la desigualdad, debida
al azar, de los factores pronósticos conocidos por los que se ha estratificado.
Se emplea cuando el tamaño del estudio es pequeño, pues cuando es grande,
ya se ha dicho que las desigualdades por azar tienden a ser cada vez menores.
Una vez establecidos los estratos, se hace una asignación aleatoria separada
dentro de cada estrato. No se puede usar si hay demasiados estratos, si hay
muchas variables.
d. Asignación aleatoria apareada: Es la situación extrema de la estratificación:
por cada sujeto del estudio se eligen n sujetos (generalmente 1) con idénticos
factores pronósticos. En el caso más simple pexp=pcon=0,5, se definen N/2
pares de sujetos. A cada par de sujetos se les aplica un muestreo por bloques,
con bloques de tamaño igual a 2 y dos posibles tipos: AB o BA. Este tipo de
asignación también puede hacerse en determinados estudios en los que los
pares experimental/control pertenecen al mismo individuo (ojo derecho, ojo
izquierdo, brazo derecho, brazo izquierdo, etc).
Diseño de Zelen: Se aplica cuando la intervención del estudio se compara con
“la intervención convencional o estándar” (la que se aplicaría si no se estuviera
llevando a cabo ensayo clínico alguno). Consiste en asignar aleatoriamente a
los pacientes sobre si se les va a pedir consentimiento o no para realizar el
estudio; los asignados al grupo de no solicitud reciben la intervención
convencional; a los asignados al grupo de sí solicitud se les informa sobre las
características del ensayo y se les deja elegir el tipo de intervención que
desean recibir. La clave está en comparar a los grupos en función de la
asignación del consentimiento, y no en función del tratamiento que finalmente
han tomado. Cuanto menor sea el número de sujetos del grupo al que se
solicita consentimiento que prefiere la intervención convencional, más
eficiente será este diseño.

e. Asignación aleatoria por conglomerados (clusters): En estos estudios la


unidad de asignación aleatoria es el grupo y no el individuo. Los pacientes
están repartidos inicialmente en bloques definidos por el médico. Para
repartirlos en 2 grupos, se pueden repartir por asignación aleatoria, por
unidades superiores de esos grupos por ejemplo de los médicos que atienden
a esos pacientes. Esto se hace cuando es táctico.
Evita o minimiza un sesgo o error de contaminación, ya que si el mismo
médico asigna distintas intervenciones a sus distintos pacientes, un paciente
que haya recibido una intervención se puede contaminar de la intervención
contraria sólo por contacto con el médico o con otro paciente de ese mismo
médico que haya recibido la otra intervención (esto sucede por ejemplo en
intervenciones de consejo sanitario).
Por ejemplo, ésta sería la situación en la que, para comparar el efecto de
distintas intervenciones encaminadas al abandono del hábito tabáquico, los
terapeutas participantes en el estudio (y no sus pacientes fumadores) son
aleatoriamente asignados para administrar los distintos tipos de
intervenciones.
Generalmente, esta estrategia se aplica
para evitar el sesgo por contaminación:
en una asignación aleatoria individual,
un fumador asignado a no recibir una
cierta intervención antitabáquica podría
“contaminarse” del efecto de esa
intervención si ésta se administra a
sujetos próximos a él (por ejemplo, si
comparten la consulta del mismo
terapeuta).

Sea cual sea el método de asignación aleatoria, es esencial que la secuencia de asignación
aleatoria sea totalmente desconocida, ciega, para las personas que van a asignar a los
pacientes a los grupos del EC. Es lo que se conoce como ocultación de la secuencia de
aleatorización (OSA).
Cuando el médico recluta al paciente para participar en el EC (porque cumple los criterios de
selección y da su consentimiento informado), no debe saber a qué grupo va a ser asignado
este paciente (si al grupo experimental o al grupo control, en la situación más sencilla). Una
vez obtenido el consentimiento, el médico se pondrá en contacto con el centro de control del
EC, que es quien entonces le indicará (en función de la secuencia aleatoria previamente
generada), a qué grupo debe ir asignado ese paciente.
Si en un EC la secuencia de aleatorización no permanece oculta para el médico responsable
de la asignación, es probable que se produzcan desequilibrios en esta asignación y que, con
ello, se pierda la comparabilidad entre grupos que se ha pretendido lograr mediante la
asignación aleatoria.
Por ejemplo, si un médico sabe que el próximo paciente a reclutar para el EC va a ser asignado
a un grupo concreto, y sabe (o sospecha, en caso de sea un estudio con doble cegamiento),
cuál es ese grupo (el experimental o el control), es posible que ese conocimiento influya en la
atención que vaya a dispensar a ese paciente o incluso conduzca a un cambio de grupo o a la
exclusión de ese paciente para el EC. Por eso, la existencia de un procedimiento que garantice
la OSA es uno de los principales criterios de calidad de un EC.

NO ES LO MISMO LA OSA QUE EL CEGAMIENTO. Es importante no confundir estos términos, un


estudio puede hacerse con ocultación y sin cegamiento, lo ideal es que un estudio se haga con
las dos cosas ocultación + cegamiento.

ASIGNACIÓN POR MINIMIZACIÓN:


Cuando el número de participantes en un EC es muy pequeño, es altamente probable que el
azar no haga bien su tarea, es decir, que precisamente por azar, los dos grupos de
comparación no sean similares con respecto a factores que son importantes confusores o
pronósticos del desenlace (es algo parecido a cuando se reparten al azar sólo 10 cartas en dos
grupos de 5: lo más probable es que el valor de ambos grupos de 5 cartas sea muy diferente).

Es la única estrategia no aleatoria que se acepta como válida en el ensayo clínico, tiene un
componente aleatorio y otro no aleatorio.

En esta situación, es frecuente emplear una asignación por minimización: se trata de repartir
a los pacientes de forma que nos aseguremos de que, al final del proceso, los dos grupos de
pacientes serán muy semejantes, al menos con respecto a las principales variables de
confusión/pronóstico.
Para ello hay diversos procedimientos. A continuación se describe uno de los más empleados:
1. Se identifican los dos o tres factores cuya distribución se pretende que sea similar
entre ambos grupos (experimental y control). Por ejemplo, imaginemos que queremos
que los grupos sean lo más parecidos posibles al menos con respecto a la edad (<65,
65 o más), el sexo (varón, mujer) y el estadio de la enfermedad (0,I, II, III).
2. Se le asigna un valor numérico a cada categoría de las tres variables. Por ejemplo:
<65: 1 Varón: 1 Estadio 0: 1
65 o más: 2 Mujer: 2 Estadio I: 2
Estadio II:3
Estadio III: 4

3. El primer paciente reclutado para el EC se asigna al azar a uno de los dos grupos
(experimental o control). A partir de este momento se empieza a contar la puntuación
de cada grupo. Por ejemplo, si el primer paciente es una mujer de 68 años con estadio
III, y ha sido asignada por azar al grupo control, tendremos la siguiente situación:
grupo experimental: 0 puntos / grupo control: 8 puntos.
4. Para asignar al segundo paciente, se cuentan sus puntos y se asigna al grupo que
tenga menos, para tratar de equilibrarlo con el otro. Por ejemplo, si el segundo
paciente es un varón de 60 años y estadio 0, se asignaría al grupo experimental, y
entonces tendríamos: grupo experimental: 3 puntos / grupo control: 8 puntos.
5. Se repite el proceso sucesivamente, asignando al siguiente paciente a aquel grupo
que tenga menos puntos, a fin de igualarlo con el otro. En caso de que haya un
empate a puntos entre ambos grupos, el siguiente paciente es nuevamente asignado
al azar.
6. Al final del proceso de asignación, el objetivo debe ser que la puntuación final de
ambos grupos sea muy parecida entre sí (idealmente, debería ser la misma).
Entonces, la distribución de las tres variables entre los dos grupos será también muy
parecida entre sí.

3.3. EN FUNCIÓN DE LA EXISTENCIA DE ENMASCARAMIENTO


El conocimiento de la pertenencia al grupo experimental o al grupo control puede influir en la
valoración de los efectos de la intervención. Por eso, es preferible ocultar ese conocimiento al
máximo número de personas implicadas en el EC. Es lo que se conoce como
enmascaramiento o cegamiento. Así, los ensayos clínicos se clasifican en dos grandes
grupos:
- SIN CEGAMIENTO O ABIERTOS: Todas las personas implicadas en la realización del
estudio conocen a qué grupo pertenece cada uno de los participantes.
- CON CEGAMIENTO: Algunas de las personas implicadas en la realización del estudio
desconocen a qué grupo pertenece cada uno de los participantes. Hay varios niveles
de cegamiento:
o Simple: Una de las partes involucradas, generalmente los pacientes, no saben
al grupo de comparación al que pertenecen.
o Doble: Ni los pacientes, ni los investigadores/médicos que administran la
intervención y realizan el seguimiento conocen a qué grupo pertenece cada
paciente.
o Evaluación ciega por terceros: Cuando el investigador y/o los pacientes saben
a qué grupo pertenecen estos últimos, es posible que una tercera persona, no
vinculada al estudio, realice la evaluación de la respuesta al tratamiento en
cada paciente.
o Triple: El analista de la información desconoce a qué grupo pertenecen los
pacientes. También lo desconocen los que administran la intervención, los
que evalúan y los pacientes.
Para poder mantener el enmascaramiento, es necesario que las intervenciones aplicadas a los
grupos de comparación sean “aparentemente” iguales, lo que no siempre es posible.
A tal efecto, es posible el empleo de un placebo: un preparado sin sustancias
farmacológicamente activas, pero de idéntica apariencia y otras características
organolépticas que el preparado de experimentación, utilizado para tratar a los sujetos del
grupo control.
El empleo de placebos en los EC tiene dos objetivos, relacionados entre sí:
1. Como ya se ha mencionado anteriormente, posibilitar el cegamiento.
2. Controlar el efecto placebo: efecto beneficioso sobre la salud que no depende de las
propiedades farmacológicas de un tratamiento, sino de la sensación psicológica de
"recibir un tratamiento". Si a un grupo de enfermos se les administra un tratamiento y
se observa una mejoría en sus síntomas, parte de esa mejoría puede no deberse a las
propiedades farmacológicas del tratamiento administrado, sino a otros factores, entre
los que se encuentran una mejoría espontánea (habrían mejorado aunque no hubieran
sido tratados) y, por supuesto, al efecto placebo del tratamiento. La única forma de
saber qué parte de la mejoría observada en ellos depende sólo de las propiedades
farmacológicas del tratamiento y no de esos otros factores es comparar el nivel de
mejoría de los pacientes tratados con el tratamiento bajo estudio con el nivel de
mejoría de los pacientes tratados sólo con placebo. La diferencia entre ambos niveles
de mejoría será atribuible exclusivamente a las propiedades farmacológicas del
tratamiento.
El empleo de placebos no debe contravenir el requerimiento ético de clinical equipoise:
- Cuando es ético comparar una intervención frente a la ausencia de intervención
alguna, es ético y muy recomendable administrar únicamente un placebo al grupo
control, siempre que sea posible.
- Cuando no es ético comparar una intervención frente a la ausencia de intervención
alguna, porque ya existe un tratamiento estándar de eficacia probada, no es ético
administrar únicamente placebo al grupo control. En este caso es posible utilizar la
técnica de doble placebo o doble simulación:
o Los sujetos del grupo de intervención reciben la intervención más un placebo
del tratamiento estándar
o Los sujetos del grupo control reciben el tratamiento estándar más un placebo
de la intervención.

3.4. EN FUNCIÓN DE LOS OBJETIVOS DEL ENSAYO


Se distinguen dos tipos de ensayos clínicos:

CON FINES TERAPÉUTICOS:


Se realizan sobre pacientes. Estos a su vez podrían subdividirse en explicativos y pragmáticos:
- Explicativos: El efecto del tratamiento se valora en condiciones lo más experimentales
posibles, para garantizar la máxima validez interna. Es el que valora la EFICACIA de una
intervención, es decir va a evaluar los efectos de la intervención en la situación de
aplicación óptima.
- Pragmáticos: Intenta remedar la práctica clínica todo lo posible, para garantizar la
máxima validez externa. Valora la EFECTIVIDAD , los efectos en condiciones reales, en
condiciones cotidianas.
La siguiente tabla resume las principales diferencias entre los ensayos explicativos y
pragmáticos.
EXPLICATIVOS PRAGMÁTICOS
Objetivo Aumentar conocimiento Ayudar en las decisiones
Centro de interés Eficacia Efectividad
Enmascaramiento Sí A menudo no
Placebo/control Sí A menudo no
Dosis de tratamiento Fija A menudo variable
Criterios de selección Restrictivos Amplios
Otros tratamientos Se evitan A menudo se permiten
Muestra de sujetos Homogénea/Cumplidora Heterogénea/Representativa
Variables de respuesta Acción farmacológica Efecto terapéutico.

SIN FINES TERAPÉUTICOS


Se realizan sobre voluntarios sanos, económicamente incentivados, y su finalidad no es
demostrar la utilidad terapéutica de un fármaco, sino otras cuestiones relacionadas:
tolerabilidad, dosis máxima tolerada, farmacocinética, farmacodinamia, biodisponibilidad,
bioequivalencia, etc.
Se considera asumible un riesgo de 1 a 100 por 1000 de sufrir una complicación leve y de 1-100
por 100.000 de sufrir una complicación grave.

3.5. EN FUNCIÓN DE LA HIPÓTESIS DE PARTIDA DEL EC


ENSAYOS DE SUPERIORIDAD
En la mayoría de EC, la hipótesis que se pretende demostrar es que el tratamiento
experimental es superior a la estrategia convencional (tratamiento de eficacia contrastada), o
a la ausencia de intervención (en caso de que no exista un tratamiento preexistente de
eficacia contrastada), tanto de un punto de vista estadístico, como clínico. Para esto último, es
necesario definir un "umbral de significación clínica": la mínima diferencia a favor del
tratamiento experimental que se desea demostrar.

ENSAYOS DE NO INFERIORIDAD:
La hipótesis que se pretende demostrar en este EC es que el tratamiento experimental no es
peor que el tratamiento estándar (o tratamiento control). Esto puede ser relevante cuando el
tratamiento experimental presente otras ventajas con respecto al control (más barato, más
fácil de administrar, menos efectos adversos, etc.).
En estos ensayos, la hipótesis nula es que el fármaco experimental es inferior al control,
mientras que la hipótesis alternativa es que el fármaco experimental no es inferior (puede ser
igual o incluso mejor).
El principio fundamental de estos EC es definir el llamado margen o límite de no inferioridad,
o valor delta: la máxima diferencia entre los tratamientos que se considerará clínicamente
irrelevante.
El EC dará un resultado significativo (es decir, rechazará la hipótesis nula de inferioridad),
cuando el límite de no inferioridad quede excluido (por debajo) del Intervalo de Confianza de
la diferencia entre ambos tratamientos.

INTERPRETACIÓN DE LOS ENSAYOS


En un ensayo de superioridad, en el que la hipótesis nula es que los dos fármacos son iguales,
la hipótesis alternativa (que son distintos), puede ser cierta si el fármaco experimental es
mejor o es peor que el control (y, obviamente, no es lo mismo una cosa que otra). Por eso, en
estos ensayos, los intervalos de confianza se construyen a dos colas.
Interpretación de un ensayo de superioridad:
Se hace en base al RAR, se resta el riesgo de muerte en los que no reciben la intervención
menos los que reciben la intervención. Si es negativo, favorece a la intervención control o al
placebo y si es positivo, al experimental nuevo. Hay que recordar que:
- Hipótesis nula; en el ensayo de superioridad es que no hay diferencia, que ambas
alternativas pueden valer.
- Hipótesis alternativa, las dos pueden valer, pero una es mejor que la otra. Esta
hipótesis se construye para que permita rechazar la hipótesis nula. Si se rechaza la
hipótesis nula, nos quedamos con la alternativa.
Hay que establecer qué beneficio es clínicamente relevante, antes de hacer el ensayo, el
investigador, debe fijar este valor.
Se estima el intervalo de confianza para el RAR, porque lo queremos aplicar no a una persona,
sino a la población. Posibilidades:

- Caso 1. Si el intervalo de confianza que calculamos incluye al RAR, el tratamiento


nuevo no es mejor que el anterior, pero nos da el máximo RAR que creemos que
existe, y ese está por debajo de lo que consideramos clínicamente relevante. No
sabemos si es mejor, pero en caso de ser mejor, no es clínicamente mejor para que la
mejoría sea clínicamente relevante, por tanto, el fármaco no interesa. Es un resultado
relevante aunque no sea estadísticamente significativo.
- Caso 2. Si el intervalo de confianza de otro fármaco sobrepasa el beneficio
clínicamente relevante sólo en una parte de su intervalo, no es clínicamente relevante,
no hay diferencias significativas
- Caso 3, podemos decir que el fármaco experimental sí es mejor, porque hay
diferencias significativas pero no puede asegurarse que la IR aporte un beneficio
clínicamente relevante.
- Caso 4, hay diferencias estadísticamente significativas y es clínicamente relevante.

Sin embargo, en un ensayo de no inferioridad, la hipótesis alternativa es, simplemente, que el


fármaco experimental no es peor: nos da igual que sea porque es igual o porque es mejor que
el control. Por eso, los intervalos de confianza se suelen construir a una cola1 (con sólo un
límite, más cercano a la estimación puntual que si fuera a dos colas).
Hipótesis nula y alternativa están formuladas al revés, la nula es que la intervención
experimental es inferior y la alternativa es que no es inferior que la control. En este tipo de
estudios aparece el límite de no inferioridad, el valor delta, es el rango que estamos dispuestos
a aceptar que es peor el fármaco experimental, si rebasa ese límite, ya decimos que es
bastante peor y entonces habrá que aceptar la hipótesis nula. Si no rebasa ese límite delta,
decimos que el fármaco experimental no es peor y gana la hipótesis alternativa. Posibles
resultados:

- Caso 1. La intervención experimental es significativamente no inferior a la control (H1).


- Caso 2. Aunque el 0 esté dentro del intervalo, no hablamos de significación estadística
en funcion de que el 0 este dentro del intervalo. Lo único que nos interesa es que el
limite inferior de nuestro intervalo está por encima del valor delta, es decir, de la
máxima diferencia admisible. Gana la hipótesis alternativa. La intervención
experimental es significativamente no inferior.
- Caso 3. En este caso el intervalo de confianza pasa al -5. El fármaco experimental
puede ser inferior al valor delta, por eso no se puede rechazar la hipótesis nula.
- Caso 4. Igual que en el 3, no se puede decir que el fármaco no sea inferior al delta.

ENSAYOS DE EQUIVALENCIA
Se usan muy poco. Para hacer un ensayo de este tipo, habría que fijar un valor delta por los
dos límites. Para poder demostrar la hipótesis de equivalencia, el intervalo de confianza
debería estar entre los dos. En ese caso, las dos intervenciones serían equivalentes. Para que
el intervalo quede dentro de los dos limites, el intervalo necesario de confianza necesita ser
muy pequeño. Se hacen poco porque requieren un tamaño de muestra muy generoso para
generar un intervalo de confianza muy estrecho.

1
CHUPIESTADÍSTICA: Recuerdo intervalos de confianza:
- Intervalo a dos colas: Confianza en que el verdadero valor está entre dos límites (con una
confianza del 95%.
- Intervalo a una cola: Confianza en que el verdadero valor del parámetro está limitado solo por
un lado.
3.6. EN FUNCIÓN DE LA PREDETERMINACIÓN O NO DEL TAMAÑO MUESTRAL
En función de que se predetermine o no el tamaño de muestra necesario se definen dos tipos
de EC:

ENSAYOS SECUENCIALES:
No se predetermina tamaño de muestra, sino que se van reclutando sujetos, que se van
asignando a los grupos experimental o control. De forma previamente planificada, se van
realizando análisis intermedios (ver más adelante), en función de cuyos resultados se decide
continuar con el reclutamiento de pacientes o detener el EC.
Este tipo de EC se justifica en que, si a priori la ignorancia sobre el efecto de un fármaco puede
ser total, ésta va desapareciendo a medida que el estudio progresa y se obtiene información,
que puede permitir detener el ensayo en cuanto ésta sea suficiente, sin incurrir en un
problema ético (por ejemplo, si un fármaco se demuestra eficaz, conviene parar el EC lo más
rápidamente posible, para no privar al grupo control de este avance).
Los ensayos secuenciales están especialmente indicados cuando tienen un único objetivo, se
prevé que el tamaño muestral final va a ser grande, la duración del ensayo es prolongada (>2
años) y el intervalo entre la asignación del tratamiento y la obtención de la respuesta es
breve.

ENSAYOS NO SECUENCIALES:
Son los ensayos clásicos, los más frecuentes, en los que existe un tamaño de muestra
prefijado. Para calcular el tamaño de muestra de un EC, inicialmente se suele fijar en 0,05 el
error alfa o tipo I aceptable (la probabilidad de rechazar la hipótesis nula -que en un ensayo
de superioridad sería la igualdad de resultados entre los dos grupos-, cuando ésta es cierta), y
en 0,8 la potencia del estudio (1 - error beta o tipo II): la probabilidad de detectar diferencias
entre grupos (cuando estas realmente existen).
A menor error alfa y mayor potencia deseada, mayor debe ser el tamaño muestral. A partir de
aquí, el tamaño muestral requerido depende de dos valores:
- El más importante es la sensibilidad del estudio, o sea, la mínima diferencia entre los
grupos de comparación que interesa detectar y que, a su vez, depende de la relevancia
clínica de los resultados. Así, para predeterminar la sensibilidad del estudio, habría que
determinar cuál es la diferencia más pequeña entre tratamientos que tiene relevancia
clínica (que justificaría decantarse por uno de ellos). Cuanto más pequeña sea la
diferencia que se pretende detectar, mayor debe ser el tamaño de los grupos.
- La frecuencia esperada de aparición del desenlace en el grupo control que se quiere
evitar mediante la intervención: Cuanto mayor sea ésta, menor tamaño muestral será
necesario. Por esta razón, interesa que la población elegible esté formada por sujetos
con una elevada probabilidad de desarrollar el desenlace que se quiere evitar.

El error alfa y la potencia se suelen fijar de antemano, pero casi todo el mundo los fija en los
mismos valores para que sean aceptados, pero lo que sí se puede mover un poco más es la
sensibilidad del estudio y la frecuencia esperada.

Por ejemplo, la siguiente tabla (tomada de: Haynes et al. "Clinical Epidemiology"), muestra
cómo varían los tamaños muestrales requeridos en cada uno de los dos grupos de un EC
(intervención y control), en función de los dos valores anteriores:
RRR
20% 25% 30% 35% 40%
Frecuencia 0,60 270 173 120 88 67
del 0,55 324 205 148 105 79
desenlace 0,50 388 247 170 124 93
esperado 0,45 466 298 203 146 111
en los 0,40 564 356 244 176 133
controles

En general, el tamaño deseado para realizar el EC es la principal variable que se ha de


considerar a la hora de decidir si éste debe ser unicéntrico (sólo hay un centro participante) o
multicéntrico (hay más de un centro participante).

3.7. EN FUNCIÓN DE LA FASE DE APLICACIÓN EN EL DESARROLLO DE UN FÁRMACO.


(IMPORTANTE)
En general, los EC más frecuentes son los que se aplican, de forma secuencial, en el desarrollo
de nuevos fármacos que constan de cuatro fases consecutivas:

FASE 1:
Trata de contrastar la seguridad y tolerancia del fármaco, así como estudiar su
farmacocinética y farmacodinamia en seres humanos.
Para ello se administra el fármaco a una muestra de voluntarios sanos (n=30-100), salvo
cuando el riesgo de efectos secundarios sea muy elevado (por ejemplo, quimioterapia en
pacientes con cáncer).
Son estudios abiertos, de corta duración (de 9 a 18 meses).

FASE 2 (Estudios terapéuticos exploratorios):


Trata de evaluar la eficacia del fármaco, sus indicaciones, la dosis ideal, el mecanismo de
acción, su seguridad, y la farmacocinética de dosis múltiples.
Para ello se administra el fármaco a una muestra de pacientes (n=100-400). Los criterios de
inclusión/exclusión son estrictos y la duración del estudio es de 1 a 3 años. Dentro de ella
pueden diferenciarse dos fases:
- Fase IIa: Estudios piloto, no controlados, en poblaciones de pacientes muy
seleccionadas.
- Fase IIb: Ensayos controlados con placebo y enmascarados para demostrar la eficacia
de una forma más rigurosa (pivotal trials).

FASE 3: (Estudios terapéuticos confirmatorios):


Trata de confirmar los objetivos anteriores, de cara a establecer la relación beneficio/riesgo
sobre la que se va a sustentar la aprobación del fármaco para su uso en la práctica clínica.
También va a valorar la seguridad a largo plazo, las interacciones con otros medicamentos, la
farmacocinética clínica, la biodisponibilidad y la formulación definitiva del preparado
comercial.
Se realiza sobre una muestra amplia de pacientes (N=1.000-3.000). Se trata de EC
aleatorizados, doble ciego, con placebo y/o fármaco de referencia. Los criterios de
inclusión/exclusión son menos estrictos y duran de 2 a 4 años.
FASE 4:
Trata de contrastar la efectividad del fármaco (en condiciones reales de uso), la presencia de
efectos adversos de baja incidencia, la existencia de nuevas indicaciones, nuevas
formulaciones o vías de administración, así como la efectividad y seguridad en grupos
especiales de pacientes.
El tamaño de muestra es muy grande (n>5.000). Se pueden realizar EC aleatorizados doble
ciego, con fármaco de referencia, o bien estudios observacionales. El tiempo es ilimitado (el
que esté el producto en el mercado). La fase 4 siempre es posterior a la comercialización.

4. ETAPAS EN EL DISEÑO DE UN ENSAYO CLÍNICO


En la planificación y realización de un EC deben tenerse en cuenta una serie de etapas, que se
describen de forma resumida a continuación. Desde hace ya algunos años, a los autores de EC
se les recomienda que, a la hora de redactar los resultados del estudio de cara a su
publicación, utilicen las normas CONSORT (CONsolidated Standards of Reporting Trials),
elaboradas en 1996 y actualizadas por última vez en 2010. El cumplimiento de los protocolos
establecidos en esta guía es un requisito exigido cada vez con mayor frecuencia por parte de
los editores de las revistas científicas, para aceptar la publicación del EC.
El diseño del estudio va a depender de que, a priori sea explicativo o pragmático

4.1. PLANTEAMIENTO DE LA HIPÓTESIS Y OBJETIVOS DEL ESTUDIO:


La hipótesis refleja las expectativas a priori que los investigadores tienen sobre los resultados
esperables del estudio. Los objetivos son la forma concreta, cuantificable, de verificar o
rechazar la hipótesis.
Una hipótesis (y sus correspondientes objetivos asociados) será válida si cumple los siguientes
requisitos:
- Es éticamente aceptable (se ajusta al principio de clinical equipoise).
- Es científicamente relevante.
- Es posible darle respuesta con suficiente factibilidad.
Generalmente, todo EC suele tener un Objetivo Primario y uno o varios Objetivos
Secundarios. Todos ellos deben especificarse de antemano.

4.2. ELECCIÓN DEL TIPO DE ENSAYO CLÍNICO


En función de todos los criterios comentados en la sección anterior.

4.3. APROBACIÓN DEL COMITÉ ÉTICO:


Ningún EC podrá realizarse en España sin la aprobación de un Comité Ético y de la Agencia
Española de Medicamentos y Productos Sanitarios. El Real Decreto 223/2004 define la
composición y funciones de los Comités Éticos de Investigación Clínica, así como los criterios
que deben aplicar para la evaluación de los EC.

4.4. DEFINICIÓN DE LA POBLACIÓN DE ESTUDIO:


El punto de partida es la identificación de una población evaluada para la inclusión en el
estudio. Esta población debe reunir dos características:
- Presentar la condición cuyo desenlace se desea modificar mediante la intervención
(por ejemplo, padecer una cierta enfermedad, si lo que se está evaluando es el efecto
de un fármaco nuevo para curarla; o no presentarla, si lo que se está ensayando es una
vacuna para su prevención).
- Ser accesible a los investigadores (por ejemplo, por acudir al hospital donde éstos
trabajan, o pertenecer a un cierto colectivo profesional fácilmente accesible para ellos,
etc.).
Los investigadores aplicarán a esta población un conjunto de criterios de selección, que se
establecen a fin de alcanzar los siguientes objetivos:
- Aumentar su homogeneidad de los participantes: La mayor homogeneidad elimina el
efecto de terceras variables que puedan influir en el efecto bajo estudio y que, a su
vez, puedan repartirse de forma desigual entre los grupos de comparación, aunque sea
por azar. Así, a mayor homogeneidad, mayor validez interna del estudio, pero menor
validez externa, porque siempre será más difícil extrapolar los resultados a la
población general, que es de por sí heterogénea.
- Asegurar el cumplimiento de los principios éticos del ensayo: Eliminar del ensayo a los
sujetos que presenten alguna contraindicación para la intervención, a los que
presenten alguna condición que vulnere el principio de clinical equipoise y, en general,
aquellos sobre los que existan dudas o incertidumbre acerca de la frecuencia e
intensidad de sus posibles efectos adversos (embarazadas, niños, inmunodeprimidos).
- Aumentar el cumplimiento de la intervención: Se suele excluir a los sujetos
potencialmente malos cumplidores (ancianos, analfabetos, personas con
incapacidades psíquicas, etc.).
- Facilitar el seguimiento y la valoración de los efectos: Se excluyen sujetos con
dificultades para desplazarse, que vivan alejados del centro de referencia, sin teléfono
de contacto, etc.
- Maximizar el efecto de la intervención: Si el objetivo de una intervención es reducir
los niveles de colesterol, podría considerarse como criterio de selección incluir sólo a
los pacientes con niveles muy elevados de colesterol, en los que se prevé que la
intervención producirá una reducción de mayor magnitud y, en consecuencia, más
objetivable. Esto es lo más importante en los estudios explicativos.
Los sujetos de la población evaluada que cumplen los criterios de selección pasan a formar
parte de la población elegible: aquella que puede participar en el EC y a la que se podrán
extrapolar sus resultados. A aquellos pacientes de la población elegible que acepten participar
en el estudio son los participantes. Para calcular el número de partcipantes, primero vemos si
es un estudio secuencial o no secuencial y si lo es planteamos el número fijo de participantes
que queremos y después nos planteamos:
- ¿Cuántos pacientes necesito?
- ¿Cuántos pacientes puedo conseguir?
Uno de los temas más debatidos es la medida en que los resultados de un EC son
generalizables o extrapolables a otras poblaciones. En general, cuanto más restrictivos sean
los criterios de selección, menor será la extrapolabilidad de sus resultados a poblaciones
distintas de la realmente estudiada, es decir mayor será la validez interna y menor la validez
externa.
Ideas clave:
- Si no hay validez interna no puede haber validez externa.
- Cuanto más restrictivos sean lo criterios de selección, mayor será la validez interna y
menor la validez externa.
- Una de las principales limitaciones de los EC es su falta de validez externa.
En concreto, la extrapolabilidad de los resultados depende de tres factores:
- Homogeneidad/heterogeneidad de las poblaciones en estudio, en cuanto a su status
basal (los pacientes más graves, o los más ancianos, o los de sexo masculino, pueden
responder de diferente forma con respecto a los más leves, los más jóvenes, o los de
sexo femenino). Cuanto más homogénea sea la población de estudio, menor es el
ruido de fondo del experimento, y mayor es la facilidad para detectar diferencias
significativas entre los grupos de comparación. En términos generales, la
heterogeneidad de los participantes disminuye la sensibilidad en la detección de
efectos y puede conllevar mayores problemas a la hora de garantizar la
comparabilidad entre los grupos de estudio, como consecuencia de una distribución
desigual de los factores pronóstico.
- Reproducibilidad de la intervención.
- Heterogeneidad del efecto: A igualdad de status basal y de intervención terapéutica,
dos pacientes pueden responder de distinta forma al tratamiento. La heterogeneidad
de efecto tiene a su vez dos dimensiones:
o Cualitativa: El efecto del tratamiento es de diferente sentido en diferentes
grupos de población: a unos les mejora, a otros les empeora.
o Cuantitativa: Aunque el tratamiento produzca un efecto del mismo sentido en
diferentes grupos de sujetos, la magnitud del efecto es diferente en cada
grupo.
Es evidente que, cuanto más restrictiva sea la población elegible, la generalizabilidad teórica
de sus resultados es menor (porque la población es más homogénea), pero la validez interna
de los mismos es mayor, porque la heterogeneidad es menor.
Es necesario establecer un compromiso entre validez interna y externa, a la hora de formular
los objetivos del estudio (más explicativos o más pragmáticos) y de elegir los criterios de
selección.
Una vez seleccionada la población elegible, es necesario plantease a cuántos sujetos de la
misma debemos incluir en el estudio para que el efecto que se quiere valorar se estime con la
suficiente precisión: esa será la muestra de estudio (ver apartado 3.6.).

4.5. OBTENCIÓN DEL CONSENTIMIENTO DE LOS PARTICIPANTES

4.6. PERÍODO DE BLANQUEO (WASH-OUT):


Siempre que sea éticamente aceptable, se debe retirar la medicación antes de iniciar la
medicación con los fármacos del estudio y mantener a los pacientes sin tratamiento durante
un período, hasta que los efectos de éstos hayan desparecido.

4.7. PERÍODO DE PREINCLUSIÓN:


En algunos casos puede ser útil mantener a todos los pacientes bajo los efectos de un placebo
antes de iniciar el estudio, para valorar el nivel de seguimiento del tratamiento. Sólo los
sujetos que demuestran un aceptable nivel de cumplimiento son aceptados para proseguir el
estudio.

4.8. MEDICIÓN DE LA SITUACIÓN BASAL DE LOS PARTICIPANTES:


La medición de las variables de los pacientes en situación basal (es decir, antes de la
intervención), no se suele hacer en un único momento, sino a lo largo del proceso de selección
de los pacientes. Hay que tener en cuenta que algunas de las variables basales del paciente
(por ejemplo la edad o la gravedad de la patología de base) van a ser determinantes como
criterios de selección de la población de estudio.
Otras variables basales, sin embargo, sólo serán valoradas una vez reclutado el paciente y
obtenido su consentimiento. Las variables que se miden son fundamentalmente de dos tipos:
- Las que informan sobre la situación basal de la enfermedad del paciente.
- Las relacionadas con el efecto que se pretende investigar: los factores pronóstico.
La medición y presentación tabulada de estas variables en los grupos de comparación es
fundamental para poder demostrar a posteriori que los grupos son comparables.

4.9. ASIGNACIÓN DE LOS SUJETOS A LOS GRUPOS DEL ESTUDIO:


Ya se ha comentado anteriormente la importancia de que la asignación sea aleatoria y de la
OSA, así como las principales técnicas de aleatorización.

4.10. INTERVENCIÓN:
A los pacientes se les aplica la intervención programada en cada grupo. Si el grupo control es
de no intervención, se le administrará, si es posible, un placebo. Es fundamental que la
intervención, sea del tipo que sea, se aplique de la forma más estandarizada posible, siguiendo
un protocolo escrito previamente aprobado. El grupo control, si se esta estudiando una
intervención alternativa se le da la mejor intervención disponible hasta la fecha, si no hay
ninguna, se le da un placebo. El placebo es indispensable para el enmascaramiento y para
controlar el efecto placebo (sensación de alivio que no depende de propiedades
farmacológicas de la molécula sino de la sensación psicológica de bienestar por estar siendo
tratado). Con el placebo no se puede medir la magnitud del efecto placebo, sino controlar el
efecto placebo.
Ejemplo: Tenemos un grupo de sujetos, le damos un placebo y vemos que algunos han
mejorado sus síntomas, nos preguntamos qué ha hecho mejorar a estos sujetos, pero no
podemos estar seguros de que toda la mejoría se debe al efecto placebo, puede deberse al
efecto placebo, a otras intervenciones que no pertenecen al estudio pero que hayan hecho los
sujetos, o a la propia mejoría de la enfermedad.
Si tenemos dos grupos y a uno le damos el placebo y a otros el experimental, si observamos que
hay más mejoría en los del fármaco experimental podremos decir que la diferencia en la
mejoría se debe exclusivamente al fármaco experimental y no se debe al efecto placebo ni a
todo lo demás. Lo que comparamos es diferencia en las tasas de mejoría y en este caso
sabemos que se debe a la intervención.

Otros usos del placebo:


- Cuando el paciente no puede (contraindicación) tomar la terapia de la eficacia
demostrada.
- Doble simulación: Para enmascarar las dos intervenciones (la experimenntal y la de
eficacia demostrada).
Int experimental + placebo de int. Control vs control…. Falta.

4.11. SEGUIMIENTO:
El seguimiento es la monitorización de todos los participantes durante el período de estudio.
Debe ser uniforme y homogéneo para todos los grupos de comparación. Ha de estar
procotolizado antes de su inicio en los siguientes términos:
- Duración mínima y máxima prevista.
- Número de contactos con los participantes.
- Tipo de contactos.
- Instrumentos de medida.
- Variables que se van a medir en cada contacto.

El seguimiento tiene tres grandes objetivos:


1. Monitorización del cumplimiento de la intervención: Necesaria cuando la
intervención es autoadministrada a lo largo de un período de tiempo, como es el caso
de la mayoría de fármacos y agentes químicos. Hay muchas maneras de evaluar si un
paciente ha cumplido con el plan terapéutico prescrito; la más utilizada es el recuento
de comprimidos, aunque también se pueden realizar determinaciones bioquímicas.
2. Evaluación de la respuesta: Hay dos tipos de respuesta:
o La objetivable: Acción farmacológica del preparado.
o La que justifica el ensayo: Efecto terapéutico del fármaco. En el desarrollo de
un fármaco, las fases de su estudio van cambiando su objetivo, desde la
valoración de su acción farmacológica, hasta la valoración de su efecto
terapéutico. En cualquier caso, el protocolo del EC debe especificar qué
efectos se esperan obtener con la intervención programada (objetivo primario
y objetivos secundarios), qué variables se van a medir para cuantificar dichos
efectos, cuántas mediciones de cada una se van a efectuar, cuándo se va a
realizar cada una de ellas y cuáles van a ser los instrumentos de medida. Éstos
últimos pueden agruparse en tres grandes categorías:
 Opiniones del paciente: Obtenidas a través de escalas y cuestionarios.
 Valoraciones clínicas realizadas por el médico.
 Pruebas de laboratorio y complementarias.
3. Monitorización de acontecimientos adversos: Llamamos efecto adverso a cualquier
efecto perjudicial o no deseado que ocurre tras la administración de un agente
terapéutico. La recogida de acontecimientos adversos puede darse en dos
circunstancias:
a. Cuando el acontecimiento adverso es, precisamente, el efecto que se desea
investigar. Esto ocurre en las fases 1 (y 4 (farmacovigilancia) de la
investigación de un nuevo fármaco.
b. Cuando el acontecimiento es un efecto colateral al efecto terapéutico que se
pretende investigar.
Esta evaluación debe efectuarse siempre en todos los EC, correspondientes a cualquier fase
del desarrollo del fármaco. La determinación de la relación causa-efecto entre un
acontecimiento adverso y la administración de un fármaco es un problema de difícil solución,
especialmente en los estudios observacionales. Su constatación depende de cinco factores:
- Consistencia
- Fuerza de la asociación
- Especificidad
- Secuencia temporal correcta
- Plausibilidad biológica
Existe un gran número de algoritmos, que permiten adscribir a cada posible secuencia causa-
efecto, un cierto grado de incertidumbre.
Puesto que la aparición de acontecimientos adversos es posible en cualquier EC, es obligatorio
concertar una póliza de seguro, que cubra los posibles daños y perjuicios derivados de
participar en el estudio.
4.12. FINALIZACIÓN DEL ENSAYO CLINICO:
La finalización del EC es la suma de los puntos finales del ensayo correspondientes a cada uno
de los pacientes. Estos puntos finales (end points), vienen determinados por cualquiera de los
siguientes factores:
- Se ha alcanzado el período máximo de duración del EC (medido en tiempo desde el
inicio para cada paciente).
- No se ha alcanzado el período máximo de duración, pero existen factores que
justifican su interrupción:
o Aparición del desenlace: efecto que se está investigando.
o Aparición de efectos indeseables que justifican la interrupción. Hay que
estudiar la distribución de los efectos adversos entre los grupos de
comparación, y su posible relación con factores de riesgo o pronóstico.
o Obtención precoz, a través de los análisis intermedios, de resultados
epidemiológica y estadísticamente significativos que justifiquen la
interrupción, para no incurrir en un problema ético (por ejemplo, privar del
tratamiento al grupo control, cuando ya existen suficientes evidencias de que
es realmente beneficioso).
- Pérdidas de seguimiento:
o Fallecimiento.
o Abandono del estudio.
o Mal cumplimiento del protocolo terapéutico.

Una vez concluido el estudio, los investigadores deben representar gráficamente toda la
secuencia de selección de los participantes, desde el inicio del estudio hasta su finalización. Es
lo que se conoce como el flujo de participantes, indispensable en toda publicación de un EC
(ver guía CONSORT).

4.13. ANÁLISIS DE DATOS:


Hay que tener en cuenta los siguientes factores:
1. Tipo de variables de efecto: Los parámetros que se van a estimar en el análisis de un
EC pueden ser muy diferentes en función del tipo de EC y de las variables de resultado
que se hayan pre especificado. En el apartado 8 se comentarán algunos de estos
parámetros, específicamente para variables de resultado dicotómicas.
2. Número de grupos de comparación: Dos o más de dos (por ejemplo, diseños
factoriales). Establecer en función de los grupos de comparación la comparación basal
entre los dos grupos. No se debe valorar la significación estadística de las diferencias
entre grupos con respecto a las variables basales. Esto es un error, porque si hemos
hecho una asignación aleatoria y vemos que hay diferencias significativas, nos dice que
esas diferencias se deben al azar, porque hemos hecho el reparto por azar, por tanto
es absurdo hacer un test estadístico.
3. Fuentes de variabilidad que interesa cuantificar: En general, hay dos fuentes de
variabilidad en las estimaciones del efecto, cuya magnitud debe tenerse en cuenta:
o Variabilidad intrasujeto: Es la variación de la medida de los efectos en los
diferentes momentos del seguimiento de los pacientes en los que se hacen las
mediciones.
o Variabilidad intersujetos: Es la que depende de las características que
diferencian a los sujetos entre sí, dependiente, a su vez, de los factores o
grupos en los que se ha categorizado a la población.
4. Significación estadística versus significación clínica:
a. La significación estadística hace referencia a la medida en que las diferencias
obtenidas en la estimación del efecto entre los grupos de comparación pueden
ser atribuidas al azar o no, independientemente de la magnitud de estas
diferencias. Es muy improbable que las diferencias entre los dos grupos
(grandes o pequeñas) sean debidas al azar, típicamente es menor del 5% (error
alfa).
b. La significación clínica hace referencia a la medida en que la magnitud de las
diferencias en la estimación del efecto entre los grupos de comparación es
clínicamente relevante o no, independientemente de la significación
estadística alcanzada. Las diferencias entre grupos suficientemente grandes
como para determinar la estrategia terapéutica.
5. Valoración de efectos aislados o de interacciones entre intervenciones: En los
ensayos factoriales, el objetivo es analizar no sólo el efecto de cada intervención por
separado, sino la modificación de dicho efecto cuando las intervenciones se aplican
sobre los mismos sujetos o, dicho en otros términos, las interacciones entre
sustancias.
6. Análisis intermedios: Independiente de que el ensayo sea secuencial (donde son
obligados), o no, es posible planificar de antemano la realización de análisis de datos
intermedios, antes de alcanzar el tamaño muestral final. Su objetivo es decidir si el
ensayo debe continuar o si, a partir de los resultados obtenidos en dichos análisis, se
puede extraer ya una conclusión que justifique la paralización del ensayo (dejando así
de reclutar pacientes y abriendo el ensayo, si era enmascarado). El problema de los
análisis intermedios es que suponen aumentar el número de test estadísticos
realizados, y cuanto mayor sea su número, mayor es la probabilidad de detectar por
casualidad una diferencia estadísticamente significativa (aumento del error alfa): es
decir, detectar diferencias entre tratamientos cuando realmente no las hay. Por ello, la
significación se valorará con respecto a un error alfa global, menor que el alfa
convencional para una única prueba (0,05), pues debe tener en cuenta todos los
análisis intermedios planificados.
7. Control y análisis de las pérdidas: Las pérdidas de los sujetos durante el seguimiento
(por incumplimiento de la intervención, abandono del estudio o fallecimiento), son
siempre un problema que es necesario minimizar en la medida de lo posible,
facilitando al máximo el cumplimiento terapéutico y haciendo un seguimiento lo más
exhaustivo posible. No obstante, siempre habrá un determinado número de pérdidas.
El control de las pérdidas requiere dar los siguientes pasos:
o Fijar un tamaño de muestra inicial que tenga en cuenta el volumen previsible
de pérdidas en el seguimiento.
o Recoger toda la información posible sobre los sujetos perdidos, para
identificar las causas de las pérdidas y determinar si son diferentes con
respecto a los sujetos no perdidos y, sobre todo, si se relacionan con los
efectos esperados de la intervención.
o Realizar un análisis por intención de tratar (AIT): Valorar las estimaciones de
efecto en relación con todos los pacientes inicialmente asignados
aleatoriamente a cada grupo, y no en relación a los que han completado la
intervención y el seguimiento (que sería el llamado análisis por protocolo). Hay
que tener en cuenta que la aleatorización (que es, en principio, la principal
garantía de comparabilidad entre grupos) afecta a los sujetos al inicio del
estudio, pero no tiene por qué mantenerse al final de éste, si las pérdidas de
sujetos de cada grupo no son aleatorias.
 El análisis por intención de tratar consiste en evaluar los resultados
según el régimen de intervención planificado (aunque no se haya
cumplido en todos los participantes).
 El análisis por protocolo (APP): Evaluar los resultados de los sujetos
que se han adherido al protocolo.
En un ensayo de superioridad, es mejor el análisis por intención de tratar,
porque da resultados más validos que el análisis por protocolo. Esto sucede
porque los 100 primeros se repartieron al azar, pero puede que con las
pérdidas que no se reparten por azar, la comparación de los sujetos del estudio
que quedan ya no sean comparables, por ello lo que aume
o Imputar los valores de las variables faltantes en los sujetos que han
abandonado el estudio (análisis de imputación múltiple).
o Hacer un análisis de sensibilidad: Simular valores extremos en los sujetos que
han abandonado el estudio para obtener, a partir de ellos, un rango de valores
plausibles para el efecto bajo estudio.
8. Análisis para variables dicotómicas: La mayoría de ensayos clínicos se construyen a
partir de cohortes fijas (ver el concepto en el siguiente tema). Para la situación más
sencilla, en el que hay una variable de desenlace dicotómica (por ejemplo, la
defunción) y dos grupos de comparación (intervención y control), la tabla de datos
tendría la siguiente estructura:

Desenlace No desenlace Total


Intervención A B N1
Control C D N0

A partir de esta tabla pueden obtenerse las siguientes estimaciones:


IAe = a/n1 IAo = c/n0
Suponiendo que la intervención reduce la incidencia del desenlace (muertes, en el ejemplo),
las estimaciones que se podrían calcular a partir de las dos incidencias acumuladas anteriores
serían las siguientes (ver fórmulas en el tema 9): RR, RRR, RAR y NNT.

Вам также может понравиться