Вы находитесь на странице: 1из 5

FUNDAMENTOS DE BIOESTADISTICA

Capitulo 1

La estadística es la ciencia por la cual se hacen inferencias sobre fenómenos aleatorios específicos sobre
la base de material de muestra relativamente limitado. El campo de la estadística tiene dos áreas
principales: estadística matemática y estadística aplicada. La estadística matemática se refiere al
desarrollo de nuevos métodos de inferencia estadística y requiere un conocimiento detallado de las
matemáticas abstractas para su implementación.

La estadística aplicada implica aplicar los métodos de estadística matemática a áreas temáticas
específicas, como economía, psicología y salud pública. La bioestadística es la rama de la estadística
aplicada que aplica métodos estadísticos a problemas médicos y biológicos. Por supuesto, estas áreas de
estadísticas se superponen un poco. Por ejemplo, en algunos casos, dada una determinada aplicación
bioestadística, los métodos estándar no se aplican y deben modificarse. En esta circunstancia, los
bioestadísticos participan en el desarrollo de nuevos métodos.

Una buena manera de aprender sobre bioestadística y su papel en el proceso de investigación es seguir
el flujo de un estudio de investigación desde su inicio en la etapa de planificación hasta su finalización,
que generalmente ocurre cuando se publica un manuscrito que informa los resultados del estudio.
Como ejemplo, describiré uno de esos estudios en el que participé.

Un amigo llamó una mañana y en el transcurso de nuestra conversación mencionó que recientemente
había usado un nuevo dispositivo automático de medición de la presión arterial del tipo que se ve en
muchos bancos, hoteles y grandes almacenes. La máquina había medido su presión arterial diastólica
promedio en varias ocasiones como 115 mm Hg; la lectura más alta fue de 130 mm Hg. Estaba muy
preocupado, porque si estas lecturas fueran precisas, mi amigo podría estar en peligro inminente de
sufrir un derrame cerebral o desarrollar alguna otra enfermedad cardiovascular grave. Lo remití a un
colega clínico mío que, usando un brazalete de presión arterial estándar, midió la presión arterial
diastólica de mi amigo como 90 mm Hg. El contraste en las lecturas despertó mi interés, y comencé a
anotar las lecturas de la pantalla digital cada vez que pasaba la máquina en mi banco local.

Tuve la clara impresión de que un gran porcentaje de las lecturas reportadas estaban en el rango
hipertensivo. Aunque uno esperaría que las personas hipertensas sean más propensas a usar una
máquina de este tipo, todavía creía que las lecturas de la presión arterial de la máquina podrían no ser
comparables con las obtenidas utilizando métodos estándar de medición de la presión arterial. Hablé
con el Dr. B. Frank Polk, médico de la Facultad de Medicina de Harvard interesado en la hipertensión,
sobre mis sospechas y logré interesarlo en una evaluación a pequeña escala de tales máquinas.
Decidimos enviar un observador humano, que estaba bien capacitado en técnicas de medición de la
presión arterial, a

Varias de estas máquinas. Ofrecería pagar a los participantes 50 ¢ por el costo del uso de la máquina si
aceptaran completar un breve cuestionario y que un observador humano y la máquina midieran su
presión arterial.

En esta etapa, tuvimos que tomar varias decisiones importantes, cada una de las cuales resultó vital
para el éxito del estudio. Estas decisiones se basaron en las siguientes preguntas:

(1) ¿Cuántas máquinas debemos probar?

(2) ¿Cuántos participantes debemos probar en cada máquina?

(3) ¿En qué orden debemos tomar las medidas? Es decir, ¿debería el observador humano o la máquina
tomar la primera medición? En circunstancias ideales, hubiéramos tomado las lecturas humana y
mecánica simultáneamente, pero esto era logísticamente imposible.

(4) ¿Qué datos debemos recopilar en el cuestionario que puedan influir en el

comparación entre métodos?

(5) ¿Cómo debemos registrar los datos para facilitar la informatización más adelante?

(6) ¿Cómo debemos verificar la precisión de los datos computarizados?

Resolvimos estos problemas de la siguiente manera:

(1) y (2) Debido a que no estábamos seguros de si todas las máquinas de presión arterial eran
comparables en calidad, decidimos probar cuatro de ellas. Sin embargo, queríamos tomar muestras
suficientes de cada máquina para obtener una comparación precisa de los métodos estándar y
automatizados para cada máquina. Intentamos predecir cómo

Una gran discrepancia puede haber entre los dos métodos. Utilizando los métodos de determinación del
tamaño de la muestra discutidos en este libro, calculamos que necesitaríamos 100 participantes en cada
sitio para hacer una comparación precisa.

(3) Luego tuvimos que decidir en qué orden tomar las medidas para cada persona. Según algunos
informes, un problema con la obtención de mediciones repetidas de la presión arterial es que las
personas se tensan durante la medición inicial, produciendo lecturas de presión arterial más altas
durante las mediciones posteriores. Por lo tanto, no siempre queremos usar primero el método
automático o manual, porque el efecto del método se confundiría con el efecto del orden de medición.
Una técnica convencional que utilizamos aquí fue aleatorizar el orden en que se tomaron las
mediciones, de modo que para cualquier persona era igualmente probable que la máquina o el humano

Una técnica convencional que utilizamos aquí fue aleatorizar el orden en que se tomaron las
mediciones, de modo que para cualquier persona era igualmente probable que la máquina o el
observador humano tomaran la primera medición. Este patrón aleatorio podría implementarse lanzando
una moneda o, más probablemente, utilizando una tabla de números aleatorios similar a la Tabla 4 del
Apéndice.

(4) Creíamos que el principal factor extraño que podría influir en los resultados sería el tamaño del
cuerpo (podríamos tener más dificultades para obtener lecturas precisas de personas con brazos más
gordos que de aquellos con brazos más delgados). También queríamos tener una idea del tipo de
personas que usan estas máquinas. Por lo tanto, hicimos preguntas sobre la edad, el sexo y los
antecedentes previos de hipertensión.

(5) Para registrar los datos, desarrollamos un formulario de codificación que podría completarse en el
sitio y desde el cual los datos podrían ingresarse fácilmente en una computadora para su posterior
análisis. A cada persona en el estudio se le asignó un número de identificación (ID) único mediante el
cual la computadora podría identificar a esa persona. Los datos en los formularios de codificación fueron
luego codificados y verificados. Es decir, se ingresó el mismo formulario dos veces y se compararon los
dos registros para asegurarse de que fueran iguales. Si los registros no coincidían, se volvió a ingresar el
formulario.

(6) La verificación de cada elemento en cada formulario era imposible debido a la gran cantidad de datos
involucrados. En cambio, después de la entrada de datos, ejecutamos algunos programas de edición
para garantizar que los datos fueran precisos. Estos programas verificaron que los valores para las
variables individuales se encontraban dentro de los rangos especificados e imprimieron valores
aberrantes para la verificación manual. Por ejemplo, verificamos que todas las lecturas de presión
arterial estaban en

menos 50 mm Hg y no más alto que 300 mm Hg, e imprimimos todas las lecturas que se encontraban
fuera de este rango.

Después de completar las fases de recopilación de datos, entrada de datos y edición de datos,
estábamos listos para ver los resultados del estudio. El primer paso en este proceso es obtener una
impresión de los datos resumiendo la información en forma de varios

estadística. Este material descriptivo puede ser numérico o gráfico. Si es numérico, puede tener la forma
de unas pocas estadísticas de resumen, que pueden presentarse en forma de tabla o, alternativamente,
en forma de distribución de frecuencia, que enumera cada valor en los datos y con qué frecuencia
ocurre. Si es gráfico, los datos se resumen gráficamente y se pueden presentar en una o más figuras. El
tipo apropiado de material descriptivo para usar varía con el tipo de distribución considerada. Si la
distribución es continua, es decir, si hay esencialmente un número infinito de valores posibles, como
sería el caso de la presión arterial, entonces las desviaciones estándar y medias pueden ser

Las estadísticas descriptivas apropiadas. Sin embargo, si la distribución es discreta, es decir, si solo hay
unos pocos valores posibles, como sería el caso del sexo, entonces los porcentajes de personas que
toman cada valor son la medida descriptiva adecuada. En algunos casos, ambos tipos de estadísticas
descriptivas se utilizan para distribuciones continuas condensando el rango de valores posibles en unos
pocos grupos y dando el porcentaje de personas que caen en cada grupo (por ejemplo, los porcentajes
de personas que tienen presiones sanguíneas entre 120 y 129 mm Hg, entre 130 y 139 mm Hg, y así
sucesivamente).
En este estudio, decidimos primero observar la presión arterial media para cada método en cada uno de
los cuatro sitios. La tabla 1.1 resume esta información [1].

Puede notar en esta tabla que no obtuvimos datos significativos de las 100 personas entrevistadas en
cada sitio. Esto se debió a que no pudimos obtener lecturas válidas de la máquina para muchas de las
personas. Este problema de datos faltantes es muy común en bioestadística y debe anticiparse en la
etapa de planificación al decidir el tamaño de la muestra (que no se realizó en este estudio).

Nuestro siguiente paso en el estudio fue determinar si las diferencias aparentes en la presión arterial
entre las mediciones de la máquina y las de los humanos en dos de los lugares (C, D) eran "reales" en
algún sentido o "debidas al azar". Este tipo de pregunta caídas

en el área de estadística inferencial. Nos dimos cuenta de que, aunque había una diferencia de 14 mm
Hg en la presión arterial sistólica media entre los dos métodos para las 98 personas que entrevistamos
en el lugar C, esta diferencia podría no sostenerse si entrevistamos a otras 98 personas en este lugar en
un momento diferente , y queríamos tener una idea del error en la estimación de 14 mm Hg. En jerga
estadística, este grupo de 98 personas representa una muestra de la población de todas las personas
que podrían usar esa máquina. Estábamos interesados en la población y queríamos utilizar la muestra
para ayudarnos a aprender algo sobre la población. En particular, queríamos saber qué tan diferente era
la diferencia media estimada de 14 mm Hg en nuestra muestra de la verdadera diferencia media en la
población de todas las personas que podrían usar esta máquina. Más específicamente, queríamos saber
si todavía era

posible que no haya una diferencia subyacente entre los dos métodos y que nuestros resultados se
debieron al azar. La diferencia de 14 mm Hg en nuestro grupo de 98 personas se conoce como una
estimación de la verdadera diferencia media (d) en la población. El problema de inferir características de
una población a partir de una muestra es la preocupación central de la inferencia estadística y es un
tema importante en este texto. Para lograr este objetivo, necesitábamos desarrollar un modelo de
probabilidad, que nos diga qué tan probable es que obtengamos una diferencia de 14 mm Hg entre los
dos métodos en una muestra de 98 personas si no hubiera una diferencia real entre los dos métodos
sobre toda la población de usuarios de la máquina. Si esta probabilidad fuera lo suficientemente
pequeña, entonces comenzaríamos a creer que existía una diferencia real entre los dos métodos. En
este caso particular, utilizando un modelo de probabilidad basado en la distribución t, concluimos que
esta probabilidad era menor a 1 en 1000 para cada una de las máquinas en las ubicaciones C y D.

Esta probabilidad fue lo suficientemente pequeña como para concluir que había una diferencia real
entre los métodos automáticos y manuales de medición de la presión arterial para dos de las cuatro
máquinas probadas.

Utilizamos un paquete estadístico para realizar los análisis de datos anteriores. Un paquete es una
colección de programas estadísticos que describen datos y realizan varias pruebas estadísticas sobre los
datos. Actualmente los paquetes estadísticos más utilizados son SAS,
SPSS, Stata, MINITAB y Excel.

El paso final en este estudio, después de completar el análisis de datos, fue compilar los resultados en
un manuscrito publicable. Inevitablemente, debido a consideraciones de espacio, eliminamos gran parte
del material desarrollado durante la fase de análisis de datos y presentamos solo los elementos
esenciales para su publicación.

Esta revisión de nuestro estudio de presión arterial debería darle una idea de lo que se trata la
investigación médica y el papel de la bioestadística en este proceso. El material en este texto es paralelo
a la descripción de la fase de análisis de datos del estudio. El Capítulo 2 resume diferentes tipos de
estadísticas descriptivas. Los capítulos 3 a 5 presentan algunos principios básicos de probabilidad y
varios modelos de probabilidad para su uso en discusiones posteriores de estadística inferencial. Los
capítulos 6 al 14 discuten los principales temas de la estadística inferencial como se usan en la práctica
biomédica. Los problemas del diseño del estudio o la recopilación de datos solo se mencionan en
relación con otros temas tratados en el texto

Вам также может понравиться