Вы находитесь на странице: 1из 3

NO ES CIERTO QUE PUEDA DEMOSTRARSE CUALQUIER COSA CON LA ESTADSTICA.

Bad science in medical biology usually arises from an investigator behaving as a naturalist and applying techically ingenious methods to the collection of observations that test no hypothesis" (1).

"No es cierto que se pueda demostrar cualquier cosa con la estadstica... El mtodo estadstico nos permite poner lmites a nuestra incertidumbre, pero no nos permite probar nada."(2). En la Seccin Cientfica del ltimo nmero (Enero-Febreo de 1999) de la Revista oficial de nuestro Colegio se incluyen dos trabajos que utilizan la estadstica para analizar la importancia de los resultados obtenidos en dichos estudios. Hay varios comentarios que me gustara hacer que espero sirvan para reflexionar sobre aspectos generales del mtodo estadstico aplicado a las ciencias de la salud y tambin sobre algunos puntos concretos de estos trabajos. En el primero de ellos se incluyen, en el apartado de resultados, unas tablas con los datos desagregados del trabajo: valores que toman las variables estudiadas en cada una de las unidades de anlisis (en este caso, indivduos sanos). sta es una excelente iniciativa. Permite a cualquiera repetir el anlisis de los datos y comprobar los resultados. Naturalmente que no siempre es posible incluir la "matriz de datos" en una publicacin, pero en este caso nos permite apreciar claramente el valor de la Estadstica Descriptiva. Es esta parte de la Estadstica la que, an siendo usada con profusin, no se valora adecuadamente, ni siquiera por los propios autores de los trabajos. Pero, con frecuencia, la "simple" descripcin de los datos, ya sea en forma desagregada o resumida, es ms informativa y, especialmente, confunde menos, que las ms o menos sofisticadas pruebas de estadstica inferencial. Este trabajo concreto propone utilizar dos nuevas medidas espiromtricas. Dejando de lado el hecho de haber llevado a cabo una comparacin directa de varianzas de las diferentes medidas (en lugar de utilizar el coeficiente de variacin de Pearson), a este respecto es muy interesante la lectura de un artculo que resalta el inters que tiene la representacin grfica de la nube de puntos enfrentando la media de dos mediciones frente a sus diferencias, como un indicador muy til del acuerdo entre dichas mediciones; as mismo, en este mismo alrtculo, tambin se nos recuerda que, dado que el coeficiente de correlacin de Pearson es una medida de tendencia, puede darnos una impresin falsa de dicho acuerdo(3). En este estudio no se realizan dos mediciones de la misma variable y el problema que se enfrenta no parece ser de reproducibilidad, sino de validez, pero la aproximacin puede ser similar. En un anlisis de subgrupos del estudio ISIS-2(4), realizado hace ya ms de 10 aos, que inclua 17.000 pacientes, se demostr ausencia de efecto de la aspirina frente al placebo en los pacientes pertenecientes a los signos del Zodaco Libra y Gminis y una diferencia muy significativa en los que pertenecan a cualquiera de los signos restantes. Esta referencia que hago tiene que ver con la ausencia de hiptesis previa en un estudio de investigacin. No quiero decir que los

autores de los trabajos carezcan completamente de intencionalidad, es decir, que no deseen "saber algo o aumentar el conocimiento sobre un aspecto de la reali dad". Pero, establecer una hiptesis conceptual, que pueda ser operativizada y en ltimo trmino transcrita a una hiptesis estadstica es algo que no solemos hacer , al menos de manera explcita. La investigacin, inevitablemente, tiene una aproximacin inicial exploratoria que permite generar hiptesis que, posteriormente, sern confirmadas o no en otros estudios explicativos. Pero, incluso las hiptesis establecidas en las fases ms precoces de la investigacin, deben estar en sintona con aquello que ya se conoce y derivar precisamente del sustrato de conocimiento que tenemos. En cualquier caso, cuando no partimos de hiptesis alguna, es seguro que vamos a tener problemas con lo que encontremos, tanto si detectamos asociaciones como si no. En la primera situacin porque de todas formas podemos estar cometiendo un error de tipo alfa (en trminos estadsticos) y en la segunda porque puede tratarse de un error de tipo beta. sto, sin considerar los sesgos en los que hayamos podido caer. En sentido estricto, la Estadstica Inferencial, aquella que permite hacer comparaciones, slo puede ser aplicada si hemos procedido a un muestreo aleatorio; es decir, si los individuos de las muestras con las que trabajamos se han obtenido de la poblacin de origen por un procedimiento de muestreo que garantice que todos los sujetos tienen las mismas probabilidades, e iguales, de ser elegidos. sto se consigue, por ejemplo, cuando en un Ensayo Clnico Controlado, asignamos de forma aleatoria la intervencin a los grupos del estudio. Otro aspecto a destacar es la cuestin de las mltiples comparaciones. La probabilidad de equivocarnos al rechazar la hiptesis nula de independencia de dos variables (es igual fumar que no fumar para desarrollar o no cancer de pulmn), la conocida p, nos permite establecer en qu medida las diferencias encontradas entre los grupos que analizamos (la frecuencia de fumadores entre los que tienen cancer de pulmn y los que estan sanos) son tan grandes como para asumir el riesgo de equivocarnos al rechazar que son iguales. Este riesgo de cometer un error alfa lo asumimos cada una de las veces que hacemos una comparacin. Lo normal es aceptar un riesgo de error alfa de 0.05, con lo que en la segunda comparacin estamos aadiendo otra probabilidad de error de 0.05 (total 0.10) y as sucesivamente. Por tanto, cuando hagamos 20 comparaciones habremos acumulado una probabilidad de error de 1.0 (0.05x20), es decir, seguro que al menos una de las asociaciones encontradas se debe al azar. La solucin, de comprensin ms sencilla , denominada Mtodo de Bonferroni, que es bastante conservadora, es ser ms exigente al establecer el error alfa aceptable; por ejemplo, para el caso de las 20 comparaciones referidas (cosa ms comn de lo que pensamos), requerir un error alfa de 0.0025 (0.05/20). Debe recordarse que la mera asociacin estadstica no implica causalidad, aspecto que va ms all de los hallazgos de un solo estudio individual y que requiere la satisfaccin de otras premisas, incluidas la temporalidad, la fuerza, plausibilidad, etc. Nadie se atrevera a plantear que pueda existir relacin entre la epidemia de SIDA y la disponibilidad de televisin en color en los hogares espaoles; sin embargo, la correlacin estadstica entre ambos desde el comienzo de lo aos 80 en nuestro Pas es bastante fuerte. Como en ocasiones las cosas no son tan

claras como en este ejemplo, hemos de protegernos de errores sistemticos a la hora de aumentar nuestro conocimiento sobre la naturaleza. Quiero terminar con otro comentario del mismo autor que nos sirvi para introducir esta carta: "En general, ponemos el nfasis en los resultados, sin hacer caso de la manera en que se obtuvieron.... En particular, como y porqu se recogieron los datos es muy importante."(2).

1 .- Buck C. Poppers philosophy for Epidemiologists. International Journal of Epidemiology 1975;4:159-168. 2.- Altman DG. Practical statistics for medical ressearch. London: Chapman and Hall, 1991. 3 .- Bland JM, Altman DG. Statistical methods for assessing agreement between two methods of clinical measurement. Lancet 1(8476):307-310, 1986. 4 .- ISIS -2 Collaborative Group. Randomised trial of intravenous streptokinase, oral aspirin, both or neither among 17187 cases of suspected acute myocardial infarction: ISIS -2. Lancet 1988;2:349-360.

Вам также может понравиться