Вы находитесь на странице: 1из 12

Revista Colombiana de Psiquiatría

ISSN: 0034-7450
revista@psiquiatria.org.co
Asociación Colombiana de Psiquiatría
Colombia

Gil, Jacky F.; Castañeda, Javier A.


Una mirada al valor de p en investigación
Revista Colombiana de Psiquiatría, vol. XXXIV, núm. 3, julio-septiembre, 2005, pp. 414-424
Asociación Colombiana de Psiquiatría
Bogotá, D.C., Colombia

Disponible en: http://www.redalyc.org/articulo.oa?id=80634308

Cómo citar el artículo


Número completo
Sistema de Información Científica
Más información del artículo Red de Revistas Científicas de América Latina, el Caribe, España y Portugal
Página de la revista en redalyc.org Proyecto académico sin fines de lucro, desarrollado bajo la iniciativa de acceso abierto
Metodología
○ ○ ○
Gil J., Castañeda J.
○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○

de investigación y lectura crítica de estudios


○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○

Una mirada al valor de p en investigación


Jacky F. Gil1
Javier A. Castañeda2

Resumen

La búsqueda de datos dentro de la bibliografía científica ofrece tanto al lector espontáneo


como al investigador diferentes retos al momento de leer, comprender y analizar los resulta-
dos de un artículo publicado, principalmente cuando los resultados contienen información
sobre procedimientos estadísticos empleados en el análisis, como es el caso del reporte de
valores de p. Este artículo ofrece al investigador y al usuario de la bibliografía científica
elementos y conceptos que le permitan, entre otras: identificar y entender los componentes
de una prueba de hipótesis, interpretar adecuadamente los valores de p, reconocer las ven-
tajas que tiene el uso de intervalos de confianza frente a los valores de p, diferenciar entre
significación estadística y significación clínica en una prueba de hipótesis y reconocer la
importancia del cálculo del tamaño de la muestra, desde la planeación de este tipo de estudios.

Palabras clave: estadística, tamaño de la muestra, intervalos de confianza.

Title: A Look at p-values in Research.

Abstract

Researchers and spontaneous readers both have to face several challenges when they are
looking for evidence in scientific papers, especially when statistical procedures are developed
during the analysis phase, such as the use of hypothesis testing and p-values. This paper
offers concepts and pointers to assist researchers and readers of scientific literature to
identify and understand the components within a statistical test of hypothesis, to appropriately
interpret p-values, to recognize the advantages in using confidence intervals rather than p-
values, to establish the difference between statistical significance and clinical relevance in
the use of hypothesis testing and to recognize the importance of sample size calculation
from the beginning of a study.

Key words: Statistic, sample size, confidence intervals.

○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○

1
Bioestadístico, profesor instructor, Unidad de Epidemiología Clínica y Bioestadística,
Pontificia Universidad Javeriana, Bogotá, Colombia.
2
Estadístico, profesor instructor, Unidad de Epidemiología Clínica y Bioestadística, Pontificia
Universidad Javeriana, Bogotá, Colombia.

414 Revista Colombiana de Psiquiatría, vol. XXXIV / No. 3 / 2005


Una mirada al valor de p en investigación
○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○

Un investigador interesado en cia no es significativa? Con los ha-


conocer la prevalencia de depresión llazgos reportados por Gómez-Res-
en Colombia realiza una búsqueda trepo y colaboradores, ¿es posible
en los diversos estudios científicos determinar la magnitud de la dife-
existentes. A partir de ahí encuentra rencia en las prevalencias de depre-
algunas referencias que considera sión por sexo? ¿Cuál es el efecto del
relevantes y se dispone a extraer los tamaño de la muestra en las conclu-
datos que, cree, son de interés. Un siones derivadas por los estudios?
ejemplo de estas referencias es, en-
tre otros, el trabajo de Gómez-Res- El investigador considera per-
trepo y colaboradores (1), quienes tinente responder a estos interro-
describen la prevalencia de depre- gantes antes de generar conclusio-
sión y los factores asociados con ella nes y usar esta información en su
en la población colombiana. Los estudio.
autores anotan en uno de los apar-
tes el siguiente resultado: «La pro-
porción de depresión grave fue ma- Pruebas de hipótesis
yor en mujeres que en hombres, en y valor de p
el último mes (29,2% frente a 19,6%,
respectivamente; p <0,001)». Del El reporte de valores de p den-
mismo modo, puede hacerse refe- tro de los resultados de una publi-
rencia al artículo de Mantilla y cola- cación es la prueba del uso de las
boradores (2), quienes describen la metodologías de inferencia estadís-
prevalencia de sintomatología de- tica, es decir, a partir de los resul-
presiva en niños y niñas escolares tados de las muestras selecciona-
de Bucaramanga, y dentro de los das en un estudio, se derivan con-
resultados comentan lo siguiente: clusiones para las poblaciones de
«En relación con el género la fre- las cuales provienen éstas. De ma-
cuencia de depresión fue mayor en nera particular, los valores de p in-
las niñas, con un 13,3%, que en los dican el uso de pruebas de hipóte-
niños, con un 6,4%. Sin embargo, sis en los parámetros de las pobla-
esta diferencia no fue significativa ciones de interés, motivo por el cual
(p = 0,07)». es necesario abordar inicialmente
este tema.
El investigador, luego de leer los
fragmentos de los resultados men- Una prueba de hipótesis es una
cionados, se plantea las siguientes forma de realizar inferencias induc-
preguntas: ¿cómo se debe interpre- tivas (a partir de casos particulares
tar la afirmación expresada en el se concluye para casos generales),
primer estudio? ¿Qué significa en en la cual inicialmente se plantea
el segundo estudio que la diferen- una hipótesis de investigación (un

Revista Colombiana de Psiquiatría, vol. XXXIV / No. 3 / 2005 415


Gil J., Castañeda J.
○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○

enunciado sobre la naturaleza del hipótesis, pues partiendo del su-


problema) y a través de los hallazgos puesto de que la hipótesis nula es
observados en un experimento se verdadera, evalúa en términos de
decide sobre su factibilidad (3). probabilidad la validez del supuesto,
Estadísticamente, el desarrollo de a la luz de la información conteni-
una prueba de hipótesis requiere da en la(s) muestra(s). Si la proba-
plantear dos enunciados excluyen- bilidad de validez del supuesto es
tes que se refieran al parámetro que muy pequeña, se concluye que la
se desea evaluar, denominados hi- hipótesis nula es falsa, y se acepta
pótesis nula e hipótesis alterna. el enunciado establecido por la hi-
pótesis alterna; en otro caso, no
La hipótesis nula recibe su nom- puede argumentarse la falsedad de
bre por afirmar la inexistencia de la hipótesis nula y, por lo tanto, no
asociación o de diferencia; mientras se rechaza (4-6).
que la hipótesis alterna corresponde
a la negación de la hipótesis nula y Si bien puede concluirse un re-
usualmente expresa lo que el inves- sultado correcto, como rechazar
tigador desea concluir: que existe una hipótesis nula cuando es falsa,
diferencia o asociación. El proce- o no rechazar una hipótesis nula
dimiento para desarrollar la prueba aunque es verdadera; también pue-
de hipótesis puede semejarse al ejer- de producirse uno de dos posibles
cicio hecho en una corte por el sis- resultados erróneos: error tipo I (fal-
tema de justicia, donde un acusado so positivo), que consiste en recha-
(hipótesis nula) es sometido a la eva- zar una hipótesis nula a pesar de
luación de un conjunto de pruebas que es verdadera, conocido como
(estadísticas muestrales), con el ob- error alfa (α); y un error tipo II (falso
jetivo de valorar su culpabilidad (ve- negativo), que consiste en no recha-
racidad de la hipótesis nula). En la zar una hipótesis nula aun cuando
corte, el jurado evalúa las pruebas es falsa, conocido como error beta
presentadas por la fiscalía y la defen- (β). Sin embargo, cuando la mues-
sa desde el supuesto de la inocencia tra es recolectada aleatoriamente
del acusado, y se pronunciará decla- por medio de un método de mues-
rando al acusado ‘culpable’ cuando treo probabilístico, es posible con-
las pruebas sean incompatibles con trolar a priori y cuantificar a poste-
este supuesto de inocencia; en otro riori la magnitud en probabilidad de
caso, cuando las pruebas no sean lo estos errores (Tabla 1). De esta for-
suficientemente contundentes, de- ma, a pesar de que la conclusión
clarará al acusado ‘no culpable’. derivada de la prueba de hipótesis
no sea ciento por ciento confiable,
La estadística emplea el mismo sí tiene una probabilidad controlada
método al evaluar una prueba de de ser acertada (7).

416 Revista Colombiana de Psiquiatría, vol. XXXIV / No. 3 / 2005


Una mirada al valor de p en investigación
○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○

Tabla 1. Decisiones en la prueba de hipótesis


Verdad en la población
Hipótesis Hipótesis
nula falsa nula verdadera
Resultado Rechazar Potencia Error tipo I
de la hipótesis 1-β α
prueba nula
de hipótesis
No rechazar Error tipo II 1-α
hipótesis β
nula

El resultado de la prueba de hi- dos veces una moneda legal se ob-


pótesis se basa principalmente en el serva como resultado dos ‘caras’).
cálculo, en términos de probabilidad,
de la fuerza de los hallazgos a favor Si se repite de manera sistemá-
de la hipótesis nula. Esta probabili- tica el mismo experimento, lanzando
dad recibe el nombre de valor de p, la moneda 3, 4, 5, 6 y 7 veces, y cada
y se define como la probabilidad de vez el resultado del lanzamiento es
cometer un falso positivo por efecto ‘cara’ y se cuantifica la probabilidad
del azar, cuando la hipótesis nula de que esto suceda desde el supuesto
es verdadera. Para ejemplificar la inicial, se obtienen los resultados de
noción de valor de p suponga el si- la Tabla 2. Es probable que ninguna
guiente experimento: una moneda de las personas que observe el expe-
legal (no cargada) es lanzada al aire rimento tenga comentarios durante
y se obtiene como resultado una las tres primeras repeticiones; sin
‘cara’. Desde el supuesto inicial, la embargo, al aumentar el número de
probabilidad de que esto suceda es ‘caras’ obtenidas de manera conse-
0,5. Ahora, en una repetición del cutiva, es muy posible que algunos
experimento, la misma moneda es observadores duden del supuesto de
lanzada, de nuevo, al aire y el resul- legalidad de la moneda empleada,
tado vuelve a ser ‘cara’. La probabi- puesto que cada vez es menos proba-
lidad de que esto suceda es 0,5 x 0,5 ble observar un resultado similar
= 0,25 (aproximadamente en 25 de cuando se usa una moneda comple-
cada 100 veces que se lance al aire tamente balanceada. El número de

Tabla 2. Cálculo de probabilidades de obtener siempre ‘cara’


al lanzar una moneda entre 1 y 7 veces al aire

Número de lanzamientos 1 2 3 4 5 6 7
Número de ‘caras’ 1 2 3 4 5 6 7
Probabilidad 0,5000 0,2500 0,1250 0,0625 0,0313 0,0156 0,0078

Revista Colombiana de Psiquiatría, vol. XXXIV / No. 3 / 2005 417


Gil J., Castañeda J.
○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○

lanzamientos necesarios para que tampoco se acepta, puesto que pue-


cada persona ponga en tela de juicio de estarse en presencia de un error
el supuesto de legalidad de la mo- tipo II, y se concluye diciendo que
neda es personal y subjetivo; no las pruebas aportadas por las mues-
obstante, al observar siete ‘caras’ tras son insuficientes para rechazar
consecutivas, seguramente nadie el enunciado descrito por la hipó-
cuestionará que la moneda está car- tesis nula (8).
gada, debido a que las posibilidades
de observar tal resultado son de 78 Es importante señalar que el
en 10.000 (¡realmente baja!). procedimiento descrito sólo es váli-
do cuando el nivel de significación
En investigación, el análisis de es especificado por el investigador
los valores de p necesita reglas obje- antes de observar el valor de p. Si el
tivas y acordes con la naturaleza del nivel de significación no se estable-
fenómeno que se está evaluado. Por ce, el criterio para rechazar la hipó-
esta razón, cuando se realiza una tesis nula se restringe a valores de
prueba de hipótesis, es preciso defi- p menores de 0,01; mientras que
nir un umbral por debajo del cual se para no rechazar la hipótesis nula
rechace la hipótesis nula. Este um- el valor de p debe ser mayor o igual
bral recibe el nombre de nivel de sig- a 0,10. Cuando el valor de p toma
nificación, y representa el máximo un valor en el rango entre 0,01 y
nivel en términos de probabilidad 0,10, lamentablemente no se puede
que el investigador está dispuesto a tomar una decisión y es necesario
cometer un falso positivo (α). recolectar una nueva muestra y re-
petir la prueba de hipótesis deter-
En la bibliografía científica los minando con anterioridad el nivel
niveles de significación común- de significación. De lo anterior, se
mente utilizados son 0,10, 0,05 y deriva la importancia de especificar
0,01; valores por arriba de 0,10 no este último incluso desde la escri-
constituyen ninguna prueba y son tura del protocolo de investigación.
rechazados dentro de la comunidad
científica. Para tomar una conclu-
sión al probar una hipótesis de for- Interpretación de los valores de p
ma estadística se compara el valor
de p y el nivel de significación alfa Las dos primeras preguntas
que se fijó con antelación. Si el valor planteadas por el investigador del
de p es menor que alfa, se rechaza ejemplo se refieren a cómo interpre-
la hipótesis nula (es muy poco pro- tar y entender los resultados deriva-
bable que la hipótesis nula sea ver- dos de la prueba de hipótesis en las
dadera). En otro caso, no se puede dos referencias mencionadas; por
rechazar la hipótesis nula, pero esta razón, es necesario retomar los

418 Revista Colombiana de Psiquiatría, vol. XXXIV / No. 3 / 2005


Una mirada al valor de p en investigación
○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○

resultados de ambos trabajos para prevalencia de depresión en la po-


responder estos interrogantes. blación de mujeres es mayor, com-
parada con la prevalencia en la
El primer paso consiste en es- población de hombres. En otras pa-
tablecer un nivel de significación labras, este resultado señala que la
como umbral para comparar el valor probabilidad de que la diferencia ob-
de p obtenido de la prueba de hipó- servada entre las prevalencias mues-
tesis, el cual en ambas publicacio- trales de hombres y mujeres se deban
nes se reporta como α = 0,05. En solamente al efecto del azar es menor
segundo lugar, debe establecerse de 1 en 1.000, lo cual es remota-
con claridad cuál es la hipótesis mente posible.
nula que se va a probar en cada si-
tuación y cuál es la respectiva hipó- Por otra parte, en el trabajo de
tesis alterna. Finalmente, se debe Mantilla y colaboradores (2), la hi-
comparar el α establecido y el valor pótesis nula plantea que las preva-
de p encontrado, indicando una lencias de depresión son iguales para
conclusión adecuada con la natu- niñas y niños; mientras que la hipó-
raleza del estudio. tesis alterna enuncia que estas dos
prevalencias son diferentes. Este tipo
Al retomar el primero de los tra- de hipótesis alterna recibe el nombre
bajos referenciados, se tiene que la de hipótesis bilateral, puesto que no
hipótesis nula debe enunciar que la especifica mayor prevalencia del
prevalencia (proporción poblacional) trastorno depresivo en alguno de los
de depresión en hombres y mujeres dos grupos. La conclusión en este
es la misma; mientras que la hipóte- caso, al ser mayor el valor de p (0,07)
sis alterna plantea que este trastor- que el valor de α, es que los datos
no es mayor en la población de mu- encontrados en las muestras son
jeres, comparada con la prevalencia insuficientes para afirmar que las
en la población de hombres (este prevalencias son distintas en los dos
tipo de hipótesis alterna se denomina grupos; sin embargo, sería incorrecto
hipótesis unilateral, porque establece concluir que la prevalencia en ambos
una única dirección para la evalua- grupos es igual, pues aunque remota,
ción de la diferencia). Dado que el la probabilidad de cometer un falso
valor de p reportado, a pesar de no negativo existe. De esta forma, la
tener una cifra exacta (p <0,001), conclusión en términos prácticos es
es menor que el nivel de significa- no rechazar la hipótesis nula de
ción preestablecido (0,05), la con- igualdad.
clusión en este caso señala que la
magnitud de la diferencia observa- En situaciones como la obser-
da en las muestras constituye una vada en el segundo ejemplo, donde
fuerte prueba para afirmar que la los resultados no logran concluir

Revista Colombiana de Psiquiatría, vol. XXXIV / No. 3 / 2005 419


Gil J., Castañeda J.
○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○

contra la hipótesis nula (llamados En términos prácticos, la deci-


resultados negativos), los editores de sión de emplear una hipótesis
las publicaciones científicas solicitan alterna unilateral o bilateral debe
el reporte de una cifra que cuantifi- estar basada en los conocimientos
que la capacidad del estudio de re- previos del problema que se va a
chazar la hipótesis nula cuando real- tratar. Las hipótesis unilaterales
mente el enunciado expuesto por solamente deben plantearse en si-
ésta es falso (9), la cual nuevamente tuaciones donde se tenga una ex-
es una probabilidad y recibe el nom- pectativa a priori del sentido en el
bre de nivel de potencia estadística que se puede observar la diferencia
de la prueba, denotado por 1-β (com- de interés o cuando se tiene cono-
plemento de la probabilidad de co- cimiento de la imposibilidad bioló-
meter un falso negativo) (4-6). gica, física, etc. de observar una
diferencia en una dirección deter-
Los investigadores deben tener minada. Por el contrario, las hipó-
precaución cuando plantean hipóte- tesis bilaterales suelen plantearse
sis bilaterales y cuando se encuen- cuando se desconoce la dirección
tran diferencias estadísticas que per- en que puede presentarse la dife-
miten rechazar la hipótesis nula de rencia de interés y solamente se
igualdad, porque erróneamente se quiere establecer la existencia de
podría argumentar, por ejemplo, que una diferencia sin concluir especí-
la característica medida es mayor o ficamente una dirección (8).
menor en alguno de los grupos, ba-
sados en las cifras muestrales. Esta Frecuentemente, algunos inves-
conclusión constituye un error, debi- tigadores suelen comparar los valo-
do a que este enunciado se deriva de res de p obtenidos en estudios dife-
una nueva hipótesis planteada a rentes o incluso dentro del mismo
posteriori (luego de ver el valor de p y estudio, a fin de intentar decidir
las cifras muestrales), la cual requie- cuál de los dos es más significativo.
re diseñar y conducir un nuevo proto- Sin embargo, esto representa un
colo de investigación para ser proba- error, puesto que los valores de p
ba (10) (excepto cuando el valor de p corresponden a variables aleatorias,
a dos colas sea menor de 0,02, valor cuyos valores dependen de la mues-
umbral para hipótesis planteadas a tra estudiada. Por ejemplo, un valor
posteriori). Por consiguiente, se reco- de p de 0,048 y otro valor de p de
mienda establecer desde etapas tem- 0,001 tienen la misma interpreta-
pranas del proceso de investigación ción (dicótoma) cuando se ha fijado
la dirección deseada para las prue- un nivel de significación del 5%: se
bas de hipótesis. De otra forma, se rechaza la hipótesis nula, sin poder
asegura la validez de las conclusio- concluir que uno es más significa-
nes derivadas en el estudio. tivo que el otro.

420 Revista Colombiana de Psiquiatría, vol. XXXIV / No. 3 / 2005


Una mirada al valor de p en investigación
○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○

Diferencia estadísticamente salud este concepto es conocido


significativa frente como diferencia clínicamente signi-
a la diferencia clínicamente ficativa o tamaño del efecto (11).
significativa
La magnitud de la diferencia
A pesar de que el resultado de clínicamente significativa la estable-
la prueba de hipótesis puede arro- ce el investigador basándose en múl-
jar como resultado el rechazo de la tiples factores, como la gravedad del
hipótesis nula, al indicar que existe problema que se va a investigar, la
diferencia entre los parámetros po- morbimortalidad asociada con el
blacionales de interés, esta conclu- fenómeno, los costos que conlleva
sión no siempre representa el mis- la implementación de nuevos trata-
mo significado en la práctica. En mientos o la presentación de efec-
algunas ocasiones se puede encon- tos secundarios, entre otros (12). No
trar que una diferencia estadística- obstante, antes de concluir que exis-
mente significativa no representa te una diferencia clínicamente sig-
una diferencia de magnitud relevan- nificativa, es necesario asegurar, en
te para la naturaleza del problema principio, la significación desde el
que se está estudiando. punto de vista estadístico.

Un principio general de la esta-


dística cuando se realiza inferencia Valores de p frente
señala que a mayor tamaño de la a los intervalos de confianza
muestra, mayor control del error alea-
torio; por lo tanto, mayor potencia de A pesar de que el investigador
la prueba de hipótesis para detectar del ejemplo ya está en capacidad de
diferencias de cualquier magnitud interpretar los resultados publica-
cuando éstas existen. De esta forma, dos en ambos artículos, y concluir
el rechazo de la hipótesis nula depen- que la prevalencia de depresión gra-
de ampliamente del tamaño de la ve es significativamente mayor en
muestra: cuando es grande casi siem- mujeres que en hombres, surgen los
pre permitirán rechazar la hipótesis siguientes nuevos interrogantes: ¿es
nula, mientras que cuando es peque- posible conocer sobre la magnitud
ño, difícilmente podrán concluir sig- de esta diferencia? ¿Es esta diferen-
nificación estadística (10). cia clínicamente relevante?

La significación práctica repre- Por desgracia, una de las prin-


senta la verdadera magnitud de la cipales debilidades que caracteriza
diferencia, que se considera útil o a las pruebas de hipótesis, y que es
relevante para la naturaleza del pro- señalada por muchos autores para
blema. Dentro de la investigación en desmotivar su uso en la investiga-

Revista Colombiana de Psiquiatría, vol. XXXIV / No. 3 / 2005 421


Gil J., Castañeda J.
○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○

ción (14), es la poca información que bres colombianos entre un 7,4% y


aporta al conocimiento del tema en un 11,8%. Esta interpretación co-
estudio, puesto que el valor de p sólo rresponde a la determinación de la
determina si la diferencia es o no magnitud de la diferencia en las
significativa, y de ninguna manera prevalencias en las dos poblaciones.
permite cuantificar la magnitud de
dicha diferencia. La segunda interpretación está
relacionada con la inclusión del valor
Puede ocurrir que un lector que 0 dentro del IC. Si está presente, esto
esté en búsqueda de un cálculo para significa que no se puede descartar
la magnitud de la diferencia encon- que las dos prevalencias sean iguales.
trada pueda verse tentado a utilizar Por el contrario, si el intervalo no in-
la prevalencia de depresión grave en- cluye el valor 0, que corresponde al
contrada en la muestra de mujeres caso presente, se puede interpretar
(29,2%) y la prevalencia calculada en que a un IC del 95% existen prue-
la muestra de hombres (19,6%), rea- bas para argumentar que las preva-
lizar una sustracción directa de es- lencias en las dos poblaciones son
tos dos porcentajes y encontrar que diferentes y que se puede identificar
la magnitud de la diferencia es un la dirección de dicha diferencia. Para
9,6% (mayor en las mujeres). Sin el caso de los datos reportados por
embargo, este procedimiento es in- Gómez-Restrepo y colaboradores, es
correcto, debido a que las prevalen- de esperar este resultado, porque el
cias 29,2% y 19,6% son valores en- IC debe reflejar similares hallazgos
contrados en la muestra, por lo que que los obtenidos con el valor de p,
es posible que al tomar otras mues- con la ganancia de poder cuantifi-
tras, y producto del error aleatorio, car probabilísticamente la diferencia
estos valores cambien, lo mismo que entre las prevalencias y el error en
la diferencia entre ellos (15). el cálculo.

Para controlar este error de tipo De esta forma, se puede decir


muestral se recomienda construir que el IC es más informativo que un
un intervalo de confianza (IC) para valor de p; pero a diferencia del pro-
el parámetro de interés, que en este cedimiento de prueba de hipótesis,
caso corresponde a la diferencia de en la construcción del IC no existe
proporciones (16). El IC del 95% el concepto de falsos negativos. De
construido para este caso es 7,4% esta forma, para permitir al lector
y 11,8%, el cual tiene dos interesan- hacer mejores y más completas in-
tes interpretaciones. La primera es terpretaciones, preferiblemente se
que con un IC del 95%, la prevalen- deben informar los dos resultados
cia de depresión grave en mujeres en la publicación, intervalos de con-
colombianas es mayor que en hom- fianza y valores de p (17).

422 Revista Colombiana de Psiquiatría, vol. XXXIV / No. 3 / 2005


Una mirada al valor de p en investigación
○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○

Importancia del tamaño comparado con otras razones de


de la muestra asignación.

Las pruebas de hipótesis, al Como se ve, el cálculo del tama-


igual que las demás metodologías ño de la muestra integra, entre
estadísticas relacionadas con la in- otros, tanto el nivel de significación
ferencia, requieren un cálculo apro- estadística (nivel α) como el nivel de
piado del tamaño de la muestra, significación clínica (diferencias que
puesto que éste es uno de los más clínicamente son relevantes). Dennis
importantes factores que aseguran y Pérez (11) ilustran las fórmulas
al investigador obtener resultados empleadas para el cálculo del tama-
con una precisión deseada y a la vez ño de la muestra en estas situacio-
controlar el error aleatorio. nes y comentan el efecto de cada
uno de los factores en el resultado
Los factores que influyen en la del cálculo.
determinación del número de indivi-
duos requeridos para un estudio que Para concluir, es importante se-
pretende probar una hipótesis son: ñalar que el cálculo del tamaño de
la muestra, además de ser un ejer-
1. Los índices máximos aceptables cicio necesario durante la elabora-
de error tipo I y error tipo II, ción de un protocolo de investiga-
pues entre menores sean, ma- ción, es también una buena herra-
yor es el tamaño de la muestra. mienta para evaluar la factibilidad
2. La diferencia mínima que se va del estudio, en términos del número
a detectar (mínima diferencia de pacientes necesarios y la precisión
que desde el punto de vista clí- que se desea en los resultados. De
nico resulta ser significativa). A esta forma, un estudio conducido
menor diferencia se requieren con un tamaño pequeño puede ser
mayores pruebas para tomar visto con buenos ojos desde una
decisiones, lo que conlleva un perspectiva económica (a menor nú-
mayor tamaño de la muestra. mero de pacientes en el estudio,
3. La variabilidad de la variable de menores serán los costos); pero al
interés. Cuando la característica tiempo puede carecer de capacidad
de interés en el estudio es poco para detectar diferencias que des-
homogénea, se hacen necesarios de el punto de vista clínico pueden
mayores tamaños de la muestra. ser relevantes.
4. La razón de asignación a los
grupos, cuando la asignación de Por otra parte, si se emplean ta-
los pacientes en los grupos del maños de muestra muy grandes, el
estudio es 1 a 1, el tamaño de estudio puede derivar en la detec-
la muestra resulta ser menor, ción de diferencias no relevantes

Revista Colombiana de Psiquiatría, vol. XXXIV / No. 3 / 2005 423


Gil J., Castañeda J.
○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○

desde el punto de vista clínico, lo 8. Dawson B, Trapp R. Bioestadística médi-


ca. 3rd ed. México: Manual Moderno; 2002.
cual representaría un mal uso de los
9. Randy SH, Scott MW, Robert SD, Tom
recursos, debido a los gastos inne- AE. Prominent medical journals often
cesarios que esto conlleva. De igual provide insufficient information to
forma, estudios con un número de assess the validity of studies with
negative results. J Negat Results
pacientes mayor o menor al estric- Biomed. 2002;1(1):1-5.
tamente necesario no son aceptables 10. Good P, Hardin J. Common errors in
desde el punto de vista ético. statistics: and how to avoid them. New
Jersey: John Wiley & Sons; 2003.
11. Dennis R, Pérez A. Cálculo del tamaño
de la muestral. En: Ruiz A, Morillo L.
Bibliografía Epidemiología clínica: investigación
médica aplicada. Bogotá: Editorial Mé-
dica Panamericana; 2004. p. 141-62.
1. Gomez-Restrepo C, Bohórquez A, Pin- 12. Pita S, Pértega S. Significancia estadís-
to D, Gil JF, Rondón M, Díaz-Granados tica y relevancia clínica serie [Metodo-
N. Prevalencia de depresión y factores logía de la investigación]. Fisterra.com
asociados con ella en la población co- [Portal de internet]. 2001[último acce-
lombiana. Revista Panamericana de so 2005 junio 30]. Disponible en http://
Salud Pública. 2004 Dec;16(6):378-86. www.fisterra.com/mbe/investiga/
2. Mantilla LF, Sabalza L, Díaz LA, Cam- signi_estadi/signi_estadi.htm..
po-Arias A. Prevalencia de sintomatolo- 13. Lozano J, Dennis R. Medidas de fre-
gía depresiva en niños y niñas escola- cuencia, de asociación y de impacto.
res de Bucaramanga, Colombia. Revista En: Ruiz A, Morillo L. Epidemiología clí-
Colombiana de Psiquiatría 2004;33(2): nica: investigación médica aplicada. Bo-
163-71. gotá: Editorial Médica Panamericana;
3. Goodman SN. Toward evidence-based 2004. p. 181-97.
medical statistics. 1: the p value fallacy. 14. Clark M. Los valores p y los intervalos
Ann Intern Med. 1999;130(12):995-1004. de confianza: ¿en qué confiar? [edito-
4. Bernard R. Fundamentals of biostatis- rial]. Revista Panamericana de la Sa-
tics. 3rd ed. Belmont (CA): Duxbury lud;15(5):293-6.
Press; 1990. 15. Castañeda J, Gil F. Una mirada a los in-
5. Hogg R, Craig A. Introduction to tervalos de confianza en investigación.
mathematical statistics. New York: Revista Colombiana de Psiquiatría.
MacMillan Publishing; 1978. 2004;33(2):193-201.
6. Gonick L, Smith W. The cartoon guide 16. Daniel W. Bioestadística base para el
to statistics. New York: Harper Perennial; análisis de las ciencias de la salud.
1993. México: Limusa; 2002.
7. Pagano M, Gauvreau K. Principles of 17. Altman D, Machin D, Bryant T, Gardner
biostatistics. 2nd ed. Pacific Grove (CA): M. Statistics with confidence. 2nd ed.
Duxbury Thomson Learning; 2000. Bristol: BMJ Books; 2000.

Recibido para publicación: 3 de marzo de 2005


Aceptado para publicación: 12 de mayo de 2005
Correspondencia
Jacky F. Gil
Hospital Universitario San Ignacio
Unidad de Epidemiología Clínica y Bioestadística
Carrera 7 No. 40-62, Bogotá
fgil@javeriana.edu.co

424 Revista Colombiana de Psiquiatría, vol. XXXIV / No. 3 / 2005

Вам также может понравиться