Вы находитесь на странице: 1из 6

10 INVESTIG 6678-177-182.

qxd 03/7/11 13:21 Página 177

INVESTIGACIÓN 52.965

Utilización de métodos robustos en la estadística


inferencial
E. Ramalle-Gómaraa y J.M. Andrés de Llanob

La estadística es la ciencia que permite to- cesario conocer ni suponer nada acerca de
mar decisiones en situaciones de incerti- las variancias poblacionales. La mayoría no
dumbre1. Estas decisiones se basan con requiere el supuesto de linealidad.



LECTURA RÁPIDA
frecuencia en inferir a partir de muestras, Cuando se dan las condiciones de aplica-
tanto para estimar valores en las poblacio- ción, las pruebas paramétricas tienen más
nes como para realizar pruebas de contras- potencia que las no paramétricas, pero,
te de hipótesis. Básicamente, el propósito cuando esto no es así, el riesgo alfa puede ▼
de las pruebas de hipótesis es obtener con- ser mayor que el especificado de antema- La estadística es la ciencia
clusiones sobre los parámetros de la pobla- no5, es decir, se aumenta la probabilidad de que permite tomar
ción (media, proporción u otros) basándo- afirmar una diferencia entre grupos que no decisiones en situaciones
nos en los resultados obtenidos en existe, que podríamos traducir como que se de incertidumbre.
muestras aleatorias2. La estadística ha de- incrementa la probabilidad de cometer un ▼
sarrollado dos grupos de pruebas para to- falso positivo6. El propósito de las pruebas
mar decisiones de este tipo: pruebas para- Una estrategia posible sería utilizar siem- de hipótesis es obtener
métricas y pruebas no paramétricas. pre pruebas no paramétricas ya que, si se conclusiones sobre los
Las pruebas paramétricas tienen en cuenta dan las condiciones de aplicación, la pérdi- parámetros de la población
los parámetros en las poblaciones. Para su da de potencia no es muy grande y, si no se (media, proporción u
utilización es necesario que se de una serie dan, son los métodos que deben emplearse. otros) basándonos en los
de requisitos o supuestos que, en caso de Es conocido que los métodos no paramé- resultados obtenidos en
no cumplirse, impiden su utilización3,4: la tricos tienen una alta potencia cuando se muestras aleatorias.
escala de medida debe ser de intervalo o dan las condiciones de aplicación de las pa- ▼
razón; las observaciones deben ser inde- ramétricas y tienen muy pocas probabilida- Las pruebas paramétricas
pendientes unas de otras; las variancias po- des de conducir a una conclusión distinta tienen en cuenta los
blacionales de las variables en estudio de- de la obtenida por los métodos tradiciona- parámetros en las
ben ser similares (homocedasticidad); la les paramétricos7. poblaciones. Para su
relación entre las variables debe ser de tipo Otra alternativa es la utilización de los lla- utilización es necesario que
se de una serie de
lineal, y la distribución de las variables en mados métodos robustos. Estos métodos
requisitos o supuestos.
la población debe seguir una ley normal. son menos potentes que los paramétricos,
Las pruebas no paramétricas no necesitan pero se muestran superiores a los no para- ▼
estas condiciones previas de aplicación. métricos clásicos. Entendemos por poten- Las pruebas no
Pueden utilizarse para analizar variables cia o poder de un test la probabilidad de paramétricas no necesitan
nominales y ordinales. La distribución po- elegir la hipótesis alternativa cuando es estas condiciones previas
de aplicación.
blacional puede ser cualquiera y no es ne- cierta, es decir, la capacidad para encontrar
diferencias significativas cuando es cierto ▼
que existen8,9. Cuando se dan las
La principal de sus ventajas es que no se condiciones de aplicación,
afectan por la existencia de datos anóma- las pruebas paramétricas
aServicio
de Epidemiología. Gobierno de La Rioja.
tienen más potencia que
Logroño. España. los, como, por ejemplo, algunos datos muy
bServicio de Pediatría. Hospital Río Carrión. Palencia. las no paramétricas, pero,
extremos (outliers), y que no requieren los
España. cuando esto no es así, el
Correspondencia:
supuestos de aplicación de las pruebas pa- riesgo alfa puede ser mayor
Enrique Ramalle-Gómara. ramétricas. que el especificado de
Servicio de Epidemiología.
C/ Villamediana, 17. Cuando una distribución cualquiera pre- antemano.
26071 Logroño. La Rioja. España.
Correo electrónico: ramalle@larioja.org senta datos anómalos, existe el hábito ge-
neralizado de eliminarlos, proceso eufe-
Manuscrito recibido el 22 de julio de 2002.
místicamente llamado de limpieza o

Manuscrito aceptado para su publicación el 22 de julio


de 2002.
depuración, antes de realizar inferencias
con ella. Esta actitud asume que los datos

99 | Aten Primaria 2003;32(3):177-82 | 177


10 INVESTIG 6678-177-182.qxd 03/7/11 13:21 Página 178

Ramalle-Gómara E, et al.
INVESTIGACIÓN Utilización de métodos robustos en la estadística inferencial

TABLA Métodos robustos para el cálculo de medidas


1 de posición

LECTURA RÁPIDA
Estimador Estrategia Resultado con los datos
(1, 2, 3, 4, 5, 100)
(media aritmética: 19,2)

Media α-winsorizada muestral Se sustituye un determinado porcentaje, α, 3,5


(20% generalmente) de valores extremos a cada lado
▼ de la muestra por el valor más próximo no sustituido
Una estrategia posible sería
Media α-recortada muestral Se eliminan las k observaciones extremas de cada lado, 3,5
utilizar siempre pruebas no en lugar de winsorizarlas, calculando la media aritmética
paramétricas ya que, si se de las observaciones restantes
dan las condiciones de Mediana muestral Divide la distribución en dos partes con el mismo número 3,5
aplicación, la pérdida de de elementos
potencia no es muy grande
Estimador de Huber Se encuentra dentro de los denominados M-estimadores, 3,57
y, si no se dan, son los que generalizan al estimador de máxima verosimilitud
métodos que deben con buenas propiedades de robustez y eficiencia.
emplearse. En este caso se descartan las observaciones que sean
mayores (o menores) a una constante

Otra alternativa es la
utilización de los llamados
extremos son erróneos, lo cual no es admi- lor promedio de la serie. La alternativa que
métodos robustos. Estos
métodos son menos
sible. Otras opciones que se utilizan son las suele proponerse a esta situación es utilizar
potentes que los de su sustitución por el valor promedio, por la mediana y los percentiles para describir
paramétricos, pero se la interpolación de un dato con respecto a la distribución14,15, ya que estas medidas
muestran superiores a los los adyacentes u otros métodos similares a no se ven afectadas, generalmente, por la
no paramétricos clásicos. los empleados cuando existen datos ausen- existencia de valores extremos. La mediana
tes (missing) en una base de datos10,11. Sin de la distribución es 4. Sin embargo, en al-

La principal de sus ventajas
embargo, un enfoque más adecuado es gunas circunstancias la mediana tampoco
es que no se afectan por la comprobar la veracidad de los datos. Si el estima bien el promedio de la distribución.
existencia de datos dato extremo está equivocado debe corre- Esto ocurre cuando en una muestra la me-
anómalos. girse. Si es correcto, eliminarlo o sustituir- diana y los valores superiores a ella están
lo puede modificar las inferencias que se muy cercanos entre sí y, a su vez, muy ale-

realicen a partir de esa información, debido jados de los valores que se sitúan por deba-
Se asume que los datos
extremos son erróneos, lo
a que introduce un sesgo que es difícil de jo de la mediana, o viceversa. Por ejemplo,
cual no es admisible. Un cuantificar12 y a que disminuye el tamaño en la muestra 1, 2, 98, 99, 100, la mediana
enfoque más adecuado es muestral. Este último aspecto es crucial es 98, que no es un índice de resumen
comprobar la veracidad de cuando la muestra estudiada es pequeña. apropiado. El porcentaje máximo de valo-
los datos. Si el dato Los métodos robustos pueden ser de utili- res extremos que soporta un estimador an-
extremo está equivocado dad para la realización de inferencias sin tes de no ser válido se llama punto de rup-
debe corregirse. tener que «depurar» los datos extremos, ya tura (breakdown point)16.
▼ que están diseñados para realizar inferen- En estas circunstancias, tamaño muestral
Se puede sustituir por el cias sobre el modelo, reduciendo la posible pequeño y presencia de valores extremos,
valor promedio, por la influencia que pudiera tener la presencia de pueden utilizarse métodos robustos para el
interpolación de un dato datos anómalos13. cálculo de estadísticos de centralización o
con respecto a los localización (tabla 1).
adyacentes u otros Métodos robustos para estimar Como parámetros de localización se reco-
métodos similares a los medidas de centralización mienda en primer lugar, el de Huber y, en
empleados cuando existen
Un problema conocido en el cálculo de segundo lugar, la media α-recortada mues-
datos ausentes.
medidas de posición o centralización es tral (con α = 0,2).
aquel en el que una distribución de datos
no sigue una ley normal; en esta circuns- Métodos robustos para estimar

tancia la media no es un buen estimador medidas de dispersión


del promedio de los datos. La media es Las medidas de dispersión clásicas (varian-
particularmente sensible cuando la serie de cia y desviación típica) se ven afectadas por
datos es pequeña y existe algún valor extre- las mismas limitaciones que las medidas de
mo. Por ejemplo, en la serie 2, 3, 4, 5, 100, posición. La desviación típica sólo es un
la media es 22,8, que no refleja bien el va- buen estimador del promedio de la desvia-

178 | Aten Primaria 2003;32(3):177-82 | 100


10 INVESTIG 6678-177-182.qxd 03/7/11 13:21 Página 179

Ramalle-Gómara E, et al.
Utilización de métodos robustos en la estadística inferencial INVESTIGACIÓN

TABLA Métodos robustos para el cálculo


2 de medidas de dispersión



Estimador Estrategia Resultado con los datos LECTURA RÁPIDA
(1, 2, 3, 4, 5, 100)
(media aritmética: 39,6)

Desviación absoluta mediana estandarizada Es la mediana de las desviaciones 2,2


absolutas a la mediana

Cuasi desviación típica α-winsorizada muestral En la que se sustituye un determinado 1,38
Los métodos robustos
porcentaje de valores extremos a cada
lado de la muestra por el valor más pueden ser de utilidad para
próximo no sustituido la realización de inferencias
sin tener que «depurar»
los datos extremos.
TABLA Métodos robustos para el contraste ■
3 de hipótesis

Contrastes de hipótesis con una muestra unidimensional



Contrastes de hipótesis con dos muestras unidimensionales utilizando intervalos y test basados en medias α-recortadas Métodos robustos para es-
muestrales timar medidas de centrali-
Generalización robusta del test de Wilcoxon-Mann-Whitney para datos independientes o apareados zación
Un problema conocido en
Métodos robustos para el análisis de la variancia con uno o varios factores y las comparaciones múltiples entre
subgrupos el cálculo de medidas de
posición o centralización es
Generalización robusta del test de Kruskal-Wallis
aquel en el que una
Métodos robustos del análisis de la variancia con medidas repetidas distribución de datos no
Análisis robustos de la correlación y estimación multivariante sigue una ley normal; en
Análisis robusto de regresión múltiple y de la covariancia esta circunstancia la media
no es un buen estimador
del promedio de los datos.
TABLA Ejemplo para la comparación ▼
4 de dos medias Como parámetros de
Grupo Días de estancia Media Mediana K-S-L
localización se recomienda
en primer lugar, el de
Fallecidos (n = 21) 1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 7,24 2,00 p < 0,0001 Huber y, en segundo lugar,
2, 3, 3, 3, 5, 14, 30, 31, 45
la media a-recortada
Supervivientes (n = 53) 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 11,74 3,00 p < 0,0001 muestral (con a = 0,2).
2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 4, 4, 4,
11, 13, 13, 14, 15, 15, 15, 18, 21, 25, 25,

27, 27, 30, 31, 33, 60, 66, 88
K-S-L: prueba de Kolmogorov-Smirnov, con corrección de Lilliefors para la comprobación del supuesto de normalidad.

Métodos robustos
para estimar medidas
ción del conjunto de los datos con respec- Ejemplo para la comparación de dos medias de dispersión
to al valor central, cuando la distribución Disponemos de 74 pacientes ingresados en Las medidas de dispersión
es normal (gaussiana). Las alternativas ro- una unidad de cuidados intensivos (UCI) y clásicas (variancia y
bustas para el cálculo de medidas de dis- queremos comparar las estancias generadas desviación típica) se ven
persión se resumen en la tabla 2. en dicha unidad entre un grupo de pacien- afectadas por las mismas
Se recomienda la utilización de la desvia- tes fallecidos y otro grupo de supervivien- limitaciones que las
medidas de posición.
ción absoluta mediana estandarizada. tes (tabla 4).

Métodos robustos para el contraste


de hipótesis TABLA

Resultados de las distintas pruebas


Con los parámetros antes referidos, se 5 para la comparación de dos medias
pueden construir intervalos de confianza Prueba de contraste de hipótesis Nivel de significación
robustos y realizar contrastes de hipóte-
Test de la t de Student 0,29
sis13. Las principales pruebas de contraste
Test de Mann-Whitney 0,07
de hipótesis basadas en métodos robustos
se presentan en la tabla 3. Test de Yuen (media α-recortada) 0,04

101 | Aten Primaria 2003;32(3):177-82 | 179


10 INVESTIG 6678-177-182.qxd 03/7/11 13:21 Página 180

Ramalle-Gómara E, et al.
INVESTIGACIÓN Utilización de métodos robustos en la estadística inferencial

TABLA Ejemplo para la comparación


6 de más de dos medias

LECTURA RÁPIDA Grupo Días de estancia Media Mediana K-S-L

Jóvenes (n = 28) 8, 30, 55, 4, 3, 1, 1, 2, 2, 1, 2, 2, 1, 3, 1, 1, 2, 3, 2, 5,18 2,00 p < 0,0001


1, 2, 1, 3, 4, 1, 2, 3, 4
Maduros (n = 23) 1, 1, 1, 25, 13, 25, 4, 5, 4, 2, 1, 2, 33, 3, 2, 3, 2, 3, 9,22 3,00 p < 0,0001
▼ 1, 66, 11, 1, 3
Como alternativa, se Ancianos (n = 23) 1, 15, 25, 1, 31, 2, 11, 88, 3, 21, 60, 3, 1, 5, 13, 2, 15,48 3,00 p = 0,0012
recomienda la utilización de 1, 2, 1, 3, 27, 3, 1, 27
la desviación absoluta
K-S-L: prueba de Kolmogorov-Smirnov, con corrección de Lilliefors para la comprobación del supuesto de normalidad.
mediana estandarizada.

■ TABLA Resultados de las distintas pruebas Ejemplo para la comparación de más de dos
7 para la comparación de más de dos medias
▼ medias
Métodos robustos para Como ejemplo de la utilidad de los méto-
el contraste de hipótesis Prueba de contraste de hipótesis Nivel de significación dos robustos para el análisis de la variancia
Con los parámetros antes Test de ANOVA 0,08 continuamos utilizando a otros 73 pacien-
referidos, se pueden
Test de Kruskal-Wallis 0,09 tes ingresados en una UCI y queremos
construir intervalos de comparar las estancias generadas en dicha
Método robusto media (α-recortada) 0,02
confianza robustos y unidad entre tres grupos de pacientes cla-
realizar contrastes de sificados en función de la edad (jóvenes,
hipótesis.
maduros y ancianos). Las características
▼ La variable estancia, como casi todas las que los describen se resumen en la tabla 6.
El test de Yuen es una que se refieren al tiempo, es una variable Por otro lado, el test de Levene para valo-
alternativa a las pruebas de conocida por su distribución alejada de lo rar la homogeneidad de las variancias (ho-
la t de Student y U de normal. Si el tamaño de los grupos que se mocedasticidad) muestra que existen dife-
Mann-Whitney para
estudian es pequeño –menor de 30–, no rencias entre ellas (p = 0,027). Por lo tanto,
tamaños muestrales
sería adecuada la utilización de métodos existen varios incumplimientos (ausencia
pequeños y distribuciones
no normales.
paramétricos (t de Student) y deberíamos de normalidad y homocedasticidad, y exis-
recurrir a los clásicos no paramétricos (U tencia de valores anómalos outliers) que
▼ de Mann-Whitney). Sin embargo, en este impiden la utilización de métodos paramé-
Ejemplo para la comparación caso concreto ninguna de estas dos opcio- tricos (ANOVA clásico) en este ejemplo y
de más de dos medias
nes tiene potencia suficiente para detectar deberíamos recurrir a los clásicos no para-
Para comparar más de dos
diferencias significativas. La potencia es la métricos de Kruskal-Wallis o, mejor, a mé-
medias, cuando no puede
utilizarse el ANOVA
capacidad para encontrar diferencias signi- todos robustos como la generalización ro-
clásico, deberíamos recurrir ficativas cuando es cierto que existen8. Sin busta del test Welch, que utiliza medias
a los clásicos no embargo, el test robusto de Yuen, que uti- α-recortadas muestrales y es capaz de de-
paramétricos de Kruskal- liza medias α-recortadas muestrales, es ca- tectar diferencias significativas entre los
Wallis o, mejor, a métodos paz de detectar diferencias significativas grupos (tabla 7).
robustos como la entre ambos grupos (tabla 5).
generalización robusta del Por tanto, el test de Yuen es una alternati- Ejemplo para el análisis de correlación y regre-
test Welch, que utiliza va a las pruebas de la t de Student y U de sión lineal
medias a-recortadas Mann-Whitney para tamaños muestrales Por último, para comparar los distintos
muestrales.
pequeños y distribuciones no normales. métodos en los análisis de correlación y re-

TABLA Ejemplo para


8 regresión lineal
Variable Días de estancia Media Mediana K-S-L

X (edad) (n = 22) 63, 79, 53, 20, 23, 18, 19, 16, 45, 30, 16, 67, 71, 50,27 58,00 p = 0,04
73, 71, 76, 77, 75, 27, 86, 76, 25
Y (estancia) (n = 22) 18, 21, 9, 87, 3, 6, 5, 2, 1, 3, 1, 16, 25, 23, 11, 21, 14,50 10,00 p = 0,002
18, 4, 2, 25, 17, 1

K-S-L: prueba de Kolmogorov-Smirnov, con corrección de Lilliefors para la comprobación del supuesto de normalidad.

180 | Aten Primaria 2003;32(3):177-82 | 102


10 INVESTIG 6678-177-182.qxd 03/7/11 13:21 Página 181

Ramalle-Gómara E, et al.
Utilización de métodos robustos en la estadística inferencial INVESTIGACIÓN

FIGURA
Rectas de regre- Valor extremo
1 sión obtenidas por



80 LECTURA RÁPIDA
mínimos cuadra-
dos y por el esti-
mador robusto de 60
regresión medio
biponderado.
Días de estancia

40 Deberíamos recurrir a
métodos no paramétricos
(Spearman) o, mejor, a
20
métodos robustos como el
coeficiente de porcentaje
ajustado poblacional y el
estimador robusto de
0
regresión medio
20 30 40 50 60 70 80
biponderado.
Edad
Línea continua: ajuste mediante el estimador robusto de regresión medio biponderado ▼
Línea de trazos discontinuos: ajuste mediante mínimos cuadrados
La realización de cualquiera
de estas estimaciones
requiere un programa
estadístico apropiado. Entre
TABLA ellos puede utilizarse el
Resultados para drados. El valor extremo apenas afecta a la
9 regresión lineal
estimación robusta.
programa R.

Prueba de contraste Coeficiente Nivel de La realización de cualquiera de estas esti-


de hipótesis de correlación significación
maciones requiere un programa estadístico ■
Pearson 0,15 0,50 apropiado. Entre ellos puede utilizarse el
Spearman 0,61 0,002 programa R, que añade al hecho de facilitar
Porcentaje ajustado estos cálculos el de ser de libre distribución,
poblacional 0,70 0,0003 por lo que no está sometido a derechos de
copyright y se obtiene gratuitamente en In-
ternet17.
gresión utilizaremos también a 22 pacien-
tes ingresados en una UCI. En este caso
deseamos valorar la relación entre la edad
de los mismos y sus estancias generadas en Bibliografía
dicha unidad (tabla 8). 1. Bailar JC III. Some ures of statistacal thin-
De nuevo observamos la ausencia de nor- king. En: Bailar JC III, Mostoller F, editors.
Medical ures of statistics. Boston: N Engl
malidad en las dos variables que invalida la
J Med Books, 1992; p. 25-57.
utilización de métodos paramétricos (co- 2. Guyatt GH, Jaeschke R, Heddle N, Cook D,
rrelación de Pearson y regresión lineal), Shannon H, Walter S. Hypothesis testing.
por lo que deberíamos recurrir a métodos CMAJ 1995;152:27-32.
no paramétricos (Spearman) o, mejor, a 3. Esbrí R. El porqué de las asunciones de las
pruebas paramétricas (distribución normal e
métodos robustos como el coeficiente de
igualdad de varianzas). Jano 1996;50:1120.
porcentaje ajustado poblacional y el esti- 4. Manzano V. Inferencia estadística. Aplicacio-
mador robusto de regresión medio bipon- nes y usos con SPS/PC+. Madrid: RA-MA,
derado (tabla 9). 1995.
En la figura 1 podemos apreciar la diferen- 5. Siegel S, Castellan NJ. Estadística no paramé-
trica. 4.ª ed. México: Trillas, 1995.
cia entre la recta de regresión obtenida por
6. Ramalle-Gómara E, Bermejo R. El significa-
el método de mínimos cuadrados y la ob- do de lo significativo. Algunas consideracio-
tenida por el estimador robusto de regre- nes sobre los tests de significación y el uso del
sión medio biponderado, y cómo afecta la valor «p». Aten Primaria 1994;14:863-5.
existencia de un valor extremo. 7. Colton T. Estadística en medicina. Barcelona:
Masson-Little Brown, 1995.
Como puede comprobarse en la figura 1, el
8. Argimon JM, Jiménez-Villa J. Métodos de in-
ajuste es mejor con el estimador robusto vestigación clínica y epidemiológica. 2.ª ed.
que con la estimación por mínimos cua- Barcelona: Harcourt, 2000.

103 | Aten Primaria 2003;32(3):177-82 | 181


10 INVESTIG 6678-177-182.qxd 03/7/11 13:21 Página 182

Ramalle-Gómara E, et al.
INVESTIGACIÓN Utilización de métodos robustos en la estadística inferencial

9. Porta M, Moreno V, Sanz F, Carné X. Una 13. García A. Métodos avanzados de estadística
cuestión de poder. Med Clin (Barc) 1989; aplicada. Madrid: UNED, 2001.
92:223-8. 14. Altman DG. Practical statistics for medical
10. Brick JM, Kalton G. Handling missing data research. London: Chapman and Hall, 1991.
in survey research. Stat Methods Med Res 15. García M, Martín M. La media ± la desvia-
1996;5:215-38. ción típica no siempre funciona. Jano 1996;
11. Little RJ. Methods for handling missing va- 50:1508.
lues in clinical trials. J Rheumatol 1999;26: 16. García A. Métodos avanzados en estadística
1654-6. aplicada II. Métodos robustos y de remues-
12. Katz MH. Multivariable analysis: a practical treo. Madrid; 2001.
guide for clinicians. Cambridge: Cambridge 17. Disponible en: http://www.R-project.org/.
University Press, 1999. 2002

182 | Aten Primaria 2003;32(3):177-82 | 104

Вам также может понравиться