Вы находитесь на странице: 1из 21

Mauricio Carrillo-Tripp

Biofsica Computacional y Bioinformtica Laboratorio Nacional de Genmica para la Biodiversidad trippm@langebio.cinvestav.mx

Cinvestav Sede Irapuato


http://langebio.cinvestav.mx

Unidad Langebio

Bioestadstica

Retos en Estadstica

Mauricio Carrillo-Tripp Langebio - Cinvestav

Retos en Estadstica

Conceptos de Mltiples Comparacines Valores Atpicos (VAs) Pruebas para deteccin de VAs

Mauricio Carrillo-Tripp Langebio - Cinvestav

Conceptos de Mltiples Comparacines


Hacer frente al problema de Mltiples Comparaciones (MC) es uno de los retos ms grandes en Anlisis de Datos. Si se calculan muchos Valores P, algunos sern pequeos solo por casualidad/aleatoriedad. Por lo tanto, es imposible interpretar Valores P pequeos sin conocer cuantas comparaciones se hicieron.
Mauricio Carrillo-Tripp Langebio - Cinvestav 5

Conceptos de Mltiples Comparacines


Ejemplo: Se realizan dos comparaciones independientes. Asumiendo que ambas HN son ciertas, cul es la probabilidad de que ambas comparaciones sean NO Estadsticamente Significativas? P = P(1era Comp. NO ES) * P(2da Comp. NO ES) P = (0.95) * (0.95) = (0.95)2 = 0.9025 = 90.25% Cerca del 10% de las conclusiones sern ES solo por casualidad!
Mauricio Carrillo-Tripp Langebio - Cinvestav 6

Conceptos de Mltiples Comparacines


Generalizacin: Para k comparaciones independientes

La probabilidad de que todas sean NO ES es 0.95k La probabilidad de que una o ms sean ES es 1 - 0.95k

Mauricio Carrillo-Tripp Langebio - Cinvestav

Conceptos de Mltiples Comparacines


Para 13 Comparaciones Independientes (HN cierta para todas ellas), la probabilidad de que uno o ms Valores P sean menores a 0.05 es ~50%, llevando a una conclusin de ES!
Mauricio Carrillo-Tripp Langebio - Cinvestav 8

Conceptos de Mltiples Comparacines


Las TRAMPAS: Analizando Datos sin un Plan Estadstico: Ah, ya calculaste el Valor P? Cirujano: S, use una Regresin Logstica Multinomial E: De verdad? Cmo se te ocurri eso? C: Bueno, prob cada anlisis en el men de la aplicacin y ese fue el que di el Valor P ms pequeo
Mauricio Carrillo-Tripp Langebio - Cinvestav 9

Conceptos de Mltiples Comparacines


Las TRAMPAS: Analizando Datos sin un Plan De no ser por todos los asesinatos, Washington tendra la taza de crmenes ms bajos del pas. Marion Barry Gobernador de Washington, DC

Mauricio Carrillo-Tripp Langebio - Cinvestav

10

Conceptos de Mltiples Comparacines


Las TRAMPAS: Analizando Datos sin un Plan Se pueden encontrar muchas formas de forzar Significacin Estadstica de un conjunto de datos:

Probar criterios distintos para incluir/excluir datos Arbitrariamente decidir qu puntos atpicos quitar Probar distintas formas de separar o agrupar datos Probar distintos algoritmos para una prueba Probar distintas pruebas estadsticas
Mauricio Carrillo-Tripp Langebio - Cinvestav 11

Conceptos de Mltiples Comparacines


Las TRAMPAS: Analizando Datos sin un Plan
Anlisis Secuenciales (Mltiples puntos temporales) Para interpretar correctamente un Valor P, se debe determinar el protocolo experimental por adelantado:

Escoger tamao de muestra Recabar datos Analizar informacin

Qu pasa si los resultados no son lo bastante ES?


Mauricio Carrillo-Tripp Langebio - Cinvestav 12

Conceptos de Mltiples Comparacines


Las TRAMPAS: Analizando Datos sin un Plan
Anlisis Secuenciales (Mltiples puntos temporales) El experimentador se puede ver tentado a realizar el experimento varias veces ms (aumentando la muestra). Si el anlisis determina que los resultados todava no son ES, realizar el experimento varias veces ms y se analizarn los resultados de nuevo. Continuar el experimento hasta que le gusten los resultados?
Mauricio Carrillo-Tripp Langebio - Cinvestav 13

Conceptos de Mltiples Comparacines


Las TRAMPAS: Analizando Datos sin un Plan
Anlisis Secuenciales (Mltiples puntos temporales) El problema es que el experimento contina cuando el resultado no es ES, pero se detiene cuando si es ES. Esta metodologa secuencial informal NO se debe de usar, ya que es imposible interpretar los resultados.
Mauricio Carrillo-Tripp Langebio - Cinvestav 14

Valores Atpicos
Un Valor Atpico, VA, (observacin anmala, espuria, contaminada) es un dato tan alejado del resto que parece haber venido de una poblacin distinta. Informalmente, es un punto tan extremo que no se ajusta con nuestra preconcepcin. Pueden aparecer por varias razones: Captura invlida, Diversidad biolgica (!), Casualidad aleatoria, Equivocacin experimental, Suposicin equivocada.
Mauricio Carrillo-Tripp Langebio - Cinvestav 15

Valores Atpicos
El cerebro humano es muy bueno para identificar patrones, pero muy malo para reconocer dispersin aleatoria. El problema de quitar VAs es nuestra tendencia a ver muchos VAs!
Mauricio Carrillo-Tripp Langebio - Cinvestav 16

Valores Atpicos
El cerebro humano es muy bueno para identificar patrones, pero muy malo para reconocer dispersin aleatoria. El problema de quitar VAs es nuestra Todos los puntos provienen de tendencia a ver muchos una Distribucin Gaussiana! VAs!
Mauricio Carrillo-Tripp Langebio - Cinvestav 17

Valores Atpicos: Pruebas para su deteccin


Antes de usar una Prueba de Vas, contestar:

Hubo una equivocacin al capturar datos? Se not algn problema durante el experimento? Los valores extremos pueden ser resultado de variabilidad biolgica? Es posible que la distribucin no sea Gaussiana?
Mauricio Carrillo-Tripp Langebio - Cinvestav 18

Valores Atpicos: Pruebas para su deteccin


Ninguna prueba puede decir si el VA vino de la misma u otra poblacin, pero: Si los datos realmente fueron muestreados de una Distribucin Gaussiana, cul es la probabilidad de encontrar un valor tan lejano a los otros como el observado?

Mauricio Carrillo-Tripp Langebio - Cinvestav

19

Valores Atpicos: Pruebas para su deteccin


Interpretacin. Valor P pequeo: Se concluye que el VA no pertenece a la misma distribucin. Se tiene una justificacin para excluirlo del anlisis. Valor P grande: No hay evidencia de que el valor extremo viene de una distribucin distinta al resto. Esto no demuestra que el VA si viene de la misma distribucin.
Mauricio Carrillo-Tripp Langebio - Cinvestav 20

Referencias
Intuitive Biostatistics: A Nonmathematical Guide to Statistical Thinking Harvey Motulsky Oxford University Press, 2010

Mauricio Carrillo-Tripp Langebio - Cinvestav

21

Вам также может понравиться