Академический Документы
Профессиональный Документы
Культура Документы
Bioestadstica
Repaso
PROBLEMA
En un estudio hecho con 1500 nios escolares de 5to y 6to bsico en la Regin Metropolitana en 2007 (52.1% hombres y 47.9% mujeres, edad promedio 11.3 aos y desviacin estndar 0.8 aos), se encontr que el 39.3% tena obesidad o sobrepeso (17% y 22.3%, respectivamente). Un investigador que ley estos resultados, plantea que, adems de diferencias en su dieta, cantidad de ejercicio fsico o nivel socioeconmico, los nios con sobrepeso u obesidad se diferencian de los normopesos en caractersticas que vienen del nacimiento (quizs en el peso al nacer, su edad gestacional, a lo mejor tuvieron baja estatura al nacer, etc.)
1
Cmo podramos disear un estudio que permita determinar si el investigador est en lo correcto (o equivocado)?
PROSPECTIVO - RETROSPECTIVO
POBLACION - MUESTRA
Un nmero arbitrario de nios. Un nmero creciente de nios hasta completar una cuota predeterminada. El tamao muestral se debe determinar de acuerdo al nivel de precisin que se desea lograr en los resultados.
Cmo podemos asegurarnos que la muestra finalmente escogida es representativa de la poblacin de la cual proviene?
La representatividad es una cualidad de la muestra, por lo que no la podemos medir. Debemos asegurarnos de que la muestra de individuos seleccionados de la poblacin de inters sea aleatoria y de un tamao mnimo adecuado. Ambos aspectos (manejables por el investigador), asegurarn una mayor representatividad.
Variables Nominales
Variables Ordinales
Variables Intervalares
Tipos de Variables
2
Qu descripcin es adecuada para resumir los datos disponibles?
ESTADSTICA DESCRIPTIVA
Estadstica Descriptiva
n, % en cada categora Categrica Grfico de barras o torta
Tipo de Variable
n, promedio, DS Simtrica Sin valores extremos Numrica Asimtrica Con valores extremos n, mediana, rango Histograma Boxplot (cajn con bigotes) Histograma Grfico de promedioDS Grfico de promedioSEM
Estadstica Descriptiva
Si la variable a describir es categrica, un programa estadstico nos puede entregar una tabla de frecuencias.
Clasificacin Nutricional 11-12 aos Frecuencia 35 1058 401 306 1800 Porcentaje 1.9 58.8 22.3 17.0 100.0 Porcentaje acumulado 1.9 60.7 83.0 100.0
Vlidos
Si la muestra es representativa de la poblacin, los porcentajes tabulados estiman las correspondientes cantidades poblacionales.
Estadstica Descriptiva
Los resultados de la variable categrica se pueden presentar grficamente.
Estadstica Descriptiva
Si la variable es numrica, podemos resumir los resultados usando el nmero de casos, una medida de tendencia central y una medida de dispersin. nmero de casos, promedio y desviacin estndar, o nmero de casos, mediana y rango
Estadstica Descriptiva
Si la variable no tiene valores extremos (outliers) y existe simetra
Estadstica Descriptiva
Presentacin grfica de resultados de la variable numrica.
Estadstica Descriptiva
Posibles formas de la distribucin de los datos.
Estadstica Descriptiva
Presentacin grfica de resultados de la variable numrica.
Informe PESO obeso no obeso obeso Total Media 3337.12 3458.37 3357.74 N 1494 306 1800 Desv. tp. 528.759 568.208 537.441 Error tp. de la media 13.680 32.482 12.668
Para mostrar la comparacin de una variable numrica entre dos o ms grupos, se puede hacer un box-plot (cajn con bigotes), un grfico de promedio DS o de promedio SEM.
3
Qu anlisis sera adecuado hacer para verificar la hiptesis del investigador?
ASOCIACIN DE VARIABLES
Asociacin de Variables
Aunque el tipo de variable (categrica o numrica) permite aproximarse a los mtodos estadsticos adecuados, tambin influye la normalidad de las variables, homogeneidad de varianzas, etc.
Y Categrica
Test exacto de Fisher (X e Y con 2 niveles)
Y Numrica
t de Student muestras indep. (X con 2 niveles) Anlisis de la varianza (X con > 2 niveles) Test de rangos de Wilcoxon (X con 2 niveles) Test de Mann-Whitney (X con > 2 niveles)
X Anlisis de la varianza (X con > 2 niveles) Numrica Regresin logstica (Y con 2 niveles)
Anlisis discriminante (Y con > 2 niveles)
Asociacin de Variables
La clasificacin de los mtodos segn variable categrica o numrica es la ms simple de construir. Pero hay otras clasificaciones ms complejas.
Fuente: Swinscow TD. Statistics at Square One 10th Ed. BMJ Books.2002
Asociacin de Variables
Presentacin
Tabla de contingencia para resumir los datos Porcentajes por fila o columna para comparaciones Test chi-cuadrado si el tamao muestral es grande Test exacto de Fisher si el tamao muestral es chico Riesgo relativo (RR). Si el estudio es prospectivo Odds ratio (OR). Si el estudio es retrospectivo
Asociacin
Riesgo
<3000 grs
>=3000 grs
Total
Recuento % de Bajo Peso de Nacimiento % de Estado nutricional Recuento % de Bajo Peso de Nacimiento % de Estado nutricional Recuento % de Bajo Peso de Nacimiento % de Estado nutricional
Pruebas de chi-cuadrado Valor 3.034b 2.770 3.152 gl 1 1 1
Total 372 100.0% 20.7% 1428 100.0% 79.3% 1800 100.0% 100.0%
Generalmente el programa estadstico nos indica si se debe usar test chi-cuadrado o exacto de Fisher.
Chi-cuadrado de Pearson Correccin por a continuidad Razn de verosimilitudes Estadstico exacto de Fisher Asociacin lineal por lineal N de casos vlidos
.046
a. Calculado slo para una tabla de 2x2. b. 0 casillas (.0%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada es 63.24.
<3000 grs
3000-4000 grs
>4000 grs
Total
Recuento % de Peso nacimiento en rangos Recuento % de Peso nacimiento en rangos Recuento % de Peso nacimiento en rangos Recuento % de Peso nacimiento en rangos
Pruebas de chi-cuadrado Valor 14.469a 13.183 10.798 1800 gl 2 2 1 Sig. asinttica (bilateral) .001 .001 .001
Chi-cuadrado de Pearson Razn de verosimilitudes Asociacin lineal por lineal N de casos vlidos
a. 0 casillas (.0%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada es 29.07.
Presentacin
Nmero de casos, promediodesviacin estndar de la numrica para cada nivel de la categrica Nmero de casos, mediana y rango de la numrica para cada nivel de la categrica Test t de Student para muestras independientes si se comparan dos promedios Anlisis de la varianza (ANOVA) en una va si se comparan ms de dos promedios
Asociacin
F Peso nacimiento (grs) Se han asumido varianzas iguales No se han asumido varianzas iguales 3.590
Sig. .058
t -3.607 -3.440
gl 1798 420.089
N <3000 grs 3000-4000 grs >4000 grs Total 372 1257 171 1800
ANOVA zbmi Suma de cuadrados 71.003 5044.184 5115.187 gl 2 1797 1799 Media cuadrtica 35.501 2.807 F 12.647 Sig. .000
(I) Peso nacimiento en rangos <3000 grs 3000-4000 grs >4000 grs
(J) Peso nacimiento en rangos 3000-4000 grs >4000 grs <3000 grs >4000 grs <3000 grs 3000-4000 grs
Diferencia de medias (I-J) Error tpico -.404* .099 -.707* .155 .404* .099 -.304 .137 .707* .155 .304 .137
Test de uso habitual en medicina: Bonferroni. El test ms potente, segn estudios actuales: Test de Benjamini-Hochberg.
Si se ordenan los pesos RN de menor a mayor, el orden (ranking) promedio de los pesos del grupo No Obesos es menor que el del grupo Obesos. Y esta diferencia es estadsticamente significativa (p<0.001).
a Estadsticos de contraste
Presentacin
Asociacin
Correlacin muestral de Pearson (si ambas variables son de origen intervalar) Correlacin por rangos de Spearman (si al menos una de las variables es de origen ordinal)
Correlacin de Pearson Sig. (bilateral) N Correlacin de Pearson Sig. (bilateral) N Correlacin de Pearson Sig. (bilateral) N Correlacin de Pearson Sig. (bilateral) N Correlacin de Pearson Sig. (bilateral) N
Z-Score de IMC
4
Las variables explicatorias se asocian independientemente con el fenmeno? Es posible predecir el fenmeno en estudio?
MODELOS ESTADSTICOS
Regresin Lineal
Cuando el fenmeno bajo estudio (Y) est representado como una variable numrica. Las variables explicatorias (X1, X2, etc.) pueden ser numricas o binarias (dicotmicas con valores 0 o 1).
Y = + 1 x1 + 2 x2 + ... + k xk +
Interesa estimar las pendientes 1, 2, etc., asociadas a cada variable X, para determinar la significancia (importancia) de cada X en el modelo. Interesa estimar tambin el coeficiente de determinacin (R2), para determinar la bondad de ajuste (capacidad predictiva) del modelo ajustado.
Regresin Lineal
Variables asociadas en forma conjunta e independiente con el valor de z-score de IMC a los 11-12 aos.
Coeficientesa Coeficientes no estandarizados B Error tp. 3.897 1.387 .774 .125 -.087 .029 -.071 .033 Coeficientes estandarizad os Beta .247 -.120 -.062
Modelo 1
(Constante) Peso nacimiento (kg) Talla nacimiento (cms) Edad gestacional (semanas)
Capacidad predictiva del modelo medida con el coeficiente de determinacin R2. (R2=2.3%)
Modelo 1
a. Variables predictoras: (Constante), Edad gestacional (semanas), Peso nacimiento (grs), Talla nacimiento (cms)
Regresin Logstica
Se usa cuando el fenmeno bajo estudio (Y) est representado como una variable dicotmica (generalmente con valores 0 o 1). Las variables explicatorias (X1, X2, etc.) pueden ser numricas o binarias.
Y * = + 1 x1 + 2 x2 + ... + k xk +
Interesa estimar las pendientes 1, 2, etc., asociadas a cada variable X, para determinar la significancia (importancia) de cada X en el modelo. Generalmente la bondad de ajuste del modelo logstico se determina mediante curvas ROC.
Regresin Logstica
Adems de la significancia de las variables, la regresin logstica provee un mtodo para estimar OR de cada variable ajustando por las dems variables en el modelo.
Variables en la ecuacin I.C. 95.0% para EXP(B) Inferior Superior 1.952 4.178 .777 .929 .856 1.053
Paso a 1
gl 1 1 1 1
Al estudiar la obesidad a los 11-12 aos como variable dicotmica, podran obtenerse resultados distintos que si se mide como variable numrica (la obesidad es un punto de corte del z-score)