Академический Документы
Профессиональный Документы
Культура Документы
Los pasos que se deben seguir para llevar a cabo una dócima de hipótesis los
provee el método científico:
1
1.1 Hipótesis Estadísticas
Las hipótesis H0 y H1 deben ser exhaustivas (deben cubrir todos los posibles
resultados) y excluyentes (no deben compartir ningún resultado).
Ejemplo. Un investigador sostiene que las mujeres que fuman durante el embarazo
tienen guaguas con menor peso promedio que la media nacional = 3,400 y desviación
estándar = 550. Los pasos a seguir para determinar si el investigador está en lo correcto
o está equivocado se muestran en el esquema siguiente.
2
Las hipótesis estadísticas pueden ser bilaterales o unilaterales. Algunos ejemplos
de hipótesis estadísticas son:
Las hipótesis bilaterales deben su nombre a que se rechaza la hipótesis nula para
valores muy grandes o muy pequeños de x (o pˆ ) . En las hipótesis unilaterales,
en cambio, sólo se rechaza H0 para valores de x (o pˆ ) en un sentido.
Por su estructura, los test de hipótesis se utilizan para encontrar diferencias entre
dos parámetros y para plantear hipótesis unilaterales. Cuando se quiere probar si
dos parámetros son iguales, se utilizan los llamados test de hipótesis de
equivalencia, los cuales no son vistos en este curso.
3
1.2 Posibles situaciones al contrastar los datos con la realidad
Supongamos que las únicas decisiones posibles de tomar, en base a los datos
muestrales, son aceptar que H0 es verdadera o que H1 es verdadera. Pero podría
ocurrir que los datos indiquen, por ejemplo, que H0 es verdadera, cuando en
realidad es falsa, o viceversa.
Luego, al tomar una decisión en base a una muestra se tendrá una de las
siguientes situaciones:
4
Ejemplo: Al comparar PA y PB, el porcentaje de pacientes que mejora con tratamientos A
y B, se plantean las hipótesis H0:PA=PB versus H1:PAPB, entonces:
Nótese que todas las probabilidades anteriores son condicionales. Estas pueden
escribirse como:
P (aceptar H 0 | H 0 es V ) 1 P(rechazar H 0 | H 0 es V )
P (rechazar H 0 | H 0 es F ) 1 P(aceptar H 0 | H 0 es F )
El objetivo del Test de Hipótesis es maximizar las probabilidades 1- y 1-, lo que
a su vez minimiza las probabilidades de error.
5
1.3 Concepto de Valor p
H0: μ ≥ 3400
H1: μ < 3400
Para hacer la dócima es necesario asumir que H0 es verdadera. Para esto, basta con
asumir que μ=3400, ya que éste o cualquier valor superior pertenece a H0. Luego, como el
tamaño muestral es grande, bajo H0 se cumple que:
x ~ N (3400,
2
)
100
El valor p se define como “la probabilidad de encontrar un igual o más extremo que el
obtenido en nuestro experimento, asumiendo que H0 es verdadera”. Es decir:
valor p P( x 2950 | H 0 es V )
Nótese que la condición “H0 es Verdadera” está implícita en la distribución asumida para
x , ya que su media es μ=3400. Al calcular el valor p, se tiene:
6
Esquemáticamente, la relación entre la significancia α y el valor p es la siguiente:
7
2. Test de Hipótesis para una Proporción (test “z”)
Nótese que la distribución de p̂ está centrada en p0, que es el valor que toma P
asumiendo que H0 es verdadera.
8
Ejemplo. En una localidad se determinó el porcentaje de alcoholismo crónico,
encontrándose 98 alcohólicos en 1500 encuestados (6.5% de los casos). Interesa
determinar si esta prevalencia es similar al 5% reportado en población general.
H0: P=0.05
H1: P0.05.
p 0 (1 p 0 ) 0.05(0.95)
pˆ ~ N ( p 0 , ) N (0.05, )
n 1500
Valor-p. Dado que la hipótesis es bilateral, rechazamos H0 para valores muy grandes o
muy pequeños de z0. Luego,
Valor p = P(z < - z0 o z > z0) = 2P(z >|z0|) = 2P(z>2.67) = 2*0.00379 = 0.00758
2100 2230 2420 2820 3000 3050 3080 3140 3180 3220
3280 3310 3330 3370 3410 3410 3460 3480 3500 3520
3610 3730 3840 3920 3970 3990 4100 4120 4200 4220
Interesa determinar si la proporción de niños con peso superior a 4000 es distinto del 10%
reportado en la literatura.
9
3. Test de Hipótesis para un Promedio (test “t”)
Lo cual significa que t0, la estandarización “t”, tiene distribución t de Student con n-
1 grados de libertad. Nótese que se asume que x ~ N ( 0 , 2 n) . Es decir, la
distribución de x está centrada en μ0, ya que se asume que H0 es verdadera.
Luego, siguiendo la misma lógica que en test de hipótesis para una proporción
(página 8), para cada hipótesis planteada el valor p es:
10
Ejemplo. Resolvamos el problema planteado varias veces antes: determinar si el peso de
nacimiento de niños de mujeres fumadoras es menor que la media nacional de 3400
gramos.
H0: μ ≥ 3400
H1: μ < 3400
Muestra Aleatoria. En una muestra aleatoria de 100 niños recién nacidos de madres
fumadoras se obtuvo: x 2950 grs. y s 550 grs. Asumiendo que H0 es verdadera
(μ=3400 gramos) y que x tiene distribución Normal (TCL), se tiene:
2950 3400
X ~ N (3400,
2
) t0 8.18 ~ t(99 )
100 550
100
Valor-p. Dado que la hipótesis es unilateral, rechazamos H0 para valores muy pequeños
de t0. Luego,
2100 2230 2420 2820 3000 3050 3080 3140 3180 3220
3280 3310 3330 3370 3410 3410 3460 3480 3500 3520
3610 3730 3840 3920 3970 3990 4100 4120 4200 4220
(Nota: para los 30 casos descritos, el peso de nacimiento promedio muestral fue
x 3400 grs. con una desviación estándar s 540 grs. )
11
4. Introducción a la Asociación de Variables
Se dice que entre dos variables aleatorias existe asociación si éstas no son
independientes. La determinación de si existe o no asociación se realiza
mediante test de hipótesis.
Desde el punto de vista probabilístico. Si definimos los sucesos A=”El paciente toma el
medicamento A”, B=” El paciente toma el medicamento B” y C=” El paciente controla su
presión arterial”, se observa que:
63 62
P (C ) 0.417
300
P (C | A) 0.42 P (C ) y P (C | B ) 0.413 P (C )
Es decir, la probabilidad de que el paciente controle su presión arterial dado que tomó el
medicamento A, que es P(C |A), es 0.42, es igual a la probabilidad de que el paciente
controle su presión arterial P(C). Lo mismo ocurre con P(C | B) = P(B). Luego, el control
de la presión arterial es independiente del medicamento administrado.
H0: PA = PB
H1: PA ≠ PB
La dócima requiere fijar un nivel de significancia (por ejemplo, α=5%) y hacer el test
usando los resultados muestrales n A 150, pˆ A 0.42 y n B 150, pˆ B 0.413 . El
resultado de esta dócima será que no hay diferencias significativas entre PA y PB.
12
4.1 Variable Explicada y Explicatoria
Por otra parte, la búsqueda de una explicación para el fenómeno se hace a través
de un conjunto de variables que podrían estar asociadas al problema. Estas son
llamadas variables explicatorias, independientes o factores. Se usa la letra X
para identificar una variable explicatoria, o las letras X1, X2, …, Xk para identificar
un conjunto de k posibles variables explicatorias del fenómeno en estudio.
La planilla tiene el formato necesario para ser utilizada como base de datos: cada
columna representa una variable aleatoria en estudio y cada fila representa un individuo.
13
4.2 Camino metodológico según el tipo de variable
Problema X Y
Interesa determinar si la pertenencia a un grupo étnico se Grupo étnico Cálculos
asocia con la presencia de cálculos vesiculares. (categórica) (categórica)
Se quiere saber si la presencia o ausencia de hipertensión HTA Ganancia peso
arterial influye sobre la ganancia de peso durante el embarazo (categórica) (numérica)
(en kilos).
Se quiere saber si el valor de un score de gravedad (que varía Score gravedad Mortalidad
entre 0 y 100 puntos, con un mayor puntaje indicando mayor (numérica) (categórica)
gravedad) es predictor de mortalidad cardiaca.
Se quiere determinar si el peso del recién nacido (en gramos) Edad materna Peso RN
está asociado con la edad de la madre (en años). (numérica) (numérica)
De esta forma, la variable explicada y cada una de las explicatorias pueden ser
clasificadas como categórica o numérica. En la asociación de ambas se tiene sólo
una de las siguientes alternativas:
14
5. Asociación Categórica – Categórica
Cuando las variables X e Y son ambas categóricas, con 2 o más niveles cada una,
se puede construir una tabla de contingencia para resumir el resultado conjunto
de las variables.
1
Para una descripción de los tipos de estudio mencionados, vea el anexo “Estudios Transversales,
Prospectivos y Retrospectivos” al final de este apunte.
15
Las figuras siguientes muestran los porcentajes que interesa calcular (y comparar)
en estudios de cohorte y caso – control.
16
5.1 Dócima de Hipótesis: Test Chi-cuadrado y Exacto de Fisher
H0: P1 = P2
H1: P1 ≠ P2
n(ad bc) 2
2
0 ~ (21)
(a c)(b d )(a b)(c d )
Dado que la tabla es de 2x2, el estadístico χ20 tiene distribución chi-cuadrado con
1 grado de libertad (ver propiedades de la distribución en página siguiente).
En general, si una tabla tiene I filas y J columnas, entonces χ20 tiene distribución
Chi-cuadrado con (I-1)x(J-1) grados de libertad.
17
Distribución Chi-cuadrado
(Oi Ei ) 2
2
0 ~ (2I 1)( J 1)
celdas Ei
18
Ejemplo de uso de la tabla. Supongamos que en una tabla de contingencia de
dimensión 3x4 (una tabla con 3 filas y 4 columnas), al calcular el valor del test chi-
2
cuadrado se obtiene χ 0 = 15.3.
Como la tabla tiene I=3 filas y J=4 columnas, los grados de libertad son (I-1)x(J-1)=2x3=6.
2
Como la hipótesis nula H0:No hay asociación, se rechaza para valores grandes de χ 0, el
valor p es: p = P(χ2(I-1)x(J-1) > χ20) = P(χ2(6) > 15.3).
Como el valor 15.3 está más a la derecha que 14.4, se deduce que P(χ2(6) > 15.3) < 0.025.
Como el valor p es menor que 0.025, se rechaza la hipótesis H0.
19
Ejemplo: Interesa determinar si hay diferencias en el porcentaje de personas con
depresión entre dos poblaciones A y B. Para esto, se tomó una muestra de 150 personas
de la población A y 200 de la población B, encontrándose 48 y 50 personas con
depresión, respectivamente. La tabla siguiente resume los resultados:
Depresión
Si No Total
A a=48 b=102 a+b=150
Población B c=50 d=150 c+d=200
Total a+c=98 b+d=252 n=350
48 50
Luego, de la tabla se tiene: pˆ A 0.32 (32%) y pˆ B 0.25 (25%)
150 200
El test es:
n(ad bc) 2 350 (48 150 50 102) 2
02 2.08
(a c)(b d )(a b)(c d ) 98 252 150 200
Valor-p: Se rechaza H0 para valores grandes de χ20. Luego, el valor p está dado por:
Dado que el valor p es mayor que α=5%, se concluye que no hay suficiente evidencia en
los datos para rechazar H0.
Ejemplo. Usando los datos en la tabla previa, calculemos χ20 mediante la fórmula general.
Para esto, tenemos que usar los valores observados y esperados en cada celda.
O1 48 O2 102 O3 50 O4 150
Los valores esperados en las celdas a, b, c y d, respectivamente, son:
El valor calculado χ20 es el mismo usando esta fórmula y la fórmula reducida (dada en
página 17). La diferencia es que en tablas de 2x2 es más fácil usar la fórmula reducida,
pero si la tabla es de dimensión mayor a 2x2, sólo se puede calcular χ20 a través de la
diferencia entre valores observados y esperados.
20
5.2 Caso especial en tablas de 2x2: Riesgo Relativo (RR) y Razón de
Chances (Odds ratio, OR)
Una limitación de los test Chi-cuadrado y Fisher es que estos sólo indican si existe
asociación entre X e Y (o diferencia entre dos proporciones p1 y p2), pero no
permiten cuantificar el grado de asociación.
Enfermedad
Si No Total
Si a b a+b = n1
Exposición
No c d c+d = n2
Total a+c = m1 b+d = m2 n
21
Generalmente el estimador del riesgo se presenta junto a un intervalo de
confianza. Se puede demostrar que un intervalo de confianza 1-α para RR está
dado por la siguiente expresión:
Count
Estado a 30 días
Muerto Vivo Total
Compromiso de Si 27 84 111
conciencia al
examen fisico No 18 312 330
Total 45 396 441
De la tabla se tiene:
27 / 111
RR 4.46
18 / 330
Luego, el riesgo de morir es 4.46 veces más alto entre los pacientes que presentan
compromiso de conciencia al ingreso.
Un intervalo de confianza de 95% para RR es (2.6, 7.8). Es decir, con confianza 95% el
riesgo de morir cuando hay compromiso de conciencia varía entre 2.6 y 7.8 veces más
que cuando no hay compromiso de conciencia.
22
Odds Ratio (Razón de Chances)
ORˆ
a /(a c)/c /(a c) ad
b /(b d ) /d /(b d ) bc
Una observación importante es que si el OR se calculara en forma prospectiva, se
tendría:
pˆ 1
ORˆ
(1 pˆ 1 )
a /(a b) d /(c d ) ad
pˆ 2 c /(c d ) b /(a b) bc
(1 pˆ 2 )
Es decir, el OR calculado en forma retrospectiva es el mismo que al calcularlo en
forma prospectiva. Esta relación es muy útil en estudios caso – control, ya que nos
provee de una estimación del riesgo relativo en estudios retrospectivos.
Al igual que en el caso del RR, el Odds Ratio se presenta habitualmente con un
intervalo de confianza (1-α). Se puede demostrar que este intervalo es de la forma:
ln(ORˆ ) z1 / 2 1 1 1 1
n ( ORˆ ) z1 / 2
1 1 1 1
e a b c d
,e a b c d
23
La interpretación de un OR es similar a la interpretación de un RR:
Aunque en estricto rigor el OR estima cuántas veces más chance hay de tener el
factor de exposición en los casos respecto a los controles, éste se interpreta
generalmente como cuántas veces más chance hay de enfermar en el grupo
expuesto respecto al grupo no expuesto. Esto es posible gracias a que el cálculo
del OR no cambia al hacerlo en forma prospectiva o retrospectiva.
1 1 1 1 1 1 1 1
ln( 0.53 ) 1.96 ln( 0.53) 1.96
(e 78 106 102 74
,e 78 106 102 74
) (0.35 , 0.81)
En este caso, el OR es 1.87, con un intervalo de confianza de 95% igual a (1.23, 2.85),
que muestran que el no consumo de leche es factor de riesgo de fractura de cadera.
24
5.3 Caso especial en tablas de 2x2: Concordancia y Discordancia
La metodología descrita hasta ahora nos permite saber si existe asociación entre
dos variables dicotómicas (chi-cuadrado, test exacto de Fisher) y determinar el
grado de asociación (OR, RR).
Sin embargo, hay muchas situaciones en que las variables están correlacionadas
por construcción. Es decir, se espera que exista asociación entre ellas porque
fueron diseñadas para ello.
Ejemplo. Un cuestionario sobre consumo de alimentos fue administrado por correo a 537
enfermeras en Estados Unidos en dos ocasiones separadas por varios meses. El
cuestionario consultaba por el consumo de más de 100 alimentos diferentes. La tabla
siguiente muestra la cantidad de carne de vacuno consumida en los dos tiempos.
Encuesta-2
En este caso tampoco interesa determinar si existe asociación entre los observadores,
sino si son concordantes o discordantes.
25
Para determinar la concordancia o discordancia entre los resultados de ambas
encuestas, se puede utilizar el Test Kappa (que se centra en la concordancia de
las dos variables) y Test de McNemar (que se centra en las discordancias).
El Test Kappa.
Aunque se pueden docimar las hipótesis H0: Қ=0 versus H1: Қ≠0, nótese que H0
se rechazaría cuando Қ sea muy negativo o muy positivo. Si se rechaza H0 y Қ es
negativo, basta con cambiar el “criterio” de clasificación de uno de los
observadores para tener un valor Қ positivo. Luego, es habitual que este cambio
se haga antes de hacer el test, de modo que las hipótesis de interés sean:
H0: Қ≤0
H1: Қ>0
p0 p e
El valor de Қ está dado por
1 pe
Donde p0 es la proporción de concordancias observadas y pe es la proporción de
concordancias esperadas asumiendo que las respuestas de los dos observadores
son independientes. El cálculo de pe sigue el mismo camino que el cálculo de Ei en
el test Chi-cuadrado.
1 c
se ( )
n (1 pe )
2
p e p 2
e
i 1
ai bi ( ai bi )
26
Independiente de su significancia estadística, el valor de Kappa en ocasiones es
evaluado de la siguiente forma:
Ejemplo. Calculemos el valor de Қ para los datos sobre consumo de alimentos (página
25). Las concordancias entre ambas encuestas son 136 y 240 (en la diagonal principal de
la tabla). Luego, la concordancia observada es:
136 240
p0 0 .7
537
Por otra parte, para calcular la concordancia esperada se requiere calcular primero el
número esperado de concordancias (como el producto de los 2 márgenes de la tabla
dividido por el total de casos tabulados). Los valores esperados para las 2 celdas de la
diagonal principal son:
87 191
pe 0.518
537
Luego,
0.378
Luego, el valor de z0 está dado por z 0 8.8 .
se( ) 0.043
El valor p es P(z>8.8) < 0.001. Se rechaza H0 y se concluye que hay concordancia entre
las dos encuestas. Sin embargo, aún cuando Қ es significativamente distinto de cero, el
grado de concordancia es más bien bajo (Қ <0.4).
27
El Test de McNemar
Luego, las hipótesis previas las podemos escribir como: H0:p=½ versus H1:p½.
2
n A n B 1
2
MN
n A n B
El estadístico 2MN ~ 2(1).
Nótese que si H0 es verdadera, entonces p=½ y por lo tanto debiera cumplirse que
nA ≈ nB (las discordancias se distribuyen uniformemente). Luego, en el numerador
de χ2MN debiera ocurrir que |nA - nB| ≈ 0. En consecuencia, se rechaza H0:p=½
para valores grandes de 2MN.
Ejemplo. Usando los datos sobre consumo de alimentos (página 25), las discordancias
son: nA=92 y nB=69. Luego, el test de McNemar es
92 69 1 2
2
3.01 ~ (21)
92 69
MN
28
5.4 Caso especial en tablas de 2x2: Sensibilidad y Especificidad
29
En general, la sensibilidad y especificidad se obtienen de una tabla de 2x2 en la
que se clasifica el verdadero estado del paciente (como columnas) y el test
diagnóstico (como filas). La tabla resultante tendrá la siguiente forma:
Enfermedad
Presente Ausente
a b
Positiva Verdaderos Positivos Falsos Positivos
Prueba o
(VP) (FP)
Test
c d
Diagnóstico
Negativa Falsos Negativos Verdaderos Negativos
(FN) (VN)
Cocaína en la Muestra
Presente Ausente Total
Prueba de Cocaína (+) 150 8 158
Laboratorio Cocaína (-) 266 785 1051
Total 416 793 1209
30
La elección de un test diagnóstico depende de la gravedad de la enfermedad. Si la
enfermedad es grave, se prefiere un test que tenga alta sensibilidad (o sea, una alta
probabilidad de detectar un enfermo). En cambio, si la enfermedad no es grave, se
prefiere un test que sea más específico (o sea, una alta probabilidad de detectar un sano).
a VP
VP
a b VP FP
d VN
VP
c d VN FN
31
Ejemplo. Los valores predictivos positivo y negativo en la detección de cocaína por parte
de los laboratorios son:
Pero, ¿qué habría ocurrido si el CDC hubiese enviado un número 10 veces mayor de
muestras sin cocaína a los laboratorios? En ese caso, y suponiendo que la sensibilidad y
especificidad se mantienen, la tabla habría sido la siguiente:
Cocaína en la Muestra
Presente Ausente Total
Prueba de Cocaína (+) 150 80 230
Laboratorio Cocaína (-) 266 7850 8116
Total 416 7930 8346
Este ejemplo muestra que cuando se quiere validar el test construido, se clasifica primero
a los pacientes según el test diagnóstico (como “positivo” o “negativo”) y se determina
posteriormente el verdadero estado de los pacientes. Este procedimiento “prospectivo” es
el que permite estimar los valores predictivos positivo y negativo.
Ejemplo (VP+ y VP- por “Método de la Abuelita”). Un nuevo test diagnóstico para cierta
enfermedad tiene sensibilidad 80% y especificidad 50%. Si la prevalencia de la
enfermedad es 5%, ¿Cuál es el valor predictivo positivo y negativo del nuevo test?
Enfermedad
Presente Ausente Total
(+) 40 475 515
Test
(-) 10 475 485
Total 50 950 1000
De la tabla se obtiene VP+ = 40/515=7.8% y VP- =475/485= 97.9%. Esto muestra que,
cuando el test resulta negativo, virtualmente descarta la enfermedad. Sin embargo,
cuando resulta positivo, sólo en el 7.8% de los casos la enfermedad está presente.
En general, los procedimientos con sensibilidad elevada son útiles para descartar una
enfermedad en pacientes cuya probabilidad a proiri de tenerla sea baja (o sea, cuando la
prevalencia es baja).
32
Análisis de Pruebas Diagnósticas Numéricas.
En este punto surgen 2 preguntas respecto al test numérico: ¿Qué tan buen
predictor es este test diagnóstico para la enfermedad? ¿Cuál es el punto de corte
en la variable que arroja la mayor sensibilidad y especificidad?
Sin infección: 735.3, 658.92, 566.6, 844.49, 467.29, 1056.32, 416.55, 738.7, 954.02, 7.49, 564.82,
634.88, 688.12, 874.44, 483.9, 33.95, 684.81, 594.97
Con infección: 1696.21, 1115.21, 1093.48, 922.06, 917.09, 908.84, 700.59, 895.31, 787.9,
1799.1, 959.8, 584.2, 1013.03, 876.68, 340.33, 732.31, 897.43, 1020.87, 1442.85, 1095.81, 1217.8
Infección
Presente Ausente Total
>800 16 4 20
Test
≤800 5 14 19
Total 21 18 39
33
Si se repite el proceso de cálculo de la sensibilidad y especificidad para todos los valores
del score, se tiene la tabla siguiente. Al graficar la sensibilidad versus 1-especificidad (en
escala de 0 a 1) se obtiene la curva ROC.
Nótese que el área máxima que puede cubrir una curva ROC es 1. Este valor sólo se
puede obtener si existiera un punto de corte “perfecto” en el test diagnóstico (un valor que
arrojara sensibilidad y especificidad iguales a 1).
La línea diagonal (en verde) acumula un área bajo la curva igual a 0.5. Si una variable
tiene área 0.5, significa que no es mejor que el azar para hacer la clasificación de los
pacientes (por ejemplo, no es mejor que clasificarlos lanzando una moneda al aire).
Luego, la hipótesis de interés es:
Usando un programa estadístico se puede obtener el área bajo la curva ROC y el error
estándar del área. En el ejemplo, el área es 0.847 con un error estándar igual a 0.064.
Luego, con p<0.001 se rechaza la hipótesis nula y se concluye que usar el score es mejor
que el azar para determinar infección.
Nótese que si el área bajo la curva ROC es menor que 0.5, basta con cambiar el criterio
de clasificación para tener un área mayor que 0.5.
Finalmente, de la tabla con todos los puntos de corte se observa que el valor 874.44 del
score es el que arroja la mayor sensibilidad y especificidad (S = 76.2% y E = 88.9%). Sin
embargo, se debe tener en cuenta que elegir el punto de corte de modo que el test tenga
la más alta sensibilidad y especificidad, implica que se le da la misma importancia a los
falsos positivos (clasificar un sano como enfermo) y falsos negativos (clasificar un
enfermo como sano).
34
6. Asociación Categórica – Numérica
Ejemplo. Interesa determinar si existe asociación entre la edad del paciente (en años) y la
presencia de cálculos vesiculares (codificado como 0=No y 1=Si), para un total de 965
personas.
35
Para determinar si existe asociación entre X e Y se comparan los promedios de
la variable numérica entre los niveles de la variable categórica. Como se muestra
en los ejemplos en página previa, el número de promedios a comparar depende
del número de niveles de la variable categórica.
36
6.1 Supuestos del test t de Student para muestras independientes y ANOVA
Nótese que, aunque las presiones arteriales son independientes al interior de cada
tiempo, no son independientes entre tiempos, ya que se trata de las mismas personas
medidas en 3 tiempos.
37
Ejemplo (uso de t de Student para muestras independientes). En el ejemplo de
asociación Litiasis – Edad (página 35), no hay inconveniente en usar test t de Student
para muestras independientes, ya que los promedios muestrales tienen distribución
Normal por TCL.
La última línea de la salida de MINITAB muestra el valor p (P-Value = 0.000). Luego, con
p<0.001 se rechaza la hipótesis de igualdad de medias. Se concluye que la edad
promedio de los litiásicos (45.8±13.9) es significativamente mayor que la edad promedio
de los no litiásicos (36.1±13.0). Equivalentemente, existe asociación entre edad y litiasis.
Nótese que, aunque se concluye que los promedios son distintos, con esta comparación
no se puede concluir que el grupo con tratamiento sea mejor para disminuir la presión
arterial que los otros grupos, ya que no sabemos cuál que la presión arterial inicial de
estos pacientes.
Un diseño adecuado debiera comparar los promedios de las diferencias de presión arterial
inicial – final entre los 3 grupos. Nótese que mientras más positivo sea el delta promedio,
indica una mayor disminución de la presión arterial. Luego, un delta promedio
significativamente mayor en el grupo tratado en comparación con el resto sería indicador
de un mayor efecto del tratamiento.
38
6.2. Test de Hipótesis para dos promedios
(x A xB )
t0 ~ t (n A n B 2)
s A2 s B2
n A nB
Siguiendo la misma lógica del test para una proporción (página 8) o para un
promedio (página 10), para cada hipótesis planteada el valor p es:
39
Ejemplo: Se calculó la disminución de peso (en kilos) de 18 pacientes sometidos a dos
tratamientos para la obesidad: 10 pacientes con tratamiento A y 8 con tratamiento B. Los
datos están expresados como
Dado que se rechaza para valores grandes de t0 (que es consistente con H1:μ A>μB), el
valor p es P(t(16) > 1.41)=1- P(t(16) < 1.41) > 0.05. No hay evidencia suficiente en los datos
para rechazar H0. Por lo tanto, el tratamiento A no es más efectivo que el B.
Nótese que x A 3.33 es bastante mayor que x B 0.61 y sin embargo no hay diferencias
significativas entre los promedios. Esto se debe a que las varianzas son muy grandes
( s A2 4.26 2 y s B2 3.89 2 ) y los tamaños muestrales son muy pequeños ( n A 10 y
n B 8 ), lo que hace que los errores estándar sean muy grandes.
40
6.3 Análisis de datos pareados (o medidas repetidas).
Ejemplo. La tabla siguiente muestra el conteo de células T-CD4 (x mm3) en una muestra
aleatoria de 20 pacientes con diagnóstico primario de VIH. El valor basal corresponde al
conteo de células T antes de iniciar un tratamiento con terapia antiretroviral (TAR) y los
controles 1 al 4 corresponde al conteo en 4 controles sucesivos, separados
aproximadamente por 6 meses entre sí.
El gráfico muestra cómo evoluciona el conteo de células T CD4 entre los controles en esta
muestra. Interesa determinar si existe un aumento significativo en el conteo de células T
CD4 en el tiempo.
Nótese que se trata de la asociación de una variable numérica (CD4) y una categórica
(tiempo, con 5 niveles). Aunque el valor de CD4 de un paciente es independiente del valor
que toma en los otros pacientes, no hay independencia entre tiempos, ya que se trata de
los mismos pacientes.
41
Como en el caso de datos independientes (página 36), el test a utilizar depende
del número de condiciones experimentales o tiempos en que se mide la variable
numérica.
Dado que cada individuo tiene dos valores, las hipótesis se pueden plantear en
términos del promedio de diferencias entre los tiempos. Es decir, si y1i e y2i son
los valores en tiempo 1 y 2 del individuo i-ésimo, entonces para cada sujeto se
puede calcular di=y1i - y2i. Nótese que si no hay diferencias entre los tiempos,
entonces se espera que el promedio de las diferencias sea igual a cero.
Nótese que estas hipótesis son un caso particular de las planteadas en Test de
Hipótesis para un Promedio, con μ0=0 (ver páginas 10 y 11).
42
Ejemplo. Interesa comparar el peso promedio entre dos tiempos: al inicio y al final de un
tratamiento para la obesidad. Los datos disponibles son los siguientes:
Para cada paciente se calcula la diferencia entre el peso inicial y el peso final. En este
caso los deltas son: 6, 4, 6, 11, 0, 1, -1, 5, 11, -2. En este esquema, plantear que no hay
diferencias entre los valores PRE y POST equivale a plantear que el delta promedio es
igual a cero. Si llamamos μ al delta promedio poblacional, entonces las hipótesis son:
H0 : 0
H1 : 0
Dado que la hipótesis es bilateral, se rechaza para valores muy grandes o muy pequeños
de t0. Luego, el valor p es P(t(n-1) <-t0 o t(n-1)> t0 ) = 2*P(t(n-1) |t0|) = 2*P(t(9) 2.8) < 0.01. Se
concluye que existen diferencias significativas entre el peso PRE y POST. Luego, como la
diferencia promedio es positiva, se concluye que el tratamiento es efectivo.
Ejemplo. Para los datos de conteo de células T-CD4 (x mm3) en pacientes con
diagnóstico primario de VIH, se utiliza ANOVA para medidas repetidas, ya que esta
variable se mide en 5 tiempos. La hipótesis de interés es:
43
6.4 Transformaciones y Test no paramétricos
Transformaciones
Si X es una variable aleatoria numérica no normal, una transformación de X podría
lograr el efecto de simetrizar los datos, de modo que podríamos utilizar los test
paramétricos estudiados sobre los datos transformados. Las conclusiones que
obtengamos para los test de hipótesis planteadas con los datos transformados
serán válidas para los datos originales.
44
Test no paramétricos
Cuando se asume normalidad, en el fondo se está asumiendo que se conoce la
forma de la distribución de los datos, la cual esta basada en parámetros (como la
media μ y la varianza σ2 de la distribución Normal). Por este motivo, estas
distribuciones se llaman paramétricas, y los test basados en estas distribuciones
se denominan test paramétricos.
Dado que en este curso el énfasis está puesto en los test paramétricos, sólo se
mencionan a continuación cuáles son los test no paramétricos equivalentes a los
test paramétricos estudiados.
45
7. Asociación Numérica – Numérica
Ejemplo. Interesa determinar si existe asociación el peso (en kilos) y el nivel de colesterol
total en una muestra de 965 personas, constituida por individuos litiásicos y no litiásicos.
46
Los gráficos superiores (gráficos 1 y 2) muestran asociaciones lineales directa e
inversa, respectivamente. Estas tendencias debieran ser detectadas por el
coeficiente de correlación.
H0 : 0
H1 : 0
r
( x x)( y y)
i i
_ _
( x x) ( y y )
i
2
i
2
47
Ejemplo: Interesa determinar si hay asociación
lineal entre el porcentaje de personas que lee
(literacy) y mortalidad infantil (por cada 1000
nacidos vivos) para una muestra de 25 países
(datos 1995).
El estadígrafo z0 es:
1 1 0.931
ln( )
z0 2 1 0.931 7.81 ~ N (0,1)
1
(25 3)
X es un mal predictor de Y
X es un pobre predictor de Y
X es un buen predictor de Y
X es un excelente predictor de Y
48
ANEXO
Estudios Transversales, Prospectivos y Retrospectivos
Estudio Transversal
En este caso se podría hacer una tabla de contingencia para determinar, por ejemplo, la
asociación de sedentarismo y obesidad. Sin embargo, no nos permitiría concluir que el
sedentarismo produce la obesidad, ya que no se sabe cuál de los dos factores ocurrió
primero (¿podría ser que debido a la obesidad una persona se puso sedentaria?).
49
Características de un Estudio Retrospectivo (Caso – Control)
El margen fijo en la tabla previa corresponde a las columnas a+c y b+d. Por lo
tanto, los porcentajes de interés se calculan usando estos denominadores.
Infarto al Miocardio
Si No Total
Uso de Si 105 120 225
ACO No 75 130 205
Total 180 250 430
Los porcentajes de interés en este caso son el porcentaje de uso de ACO en los casos (el
grupo con infarto) y en los controles (el grupo sin infarto).
50
Características de un Estudio Prospectivo
El margen fijo en esta tabla son las filas a+b y c+d. Por lo tanto, los porcentajes de
interés se calculan usando estos denominadores.
Se debe tener certeza de que la enfermedad está ausente al inicio del estudio. Por
otra parte, es necesario considerar posibles pérdidas de seguimiento (sujetos que
no vuelven a control, cambian su condición de expuesto o no expuesto, mueren,
etc.). Los no expuestos deben ser representativos de la población de donde
provienen los expuestos. Como en estudios Caso – Control, estos grupos deben
entenderse como representativos de la misma población.
Los porcentajes de interés en este caso son el porcentaje de IAM en los expuestos (el
grupo con ACO) y en los no expuestos (el grupo sin ACO).
Nótese que al inicio del estudio es necesario verificar que ninguna de las 15000 personas
seleccionadas haya tenido un infarto al miocardio.
51
Ventajas de los Estudios Caso – Control y Cohorte
52