Вы находитесь на странице: 1из 70

CONTRASTE

DE HIPÓTESIS
Prueba basada en dos muestras

Profesora Mariana Díaz


1
Repaso:
Nivel de significación / Valor p
Significancia de una prueba estadística
Esquema gráfico según hipótesis alternativa
Tipos de error: I y II
Contraste basado en dos muestras
Contraste para muestras dependientes
Contraste para muestras independientes

2
Nivel de significación

El punto crítico (umbral) es el nivel de


significación, convencionalmente α=0,05

Significancia observada o valor p

3
Valor p p-valor
valor de p consignado
Significancia observada
en inglés p-value
• Se rechaza la hipótesis nula si el valor de p asociado al resultado
observado es igual o menor que el nivel de significación establecido
(convencionalmente 0,05)
• Es decir, el valor p nos muestra la probabilidad de haber obtenido el
resultado que hemos obtenido si suponemos que la hipótesis nula es
cierta.
• Conclusiones científicas y decisiones de gestión no se deben basar
únicamente en valor de p  siempre aplicar criterio: técnico,
económico, social, o de sustentabilidad en el uso de recursos, por
ejemplo.
• Además se recuerda que el área de investigación es BIOLOGÍA
4
Significancia, p-valor y criterio de rechazo
 Sobre α  Sobre p-valor
 Es un número pequeño  Esconocido tras realizar el
preelegido al diseñar el experimento
experimento
 Conocidoel p-valor sabemos
 Conocido α sabemos todo todo sobre el resultado del
sobre la región de aceptación experimento
y región(es) de rechazo

 Sobre el criterio de rechazo


La prueba es significativa si el p-valor es menor que α

5
Esquema gráfico
Región de Rechazo de H0 para un α dado (RRα)
Región de Aceptación de H0 para un α dado (RAα)

Región Crítica o de Región Crítica o de


Rechazo de H0 = RRα Rechazo de H0 = RRα

Región de Aceptación de
H0 = RAα

Nótese que siempre la conclusión es con respecto a la hipótesis


nula: ésta se acepta o se rechaza
6
7
Tipos de error al tomar una decisión

8
Resumen
Tipos de error al contrastar hipótesis
Realidad
H0 cierta H0 Falsa
Decisión
Acepto H0
Error de tipo II
Acierto El tratamiento si tiene efecto pero
El tratamiento no tiene no lo percibimos.
efecto y así se decide.
Probabilidad β
Rechazo H0
Error de tipo I
Acierto
∴ El tratamiento no tiene
efecto pero se decide que sí. El tratamiento tiene efecto y el
Acepto H1 experimento lo confirma.
Probabilidad α
9
Errores de Tipo I y Tipo II, Potencia
Error Tipo I: Se considera importante. Corresponde a α
α = P (rechazar H0│cuando es correcta)

Error de Tipo II: Su Probabilidad es igual a β


β= P (No rechazar H0│ cuando es falsa)

Potencia: Probabilidad de rechazar Ho dada Ho falsa


Potencia () =1- β
 = 1-Probabilidad de error de Tipo II

10
Resumen: Tipos de error al contrastar hipótesis
Realidad
Decisión
H0 cierta H0 Falsa

Acepto Error de tipo II


H0
ACIERTO 𝑷 𝒏𝒐 𝒓𝒆𝒄𝒉𝒂𝒛𝒂𝒓 𝑯𝟎 ห𝑯𝟎 𝒇𝒂𝒍𝒔𝒂 = 𝜷
𝑷 𝒏𝒐 𝒓𝒆𝒄𝒉𝒂𝒛𝒂𝒓 𝑯𝟎 ห𝑯𝟎 𝒄𝒊𝒆𝒓𝒕𝒂 = 𝟏 − 𝜶
Probabilidad β

Error de tipo I ACIERTO


Rechazo 𝑷 𝑹𝒆𝒄𝒉𝒂𝒛𝒂𝒓 𝑯𝟎 ห𝑯𝟎 𝒄𝒊𝒆𝒓𝒕𝒂 = 𝜶 𝑷 𝑹𝒆𝒄𝒉𝒂𝒛𝒂𝒓 𝑯 ห𝑯 𝒇𝒂𝒍𝒔𝒂 = 𝟏 − 𝜷
𝟎 𝟎
H0 Nivel de significancia
Probabilidad α
Potencia
Los errores de Tipo I y Tipo II no se pueden
cometer simultáneamente
α solo puede darse si H0 es Correcta

β solo puede darse de H0 es Incorrecta

 Si la probabilidad de Error Tipo I, α ↑, entonces la probabilidad del


error Tipo II , β ↓, y viceversa

12
Los errores de Tipo I y Tipo II no se pueden
cometer simultáneamente
 Si todo lo demás no cambia
◦ β ↑ cuando la diferencia entre el valor supuesto para el
parámetro y su valor real ↓
◦ β ↑ Cuando α ↓
◦ β ↑ Cuando la variabilidad de la población (σ2)↑
◦ β ↑ Cuando el tamaño muestral (n) ↓

13
NO SE PUEDE TENER TODO…

• Para un tamaño muestral fijo, no


se pueden reducir a la vez ambos
tipos de error.

• Para reducir b, hay que aumentar


el tamaño muestral.

14
Uso del concepto de potencia
 En la planificación de un
experimento, se debe considerar el
tamaño muestral (o el número de
repeticiones) para tener una alta
chance de detectar una diferencia
dada entre la media verdadera y la
postulada en la hipótesis nula

15
Inferencia Estadística

Estimación de Contraste de
Parámetros hipótesis

Basada en
Puntual
una muestra

Por intervalos Basada en


de confianza dos muestras

16
17
Contraste de hipótesis para dos muestras

Se desea comparar dos muestras provenientes de dos


poblaciones:
m1={X11, X21,…, Xn1}
m2={X12, X22,…, Xn2}

El objetivo de la inferencia se puede definir como:


Estimación de la diferencia entre las medias de las
poblaciones (1-2) de las cuales proceden las muestras
18
Contraste de hipótesis para dos muestras

19
Muestras
Dependientes vs Independientes
Cuando se contrastan dos muestras, el tipo de prueba dependerá
si las muestras son dependientes o independientes.
• Lasmuestras primeras son mediciones pareadas o aparejadas
de un conjunto de elementos.
Dependiente es cuando los valores de una muestra afectan los valores de
la otra muestra
• Lasmuestras independientes son mediciones realizadas en dos
conjuntos diferentes de elementos.
Si los valores de una muestra no revelan información sobre los valores de
la otra muestra son independientes.

20
Ejemplo: Recolección de muestras en cada caso
• Un laboratorio farmacéutico que desea probar la efectividad de un
nuevo fármaco en la reducción de la presión sanguínea. Se podría
recolectar los datos de dos maneras:

1. Tomando muestras de la presión sanguínea de las mismas


personas antes y después de administrarles una dosis.
dependientes porque se toman de las mismas personas.

Es probable que las personas con la presión sanguínea más alta en la
primera muestra, también tengan la presión sanguínea más alta en la
segunda muestra.

21
Ejemplo: Recolección de muestras en cada caso
• Un laboratorio farmacéutico que desea probar la efectividad de un
nuevo fármaco en la reducción de la presión sanguínea. Se podría
recolectar los datos de dos maneras:
2. Otra manera sería administrar a un grupo de personas un
medicamento activo y a otro grupo de personas un placebo inactivo,
para luego compararlos
Estas dos muestras son independientes, porque las mediciones
corresponden a personas diferentes.
Pues, Saber algo sobre la distribución de los valores de la primera
muestra no le indica nada con respecto a la distribución de los valores
de la segunda.
22
Inferencia basada en dos muestras

El estadístico a usar en el contraste de medias dependerá de:


1. La naturaleza de las muestras: si son dependientes o
independientes
2. Si se conocen las varianzas poblacionales o no
3. Si las varianzas poblacionales son iguales o diferentes

23
24
25
26
27
Contraste de hipótesis para dos muestras

“Contraste anidado”

28
Contraste de hipótesis
Procedimiento muestras dependientes

29
30
31
32
33
34
35
36
37
38
Contraste de hipótesis
Procedimiento muestras independientes

39
Inferencia basada en dos muestras
El estadístico a usar en el contraste de medias depende de:
I. La naturaleza de las muestras: si son dependientes o
independientes
II. Si se conocen las varianzas poblacionales o no
III. Y si las varianzas poblacionales son iguales o diferentes 40
Para muestras independientes con varianzas
poblacionales conocidas

La inferencia se basa en el estadístico Z:

Z 
 X 1  X 2    1  2 
~ N (0,1)
  12 2 
2

  
 n1 n2 

Sin embargo …usualmente las varianzas son desconocidas 41


Muestras independientes con varianza conocida
Se desea estudiar dos tipos de dietas, se realiza un ensayo con
100 aves de corral en cierto periodo de su crecimiento.
Aleatoriamente a 55 de ellos se les administró la dieta A y a los
restantes 45 la dieta B.

Luego del tiempo de experimentación se registró el peso final (kg)


de las aves, obtenido las siguientes medias muestrales: media de
peso (kg) con la dieta A, 𝒙𝑨 = 𝟐, 𝟕𝟑, media de peso (kg) con la
dieta B, 𝒙𝑩 = 𝟑, 𝟎𝟏.

42
Muestras independientes con varianza conocida

Se conoce por experiencias previas las dispersiones cuadráticas


poblacionales de los pesos con cada dieta:
𝝈𝟐𝑨 = 𝟎, 𝟒𝟔 𝒚 𝝈𝟐𝑩 = 𝟎, 𝟓𝟏.

¿Proporcionan estos datos evidencias suficientes para


concluir que hay diferencias en el peso obtenido de
acuerdo a las dietas administradas?

Ejercicio resuelto en la pizarra considerando una significancia de 5 % y de


1%. Reflexión: al variar la significancia varían los intervalos de la región de
Aceptación de Ho y por lo tanto también podría variar la conclusión de un
contraste.
43
Procedimiento
1. Plantear hipótesis nula y alternativa (Ha define el esquema
gráfico)

2. De acuerdo al estadístico de contraste, y el valor de tabla a una


significancia (α) dada: definir la Región de Aceptación de H0
(RAα) y Región(es) de Rechazo de H0 (RRα)

3. Calcular el valor experimental u observado en la muestra y


comparar

4. Concluir referenciando la significancia empleada

44
Para muestras independientes con varianzas
poblacionales desconocidas
se debe realizar una Prueba de Homogeneidad de Varianzas
¿hay igualdad de varianzas ?

2 2
𝐻0 : 𝜎1 = 𝜎2
2 2
𝐻1 : 𝜎1 ≠ 𝜎2
Se realiza una prueba utilizando el
𝑆12
estadístico F  “F de Fisher-Snedecor” 𝐹 = 2 ~ 𝐹(𝑛1 −1,𝑛2 −1)
o “F –Snedecor” 𝑆2
45
Luego, para muestras independientes con varianzas
poblacionales desconocidas e iguales

La inferencia acerca de las medias se


basa en el estadístico T:

𝑥ҧ1 − 𝑥ҧ2 − (𝜇1 − 𝜇2 )


𝑇= ~ 𝑇𝑛1 +𝑛2−2
1 1
𝑠𝑝2 +
𝑛1 𝑛2
Donde 𝑆𝑝2 :
2 2
2
𝑛1 − 1 𝑆1 + 𝑛2 − 1 𝑆2
𝑆𝑝 = 46
𝑛1 + 𝑛2 − 2
Y para muestras independientes con varianzas
poblacionales desconocidas diferentes
La inferencia acerca de las medias se
basa en el siguiente estadístico :

T 
 X 1  X 2    1   2 
~ tv
S 2
S  2


1
 
2

 n1 n2 
2
S 2
S 2


1  2

 n n 
  2
1 2
Donde 𝑣 : 2 2
 S12   S 22 
 n   n 
 1   2 
n1  1 n2  1 47
Ejemplo
Se realizó un estudio que pretende comparar el nivel de
calcio en plasma sanguíneo en hombres y mujeres. Así, se
dispone de 18 casos 10 de ellos son hombres y 8 mujeres,
obteniendo que el nivel medio para los hombres es 3.6
mmol/l con una desviación estándar muestral 0.9 mmol/l
mientras que para las mujeres el nivel medio es 2.9 con
una desviación estándar muestral de 1.2 mmol/l.
¿Es significativa la diferencia obtenida en el nivel de calcio
entre hombres y mujeres (α =0.05)?

48
Procedimiento contraste de hipótesis
Previo al contraste y para seleccionar el estadístico se debe determinar
la naturaleza de las muestras (si estas son dependientes o
independientes): en este caso se asume independencia.
Luego, analizar si se conoce las varianzas poblacionales o no: según los
antecedentes aportados, no se conocen.

Dado que se desconocen 2  se debe determinar homocedasticidad o


igualdad de varianzas: esto corresponde a un contraste de hipótesis
anidado dentro del principal
49
Procedimiento contraste de hipótesis

1. Plantear hipótesis nula y alternativa

2. De acuerdo al estadístico de contraste y su


valor de tabla a una significancia (α) dada,
definir la Región de Aceptación (RAα) y
Región(es) de Rechazo (RRα)

3. Calcular el valor experimental u observado en


la muestra y comparar

4. Concluir referenciando la significancia empleada


50
Datos disponibles
Hombres: nh= 10 xh= 3,6 Sh = 0,9
Mujeres: nm= 8 xm = 2,9 Sm = 1,2
Se desprende que las muestras son independientes pero sus
varianzas desconocidas, por lo tanto el siguiente paso es
determinar la homocedasticidad u homogeneidad de varianzas.

Para ello debemos realizar un contraste previo de F-Fisher/


Snedecor, siguiendo el mismo procedimiento de 3 pasos:
donde el paso 1 corresponde al planteamiento de hipótesis:

51
HOMOCEDASTICIDAD

¿Las varianzas poblacionales son iguales o diferentes?

Paso 1:
H0 :  2
1  2
2

Hipótesis
H1 :  2
1  2
2

Para determinar homogeneidad de varianzas, las hipótesis


siempre serán las mismas y el contraste siempre será bilateral
dado que la hipótesis alternativa es negación de la hipótesis nula 52
HOMOCEDASTICIDAD: Distribución F-Fisher
Paso 2: s 2
Selección del F  1
2
~ F( n1 1, n2 1)
Estadístico s 2

Como la distribución F es asimétrica se deben


determinar dos puntos críticos, esto dado que la
hipótesis alternativa es una negación de la H0 por
lo tanto un contraste Bilateral

53
Contraste para la homogeneidad de varianzas
Paso 2: Obtención de valores de tabla y RRa
Se distribuye como una F con 9 y 7 g.l.

Recuerde que
una distribución
de probabilidades
siempre se “lee”
de izquierda a
derecha

α/2 =0,025 1 – α =0,95 α/2 =0,025

F0,025
F0,025 + 0,95= 0,975 54
Contraste para la homogeneidad de varianzas
Paso 2: Obtención de valores de tabla y RRα
Las regiones de rechazo RRα vienen determinadas por los valores
que quedan a la derecha y los valores que quedan a la izquierda:
F(9;7)0;025 = 0,2383
F (9;7)0;975 = 4,8232

α/2 =0,025 1 – α =0,95 α/2 =0,025

F0,025 = 0,2383
F0,975 = 4,8232 55
Contraste para la homogeneidad de varianzas
2: Obtención de valores de tabla y RRα  tabla

56
Contraste para la homogeneidad de varianzas
2b.- Obtención de valores de tabla y RRα  infostat

57
Contraste para la homogeneidad de varianzas
Paso 3: Obtención de valor calculado

Hombres: nh = 10, xh = 3,6, Sh = 0,9


Mujeres: nm = 8, xm = 2,9, Sm = 1,2

𝑆12 0,92
𝐹 = 2 ~ 𝐹(𝑛1−1,𝑛2−1) 𝐹= = 0,56
𝑆2 1,22

58
3: Comparación
valores calculado y de tabla de la Prueba F

Como F=0,56 está en el intervalo


(0,2383; 4,8232) se acepta H0: 12= 22

acepto H0

0,2383 0,56 4,8232 59


Paso 4. Conclusión

se acepta H0: 12= 22

Se concluye que, con un 5% de significancia, no hay


diferencias entre las varianzas poblacionales.

Se cumple el supuesto de homogeneidad de varianzas:


existe homocedasticidad con un 5% de significancia.

Ya resuelta la homocedasticidad, utilizaremos el


estadístico correspondiente…
60
Volvemos al contraste principal:
Comparar el nivel de calcio en plasma
sanguíneo en hombres y mujeres
1. Plantear hipótesis nula y alternativa

2. De acuerdo al estadístico de contraste y su valor de tabla


a una significancia (α) dada, definir la Región de
Aceptación (RAα) y Región(es) de Rechazo (RRα)

3. Calcular el valor experimental u observado en la muestra


y comparar

4. Concluir referenciando la significancia empleada


61
Volvemos al contraste principal:
Comparar el nivel de calcio en plasma
sanguíneo en hombres y mujeres
Paso 1: Las hipótesis propuestas son

H0: 1= 2
vs
H1: 1  2

62
Para muestras independientes con varianzas
poblacionales homocedásticas (iguales)
Paso 2: Selección del estadístico T

T 
 X 1  X 2    1  2 
~ Tn1  n2  2
 1 1 
2
S 
p  
 n1 n2 

(n1  1) S  (n2  1) S
2 2
S 2
 1 2

n1  n2  2
p

63
2: Valor de tabla de la distribución

Por simetría de la
distribución se
considera que
T(16);0,025= -2,11
T(16);0,975= 2,11

64
2: Valor de tabla de la distribución

RAα
0,95
RRα RRα
0,025 0,025

-2,11 2,11

65
3: Valor calculado de la Prueba T

Hombres: nh = 10, xh = 3;6, Sh = 0;9


Mujeres: nm = 8, xm = 2;9, Sm = 1;2

2 2
𝑛1 − 1 𝑆1 + 𝑛2 − 1 𝑆2
𝑆𝑝2 =
𝑛1 + 𝑛2 − 2

2 2
10 − 1 0,9 + 8 − 1 1,2
𝑆𝑝2 = = 1,08
10 + 8 − 2

Se reemplazan los términos respectivos… 66


3: Valor calculado de la Prueba T
Hombres: nh = 10, xh = 3;6, Sh = 0;9
Mujeres: nm = 8, xm = 2;9, Sm = 1;2

2 2
10 − 1 0,9 + 8 − 1 1,2
𝑆𝑝2 = = 1,08
10 + 8 − 2

𝑋ത1 − 𝑋ത2 − (𝜇1 − 𝜇2 )


𝑇= ~ 𝑇𝑛1 +𝑛2−2
1 1
𝑠𝑝2 +
𝑛1 𝑛2

(3,6 − 2,9)
𝑇= = 1,42 ~ 𝑡16
1 1
1,08 +
10 8
67
3 Comparación
Como T calculado=1,42 está en la región de aceptación
de H0 se acepta H0: 1= 2

1,42

-2,11 2,11 68
Paso 4: conclusión
Dado los resultados del contraste de hipótesis
podemos concluir que, con un 5% de
significancia, el nivel medio del calcio en
plasma sanguíneo no es significativamente
diferente en hombres y mujeres.

69
70

Вам также может понравиться