Академический Документы
Профессиональный Документы
Культура Документы
Prueba de Hipótesis
Dr. José Luis Morales Rocha
Definición de hipótesis
› Una hipótesis es una afirmación que esta sujeta a
verificación o comprobación.
• Hipótesis nula
– Se denota por: H0 , es una afirmación acerca del valor de un
parámetro poblacional (característica de la población).
• Hipótesis alterna
– Se denota por: H1 ó Ha , es la afirmación que se aceptará si los
datos muéstrales proporcionan evidencia de que la hipótesis nula
es falsa.
Prueba unilateral y bilateral
• La prueba de hipótesis unilateral es aquella en la cual la zona de
rechazo o zona crítica está completamente comprendida en uno
de los extremos de la distribución.
Formulación de la
regla de decisión
Toma de decisión
Procedimiento para probar una hipótesis
Método Moderno
H 0 : e c H 0 : e c H 0 : cte.
Formulación de las
hipótesis estadísticas H a : e c H a : e c H a : cte.
Estadístico de prueba
PARAMÉTRICAS NO PARAMÉTRICAS
› Se utilizan para analizar › Se utilizan para analizar datos
variables cuantitativas de escala nominal u ordinal.
continuas.
› Normalidad
Pruebas paramétricas y no paramétricas
Análisis Paramétrico No paramétrico
Describir un grupo µ, 𝜎 2 Mediana, rango intercuartil
Comparar un grupo a un t de student de una muestra Prueba de Wilcoxon
valor
Comparar medias entre dos t de student de dos muestras Mann – Whitney
grupos
Comparar medias entre dos t de student apareada Prueba de Wilcoxon
grupos apareados
Comparar medias en tres o ANOVA Kruskal - Wallis
mas grupos
𝒙−𝝁
𝒕𝒄 = ~𝒕𝒏−𝟏
Cuando no se conoce 𝒔𝒙
la varianza
𝑺
poblacional 𝒔𝒙 = Poblaciones infinitas
𝒏
(𝝈𝟐 ) 𝒚 𝒏 < 𝟑𝟎 𝑺 𝑵−𝒏
𝒔𝒙 = Poblaciones finitas
𝒏 𝑵−𝟏
Prueba de hipótesis de la media - Ejemplo
Una empresa eléctrica fabrica baterías de celular que tienen una
duración que se distribuye de forma aproximadamente normal con
una media de 800 horas. Se extrae una muestra aleatoria de 30
baterías, ¿muestran los datos suficiente evidencia para decir que la
duración media no es de 800 horas?.
755 752 770 780 806 769 814 782 798 774
786 752 702 799 824 820 771 752 776 805
792 832 848 760 828 772 792 803 803 817
Prueba de hipótesis de la media - Ejemplo
1. Formulación de hipótesis
𝐻0 : 𝜇 = 800 horas
𝐻𝑎 : 𝜇 ≠ 800 horas
2. Estadístico de prueba (Con SPSS: Analizar, Comparar medias, Prueba T para una muestra)
3. Toma de decisión
Como p-valor = 0.037 (Sig. Bilateral) es menor a 0,05, entonces
rechazamos la hipótesis nula y aceptamos la hipótesis alterna, y se
concluye con un nivel de significancia del 5% la duración promedio de
las baterías es diferente a 800 horas.
Prueba de hipótesis de diferencia de medias
Esta prueba de hipótesis se utiliza cuando se tiene dos poblaciones y
se desea comparar el comportamiento de dichas poblaciones a través
de los promedios.
Cuando se conocen las varianzas Cuando no se conocen las varianzas poblacionales
poblacionales (𝝈𝟐𝟏 y 𝝈𝟐𝟐 ) (𝝈𝟐𝟏 y 𝝈𝟐𝟐 ) y además 𝒏𝟏 ≥ 𝟑𝟎 y 𝒏𝟐 ≥ 𝟑𝟎
𝑥1 − 𝑥2 − (𝜇1 − 𝜇2 ) 𝑥1 − 𝑥2 − (𝜇1 − 𝜇2 )
𝑍𝑐 = ~𝑁(0,1) 𝑍𝑐 = ~𝑁(0,1)
𝜎𝑥1−𝑥2 𝑆𝑥1 −𝑥2
𝜎12 𝑁1 − 𝑛1 𝜎22 𝑁2 − 𝑛2
𝜎𝑥1−𝑥2 = × + × 𝑆12 𝑁1 −𝑛1 𝑆22 𝑁2 −𝑛2
𝑛1 𝑁1 − 1 𝑛2 𝑁2 − 1 𝑆𝑥1−𝑥2 = × + ×
𝑛1 𝑁1 −1 𝑛2 𝑁2 −1
Poblaciónes finitas Poblaciones finitas
Prueba de hipótesis de diferencia de medias
Cuando las varianzas poblacionales son Cuando las varianzas poblacionales son
desconocidas pero iguales (𝝈𝟐𝟏 = 𝝈𝟐𝟐 ) además desconocidas pero diferentes (𝝈𝟐𝟏 ≠ 𝝈𝟐𝟐 )
𝒏𝟏 < 𝟑𝟎 y 𝒏𝟐 < 𝟑𝟎 además 𝒏𝟏 < 𝟑𝟎 y 𝒏𝟐 < 𝟑𝟎
𝑥1 − 𝑥2 − (𝜇1 − 𝜇2 ) 𝑥1 − 𝑥2 − (𝜇1 − 𝜇2 )
𝑡𝑐 = ~𝑡(𝑛1+𝑛2−2) 𝑡𝑐 = ~𝑡(𝑣)
𝑆𝑥1 −𝑥2 𝑆𝑥1 −𝑥2
2
𝑆12 𝑛1 − 1 +𝑆22 𝑛2 − 1 1 1 𝑆12 𝑆22
𝑆𝑥1−𝑥2 =
𝑛1 + 𝑛2 − 2
× +
𝑛1 𝑛2 𝑛1 + 𝑛2
𝑣= 2 2 −2
𝑆12 𝑆22
𝑛1 𝑛2
𝑛1 + 1 + 𝑛2 + 1
𝑆12 𝑆22
𝑆𝑥1−𝑥2 = +
𝑛1 𝑛1
Prueba de hipótesis de diferencia de medias - Ejemplo
Un fabricante registró el número de artículos producidos diariamente, durante 18 días, para
un grupo de 15 obreros que operaban con base en un plan de salarios fijos. El fabricante
introdujo un plan de incentivos salariales para otros 15 obreros y registró la producción
durante 18 días. El número de artículos producidos diariamente fueron:
Grupo 1 75 76 74 80 72 78 76 73 72 75 78 75 76 76 72 77 81 76
Grupo 2 86 78 86 84 81 79 78 84 88 80 80 82 79 83 79 84 82 79
Suponiendo que los salarios pagados a cada grupo fueron iguales, ¿puede el fabricante
concluir que el plan de incentivos fue efectivo?
Prueba de hipótesis de diferencia de medias - Ejemplo
1. Formulación de hipótesis
𝐻0 : 𝜇1 = 𝜇2
𝐻𝑎 : 𝜇1 ≠ 𝜇2
2. Estadístico de prueba (SPSS: Analizar, Comparar medias, Prueba T para muestras independientes)
3. Toma de decisión
Como p-valor = 0.000 (Sig. Bilateral) es menor a 0,05, entonces rechazamos la
hipótesis nula y aceptamos la hipótesis alterna, y se concluye que existe diferencia
estadísticamente significativa entre los Grupos 1 y 2. Es decir el plan de incentivos
fue efectivo.
Prueba de hipótesis de la diferencia de dos poblaciones normales
dependientes (datos por pares)
Se utiliza para comparar dos poblaciones dependientes, es decir
cuando las observaciones se muestran por pares y cada observación
en una población esta apareada o relacionada de alguna forma con
una observación en otra población.
Cuando se conoce σ2 Cuando no se conoce σ2 y n ≥ 30. Cuando no se conoce σ2 y n < 30
𝑑 − 𝜇𝑑 𝑑 − 𝜇𝑑 𝑑 − 𝜇𝑑
𝑍𝑐 = ~𝑁(0,1) 𝑍𝑐 = ~𝑁 0,1 𝑡𝑐 = ~𝑡𝑛−1
𝜎𝑑 𝑆𝑑 𝑆𝑑
𝜎𝑑 𝑆𝑑 𝑆𝑑
𝜎𝑑 = 𝑆𝑑 = 𝑆𝑑 =
𝑛 𝑛 𝑛
n
𝑛
(d i2 d )
2
𝑖=1 𝑑𝑖 S d2
𝑑=
𝑛 S d2 i 1 Varianza Sd Error típico
n n 1
Prueba de hipótesis de la diferencia de dos poblaciones
normales dependientes - Ejemplo
En los últimos tiempos hay una cantidad cada Número Internet TV por Cable
vez mayor de opciones de entretenimiento que 1 22 25
compiten por el tiempo de los consumidores. 2 8 10
En el 2015, la televisión por cable y el Internet 3 25 29
superaron a la televisión abierta, a la radio y a 4 22 19
los periódicos, convirtiéndose en los medios de 5 12 13
entretenimiento más usados. Con una muestra
6 26 28
de 15 individuos se obtienen los datos de las
7 22 23
horas por semana que ven televisión por cable y
8 19 21
de las horas por semana que navegan en el
9 21 21
Internet.
10 23 23
11 14 15
Haga una prueba para la diferencia entre las 12 14 18
medias poblacionales de la cantidad de horas
13 14 17
de televisión por cable y de la cantidad de
horas que navegan en Internet. 14 16 15
15 24 23
Prueba de hipótesis de la diferencia de dos poblaciones
normales dependientes - Ejemplo
1. Formulación de hipótesis
𝐻0 : 𝜇𝑑 = 0
𝐻𝑎 : 𝜇𝑑 ≠ 0
2. Estadístico de prueba (Con SPSS: Analizar, Comparar medias, Prueba T para muestras relacionadas)
3. Toma de decisión
Como p-valor = 0.033 (Sig. Bilateral) es menor a 0,05, entonces rechazamos la
hipótesis nula y aceptamos la hipótesis alterna, lo que implica que los datos
evidencian una diferencia significativa en cantidad de horas de TV por cable e
Internet.
Prueba de hipótesis de una proporción
Es denominada prueba de hipótesis de una relación proporcional, se
aplica cuando se dispone de una sola población. Se utiliza para
comprobar afirmaciones acerca de una proporción poblacional en
base a información muestral.
𝑝−𝑃
𝑍𝑐 = ~𝑁(0,1)
𝜎𝑝
𝑃(1−𝑃)
𝜎𝑝 = , población infinita o selección con remplazo.
𝑛
𝑃(1−𝑃) 𝑁−𝑛
𝜎𝑝 = × 𝑁−1, población finita y selección sin remplazo.
𝑛
𝑝: Proporción muestral
𝑃: Proporción poblacional
Prueba de hipótesis de una proporción - Ejemplo
Solución
1. Formulación de hipótesis
𝐻0 : 𝑃 ≥ 0.76
𝐻𝑎 : 𝑃 < 0.76
Prueba de hipótesis de una proporción - Ejemplo
2. Estadístico de prueba (SPSS: Analizar, Comparar medias, Prueba T para una muestra)
3. Decisión estadística
Como p-valor = 0.158 (Sig. Bilateral) es mayor a 0,05, entonces se acepta
la hipótesis nula, por lo tanto concluimos que la selección no se reduce
con los cambios introducidos.
Prueba de hipótesis de la diferencia entre dos
proporciones poblacionales
Se utiliza cuando se desea comparar dos proporciones, obtenidas en
dos poblaciones independientes, o si un grupo tuvo una proporción
mayor que el otro.
a. Cuando b. Cuando
1. 𝐻0 : 𝑃1 − 𝑃2 = 0 1. 𝐻0 : 𝑃1 − 𝑃2 = 𝑃0
2. 𝐻0 : 𝑃1 − 𝑃2 ≤ 0 2. 𝐻0 : 𝑃1 − 𝑃2 ≤ 𝑃0
3. 𝐻0 : 𝑃1 − 𝑃2 ≥ 0 3. 𝐻0 : 𝑃1 − 𝑃2 ≥ 𝑃0
𝑝1 − 𝑝2 − (𝑃1 − 𝑃2 ) 𝑍𝑐 =
𝑝1 −𝑝2 −(𝑃1 −𝑃2 )
~𝑁(0,1)
𝑍𝑐 = ~𝑁 0,1 𝑆𝑝1 −𝑝2
𝑆𝑝1−𝑝2
1 1 𝑝1 (1−𝑝1 ) 𝑝2 (1−𝑝2 )
𝑆𝑝1−𝑝2 = 𝑝(1 − 𝑝) + 𝑆𝑝1−𝑝2 = + poblaciones infinitas
𝑛1 𝑛2 𝑛1 𝑛2
poblaciones infinitas
𝑝1 (1 − 𝑝1 ) 𝑁1 − 𝑛1 𝑝2 (1 − 𝑝2 ) 𝑁2 − 𝑛2
𝑆𝑝1−𝑝2 = × + ×
𝑆𝑝1−𝑝2 = 𝑝(1 − 𝑝)
1
×
𝑁1 −𝑛1
+
1
×
𝑁2 −𝑛2 𝑛1 𝑁1 − 1 𝑛2 𝑁2 − 1
𝑛1 𝑁1 −1 𝑛2 𝑁2 −1
Poblaciones finitas y selección sin remplazo
Poblaciones finitas
Dónde: 𝑝 =
𝑥1 +𝑥2 𝑝: 𝑀𝑒𝑑𝑖𝑎 𝑝𝑜𝑛𝑑𝑒𝑟𝑎𝑑𝑎
𝑛1 +𝑛2
P1, p2:Proporciones muestrales
Prueba de hipótesis de la diferencia entre dos proporciones
poblacionales - Ejemplo
En una universidad peruana se toma una muestra aleatoria de 600 mujeres, 300 de las
cuales indican que están a favor de la supresión de sustentación de tesis en público. En
una muestra de 400 hombres, 240 indican que están a favor del mismo. Pruebe la
hipótesis al nivel del 5% si la diferencia entre las proporciones es significativa.
1. Formulación de hipótesis
𝑥1 + 𝑥2 300 + 240
𝐻0 : 𝑃1 = 𝑃2 𝑝= = = 0.54
𝑛1 + 𝑛2 600 + 400
𝐻𝑎 : 𝑃1 ≠ 𝑃2
Zt Z 0.05 1.96
2
Z c
5. Toma de decisión
X Y X Y / n
H0 : r 0
i i i i
n2 r i 1 i 1 i 1
tc r
2 2
n
n n
n
Ha : r 0 1 r2
i 1
X
i
2
iX
i 1
n Yi Yi
i 1 i 1
2
n
Se muestra una asociación directa, los individuos con puntuaciones bajas en la prueba
de personalidad también tienen puntuaciones bajas en la prueba de conocimientos.
Complementariamente, las personas con altas puntuaciones en la prueba de
personalidad tienen altas puntuaciones en la prueba de conocimientos.
Prueba de hipótesis de correlación - Ejemplo
Prueba de normalidad de datos
𝐻0 : 𝐿𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 𝑡𝑖𝑒𝑛𝑒 𝑢𝑛𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖𝑜𝑛 𝑛𝑜𝑟𝑚𝑎𝑙
𝐻𝑎 : 𝐿𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 𝑛𝑜 𝑡𝑖𝑒𝑛𝑒 𝑢𝑛𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖𝑜𝑛 𝑛𝑜𝑟𝑚𝑎𝑙
3. Decisión estadística
Como p-valor = 0.000 (Sig. Bilateral) es menor a 0,05, entonces rechazamos la
hipótesis nula y aceptamos la hipótesis alterna, lo que implica existen evidencias
estadísticas significativas para afirmar que, existe relación entre el nivel de personalidad
y el nivel de conocimientos del los candidatos a doctor.
Prueba de hipótesis de correlación de Spearman
El coeficiente de correlación de Spearman es una prueba no
paramétrica cuando se desea quiere medir la relación entre
dos variables y no se cumple el supuesto de normalidad en la
distribución de tales valores. El coeficiente de correlación de
Spearman de designa por rs .
H0 : rs 0
Ha : rs 0
Ejemplo Nº Edad (X)
Valor resultante
del EEG (Y)
1 20 98
En un estudio de la relación entre 2 21 75
la edad y los resultados del 3 22 95
electroencefalograma (EEG), se 4 24 100
recopilaron datos en 20 personas 5 27 99
con edades entre 20 y 60 años. La 6 30 65
7 31 64
Tabla muestra las edades y un 8 33 70
valor de rendimiento del EEG 9 35 85
particular para cada una de esas 10 38 74
20 personas. Los investigadores 11 40 68
pretenden saber si es posible 12 42 66
concluir que este rendimiento del 13 44 71
14 46 62
EEG particular tiene relación 15 48 69
inversa con la edad a un nivel de 16 51 54
signficancia α=0.05. 17 53 63
18 55 52
19 58 67
Prueba de hipótesis de correlación de Spearman - Ejemplo
La Sig, = 0.422 de edad es mayor a 0,05, se verifica que la variable Edad es semejante
a la distribución norma, mientras que Sig. = 0.023 de la variable EEG es mayor a 0,05,
entonces se rechaza la hipótesis nula y se acepta la hipótesis alterna en Shapiro-Wilk
(muestras pequeñas), entonces se verifica que la variable EEG no es semejante a la
distribución normal.
SPSS
SPSS
Prueba de hipótesis de correlación de Spearman - Ejemplo
1. Formulación de hipótesis
𝐻0 : 𝑟𝑠 = 0 El rendimiento del EEG y la edad son mutuamente independientes
𝐻𝑎 : 𝑟𝑠 ≠ 0 Existe una tendencia del rendimiento del EEG a disminuir con la edad
3. Decisión estadística
Como p-valor = 0.000 (Sig. Bilateral) es menor a 0,05, entonces rechazamos la
hipótesis nula y aceptamos la hipótesis alterna, lo que implica existen evidencias
estadísticas significativas para afirmar que, existe relación inversa entre la Edad y el
EEG..
Ejercicio
Un investigador desea Número de
relacionar el desempeño Calificaciones
libros leídos
de un grupo de
70 4
estudiantes (medido
como su promedio de 65 2
calificaciones en un año) 97 5
con el numero de libros 85 6
leidos en ese mismo 74 3
periodo por cada uno de
los estudiantes. Los
datos son los siguientes:
Prueba de hipótesis de correlación de Tau-b de Kendall
H0 : r 0 No correlación
Ha : r 0 Correlación
Ejemplo Nº
Nivel de
identificación
Nivel de
instrucción
1 Medio Técnico
2 Medio Universitario
En un estudio sobre el nivel 3 Alto Técnico
de identificación del 4 Bajo Secundaria
colaborador con la empresa 5 Bajo Secundaria
6 Bajo Secundaria
y el nivel de instrucción del 7 Bajo Técnico
mismo. 8 Bajo Universitario
9 Medio Universitario
Se desea probar si existe 10 Medio Secundaria
alguna asociación entre el 11 Bajo Universitario
12 Medio Universitario
nivel de identificación del 13 Alto Universitario
colaborador con la empresa 14 Medio Técnico
y el nivel de instrucción del 15 Alto Técnico
mismo. 16
17
Alto
Alto
Técnico
Secundaria
18 Medio Secundaria
19 Alto Secundaria
20 Alto Técnico
21 Medio Universitario
22 Bajo Secundaria
Prueba de hipótesis de correlación de Tau-b de Kendall
1. Formulación de hipótesis
No hay asociación entre las variables nivel identificación y el nivel de
𝐻0 : 𝑟 = 0
instrucción
𝐻𝑎 : 𝑟 ≠ 0 Hay asociación entre las variables nivel identificación y el nivel de instrucción
2. Estadístico de prueba (Con SPSS: Analizar, Correlaciones, Bivariadas)
3. Decisión estadística
Como p-valor = 0.974 (Sig. Bilateral) es mayor a 0,05, entonces no rechazamos la
hipótesis nula, con lo que se concluye que no hay asociación entre las variables Nivel
de identificación con la empresa y el nivel de instrucción. Lo que queda evidenciado
con el valor del coeficiente de correlación r = -0,006 el cual se interprete como una
correlación muy baja entre las variables en mención.
Prueba de hipótesis de Chi cuadrada de independencia
𝐹 𝐶 2
𝑂𝑖𝑗 − 𝐸𝑖𝑗
𝑥𝑐2 = ~𝑥 2𝐹−1)(𝐶−1
𝐸𝑖𝑗
𝑖=1 𝑗=1
Dónde:
3. Decisión estadística
Como p-valor = 0.047 (Sig. Bilateral) es menor a 0,05, entonces se rechaza la
hipótesis nula y se acepta la hipótesis alterna, y se concluye que los resultados
proporcionan evidencia significativa suficiente para afirmar que la preferencia por
una cerveza no es independiente del género del consumidor.
Ejercicio
Un medico esta interesado en saber si existe relación entre la
percepción de la calidad de servicio que brinda a sus pacientes y el
grado de instrucción del paciente. Para ello selecciona una muestra
de 400 pacientes y obtiene la siguiente información:
Grado de Percepción de la calidad del servicio
instrucción Malo Regular Bueno
Primaria 50 30 70
Secundaria 50 60 60
Superior 60 40 30