Вы находитесь на странице: 1из 47

Universidad José Carlos Mariátegui

Seminario Taller de Investigación Científica

Prueba de Hipótesis
Dr. José Luis Morales Rocha
Definición de hipótesis
› Una hipótesis es una afirmación que esta sujeta a
verificación o comprobación.

› Desde el punto de vista estadístico, una hipótesis es un


enunciado acerca de un parámetro de la población con
el propósito de ponerse a prueba.
Prueba de hipótesis
Es un procedimiento para que a partir de una muestra aleatoria y
significativa, se pueda extraer conclusiones que permitan aceptar o
rechazar una hipótesis previamente emitida sobre el valor de un
parámetro desconocido de una población.

• Hipótesis nula
– Se denota por: H0 , es una afirmación acerca del valor de un
parámetro poblacional (característica de la población).
• Hipótesis alterna
– Se denota por: H1 ó Ha , es la afirmación que se aceptará si los
datos muéstrales proporcionan evidencia de que la hipótesis nula
es falsa.
Prueba unilateral y bilateral
• La prueba de hipótesis unilateral es aquella en la cual la zona de
rechazo o zona crítica está completamente comprendida en uno
de los extremos de la distribución.

• En el caso de que la prueba comprenda áreas o zonas de rechazo


en ambos extremos de la distribución, la prueba es bilateral o sea
que la hipótesis alterna es diferente.
Errores de Tipo I y Tipo II
Las decisiones que podría tomar el investigador y las consecuencias
posibles se muestran en la tabla siguiente:
Investigador

Hipótesis nula Se acepta Ho Se rechaza Ho

Ho es verdadera Decisión correcta Error de Tipo I


Probabilidad = α
Ho es falsa Error de Tipo II Decisión correcta
Probabilidad = 1 - α

La probabilidad de cometer Error de tipo I es el nivel de significancia α


Procedimiento para probar una hipótesis
Método Tradicional
Formulación de las
hipótesis estadísticas

Elección del nivel


de significancia

Elección del estadístico


de prueba

Formulación de la
regla de decisión

Toma de decisión
Procedimiento para probar una hipótesis
Método Moderno
H 0 : e  c H 0 : e  c H 0 :   cte.
Formulación de las
hipótesis estadísticas H a : e  c H a : e  c H a :   cte.

Estadístico de prueba

Observar el valor p (significancia)


Toma de decisión
Si p< 0.05 RECHAZAR H0
Si p ≥ 0.05 ACEPTAR H0
Pruebas paramétricas y no paramétricas

PARAMÉTRICAS NO PARAMÉTRICAS
› Se utilizan para analizar › Se utilizan para analizar datos
variables cuantitativas de escala nominal u ordinal.
continuas.
› Normalidad
Pruebas paramétricas y no paramétricas
Análisis Paramétrico No paramétrico
Describir un grupo µ, 𝜎 2 Mediana, rango intercuartil
Comparar un grupo a un t de student de una muestra Prueba de Wilcoxon
valor
Comparar medias entre dos t de student de dos muestras Mann – Whitney
grupos
Comparar medias entre dos t de student apareada Prueba de Wilcoxon
grupos apareados
Comparar medias en tres o ANOVA Kruskal - Wallis
mas grupos

Correlación entre variables Pearson Spearman


Clasificación de hipótesis - cuantitativo
Hipótesis Establecen relación entre variable y constante Monovariadas
descriptivas Establecen relación entre dos variables Bivariadas
Hipótesis Establecen solo la relación entre las variables. Bivariadas
correlacionales Multivariadas
Establecen como es la relación entre las variables Bivariadas
Multivariadas
Hipótesis de la Establecen solo la diferencia entre Mismo grupo
diferencia los valores de las medias. Dos o mas grupos
de medias Establecen en favor de que valor de media es la Mismo grupo
diferencia. Dos o mas grupos
Hipótesis Una variable independiente y una dependiente Bivariadas
causales Varias variables independientes y una dependiente Multivariadas
Una variable independiente y varias dependientes. Multivariadas
Varias variables independientes y varias Multivariadas
dependientes.
Prueba de hipótesis de la media
La prueba de hipótesis de la media se utiliza para verificar la hipótesis
cuando el parámetro de interés es la media poblacional.
Cuando se conoce las varianza Cuando no se conoce la varianza
poblacional (𝝈𝟐 ) poblacional (𝝈𝟐 ) 𝒚 𝒏 ≥ 𝟑𝟎
𝒙−𝝁 𝒙−𝝁
𝒁𝒄 = ~𝑵(𝟎, 𝟏) 𝒁𝒄 = ~𝑵(𝟎, 𝟏)
𝝈𝒙 𝒔𝒙
𝝈 𝑺
𝝈𝒙 = 𝒏
Población infinita 𝒔𝒙 = Población infinita
𝒏
𝝈 𝑵−𝒏 𝑺 𝑵−𝒏
𝝈𝒙 = Población finita 𝒔𝒙 = Población finita
𝒏 𝑵−𝟏 𝒏 𝑵−𝟏

𝒙−𝝁
𝒕𝒄 = ~𝒕𝒏−𝟏
Cuando no se conoce 𝒔𝒙
la varianza
𝑺
poblacional 𝒔𝒙 = Poblaciones infinitas
𝒏
(𝝈𝟐 ) 𝒚 𝒏 < 𝟑𝟎 𝑺 𝑵−𝒏
𝒔𝒙 = Poblaciones finitas
𝒏 𝑵−𝟏
Prueba de hipótesis de la media - Ejemplo
Una empresa eléctrica fabrica baterías de celular que tienen una
duración que se distribuye de forma aproximadamente normal con
una media de 800 horas. Se extrae una muestra aleatoria de 30
baterías, ¿muestran los datos suficiente evidencia para decir que la
duración media no es de 800 horas?.

755 752 770 780 806 769 814 782 798 774
786 752 702 799 824 820 771 752 776 805
792 832 848 760 828 772 792 803 803 817
Prueba de hipótesis de la media - Ejemplo
1. Formulación de hipótesis
𝐻0 : 𝜇 = 800 horas
𝐻𝑎 : 𝜇 ≠ 800 horas
2. Estadístico de prueba (Con SPSS: Analizar, Comparar medias, Prueba T para una muestra)

3. Toma de decisión
Como p-valor = 0.037 (Sig. Bilateral) es menor a 0,05, entonces
rechazamos la hipótesis nula y aceptamos la hipótesis alterna, y se
concluye con un nivel de significancia del 5% la duración promedio de
las baterías es diferente a 800 horas.
Prueba de hipótesis de diferencia de medias
Esta prueba de hipótesis se utiliza cuando se tiene dos poblaciones y
se desea comparar el comportamiento de dichas poblaciones a través
de los promedios.
Cuando se conocen las varianzas Cuando no se conocen las varianzas poblacionales
poblacionales (𝝈𝟐𝟏 y 𝝈𝟐𝟐 ) (𝝈𝟐𝟏 y 𝝈𝟐𝟐 ) y además 𝒏𝟏 ≥ 𝟑𝟎 y 𝒏𝟐 ≥ 𝟑𝟎
𝑥1 − 𝑥2 − (𝜇1 − 𝜇2 ) 𝑥1 − 𝑥2 − (𝜇1 − 𝜇2 )
𝑍𝑐 = ~𝑁(0,1) 𝑍𝑐 = ~𝑁(0,1)
𝜎𝑥1−𝑥2 𝑆𝑥1 −𝑥2

𝜎12 𝜎22 𝑆12 𝑆22


𝜎𝑥1−𝑥2 = + 𝑆𝑥1−𝑥2 = +
𝑛1 𝑛2 𝑛1 𝑛2
Poblaciones infinitas Poblaciones infinitas

𝜎12 𝑁1 − 𝑛1 𝜎22 𝑁2 − 𝑛2
𝜎𝑥1−𝑥2 = × + × 𝑆12 𝑁1 −𝑛1 𝑆22 𝑁2 −𝑛2
𝑛1 𝑁1 − 1 𝑛2 𝑁2 − 1 𝑆𝑥1−𝑥2 = × + ×
𝑛1 𝑁1 −1 𝑛2 𝑁2 −1
Poblaciónes finitas Poblaciones finitas
Prueba de hipótesis de diferencia de medias
Cuando las varianzas poblacionales son Cuando las varianzas poblacionales son
desconocidas pero iguales (𝝈𝟐𝟏 = 𝝈𝟐𝟐 ) además desconocidas pero diferentes (𝝈𝟐𝟏 ≠ 𝝈𝟐𝟐 )
𝒏𝟏 < 𝟑𝟎 y 𝒏𝟐 < 𝟑𝟎 además 𝒏𝟏 < 𝟑𝟎 y 𝒏𝟐 < 𝟑𝟎
𝑥1 − 𝑥2 − (𝜇1 − 𝜇2 ) 𝑥1 − 𝑥2 − (𝜇1 − 𝜇2 )
𝑡𝑐 = ~𝑡(𝑛1+𝑛2−2) 𝑡𝑐 = ~𝑡(𝑣)
𝑆𝑥1 −𝑥2 𝑆𝑥1 −𝑥2

2
𝑆12 𝑛1 − 1 +𝑆22 𝑛2 − 1 1 1 𝑆12 𝑆22
𝑆𝑥1−𝑥2 =
𝑛1 + 𝑛2 − 2
× +
𝑛1 𝑛2 𝑛1 + 𝑛2
𝑣= 2 2 −2
𝑆12 𝑆22
𝑛1 𝑛2
𝑛1 + 1 + 𝑛2 + 1

𝑆12 𝑆22
𝑆𝑥1−𝑥2 = +
𝑛1 𝑛1
Prueba de hipótesis de diferencia de medias - Ejemplo
Un fabricante registró el número de artículos producidos diariamente, durante 18 días, para
un grupo de 15 obreros que operaban con base en un plan de salarios fijos. El fabricante
introdujo un plan de incentivos salariales para otros 15 obreros y registró la producción
durante 18 días. El número de artículos producidos diariamente fueron:

Grupo 1 75 76 74 80 72 78 76 73 72 75 78 75 76 76 72 77 81 76
Grupo 2 86 78 86 84 81 79 78 84 88 80 80 82 79 83 79 84 82 79

Suponiendo que los salarios pagados a cada grupo fueron iguales, ¿puede el fabricante
concluir que el plan de incentivos fue efectivo?
Prueba de hipótesis de diferencia de medias - Ejemplo
1. Formulación de hipótesis
𝐻0 : 𝜇1 = 𝜇2
𝐻𝑎 : 𝜇1 ≠ 𝜇2
2. Estadístico de prueba (SPSS: Analizar, Comparar medias, Prueba T para muestras independientes)

3. Toma de decisión
Como p-valor = 0.000 (Sig. Bilateral) es menor a 0,05, entonces rechazamos la
hipótesis nula y aceptamos la hipótesis alterna, y se concluye que existe diferencia
estadísticamente significativa entre los Grupos 1 y 2. Es decir el plan de incentivos
fue efectivo.
Prueba de hipótesis de la diferencia de dos poblaciones normales
dependientes (datos por pares)
Se utiliza para comparar dos poblaciones dependientes, es decir
cuando las observaciones se muestran por pares y cada observación
en una población esta apareada o relacionada de alguna forma con
una observación en otra población.
Cuando se conoce σ2 Cuando no se conoce σ2 y n ≥ 30. Cuando no se conoce σ2 y n < 30

𝑑 − 𝜇𝑑 𝑑 − 𝜇𝑑 𝑑 − 𝜇𝑑
𝑍𝑐 = ~𝑁(0,1) 𝑍𝑐 = ~𝑁 0,1 𝑡𝑐 = ~𝑡𝑛−1
𝜎𝑑 𝑆𝑑 𝑆𝑑

𝜎𝑑 𝑆𝑑 𝑆𝑑
𝜎𝑑 = 𝑆𝑑 = 𝑆𝑑 =
𝑛 𝑛 𝑛
n
𝑛
 (d i2  d )
2
𝑖=1 𝑑𝑖 S d2
𝑑=
𝑛 S d2  i 1 Varianza Sd  Error típico
n n 1
Prueba de hipótesis de la diferencia de dos poblaciones
normales dependientes - Ejemplo
En los últimos tiempos hay una cantidad cada Número Internet TV por Cable
vez mayor de opciones de entretenimiento que 1 22 25
compiten por el tiempo de los consumidores. 2 8 10
En el 2015, la televisión por cable y el Internet 3 25 29
superaron a la televisión abierta, a la radio y a 4 22 19
los periódicos, convirtiéndose en los medios de 5 12 13
entretenimiento más usados. Con una muestra
6 26 28
de 15 individuos se obtienen los datos de las
7 22 23
horas por semana que ven televisión por cable y
8 19 21
de las horas por semana que navegan en el
9 21 21
Internet.
10 23 23
11 14 15
Haga una prueba para la diferencia entre las 12 14 18
medias poblacionales de la cantidad de horas
13 14 17
de televisión por cable y de la cantidad de
horas que navegan en Internet. 14 16 15
15 24 23
Prueba de hipótesis de la diferencia de dos poblaciones
normales dependientes - Ejemplo
1. Formulación de hipótesis
𝐻0 : 𝜇𝑑 = 0
𝐻𝑎 : 𝜇𝑑 ≠ 0
2. Estadístico de prueba (Con SPSS: Analizar, Comparar medias, Prueba T para muestras relacionadas)

3. Toma de decisión
Como p-valor = 0.033 (Sig. Bilateral) es menor a 0,05, entonces rechazamos la
hipótesis nula y aceptamos la hipótesis alterna, lo que implica que los datos
evidencian una diferencia significativa en cantidad de horas de TV por cable e
Internet.
Prueba de hipótesis de una proporción
Es denominada prueba de hipótesis de una relación proporcional, se
aplica cuando se dispone de una sola población. Se utiliza para
comprobar afirmaciones acerca de una proporción poblacional en
base a información muestral.
𝑝−𝑃
𝑍𝑐 = ~𝑁(0,1)
𝜎𝑝

𝑃(1−𝑃)
𝜎𝑝 = , población infinita o selección con remplazo.
𝑛

𝑃(1−𝑃) 𝑁−𝑛
𝜎𝑝 = × 𝑁−1, población finita y selección sin remplazo.
𝑛

𝑝: Proporción muestral
𝑃: Proporción poblacional
Prueba de hipótesis de una proporción - Ejemplo

Una empresa, al seleccionar su personal lo somete a un curso de


entrenamiento. Por experiencia, el 76% de los aspirantes aprueban el
curso. Se efectúan ciertos cambios en el programa para el cual se
inscriben 40 y 26 lo aprueban. ¿Podría afirmarse que los cambios
introducidos reducen la selección?

Solución

1. Formulación de hipótesis

𝐻0 : 𝑃 ≥ 0.76
𝐻𝑎 : 𝑃 < 0.76
Prueba de hipótesis de una proporción - Ejemplo
2. Estadístico de prueba (SPSS: Analizar, Comparar medias, Prueba T para una muestra)

3. Decisión estadística
Como p-valor = 0.158 (Sig. Bilateral) es mayor a 0,05, entonces se acepta
la hipótesis nula, por lo tanto concluimos que la selección no se reduce
con los cambios introducidos.
Prueba de hipótesis de la diferencia entre dos
proporciones poblacionales
Se utiliza cuando se desea comparar dos proporciones, obtenidas en
dos poblaciones independientes, o si un grupo tuvo una proporción
mayor que el otro.
a. Cuando b. Cuando
1. 𝐻0 : 𝑃1 − 𝑃2 = 0 1. 𝐻0 : 𝑃1 − 𝑃2 = 𝑃0
2. 𝐻0 : 𝑃1 − 𝑃2 ≤ 0 2. 𝐻0 : 𝑃1 − 𝑃2 ≤ 𝑃0
3. 𝐻0 : 𝑃1 − 𝑃2 ≥ 0 3. 𝐻0 : 𝑃1 − 𝑃2 ≥ 𝑃0

𝑝1 − 𝑝2 − (𝑃1 − 𝑃2 ) 𝑍𝑐 =
𝑝1 −𝑝2 −(𝑃1 −𝑃2 )
~𝑁(0,1)
𝑍𝑐 = ~𝑁 0,1 𝑆𝑝1 −𝑝2
𝑆𝑝1−𝑝2
1 1 𝑝1 (1−𝑝1 ) 𝑝2 (1−𝑝2 )
𝑆𝑝1−𝑝2 = 𝑝(1 − 𝑝) + 𝑆𝑝1−𝑝2 = + poblaciones infinitas
𝑛1 𝑛2 𝑛1 𝑛2

poblaciones infinitas
𝑝1 (1 − 𝑝1 ) 𝑁1 − 𝑛1 𝑝2 (1 − 𝑝2 ) 𝑁2 − 𝑛2
𝑆𝑝1−𝑝2 = × + ×
𝑆𝑝1−𝑝2 = 𝑝(1 − 𝑝)
1
×
𝑁1 −𝑛1
+
1
×
𝑁2 −𝑛2 𝑛1 𝑁1 − 1 𝑛2 𝑁2 − 1
𝑛1 𝑁1 −1 𝑛2 𝑁2 −1
Poblaciones finitas y selección sin remplazo
Poblaciones finitas

Dónde: 𝑝 =
𝑥1 +𝑥2 𝑝: 𝑀𝑒𝑑𝑖𝑎 𝑝𝑜𝑛𝑑𝑒𝑟𝑎𝑑𝑎
𝑛1 +𝑛2
P1, p2:Proporciones muestrales
Prueba de hipótesis de la diferencia entre dos proporciones
poblacionales - Ejemplo
En una universidad peruana se toma una muestra aleatoria de 600 mujeres, 300 de las
cuales indican que están a favor de la supresión de sustentación de tesis en público. En
una muestra de 400 hombres, 240 indican que están a favor del mismo. Pruebe la
hipótesis al nivel del 5% si la diferencia entre las proporciones es significativa.

1. Formulación de hipótesis
𝑥1 + 𝑥2 300 + 240
𝐻0 : 𝑃1 = 𝑃2 𝑝= = = 0.54
𝑛1 + 𝑛2 600 + 400
𝐻𝑎 : 𝑃1 ≠ 𝑃2

2. Elección del nivel de significancia p1 


300
 0.5 p2 
240
 0.6
600 400
  0.05
0.5 − 0.6 − 0
3. Elección del estadístico de prueba 𝑍𝑐 = = −3.11
1 1
0.54(1 − 0.54) +
𝑝1 − 𝑝2 − (𝑃1 − 𝑃2 ) 600 400
𝑍𝑐 = ~𝑁(0,1)
𝑆𝑝1−𝑝2
1 1
𝑆𝑝1−𝑝2 = 𝑝(1 − 𝑝) +𝑛
𝑛1 2
Prueba de hipótesis de la diferencia entre dos proporciones
poblacionales - Ejemplo
4. Formulación de la regla de decisión
Si Zc es menor que -1,96 o mayor a 1,96; entonces se rechaza la H0.

Zt  Z 0.05  1.96
2

Z c

5. Toma de decisión

Existen evidencias estadísticas con un nivel de significancia del 5% para rechazar la


H0 y aceptar Ha, con lo que se concluye que la diferencia entre las proporciones es
significativa, al nivel de significancia del 5%.
Prueba de hipótesis de correlación
Esta prueba se aplica en diseños de investigación en los que a un único grupo de
individuos se les han medido simultáneamente dos variables cuantitativas continuas
que tienen distribución semejante a la de la curva normal.
En esta prueba se calcula una medida de resumen llamada coeficiente de correlación
de Pearson, que permite identificar la forma en que se asocian las dos variables
cuantitativas continuas. n n n

 X Y   X Y / n
H0 : r  0
i i i i

n2 r i 1 i 1 i 1

tc  r
2 2
n
 n  n
 n 
Ha : r  0 1 r2 
i 1
X
i
2
   iX
 i 1 
n  Yi    Yi 
i 1  i 1 
2
n

En esta prueba se exige el cumplimiento de que la distribución de ambas variables debe


ser semejante a la de una curva normal. En el caso de que no se cumpla la condición o
que de entrada una o ambas variables sean discretas, la prueba alterna del análisis
estadístico que debe utilizarse es la denominada de Spearman. Tau-b de Kendall. –
este coeficiente de correlación es apropiado para estudiar la relación entre variables
ordinales.
Prueba de hipótesis de correlación - Ejemplo
A 10 candidatos al ingresar en un programa de doctorado, se les aplica en la Facultad
de Psicología una prueba de personalidad (X) y un examen general de conocimientos
(Y), con las siguientes puntuaciones:

Puntuación en prueba Puntuación en examen


de personalidad (X) de conocimientos (Y)
2,96 529
2,46 506
3,36 591
3,4 610
2,43 474
2,12 509
2,85 550
3,12 600
3,2 575
2,75 540

Se muestra una asociación directa, los individuos con puntuaciones bajas en la prueba
de personalidad también tienen puntuaciones bajas en la prueba de conocimientos.
Complementariamente, las personas con altas puntuaciones en la prueba de
personalidad tienen altas puntuaciones en la prueba de conocimientos.
Prueba de hipótesis de correlación - Ejemplo
Prueba de normalidad de datos
𝐻0 : 𝐿𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 𝑡𝑖𝑒𝑛𝑒 𝑢𝑛𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖𝑜𝑛 𝑛𝑜𝑟𝑚𝑎𝑙
𝐻𝑎 : 𝐿𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 𝑛𝑜 𝑡𝑖𝑒𝑛𝑒 𝑢𝑛𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖𝑜𝑛 𝑛𝑜𝑟𝑚𝑎𝑙

Como la Sig, = 0.684 de personalidad y Sig. = 0.782 conocimiento de Shapiro-Wilk


(muestras pequeñas) son mayores a 0.05, entonces se verifica que ambas variables
son semejantes a la distribución normal.
Prueba de hipótesis de correlación - Ejemplo
1. Formulación de hipótesis
𝐻0 : 𝑟 = 0
𝐻𝑎 : 𝑟 ≠ 0
2. Estadístico de prueba (Con SPSS: Analizar, Correlaciones, Bivariadas)

3. Decisión estadística
Como p-valor = 0.000 (Sig. Bilateral) es menor a 0,05, entonces rechazamos la
hipótesis nula y aceptamos la hipótesis alterna, lo que implica existen evidencias
estadísticas significativas para afirmar que, existe relación entre el nivel de personalidad
y el nivel de conocimientos del los candidatos a doctor.
Prueba de hipótesis de correlación de Spearman
El coeficiente de correlación de Spearman es una prueba no
paramétrica cuando se desea quiere medir la relación entre
dos variables y no se cumple el supuesto de normalidad en la
distribución de tales valores. El coeficiente de correlación de
Spearman de designa por rs .

H0 : rs  0
Ha : rs  0
Ejemplo Nº Edad (X)
Valor resultante
del EEG (Y)
1 20 98
En un estudio de la relación entre 2 21 75
la edad y los resultados del 3 22 95
electroencefalograma (EEG), se 4 24 100
recopilaron datos en 20 personas 5 27 99
con edades entre 20 y 60 años. La 6 30 65
7 31 64
Tabla muestra las edades y un 8 33 70
valor de rendimiento del EEG 9 35 85
particular para cada una de esas 10 38 74
20 personas. Los investigadores 11 40 68
pretenden saber si es posible 12 42 66
concluir que este rendimiento del 13 44 71
14 46 62
EEG particular tiene relación 15 48 69
inversa con la edad a un nivel de 16 51 54
signficancia α=0.05. 17 53 63
18 55 52
19 58 67
Prueba de hipótesis de correlación de Spearman - Ejemplo

Se muestra una asociación


inversa, los individuos con
resultados bajos del
electroencefalograma tienen
edades altas.
Complementariamente, las
personas con resultados altos
del electroencefalograma
tienen bajas edades.
Prueba de hipótesis de correlación - Ejemplo
Prueba de normalidad de datos
𝐻0 : 𝐿𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 𝑡𝑖𝑒𝑛𝑒 𝑢𝑛𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖𝑜𝑛 𝑛𝑜𝑟𝑚𝑎𝑙
𝐻𝑎 : 𝐿𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 𝑛𝑜 𝑡𝑖𝑒𝑛𝑒 𝑢𝑛𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖𝑜𝑛 𝑛𝑜𝑟𝑚𝑎𝑙

La Sig, = 0.422 de edad es mayor a 0,05, se verifica que la variable Edad es semejante
a la distribución norma, mientras que Sig. = 0.023 de la variable EEG es mayor a 0,05,
entonces se rechaza la hipótesis nula y se acepta la hipótesis alterna en Shapiro-Wilk
(muestras pequeñas), entonces se verifica que la variable EEG no es semejante a la
distribución normal.
SPSS
SPSS
Prueba de hipótesis de correlación de Spearman - Ejemplo
1. Formulación de hipótesis
𝐻0 : 𝑟𝑠 = 0 El rendimiento del EEG y la edad son mutuamente independientes
𝐻𝑎 : 𝑟𝑠 ≠ 0 Existe una tendencia del rendimiento del EEG a disminuir con la edad

2. Estadístico de prueba (Con SPSS: Analizar, Correlaciones, Bivariadas)

3. Decisión estadística
Como p-valor = 0.000 (Sig. Bilateral) es menor a 0,05, entonces rechazamos la
hipótesis nula y aceptamos la hipótesis alterna, lo que implica existen evidencias
estadísticas significativas para afirmar que, existe relación inversa entre la Edad y el
EEG..
Ejercicio
Un investigador desea Número de
relacionar el desempeño Calificaciones
libros leídos
de un grupo de
70 4
estudiantes (medido
como su promedio de 65 2
calificaciones en un año) 97 5
con el numero de libros 85 6
leidos en ese mismo 74 3
periodo por cada uno de
los estudiantes. Los
datos son los siguientes:
Prueba de hipótesis de correlación de Tau-b de Kendall

El coeficiente de correlación de Kendall es una prueba no


paramétrica utilizado para medir la asociación entre dos
variables de tipo cualitativa ordinal. Se interpreta igual que el
coeficiente de correlación de Pearson.

2(𝑁𝑐 − 𝑁𝐷 ) Par concordante (NC)


𝑟= Par discordante (ND)
𝑁(𝑁 − 1)

H0 : r  0 No correlación

Ha : r  0 Correlación
Ejemplo Nº
Nivel de
identificación
Nivel de
instrucción
1 Medio Técnico
2 Medio Universitario
En un estudio sobre el nivel 3 Alto Técnico
de identificación del 4 Bajo Secundaria
colaborador con la empresa 5 Bajo Secundaria
6 Bajo Secundaria
y el nivel de instrucción del 7 Bajo Técnico
mismo. 8 Bajo Universitario
9 Medio Universitario
Se desea probar si existe 10 Medio Secundaria
alguna asociación entre el 11 Bajo Universitario
12 Medio Universitario
nivel de identificación del 13 Alto Universitario
colaborador con la empresa 14 Medio Técnico
y el nivel de instrucción del 15 Alto Técnico
mismo. 16
17
Alto
Alto
Técnico
Secundaria
18 Medio Secundaria
19 Alto Secundaria
20 Alto Técnico
21 Medio Universitario
22 Bajo Secundaria
Prueba de hipótesis de correlación de Tau-b de Kendall
1. Formulación de hipótesis
No hay asociación entre las variables nivel identificación y el nivel de
𝐻0 : 𝑟 = 0
instrucción
𝐻𝑎 : 𝑟 ≠ 0 Hay asociación entre las variables nivel identificación y el nivel de instrucción
2. Estadístico de prueba (Con SPSS: Analizar, Correlaciones, Bivariadas)

3. Decisión estadística
Como p-valor = 0.974 (Sig. Bilateral) es mayor a 0,05, entonces no rechazamos la
hipótesis nula, con lo que se concluye que no hay asociación entre las variables Nivel
de identificación con la empresa y el nivel de instrucción. Lo que queda evidenciado
con el valor del coeficiente de correlación r = -0,006 el cual se interprete como una
correlación muy baja entre las variables en mención.
Prueba de hipótesis de Chi cuadrada de independencia

Se realiza la prueba de independencia cuando estamos interesados en saber si dos


variables categóricas son independientes o están relacionadas.

𝐹 𝐶 2
𝑂𝑖𝑗 − 𝐸𝑖𝑗
𝑥𝑐2 = ~𝑥 2𝐹−1)(𝐶−1
𝐸𝑖𝑗
𝑖=1 𝑗=1

Dónde:

𝑂𝑖𝑗 : Es la frecuencia observada de la i-ésima fila y j-ésima


columna.
𝐸𝑖𝑗 : Es la frecuencia esperada de la i-ésima fila y j-ésima columna.

En el que: 𝑡𝑜𝑡𝑎𝑙 𝑓𝑖𝑙𝑎 𝑖 × 𝑡𝑜𝑡𝑎𝑙 𝑐𝑜𝑙𝑢𝑚𝑛𝑎 𝑗


𝐸𝑖𝑗 =
𝑡𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑚𝑢𝑒𝑠𝑡𝑟𝑎
Prueba de hipótesis de Chi cuadrada de independencia - ejemplo
La empresa XXX produce y distribuye tres tipos de cerveza: ligera, clara y oscura. Al
analizar los segmentos de mercado de las tres cervezas, el grupo de investigación de
mercado de la empresa se preguntó si las preferencias de los consumidores por estos
tipos de cerveza diferían entre hombres y mujeres.
En caso de que las preferencias fueran independientes del género del consumidor,
iniciarían una campaña publicitaria para todas las cervezas de la empresa.
Pero, si las preferencias por los distintos tipos de cerveza dependían del género del
consumidor, la empresa ajustaría sus promociones a los mercados. Probar la hipótesis
de que la preferencia por un tipo de cerveza (ligera, clara u oscura) es independiente
del género del consumidor (hombre o mujer).
Resultados muéstrales del tipo de cerveza que prefieren hombres y
mujeres (frecuencias observadas)
Género Cerveza preferida Total
Ligera Clara Oscura
Hombre 20 40 20 80
Mujer 30 30 10 70
Total 50 70 30 150
Prueba de hipótesis de Chi cuadrada de independencia
La empresa XXX produce y distribuye tres tipos de cerveza: ligera, clara y oscura. Al
analizar los segmentos de mercado de las tres cervezas, el grupo de investigación de
mercado de la empresa se preguntó si las preferencias de los consumidores por estos
tipos de cerveza diferían entre hombres y mujeres.
En caso de que las preferencias fueran independientes del género del consumidor,
iniciarían una campaña publicitaria para todas las cervezas de la empresa.
Pero, si las preferencias por los distintos tipos de cerveza dependían del género del
consumidor, la empresa ajustaría sus promociones a los mercados. Probar la hipótesis
de que la preferencia por un tipo de cerveza (ligera, clara u oscura) es independiente
del género del consumidor (hombre o mujer).
Resultados muéstrales del tipo de cerveza que prefieren hombres y
mujeres (frecuencias observadas)
Género Cerveza preferida Total
Ligera Clara Oscura
Hombre 20 40 20 80
Mujer 30 30 10 70
Total 50 70 30 150
Prueba de hipótesis de Chi cuadrada de independencia
1. Formulación de hipótesis
𝑯𝟎 : La preferencia por un tipo de cerveza es independiente del género del consumidor.
𝑯𝒂 : La preferencia por un tipo de cerveza no es independiente del género del consumidor.

2. Estadístico de prueba (Con SPSS)

3. Decisión estadística
Como p-valor = 0.047 (Sig. Bilateral) es menor a 0,05, entonces se rechaza la
hipótesis nula y se acepta la hipótesis alterna, y se concluye que los resultados
proporcionan evidencia significativa suficiente para afirmar que la preferencia por
una cerveza no es independiente del género del consumidor.
Ejercicio
Un medico esta interesado en saber si existe relación entre la
percepción de la calidad de servicio que brinda a sus pacientes y el
grado de instrucción del paciente. Para ello selecciona una muestra
de 400 pacientes y obtiene la siguiente información:
Grado de Percepción de la calidad del servicio
instrucción Malo Regular Bueno
Primaria 50 30 70
Secundaria 50 60 60
Superior 60 40 30

¿Qué se puede concluir a un nivel de significancia del 5%?


Gracias …

Dr. José Luis Morales Rocha

Вам также может понравиться