You are on page 1of 46

Unidad 4.

Prueba de
hipótesis
Universidad del Politécnica del Valle de México

Idea original: Dr. Luis Antonio Pérez González Revisado por: Francisco Quiroz Aguilar 1
Resultados de aprendizaje
Probar con significancia estadística la validez de un enunciado
que se hace sobre los parámetros de una o dos poblaciones

Revisado por: Francisco Quiroz Aguilar 2


Verificación de hipótesis
estadísticas
Hipótesis
• Declaración específica de una predicción.
• Sospecha
• Aseveración sobre un modelo
probabilístico.

Describe en términos concretos


(en vez de teóricos),
lo que esperamos que suceda en un estudio o
investigación.
Dr. Luis Antonio Pérez González Revisado por: Francisco Quiroz Aguilar 3
Verificación de hipótesis estadísticas
Hipótesis Nula (Ho)
• Suposición tentativa acerca del parámetro poblacional
• Hipótesis de nulidad de efectos
• Es la que presupone franqueza y lealtad,
• Es aceptada provisionalmente como verdadera, cuya
validez será sometida a comprobación de experimentos

Hipótesis Alternativa (H1 o HA)


• Hipótesis que describe todos los demás resultados posibles
• Hipótesis que apoya nuestra predicción
• Hipótesis de investigación
Prueba de hipótesis de investigación
5
• Una hipótesis de investigación se debe plantear
como hipótesis alternativa Revisado por: Francisco Quiroz Aguilar
Verificación de hipótesis estadísticas
Prueba de la validez de una afirmación

• En toda situación en la que se desee probar la validez de una


afirmación, la hipótesis nula se suele basar en la suposición de
que la afirmación es verdadera.

• Entonces, la hipótesis alternativa se formula de manera que


rechazar H0 proporcione evidencia estadística de que la suposición
establecida es incorrecta.

• Por ejemplo lo que asegura un fabricante se le suele dar el beneficio


de la duda y se establece como hipótesis nula. Si se rechaza la
hipótesis nula se concluye que su dicho es falso.
Revisado por: Francisco Quiroz Aguilar 6
Verificación de hipótesis estadísticas
Prueba en situaciones de toma de decisión

• Cuando se prueba una hipótesis de investigación o la validez de una


afirmación, se toman medidas si se rechaza H0.

• Sin embargo, en algunas situaciones se toman tanto si no se puede


rechazar H0 como si se puede rechazar H0.

• En general, este tipo de situaciones se presentan cuando la


persona que debe tomar una decisión tiene que elegir entre dos
líneas de acción, una relacionada con la hipótesis nula y otra con
la hipótesis alternativa

Revisado por: Francisco Quiroz Aguilar 7


Verificación de hipótesis estadísticas
Prueba en situaciones de toma de decisión
• Suponga que una especificación para unas piezas determinadas sea
que su longitud media deba ser de dos pulgadas.

• Si la longitud media es menor o mayor a dos pulgadas, las piezas


ocasionarán problemas de calidad en la operación de ensamblado.

• En este caso, las hipótesis nula y alternativa se formulan como


sigue.

H 0 :   2 ´´ Este tipo de prueba de hipótesis se emplea en el


procedimiento de control de calidad conocido como
H 0 :   2´´ muestreo de aceptación de lotes
8

Revisado por: Francisco Quiroz Aguilar


Verificación de hipótesis estadísticas

Principios básicos de la verificación de hipótesis:

1. La formulación de dos hipótesis mutuamente


excluyentes que en conjunto reúnen todos los
resultados posibles.

2. La prueba de éstas es tal que una es


necesariamente aceptada, y la otra rechazada.

Revisado por: Francisco Quiroz Aguilar 9


Verificación de hipótesis estadísticas
Componentes interrelacionados que influencian las
conclusiones de una investigación:

Tamaño de la muestra: Tamaño del efecto:


Número de unidades Magnitud del efecto del
utilizadas en el estudio. tratamiento en relación a la
precisión del experimento.

Potencia: Nivel alfa (a):


Probabilidad de obtener Probabilidad de obtener
evidencia a favor de la indebidamente evidencia a
hipótesis de investigación, favor de la hipótesis de
cuando esta es cierta. investigación.
Revisado por: Francisco Quiroz Aguilar 10
Verificación de hipótesis estadísticas

Lo que Estado de la naturaleza


concluimos
Ho verdadera Ho falsa

Aceptamos 1-a 
Ho
Nivel de Error
Confianza Tipo II
Rechazamos a 1-
Ho
Error Potencia
Tipo I

Revisado por: Francisco Quiroz Aguilar 11


Verificación de hipótesis estadísticas
Errores tipo I y tipo II

a  P ( RH o / H o cierta)
- P(Rechazar que es inocente | inocente)
- P(Rechazar =2´´|=2´´ es cierta) “Rechazar los tornillos dado que sí cumplen”

  P ( RH 1 / H 1 cierta)   P ( AH 0 / H 0 es falsa)
- P(Rechazar que es culpable|culpable) ó P(Aceptar que es inocente|culpable)
- P(Rechazar ≠2´´|≠2´´ es cierta) ó P(aceptar =2´´| =2´´ es falsa)
“Aceptar los tornillos dado que no cumplen” Revisado por: Francisco Quiroz Aguilar 12
Verificación de hipótesis estadísticas

Aciertos:
Nivel de Confianza y Potencia de la prueba

1  a  P ( AcH o / H o cierta)

1    P ( AcH 1 / H 1 cierta)

Revisado por: Francisco Quiroz Aguilar 13


Verificación de hipótesis estadísticas

Para verificar la hipótesis necesitamos


un estadístico de prueba.

Revisado por: Francisco Quiroz Aguilar 14


Verificación de hipótesis estadísticas

Un estadístico de prueba es una


función de los valores de la muestra
cuyo comportamiento estadístico
conocemos tanto si Ho es cierta, como
si la cierta fuera H1.

Revisado por: Francisco Quiroz Aguilar 15


Verificación de hipótesis estadísticas

Hipótesis de una cola


Ejemplo:
Como resultado del Programa de
Capacitación de la Empresa XYZ:

HO: El ausentismo se mantiene


o aumenta.

HA: El ausentismo decrece.

Revisado por: Francisco Quiroz Aguilar 16


Verificación de hipótesis estadísticas

Sin cambio
Una cola

Menos Más

Ausentismo

Dr. Luis Antonio Pérez González Revisado por: Francisco Quiroz Aguilar 17
Verificación de hipótesis estadísticas

Hipótesis de dos colas


Ejemplo:
Como resultado de la aplicación de
300 mg/día de la droga ABC:

HO: No hay diferencia significativa


en la depresión.
HA: Existe una diferencia
significativa en la depresión.

Revisado por: Francisco Quiroz Aguilar 18


Verificación de hipótesis estadísticas

Sin cambio
Dos colas

Menos Más

Depresión

Revisado por: Francisco Quiroz Aguilar 19


Resumen de conceptos importantes:
Sea X1, X2, ..., Xn, una muestra extraída de una
población N(,2). Entonces:
_
X  
z  N ( 0,1)   Error estándar


_ de la media
_
X n
X
_
X  s
t  t n 1 s_ 
s_ X n
X
_ n 2
1 1 
n
 _
X  Xi s   Xi  X 
n i 1 n  1 i 1  
Revisado por: Francisco Quiroz Aguilar 26
Tenemos también, en el caso de Normalidad:

Z 1-a = - Z a
a

Z 1a a < 0.5 Z a> 0


a > 0.5 Z a< 0

a
a  0.5 Z a 0
-Z a
0 Revisado por: Francisco Quiroz Aguilar 27
Análogamente, para la distribución tn:

t n,1-a = - tn, a
a
t n,1-a
a < 0.5 t n,a > 0
a > 0.5 t n,a < 0

a
a  0.5 tn, a  0
-t n,a
0 Revisado por: Francisco Quiroz Aguilar 28
Pruebas de hipótesis sobre una
muestra

Revisado por: Francisco Quiroz Aguilar 29


_ _
X o X o
Pruebas sobre  Estadístico z0 



Caso:  conocida.
_

de prueba: X
n

Región
Ho H1 crítica:
z 0 <  za / 2
  o   o
z 0 > za / 2
  o  > o z 0 > za

  o  < o z 0 <  za

Revisado por: Francisco Quiroz Aguilar 30


Procedimiento general de las pruebas de
hipótesis
1. Se expresa el problema en términos de algún parámetro
poblacional
2. Establecer la hipótesis nula y alternativa H0 y H1
3. Elegir un nivel de significancia a
4. Establecer un estadístico de prueba apropiado
5. Establecer la región de rechazo del estadístico
6. Decidir si deberá rechazarse o no H0 y contextualizar la decisión del
problema

Revisado por: Francisco Quiroz Aguilar 31


Valores de Z más usados

Prueba unilateral Prueba bilateral


Nivel de Confiabilidad Solo lado izquierdo Solo lado derecho Lado izquierdo Lado derecho
significancia
0.01 99% P(Z)=0.01, -Z=-2.32635 P(Z)=0.01, Z=2.32635 P(Z)=0.005,-Z=-2.57583 P(Z)=0.995,Z=2.57583

0.05 95% P(Z)=0.05, -Z=-1.645 P(Z)=0.05, Z=1.645 P(Z)=0.025, -Z=-1.96 P(Z)=0.025, Z=1.96

0.10 90% P(Z)=0.10,- Z=-1.28155 P(Z)=0.10, Z=1.28155 P(Z)=0.05, -Z=-1.64485 P(Z)=0.05, Z=1.64485

0.20 80% P(Z)=0.20, -Z=-0.841621 P(Z)=0.20, Z=0.841621 P(Z)=0.10, -Z=-1.28155 P(Z)=0.10, Z=1.28155

Revisado por: Francisco Quiroz Aguilar 33


Control de calidad
El gerente de control de calidad desea saber si el último lote fabricado
cumple la especificación que dice que el peso promedio () de las cajas
de cereal es de 300g; se sabe por experiencia que la desviación
estándar poblacional es de 15g. Para esto se toma una muestra
aleatoria de 9 cajas de cereal, con los siguientes pesos: 295, 299, 301,
305, 298, 300, 301, 305 y 300g.

Pruebas sobre 
Caso:  conocida. Revisado por: Francisco Quiroz Aguilar 34
Control de calidad
Paso 1. Identificar el modelo probabilístico (qué distribución de
probabilidad utilizar)
La distribución muestral de la media 𝑥ҧ se aproxima a una distribución
𝜎
norma con media m y desviación estándar 𝜎𝑥ҧ = (error estándar de
𝑛
la media).
Para este caso de prueba de hipótesis se empleará la distribución
normal “Z”

Pruebas sobre 
Caso:  conocida. Revisado por: Francisco Quiroz Aguilar 35
Control de calidad
Paso 2. Establecer la hipótesis nula y la alternativa
La hipótesis nula en términos estadísticos, para este ejemplo, es que el
promedio del peso de las cajas de cereal del lote (población) sea igual a
300g.
𝐻0 : 𝜇 = 300 𝑔
donde μ es el promedio del peso de todas las cajas del lote a evaluar
La hipótesis alternativa también debe estar en términos estadísticos y
corresponde al complemento de la hipótesis nula; ésta se representa
como H1
𝐻1 : 𝜇 ≠ 300 𝑔
Pruebas sobre 
Caso:  conocida. Revisado por: Francisco Quiroz Aguilar 36
Control de calidad
Paso 3. Definir el nivel del error de tipo I “a”
Definir el nivel de error de tipo I es un paso crítico ya que en función de
éste se establecerán los criterios para rechazar la hipótesis nula. En
algunas pruebas importantes para establecer la calidad de productos
de consumo humano, la Secretaría de Salud en la Norma Oficial
Mexicana NOM 177-SSA1-1998 establece la magnitud del error de tipo
I como 0.05.

Pruebas sobre 
Caso:  conocida. Revisado por: Francisco Quiroz Aguilar 37
Control de calidad
Paso 4. Determinar el estadístico de prueba.
Como estadístico de prueba se le conoce al valor que es calculado a
partir de los datos muestrales considerando la distribución de
probabilidad seleccionada; este valor se utilizará para tomar la decisión
de rechazar o no la hipótesis nula.
De acuerdo con el paso 1, la distribución a utilizar es la normal
estándar, por lo tanto el estadístico de prueba es el siguiente:
A partir de los datos de la muestra se
𝑥ҧ − 𝜇 determina el promedio muestral 𝑥 y
𝑍0 = 𝜎 se calcula el estadístico de prueba 𝑍0
Pruebas sobre  (Z calculada)
Caso:  conocida. 𝑛 Revisado por: Francisco Quiroz Aguilar 38
Control de calidad
Paso 4. Determinar el estadístico de prueba.
Con base en lo anterior:

295 + 299 + 301 + 305 + 298 + 300 + 301 + 305 + 300 2704
𝑥ҧ = = = 300.4
9 9

𝑥ҧ − 𝜇 300.4 − 300 0.4


𝑍0 = 𝜎 = = = 0.08
15 5
𝑛 9

Pruebas sobre 
Caso:  conocida. Revisado por: Francisco Quiroz Aguilar 39
Control de calidad
Paso 5. Establecer las regiones de rechazo para la hipótesis nula.
Fronteras de la región crítica
−𝑍𝛼 = −𝑍0.05 = −𝑍0.025 = −1.96
2 2
𝑍𝛼 = 𝑍0.025 = 1.96
2

Región crítica (zona de rechazo):


z 0 <  za / 2 z 0 > za / 2

Rechazar 𝐻0 𝑠𝑖 𝑍0 < −1.96 ó 𝑍0 > 1.96

No rechazar 𝐻0 𝑠𝑖 − 1.96 ≤ 𝑍0 ≤ 1.96


Revisado por: Francisco Quiroz Aguilar 40
Control de calidad
Paso 6. Tomar la decisión de rechazar o aceptar la hipótesis nula con
base en Z0 y Ztablas y concluir
Rechazar 𝐻0 𝑠𝑖 𝑍0 > 1.96 𝑜 𝑍0 < −1.96
𝑍0 = 0.08

Debido a que − 1.96 < 0.08 < 1.96,


no hay evidencia estadística para rechazar 𝐻0

Conclusión
No existe evidencia que indique que el promedio del peso de las cajas de cereal sea diferente a 300g
Revisado por: Francisco Quiroz Aguilar 41
_

Pruebas sobre  X o
Estadístico t
Caso: de prueba: s_
 desconocida. X

Región
Ho H1 crítica:
t 0 > t n  1, a / 2
  o   o t 0 <  t n  1, a / 2

  o  > o t 0 > t n  1, a

  o  < o t 0 <  t n  1, a

Dr. Luis Antonio Pérez González Revisado por: Francisco Quiroz Aguilar 42
Vitaminas
El gerente de desarrollo de nuevos productos está interesado en saber
si el contenido de una vitamina en una nueva presentación individual,
es menor o igual a indicado en el marbete (5ml), ya que si el contenido
es menor que lo indicado, se considera como fraude al consumidor y la
empresa puede ser demandada.
Al realizar un muestreo de 9 ampolletas de vitaminas, se observan los
siguientes resultados:
4.5, 5.0, 6.0, 5.5, 4.7, 5.8, 5.3, 5.9 y 5.2 ml

Pruebas sobre 
Caso:
 desconocida. Revisado por: Francisco Quiroz Aguilar 43
Vitaminas
Paso 1. Identificar el modelo probabilístico
Dado que se desconoce y se desea inferir sobre el promedio, la
distribución utilizada será la t-student.
Paso 2. Establecer la hipótesis nula y la alternativa
𝐻0 : 𝜇 ≤ 5𝑚𝑙
𝐻1 : 𝜇 > 5 𝑚𝑙
Paso 3. Definir el nivel de error I “a”
a=0.05
Pruebas sobre 
Caso:
 desconocida. Revisado por: Francisco Quiroz Aguilar 44
Vitaminas
𝑥−𝜇
Paso 4. Definir el estadístico de prueba 𝑡0 =
𝑆
𝑛

σ 𝑥𝑖 − 𝑥ҧ 2 4.5 − 5.32 2 + 5 − 5.32 2 + 4.5 − 5.32 2 + ⋯ + 4.5 − 5.32 2


𝑆= =
𝑛−1 9−1

0.6724 − 0.1024 + 0.4624 + ⋯ + 0.0144 2.2356


= = 0.5286
8 8

𝑥 − 𝜇 5.32 − 5.00 0.32


Pruebas sobre  𝑡0 = = = = 1.8161
𝑆 0.5286 0.1762
Caso:
 desconocida. 𝑛 9 Revisado por: Francisco Quiroz Aguilar 45
Vitaminas
Paso 5. Establecer las regiones de rechazo para la hipótesis nula
Como a tiene un valor de 0.05, el valor de ttablas que define la región de
rechazo es:
Fronteras de la región crítica
𝑡𝛼,𝑛−1 = 𝑡0.05,9−1 = 𝑡0.05,8 = 1.86
Región crítica (zona de rechazo) es:
𝑡0 > 𝑡𝛼,𝑛−1

Rechazar 𝐻0 si 𝑡0 > 1.86

46

Revisado por: Francisco Quiroz Aguilar


Vitaminas
Paso 6. Tomar la decisión de rechazar o aceptar la hipótesis nula, con
base a t0 y ttablas y concluir
Rechazar 𝐻0 si 𝑡0 > 1.86
𝑡0 = 1.8161
Debido a que 1.8161 < 1.86, no hay evidencia estadística para rechazar 𝐻0

Conclusión
Se determina que el promedio poblacional (de todo el proceso) es menor
o igual que 5 ml, por lo tanto, la empresa puede ser demandada por el
consumidor ya que el contenido promedio puede ser menor que 5 ml.
Revisado por: Francisco Quiroz Aguilar 47
Problemas complementarios

Revisado por: Francisco Quiroz Aguilar 48


Hotel Embassy Suites
En una reunión informativa para una oficina corporativa, el gerente del
hotel Embassy Suites en Atlanta, reportó que el número promedio de
habitaciones alquiladas por noche es de por lo menos 212. Es decir,
µ ≥ 212. Uno de los funcionarios corporativos considera que esta cifra
puede estar algo sobrestimada. Una muestra de 150 noches produce
una media de 201.3 habitaciones y una desviación estándar de 45.5
habitaciones. Si estos resultados sugieren que el gerente ha "inflado“
su reporte, será amonestado severamente. A un nivel de 1%, ¿cuál es el
destino del gerente?

Revisado por: Francisco Quiroz Aguilar 49


Asociación Nacional de Estudiantes
Colegiados
Una encuesta realizada por la Asociación Nacional de Estudiantes
Colegiados (National Collegiate Students' Association) mostró que los
estudiantes de las universidades de la nación gastan en promedio más
de US$75 mensuales en entretenimiento. Si usted puede hallar
evidencias para confirmar esta afirmación, podría utilizarla para
solicitar a su casa ayuda monetaria adicional. De los 100 estudiantes
que tomó de muestra, usted halla una media de US$80.23 con una
desviación estándar de US$45.67. ¿A un nivel de significancia del 2%,
se encuentra justificación para la solicitud?

Revisado por: Francisco Quiroz Aguilar 52


Impurezas en un proceso
En un proceso de fabricación, la cantidad de impurezas permisibles en
la materia prima es de 0.05 miligramos por litro (mg/L). Los análisis que
se le practican a una muestra aleatoria de tamaño 10 de un lote recién
recibido dieron una media de 0.058 mg/L con una desviación estándar
muestral de 0.012 mg/L. ¿Deberá aceptarse el lote?

Revisado por: Francisco Quiroz Aguilar 55


Uso de valores P en la prueba de hipótesis
• Una manera de reportar los resultados de una prueba de hipótesis es
enunciando que la hipótesis nula fue rechazada o no en un valor a o nivel
de significancia especificado.
El valor P es el nivel de significación más bajo que llevará el rechazo de la
hipótesis nula con los datos dados.
• Para las pruebas de la distribución normal es sencillo calcular el valor P. Si
Z0 es el valor calculado estadístico

2 1 − Φ 𝑧0 para una prueba de dos colas: 𝐻0 : 𝜇 = 𝜇0 𝐻1 : 𝜇 ≠ 𝜇0


𝑃= 1 − Φ 𝑧0 para una prueba de cola superior: 𝐻0 : 𝜇 = 𝜇0 𝐻1 : 𝜇 > 𝜇0
Φ 𝑧0 para una prueba de cola inferior ∶ 𝐻0 : 𝜇 = 𝜇0 𝐻1 : 𝜇 < 𝜇0
Φ 𝑧 = 𝑃 𝑍 ≤ 𝑧 , donde 𝑍 es 𝑁 0,1
(función de distribución nomal estándar acumulada) Revisado por: Francisco Quiroz Aguilar 58
Ejemplo P-Valor
Los sistemas de escape de emergencia para tripulaciones de aeronaves
son impulsados por un combustible sólido. Una de las características
importantes de este producto es la rapidez de combustión. Las
especificaciones requieren que la rapidez-promedio de combustión sea
50cm/s. Se sabe que la desviación estándar de esta rapidez es m=2
cm/s. El experimentador decide especificar una probabilidad para el
error tipo I, o nivel de significancia, de a=0.05. Selecciona una muestra
aleatoria de n =25 y obtiene una rapidez promedio muestral de
combustión de 𝑥= ҧ 51.3 cm/s. ¿A qué conclusiones debe llegar?

Revisado por: Francisco Quiroz Aguilar 59


Ejemplo P-Valor
1. El parámetro de interés es la media, la distribución utilizada será la distribución normal
Z.
2. 𝐻0 : 𝜇 = 50 cm/s, 𝐻1 : 𝜇 ≠ 50cm/s
3. 𝛼 = 0.05
51.3−50
4. estadístico de prueba es 𝑍0 = 2 = 3.25
25
5. -𝑍𝛼 = −𝑍0.025 = −1.96, 𝑍0.025 = 1.96
Se rechaza H0 si Z0>1.96 ó si Z0<1.96
6. Puesto que Z0=3.25>1.96, se rechaza H0. Se concluye que la media de la rapidez de
combustión difiere de 50 cm/s, con base en una muestra de 25 mediciones.
𝑉𝑎𝑙𝑜𝑟 𝑃 = 2 1 − Φ 3.25 = 2 1 − 0.9994 = 0.0012
Por lo tanto, H0: =50 se rechazaría en cualquier nivel de significancia a≥valor P=0.0012
Para nuestro caso, por tanto se rechazaría H0 ya que el P-valor es menor a 0.05
Revisado por: Francisco Quiroz Aguilar 60