Вы находитесь на странице: 1из 55

INSTITUTO TECNOLÓGICO SUPERIOR DE TIERRA BLANCA

MANUAL DE PRUEBA
DE HIPÓTESIS
Estadística inferencial I

MIP. Viridiana Sánchez Vázquez

Diciembre de 2016

Estadística Inferencial I
Contenido
3 Pruebas de hipótesis. .................................................................................................... 1

3.1 Introducción. ........................................................................................................... 1

3.2 Confiabilidad y significancia. ................................................................................... 1

3.3 Errores tipo I y tipo II. .............................................................................................. 2

3.4 Potencia de la prueba. ............................................................................................ 2

3.5 Formulación de hipótesis estadísticas. ................................................................... 4

3.6 Prueba de hipótesis para la media. ........................................................................ 5

3.7 Prueba de hipótesis para la diferencia de medias. ............................................... 15

3.8 Prueba de hipótesis para la proporción. ............................................................... 27

3.9 Prueba de hipótesis para la diferencia de proporciones. ...................................... 32

3.10 Prueba de hipótesis para la varianza. ................................................................. 38

3.11 Prueba de hipótesis para la relación de varianzas. ............................................ 43

Prácticas......................................................................................................................... 50

3.1 El tangram. ........................................................................................................... 50

3.2 Prueba de la vista. ................................................................................................ 51

2
3 Pruebas de hipótesis.

Competencia específica a desarrollar.

 Identificar y aplicar los conceptos básicos de una prueba de hipótesis.


 Identificar los diferentes fenómenos que se presentan en una prueba de hipótesis
 Identificar y analizar cuáles son los posibles fenómenos que se pueden analizar
a través de una prueba de hipótesis

3.1 Introducción.

Una prueba de hipótesis es una herramienta de análisis de datos que puede en general
formar parte de un experimento comparativo más completo. Una hipótesis es una
expresión a manera de conjetura, es decir, una proposición tentativa en modo afirmativo
acerca de la relación general o específica entre dos o más variables. En la formulación
de cualquier hipótesis es conveniente observar los dos criterios siguientes: deben
expresar relaciones entre variables; y además, ser inferencias que permitan probar las
relaciones establecidas. Esto indica que toda expresión hipotética estará integrada por
dos o más variables mensurables y tener una forma explícita del tipo de relación que se
supone existe entre éstas. La estructura de la prueba de hipótesis se establece usando
el término hipótesis nula, el cual se refiere a cualquier hipótesis que se desea probar y
se denota con H0. El rechazo de H0 conduce a la aceptación de una hipótesis
alternativa, que se denota con H1.

La formulación de la prueba de hipótesis se puede hacer de la siguiente manera:


 Rechazar H0 a favor de H1 debido a evidencia suficiente en los datos.
 No rechazar H0 debido a evidencia insuficiente en los datos.

3.2 Confiabilidad y significancia.

Tiene como objetivo principal evaluar suposiciones o afirmar acerca de los valores
estadísticos de la población, denominados parámetros.

1
3.3 Errores tipo I y tipo II.

Prueba de error tipo 1

Se comete el error tipo 1 cuando se rechaza la hipótesis nula y es verdadera, entonces


se ha cometido un error del tipo 1, el procedimiento de toma de decisiones recién
descrito podría conducir a cualquiera de dos conclusiones erróneas.
 El rechazo de la hipótesis nula cuando es verdadera se denomina error tipo I.
 No rechazar la hipótesis nula cuando es falsa se denomina error tipo II.

O también se denota como:


 Error tipo 1: se rechaza Ho cuando esta es verdadera.
 Error tipo 2: se acepta Ho cuando esta es falsa.

Error tipo 2.

La probabilidad de cometer un error tipo II, que se denota con β, es imposible de


calcular a menos que tengamos una hipótesis alternativa específica. De manera ideal,
es preferible utilizar un procedimiento de prueba con el cual haya pocas probabilidades
de cometer el error tipo I y el error tipo II. A medida que la hipótesis alternativa se
aproxima a la unidad, el valor de β tiende a disminuir hasta cero.

3.4 Potencia de la prueba.

La potencia del contraste es la probabilidad de detectar efectos estadísticamente


significativos, esto es, la probabilidad de rechazar la Hipótesis Nula cuando es falsa,
que se simboliza 1-beta, y es igual a la probabilidad de ocurrencia de valores del
estadístico en la región de rechazo bajo el supuesto que 𝐻1 (La Hipótesis Alternativa)
sea verdadera.

Ejemplo:
2
Supongamos que la probabilidad verdadera de ocurrencia de "cara" es igual a 0.8.
Tenemos:

La probabilidad de ocurrencia de los valores de la región de rechazo bajo el supuesto


de que la Hipótesis Alternativa sea verdadera es igual a 0.38 (Ver columna verde en la
siguiente tabla. 0.38 es igual a la suma de las probabilidades de ocurrencia de 0, 1, 9 o
10 caras)

En consecuencia, la probabilidad de rechazar H0 bajo el supuesto que H1 sea


verdadera es igual a 0.38. Si la Hipótesis Alternativa p=0.9 fuera verdadera 1-beta sería
igual a 0.74. (Puedes comprobarlo clicando en la imagen de la tabla e introduciendo 0.9
en la casilla verde de p(x). Puedes ver que la potencia de la prueba es mayor a medida
que la verdadera distribución muestral se aleja de la distribución muestral definida en la
Hipótesis Nula.

Principales características de la potencia de la prueba

El valor de la potencia es complementario al de beta (probabilidad de cometer errores


de tipo II), cuanto menor es alfa, mayor es beta, y viceversa.

Los valores de alfa y 1-beta están relacionados. Cuanto mayor sea alfa, mayor es 1-
beta.

El valor de la potencia depende de la verdadera posición del parámetro, que es


desconocida, pero podemos tomar medidas que generalmente la incrementan:
3
a) Hacer alfa más grande. Hay que tener en cuenta que esta medida también
incrementa la probabilidad de errores de tipo I (si H0 es verdadera).
b) Otra medida consiste en hacer más grande el tamaño de la muestra. La razón es
que disminuye la desviación típica de la distribución muestral (el Error Típico del
estadístico); en consecuencia los límites de la región de aceptación se acercan y
quedan más lejos de la verdadera distribución del estadístico, lo que incrementa
la probabilidad de que el estadístico de contraste se sitúe en la región de
rechazo.

3.5 Formulación de hipótesis estadísticas.

En la formulación de la hipótesis se deben emplear términos claros y concretos, de


modo que puedan ser definidos de modo operacional, a los fines de que otros
investigadores puedan refutar o corroborar la investigación realizada. Por lo tanto, toda
hipótesis, en el campo de la investigación científica, debe estar sujeta a referencias y a
una contrastación empírica. Por otra parte, deben ser objetivas y no se puedan incluir
en ellas juicios de valor, tipo que tal elemento o condición es “mejor o peor” que otro,
sino simplemente plantearse tal como objetivamente postula que el fenómeno estudiado
sucede en la realidad.

Estructura de la hipótesis

Las hipótesis contienen tres elementos estructurales que son:

 Las unidades de análisis o de observación. A saber, individuos, instituciones,


conglomerados.
 Las variables. Son los atributos, características, o propiedades cualitativas o
cuantitativas que manifiestan en las unidades de observación.
 El enlace lógico o término de relación. Que describe la relación existente entre
las unidades de análisis con las variables y de éstas entre sí.

En l hipótesis: “a mayor satisfacción entre la pareja, menor la frecuencia de infidelidad


conyugal”, las unidades de observación son las parejas, las variables: satisfacción e
infidelidad conyugal, el termino relación: a mayor…menor frecuencia.

4
3.6 Prueba de hipótesis para la media.

En particular al estudiar la media 𝜇, es de interés preguntarse si esta es igual, mayor o

menor acierto valor 𝜇0 . Donde este es conocido y por alguna razón es considerado un
valor estándar. La hipótesis sobre la media se puede probar suponiendo la varianza
poblacional 𝜎 2 conocida o desconocida. Sin embargo como la mayoría de los estudios
estadísticos es irreal suponer de antemano que se conoce la varianza, nos limitamos a
describir el caso cuando 𝜎 2 no se conoce.

Formula empleadas:

𝑥̅ −𝜇𝑜
𝑍𝑜 = El valor estadístico z, para muestra grande y desviación estándar
𝜎/√𝑛

poblacional desconocida se determina por la ecuación.

𝑥̅ −𝜇𝑜
𝑡𝑜 = 𝑆 En la prueba para una media poblacional con muestra pequeña y
√𝑛

desviación estándar poblacional desconocida se utiliza el valor estadístico t .

Ejemplo 3.1

Una muestra aleatoria de 100 muertes registradas en el estado de Veracruz, durante el


año pasado, reveló una vida promedio de 71.8 años. Si se supone una desviación
estándar poblacional de 8.9 años. Utilice un nivel de confianza de 95% y determine si
hay suficiente evidencia estadística para indicar que la vida media es mayor que 70
años.

𝐻0 : 𝜇 = 70

𝐻1 : 𝜇 > 70

Solución:

𝛼 = 1 − 0.95 = 0.05 𝑍𝛼 = 1.65

𝑥̅ − 𝜇𝑜 71.8 − 70
𝑍𝑜 = = = 2.02
𝜎/√𝑛 8.9/√100

5
2.02 > 1.65
𝑍𝑜 > 𝑍𝛼

Como 𝑍𝑜 > 𝑍𝛼 no se acepta 𝐻0 , eso quiere decir que si hay suficiente evidencia
estadística para demostrar que la vida media, en el estado de Veracruz, es mayor que
70 años.

Solución utilizando la hoja de cálculo.

Solución utilizando software estadístico.

Estadísticas > Estadística básica > Z de 1 muestra > Datos resumidos.

“Datos resumidos porque no se tiene el conjunto de datos de la muestra, solamente las


estadísticas de interés”

Llenar los datos como se muestra en la ventana.

6
En el botón Opciones…

Aceptar > Aceptar

El resultado en pantalla es:

7
Como 𝑣𝑎𝑙𝑜𝑟 − 𝑃 < 𝛼 se rechaza 𝐻0 .

Ejemplo 3.2

En un ingenio azucarero, 75 costales de 50 kilos tienen un peso promedio de 50.15


kilos. Los registros históricos muestran que la desviación estándar poblacional en peso
es de 0.8 kilos. ¿A un nivel de confianza del 95% los costales parecen estar llenos con
un promedio de 50 kilos?

𝐻0 : 𝜇 = 50

𝐻1 : 𝜇 ≠ 50

Solución:

𝛼 = 1 − 0.95 = 0.05
−𝑍𝛼/2 < 𝑍𝑜 < 𝑍𝛼/2
𝑥̅ − 𝜇𝑜 50.15 − 50
𝑍𝑜 = = = 1.62
𝜎/√𝑛 0.8/√75 −1.96 < 1.62 < 1.96

𝑍𝛼/2 = 1.96

Como −𝑍𝛼/2 < 𝑍𝑜 < 𝑍𝛼/2 se acepta 𝐻0 , lo que quiere decir, con una confianza del 95%
que los costales de azúcar tienen un peso de llenado de 50 kilos, en promedio.

Solución utilizando la hoja de cálculo.

Solución utilizando software estadístico.

8
Estadísticas > Estadística básica > Z de 1 muestra > Datos resumidos.

Llenar los datos como se muestra en la ventana.

En el botón Opciones…

Aceptar > Aceptar

El resultado en pantalla es:

9
Como 𝑣𝑎𝑙𝑜𝑟 − 𝑃 > 𝛼 se acepta 𝐻0 .

Ejemplo 3.3

Un negocio de comida rápida lanzó recientemente al mercado una hamburguesa de 1/4


de libra de carne. Un grupo de estudiantes universitarios compraron un total de 22
hamburguesas y utilizando su propia báscula, estiman los pesos promedio. La media
muestral es de 112.2 gramos, con desviación estándar muestral de 0.86. Utilice una
confianza del 90% para determinar si el negocio de comida rápida realmente vende
hamburguesas con 1/4 de libra de carne. Considere 1/4 de libra = 113.4 gramos

𝐻0 : 𝜇 = 113.4

𝐻1 : 𝜇 ≠ 113.4

Solución:

𝛼 = 1 − 0.9 = 0.1
𝑥̅ − 𝜇𝑜 112.2 − 113.4
𝛼/2 = 0.05 [Columna] 𝑡𝑜 = = = −6.54
𝑆 0.86
√𝑛 √22
𝑛 − 1 = 21 [Fila]
𝑡𝑜 < − 𝑡𝛼/2,𝑛−1
𝑡𝛼/2,𝑛−1 = 1.721
−6.54 < −1.721

Como 𝑡𝑜 < − 𝑡𝛼/2,𝑛−1 rechazo 𝐻0 . Entonces el peso promedio de la carne de las


hamburguesas no es de ¼ de libra.

Solución utilizando la hoja de cálculo.

10
Solución utilizando software estadístico.

Estadísticas > Estadística básica > t de 1 muestra > Datos resumidos.

Llenar los datos como se muestra en la ventana.

En el botón Opciones…

11
Aceptar > Aceptar

El resultado en pantalla es:

Como 𝑣𝑎𝑙𝑜𝑟 − 𝑃 < 𝛼 se rechaza 𝐻0 .

Ejemplo 3.4

Una pizzería local planea comprar una nueva flota de motos repartidoras. La decisión
depende de si el consumo de gasolina de las motocicletas es menor a $0.50 por
kilómetro. Las 8 motocicletas que prueba la empresa reportan una media de $0.55, con
una desviación estándar de $0.15. A un nivel de confianza de 99% ¿le aconsejaría a la
pizzería que compre la nueva flota de motos repartidoras?

𝐻0 : 𝜇 = 0.50

𝐻1 : 𝜇 < 0.50

Solución:

𝛼 = 1 − 0.99 = 0.01 𝑛 − 1 = 7 [Fila]

𝛼 = 0.01 [Columna] 𝑡𝛼,𝑛−1 = 2.998


12
𝑡𝑜 > − 𝑡𝛼,𝑛−1
𝑥̅ − 𝜇𝑜 0.55 − 0.50
𝑡𝑜 = = = 0.94 0.94 > −2.998
𝑆/√𝑛 0.15/√8

Como 𝑡𝑜 > − 𝑡𝛼,𝑛−1 acepto 𝐻𝑂 , por lo tanto el consumo de gasolina por kilómetro es
mayor o igual a $0.50, la recomendación a la pizzería es que no compre las nuevas
motos.

Solución utilizando la hoja de cálculo.

Solución utilizando software estadístico.

Estadísticas > Estadística básica > t de 1 muestra > Datos resumidos.

Llenar los datos como se muestra en la ventana.

13
En el botón Opciones…

Aceptar > Aceptar

El resultado en pantalla es:

14
Como 𝑣𝑎𝑙𝑜𝑟 − 𝑃 > 𝛼 se acepta 𝐻0 .

3.7 Prueba de hipótesis para la diferencia de medias.

En ocasiones interesa definir un intervalo de valores tal que permita establecer cuáles
son los valores mínimo y máximo aceptables para la diferencia entre las medias de dos
poblaciones. Pueden darse dos situaciones según las muestras sean o no
independientes; siendo en ambos casos condición necesaria que las poblaciones de
origen sean normales o aproximadamente normales.

Formulas empleadas:

𝑥̅ 1 −𝑥̅ 2
𝑍𝑜 = Para muestras grandes.
2 2
√𝑆1 +𝑆2
𝑛1 𝑛2

𝑥̅ 1 −𝑥̅ 2
𝑡𝑜 = Para prueba de hipótesis con dos muestras independientes.
𝑆2 2
𝑝 𝑆𝑝
√ +
𝑛1 𝑛2

(𝑛1 −1)𝑆1 2 +(𝑛2 −1)𝑆2 2


𝑆𝑝2 = La varianza ponderada.
𝑛1 +𝑛2 −2

𝑥̅ 1 −𝑥̅2
𝑡𝑜 = Para muestras chicas, prueba de hipótesis para la diferencia
𝑆2 𝑆2
√ 1+ 2
𝑛1 𝑛2

de medias. Muestras independientes, varianza desconocida.

𝑆 𝑆2 2 2
[ 1 + 2 ]
𝑛1 𝑛2
𝑔𝑙 = 2 2 2 Ecuación welch satterthwaite.
𝑆 𝑆 2
[ 1 ⁄𝑛1 ] [ 2 ⁄𝑛2 ]
+
𝑛1 −1 𝑛2 −1

Ejemplo 3.5

Una empresa de correspondencia tiene dos rutas posibles entre las ciudades de
Chicago y Kansas City. Una muestra de 80 envíos por la ruta norte reveló un tiempo
promedio de 26 horas con una desviación estándar de 5.3 horas, mientras que 35
envíos por la ruta del sur necesitaron un promedio de 22 horas para ser entregados con

15
una desviación estándar de 4.5 horas. Dígale al jefe de logística, con una confianza del
95%, si el tiempo promedio de entrega entre las dos rutas es igual.

𝐻0 : µ1 − µ2 = 0

𝐻1 : µ1 − µ2 ≠ 0

Solución:

𝛼 = 1 − 0.95 = 0.05

𝑥̅1 − 𝑥̅2 26 − 22
𝑍𝑜 = = = 4.15
2 2
2 2 √(5.3) + (4.5) 𝑍𝑜 > 𝑍𝛼/2
√𝑆1 + 𝑆2 80 35
𝑛1 𝑛2
4.15 > 1.96
𝑍𝛼/2 = 1.96

Como 𝑍𝑜 > 𝑍𝛼/2 no se acepta 𝐻0 , con lo que se puede concluir que las dos rutas tienen
tiempos de entrega diferentes.

Solución utilizando la hoja de cálculo.

Solución utilizando software estadístico.

Estadísticas > Estadística básica > t de 2 muestras > Datos resumidos.

16
“t de 2 muestras porque el software no ofrece la opción Z de 2 muestras, la conclusión
es la misma. Recuerde que mientras más grande sea el tamaño de muestra la
distribución t se aproxima a la normal”

Llenar los datos como se muestra en la ventana.

En el botón Opciones…

Aceptar > Aceptar

El resultado en pantalla es:

17
Como 𝑣𝑎𝑙𝑜𝑟 − 𝑃 < 𝛼 se rechaza 𝐻0 .

Ejemplo 3.6

El servicio de atención al cliente de una compañía telefónica recientemente instituyó


dos programas de capacitación para mejorar la calidad del servicio. Para probar la
efectividad relativa de cada programa, a 45 representantes entrenados en el primer
programa se les hizo una prueba de competencia. El puntaje promedio obtenido fue 76
con 𝑆1 = 13.5 puntos. Las 40 personas entrenadas bajo el segundo programa
reportaron un puntaje promedio de 77.97 y 𝑆2 = 9.05. El gerente de recursos humanos
desea saber si el segundo programa es mejor que el primero, por lo que usted decide
realizar la prueba al 99% de confianza para determinar si el programa dos tuvo mejores
resultados que el primero.

𝐻0 : µ1 − µ2 = 0

𝐻1 : µ1 − µ2 < 0

Solución:

𝛼 = 1 − 0.99 = 0.01 𝑍𝛼 = 2.33

𝑥̅1 − 𝑥̅2 76 − 77.97


𝑍𝑜 = = = −0.80
2 2
2 2 √(13.5) + (9.05)
√𝑆1 + 𝑆2 45 40
𝑛1 𝑛2

18
𝑍𝑜 > −𝑍𝛼

−0.80 > −2.33

Como 𝑍𝑜 > −𝑍𝛼 acepto 𝐻0 , por lo tanto se le puede comunicar al gerente de recursos
humanos que los dos programas de capacitación reportaron resultados
estadísticamente iguales.

Solución utilizando la hoja de cálculo.

Solución utilizando software estadístico.

Estadísticas > Estadística básica > t de 2 muestras > Datos resumidos.

Llenar los datos como se muestra en la ventana.

19
En el botón Opciones…

Aceptar > Aceptar

El resultado en pantalla es:

20
Como 𝑣𝑎𝑙𝑜𝑟 − 𝑃 > 𝛼 se acepta 𝐻0 .

Ejemplo 3.7

En un reconocido hotel del centro de la ciudad, se realizó una investigación donde se


determinó que la vida promedio de las lámparas de las habitaciones es de 295 días con
desviación estándar de 8 días, dicha muestra fue de 12 lámparas. El técnico en
electricidad modificó un elemento del circuito para que tengan una mayor duración. Se
realizó un experimento con una muestra de 10 lámparas y se encontró que la vida
media ahora es de 301 días con una desviación estándar de 12 días. Asuma la igualdad
de varianzas. A un nivel de confianza de 95% ¿la modificación incrementó la vida de las
lámparas?

𝐻0 : µ1 − µ2 = 0

𝐻1 : µ1 − µ2 > 0

Solución:

𝛼 = 1 − 0.95 = 0.05

(𝑛1 − 1)𝑆1 2 + (𝑛2 − 1)𝑆2 2 (12 − 1)(8)2 + (10 − 1)(12)2


𝑆𝑝2 = = = 100
𝑛1 + 𝑛2 − 2 12 + 10 − 2

𝑥̅1 − 𝑥̅2 295 − 301 𝑡𝛼,𝑛1 +𝑛2 −2 = 1.725


𝑡𝑜 = = = −1.4
𝑆2 𝑆2 √100 + 100
√ 𝑝+ 𝑝 12 10
𝑛1 𝑛2

21
−1.4 < 1.725
𝑡𝑜 < −𝑡𝛼,𝑛1 +𝑛2 −2

Como 𝑡𝑜 < −𝑡𝛼,𝑛1 +𝑛2 −2 acepto 𝐻0 . En conclusión se puede decir que no hay suficiente
evidencia estadística que demuestre que la modificación en el circuito eléctrico
incrementa la vida útil de las lámparas, a una confianza del 95%.

Solución utilizando la hoja de cálculo.

Solución utilizando software estadístico.

Estadísticas > Estadística básica > t de 2 muestras > Datos resumidos.

Llenar los datos como se muestra en la ventana.

22
En el botón Opciones…

Aceptar > Aceptar

El resultado en pantalla es:

23
Como 𝑣𝑎𝑙𝑜𝑟 − 𝑃 > 𝛼 se acepta 𝐻0 .

Ejemplo 3.8

Una empresa acerera compra materias primas de dos proveedores. Los directivos están
preocupados sobre los retrasos en la entrega de los materiales. Una muestra de 10
envíos del proveedor A tienen un tiempo de entrega promedio de 8.8 días y 𝑆 = 2.57
días, mientras que 16 envíos del proveedor B tienen un promedio de 6.5 días y 𝑆 =
1.93. El gerente de planta pide un análisis estadístico para determinar si existe
diferencia significativa entre los tiempos de entrega de los proveedores. Si es así, se
pretende realizar la mayoría de encargos a un solo proveedor ¿qué recomendación
haría con base en una confianza del 90% para la diferencia en los tiempos de entrega?
No existe razón suficiente para asumir que las varianzas son iguales.

𝐻0 : µ1 − µ2 = 0

𝐻1 : µ1 − µ2 ≠ 0

Solución:

𝛼 = 1 − 0.9 = 0.1

𝑥̅1 − 𝑥̅2 8.8 − 6.5


𝑡𝑜 = = = 2.43
2 2
𝑆2 𝑆22 √(2.57) + (1.93)
√ 1
𝑛1 + 𝑛2 10 16

24
𝑆 𝑆2 2 2 (2.57)2 (1.93)2
2
[ 1 + 2 ] [ + ]
𝑛1 𝑛2 10 16
𝑔𝑙 = 2 2 = 2 2 = 15 [Fila]
𝑆1 2⁄ 𝑆 2 (2.57)2⁄ (1.93)2⁄
[ 𝑛1 ] [ 2 ⁄𝑛 ] [ 10] [ 16]
2
+ +
𝑛1 −1 𝑛2 −1 10−1 16−1

𝛼/2 = 0.05 [Columna]


𝑡𝑜 > 𝑡𝛼/2,𝑔𝑙
𝑡𝛼/2,𝑔𝑙 = 1.753
2.43 > 1.753

Como 𝑡𝑜 > 𝑡𝛼/2,𝑔𝑙 se rechaza 𝐻0 . Con una confianza del 90% se determina que si hay
una diferencia significativa entre los tiempos de entrega de los proveedores. La
recomendación para el gerente de planta es que si podría realizar la mayoría de
encargos a un solo proveedor, en este caso sería el proveedor B.

Solución utilizando la hoja de cálculo.

Solución utilizando software estadístico.

Estadísticas > Estadística básica > t de 2 muestras > Datos resumidos.

Llenar los datos como se muestra en la ventana.

25
“Se desmarca la opción Asumir varianzas iguales porque el problema así lo indica”

En el botón Opciones…

Aceptar > Aceptar

El resultado en pantalla es:

26
Como 𝑣𝑎𝑙𝑜𝑟 − 𝑃 < 𝛼 se rechaza 𝐻0 .

3.8 Prueba de hipótesis para la proporción.

Las pruebas de proporciones son adecuadas cuando los datos que se están analizando
constan de cuentas o frecuencias de elementos de dos o más clases. El objetivo de
estas pruebas es evaluar las afirmaciones con respecto a una proporción (o Porcentaje)
de población Las pruebas se basan en la premisa de que una proporción muestral (es
decir, x ocurrencias en n observaciones, o x/n) será igual a la proporción verdadera de
la población si se toman márgenes o tolerancias para la variabilidad muestral .

Formula empleadas:

𝑃−𝑃𝑜
𝑍𝑜 = Para muestras grandes, esta prueba comprende el cálculo del
𝑃 (1−𝑃𝑜 )
√ 𝑜
𝑛

valor estadístico de prueba Z.

Ejemplo 3.9

Las estadísticas nacionales indican que el 48% de los estudiantes de nivel medio
superior tienen una computadora propia. Si una muestra 1,020 estudiantes revela que
473 tienen computadora. Con una confianza de 99% ¿usted puede afirmar la
suposición de que la muestra tiene la misma proporción que la población?

𝐻0 : 𝑃 = 0.48

𝐻1 : 𝑃 ≠ 0.48

27
Solución:

𝛼 = 1 − 0.99 = 0.01

473
𝑃= = 0.46
1020

𝑃 − 𝑃𝑜 0.46 − 0.48
𝑍𝑜 = = = −1.04
√𝑃𝑜 (1 − 𝑃𝑜 ) √0.48(1 − 0.48) −𝑍𝛼/2 < 𝑍𝑜 < 𝑍𝛼/2
𝑛 1020

−2.58 < −1.04 < 2.58


𝑍𝛼/2 = 2.58

Como −𝑍𝛼/2 < 𝑍𝑜 < 𝑍𝛼/2 cae en el área de aceptación; se puede afirmar que la
suposición de que el 48% de estudiantes de nivel medio superior tienen una
computadora propia es verdadera, con una confianza al 99%.

Solución utilizando la hoja de cálculo.

Solución utilizando software estadístico.

Estadísticas > Estadística básica > 1 proporción > Datos resumidos.

Llenar los datos como se muestra en la ventana.

28
En el botón Opciones…

“Marque la opción Utilice la prueba y el intervalo basado en la distribución normal, para


que obtenga el estadístico Z”

Aceptar > Aceptar

El resultado en pantalla es:

29
Como 𝑣𝑎𝑙𝑜𝑟 − 𝑃 > 𝛼 se acepta 𝐻0 .

Ejemplo 3.10

En una planta empacadora de arroz, se tienen registros que indican que el 36% de
todas las devoluciones de producto se deben a que los empaques llegan rotos. Un
ingeniero desarrolla un proyecto de mejora. Después de aplicarlo toma 425 muestras
que revelan que ahora solamente 115 defectos se debieron a empaques rotos. A una
confianza de 95% ¿existe suficiente evidencia estadística para suponer que el proyecto
de mejora logró reducir significativamente la proporción de devoluciones por empaques
rotos?

𝐻0 : 𝑃 = 0.36

𝐻1 : 𝑃 < 0.36

Solución:

𝛼 = 1 − 0.95 = 0.05

115
𝑃= = 0.27
425

𝑃 − 𝑃𝑜 0.27 − 0.36
𝑍𝑜 = = = −3.84
√𝑃𝑜 (1 − 𝑃𝑜 ) √0.36(1 − 0.36) 𝑍𝑜 < −𝑍𝛼
𝑛 425

−3.84 < −1.65


𝑍𝛼 = 1.65

Como 𝑍𝑜 < −𝑍𝛼 , no se acepta la hipótesis nula. Por lo tanto, si existe suficiente
evidencia estadística para suponer que el proyecto de mejora, que desarrolló el
ingeniero, si logró reducir significativamente la proporción de devoluciones por
empaques rotos.

Solución utilizando la hoja de cálculo.

30
Solución utilizando software estadístico.

Estadísticas > Estadística básica > 1 proporción > Datos resumidos.

Llenar los datos como se muestra en la ventana.

En el botón Opciones…

31
Aceptar > Aceptar

El resultado en pantalla es:

Como 𝑣𝑎𝑙𝑜𝑟 − 𝑃 < 𝛼 se rechaza 𝐻0 .

3.9 Prueba de hipótesis para la diferencia de proporciones.

En algunos diseños de investigación el plan muestra requiere seleccionar dos muestras


independiente calcular las proporciones muéstrales y usar la diferencia de las dos
proporciones para estimar o probar una diferencia entre las mismas.

Formulas empleadas:

𝑃1 −𝑃2
𝑍𝑜 = 1 1
Para muestras grandes, a partir de dos muestras
√𝑃(1−𝑃)(𝑛 +𝑛 )
1 2

aleatorias e independientes.

Ejemplo 3.11

32
Se organizó una votación entre los habitantes de una ciudad y una comunidad aledaña
a la misma, con la finalidad de determinar si se aprueba una propuesta para la
construcción de una planta productora de biocombustible. La encuesta se realizó para
determinar si hay una diferencia significativa en la proporción de habitantes de la ciudad
y de la comunidad que están a favor de la propuesta. Si 345 de 500 votantes de la
ciudad están a favor y 193 de 380 de la comunidad también lo hacen. ¿Estaría de
acuerdo en que la proporción de habitantes de la ciudad que favorecen la propuesta es
mayor que la proporción de votantes de la comunidad? Utilice un nivel de confianza de
95%.

𝐻0 : 𝑃1 − 𝑃2 = 0

𝐻1 : 𝑃1 − 𝑃2 > 0

Solución:

𝛼 = 1 − 0.95 = 0.05

345 193 345 + 193


𝑃1 = = 0.69 𝑃2 = = 0.51 𝑃= = 0.61
500 380 500 + 380

𝑃1 − 𝑃2 0.69 − 0.51
𝑍𝑜 = = = 5.42
1 1
√𝑃(1 − 𝑃) ( + ) √0.61(1 − 0.61) ( 1 + 1 )
𝑛1 𝑛2 500 380

𝑍𝑜 > 𝑍𝛼
𝑍𝛼 = 1.65
5.42 > 1.65

Como 𝑍𝑜 > 𝑍𝛼 rechazo 𝐻0 . Por lo tanto, la proporción de habitantes de la ciudad que


están a favor de la propuesta si es mayor que en la comunidad.

Solución utilizando la hoja de cálculo.

33
Solución utilizando software estadístico.

Estadísticas > Estadística básica > 2 proporciones > Datos resumidos.

Llenar los datos como se muestra en la ventana.

En el botón Opciones…

34
“Marque la opción Utilice el cálculo agrupado de p para la prueba, para que se
obtengan los mismos valores que en la resolución con fórmulas”

Aceptar > Aceptar

El resultado en pantalla es:

Como 𝑣𝑎𝑙𝑜𝑟 − 𝑃 < 𝛼 se rechaza 𝐻0 .

Ejemplo 3.12

La empresa donde usted labora, utiliza dos máquinas diferentes para cortar tiras de
hule. Se han presentado problemas en cuanto a la longitud de las tiras, debido al
funcionamiento de las máquinas. Como gerente del departamento de control de calidad
su trabajo es estimar la diferencia en la proporción de defectos producidos por cada
máquina. Se tomaron muestras de tamaños 𝑛1 = 120 y 𝑛2 = 95; la primera máquina
produjo 17 defectos y la segunda 16. Fije 𝛼 = 0.05 y determine si la evidencia sugiere
que existe una diferencia entre las proporciones de defectos en ambas máquinas.

35
𝐻0 : 𝑃1 − 𝑃2 = 0

𝐻1 : 𝑃1 − 𝑃2 ≠ 0

Solución:

𝛼 = 0.05

17 16 17 + 16
𝑃1 = = 0.14 𝑃2 = = 0.17 𝑃= = 0.15
120 95 120 + 95

𝑃1 − 𝑃2 0.14 − 0.17
𝑍𝑜 = = = −0.61
1 1
√𝑃(1 − 𝑃) ( + ) √0.15(1 − 0.15) ( 1 + 1 )
𝑛1 𝑛2 120 95

−𝑍𝛼/2 < 𝑍𝑜 < 𝑍𝛼/2


𝑍𝛼/2 = 1.96
−1.96 < −0.61 < 1.96

Como −𝑍𝛼/2 < 𝑍𝑜 < 𝑍𝛼/2 acepto 𝐻0 . Por lo tanto no existe evidencia suficiente para
determinar que las proporciones de defectos producidas por ambas máquinas son
diferentes.

Solución utilizando la hoja de cálculo.

Solución utilizando software estadístico.


36
Estadísticas > Estadística básica > 2 proporciones > Datos resumidos.

Llenar los datos como se muestra en la ventana.

En el botón Opciones…

Aceptar > Aceptar

El resultado en pantalla es:

37
Como 𝑣𝑎𝑙𝑜𝑟 − 𝑃 > 𝛼 se acepta 𝐻0 .

3.10 Prueba de hipótesis para la varianza.

En situaciones como control estadístico de la calidad, de antemano se conocen los


parámetros de referencia del proceso bajo control. La actividad central para decir si en
un momento dado, el proceso está bajo control, es la confrontación permanente de los
datos obtenidos con la hipótesis sobre la centralidad del proceso (media) y sobre la
magnitud de su variabilidad (varianza).

La varianza como medida de dispersión es importante dada que nos ofrece una mejor
visión de dispersión de datos.

Formulas empleadas:

(𝑛−1)𝑆 2
𝜒𝑜2 = Para muestras chicas con distribución normal.
𝜎𝑜2

Ejemplo 3.13

Un fabricante de bombas de agua afirma que la duración de su producto sigue


aproximadamente una distribución normal con desviación estándar de 0.7 años. Una
muestra de 15 productos tuvo una desviación estándar de 1.3 años. Pruebe con una
significancia de 1%, si la desviación estándar observada es mayor que la que afirma el
fabricante.

𝐻0 : 𝜎 2 = 0.49

𝐻1 : 𝜎 2 > 0.49

38
Solución:

𝛼 = 1% = 0.01

(𝑛 − 1)𝑆 2 (15 − 1)(1.3)2


𝜒𝑜2 = = = 48.29
𝜎𝑜2 0.49

𝛼 = 0.01 [Columna]
𝜒𝑜2 > χ2α,n−1
𝑛 − 1 = 14 [Fila]
48.29 > 29.141
χ2α,n−1 = 29.141

Como 𝜒𝑜2 > χ2α,n−1 se rechaza 𝐻0 , por lo tanto si existe suficiente evidencia para afirmar
que la variabilidad en la duración de las bombas de agua es mayor que la que dice el
fabricante.

Solución utilizando la hoja de cálculo.

Solución utilizando software estadístico.

Estadísticas > Estadística básica > 1 varianza

Llenar los datos como se muestra en la ventana.

39
“En Datos elegir Desviación estándar de la muestra porque los datos del problema así
lo indican”

“Seleccionar desviación estándar hipotética porque el problema pide realizar la prueba


para desviación estándar de 0.7 años”

En el botón Opciones…

Aceptar > Aceptar

El resultado en pantalla es:

40
Como 𝑣𝑎𝑙𝑜𝑟 − 𝑃 < 𝛼 se rechaza 𝐻0 .

Ejemplo 3.14

Usted es el gerente de un restaurante de comida rápida, en el que tienen una máquina


dispensadora de refresco, que está programada para llenar vasos de 16 onzas. De una
muestra de 20 vasos de refresco obtuvo una variación en el llenado de 𝑆 2 = 0.4.
Realice una prueba al 95% de confianza para determinar que la varianza de la muestra
sea menor que una variación de 0.3. Si no se cumple dicha suposición ordenaría que el
técnico aplique mantenimiento a la máquina dispensadora. ¿Cuál es su decisión?

𝐻0 : 𝜎 2 = 0.3

𝐻1 : 𝜎 2 < 0.3

Solución:

α = 1 − 0.95 = 0.05

(𝑛 − 1)𝑆 2 (20 − 1)(0.4)


𝜒𝑜2 = = = 25.33
𝜎𝑜2 0.3

1 − α = 0.95 [Columna]
2
𝜒𝑜2 > 𝜒1−α,𝑛−1
𝑛 − 1 = 19 [Fila]
25.33 > 10.117
2
𝜒1−α,𝑛−1 = 10.117

41
2
Como 𝜒𝑜2 > 𝜒1−α,𝑛−1 acepto 𝐻0 . Por lo que se entiende que la varianza en el llenado no
es menor que 0.3. El técnico si debe darle mantenimiento a la máquina dispensadora.

Solución utilizando la hoja de cálculo.

Solución utilizando software estadístico.

Estadísticas > Estadística básica > 1 varianza

Llenar los datos como se muestra en la ventana.

“Obsérvese que ahora se eligió Varianza de la muestra y Varianza hipotética, debido a


las necesidades del problema”

En el botón Opciones…
42
Aceptar > Aceptar

El resultado en pantalla es:

Como 𝑣𝑎𝑙𝑜𝑟 − 𝑃 > 𝛼 se acepta 𝐻0 .

3.11 Prueba de hipótesis para la relación de varianzas.

A diferencia de otras pruebas de medias que se basan en la diferencia existente entre


dos valores, el análisis de varianza emplea la razón de las estimaciones, dividiendo la
estimación intermediaste entre la estimación interna. El valor estadístico de prueba
resultante se debe comparar con un valor tabular de F, que indicará el valor máximo del
valor estadístico de prueba que ocurría si H0 fuera verdadera, a un nivel de
significación seleccionado.

Fórmula empleada:

43
𝑆12
𝐹𝑜 = Para muestras chicas, cálculo de la razón F a partir de datos
𝑆22

muéstrales.

Ejemplo 3.15

Un nuevo modelo de llantas para automóvil ha sido desarrollado por una reconocida
marca. Los fabricantes tienen la hipótesis que sostiene que las varianzas de las
distancias de frenado sobre pavimento seco y húmedo son iguales. En un estudio a 16
automóviles que iban a la misma velocidad y usaban las nuevas llantas se les hizo
frenar sobre pavimento seco y después sobre pavimento húmedo. En pavimento seco
la desviación estándar de la distancia de frenado fue de 8.4 metros y sobre pavimento
húmedo se obtuvo una desviación estándar de 9.6 metros. Con una significancia de
0.05 ¿los datos del experimento demuestran, efectivamente, que no existe una
diferencia entre las varianzas de las distancias de frenado?

𝐻0 : 𝜎12 − 𝜎22 = 0

𝐻1 : 𝜎12 − 𝜎22 ≠ 0

Solución:

α = 0.05

𝑆12 70.56
𝐹𝑜 = 2 = = 0.77
𝑆2 92.16

α/2 = 0.025 [Tabla F=0.025]


𝐹1−α/2,𝑣1 ,𝑣2 < 𝐹𝑜 < 𝐹α/2,𝑣1,𝑣2
𝑣1 = 𝑛1 − 1 = 15 [Columna]
0.35 < 0.77 < 2.86
𝑣2 = 𝑛2 − 1 = 15 [Fila]

𝐹α/2,𝑣1,𝑣2 = 2.86

𝐹1−α/2,𝑣1 ,𝑣2 = (2.86)−1 = 0.35

44
Como 𝐹𝑜 cae en el área de aceptación, se puede decir que si existe suficiente evidencia
estadística para demostrar que no hay diferencia entre las varianzas de las distancias
de frenado del pavimento seco y húmedo.

Solución utilizando la hoja de cálculo.

Solución utilizando software estadístico.

Estadísticas > Estadística básica > 2 varianzas

Llenar los datos como se muestra en la ventana.

En el botón Opciones…

45
Aceptar > Aceptar

El resultado en pantalla es:

Como 𝑣𝑎𝑙𝑜𝑟 − 𝑃 > 𝛼 se acepta 𝐻0 .

Ejemplo 3.16
46
El proceso de inspección de camiones de carga, en una empresa de transporte, debe
tomar en promedio 1 hora. Los inspectores tienen dos métodos para llevar a cabo su
trabajo y debido a la nueva norma de calidad implementada se deberá estandarizar un
solo método. Con el primer método, en una muestra de 10 inspecciones se obtuvo una
desviación estándar de 0.1 horas. Una segunda muestra de 6 inspecciones con el
método dos arrojó una desviación estándar de 0.2 horas. Pruebe la hipótesis de que el
primer método tiene una varianza menor, con una confianza de 90% ¿Cuál de los dos
métodos se deberá estandarizar y cuál será eliminado?

𝐻0 : 𝜎12 − 𝜎22 = 0

𝐻1 : 𝜎12 − 𝜎22 < 0

Solución:

α = 1 − 0.9 = 0.1

𝑆12 0.01
𝐹𝑜 = = = 0.25
𝑆22 0.04

α = 0.1 [Tabla F=0.1]


𝐹𝑜 < 𝐹1−α,𝑣1 ,𝑣2
𝑣1 = 𝑛1 − 1 = 9 [Columna]
0.25 < 0.301
𝑣2 = 𝑛2 − 1 = 5 [Fila]

𝐹α,𝑣1 ,𝑣2 = 3.32

𝐹1−α,𝑣1 ,𝑣2 = (3.32)−1 = 0.301

Como 𝐹𝑜 < 𝐹1−α,𝑣1 ,𝑣2 rechazo 𝐻0 . Significa que la variación del método de inspección 1
es menor que la del método 2. Por lo tanto la recomendación es que se estandarice el
método 1 y se elimine el método 2, con una confianza del 90%.

Solución utilizando la hoja de cálculo.

47
Solución utilizando software estadístico.

Estadísticas > Estadística básica > 2 varianzas

Llenar los datos como se muestra en la ventana.

En el botón Opciones…

48
Aceptar > Aceptar

El resultado en pantalla es:

Como 𝑣𝑎𝑙𝑜𝑟 − 𝑃 < 𝛼 se rechaza 𝐻0 .

49
Prácticas.

3.1 El tangram.

Se elige una muestra aleatoria de 25 personas, tanto hombres como mujeres, y se mide
el tiempo que tardan en armar todas las figuras. Los datos deben registrar el tiempo, en
segundos, que tardó una persona armando las cinco figuras y si es hombre o mujer.
Con el conjunto de datos recolectados responda lo siguiente:

a) ¿Puede concluir que el tiempo de armado promedio en general, tanto de


hombres como de mujeres, es menor que 45 segundos? Utilice 𝛼 = 0.01.
b) Si utiliza una confianza de 95% ¿La desviación estándar del tiempo de armado,
tanto de hombres como de mujeres, es estadísticamente mayor que 10
segundos?
c) ¿Existe suficiente evidencia estadística para determinar, con una confianza del
90%, que el tiempo promedio para armar las cinco figuras es diferente entre
hombres y mujeres?
d) Con una significancia de 0.05, pruebe si la variación del tiempo de armado de las
figuras de los hombres es diferente que la variación del tiempo de las mujeres.

50
3.2 Prueba de la vista.

Según el Instituto Nacional de Estadística y Geografía (INEGI), en 2015, el 56.2% de


personas de 15 a 29 años de edad tienen limitación para ver. Tome una muestra de 40
personas, que tengan entre 15 y 29 años, y pídales realizar el examen de la vista, hasta
la fila 8 (20/20), auxiliándose de la tabla que se anexa. Para efectos prácticos, deje tres
metros de distancia entre la persona y la tabla. Sus datos deben registrar si la persona
es hombre o mujer, si usa lentes y si tuvo problemas al realizar la prueba o no. La
prueba deberán realizarla sin anteojos ni lentes de contacto. Con la información
recopilada responda lo siguiente:

a) De todas las personas que tomó como muestra ¿se puede concluir que la
proporción de personas que tienen limitaciones para ver es menor que lo que
dice el INEGI? Responda esto a un 95% de confianza.
b) Divida a su muestra en dos grupos, hombres y mujeres. Pruebe si la proporción
de hombres con limitaciones visuales es mayor que lo que indica el INEGI. Utilice
𝛼 = 0.1.
c) Repita el inciso b, pero ahora para las mujeres.
d) Con una significancia de 0.01, pruebe si la proporción de hombres con
limitaciones visuales es diferente que la proporción de las mujeres.
e) Finalmente, ¿existe suficiente evidencia estadística para determinar, con una
confianza del 95%, que la proporción de personas que dice utilizar lentes es
diferente a la proporción de personas que tuvo problemas para realizar la
prueba? ¿Qué puede concluir al respecto?

51
52
53