Вы находитесь на странице: 1из 29

Facultad de Ingeniería Minas

ESTADÍSTICA Y PROBABILIDAD

Semana 14:
PRUEBA DE HIPÓTESIS PARA LA
MEDIA POBLACIONAL (µ) y
PROPORCIÓN POBLACIONAL (π)
Mg. Elizabeth Zambrano
PLAN DE CLASES

• Motivación.
• Competencias
Inicio • Saberes previos.

• Definiciones básicas
• Prueba de hipótesis para la media:
• Cuando la varianza es conocida
Construcción • Cuando la varianza es desconocida
• Prueba de hipótesis de la proporción

• Retroalimentación.
Cierre • Autoevaluación
Motivación
JOHN
JOHN MORRELL
MORRELL & & COMPANY*CINCINNATI,
COMPANY*CINCINNATI, OHIO OHIO
John
John Morrell
Morrell && Company,
Company, que
que se
se inició
inició en
en Inglaterra
Inglaterra en
en 1827,
1827, es
es considerado
considerado elel fabricante
fabricante de
de
productos
productos dede carne
carne más
más antiguo
antiguo de
de Estados
Estados Unidos;
Unidos; ofrece
ofrece aa los
los consumidores
consumidores una una amplia
amplia
línea
línea de
de productos
productos dede carne
carne procesada
procesada yy carne
carne fresca
fresca de
de puerco
puerco dede 13
13 marcas
marcas regionales
regionales que
que
comprenden
comprenden JohnJohn Morrell,
Morrell, E-Z-Cut,
E-Z-Cut, etc.
etc. Cada
Cada marca
marca regional
regional disfruta
disfruta del
del reconocimiento
reconocimiento yy la
la
lealtad
lealtad de
de sus
sus consumidores.
consumidores.

Las investigaciones de mercado de Morrell proporcionó a los directivos


información actualizada acerca de los diversos productos de la empresa y
sobre su posición en relación con las otras marcas de productos similares.

Se comparó uno de los productos de Morrell, Beef Pot Roast, con productos
similares de dos de los competidores principales. En esta prueba se empleó
una muestra de consumidores para que indicaran cómo calificaban a los
productos en términos de sabor, apariencia, aroma y preferencia.

Una de las cuestiones que se deseaba investigar era si el producto de Morrell


era la elección de preferencia de más de 50% de la población de
consumidores. Si p representa la proporción poblacional que prefiere el
producto de Morrell, la prueba de hipótesis para la cuestión que se investiga
es la siguiente:
3
COMPETENCIAS Identifica los
elementos básicos de
una PH

Resuelve problemas y Formula e interpreta


usa Excel e apropiadamente pruebas de Comprende el error
interpreta resultados hipótesis para un tipo I
del software parámetro con la finalidad
de toma de decisiones.

Realiza la PH para
la media y
proporción
SABERES PREVIOS

Uso de la tabla distribución Normal.

Uso de la tabla t de Student.

Cálculo de estimadores como la media muestral, varianza


muestral o desviación estándar muestral.
¿Qué es una Hipótesis estadística?

Es una proposición o supuesto sobre los parámetros de una o


más poblaciones. Principalmente sobre la media (µ), varianza
(2 ), proporción (), etc.

¿Qué es una Prueba de hipótesis?

Es un procedimiento basado en:


• Evidencia de la muestra
• La teoría de la probabilidad
Se emplea para determinar si la hipótesis nula es
• Un enunciado razonable y no debe rechazarse
• Un enunciado no razonable y debe ser rechazado
Hipótesis Estadística

Hipótesis Nula (H0) Hipótesis Alterna (H1)


(Ha)
 Es la negación de la  Es la hipotesis que pretende
hipótesis alterna. demostrar el investigador.

 Lleva los signos igual,  Lleva los signos diferente ,


mayor igual y menor igual. Mayor o menor ( ≠, > ó <).
Tipos de Errores
H0: El conocimiento promedio es igual a 14 (µ≥14)
H1: El conocimiento promedio es menor 14 (µ<14)

Realidad
Ho cierta Ho falsa
(µ ≥ 14) (µ < 14)

Error tipo I Correcto


(en base a los

Se rechaza Ho
resultados)

El promedio de conocimiento
Decisión

(µ < 14)
es menor a 14 y en realidad es El promedio de conocimiento es menor
mayor o igual a 14 a 14 y en realidad es menor a 14

Correcto Error tipo II


No se rechaza Ho
(µ ≥ 14) El promedio de conocimiento es mayor El promedio de conocimiento es mayor o
o igual a 14 y en realidad es mayor o igual a 14 y en realidad el conocimiento
igual a 14 promedio es menor a 14

8
Prueba de Hipótesis para la media poblacional (µ)

UNILATERAL A LA UNILATERAL A LA
PASOS IZQUIERDA BILATERAL DERECHA

1. Hipótesis H 0 :   0 H 0 :   0 H 0 :   0
estadística H1 :    0 H1 :    0 H1 :    0
2. Nivel de
significación ( 𝛼 𝑝𝑢𝑒𝑑𝑒 𝑠𝑒𝑟 0.01 , 0.05 ,0.10 ,𝑒𝑡𝑐 )
Si es conocido Si es desconocido
3. Estadístico
de Prueba  𝑍 = 𝑥 − 𝜇 ≈ 𝑁 (0,1) Tc 
x
 t( n 1)
𝑐
𝜎 /√𝑛 S/ n

4.
4. Región
Región
critica
critica Z
5.
Z
 
Z
   
5. Decisión
Decisión yy Rechazar
conclusión
conclusión Rechazar HH00 si
si ZZcc << ZZaa Rechazar
Rechazar H H00 si
si |Z
|Zcc|| >> ZZ1-a/2
1-a/2
Rechazar
Rechazar H H00 si
si ZZcc >> ZZ1-a
1-a
Rechazar
Rechazar H
H00 si
si TTcc << TT(n-1,a) Rechazar H 0 si |T | > T
Rechazar H0 si |Tc| > T(n-1,1-a/2)
c (n-1,1-a/2) Rechazar H si T > T
Rechazar H0 si Tc > T(n-1,1-a)
0 c (n-1,1-a)
(n-1,a)
Ejemplo 1
Una máquina está calibrada para embolsar cereales a un peso promedio de 500 gramos
Cada cierto tiempo, el jefe de control de calidad realiza una inspección para determinar
si se debe mandar a calibrar la máquina. Para tomar una decisión seleccionó una
muestra aleatoria de 36 bolsas y registró un promedio de 496.5 gramos. ¿A que
conclusión llegará el jefe de control de calidad. Si el peso se distribuye normalmente
con una desviación estándar de nueve gramos? Use un 5% de significancia.

Se identifica: Datos:
Elemento: Una bolsa de cereal. Promedio poblacional: µ = 500 gramos
Población: Todas las bolsas de cereal. Muestra aleatoria: n = 36 bolsas
Variable: X = Peso (en gramos) de las bolsas Promedio muestral: X  496.5 gramos
de cereal.
Desviación estándar poblacional: σ = 9 gramos
Tipo de variable: Cuantitativa continua.
Parámetro a estimar: µ (Peso promedio de la
bolsa de cereal)
1.- Hipótesis nula: Hipótesis alterna

H 0 :   500 H 1 :   500

La máquina esta calibrada (las bolsas de La máquina no esta calibrada (las bolsas de
cereal pesan en promedio 500 gr.) cereal no pesan en promedio 500 gr.)

La variable de estudio es peso (X), y se distribuye como


2.-  = 0.05 una normal. Por dato del problema, se sabe que (=9) .

3.- Estadístico de prueba 5.- Decisión


x   496.5  500
Zc    2.33
/ n 9 / 36

4.- Valor crítico


ZT = Z1-a/2 = Z0.975 = 1.96 Como Zc= -2.33< ZT=1.96, se rechaza H0.

Como Zc= |2.33 | > ZT=1.96, se rechaza H0.

Con un nivel de significación del 5%, existe


Conclusión: evidencia estadística
para concluir que el peso promedio de las bolsas de cereal no pesan 500
gramos. Se justifica enviar a calibrar la máquina.
Ejemplo 2

En estudios previos se ha determinado que el nivel de colesterol promedio de


pacientes con problemas cardíacos es 220. Un cardiólogo piensa que en
realidad el nivel es más alto y para probar su afirmación usa la muestra
217 223 225 245 238 216 217 226 202 218
233 235 242 219 221 234 199 236 248 224

¿Habrá suficiente evidencia estadística para apoyar la afirmación del


cardiólogo? Justificar su respuesta con un α = 0.05.

promedio de pacientes con


problemas cardíacos es
u=220
Por dato del problema, se sabe que  es desconocido, por tanto a partir de los datos
de la muestra debemos calcular la media y desviación estándar muestral.

Solución:
20 20

 xi  i  n x
2 2
x
x i 1
 225.90 S i 1
 13.0944
n n 1

20 20
x
i 1
i  217  223    248  224
 i
x 2
 217 2
 223 2
   248 2
 224 2

i 1
20

x  4518 20
i 1
i
 i  1 023874
x 2

i 1
1.- Hipótesis nula: Hipótesis alterna

H 0 :   220 H 1 :   220
El cardiólogo no tiene la razón El cardiólogo tiene la razón
La variable de estudio es colesterol (X), y se
2.-  = 0.05 supone que distribuye como una normal. Además
 desconocido.
3.- Estadístico de prueba
5.- Decisión
x 225.90  220
Tc    2.02
S / n 13.0944 / 20

4.- Valor crítico


tt  1.729
tt  t n 1;1  t19;0.95  1.729 Como Tc= 2.02 > TT=1.729,
se rechaza H0.
Conclusión: Con un nivel de significación del 5%, existe evidencia
estadística para concluir que el colesterol promedio de los pacientes con
problemas cardíacos es mayor a 220 (es decir, el cardiólogo tiene la razón).
Autoevaluación

Resolver las siguientes preguntas teóricas

a) Si se utiliza una prueba de hipótesis unilateral izquierda para la


media cuando la varianza es desconocida, entonces el valor crítico
para un nivel de significación de 5% es _____________.

b) El complemento del error tipo I se le denomina _______________.

c) Una hipótesis estadística es una ___________acerca de uno o varios


parámetros de la población.
Prueba de Hipótesis para la proporción poblacional (π)
UNILATERAL A LA UNILATERAL A LA
PASOS BILATERAL
IZQUIERDA DERECHA

H0 :   0 H0 :   0 H0 :   0
1. Hipótesis
H1 :    0 H1 :    0 H1 :    0
2. Nivel de
significación  puede ser 0.01, 0.05, 0.10, etc 

P 0
Zc  x
3. Estadístico
 0 (1   0 ) P
de Prueba n
n

4. Decisión

Rechazar H0 si Zc < Za Rechazar H0 si |Zc| > Z1-a/2 Rechazar H0 si Zc > Z1-a


Ejemplo 3:
Se debe decidir si los lotes que llegan a una fábrica deben ser aceptados o devueltos al proveedor.
Los artículos de este lote vienen con una garantía de 10% de artículos defectuosos. Si hay
evidencia que es más de 10% se rechazará el lote. Para tomar una decisión se elige una muestra
aleatoria de 625 artículos y se encuentran que 550 no son defectuosos. ¿Cuál será la decisión? Use
alfa = 0.01

Se identifica: Datos:
Elemento: Un artículo. Proporción poblacional: π = 0.10
Población: Lote de artículos. No defectuoso
Muestra aleatoria: n = 625 artículos
Variable: X = Estado de artículo Defectuosos
Proporción muestral: Estimar por P
Tipo de variable: Cualitativa nominal. →
Parámetro a estimar: π (Proporción de artículos
defectuosos)
1.- Hipótesis nula: Hipótesis alterna

Ho: p ≤ 0.10 H1: p > 0.10


No se rechaza el lote. Se rechaza el lote

2.-  = 0.01 5.- Decisión


3.- Estadístico de prueba
P  0.12  0.10
Zc    1.667
 (1    0.10(1  0.10)
n 625

4.- Valor crítico


Como Zc= 1.667 < ZT =2.33, no se
ZT = Z1-a = Z0.99 = 2.33 rechaza H0.

Conclusión: Con un nivel de significación del 1%, no existe suficiente


evidencia estadística para concluir que más del 10% de los artículos son
defectuosos. No hay razón para rechazar el lote.
¿Cómo calcular el p-valor?
UNILATERAL A LA BILATERAL UNILATERAL A LA DERECHA
IZQUIERDA

p  valor  F ( Z c ) p  valor  2(1  F ( Z c ) ) p  valor  1  F ( Z c )


Z c siempre 

¿Cómo interpretar?
Si p-valor < α, rechazar Ho, es decir, la prueba es significativa
Si p-valor > α, no rechazar Ho, es decir, la prueba no es significativa

¿Qué significa?
El “p-value” llamado el nivel de significación observado, es el mínimo valor de  al
cual se rechazaría la hipótesis nula. Un “p-value” cercano a 0 indica que es muy
poco probable que H0 ocurra por lo que estaremos inclinados a rechazarla.
PRUEBA DE NORMALIDAD: ANDERSON DARLING
(con Reporte Minitab)
Se utiliza esta prueba para verificar si los datos provienen o no de
una población con distribución normal.

Hipótesis Nula Hipótesis Alterna


La variable se distribuye como La variable no se distribuye
una distribución normal como una distribución normal

Nivel de significación:  puede ser 0.01, 0.05, 0.10, etc 

Decisión: Si p-valor > α no se rechaza Ho


Si p-valor < α se rechaza Ho
Ejemplo 4:
Verificar si los siguientes datos se distribuyen como una normal.
1.- Planteamiento de
hipótesis
Ho: La variable aleatoria se
comporta como una
distribución normal
H1: La variable aleatoria No
se comporta como una
distribución normal.
2.- Nivel de significación:
α =0.05
3.- Decisión
Como p-valor = 0.177 >
0.05, no se rechaza H0. Es
decir, al nivel de
significación de 5% los
datos se distribuyen como
una normal
Η 0 : π  0.235 (La empresa invertirá en la elaboración del yogurt)
a) Hipótesis:
Η1 : π  0.235 (La empresa no invertirá en la elaboración del yogur)

Nivel de significancia:  = 0.01


0.225  0.235
Zc   0.47
b) Estadístico de prueba: 0.235  (1  0.235)
400

c) Valor crítico: Z T  Z α  Z 0.05  1.64 o - 1.65

d) Decisión: Como Z c  0.47  Z 0.05  1.64; no se rechaza H 0 .

Conclusión: Con un nivel de significación de 0.05, no se puede rechazar que la proporción de


consumidores es al menos 0.20. Por lo tanto, la empresa si invertirá en su nuevo producto.
e) Cálculo del p_valor:
p  valor  F(Z c )  F(3.54)  0.99980
Como p  valor  0.99980  α  0.05; no se rechaza H 0
Datos: µ = 320 x  317
n = 36 unidades s  12
0  312 (verdadera media)

a) Cálculo de β:   P( x  317 / 0  312) Estandarizando:


x  0 317  312 x  0
  P(  ) z 
s n 12 36 s n

  P( z  2.5) Buscando en la tabla Z


  1  P ( z  2.5) 1  0.99379  0.00621
Se aplicó la propiedad:
P(Z > z) = 1 – P(Z ≤ z): Complemento (Estadística 1)
b) Cálculo de la potencia: 1 – β

1    1  0.00621  0.99379
Pregunta de Repaso 1

  determinó el punto de fusión de cada una de las 16


Se
muestras de una cierta marca de aceite vegetal hidrogenado
y el resultado fue =94.32. Suponiendo que la distribución
del punto de fusión es normal con = 1.20.
a. Probar

por medio de una prueba de dos colas de nivel 0.01.


1.- Hipótesis nula: Hipótesis alterna

  𝐻 0 : 𝜇 = 95 𝐻 1 : 𝜇 ≠ 95
 =94.32
2.-  = 0.01 = 1.20
𝑥 − 𝜇 94,32 −95
3.- Estadístico de prueba   𝑐=
𝑍 = =−2,267
𝜎 / √ 𝑛 1,20/ √ 16
4.- Valor crítico

ZT = Z1-a/2 = Z0.995 = 2,58/2,57

5.- Decisión

Como Zc= |2,267| < ZT=2,58, no se 2,267

rechaza H0. -2,58 2,58

Con un nivel de significación del 1%, existe evidencia estadística


Conclusión:
para concluir que el punto de fusión promedio es igual 95.
Pregunta de Repaso 2

  determinó la cantidad de desgaste en una flecha (0.0001


Se
pulg) después de un kilometraje fijo para cada uno de n = 8
motores de combustión interna con cojinetes de plomo al
cobre y se obtuvo = 3.72 y s = 1.25.
a. Suponiendo que la distribución del desgaste de la flecha
es normal con media , use la prueba a un nivel de 0.05
para probar
Pregunta de auto examen

En una encuesta de Gallup se preguntó a 1087 familias


seleccionadas aleatoriamente “¿en los fines de semana
salen fuera de la ciudad?”. El 62% de las personas
afirmaron salir de la ciudad. Al nivel de significación de
5% se puede afirmar de que la mayoría de las familias
salen de la ciudad en los fines de semana?.
Preguntas de autoevaluación

Para probar una hipótesis para una proporción, se debe verificar que
tanto nπ como n(1- π) debe cumplir___________.

Si se utiliza una prueba de hipótesis unilateral izquierda para la media


cuando la varianza es desconocida, entonces el valor crítico para un
nivel de significación de 5% es _____________.

Al complemento del error tipo I se le denomina _______________.

Una hipótesis estadística es una ___________acerca de uno o varios


parámetros de la población.
Bibliografía:

1.- Anderson, S. (2010) Estadística para Administración y


Economía. Cengage Learning 8va. Edición. México.

2.- Mendehall, W. (2008) Introducción a la Probabilidad y


Estadística. Thomson 12° Edición. México.

3.- Alvarado, J., Obagi, J. (2008) Fundamentos de la Inferencia


Estadística. Ed. Pontificia Universidad Javeriana 1ra. Edición.
Colombia.

Вам также может понравиться