Вы находитесь на странице: 1из 50

UNIDAD 5-8.

PRUEBAS
DE HIPÓTESIS
Jhonatan Andrés Rodríguez Manrique
Corporación Universitaria del Caribe-CECAR
Facultad de Ciencias Básicas, Ingeniería y arquitectura
Programa de Ingeniería de Sistemas
CONTENIDO
• UNIDAD 5. CONTRASTE DE HIPÓTESIS UNIDAD 6. CONTRASTE DE HIPÓTESIS MUESTRAS GRANDES
• Hipótesis nula y alternativa  Prueba de hipótesis para una media poblacional
 Prueba de hipótesis para la diferencia de dos medias
• Contrastes unilaterales y bilaterales poblacionales
• Errores de tipo I y de tipo II  Prueba de hipótesis para una proporción binomial
• Región crítica, región de aceptación y  Prueba de hipótesis para la diferencia de dos proporciones
criterio de decisión.

UNIDAD 7. CONTRASTE DE HIPÓTESIS MUESTRAS UNIDAD 8. OTROS CONTRASTES DE HIPÓTESIS


PEQUEÑAS  Prueba de una varianza muestral
 Prueba de hipótesis para una media muestral  Comparación de dos varianzas muéstrales
 Pruebas para diferencias entre dos medias  Prueba de bondad del ajuste
muéstrales (muestras independientes)  Prueba de independencia
 Prueba de diferencias por pares (muestras  Prueba de homogeneidad
dependientes)
HIPÓTESIS NULA Y ALTERNATIVA
Se denomina hipótesis estadística a cualquier afirmación o conjetura
que se hace acerca de la distribución de una o más poblaciones.

En las aplicaciones básicas, se asume la forma de


la distribución de la población. En este caso, las
hipótesis estadísticas consisten en suponer que
los parámetros, que definen a la población,
toman determinados valores numéricos.
HIPÓTESIS NULA Y ALTERNATIVA

• La valoración media de • La proporción de • La variación de las


un test de rendimiento y personas que fueron pruebas de prototipado
productividad en identificadas como rápido en procesadores
cuadrillas de trabajadores millennials en Sincelejo de equipos de computo
de una compañía es inferior al 20% es de 0.25 puntos

1 2 3
HIPÓTESIS NULA Y ALTERNATIVA

La hipótesis nula (H0), es la


La hipótesis alternativa
pretensión que inicialmente se supone
denotada por H1,Es la aseveración
Cierta (la pretensión de “creencia
previa”).
contradictoria a H0.

La hipótesis nula será rechazada en favor de la hipótesis alternativa sólo si la evidencia muestral
sugiere que H0 es falsa.

Si la muestra no contradice fuertemente a H0, se continuará creyendo en la verdad de la hipótesis nula. Las
dos posibles conclusiones derivadas de un análisis de prueba de hipótesis son entonces rechazar H0 o no
rechazar H0.
HIPÓTESIS NULA Y ALTERNATIVA
• Conforme se vaya aprendiendo más sobre la prueba de hipótesis, debería notar que el analista
llega a una de las siguientes dos conclusiones:

Rechace 𝑯𝟎 : a favor de No rechace 𝑯𝟎 : debido


𝐻1 debido a evidencia a evidencia insuficiente
suficiente en los datos en los datos.

Observe que las conclusiones no implican una “aceptación” formal y literal de 𝐻0 . El enunciado
de 𝐻0 a menudo representa el “status quo” contrario a una nueva idea, conjetura, etcétera,
enunciada en 𝐻1 ; en tanto que no rechazar 𝐻0 representa la conclusión adecuada
HIPÓTESIS NULA Y ALTERNATIVA
• Aunque las aplicaciones de la prueba de hipótesis son bastante abundantes en trabajos científicos y de
ingeniería, quizás el mejor ejemplo para iniciar sea la dificultad que se encuentra en el veredicto de un
jurado. Las hipótesis nula y alternativa son:

𝐻0 : el acusado es 𝐻1 : El acusado es
inocente culpable
La acusación proviene de una sospecha de culpabilidad. La hipótesis 𝐻0 (status quo) se establece en oposición a H1
y se mantiene a menos que se apoye H1 con evidencia “más allá de una duda razonable”. Sin embargo, en este caso
“no rechace H0” no implica inocencia, sino tan sólo que la evidencia fue insuficiente para lograr una condena. De
manera que el jurado no necesariamente acepta H0 sino que no rechaza H0
HIPÓTESIS NULA Y ALTERNATIVA

Si se asume que 𝜃0 es un valor del parámetro desconocido 𝜃 de una población cuya distribución
se supone conocida, entonces son hipótesis nulas y alternativas respectivamente las siguientes
afirmaciones:

1. 𝐻0 : 𝜃 = 𝜃0 , y 𝐻1 : 𝜃 ≠ 𝜃0
2. 𝐻0 : 𝜃 ≤ 𝜃0 , y 𝐻1 : 𝜃 > 𝜃0
3. 𝐻0 : 𝜃 ≥ 𝜃0 , y 𝐻1 : 𝜃 < 𝜃0
CONTRASTES UNILATERALES Y BILATERALES
CONTRASTES UNILATERALES Y BILATERALES
El tipo de prueba depende básicamente de la hipótesis alternativa
𝐻1 . Se denomina prueba de una cola a toda prueba de hipótesis
donde la alternativa 𝐻1 es unilateral. Si la alternativa es bilateral,
la prueba se denomina prueba de dos colas.

Tipo H0 H1
Prueba bilateral o de dos colas 𝐇𝟎 : 𝛉 = 𝛉 𝟎 𝐇𝟏 : 𝛉 ≠ 𝛉 𝟎

Prueba unilateral de cola a la derecha 𝐇𝟎 : 𝛉 ≤ 𝛉 𝟎 𝐇𝟏 : 𝛉 > 𝛉 𝟎

Prueba unilateral de cola a la izquierda 𝐇𝟎 : 𝛉 ≥ 𝛉 𝟎 𝐇𝟏 : 𝛉 < 𝛉 𝟎


CONTRASTES UNILATERALES Y BILATERALES
Ejercicio 1

• Un fabricante de pintura de secado rápido afirma que el tiempo de secado de la


misma es de 20 min. El comprador diseña el siguiente experimento: pinta 36
tableros y decide rechazar el producto si el promedio de tiempo de secado de los
mismos supera los 20.75 min. Si por experiencia σ=2.4 min. ¿Cómo plantearía el
juego de hipótesis?
Ejercicio 2

Se sabe que cierto tipo de vacuna contra el resfriado tan sólo es efectiva en 25%
después de un periodo de dos años. Para determinar si una vacuna nueva, y algo
más cara, es superior al dar protección contra el mismo virus durante un periodo
más largo, suponga que se elige a 20 Personas al azar y se inoculan. Proponga
hipótesis nula e hipótesis alternativa.
ERRORES DE TIPO I Y DE TIPO II
ERRORES DE TIPO I Y DE TIPO II
Cuando se toma una decisión utilizando la información en una muestra
aleatoria, esta decisión esta sujeta a error.

Si la hipótesis nula se rechaza


Si la hipótesis nula se acepta
cuando es verdadera, entonces
cuando es falsa, entonces el
se ha cometido un error del
error cometido es del tipo II.
tipo I.
ERRORES DE TIPO I Y DE TIPO II
ERRORES DE TIPO I Y DE TIPO II
REGIÓN CRÍTICA, REGIÓN DE ACEPTACIÓN Y CRITERIO
DE DECISIÓN
REGIÓN CRÍTICA, REGIÓN DE ACEPTACIÓN Y CRITERIO
DE DECISIÓN
𝐇𝟎 : 𝛉 ≥ 𝛉 𝟎 𝐇𝟏 : 𝛉 < 𝛉 𝟎

𝐇𝟎 : 𝛉 ≤ 𝛉 𝟎 𝐇𝟏 : 𝛉 > 𝛉 𝟎

𝐇𝟎 : 𝛉 = 𝛉 𝟎 𝐇𝟏 : 𝛉 ≠ 𝛉 𝟎
UNIDAD 6. CONTRASTE DE HIPÓTESIS
MUESTRAS GRANDES
 Prueba de hipótesis para una media
poblacional
 Prueba de hipótesis para la
diferencia de dos medias
poblacionales
 Prueba de hipótesis para una
proporción binomial
 Prueba de hipótesis para la
diferencia de dos proporciones

UNIDAD 6. CONTRASTE DE HIPÓTESIS MUESTRAS GRANDES


PRUEBA DE HIPÓTESIS PARA UNA MEDIA POBLACIONAL

El procedimiento general de 1) Formular la hipótesis nula 𝐻0 : 𝜃 = 𝜃0 y la hipótesis alternativa adecuada


𝐻1 : 𝜃 ≠ 𝜃0 o 𝐻1 : 𝜃 > 𝜃0 o 𝐻1 : 𝜃 < 𝜃0 .
la prueba de una hipótesis
de parámetro 𝜃 se resume 2) Especificar el tamaño a del nivel de significación.

en los siguientes pasos:


3) Seleccionar el estadístico apropiado a usar en la prueba.

4) Establecer la regla de decisión, determinando la región crítica de la


prueba.

5) Calcular el valor del estadístico de la prueba a partir de los datos de la


muestra.

6) Tomar la decisión de rechazar la hipótesis 𝐻0 si el valor del estadístico de la


prueba está en la región crítica. En caso contrario, no rechazar 𝐻0 .
PRUEBA DE HIPÓTESIS PARA UNA MEDIA POBLACIONAL

2) ESPECIFICAR EL TAMAÑO A DEL NIVEL DE SIGNIFICACIÓN

Se denomina nivel de
significación de una prueba
de hipótesis a la
probabilidad de cometer un
error de tipo I

Región crítica y regla de decisión


Después de plantear la hipótesis nula H0 y su correspondiente alternativa H1, referentes a un parámetro 𝜃, y
especificado el tamaño a del nivel de significación de la prueba de H0 contra H1, se deberá determinar una
estadístico 𝜃෡ correspondiente al parámetro, cuya distribución muestral se conozca.
PRUEBA DE HIPÓTESIS PARA UNA MEDIA POBLACIONAL

2) ESPECIFICAR EL TAMAÑO A DEL NIVEL DE SIGNIFICACIÓN

El nivel de significación es la zona de


rechazo, corresponde a lo inverso del
nivel de aceptación, entre mas grande
es el nivel de aceptación mas flexible es
la prueba de hipótesis. Este nivel de
significación lo define el estadista y
depende del nivel de flexibilidad que se
desee. Puede ser del 5%, 10%, 25% u
otro.
PRUEBA DE HIPÓTESIS PARA UNA MEDIA POBLACIONAL

El estadístico de prueba es un valor que se utiliza para tomar la decisión sobre la hipótesis nula, y se
calcula convirtiendo al estadístico muestral (Como la proporción de la media muestral, o la desviación
estándar muestral) en una puntuación (como 𝑧, 𝑡 𝑜 𝑥 2 ), bajo el supuesto de que la hipótesis nula es
verdadera.

Estadístico de Prueba para Medias


𝑥ҧ − 𝜇
𝑍= 𝜎
𝑛
PRUEBA DE HIPÓTESIS PARA UNA MEDIA POBLACIONAL
4) ESTABLECER LA REGLA DE DECISIÓN,
DETERMINANDO LA REGIÓN CRÍTICA DE LA PRUEBA.
PRUEBA DE HIPÓTESIS PARA UNA MEDIA POBLACIONAL
4) ESTABLECER LA REGLA DE DECISIÓN, DETERMINANDO
LA REGIÓN CRÍTICA DE LA PRUEBA.

La región crítica (o región de rechazo) es el conjunto de todos los valores del


estadístico de prueba que pueden provocar que rechacemos la hipótesis nula. Por
ejemplo, observe la región sombreada más oscura en la figura.
PRUEBA DE HIPÓTESIS PARA UNA MEDIA POBLACIONAL
5) CALCULAR EL VALOR DEL ESTADÍSTICO DE LA
PRUEBA A PARTIR DE LOS DATOS DE LA MUESTRA.
PRUEBA DE HIPÓTESIS PARA UNA MEDIA POBLACIONAL
6) Tomar la decisión de rechazar la hipótesis 𝐻0 si el valor del estadístico de la
prueba está en la región crítica. En caso contrario, no rechazar 𝐻0 .
PRUEBA DE HIPÓTESIS PARA UNA MEDIA POBLACIONAL
6) Tomar la decisión de rechazar la hipótesis 𝐻0 si el valor del estadístico de la
prueba está en la región crítica. En caso contrario, no rechazar 𝐻0 .
PRUEBA DE HIPÓTESIS PARA UNA MEDIA POBLACIONAL
6) Tomar la decisión de rechazar la hipótesis 𝐻0 utilizando el valor-p.
Equivalentemente, se puede resolver un contraste de hipótesis a partir de una probabilidad que recibe el
nombre de p-valor. El p-valor de un contraste de hipótesis indica cuál es la probabilidad de obtener un
valor del estadístico de contraste tanto o más “extraño” que el que se ha obtenido suponiendo que la
hipótesis nula es cierta.

Por tanto, p-valores pequeños nos llevarán a rechazar la hipótesis nula. Concretamente, si el p-
valor obtenido es más pequeño que el nivel de significación, rechazaremos la hipótesis nula. En
caso contrario, no podremos rechazar la hipótesis nula y la consideraremos verdadera.
EJERCICIO
Con el propósito de determinar el número promedio de unidades producidas por operario en un proceso de manufactura
de tarjetas inteligentes para dispositivos móviles en un horario de trabajo igual a 8 horas, el ingeniero de planificación y
desarrollo somete a 75 operarios seleccionados de forma aleatoria de su línea de producción a una prueba. Mediante la
prueba se mide el número de unidades que producto y también registra su sexo y su habilidad para realizar jornadas de
entrenamiento especializado de manufactura fuera del horario laboral. Los datos seleccionados se adjuntan en el archivo
denominado “Base de datos unidades de manufactura”.

El ingeniero de planificación y desarrollo conoce por estudios anteriores que el número de unidades producidas se
distribuye normalmente con una varianza poblacional de 7.5 unidades cuadráticas. Por ello, desea determinar si ¿es
posible asumir que el número medio de unidades producidas que realizan sus operarios es de 55 tarjetas inteligentes
para dispositivos móviles?. Utilice un nivel de significancia del 5%.
EJERCICIO

Reis, Inc., una empresa en Nueva York de investigación sobre bienes raíces, vigila los
montos de las rentas de departamentos en Estados Unidos. A mediados de 2002, la
renta promedio de un departamento era $895 por mes. Suponga que, según los
estudios trimestrales anteriores, es razonable suponer que la desviación estándar
poblacional es S=$225. En un estudio reciente, en una muestra de 180 departamentos
en todo el país se obtuvo que el valor medio de las rentas fue de $800. ¿ Este dato
muestral permiten que Reis concluya que la media de la renta actual de
departamentos es superior a la media encontrada en 2002?
a. Dé las hipótesis nula y alternativa.
b. ¿Cuál es el valor-p?
c. Con a 0.01, ¿cuál es su conclusión?
d. ¿Qué le recomendaría a Reis hacer ahora?
PRUEBA DE HIPÓTESIS PARA LA DIFERENCIA DE DOS
MEDIAS POBLACIONALES
PRUEBA DE HIPÓTESIS PARA LA DIFERENCIA DE DOS
MEDIAS POBLACIONALES

Población 1 Población 2
𝜇1 𝜇2
¿Son las poblaciones iguales?
PRUEBA DE HIPÓTESIS PARA LA DIFERENCIA DE DOS
MEDIAS POBLACIONALES
Casos de pruebas de hipótesis
diferencia de dos medias
Caso 1. Varianzas poblacionales conocidas o desconocidas (n>30)

Caso 2. Varianzas poblacionales iguales, desconocidas (n<30)

Caso 3. Varianzas poblacionales diferentes, desconocidas y muestras


pequeñas
CASO 1. VARIANZAS POBLACIONALES CONOCIDAS O DESCONOCIDAS (n>30)

𝜇1 − 𝜇2 ≠ 𝑑0
𝐻0 : 𝜇1 − 𝜇2 = 𝑑0 𝐻1 : ቐ𝜇1 − 𝜇2 < 𝑑0
𝜇1 − 𝜇2 > 𝑑0
Ejercicio caso 1
Se desea comparar el número de artículos que se comercializan según dos estrategias computacionales de
marketing e-business. Para tal efecto, se toman 20 registros de ingresos (USD) obtenidos por las ventas de
los artículos ofrecidos y se obtuvieron los siguientes resultados:

Método 9,9 9,4 9,3 9,6 10,2 10,6 10,3 10,0 10,3 10,1
e-business 1 12,4 9,6 8,9 10,5 10,5 10,2 10,2 10,0 9,7 11,1
Método 10,2 10,6 10,7 10,4 10,5 10,0 10,2 10,7 10,4 10,3
e-business 2 10,8 12,2 11,5 10,5 11,2 11,2 12,2 11,8 10,9 12,5

¿Los datos apoyan la afirmación de que el ingreso medio obtenido por las ventas bajo los diferentes
métodos e-bussines es diferente es igual bajo las dos estrategias computacionales de marketing?. Utilice un
nivel de significancia del 5% y asuma que las varianzas de ambas poblaciones desconocidas.
CASO 2. VARIANZAS POBLACIONALES IGUALES, DESCONOCIDAS (n<30)

𝜇1 − 𝜇2 ≠ 𝑑0
𝐻0 : 𝜇1 − 𝜇2 = 𝑑0 𝐻1 : ቐ𝜇1 − 𝜇2 < 𝑑0
𝜇1 − 𝜇2 > 𝑑0
Estadístico de prueba Dado que n<30 la variable aleatorio tiene una distribución t-Student con grados de
libertad (𝑣 = 𝑛1 + 𝑛2 − 2). De modo que la expresión.
൫𝑥1 − 𝑥2 ) − 𝑑0
𝑡= 𝑛1 − 1 𝑠12 + 𝑛2 − 1 𝑠22
1 1 𝑆𝑝 =
𝑆𝑝 + 𝑛1 + 𝑛2 − 2
𝑛1 𝑛2
Dada es la llamada varianza combinada y corresponde al estimador
insesgado de la Varianza poblacional común.
Ejemplo caso 2
Se estudian dos metodologías de programación en la producción de software con respecto a los
defectos o errores que se producen en el código durante la fase de desarrollo. Para ello, se tomaron
al azar 20 software elaborados por el sistema A y 10 por el sistema B. A continuación, se presenta el
grado de dificultad de resolución de errores expresado en tiempo (horas) obtenido al aplicar cada
uno de los dos sistemas:

42 40 37 37 34 37 40 37 35 38
Método A
35 42 40 39 36 43 36 43 38 41
Método B 35 40 37 37 34 37 40 37 35 42

Efectuar la prueba de promedios correspondientes. Usar α = 0.05


Ejemplo

tc=1,055

−2.048 2.048

El valor 𝑡𝛼/2,𝑔𝑙 = 𝑡0.025,28 = 2.048. Como |𝑡𝑐 | < 𝑡𝛼/2,𝑔𝑙 el estadístico de prueba se encuentra en la región de
aceptación, por lo cual se concluye que no hay razones para afirmar que los dos metodologías de programación en la
producción de software produzcan efectos diferentes frente a esta variable (grado de dificultad de resolución de
errores expresado en tiempo (horas) )
CASO 3. VARIANZAS POBLACIONALES DIFERENTES,
DESCONOCIDAS Y MUESTRAS PEQUEÑAS
CASO 3. VARIANZAS POBLACIONALES DIFERENTES, DESCONOCIDAS Y MUESTRAS
PEQUEÑAS

Las siguientes muestras aleatorias son las lecturas de la capacidad de


generación de calor en dos procesadores de ultima generación durante la
producción y prototipado de equipos de computo avanzado. Los datos
recolectados expresados en BTU, se ilustran en el siguiente:

Procesador 1: 8400 ,8230 ,8380 ,7860 ,7930, 7933, 8200, 8600, 8203
Procesador 2: 7510, 7690, 7720, 8070 ,7660, 7230, 7450, 7650

Utilice un nivel de significación del 5 % para probar si el procesador 2 supera


la generación de calor en dos puntuaciones.
PRUEBA DE HIPÓTESIS PARA UNA PROPORCIÓN BINOMIAL
PRUEBA DE HIPÓTESIS PARA UNA PROPORCIÓN BINOMIAL
PRUEBA DE HIPÓTESIS PARA UNA PROPORCIÓN BINOMIAL
PRUEBA DE HIPÓTESIS PARA UNA PROPORCIÓN BINOMIAL

Un diseñador de paginas web afirma que el 30% de todos los usuarios empresariales
prefieren su producto. Con el fin de evaluar esta afirmación se tomó una muestra aleatoria
de 400 empresarios y se encontró que 100 de ellos prefieren sus diseños.

a. ¿Es esta suficiente evidencia para inferir que el porcentaje de preferencia del diseño no
es 30%?. Utilice un nivel de significancia 1%
b. ¿Es esta suficiente evidencia para inferir que el porcentaje de preferencia del producto es
mucho mas que el 30%?. Utilice un nivel de significancia 5%
PRUEBA DE HIPÓTESIS PARA LA DIFERENCIA DE DOS PROPORCIONES
PRUEBA DE HIPÓTESIS PARA LA DIFERENCIA DE DOS
PROPORCIONES
PRUEBA DE HIPÓTESIS PARA LA DIFERENCIA DE DOS
PROPORCIONES
PRUEBA DE HIPÓTESIS PARA LA DIFERENCIA DE DOS
PROPORCIONES
En los últimos años ha aumentado el número de personas que emplean Internet para buscar noticias sobre política.
Los sitios Web sobre política suelen pedir a los usuarios que den sus opiniones participando en encuestas en línea.
Pew Research Center realizó un estudio para conocer la participación de republicanos y demócratas en las encuestas
en línea. Se obtuvieron los resultados muéstrales siguientes.

a. Calcule la estimación puntual de la proporción de republicanos que indicaron participar en encuestas en línea.
Calcule la estimación puntual de demócratas.
b. ¿Cuál es la estimación puntual de la diferencia entre las dos proporciones poblacionales?
d. Representantes de la industria científica de sondeo opinan que la profusión de encuestas en línea puede confundir
a las personas. ¿Está usted de acuerdo con esto? Use un intervalo de confianza de 95% para estimar la diferencia
entre las proporciones poblacionales de republicanos y demócratas para justificar su respuesta.

Вам также может понравиться