Академический Документы
Профессиональный Документы
Культура Документы
PRUEBAS
DE HIPÓTESIS
Jhonatan Andrés Rodríguez Manrique
Corporación Universitaria del Caribe-CECAR
Facultad de Ciencias Básicas, Ingeniería y arquitectura
Programa de Ingeniería de Sistemas
CONTENIDO
• UNIDAD 5. CONTRASTE DE HIPÓTESIS UNIDAD 6. CONTRASTE DE HIPÓTESIS MUESTRAS GRANDES
• Hipótesis nula y alternativa Prueba de hipótesis para una media poblacional
Prueba de hipótesis para la diferencia de dos medias
• Contrastes unilaterales y bilaterales poblacionales
• Errores de tipo I y de tipo II Prueba de hipótesis para una proporción binomial
• Región crítica, región de aceptación y Prueba de hipótesis para la diferencia de dos proporciones
criterio de decisión.
1 2 3
HIPÓTESIS NULA Y ALTERNATIVA
La hipótesis nula será rechazada en favor de la hipótesis alternativa sólo si la evidencia muestral
sugiere que H0 es falsa.
Si la muestra no contradice fuertemente a H0, se continuará creyendo en la verdad de la hipótesis nula. Las
dos posibles conclusiones derivadas de un análisis de prueba de hipótesis son entonces rechazar H0 o no
rechazar H0.
HIPÓTESIS NULA Y ALTERNATIVA
• Conforme se vaya aprendiendo más sobre la prueba de hipótesis, debería notar que el analista
llega a una de las siguientes dos conclusiones:
Observe que las conclusiones no implican una “aceptación” formal y literal de 𝐻0 . El enunciado
de 𝐻0 a menudo representa el “status quo” contrario a una nueva idea, conjetura, etcétera,
enunciada en 𝐻1 ; en tanto que no rechazar 𝐻0 representa la conclusión adecuada
HIPÓTESIS NULA Y ALTERNATIVA
• Aunque las aplicaciones de la prueba de hipótesis son bastante abundantes en trabajos científicos y de
ingeniería, quizás el mejor ejemplo para iniciar sea la dificultad que se encuentra en el veredicto de un
jurado. Las hipótesis nula y alternativa son:
𝐻0 : el acusado es 𝐻1 : El acusado es
inocente culpable
La acusación proviene de una sospecha de culpabilidad. La hipótesis 𝐻0 (status quo) se establece en oposición a H1
y se mantiene a menos que se apoye H1 con evidencia “más allá de una duda razonable”. Sin embargo, en este caso
“no rechace H0” no implica inocencia, sino tan sólo que la evidencia fue insuficiente para lograr una condena. De
manera que el jurado no necesariamente acepta H0 sino que no rechaza H0
HIPÓTESIS NULA Y ALTERNATIVA
Si se asume que 𝜃0 es un valor del parámetro desconocido 𝜃 de una población cuya distribución
se supone conocida, entonces son hipótesis nulas y alternativas respectivamente las siguientes
afirmaciones:
1. 𝐻0 : 𝜃 = 𝜃0 , y 𝐻1 : 𝜃 ≠ 𝜃0
2. 𝐻0 : 𝜃 ≤ 𝜃0 , y 𝐻1 : 𝜃 > 𝜃0
3. 𝐻0 : 𝜃 ≥ 𝜃0 , y 𝐻1 : 𝜃 < 𝜃0
CONTRASTES UNILATERALES Y BILATERALES
CONTRASTES UNILATERALES Y BILATERALES
El tipo de prueba depende básicamente de la hipótesis alternativa
𝐻1 . Se denomina prueba de una cola a toda prueba de hipótesis
donde la alternativa 𝐻1 es unilateral. Si la alternativa es bilateral,
la prueba se denomina prueba de dos colas.
Tipo H0 H1
Prueba bilateral o de dos colas 𝐇𝟎 : 𝛉 = 𝛉 𝟎 𝐇𝟏 : 𝛉 ≠ 𝛉 𝟎
Se sabe que cierto tipo de vacuna contra el resfriado tan sólo es efectiva en 25%
después de un periodo de dos años. Para determinar si una vacuna nueva, y algo
más cara, es superior al dar protección contra el mismo virus durante un periodo
más largo, suponga que se elige a 20 Personas al azar y se inoculan. Proponga
hipótesis nula e hipótesis alternativa.
ERRORES DE TIPO I Y DE TIPO II
ERRORES DE TIPO I Y DE TIPO II
Cuando se toma una decisión utilizando la información en una muestra
aleatoria, esta decisión esta sujeta a error.
𝐇𝟎 : 𝛉 ≤ 𝛉 𝟎 𝐇𝟏 : 𝛉 > 𝛉 𝟎
𝐇𝟎 : 𝛉 = 𝛉 𝟎 𝐇𝟏 : 𝛉 ≠ 𝛉 𝟎
UNIDAD 6. CONTRASTE DE HIPÓTESIS
MUESTRAS GRANDES
Prueba de hipótesis para una media
poblacional
Prueba de hipótesis para la
diferencia de dos medias
poblacionales
Prueba de hipótesis para una
proporción binomial
Prueba de hipótesis para la
diferencia de dos proporciones
Se denomina nivel de
significación de una prueba
de hipótesis a la
probabilidad de cometer un
error de tipo I
El estadístico de prueba es un valor que se utiliza para tomar la decisión sobre la hipótesis nula, y se
calcula convirtiendo al estadístico muestral (Como la proporción de la media muestral, o la desviación
estándar muestral) en una puntuación (como 𝑧, 𝑡 𝑜 𝑥 2 ), bajo el supuesto de que la hipótesis nula es
verdadera.
Por tanto, p-valores pequeños nos llevarán a rechazar la hipótesis nula. Concretamente, si el p-
valor obtenido es más pequeño que el nivel de significación, rechazaremos la hipótesis nula. En
caso contrario, no podremos rechazar la hipótesis nula y la consideraremos verdadera.
EJERCICIO
Con el propósito de determinar el número promedio de unidades producidas por operario en un proceso de manufactura
de tarjetas inteligentes para dispositivos móviles en un horario de trabajo igual a 8 horas, el ingeniero de planificación y
desarrollo somete a 75 operarios seleccionados de forma aleatoria de su línea de producción a una prueba. Mediante la
prueba se mide el número de unidades que producto y también registra su sexo y su habilidad para realizar jornadas de
entrenamiento especializado de manufactura fuera del horario laboral. Los datos seleccionados se adjuntan en el archivo
denominado “Base de datos unidades de manufactura”.
El ingeniero de planificación y desarrollo conoce por estudios anteriores que el número de unidades producidas se
distribuye normalmente con una varianza poblacional de 7.5 unidades cuadráticas. Por ello, desea determinar si ¿es
posible asumir que el número medio de unidades producidas que realizan sus operarios es de 55 tarjetas inteligentes
para dispositivos móviles?. Utilice un nivel de significancia del 5%.
EJERCICIO
Reis, Inc., una empresa en Nueva York de investigación sobre bienes raíces, vigila los
montos de las rentas de departamentos en Estados Unidos. A mediados de 2002, la
renta promedio de un departamento era $895 por mes. Suponga que, según los
estudios trimestrales anteriores, es razonable suponer que la desviación estándar
poblacional es S=$225. En un estudio reciente, en una muestra de 180 departamentos
en todo el país se obtuvo que el valor medio de las rentas fue de $800. ¿ Este dato
muestral permiten que Reis concluya que la media de la renta actual de
departamentos es superior a la media encontrada en 2002?
a. Dé las hipótesis nula y alternativa.
b. ¿Cuál es el valor-p?
c. Con a 0.01, ¿cuál es su conclusión?
d. ¿Qué le recomendaría a Reis hacer ahora?
PRUEBA DE HIPÓTESIS PARA LA DIFERENCIA DE DOS
MEDIAS POBLACIONALES
PRUEBA DE HIPÓTESIS PARA LA DIFERENCIA DE DOS
MEDIAS POBLACIONALES
Población 1 Población 2
𝜇1 𝜇2
¿Son las poblaciones iguales?
PRUEBA DE HIPÓTESIS PARA LA DIFERENCIA DE DOS
MEDIAS POBLACIONALES
Casos de pruebas de hipótesis
diferencia de dos medias
Caso 1. Varianzas poblacionales conocidas o desconocidas (n>30)
𝜇1 − 𝜇2 ≠ 𝑑0
𝐻0 : 𝜇1 − 𝜇2 = 𝑑0 𝐻1 : ቐ𝜇1 − 𝜇2 < 𝑑0
𝜇1 − 𝜇2 > 𝑑0
Ejercicio caso 1
Se desea comparar el número de artículos que se comercializan según dos estrategias computacionales de
marketing e-business. Para tal efecto, se toman 20 registros de ingresos (USD) obtenidos por las ventas de
los artículos ofrecidos y se obtuvieron los siguientes resultados:
Método 9,9 9,4 9,3 9,6 10,2 10,6 10,3 10,0 10,3 10,1
e-business 1 12,4 9,6 8,9 10,5 10,5 10,2 10,2 10,0 9,7 11,1
Método 10,2 10,6 10,7 10,4 10,5 10,0 10,2 10,7 10,4 10,3
e-business 2 10,8 12,2 11,5 10,5 11,2 11,2 12,2 11,8 10,9 12,5
¿Los datos apoyan la afirmación de que el ingreso medio obtenido por las ventas bajo los diferentes
métodos e-bussines es diferente es igual bajo las dos estrategias computacionales de marketing?. Utilice un
nivel de significancia del 5% y asuma que las varianzas de ambas poblaciones desconocidas.
CASO 2. VARIANZAS POBLACIONALES IGUALES, DESCONOCIDAS (n<30)
𝜇1 − 𝜇2 ≠ 𝑑0
𝐻0 : 𝜇1 − 𝜇2 = 𝑑0 𝐻1 : ቐ𝜇1 − 𝜇2 < 𝑑0
𝜇1 − 𝜇2 > 𝑑0
Estadístico de prueba Dado que n<30 la variable aleatorio tiene una distribución t-Student con grados de
libertad (𝑣 = 𝑛1 + 𝑛2 − 2). De modo que la expresión.
൫𝑥1 − 𝑥2 ) − 𝑑0
𝑡= 𝑛1 − 1 𝑠12 + 𝑛2 − 1 𝑠22
1 1 𝑆𝑝 =
𝑆𝑝 + 𝑛1 + 𝑛2 − 2
𝑛1 𝑛2
Dada es la llamada varianza combinada y corresponde al estimador
insesgado de la Varianza poblacional común.
Ejemplo caso 2
Se estudian dos metodologías de programación en la producción de software con respecto a los
defectos o errores que se producen en el código durante la fase de desarrollo. Para ello, se tomaron
al azar 20 software elaborados por el sistema A y 10 por el sistema B. A continuación, se presenta el
grado de dificultad de resolución de errores expresado en tiempo (horas) obtenido al aplicar cada
uno de los dos sistemas:
42 40 37 37 34 37 40 37 35 38
Método A
35 42 40 39 36 43 36 43 38 41
Método B 35 40 37 37 34 37 40 37 35 42
tc=1,055
−2.048 2.048
El valor 𝑡𝛼/2,𝑔𝑙 = 𝑡0.025,28 = 2.048. Como |𝑡𝑐 | < 𝑡𝛼/2,𝑔𝑙 el estadístico de prueba se encuentra en la región de
aceptación, por lo cual se concluye que no hay razones para afirmar que los dos metodologías de programación en la
producción de software produzcan efectos diferentes frente a esta variable (grado de dificultad de resolución de
errores expresado en tiempo (horas) )
CASO 3. VARIANZAS POBLACIONALES DIFERENTES,
DESCONOCIDAS Y MUESTRAS PEQUEÑAS
CASO 3. VARIANZAS POBLACIONALES DIFERENTES, DESCONOCIDAS Y MUESTRAS
PEQUEÑAS
Procesador 1: 8400 ,8230 ,8380 ,7860 ,7930, 7933, 8200, 8600, 8203
Procesador 2: 7510, 7690, 7720, 8070 ,7660, 7230, 7450, 7650
Un diseñador de paginas web afirma que el 30% de todos los usuarios empresariales
prefieren su producto. Con el fin de evaluar esta afirmación se tomó una muestra aleatoria
de 400 empresarios y se encontró que 100 de ellos prefieren sus diseños.
a. ¿Es esta suficiente evidencia para inferir que el porcentaje de preferencia del diseño no
es 30%?. Utilice un nivel de significancia 1%
b. ¿Es esta suficiente evidencia para inferir que el porcentaje de preferencia del producto es
mucho mas que el 30%?. Utilice un nivel de significancia 5%
PRUEBA DE HIPÓTESIS PARA LA DIFERENCIA DE DOS PROPORCIONES
PRUEBA DE HIPÓTESIS PARA LA DIFERENCIA DE DOS
PROPORCIONES
PRUEBA DE HIPÓTESIS PARA LA DIFERENCIA DE DOS
PROPORCIONES
PRUEBA DE HIPÓTESIS PARA LA DIFERENCIA DE DOS
PROPORCIONES
En los últimos años ha aumentado el número de personas que emplean Internet para buscar noticias sobre política.
Los sitios Web sobre política suelen pedir a los usuarios que den sus opiniones participando en encuestas en línea.
Pew Research Center realizó un estudio para conocer la participación de republicanos y demócratas en las encuestas
en línea. Se obtuvieron los resultados muéstrales siguientes.
a. Calcule la estimación puntual de la proporción de republicanos que indicaron participar en encuestas en línea.
Calcule la estimación puntual de demócratas.
b. ¿Cuál es la estimación puntual de la diferencia entre las dos proporciones poblacionales?
d. Representantes de la industria científica de sondeo opinan que la profusión de encuestas en línea puede confundir
a las personas. ¿Está usted de acuerdo con esto? Use un intervalo de confianza de 95% para estimar la diferencia
entre las proporciones poblacionales de republicanos y demócratas para justificar su respuesta.