Вы находитесь на странице: 1из 36
Unipap 1 PRUEBA DE HIPOTESIS Objetivos Al finalizar la unidad, el alumno: ‘© Comprenders el concepto de prueba de hipétesis error de tipo I y I. ‘© Aplicard prueba de hip6tesis para estimar la media poblacional cuando se conoce o desconoce su desviacion esténdar rueba de hipstesis para comparar dos poblaciones independient 4 los resultados de prueba de hipétesis en problemas de aplicacién. Estadistica 1117 Introduccién ctualmente la estadistica aplicada ha tomado un papel fundamental como herramienta para la toma de decisiones. El andlisis de los sucesos econémicos, politicos y sociales en cualquier lugar del mundo tienen relevancia en nuestro entorno, por lo tanto, toda herramienta que sirva para inferir, pronosticar, analizar y resumir informacién, es considerada como una ventaja competitiva, que es precisamente la labor de la estadistica aplicada Con la evolucién de las computadoras y su facil manejo, la estadistica ha evolucionado gigantescamente, sin embargo, es necesario que el profesionista tenga los conocimientos suficientes para poder interpretar correctamente los resultados de un andlisis estadistico, éste es uno de los principales objetivos del presente libro. Como mencionamos, uno de los propésitos més relevantes de la estadistica es describir la informacién, ya sea proveniente de una muestra o de la poblacién (censo); por razones de costos y tiempo no es comiin realizar censos para conocer la poblacién de interés, que puede ser la calidad de un lote de producto, la aceptabilidad de un nuevo antidcido en el mercado mexicano, la intencién de voto a favor de un candidato presidencial, ete. Para conocer a Ja poblacién se recurre al muestreo; éste consiste en seleccionar una muestra representativa, evaluarla y, a partir de los resultados obtenidos de la muestra, inferir el comportamiento de la poblacin. En el curso de estadistica I adquiriste conocimientos bisicos de estadistica descriptiva, técnicas de muestreo, distribuciones de probabilidad (normal estindar), asi como procedimientos para realizar estimaciones, los cuales se retoman en la presente unidad con la finalidad de estudiar el proceso de prueba de hipétesis. Con [a aplicacién de pruebas de hipdtesis se obtendra informacién confiable para tomar decisiones acerca del comportamiento de la poblacién de interés En esta unidad se describiré el procedimiento para realizar pruebas de hipstesis, describir a una poblacién y comparar dos poblaciones; también se discutiré la importancia de conocer el Jenguaje utilizado en pruebas de hipstesis, ya que es utilizado en Normas Oficiales Mexicanas, se citardn algunos ejemplos. 18 | Unidad 1 1.1. Definicién de prueba de hipotesis Una prueba de hipétesis es el procedimiento de la estadistica interencial donde seestablece una conjetura acerca de las) caraceristica(s) de una poblacién y que permite verificar, si esta(s) caracteristica(s)_preestablecidas) se cumple(n). El objetivo de este procedimiento es rechazar o aceptar la conjetura ini que recibe el nombre de hipétesis; ejemplo: un jefe de gobierno considera que cn las proximas elecciones su partido volverd a ganar la jefatura, para lo cual establece (crea una hipétesis) que més de 50% de los ciudadanos votarin a favor de su partido, Para probar sila “ del actual jefe de gobierno es correcta, se tomar una muestra representativa de los ciudadanos y a partir de Jos resultados obtenidos se concluira si el jefe de gobierno tiene o no razén. al, 1.1.1. Tipos de errores en el planteamiento de prueba de hipotesis Al tomar una decisién 0 conclusién acerca de cualquier tipo de fenémeno existe la posibilidad de cometer error, por ejemplo, en el noticiero de la maiiana se pronostica que el dia sera caluroso y sin Iluvia, por lo tanto, decidimos, con base en el pronéstico, vestimos con ropa ligera; pero sucede que el dia es frio y-con Iluvia intensa, esto quiere decir que a pesar de tener elementos de juicio, existe la posibilidad de cometer error en la toma de decisiones, por lo tanto, resulta necesario reducir lo mis posible este error. Con el propésito de deseribir los tipos de errores en el planteamiento de pruebas de hipétesis analizaremos el siguiente ejemplo: Se trata de un juicio para demostrar si una persona es inocente o culpable de un delito, de tal forma se plantea como hipdtesis que la persona es inocente, a esta hipétesis se le conoce como hipdtesis nula y se representa por H, el término nula se refiere a que hay nulidad de efecto, és decir, se da por hecho que la persona es inocente hasta que se demuestre lo contrario; la hipstesis alternativa (representada por H,) corresponde a ser culpable. Jui Hipétesis nula_-H,: La persona es inocente Hipétesis alterna HY: La persona es culpable Estadistica I]19 Después de analizar todas la pruebas y testimonios correspondientes al andlisis de la muestra, el jurado indica su veredicto; a continuacin se presentan lidades de error de este veredicto, cuando se contrasta con la situacién VEREDICTO Tnoconte Culpable (Aceptar H,) (Rechazar 1, Inocente | No hay error error de tipo | SITUACION| culpable | Error de tipo I! No hay Error REAL 2 Tabla 1.1. Errores en el planteamiento de prueba de hipétesis. Al analizar Ia tabla anterior se identifican dos tipos de errores cy fa estos errores se les conoce como errores tipo I y tipo Il, respectivamente. Una de las caracteristicas de estos errores es que se encuentran relacionados de manera wersamente proporcional, lo que quiere decir que conforme disminuye uno el otro aumenta, de tal forma que es fundamental establecer cual de estos errores es mis nportante y reducirlo. En a estadistica inferencial, al igual que en el ejemplo del juicio a una persona, el error mis importante es el error de tipo I; es decir, concluir que la persona es culpable dado que es inocente. Jmaginemos que la pena ssea cadena perpetua, sise analiza el error de tipo Il, éste indica que el veredicto ¢s inocente cuando realmente es culpable; las consecuencias de esto son inciertas debido a que la persona se puede regenerar y convertirse en hombre de bien. A continuacién se define de manera formal (ortodoxa) estos errores con base en la tabla 1. Error de tipo les la probabilidad de rechazar la hipotesis nula dado que la hipotesis nula es verdadera Error de tipo Iles la probabilidad de aceptar la hipétesis mula dado que la hipotesis nula es falsa* la palabra “aceptar” generalmente no se “En el lenguaje estadistico para prueba de hipétes la tazén es que decir “aceptat™ implica Uutliza, en su lugar se prefiere decir “no rechazat”: certezs (otal eertidumbre), 20 | Unidad 1 1.2. Prueba de hipotesis para la media de una poblacion pcuando se conoce la desviacion estandar poblacional o Para describir una poblacién en estadistica se utilizan medidas Hamadas parimetros, uno de los parimetros més utilizados para describir una poblacién se le conoce como promedio aritmetico 0 media y se representa por la letra griega H (ver Estadistica I, unidad 3), para conocer este valor seria necesario evaluar cada elemento de la poblacién, lo cual resulta muy costoso y requiere mucho tiempo, de tal forma que se prefiere utilizar la informacién de una muestra que sea representativa y, a partir del promedio muestral X. inferir el valor de J Para este caso se da por conocido el valor de la dispersién de la poblacién medido en términos de desviacién estindar poblacional 6 (ver Estadistica I, unidad 4), este valor se determina con base en estudios estadisticos anteriores Ginformacién retrospectiva). Un ejemplo corresponde a la variabilidad en el volumen dosificado en frascos de jarabe para la tos; el jefe de produccién conoce la variabilidad de la maquina, ya que se han fabricado muchos lotes anteriores Yy se tiene esta informacién, o bien, este valor de desviacién estindar puede ser ‘obtenida por medio del proveedor del equipo, articulos cientificos 0 por medio del conocimiento a priori del especialista A continuacién describimos la metodologfa para la prueba de hipétesis dey con desviacién estindar poblacional c conocida, por medio de un ejemplo: Fjemplo 1 El gerente de control de calidad desea saber si el tiltimo lote fabricado cumple la especificacién que dice que el peso promedio (1) de las cajas de cereal es de 300g; se sabe por experiencia que la desviacién estandar poblacional es de 15g, Para esto se toma una muestra aleatoria de 9 cajas de cereal, con los siguientes pesos: 295, 299, 301, 305, 298, 300, 301, 305 y 300z. Estadistica II|21 Procedimiento Paso 1 Identificar el modelo prob: El modelo probabilistico se refiere a la distribucién de probabilidad a utilizar. esto se define con base en las caraeteristicas del problema, en atencisn alfeorema central del limite (ver Estadistica 1. unidad 8, tema 8.3) que en sintesis dice “la distribucién muestral de la media ¥ se aproxima a una distribucién normal con media jr y desviacién estindar ¢,=9/,-, a medida de que se incremente el niimero de elementos 7 que conformar’ el timaiio de las muestras posibles que se cobticnen de la poblacién, no importando el tipo de distribucién de la pobl: por lo tanto, para este caso de prueba de hipdtesis se empl normal estindar “Z” (ver Estadistica J, unidad 7, tema 7.2). la distribucién Paso 2 Establecer la hipétesis nula y la alternativa La hipétesis nula en téminos estadisticos, para este ejemplo, es que el promedio del peso de las cajas de cereal del lote (poblacién) sea igual a 300. Hy = 300g Donde es el promedio del peso de todas las cas de cereales del lote a evalua. La hip6tesis alternativa también debe estar en términos estadisticos y corresponde al complemento de la hipétesis mula; ésta se representa como H, (algunos autores la identifican como Ha). En este ejemplo 1a hipétesis alternativa es la siguiente: Hy: 1#300g Paso 3 Definir el nivel del error de tipo I “te” y determinar el estadistico de prueba Definir el nivel de error de tipo I es un paso eri Este se establecerdn los criterios para rechazar la hip6tesis nula. Debido a lo anterior, en algunas pruebas importantes para establecer la calidad de productos de consumo humano, la Secretaria de Salud (por medio de documentos que ‘0 ya que en funcién de 22 | Unidad 1 son considerados leyes para el gobierno mexicano, tal como la Norma Oficial Mexicana NOM 177-SSA1-1998)establece la magnitud del errorde tipo | como 0.05. Al error de tipo I en pruebas de hipétesis también se le conoce como nivel de significancia® En general se considera como un nivel de significancia adecuado el valor de 0105; es decir, cometer un error de 5%. Este valor fue utlizado inicialmente por R. A. Fisher”: dependiendo del rea de estudio, este valor puede ser modificado ya sea por criterio del investigador 0 por documentos normativos. Esta ico de prueba Como estacistico de prueba se le conoce al valor que es calculado a partir de los datos muestrales considerando la distribucién de probabilidad seleccionada; este valor se utilizard para tomar la decision de rechazar ono la hip6tesis mula De acuerdo con el paso I, la distribucién a utilizar es la normal esténdar, por lo tanto el estadistico de prueba es el siguiente: “ o wn ‘A partir de los datos de la muestra se determina el promedio muestral X yse calcula el estadistico de prueba Z, Zealculada). De acuerdo con los datos del problem, el tamafio de la muestra es 71= 9, los resultados del peso de cada caja de cereal fueron 295, 299, 301, 305, 298, 300. 301, 305, y 300g. La desviacién estindar poblacional ¢ es de 15g Con base en lo anterior: 95-+299-+301+305 +298+300+ 9 3004-300 _ 04 TS 5 08 v9 ‘Aumue Ta Real Ardea de la Lengua Espo adopt lino “significa” gut utilizaremos el término “significancia’, del ingléssignificance, *4Fisher es considerado padre de la estalstca aplicada, Estadistica I]23 Paso 4 Establecer las regiones de rechazo para la hip6tesis nula La distribucién del estadistico de prueba, en este caso la distribucién normal estindar, se divide en 2 regiones, una regién de rechazo de H,y otra de no rechaza (Vease la figura 1.1) Exto significa que con base en el valor de Z, se tomar la deci aaceptarlahipétesis nuts; esta decisin estard en funcién del nivel de La hipotesis nula para este caso indica que yes igual a 300 (H,; = 3002), esto quiere decir que se va.a rechazar cuando sea diferente de 3002, pero .. mn de rechazar 0 ignificancia a. qué significa que ys sea diferente de 300g? wo» diferente de 300g implica dos alternativas, una que sea mayor que 300g y la otra que sea menor que 300z. por lo tanto se tendriin dos regiones de rechazo (algunos autores Haman a este tipo de prueba de “dos colas” o de “dos extremos”). Las regiones de rechazo indican partir de qué valor se va a considerar 1 mayor o menor que 300g. Para construir las n normal «dar (se llama normal estindar porque siempre tendré como valor de 1 cero y nplo la media bajo H, toma nla distribucién normal estindar, Z, este valor equivale a cero, est desviacién estindar 1), esto quiere decir que en el ej el valor de 304 El rea de las regiones de rechazo corresponden al valor del error de tipo I 0 nivel de significaciéncz; dado que en este ejemplo se tienen dos regiones de rechazo, cada regi6n tendré ce/2 de drea, para que la suma de las dos regiones de rechazo sea ‘gual az, tal como se muestra en la siguiente figura: Regisn de aceptaisn de, Region derecharo cH, > peso de las eaas de cereal 3008 x Figura 1.1. Distribucién del peso de las cajas de cereal 24 | Unidad 1 Al utilizar la distribucién normal esténdar, la media de las cajas de cereal se transforma en cero, con desviacién estindar 1, tal como se muestra a continuacién, Region de sceptacién Regin de rechazo de, de, an ed 5ml Donde yes el promedio del volumen del nuevo producto. Paso 3 Definir el nivel de error de tipo I “tz” y el estadistico de prueba Se define «= 0.05 El estadistico de prueba es: A partir de los datos de la muestra determinar el promedio muestral xy 1a desviacién estindar muestral “S”; calcular el estadistico de pruebat, $4.745.845,345.9 + 5.327 +6.0- 53. 9-1 @-3F “Vo n=l (0.6724 + 0.1024+0.4624 +. 8 28 | Unidad 1 Paso 4 Establecer las regiones de rechazo para la hipétesis nula En este caso existe una regién de rechazo que corresponde a los valores de ¢, que sean significativamente mayores a la media, tal como se muestra a continuacién: Region de aceptacion ae, Regién de rechazo eH, Figura 1.5 Como c tiene un valor de 0.05, el valor de /,.,, que define la regién de rechazo es: bo i= tos 91 tong, a= L859591.86 (tabla de la distribueién f-siudent) Bjemplo para determinar el valor de f,.,- Nivel de c (cola superior) al o1 | 0.05 | 0.025 | 0.01 1 | 3.0777 | 6.3}38 | 12.7062 | 31.8207 2 | 1.8856 | 2.900 | 4.3027 | 6.9646 8 + ——+| 1.8595 Tabla 1.2. Tabla de la distribucién ‘student (ver anexo 2). Estadistica I]29 De manera que la egiOn de rechazo es: f,> 1,8595 Regi de aceptacién ell, Regién de rechazo ae, 0 8595 t Figura 1.6 Paso 5 ‘Tomar la decisién de rechazar oaceptar la hipétesis nula, con base en, Yt, yeoneluir. Como f, =1.8161 esté en la regién de aceptacién, se acepta la hipétesis mula Conelusién Se determina que el promedio poblacional (de todo el proceso) es menor 6 igual que 5 ml, por lo tanto, ta empresa puede ser demandada por el consumidor ya que el contenido promedio puede ser menor que 5 ml Ejercicio 1 En una empresa el serv nte se califica en una escala de 0 a 10, El jefe de este servicio considera que, en promedio, los clientes califican el servicio con 9, Pura demostrar lo anterior decide seleccionar aleatoriamente 10 clientes y preguntaries la calificaci6n que darian a la empresa, los resultados son los siguientes: 8,9, 10, 7, 10, 8, 9,9, 77. Con base en esta muestra, se puede conch servicio al cliente es correcta? que la conjetura del jefe de 30 | Unidad 1 1.4, Prueba de hipotesis para comparar dos poblaciones independientes Un problema comin en la industria es comparar la eficiencia de dos proveedores, el rendimiento de dos métodos de fabricacién, la velocidad entre dos méquinas, la calidad de egresados en dos instituciones, la aceptacién de un producto en dos nichos de mercado, etc. En estos ejemplos se identifica que las poblaciones son independientes, esto quiere decir que los resultados de un consumidor o la eficacia del proveedor A no influyen en los resultados del otro consumidor o proveedor B. A continuacién se describird el procedimiento para comparar dos poblaciones independientes. Para comparar dos poblaciones generalmente se considera que ambas tienen Ja misma variabilidad; es decir, Ia amplitud de las distribuciones normales son semejantes: a esta propiedad se le conoce como omoscedasticidach Hy He Figura 1.7. En la figura anterior se observa que 1a amplitud de las distribuciones, que representa la variabilidad, es semejante, éste es un supuesto que se puede verificar por medio de una prueba de hipstesis con distribucién F’'de Fisher . El objetivo de comparar dos poblaciones por medio de una prueba de hipétesis consiste en determinar si las medias j1, y ft son estadisticamente diferentes; esto se puede evaluar por medio de la diferencia entre éstas, es decir, 4/1, =6, sid es diferente de cero, querré decir que las poblaciones son diferentes. La metodologia de prueba de hipétesis es 1a misma que se empleé anteriormente. Estadistica [31 Cuando se conoce la desviacién estindar poblacional cen ambas poblaciones y bajo el supuesto de homoscedasticidad, se utilizard como estadistico de prueba que se define como: donde: ¥,= media de la muestra tomada de la poblaci6n 1. media de 1a muestra tomada de ta poblacién media de la poblacién 1. media de la poblacién varianza de la poblacién 1. arianza de la poblacién 2. ‘n= tamaiio de In muestra tomada de la poblacién 1. Z= tamaito de la muestra tomada de la poblaci6n 2. Sin embargo, en la mayoria de los casos donde se desea comparar dos poblaciones, se desconoce el valor de Ia varianza, por esta razén se utiliza ~bajo el supuesto de homoscedasticidad~ un valor que representa Ia variabilidad de ambus poblaciones a partir de datos muestrales 7, < 30, 7, < 30); a esta varianza se le conoce como varianza mancomunada o S,? (pproviene del inglés pooled) La hip6tesis que se plantea para determinar si dos poblaci ales se describe a continuacién: mes son Contra la hipétesis alternativa: Him, #4, 0 HM, #0 Para evaluar la hipstesis anterior se utiliza el estadistico de prueba s, para varianza mancomunada Sz 32 | Unidad 1 donde: media de la muestra tomada de la poblacién media de la muestra tomada de la poblacién 2. dia de la poblacién 1 media de la poblacién 2. '= varianza de la muestra tomada de la poblacién 1 varianza de la muestra tomada de la poblacién 2. ‘amafio de 1a muestra tomada de la poblacién 1. (7, < 30) 1n,= tamaio de la muestra tomada de la poblacién 2. 1, < 30) El valor de /,.,, S¢ calcula con el nivel de significancia cy con los grados de libertad El procedimiento se describiré por medio del siguiente ejemplo: Ejemplo 4 A una muestra aleatoria de vendedores de seguros de dos compaiiias se les aplica un examen para demostrar sus conocimientos sobre seguros, los resultados son: ‘Compania 1 | Compahia2 ny=10 ny=10 5210.2 s14.14 F833 F924 Estadistica II]33 {Se puede concluir que los vendedores de ambas compaiias tienen en promedio los mismos conocimientos en seguros? Paso 1 Identificar el modelo probabilistico Distribucién fcon varianza mancomunada (ya que no se conocen g, y0;) Paso 2 Establecer la hipétesis nula y la alternativa He y= 0 Hy 4,-4,40 Donde s/s el promedio de conocimientos en seguros para cada poblacién. Paso 3 Definir el nivel del error de tipo I “tc” y el estadistico de prueba Se define «= 0.05 Elestadistico de prueba es: p= GsEdotn=) be(td] Con base en Ia informacién muestral se calcula el estadistico de prueba. ‘Compaiia 1 | Compafia2 n=10 n=10 5-102 sp l4.l4 ¥-83.3 3924 34 | Unidad 1 A partir de las desviaciones estndares “S” se obtienen las varianzas, para esto se eleva al cuadrado cada valor de la desviaci6n estindar. 0.27=104.04 Una vez calculadas las varianzas muestrales se obtiene el valor de la varianza mancomunada y finalmente el estadistico de prueba f, tal como se muestra a continuacién: (n, -Ds? +(n =1)s? _ (10-1)104.04 + (10-1199 94 _ 2735.82 2 10+10-2 18 (833-92.4)-(0)__-9.1_ _ ~9.1 i TT, 30398 5.513 519 44+ YISL99G5 +79) 1.99 1.65 Paso 4 Establecer las regiones de rechazo para la hipétesis nula En este caso existen dos regiones de rechazo, como se observa en Ia si afi ente Regién de rechazo de H, Regién de aceptacién para H, Figura 1.8. Como ces de 0.05, los valores de 4, havin Aue definen las regiones de rechazo son: t, 11009 ( Valor obtenido de la tabla de la distribuciéns-stucent) Estadistica [35 Para determinar el valor de f,.,¢ Nivel de @ (cola superior) oa | 00s | 0025 | 001 i al 1 | 3.0777 | 6.3138 | 12.4002 | 31.8207 2 | Lasse | 2.9200 | 4.3927 | 6.9646 18 {2.1009 Tabla 1.3. fabla de la distribuci6n fostudent (ver anexo 2). mn de rechazo queda de la siguiente forma: Regi de aveptacién ath, Regién de rechazo eH wa > wa : 2.1009) 2.1009 Figura 1.9. Paso 5 Tomar la deci ¥ tgyay ¥ concluir in de rechazar oaceptar la hipétesi ula con base en, Como 1,= -1.65 estd en la regién de aceptacién, se pta Hy, 36 | Unidad 1 Region de acepasiin ae, Repién de reeher0 eH, Figura 1.10. Conclusién Existe evidencia que demuestra que en promedio, los conocimientos de los vendedores de seguros de las compaitias evaluadas son los mismos Ejercicio 2 1. Dada una muestra de tamatio 7,=40 que proviene de una poblacién con desviacién estindar conocida 0,=20, y otra muestra independiente 7,=50 que proviene de otra poblacién con desviacién estindar conocida 0,=10, los promedios de cada muestra fueron los siguientes: 66, determinar el estadistico de prueba Z, 2. Se desea determinar si existe diferencia entre el tiempo en que los clientes de dos tiendas de ropa casual reciben el catilogo con los nuevos modelos y tendencia en la moda. Los resultados son los siguientes: ‘Tienda 1 Tienda 2 3 3sdias | y-44 dies S24 3 dias n=40 30 Asumiendo que las varianzas poblacionales de ambas tiendas son iguales (homoscedisticas) y «=0.05, {se puede concluir que el tiempo en que los clientes reciben el catdlogo en ambas tiendas es el 1 Estadistica II]37 Ejercicios resueltos 1. Se realiz6 un estudio de mercado para saber el nivel de ingreso familiar promedio en una zona especitica de Ia ciudad de México; si el nivel de ingreso familiar es mayor 0 igual que 15 000 pesos, entonces se consideraré esta zona como viable para ser un nicho de mercado. Se decide tomar una muestra de 10 familias, con base en estudios anteriores se considera que 1a desviacién estdndar del nivel de ingreso poblacional o para esta zona es de 5 000 pesos. Jos resultados son los siguientes: $12 000, $17 000, $12,000. $15 000, $16 000, $10 000, $14 000, $160000. $18 000 y $11. 000 {Se puede concluir con base en esta muestra que el promedio de ingreso familiar es mayor o igual que 15.000 pesos? Paso 1 Identificar el modelo probabilistico Dado que se conoce la desviacién estindar poblacional oy se desea inferir sobre el promedio, la distribucién apropiads es la normal esténdar Z. Paso 2 Establecer la hipétesis nula y la alternativa Hy wz $15.00 eso de todas las familias de la zona de Donde 1 es el promedio del interés. ente: En este ejemplo ta hipstesis alternativa es la Hy w< $15.00 38 | Unidad 1 Paso 3 Definir el nivel del error de tipo I ‘t<” y determinar el estad Se define «= 0.05 El estadistico de prueba es: i-u a Vn A partir de los datos de Ja muestra, determinar el promedio muestral X y calcular el estadistico de prueba 1200+ 17 000-+12.000+15 000+ 16 000+ 10 000+14000+16 000 +18000-+1 1000 _ 0 141000 _ 10 14100 14100-15000 __-900 5.000 1581.14 iO Paso 4 Establecer las regiones de rechazo para la hipétesis nula En este caso existe una Unica regién de que corresponde a los valores de Z que sean signi media, tal como se muestra a continuacién 0 (prueba de “una cola”), tivamente menores que la Regi de cepacia Region de ecbazo dete well, \ Figura 1.11. Estadistica i1]39 Como ces de 0.05, el valor de Z, Z sas que define la regién de rechazo es: 645 Lo anterior se observa en la sigui Regn de sceptacién Regién de rechazo = eH, ae, = 64s 0 z Figura 1.12. Paso 5 ‘Tomar la decisin de rechazar o aceptar la H, con base en Z, ¥ Zs,,¥ concluir dentro de la regi n de aceptacién, se acepta la Como Z, = -0.57 hipétesis nula. Regisn de aeptacién ek, Repién de echazo eH, \ HLes z-081 Figura 1.13. Conelusién El promedio familiar en la zona (poblacién) de interés es mayor 0 igual que $15 000, por lo tanto, esta zona puede ser considerada como nicho de mercado 40 | Unidad 1 2. Dada una muestra de tamaio ,= 8 con media nwestral ¥, = 42.y desviacién esténdar muestral s,= 4, y otra muestra independiente de tamatio”2,=15 con media muestral ¥, = 34 y desviaciOn estindar muestral s3=5. ¢Es posible concluir que las dos poblaciones representadas por las nuestras son iguales? Considera que las varianzas poblacionales son semejantes y utiliza c= 0.05 Paso 1 Identificar el modelo probabilistico Distribucién con varianza mancomunada. Paso 2 Establecer la hipétesis nula y la alternativa Hy 4, Hem Donde ses el promedio en cada poblacién. Paso 3 Definir el nivel del error de tipo I “2” y el estadi Se define « = 0.05 El estadistico de prueba es: Ie .t enn Con base en Ia informacién muestral se calcula el estadistico de prueba. Estadistica 141 42-34)-(0 Td | gis Establecer las regiones de rechazo para la hip6tesis nula En este caso existen dos reg grifica: nes de rechazo, como se observa en la siguiente Regia de aceptaciéa ae, Regidn de reenaro det, Figura 1.14. Como a es de 0.05, los valores de 4, fans ue definen las regiones de rechazo son: boo 2.5177 (tabla de la distribucién é-student) Para determinar el valor de fysur Nivel de a (cola superior) 1 Toa | 00s | 002s | oor 1 | 3.0777 | 6.3138 | 12-4062 | 51.8207 2 | 1.8856 | 2.9200 | 4.3h27 | 69646 a | ——-—} 25177 Tabla 1.4. Tabla de la distribucién Astudent (ver anexo 2) 42 | Unidad 1 Por lo anterior, la egion de rechazo queda de la si Rogicn de aceptacién eH, jiente forma: Figura 1.14. Paso 5 Tomar la decisién de rechazar 0 aceptar la hipétesis nula con base ent, y coneluir. batts Como /,= 3.896 esté en la regién de rechazo, se rechaza Hy Condlusién Existe evidencia que demuestra que las medias de las poblaciones son diferentes Ejercicios propuestos 1. El gerente de recursos humanos quiere demostrar que el rendimiento promedio del personal es de 90%, para esto considera que la desviacién estindar poblacional cres de 10%; decide tomar una muestra de 18 empleado y evaluar su rendimiento, los resultados son los siguientes: 90, 78, 40, 34, 20, 36, 61, 60, 80, 89, 41, 32, 69, 68, 50, 95, 78 y 89%. Con base en estos resultados, se puede concluir que la hipétesis del gerente Estadistica l]43 jentes datos representan el nimero de platos lavados antes de que desaparezea la espuma en una prueba de detergente para trastos: 27, 28, 30, 31 29, 25,25, 30, 21, 34, 31, 33, 35, 24, 25, 28, 32, 34, 30 y 34 Sila fabrica no puede demostrar que el promedio de platos lavados (antes de que desapareciera la espuma) es de por lo menos 34, ésta tendra que mejorar su detergente, Basados en esta prueba concr = 0.05, ;qué tiene que hacer la fabrica? 3, Se quiere evaluar dos proveedores. Las cal fueron: Proovedor | Proovedor A B 35 38 50 22 4 58 30 45 33 30 {Se puede concluir que hay diferencia entre los proveedores con c= 0.05? Considera que las varianzas de las calificaciones en ambos proveedores es la misma, Autoevaluacion I de los siguientes incisos corresponde a la definicién del error de ‘on? a) Probabilidad de rechazar la hipétesis nula dado que la hip6tesis nula es verdadera. b) Probabilidad de aceptar la hip6tesis nula dado que Ia hipétesis nula es falsa. ©) Probabilidad de aceptar la hipétesis nula dado que Ia hip6tesis nula es verdadera. @ Probabilidad de rechazar la hip6tesis nula dado que la hip6t falsa, is nula es 44 | Unidad 1 2. ;Cual de las siguientes opciones corresponde al planteamiento de una prueba de hipstesis? a) w=20 b) @= 0.05 ce) ¥=833 d) Z=196 3. El estadistico de pruet se desconoce: {,s¢ usa para verificar que Hy; 4¢= 280, cuando ao bys cn da 4, El gerente de control de calidad desea verificar que el contenido promedio de shampoo en el titime lote producido es de 250 ml, para esto toma una muestra aleatoria de 25 botellas, con promedio muestral de 245 ml y desviacién esténdar s=16 mil. ;Cual es la prueba de hipdtesis que corresponde a este planteamiento? a) Hga> 250ml vs Hy $250 ml b) Hew<250ml vs Hy 2250ml c 250ml vs Hw $250 ml 250ml vs Hy: #250 ml 5. Del inciso anterior, qué valor corresponde al estadistico de prueba f:? a) -1.56 b) 2.33 old 4) 2.56 6. Indica el valor de los grados de libertad @/) para el enunciado del problema 4. a) 14 b) 16 c) 24 4) 20 Estadistica ]45 7. Indica el valor de f, tus, onsiderandos=0.05 en el enunciado del problema 4 a) 2.064 b) 1.7531 ©) 1.3406 4) 0.6912 ©) 2.9467 8. Con base en los incisos anteriores, ;cudl serfa la conclusién’? a) Rechazar Hyp b) Aceptar Hp ©) Ni aceptar ni rechazar Hy 4) Rechazar Hy 9. Se tienen dos poblaciones independientes y es de interés conocer si las poblaciones son similares; para esto se considera que las varianzas poblacionales son iguales y c= 0.05. Después de realizar un muestreo aleatorio en cada poblacién se presentan los resultados. Pobl Indica ;cual es la hipétesis nula y alternativa? a) Hya-m20 vs Hy mn, 40 b) vs Hem, ° vs He aye @) H,-1,20 vs Hy ,-1,=0 10. ;Cual seria la conclusién, considerando los datos del problema 9? a) Rechazar Hy b) Aceptar Hy, ©) Ni aceptar ni rechazar Hy 4) Rechazar Hy, 46 | Unidad 1 Respuestas a los ejercicios Ejercicio 1 vs Hy 61647 Prueba de dos colas c¢/2 = 0.025. fy. Zonas de rechazo: #9 2622 Regién de rechazo de, Regn de aceptacisn oH, a ° NS 2282 22622 Conclusion: se avepta Hy por lo tanto, la conjetura realizada por el jefe de servicio al cliente es correcta, Ejercicio 2 8, Prueba de dos colasc/2 = 0.025. f,., Zonas de rechazo: Estadistica I1]47 Regién de rechamo Regitin de acepiacén aH, ey, a a7 ° NS 1995 Conclusion: dado que t quiere decir que hay diferencia entre el tiempo en que los clientes de cada tienda reciben el catalogo. 14 en la regidn de rechazo, se rechaza H,; esto Respuestas a los ejercicios propuestos 90% vs H 4#90% 12.3693 196 Regia de rechazo mde H, Rei de seepacin eel, 196 Conclusion: dado que el valor de Z,se encuentra en la zona de rechazo, se rechaza H,, por lo tanto, la hipétesis del gerente es incorrecta . Hy: ft 234 platos vs H,: 11 < 34 platos = 5.3968 9 1 645, y= 1.7291, dado que la zona de rechazo es la izquierda, el valor ra negativo. Zona de rechazo para H, 48 | Unidad 1 Regién de aceptacién Regie de recta ei, Conclusién: dado que el valor de t, se encuentra en las zona de rechazo, se rechaza H, por lo tanto, la compatia tendré que mejorar su detergente a espuma no dura lo suficiente para lavar més de 34 platos. va que 3. Hy, HL 1.5 0.422739 gl= 8, Prueba de dos colas a2 1 2.3060 Os He m-,40 0.025 hosts oon Zonas de rechazo para Hy Region de aceptacon Rein dee va ° N\ 1 23060 2.3060 Conclusion: dado que el valor de f, se encuentra en la zona de aceptacién, se acepta Hy por lo tanto, no hay evidencia que demuestre diferencia entre los proveedores. Estadistica I]49 Respuestas a la autoevaluaci6n 1. a) 2. a) 3. a) 4.4) a) a) 1. a) 8. b) 9. a) 10. a)

Вам также может понравиться