Вы находитесь на странице: 1из 5

INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE DOS MEDIAS.

Sean X11, X12, X1n1, una muestra aleatoria de n1 observaciones tomadas de una primera poblacin con valor esperado 1 y varianza s 1, y X21, X22, X2n2 una muestra aleatoria de n2 observaciones tomada de la segunda poblacin con valor esperado 2 y varianza s 2. Si son las medias muestrales, la estadstica es un estimador puntual de 1 - 2, y tiene una distribucin normal si las dos poblaciones son normales, o aproximadamente normal si cumple con las condiciones del teorema del limite central (tamaos de muestras relativamente grandes). Es decir, . Por lo tanto, Para calcular el intervalo de confianza para la diferencia de dos medias se debe saber si las varianzas poblacionales son conocidas o desconocidas, y en caso de que sean desconocidas, se debe probar si son iguales o diferentes. Cada uno de estos tres casos se analizarn por separado Varianzas conocidas Si las varianzas poblacionales son conocidas, los pasos a seguir para encontrar el intervalo de confianza son los siguientes: a) El estadstico usado como estimador puntual de la diferencia de medias 1 - 2 ser T = , que es un estimador suficiente b) La variable aleatoria asociada con el estimador ser la variable normal estndar dada por: c) Para calcular el intervalo de confianza se debe tener en cuenta la siguiente probabilidad: Manipulando la expresin anterior en forma similar a como se hizo en los casos de una sola muestra se llega al siguiente teorema que nos define el intervalo de confianza para la diferencia entre dos medias 1 - 2 con varianzas conocidas s 1ys 2. Teorema. Si son las medias de dos muestras aleatorias independientes de tamao n1 y n2 tomadas de poblaciones que tienen varianzas conocidas s

1ys 2, respectivamente, entonces un intervalo de confianza del 100(1-a)% para 1 - 2 es: Ejemplo. Construya un intervalo de confianza del 94% para la diferencia real entre las duraciones de dos marcas de bombillos, si una muestra de 40 bombillos tomada al azar de la primera marca dio una duracin media de 418 horas, y una muestra de 50 bombillos de otra marca dieron una duracin media de 402 horas. Las desviaciones estndares de las dos poblaciones son 26 horas y 22 horas, respectivamente. Solucin. Tenemos que:, , s1 = 26, s2 = 22, n1 = 40, n2 = 50, Z0.03 = 1.88. El intervalo de confianza es, entonces: El hecho de que ambos lmites sean positivos, y por lo tanto no contengan el valor cero indican que ambas marcas no tienen la misma duracin media, y sugiere que pueda pensarse que la primera marca de bombillos tenga una duracin media superior a la segunda. Varianzas desconocidas e iguales ( = = ) Cuando las varianzas son desconocidas, se debe realizar previamente una prueba estadstica para verificar si stas son iguales o diferentes. Para realizarlo debemos hacer uso de la distribucin F, bien sea mediante el clculo de la probabilidad de que la muestra tomada provenga de dos poblaciones con varianzas iguales, o mediante el uso de un intervalo de confianza para la relacin de dos varianzas, segn se estudiar ms adelante. Si mediante el uso de la distribucin F se llega a la conclusin de que las varianzas son iguales, el procedimiento a seguir para el clculo del intervalo de confianza para la diferencia de dos medias ser el siguiente: a) El estadstico usado como estimador puntual de la diferencia de medias 1 - 2 ser T = , que es un estimador suficiente. b) La variable aleatoria asociada con el estimador ser la variable T definida como: donde es un estimador combinado de s , mejor que por separado, y c) Para calcular el intervalo de confianza se debe tener en cuenta la siguiente probabilidad:

De nuevo, manipulando la expresin anterior en forma similar a los casos se llega al siguiente teorema que nos define el intervalo de confianza para la diferencia entre dos medias 1 - 2 con varianzas desconocidas s 1ys 2, pero iguales: Teorema. Si son las medias y las varianzas de dos muestras aleatorias de tamaos n1 y n2, respectivamente, tomadas de dos poblaciones normales e independientes con varianzas desconocidas pero iguales, entonces un intervalo de confianza del 100(1-a)% para la diferencia entre medias 1 - 2 es: Ejemplo. La siguiente tabla presenta los resultados de dos muestras aleatorias para comparar el contenido de nicotina de dos marcas de cigarrillos. Suponiendo que los conjuntos de datos provienen de muestras tomadas al azar de poblaciones normales con varianzas desconocidas, construya un intervalo de confianza del 95% para la diferencia real de nicotina de las dos marcas. Solucin. Inicialmente mediante la distribucin F debemos verificar si las varianzas son iguales (==) Buscando en la tabla de la distribucin F para 7 grados de libertad en el numerador y 9 en el denominador, vemos que el valor de la probabilidad est entre 0.10 y 0.25 (aproximadamente 0.19, mediante interpolacin lineal). Como esta probabilidad es muy alta, concluimos que no hay evidencia para rechazar la hiptesis de que las varianzas sean iguales. Como las varianzas son iguales, calculamos que est dado por: El intervalo de confianza del 95% est dado por (t0.025,16 = 2.12): Debido a que la diferencia real puede ser cero, no se puede concluir que existe una diferencia en el contenido de nicotina de las dos marcas de cigarrillos. Ejemplo. El gerente de una refinera piensa modificar el proceso para producir gasolina a partir de petrleo crudo. El gerente har la modificacin slo si la gasolina promedio que se obtiene por este nuevo proceso (expresada como un porcentaje del crudo) aumenta su valor con respecto al proceso en uso. Con base en experimentos de

laboratorio y mediante el empleo de dos muestras aleatorias de tamao 12, una para cada proceso, la cantidad de gasolina promedio del proceso en uso es de 24.6 con una desviacin estndar de 2.3, y para el proceso propuesto fue de 28.2 con una desviacin estndar de 2.7. El gerente piensa que los resultados proporcionados por los dos procesos son variables aleatorias independientes normalmente distribuidas con varianzas iguales. Con base en esta evidencia, debe adoptarse el nuevo proceso? Varianzas desconocidas y desiguales s 1s 2 Si mediante el uso de la distribucin F se llega a la conclusin de que las varianzas son diferentes, el procedimiento a seguir para el clculo del intervalo de confianza para la diferencia de dos medias ser el siguiente: a) El estadstico usado como estimador puntual de la diferencia de medias 1 - 2 ser T = , que es un estimador suficiente b) La variable aleatoria asociada con el estimador ser la variable T definida como:
donde

c) El intervalo de confianza esta dado por el siguiente teorema, basado en la distribucin t con n grados de libertad. Teorema. Si son las medias y las varianzas de dos muestras aleatorias de tamaos n1 y n2, respectivamente, tomadas de dos poblaciones normales e independientes con varianzas desconocidas y desiguales, entonces un intervalo de confianza aproximado del 100(1-a)% para la diferencia entre medias 1 - 2 es: Problema. Cierto metal se produce, por lo comn, mediante un proceso estndar. Se desarrolla un nuevo proceso en el que se aade una aleacin a la produccin del metal. Los fabricantes se encuentran interesados en estimar la verdadera diferencia entre las tensiones de ruptura de los metales producidos por los dos procesos. Para cada metal se seleccionan 12 ejemplares y cada uno de stos se somete a una tensin hasta que se rompe. La siguiente tabla muestra las tensiones de ruptura de los ejemplares, en kilogramos por centmetro cuadrado: Si se supone que el muestreo se llev a cabo sobre dos distribuciones normales e independientes, obtener los intervalos de confianza estimados del 95 y 99% para la diferencia entre los dos procesos. Interprete los resultados.

Вам также может понравиться