Вы находитесь на странице: 1из 99

UNIVERSIDAD AUTÓNOMA DEL ESTADO DE MÉXICO

FACULTAD DE QUíMICA
P.E. DE INGENIERO QUÍMICO

U.A. PROBABILIDAD Y ESTADÍSTICA

UNIDAD IV INTERVALOS DE CONFIANZA

Material didáctico
Modalidad: Solo visión proyectable (diapositivas)

Responsable de la Elaboración:
SANDRA LUZ MARTÍNEZ VARGAS
1
mayo 2014
Presentación de la UA de Probabilidad y
Estadística
 La Unidad de Aprendizaje (UA) de Probabilidad y Estadística se ubica en el
núcleo básico del currículo de Ingeniero Químico y su importancia radica en que
es una herramienta fundamental para el ingeniero químico en la actualidad
puesto que le permite resolver problemas relacionados el control estadístico de
procesos, logística, integración de bases de datos y en el desarrollo de
experimentos, entre otros.
 La contribución de esta UA al perfil de egreso del ingeniero químico se centra en
la promoción de competencias como analizar, sintetizar y discriminar
información y su representación en tablas y gráficas; además de su capacidad
de intervenir y decidir en la solución de problemas relacionados con las áreas de
producción, procesos, calidad y desarrollo tecnológico, mediante la aplicación
de herramientas estadísticas.
 Las competencias que la UA promueve en el estudiante son de carácter integral,
el nivel cognoscitivo pretende alcanzar los niveles de comprensión de conceptos
y su aplicación en la solución de los problemas antes citados.
 La UA consta de seis unidades: Estadística descriptiva; Probabilidad;
Distribuciones de probabilidad de variables discretas y distribuciones de
probabilidad de variables continuas; Intervalos de confianza; Pruebas de
hipótesis; Regresión y correlación. Sustentada en un proceso educativo que se
centra en el estudiante, con la finalidad de propiciar el autoaprendizaje
desarrollando de manera integral habilidades, actitudes y valores. Por lo que
estrategias como la investigación individual y grupal, trabajos grupales,
resolución de problemas, exposiciones del profesor y de los estudiantes, así
como la resolución de problemas en la sala de cómputo conformaran las
actividades centrales durante el semestre.
 Los criterios de evaluación tienen un carácter de proceso continuo en el cual la
realimentación oportuna a los estudiantes acerca de su desempeño será factor
clave en el aprendizaje, de manera que el estudiante realizará trabajos previos
y posteriores a las sesiones de clase como: investigación documental de temas,
elaboración de representaciones gráficas y resolución de problemas; trabajo
activo en clase (resolución de problemas tipo y exposiciones ante el grupo);
2 y
presentación de las evaluaciones tanto las que señale el calendario oficial
respectivo.
Objetivo de la UA de Probabilidad
y Estadística
 Los discentes del programa educativo de Ingeniero Químico
mediante trabajo individual y en equipo serán capaces de
obtener modelos estadísticos que permitan resolver
problemas de cinética química, ingeniería de reactores,
ingeniería de procesos entre otros. Al finalizar la unidad de
aprendizaje el discente será capaz de analizar y discriminar
la información con que se cuente para poder resolver
problemas que involucren intervalos de confianza y pruebas
de hipótesis, relaciones de regresión y correlación de
variables. Además de proyectar comportamientos de las
variables a través de la inferencia estadística. Manteniendo
una disposición a la tolerancia, respeto, a aprender a
aprender; y una visión orientada a la calidad en el trabajo y
al trabajo en equipo; mediante el trabajo en equipo,
trabajo individual, uso de herramientas de cómputo,
búsqueda de información, capacidad de análisis, resolución
3

de problemas.
Guía para la utilización del material
 Este paquete contiene 93 diapositivas que tienen
como propósito que los estudiantes de la UA de
Probabilidad y Estadística, cuenten con un
material de apoyo para la Unidad IV Intervalos de
Confianza, pretendiendo facilitar la comprensión de
la temática abordada en la misma.

 El material que se presenta constituye un apoyo


para el docente que tenga la oportunidad de
impartir la unidad de aprendizaje de Probabilidad y
Estadística, cuya extensión y profundidad
corresponden a lo propuesto en el programa de la
UA. En cada tema se incluye la definición del
intervalo estudiado y ejemplos.

4
Contenido del material de apoyo
 Definición de Intervalo de Confianza
 Intervalo de confianza para la media de una población normal con
varianza conocida
 Intervalo de confianza para la media de una población con varianza
desconocida
 Intervalo de confianza para la varianza de una distribución normal
 Intervalo de confianza para el cociente de dos varianzas en
poblaciones normales
 Intervalo de confianza de muestra grande para una proporción
poblacional p
 Intervalo de confianza para la diferencia
de dos proporciones
 Intervalo de confianza para la diferencia de medias de dos
poblaciones de varianzas conocidas
 Intervalo de confianza para la diferencia de medias poblacionales
con varianzas desconocidas pero iguales
 Intervalo de confianza para la diferencia de medias de dos
poblaciones con varianzas desconocidas y diferentes
 Errores y tamaños de muestra 5
 Referencias Bibliográficas
DEFINICIÓN

 En estadística, se llama Intervalo de


Confianza a los pares de números entre
los cuales se estima que estará cierto
valor desconocido con una determinada
probabilidad de acierto.

 Formalmente, estos números determinan


un intervalo, que se calcula a partir de
datos de una muestra, y el valor
desconocido es un parámetro poblacional.

6
DEFINICIÓN

 La probabilidad de éxito, en la
estimación del intervalo se
representa con 1-α y se denomina
nivel de confianza.

α es el llamado error aleatorio o nivel


de significación, y se entiendo como
la medida de las posibilidades de
fallar.
7
DEFINICIÓN
 El nivel de confianza y la amplitud del
intervalo varían conjuntamente, es decir
 un intervalo con un rango más amplio
tendrá más probabilidad de acierto
(mayor nivel de confianza),
 un intervalo con un rango más pequeño,
que ofrece una estimación más precisa,
aumenta su probabilidad de error.

8
 Para la construcción de un
determinado intervalo de
confianza (1-α)100% es necesario
conocer la distribución teórica que
sigue el parámetro estadístico a
estimar, θ.

 Es habitual que el parámetro


presente una distribución normal.
9
 Un intervalo de confianza al (1-α)100%
para la estimación de un parámetro
poblacional θ que sigue una determinada
distribución de probabilidad, se define
con una expresión del tipo:
𝜃1 , 𝜃2 𝑡𝑎𝑙 𝑞𝑢𝑒 𝑃 𝜃1 ≤ 𝜃 ≤ 𝜃2 = 1 − 𝛼
Donde:
P es la función de distribución de
probabilidad de θ.

10
“Intervalo de confianza para la
media de una población normal
con varianza conocida”
11
 DEFINICIÓN

Si nuestra muestra se selecciona a partir de una población normal ó, a


falta de ésta, si n es suficientemente grande, podemos establecer un
intervalo de confianza para μ al considerar la distribución muestral de

𝑋.

La distribución muestral de 𝑋ത está distribuida de forma


aproximadamente normal con media 𝝁ഥ𝒙 = 𝝁 y desviación estándar
𝝈ഥ𝒙 = 𝝈/ 𝒏. Al escribir 𝒛𝜶/𝟐 para el valor de 𝑧 por arriba del cual
encontramos un área de α/𝟐, podemos ver que:

𝑃 −𝑧𝛼/2 < 𝑍 < 𝑧𝛼/2 = 1 − 𝛼


𝑋−𝜇
Donde 𝑍= 𝜎/ 𝑛


𝑋−𝜇
Por ello, 𝑃 −𝑧𝛼/2 < < 𝑧𝛼/2 = 1 − 𝛼 12
𝜎/ 𝑛
Sustituyendo y despejando se obtiene
𝑋ത − 𝜇
𝜎/ 𝑛 𝑃 −𝑧𝛼/2 < 𝜎 < 𝑧𝛼/2 = 1 − 𝛼
𝑛
𝜎 𝜎
𝑃 −𝑧𝛼/2 < 𝑋ത − 𝜇 < 𝑧𝛼/2 =1−α
𝑛 𝑛

𝜎 𝜎
Restando 𝑋ഥ 𝑑𝑒 𝑃 −𝑧𝛼/2 < 𝑋ത − 𝜇 < 𝑧 =1−α
𝑛 𝑛 𝛼/2
𝜎 𝜎
−1 𝑃 −𝑋ത − 𝑧𝛼/2 < −𝜇 < 𝑧𝛼/2 − 𝑋ത =1−α
𝑛 𝑛
𝜎 𝜎
Definiendo al intevalo como: 𝑃 𝑋ത − 𝑧𝛼/2 < 𝜇 < 𝑋ത + 𝑧 =1−α
𝑛 𝑛 ∝/2

13
Para muestras de tamaño 𝑛 ≥ 30, donde la forma de las distribuciones
no este muy sesgada, la teoría de muestreo garantiza buenos
resultados. Los valores de las variables aleatorias 𝜃𝐿 𝑦 𝜃𝑈 , son los
límites de confianza
𝜎 𝜎

𝜃𝐿 = 𝑥ҧ − 𝑧𝛼 መ
𝑦 𝜃𝑈 = 𝑥ҧ + 𝑧𝛼
2 𝑛 2 𝑛

 Ejemplo:
Se encuentra que la concentración promedio de zinc obtenida de una
muestra de mediciones en 36 sitios diferentes es 2.6 gramos por
mililitro. Encuentre los intervalos de confianza de 95 y 99 porciento
para la concentración media de zinc en el río. Suponga que la
desviación estándar de la población es 0.3
14
Ejemplo
Para 95%
La estimación puntual de μ es 𝑥ҧ = 2.6 el valor z que deja un área de 0.025 a la
derecha y, por lo tanto un área de 0.975 a la izquierda es 𝑧0.025 = 1.96*
0.3 0.3
2.6 − 1.96 < 𝜇 < 2.6 + 1.96
36 36
2.50 < 𝜇 < 2.70

Para el intervalo de confianza del 99% se encuentra el valor de z, que deja un


área de 0.005 a la derecha y 0.995 a la izquierda. Por lo tanto, 𝑧0.025 = 2.575 *
0.3 0.3
2.6 − 2.575 < 𝜇 < 2.6 + 2.575
36 36
2.47 < 𝜇 < 2.73

*Todos los valores de tablas son del : Walpole, Myers. (2007) Tabla A3 en “Probabilidad y
Estadística para ingeniería y ciencias”. (8ª ed.). Pearson Education. 15
“Intervalo de confianza para
la media de una población
con varianza desconocida”

16
Introducción
 Utilizar muestras pequeñas, siempre y cuando la muestra tenga
un comportamiento normal.
 Esta teoría también es conocida como: teoría exacta del
muestreo (porque también puede ser utilizada en muestras
aleatorias grandes).

 Necesita identificar el concepto de “grados de libertad”


1. Se hace referencia a la varianza muestral:

σ𝑛 2
𝑖=1 𝑥𝑖 − 𝑥ҧ
𝑠2 =
𝑛−1

 Esta ecuación está basada en n-1 grados de libertad


 Su simbología es v 17
Grados de libertad
 Lo que quiere decir que 𝑠 2 está basada en n cantidades, y
todas ellas suman cero.
𝑥1 − 𝑥,ҧ 𝑥2 − 𝑥,ҧ … , 𝑥𝑛 − 𝑥,ҧ

 Entonces especificar cualquiera n-1 determina el valor restante

 Por ejemplo, si n=4 y 𝑥1 − 𝑥ҧ = 8; 𝑥2 − 𝑥ҧ = −6 y 𝑥4 − 𝑥ҧ = −4 ,


entonces automáticamente tenemos 𝑥3 − 𝑥ҧ = 2

 Así que sólo tres de los cuatro valores de 𝑥𝑖 − 𝑥ҧ están


determinados (3 grados de libertad)

18
Student t
 Se tiene una muestra con una población normal con
media μ y varianza 𝜎 2 .

 Siendo 𝑥ҧ el promedio de las n observaciones de las


muestras

 Su distribución seria:

𝑥ҧ − 𝜇
𝑧=𝜎
ൗ 𝑛

Siendo una distribución normal estándar

19
Cuando la varianza es desconocida
 La media y la varianza de la distribución t son

𝜇 = 0 y 𝜎 2 = 𝑣Τ 𝑣−2 𝑝𝑎𝑟𝑎 𝑣 > 2

 La apariencia es similar a la de la distribución normal


estándar:
 Simétricas
 Unimodales
Distribución student T
 El valor máximo de la ordenada se alcanza en la media
μ=0
 La distribución t tiene colas más amplias que la normal,
es decir, la probabilidad de las colas es mayor que en la
distribución normal.
 A medida que el número de grados de libertad tiende a
infinito, la forma límite de la distribución t es la
distribución normal estándar. 20
Propiedades de la distribución t
1.Cada curva tiene forma de campana con centro en 0
2. Cada curva es más dispersa que la curva normal
3. A mayor n , la dispersión de la curva t correspondiente
disminuye
4. A medida que v tiene a infinito, la curva t se aproxima
a la normal, por lo que a ésta se le puede llamar curva t

En Resumen:

21
Gráfica de Intervalo de
Confianza.
95%

22
 Para este caso se aplica la distribución muestral de T:

𝑋ത − 𝜇
𝑇=
𝑆/ 𝑛

 Con relación a la gráfica se tiene que:

𝑃 −𝑡𝛼 < 𝑇 < 𝑡𝛼/2 = 1 − 𝛼


2

 Sustituimos la T y nos queda:

𝑋ത − 𝜇
𝑃 −𝑡𝛼/2 < < 𝑡𝛼/2 = 1 − 𝛼
𝑆/ 𝑛

 Simplificando obtenemos:

𝑆 𝑆
𝑃 𝑋ത − 𝑡𝛼 ത
< 𝜇 < 𝑋 + 𝑡𝛼/2 =1−𝛼
2 𝑛 𝑛 23
 Si x y s son la media y la desviación estándar
de una muestra aleatoria de tamaño n<30,
tomada de una población aproximadamente
normal con variancia desconocida 𝜎 2 , un
intervalo de confianza (1-α)100% para μ
estará dada por:

𝑠 𝑠
𝑋ത − 𝑡𝛼 < 𝜇 < 𝑋ത + 𝑡𝛼/2
2 𝑛 𝑛

 Donde tα/2 es el valor t con n = n-1 grados de


libertad, que deja un área de α/2 a la
derecha.
24
25
Ejemplo No.1:
El contenido de siete contenedores similares de ácido
sulfúrico son 9.8, 10.2, 10.4, 9.8, 10.0, 10.2, y 9.6
litros. Encuentre un intervalo de confianza del 95% para
la media de todos los contenedores si se supone una
distribución aproximadamente normal.
Solución:

La media muestral y la desviación estándar para los datos


dados son:
x= 10 s=0.283

En la tablas de distribución T, se encuentra que t0.025=2.447


con 6 grados de libertad, de aquí, el intervalo de
confianza de 95% para μ es:
26
Con un nivel de confianza del 95% se sabe que el
promedio del contenido de los contenedores está entre
9.47 y 10.26 litros.

27
Ejemplo No.2:
Un ingeniero químico afirma que el rendimiento medio de la
población de cierto proceso en lotes es 500 gramos por
milímetro de materia prima. Para verificar esta afirmación
toma una muestra de 25 lotes cada mes. Si el valor de t
calculado cae entre –t0.05 y t0.05, queda satisfecho con su
afirmación. ¿Qué conclusión extraería de una muestra que
tiene una media de 518 gramos por milímetro y una
desviación estándar de 40 gramos? Suponga que la
distribución de rendimientos es aproximadamente normal.

De tablas de distribución T, encontramos que t0.05 para 24 grados de


libertad es de 1.711. Por tanto, el fabricante no queda satisfecho
con esta afirmación si una muestra de 25 lotes rinde un valor t
entre y −1.711 𝑦 1.711.
Se procede a calcular el valor de t

𝑋ത − 𝜇 518 − 500
𝑡= = = 2.25
𝑠/ 𝑛 40/ 25 28
“Intervalo de confianza para
la varianza de una distribución
normal”
29
introducción
 La estadística estandarizada
σ 𝑥𝑖 − 𝑥ҧ 2
𝑠2 =
𝑛−1
 Recibe el nombre de variable ji cuadrada y tiene una
distribución de muestreo llamada distribución de
probabilidad ji cuadrada (o X²), con n-1 grados de
libertad.
 La curva de esta función es la siguiente

30
INTRODUCCIÓN
 La expresión para el intervalo de confianza, con nivel
de confianza 1−α es el siguiente

 Donde 𝑋𝛼 2 y 𝑋1−𝛼 2 son los valores 𝑋 2 que localizan la


2 2
mitad de α en cada cola de la distribución ji cuadrada.

Suposición: La muestra se selecciona al azar


de una población normal.
31
EJEMPLO 1
 La varianza de la resistencia a la rotura de 30 cables probados
fue de 32 lb2. Halle un intervalo de confianza del 90 por ciento,
para la varianza de la resistencia de todos los cables de ésta
marca.

30(31) 30(31)
< 𝜎2 <
42.56 17.71

 𝟐𝟏. 𝟖𝟓𝟏𝟓 < 𝝈𝟐 < 𝟓𝟐. 𝟓𝟏𝟐𝟕


32
EJEMPLO 2
En 16 recorridos de prueba, el consumo de gasolina de un motor
experimental tuvo una desviación estándar de 2.2 litros.
Construir un intervalo de confianza del 99% para la varianza y
para la desviación estándar esperadas de este motor.

Por lo que el intervalo de confianza para la varianza estará


dado por: 15(2.2)2 15(2.2)2
< 𝜎2 <
32.8 4.6

33
2.2134 < 𝜎 2 <15.7826
“Intervalo de confianza para el
cociente de dos varianzas en
poblaciones normales”
Gráfica
Estadístico de prueba

2
𝑠1 Donde 𝑠12 es la varianza
𝐹= muestral más grande
𝑠22
Una forma de comparar dos varianzas
poblacionales, 𝑆12 𝑦 𝑆22 es usar la razón entre las
varianzas muestrales, 𝑆12 𝑦 𝑆22 . Si 𝑆12 𝑦 𝑆22 es casi igual
a 1, se puede considerar que 𝑆12 𝑦 𝑆22 son iguales. Por
otra parte, un valor muy grande o muy pequeño
para 𝑆12 𝑦 𝑆22 da evidencia de una diferencia en las
varianzas poblacionales.
Intervalo de Confianza

𝑠12 1 𝜎12 𝑠12


2 𝐹 < 2 < 2 𝐹𝑑𝑓2 ,𝑑𝑓1
𝑠2 𝑑𝑓1 ,𝑑𝑓2 𝜎2 𝑠2

Donde 𝑑𝑓1 = (𝑛1 − 1) 𝑦 𝑑𝑓2 = (𝑛2 − 1). 𝐹𝑑𝑓1,𝑑𝑓2 es


el valor crítico tabulado de F correspondiente a df1 y
df2 grados de libertad en el numerador y
𝛼
denominador de F, respectivamente, con área a su
2
derecha.
Ejemplos
Ejemplo 1
 Calidad de un producto. La estabilidad de mediciones en un
producto manufacturado es importante para mantener la
calidad del producto. De hecho, a veces es mejor tener una
pequeña variación en el valor medido de alguna
característica importante de un producto, así como tener la
media del proceso ligeramente fuera del objetivo, que sufrir
una amplia variación con valor medio que perfectamente se
ajuste a los requisitos. Esta última situación puede producir
un porcentaje más alto de productos defectuosos que la
primera. Un fabricante de focos eléctricos sospechaba que
una de sus líneas de producción estaba produciendo focos
con una amplia variación en duración de vida útil. Para
probar su teoría, comparó las duraciones de vida útil de
n=21 focos muestreados al azar de la línea sospechosa y
n=25 de una línea que parecía estar “en control”. Las
medias muestrales y varianzas para las dos muestras fueron
como sigue:
Líneas sospechosas Línea “en control”
𝑋ത1 = 1520 𝑋ത2 = 1476
𝑠12 = 92000 𝑠22 = 37000

a) ¿Los datos dan suficiente evidencia para indicar que los


focos producidos por la “línea sospechosa” tienen una
varianza más grande en duración que los producidos por la
línea que se supone está en control? Pruebe usando 𝛼= 0.10.

𝑠12 92000
𝐹= 2= = 2.486486
𝑠2 37000

De la tabla de distribución F se obtuvo que el valor en los grados


de libertad dados para 𝐹𝛼,20,24 = 2.03*
2
 Se puede descartar que 𝜎12 = 𝜎22 ya que F > 𝐹𝛼
2

Por lo cual se puede concluir que las varianzas poblacionales de


ambas líneas de producción son diferentes, y que la segunda
varianza es mayor

b) Construya un intervalo de confianza de 90% para la razón de


varianza

𝑠12 1 𝜎12 𝑠12


< < 2 𝐹𝑑𝑓2,𝑑𝑓1
𝑠22 𝐹𝑑𝑓1,𝑑𝑓2 𝜎22 𝑠2

𝑠12 1 92000 1 𝑠12


𝐹𝑑𝑓2,𝑑𝑓1 =
92000
2.08*
= 𝑠22 37000
𝑠22 𝐹𝑑𝑓1,𝑑𝑓2 37000 2.03 ∗

𝜎12
1.22 < 2 < 5.17
𝜎2
EJEMPLO2 2
𝑠12 1 𝜎12 𝑠12
< 2 < 2 𝐹𝑑𝑓2 ,𝑑𝑓1
𝑠2 𝐹𝑑𝑓1,𝑑𝑓2 𝜎2 𝑠2

 Se calcularon las varianzas Ecuación1


de las muestras para los Para el f1 se utiliza la propiedad de
volúmenes de flujo (mL) de distribución f y calculamos el
dos grupos de pacientes que complemento y los grados de libertad
se invierten.
sufren de una alteración en
el tabique interauricular. 1
Los resultados y tamaños de 𝑓0.95,8,6 =
𝑓0.05,8,6
= 0.24
las muestras son:
 N1=9 N2=7 𝑓0.05,6,8 = 3.58
 S1=35mL S2=20mL
Sustituimos en la Ecuación 1 y
 Se construye un intervalo de obtenemos un intervalo de confianza
confianza del 90% para las de
varianzas poblacionales
 NC=90% σ12
0.42 ≤ 2 ≤ 6.265
 α=10% σ2
“Intervalo de confianza de
muestra grande para una
proporción poblacional p”

42
Introducción
 Es una distribución binomial con aproximación a la normal.
 Un intervalo de confianza de muestra grande (1— α)100%
para una proporción poblacional p

𝑝𝑞
𝑝Ƹ ± 𝑧𝛼/2
𝑛
donde zα/2 es el valor z correspondiente a un área de α/2 en
la cola derecha de una distribución normal z. Como p y q son
incógnitas, se estiman con el uso de los mejores estimadores
puntuales: 𝐩ෝy𝒒ෝ.
𝑛𝑝Ƹ − 𝑛𝑝 𝑛 𝑝Ƹ − 𝑝
𝑧= =
𝑛𝑝(1 − 𝑝) 𝑛𝑝(1 − 𝑝)
𝑝Ƹ − 𝑝 𝑝Ƹ − 𝑝
𝑧= =
𝑛𝑝(1 − 𝑝) 𝑝(1 − 𝑝)
𝑛 2 𝑛
𝑥 = 𝑝𝑛
Ƹ
43
Introducción

 El tamaño muestral se considera grande cuando la aproximación normal a la


distribución binomio es adecuada, es decir, cuando np>5 y nq>5.

 Cuando el tamaño muestral es grande, la proporción muestral,


𝑥 𝑁ú𝑚𝑒𝑟𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 é𝑥𝑖𝑡𝑜𝑠
𝑝Ƹ = =
𝑛 𝑁ú𝑚𝑒𝑟𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑖𝑛𝑡𝑒𝑛𝑡𝑜𝑠

es el mejor estimador puntual para la proporción poblacional p.

44
Ejemplo
 Una muestra aleatoria de 985 “probables”
electores, o sea los que probablemente
voten en la próxima elección, fueron
encuestados durante un maratón telefónico
realizado por el Partido Republicano. De
ellos, 592 indicaron que tenían la intención
de votar por la candidata republicana.
Construya un intervalo de confianza de 90%
para p, la proporción de electores probables
de la población que tienen la intención de
votar por la candidata republicana. Con base
en esta información, ¿se puede concluir que
la candidata ganará la elección? 45
46
“Intervalo de confianza para
la diferencia
de dos proporciones”

47
introducción

 Una simple extensión de la estimación de una proporción


binomial p es la estimación de la diferencia entre dos
proporciones binomiales. Se pueden hacer
comparaciones como éstas:

 La proporción de artículos defectuosos manufacturados en dos


líneas de producción.
 La proporción de votantes mujeres y la proporción de votantes
hombres que están a favor de una enmienda de iguales derechos.
 Los porcentajes de germinación de semillas no tratadas y
semillas tratadas con un fungicida.
48
PROPIEDADES DE LA DISTRIBUCIÓN MUESTRAL
DE LA DIFERENCIA (𝑝Ƹ1 −𝑝Ƹ2 ))ENTRE DOS
PROPORCIONES MUESTRALES

 Distribución muestral de la diferencia entre proporciones


muestrales
𝑥1 𝑥2
(𝑝Ƹ1 −𝑝Ƹ 2 ) = −
𝑛1 𝑛2
 La media de (𝑝Ƹ1 −𝑝Ƹ 2 ) es: 𝑝1 − 𝑝2

𝑝1 𝑞1 𝑝1 𝑞1
 Varianza de 𝜎2 (𝑝ො1 −𝑝ො2 ) = −
𝑛1 𝑛1

 La distribución muestral de (𝑝Ƹ1 −𝑝Ƹ 2 ) puede ser


aproximada por una distribución normal cuando 𝑛1 y 𝑛2
son grandes (tamaños de muestras). 49
INTERVALO DE CONFIANZA 100% DE
MUESTRA GRANDE de (1- α) PARA (p 1- p 2 )

𝑝Ƹ1 𝑞ො1 𝑝Ƹ 2 𝑞ො2 𝑝Ƹ1 𝑞ො1 𝑝Ƹ 2 𝑞ො2


(𝑝Ƹ1 −𝑝Ƹ 2 ) − 𝑍𝛼 + < 𝑝1 − 𝑝2 < (𝑝Ƹ1 −𝑝Ƹ 2 ) + 𝑍𝛼 +
2 𝑛1 𝑛2 2 𝑛1 𝑛2

 Estimador puntual: (𝑝Ƹ1 −𝑝Ƹ 2 )

𝑥1 𝑥2
 𝑝Ƹ1 = y 𝑝Ƹ 2 =
𝑛 𝑛

 𝑛1 y 𝑛2 deben ser suficientemente grandes para que la distribución


muestral de (𝑝Ƹ1 −𝑝Ƹ 2 ) puede ser aproximado por una distribución normal, es
decir, si 𝑛1 𝑝Ƹ1 , 𝑛1 𝑞ො1 , 𝑛2 𝑝Ƹ 2 y 𝑛2 𝑞ො2 son todas mayores a 5.
50
Para calcular z

(𝑝Ƹ1 −𝑝Ƹ 2 ) − ( 𝑝1 − 𝑝2 )
Z=
𝑝1 𝑞1 𝑝2 𝑞2
+
𝑛1 𝑛2

Coeficiente de
confianza
(1-α)
α α/2 𝑍α/2
0.9 0.1 0.05 1.645
0.95 0.05 0.025 1.96
0.98 0.02 0.01 2.33 51
0.99 0.01 0.005 2.58
ejemplo 1
 La propuesta de un bono para la
construcción de una escuela será enviada a
los votantes en la siguiente elección
municipal. Una parte importante del dinero
derivado de esta emisión de bonos se
empleará en construir escuelas en una zona
de rápido desarrollo de la ciudad y lo demás
se usará para renovar y actualizar los
edificios escolares del resto de ésta. Para
evaluar la viabilidad de la propuesta de un
bono, a una muestra aleatoria de 𝑛1 =50
residentes de la zona de rápido desarrollo y
𝑛2 =100 de las otras partes de la ciudad, se
les preguntó si piensan votar por la
propuesta. Los resultados se tabulan: 52
 1. Estime la diferencia en las proporciones verdaderas a
favor de la propuesta de bono con un 99% de nivel de
confianza.

53
Solución
1. La mejor estimación puntual de la diferencia (𝑝1 −𝑝2 ) está dada por
(𝑝Ƹ1 −𝑝Ƹ 2 ) = 0.76 − 0.65 = 0.11
Sustituyendo valores y resolviendo:

𝑝Ƹ1 𝑞ො1 𝑝Ƹ 2 𝑞ො2 (80.76)(0.24) (0.65)(0.35)


+ = + = 0.077
𝑛1 𝑛2 50 100
El intervalo de confianza de 99% se calcula como:

𝑝1 𝑞1 𝑝2 𝑞2
(𝑝Ƹ1 −𝑝Ƹ 2 ) ± 2.58 +
𝑛1 𝑛2

0.11 ± 2.58(0.0770)

0.11 ± 475.8 54
solución
 O sea,
−0.089 < 𝑝Ƹ1 −𝑝Ƹ 2 < 0.309

Como este intervalo contiene el valor


(𝑝Ƹ1 −𝑝Ƹ 2 ) =0, es posible que 𝑝Ƹ1 = 𝑝Ƹ 2 , con lo cual
se podría inferir que puede no haber diferencia
en las proporciones a favor del asunto del bono
en las dos secciones de la ciudad; sin embargo, se
puede notar que 𝑝Ƹ 2 triplica a la cantidad de 𝑝Ƹ1 de
este modo se puede concluir que es mayor la
cantidad de votantes para la propuesta del bono
en las diferentes áreas de la ciudad que en la
zona de rápido desarrollo.
55
Ejercicio 2
Muestras aleatorias independientes de 𝑛1 = 1265 y
𝑛2 = 1688 observaciones se seleccionaron de las
poblaciones binomiales 1 y 2, y se observaron 𝑥1 = 849
y 𝑥2 =910 éxitos.
a ) Encuentre un intervalo de confianza de 99% para la
diferencia (𝑝Ƹ1 −𝑝Ƹ2 ) de las dos proporciones
poblacionales.
b) Con base en el intervalo de confianza del inciso a),
¿se puede concluir que hay una diferencia en las dos
proporciones binomiales? Explique.

56
Solución
1. La mejor estimación puntual de la diferencia (𝑝1 −𝑝ҧ2 ) está dada por
(𝑝1 −𝑝2ҧ ) = 0.67 − 0.53 = 0.14
Sustituyendo valores y desarrollando se obtiene:

𝑝Ƹ1 𝑞ො1 𝑝Ƹ 2 𝑞ො2 (0.67)(0.33) (0.53)(0.47)


+ = + = 0.0179
𝑛1 𝑛2 1256 1688

El intervalo de confianza de 99% se calcula como:


𝑝Ƹ1 𝑞ො1 𝑝Ƹ 2 𝑞ො2
±2.58 +
𝑛1 𝑛2
0.14 ± 2.58(0.0179)
0.14 ± 0.046

57
conclusión
 Intervalode confianza de 99%:
0.094 < 𝑝ො1 − 𝑝ො2 < 0.186

Se puede observar que 𝑝ො2 es el doble


de la cantidad de 𝑝ො1 , por esta razón
se concluye que existe una diferencia
de proporciones binomiales.

58
“Intervalo de confianza para
la diferencia de medias de
dos poblaciones de varianzas
conocidas”
59
Condiciones experimentales y
la unidad experimental

 Se consideran las condiciones experimentales del


proceso de recolección de datos.
 Para cualquier estudio hay una unidad experimental
que es la parte del experimento que produce el error
experimental y que es responsable de la varianza de la
población.
 Ej. En un experimento químico, puede ser la cantidad
de materia prima
 En un experimento médico, es el paciente o el sujeto.

La diferencia debe tener un impacto mínimo en los


resultados.
60
Estimación puntual

61
Intervalo de confianza

62
Ejemplo 1

63
Solución

64
Ejemplo 2

65
Solución

66
“Intervalo de confianza
para la diferencia de medias
poblacionales con varianzas
desconocidas pero iguales”

67
INTRODUCCIÓN.
 Se extraen muestras aleatorias independientes de dos
poblaciones de mediciones n1 y n2 con medias y
varianzas
𝜇1 , 𝜎12 , 𝜇2 , 𝜎22

Con el objetivo de hacer inferencias acerca de medias


(μ1−μ2) la diferencia entre las dos medias
poblacionales.

 Cuando se toman muestras pequeñas (menor a 30) se


asume que las poblaciones de interés están
distribuidas de manera normal, y los intervalos de
confianza se basan en la distribución t.
68
 Las medias muéstrales 𝑥ҧ1 − 𝑥ҧ2 serán normal con media
𝜇1 − 𝜇2 y error estándar
𝜎12 𝜎22
+
𝑛1 𝑛2

 Si ambas poblaciones 𝜎12 = 𝜎22 = 𝜎 2 , entonces el error


estándar es :

𝜎12 𝜎22 1 1
+ = 𝜎2 +
𝑛1 𝑛2 𝑛1 𝑛2

 Entonces el estadístico de prueba es:

𝑥ҧ1 − 𝑥ҧ2 − 𝜇1 − 𝜇2
𝑡=
1 1
𝑠𝑝 𝑛 + 𝑛
1 2
69
 Al usar un promedio ponderado para obtener mejor información se obtiene
el estimador

𝑛1 − 1 𝑠12 + 𝑛2 − 1 𝑠22
𝑠𝑝2 =
𝑛1 + 𝑛2 − 2

 Donde los grados de libertad para el estadístico t son 𝑠12 𝑡𝑖𝑒𝑛𝑒 𝑛1 − 1 y


𝑠22 𝑡𝑖𝑒𝑛𝑒 𝑛2 − 1 , el número total de grados de libertad es la suma
𝑣 = 𝑛1 + 𝑛2 − 2

 El intervalo de confianza esta definido por:

1 1 1 1
𝑥ҧ1 − 𝑥ҧ2 − 𝑡𝛼 𝑠𝑝 + < 𝜇1 − 𝜇2 < 𝑥ҧ1 − 𝑥ҧ2 + 𝑡𝛼 𝑠𝑝 +
2 𝑛1 𝑛2 2 𝑛1 𝑛2

70
Ejemplo 1:
 Un artículo publicado dio a conocer los resultados de un
análisis del peso de calcio en cemento estándar y en cemento
contaminado con plomo. Los niveles bajos de calcio indican
que el mecanismo de hidratación del cemento queda
bloqueado y esto permite que el agua ataque varias partes de
la estructura del cemento. Al tomar diez muestras de cemento
estándar, se encontró que el peso promedio de calcio es de 90
con una desviación estándar de 5; los resultados obtenidos con
15 muestras de cemento contaminado con plomo fueron de 87
en promedio con una desviación estándar de 4. Suponga que el
porcentaje de peso de calcio está distribuido de manera
normal.
a) Encuentre un intervalo de confianza del 95% para la diferencia
entre medias de los dos tipos de cementos.
b) ¿Es posible afirmar que la presencia del plomo afecte el
mecanismo de hidratación, a partir de a)? Justifique la
respuesta.
71
Cemento estándar Cemento contaminado
𝑛1 = 10 𝑛2 = 15

𝑋ത1 = 90 𝑋ത2 = 87

𝑆1 = 5 𝑆2 = 4

Utilizando el estimador combinado de la desviación estándar :


2 2 2 10 − 1 + 42 15 − 1
𝑠1 𝑛1 − 1 + 𝑠2 𝑛 2 − 1 5
𝑠𝑝2 = = = 19.52
𝑛1 + 𝑛2 − 2 10 + 15 − 2

Al calcularle raíz cuadrada a este valor nos queda, sp= 4.41


Al utilizar: 𝛼 = 0.05
Se encuentra de la tabla A.4 (Walpole) 𝑡𝛼/2 = 𝑡0.025 = 2.069

Para 𝑛1 + 𝑛2 − 2 = 10 + 15 − 2 = 23 𝑔𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑡𝑎𝑑

1 1 1 1
𝜇1 − 𝜇2 = 𝑥ҧ1 − 𝑥ҧ2 ± 𝑡𝑠𝑝 + = 90 − 87 ± 2.069 724.41 +
𝑛1 𝑛2 10 15
La expresión se reduce a:

73
INTERPRETACIÓN
 Observar que el intervalo de confianza del 95%
incluye al cero, entonces para este nivel de
confianza no puede concluirse la existencia de una
diferencia entre las medias.

b) De acuerdo al intervalo de confianza obtenido se


puede dar una interpretación más no una afirmación
segura debido a que el tamaño de la muestra es muy
pequeño. Dicha interpretación puede expresar que el
cemento contaminado con plomo afecta al
mecanismo de hidratación, ya que el peso promedio
de calcio es menor para esta población.

74
Ejemplo 2:
Una investigación consiste en la evaluación de la eficacia de un índice
numérico de diversidad de especies para indicar la degradación del
agua debida al drenaje de una mina de ácido. Desde el punto de
vista conceptual, un alto índice de diversidad de las especies macro
invertebrados debe indicar un sistema de agua no contaminado,
mientras que uno bajo, debe indicar un sistema de agua
contaminado.
Para este estudio, se seleccionaron dos estaciones independientes de
muestreo una localizada río abajo del punto de descarga de la mina
y la otra localizada río arriba. Para 12 muestras recogidas río abajo,
el índice de diversidad de especies tuvo un valor promedio de 𝑋ത1 =
3.11y una desviación estándar de 𝑆1 = 0.771, mientras que en 10
muestras recogidas río arriba el valor del índice promedio fue 𝑋ത2 =
2.04 y una desviación estándar de 𝑆2 = 0.448. Encuentre el intervalo
de confianza del 90% para una diferencia de medias poblacionales de
las dos estaciones, asumiendo que las poblaciones están distribuidas
aproximadamente de forma normal con varianzas iguales.
75
76
INTERPRETACIÓN
De aquí que se obtiene una confianza del 90%
de que el intervalo de 0.593 a 1.547 contiene
la diferencia de las medias poblaciones para
valores de los índices de diversidad de
especies en las dos estaciones. El hecho que
ambos límites de confianza sean positivos
indica que, en promedio, el índice para la
estación ubicada río abajo del punto de
descarga es mayor que para la localizada río
arriba.

77
“Intervalo de confianza para
la diferencia de medias de
dos poblaciones con varianzas
desconocidas y diferentes.”
78
Teorema
 Si 𝑥1 , 𝑥2 , 𝑠12 , 𝑠22 son las medias y las varianzas
de dos muestras aleatorias de tamaños
𝑛1 , 𝑛2 respectivamente, tomadas de dos
poblaciones normales e independientes con
varianzas desconocidas y diferentes,
entonces un intervalo de confianza para
diferencia entre medias 𝜇1 − 𝜇2 es;
(nuevamente para el caso de muestras
pequeñas):

𝑠12 𝑠22 𝑠12 𝑠22


(𝑥1 − 𝑥ҧ2 ) − 𝑡 + ≤ 𝜇1 − 𝜇2 ≤ (𝑥1 − 𝑥ҧ2 ) + 𝑡 +
𝑛1 𝑛2 𝑛1 𝑛2
79
GRADOS DE LIBERTAD
 Donde los grados de libertad están dados por:

2 2
𝑠12 𝑠2
+
𝑛1 𝑛2
𝑣= 2 2
𝑠12 𝑠22
𝑛1 𝑛2
+
𝑛1 − 1 𝑛2 − 1
NOTA:
El valor obtenido se redondea al entero próximo.

80
 El estadístico usado como estimador puntual de la
diferencia de medias
𝜇1 − 𝜇2 , 𝑠𝑒𝑟á 𝑥1ҧ − 𝑥ҧ2 .

 Se puede asociar una variable al estimador denominada


“t”, definida como:
𝑥1ҧ − 𝑥ҧ2−(𝜇1 −𝜇2 )
𝑡=
𝑠12 𝑠22
+
𝑛1 𝑛2

81
Ejemplo
Cierto metal se produce, por lo común, mediante un proceso
estándar. Se desarrolla un nuevo proceso en el que se añade
una aleación a la producción del metal. Los fabricantes se
encuentran interesados al estimar la verdadera diferencia entre
las tensiones de ruptura de los metales producidos por los dos
procesos. Para cada metal se seleccionan 12 ejemplares y cada
uno de éstos se somete a una tensión hasta que se rompe.
La siguiente tabla muestra las tensiones de ruptura de los
𝐾𝑔
ejemplares, en 2
𝑐𝑚

Si se supone que el muestreo se llevó a cabo sobre dos


distribuciones normales e independientes, obtener los intervalos
de confianza estimados del 95 y 99% para la diferencia entre los
dos procesos. 82
solución
n media S
12 451.4 14.9 95% de confianza
12 443.3 24.8

2
𝑠12 𝑠22 14.9 24.8 2
+ +
𝑛1 𝑛2 12 12
𝑣= 2 2 = 2 2 = 𝟏𝟖
𝑠12 𝑠22 14.9 24.8
𝑛1 𝑛2 12 + 12
+ 12 − 1 12 − 1
𝑛1 − 1 𝑛2 − 1

Por lo tanto:
𝑠12 𝑠22 𝑠12 𝑠22
(𝑥ҧ1 − 𝑥ҧ 2 ) − 𝑡 + ≤ 𝜇1 − 𝜇2 ≤ (𝑥ҧ1 −𝑥ҧ 2 ) + 𝑡 +
𝑛1 𝑛2 𝑛1 𝑛2

83
Donde:

𝑡1 𝑦 𝑡2 𝑡1 = 2.10
obtenido de
𝑡2 = −2.10
tablas
(Walpole).

Grafico 1 . Distribución t con α=0.05

 Sustituyendo valores

14.92 24.82 14.92 24.82


451.4 − 443.3 − 2.10 + ≤ 𝜇1 − 𝜇2 ≤ 451.4 − 443.3 + 2.10 +
12 12 12 12

−𝟐𝟓. 𝟔𝟓 ≤ 𝝁𝟏 − 𝝁𝟐 ≤ 𝟗. 𝟒𝟗

84
 Para 99% de confianza

𝑡1 = 2.8
𝑡2 = −2.8

Grafico 2 . Distribución t con


α=0.01

14.92 24.82 14.92 24.82


451.4 − 443.3 − 2.88 + ≤ 𝜇1 − 𝜇2 ≤ 451.4 − 443.3 + 2.88 +
12 12 12 12

−𝟑𝟐. 𝟏𝟔 ≤ 𝝁𝟏 − 𝝁𝟐 ≤ 𝟏𝟓. 𝟗

85
“Errores y tamaños de
muestra”

86
Para el tamaño de la muestra

𝑒 = 𝑆𝐸(𝑧𝛼 )
2

2
Donde 𝑧 puede ser 𝑡 , 𝑥𝛼 o
𝛼 𝛼
2 2 2
𝑓𝛼
2

87
Para la Media de una población
normal con varianza conocida

Error estándar de 𝑥ҧ

𝜎
𝑆𝐸 =
𝑛

88
Para la Media de una población
normal con varianza desconocida

Error estándar de 𝑥ҧ
𝑠
𝑆𝐸 =
𝑛
Para el tamaño de la muestra:
𝑡𝛼 𝑠 2
2
𝑛 < 30 𝑛=
𝑒
𝑍𝛼 𝜎 2
2
𝑛 ≥ 30 𝑛=
𝑒
89
Para la Varianza de una
población normal

(𝑛 − 1)𝑠 2
𝑆𝐸 =
𝑋𝛼2
2

90
Para el Cociente de dos
varianzas

𝑆𝐸 = 𝐹𝛼;𝑣,𝑣
2 1 2

𝑣1 = 𝑛1 − 1
𝑣2 = 𝑛2 − 1

91
Para la Proporción poblacional 𝑝
en una muestra grande

Error estándar de 𝑝ො
𝑝𝑞
𝑆𝐸 =
𝑛

92
Para la Diferencia de dos
proporciones tomando muestras
grandes

𝑝1 𝑞1 𝑝2 𝑞2
𝑆𝐸 = 𝜎(𝑝ෞ1−𝑝ෞ2) = +
𝑛1 𝑛2

93
Para la Diferencia de dos medias
poblacionales CON VARIANZAs
conocidas
Error estándar de (𝑥1 − 𝑥2 )

𝜎1 2 𝜎2 2
𝑆𝐸 = 𝜎(𝑥1−𝑥2) = +
𝑛1 𝑛2

94
Para la diferencia de medias con
varianzas desconocidas pero
iguales

1 1
𝑆𝐸 = 𝑆𝑝 +
𝑛1 𝑛2

95
Para la Diferencia de medias con
varianzas desconocidas y
diferentes

𝑠1 2 𝑠2 2
𝑆𝐸 = +
𝑛1 𝑛2

96
Ejercicio 1

Un ingeniero de control de calidad desea estimar la fracción


de artículos defectuosos en un gran lote de rollos de
película. Por experiencias anteriores, él piensa que la
fracción real de piezas defectuosas debe estar alrededor de
0.05 ¿Qué tan grande debe ser la muestra si quiere estimar
la fracción dentro de 0.01 con un nivel de confianza de 95%?

𝑝𝑞 (0.05)(0.95)
n= 2
𝑛= 2
𝑒 0.01
𝑧α 1.96
2

𝑛 = 1824.76

n= 1825 𝑎𝑟𝑡í𝑐𝑢𝑙𝑜𝑠 𝑝𝑜𝑟 𝑙𝑜 𝑚𝑒𝑛𝑜𝑠 97


Ejercicio 2
Un director de personal quiere comparar la efectividad de
dos métodos de entrenamiento para trabajadores industriales
a fin de efectuar cierta operación de montaje. Se divide un
número de operarios en dos grupos iguales: el primero recibe
el método de entrenamiento uno, y el segundo, el método
dos. Cada uno realizará la operación de montaje y se
registrará el tiempo de trabajo. Se espera que las mediciones
para ambos grupos tengan una desviación estándar
aproximadamente de dos minutos. Si se desea que la
estimación de la diferencia en tiempo medio de montaje sea
correcta hasta por un minuto, con una probabilidad igual a
0.99, ¿cuántos trabajadores se tienen que incluir en cada
grupo de entrenamiento?

𝑧 2 (σ12 + σ22 ) 2.582 (22 + 22 )


𝑛= = = 53.24
Ɛ2 12

Cada grupo debe contener al menos 53


empleados. 98
REFERENCIAS BIBLIOGRAFÍCAS
 Mendenhall, W.; Beaver, R,J.; Beaver, (2010) Introducción a la probabilidad
y estadística. Treceava edición, CENGANE Learning

 Devore, J. L. (2009). Probabilidad y Estadística para Ingeniería y


Ciencias. Thomson Learning. México. p. 230.

 Walpole Myers,(2007). Probabilidad y Estadística, Octava Edición, Editorial


Pearson Educación, México.

 Montgomery, G. Runger, C. (2004). Probabilidad y Estadística aplicada a


la Ingeniería. Limusa. México

 Velasco, G., Wisniewski, P. (2001). Probabilidad y Estadística para


Ingeniería y Ciencias. Thomson Learning. México

 Teoría de pequeñas muestras. Visitado el 20 de abril del 2014. En:


http://www.itch.edu.mx/academic/industrial/estadistica1/u0304.pdf99

Вам также может понравиться