Wa0007

INTERVALOS DE CONFIANZA EN DOS MUESTRAS
ESTADÍSTICA II
AUTOR: Rogelio Alvarado Martinez
ÍNDICE
ÍNDICE
1. INTERVALOS DE CONFIANZA EN DOS MUESTRAS
1.1. Introducción
1.2. Diferencia de medias con varianzas poblacionales conocidas
1.3. Diferencia de medias con varianzas poblacionales desconocidas y (n1 y n2 ) > 30 (con n1 ≈ n2)
1.4. Diferencia entre medias de dos poblaciones normales con varianzas poblacionales desconocidas Acceso rápido
pero iguales y muestras pequeñas (n1 < 30 y n2 <30)
1.5. Diferencia entre medias de dos poblaciones normales con varianzas poblacionales desconocidas
pero iguales y muestras pequeñas (n1 + n2 <30)
1.6. Intervalo para diferencia de proporciones DESARROLLO
1.7. Diferencia de muestras pareadas

GLOSARIO REFERENCIAS
Este material pertenece al Politécnico

Grancolombiano y a la Red Ilumno. Por ende, son
de uso exclusivo de las Instituciones adscritas a
la Red Ilumno. Prohibida su reproducción total
o parcial.
02 -------
1. INTERVALOS DE CONFIANZA EN DOS MUESTRAS Solución:
1.1. INTRODUCCIÓN n1= 36 n2= 64 𝑋𝑋 " = 75 𝑋𝑋$ = 60 𝜎𝜎"$ = 41,16 𝜎𝜎$$ = 28,59
Un problema que es tan importante como la estimación de una sola media poblacional para una
población cuantitativa es la comparación de dos medias poblacionales. En forma similar una
extensión de la estimación de una proporción para una población cualitativa, es la estimación de Se ubica el valor de la distribución normal con nivel del 98%, Z= 2,33, (si alguna duda, revisar los
la diferencia entre dos proporciones. ejemplos de la lectura de la semana 3).

El intervalo queda en la forma:
1.2. DIFERENCIA DE MEDIAS CON VARIANZAS POBLACIONALES CONOCIDAS

𝜎𝜎"$ 𝜎𝜎$$
𝐼𝐼 = 𝑋𝑋" − 𝑋𝑋$ ± 𝑍𝑍0/$ +
Un buen estimador puntual para las diferencias de medias, es la diferencia de medias muestrales 𝑛𝑛" 𝑛𝑛$
𝑋𝑋" − 𝑋𝑋$ . Se cumple que la distribución muestral de la diferencia de medidas es normal con media
𝜇𝜇&' (&) y varianza 𝜎𝜎&$' (&) .
El intervalo de confianza de nivel (1-‐ 𝛼𝛼 ) para la diferencia de medias de dos distribuciones 41,16 28,59
normales de varianzas conocidas es: (75 – 60) ± 2.33 +
36 64

15 ± 2,33(1,26)
𝜎𝜎"$ 𝜎𝜎$$ 15 + 2,94=17,94

𝐼𝐼 = 𝑋𝑋" − 𝑋𝑋$ ± 𝑍𝑍0/$ +
𝑛𝑛" 𝑛𝑛$
15 -‐ 2,94=12,06

Ejemplo 1 La diferencia de medias está entre 12,06 y 17,94 con una confiabilidad del 98%. Es decir, que en
promedio el número de artículos producidos por el primer proceso es superior al del Segundo
proceso. Esto porque el intervalo da diferencias positivas.
Se comparan dos procesos de fabricación, los dos procesos tienen distribución normal y con base
en registros pasados se determina que las varianzas eran 41,16 y 28,59, respectivamente. Se
toman dos muestras, una de 36 artículos de la primera producción y otra de 64 de la segunda
obteniendo medias de 75 y 60, respectivamente. 1.3. DIFERENCIA DE MEDIAS CON VARIANZAS POBLACIONALES DESCONOCIDAS Y (N1
Y N2 ) > 30 (CON N1 ≈ N2)
Encontrar los límites de confianza del 98% para la diferencia de las medias poblacionales.
Los valores de las varianzas poblacionales no necesariamente podrán ser conocidos, pero si las
muestras son grandes, las varianzas muestrales son generalmente una buena aproximación a las
3 POLITÉCNICO GRANCOLOMBIANO ESTADÍSTICA II 4

varianzas poblacionales. Luego, el intervalo de confianza para la diferencia de medias puede (n1 − 1) S12 + (n2 − 1) S 22
aproximarse a: Sp =
n1 + n2 − 2
𝑆𝑆"$ 𝑆𝑆$$
𝐼𝐼 = 𝑋𝑋" − 𝑋𝑋$ ± 𝑍𝑍0/$ +
𝑛𝑛" 𝑛𝑛$
1.5. DIFERENCIA ENTRE MEDIAS DE DOS POBLACIONES NORMALES CON VARIANZAS
POBLACIONALES DESCONOCIDAS PERO IGUALES Y MUESTRAS PEQUEÑAS (N1 +

N2 <30)
Este aproximación es válida para muestras grandes. El criterio que usaremos es 𝑛𝑛" + 𝑛𝑛$ > 30 con
Cuando las varianzas de las poblaciones son desconocidas y las varianzas poblacionales son
la condición de que ambos tamaños muestrales 𝑛𝑛" ≈ 𝑛𝑛$
diferentes para muestras pequeñas, se podrá asumir un estadístico equivalente:

𝑋𝑋" − 𝑋𝑋$ − 𝜇𝜇" − 𝜇𝜇$

𝑡𝑡 =
1.4. DIFERENCIA ENTRE MEDIAS DE DOS POBLACIONES NORMALES CON VARIANZAS
POBLACIONALES DESCONOCIDAS PERO IGUALES Y MUESTRAS PEQUEÑAS (N1 < +
𝑛𝑛" 𝑛𝑛$
30 Y N2 <30)
Para muestras pequeñas, y considerando en primer lugar que las dos varianzas poblacionales son
iguales 𝜎𝜎"$ = 𝜎𝜎$$ aunque con valor desconocido. Puede construirse la siguiente variable normal
tipificada: Se trabaja con las varianzas en la muestra, este estadístico sigue aproximadamente una
distribución t de Student con f grados de libertad, donde f es el entero más próximo a la
𝑋𝑋" − 𝑋𝑋$ − 𝜇𝜇" − 𝜇𝜇$ aproximación de Welch:
𝑍𝑍 =
$
𝜎𝜎"$ 𝜎𝜎$$ 𝑆𝑆"$ 𝑆𝑆$$
− +
𝑛𝑛" 𝑛𝑛$ 𝑛𝑛" 𝑛𝑛$
𝑓𝑓 = $ $ − 2
𝑛𝑛" 𝑛𝑛
+ $
𝑛𝑛" + 1 𝑛𝑛$ + 1
El intervalo de confianza de nivel 1 − 𝛼𝛼 para la diferencia de medidas de dos poblaciones
normales de varianza desconocidas pero iguales es:
Por lo tanto, el intervalo de confianza de nivel 1 − 𝛼𝛼 para la diferencia de medias de dos

1 1 poblaciones normales de varianzas desconocidas es:
𝐼𝐼 = 𝑋𝑋" − 𝑋𝑋$ ± 𝑡𝑡0,D ED ($ 𝑆𝑆F ∙ +
$ ' ) 𝑛𝑛" 𝑛𝑛$

En esta expresión t tiene distribución t Student con (n1+n2-‐2) grados de libertad.
Y la desviación estándar Sp: 𝐼𝐼 = 𝑋𝑋" − 𝑋𝑋$ ± 𝑡𝑡0,I ∙ +
$ 𝑛𝑛" 𝑛𝑛$

1.6. INTERVALO PARA DIFERENCIA DE PROPORCIONES Se definen los valores:
Teniendo en cuenta que la varianza de la distribución muestral de una proporción puede
F("(F) n1= 1000 n2= 1000 P1= 0,18 P2= 0,14
escribirse como: 𝜎𝜎F = , la varianza de la distribución muestral de la diferencia de
D
proporciones será: (1-‐α )= 0,95

𝑝𝑝" 1 − 𝑝𝑝" 𝑝𝑝$ 1 − 𝑝𝑝$
𝜎𝜎F$' (F) = + Para el nivel de confianza del 95% se ubica el valor Z en la tabla de la distribución normal:
𝑛𝑛" 𝑛𝑛$
Z = 1,96 (si alguna duda de cómo identificar este valor ir a la lectura semana 3)
si partimos del hecho de que las muestras son grandes, por lo tanto, la distribución muestral de

la diferencia de proporciones es aproximadamente normal, luego, el intervalo de confianza de
nivel 1 − 𝛼𝛼 para la diferencia de proporciones es:
𝑃𝑃" 1 − 𝑃𝑃" 𝑃𝑃$ 1 − 𝑃𝑃$
𝐼𝐼 = 𝑃𝑃" − 𝑃𝑃$ ± 𝑍𝑍0/$ ∙ +
𝑛𝑛" 𝑛𝑛$
𝑃𝑃" 1 − 𝑃𝑃" 𝑃𝑃$ 1 − 𝑃𝑃$

𝐼𝐼 = 𝑃𝑃" − 𝑃𝑃$ ± 𝑍𝑍0/$ ∙ +
𝑛𝑛" 𝑛𝑛$
(0,18)(0,82) (0,14)(0,86)
(0,18 − 0,14) ± 1,96 +
1000 1000
donde 𝑃𝑃" es la proporción de éxitos en una muestra de tamaño 𝑛𝑛" de la primera población y lo
0,04 + 0,032 = 0,0721
mismo para 𝑃𝑃$ pero con la muestra 𝑛𝑛$ .
0,04 – 0,032 = 0,0079

Ejemplo 2 Con un nivel de confianza del 95% se puede decir que la diferencia en la proporción de productos
defectuosos está entre 0,0079 y 0,0721. Este resultado indica que la proporción de defectuosos
El departamento de control de calidad de una gran industria quiere establecer con un nivel de es mayor en el turno A, la conclusión se da porque los dos límites del intervalo son positivos.
confianza del 95% si existe alguna diferencia entre el número de productos defectuosos que son
encontrados en la producción, en dos turnos de trabajo. El departamento toma muestras de 1000
productos en cada turno, el turno A encuentra un 18% de productos defectuosos mientras que
en el turno B este porcentaje era del 14%.

1.7. DIFERENCIA DE MUESTRAS PAREADAS Ejemplo 3
La diferencia de medias tratada anteriormente, corresponde a muestras independientes. En este
Se tienen los puntajes de la prueba de 10 empleados antes y después de habérseles impartido
caso se trata de establecer la diferencia para muestras dependientes o relacionadas en capacitación laboral adicional. Se quiere establecer un intervalo de confianza del 90% para la
situaciones en donde se analiza el mismo sujeto o la misma unidad en dos momentos, como en media de la diferencia en los puntajes antes y después de la capacitación.
los casos antes y después o pre y post.

El intervalo de confianza de nivel 1 − 𝛼𝛼 para la diferencia de medidas de observaciones
pareadas con 𝑛𝑛 > 30 puede expresarse como: Los puntajes aparecen en la tabla:
Solución:
𝑆𝑆O
𝐼𝐼 = 𝐷𝐷 ± 𝑍𝑍0/$
𝑛𝑛
Puntaje antes Puntaje

de la después de la
En el caso de que la muestra 𝑛𝑛 < 30 habría que sustituir la distribución normal por una capacitación del capacitación 𝑑𝑑S = 𝑥𝑥"R − 𝑥𝑥$R
Empleado 𝑑𝑑S − 𝐷𝐷 $
distribución t, siendo el intervalo de confianza: empleado delempleado
𝒙𝒙𝟏𝟏𝒊𝒊 𝒙𝒙𝟐𝟐𝒊𝒊
𝑆𝑆O
𝐼𝐼 = 𝐷𝐷 ± 𝑡𝑡0,D(" 1 9.0 9.2 -‐0.2 −0.2 − (−0.5) $
= 0.09
$ 𝑛𝑛
donde
2 7.3 8.2 -‐0.9 0.16
𝐷𝐷 es la diferencia entre el valor de antes y el valor después, es decir,
3 6.7 8.5 -‐1.8 1.69
D D
ST" 𝑥𝑥"R − 𝑥𝑥$R ST" 𝑑𝑑S 4 5.3 4.9 0.4 0.81
𝐷𝐷 = =
𝑛𝑛 𝑛𝑛
5 8.7 8.9 -‐0.2 0.09
𝑆𝑆O es la desviación estándar de las diferencias, es decir,
6 6.3 5.8 0.5 1.0

7 7.9 8.2 -‐0.3 0.04
D
ST" 𝑑𝑑S − 𝐷𝐷 $
𝑆𝑆O =
𝑛𝑛 − 1
8 7.3 7.8 -‐0.5 0.00

De acuerdo al nivel de confianza del 90% se ubica el valor de la tabla t Student con (n-‐1) = (10 -‐ 1)
9 8.0 9.5 -‐1.5 1.0 = 9 grados de libertad. El valor t= 1,833 (para buscar este valor en la tabla, revisar ejemplo 2,
lectura semana 3)
10 8.5 8.0 -‐0.5 0.00
𝑆𝑆O 0.73
-‐5.0 4.88 𝐼𝐼 = 𝐷𝐷 ± 𝑡𝑡0,D("
$ 𝑛𝑛
= −0.5 ± 1.833
10

𝐼𝐼 = −0.5 ± 0.42
Tabla 1: Ejemplo 3, diferencia de muestras pareadas

Fuente: Elaboración propia
• Límite superior de confianza = −𝟎𝟎. 𝟎𝟎𝟎𝟎

• Límite inferior de confianza = −𝟎𝟎. 𝟗𝟗𝟗𝟗
La media de las diferencias es:

𝑛𝑛 Debido a que se restan los puntajes posteriores al entrenamiento de los puntajes anteriores al
𝑖𝑖=1 𝑑𝑑𝑖𝑖 −5.0
entrenamiento, produciendo valores negativos, se puede estar 90% seguro de que la media de
𝐷𝐷 = = = −0.5
𝑛𝑛 10 los puntajes posteriores al entrenamiento está entre 0.08 y 0.92 más altos. Por lo tanto, se puede
decir que los puntajes después del entrenamiento son mayores a los puntajes de antes del
departamento.
𝑆𝑆O es la desviación estándar de las diferencias, es decir,

D $
ST" 𝑑𝑑S − 𝐷𝐷 4.88 4.88
𝑆𝑆O = = = = 0.54 = 0.73
𝑛𝑛 − 1 10 − 1 9

por lo que la muestra 𝑛𝑛 < 30 usamos la distribución t, siendo el intervalo de confianza:

𝑆𝑆O
𝐼𝐼 = 𝐷𝐷 ± 𝑡𝑡0,D("
$ 𝑛𝑛

03 -------
GLOSARIO DE TÉRMINOS entreviste a cada quinta familia en un conjunto residencial comenzando con la casa 5, la muestra
constaría de familias de las casas 5, 10, 15 del conjunto residencial.
Distribución muestral de medias: Distribución de probabilidad que consta de todas las posibles
medias de muestras de tamaño determinado seleccionadas de la población. Muestreo por conglomerados: Método común para reducir el costo del muestreo si la población
se encuentra dispersa en un área geográfica amplia. El área se divide en pequeñas unidades
Error de muestreo: Diferencia entre un estadístico muestral y el correspondiente parámetro
(condados, distritos, manzanas, etc.), denominadas unidades primarias. Después se eligen unas
poblacional. Por ejemplo: el ingreso medio muestral es de $30 100; la media poblacional es de
cuantas unidades primarias y se selecciona una muestra aleatoria de cada una.
$30 000. El error de muestreo es: $30 100 – $ 30 000 = $100. Este error es atribuible al muestreo,
es decir, al azar. Muestra probabilística: Muestra de elementos o individuos elegidos de manera que cada
miembro de la población cuente con la misma posibilidad de que se le incluya en la muestra.
Estimador de intervalo: Intervalo donde probablemente se localiza un parámetro de población,
basado en información de la muestra. Ejemplo: de acuerdo con los datos de la muestra, la media Sesgo: Posible consecuencia de negar a determinados miembros de la población la oportunidad
de la población está en el intervalo entre 0.7 y 1.5 kilo. de ser seleccionados para la muestra. Como resultado, la muestra puede no ser representativa
de la población.
Estimador puntual: Valor único calculado a partir de una muestra para calcular un parámetro
poblacional. Por ejemplo: si la media de la muestra es de 520 metros, éste constituye el mejor Teorema del límite central: Si el tamaño de la muestra es lo bastante grande, la distribución
estimador de la distancia media de la población. muestral de medias se aproximará a la distribución normal prescindiendo de la forma de la
población.
Muestreo aleatorio estratificado: Una población primero se divide en subgrupos denominados
estratos. Enseguida se elige una muestra de cada estrato. Si, por ejemplo, la población de interés
consta de todos los estudiantes universitarios, el diseño de la muestra puede indicar que formen

parte de la muestra 32 estudiantes de primer año, 41 de segundo, 50 de tercero y 42 del último

grado.

Muestreo aleatorio simple: Esquema de muestreo en el que cada miembro de la población posee

la misma posibilidad de que se le seleccione como parte de la muestra.

Muestreo aleatorio sistemático: Si la población se ordena de cierta forma, ya sea alfabética, por
estatura o en un archivero, se selecciona un punto de partida aleatorio; después, cada k-‐ésimo

elemento se convierte en miembro de la muestra. Si el diseño de una muestra requiere que se


04 -------
BIBLIOGRAFÍA
• Dougla A. Lind, W. G. (2012). Estadística aplicada a los negocios y la economía (13ª ed.).
MCGRAW-‐HILL.
• Paul Newbold, W. L. (2008). Estadistica para administracion y economia (6ª ed.). Madrid:
PRENTICE-‐HALL.
• Javier Gorgas García, N. C. (2009). Estadística básica para estudiantes de ciencias (1ª ed.).
Editorial Universidad Complutense de Madrid.
REMISIÓN A FUENTES COMPLEMENTARIAS
LECTURA 1: Marulanda Fraume, M. C. (2013). Modelación probabilista de pérdidas económicas
por sismo para la estimación de la vulnerabilidad fiscal del estado y la gestión financiera del riesgo
soberano.
LECTURA 2 Newcombe, R. G., & Soto, C. M. (2006). INTERVALOS DE CONFIANZA PARA LAS
ESTIMACIONES DE PROPORCIONES Y LAS DIFERENCIAS ENTRE ELLAS. Interdisciplinaria: Revista De
Psicología Y Ciencias Afines, 23(2), 141-‐154.
LISTA DE TABLAS
Tabla 1: Ejemplo 3, muestreo aleatorio simple ............................................................................... 9

POLITÉCNICO GRANCOLOMBIANO - 2016 ©

Wa0007

Загружено:

Сведения о документе

Оригинальное название

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

Wa0007

Загружено:

Авторское право:

Доступные форматы

INTERVALOS DE CONFIANZA EN DOS MUESTRAS

1. INTERVALOS DE CONFIANZA EN DOS MUESTRAS

1.2. Diferencia de medias con varianzas poblacionales conocidas

pero iguales y muestras pequeñas (n1 < 30 y n2 <30)

pero iguales y muestras pequeñas (n1 + n2 <30)

1.6. Intervalo para diferencia de proporciones DESARROLLO

1.7. Diferencia de muestras pareadas

Este material pertenece al Politécnico

El intervalo queda en la forma:

1.2. DIFERENCIA DE MEDIAS CON VARIANZAS POBLACIONALES CONOCIDAS

𝜎𝜎"$ 𝜎𝜎$$ 15 + 2,94=17,94

3 POLITÉCNICO GRANCOLOMBIANO ESTADÍSTICA II 4

𝑋𝑋" − 𝑋𝑋$ − 𝜇𝜇" − 𝜇𝜇$

Por lo tanto, el intervalo de confianza de nivel 1 − 𝛼𝛼 para la diferencia de medias de dos

5 POLITÉCNICO GRANCOLOMBIANO ESTADÍSTICA II 6

𝑃𝑃" 1 − 𝑃𝑃" 𝑃𝑃$ 1 − 𝑃𝑃$

0,04 – 0,032 = 0,0079

7 POLITÉCNICO GRANCOLOMBIANO ESTADÍSTICA II 8

Puntaje antes Puntaje

3 6.7 8.5 -­‐1.8 1.69

9 POLITÉCNICO GRANCOLOMBIANO ESTADÍSTICA II 10

11 POLITÉCNICO GRANCOLOMBIANO ESTADÍSTICA II 12

13 POLITÉCNICO GRANCOLOMBIANO ESTADÍSTICA II 14

REMISIÓN A FUENTES COMPLEMENTARIAS

LISTA DE TABLAS

Tabla 1: Ejemplo 3, muestreo aleatorio simple ............................................................................... 9

15 POLITÉCNICO GRANCOLOMBIANO ESTADÍSTICA II 16

Вам также может понравиться

3 6.7 8.5 -‐1.8 1.69