Вы находитесь на странице: 1из 10

INTERVALOS DE CONFIANZA EN DOS MUESTRAS

ESTADÍSTICA II
AUTOR: Rogelio Alvarado Martinez
ÍNDICE
ÍNDICE  

1. INTERVALOS  DE  CONFIANZA  EN  DOS  MUESTRAS  

1.1. Introducción  

1.2. Diferencia  de  medias  con  varianzas  poblacionales  conocidas  

1.3. Diferencia  de  medias  con  varianzas  poblacionales  desconocidas  y  (n1  y  n2  )  >  30    (con  n1  ≈  n2)  

1.4. Diferencia  entre  medias  de  dos  poblaciones  normales  con  varianzas  poblacionales  desconocidas   Acceso rápido

pero  iguales    y  muestras  pequeñas  (n1  <  30      y  n2  <30)  

1.5. Diferencia  entre  medias  de  dos  poblaciones  normales  con  varianzas  poblacionales  desconocidas  

pero  iguales    y  muestras  pequeñas  (n1  +  n2  <30)  

1.6. Intervalo  para  diferencia  de  proporciones   DESARROLLO

1.7. Diferencia  de  muestras  pareadas  

   

GLOSARIO REFERENCIAS

Este material pertenece al Politécnico


Grancolombiano y a la Red Ilumno. Por ende, son
de uso exclusivo de las Instituciones adscritas a
la Red Ilumno. Prohibida su reproducción total
o parcial.
02 -------
1. INTERVALOS  DE  CONFIANZA  EN  DOS  MUESTRAS   Solución:  

1.1. INTRODUCCIÓN   n1=  36                n2=  64                    𝑋𝑋  " = 75      𝑋𝑋$ = 60              𝜎𝜎"$ = 41,16              𝜎𝜎$$ = 28,59  

Un  problema  que  es  tan  importante  como  la  estimación  de  una  sola  media  poblacional  para  una    
población   cuantitativa   es   la   comparación   de   dos   medias   poblacionales.   En   forma   similar   una  
extensión  de  la  estimación  de  una  proporción  para  una  población  cualitativa,  es  la  estimación  de   Se  ubica  el  valor  de  la  distribución  normal  con  nivel  del  98%,    Z=  2,33,  (si  alguna  duda,  revisar  los  
la  diferencia  entre  dos  proporciones.   ejemplos  de  la  lectura  de  la  semana  3).  

   

El  intervalo  queda  en  la  forma:  

1.2. DIFERENCIA  DE  MEDIAS  CON  VARIANZAS  POBLACIONALES  CONOCIDAS  


𝜎𝜎"$ 𝜎𝜎$$
𝐼𝐼 = 𝑋𝑋" − 𝑋𝑋$ ± 𝑍𝑍0/$ +  
Un  buen  estimador  puntual  para  las  diferencias  de  medias,  es  la  diferencia  de  medias  muestrales   𝑛𝑛" 𝑛𝑛$
𝑋𝑋" − 𝑋𝑋$ .  Se  cumple  que  la  distribución  muestral  de  la  diferencia  de  medidas  es  normal  con  media  
𝜇𝜇&' (&)  y  varianza    𝜎𝜎&$' (&) .    

El   intervalo   de   confianza   de   nivel   (1-­‐ 𝛼𝛼 )   para   la   diferencia   de   medias   de   dos   distribuciones   41,16 28,59
normales  de  varianzas  conocidas  es:    (75  –  60)  ±  2.33 +  
36 64
 
15  ±  2,33(1,26)  

𝜎𝜎"$ 𝜎𝜎$$ 15  +  2,94=17,94  


𝐼𝐼 = 𝑋𝑋" − 𝑋𝑋$ ± 𝑍𝑍0/$ +  
𝑛𝑛" 𝑛𝑛$
15  -­‐  2,94=12,06  

   

Ejemplo  1   La  diferencia  de  medias  está  entre  12,06  y  17,94  con  una  confiabilidad  del  98%.  Es  decir,  que  en  
promedio  el  número  de  artículos  producidos  por  el  primer  proceso  es  superior  al  del  Segundo  
proceso.  Esto  porque  el  intervalo  da  diferencias  positivas.  
Se  comparan  dos  procesos  de  fabricación,  los  dos  procesos  tienen  distribución  normal  y  con  base  
en   registros   pasados   se   determina   que   las   varianzas   eran   41,16   y   28,59,   respectivamente.   Se  
toman  dos  muestras,  una  de  36  artículos  de  la  primera  producción  y  otra  de  64  de  la  segunda  
obteniendo  medias  de  75  y  60,  respectivamente.   1.3. DIFERENCIA  DE  MEDIAS  CON  VARIANZAS  POBLACIONALES  DESCONOCIDAS  Y  (N1  
Y  N2  )  >  30    (CON  N1  ≈  N2)  
Encontrar  los  límites  de  confianza  del  98%  para  la  diferencia  de  las  medias  poblacionales.  
Los  valores  de  las  varianzas  poblacionales  no  necesariamente  podrán  ser  conocidos,  pero  si  las  
  muestras  son  grandes,  las  varianzas  muestrales  son  generalmente  una  buena  aproximación  a  las  

3 POLITÉCNICO GRANCOLOMBIANO ESTADÍSTICA II 4


varianzas   poblacionales.   Luego,   el   intervalo   de   confianza   para   la   diferencia   de   medias   puede   (n1 − 1) S12 + (n2 − 1) S 22
aproximarse  a:   Sp =  
n1 + n2 − 2

𝑆𝑆"$ 𝑆𝑆$$
𝐼𝐼 = 𝑋𝑋" − 𝑋𝑋$ ± 𝑍𝑍0/$ +  
𝑛𝑛" 𝑛𝑛$
1.5. DIFERENCIA  ENTRE  MEDIAS  DE  DOS  POBLACIONES  NORMALES  CON  VARIANZAS  
POBLACIONALES  DESCONOCIDAS  PERO  IGUALES    Y  MUESTRAS  PEQUEÑAS  (N1  +  
 
N2  <30)  
Este  aproximación  es  válida  para  muestras  grandes.  El  criterio  que  usaremos  es  𝑛𝑛" + 𝑛𝑛$ > 30  con  
Cuando   las   varianzas   de   las   poblaciones   son   desconocidas   y   las   varianzas   poblacionales   son  
la  condición  de  que  ambos  tamaños  muestrales    𝑛𝑛" ≈ 𝑛𝑛$  
diferentes  para  muestras  pequeñas,  se  podrá  asumir  un  estadístico  equivalente:  
 
 

𝑋𝑋" − 𝑋𝑋$ − 𝜇𝜇" − 𝜇𝜇$


𝑡𝑡 =  
1.4. DIFERENCIA  ENTRE  MEDIAS  DE  DOS  POBLACIONES  NORMALES  CON  VARIANZAS  
𝑆𝑆"$ 𝑆𝑆$$
POBLACIONALES  DESCONOCIDAS  PERO  IGUALES  Y  MUESTRAS  PEQUEÑAS  (N1  <   +
𝑛𝑛" 𝑛𝑛$
30      Y  N2  <30)  

Para  muestras  pequeñas,  y  considerando  en  primer  lugar  que  las  dos  varianzas  poblacionales  son    
iguales   𝜎𝜎"$ = 𝜎𝜎$$  aunque  con  valor  desconocido.  Puede  construirse  la  siguiente  variable  normal  
tipificada:   Se   trabaja   con   las   varianzas   en   la   muestra,   este   estadístico   sigue   aproximadamente   una  
distribución   t   de   Student   con   f   grados   de   libertad,   donde   f   es   el   entero   más   próximo   a   la  
𝑋𝑋" − 𝑋𝑋$ − 𝜇𝜇" − 𝜇𝜇$ aproximación  de  Welch:  
𝑍𝑍 =  
$
𝜎𝜎"$ 𝜎𝜎$$ 𝑆𝑆"$ 𝑆𝑆$$
− +
𝑛𝑛" 𝑛𝑛$ 𝑛𝑛" 𝑛𝑛$
𝑓𝑓 = $ $ − 2  
𝑆𝑆"$ 𝑆𝑆$$
  𝑛𝑛" 𝑛𝑛
+ $
𝑛𝑛" + 1 𝑛𝑛$ + 1
El   intervalo   de   confianza   de   nivel   1 − 𝛼𝛼  para   la   diferencia   de   medidas   de   dos   poblaciones  
normales  de  varianza  desconocidas  pero  iguales  es:    

Por   lo   tanto,   el   intervalo   de   confianza   de   nivel   1 − 𝛼𝛼  para   la   diferencia   de   medias   de   dos  


1 1 poblaciones  normales  de  varianzas  desconocidas  es:  
𝐼𝐼 = 𝑋𝑋" − 𝑋𝑋$ ± 𝑡𝑡0,D ED ($ 𝑆𝑆F ∙ +  
$ ' ) 𝑛𝑛" 𝑛𝑛$
 
En  esta  expresión  t  tiene  distribución  t  Student  con  (n1+n2-­‐2)  grados  de  libertad.  
𝑆𝑆"$ 𝑆𝑆$$
Y  la  desviación  estándar  Sp:   𝐼𝐼 = 𝑋𝑋" − 𝑋𝑋$ ± 𝑡𝑡0,I ∙ +  
$ 𝑛𝑛" 𝑛𝑛$

5 POLITÉCNICO GRANCOLOMBIANO ESTADÍSTICA II 6


1.6. INTERVALO  PARA  DIFERENCIA  DE  PROPORCIONES   Se  definen  los  valores:  
Teniendo   en   cuenta   que   la   varianza   de   la   distribución   muestral   de   una   proporción   puede  
F("(F) n1=  1000            n2=  1000        P1=  0,18            P2=  0,14      
escribirse   como:   𝜎𝜎F = ,   la   varianza   de   la   distribución   muestral   de   la   diferencia   de  
D
proporciones  será:   (1-­‐α  )=  0,95  
 
 
𝑝𝑝" 1 − 𝑝𝑝" 𝑝𝑝$ 1 − 𝑝𝑝$
𝜎𝜎F$' (F) = +   Para  el  nivel  de  confianza  del  95%  se  ubica  el  valor  Z  en  la  tabla  de  la  distribución  normal:  
𝑛𝑛" 𝑛𝑛$

  Z  =  1,96  (si  alguna  duda  de  cómo  identificar  este  valor  ir  a  la  lectura  semana  3)  

si  partimos  del  hecho  de  que  las  muestras  son  grandes,  por  lo  tanto,  la  distribución  muestral  de  
 
la  diferencia  de  proporciones  es  aproximadamente  normal,  luego,  el  intervalo  de  confianza  de  
nivel   1 − 𝛼𝛼  para  la  diferencia  de  proporciones  es:  
𝑃𝑃" 1 − 𝑃𝑃" 𝑃𝑃$ 1 − 𝑃𝑃$
𝐼𝐼 = 𝑃𝑃" − 𝑃𝑃$ ± 𝑍𝑍0/$ ∙ +  
  𝑛𝑛" 𝑛𝑛$

𝑃𝑃" 1 − 𝑃𝑃" 𝑃𝑃$ 1 − 𝑃𝑃$  


𝐼𝐼 = 𝑃𝑃" − 𝑃𝑃$ ± 𝑍𝑍0/$ ∙ +  
𝑛𝑛" 𝑛𝑛$
(0,18)(0,82) (0,14)(0,86)
(0,18 − 0,14) ± 1,96 +
  1000 1000  
donde  𝑃𝑃"  es  la  proporción  de  éxitos  en  una  muestra  de  tamaño  𝑛𝑛"  de  la  primera  población  y  lo  
0,04  +  0,032  =  0,0721  
mismo  para  𝑃𝑃$  pero  con  la  muestra    𝑛𝑛$ .  

  0,04  –  0,032  =  0,0079  

   

Ejemplo  2   Con  un  nivel  de  confianza  del  95%  se  puede  decir  que  la  diferencia  en  la  proporción  de  productos  
defectuosos   está   entre   0,0079   y   0,0721.   Este   resultado   indica   que   la   proporción   de   defectuosos  
El  departamento  de  control  de  calidad  de  una  gran  industria  quiere  establecer  con  un  nivel  de   es  mayor  en  el  turno  A,  la  conclusión  se  da  porque  los  dos  límites  del  intervalo  son  positivos.  
confianza  del  95%  si  existe  alguna  diferencia  entre  el  número  de  productos  defectuosos  que  son  
encontrados  en  la  producción,  en  dos  turnos  de  trabajo.  El  departamento  toma  muestras  de  1000    
productos  en  cada  turno,  el  turno  A  encuentra  un  18%  de  productos  defectuosos  mientras  que  
en  el  turno  B  este  porcentaje  era  del  14%.  

7 POLITÉCNICO GRANCOLOMBIANO ESTADÍSTICA II 8


1.7. DIFERENCIA  DE  MUESTRAS  PAREADAS   Ejemplo  3  

La  diferencia  de  medias  tratada  anteriormente,  corresponde  a  muestras  independientes.  En  este  
Se  tienen  los  puntajes  de  la  prueba  de  10  empleados  antes  y  después  de  habérseles  impartido  
caso   se   trata   de   establecer   la   diferencia   para   muestras   dependientes   o   relacionadas   en   capacitación   laboral   adicional.   Se   quiere   establecer   un   intervalo   de   confianza   del   90%   para   la  
situaciones   en   donde   se   analiza   el   mismo   sujeto   o   la   misma   unidad   en   dos   momentos,   como   en   media  de  la  diferencia  en  los  puntajes  antes  y  después  de  la  capacitación.  
los  casos  antes  y  después  o  pre  y  post.  
 
El   intervalo   de   confianza   de   nivel   1 − 𝛼𝛼  para   la   diferencia   de   medidas   de   observaciones  
pareadas  con  𝑛𝑛 > 30  puede  expresarse  como:   Los  puntajes  aparecen  en  la  tabla:  
  Solución:  
𝑆𝑆O  
𝐼𝐼 = 𝐷𝐷 ± 𝑍𝑍0/$  
𝑛𝑛

  Puntaje  antes   Puntaje  


de  la   después  de  la  
En   el   caso   de   que   la   muestra   𝑛𝑛 < 30  habría   que   sustituir   la   distribución   normal   por   una   capacitación  del   capacitación   𝑑𝑑S = 𝑥𝑥"R − 𝑥𝑥$R  
Empleado   𝑑𝑑S − 𝐷𝐷 $  
distribución  t,  siendo  el  intervalo  de  confianza:   empleado   delempleado  

  𝒙𝒙𝟏𝟏𝒊𝒊   𝒙𝒙𝟐𝟐𝒊𝒊  

𝑆𝑆O
𝐼𝐼 = 𝐷𝐷 ± 𝑡𝑡0,D("   1   9.0   9.2   -­‐0.2   −0.2 − (−0.5) $
= 0.09  
$ 𝑛𝑛

donde    
2   7.3   8.2   -­‐0.9   0.16  
𝐷𝐷  es  la  diferencia  entre  el  valor  de  antes  y  el  valor  después,  es  decir,  

  3   6.7   8.5   -­‐1.8   1.69  

D D
ST" 𝑥𝑥"R − 𝑥𝑥$R ST" 𝑑𝑑S 4   5.3   4.9   0.4   0.81  
𝐷𝐷 = =  
𝑛𝑛 𝑛𝑛
  5   8.7   8.9   -­‐0.2   0.09  

𝑆𝑆O  es  la  desviación  estándar  de  las  diferencias,  es  decir,    
6   6.3   5.8   0.5   1.0  
 
7   7.9   8.2   -­‐0.3   0.04  
D
ST" 𝑑𝑑S − 𝐷𝐷 $
𝑆𝑆O =  
𝑛𝑛 − 1
8   7.3   7.8   -­‐0.5   0.00  

9 POLITÉCNICO GRANCOLOMBIANO ESTADÍSTICA II 10


De  acuerdo  al  nivel  de  confianza  del  90%  se  ubica  el  valor  de  la  tabla  t  Student  con  (n-­‐1)  =  (10  -­‐  1)  
9   8.0   9.5   -­‐1.5   1.0   =  9  grados  de  libertad.    El  valor  t=  1,833    (para  buscar  este  valor  en  la  tabla,  revisar  ejemplo  2,  
lectura  semana  3)  
10   8.5   8.0   -­‐0.5   0.00    

𝑆𝑆O 0.73
      -­‐5.0   4.88   𝐼𝐼 = 𝐷𝐷 ± 𝑡𝑡0,D("
$ 𝑛𝑛
= −0.5 ± 1.833
10
 

𝐼𝐼 = −0.5 ± 0.42  
Tabla 1: Ejemplo 3, diferencia de muestras pareadas
 
Fuente: Elaboración propia
• Límite  superior  de  confianza  = −𝟎𝟎. 𝟎𝟎𝟎𝟎  
 
• Límite  inferior  de  confianza  = −𝟎𝟎. 𝟗𝟗𝟗𝟗  
La  media  de  las  diferencias  es:  
 
 
𝑛𝑛 Debido  a  que  se  restan  los  puntajes  posteriores  al  entrenamiento  de  los  puntajes  anteriores  al  
𝑖𝑖=1 𝑑𝑑𝑖𝑖 −5.0
entrenamiento,  produciendo  valores  negativos,  se  puede  estar  90%  seguro  de  que  la  media  de  
𝐷𝐷 = = = −0.5  
𝑛𝑛 10 los  puntajes  posteriores  al  entrenamiento  está  entre  0.08  y  0.92  más  altos.  Por  lo  tanto,  se  puede  
  decir   que   los   puntajes   después   del   entrenamiento   son   mayores   a   los   puntajes   de   antes   del  
departamento.  
𝑆𝑆O  es  la  desviación  estándar  de  las  diferencias,  es  decir,    
 
 
 
D $
ST" 𝑑𝑑S − 𝐷𝐷 4.88 4.88  
𝑆𝑆O = = = = 0.54 = 0.73  
𝑛𝑛 − 1 10 − 1 9
 
 
 
por  lo  que  la  muestra   𝑛𝑛 < 30  usamos  la  distribución  t,  siendo  el  intervalo  de  confianza:  
 
 
 
𝑆𝑆O
𝐼𝐼 = 𝐷𝐷 ± 𝑡𝑡0,D("    
$ 𝑛𝑛

11 POLITÉCNICO GRANCOLOMBIANO ESTADÍSTICA II 12


03 -------
GLOSARIO  DE  TÉRMINOS   entreviste  a  cada  quinta  familia  en  un  conjunto  residencial  comenzando  con  la  casa  5,  la  muestra  
constaría  de  familias  de  las  casas  5,  10,  15  del  conjunto  residencial.    
Distribución   muestral   de   medias:   Distribución   de   probabilidad   que   consta   de   todas   las   posibles  
medias  de  muestras  de  tamaño  determinado  seleccionadas  de  la  población.     Muestreo  por  conglomerados:  Método  común  para  reducir  el  costo  del  muestreo  si  la  población  
se   encuentra   dispersa   en   un   área   geográfica   amplia.   El   área   se   divide   en   pequeñas   unidades  
Error   de   muestreo:   Diferencia   entre   un   estadístico   muestral   y   el   correspondiente   parámetro  
(condados,  distritos,  manzanas,  etc.),  denominadas  unidades  primarias.  Después  se  eligen  unas  
poblacional.  Por  ejemplo:  el  ingreso  medio  muestral  es  de  $30  100;  la  media  poblacional  es  de  
cuantas  unidades  primarias  y  se  selecciona  una  muestra  aleatoria  de  cada  una.    
$30  000.  El  error  de  muestreo  es:  $30  100  –  $  30  000  =  $100.  Este  error  es  atribuible  al  muestreo,  
es  decir,  al  azar.     Muestra   probabilística:   Muestra   de   elementos   o   individuos   elegidos   de   manera   que   cada  
miembro  de  la  población  cuente  con  la  misma  posibilidad  de  que  se  le  incluya  en  la  muestra.    
Estimador   de   intervalo:   Intervalo   donde   probablemente   se   localiza   un   parámetro   de   población,  
basado  en  información  de  la  muestra.  Ejemplo:  de  acuerdo  con  los  datos  de  la  muestra,  la  media   Sesgo:  Posible  consecuencia  de  negar  a  determinados  miembros  de  la  población  la  oportunidad  
de  la  población  está  en  el  intervalo  entre  0.7  y  1.5  kilo.     de  ser  seleccionados  para  la  muestra.  Como  resultado,  la  muestra  puede  no  ser  representativa  
de  la  población.    
Estimador  puntual:  Valor  único   calculado  a  partir  de  una  muestra  para  calcular  un  parámetro  
poblacional.  Por  ejemplo:  si  la  media  de  la  muestra  es  de  520  metros,  éste  constituye  el  mejor   Teorema   del   límite   central:   Si   el   tamaño   de   la   muestra   es   lo   bastante   grande,   la   distribución  
estimador  de  la  distancia  media  de  la  población.   muestral   de   medias   se   aproximará   a   la   distribución   normal   prescindiendo   de   la   forma   de   la  
población.  
Muestreo  aleatorio  estratificado:  Una  población  primero  se  divide  en  subgrupos  denominados  
estratos.  Enseguida  se  elige  una  muestra  de  cada  estrato.  Si,  por  ejemplo,  la  población  de  interés    
consta  de  todos  los  estudiantes  universitarios,  el  diseño  de  la  muestra  puede  indicar  que  formen  
 
parte  de  la  muestra  32  estudiantes  de  primer  año,  41  de  segundo,  50  de  tercero  y  42  del  último  
 
grado.    
 
Muestreo  aleatorio  simple:  Esquema  de  muestreo  en  el  que  cada  miembro  de  la  población  posee  
 
la  misma  posibilidad  de  que  se  le  seleccione  como  parte  de  la  muestra.    
 
Muestreo  aleatorio  sistemático:  Si  la  población  se  ordena  de  cierta  forma,  ya  sea  alfabética,  por    
estatura  o  en  un  archivero,  se  selecciona  un  punto  de  partida  aleatorio;  después,  cada  k-­‐ésimo  
 
elemento  se  convierte  en  miembro  de  la  muestra.  Si  el  diseño  de  una  muestra  requiere  que  se  
 

13 POLITÉCNICO GRANCOLOMBIANO ESTADÍSTICA II 14


04 -------
BIBLIOGRAFÍA  

• Dougla   A.   Lind,   W.   G.   (2012).   Estadística   aplicada   a   los   negocios   y   la   economía   (13ª   ed.).  
MCGRAW-­‐HILL.  

• Paul  Newbold,  W.  L.  (2008).  Estadistica  para  administracion  y  economia  (6ª  ed.).  Madrid:  
PRENTICE-­‐HALL.  

• Javier  Gorgas  García,  N.  C.  (2009).  Estadística  básica  para  estudiantes  de  ciencias  (1ª  ed.).  
Editorial  Universidad  Complutense  de  Madrid.  

REMISIÓN  A  FUENTES  COMPLEMENTARIAS  

LECTURA  1:  Marulanda  Fraume,  M.  C.  (2013).  Modelación  probabilista  de  pérdidas  económicas  
por  sismo  para  la  estimación  de  la  vulnerabilidad  fiscal  del  estado  y  la  gestión  financiera  del  riesgo  
soberano.  

LECTURA   2   Newcombe,   R.   G.,   &   Soto,   C.   M.   (2006).   INTERVALOS   DE   CONFIANZA   PARA   LAS  
ESTIMACIONES  DE  PROPORCIONES  Y  LAS  DIFERENCIAS  ENTRE  ELLAS.  Interdisciplinaria:  Revista  De  
Psicología  Y  Ciencias  Afines,  23(2),  141-­‐154.  

LISTA  DE  TABLAS  

Tabla  1:  Ejemplo  3,  muestreo  aleatorio  simple  ...............................................................................  9  

15 POLITÉCNICO GRANCOLOMBIANO ESTADÍSTICA II 16


POLITÉCNICO GRANCOLOMBIANO - 2016 ©