Академический Документы
Профессиональный Документы
Культура Документы
Muestreo Estadístico 1
1.1 INTRODUCCION.
Cabe recordar que el objetivo de la estadística es hacer inferencias acerca de una
población con base en la información contenida en una muestra. Este mismo objetivo
motiva el estudio del problema. Vamos a considerar el problema de muestreo de una
población que no es, necesariamente, muy grande.
TERMINOS TÉCNICOS
Ejemplo: Se realiza una encuesta de opinión sobre Intención de voto en las próximas
elecciones presidenciales en el Perú.
En este caso un elemento es un votante, persona mayor de 18 años y con D.N.I.,
registrado en Lima Metropolitana.
Considerando otro ejemplo, supongamos que Unique quiere evaluar la respuesta de los
consumidores a una línea nueva de lápices labiales y quiere obtener una muestra de
mujeres mayores de 18 años, en este caso la unidad de muestreo sería igual a un
elemento. En forma alternativa, la unidad de muestreo serían las familias. En este último
caso, las familias participarían en la muestra y se entrevistarían a todas las mujeres
mayores e 18 años en cada familia.
Para las encuestas telefónicas, el marco de muestreo podría ser, una lista de todos los
números telefónicos residenciales de la ciudad.
Para las entrevistas personales, una lista de las direcciones de todas las calles.
Para una encuesta de agricultura, una lista de todas las granjas o un mapa de las áreas
que contienen granjas.
Los datos son obtenidos de los elementos de la muestra y son usados para describir a la
población. Considérese al votante individual como la unidad de muestreo y a la lista de
votantes registrados como el marco.
En la encuesta de opinión publica cierto número de votantes (la muestra) van a ser
entrevistados para determinar su preferencia en las próximas elecciones.
Podemos usar la información obtenida de estos votantes para hacer inferencia acerca de
la preferencia de los votantes en una población determinada.
Capitulo I. Muestreo Estadístico 3
TOTAL POBLACIONAL: Y
n
Y
i 1
i
MEDIA POBLACIONAL: Y
N
Y i
Y i 1
N
VARIANZA POBLACIONAL: 2
N
(Y Y ) i
2
2 i 1
N
1 si i C
Yi
0 si i C
N
1
P
N
Y
i 1
i Proporción de unidades de la Población que pertenecen a C.
RAZÓN POBLACIONAL
TOTAL Y MEDIA Y
R
TOTAL X MEDIA X
Capitulo I. Muestreo Estadístico 4
ESTADÍSTICO O ESTADÍGRAFO
Es una medida usada para describir alguna característica de la muestra y la toma de
decisiones contienen un grado de incertidumbre.
i) MEDIA MUESTRAL : y
ii) PROPORCIÓN MUESTRAL : p̂
iii)VARIANZA MUESTRAL : s 2
ESTIMADOR Y ESTIMACIÓN
Un estimador de un parámetro poblacional ˆ (media, total, razón, proporción en la
población) es una función cuyo dominio es el conjunto S (muestras posibles) y su
recorrido coincide con posibles valores que puede tomar el parámetro .
característica
A estimar
de la
población
Si se imagina que este procedimiento se repite con todas las muestras posibles, los datos
que proporcionan cada una de ellas al ingresar al estimador (fórmula) darán como
resultado números (estimaciones) los cuales, en general, diferirán de muestra en
muestra. Es decir, que para cada muestra posible se obtiene un número (no
necesariamente distinto).
Una muestra Aleatoria simple con reemplazo, de tamaño n, obtenida a partir de una
población de N unidades, se puede pensar como la extracción de n muestras
independientes de tamaño 1.
Una unidad se extrae de la población al azar, para ser la primera unidad muestreada,
con una probabilidad 1/N.
Una muestra aleatoria simple sin reemplazo de tamaño n se elige de modo que cada
subconjunto posible e n unidades distintas en la población tiene la misma probabilidad
N
de ser elegido en la muestra. Existen muestras posibles, y cada una es igualmente
n
probable, de modo que la probabilidad de elegir cualquier muestra individual S de n
unidades es:
1 n! N n !
P S
N N!
n
Como consecuencia de esta definición, la probabilidad de que cualquier unidad dada
aparezca en la muestra es n N .
Para extraer una muestra aleatoria simple, necesitamos una lista de todas las unidades de
observación que pertenecen a la población; esta lista es el MARCO MUESTRAL. En
este tipo de muestra, la unidad de muestreo y la unidad de observación coinciden. Cada
unidad tiene asignado un número, y se elige una muestra de modo que:
Cuando se usan estas tablas para seleccionar una muestra aleatoria simple, el primer
paso es la enumeración de las unidades de la población del 1 al N. Si el primer dígito de
N es un número entre 5 y 9, el siguiente método de selección es el adecuado.
Capitulo I. Muestreo Estadístico 6
Supongamos que N = 528 y queremos n =10. Tomemos por ejemplo tres columnas de la
Tabla Nº 1, digamos la 25, 26 y 27. Recorramos hacia abajo cada columna
seleccionando los 10 primeros números distintos , entre 001 y 528. Estos son: 36, 509,
364, 417, 348, 127, 149, 186, 290 y 162. Para los dos últimos números saltamos a las
columnas 30 a 32.
Cuando el primer dígito de N es menor que 5, algunos pueden preferir este método si n
es pequeño y se dispone de una tabla de números aleatorios bastante grande.
5 47417 98326 87719 92294 6614 50948 64886 20002 97365 30976
6 28357 94070 20652 35774 16249 75019 21145 05217 47286 76305
7 17783 00015 10806 83091 91530 36466 39981 62481 49177 7579
8 40950 84820 29881 85966 62800 70326 84740 62660 77379 90279
9 82995 64157 66164 41180 10089 41757 78258 96488 88629 37231
10 96754 17676 55659 44105 47361 34833 86679 23930 53249 27083
11 34357 88040 53364 71726 45690 66334 60332 22554 90600 71113
12 06318 37403 49927 57715 50423 67372 63116 48888 21505 80182
13 62111 52820 07243 79931 89292 84767 85693 73947 22278 11551
14 47534 09243 67879 00544 23410 12740 02540 54440 32949 13491
15 98614 75993 84460 62846 59844 14922 48730 73443 48167 34770
16 24856 03648 44898 09351 98795 18644 39765 71058 90368 44104
17 96887 12479 80621 66223 86085 78285 02432 53342 42846 94771
18 90801 21472 42815 77408 37390 76766 52615 32141 30268 18106
19 55165 77312 83666 36028 28420 70219 81369 41943 47366 41067
En una encuesta por muestro elegimos ciertas propiedades que intentamos medir y
registrar para cada unidad que venga dentro de la muestra. Esta propiedades de las
unidades se llaman características o simplemente atributos.
Los valores obtenidos para cualquier atributo especifico en las N unidades que
comprenden la población, se representan por Y1 , Y2 ,..., YN . Los valores
correspondientes para las unidades en muestreo se denotan por y1 , y 2 ,..., y n
Las letras mayúsculas se refieren a las características de la población y las minúsculas a
las de la muestra.
Población Muestra
___________________________________________________________________
N n
Total : Y Yi Y1 Y2 .... Y N y i y1 y 2 .... y n
i 1 i 1
N n
Media: Y1 Y2 .... YN Y i
y1 y 2 .... y n i 1 i y
Y i 1
y
N N n n
__________________________________________________________________
Aun cuando el muestreo se realiza con muchos propósitos, el interés se centra, con
frecuencia, en cuatro características de la población.
Estimadores
_________________________________________________________________
Media de la población Y Yˆ y media muestral
n
Total de la población Y Yˆ Ny N y i n
i 1
n
y y i
Razón de la población R R̂ i 1
n
x
x
i 1
i
Capitulo I. Muestreo Estadístico 8
_________________________________________________________________
Observación
ESTIMADOR DE LA MEDIA POBLACIONAL :
n
y i
μ̂ Ŷ y i 1
n
ESTIMADOR DE LA VARIANZA DE y :
s2 n s2
Vˆ y 1 1 f ,
n N n
y y
2
i
donde i 1
s2
n 1
f n
N es la fracción de muestreo.
y1 33,5
y2 32
y3 52
y4 43
y5 40
y6 41
y7 45
y8 42,5
Capitulo I. Muestreo Estadístico 9
y9 39
Solución:
Es conveniente presentar los datos y cálculos de la muestra como se indica en la Tabla
N º 3.
Tabla 3: Datos y cálculos para el ejemplo
y y2 yi y 2
33,5 1122,25 54,6121
32 1024 79,0321
52 2704 123,4321
43 1849 4,4521
40 1600 0,7921
41 1681 0,0121
45 2025 16,8921
42,5 1806,25 2,5921
39 1521 3,5721
368 15332,5 285,3889
Luego
n
y i
368
ˆ y i 1
$40.89
n 9
y y
2
i
285.389
s2 i 1
35.67
n 1 8
s2 n 35.67 8
Vˆ y 1 1 3.89
n N 8 484
1.96
V̂ y 1.96 x 3.89 3.8657 $3.87
n
N yi
Yˆ N y i 1
n
ESTIMADOR DE LA VARIANZA DE Ŷ :
s2
V̂ Ŷ V̂ N y N 2 V̂ y 1 f
n
y y
2
i
donde
s2
n 1
f n
N es la fracción de muestreo.
s2
Z 1 / 2 Vˆ N y Z 1 / 2 N 2 1 f
n
Ejemplo 2: Una empresa industrial está interesada en el tiempo por semana que los
científicos emplean para ciertas tareas triviales. Las hojas de control del tiempo de una
muestra aleatoria de n = 50 empleados muestran que la cantidad promedio de tiempo
empleado en esas tareas es de 10.31 horas, con una varianza muestral de s 2 2.25 . La
compañía emplea N = 750 científicos. Estime el número total horas-hombre que se
pierden por semana en las tareas insignificantes y establezca un límite del 95% para el
error de estimación.
Solución
Luego la estimación del total horas-hombre que se pierden por semana en dichas tareas
insignificantes es :
Ŷ N y 75010.31 7732.5
La varianza estimada para dicha estimación es:
Capitulo I. Muestreo Estadístico 11
2
Vˆ Yˆ Vˆ N y N Vˆ y N
2 2 s
1 f 750 2 2.25 1 50
n 50 750
23540.63
donde:
N : tamaño de los elementos de la población.
y y
2
s 2
i
n 1
e : Error máximo que aceptamos en las estimaciones las cuales se obtienen en base a
la muestra elegida.
Z
1
: para una confiabilidad del 100x (1-)%
2
Pero antes se realiza una estimación anticipada para Y en esta fórmula. Si N es grande,
una primera aproximación es
Z12 / 2 2
n0 (1.2)
e2
n0
n
n
0
(1.3)
1
N
Capitulo I. Muestreo Estadístico 12
Solución:
Error de estimación ˆ E
P error de estimación E 1
Z1 / 2 V y E
para n.
Recordemos que la varianza estimada de y , esta dada por:
2
V̂ y
s
1 f
n
También
2
Nn
V y
n N 1
El tamaño de muestra requerido ahora puede encontrarse despejando n de la siguiente
ecuación:
2
N n
Z
1 / 2
V y Z
1 / 2
E
n N 1
Tamaño de muestra requerido para estimar con un límite para el error del
estimador E:
N Z12α/2 σ 2 Nσ 2
n
(N 1)E 2 Z 2 σ 2 (N 1)V σ 2
E2
V θ̂
donde: ( Z 1 / 2 ) 2 es la varianza del estimador .
Observación
Solución .-
Despejando
2 2
E 3
V 2.34
2 2
Z 0.975 (1.96)
N 2
n
( N 1) V 2
1000 650.25
n 217.63
999 2.34 650.25
necesitamos aproximadamente 218 observaciones para estimar μ , la media de las
cuentas por cobrar, con un límite para el error de estimación de $3.00.
o, equivalentemente,
z1 / 2 N V y E
Luego el tamaño de muestra requerido para estimar Y con un límite para el error e, es:
N 2
n
( N 1) V 2
E2
donde : V
N 2 Z12 / 2
gramos.
Solución
Calculando V , resulta
V
E2
1000 2
0.26
1.96 N 3.8416 1000
2 2 2
Por lo tanto, el investigador necesita pesar n = 122 polluelos para estimar Y, la ganancia
en peso total de 0 a 4 semanas de N = 1000 polluelos, con un límite para el error de
estimación igual a 1000 gramos.
Capitulo I. Muestreo Estadístico 16
LIMITES DE CONFIANZA
Z1 / 2 s
Límite inferior y 1 f ,
n
Z 1 / 2 s
Límite superior y 1 f
n
NZ1α/2 s NZ1α/2 s
Límite inferior N y 1 f , Límite superior N y 1 f
n n
donde:
s 2 : Varianza en la muestra
Observación:
Ejemplo 6. Se recabaron firmas para una población de 676 hojas. Cada hoja tenía
espacio suficiente para 42 firmas pero en muchas de las hojas se recabó un número
menor. Se contó el número de firmas por hoja en una muestra al azar de 50 hojas
(muestra del 7% aproximadamente), los resultados se muestran en la siguiente Tabla.
Estimar el número total de firmas para la petición y los límites de confianza al 80%.
Basado en la experiencia las medias de las muestras de las observaciones se distribuyen
aproximadamente de acuerdo a una normal.
Capitulo I. Muestreo Estadístico 17
yi 42 41 36 32 29 27 23 19 16 15 14 11 10 9 7 6 5 4 3 Total
ni 23 4 1 1 1 2 1 1 2 2 1 1 1 1 1 3 2 1 1 50
Solución.
n ni 50 , y y i ni 1471 , y n 2
i i 54497
i 1
Ŷ N y
676 1471 19888
50
La varianza de la muestra es :
1 n 2 1 n 2 y i ni
2
s
2
ni y i y n 1
n 1 i 1
y i ni
n
i 1
1 14712
54497 229.0
49 50
50
(676)(1.28)15.13 1
NZ 1 / 2 s 676 21669
Yˆsup N y 1 f 19888
n 50
Existe un 80% de confianza de que el número total de firmas para la petición se
encuentra entre 18107 y 21669.
Notación: Suponemos que todas y cada una de la unidades en la población caen dentro
de una, de dos posibles clases C y C´. La notación es como sigue:
Numero de unidades en C en la :
Población Muestra
A a
Proporción de unidades en C en la :
Población Muestra
P = A/N p = a/n
La estimación muestral de P es p, y la estimación muestral de A es Np o Na/n.
Para cualquier unidad en la muestra o población, se define y i como 1 si la unidad está
en C (posee la característica específica) , y como 0 si la unidad está en C [ (no posee la
característica específica). Para esta población de valores y i , esta claro que:
N
Y yi A
i 1
y i
A
Y i 1
P
N N
y i
a
y i 1
p
n n
y i
a
P̂ p y i 1
n n
ESTIMADOR DE LA VARIANZA DE P̂ :
Pˆ Qˆ
Vˆ Pˆ 1 f ,
n 1
donde : ˆ 1 P
Q ˆ
Pˆ Qˆ
Z 1 / 2 Vˆ Pˆ Z 1 / 2 1 f
n 1
Ejemplo 7. De una lista de 3042 nombres y direcciones, una muestra aleatoria simple
de 200 nombres mostró, al revisarla. 38 direcciones equivocadas. Estime el número total
de direcciones que se necesita corregir en la lista y encuentre el error estándar de esta
estimación.
Solución:
ˆ ˆ
ˆ N 2Vˆ Pˆ N 2 PQ 1 n (3042) 2 0.19 x 0.81 x1 200 6655.59
VA
n 1 N 199 3042
VA
ˆ 81.58
Z 12α/ 2 NPQ
n
N 1 e 2 Z12α/ 2 PQ
donde:
Observación
Solución
Observación. Otra expresión que se utiliza para seleccionar el tamaño de muestra para
la estimación de la proporción de una población,
NPQ
n
N 1V PQ
E2
donde: Q 1 P y V
Z 1 / 2
Ejemplo 9. Los dirigentes del consejo estudiantil en un colegio desean realizar una
encuesta para determinar la proporción de estudiantes que está a favor de una propuesta
de código de honor. Ya que entrevistar a 2000 estudiantes en un lapso razonable es casi
imposible. Determine el tamaño de muestra (Número de estudiantes a entrevistarse)
necesario para estimar p con un límite para el error de estimación de magnitud E = 0.05
y una confiabilidad del 95%. Suponga que no hay información previa disponible para
estimar P.
Solución
Cuando no se cuenta con información previa, podemos aproximar los tamaños de
muestra requeridos, estableciendo p = 0.5. Tenemos que:
E2 0.05 2
V 0.00065
(1.96) 2 3.8416
Capitulo I. Muestreo Estadístico 21
NPQ
n
N 1 V PQ
2000 0.5 0.5
1999 0.00065 0.05 0.05
500
1.3034
383.61
Luego 384 estudiantes deben ser entrevistados para estimar la proporción de estudiantes
que está a favor de una propuesta de código de honor, con un límite par el error de
estimación de 0.5.
Ejercicio:
ELEMENTO DE LA MUESTRA
L L _
y Yi Ni Y i L _
(1.4)
Y est T i 1 i 1
Wi Y i
N N N i 1
Ni
donde : N = N1 + N2 +...+ NL y Wi
N
L L
L L
V y est V Wi y i Wi2 V y i 2 Wi WjCov y i , y j
i1 i1 i 1 j k
2 N n
V y
n N
Lo anterior aplicado a un estrato i :
i2 N i n i
V y i (1.7)
ni Ni
De (1.6)
L L
N i2 1 L
V yest Wi2 V yi 2
V y i 2 N V y
2
i i
i 1 i 1 N N i 1
Por (1.7),
1 L
i2 N i n i L 2
V y est N i2 Wi2 i 1 f i
N2 i 1 n i N i i 1 ni
L
i2
V yest Wi2 1 f i
i 1 ni (1.8)
Ni
Wi fi n i Ni
N
Observación
esta fórmula es apropiada cuando las correcciones por población finita se pueden
ignorar.
donde :
si2 : varianza muestral en el estrato i.
Ni
Wi
N
f i ni N i
i 1 ni
LÍMITES DE CONFIANZA
Estas fórmulas suponen que y st está normalmente distribuida y que V̂ y est está
bien determinada, y Z1 / 2 puede encontrarse en las tablas de la distribución normal.
OBSERVACIÓN
Ejemplo 10. Una empresa publicitaria está interesada en determinar qué tanto debe
enfatizar la publicidad televisiva en determinado municipio, y decide realizar una
encuesta de muestreo para estimar el número promedio de horas por semana que se ve
la televisión en los hogares del municipio. Este comprende dos pueblos, pueblo A,
pueblo B y un área rural. El pueblo A circunda una fábrica, y la mayoría de los hogares
son de trabajadores fabriles con niños en edad escolar. El pueblo B es un suburbio
exclusivo de una ciudad vecina y consta de habitantes más viejos con pocos niños en
casa. Existen 155 hogares en el pueblo A, 62 en el pueblo B y 93 en el área rural.
n1 20 n2 8 n3 12
2 2 2
y 33.900
1 y 25.125
2 y 3 19.000
s12 35.358 s 22 232.411 s 32 87.636
N1 155 N 2 62 N 3 93
_____________________________________________
Solución.
1
y est N1 y1 N 2 y 2 N 3 y3
N
1
155 33.9 62 25.125 9319
310
27.7
es el número promedio de horas por semana en que en todos los hogares del municipio
se ve televisión.
1 3
N ni s i2
V̂ y est N i2 i
N2 i 1 Ni n i
24.9 Y 30.5
Entonces estimamos que el número promedio de horas por semana que se ve televisión
en los hogares del municipio es de 27.7 horas.
y 2 25.125 y s 22 232.411
S22 N 2 n 2 232.411 62 8
V y 2 25.30
n2 N2 8 62
Capitulo I. Muestreo Estadístico 28
(15.27 , 34.99)
El tiempo semanal total que en los hogares del municipio se ve televisión es de 8 587
horas.
La varianza estimada de N y est es
8587 851
7736, 9438
Existe un 95% de confianza de que el tiempo semanal total que en los hogares del
municipio se ve televisión se encuentre entre 7736 y 9438 horas.
N 2 2
i i wi
n h 1
L
N V N i i2
2 ( 1.12)
h 1
donde
wi : fracción de observaciones asignadas al estrato i
i2 : varianza poblacional para el estrato i
E2
V para estimar la media poblacional Yest
Z1 / 2
Capitulo I. Muestreo Estadístico 29
Ejemplo 11. Una encuesta anterior sugiere que las varianza de los estratos para el
ejemplo 10, son aproximadamente 12 25 , 22 225 y 3 100 .
2
Solución
Z1 / 2 V y est E
22 4
1.96 V y est 2 o sea V y est 1.02 , entonces V 2
1.041
(1.96) 3.8416
3
N 2h 2h N12 12 N 22 22 N12 31
2
h 1 Wh
W`1
W`2
W`3
155 2 25 62 2 225 93 2100
1 1 1
3 3 3
N
h 1
h
2
h N112 N 2 22 N 3 32
N 2
h
2
h Wh
6991275
n i 1
54.98
L
100040.1 27125
N 2 V N h 2h
h 1
1
n h n Wh 55 18.33 18 para h = 1, 2, 3.
3
Ejemplo 12. Así como en el ejemplo 11, supongamos que las varianzas del ejemplo 10
son aproximadamente 12 25 , 22 225 y 32 100 .
a) Estime el total poblacional Y con un límite de 400 horas para el error de
estimación.
b) Seleccione el tamaño de muestra apropiado, si se va a tomar el mismo número
de observaciones en cada estrato.
Solución
E2 (400) 2
V 0.6583
Z1 / 2 N 2 (1.96) 2 (310) 2
3
N 2h 2h
h 1 Wh
6991275
N
h 1
h
2
h 27125
N 2
h
2
h Wh
6991275
n h 1
77.35
3
63262.63 27125
N 2 V N h 2h
h 1
n h n Wh 781 / 3 26
Entonces n1 n 2 n 3 26.
Se recordará que el objetivo del diseño de una encuesta por muestreo es proporcionar
estimadores con alta precisión al menor costo posible. Después de elegir el tamaño de
muestra n, existen muchas maneras para dividir n entre los tamaños de muestra de los
estratos n1, n2,..., nL (Afijación de la muestra) Cada división diferente puede originar una
precisión diferente para el estimador. Por lo que nuestro objetivo es usar una afijación
que presente una cantidad especificada de información a un costo mínimo.
En términos de los objetivos señalados, el mejor esquema de afijación está influido por
tres factores:
1. El número total de elementos en cada estrato.
2. La variabilidad de las observaciones dentro de cada estrato.
3. El costo por obtener una observación de cada estrato.
L L
N i i / c i N i i c i
n i1 i1
L (1.13)
N 2 V N i i2
i 1
Capitulo I. Muestreo Estadístico 32
donde ,
N i i / ci
n h n
N / c N / c ... N / c
1 1 1 2 2 2 L L L
(1.14)
N / ci
n L i i
N i i / ci
i 1
Ejemplo. 13. La firma publicitaria del ejemplo 10 encontró que cuesta más obtener una
observación del área rural que una del pueblo A o del B. El incremento es debido a los
costos de traslado de un hogar rural a otro. El costo por observación en cada pueblo se
ha estimado en $9.00 (esto es, c1 = c2 = 9 ) y los costos por observación en el área rural
se han estimado en $16.00 (esto es c3 = 16). Las varianzas por estrato (aproximadas por
las varianzas muestrales de una encuesta previa) son 12 25 , 22 225 y 32 100 .
Halle el tamaño de muestra total y los tamaños de muestra para los tres estratos, que
permitan a la empresa estimar, al mínimo costo, el tiempo promedio que se ve
televisión, con un límite para el error de estimación igual a 2 horas.
3
N i i N1 1 N 2 2 N 3 3
i 1 i
1
2
3
155 5 6215 9310 800.83
9 9 9
N
i 1
i i ci N1 1 c1 N 2 2 c2 N 3 3 c3
Capitulo I. Muestreo Estadístico 33
3 3
N i i / c i N i i c i
n i1 i1
3
N 2 V N i i2
i 1
n
800.83 8835 55.64
310 1.041 27125
2
N 1 1 / c1
n 1 n
N / c N / c N / c
1 1 1 2 2 2 3 3 3
155 5 / 3
n 56 (0.32) 17.92
800.83
Asimismo,
6215 3
n2 n 56 (0.39) 21.84
800.83
9310 / 4
n3 n (56)(0.29) 16.24
800.83
Se debe seleccionar 18 hogares del pueblo A al azar, 22 del pueblo B y 16 del área
rural. Así se puede estimar el número promedio de horas empleadas en ver la televisión,
al mínimo costo, con un límite de 2 horas para el error de estimación.
N
n i n L i i
(1.15)
N ii
i 1
Capitulo I. Muestreo Estadístico 34
Este método de seleccionar n1, n2, ..., nL se denomina afijación Neyman. En la afijación
de Neyman, la ecuación (1.14) para el tamaño de muestra total n toma la forma
2
L
Nii
n i1 (1.16)
L
N V Ni
2 2
i
i 1
Ejemplo 14. La firma publicitaria del ejemplo 10 decide utilizar entrevista por teléfono
en lugar de entrevistas personales, porque todos los hogares en el municipio tienen
teléfono y este método reduce los costos. El costo de obtener una observación es
entonces el mismo en los tres estratos. Las varianzas son de nuevo aproximadas por
12 25 , 22 225 y 32 100 . La empresa desea estimar la media de la población
con un límite para el error de estimación igual a 2 horas. Encuentre el tamaño
aproximado de la muestra n y los tamaños de muestra para los estratos n1, n2 y n3.
Solución .-
Como los costos son iguales en los tres estratos utilizaremos las Ecuaciones (1.15) y
(1.16).
Para encontrar las fracciones de asignación W1, W2 y W3, usaremos la Ecuación
(1.15). Entonces
3
N
i 1
i i N11 N 2 2 N 3 3
N
n1 3 1 1 n 155 5 n 0.30 n
2635
N h h
h1
N
n2 3 2 2 n 6215 n 0.35 n
2635
N h h
h1
N
n3 3 3 3 n 9310 n 0.35 n
2635
Nhh
h 1
2
L
Nh h
n h 1 L (1.17)
N 2 V N h 2h
h 1
E2 22
Como, V 1.0412 entonces N 2 V 310 2 (1.042) 100136.2
Z12 / 2 (1.96) 2
3
También sabemos que N
i 1
i i
2
27125 .
2
3
N h h
n h1
3
N 2V N h h2
h 1
n
2635 2 67.5
100136.2 27125
Entonces
n1 w1 n 0.30 68 20.4
n2 w2 n 0.35 68 23.8
n 3 w 3 0.35 68 23.8
Se debe seleccionar 20 hogares del pueblo A al azar, 24 del pueblo B y 24 del área
rural. Así se puede estimar el número promedio de horas empleadas en ver la televisión,
al mismo costo en los tres estratos, con un límite de 2 horas para el error de estimación.
nh L h
N n N h n
(1.18)
N
Nh
h 1
Por supuesto la afijación proporcional puede y suele utilizarse cuando los costos y las
varianzas de los estratos no son iguales. Una ventaja al usar esta descomposición es que
el estimador y est es simplemente la media muestral de toda la muestra. Esta
característica puede representar un importante ahorro de tiempo en algunas encuestas.
En el esquema de afijación proporcional, la ecuación para el valor de n, que produce
V y est V , se convierte en
N h
2
h
n i 1
(1.19)
1 L
N V N h 2h
N i 1
Ejemplo 15. La empresa publicitaria del ejemplo 10 considera que las varianzas
aproximadas que se usaron en los ejemplos previos son erróneas y que las varianzas de
los estratos son iguales. El valor común de i fue aproximado por 10 en un estudio
preliminar. Se van a efectuar entrevistas por teléfono, por lo que los costos serán iguales
en todos los estratos. La empresa desea estimar el número promedio de horas por
semana que se ve la televisión en los hogares del municipio, con un límite para el error
de estimación igual a 2 horas. Encuentre el tamaño de muestra y los tamaños de estratos
necesarios para lograr esta actitud.
Solución
N i
3
i 155100 62100 93100 310100 31000
i 1
E2 22
entonces, ya que V 1.0412 , de la ecuación (1.15) tenemos que :
Z12 / 2 (1.96) 2
3
N i
2
i
31000
n i 1
73
1 3
1
NV N i i2 3101.042 31000
N i1 310
N 155
n1 1 n 73 0.5 73 36
N 310
N 62
n2 2 n 73 0.2 73 15
N 310
N 93
n3 3 n 73 0.3 73 22
N 310
Se debe seleccionar 36 hogares del pueblo A al azar, 15 del pueblo B y 22 del área rural.
Así se puede estimar el número promedio de horas empleadas en ver la televisión, al
mismo costo en los tres estratos, con un límite de 2 horas para el error de estimación, y
asumiendo que las varianzas son iguales en todos los estratos.
OBSERVACIÓN
Ejemplo 16. En el ejemplo 10, el costo por observación en cada pueblo se ha estimado
en $9.00 (esto es, c1 c2 9 ) y los costos por observación en el área rural se han
estimado en $16.00 (esto es c3 16 ). Vamos a aproximar las desviaciones estándar por
1 5 , 2 15 y 3 10 . Dado que la empresa publicitaria tiene únicamente $500
para gastar en muestreo, elija el tamaño de muestra y la asignación que minimice
V yest
Solución
o bien
500
Despejando n tenemos que: n 45.33
11 .03
Por lo que se debe tomar n = 45 para asegurar que los costos permanezcan inferiores a
$500.
n 1 W1 n 0.32 (45) 14
n2 W2 n 0.39 (45) 18
n 3 W3 n 0.29 ( 45) 13
OBSERVACIÓN
La población se divide en estratos, al igual que antes, y se toma una muestra aleatoria de
cada estrato. Luego se realizan las entrevistas para determinar la proporción Ph de
hogares, integrantes en el estrato h, donde se ve el programa.
L
yh ph , Pˆest Wi pi
i 1
L
1
P̂est N1p1 N 2 p 2 ... N L p L 1 N h p h (1.20)
N N h 1
V̂ P̂est
1
N2
N12 V̂ p1 N 22 V̂ p 2 ... N 2L V̂ p L
L
1
N2
N V̂ p
h 1
2
h h
1 L
pq
V̂ Pˆest N 1 f n 1
i
2
i
i i
(1.21)
N2 i 1 i
1 L
pq
Z1 / 2 Vˆ Pˆest Z1 / 2 N 1 f n 1
2
h h
h h
(1.22)
N2 h 1 hi
LÍMITES DE CONFIANZA
ˆest Z1 / 2 N Vˆ P
NP ˆest (1.24)
L
donde : Pˆest Wh ph
h 1
1 n1 20 16 0.80
2 n2 8 2 0.25
3 n 3 12 6 0.50
_____________________________________________
Solución
L
1 1
Pˆest N h ph 0.82(155) 62 0.25 93 0.50 0.60
N h 1 310
1 L
p q
V̂ P̂est N 1 f n 1
2
h h
h h
N2 h 1 h
[ 0.47, 0.73 ]
Existe un 95% de confianza de que el valor de la proporción de hogares donde se ve el
programa X en el municipio se encuentre entre 0.47 y 0.73.
Capitulo I. Muestreo Estadístico 41
Asignación óptima:
L L
( N i Pi (1 Pi ) / ci )( N i Pi (1 Pi ) ci )
n i 1
L
i 1
(1.25)
N V ( Pˆest ) N i Pi (1 Pi )
2
i 1
Asignación de Neyman:
L
( N i Pi (1 Pi ) ) 2
n i 1
L (1.26)
N V ( Pˆest ) N i Pi (1 Pi )
2
i 1
Asignación proporcional:
N P (1 P )
i i i
n i 1
L (1.27)
1
NV ( Pˆest )
N
N P (1 P )
i 1
i i i
La asignación aproximada que minimiza el costo para un valor fijo de V(p̂ est )
o minimiza V(p̂ est ) para un costo fijo:
N i Pi (1 Pi ) / ci
ni n
L
i = 1, 2, …, L (1.28)
N
i 1
i Pi (1 Pi ) / ci
N i Pi (1 Pi )
ni n
L
i = 1, 2, …, L (1.29)
N
i 1
i Pi (1 Pi )
Capitulo I. Muestreo Estadístico 42
Ni Ni
ni L
n n
N i = 1, 2, …, L (1.30)
N
i 1
i
Ejemplo 18.- Supongamos que los datos del ejemplo17 fueron tomados de un muestreo
realizado el año pasado. La empresa publicitaria quiere ahora efectuar un nuevo estudio
en el mismo municipio para estimar la proporción de hogares donde ven el programa X.
Aunque las proporciones P1, P2 y P3 que aparecen en las formulas son desconocidas,
pueden ser aproximadas por las estimaciones del estudio anterior, esto es, Pˆ1 0.80 ,
Pˆ2 0.25 y Pˆ3 0.50 . El costo por obtener una observación es $ 9 para cualquiera de
los pueblos y $ 16 para el área rural. Los hogares que se encuentran dentro de los
estratos son N1 = 155, N2 = 62 y N3 = 93. La empresa quiere estimar la proporción
poblacional P, con un nivel de confianza del 95% y con un límite para el error de
estimación igual a 0.01. Encuentre el tamaño de la muestra n y los tamaños de los
estratos n1, n2 y n3.
Solución.-
Estrato Ni ci pi 1- pi N i p i (1 pi ) / ci Ni p i (1 p i ) ci Ni pi (1-pi )
1 155 9 0.80 0.20 20.677 186.00 24.8
2 62 9 0.25 0.75 8.9466 80.538 11.625
3 93 16 0.50 0.50 11.625 186.00 23.25
Total 310 41.2486 452.538 59.675
2
0.01
V ( Pˆest ) 0.0026
1.96
Luego:
20.677
n1 60 30 hogares del pueblo A.
41.2486