Вы находитесь на странице: 1из 33

Donde

MUESTREO ALEATORIO ESTRATIFICADO

Es un procedimiento de selección de una


muestra con el objeto de dividir a la
población heterogénea en estratos (Ni) o
sub poblaciones homogéneas . En cada uno
de los estratos se seleccionan una muestra
de tamaño “ni “ ,mediante MAS o MASy .
• Los estratos deben formarse de manera que los
elementos de cada estrato sean lo más
homogéneos que se pueda entre sí (más
homogéneos que el conjunto de la población)
• Las diferencias entre un estrato y otro sean las
mayores posibles.
• Esta forma de construir los estratos conduce a
muestras con poca variabilidad entre las
mediciones que producirán pequeñas varianzas
de los estimadores y por tanto menores límites
para los errores de estimación que con otros
diseños de la muestra
NOTACIÓN
ESTIMACIÓN DE LA MEDIA, PROPORCIÓN Y
TOTAL POBLACIONALES
La media de la población se obtiene calculando la
media ponderada de las medias de las muestras de
cada estrato.
* Estimador puntual de la media

* Estimador del total


• Varianza estimada de la media estratificada

• Error estándar de la media

• Varianza estimada del total


INTERVALO DE CONFIANZA
• PARA LA MEDIA

• PARA EL TOTAL DE LA POBLACIÓN


• Estimación puntual de la proporción

• Estimador del total poblacional

• Varianza estimada de la proporción


poblacional

• Estimador del error estandar de la proporcion


• ESTIMADOR DE LA VARIANZA DEL TOTAL

• INTERVALO DE CONFIANZA PARA LA


PROPORCION

𝑃𝑆𝑇 ± 𝑍𝑆𝑃𝑆𝑇
DETERMINACIÓN DEL TAMAÑO DE MUESTRA
• El tamaño de muestra que se requiere para estimar
la media y el total con un limite B para el error de
estimación es:
2  i Ni − n i
2
1
𝐵 = 𝑧 𝑉(𝑦ത𝑠𝑡 ሻ V (yst ) = 2  Ni * ( )
También se tiene N ni Ni − 1
 i2
ni = nwi  i
N 2

wi
n=
N 2 D +  N i i2
• Donde
B2
D= 2 2
2
Para la media D = B Para el total
2
z z N

Nota: Para las proporciones solo se sustituye 𝜎𝑖2 por 𝑝𝑖 𝑞𝑖


ASIGNACIÓN DE LA MUESTRA
• Significa asignar o afijar el tamaño muestral “n” en los
distintos estratos.
• Siendo el objetivo del diseño por muestreo proporcionar
estimadores con varianza pequeña (pequeño error de
estimación), al menor costo posible.
• ¿Cuál es el tamaño de muestra n? y ¿cómo afijar el tamaño
de muestra a cada estrato?
➢ Existen muchas maneras de dividir el tamaño de muestra
total entre los estratos. (afijación de la muestra).
AFIJACIÓN OPTIMA
• La asignación aproximada que minimiza el
costo para el valor fijo de 𝑉(𝑦ത𝑠𝑡ሻ o que minimiza
V (y ) para un costo fijo es :
st

 N i i 
 ci  ci: costo para obtener una
ni = n   observación individual del
  N i i ci  i-ésimo estrato
 
 
Tamaño de muestra
Para el caso de
෌ 𝑁𝑖 𝜎𝑖 Τ 𝑐𝑖 ሻ(෌ 𝑁𝑖 𝜎𝑖 𝑐𝑖 proporciones solo se
n= sustituye 𝜎𝑖2 por 𝑝𝑖 𝑞𝑖
𝑁 2 𝐷 + ෌ 𝑁𝑖 𝜎𝑖2
AFIJACIÓN DE NEYMAN
• Cuando los costos de observación de cada
estrato son las mismas o no se conocen las
expresiones de la asignación optima se
simplifican y transforman en.
ci: costo para obtener una
observación individual del i-ésimo
 N i i  estrato
ni = n  
N 
 i i 
Tamaño de muestra
Para el caso de
σ 𝑁𝑖 𝜎𝑖 2 proporciones solo se
n= sustituye 𝜎𝑖2 por 𝑝𝑖 𝑞𝑖
𝑁 2 𝐷 + ෌ 𝑁𝑖 𝜎𝑖2
AFIJACIÓN PROPORCIONAL
• Si además de los costos coinciden el valor de
las varianzas en c/u de los estratos, las
expresiones de las asignación optima se
simplifican en:
ci: costo para obtener una observación individual del
i-ésimo estrato

 Ni 
ni = n  
N
 i 
Tamaño de muestra
Para el caso de
n =
N i i
2
proporciones solo se
1 sustituye 𝜎𝑖2 por 𝑝𝑖 𝑞𝑖
ND +
N
 N i i
2
Ejercicios
• Se desea estimar tanto el área cultivada
promedio por inca como el área total cultivada en
una región agrícola que agrupa a 2,010 fincas.
Para tal efecto las fincas fueron estratificadas
según la superficie total que poseen; es decir,
para cada finca se disponía de su área total y a
través de ella se clasifico a las incas en los 7
estratos. Posteriormente, y en forma
independiente, dentro de cada estrato fueron
seleccionadas muestras simples aleatorias
eligiendo y visitando solo al 10% de las fincas del
estrato. Los resultados obtenidos fueron:
Estrato número de
fincas información con las fincas
Sub. Total (Has) 𝑁ℎ 𝑤ℎ 𝑛ℎ 𝑦തℎ 𝑠ℎ
Hasta 40 394 0,1960 40 5,4 8,3
40,1--80
461 0,2294 46 16,3 13,3
80,1- 120
391 0,1945 39 24,3 15,1
120,1-180 334 0,1662 33 34,5 19,8
180,1-250
169 0,0841 17 42,1 24,5
250,1-350
113 0,0562 11 50,1 26,0
350,1- mas
148 0,0736 15 63,8 35,2
total 2,010 1 201
• Respuesta:
• a.- Estimación de la superficie cultivada promedio por finca
σ 𝑁ℎ 𝑦തℎ
• 𝑦𝑒 = 𝑁 = σ 𝑤ℎ 𝑦തℎ = ሾ0.1960 ∗ 5.4 + 0.2294 ∗ 16.3 +
⋯ + 0.0736 ∗ 63.8ሿ
• 𝑦𝑒 = 26.3 Hectáreas cultivadas por finca
• Su varianza estimada será:
σ 𝑤ℎ 2 1−𝑓ℎ 𝑠ℎ 2
• 𝑣(𝑦ത𝑒ሻ = 𝑛ℎ

2 8.32 2
• = ሾ 0.1960 ∗ 1 − 0.1 ∗ + ⋯ + 0.0736 1 − 0.1 ∗
40
35.22 /15ሿ
• 𝑣(𝑦ത𝑒ሻ = 1.5386 = 1.24 Hectáreas cultivadas
• De las 24000 familias de un pueblo se desea seleccionar una
muestra representativa con el fin de estimar el valor promedio de
los bienes familiares que pueden ser convertidos rápidamente en
dinero efectivo por familia. Las familias son estratificadas en dos
estratos, uno de rentas altas y el otro de rentas bajas; se piensa que
sea una familia en el estrato de renta de renta alta posee cerca de 9
veces más bienes de este tipo que los poseídos por un hogar de
renta baja; y se espera que la desviación estándar en cada estrato
sea proporcional a la raíz cuadrada de la media del estrato. Existen
4000 familias en el estrato de renta alta y 20000 familias en el
estrato de renta baja.
• a.- como distribuiría una muestra estratificada de 1000 hogares en
cada uno de los estratos.
• b.- si el objetivo fuera estimar la diferencia entre el valor promedio
de los bienes convertibles rápidamente en dinero por familia de los
dos estratos, ¿cómo debe estar distribuida la muestra en los
estratos?
Respuesta: Estrato 𝑁ℎ 𝑦തℎ 𝑠ℎ 𝑛ℎ
renta alta 4000 9y 𝑘 9𝑦ത ……
renta baja 20000 y 𝑘 𝑦ത ……
24000 1000
Asumiendo una asignación optima del tamaño de muestra:
𝑛𝑁ℎ 𝑆ℎ
𝑛ℎ = σ , para h: 1,2
𝑁ℎ 𝑆ℎ

𝑘 9𝑦ത
𝑛1 = 1000 ∗ 4000 ∗ = 375

4000𝑘 9𝑦+20,000𝑘 𝑦ത

𝑘 𝑦ത
𝑛2 = 1000 ∗ 20000 ∗ = 625

4000𝑘 9𝑦+20,000𝑘 𝑦ത

Total =1000
b.- Para estimar la diferencia de promedio entre estratos como cada estrato es
muestreado independientemente.

𝑠1 2 𝑠 2 2
𝑣 𝑦ത1 −𝑦ത2 = 𝑣 𝑦ത1 + 𝑣 𝑦ത2 = +
𝑛1 𝑛2
El objetivo es:
Minimizar: 𝑣 𝑦ത1 + 𝑣 𝑦ത2
Sujeto a: 𝑛1 +𝑛2 = 𝑛
𝑠2 1 𝑠2 2
Min Φ: + + 𝑡(𝑛 − 𝑛1 − 𝑛2 ሻ
𝑛1 𝑛2

𝑑Φ 𝑠2 ℎ
= −𝑡 =0
𝑑𝑛ℎ 𝑛ℎ

σ 𝑠ℎ
𝑛ℎ = 𝑠ℎ / 𝑡 ; Luego σ 𝑛ℎ = = 𝑛 , entonces 𝑡 = (σ 𝑠ℎ ሻ2 /𝑛2
𝑡

Así
𝑛𝑠ℎ
𝑛ℎ = σ
𝑠ℎ

𝑘 9𝑦ത
𝑛1 = 1000 ∗ = 750

𝑘 9𝑦+ 𝑦ത

𝑘 𝑦ത
𝑛2 = 1000 ∗ = 250

𝑘 9𝑦+ 𝑦ത

Total =1000
• En una región agrícola conformada por 2010 fincas, la superficie
total y la superficie cultivada con maíz fue investigado en cada una
de las unidades agrícolas. Con los resultados, las fincas fueron
clasificadas según su tamaño total en 7 estratos y se obtuvo la
información siguiente:
número
estrato de fincas superficie cultiva con maíz
(h) sub total promedio desv estándar
(has) 𝑁ℎ 𝑦തℎ 𝑆ℎ
1 hasta 40 394 5,4 8,3
2 40,1 a 80 461 16,3 13,3
3 80,1 a 120 391 24,3 15,1
4 120,1 a 180 334 34,5 19,8
5 180,1 a 250 169 42,1 24,5
6 250,1 a 350 113 50,1 26,0
7 350,1 a mas 148 63,8 35,2
2010 26,3
• Con el fin de actualizar la información de la zona se desea realizar
una nueva encuesta por muestreo seleccionando una muestra de
100 fincas, determinar el número de fincas que deberán ser
visitadas en cada estrato asumiendo:
• a.- Asignación proporcional.
• b.- Asignación óptima.
• c.- Compare las precisiones esperadas lograr a través de los dos
métodos de asignación, respecto a utilizar una muestra simple
aleatoria.
• d.- Verificar que se cumple:
2 1
• 𝑣(𝑦ሻ
ത 𝐴 = 𝑣(𝑦ത𝑒 ሻ𝑃 + ቂσ 𝑁ℎ 𝑦തℎ − 𝑦ത − σ(𝑁 −
𝑁
𝑁−𝑛
𝑁ℎ ሻ𝑆 2 ℎ ቃ 𝑁 𝑁−1 𝑛
Respuesta:

𝑁ℎ ෍ 𝑌 2 ℎ𝑖
h 𝑤ℎ = 𝑁 𝑤ℎ 𝑁ℎ 𝑤ℎ 𝑆 2 ℎ 𝑤ℎ (𝑦തℎ − 𝑦ሻ
ത 2 𝑆2ℎ
1 0,196 1,6268 13,5024 85,6148 68,89 38563
2 0,229 3,0457 40,5078 22,9000 176,89 203853
3 0,195 2,9445 44,4620 0,7800 228,01 319805
4 0,166 3,2868 65,0786 11,1618 392,04 528093
5 0,084 2,0580 50,4210 20,9698 600,25 400379
6 0,056 1,4560 37,8560 31,7206 676,00 359343
7 0,074 2,6048 91,6890 104,0625 1239,04 784564
1 17,0226 343,5168 277,2095 3381,12 2634600
a.- Asignación proporcional: 𝑛ℎ = 𝑛 ∗ 𝑤ℎ del tamaño de muestra:

𝑁ℎ
h 𝑤ℎ = 𝑛ℎ = 100 ∗ 𝑤ℎ
𝑁
1 0,196 20
2 0,229 23
3 0,195 19
4 0,166 17
5 0,084 8
6 0,056 6
7 0,074 7
Total 100
𝑤 𝑠ℎ
b.- asignación óptima: 𝑛ℎ = 𝑛 ∗ (σ 𝑤ℎ𝑠
ሻ del tamaño de muestra.
ℎ ℎ

𝑁ℎ 𝑤ℎ 𝑠ℎ
𝑤ℎ = 𝑛ℎ = 100 ∗ ( ሻ
h 𝑁 𝑤ℎ 𝑁ℎ σ 𝑤ℎ 𝑠ℎ
1 0,196 1,6268 10
2 0,229 3,0457 18
3 0,195 2,9445 17
4 0,166 3,2868 19
5 0,084 2,0580 12
6 0,056 1,4560 9
7 0,074 2,6048 15
1 17,0226 100
• c.- Precisiones esperadas con los métodos de asignación
• Varianza esperada con la asignación proporcional, para el estimador del
promedio de la superficie cultivada con maíz:
1−𝑓 1
• 𝑣(𝑦ത𝑒 ሻ𝑜 = ∗ σ 𝑤ℎ 𝑠 2 ℎ = ∗ σ 𝑤ℎ 𝑠 2 ℎ Despreciando 1 − 𝑓 = 1
𝑛 𝑛
343.5168
• = = 3.345
100
• Varianza esperada con la asignación óptima, para el estimador del promedio
de la superficie cultivada con maíz:
σ 𝑤ℎ 𝑠ℎ 2 σ 𝑤ℎ 𝑠 2 ℎ σ 𝑤ℎ 𝑠ℎ 2
• 𝑣 𝑦ത𝑒 𝑜 = − = Considerando 1 − 𝑓 = 1
𝑛 𝑁 𝑛
17.0226 2
• = = 2.898
100
• Varianza esperada con una muestra simple aleatoria, para el estimador del
promedio de la superficie cultivada con maíz.
1
• 𝑣(𝑦ሻ
ത 𝐴= σ 𝑤ℎ 𝑠 2 ℎ + (1/𝑛ሻ σ 𝑤ℎ (𝑦തℎ − 𝑦ሻ
ത 2
𝑛
343.5168 277.2095
• = + = 6.207
100 100
• Luego respecto al muestreo simple aleatorio, las precisiones esperadas con el
muestreo estratificado tendrían el comportamiento siguiente:
varianza
Método esperada precisión relativa
𝑣 𝑦ത 𝐴
∗ 100
𝑣 𝑦ത𝑒
simple aleatorio 6,207
asignación
proporcional 3,435 181%
asignación optima 2,898 214%
Se esperaría lograr mayor precisión utilizando el muestreo estratificado con una
asignación óptima del tamaño de muestra entre siete estratos.
d.- Verificar que se cumple:

2 1 𝑁−𝑛 1−𝑓
ത 𝐴 = 𝑣(𝑦ത𝑒 ሻ𝑃 + σ 𝑁ℎ 𝑦തℎ − 𝑦ത
𝑣(𝑦ሻ − ∗ ∗𝑁 = +
𝑁 σ 𝑁−𝑁ℎ 𝑠2 𝑁−1 𝑛 σ 𝑤ℎ 𝑠 2 ℎ
2 1 1 𝑁−𝑛
ሾσ 𝑤ℎ 𝑦തℎ − 𝑦ത − σ 𝑠2ℎ + σ 𝑤ℎ 𝑠 2 ℎ ሿሾ ሿ
𝑁 𝑁 𝑛 𝑁−1

3381.12 343.5168
= 0.95 ∗ 3.435 + 277.2095 − + 2010 2010 − 100 2009 ∗ 100
2010

𝑣(𝑦ሻ
ത 𝐴 = 3.263 + 2.621 = 5.884
Directamente calculada la varianza esperada con una muestra simple aleatoria
seria:
ത 𝐴 = 1 − 𝑓 𝑆 2 /𝑛
𝑣(𝑦ሻ
1
Donde 𝑆 2 = 2009
2634600 − 2010 26.3 2
= 619.3644
619.3644
𝑣(𝑦ሻ
ത 𝐴 = 0.95 ∗ 100
= 5.884 Vemos que se cumple.
En una región forestal de desea estimar tanto el volumen de madera
total existente, como al volumen de madera por árbol. La región
contiene 640 árboles de madera comercial con un clara zonificación
interna distinguiéndose tres estratos.
Estrato (h) Tipología
1 Bosque denso
2 Bosque abierto
3 Pradera
En cada uno de los estratos conformados se tomó una muestra simple
aleatoria de 20 árboles, procediéndose a cubicar el volumen de
madera de registran cada árbol seleccionado; como resultado de logro
la información siguiente:
h 𝑁ℎ 𝑛ℎ 𝑦തℎ 𝑠ℎ 𝑁ℎ 𝑠ℎ 𝑁ℎ 𝑠 2 ℎ (1 − 𝑓ℎ ሻ Producto 𝑁ℎ 𝑦തℎ
1 246 20 18,1 20,1 4945 99386 0,919 1123439 4452,6
2 322 20 105,2 69,8 22475 1568797 0,938 23691657 33874,4
3 72 20 190,8 130,4 9389 1224230 0,722 3182199 13737,6
640 36809 2892413 27997295 52064,6
𝑃𝑟𝑜𝑑𝑢𝑐𝑡𝑜 = 𝑁 2 ℎ 𝑠 2 ℎ (1 − 𝑓ℎ ሻ𝑛ℎ
• Un especialista propone tomar una muestra estratificada aleatoria de una
población que ha sido dividida en dos estratos; espera que sus costos de
trabajo de campo tendrán la forma: σ 𝑐ℎ 𝑛ℎ
• Sus estimaciones preliminares sobre los valores principales para los dos
estratos son:
estrato 𝑤ℎ 𝑠ℎ 𝑐ℎ
1 0,4 10 4
2 0,6 20 9
𝑛1 𝑛2
a.- Determinar los valores , que minimizan al costo de trabajo
𝑛 𝑛
de campo de la investigación asumiendo una misma varianza 𝑣(𝑦ത𝑒 ሻ
predeterminada.
b.- Encontrar el tamaño de muestra requerido para que una
asignación óptima se pueda lograr una varianza 𝑣 𝑦ത𝑒 = 1(ignore la
corrección de población finita 𝑐. 𝑝. 𝑓. : 1 − 𝑓 = 1).
c.- ¿Cuál será el costo total del trabajo de campo que se espera
incurrir para l investigación?
Después de realizar la encuesta el muestrista encontró que sus
costos efectivos de trabajo decampo fueron:
𝑐1 = 2; 𝑐2 = 12
d.- ¿En cuánto supero el costo efectivo al costo esperado?
e.- ¿Si se hubiera conocido los verdaderos costos de trabajo de
campo por adelantado, podría haberse obtenido la varianza
prevista 𝑣 𝑦ത𝑒 = 1 con el presupuesto asignado para cubrir los
costos de trabajo campo resultante de la pregunta c?
una población fue estratificada en dos estratos obteniéndose:

estrato 𝑤ℎ 𝑠ℎ
1 0,8 2
2 0,2 4

Determinar los tamaños de muestra n1;n2 requiriendo en las


situaciones siguientes:
a.- el error estándar del estimador de la media poblacional
debe ser menor a 0.1 y el tamaño de muestra n=n1+n2
mínimo.
b.- El error estándar de la media estimada de cada estrato
debe ser menor a 0.1.
c.- el error estándar de la diferencia entre las medias
estimadas de cada estrato debe ser menor a 0.1 y el tamaño
de muestra n=n1+n2 mínimo.

Вам также может понравиться