Вы находитесь на странице: 1из 8

MUESTREO POR CONGLOMERADOS

Por algunas razones naturales, los elementos muestrales se encuentran formando grupos,
como, por ejemplo, las personas que viven en colonias de una ciudad, los elementos de una caja
de una línea de producción, los clubes de personas, las áreas arboladas de un terreno, etc.

Como el objetivo del muestreo es levantar la mayor cantidad de información al menor costo, en
este tipo de casos lo más económico el encuestar a un elemento muestral y a todos sus vecinos,
así se ahorran los costos de un traslado del encuestador.

A este modelo de muestreo se llama “Por conglomerados”, ya que una vez seleccionado un
elemento para la muestra, se incluyen también a todos los elementos que estén alrededor de
él.

A diferencia del muestreo estratificado, este muestreo no requiere que los elementos tengan
características homogéneas.

1. VENTAJAS:
 Es muy eficiente cuando la población es muy grande y dispersa
 No es preciso tener un listado de toda la población, solo de las unidades
primarias de muestreo.
2. INCONVENIENTES:
 El error estándar es mayor que en el muestreo aleatorio simple o estratificado
 El cálculo del error estándar es complejo
3. CARACTERISTICAS:

El promedio del tamaño de los conglomerados de la muestra se calcula de la siguiente manera:


𝑛
1
𝑚
̅ = ∑ 𝑚𝑖
𝑛
𝑖=1

1
El tamaño de toda la población se calcula de la siguiente manera:
𝑁

𝑀 = ∑ 𝑚𝑖
𝑖=1

No olvidar de que los parámetros marcados con “M” mayúscula se refieren a toda la
población.

El tamaño promedio de los conglomerados de toda la población se calcula de la siguiente


manera:
𝑀
̅=
𝑀
𝑁

4. ESTIMACION DE LA MEDIA

Una vez seleccionados los conglomerados a muestrear, se obtiene de cada uno su


tamaño (mi) y la suma de la variable que se desea analizar (xi). Nótese que es la suma
de las variables, no la media.

Después se suma cada una de las columnas y se aplica la siguiente ecuación:

∑𝑛𝑖=1 𝑖
=
∑𝑛𝑖=1 𝑚𝑖
Conglomerado mi xi
Ejemplo: 1 32 125
2 28 136
Si se cuenta con 81 conglomerados (N) y 2268 3 25 145
elementos en la población (M) 4 27 134
5 26 135
6 30 128
803
= = 4.77976 168 803
168

5. ESTIMACION DE LA VARIANZA DE LA MEDIA:

Para el cálculo de la varianza de la media es conveniente agregar dos columnas a la tabla,


en la primera se multiplica la media general por el tamaño de cada conglomerado; en la
siguiente columna se resta el total de cada conglomerado menos la columna anterior y
se eleva al cuadrado. La columna se suma.

Conglomerado mi xi 𝑚𝑖 𝑚
1 32 125 152.952 781.336
2 28 136 133.833 4.694
3 25 145 119.494 650.554
4 27 134 129.054 24.467
5 26 135 124.274 115.051 2
6 30 128 143.393 236.940
168 803 1813.042
La varianza se calcula con la siguiente ecuación:

𝑁 𝑛 ∑𝑛𝑖=1 𝑖 𝑚𝑖 )
𝑉 )=[ ]
𝑀 𝑛 1
𝑁𝑛 ( 𝑁 )

81 6 1813.042
𝑉 )=[ ] = 0.0713
2268 6 1
81 ∗ 6 ( 81 )

6. INTERVALO DE CONFIANZA PARA LA MEDIA

El intervalo de confianza para la media es la siguiente:

𝑋̅ 2√𝑉 ) < 𝜇 < 𝑋̅ + 2√𝑉 )

4.77976 2√0.0713 < 𝜇 < 4.77976 + 2√0.0713


4.24 < 𝜇 < 5.31

7. TAMAÑO DE LA MUESTRA PARA ESTIMAR LA MEDIA

Para realizar los cálculos es necesario encontrar la varianza del total en la muestra

con la siguiente ecuación:

∑𝑛
𝑖=1 𝑥𝑖 −𝑥𝑚𝑖 )
2 1813.042
𝑠𝐶 = = =362.6084042
𝑛−1 6 1

Se determina el error máximo que se permite en los resultados. A este valor se le llamará
E. Las ecuaciones para encontrar el tamaño de la muestra son las siguientes:

𝐸 𝑀̅
𝐷=
4

𝑁𝑠2𝐶
𝑛=
𝑁 𝐷 + 𝑠2𝐶
3
Si E=0.4

2268
0.4 )
81
𝐷= = 31.36
4
81 ∗ 362.60840422
𝑛= = 10.11 ≈ 10
81 ∗ 31.36 + 362.60840422
El resultado es el número de conglomerados que se deben muestrear. El resultado se
redondea al entero superior.

EJEMPLO:

Se desea conocer las ganancias por cabeza de las familias de una provincia. Las familias viven
en las casas habitacionales y éstas casa están situadas en 415 manzanas dentro de la provincia.

El objetivo es obtener, en base a un muestreo científico información al respecto. Es claro que


el tipo del diseño muestral adecuados para esta situación por el rasgo del arreglo espacial de
tipo agregada sería el muestreo conglomerado (Bellhouse & Rao, 1975; Cochran, 1946;
Buckland, 1951)

Procedimiento: De forma al azar se seleccionan 10 manzanas del total de las manzanas del
municipio y se arrojan los siguientes datos (Tabla 1). Además, los tamaños óptimos de la
muestra (n optimo) para el muestreo conglomerado en función de diferentes valores de “L” se
indican en la Tabla:
Manzana N° de adultos Ingreso total
(ni) (mi) /manzana (yi)
𝑚𝑖 𝑖 𝑖 ∗ 𝑚𝑖
1 8 96 1 9216 768
2 12 121 4 14641 1452
3 4 42 9 1764 168
4 5 65 16 4225 325
5 6 52 25 2704 312
6 6 40 36 1600 240
7 7 75 49 5625 525
8 5 65 64 4225 325
9 8 45 81 2025 360
10 3 50 100 2500 150
55 64 651 385 48525 4625

a. Encontrar los límites para la estimación de la media poblacional al 95%


b. Determine un tamaño de muestra, con un error de 0.2 más de lo obtenido en a.

8. ESTIMACION DEL TOTAL POBLACIONAL:

Para estimar el total poblacional 𝜏 es ahora 𝑀𝜇, porque 𝑀, denota el número total
de elementos en la población. Por ende, como el muestreo aleatorio simple, 𝑀
proporciona un estimador de 𝜏

4
Estimador del total poblacional 𝝉:
∑𝑛𝑖=1 𝑖
𝑀 =𝑀
∑𝑛𝑖=1 𝑚𝑖

̅:
Varianza estimada de 𝑴𝒙

𝑁 𝑛 ∑𝑛=1 ̅ 𝑚 )2
𝑉̂ 𝑀 ) = 𝑀 𝑉̂ )=𝑁 ( )
𝑁𝑛 𝑛 1

Límite para el error de estimación:

𝑁 𝑛 ∑𝑛=1 ̅ 𝑚 )2
𝐸 = 𝑍1−𝛼⁄ √𝑉̂ 𝑀 ) = 𝑍1−𝛼⁄ √𝑁 ( )
𝑁𝑛 𝑛 1

Límites de estimación para 𝝉:

𝜏±𝐵

Se debe de observar que el estimador 𝑀 es útil únicamente si se conoce el número


de elementos 𝑀 en la población.

Frecuentemente el número de elementos en la población no es conocido, entonces


el estimador que no dependa de 𝑀, se usará el siguiente estimador:

𝑛
1
𝑡 = ∑ 𝑖
𝑛
𝑖=1

Donde 𝑡 es el promedio de los totales de conglomerados para los n conglomerados


muestreados. Por lo que 𝑁 𝑡 , es un estimador insesgado del total poblacional 𝜏

Estimador del total poblacional 𝝉, que no dependa de 𝑴


𝑛
𝑁
𝑁 𝑡 = ∑ 𝑖
𝑛
𝑖=1

̅:
Varianza estimada de 𝑵𝒙

𝑁 𝑛 ∑𝑛=1 𝑡)
2
𝑉̂ 𝑁 𝑡 ) = 𝑁 𝑉̂ 𝑡) = 𝑁 ( )
𝑁𝑛 𝑛 1

Límite para el error de estimación:


5
𝐸 = 𝑍1−𝛼⁄ √𝑉̂ 𝑁 𝑡 )

El intervalo de confianza para el total es la siguiente:

𝜏̂ 𝑧√𝑉 𝜏̂ ) < 𝜏 < 𝜏̂ + 𝑧√𝑉 𝜏̂ )

Si t= 119130 y 𝑉 𝜏̂ ) = 5280500.8; hallar el intervalo de confianza al 95.5%

9. TAMAÑO DE MUESTRA PARA EL TOTAL POBLACIONAL

La varianza del total permitirá establecer el intervalo de confianza. Para calcular la


varianza del total se debe calcular la varianza de cada estrato con las siguientes
fórmulas.

𝑁 𝜎2𝐶
𝑛=
𝑁 𝐷 + 𝜎2𝐶
Donde 𝜎𝐶 , es estimada por 𝑆𝐶

𝐸
𝐷=
4𝑁
∑𝑛𝑖=1 𝑖 𝑚𝑖 )
𝑆𝑐 =
𝑛 1
10. ESTIMACION DE UNA PROPORCIÓN POBLACIONAL:

El estimador de la proporción poblacional 𝑝 es la proporción muestral 𝑝̂ . Sea 𝑎𝑖 el número


total de elementos en el conglomerado i que poseen la característica de interés. Entonces,
la proporción de elementos en la muestra de n conglomerados que poseen la característica
de interés es dada por
∑𝑛𝑖=1 𝑎𝑖
𝑝̂ =
∑𝑛𝑖=1 𝑚𝑖

Donde 𝑚𝑖 es el número de elementos en el é𝑠 𝑚𝑜 conglomerado, = 1,2, … . , 𝑛.

Nótese que 𝑝̂ tiene la misma forma de , donde 𝑖 es reemplazado por 𝑎𝑖 . La varianza


estimada de 𝑝̂ es similar a la de

Estimador de la proporción poblacional p:

6
∑𝑛𝑖=1 𝑎𝑖
𝑝̂ =
∑𝑛𝑖=1 𝑚𝑖

Varianza estimada de 𝑝̂ :

𝑁 𝑛 ∑𝑛𝑖=1 𝑎𝑖 𝑝̂ 𝑚𝑖 )
𝑉̂ 𝑝̂ ) = [ ]
̅
𝑁𝑛𝑀 𝑛 1

Límite para el error de estimación:

𝑁 𝑛 ∑𝑛=1 𝑎 𝑝̂𝑚 )2
𝐸 = 𝑍1−𝛼⁄ √𝑉̂ 𝑝̂) = 𝑍1−𝛼⁄ √[ ]
̅2
𝑁𝑛𝑀 𝑛 1

Esta fórmula sirve cuando n es grande n≥20

11. TAMAÑO DE MUESTRA PARA LA ESTIMACION DE PROPORCION

La estimación de la proporción poblacional 𝑝, con un límite de E unidades para el error


de estimación, implica que

𝐸 = 𝑍1 ̂
𝛼⁄ √𝑉 𝑝̂ )
2

Esta ecuación puede ser resulta para n y la solución es similar a:

𝑁 𝜎2𝐶
𝑛=
𝑁 𝐷 + 𝜎2𝐶
Donde

𝐸 𝑀̅
𝐷=
4
Y 𝜎𝐶 es estimada por;

∑𝑛𝑖=1 𝑎𝑖 𝑝̂ 𝑚𝑖 )
𝑆𝑐 =
𝑛 1

EJEMPLO:

La siguiente información es el resultado de la encuesta, respecto a si son dueños o no


de las residencias donde viven. Estimar la proporción de residentes que viven en casas
7
alquiladas, establezca los límites para el error de estimación y sus límites de estimación
a un nivel de confianza al 95%

N° residentes N° arrendatarios N° residentes N° arrendatarios


Conglomerado Conglomerado
(mi) (ai) (mi) (ai)

1 8 4 14 10 5
2 12 7 15 9 4
3 4 1 16 3 1
4 5 3 17 6 4
5 6 3 18 5 2
6 6 4 19 5 3
7 7 4 20 4 1
8 5 2 21 6 3
9 8 3 22 8 3
10 3 2 23 7 4
11 2 1 24 3 0
12 6 3 25 8 3
13 5 2

5 5

∑ 𝑚𝑖 = 151 ∑ 𝑎𝑖 = 72
𝑖=1 𝑖=1
5 5 5

∑𝑎 𝑖 = 262 ∑𝑚 𝑖 = 1047 ∑ 𝑎𝑖 𝑚𝑖 = 511


𝑖=1 𝑖=1 𝑖=1

Вам также может понравиться