Вы находитесь на странице: 1из 9

143

DISEO Y CONSTRUCCIN DE MARCOS DE


MUESTREO PARA LAS ENCUESTAS DE HOGARES

DEPARTAMENTO ADMINISTRATIVO NACIONAL DE ESTADSTICA (DANE)


COLOMBIA

144

Diseo y construccin de marcos de muestreo...

NDICE
Pgina

Introduccin.................................................................................................................................... 145
I.-

Antecedentes ........................................................................................................................ 145

II.-

Ampliacin de la Muestra Maestra ...................................................................................... 145

III.-

Sistema de Informacin Geoestadstica ............................................................................... 149

Diseo y construccin de marcos de muestreo...

145

Introduccin
A continuacin se presentan los principales aspectos referentes a la experiencia de Colombia en la
utilizacin de los censos de poblacin como insumo principal en la construccin de los marcos de
muestreo para las encuestas a hogares, vale decir, Encuesta Continua de Hogares, Encuesta de Calidad de
Vida, Encuesta de Ingresos y Gastos y Encuesta de Trabajo Infantil. Tambin se hace una explicacin de
la ampliacin de la muestra maestra de propsitos mltiples del 2001 as como de todos los aspectos
cartogrficos relacionados con la construccin de las unidades secundarias de muestreo como parte
fundamental en su implementacin.
I. Antecedentes
Hasta la fecha se han realizado l6 censos nacionales de poblacin y cinco de vivienda. El ltimo de ellos
en el ao de 1993 y se tiene programado para el 2003 la realizacin del XVII Censo Nacional de
Poblacin y VI de vivienda. El marco de muestreo utilizado actualmente corresponde al generado
precisamente con base en el censo del ao 1993. Con este marco se realizaron las encuestas de Calidad de
Vida de 1997 y las encuestas de hogares para la medicin de la fuerza laboral, as como la Encuesta de
Trabajo Infantil para el ao 2001 y 2002 y el Observatorio de Seguridad para la ciudad de Barranquilla.
El mayor uso es el dado a la Encuesta Continua de Hogares, donde se mide la fuerza laboral. El
sistemtico perfeccionamiento de su metodologa y esquemas operativos ha sido una constante en los
ltimos aos. En 1996 1997 se realizaron importantes innovaciones: se aument el tamao de la
muestra para incrementar la precisin de las estimaciones; se ajust la distribucin departamental, la de
las grandes ciudades y la regional, para garantizar un error de muestreo similar para estos niveles de
desagregacin, en los indicadores mas importantes, se incorporaron los materiales de la muestra diseada
para la evaluacin de cobertura del censo 93, que por su diseo, tamao y estructura poda ser utilizada
con el carcter de muestra maestra.
En 1998, en atencin a las recomendaciones del seor Ralph Hussmans, Experto en Estadsticas
Laborales de la OIT, se inici el proceso de conversin de la Encuesta Nacional de Hogares ( ENH) de
una investigacin transversal, con medicin trimestral de los indicadores de empleo, a una de tipo
continuo, para una captacin del comportamiento integral de los fenmenos laborales, durante todo el
ao. La primera etapa de conversin, llevada a cabo exitosamente, comenz en la primera semana de
1999 con un esquema de semanalizacin de la muestra y de la encuesta trimestral de Hogares de Bogot,
D.C., paralelo al de la encuesta transversal tradicional al cual se incorporaron en el segundo semestre
Medelln, Cali, Barranquilla y Bucaramanga.
Desde la primera semana del ao 2000 se agregaron a la fase experimental continua las restantes grandes
ciudades y reas metropolitanas de la Encuesta transversal trimestral y se continu, al mismo tiempo, con
la encuesta transversal. La simultaneidad de los esquemas continuo y trasversal, se mantuvo durante todo
este ao.
En enero del 2001 se dio inicio a la encuesta continua para el resto urbano y la zona rural con submuestras
replicadas mensuales del diseo construido a partir de la muestra maestra de este resto de pas.
Finalmente a partir de este ao entr en plena vigencia y de manera oficial la Encuesta Continua de
Hogares.
II. Ampliacin de la Muestra Maestra
Debido a que cada vez se hace mas evidente el requerimiento de los usuarios de la informacin de las
encuestas de hogares por muestreo, de estimaciones con el mximo de desagregacin geogrfica posible,
se requiri del diseo de una gran muestra que tuviese gran flexibilidad en la planeacin del tamao y
caractersticas de las muestras especficamente requeridas por las diversas investigaciones nacionales del
pas, as como la posibilidad de acumulacin de resultados de varios estudios que tengan componentes o

146

Diseo y construccin de marcos de muestreo...

mdulos similares y que hayan sido realizados simultneamente. Es as como la muestra diseada para la
realizacin de la Encuesta Postcensal de Cobertura del Censo de Poblacin y Vivienda del 93, se dise
con el carcter de Maestra y se implement para la Encuesta Nacional de Hogares . En el 2001 se realiz
una ampliacin de esta muestra maestra bajo las siguientes consideraciones:
!

Definicin integral del tamao y composicin de la muestra que sera utilizada en los prximos
aos, con el fin de permitir la planeacin de materiales y operaciones ms eficientes y baratos, de
garantizar una mejor calidad y precisin de los resultados, y de permitir la confiable comparacin y
seguimiento de los indicadores generados a travs del tiempo. Los clculos para la estimacin anual
de los indicadores laborales a nivel departamental, sealan un requerimiento aproximado de 9,000
segmentos; un esquema de rotacin a tres aos, eleva esta cifra a alrededor de 27,000 segmentos. Los
estudios coyunturales podran exigir entre 500 y 2,5000 segmentos cada uno.

Ampliacin del nmero de estratos y unidades primarias de muestreo (UPM) para poder
completar 12 submuestras nacionales replicadas (una por mes), y para facilitar la eventual obtencin
de indicadores departamentales. Se completaron 205 UPM (con 244 mpios.), frente a 165 existentes,
(con 166 mpios.), con un total de 228 estratos (algunas UPM grandes tienen 2 o 3 estratos).
Consiguientemente, se reestructur toda la actual estratificacin, con base en la ltima informacin
disponible sobre las variables de clasificacin (Censo 93 y sus proyecciones). Las 13 grandes
ciudades con sus reas metropolitanas, no estn contempladas en esta reestructuracin, pues
son autorrepresentadas .
El nmero 228 es modular no slo para la conformacin de las 12 submuestras replicadas mensuales
de 19 estratos cada una, sino que permite la conformacin de otro conjunto de clasificaciones o
submuestras nacionales replicadas para los estudios coyunturales: 4 submuestras de 57 UPM cada
una y 3 submuestras de 76 UPM cada una. Estas clasificaciones permiten, a su vez, ofrecer un
variado men de submuestras nacionales de la siguiente magnitud, segn el nmero de hogares
requeridos:
Requerimiento muestral de un estudio en
particular
N de Estratos
Segmentos
Hogares
(10 a 20 por estr.)
570 1,140
5,700 11,400
57
760 1,520
7,600 - 15,200
76
1140 2,280
11,400 22,800
114
1520 3,040
15,200 30,400
152
1,710 3,420
17,100 34,200
171

N de Submuestras
combinadas
1
1
2 (de 57 UPM)
2 ( de 76 UPM)
3 ( de 57 UPM)

La decisin del nmero de segmentos por estrato, dentro del rango, depender de consideraciones
operativas, de costo y sobre el efecto esperado de los conglomerados (Deff).
!

Mantenimiento de buena parte de las UPM de la muestra actual, para poder seguir utilizando los
materiales muestrales disponibles, y el pertinente ajuste de las probabilidades de seleccin y de los
factores bsicos de expansin. De las 205 UPM de la nueva muestra, 129 (63%) son de la muestra
vigente (Cuadro 1).

Actividades
Las actividades realizadas para la ampliacin de la muestra comprenden:
1.

Redefinicin de las Unidades Primarias de Muestreo (UPM). Se estableci un tamao poblacional


total mnimo de 3,000 habitantes, y de 2000 habitantes en la cabecera municipal, para poder generar

Diseo y construccin de marcos de muestreo...

147

los segmentos muestrales requeridos por las encuestas del prximo futuro. Integracin con UPM
vecinas de similares caractersticas de las que no cumplan los anteriores requisitos.
2.

Revisin de las variables de estratificacin con base en la ms reciente informacin disponible, y


verificacin de que las variables confirmadas tuvieran la menor correlacin entre s.
Confirmacin como variables claves de: Regin, departamento, tamao del estrato, poblacin total
de cada UPM, proporcin cabecera -resto y proporcin con necesidades bsicas insatisfechas (NBI).

3.

Elaboracin de 228 estratos aplicando como herramienta de gran ayuda para su optimizacin el
procedimiento Clusters del paquete SAS.

4.

Actualizacin de los parmetros del clculo del tamao muestral. Verificacin del efecto de los
conglomerados en el diseo (deff), con base en los resultados de las etapas 105 y 109 de la Encuesta
Nacional de Hogares (ENH). Utilizacin, como medida de seguridad, del deff ms alto observado en
cada departamento. Cuantificacin del aporte en la varianza total de las estimaciones, de la varianza
inter e intra UPM.

5.

Realizacin de clculos exploratorios de tamao de muestra a nivel departamental para estimaciones


puntuales de los indicadores de inters, particularmente de la tasa de desempleo, con diferentes
alternativas de precisin (ESrel = 0.01 a 0.12), y para la estimacin de cambios en el tiempo de tales
indicadores (cambios de 0.5, 1.0 y 1.5 puntos porcentuales).

6.

Adopcin de tamaos muestrales gua para la orientacin del subsiguiente trabajo, as:
! 2,400 segmentos anuales (es la cifra actualmente vigente y no incluye grandes ciudades), o sea
200 segmentos mensuales para apoyar la ECH en su versin 2001-2002. Cada segmento tiene en
promedio 10 hogares.
! 9,600 segmentos anuales, que es cuatro veces la cifra anterior, lo cual significa 800 segmentos
mensuales, para permitir la estimacin del desempleo anual, por departamento, con un ESrel =
0.04 0.05
! 38,400 segmentos totales; 28,800 de ellos para permitir la rotacin anual completa de los 9,600
segmentos por un lapso de tres aos, y otros 9,600 para facilitar hasta tres estudios coyunturales
en el mismo ao, cada uno con un requerimiento hasta de 2,400 segmentos.
Las cifras anteriores son ajustables, por supuesto, ante un raciocinio diferente por parte del equipo
directivo del DANE.

7.

Clasificacin de los 228 estratos en que est dividido el pas en 12 subgrupos replicados de 19
estratos, es decir, idnticos desde el punto de vista de las variables de estratificacin. La
metodologa garantiza ptima representatividad nacional de cada uno de los subgrupos replicados,
separadamente, a travs de las UPM que los representa. Hablamos entonces de 12 submuestras
replicadas, para las encuestas mensuales de la Encuesta Nacional de Hogares.
Para esta clasificacin se aplic la tcnica de Seleccin Controlada (Goodman y Kish, 1950) que,
en este caso, optimiza la balanceada composicin de las submuestras, vale decir, minimiza la
varianza intersubmuestra, y maximiza la varianza intrasubmuestra (lo contrario de la estratificacin).
Conviene aclarar que esta tcnica, diseada para optimizar el efecto de la estratificacin (reducir el
error de muestreo, minimizando varianza intra estrato y maximizando varianza inter estrato), se
adapt en este caso para producir el efecto contrario.

8.

Distribucin de los 2,400 segmentos financiados de la muestra anual actual de la ENH, en 12


paquetes, con la siguiente secuencia:
! Distribucin del total de segmentos (2,400) en los 23 departamentos. Los 81 segmentos rurales
de las 13 grandes ciudades se incluyeron en esta distribucin. La distribucin se hizo en funcin

148

Diseo y construccin de marcos de muestreo...

del mismo Error Estndar Relativo (coincidi un ESrel = 9 10%), para fenmenos laborales con
una probabilidad de ocurrencia de p = 0.10.
! Distribucin por UPM de la muestra maestra de los segmentos de cada departamento,
proporcionadamente a la poblacin de los estratos respectivos, y distribucin cabecera resto en
cada UPM, conforme a la composicin de sus estratos. Con este procedimiento se garantiz
probabilidad igual en todos los segmentos y hogares de cada departamento.
! Posterior redondeo en 200 de los segmentos resultantes en cada una de las submuestras nacionales
de UPM, proporcionalmente al tamao de los estratos respectivos. Dichos segmentos resultantes
de la distribucin del paso anterior fluctuaron ligeramente alrededor de 200 en las 12
submuestras. La igualacin en 200 tiende a generar similar error de muestreo en las submuestras
para fenmenos de la misma probabilidad de ocurrencia, con las consiguientes ventajas
adicionales para la planeacin e implementacin de los operativos de campo mensuales.
9.

Construccin del Marco de Muestreo de las Unidades Secundarias en los municipios seleccionados
diferentes a los Autorepresentados: Decisin estructurada sobre los procesos de seleccin y
segmentacin de las Unidades Terciarias de Muestreo (UTM), correspondientes a secciones o
sectores censales. Para las zonas rurales, el DIG (Direccin de Informacin Geoestadstica del
DANE-) hace la segmentacin sobre fotos areas ampliadas, utilizando tanto lo observado en dichas
fotos como la clasificacin catastral sobre uso de las edificaciones (vivienda u otro fin); para las
zonas urbanas, las regionales del DANE hacen el listado y segmentacin de las manzanas
seleccionadas por el Equipo de Diseos Muestrales, sobre el material geogrfico generado por DIG.
La siguiente es la secuencia del trabajo:
! Verificacin de que las secciones censales (o sectores ) tengan entre 120 y 200 viviendas (160 en
promedio), es decir, 4 Medidas de Tamao (MT) de 40 hogares en promedio, por cada segmento
a ser seleccionado, para garantizar el mximo tamao potencial previsto en la muestra maestra. Si
en un sector slo se va a seleccionar un segmento, o ya existe seleccionado uno, su tamao debe
ser mnimo de 16 MT, si se van a seleccionar 2 MT, debe tener un mnimo de 32 MT, y as
sucesivamente. Si no se cumple este requisito, se deben juntar los sectores o secciones
insuficientes, con sectores o secciones vecinos.
! En las nuevas UPM, o en los procesos de ampliacin de la muestra de las UPM antiguas,
seleccionar tantos sectores o secciones (la mxima desagregacin existente) como nuevos
segmentos se requieran con probabilidad proporcional al nmero de MT existentes.
! En los sectores o secciones seleccionados, identificacin del nmero de MT existentes (de x =
40 hogares). En las zonas urbanas realizar esta identificacin a nivel de manzana. Las manzanas
que no tengan una MT, por lo menos, se juntarn con una vecina de la misma seccin. Aunque se
espera que las secciones rurales tengan por lo menos una MT, las que no cumplan con este
requisito deben integrarse con una contigua.
! Disear una instruccin de submuestreo para los nuevos sectores o secciones seleccionados. Para
los sectores urbanos, seleccin sistemtica, con un intervalo constante, de tal manera que el
nmero de seleccin resultante de la aplicacin del intervalo de muestreo, identifique
directamente la manzana (o manzanas colapsadas) seleccionadas. Estas reas ltimas
muestreadas, cada una de las cuales contiene por lo menos una MT con un promedio de 40
hogares, son las que deben ser visitadas por el personal de las regionales, para su listado y
particin en segmentos de 10 hogares en promedio. Finalmente, asignacin aleatoria del orden en
que sern utilizados esos segmentos.
Para las zonas rurales, subdivisin de los sectores en tantas partes como medidas de tamao
existentes, submuestreo aleatorio de una de ellas, particin en segmentos de 10 viviendas en
promedio, y asignacin aleatoria del orden en que van a ser utilizados en las prximas encuestas.

Diseo y construccin de marcos de muestreo...

149

10. Construccin del Marco de Muestreo de las Unidades Secundarias en los municipios
Autorepresentados: Las ciudades que se venan trabajando en la Encuesta de Hogares Tradicional, se
introdujeron en la muestra como ciudades autorrepresentadas con las cuales se siguen dando
estimaciones de las variables de inters de acuerdo a la periodicidad establecida. Para la
estratificacin y seleccin de la muestra, las reas geogrficas de estas ciudades con sus reas
metropolitanas se organizaron, segn los principios cartogrficos establecidos, en sectores, secciones
y manzanas, definidos as:
Sector: es un rea cartogrfica delimitada, compuesta por secciones y manzanas; lo conforman
uno, dos o ms barrios o urbanizaciones, aunque se encuentran casos en que el sector est
circunscrito a una parte de un barrio grande.
Seccin. Es una subdivisin del sector equivalente a 18 manzanas aproximadamente en la
parte urbana
Manzana. Lote de terreno edificado o sin edificar, delimitado por vas de trnsito vehicular o
peatonal de carcter pblico, es decir por calles, carreras, diagonales, transversales, avenidas o
pasos peatonales. Una manzana puede estar delimitada igualmente por un ro, una quebrada o
un canal siempre y cuando estos elementos sean de carcter permanente y se localicen
fcilmente en campo.
Al marco de muestreo, con la informacin del nmero de viviendas a nivel de manzana se le adicion el
archivo con la estratificacin realizada por cada municipio, con base en la "Metodologa de la
estratificacin de viviendas urbanas en los municipios" con la cual se estratifican las manzanas en 6
estratos socioeconmicos teniendo en cuenta los siguientes factores:
Caractersticas fsicas de las viviendas.
Disponibilidad de servicios pblicos domiciliarios.
Estado de las vas adyacentes y dems elementos de la infraestructura.
Facilidades recreacionales y zonas verdes.
Naturaleza y calidad de los medios de transporte.
Uso y concentracin comercial.
Como insumo del XVI Censo Nacional de Poblacin y V de Vivienda, realizado en 1993, se obtuvo el
marco de muestreo en el cual esta consolidado el total de personas, hogares y viviendas a nivel de
manzana para las cabeceras municipales y a nivel de sector cartogrfico para la parte resto del municipio.
Las variables de identificacin que componen estos archivos llamados VIHOPE (viviendas, hogares y
personas) son: Departamento, municipio, clase, sector rural, localidad, sector urbano, seccin, manzana,
viviendas.
El marco permite tener la informacin a un nivel de agregacin mayor como lo es el municipio con lo
cual se trabaja en la primera etapa de seleccin de la Muestra Maestra
III. Sistema de Informacin Geoestadstica
El marco de muestreo est soportado sobre la cartografa utilizada para la realizacin del XVI Censo
Nacional de Poblacin y V de Vivienda de 1993, donde el DANE consciente de la importancia de contar
con una base cartogrfica actualizada y aprovechando las posibilidades ofrecidas por la tecnologa, llev a
cabo el Proyecto de Actualizacin y Sistematizacin de la Cartografa Censal, cuyo objetivo fue
actualizar la cartografa censal, para satisfacer los requerimientos censales y estadsticos post-censales de

150

Diseo y construccin de marcos de muestreo...

la Entidad, as como ofrecer la posibilidad de asociar informacin estadstica a la informacin geogrfica,


mediante la conformacin del DIG1.
El desarrollo del Proyecto inici con la digitalizacin de la informacin bsica de la cartografa rural, para
lo cual se utiliz como base la cartografa del IGAC2, escala 1:25.000 en el 51.19% del rea total del
territorio nacional, 1:50.000 en el 9.13% y 1:200.000 en el 30.53%. Esta captura se realiz por planchas y
se capturaron cuatro niveles de informacin bsica: ros, vas, curvas de nivel y toponimia. El trabajo de
actualizacin en las reas rurales se realiz mediante la georreferenciacin de puntos de referencia3 y vas,
verificacin de nombres de ros y quebradas, verificacin de la existencia de centros poblados,
actualizacin de los tipos de vas y ajustes a la sectorizacin censal, la cual previamente haba sido
delimitada sobre la cartografa base (trabajo de oficina), garantizando que los sectores censales
correspondieran a lmites identificables en el terreno.
Para las reas urbanas se tom como base la cartografa ms actualizada, la cual poda corresponder a
planos producidos por las oficinas de Planeacin a nivel municipal y/o departamental, por el IGAC y/o
DANE. Adicionalmente, se agregaron las novedades encontradas, mediante la realizacin de
levantamientos topogrficos con brjula y cinta, la verificacin y complementacin de nomenclatura vial
y de sitios de inters. Para aquellas cabeceras municipales y/o centros poblados que no tenan plano base,
se elabor el plano respectivo, mediante un levantamiento topogrfico y la correspondiente
georreferenciacin4.
El trabajo inicial de captura de la informacin bsica del rea rural y urbana, se realiz durante los aos
1992 y 1993, en los aos posteriores se realiz el empalme, complementacin y estructuracin topolgica
de la cartografa bsica complementaria, as como la definicin de la estructura para el almacenamiento
de la informacin dentro de una base de datos, la estructuracin y adecuacin del marco geoestadstico
nacional.
Lo anterior le permite al DANE y al pas contar hoy con el marco geoestadstico nacional y una
informacin cartogrfica de referencia para las reas urbanas y rurales del territorio nacional, que se
encuentran digitalizados y estructurados topolgicamente, para permitir su organizacin dentro de una
base de datos grfica, facilitando los procesos de actualizacin y mantenimiento de dicha informacin, a
travs de operativos de campo, la generacin de productos derivados, y la integracin con la informacin
estadstica que produce la Entidad, dentro del Sistema de Informacin Geoestadstica, tal que facilite el
desempeo de las diferentes tareas y procesos tendientes a generar la informacin estadstica estratgica
del pas.
El Marco Geoestadstico Nacional, es un sistema diseado para referenciar correctamente la informacin
estadstica con los lugares geogrficos correspondientes. Esta constituido por la divisin poltico
administrativa, departamentos, municipios, y sectores geogrficos definidos con fines estadsticos, los
cuales se encuentran delimitados principalmente por accidentes naturales identificables en terreno. Su
actualizacin y mantenimiento permanentes son de gran relevancia para garantizar la permanencia en el
tiempo del Sistema, as como su funcionalidad.
El Marco Geoestadstico, se encuentra complementado con informacin cartogrfica bsica para cada
municipio, tanto para las reas urbanas (cabeceras municipales y centros poblados) y rurales. Para las
cabeceras municipales y centros poblados la cartografa se encuentra en escala 1:5000 con informacin
hasta nivel manzana, incluyendo sitios de inters y nomenclatura vial. Para las zonas rurales se cuenta
con informacin bsica de ros, vas, toponimia y curvas de nivel, tomada de la base IGAC.
1

DIG Direccin de Informacin Geoestadstica


Instituto Geogrfico Agustn Codazzi
Corresponden a sitios de inters locales que facilitan la orientacin y ubicacin en campo, tales como: Fincas, peajes, escuelas, puestos de salud,
estaciones de servicio, instalaciones agroindustriales, iglesias, restaurantes y hoteles entre otros.
4
Esta georreferenciacin se hizo utilizando GPS, Sistema de Posicionamiento Global, con el fin de asignar las correspondientes coordenadas
espaciales.
2
3

Diseo y construccin de marcos de muestreo...

151

La base de datos grfica del sistema contiene el marco geoestadstico nacional, es decir, cuenta con los
lmites de todos los departamentos y municipios del territorio nacional, adems de la identificacin de
todas las cabeceras municipales y de los centros poblados5; para stos ltimos se cuenta con informacin
cartogrfica hasta nivel manzana. Lo anterior permite realizar consultas que involucran la combinacin de
datos fsicos de la zona y su correspondiente informacin estadstica. Por ejemplo, teniendo la
localizacin de las fuentes para la Encuesta de Comercio y conociendo el nmero de encuestadores
disponibles, se puede hacer la organizacin de las correspondientes rutas para la entrega y recoleccin de
los formularios. Otro ejemplo, puede ser el de las citaciones para los empadronadores el da del Censo
Nacional, a los cuales se les asignan reas de trabajo prximas a sus lugares de residencia.

Centro poblado, se refiere a los caseros, inspecciones de polica y corregimientos pertenecientes al rea rural del municipio y que estn
conformados por 20 o ms viviendas contiguas o adosadas

Вам также может понравиться