You are on page 1of 14

273

METODOLOGA PARA LA INTEGRACIN DE BASES


DE DATOS DE ENCUESTAS DE HOGARES

INSTITUTO NACIONAL DE ESTADSTICA (INE)

VENEZUELA
274 Metodologa para la integracin de bases de...

NDICE

Pgina

1. Aspectos Institucionales....................................................................................................... 275


2. Aspectos Generales.............................................................................................................. 275
Encuesta de hogares por muestreo ...................................................................................... 276
3. Aspectos Computacionales de la EHM................................................................................ 277
3.1 Estrategia para la captura de datos .............................................................................. 277
3.1.1 Centralizacin de los procesos ......................................................................... 277
3.1.2 Crtica y codificacin de la planilla.................................................................. 278
3.1.3 Captura de datos ............................................................................................... 279
3.1.3.1 Diseo de estructura de datos............................................................. 279
3.1.3.2 Desarrollo de la aplicacin ................................................................. 280
3.1.3.3 Requerimiento de hardware y software.............................................. 283
3.1.3.4 Justificacin para el desarrollo del sistema de captura ...................... 283
3.2 Procedimientos para evaluar la consistencia de la informacin.................................. 283
3.2.1 Validacin......................................................................................................... 283
3.3 Procesamiento de las bases de datos ........................................................................... 284
3.3.1 Software utilizados y desarrollo del mismo ..................................................... 284
3.3.2 Clculo de los factores de expansin ............................................................... 284
3.3.3 Generacin de tabulados................................................................................... 284
3.4 Imputacin de datos..................................................................................................... 285
3.5 Integracin de variables............................................................................................... 285
3.6 Integracin de archivos de datos ................................................................................. 285
3.7 Polticas institucionales de acceso a la base de datos ................................................. 286
Metodologa para la integracin de bases de... 275

1. Aspectos Institucionales
La Direccin de Estadsticas Sociales y Ambientales, dentro del INE, tiene como misin, garantizar que
se efecten los diseos de investigaciones estadsticas en el rea social, demogrfica y ambiental, as
como, las proyecciones, predicciones y anlisis estadstico que corresponda al INE y velar porque los
diseos de las investigaciones que se realizan en otros rganos del Sistema Estadstico Nacional se
efecte en concordancia con el Plan Estadstico de la nacin.
El Programa Sistema de Encuestas a Hogares, adscrito a la DESDA , es el encargado de velar por la
armonizacin conceptual y metodolgica de las Encuestas a Hogares del Sistema Estadstico Nacional,
mediante la accin coordinada con las distintas instancias implicadas; en este programa se ubica la
Unidad de Consolidacin y Consistencia de Resultados, encargada de garantizar la ejecucin de la fase
relativas a la integracin, consolidacin y procesamiento de los datos de cada una de las encuestas del
Sistema.

Instituto Nacional de Estadstica

Direccin de Estadsticas Sociales Demogrficas y Ambientales

Programa Sistema de Encuestas a Hogares

Unidad de consolidacin y Consistencia de


Resultados

2. Aspectos Generales
Las Encuestas que integran actualmente el Programa de Sistemas de Encuestas a Hogares las podemos
clasificar en:
! Encuestas Continuas: Encuestas que manejan variables susceptibles de modificaciones
significativas en corto plazo o variables coyunturales.
! Encuestas no peridicas y complementarias: Que incluyen temas de inters para el diseo de
polticas econmicas y sociales a ser estudiadas, peridicas o eventualmente.
276 Metodologa para la integracin de bases de...

Encuestas Continuas Encuesta de Hogares por Muestreo

Encuesta de Presupuesto Familiar (Proyecto 2004)


Encuesta de Atencin a la Infancia (1998)
Encuestas Peridicas/ Encuesta de Educacin (Actual)
Complementarias Encuesta Social (Proyecto 2004)
Encuesta de Informalidad
Encuestas MICS
Encuesta de Poblacin y Familia

Encuesta de hogares por muestreo


Es una encuesta peridica, que se realiza en el pas de forma ininterrumpida desde el ao 1967, y
genera informacin sobre el tamao de la Fuerza de Trabajo, proporcionan cifras relativas al
desempleo y dems aspectos inherentes al mercado de trabajo venezolano, cubriendo las demandas
de informacin, tanto a nivel nacional como internacional.
La Encuesta de Hogares por Muestreo constituye la principal fuente de datos que alimenta el Sistema
de Encuestas a Hogares, dado la informacin que registra y la periodicidad con que se recoge y
procesa la data.

Periodicidad Semestral

Caractersticas de la vivienda
Caractersticas del hogar
Encuesta de Hogares Caractersticas de la familia
Caractersticas Demogrficas
Caractersticas de la poblacin
Variables econmicamente activa
Investigadas Caractersticas de la poblacin
econmicamente inactiva

En el diseo y ejecucin de la Encuesta, participan diferentes direcciones, dentro de la estructura


organizativa del INE, a saber:
! Direccin de Diseos y Tcnicas Estadsticas (DDTE)
! Direccin de Estadsticas Sociales y Ambientales (DESA)
! Direcciones Estadales (DE)
! Direccin de Operaciones de Encuestas (DOE)
! Direccin de Computacin (DC)
! Oficina de Promocin y Servicios de Informacin (OPSI)
Metodologa para la integracin de bases de... 277

A continuacin se presenta un diagrama donde se contemplan las 8 grandes etapas que comprenden a la
EHM y las direcciones que en cada una intervienen:

3. Aspectos Computacionales de la EHM.


Actualmente en el INE, los procesos computacionales que requiere la Encuesta de Hogares por Muestreo
para la generacin de resultados, no se encuentran integrados en un solo sistema, son aplicaciones
independientes para cada uno de los procesos, y son llevados a cabo por direcciones diferentes
dependiendo de la etapa que se ejecute.
En tal sentido el INE emprendi un Proyecto de Actualizacin y Modernizacin de la Plataforma
Informtica, cuya filosofa se basa en el rediseo y migracin de todas las aplicaciones estadsticas y
administrativas a una plataforma web. La idea fundamental consisti en la desconcentracin de los
procesos a las diferentes regiones del pas, (inicindose con el proceso de trascripcin) a fin de garantizar
la oportunidad de la informacin generada por las diferentes encuestas.
Este proyecto no ha podido ser implementado por razones presupuestarias, debido a la gran inversin
econmica para la adquisicin del Hardware y el desarrollo del Software.

3.1 Estrategia para la captura de datos


3.1.1 Centralizacin de los procesos.
Una vez diligenciados los cuestionarios en cada una de las direcciones regionales, en
donde semanalmente se ejecuta el levantamiento de la encuesta de hogares, y aplicado
los controles de calidad respectivos a los mismos, son enviados va valija a la oficina
central con sede en Caracas, para continuar con los siguientes procesos en la obtencin
de resultados de la encuesta, cabe resaltar que el nico proceso descentralizado de la
encuesta, es el levantamiento.
278 Metodologa para la integracin de bases de...

3.1.2 Critica y codificacin de la planillas


La crtica y codificacin son dos procesos que se realizan simultneamente, previos a la
trascripcin, y esta orientado a examinar los datos contenidos en las planillas para
detectar la mayor cantidad de inconsistencia, errores y omisiones que se puedan
presentar, para luego corregirlas y depurar el dato. Este proceso permite afinar la
informacin recabada en campo, sometindola a una revisin exhaustiva antes de que sea
transcrita y procesada, lo cual, garantiza la minimizacin de errores en los procesos
posteriores.
Los cuestionarios de la EHM estn diseados utilizando varios tipos de preguntas, l
respetando un orden de llenado. As, tenemos preguntas abiertas, cerradas y de
respuestas mltiples. La mayor parte del cuestionario corresponde a preguntas cerradas
donde requieren respuestas estrictamente limitadas a las categoras establecidas en ellas.
Estas categoras son identificadas a travs de un cdigo que debe ser trasladado al lugar
correspondiente, lo que llamamos, preguntas precodificadas.
Las preguntas que requieren codificacin -en estos momentos se realiza en forma
manual- son las relacionadas con los grupos de ocupacin y rama de actividad
econmica, as como el cdigo de entidades federales y pases.
Metodologa para la integracin de bases de... 279

3.1.3 Captura de datos


3.1.3.1 Diseo de estructura de datos
El Modelo lgico empleado en el sistema de captura de la EHM es de entidad-
relacin.
El sistema utiliza tres tablas de datos, una por cada unidad de anlisis de la encuesta
a saber:
! Tabla de Vivienda
! Tabla de Hogares
! Tabla de Personas

En el semestre en curso se levanta una encuesta complementaria de educacin, cuya captura


se hace en conjunto con la de la EHM, generndose una tabla adicional para dicha encuesta.
280 Metodologa para la integracin de bases de...

3.1.3.2 Desarrollo de la aplicacin


El sistema de captura fue desarrollado en Visual Basic 6.0 con el manejador de base
de datos Access 98 2000.
El sistema de captura de la EHM cuenta con el siguiente men:
Metodologa para la integracin de bases de... 281

! Encuesta: Opcion que permite transcribir las planillas de las EHM y las
complementarias cuando existan.
! Conversin de los datos: Transforma los tablas de Access a formato dbf para
su posterior manejo.
! Consolidacin de la informacin : consolida las bases de datos en una sola y
genera estructuras requeridas para el procesamiento de los datos

Pantalla de captura EHM


282 Metodologa para la integracin de bases de...

Pantalla de captura, Encuesta Complementaria de Educacin


Metodologa para la integracin de bases de... 283

3.1.3.3 Requerimiento de hardware y software.


Equipo mnimo para la instalacin del sistema
! Pentium 586
! 64 mgbyte de Ram
! Windows 95 en adelante
! Espaco en disco de 100 mgbyte
! Acces 98 0 2000
Recursos existentes para el proceso de trascripcin
! 7 Pc. Conectados en red
! 1 Pc como servidor
! 7 transcriptoras por turno
! Un supervisor de transcripcin
3.1.3.4 Justificacin para el desarrollo del sistema de captura
La EHM fue diseada de modo tal que permite, incorporar encuestas
complementarias en el momento que se estime conveniente para profundizar en
temas de inters distintos a la fuerza de trabajo, pero vinculados a los hogares, de all
la necesidad de contar con un Sistema flexible que permita la insercin al mdulo de
transcripcin de nuevas estructuras de captura de datos de esas encuestas.

3.2. Procedimientos para evaluar la consistencia de la informacin


3.2.1 Validacin
Se consideran dos niveles de validaciones:
a. Validacin en Lnea: se realiza al momento de la entrada de datos y contempla:
! Rango de datos: Valores permitidos para cada una de las variables
! Consistencia y coherencia de los datos
! Unicidad de registros
! Normalizacin de registros
b. Validacin post-captura: Se realiza una vez consolidada la data, aplicndose el
mismo plan de validacin de la captura. Los errores encontradas son corregidos
ejecutando un programa de correccin, repitindose el proceso hasta tanto quede
depurada la base de datos. Esta validacin se realiza por la limitacin que tiene el
sistema de captura de almacenar la informacin en una Base de Datos Unica durante
el proceso de entrada. La informacin es almacenada en Bases de Datos locales y
luego consolidada, mediante un proceso de respaldo y de carga de los datos.

El software para la validacin y correccin


de errores post-captura, esta desarrollado en
FoxPro
284 Metodologa para la integracin de bases de...

El flujo de los datos una vez capturados es el siguiente:

3.3 Procesamiento de las bases de datos


3.3.1 Software utilizados y desarrollo de mismo.
Los programas para el procesamiento de datos han sido desarrollados en FoxPro. El
desarrollo de los programas est a cargo de la Unidad de Consolidacin y Consistencia
de Resultados. Dado que la EHM es una investigacin estadstica, donde intervienen
factores externos, susceptibles de ser modificados en el transcurso de la misma, se
requiere un sistema flexible, para su procesamiento que permita introducir cambios en
la ejecucin de los programas empleados tantas veces sea necesario hasta tanto no se
evalen los resultados y se consideren estadsticamente satisfactorios.
3.3.2 Clculo de los factores de expansin: Una vez depurados los datos se ejecuta este
proceso, por el cual se obtiene la estimacin poblacional a partir de los resultados de la
muestra. Es un proceso completamente automatizado con un eficiente tiempo de
respuesta, donde se aplican frmulas estadsticas para los clculos y se asignan pesos a
los registros de las tablas de personas.
3.3.3 Generacin de Tabulados: El plan de tabulacin de la EHM est desarrollado en
FoxPro, ya que este software permite el procesamiento de la data, de uno o varios de
tabulados simultneamente; ya sea en forma mensual, trimestral o semestral, as como
por grupos de entidades y en tiempos muy cortos, lo que permite entregar la informacin
para su anlisis oportunamente, tambin permite la salida de los tabulados en diferentes
formatos: Excel, Lotus, ASCII, dbf, lo que le da flexibilidad al usuario para hacer sus
propios clculos en el anlisis
Metodologa para la integracin de bases de... 285

La Unidad de Consolidacin y Consistencia de Resultados, brinda apoyo tcnico al resto


de los programas de la Direccin de Estadsticas, supliendo la necesidad de informacin
de cada una de las encuestas del Sistema Encuestas a Hogares. Para tales demandas se
procesa en SPSS, a travs de ese sistema integrado se responde las solicitudes especiales
de usuales externos.

3.4. Imputacin de datos


La Encuesta de Hogares por Muestreo, no realiza imputacin de datos para la generacin de
los indicadores de la fuerza de trabajo.
Existen variables en la encuesta, donde no esta permitida la no respuesta, como los son las
variables utilizadas para los clculos de los factores de expansin (sexo y edad) y as como
las preguntas que conforman el cdigo sumario para la caracterizacin de las personas
dentro o fuera de la Fuerza de Trabajo.
Existe para cada tabulado una categora llamada No declarado donde se totaliza el
nmero de personas que no respondieron las variables involucradas en el tabulado.
Los usuarios internos de las bases de datos de la EHM, como por ejemplo, el programa
Indicadores de Condiciones de Vida desarrollan algoritmos para imputacin de valores de
la variable ingresos, se utiliza tcnicas hot- deck y el sistema integrado STATA.
3.5. Integracin de variables
Para el procesamiento de los tabulados de la EHM se incorporan a la base de datos
variables generadas por algoritmos, como lo son: el peso de cada persona, situacin de la
personas en la fuerza de trabajo, informalidad, ingresos del hogar y otras ms, quedando en
ellas de forma permanente para uso y manipulacin de los usuarios de las bases,
anexndolas y describindoles en el diccionario de las bases de datos.
3.6. Integracin de archivos de datos
Los archivos de la EHM que contienen la informacin de Vivienda, Hogares y Personas son
generadas con una periodicidad semestral en formato dbf, por lo que pueden ser ledas y
procesadas por los paquetes estadsticos, sin necesidad de ninguna transformacin.
286 Metodologa para la integracin de bases de...

3.7. Polticas Institucionales de acceso a la base de datos


El INE, adelanta un proyecto de Polticas de Difusin de Informacin donde se prev la
comercializacin electrnica de los datos. Mientras esto ocurre, los productos derivados de
la encuesta se comercializan de manera directa, a travs de la Oficina de Promocin y
Atencin al Usuario.
Existe un calendario preestablecido segn la periodicidad, de difusin de la informacin, la
cual puede ser: mensual, trimestral o semestral, estando disponibles los resultados mes y
medio luego de culminado el mes de referencia.
Los productos comercializados hasta los momentos son:
! Bases de datos Semestrales de la Encuesta de Hogares
! Libro 30 aos de la Encuesta de Hogares por Muestreo
! CD ROOm 30 aos de la Encuesta de Hogares por muestreo
! Libro Indicadores de la Fuerza de Trabajo Semestral
! Informes comparativos : Principales Indicadores de la Fuerza de Trabajo (mensual,
trimestral y semestral)
! 108 Tabulados detallados de la Encuesta de Hogares por Muestro en formato
impreso o electrnico.
Actualmente contamos con la pagina web institucional, cuya direccin de acceso es:
www.ine.gov.ve , donde se encuentran para consulta los Principales Indicadores de la
Fuerza de Trabajo segn la periodicidad disponible.
Sin embargo la informacin producida por la encuesta no se limita a la presentada en sus
publicaciones, ya que el usuario puede solicitar procesamientos especiales para la
obtencin de informacin adicional.