Вы находитесь на странице: 1из 3

TALLER DE STATA 20161

TAREA 1

Objetivo General

Procesar las encuestas de hogares de Bolivia y México2.

Objetivos específicos

- Reconocer las variables y sus códigos en el manual de la encuesta


- Generar, renombrar, eliminar variables, etc.
- Crear categorías y grupos dentro de las variables según lo establecido en el manual
- Etiquetar variables, cambiarles el formato de string a numeric (o viceversa) y otros
- Realizar estadísticas básicas y presentar los resultados en cuadros estadísticos por medio
del colapso de base de datos
- Adjuntar bases de datos
- Exportar las salidas de resultados a Excel
- Crear gráficos para presentar los resultados

Instrucciones generales

Todos los resultados deberán ser entregados en un único Do-file. El nombre de este deberá ser
T1_nombre_apellido.do . El archivo .do debe estar ordenado y debe tener comentarios
aclaratorios en caso de ser necesario. Los comandos browse y edit no deben estar en el código
del Do-file. Esta tarea no puede ser resuelta usando loops o iteraciones, ya que, ese tema será
evaluado en la tarea siguiente.

El plazo de entrega: 22 de agosto.

1
Taller gestionado por CISOH. Profesora: Cindy Lara
2 Las bases de datos han sido construidas para simular variables de los manuales de usuario de Encuestas de Hogares de
la división de Estadísticas y Proyecciones de CEPAL. Los nombres de las variables y los códigos de clasificación son
verídicos, no así los datos. Por lo tanto, Ud. no puede obtener conclusiones sobre la situación de los países estudiados
en esta tarea.

La información real no es empleada debido a imposiciones restrictivas de algunos gobiernos al uso de la información
disponible en el BADEHOG de CEPALSTAT, por lo que todas las encuestas que conforman el banco de datos son de uso
exclusivo del personal de la CEPAL y no pueden ser compartidas con personas ajenas a la Comisión.
Análisis comparativo de los ingresos de Bolivia y México.

Ud. debe procesar las siguientes encuestas de hogares:

BOL_ENE_1997.dta : Encuesta Nacional de Empleos. Noviembre de 1997. Bolivia.


BOL_EH_2002.dta : Encuesta de Hogares. Noviembre y diciembre de 2002. Bolivia
MEX_INEGI_1996.dta : Encuesta Nacional de Ingresos y Gastos de los Hogares. Tercer
t trimestre de 1996. Bolivia
MEX_INEGI_2002.dta : Encuesta Nacional de Ingresos y Gastos de los Hogares. Tercer
t trimestre de 2002. Bolivia.

Para todo el procesamiento, considere que lo que finalmente se quiere hacer es un análisis
comparativo entre los países y los años. Por lo tanto, tenga en mente que las categorías que ud.
debe crear deben estar homologadas entre estos. Sería ideal que Ud. se apoyara creando una
“nota técnica” donde escriba qué variables homologó y cuáles fueron los criterios. Compare las
preguntas entre los cuestionarios de los distintos países y años, y establezca criterios de similitud
entre las variables para homologar todas las variables como le sea posible.

1. Descargue los manuales de usuario de las Encuestas de Hogares de la división de


Estadísticas y Proyecciones de CEPAL. Para ello diríjase a siguiente página:
http://interwp.cepal.org/badehog/consulta_encuesta.asp?pais=ar . Luego, busque el país,
seleccione el año y descargue el manual de usuario con letras rojas.

Ejemplo 1 – Descargar el manual de usuario de la Encuesta de hogares de Bolivia, 2002.

2. Examine las bases de datos usando los comandos describe, summarize, etc. Luego,
utilizando los manuales, para cada una de las variables de cada base de datos, cree los
label. En el manual de usuario del país y el año, encontrará la variable y las etiquetas que
debiese tener previo a cualquier clasificación. No todas las variables podrán ser
etiquetadas.
3. Elimine las variables que no tienen observaciones. Piense en cómo tratar una variable que
tiene información en algún país y en otro no, o que tiene información en ambos países pero
no para todos los años. Cree un criterio.
4. Genere nuevas variables con categorías arbitrarias. Por ejemplo, a partir de la variable
edad, cree otra variable, supongamos tedad, que categorice edad en 5 tramos. Hint: utilice
generate y replace. También cree las etiquetas para sus nuevas variables. Cree todas las
categorías que sean necesarias de manera de homologar criterios entre las bases de datos
y entre los años3.
5. Cree una base de datos maestra y nómbrela como “masterdata.dta” . La base debe tener
información de Bolivia en 1997 y 2002 y México en 1996 y 2002. Hint: use el comando
append, pero previo a ello verifique que los nombres de las variables de cada base por
país y año sean equivalentes entre sí. Por ejemplo; la variable que expresa los ingresos
laborales debe llamarse, por ejemplo: ing_lab, en todas las bases. Renombre en caso de
ser necesario.

El código para las siguientes actividades debe escribirse usando la base de datos maestra.

6. Genere totales y variaciones mensuales; a) genere el total de ingresos por cada una de
las variables que categorizó anteriormente. Hint: sume los ingresos b) total ingresos
medios por cada variable categorizada. c) mínimos y máximo de los ingresos por cada
variable categorizada d) variación anual del total de los ingresos según sexo y país (1
variable nueva) e) percentiles para la variable que representa los ingresos; percentil 25,
50, 75 (3 variables nuevas). f) calcule la desviación estándar del ingreso cruzado con al
menos 4 variables g) genere otras tres estadísticas para totales, apóyese en el help de
Stata.
7. Cambie el formato de la variable país, de string a numeric y etiquete la variable usando el
comando labmask.
8. Presente en la pantalla Results, cuadros estadísticos expresando lo siguiente:
o Media de los ingresos laborales por año y país.
o Máximo de los ingresos laborales por país, año y la variable edad en tramos.
o Media de los ingresos laborales expresados en horas para cada una de las
categorías de rama de actividad.
o Frecuencia de la variable sexo cruzada con la variable que creó para categorizar
los años de educación.
o Invente otros 6 cuadros estadísticos cruzando variables según le parezca
necesario para comprender el comportamiento del ingreso, entre países y/o a
través del tiempo.
9. Collapse la base de datos haciendo uso del factor de expansión para crear los mismos
cuadros estadísticos anteriores. Utilice los comandos Preserve y Restore. Exporte los
resultados a Excel. En ningún caso cree una sub-base de datos .dta en la carpeta, si
necesita guardar resultados, utilice el comando para guardar temporalmente bases de
datos.
10. Cree un histograma para representar los ingresos laborales, gráfico(s) de barras con los
ingresos por país y por año, gráficos de círculo para representar el total de ingreso por
sexo, otro para el total de ingresos por cada una de las variables categorizadas.

3
Esto significa que, por ejemplo, si Ud. crea la variable tedad con 5 tramos de edad, donde 1 “ niños”,
2”adolescentes” 3 “jóvenes” 4 “adultos” 5 “viejos”, esta clasificación deberá estar en todas las bases de
datos ; la variable tedad tiene que estar en BOL_ 1997.dta ,BOL_2002.dta, MEX_1996.dta y MEX_2002.dta

Вам также может понравиться