Академический Документы
Профессиональный Документы
Культура Документы
TAREA 1
Objetivo General
Objetivos específicos
Instrucciones generales
Todos los resultados deberán ser entregados en un único Do-file. El nombre de este deberá ser
T1_nombre_apellido.do . El archivo .do debe estar ordenado y debe tener comentarios
aclaratorios en caso de ser necesario. Los comandos browse y edit no deben estar en el código
del Do-file. Esta tarea no puede ser resuelta usando loops o iteraciones, ya que, ese tema será
evaluado en la tarea siguiente.
1
Taller gestionado por CISOH. Profesora: Cindy Lara
2 Las bases de datos han sido construidas para simular variables de los manuales de usuario de Encuestas de Hogares de
la división de Estadísticas y Proyecciones de CEPAL. Los nombres de las variables y los códigos de clasificación son
verídicos, no así los datos. Por lo tanto, Ud. no puede obtener conclusiones sobre la situación de los países estudiados
en esta tarea.
La información real no es empleada debido a imposiciones restrictivas de algunos gobiernos al uso de la información
disponible en el BADEHOG de CEPALSTAT, por lo que todas las encuestas que conforman el banco de datos son de uso
exclusivo del personal de la CEPAL y no pueden ser compartidas con personas ajenas a la Comisión.
Análisis comparativo de los ingresos de Bolivia y México.
Para todo el procesamiento, considere que lo que finalmente se quiere hacer es un análisis
comparativo entre los países y los años. Por lo tanto, tenga en mente que las categorías que ud.
debe crear deben estar homologadas entre estos. Sería ideal que Ud. se apoyara creando una
“nota técnica” donde escriba qué variables homologó y cuáles fueron los criterios. Compare las
preguntas entre los cuestionarios de los distintos países y años, y establezca criterios de similitud
entre las variables para homologar todas las variables como le sea posible.
2. Examine las bases de datos usando los comandos describe, summarize, etc. Luego,
utilizando los manuales, para cada una de las variables de cada base de datos, cree los
label. En el manual de usuario del país y el año, encontrará la variable y las etiquetas que
debiese tener previo a cualquier clasificación. No todas las variables podrán ser
etiquetadas.
3. Elimine las variables que no tienen observaciones. Piense en cómo tratar una variable que
tiene información en algún país y en otro no, o que tiene información en ambos países pero
no para todos los años. Cree un criterio.
4. Genere nuevas variables con categorías arbitrarias. Por ejemplo, a partir de la variable
edad, cree otra variable, supongamos tedad, que categorice edad en 5 tramos. Hint: utilice
generate y replace. También cree las etiquetas para sus nuevas variables. Cree todas las
categorías que sean necesarias de manera de homologar criterios entre las bases de datos
y entre los años3.
5. Cree una base de datos maestra y nómbrela como “masterdata.dta” . La base debe tener
información de Bolivia en 1997 y 2002 y México en 1996 y 2002. Hint: use el comando
append, pero previo a ello verifique que los nombres de las variables de cada base por
país y año sean equivalentes entre sí. Por ejemplo; la variable que expresa los ingresos
laborales debe llamarse, por ejemplo: ing_lab, en todas las bases. Renombre en caso de
ser necesario.
El código para las siguientes actividades debe escribirse usando la base de datos maestra.
6. Genere totales y variaciones mensuales; a) genere el total de ingresos por cada una de
las variables que categorizó anteriormente. Hint: sume los ingresos b) total ingresos
medios por cada variable categorizada. c) mínimos y máximo de los ingresos por cada
variable categorizada d) variación anual del total de los ingresos según sexo y país (1
variable nueva) e) percentiles para la variable que representa los ingresos; percentil 25,
50, 75 (3 variables nuevas). f) calcule la desviación estándar del ingreso cruzado con al
menos 4 variables g) genere otras tres estadísticas para totales, apóyese en el help de
Stata.
7. Cambie el formato de la variable país, de string a numeric y etiquete la variable usando el
comando labmask.
8. Presente en la pantalla Results, cuadros estadísticos expresando lo siguiente:
o Media de los ingresos laborales por año y país.
o Máximo de los ingresos laborales por país, año y la variable edad en tramos.
o Media de los ingresos laborales expresados en horas para cada una de las
categorías de rama de actividad.
o Frecuencia de la variable sexo cruzada con la variable que creó para categorizar
los años de educación.
o Invente otros 6 cuadros estadísticos cruzando variables según le parezca
necesario para comprender el comportamiento del ingreso, entre países y/o a
través del tiempo.
9. Collapse la base de datos haciendo uso del factor de expansión para crear los mismos
cuadros estadísticos anteriores. Utilice los comandos Preserve y Restore. Exporte los
resultados a Excel. En ningún caso cree una sub-base de datos .dta en la carpeta, si
necesita guardar resultados, utilice el comando para guardar temporalmente bases de
datos.
10. Cree un histograma para representar los ingresos laborales, gráfico(s) de barras con los
ingresos por país y por año, gráficos de círculo para representar el total de ingreso por
sexo, otro para el total de ingresos por cada una de las variables categorizadas.
3
Esto significa que, por ejemplo, si Ud. crea la variable tedad con 5 tramos de edad, donde 1 “ niños”,
2”adolescentes” 3 “jóvenes” 4 “adultos” 5 “viejos”, esta clasificación deberá estar en todas las bases de
datos ; la variable tedad tiene que estar en BOL_ 1997.dta ,BOL_2002.dta, MEX_1996.dta y MEX_2002.dta