Академический Документы
Профессиональный Документы
Культура Документы
Economistas del Instituto Peruano de Economa. Los errores u omisiones son entera responsabilidad de los autores.
Responsables:
Victor Fuentes
Piero Ortiz
Introduccin
La presente gua es un esfuerzo del IPE, con el auspicio de la Fundacin M. J. Bustamante
de la Fuente, para contribuir a la educacin de los estudiantes universitarios del Per.
Mediante la realizacin de los Foros de Desarrollo Econmico Regionales se intenta
involucrar a los alumnos en la problemtica local y nacional. Para lograr dicho cometido,
resulta relevante que los alumnos de economa tengan la capacidad de aprovechar las
principales fuentes de informacin provistas por el Instituto Nacional de Estadstica (INEI),
como la Encuestas Nacionales de Hogares (ENAHO).
De manera sencilla, se presenta el entorno del software estadstico y economtrico STATA
12. Asimismo, se muestra el funcionamiento de los principales botones de la interfaz que
permitirn una mayor interaccin al usar las bases de datos. Adems, se incluyen dos
aplicaciones prcticas para reforzar el aprendizaje a nivel de investigador. Las bases de
datos empleadas son Automviles en EE.UU. y la ENAHO 2014. En el primer caso, la
informacin es provista por el propio paquete estadstico y servir para practicar los
comandos vistos en la primera seccin.
Por otro lado, el manejo de la ENAHO 2014 permitir replicar los principales indicadores
como pobreza, gastos e ingresos de los hogares, cobertura de la telefona mvil,
cobertura elctrica, material predominante en pisos, paredes y techos, etc. Usando los
comandos descritos lneas abajo y explorando en el manual de ayuda de STATA 12, los
alumnos pueden incrementar sus conocimientos de manera autodidacta.
Finalmente, para lograr un correcto entendimiento de la presente gua se recomienda
revisar en paralelo el do-file anexo STATA_12_para_economistas_.do. Todas las consultas
o dudas pueden ser realizadas a los correos vfuente@ipe.org.pe o portiz@ipe.org.pe.
ndice
Introduccin .................................................................................................................................... 2
A. Conceptos bsicos ................................................................................................................. 4
I.
II.
III.
II.
Ejercicios................................................................................................................................ 9
II.
III.
A. Conceptos
bsicos
I.
Entorno de STATA
El despliegue inicial de STATA presenta cuatro ventanas:
Review
Command
Variables
Results
II.
Por ejemplo:
use C:\Users\Gianfranco\Desktop\STATA12paraEconomistas\sumaria-2014.dta, clear
save C:\Users\Gianfranco\Desktop\STATA12paraEconomistas\sumaria-2014.dta, replace
III.
O bien:
pwd
Por ejemplo:
cd C:\Users\Gianfranco\Desktop\STATA12paraEconomistas\
IV.
describe (des)
summarize (sum)
tabulate (tab)
generate (gen)
Existen dos tipos de archivos ms: nombre.log y nombre.ado. Para mayor informacin revisar el Help de STATA
Suma
Resta
Multiplicacin
Divisin
Igual
>=
>
<=
<
!=
Mayor o igual
Mayor
Menor o igual
Menor
Distinto de
~=
&
|
exp()
ln()
Distinto de
y
o
Exponencial
Logaritmo base E
3. Expresiones condicionales
Permite hacer instrucciones condicionales, ya sea con
comandos descriptivos o de creacin.
Permite realizar instrucciones basndose en la clasificacin
de una variable en especfico
if
by
restore
replace
egen
sort
lookfor
B. Aplicacin:
Automviles en
EE.UU.
I.
Base de datos
En la ventana de comandos escribir:
clear all
sysuse auto.dta, clear
II.
Ejercicios
1.
Listado
3. Cules son los cinco autos con el mayor millaje por galn?
list make mpg in -5/l
10
14. Creamos nueva variable: weight2 (cuadrado del peso del auto)
gen weight2=weight^2
11
C. Aplicacin:
ENAHO 2014
12
I.
Base de datos
En la ventana de comandos escribir:
clear all
En mi caso es el siguiente:
cd "C:\Users\Gianfranco\Desktop\STATA12paraEconomistas"
II.
Ejercicios bsicos
1.
browse
2.
Codebook
3.
codebook ubigeo
sum ubigeo
describe ubigeo
4.
5.
13
6.
codebook dominio
sum dominio
describe dominio
8.
gen ambito=.
label variable ambito "ambito"
replace ambito = 0 if estrato>=6 & estrato <=8
replace ambito = 1 if estrato>0 & estrato <=5
label define ambito 1 "Urbano" 0 "Rural"
label value ambito ambito
tab ambito
tab region ambito
tab region_natural ambito
tab region ambito region_natural
table region ambito region_natural
14
III.
Ejercicios intermedios
9.
Al comparar con los datos ofrecidos por el INEI notaremos que los resultados no son
correctos, qu ocurre? Hasta ahora solo habamos estado trabajando con la base
de datos y sus variables; no obstante, al iniciar los clculos sobre ellas debemos
recordar que se trata de una encuesta y no de la poblacin. Por lo tanto, debemos
considerar los factores de expansin o ponderadores que hacen que los indicadores
muestrales se conviertan en representaciones poblacionales.
lookfor factor
codebook factor07
15
proportion pobreza2
tabulate region pobreza2
tabulate region pobreza2, row ci se
tabulate ambito pobreza2, row ci se
tabulate region_natural pobreza2, row ci se
Usamos el comando xtile para calcular los quintiles. Primero revisamos qu nos dice
STATA:
III Foro de Desarrollo Econmico Regional Cusco 2015
16
Podemos usar esta variable para calcular los quintiles por regiones?
table region quintiles_ing [iw=factor], c(mean inghog2d)
No, porque esta variable ha sido calculada usando como poblacin objetivo al Per.
Demostrmoslo:
table region quintiles_ing [iw=factor], row
La tabla nos muestra las observaciones segn quintiles. Solo en la ltima fila, referida
al Total o Per, los montos son estadsticamente semejantes. Por lo tanto, para
calcular los quintiles de ingresos segn regiones, estos se deben calcular
independientemente. Para el caso de Arequipa:
xtile quintiles_ing_arequipa = inghog2d [w=factor07] if region==4,nq(5)
table quintiles_ing_arequipa [iw=factor], c(mean inghog2d)
17
El error se debe a que las variables que habamos generado en los ejercicios
anteriores no se encuentran en esta base de datos. Al respecto, se pueden emplear
dos soluciones similares. Generar todas las variables calculadas previamente usando
los comandos descritos lneas arriba o combinar las bases de datos. En este caso
usaremos la primera alternativa; usaremos la segunda ms adelante.
Luego de volver a calcular las variables de regiones, regiones naturales y nivel de
urbanidad, calculamos lo solicitado:
table region [iw=factor07], c(mean celular)
Como puede haber notado, al revisar las variables del mdulo 100, el procedimiento
aplicado tambin puede servir para obtener la cobertura de telfono, internet y tv
cable. Pista:
lookfor p114
18
Generamos una variable ms amigable usando la definicin del INEI sobre acceso
a red pblica de agua
gen agua=.
replace agua=0 if p110<=3
replace agua=1 if p110>3
label variable elect "Acceso a red pblica de agua"
label define agua 1 "Tiene acceso a red pblica" 2 "No tiene
label values agua
19
14.
Notamos que las observaciones que solo estn incluidas en la base de datos del
mdulo 100 representan missing values. Para evitar posible problemas, solo
guardamos las variables presentes en ambas bases de datos o, que es lo mismo,
aquellas incluidas en Sumaria.
keep if _merge==3
Tambin podramos haber usado las bases de datos que modificado al trabajar los
clculos previos:
use enaho01-2014-100-mod.dta, clear
sort conglome vivienda hogar
5
20
_______________________________________________________________________________
La presente gua constituye una primera herramienta para aprovechar la informacin
provista por el INEI. Se deja como asignacin personal la investigacin de nuevos
comandos y la aplicacin sobre nuevos mdulos de la ENAHO. Finalmente, la principal
herramienta para avanzar en el dominio de STATA radica en el uso del Manual de Ayuda
(comando help).
21