Вы находитесь на странице: 1из 5

Guía Rápida Stata 6.

Preparada por Andrea Sánchez

1. ¿Qué es Stata?
Stata es un programa estadístico muy amplio, para sistemas Windows,
Macintosh o Unix. Este combina velocidad con un fácil uso, una biblioteca de
pre-programas analíticos, capacidad para el manejo de datos, y la
programación que permite a los usuarios inventar y ampliar su capacidad tanto
como sea necesaria.

2. Elementos básicos, obtener ayuda, salir


El programa presenta cuatro ventanas:
Stata Results: presenta los resultados de cada orden
Stata command: ventana donde se tipean los comandos
Review: acumula comandos anteriores, los cuales pueden ser reenviados a la
ventana de Stata command clickeando sobre ellos.
Variables: muestra el listado de variables de la base de datos.
Para obtener ayuda, clickee en el menú la opción Help y siga las instrucciones
en pantalla. También puede buscar la sintaxis de un comando tipeando search
y el nombre del comando.

Para terminar la sesión, cierre el programa clickeando en el botón superior


derecho (como cualquier otro programa Windows).

3. Lectura de datos
La estructura básica de datos en Stata es una tabla, en donde cada columna
representa a una variable y cada fila a una observación. Si bien existen
numerosas formas de incorporar datos a Stata, en esta nota discutiremos las
dos más usuales:

Importación de datos desde una planilla de cálculo tipo Excel:

Supongamos que los datos se encuentran en un archivo excel (de planilla de


cálculo) llamado mydata.xls, en el cual en la primer fila se encuentran los
nombres de las variables y en las restantes las observaciones, de modo que
cada columna corresponde a una variable. Stata no puede importar planillas de
calculo directamente, por lo que hay que hacer una pequeña conversión.
Primeramente, hay que abrir el archivo conteniendo los datos en Excel y
proceder a grabarlo nuevamente con la secuencia:
Archivo, Guardar como, CSV (delimitado por comas), Guardar

tras lo cual se guardara una copia en formato ASCII, que contiene las variables
separando las columnas con comas. Supongamos que este archivo se llama
mydata.csv y que se encuentra en el subdirectorio:
c:\misdatos\mydata.csv

Para leer los datos desde Stata, ingresar el siguiente comando:


insheet using c:\misdatos\mydata.csv, comma

1
tras lo cual, si todo sale bien, Stata creará una nueva base de datos, y los
nombres de las variables aparecerán en la ventana Variables.

Importación de datos de un archivo tipo dbf:

Si los datos se encuentran en formato de tipo dBASE (.dbf) se pueden convertir


rápidamente al formato de Stata (.dta) con un simple software llamado Stata
Transfer. Primero se despliega el listado de los tipos de programas que este
software puede manejar, se selecciona la opción dBASE or Compatible y se
especifica la base de datos a transferir. Segundo se despliega el listado de los
tipos de archivos que puede producir, se selecciona la opción Stata version 6 y
se clickea la opción Transfer. Rápidamente Stata Transfer convierte el archivo
de dBASE en un archivo de Stata, con la misma cantidad de observaciones.

Si antes de salir de Stata Transfer, desea convertir otro archivo en formato .dta,
sólo debe clickear la opción Reset para volver a comenzar.

4. Archivos de salida y lectura de comandos desde un archivo


Antes de pasar a ver los comandos más utilizados es necesario aprender como
almacenar los resultados y también como programar los comandos.

A veces es útil guardar resultados en un archivo de texto (log file) que puede
ser editado con un procesador de textos común. El log file es un archivo ASCII
que puede ser editado con cualquier procesador o editor (tipo Word, Wordpad
o Notepad). Para ello, clickear en el menú el botón Log, tras lo cual aparecerá
una ventana en la cual se debe ingresar un nombre para este archivo. Esto
creara una nueva pantalla en donde se guardaran los resultados. A partir de
esto, los resultados aparecerán en pantalla y serán guardados en este archivo.
Para volver a la pantalla de resultados, clickear en el marco de la ventana de
Stata results. Para ver el contenido de log, clickear Log/Bring log window to top.
Para interrumpir momentáneamente el envío de resultados al log, clickear
Log/Suspend log file, y para reanudarlo, clickear Log/Resume suspended log
file. Para cerrar el log file, clickear Log/Close log file.

Para crear un secuencia de comandos se debe originar un archivo de texto con


el formato DO. Se clickea en el menú el botón Do, tras lo cual se abre el editor
del Do file para ingresar la lista de comando. Stata lee este archivo y ejecuta
todos los comandos que contiene. El Do file es un archivo de texto de tipo
ASCII que puede ser creado y modificado con cualquier procesador (tipo Word,
Wordpad o Notepad). En él se puede abrir una base, manejar los datos,
guardarla y volver a abrir otra base de datos. Por ejemplo:
use “c:\misdatos\mydata.dta”, clear

gen edu=0

save “c:\misdatos\mydata.dta”, replace

use “c:\misdatos\otherdata.dta”, clear

Stata no ejecuta ninguna línea que comience con un asterisco. Por tanto,
dichas líneas resultan útiles para colocar notas aclaratorias y comentarios. Por
ejemplo:

* Este es el archivo DO para el práctico 1

También se pueden adjuntar comentarios al comando se tipea:


sum var1 /* esta parte es el comentario*/
2
5. Comandos más utilizados
a) Si se desea listar los datos para tener la información global de la base, el
comando es:
list

Alternativamente, se pueden listar un subgrupo de variables. Por ejemplo, si la


base de datos contiene las variables y, gre, prom, y toefl, un listado de estas
dos ultimas puede obtenerse con
list prom toefl

Para interrumpir el listado, clickear el botón break en la barra de menú.

b) Si se necesita generar una variable que toma el valor cero si la edad es menor
a 16 años y uno si es mayor o igual a 16 años, la sintaxis a usar es:
generate newvar=0

replace newvar=1 if edad>=16

c) Para ampliar la capacidad de la memoria RAM que utiliza Stata, por ejemplo
incrementarla a 16 megabytes se debe seleccionar:
set mem 16m

d) A veces es necesario borrar datos, variables, etc.


drop in 6 /*borra la sexta observación*/

drop y /*borra la variable y*/

e) Se puede usar la función group para crear una variable con grupos de igual
tamaño, por ejemplo:
gen newvar=group(5)

Es aconsejable primero ordenar la base por una variable de referencia antes de


crear los grupos, ya que este comando asigna 1 al primer grupo, 2 al siguiente
y así sucesivamente. Esto es:
sort y

f) Para hacer gráficos existen diversos formatos, colores, escalas, etc. Por
defecto realiza un histograma con 5 barras verticales de una variable, por
ejemplo:
graph z

Para dibujar un histograma con 9 barras verticales, la curva normal y


seleccionar automáticamente la escala de los ejes x e y se debe especificar:
graph z, bin (9) norm ylabel xlabel

Si además desea guardar el gráfico, para luego pegarlo en un texto o


imprimirlo, tipear:
graph z, saving (“Gráfico 1”, replace)

3
6. Estadísticas básicas y regresiones
El siguiente comando produce una serie de medidas estadísticas básicas
para cada una de las variables
summarize, format detail

También si se necesita obtener una tabla con la distribución de frecuencias


que incluya los porcentajes de todos los valores no missing de una variable y,
se tipea:
tabulate y

Para estimar los parámetros de un modelo lineal por el método de mínimos


cuadrados ordinarios, el comando es:
regress y gre prom toefl

Este comando producirá estimaciones mínimo-cuadráticas de un modelo en


donde y es la variable dependiente y las restantes son las variables
explicativas. El modelo incluye automáticamente una constante.

Los modelos probit y logit pueden ser estimados con


logit y gre prom toefl

o
probit y gre prom toefl

para lo cual es necesario que la variable dependiente sea un indicador binario

7. Guardar datos
Si se desea, se pueden guardar los datos en formato Stata. Para esto clickear
File/Save

tras lo cual (luego de elegir un nombre para el archivo) los datos son
guardados en formato Stata (.dta), y no es necesario volver a realizar la
conversión desde Excel al comienzo de una nueva sesión. Para iniciar
nuevamente la sesión con los datos en formato Stata, luego de abrir Stata,
clickear
File/Open

y elegir la base de datos deseada.

4
8. ¿Dónde encontrar mas información?
Stata es un paquete estadístico muy extenso y esto es solo una breve
introducción. Estas son algunas recomendaciones para aquellos interesados en
explorar el software a fondo:
• Los manuales originales, aunque muy voluminosos, son una excelente fuente
de referencia, con numerosos ejemplos. Uno de ellos (Getting Started) es
recomendable para aquellos que desean una breve introducción. El resto es útil
tenerlos solo como referencia y acudir solo si es necesario.

• Stata mantiene un muy buen web-site con abundante información sobre el


producto, para usuarios iniciados y avanzados. El mismo esta en:
http://www.stata.com

• Stata dispone de una serie de tutoriales on-line. En la ventana de comandos,


tipear tutorial para ver una lista de tutoriales disponibles. Se recomienda
altamente trabajar con estos tutoriales.

Вам также может понравиться