Вы находитесь на странице: 1из 10

REFERENCIA RPIDA PARA INSTRUCCIN EN STATA: Comandos importantes en Stata

Este documento se puede usar como referencia durante y despus del entrenamiento en Stata. Se presentarn algunos ejemplos para esclarecer ciertos comandos. Varios comandos pueden ser especificados con abreviaciones (por ejemplo, todos describe,des, y de son apropiados para indicar describe), presentndose a continuacin varios ejemplos. Texto en courier new rojo refiere a un comando a ser digitado en la ventana de comandos del programa Stata. Texto en courier new rojo itlico se refiere a informacin a ser digitada que vara con el banco de datos/archivo del usuario. variable = la variable de inters var# = cada variable de inters. En la mayora de los casos, hay opciones adicionales que pueden seguir comandos iniciales para funciones y operaciones ms especficas/detalladas. Slo algunos ejemplos de lneas de comandos aparecen en este documento.

Ejemplo del interfaz de Stata

Traducido y adaptado de fuente orginal: dataninja.wordpress.com Contribuidores: Ronnie Babigumira, Jamie Cotta, Carolina de Souza Costa y Pablo Prado

I. Iniciarse com Stata I.1. Uso general En Stata las letras maysculas y minsculas son interpretadas como letras diferentes. Usar comillas ... alrededor de informacin string (texto) Usar == para una ecuacin lgica (if x==1) Usar /// para continuar una lnea con ms de 80 caracteres Usar / para indicar todos los valores en el intervalo de x hasta y (i.e. 1 / 10 representa todos los valores de 1 hasta 10) Usar #delimit; para que los comandos sean delimitados con el punto y coma (;) en el archivo .do: (ver seccin I.6. para archivos .do)
(facilita una organizacin visual mejor de sus comandos, en lugar de tener lneas de comandos muy largos)

Usar #delimitcr; para especificar que el delimitador sea el ENTER. Para insertar comentarios en archivos .do y programas se puede: 1) comenzar la lnea con un asterisco (*) 2) insertar el comentario entre /* y */ al inicio da lnea o en el medio 3) comenzar el comentario con // al inicio o al final de la lnea 4) comenzar el comentario con /// Ejemplo 1: comando1 * (su comentario aqu, esta lnea no ser considerada) comando2 comando3 Ejemplo 2: comando1 /*(su comentario aqu, el texto entre los asteriscos no ser considerada) */ comando2 comando3 Ejemplo 3: comando1 // (su comentario aqu) comando2 comando3 // (otro comentario aqu, el resto de la lnea no ser considerada) comando4 Ejemplo 4: comando1 comando2 /// (otro comentario aqu, esta lnea debe ser conectada a la prxima lnea) comando3
Siempre hay que incluir uno o ms espacios antes de las barras // y ///.

Traducido y adaptado de fuente orginal: dataninja.wordpress.com Contribuidores: Ronnie Babigumira, Jamie Cotta, Carolina de Souza Costa y Pablo Prado

I.2. Familiarizarse con la sintaxis de comandos [by varlist] comando [varlist] [if exp] [in range] [weight] [,options] varlist hace que Stata repita el comando para cada sub-muestra de los datos para la cual valores de las variables en varlist sean iguales. En los ejemplos presentados aqu sustituimos varlist con variable. Si ninguna variable est incluida, Stata asume _all, para incluir todas las variables en el banco de datos. if exp restringe el comando a un rango especfico do comando a los casos para los cuales la exp (expresin) es verdadera. in range restringe el comando a un rango especfico de observaciones. weight indica el tamao en adjunto de cada observacin. options: muchos comandos tiene opciones adicionales y '[options]' es el mtodo para visualizar estas opciones por comandos especficos. I.3. Digitar comandos rpidamente y corregir errores (Windows/Mac Unix) Para recuperar la lnea del comando anterior: Page Up Ctrl-R Presionar Page Up (ou Ctrl-R) varias veces para retornar decrecentemente por las lneas de comandos anteriores. Para pasar adelante por las lneas de comandos anteriores: Page Down Ctrl-B Para visualizar una lista de las ltimas 5 lneas de comandos: #review #review Para visualizar las n lneas de comandos anteriores: #review n # review n Para visualizar la na lnea de comando: n Ctrl-Home n Ctrl-W I.4. Editar lneas de comando Usar las flechas izquierda y derecha para mover el cursor. Para mover el cursor hasta el inicio de la lnea: Home Ctrl-K Para mover el cursor hasta el final de la lnea: End Ctrl-P Para borrar el carcter en la localizacin del cursor: Delete Ctrl-D Digitando substituir caracteres existentes Para insertar caracteres al frente del cursor sin sustituir: Insert Ctrl-E Para regressar al modo de sustitucin: Insert Ctrl-E Para borrar una lnea y comenzar de nuevo: Esc Ctrl-U Para cortar la lnea en la localizacin del cursor: Ctrl-End Ctrl-X I.5. Visualizar y modificar directorio (pwd, cd) Visualizar en cul directorio Stata est procurando/salvando archivos: pwd (pwd = print working directory) Cambiar de directrio: cd (cd = change directory) Visualizar, en la ventana de resultados, todos los archivos dentro del directorio actual: dir

Traducido y adaptado de fuente orginal: dataninja.wordpress.com Contribuidores: Ronnie Babigumira, Jamie Cotta, Carolina de Souza Costa y Pablo Prado

I.6. Ejecutar una rutina Ejecutar un archivo .do: run camiocompleto\nombrearchivo.do


camiocompleto = el camio entero de la carpeta donde el archivo est guardado nombrearchivo = nombre escogido por el investigador para el archivo

Ejecutar la rutina entera sin paginar por el archivo output entero: set more off Ejemplo: set more off run C:\Desktop\STATEX\correlacion_ingreso2010.do Ejecutar comando suprimiendo output y procediendo a pesar de los errores: capture comando Ejecutar comando y ver output y mensajes de error: capture noisily comando

I.7. Crear y salvar archivo .log Crear un registro de su trabajo (grabar y salvar los resultados de los comandos ejecutados) log using camiocompleto/nombrearchivo.log o log using camiocompleto/nombrearchivo.log, text replace (text replace sustituye la versin anterior del log) capture log using camiocompleto/nombrearchivo.log Parar de guardar el resultado (cerrar el log): log close Para pasar mensajes de error: capture by Visualizar log entero: view nombrearchivo.log Ejemplo: log using C:\Desktop\STATEX\anova_ingreso2010.log, text replace comando1 comando2 log close view anova_ingreso2010.log I.8. Usar operadores: Relacin lgica aritmtica (numrica + sumar ~ no * multiplicar / dividir < menor que > mayor que ^ elevado a la n potencia == igual y string(texto)) sustraer & y >= mayor o igual != no igual

| <= ~=

o menor o igual no igual

Traducido y adaptado de fuente orginal: dataninja.wordpress.com Contribuidores: Ronnie Babigumira, Jamie Cotta, Carolina de Souza Costa y Pablo Prado

1.9. Incluir calificadores en expresiones Caso x sea igual a 1: if x==1 Caso x sea mayor que 5 y menor que 20: if x>5 & x<20 Para indicar que est en las primeras 10 observaciones: in (1/10) Para realizar una accin por grupos (uno o ms) usar: by o over Ejemplos: by genero: summarize escolaridad bysort genero: sum escolaridad if edad >=15 & edad <=55 graph bar escolaridad, over (genero)

grupo refiere a una variable categrica

1.10. Listar variables Listar x1 hasta x10: x1-x10 Listar todas las variables incluyendo y entre var2 y var6: var2-var6 Ejemplo: genero-altura (genero y altura representan dos variables en el banco de datos) Listar todas las variables comenzando con popul: popul* Listar todas las variables: comando _all Ejecutar comando para todas las variables: comando _all Ejemplos: des _all o su _all II. Trabajar con los datos II.1. Cargar achivos .dta Cargar archivo .dta: use camio/nombrearchivo.dta Limpiar la memoria de Stata, o retirar el banco de datos actual de la memoria (usar antes de importar un nuevo banco): clear Trabajar con apenas las primeras 100 observaciones: use camio/nombrearchivo.dta in=1/100 Trabajar con apenas las observaciones de un valor/categora (i.e. hombres): use camio/ nombrearchivo.dta if genero==hombre II.2. Leer un archivo de texto Importar archivo de texto (delimitado con comas): insheet using camio/nombrearchivo.txt, comma
Sustituir coma con tab si el archivo es tab-delimitado

Si los nombres de variables no estn incluidos usar: insheet var1 var2 var3 camio/nombrearchivo.txt

II.3. Guardar archivos Guardar en formato de Stata (.dta): save camio/nombrearchivo.dta o save camio/nombrearchivo.dta, replace (replace graba la nueva versin sobre la original) Guardar en formato texto-delimitado: outsheet _all using camio/nombrearchivo.txt, comma (puede usar tab en lugar de coma)

Traducido y adaptado de fuente orginal: dataninja.wordpress.com Contribuidores: Ronnie Babigumira, Jamie Cotta, Carolina de Souza Costa y Pablo Prado

II.4. Describir y resumir datos Visualizar nombres y legendas de variables, y datos del libro de cdigos que describe el banco de datos: codebook Listar informacin sobre el libro de cdigos para variables especficos: codebook variable o codebook ar1 var2 var3 Listar estadsticas univariadas para todos las variables: summarize o sum o su Listar estadsticas univariadas para variables especficas: su var1 var2 var3 Listar los datos en la memoria: list Listar todos los valores de var1: list var1 Listar todos los valores de var1 y var2 y somar los valores de var2: list var1 var2, sum (var2) Listar casos 1 at 10 de var1: list var1 in 1/10
Se puede ordenar la variable antes de listarla (i.e. ordenar edad y listar los 5 individuos ms jvenes)

Listar casos 1 hasta 20 de var1, var2 e var3: list var1 var2 var3 in 1/20 Listar cualquier observacin: list in #obs (inserir # da observacin) Listar todas las variables comenzando con popul: list popul* Listar casos condicionalmente: list varl if varl>20

II.5. Organizar variables Ordenar variable: sort variable Retirar una variable del banco de datos en uso: drop var1 var2 [if][options] Mantener variables en el banco de datos en uso: keep var1 var2 [if][options] Ordenar variables: order var5 var2 var8 var10

Las variables no-especificadas sern eliminadas

Las variables listadas aparecern primero en la ventana de variables, en la orden especificada. Las otras se quedarn en la orden original, despus de las listadas.

Ordenar variables alfabeticamente: aorder var5 var2 var8 (segue la misma lgica acima)

Traducido y adaptado de fuente orginal: dataninja.wordpress.com Contribuidores: Ronnie Babigumira, Jamie Cotta, Carolina de Souza Costa y Pablo Prado

II.6. Crear leyendas Crear una leyenda para un banco de datos: label data Leyenda del banco Crear una leyenda para una variable: label variable nombrevaroriginal nuevonombrevar Definir una lista de asociaciones de nmeros enteros y texto llamadas value labels (leyendas de valores): label define leyendavalores x leyenda1 y leyenda2 z leyenda3 Anexar una leyenda de valores a una variable: label values variable Ejemplo de comandos en secuencia: label variable pesc2008 pescador en 2008 label define pescador 1 s 0 no label values pesc2008 Visualizar una lista de nombres de las leyendas de valores almacenadas en la memoria: label dir Listar nombres y contenido de leyendas de valores en la memoria o apenas variables especificadas: label list o label list leyendavalores leyendavalores2 Generar una copia de una leyenda de valores que existe: label copy leyendavalores nuevoleyendavalores Ejemplo: label copy anos_escuela escolaridad Eliminar una legenda: label drop leyendavalores Salvar leyendas en un archivo .do: label save
Es til para leyendas de valores que no estn asociadas a una variable porque las leyendas no son salvadas con los datos.

II.7. Adicionar idioma para leyendas Adicionar leyendas en otro idioma como espaol label language es, new Retornar al idioma de leyendas patrn: label language, default Retornar a otro idioma de leyendas (i.e., espaol): label language es

Traducido y adaptado de fuente orginal: dataninja.wordpress.com Contribuidores: Ronnie Babigumira, Jamie Cotta, Carolina de Souza Costa y Pablo Prado

II.8. Copiar y manipular variables Generar nueva variable basada en una variable existente (ejemplos): gen x = y/10 o gen x2= x^2 o gen z=(x+y) if var1==1 & var2>100 Renombrar variable= rename var1 nuevonombrevar Clonar (copiar) variable: clonevar nuevonombrevar = nombrevar [if][options]
Este comando copia todas las propiedades de la variable original (nombre, tipo de almacenamiento, valores, leyendas, etc.)

Recodificar valores de variable (crear nuevos cdigos para valores despus de copiar variable original: recode var1 (min/5=1) (6/max=2) o recode var1 (.=1) if var2==1 o recode var1 (1=2) (else=0) o recode var1 var2 (1 2 = 1 "bajo") (3 = 2 medio) (4 5 = 3 "alto"), label(nuevoclase) Sustituir valores: replace variable [if][options] Se puede repetir comando hasta que todos los valores de inters sean substituidos Example 1: replace var1 = var1^2 Example 2: replace var1 = 1 if (var1<=25) replace var1 = 2 if (var1>25) & (var1<=50) replace var1 = 3 if (var1>=51) & (var1<=75)

II.9. Agregar bancos de datos Agregar (append) dos bancos semejantes (i.e. bancos con variables idnticas digitados por personas diferentes): use banco1 append using banco2 o append using banco2, keep(var1 var 2 var5 var7 var8) save camio/banco3
Para cualquier variable que no est en ambos los bancos, puntos decimales (.) sern inseridos para los valores ausentes.

II.10. Unir bancos de datos Unir (merge) dos bancos diferentes que tienen por lo menos una variable en comn: use banco1 sort id (id representa la variable en comn por la cual la unin ser basada) save, replace clear use banco2 sort id merge id using banco1 o merge id using banco1, uniqmaster o merge id using banco1, uniqusing save camio/banco3
unique, uniqmaster, y uniqusing especifican que las variables en las cuales la unin ser basada identifiquen nicamente las observaciones. uniqmaster identifica nicamente observaciones en el banco que est abierto y no necesariamente en el banco using uniqusing identifica nicamente observaciones en el using y no necesariamente en el banco master Para la mayora de estas, debe especificar apenas unique. unique igual a especificar ambos uniqmaster y uniqusing.

Traducido y adaptado de fuente orginal: dataninja.wordpress.com Contribuidores: Ronnie Babigumira, Jamie Cotta, Carolina de Souza Costa y Pablo Prado

II.11. Agrupar variables Simple: collapse (sum) var3 var4 var5, by (var1 var2)
La suma de los valores de var3 var4 y var5 ser generada al nivel de var1 y var2.

Ejemplo: collapse (sum) ingresobosque ingresoagric ingresopesca, by (domicilio ao) Avanzada: collapse (count) var2 (sum) var3 (mean) var8 (p50) var9, by (var1)
La cuenta de casos de var2, la soma de valores de var3, el promedio de valores de var8, y la mediana de valores de var9 sern generadas al nivel de var1.

Ejemplo: collapse (count)productos (sum)ingresobosque (mean)ingresobruto (p50)ingresoliquido, by (domicilio) II.12. Realizar operaciones en todas las variables (loop over items) Usar foreach para aplicar un comando a cada variable listada: Ejemplo 1: foreach x of varlist var1 var2 var3 { recode `x (-99=.) } Puede usar tambin: foreach x in var1 var2 var3
Observe las comillas la primera y segunda son caracteres diferentes

Ejemplo 2: foreach v of varlist var1 var4 var7 var8 var9 { generate log`v = log(`v) } II.13. Trabajar con valores ausentes Transformar valores ausentes (.) en valores numricos: mvencode variable mv(-999) [in][if][options]
El nmero entre parntesis puede ser cualquier que no sea un valor vlido para la variable

Transformar valores numricos en valores ausentes (.): mvdecode variable mv(-99) [in][if][options]
El numero entre parntesis varia para cada banco de datos

II.14. Generar nmeros aleatorios Crear variable aleatoria que contiene nmeros pseudo-aleatorios uniformamente distribuidos en el intervalo [0,1) gen random = runiform() Crear variable aleatoria que contiene nmeros aleatorios normalmente distribuidos con promedio 0 y desviacin estndar 1: gen normal = rnormal() Otras opciones: rbinomial(n,p) rchi2(df) rpoisson() rt(df) etc. Caso ningn banco de datos est en la memoria, pueden ser creadas 100 observaciones: set obs 100

Traducido y adaptado de fuente orginal: dataninja.wordpress.com Contribuidores: Ronnie Babigumira, Jamie Cotta, Carolina de Souza Costa y Pablo Prado

III. Ayuda III.1. Usar asistencia disponible en el internet Para ayuda con comandos especficos: help nombrecomando Para ayuda con el comando help: help Para una lista completa de tpicos de ajuda: help contents Para obtener todas las referencias para un tpico, ambos on-line y en el manual: lookup inserirtpico Para aprender todo sobre lookup: help lookup III.2. Usar tutoriales disponibles en el internet Para ejecutar un tutorial Stata en un tpico especfico: tutorial nombrearchivo Para una lista completa de tutoriales Stata: tutorial contents Ejemplos de tutoriales: intro, tables, regress, logit, survival, ado

Traducido y adaptado de fuente orginal: dataninja.wordpress.com Contribuidores: Ronnie Babigumira, Jamie Cotta, Carolina de Souza Costa y Pablo Prado

Вам также может понравиться