Академический Документы
Профессиональный Документы
Культура Документы
0 para economistas
Milenka Moschella y Juan Manuel Rivas
Variables
Results
Aqu aparecen los comandos que han sido utilizados durante la sesin.
Solo los resultados ms recientes son visibles en esta pantalla.
Sirve para utilizar Stata de forma interactiva, es decir se emplea para
crear las lneas de comandos y llevar a cabo las aplicaciones
disponibles en el software.
Nos informa sobre las variables que estn disponibles en nuestra base
de datos para realizar las diversas aplicaciones
Esta nos permite visualizar los resultados (outputs) de los estadsticos
que pedimos calcular o de los modelos que solicitamos estimar.
El tamao y posicin de las ventanas puede ser ajustado segn las preferencias del usuario y las
cuales pueden ser guardadas utilizando Prefs \Save Windowing Preferences.
Tambin podemos modificar el color de fondo o las fuentes de la ventana Stata Results eligiendo
la siguiente opcin del men principal: Prefs \General Preferences
Otras ventanas importantes son:
Stata Editor
Stata Viewer
programa.
Stata Graphs
Stata Do-file Editor
Stata Browser
permite navegar y modificar los datos como si fuese una hoja de Excel.
permite acceder a informacin en lnea y tambin a la ayuda del
presenta el ltimo grfico realizado.
es una ventana separada en Windows y funciona como un editor de
textos que permite ejecutar una lista de comandos.
permite visualizar los datos, mas no modificarlos.
Nota : Si alguna ventana esta cerrada podemos abrirla desde el men Window.
Seleccionamos una opcin desde los mens Data, Graphics o Statistics y llenamos la caja o
cuadro de dilogo correspondiente:
Por ejemplo, para acceder al cuadro de dilogo siguiente, utilizamos la ruta que presentamos a
continuacin, la cual se encuentra en los mens desplegables:
Statistics/Linear Regression and Related/ Linear regression
Esta forma de trabajar con el programa de manera interactiva es lo que Stata llama GUI
(Graphic User Interface), lo cual es una mejora de la versin 8 respecto de las anteriores. Si
bien Stata 8 permite trabajar de manera interactiva, sigue siendo un programa manejado por
comandos (al igual que RATS 6), debido a que cada ventana se encuentra asociada a un
comando (a diferencia de Eviews 5.0, en donde las ventanas desplegables estn orientadas a
objetos), por lo que aprender a manejar Stata8 mediante comandos ser de mucha utilidad,
sobre todo si lo que se desea es programar en este lenguaje.
=
=
=
=
=
=
=
=
=
=
=
=
Nota: Al ejecutar los comandos mediante estos mens adems se registra en la ventana Stata
Review el comando equivalente para la ventana Stata Command. Esta caracterstica es muy
til cuando se aprende Stata porque es posible ejecutar un comando mediante la GUI y luego
repetirlo empleando comandos.
Cuando cargamos en la memoria el archivo auto.dta mediante el men Stata, ste ha
incorporado en la ventana de resultados los comandos equivalentes que se hubiesen tenido
que poner en Stata Command para obtener el mismo resultado. Los comandos se han
almacenado en la ventana Review del mismo modo que sucedera si hubisemos digitado los
comandos en dicha ventana. Si bien trabajar con la barra de herramientas y con los mens
desplegables es ms intuitivo, para el usuario experto es ms rpido y sencillo potente trabajar
directamente con los comandos (lo cual le permite emplear los archivos de ejecucin y la
programacin avanzada)
. ds
make
price
mpg
warning:
missing "":
0/74
"Cad. Deville"
"Dodge Magnum"
"Merc. XR-7"
"Pont. Catalina"
variable has embedded blanks
------------------------------------------------------------------------------mpg
Mileage (mpg)
------------------------------------------------------------------------------type:
range:
unique values:
mean:
std. dev:
numeric (int)
[12,41]
21
units:
missing .:
1
0/74
21.2973
5.7855
percentiles:
10%
14
25%
18
50%
20
75%
25
90%
29
------------------------------------------------------------------------------rep78
Repair Record 1978
------------------------------------------------------------------------------type:
numeric (int)
range:
unique values:
[1,5]
5
tabulation:
Freq.
2
8
30
18
11
5
units:
missing .:
1
5/74
Value
1
2
3
4
5
.
------------------------------------------------------------------------------weight
Weight (lbs.)
------------------------------------------------------------------------------type:
range:
unique values:
mean:
std. dev:
percentiles:
numeric (int)
[1760,4840]
64
units:
missing .:
10
0/74
3019.46
777.194
10%
2020
25%
2240
50%
3190
75%
3600
90%
4060
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
+---------------------+
| make
mpg |
|---------------------|
| AMC Concord
22 |
| AMC Pacer
17 |
| AMC Spirit
22 |
| Buick Century
20 |
| Buick Electra
15 |
|---------------------|
| Buick LeSabre
18 |
| Buick Opel
26 |
| Buick Regal
20 |
| Buick Riviera
16 |
| Buick Skylark
19 |
+---------------------+
1.
2.
3.
4.
5.
+-------------------------+
| make
mpg |
|-------------------------|
| Linc. Continental
12 |
| Linc. Mark V
12 |
| Linc. Versailles
14 |
| Merc. XR-7
14 |
| Cad. Deville
14 |
+-------------------------+
Cules son los cinco autos con mayor millaje por galn?
70.
71.
72.
73.
74.
+----------------------+
| make
mpg |
|----------------------|
| Toyota Corolla
31 |
| Plym. Champ
34 |
| Subaru
35 |
| Datsun 210
35 |
| VW Diesel
41 |
+----------------------+
Para ver los datos tal como si los visemos en MSExcel digitamos browse y aparece la
ventana Stata Editor.
Browse
Nota : Cuando las ventanas Browser y Edit se encuentran abiertas es imposible ingresar
comandos, puesto que la barra Stata Command desaparece.
En cuanto a los Tipos de variables, Stata tiene 5 tipos de variables de datos:
float
double
byte
int
long
Stata por defecto le asigna formato float a una variable de datos nueva.
Intercooled Stata8.0 soporta cadenas de hasta 80 caracteres de largo.
str1
str80
cadenas de 1 carcter
cadenas de 80 caracteres
Estadsticas descriptivas
Como no estoy familiarizado con los precios de 1978, cul es el precio promedio de los carros
en esta base de datos?
. summarize price
Variable |
Obs
Mean
Std. Dev.
Min
Max
-------------+-------------------------------------------------------price |
74
6165.257
2949.496
3291
15906
summarize funciona como list, pero sin argumentos, nos da un resumen de toda la data:
. summarize
Variable |
Obs
Mean
Std. Dev.
Min
Max
-------------+-------------------------------------------------------make |
0
price |
74
6165.257
2949.496
3291
15906
mpg |
74
21.2973
5.785503
12
41
rep78 |
69
3.405797
.9899323
1
5
headroom |
74
2.993243
.8459948
1.5
5
-------------+-------------------------------------------------------trunk |
74
13.75676
4.277404
5
23
weight |
74
3019.459
777.1936
1760
4840
length |
74
187.9324
22.26634
142
233
turn |
74
39.64865
4.399354
31
51
displacement |
74
197.2973
91.83722
79
425
-------------+-------------------------------------------------------gear_ratio |
74
3.014865
.4562871
2.19
3.89
foreign |
74
.2972973
.4601885
0
1
Nota: la variable make tiene 0 observaciones debido a que es una variable de cadena
(string) , calcular una media bajo este comando est indefinido pero no es un error
hacerlo. La variable rep78 slo tiene 69 observaciones porque no tiene registro para 5
carros.
Cul es el precio promedio de los carros que se encuentran por encima y por debajo de la
media de mpg?
. summarize price if mpg<21.3
Variable |
Obs
Mean
Std. Dev.
Min
Max
-------------+-------------------------------------------------------price |
43
7091.86
3425.019
3291
15906
. summarize price if mpg>=21.3
Variable |
Obs
Mean
Std. Dev.
Min
Max
-------------+-------------------------------------------------------price |
31
4879.968
1344.659
3299
9735
if puede utilizarse como sufijo para casi todos los comandos. Esta es una de las caractersticas
ms tiles en Stata.
20
75%
90%
95%
99%
25
29
34
41
Largest
34
35
35
41
Mean
Std. Dev.
21.2973
5.785503
Variance
Skewness
Kurtosis
33.47205
.9487176
3.975005
Respuesta: 20.
Nuestra base de datos contiene la variable foreign que esta codificada de la siguiente manera:
0 si el carro ha sido fabricado los Estados Unidos o Canada, y 1 si el carros ha sido fabricado
en otra parte.
Existen diferencias de precio o millaje explicadas por el origen de fabricacin?
Para saberlo tenemos que estimar las estadsticas de resumen para las variables price y MPG
en los dos casos se recoge la variable foreign.
Existen dos soluciones para este problema:
1. Tipeando los comandos
summarize price mpg if foreign==0
summarize price mpg if foreign==1
2.
. sort foreign
. by foreign: summarize price mpg
------------------------------------------------------------------------------> foreign = Domestic
Variable |
Obs
Mean
Std. Dev.
Min
Max
-------------+-------------------------------------------------------price |
52
6072.423
3097.104
3291
15906
mpg |
52
19.82692
4.743297
12
34
------------------------------------------------------------------------------> foreign = Foreign
Variable |
Obs
Mean
Std. Dev.
Min
Max
-------------+-------------------------------------------------------price |
22
6384.682
2621.915
3748
12990
mpg |
22
24.77273
6.611187
14
41
Parece que el MPG promedio de los carros domsticos extranjeros es diferente. Lo que
queremos ahora es saber si son "estadsticamente" diferente. Para ello haremos un contraste
de hiptesis para verificar si las medias de ambos grupos son iguales.
10
Ha: diff != 0
Pr(|T| > |t|) = 0.0005
A partir de esta prueba hemos establecido que los carros domsticos en 1978 tenan un menor
millaje de gasolina que los carros extranjeros.
Tablas
Ahora, lo que queremos es saber el nmero de carros domsticos y extranjeros.
. tabulate foreign
Car type |
Freq.
Percent
Cum.
------------+----------------------------------Domestic |
52
70.27
70.27
Foreign |
22
29.73
100.00
------------+----------------------------------Total |
74
100.00
11
Tenemos 74 carros, slo 69 tienen registrada la variable rep78 . Queremos conocer los carros
para los cuales esta informacin no existe.
. list make if rep78>=.
14.
17.
23.
27.
72.
+---------------+
| make
|
|---------------|
| Plym. Sapporo |
| Buick Opel
|
| Pont. Phoenix |
| AMC Spirit
|
| Peugeot 604
|
+---------------+
Parece que los carros domsticos tienen una menor frecuencia de mantenimiento. A
continuacin, queremos determinar si esta diferencia es estadsticamente significativa. Para
ello realizaremos un test chi2 (a pesar de que no se cumple la condicin de que debe haber
como mnimo cinco observaciones en cada celda de la tabla).
. tabulate rep78 foreign, chi2
Repair |
Record |
Car type
1978 | Domestic
Foreign |
Total
-----------+----------------------+---------1 |
2
0 |
2
2 |
8
0 |
8
3 |
27
3 |
30
4 |
9
9 |
18
5 |
2
9 |
11
-----------+----------------------+---------Total |
48
21 |
69
Pearson chi2(4) =
27.2640
Pr = 0.000
12
Matrices de correlacion
Cul es la correlacin entre MPG y el peso de un carro?
. correlate mpg weight
(obs=74)
|
mpg
weight
-------------+-----------------mpg |
1.0000
weight | -0.8072
1.0000
Nota: Podemos haber obtenido ningn resultado tipeando by foreign: correlate mpg
weight.
Podemos estimar matrices de correlacin con tantas variables como querramos.
. correlate mpg weight price length displacement
(obs=74)
|
mpg
weight
price
length displa~t
-------------+--------------------------------------------mpg |
1.0000
weight | -0.8072
1.0000
price | -0.4686
0.5386
1.0000
length | -0.7958
0.9460
0.4318
1.0000
displacement | -0.7056
0.8949
0.4949
0.8351
1.0000
13
scatter y x dibuja un grfico de y contra x. Notamos que la relacin a primera vista no es lineal.
14
A continuacin, realizaremos dos grficos separados para los carros domsticos y extranjeros.
. sort foreign
. scatter mpg weight, by(foreign, total row(1))
La relacin no es nicamente no lineal, sino que tambin parece diferir para los carros
domsticos y extranjeros.
15
Regresin lineal
Queremos modelar la relacin entre MPG y el peso (weight).
Basndonos en los grficos, hemos encontrado que la relacin es no lineal y modelaremos
MPG con un efecto cuadrtico en el peso. Tambin, basndonos en los grficos, creemos que
la relacin es diferente para los carros domsticos y extranjeros. Para recoger esta informacin
incluiremos una variable indicadora (dummy) para los carros extranjeros llevaremos despus si
esta variable describe adecuadamente la diferencia. Por lo tanto, estimaremos el siguiente
modelo:
mpg = 0 + 1 weight + 2 weight2 + 3 foreign +
foreign ya es una variable codificada como 0/1 , nicamente necesitamos crear la variable del
peso al cuadrado:
Para tal efecto, debemos crear el cuadrado de weight
16
Nota : los caracteres vlidos son dgitos (0-9), caracteres (a-z y A-Z) y el guin bajo (_), Stata
recomienda que las variables comiencen con maysculas (para evitar confusiones con los
comandos que siempre van en minsculas)
Obtenemos la misma variable con los siguientes comandos:
. gen wtsq = weight^2
17
Nota : Una forma alternativa de incluir las variables del modelo de regresin en el cuadro de
dilogo es haciendo clic sobre ellas.
Number of obs
F( 3,
70)
Prob > F
R-squared
Adj R-squared
Root MSE
=
=
=
=
=
=
74
52.25
0.0000
0.6913
0.6781
3.2827
-----------------------------------------------------------------------------mpg |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------weight | -.0165729
.0039692
-4.18
0.000
-.0244892
-.0086567
wtsq |
1.59e-06
6.25e-07
2.55
0.013
3.45e-07
2.84e-06
foreign |
-2.2035
1.059246
-2.08
0.041
-4.3161
-.0909002
_cons |
56.53884
6.197383
9.12
0.000
44.17855
68.89913
------------------------------------------------------------------------------
Nota : Stata incluye por defecto una constante como variable independiente en el modelo de
regresin.
Para estimar por Mnimos Cuadrados podemos ingresar directamente el comando:
. regress mpg weight wtsq foreign
18
Nota : En general todos los mtodos de estimacin en Stata8 son similares, por lo que si
conocemos tericamente un mtodo de estimacin la implementacin mediante estos cuadros
de dilogo es muy simple. Adems los procesos estadsticos luego de la estimacin (intervalos
de confianza, prueba de hiptesis, etc) son similares en todas las metodologas.
Stata puede estimar varios tipos modelos, incluyendo la regresin logstica, la regresin de Cox
para riesgos proporcionales, etc.
19
scatter mpg weight grfica mpg vs weight como un ploteo. line mpghat weight grfica
mpghat vs weight como una lnea de ploteo. Los || sirven para empalmar los dos grficos.
Hemos mostrado nuestros resultados a un ingeniero. "No," dice. "Deberamos necesitar el
doble de energa para mover 2,000 libras 1 milla comparado con mover 1,000 libras, y por ello
el doble de gasolina. Millas por galn no tiene una relacin cuadrtica con el peso, galones por
milla es una funcin lineal del peso.
Volvamos a la computadora:
.
.
.
.
20
Number of obs
F( 2,
71)
Prob > F
R-squared
Adj R-squared
Root MSE
=
=
=
=
=
=
74
113.97
0.0000
0.7625
0.7558
.00632
-----------------------------------------------------------------------------gpm |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------weight |
.0000163
1.18e-06
13.74
0.000
.0000139
.0000186
foreign |
.0062205
.0019974
3.11
0.003
.0022379
.0102032
_cons | -.0007348
.0040199
-0.18
0.855
-.0087504
.0072807
------------------------------------------------------------------------------
Hemos encontrado que los carros extranjeros en 1978 eran menos eficientes. Los carros
extranjeros tenan un mejor rendimiento de gas por milla que los domsticos en 1978, debido
nicamente ya que eran ms ligeros.
21
ALGUNOS TIPS
Cmo puedo cambiar la fuente de la ventana de resultados?
La ventana Stata Results tiene uncono en la esquina superior izquierda. Al seleciconarlo
aparece un menu que permite seleccionar la fuente del texto. Se puede repetir el proceso en
cada ventana.
22
23
El do-file
A travs de una ventana similar a la de un editor de textos es posible crear una
secuencia de comandos de STATA, los cuales se almacenan a travs de los llamados
do-files. La ventaja de estos archivos (de extensin *.do) es que permiten replicar un
conjunto de instrucciones previamente almacenadas. Esto ayuda a ir corrigiendo
posibles errores en la ejecucin de los comandos, adems de permitir guardar la rutina
de comandos ejecutados para sesiones posteriores.
Los dofiles permiten
1. Mantener un registro de todo lo que se ha hecho en la sesin y poder
replicarlo.
2. Correr una gran cantidad de comandos.
Se pueden considerar como un mecanismo de seguridad por permitir facilmente
regresar a la data original sin importar cuantas transformaciones se hayan realizado.
Recordemos que para abrir la ventana del Do-file Editor pulsamos el botn
correspondiente o las teclas {ctrl+8} o desde el men principal: Windows/Dofile Editor. Como ejemplo abriremos el archivo coment.do. Para ejecutar unas
lneas las iluminamos y luego pulsamos el penltimo botn de dicha ventana.
Para ejecutarlo todo pulsamos el ltimo botn o empleamos el comando do del
siguiente modo:
24
Con el comando cd podemos cambiar de directorio donde se guardan los datos, aunque estos
cambios solo sern validos por la sesin en uso.
. cd C:\
C:\
. pwd
C:\
25
Guardando Bitcoras
STATA permite guardar un registro de los comandos y los resultados. Para crear un archivo de
bitcora se usa el comando log using:
log using bitacora
Por defecto se guarda en el directorio en uso y en formato SMCL (que es el que usa STATA)
para presentar los resultados.
use "C:\cursos\Stata8\Sesion01\auto.dta,
clear
describe
Si lo nico que se desea es guardar los comandos debe emplearse cmdlog. Esta opcin es
especialmente til cuando lo que se busca es crear un archivo do.
cmdlog using C:\cursos\Stata8\Sesion01\comusados
help log
26
es la lista de variables.
son los pesos o ponderaciones.
permite seleccionar la muestra donde exp es una expresin lgica.
permite seleccionar la muestra donde range es un rango de los datos.
27
28
Matrices
29
Grficos bsicos
Ms grficos
30
Ploteando Funciones
31
Tarea N1
Cree un archive log donde estn los comandos que utilizo para realizar la tarea explicados con
comentarios. Adicionalmente cree un archivo en Microsoft Word donde reporte las respuestas
de las tareas.
El archivo debe tener el siguiente nombre:
Nombre_apellido_T1.log
Nombre_apellido_T1.doc
Este archivo deber de ser entregado por correo.
1. Utilizando la data auto.dta, estime un modelo de regresin lineal entre el peso y los
galnes por milla. Justifique su modelacin con ploteos.
2. Realice un test de igualdad de medias entre la nueva variable galnes por milla entre
los carros domsticos y los extranjeros.
3. Busque mediante el comando help lo que hacen las opciones in, by, if
4. Explique que hacen los siguientes comandos:
sysuse auto
l
l
l
l
l
l
l
l
in 5/10
in -5/-1
in f/10
in -4/l
make mpg rep78 in 1/5
if mpg>=21
if mpg>=21 & price<=4500
if mpg>=21 & price<=5000&price>=4500
twoway fpfitci mpg weight || scatter mpg weight, sort m(t) by(foreign,
total row(1))
twoway function y=x^3, range(-5 5) xsize(4) ysize(3) xlabel(#10)
xline(0)
32