Вы находитесь на странице: 1из 3

Universidad de Buenos Aires

Facultad de Ciencias Económicas


Estadística 1

TRABAJO PRÁCTICO

La fecha de entrega es el lunes 17 de junio inclusive. Debe enviarse por mail a


jtasso@economicas.uba.ar. Pasado el lunes no se reciben trabajos prácticos.

Deben entregar un solo archivo en formato PDF. Es importante que respondan lo


que se pregunta y que toda la información que incluyan en tablas pueda leerse
fácilmente y esté bien referenciada. No es válido copiar y pegar una tabla de Stata
dado que muchas veces el programa devuelve más información que la necesaria
para responder la pregunta. No incluyan información irrelevante y sean breves en
las respuestas.

Van a trabajar con una base de datos que tiene 5 variables:

• “region”: que toma los valores {1, 40, 41, 42, 43, 44} si la persona vive en el GBA,
el NOA, el NEA, cuyo, la región pampeana o la patagonia respectivamente.
• “MASC”: que toma valor 1 si la persona es hombre y 0 si no lo es.
• “EDAD”: edad en años cumplidos.
• “nivel_ed”: que toma valores discretos desde el 0 al 6 que representan
personas sin instrucción, con primaria incompleta, con primaria completa,
con secundaria incompleta, con secundaria completa, con universidad
incompleta y con universidad completa. Incrementándose en uno cada vez.
• “INGRESOTOTAL”: el ingreso total de la persona en el tercer trimestre de 2018
medido en pesos.
1. Provea una tabla con medidas descriptivas de las variables INGRESOTOTAL y
EDAD. Comente brevemente las medidas obtenidas para estas variables.
Además, responda: ¿cuántos hombres y cuántas mujeres hay en la muestra?
¿Cuántas personas de su muestra terminaron la universidad? ¿Cuántas
personas de su muestra residen en el Gran Buenos Aires? Exponga tres tablas
en donde pueda observarse esta información para las variables MASC,
nivel_ed y region.

2. Genere una nueva variable definida como el logaritmo natural de la variable


INGRESOTOTAL. Presente medidas de tendencia central, de dispersión, de
concentración y de forma de esta variable y coméntelas brevemente. Realice
un histograma y preséntelo junto a una distribución normal. En base a este
gráfico, a las medidas descriptivas y aplicando la regla empírica (68% - 95% -
99.7%) vista en clase: ¿Puede decir que el logaritmo del ingreso total tiene
distribución normal? ¿Por qué?

3. Para este punto concéntrese en la variable logaritmo del ingreso total que
generó en el punto anterior. El objetivo de este ejercicio es comparar la media
y la varianza del ingreso entre hombres y mujeres. Entre el ingreso medio de
los hombres y de las mujeres, ¿cuál presume que será mayor? Realice un test
t de comparación de medias. Realice también el test F de comparación de
varianzas. En todos los casos deben quedar claras las hipótesis nula y
alternativa, la distribución muestral usada, el valor del estadístico de prueba
y la decisión de rechazar o no. El nivel de significatividad es 5%.

4. Presente una tabla que clasifique a las personas de su muestra según la


región donde vive y según su nivel educativo. Realice un test de independencia
entre las variables region y nivel_ed. En todos los casos deben quedar claras
las hipótesis nula y alternativa, la distribución muestral usada, el valor del
estadístico de prueba y la decisión de rechazar o no. El nivel de
significatividad es 5%.

5. Presente un diagrama de dispersión en donde en el eje horizontal este la


variable EDAD y en el vertical el logaritmo del ingreso total. Obtenga el
coeficiente de correlación entre estas dos variables y comente cómo es la
relación lineal. Obtenga también la pendiente y la ordenada al origen de la
recta de regresión y comente la significatividad estadística de estas últimas
estimaciones. Interprete cuidadosamente el significado de la estimación de la
pendiente. Presente en una tabla los resultados de la estimación: la tabla debe
incluir las estimaciones de los coeficientes, los errores estándares y debe
quedar claro si la estimación es estadísticamente significativa o no.
En lo que sigue va una lista de instrucciones adicionales para ir respondiendo las
preguntas del trabajo.

Statistics → Summaries, tables and tests → Summary and descriptive


statistics → Summary statistics.
Data → Create or change data → Create new variable.
Statistics → Summaries, tables and tests → Summary and descriptive
statistics → Summary statistics (option display additional statistics).
Graphics → Histogram. (Chequeen en la pestaña Density plots para agregar
el gráfico de la normal)
Para aplicar la regla empírica de la distribución normal deberán contar
cuántas observaciones hay a una desviación estándar desde la media, a dos
desviaciones estándares desde la media y a tres desviaciones estándares
desde la media. Para contar observaciones según distintos criterios pueden
escribir lo siguiente en la ventana de comandos: “count if y<=14”. “y” es el
nombre de la variable en cuestión. Ese comando contará cuántas
observaciones hay tales que la variable “y” es menor o igual a 14.
Recuerden que Stata no resta el 3 cuando calcula la curtosis.
Statistics → Summaries, tables and tests → Classical test of hypotheses → t-
test.
Statistics → Summaries, tables and tests → Classical test of hypotheses →
Variance-comparison test.
Statistics → Summaries, tables and tests → Frequency tables → Two way
table with measures of association. La opción Pearson’s chi-squared realiza el
test de independencia que se pide.
Graphics → Twoway graph → Create → Scatter.
Pueden editar el gráfico que hagan apretando en “Start Graph Editor”. Usen
esta opción para poner bien el nombre de los ejes, incluir títulos y referencias.
Statistics → Summaries, tables and tests → Summary and descriptive
statistics → Correlations and covariances.
Statistics → Linear model and related → Linear regression.

Вам также может понравиться