Вы находитесь на странице: 1из 13

*************************************

*Trabajo de Stata

*************************************

*DETERMINANTES DE LA DESIGUALDAD EN CHILE, POR FACTOR POBREZA

*************************************

*************************************

*2018

*************************************

clear all

set more off

cd "C:\Users\sermu\OneDrive\Escritorio\Nueva carpeta"

cap log close

log using trabajoecon.txt, replace text

**************************************

*PREGUNTA DE INVESTIGACIÓN

*¿Cuáles son las fuentes de la desigualdad de ingresos en Chile??

**************************************

*Evaluado desde el nivel de pobreza.

*Variable dependiente: pobreza_multi_4d

*Variables independientes: esc ecivil tot_per sexo edad

clear all

use Casen2015, clear

*Importando base de datos.

*************************************

tab pobreza_multi_4d, nolabel

keep pobreza_multi_4d esc ecivil tot_per sexo y0101h edad


*Balanceando la base de datos y filtrando

drop if y0101h==0

*------------------------

drop if esc==.

drop if pobreza_multi_4d==.

//Estableciendo el modelo para estimar

*Variable dependiente

*- Condición de pobreza

rename pobreza_multi_4d pob

rename y0101h ingss

*Variables independientes:

*- esc ecivil tot_per sexo edad

************************************************************

*Var. Sexo, realizaremos una recodificación:

recode sexo (1 = 0) (2 = 1), gen(sex)

label define sex 0 "Hombre" 1 "Mujer"

drop sexo

*Sueldo y salario, sacaremos el logaritmo para suavizar

*la serie y diferencia entre ambos:

gen lingss=ln(ingss)

label var lingss "Logaritmo de sueldos y salario"

************************************************************

*Guardemos la base para proceder a la estimación

save bdtrabajofinal.dta, replace

************************************

*1. TABLA DE ESTADÍSTICA DESCRIPTIVA

************************************

sum
*Descripción e interpretación estadística:

*N=143049 observaciones

*Variables exógenas

*- Total de personas

*El promedio de personas que viven en un hogar de Chile

* es de 4 personas

*- edad

*El promedio de la edad en esta muestra es de 40 años.

*Años de educación:

tab esc sex

*Los años de educación promedio es de 11 años

*pero existen personas que tienen entre 0 y 22 años

*lo que podria indicarme que existiria algun tipo de error de medida.

*- Pobreza y años de escolaridad

tab esc pob

*Esto nos indica que la mayor proporción de pobres

*tienen hasta 12 años de educación.

*- Pobreza

tab pob

*Esta variable independiente indica que un 80% de la población

*se encuentra en una ubicación por encima de la pobreza.

*Pero aun existe una parte amplia que concentra el 20% de pobreza.

*Sexo:

tab sex

*El 74% de toda la muestra es femenina

*Salarios y sueldos:

sum ingss

*El sueldo promedio es $681376.8 pesos.


************************************

* ESTIMANDO EL MODELO POR MCO

************************************

reg pob tot_per edad ecivil lingss esc sex

*Guardando los coeficientes

estimates store modelA

************************************

*Mostrando los valores en una tabla de trabajo

estimates table modelA, b( %7.2f) se( %7.2f) p( %7.2f) stats(N r2_a aic bic)

tab pob, nolabel

*Interpretacion del Cuadro ANOVA - Resultados

*********************************

/*Asumiendo "ceteris paribus", las demás variables

Efecto marginal de la variable "edad" : b(edad)= -0.0007

Si la "edad"(1ra var.independiente) aumenta en 1 unidad,

entonces, la probabilidad de "ser pobre"(var.dependiente) disminuye en 0.0007

Efecto marginal de la variable "tot_per" : b(tot_per)= 0.0662

Si el número de personas aumenta en 1 unidad,

entonces, la probabilidad de "ser pobre"(var.dependiente) aumenta en 0.0662

Efecto marginal de la variable "sexo" :

La probabilidad que una mujer sea pobre a comparación del hombre, es menor

en 0.0174.

Efecto marginal de la variable "esc" : b(esc)= -0.02

Si la "esc", aumenta en 1 unidad,

entonces, el la probabilidad de ser pobre disminuye en 0.02.


Efecto marginal de la variable "ecivil" :

La probabilidad que una personas casada sea pobre a comparación de otros estados civiles

aumenta en 0.002.

Efecto marginal de la variable "lingss" : b(lingss)= -0.067

Si el sueldo de una persona aumenta en 1 unidad,

la probabilidad de ser pobre disminuye en 0.067.

*/

/*SIGNIFICANCIA INDIVIDUAL

===================================

*Utilizaremos las pruebas "t" student:

*Evaluar "t-student"

======================

*Ho: b=0 , el parametro NO ES SIGNIFICADO

*Ha: b!=0 , el parametro SI ES SIGNIFICATIVO

Evaluando el estadístico de t-student:

=======================================

Hipotesis nula:

Ho el parametro no es significativo

Hipotesis alternativa

H1 no cumple Ho entonces es significativo

Regla: prob < 5% => Rechazo la Ho,SI ES SIGNIFICATIVO DE MANERA INDIVIDUAL

"TOTAL DE PERSONAS"
P>!t!: prob(esc)=0.000 < 5%...Si es significativo

"EDAD"

P>!t!: prob(sex)=0.000 < 5%...Si es significativo

"ESTADO CIVIL"

P>!t!: prob(edad)=0.000 < 5%...Si es significativo

"SUELDO Y SALARIO"

P>!t!: prob(edad)=0.000 < 5%...Si es significativo

"SEXO"

P>!t!: prob(edad)=0.000 < 5%...Si es significativo

"AÑOS DE ESCOLARIDAD"

P>!t!: prob(edad)=0.000 < 5%...Si es significativo

Evaluando el estadístico F-Fisher:

====================================

Ho: b(edad)= b(sexo) = b(esc)=0

H1: Rechazo Ho, si es significativo

Regla: Prob. Fisher < 5% => Rechaza Ho

Por lo tanto las variables explicativas SI SON SIGNIFICATIVOS

de manera CONJUNTA.

Como podemos apreciar:

Prob > F = 0.0000 < 5%

Entonces Rechazo la Ho, todas las variables

SI SON SIGNIFICATIVAS de manera CONJUNTA.

BONDAD DE AJUSTE DEL MODELO

*****************************
*Coeficiente de Determinación R2

*R2= R-squared(solo R squared) = 0.1461 = 14.61%

El 15.2% de la variabilidad de ser pobre es explicada por las

variables independientes, incorporadas en este modelo

**EL MODELO TIENE PROBLEMAS DE IDENTIFICACIÓN DE LA VARIABLE

DEPENDIENTE DEBIDO A QUE SE ESTA ESTIMANDO CON UN MODELO

DE PROBABILIDAD LINEAL YA QUE ESTA SE CONSIDERA DICOTÓMICA, SE TIENE

QUE CORREGIR ESTE PROBLEMA EN LA POST-ESTIMACIÓN.

*/

***************************************************

*Análisis de los SUPUESTOS DE MCO

***************************************************

*Supuestos del MRLM

*HOMOSCEDASTICIDAD

****************************************************

*¿La varianza de los errores es constante (contraste de

*Heterocedasticidad)?

reg pob tot_per edad ecivil lingss esc sex

//Predecir la variable dependiente

predict redpob, xb

//Obteniendo los errores del modelo

predict u, resid

//Creamos la variable error al cuadrado

gen u2=u*u

*Contraste de Breush-Pagan

reg u2 tot_per edad ecivil lingss esc sex

*Rechazo hipotesis nula por lo tanto existe Heterocedasticidad


*Test de white

reg pob tot_per edad ecivil lingss esc sex

whitetst

*Rechaza la Ho por lo tanto existe Heterocedasticidad

*Test de Breusch-Pagan

reg pob tot_per edad ecivil lingss esc sex

hettest

*Rechaza la Ho por lo tanto existe Heterocedasticidad

*Test de Glejser

lmhgl pob tot_per edad ecivil lingss esc sex

*Rechaza la Ho por lo tanto existe Heterocedasticidad

*Cual sería el origen de este problema

/*Lo que sucede que la muestra presenta una varianza distinta

para cada variable por lo que podemos determinar que no es constante

para los errores del modelo y no se cumple el supuesto, como indican

los test de hipotesis.

*Que efecto tendria sobre las estimaciones y los contrastes de

hipótesis.

Los estimadores serian ineficientes, por lo que tambien

los contrates de hipotesis perderian cierto grado de relevancia.

*Solución de la heterocedasticidad para el modelo*/

reg pob tot_per edad ecivil lingss esc sex, robust


estimates store modelB

*Mostrando los resultados

estimates table modelB modelA, b( %7.2f) se( %7.2f) p( %7.2f) stats(N r2_a aic bic)

*MULTICOLINEALIDAD

*****************************************************

* Corr(X's) debe ser bajo

*Factor de inflación de varianza:

reg pob tot_per edad ecivil lingss esc sex, robust

vif

*El test VIF identifica que sus valores son menores que 10 por lo tanto

*No Existe presencia de multicolinealidad

*NO ENDOGENEIDAD

*****************************************************

*Comprobemos si hay variables omitidas:

*Test de Ramsey

reg pob tot_per edad ecivil lingss esc sex, robust

ovtest

*Al resultar que el P-valium es menor a 0.05 nos lleva a la conclusión que se

*rechaza la hipotesis nula del test por tanto existe presencia de

*omisón de alguna variable independiente relevante.

*Test Link

linktest

*Existe Endogeneidad, posibilidad que exista alguna variable relevante que

*se este omitiendo.


*El problema.

/*Lo que sucede que al parecer para este modelo existe un problema

de omitir alguna variable que podria mejorar la estimación del

modelo por lo que se tendria que evaluar la significancia.

*Efectos.

El efecto sobre los estimadores es que resultarian inconsistentes

y por lo tanto los contrastes de hipotesis usados no tendrian un

comportamiento normal y resultaria muy complicado seguir utilizando

este modelo.*/

*NO AUTOCORRELACIÓN

*****************************************************

*Creamos una variable de Series de tiempo: 1,2,....

gen id=_n

tsset id

*Test Durbin watson:

reg pob tot_per edad ecivil lingss esc sex L.u, robust

estat dwatson

*No Existe presencia de autocorrelación ya que el estadístico tiende a 2.

*NORMALIDAD

****************************************************

*Gr᧩cos del error

pnorm u

*Como podemos observar su distribución no seria linea

*Posible dato para estimar un modelo más alineado a este caso.

*ademas existen valores que estan por debadjo de 0, y esto es ilogico


*cuando hablamos de probabilidad.

qnorm u

*Test de S.wilk

swilk u

*Es de 0.000 menor al 5% No hay presencia de normalidad

*Test de Shapiro

sfrancia u

*Es de 0.000 menor al 5% No hay normalidad

*No Existe presencia de normalidad

***************************************************

* MODELO FINAL

***************************************************

logit pob tot_per edad ecivil lingss esc sex, vce(robust)

*Este modelo representa mejor la predicción del modelo.

*y asi podemos realizar inferencia.

predict yhat

predict xb, xb

label var xb "xb (index)"

*Gráfica de probabilidad

scatter pob yhat xb, symbol(+ o)

*Como podemos ver la predicción se ajusta a los niveles de probabilidad

mfx //Efectos marginales

*Estos resultados indican que en promedio de la muestra

*La probabilidad promedio de ser pobre es de 14 unidades porcentuales.

*La probabilidad que el total de numero de personas afecte a la pobreza


*aumenta en 0.06 unidades porcentuales.

*La probabilidad que una persona tenga un año más de edad se reduce en

*0.001 unidades porcentuales.

*La probabilidad que una persona casa sea pobre aumenta en 0.0008 (+realista)

*Ante un aumento de los ingresos la probabilidad de que una persona sea pobre

* disminuye en 0.078 unidades porcentuales

*Ante un aumento de los años de educación la probabilidad de que una persona sea pobre

* disminuye en 0.020 unidades porcentuales

*La probabilidad que una persona del sexo femenino sea pobre disminuye en 0.02

*a comparación del hombre (HOMBRES POBRES)

***************************************************

*PREGUNTA DE INVESTIGACIÓN

*¿Afectan los años de educación, la edad y el sexo

*como determinantes para el salario?

***************************************************

***************************************************

/*RESPUESTA DE TRABAJO

***************************************************

La decisión de las variables económicas utilizadas en esta

investigación son las siguientes:


Responden la pregunta de investigación definido por la diferencia entre ser pobre y no pobre,

los datos nos indican que los ingresos son determinantes para las condiciones de pobreza como

tambien lo son la educacion, pilares maximos para el desarrollo de una economia

asi mismo podemos ver que ante un mayor numero de personas en un hogar la concentracion

de ingresos es más delgada por lo que es más probable que se viva en condiciones más
necesitadas

la edad, el estado civil no serian un factor tan determinando en la desigualdad pero nos da

un pequeño grado de inferencia, en el caso del sexo de la persona nos indica que las mujeres

suelen tener menos problems de pobreza que los hombres, pese a ser una cantidad mayor que la
de

los hombres a nivel demografico.

*/

log close

Вам также может понравиться