Вы находитесь на странице: 1из 25

Examen práctico

Nombre: Benjamín Segoiva


Pregunta 1

a. Generar tabla de contingencia

Primero, para generar una tabla de contingencia, usamos el siguiente comando:

CrossTable(sitecon, pospol, sort = T)


B) Se quiere saber si hay asociación entre situación económica e identificación política.
Para esto, se calcula con un test estadístico de Chi-cuadrado dado que me preguntan por
asociación entre dos variables categóricas. Para realizar el test, primero debo abrir la base
de datos con el siguiente comando:

cep61<- cep61%>%mutate(sitecon = as.factor(sitecon), pospol = as.factor(pospol))

y luego usar el comando del test chicuadrado:


chisq.test(base de datos$situación económica, base de datos $identificación política,
simulate = T)

C) Para determinar cómo testear la hipótesis generamos:

cep61<- cep61%>%mutate(sitecon = as.factor(sitecon), pospol = as.factor(pospol))

skim(cep61$pospol)

Para el test Chi-cuadrado:


chisq.test(cep61$sitecon, cep61$pospol, simulate = T)

###Podemos concluir que con un nivel de significancia del 0.05, se rechaza la hipótesis
nula. Es decir, hay asociación entre situación económica e identificación política.

Podemos ver gráficamente el resultado según el comando usado:


Pregunta 2:

Un investigador busca evaluar si el promedio de edad es diferente entre quienes siempre


prefieren democracia y quienes considera que da lo mismo. Para su respuesta, use la base
de datos “cep61.csv”. Realize un test de hipótsis (recuerdo presentar los 5 pasos del test de
hipótesis)

TE1P01: 1 La democracia siempre es preferible a otra forma de gobierno


2 En algunas circunstancias, un régimen autoritario puede ser mejor que uno democratico
3 Da lo mismo un régimen democrático que uno autoritario
8: no sabe 9: no responde.

Primero buscamos crear una nueva variable para explicar

B1 <- cep61%>%dplyr::select(TE1P01, edad) %>% filter(TE1P01 ==1)


B1<-as.data.frame(g1)
view(g1)

B3 <- cep61%>%dplyr::select(TE1P01, edad) %>% filter(TE1P01 ==3)


B3<-as.data.frame(g3)
t.test(g1,g3)

Restringimos la base para que sólo de valores 1 y 3 que es lo que estamos buscando.
Hacemos entonces el Test de hipótesis y nos da como resultado que no se rechaza la hipótesis
nula donde el promedio de edad no es diferente entre quienes prefieren la democracia y
quienes considera que da lo mismo.

Pregunta 3:

Explique en términos sustantivos las diferencias entre los modelos 1, 2 y 3.


Primero, vamos a crear los cuatro modelos:
Abrimos la base:

precios <- read_csv("~/Desktop/Clases Benja/Examen R/precios.csv")

View(precios)
precios
summary(precios) ##Con esto podemos tener un resumen.
skim(precios)
Para crear modelos, necesitamos escribir ##nombre_modelo <- lm(VD ~ X1 + X2 + X3, data
= nombre_base)

Modelo_1 <- lm(lnprecio ~ crimen + nox + habs + nueva + distancia, data = precios)
summary(Modelo_1)

Gráfico del modelo 1

# Modelo (2)

Modelo_2 <- lm(lnprecio ~ crimen + nox + habs + nueva + distancia + (habs*distancia), data
= precios)

summary(Modelo_2)
Gráfico modelo 2

#Modelo (3)

Modelo_3 <- lm(lnprecio ~ I(crimen^2) + nox + habs + nueva + distancia + (habs*nueva),


data = precios)

summary(Modelo_3)
Gráfico modelo 3

#Modelo (4)

Modelo_4 <- lm(lnprecio ~ crimen + nox + I(nox^2) + habs + nueva + distancia +


(habs*nueva), data = precios)

summary(Modelo_4)
Las diferencias sustantivas básicamente es que, entre los Modelos 1, 2 y 3.
El modelo 1 es el modelo completo, o no restringido, donde se ubican todas los regresores.
El modelo 2 y el modelo 3 vemos que se integra una interacción entre dos regresores, en este
caso, vemos una interacción entre la variable “habs” y la variable “nueva”.
Una última diferencia es que el Modelo 3, a diferencia del resto de los mencionados, se
integra una variable con función cuadrática.

Gráficos de los modelos:

Modelo 2:
Gráfico Modelo_2
Gráfico Modelo_3
Gráfico Modelo_4
#Modelo (5):

Modelo_5 <- lm(lnprecio ~ log(crimen) + nox + I(nox^2) + habs + nueva + distancia +


habs*nueva , data = precios)
B) Considerando los modelos 2, 3, 4 y 5: seleccione el “mejor modelo”. Justifique su
respuesta. En ella, incluya la prueba-F, pruebas de heterocedasticidad, la prueba RESET, la
prueba Davidson-MacKinnon en caso que se apropiado. Así mismo, incluya en sus
respuestas la interpretación de los tests que realice.

Primero:
Supuestos:
 Gauss Markov + Normalidad de los errores

Test Breush Pagan

Con Test Breush Pagan se analiza la varianza del error de los 5 modelos. De esta
forma se hace el comando:

bptest(Modelo_2)
bptest(Modelo_3)
bptest(Modelo_4)
bptest(Modelo_5)
Prueba de Rest

Luego, con la no-linealidad de la forma funcional mediante del test RESET

resettest(Modelo_2)
resettest(Modelo_3)
resettest(Modelo_4)
resettest(Modelo_5)
Test de restricciones múltiples

Para Test de restricciones múltiples, utiliamos el siguiente comando:

anova(Modelo_2, Modelo_3, Modelo_4, Modelo_5)

Para prueba de heterocedasticidad, usamos el siguiente comando:

par(mfrow = c(2,2))
plot(Modelo_2, which = 1, main="Modelo 2")
plot(Modelo_3, which = 1, main="Modelo 3")
plot(Modelo_4, which = 1, main="Modelo 4")
plot(Modelo_5, which = 1, main="Modelo 5")

ncvTest(Modelo_2)
ncvTest(Modelo_3)
ncvTest(Modelo_4)
ncvTest(Modelo_5)
Interpretación: Cada Modelo analizado presenta heterocedasticidad. Sin embargo, el Modelo
5 pareciera ser el mejor modelo.
Prueba de F

Prueba F entre modelos y compararlos. Escogemos el siguiente comando:

anova(Modelo_2, Modelo_3) ## Escogemos el Modelo_3


anova(Modelo_4, Modelo_5) ## Escogemos el modelo_5

Prueba de Davidson- MacKinnon

Por último, para realizar la prueba Davidson-MacKinnon entre 3 y 5, debemos escoger el


siguiente comando:

jtest(Modelo_3, Modelo_5)

Según los resultados entregados, se concluye que en el modelo 5 explica más varianza que el
resto de los modelos.
c. Interpretar el modelo 5 seleccionado:
Con el paquete stargazer creamos la tabla:

> stargazer(Modelo_1, Modelo_2, Modelo_3, Modelo_4, Modelo_5, type = "text",


+ title = "Tabla 1",
+ out = "tabla.html")

Interpretación:
 Intercepto: Manteniendo todos los demás valores iguales a cero, el intercepto es de
14.118.
 Variable log(crimen): El aumento de 1% de crimen, disminuye en porcentaje -0.061
el precio de las casas, manteniendo todo lo demás constante.
 Nox (cantidad de oxígeno): El aumento de una unidad de nox disminuye en 1.084 %
el precio de las casas, manteniendo todo lo demás constante.
 I(nox2): Variable cuadrática. Quiere decir que es positiva, sin embargo, su resultado
es decreciente. Por consiguiente, el efecto marginal de nox sobre el precio de las casas
depende del valor dado a nox.
 Habs (Número de habitantes): El aumento de una unidad de habs aumenta en 0.243
% el precio de las casas, manteniendo todo lo demás constante.
 Nueva (Si la casa es nueva o no): El aumento de una unidad de nueva disminuye en
0.067 % el precio de las casas, manteniendo todo lo demá´s constante.
 Interacción entre variable habs y nueva: Es decir, hay multicolinealidad entre ambas
variables. Una depende de la otra en el efecto sobre el precio de las casas.
 Este es el Modelo restringido porque excluye la variable I(crimen^2).

d. Calcule el intervalo de confianza de la estimación del valor esperado del ln(precio), es


decir, el valor promedio (en logaritmo) de una casa con las siguientes características:
nueva, 3 habitaciones, en una comunidad con 0.25 crímenes reportados per cápita, un nivel
de NOx de 5.2 y distancia de 4kms. Interprete.

Para hacer predicciones, seleccionamos el siguiente comando:

prediccion_lnprecio <- with(Modelo_5, data.frame(nueva=1, habs=3, crimen=0.25,


"I(nox^2)"=5.2, nox=5.2, distancia=4 ))

ic <- predict(Modelo_5, newdata = prediccion_lnprecio, interval = "confidence")

ic

Me predice que el modelo 5 tiene 8.838091

Interpretación: Para realizar la predicción, ocupamos el Modelo 5. Esto quiere decir, que el
valor promedio de la casa con las siguientes características: nueva, 3 habitaciones, en una
comunidad con 0.25 crímenes reportados per cápita, un nivel de NOX de 5.2 y distancia de
4 kms se encuentra en ese intervalo de 95%.

E. Calcular el intervalo de confianza de la predicción de ln(precio) para una casa en particular


con las mismas características en d). Interprete. Explique porqué varía su respuesta con
respecto a d)
Interpretación con respecto a la d:

Вам также может понравиться