Академический Документы
Профессиональный Документы
Культура Документы
27 de Marzo de 2019
Resumen
El presente documento presenta los elementos de un modelo econométrico básico, en un caso
inicial con una variable dependiente y una sola variable independiente.
2. El modelo es estocástico, la variable Y estimada depende del azar, esto es, al incorporarse un
elemento estocástico ui , la relación entre la variable endógena y la(s) explicativa(s) se transforma
en estocástica.
3. Las variable Xk son deterministas, esto es los valores de las variables explicativas son los mismos
en muestras sucesivas (son fijas).
1
Ver Qin (2013)
2
Mediante la construcción de los llamados modelo estructurales.
3
El método que usaremos es el de mínimos cuadrados, otros métodos son: máximo-verosimilitud y los métodos no lineales.
4
Una tabla comparativa de supuestos del modelo de regresión, presentes en algunos textos básicos en econometría se puede
revisar en el anexo del presente documento.
1
Sean dos variables, Y e X1 , donde Y es la variable que queremos explicar con la información de
X1 , la información proviene de una muestra adecuadamente tomada (aleatoria) en un punto en el tiempo,
que se denomina sección cruzada, cada par de n observaciones se denotará por (Xi ,Yi ). Por ejemplo si
deseamos analizar la relación entre Yi e Xi en un gráfico de dispersión podemos observar una relación
como se observa en le Figura 1:
En la Figura 1, una línea puede «resumir» la relación entre X1 e Y, la línea roja (calculada mediante
el método econométrico apropiado) minimiza «lejanía» de los valores estimados respecto a la relación
lineal, esta medida es la suma cuadrática de la distancia entre los valores observados y la línea misma
en cada observación de X, si escribimos esta diferencia (para cada observación) como Y i − Ŷi , donde
Ŷi = β0 + Xi + ui , podemos afirmar que la sumatoria de los residuos cuadráticos es:
N
X
(Yi − β0 − β1 Xi )2 (1)
N =1
Si ampliamos el gráfico anterior, en la Figura 2, por ejemplo para el valor de X1 = 5, podemos ver que
el valor de Yi (el valor de Y observado) es menor al valor estimado en el modelo produciendo un error
por exceso, si de manera similar observamos los demás residuos tendremos otros residuos por defecto,
se desea que estos residuos tengan el menor valor posible, por lo que usaremos los métodos estadísticos
disponibles para encontrar una formulación que cumpla esa tarea.
2
Podemos afirmar que el valor de Yi , tiene dos partes o componentes, una parte sistemática: β0 +β1 Xi ,
y una parte no sistemática: ui . Mediante un procedimiento de minimización, se deriva la expresión
anterior respecto a las variables de decisión β0 y β1 , y las igualamos a cero, tenemos.
∂(.)
=0
∂β0
∂(.)
=0
∂β1
Según conocemos del cálculo diferencial (la regla de la cadena), dado y = f (w) y a su vez w =
f (x), la derivada de y respecto a x es:
dy dy dw
=
dx dw dx
Usando el concepto de función de función obtenemos:
N
∂(.) X
= −2 (Yi − β0 − β1 Xi ) = 0
∂β0
N =1
N
∂(.) X
= −2 (Yi − β0 − β1 Xi )Xi = 0
∂β1
N =1
Efectuando las sumatorias de las expresiones anteriores, obtenemos dos resultados importantes en la
teoría econométrica:
Primera ecuación normal:
N
X N
X
Yi = nβ0 + β1 Xi (2)
N =1 N =1
3
Ȳ = β0 + β1 X̄ (5)
La ecuación anterior nos indica que la relación lineal estimada «pasa» por los valores medios de las
variables involucradas.
Desarrollando el paréntesis de la segunda ecuación normal:
N
X N
X N
X
Xi Yi − β0 Xi − β1 Xi2
n=1 n=1 n=1
N
X N
X N
X
Xi Yi = β0 Xi + β1 Xi2
n=1 n=1 n=1
N
X N
X N
X N
X
Xi Yi = Ȳ Xi − β1 X̄ Xi + β1 Xi2
n=1 n=1 n=1 n=1
N
X N
X N
X N
X
Xi Yi − Ȳ Xi = β1 Xi2 − β1 X̄ Xi
n=1 n=1 n=1 n=1
N
X N
X N
X N
X
Xi Yi − Ȳ Xi = β1 Xi2 − X̄ Xi
n=1 n=1 n=1 n=1
Las ecuaciones (4) y (6), muestran los estimadores de los parámetros (poblacionales) del modelo
planteado. Llamaremos ui a los errores, estos tienen las siguientes propiedades:
N
X
ûi = 0 (7)
n=1
N
X
ûi Xi = 0 (8)
n=1
4
2.1. El modelo en diferencias
Una forma muy utilizada en econometría para expresar las ecuaciones de manera simplificada es
definiendo las variables “en diferencias respecto a la media” donde a cada serie de observaciones de X
e Y se le resta la media muestral respectiva, esto es:
yi = Yi − Ȳ
xi = Xi − X̄
Si se realiza esto el modelo adquiere las siguientes propiedades:
N
X
xi = 0
n=1
N
X
yi = 0
n=1
N
X N
X
xi Xi = x2i
n=1 n=1
N
X N
X
yi Yi = yi2
n=1 n=1
N
X N
X N
X
x i yi = xi Yi = Xi yi
n=1 n=1 n=1
Sea Yi = β0 + β1 Xi + ui y Ȳ = β0 + β1 X̄ es:
Yi − Ȳ = β0 + β1 Xi + ui − β0 − β1 X̄
Yi − Ȳ = β1 (Xi − X̄) + ui
Es decir:
yi = β1 xi + ui
Gráficamente se puede observar un desplazamiento de las observaciones hacia el origen. Conside-
rando que los residuos de este modelo son:
yi − β 1 x i
Mediante un proceso similar al de la minimización de la sumatoria de residuos cuadráticos tenemos:
N
X N
X
û2 = (yi − β1 xi )2
n=1 n=1
Introduciendo xi :
5
N
X
(yi xi − β1 x2i ) = 0
N =1
N
X N
X
yi x i − β 1 x2i = 0
N =1 N =1
β1 es entonces:
N
X
xi yi
n=1
β1 = N
(10)
X
x2i
n=1
6
Tomando la esperanza de βˆ1 , tenemos:
N
1 X
E(βˆ1 ) = β1 + N
xi E(ui )
n=1
X
x2i
n=1
Por el supuesto inicial del modelo de regresión, E(ui ) = 0, por lo que el segundo término es cero.
Obtenemos la propiedad de insesgamiento de beta:
E(βˆ1 ) = β1
Analizando la varianza de beta, sabemos por definición de la varianza:
N
X
xi ui
2
n=1
var(βˆ1 ) = E N
X
x2i
n=1
N
X 2
1
var(βˆ1 ) = N E xi ui
X 2 n=1
2
xi
n=1
N
X N X
N
1 X
var(βˆ1 ) = N E x2i u2i +2 xi xj ui uj
X 2 n=1 j=1 n=1
x2i
n=1
N
X N X
N
1 X
var(βˆ1 ) = N x2i E[u2i ] +2 xi xj E[ui uj ]
X 2 n=1 j=1 n=1
x2i
n=1
σ2
var(βˆ1 ) = N
(12)
X
x2i
n=1
7
2.1.2. Determinación de σ 2
Si a la ecuación inicial Yi = β0 + Xi + ui le restamos Ȳ = β0 + β1 X̄ + ū, se obtiene:
Yi − Ȳ = β0 − β0 + β1 (Xi − X̄) + ui − ū
Que es la expresión del modelo en diferencias (en el ámbito poblacional).
ei = yi − βˆ1 xi
Reemplazando la ecuación 13 en la expresión anterior:
e2i = (β1 − βˆ1 )2 x2i + (ui − ū)2 + 2(β1 − βˆ1 )xi (ui − ū)
Aplicando la sumatoria:
N
X N
X N
X N
X
e2i = (β1 − βˆ1 )2 x2i + (ui − ū)2 + 2(β1 − βˆ1 ) xi (ui − ū)
n=1 n=1 n=1 n=1
Tomando la esperanza:
N
X N
2 X N
X N
X
E e2i ˆ
= E (β1 − β1 ) 2
xi + E 2 ˆ
(ui − ū) + 2E (β1 − β1 ) xi (ui − ū)
n=1 n=1 n=1 n=1
N
X N
2 X PN 2 N
n=1 (ui − ū)
X
E e2i ˆ
= E (β1 − β1 ) 2
xi + (n − 1)E ˆ
+ 2E (β1 − β1 ) xi (ui − ū)
n−1
n=1 n=1 n=1
y en el tercer sumando reemplazamos (β1 − βˆ1 ) por la ecuación 11, y desarrollando el tercer múltiplo
del tercer término:
N
X
N 2 XN PN xi ui N N
X 2
n=1 (ui − ū) n=1 X X
e2i ˆ 2
E = E (β1 −β1 ) xi +(n−1)E −2E N xi ui − xi ū)
n−1
n=1 n=1 n=1 n=1
X
x2i
n=1
N
X
N 2 XN PN xi ui N
X
(u − ū) 2
n=1 i n=1 X
e2i ˆ 2
E = E (β1 − β1 ) xi + (n − 1)E − 2E N xi ui
n−1
n=1 n=1 n=1
X
x2i
n=1
8
PN 2
PN 2
Se multiplica por n=1 xi / n=1 xi al tercer término para no alterar la ecuación:
N
X
N 2 XN N
xi ui
X PN 2 2
(ui − ū) X n=1
E e2i = E (β1 − βˆ1 ) 2
xi + (n − 1)E n=1
−2 2
xi E
n−1 N
n=1 n=1 n=1
X
x2i
n=1
N
X
P "" xi ui #2 #
N 2
n=1 (ui −ū)
Sabemos que E(β1 − βˆ1 )2 = var(βˆ1 ), E n−1 = var(ui ), y E n=1
N
=
X
x2i
n=1
var(βˆ1 ), reemplazando en la ecuación anterior:
N
X N
X N
X
E e2i = var(βˆ1 ) x2i + (n − 1)var(ui ) − 2 x2i var(βˆ1 )
n=1 n=1 n=1
Simplificando:
N
X
E e2i = σ 2 + (n − 1)σ 2 − 2σ 2
n=1
N
X
E e2i = (n − 2)σ 2 (14)
n=1
Se le llama s2 al estimador de σ 2 :
N
X
e2i
i=1
s2 = σ̂ 2 = (15)
(n − 2)
9
Si β0 o β1 se distribuye como una normal, podemos utilizar el intervalo de confianza que propor-
ciona la distribución de probabilidad normal para comparar el valor puntual obtenido en el proceso de
estimación con este intervalo. En el caso del contraste de hipótesis de los parámetros beta del modelo, la
hipótesis nula a plantear es que los betas “no son significativos” por lo tanto se plantearía una hipótesis
nula como:
H0 : β̂i = 0
La hipótesis alternativa es que el estimador sea “significativo” por lo tanto, el complemento de la
afirmación anterior es:
Ha : β̂i 6= 0
Luego del proceso de “estandarización” del parámetro estimado, que consiste en restarle la media
esperada (cero) y dividirlo entre la desviación estándar (aproximada mediante s2 ), obtenemos una nueva
variable, que se debe distribuir según los percentiles de la función de probabilidad conocida (la normal o
una distribución con propiedades establecidas); como la desviación se aproxima mediante s2 , la variable
resultante se distribuye según la función de distribución t-Student. Si el valor de esta nueva variable “está
cerca” del valor que tendría bajo la hipótesis nula (cero), entonces se puede afirmar que la diferencia
entre el estimador y el verdadero valor del estimador (bajo la hipótesis inicial, la hipótesis de cero efecto
de Xi sobre Y ) es muy baja, por tanto no podemos eliminar la posibilidad estadística que no hay efecto
de Xi sobre Y 5 . El intervalo definido por estos límites determina en la función de distribución, un área
o zona “de no rechazo” o no descarte que, efectivamente X no tenga influencia en Y . Podemos resumir
lo anterior en el gráfico siguiente:
El tamaño del área que define el intervalo de referencia depende del “riesgo” que se pueda asumir
ante el error, este “riesgo” es de α %, el error que se tendría al equivocarse, en este caso sería aceptar
que no hay influencia de X sobre Y, dado que si la hay (aceptar la hipótesis nula como cierta, sin serla),
este es el error tipo I, se asume generalmente que un riesgo adecuado sería del 5 %. Al complemento del
riesgo se le denomina "nivel de confianza"(1 − α).
En el caso que el ratio entre el beta calculado y la desviación estándar del beta sea cercano a 0,
existiría evidencia que se cumple la hipótesis nula, en el caso contrario más bien existiría evidencia que
beta no se acerca a 0.
5
A esta última afirmación se le menciona como “no se puede rechazar la H0 ”
10
El límite entre el intervalo de “aceptación” de la hipótesis (nula) y el “rechazo” está dado por el
percentil de la distribución que define un área igual al riesgo que se desea asumir, a los lados de la distri-
bución. Para un nivel de 5 % el percentil de la distribución t está en función del número de observaciones
del modelo ajustadas por los parámetros estimados: n − k − 1.
Supongamos que en una regresión se obtienen los siguientes datos 6 :
------------------------------------------------------------------------------
testscr | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
str | -2.279808 .4798256 -4.75 0.000 -3.22298 -1.336637
_cons | 698.933 9.467491 73.82 0.000 680.3231 717.5428
------------------------------------------------------------------------------
Donde:
testscr = promedio de notas de las áreas de matemáticas y, letras
str = ratio estudiante/docente
Estamos interesados en probar la hipótesis que la variable str no tiene influencia sobre (testscr) (H0 ),
contra la hipótesis que si tiene influencia (Ha ). Bajo los supuestos mencionados el ratio β1 /sd(β1 ) se
distribuye como una variable t con (n − k − 1) grados de libertad y un nivel de confianza de α %.
Ubicamos el valor crítico en la tabla, en k = 418 y α = 5 %, el valor crítico (t de tabla) es de 1.9657.
Por lo tanto el valor t obtenido en la regresión es mayor al valor crítico de tabla, concluimos que no
podemos aceptar la H0 , por tanto no hay evidencia que β1 = 0 7 .
2.2.1. Ejemplo 0
Comenzaremos verificando las propiedades del modelo lineal de una variable mediante un ejemplo
numérico que el lector puede verificar manualmente, lo que se recomienda. Sea una “muestra” 8 de las
siguientes observaciones de X e Y.
Los estadísticos necesarios para calcular los betas en las ecuaciones normales serán:
3
X 3
X 3
X 3
X
X = 6, Y = 14, X 2 = 14, XY = 31, n = 3
i=1 i=1 i=1 i=1
6
Ver Wooldridge (2010)
7
En una hoja de cálculo Microsoft Excel este estadístico se puede obtener con la función INV.T.2C(0.05,418).
8
Por supuesto, esta no es una muestra, solo se usa como recurso didáctico.
11
Figura 4: Zona de aceptación y rechazo de H0 : β1 = 0. Para el modelo testscr = β0 + β1 str
14 = 3β0 + 6β1
31 = 6β0 + 14β1
14 − 6β1
31 = 6 + 14β1
3
σ̂ 2 0,1666
var(βˆ1 ) = N
= = 0,0833
X 2
( x2i )
i=1
sd(βˆ1 ) =
p
0,0833 = 0,2886
La ecuación de cálculo de la varianza de β1 en el modelo en niveles es :
12
Cuadro 4: Regresión MCO del modelo Y = β0 + β1 X
reg Y X
------------------------------------------------------------------------------
Y | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
X | 1.5 .2886751 5.20 0.121 -2.167965 5.167965
_cons | 1.666667 .6236096 2.67 0.228 -6.257044 9.590377
------------------------------------------------------------------------------
σ2 0,1666
var(βˆ1 ) = N
= = 0,0833
X 2
( Xi − X̄)2
i=1
Podemos ver que el coeficiente no cambia de valor. Es decir el modelo en niveles es equivalente al
modelo en diferencias para estimar β1
13
Cuadro 8: Ejemplo 0: Regresión del modelo en diferencias y = β0 + β1 x
reg y x
------------------------------------------------------------------------------
y | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
x | 1.5 .2886751 5.20 0.121 -2.167965 5.167965
_cons | 2.98e-08 .2357022 0.00 1.000 -2.994881 2.994881
------------------------------------------------------------------------------
2.2.2. Relación entre la prueba de significancia conjunta e individual en el modelo de una varia-
ble
En el modelo de una variable explicativa, sabemos que se agrega una variable adicional para explicar
el comportamiento de Y , esta es X. Sin embargo una primera aproximación a Yi es su media, es “como
si” se propusiera un modelo de 0 variables explicativas, y una constante, calculando ese modelo tenemos:
reg Y
------------------------------------------------------------------------------
Y | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
_cons | 4.666667 .8819171 5.29 0.034 .8720836 8.46125
------------------------------------------------------------------------------
El modelo Yi = β0 se puede entender como un modelo Yi = β0 + (β1 |β1 = 0)Xi , este primer
modelo se conoce como el modelo restringido del modelo “compleo” (Yi = β0 + β1 Xi ), restringido en
el sentido que de todos los valores posibles de β1 este solo toma el valor de 0.
Podemos comparar el modelo sin restricciones (Yi = β0 + β1 Xi ), con el modelo restringido (Yi =
β0 ). El estadístico F 9 para la prueba de significancia conjunta es 10 :
RSSR − RSSU R
q
F = (16)
RSSU R
N −k−1
9
Ver Stock and Watson (2012), página 30.
10
Recordemos que la distribución del cociente de dos variables aleatorias chi-cuadrado con m grados de libertad y n grados
de libertad se denota Fm,n .
14
La hipótesis nula es en este caso que ambos estimadores son a la vez 0:
H0 : βˆ0 = 0 y βˆ1 = 0
La hipótesis alternativa es que los estimadores son “significativos en conjunto” por lo tanto, el com-
plemento de la afirmación anterior es:
Ha : βˆ0 o βˆ1 6= 0
Este estadístico se distribuye con (q, N − k − 1) grados de libertad. Siendo la regla, si F empírico
es mayor a F de tabla la restricción impuesta es no adecuada, rechazamos la H0 de que la restricción
impuesta es válida. Para el caso analizado tenemos:
RSSR −RSSU R 4,666−0,1666
q 1 4,5000
Femp = RSSU R
= 0,1666 = = 27,00
N −k−1 3−1−1
0,1666
El valor tabulado con 5 % de significancia es F (1, 1) = 161, como F empírico no es mayor al F
tabulado, no podemos descartar que el verdadero valor de los estimadores es realmente 0, es decir los
estimadores encontrados son estadísticamente iguales a 0 en conjunto.
Referencias
Alonso, A., Fernández, J., and Gallastegui, I. (2005). Econometría. Pearson Educación, 1 edition.
15
Gujarati, D. N. (2003). Econometría. McGraw-Hill Interamericana.
Qin, D. (2013). A history of econometrics The reformation from the 1970s. Oxford University Press, 1
edition.
3. Anexos
16
Autor Supuestos del modelo
Novales
(1993)
1. El modelo es estocástico.
2. El modelo es lineal.
3. Los coeficientes del modelo son constantes en el tiempo
4. Existe una relación causal desde las variables explicativas hacia la variable endógena
5. Las variables x no son linealmente dependientes.
6. Las variables x son deterministas.
Gujarati
(2003)
1. El modelo de regresión es lineal en los parámetros.
2. Los valores de x son fijos en muestreo repetido.
3. El valor medio de la perturbación ui es igual a cero.
4. Homocedasticidad o igual varianza de ui.
5. No existe autocorrelación entre las perturbaciones.
6. La covarianza entre ui y Xi es cero.
7. El número de observaciones n debe ser mayor que el número de parámetros a estimar.
8. Variabilidad en los valores de X.
9. El modelo de regresión está correctamente especificado.
10. No hay multicolinealidad perfecta.
Wooldridge
(2010)
1. En el modelo poblacional, la variable dependiente, y, está relacionada con la variable
independiente, x, y con el error (o perturbación), u, de la manera siguiente y =
β0 + β1 x + u, donde β0 y β1 representan parámetros poblacionales.
2. Se cuenta con una muestra aleatoria de tamaño n, (xi , yi ): i = 1, 2, . . . , n, que sigue
el modelo poblacional de la ecuación.
3. No todos los valores muestrales de x, a saber xi , i = 1, . . . , n, son iguales, es decir,
no todos tienen el mismo valor.
4. Para todo valor de la variable explicativa, el valor esperado del error u es cero. Es
decir, E(u|x) = 0.
5. El error u tiene la misma varianza para cualquier valor de la variable explicativa. En
otras palabras, var(u|x) = σ 2 .
Stock and
Watson
1. La distribución condicional de ui dado Xi tiene media cero.
(2012)
2. (Xi , Yi ), i = 1, . . . , n son independiente e idénticamente distribuidas.
3. Los outliers son poco probables.
Alonso
et al. (2005)
1. Sobre la relación (entre las variables): está bien especificada.
2. Sobre los coeficientes: son constantes en toda la muestra.
3. Sobre la variable explicativa X: puede considerarse fija en sucesivas muestras.
4. Sobre la perturbación aleatoria u: a) E(ui ) = 0, para todo i, b) V ar(ui ) = σ 2 , para
todo t, y c) cov(ui , uj ) = 0, para todo t 6= s.
17