NotasClaseEconometria 01 2019

Notas de Clase - Econometría I: Introducción*
Alfonso Leonel Ayala Loro†
27 de Marzo de 2019
Resumen
El presente documento presenta los elementos de un modelo econométrico básico, en un caso
inicial con una variable dependiente y una sola variable independiente.
* Notas de Clase para el curso Econometría I

†
B. Sc. Economía, Universidad Nacional Mayor de San Marcos. Maestría en Finanzas, Universidad del Pacífico. Profesor
Asociado del Departamento de Economía de la UNMSM. Investigador asociado al Instituto de Investigaciones FCE - UNMSM
y al Instituto de Estudios Sociales del Rímac. Contacto: aayalal1@unmsm.edu.pe
1. Introducción
Como señala Koutsoyiannis (1977), se pueden distinguir tres objetivos al plantear un modelo econo-
métrico: «(1) análisis, por ejemplo testear una teoría económica; (2) política económica, por ejemplo
proveer estimados numéricos de coeficientes de las relaciones económicas, los cuales pueden ser utiliza-
dos para la toma de decisiones; (3) pronóstico, por ejemplo usar los estimados numéricos de coeficientes
para predecir los valores futuros de las magnitudes económicas.» El primero de estos objetivos está re-
lacionado a la propuesta de Haavelmo de los años 301 , el segundo es el eje central de la propuesta de
la Cowles Commision2 , en tanto que el tercero es una derivación lógica de los dos anteriores, bajo el
supuesto que algun modelo identificado permita simular el comportamiento futuro de alguna relación
de la economía. Este tercer objetivo fue el origen de los primeros desarrollos en la teoría econométrica,
aunque como se verá mas adelante necesitó de un importante «ajuste» para su aplicación.
La econometría como la entendemos hoy, es el resultado del avance conjunto de los métodos de esti-
mación, la formulación y ajuste de las pruebas estadísticas aplicadas a fenómenos sociales y el contraste
con los datos disponibles. El desarrollo en este campo plantea diferentes métodos para encontrar aque-
llos coeficientes a los que se refiere el párrafo anterior3 , y su validación y uso, en la teoría económica y
la política económica.
Los temas metodológicos son de vital importancia al momento de formular un modelo econométri-
co, dadas las limitaciones de la data en economía muchas veces el formulador debe adaptar los métodos
y, los modelos disponibles a la naturaleza de la data para obtener estimadores que cumplan sus objetivos.
Los problemas metodológicos se pueden atenuar parcialmente con un modelo teórico consistente, sin
embargo el trabajo econométrico agrega un nivel más a las dificultades usuales del trabajo empírico.
Como veremos en los siguientes documentos de este curso, esta problemática se aborda con la for-
mulación de sucesivos esquemas, que según la amplitud (o grado de generalidad) requerida, reducen las
restricciones de un esquema inicial que podemos caracterizar como simplificado, este modelo inicial es
el modelo de regresión lineal simple, que presentamos en el presente trabajo.
2. El modelo de regresión lineal

A partir de una hipótesis inicial proporcionada por la teoría económica «Y es función de X», un
investigador puede construir un modelo que «pone a prueba» la hipótesis que relaciona la variable endó-
gena, que llamaremos Y , la variable que buscamos explicar, y, una variable explicativa que llamaremos
X1 , más adelante ampliamos la cantidad de variables explicativas, por tanto tendremos X2 , X3 , etc.
Simplificando, por el momento supongamos que Y sólo depende de X1 , de tal manera que se postula un
modelo tal como:
Y = β0 + β1 X1 + ui
Tres son los supuestos básicos del modelo lineal básico4 :
1. El modelo es lineal en los parámetros β0 y β1 .
2. El modelo es estocástico, la variable Y estimada depende del azar, esto es, al incorporarse un
elemento estocástico ui , la relación entre la variable endógena y la(s) explicativa(s) se transforma
en estocástica.
3. Las variable Xk son deterministas, esto es los valores de las variables explicativas son los mismos
en muestras sucesivas (son fijas).
1
Ver Qin (2013)
2
Mediante la construcción de los llamados modelo estructurales.
3
El método que usaremos es el de mínimos cuadrados, otros métodos son: máximo-verosimilitud y los métodos no lineales.
4
Una tabla comparativa de supuestos del modelo de regresión, presentes en algunos textos básicos en econometría se puede
revisar en el anexo del presente documento.
1
Sean dos variables, Y e X1 , donde Y es la variable que queremos explicar con la información de
X1 , la información proviene de una muestra adecuadamente tomada (aleatoria) en un punto en el tiempo,
que se denomina sección cruzada, cada par de n observaciones se denotará por (Xi ,Yi ). Por ejemplo si
deseamos analizar la relación entre Yi e Xi en un gráfico de dispersión podemos observar una relación
como se observa en le Figura 1:
Figura 1: Gráfico de dispersión entre X e Y y la línea de regresión
En la Figura 1, una línea puede «resumir» la relación entre X1 e Y, la línea roja (calculada mediante
el método econométrico apropiado) minimiza «lejanía» de los valores estimados respecto a la relación
lineal, esta medida es la suma cuadrática de la distancia entre los valores observados y la línea misma
en cada observación de X, si escribimos esta diferencia (para cada observación) como Y i − Ŷi , donde
Ŷi = β0 + Xi + ui , podemos afirmar que la sumatoria de los residuos cuadráticos es:
N
X
(Yi − β0 − β1 Xi )2 (1)
N =1
Si ampliamos el gráfico anterior, en la Figura 2, por ejemplo para el valor de X1 = 5, podemos ver que
el valor de Yi (el valor de Y observado) es menor al valor estimado en el modelo produciendo un error
por exceso, si de manera similar observamos los demás residuos tendremos otros residuos por defecto,
se desea que estos residuos tengan el menor valor posible, por lo que usaremos los métodos estadísticos
disponibles para encontrar una formulación que cumpla esa tarea.
Figura 2: Gráfico de dispersión entre X e Y y la línea de regresión
2
Podemos afirmar que el valor de Yi , tiene dos partes o componentes, una parte sistemática: β0 +β1 Xi ,
y una parte no sistemática: ui . Mediante un procedimiento de minimización, se deriva la expresión
anterior respecto a las variables de decisión β0 y β1 , y las igualamos a cero, tenemos.
∂(.)
=0
∂β0
∂(.)
=0
∂β1
Según conocemos del cálculo diferencial (la regla de la cadena), dado y = f (w) y a su vez w =
f (x), la derivada de y respecto a x es:
dy dy dw
=
dx dw dx
Usando el concepto de función de función obtenemos:
N
∂(.) X
= −2 (Yi − β0 − β1 Xi ) = 0
∂β0
N =1
N
∂(.) X
= −2 (Yi − β0 − β1 Xi )Xi = 0
∂β1
N =1
Efectuando las sumatorias de las expresiones anteriores, obtenemos dos resultados importantes en la
teoría econométrica:
Primera ecuación normal:
N
X N
X
Yi = nβ0 + β1 Xi (2)
N =1 N =1
Segunda ecuación normal:

N
X N
X N
X
Xi Yi = β0 Xi + β1 Xi2 (3)
n=1 N =1 n=1
Las ecuaciones anteriores se denominan ecuaciones normales de la regresión mínimo-cuadrática. Resol-

viendo las ecuaciones obtenemos:
N
X N
X N
X N
X
Xi2 Yi −Xi Xi Yi
n=1 n=1 n=1 n=1
β0 = N N
(4)
X X 2
n Xi2 − Xi
n=1 n=1
Dividiendo la primera ecuación normal entre n, tenemos:

N
X N
X
Y = nβ0 + β1 Xi
n=1 n=1
n
N
X N
X
Yi Xi
n=1 n=1
= β0 + β1
n n
3
Ȳ = β0 + β1 X̄ (5)
La ecuación anterior nos indica que la relación lineal estimada «pasa» por los valores medios de las
variables involucradas.
Desarrollando el paréntesis de la segunda ecuación normal:
N
X N
X N
X
Xi Yi − β0 Xi − β1 Xi2
n=1 n=1 n=1
N
X N
X N
X
Xi Yi = β0 Xi + β1 Xi2
n=1 n=1 n=1
Reemplazando β0 , por la ecuación 5:

N
X N
X N
X
Xi Yi = (Ȳ − β1 X̄) Xi + β1 Xi2 = 0
n=1 n=1 n=1
N
X N
X N
X N
X
Xi Yi = Ȳ Xi − β1 X̄ Xi + β1 Xi2
n=1 n=1 n=1 n=1
N
X N
X N
X N
X
Xi Yi − Ȳ Xi = β1 Xi2 − β1 X̄ Xi
n=1 n=1 n=1 n=1
N
X N
X N
X N
X
Xi Yi − Ȳ Xi = β1 Xi2 − X̄ Xi
n=1 n=1 n=1 n=1
Obtenemos el estimador β1 es:

N
X N
X
Xi Yi − Ȳ Xi
n=1 n=1
β1 = N N
(6)
X X
Xi2 − X̄ Xi
n=1 n=1
Las ecuaciones (4) y (6), muestran los estimadores de los parámetros (poblacionales) del modelo
planteado. Llamaremos ui a los errores, estos tienen las siguientes propiedades:
N
X
ûi = 0 (7)
n=1
N
X
ûi Xi = 0 (8)
n=1
La recta estimada para los valores medios de X e Y, conforme a la ecuación 5.

N
X
ûi Ŷi = 0 (9)
n=1
4
2.1. El modelo en diferencias
Una forma muy utilizada en econometría para expresar las ecuaciones de manera simplificada es
definiendo las variables “en diferencias respecto a la media” donde a cada serie de observaciones de X
e Y se le resta la media muestral respectiva, esto es:
yi = Yi − Ȳ
xi = Xi − X̄
Si se realiza esto el modelo adquiere las siguientes propiedades:
N
X
xi = 0
n=1
N
X
yi = 0
n=1
N
X N
X
xi Xi = x2i
n=1 n=1
N
X N
X
yi Yi = yi2
n=1 n=1
N
X N
X N
X
x i yi = xi Yi = Xi yi
n=1 n=1 n=1
Sea Yi = β0 + β1 Xi + ui y Ȳ = β0 + β1 X̄ es:
Yi − Ȳ = β0 + β1 Xi + ui − β0 − β1 X̄
Yi − Ȳ = β1 (Xi − X̄) + ui
Es decir:
yi = β1 xi + ui
Gráficamente se puede observar un desplazamiento de las observaciones hacia el origen. Conside-
rando que los residuos de este modelo son:
yi − β 1 x i
Mediante un proceso similar al de la minimización de la sumatoria de residuos cuadráticos tenemos:
N
X N
X
û2 = (yi − β1 xi )2
n=1 n=1
Derivando la expresión anterior respecto a β1 :

N
∂(.) X
= −2 (yi − β1 xi )xi
∂β1
N =1
Introduciendo xi :
5
N
X
(yi xi − β1 x2i ) = 0
N =1
N
X N
X
yi x i − β 1 x2i = 0
N =1 N =1
β1 es entonces:
N
X
xi yi
n=1
β1 = N
(10)
X
x2i
n=1
2.1.1. Determinación de varianza de βˆ1

Recordando que en el modelo de regresión se buscan k+1 parámetros (k−1 parámetros de la relación
entre las Xs e Y, una constante y la varianza del error). Necesitamos un estimador de la varianza del error
(que determina la varianza de la variable dependiente). Empezamos con la ecuación 10, expresamos yi
como la serie en diferencias de Y :
N
X N
X N
X
xi (Yi − Ȳ ) xi Yi − Ȳ xi
n=1 n=1 n=1
βˆ1 = N
= N
X X
x2i x2i
n=1 n=1
N
X
Dado que xi es cero se elimina el segundo término del numerador, quedando:
n=1
N
X
xi Yi
n=1
βˆ1 = N
X
x2i
n=1
Reemplazando Yi por el modelo propuesto:
N
X N
X N
X N
X
xi (β0 + β1 Xi + ui ) β0 xi − β1 xi Xi + xi ui
n=1 n=1 n=1 n=1
βˆ1 = N
= N
X X
x2i x2i
n=1 n=1
N
X N
X
Nuevamente se elimina el primer término del numerador, adicionalmente sabemos que: xi Xi = x2i ,
n=1 n=1
obtenemos:
N
X
xi ui
n=1
βˆ1 = β1 + N
(11)
X
x2i
n=1
6
Tomando la esperanza de βˆ1 , tenemos:
N
1 X
E(βˆ1 ) = β1 + N
xi E(ui )
n=1
X
x2i
n=1
Por el supuesto inicial del modelo de regresión, E(ui ) = 0, por lo que el segundo término es cero.
Obtenemos la propiedad de insesgamiento de beta:
E(βˆ1 ) = β1
Analizando la varianza de beta, sabemos por definición de la varianza:
var(βˆ1 ) = E[βˆ1 − E(βˆ1 )]2

Reemplazando la E(βˆ1 ) con la ecuación 11 (debido a que β1 es insesgado):
N
X
xi ui
2
n=1
var(βˆ1 ) = E βˆ1 − β1 + N
X
x2i
n=1
N
X
xi ui
2
n=1
var(βˆ1 ) = E N
X
x2i
n=1
N
X 2
1
var(βˆ1 ) = N E xi ui
X 2 n=1
2
xi
n=1
N
X N X
N
1 X
var(βˆ1 ) = N E x2i u2i +2 xi xj ui uj
X 2 n=1 j=1 n=1
x2i
n=1
N
X N X
N
1 X
var(βˆ1 ) = N x2i E[u2i ] +2 xi xj E[ui uj ]
X 2 n=1 j=1 n=1
x2i
n=1
Sabiendo que E[ui uj ] = 0, y que la varianza de la perturbación es σ 2 .

N N
σ2
X X
ˆ 1 2 2 2
var(β1 ) = N xi σ = N xi
X 2 n=1 X 2 n=1
2 2
xi xi
n=1 n=1
σ2
var(βˆ1 ) = N
(12)
X
x2i
n=1
7
2.1.2. Determinación de σ 2
Si a la ecuación inicial Yi = β0 + Xi + ui le restamos Ȳ = β0 + β1 X̄ + ū, se obtiene:
Yi − Ȳ = β0 − β0 + β1 (Xi − X̄) + ui − ū
Que es la expresión del modelo en diferencias (en el ámbito poblacional).
yi = β1 xi + (ui − ū) (13)

Los errores del modelo (en el ámbito muestral) se pueden expresar como:
ei = yi − βˆ1 xi
Reemplazando la ecuación 13 en la expresión anterior:
ei = β1 xi + (ui − ū) − βˆ1 xi = xi (β1 − βˆ1 ) + (ui − ū)

Elevando al cuadrado:
e2i = (β1 − βˆ1 )2 x2i + (ui − ū)2 + 2(β1 − βˆ1 )xi (ui − ū)
Aplicando la sumatoria:
N
X N
X N
X N
X
e2i = (β1 − βˆ1 )2 x2i + (ui − ū)2 + 2(β1 − βˆ1 ) xi (ui − ū)
n=1 n=1 n=1 n=1
Tomando la esperanza:
N
X N
2 X N
X N
X
E e2i ˆ
= E (β1 − β1 ) 2
xi + E 2 ˆ
(ui − ū) + 2E (β1 − β1 ) xi (ui − ū)
n=1 n=1 n=1 n=1
Multiplicamos el segundo término por (n − 1)/(n − 1),
N
X N
2 X PN 2 N
n=1 (ui − ū)
X
E e2i ˆ
= E (β1 − β1 ) 2
xi + (n − 1)E ˆ
+ 2E (β1 − β1 ) xi (ui − ū)
n−1
n=1 n=1 n=1
y en el tercer sumando reemplazamos (β1 − βˆ1 ) por la ecuación 11, y desarrollando el tercer múltiplo
del tercer término:
N
X
N 2 XN PN xi ui N N
X 2
n=1 (ui − ū) n=1 X X
e2i ˆ 2

E = E (β1 −β1 ) xi +(n−1)E −2E N xi ui − xi ū)
n−1
n=1 n=1 n=1 n=1
X
x2i
n=1
N
X
N 2 XN PN xi ui N
X
(u − ū) 2
n=1 i n=1 X
e2i ˆ 2

E = E (β1 − β1 ) xi + (n − 1)E − 2E N xi ui
n−1
n=1 n=1 n=1
X
x2i
n=1
8
PN 2
PN 2
Se multiplica por n=1 xi / n=1 xi al tercer término para no alterar la ecuación:
N
X
N 2 XN N
xi ui
X PN 2 2
(ui − ū) X n=1
E e2i = E (β1 − βˆ1 ) 2
xi + (n − 1)E n=1
−2 2
xi E
n−1 N
n=1 n=1 n=1
X
x2i
n=1
N
X
P "" xi ui #2 #
N 2
n=1 (ui −ū)
Sabemos que E(β1 − βˆ1 )2 = var(βˆ1 ), E n−1 = var(ui ), y E n=1
N
=
X
x2i
n=1
var(βˆ1 ), reemplazando en la ecuación anterior:
N
X N
X N
X
E e2i = var(βˆ1 ) x2i + (n − 1)var(ui ) − 2 x2i var(βˆ1 )
n=1 n=1 n=1
Reemplazando las varianzas:

N N N
σ2 σ2
X X X
E e2i = PN x2i + (n − 1)σ 2 − 2 x2i PN
2 2
n=1 n=1 xi n=1 n=1 n=1 xi
Simplificando:
N
X
E e2i = σ 2 + (n − 1)σ 2 − 2σ 2
n=1
N
X
E e2i = (n − 2)σ 2 (14)
n=1
Se le llama s2 al estimador de σ 2 :
N
X
e2i
i=1
s2 = σ̂ 2 = (15)
(n − 2)
2.2. Inferencia sobre los parámetros del modelo

Como vimos en la parte anterior al seguir ui una distribución normal, entonces Yi también sigue una
distribución normal, y la forma “estable” que X influye sobre Y esta dado por las betas del modelo.
Sabemos que las distribuciones de los betas del modelo de dos variables son:
" " ##
1 X̄ 2
βˆ0 ∼ N β0 , + N
n X
x2i
i=1
" " ##
X̄ 2
βˆ1 ∼ N β1 , N
X
x2i
i=1
9
Si β0 o β1 se distribuye como una normal, podemos utilizar el intervalo de confianza que propor-
ciona la distribución de probabilidad normal para comparar el valor puntual obtenido en el proceso de
estimación con este intervalo. En el caso del contraste de hipótesis de los parámetros beta del modelo, la
hipótesis nula a plantear es que los betas “no son significativos” por lo tanto se plantearía una hipótesis
nula como:
H0 : β̂i = 0
La hipótesis alternativa es que el estimador sea “significativo” por lo tanto, el complemento de la
afirmación anterior es:
Ha : β̂i 6= 0
Luego del proceso de “estandarización” del parámetro estimado, que consiste en restarle la media
esperada (cero) y dividirlo entre la desviación estándar (aproximada mediante s2 ), obtenemos una nueva
variable, que se debe distribuir según los percentiles de la función de probabilidad conocida (la normal o
una distribución con propiedades establecidas); como la desviación se aproxima mediante s2 , la variable
resultante se distribuye según la función de distribución t-Student. Si el valor de esta nueva variable “está
cerca” del valor que tendría bajo la hipótesis nula (cero), entonces se puede afirmar que la diferencia
entre el estimador y el verdadero valor del estimador (bajo la hipótesis inicial, la hipótesis de cero efecto
de Xi sobre Y ) es muy baja, por tanto no podemos eliminar la posibilidad estadística que no hay efecto
de Xi sobre Y 5 . El intervalo definido por estos límites determina en la función de distribución, un área
o zona “de no rechazo” o no descarte que, efectivamente X no tenga influencia en Y . Podemos resumir
lo anterior en el gráfico siguiente:
Figura 3: Zona de aceptación y rechazo de H0
El tamaño del área que define el intervalo de referencia depende del “riesgo” que se pueda asumir
ante el error, este “riesgo” es de α %, el error que se tendría al equivocarse, en este caso sería aceptar
que no hay influencia de X sobre Y, dado que si la hay (aceptar la hipótesis nula como cierta, sin serla),
este es el error tipo I, se asume generalmente que un riesgo adecuado sería del 5 %. Al complemento del
riesgo se le denomina "nivel de confianza"(1 − α).
En el caso que el ratio entre el beta calculado y la desviación estándar del beta sea cercano a 0,
existiría evidencia que se cumple la hipótesis nula, en el caso contrario más bien existiría evidencia que
beta no se acerca a 0.
5
A esta última afirmación se le menciona como “no se puede rechazar la H0 ”
10
El límite entre el intervalo de “aceptación” de la hipótesis (nula) y el “rechazo” está dado por el
percentil de la distribución que define un área igual al riesgo que se desea asumir, a los lados de la distri-
bución. Para un nivel de 5 % el percentil de la distribución t está en función del número de observaciones
del modelo ajustadas por los parámetros estimados: n − k − 1.
Supongamos que en una regresión se obtienen los siguientes datos 6 :
Cuadro 1: Regresión MCO del modelo testscr = β0 + β1 str
regress testscr str
Source | SS df MS Number of obs = 420

-------------+------------------------------ F( 1, 418) = 22.58
Model | 7794.11004 1 7794.11004 Prob > F = 0.0000
Residual | 144315.484 418 345.252353 R-squared = 0.0512
-------------+------------------------------ Adj R-squared = 0.0490
Total | 152109.594 419 363.030056 Root MSE = 18.581
------------------------------------------------------------------------------
testscr | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
str | -2.279808 .4798256 -4.75 0.000 -3.22298 -1.336637
_cons | 698.933 9.467491 73.82 0.000 680.3231 717.5428
------------------------------------------------------------------------------
Donde:
testscr = promedio de notas de las áreas de matemáticas y, letras
str = ratio estudiante/docente
Estamos interesados en probar la hipótesis que la variable str no tiene influencia sobre (testscr) (H0 ),
contra la hipótesis que si tiene influencia (Ha ). Bajo los supuestos mencionados el ratio β1 /sd(β1 ) se
distribuye como una variable t con (n − k − 1) grados de libertad y un nivel de confianza de α %.
Ubicamos el valor crítico en la tabla, en k = 418 y α = 5 %, el valor crítico (t de tabla) es de 1.9657.
Por lo tanto el valor t obtenido en la regresión es mayor al valor crítico de tabla, concluimos que no
podemos aceptar la H0 , por tanto no hay evidencia que β1 = 0 7 .
Cuadro 2: Valores críticos de la distribución t (α=10 %, 5 %, 1 %), para n = 418

k α = 0,10 α = 0,05 α = 0,01
418 1.6485 1.9657 2.5876
Para comparar ambos estadísticos, ubicamos en la tabla de la distribución t, el percentil de la dis-

tribución que delimita el área de (1 − α) % centrada en 0, y el área de α % (dividida en dos partes
simétricas) en los extremos superior e inferior de la distribución.
2.2.1. Ejemplo 0
Comenzaremos verificando las propiedades del modelo lineal de una variable mediante un ejemplo
numérico que el lector puede verificar manualmente, lo que se recomienda. Sea una “muestra” 8 de las
siguientes observaciones de X e Y.
Los estadísticos necesarios para calcular los betas en las ecuaciones normales serán:
3
X 3
X 3
X 3
X
X = 6, Y = 14, X 2 = 14, XY = 31, n = 3
i=1 i=1 i=1 i=1
6
Ver Wooldridge (2010)
7
En una hoja de cálculo Microsoft Excel este estadístico se puede obtener con la función INV.T.2C(0.05,418).
8
Por supuesto, esta no es una muestra, solo se usa como recurso didáctico.
11
Figura 4: Zona de aceptación y rechazo de H0 : β1 = 0. Para el modelo testscr = β0 + β1 str
Cuadro 3: Ejemplo 0: Valores de 3 observaciones de X e Y

Observación X Y
1 1 3
2 2 5
3 3 6
Las ecuaciones normales quedarían como:
14 = 3β0 + 6β1
31 = 6β0 + 14β1
14 − 6β1
31 = 6 + 14β1
3
β̂1 = 1,50, β̂0 = 5/3

Lo que podemos verificar en una estimación con Stata:
Comprobemos las propiedades de los residuos:
Comprobemos las propiedades de los residuos:
El cálculo beta y de la varianza es el siguiente:
N
X
e2i
i=1 0,1666
s2 = σ̂ 2 = = = 0,166
(n − 2) 3−2
σ̂ 2 0,1666
var(βˆ1 ) = N
= = 0,0833
X 2
( x2i )
i=1
sd(βˆ1 ) =
p
0,0833 = 0,2886
La ecuación de cálculo de la varianza de β1 en el modelo en niveles es :
12
Cuadro 4: Regresión MCO del modelo Y = β0 + β1 X
reg Y X

-------------+------------------------------ F( 1, 1) = 27.00
Model | 4.5 1 4.5 Prob > F = 0.1210
Residual | .166666667 1 .166666667 R-squared = 0.9643
-------------+------------------------------ Adj R-squared = 0.9286
Total | 4.66666667 2 2.33333333 Root MSE = .40825
------------------------------------------------------------------------------
Y | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
X | 1.5 .2886751 5.20 0.121 -2.167965 5.167965
_cons | 1.666667 .6236096 2.67 0.228 -6.257044 9.590377
------------------------------------------------------------------------------

Observación X Y Ŷ û = Y − Ŷ ûX ûY û2 (Xi −X)2
1ra 1 3 3.166 -0.166 -0.166 -0.5277 0..0277 1
2da 2 5 4.666 0.333 0.666 1.5555 0.1111 0
3ra 3 6 6.166 -0.166 -0.500 -1.0277 0.0277 1
P3
i=1 0.000 0 0 0.1666 2
Cuadro 6: Ejemplo 0: Valores de 3 observaciones de X e Y, en diferencias

Observación x y
1ra -1 -1.666
2da 0 0.333
3ra 1 1.333

Observación x y xy x2 ŷ ûi ûi 2
1ra -1 -1.666 1.666 1 -1.500 -0.1666 0.0277
2da 0 0.333 0 0 0 0.3333 0.1111
3ra 1 1.333 1.333 1 1.50 0.1666 0.0277
P3
i=1 3 2 0 0.1666
σ2 0,1666
var(βˆ1 ) = N
= = 0,0833
X 2
( Xi − X̄)2
i=1
Podemos ver que el coeficiente no cambia de valor. Es decir el modelo en niveles es equivalente al
modelo en diferencias para estimar β1
13
Cuadro 8: Ejemplo 0: Regresión del modelo en diferencias y = β0 + β1 x
reg y x

-------------+------------------------------ F( 1, 1) = 27.00
Model | 4.5 1 4.5 Prob > F = 0.1210
Residual | .166666647 1 .166666647 R-squared = 0.9643
-------------+------------------------------ Adj R-squared = 0.9286
Total | 4.66666665 2 2.33333332 Root MSE = .40825
------------------------------------------------------------------------------
y | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
x | 1.5 .2886751 5.20 0.121 -2.167965 5.167965
_cons | 2.98e-08 .2357022 0.00 1.000 -2.994881 2.994881
------------------------------------------------------------------------------
2.2.2. Relación entre la prueba de significancia conjunta e individual en el modelo de una varia-
ble
En el modelo de una variable explicativa, sabemos que se agrega una variable adicional para explicar
el comportamiento de Y , esta es X. Sin embargo una primera aproximación a Yi es su media, es “como
si” se propusiera un modelo de 0 variables explicativas, y una constante, calculando ese modelo tenemos:
Cuadro 9: Ejemplo 0: Regresión del modelo: Y = β0
reg Y

-------------+------------------------------ F( 0, 2) = 0.00
Model | 0 0 . Prob > F = .
Residual | 4.66666667 2 2.33333333 R-squared = 0.0000
-------------+------------------------------ Adj R-squared = 0.0000
Total | 4.66666667 2 2.33333333 Root MSE = 1.5275
------------------------------------------------------------------------------
Y | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
_cons | 4.666667 .8819171 5.29 0.034 .8720836 8.46125
------------------------------------------------------------------------------
El modelo Yi = β0 se puede entender como un modelo Yi = β0 + (β1 |β1 = 0)Xi , este primer
modelo se conoce como el modelo restringido del modelo “compleo” (Yi = β0 + β1 Xi ), restringido en
el sentido que de todos los valores posibles de β1 este solo toma el valor de 0.
Podemos comparar el modelo sin restricciones (Yi = β0 + β1 Xi ), con el modelo restringido (Yi =
β0 ). El estadístico F 9 para la prueba de significancia conjunta es 10 :
RSSR − RSSU R
q
F = (16)
RSSU R
N −k−1
9
Ver Stock and Watson (2012), página 30.
10
Recordemos que la distribución del cociente de dos variables aleatorias chi-cuadrado con m grados de libertad y n grados
de libertad se denota Fm,n .
14
La hipótesis nula es en este caso que ambos estimadores son a la vez 0:
H0 : βˆ0 = 0 y βˆ1 = 0
La hipótesis alternativa es que los estimadores son “significativos en conjunto” por lo tanto, el com-
plemento de la afirmación anterior es:
Ha : βˆ0 o βˆ1 6= 0
Este estadístico se distribuye con (q, N − k − 1) grados de libertad. Siendo la regla, si F empírico
es mayor a F de tabla la restricción impuesta es no adecuada, rechazamos la H0 de que la restricción
impuesta es válida. Para el caso analizado tenemos:
RSSR −RSSU R 4,666−0,1666
q 1 4,5000
Femp = RSSU R
= 0,1666 = = 27,00
N −k−1 3−1−1
0,1666
El valor tabulado con 5 % de significancia es F (1, 1) = 161, como F empírico no es mayor al F
tabulado, no podemos descartar que el verdadero valor de los estimadores es realmente 0, es decir los
estimadores encontrados son estadísticamente iguales a 0 en conjunto.
Cuadro 10: Valores críticos de la distribución F , para q = 1, n = 1

(N − k − 1)
q 1
1 161.4476
El gráfico del ratio F se muestra a continuación:
Figura 5: Zona de aceptación y rechazo de H0 : β0 = 0 y β1 = 0. Para el modelo 0: Y = β0 + β1 X
Referencias
Alonso, A., Fernández, J., and Gallastegui, I. (2005). Econometría. Pearson Educación, 1 edition.
15
Gujarati, D. N. (2003). Econometría. McGraw-Hill Interamericana.
Koutsoyiannis, A. (1977). Theory of econometrics An introductory exposition of econometric methods.

The MacMillan Press Ltd., 2 edition.
Novales, A. (1993). Econometría. McGraw-Hill, 2 edition.
Qin, D. (2013). A history of econometrics The reformation from the 1970s. Oxford University Press, 1
edition.
Stock, J. H. and Watson, M. M. (2012). Introducción a la econometría. Pearson Educación, 3 edition.
Wooldridge, J. M. (2010). Introducción a la econometría Un enfoque moderno. Cengage Learning

Editores, 4 edition.
3. Anexos
16
Autor Supuestos del modelo
Novales
(1993)
1. El modelo es estocástico.
2. El modelo es lineal.
3. Los coeficientes del modelo son constantes en el tiempo
4. Existe una relación causal desde las variables explicativas hacia la variable endógena
5. Las variables x no son linealmente dependientes.
6. Las variables x son deterministas.
Gujarati
(2003)
1. El modelo de regresión es lineal en los parámetros.
2. Los valores de x son fijos en muestreo repetido.
3. El valor medio de la perturbación ui es igual a cero.
4. Homocedasticidad o igual varianza de ui.
5. No existe autocorrelación entre las perturbaciones.
6. La covarianza entre ui y Xi es cero.
7. El número de observaciones n debe ser mayor que el número de parámetros a estimar.
8. Variabilidad en los valores de X.
9. El modelo de regresión está correctamente especificado.
10. No hay multicolinealidad perfecta.
Wooldridge
(2010)
1. En el modelo poblacional, la variable dependiente, y, está relacionada con la variable
independiente, x, y con el error (o perturbación), u, de la manera siguiente y =
β0 + β1 x + u, donde β0 y β1 representan parámetros poblacionales.
2. Se cuenta con una muestra aleatoria de tamaño n, (xi , yi ): i = 1, 2, . . . , n, que sigue
el modelo poblacional de la ecuación.
3. No todos los valores muestrales de x, a saber xi , i = 1, . . . , n, son iguales, es decir,
no todos tienen el mismo valor.
4. Para todo valor de la variable explicativa, el valor esperado del error u es cero. Es
decir, E(u|x) = 0.
5. El error u tiene la misma varianza para cualquier valor de la variable explicativa. En
otras palabras, var(u|x) = σ 2 .
Stock and
Watson
1. La distribución condicional de ui dado Xi tiene media cero.
(2012)
2. (Xi , Yi ), i = 1, . . . , n son independiente e idénticamente distribuidas.
3. Los outliers son poco probables.
Alonso
et al. (2005)
1. Sobre la relación (entre las variables): está bien especificada.
2. Sobre los coeficientes: son constantes en toda la muestra.
3. Sobre la variable explicativa X: puede considerarse fija en sucesivas muestras.
4. Sobre la perturbación aleatoria u: a) E(ui ) = 0, para todo i, b) V ar(ui ) = σ 2 , para
todo t, y c) cov(ui , uj ) = 0, para todo t 6= s.
Cuadro 11: Comparación de los supuestos del modelo lineal
17

NotasClaseEconometria 01 2019

Загружено:

Сведения о документе

Оригинальное название

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

NotasClaseEconometria 01 2019

Загружено:

Авторское право:

Доступные форматы

Notas de Clase - Econometría I: Introducción*

Alfonso Leonel Ayala Loro†

* Notas de Clase para el curso Econometría I

2. El modelo de regresión lineal

1. El modelo es lineal en los parámetros β0 y β1 .

Figura 1: Gráfico de dispersión entre X e Y y la línea de regresión

Figura 2: Gráfico de dispersión entre X e Y y la línea de regresión

Segunda ecuación normal:

Las ecuaciones anteriores se denominan ecuaciones normales de la regresión mínimo-cuadrática. Resol-

Dividiendo la primera ecuación normal entre n, tenemos:

Reemplazando β0 , por la ecuación 5:

Obtenemos el estimador β1 es:

La recta estimada para los valores medios de X e Y, conforme a la ecuación 5.

Derivando la expresión anterior respecto a β1 :

2.1.1. Determinación de varianza de βˆ1

var(βˆ1 ) = E[βˆ1 − E(βˆ1 )]2

Sabiendo que E[ui uj ] = 0, y que la varianza de la perturbación es σ 2 .

yi = β1 xi + (ui − ū) (13)

ei = β1 xi + (ui − ū) − βˆ1 xi = xi (β1 − βˆ1 ) + (ui − ū)

Multiplicamos el segundo término por (n − 1)/(n − 1),

Reemplazando las varianzas:

2.2. Inferencia sobre los parámetros del modelo

Figura 3: Zona de aceptación y rechazo de H0

Cuadro 1: Regresión MCO del modelo testscr = β0 + β1 str

regress testscr str

Source | SS df MS Number of obs = 420

Cuadro 2: Valores críticos de la distribución t (α=10 %, 5 %, 1 %), para n = 418

Para comparar ambos estadísticos, ubicamos en la tabla de la distribución t, el percentil de la dis-

Cuadro 3: Ejemplo 0: Valores de 3 observaciones de X e Y

Las ecuaciones normales quedarían como:

β̂1 = 1,50, β̂0 = 5/3

Source | SS df MS Number of obs = 3

Cuadro 5: Ejemplo 0: Valores de 3 observaciones de X e Y

Cuadro 6: Ejemplo 0: Valores de 3 observaciones de X e Y, en diferencias

Cuadro 7: Ejemplo 0: Valores de 3 observaciones de X e Y

Source | SS df MS Number of obs = 3

Cuadro 9: Ejemplo 0: Regresión del modelo: Y = β0

Source | SS df MS Number of obs = 3

Cuadro 10: Valores críticos de la distribución F , para q = 1, n = 1

El gráfico del ratio F se muestra a continuación:

Figura 5: Zona de aceptación y rechazo de H0 : β0 = 0 y β1 = 0. Para el modelo 0: Y = β0 + β1 X

Koutsoyiannis, A. (1977). Theory of econometrics An introductory exposition of econometric methods.

Novales, A. (1993). Econometría. McGraw-Hill, 2 edition.

Stock, J. H. and Watson, M. M. (2012). Introducción a la econometría. Pearson Educación, 3 edition.

Wooldridge, J. M. (2010). Introducción a la econometría Un enfoque moderno. Cengage Learning

Cuadro 11: Comparación de los supuestos del modelo lineal

Вам также может понравиться