Вы находитесь на странице: 1из 68

Econometria I

Tema 1

Universidad Carlos III

Getafe, Madrid

UC3M

Julio Cceres Delpiano (UC3M) Econometria I 10/07 1 / 68


Outline

Introduccin
Pasos en el trabajo emprico
Datos economicos
El modelo econometrico
Ejemplos
Nuestro gran objetivo: Causalidad

Julio Cceres Delpiano (UC3M) Econometria I 10/07 2 / 68


Que es Econometra?

Disciplina que usa modelos probabilsticos y de mtodos de inferencia


estadstica, para el estudio de relaciones econmicas, la contrastacin
de teoras econmicas o la evaluacin e implementacin de polticas
econmicas o empresariales.
Cual es la diferencia entre econometria y estadistica matematica?
Observacionales vs Experimentales.
Economistas han desarrolado tecnicas destinadas a resolver y explotar
la naturaleza de los datos
El metodo de regresion multiple es el mismo, pero el enfoque e
interpretacion diere

Julio Cceres Delpiano (UC3M) Econometria I 10/07 3 / 68


Aplicaciones

Aplicacion y preguntas donde la econometria nos puede ayudar. Muchas!!!!


Evaluacion de programas. Treatment literature. Una forma muy util
de ver los problemas econometricos
Prediccion de variables macros (PGB, tasas de interes, tasas de
inacion, etc.)
Relaciones macroeconomicas: DesempleoInacion, InacionDinero
Relaciones Microeconomicas: SalariosEducacion, ProductoInsumo,
I+D inversionUtilidades en las rmas
Finanzas: stock volatility
Otras diciplinas: Sociologia, Historia, Criminologia, etc.

Julio Cceres Delpiano (UC3M) Econometria I 10/07 4 / 68


Etapas del Anlisis Econmico Emprico

El modelo economico. La pregunta


Datos y variables Economicas
Modelo economtrico

Julio Cceres Delpiano (UC3M) Econometria I 10/07 5 / 68


El modelo economico

La teoria propone modelos que explican el comportamiento de las


variables Y = (Y1 , . . . , Ym )0 (variables endogenas) como funcion de
otras variables X = (X1 , . . . , Xk )0 que se determinan fuera del modelo
(variables exogenas)
Las variables Y1 , . . . , Ym pueden expresarse como solucion del
siguiente sistema de ecuaciones
f1 (Y1 , . . . , Ym ; X1 , . . . , Xk ) = 0
:
fm (Y1 , . . . , Ym ; X1 , . . . , Xk ) = 0
Las funciones f1 ,. . . , fm representan el comportamiento de los
agentes econmicos determinado en base a una optimizacin

Julio Cceres Delpiano (UC3M) Econometria I 10/07 6 / 68


Datos y Variables Econmicas

Las variables de un modelo econmico Z = (Y 0 , X 0 )0 representan


aspectos del comportamiento de los agentes a nivel individual o
agregado.
El economista observa, directamente o de forma aproximada, el
comportamiento y las caractersticas de los agentes, que organiza en
lo que llamamos datos, la evidencia emprica,

Datos0Zn ! 1fZ1 , ..Zn g


y1i
B .. C
B . C
B C
Bymi C
Zi = B C
B x1i C
B C
B .. C
@ . A
xmi

Julio Cceres Delpiano (UC3M) Econometria I 10/07 7 / 68


Modelos Economtricos

Un modelo economtrico se construye para cuanticar y contrastar las


relaciones entre variables econmicas postuladas por un modelo
econmico a partir de la evidencia emprica (los datos).

Caractersticas de un modelo economtrico:


Reconoce el carcter estocstico que gobierna las relaciones entre
variables.
Postula una forma funcional que depende de parmetros, los cuales se
denen (identican) a partir de la informacin que proporciona la
teora econmica, o el sentido comn, y/o supuestos probabilsticos no
contrastables.
El modelo debe tener en cuenta que hay otros muchos factores que
afectan a la decisin y que en general no son observables o
identicables.

Julio Cceres Delpiano (UC3M) Econometria I 10/07 8 / 68


La Estructura de los Datos Econmicos

Existen diferentes tipos estructura de los datos economicos. Mientras


algunos metodos econometricos pueden ser aplicados con pocas
modicaciones a diferentes tipos de datos economicos, aspectos
particulares de algunos datos economicos requieren modicaciones en
orden de explotar estos aspectos de los datos
Muestreo Aleatorio: Se considera el experimento entrevistar a una
persona al azar en una poblacin de individuos. El espacio muestral
de todos los sucesos individuales, es el conjunto de todos los
individuos de la poblacin.
Tambin se pueden considerar las observaciones de Zn = z1 , ..., zn
como las realizaciones IID de n v.a. independientes Z1 , ..., Zn .

Julio Cceres Delpiano (UC3M) Econometria I 10/07 9 / 68


Datos de corte transversal o Datos de Seccin Cruzada

Son datos estticos, referidos a un periodo jo, sobre individuos de


una poblacin, generalmente provenientes de encuestas sobre familias,
empresas, etc.
El orden de los datos no importa
Esta es la estructura de datos que tendremos en mente gran durante
este semestre.

Julio Cceres Delpiano (UC3M) Econometria I 10/07 10 / 68


Datos de corte transversal o Datos de Seccin Cruzada

ID Age Income Sex Marriage


1 68 12000 1 1
2 43 24324 0 1
3 23 17345 0 0
. . . . .
. . . . .
. . . . .
999 67 54987 1 1
1000 32 67677 1 0

Julio Cceres Delpiano (UC3M) Econometria I 10/07 11 / 68


Series Temporales

Son observaciones de una variable o varias variables a lo largo de


varios periodos de tiempo (aos, meses, etc.). Ejemplos: precio de
activos, tipos de inters, tipos de cambio, tasa de inacin, oferta de
dinero, PIB, tasa de desempleo, ventas de una empresa, etc.
Las observaciones no son independientes: la evolucin temporal puede
explotarse con nes predictivos.
La frecuencia y orden con la que se observan los datos es muy
importante.

Julio Cceres Delpiano (UC3M) Econometria I 10/07 12 / 68


Series Temporales

year ination unemployment growth


1975 3,8 5,8 3,6
1976 5,4 6,4 2,8
1977 5,3 8,9 2,9
. . . .
. . . .
. . . .
2001 1,3 6,3 1,5
2002 1,1 6,9 1,2

Julio Cceres Delpiano (UC3M) Econometria I 10/07 13 / 68


Datos de Panel

Consisten en una serie temporal por cada unidad de seccin cruzada.


La longitud de las series temporales (T ) suele ser mucho ms corta
que el nmero de unidades de seccin cruzada (n).
Generalment N > T
Datos de panel 6= series temporales de secciones cruzadas
Son ms difciles de conseguir.
Aportan ms informacin y permite responder a preguntas que las
secciones cruzadas no pueden
Permiten incluir una estructura temporal en el razonamiento
econmico

Julio Cceres Delpiano (UC3M) Econometria I 10/07 14 / 68


Datos de Panel

Firm year prot employment stock


1 1995 200 150 0
1 1996 3000 135 0
: : : : :
: : : : :
1 2000 4566 356 1
2 1995 200 150 0
2 1996 3000 135 0
: : : : :
525 1995 200 150 0
525 1996 3000 135 0
: : : : :
: : : : :
525 2000 4566 356 1

Julio Cceres Delpiano (UC3M) Econometria I 10/07 15 / 68


Causalidad y anlisis ceteris paribus

Objetivo: descubrir si una variable tiene un efecto causal sobre otras


variables.
La relacin causal es muy diferente de una simple asociacin o
correlacin
Ceteris paribus: otros factores (relevantes) siendo iguales, es un
concepto clave en el anlisis causal. Sin este concepto no se pueden
medir efectos causales.
Prctica: imposible realizar experimentos c.p. en Economa.
Tcnicas Economtricas: simulan tales experimentos a partir de datos
observacionales.

Julio Cceres Delpiano (UC3M) Econometria I 10/07 16 / 68


El Modelo de Regresin Simple// Denicin y elementos

Objetivo: Modelo Economtrico para explicar cmo x explica y Problemas


bsicos:
Como la relacin entre x e y no es perfecta, cmo se permite que
otros factores afecten a y?
Cul es la relacin funcional entre x e y?
Cmo asegurarnos que est captando una relacin ceteris paribus?

Julio Cceres Delpiano (UC3M) Econometria I 10/07 17 / 68


Modelo de Regresin lineal simple

Solucin sencilla a los problemas anteriores:

Y = 0 + 1 X + u

El supuesto es que se cumple en la poblacin de inters.


Elementos del modelo:
Variables y trmino de error.
Relacin funcional.
Parmetros

Julio Cceres Delpiano (UC3M) Econometria I 10/07 18 / 68


Modelo de Regresin lineal simple. Relacin funcional:
Modelo lineal

Si los dems factores contenidos en u se mantienen jos, u = 0,


entonces x tiene un efecto lineal sobre y
y = 1 x si u = 0

Julio Cceres Delpiano (UC3M) Econometria I 10/07 19 / 68


Modelo de Regresin lineal simple. Parametros

1 : parmetro de pendiente en la relacin entre x e y : es el cambio


en y cuando se multiplica por el cambio en x. Es el parmetro clave
en aplicaciones.
0 : trmino constante (valor de y cuando x y u son cero). Menos
interesante.
Ejemplo Mincer Equation

Julio Cceres Delpiano (UC3M) Econometria I 10/07 20 / 68


Anlisis ceteris paribus?

1 : efecto de x sobre y, con todos los dems factores (en u) jos.


Pero en qu sentido podemos mantener los otros factores para llegar
a tales conclusiones?
Slo se pueden obtener estimaciones ables de los parmetros 0 y 1
a partir del muestreo aleatorio cuando establecemos supuestos que
restringen el modelo en que el error no observable u se relaciona con
la variable explicativa x.
Como x y u son VAs necesitamos un concepto basado en su
distribucin de probabilidad.

Julio Cceres Delpiano (UC3M) Econometria I 10/07 21 / 68


Trmino constante: 0 ?

Supuesto inicial: siempre que incluyamos el trmino constante 0 en


la ecuacin podemos suponer que el valor medio de u en la poblaci
es cero:

E (u ) = 0.
No arma nada sobre la relacin entre x e y .
Slo afecta a la distribucin marginal de u.
Es simplemente una normalizacin: el efecto medio de los otros
factores se renormaliza a cero.

Julio Cceres Delpiano (UC3M) Econometria I 10/07 22 / 68


Modelo de Regresin lineal simple. Relacin x y u

Se dene la independencia entre x y u desde el punto de vista de la


distribucin de u condicional en x :

E (u jx ) = E (u ) = 0.
Para todos los posibles valores de x, la media de u siempre es la
misma, 0.
Que dice este supuesto sobre habilidad en la ecuacin de Mincer?
Ejemplo fertilizante

Julio Cceres Delpiano (UC3M) Econometria I 10/07 23 / 68


Otra interpretacin

El supuesto E (u jx ) = E (u ) = 0. con lleva otra interpretacin muy


til. Tomando el valor esperado de y condicional en el valor de x,

E (y jx ) = 0 + 1 X
Esta expresin proporciona el valor de la funcin de regresin
poblacional, que en este caso es lineal.
Tambin se puede escribir

y = E (y jx ) + u = 0 + 1 X + u,
donde E (y jx ) = 0 + 1 es la parte explicada por x y u es la parte
no explicada por x.

Julio Cceres Delpiano (UC3M) Econometria I 10/07 24 / 68


Especicacin de la forma funcional. No linealidades en
regresin simple. Log-Level
El modelo lineal implica que el incremento de y cuando cambia x
siempre es igual, independientemente del nivel de x :

wage = 0 + 1 educ + u
Pero es ms razonable suponer que es el porcentaje de incremento el
que es constante.
Un modelo que consigue esto, aproximadamente, es:

log (wage ) = 0 + 1 educ + u

As, si u = 0, entonces (100 1 ) es la semielasticidad de wage


respecto a educ,

%wage = (100 1 )educ.


Julio Cceres Delpiano (UC3M) Econometria I 10/07 25 / 68
Modelos No Lineales. Modelo de Elasticidad Constante
(log-log)

En este caso la relacin entre x e y se establece en trminos de


incrementos relativos.
Ambas variables deben aparecer en logaritmos,
log (wage ) = 0 + 1 log (educ ) + u

Pero es ms razonable suponer que es el porcentaje de incremento el


que es constante.
Cual es la interpretacin de 1 ?

Julio Cceres Delpiano (UC3M) Econometria I 10/07 26 / 68


Modelos No Lineales. Modelo con regresores en logaritmos
(level-log)

En este caso controlamos incrementos relativos de x,


y = 0 + 1 log (x ) + u,
Cual es la interpretacin de 1 ?

Julio Cceres Delpiano (UC3M) Econometria I 10/07 27 / 68


Limitaciones del Anlisis de Regresin Simple

Difcil extraer conclusiones ceteris paribus: mejor controlar ms


factores para hacer una anlisis causal. Ej: Student Score on Student
Expenditure.
Slo consigue explicar una parte limitada de la variabilidad de y en
funcin de una nica x.
Slo puede incorporar una determinada relacin funcional entre la x y
la y (en funcin de x, log (x ), etc.). Ej CEO salaries

Julio Cceres Delpiano (UC3M) Econometria I 10/07 28 / 68


Motivacin para la regresin mltiple. Modelo con k
variables independientes

Y = 0 + 1 X1 + 2 X2 + . . . + k Xk + u.
k + 1 parmetros.
0 es el trmino constante.
j mide el efecto sobre y de un cambio en xj , manteniendo otros
factores constantes (parmetros de pendiente).
u : otros factores que afectan y y no son x1 , x2 , . . . , xk .

Julio Cceres Delpiano (UC3M) Econometria I 10/07 29 / 68


Motivacin para la regresin mltiple. Modelo con k
variables independientes: SUPUESTOS

Generalizacin de la independencia en media condicional:

E (u jx1 , x2 , . . . , xk ) = 0.
El valor esperado de u debe ser igual para todas las combinaciones de
x1 , x2 , . . . , xk .
Tambin implica que se han especicado correctamente todas las
relaciones funcionales entre las x 0 s y la y .
Este supuesto garantiza que MCO est insesgado, y si se omite una
variable de x1 , x2 , . . . , xk ocasionar un sesgo.

Julio Cceres Delpiano (UC3M) Econometria I 10/07 30 / 68


Mecnica e interpretacin de MCO. Obtencin de los
EMCO

Ecuacin estimada por MCO:

Y =c 0 + c
1 X1 + c2 X2 + . . . + c Xk
k
MCO elige los valores de c0 , c
1 , c c que minimizan la suma de
2 , . . . , k
cuadrados de los residuos.
Dadas n observaciones f(xi 1 , xi 2 , ..., xik , yi ), i = 1, . . . , ng se eligen
c
1 , c c para hacer
2 , . . . , k
n
i =1 i( y ( c
0 + c
1 Xi 1 + c c Xik ))2
2 Xi 2 + . . . + k

tan pequeo como sea posible..

Julio Cceres Delpiano (UC3M) Econometria I 10/07 31 / 68


Mecnica e interpretacin de MCO. Obtencin de los
EMCO: caso general

CPO:

i =1 n (yi (c
0 + c
1 Xi 1 + c c Xik )) = 0
2 Xi 2 + . . . + k

i =1 n xi 1 (yi (c
0 + c
1 Xi 1 + c c Xik )) = 0
2 Xi 2 + . . . + k

..
.

i =1 n xik (yi (c
0 + c
1 Xi 1 + c c Xik )) = 0
2 Xi 2 + . . . + k

Julio Cceres Delpiano (UC3M) Econometria I 10/07 32 / 68


Mecnica e interpretacin de MCO. Obtencin de los
EMCO: caso general

Las condiciones de primer orden reproducen las condiciones

E (u ) = 0, E (xj u ) = 0, j = 1, . . . k,
que se obtienen a partir del supuesto E (u jx1 , x2 , . . . , xk ) = 0

Adems deben resolverse de forma nica.


Regresin mnimo cuadrtica, funcin de regresin muestral:

yb = c
0 + c
1 x1 + c c xk
2 x2 + . . . + k
c
: estimador MCO del trmino constante.
0
c
1 , c c : estimadores MCO de las pendientes.
1 , . . . , k
Interpretacin ceteris paribus
Julio Cceres Delpiano (UC3M) Econometria I 10/07 33 / 68
Mecnica e interpretacin de MCO. Interpretacin de
Mantener Otros Factores Constantes

El anlisis de regresin mltiple proporciona interpretaciones ceteris


paribus incluso si los datos no se han recogido de forma ceteris
paribus.

Regresin mltiple permite realizar en situaciones no experimentales


los mismos anlisis que hacen otros cientcos en situaciones de
laboratorio bajo control.

Julio Cceres Delpiano (UC3M) Econometria I 10/07 34 / 68


Mecnica e interpretacin de MCO Valores ajustados y
Residuos MCO

Valor ajustado para la observacin i :

ybi = c
0 + c
1 xi 1 + c c xik
2 xi 2 + . . . + k
Residuo para la observacin i :

ubi = yi ybi = yi c
0 c
1 xi 1 c
2 xi 2 ... c xik
k

Julio Cceres Delpiano (UC3M) Econometria I 10/07 35 / 68


Mecnica e interpretacin de MCO Valores ajustados y
Residuos MCO

u = 0

[ n (xj u ) = 0,
COV j = 1, . . . , k

El punto (x1 , x2 , . . . , xk , y ) pertenece la recta de regresin MCO.

Julio Cceres Delpiano (UC3M) Econometria I 10/07 36 / 68


Mecnica e interpretacin de MCO Una interpretacin "de
ltrado" de regresin mltiple

Caso k = 2 :

ni=1 ri 1 yi
1 = ni=1 ri21
donde ri 1 son los residuos MCO de una regresin simple de x1 sobre
x2 , con la misma muestra.

Julio Cceres Delpiano (UC3M) Econometria I 10/07 37 / 68


Mecnica e interpretacin de MCO Bondad de ajuste

Suma de Cuadrados Totales, SST:

ni=1 (yi y )2

Suma de Cuadrados Explicada, SSE:

ni=1 (yi y )2

Suma de Cuadrados de los Residuos, SSR:


ni=1 ui2

Julio Cceres Delpiano (UC3M) Econometria I 10/07 38 / 68


Bondad de ajuste. Descomposicin de las Sumas de
Cuadrados

SST = SSE + SSR.

Coeciente de Determinacin or R-cuadrado

SSE SSR
R2 = SST =1 SST

Propiedad, recordando que y = y ,

R 2 = 2y y

R 2 nunca desciende cuando se aade una nueva variable en la


regresin: no es un buen criterio para decidir si aadir una nueva
variable al modelo.
Julio Cceres Delpiano (UC3M) Econometria I 10/07 39 / 68
Valores esperados de los Estimadores MCO. Supuestos

RLM.1 (Modelo lineal en parmetros). En el modelo para la


poblacin, la variable dependiente y se relaciona con la variable
independiente x y el error u mediante

Y = 0 + 1 X1 + 2 X2 + . . . + k Xk + u
donde 0 , 1 , . . . , k son parmetros desconocidos y u es una
perturbacin o error aleatorio.
Esta expresin se la conoce como el modelo verdadero (para la
poblacin) y es importante para interpretar los parmetros.

Julio Cceres Delpiano (UC3M) Econometria I 10/07 40 / 68


Valores esperados de los Estimadores MCO. Supuestos(2)

RLM.2 (Muestreo aleatorio). Para estimar los parmetros se dispone


de una muestra de tamao n, (xi 1 , . . . , xik , yi ) i = 1, . . . , n del
modelo poblacional,

yi = 0 + 1 xi 1 + 2 xi 2 + . . . + k xik + ui , i = 1, . . . , n
Esta expresin es importante para deducir las propiedades de los
EMCO de 0 , 1 , . . . , k .

Julio Cceres Delpiano (UC3M) Econometria I 10/07 41 / 68


Valores esperados de los Estimadores MCO. Supuestos(3)

RLM.3 (Media Condicional cero).

E (u jx1 , x2 , . . . , xk ) = 0.

Cuando no se cumple?
Incorrecta Especicacin.
Omitir factores que estan correlacionados con x1 , x2 , . . . , xk
Otros problemas son los errores de medida, y la simultaneidad (y se
determina conjuntamente con alguna variable explicativa.).
Si RLM.3 es cierta, se dice que tenemos variables explicativas
exgenas, y en caso contrario endgenas.

Julio Cceres Delpiano (UC3M) Econometria I 10/07 42 / 68


Valores esperados de los Estimadores MCO. Supuestos(4)

RLM.4 (No multicolinealidad perfecta). En la muestra (y por tanto


en la poblacin), ninguna de las variables explicativas es constante, y
no hay una relacin lineal exacta entre las variables explicativas.

Slo afecta a las xs, por lo que es muy diferente de RLM.3.


Si una variable independiente es una combinacin lineal exacta de
otras variables independientes, entonces hay multicolinealidad
perfecta: no se puede hacer MCO.
No impide que haya correlacin entre las xs, slo requiere que no sea
perfecta.
Otra causa: el tamao muestral n es demasiado pequeo, n < k + 1.

Julio Cceres Delpiano (UC3M) Econometria I 10/07 43 / 68


Valores esperados de los estimadores MCO

Teorema 3.1 (Insesgadez de MCO). Bajo los supuestos RLM.1-5.

E ( j ) = j j = 0, . . . , k

El supuesto clave es RLM.3


La propiedad de insesgadez no dice nada sobre el resultado de la
estimacin en un caso particular, si no que es una propiedad del
mtodo de estimacin MCO.
Cual es la consecuencia (en trminos de sesgo) de una
sobreidenticacin de un modelo?

Julio Cceres Delpiano (UC3M) Econometria I 10/07 44 / 68


Valores esperados de los estimadores MCO. Sesgo por
omisin de variables: el caso simple

Ahora se omite una variable que s que pertenece al modelo


poblacional: se excluye una variable relevante o infra-estimacin del
modelo: caso particular de error de especicacin.
Modelo verdadero: y = 0 + 1 x1 + 2 x2 + u y se satisfacen
RLM.1-4.
Suponemos que el objeto de inters es 1 , el efecto parcial de x1
sobre y .
Para obtener estimadores insesgados deberamos incluir x2 en la
regresin, pero no lo hacemos,

y = 0 + 1 x1

Julio Cceres Delpiano (UC3M) Econometria I 10/07 45 / 68


Valores esperados de los estimadores MCO. Sesgo por
omisin de variables: el caso simple

(x1i x1 )x 2i
E ( 1 ) = 1 + 2 (x1i 2 .
x1 )

O en forma similar E ( 1 ) = 1 + 2 1 .

donde x2 = 0 + 1 x1
Suponemos que el objeto de inters es 1 , el efecto parcial de x1
sobre y .
De esta forma podemos denir el sesgo de como 1

Sesgo( 1 )=E ( 1 ) 1 = 2 1

Julio Cceres Delpiano (UC3M) Econometria I 10/07 46 / 68


Valores esperados de los estimadores MCO. Sesgo por
omisin de variables: el caso simple

Hay dos casos en los que 1 es insesgado:


Si 2 = 0, por lo que x2 no aparece en la ecuacin.
Si 1 = 0, es decir la covarianza muestral entre x1 y x2 es cero. Ya
sabemos que si x1 y x2 estn incorrelados muestralmente, 1 = 1 , y
1 es insesgado
Cual es el signo del sesgo?

Julio Cceres Delpiano (UC3M) Econometria I 10/07 47 / 68


Varianza de los Estimadores MCO

RLM.5 (Homocedasticidad Condicional): u tiene varianza, condicional


en x1 , . . . , xk constante,

Var(u jx1 , . . . , xk )=2

2 se le llama la varianza del error o perturbacin.


Si no se cumple, estamos en presencia de heteroscedasticidad.
Los supuestos RLM.1-5 se denominan los supuestos de Gauss-Markov
[para datos de seccin cruzada].

Julio Cceres Delpiano (UC3M) Econometria I 10/07 48 / 68


Varianza de los Estimadores MCO

RLM.3 y RLM.5 se pueden escribir como, x = (x1 , . . . , xk ) ,

E (y jx ) = 0 + 1 x1 + 2 x2 + . . . + 2 xk
Var (y jx ) = 2

Teorema 3.2 (Varianzas muestrales de los estimadores MCO de las


pendientes). Bajo supuestos RLM.1-5, condicional en los valores de
las variables independientes,

2
V ( j ) = SST j (1 R j2 )
j = 0, . . . , k con

SSTj = (xji xj )2
Qu elementos afectan el error standard de nuestros estimadores de
MCO?
Julio Cceres Delpiano (UC3M) Econometria I 10/07 49 / 68
Varianza de los estimadores MCO. Varianzas en modelos
mal especicados
Hay un tradeo entre sesgo y varianza a la hora de decidir si incluir
una variable o no en una regresin.
Modelo verdadero, con supuestos Gauss-Markov,

y = 0 + 1 x1 + 2 x2 + u

Consideramos dos estimadores:


1 , en regresin mltiple,

y = 0 + 1 x1 + 2 x2

1 , en regresin simple,

y = 0 + 1 x1
Julio Cceres Delpiano (UC3M) Econometria I 10/07 50 / 68
Varianza de los estimadores MCO. Varianzas en modelos
mal especicados

Si 2 6= 0, 1 estar sesgado, por lo que desde el punto de vista del


sesgo, 1 ser preferido.
Que podemos decir de la variaza de estos estimadores?
Si x1 y x2 estan correlados:
Si 2 6= 0, 1 es sesgado, 1 es insesgado y Var( 1 )<Var( 1 ).
Si 2 = 0, 1 y 1 son insesgado y Var( 1 )<Var( 1 ).
En el segundo caso preferimos 1 : introducimos una variable
irrelevante.
En el primer caso es ms complicado: se suele preferir 1 .

Julio Cceres Delpiano (UC3M) Econometria I 10/07 51 / 68


Varianza de los estimadores MCO. Estimacin de 2

2 = E (u 2 ) por lo que un estimador insesgado de 2 es n ni=1 ui2


1

Como los errores no son observables, un primer estimador sera


n 1 SSR = n 1 ni=1 ui2 , pero este no es insesgado.
Los residuos ui satisfacen k + 1 restricciones. Por tanto los residuos
tienen n k 1 grados de libertad.

2 = 1
n k 1 ni=1 ui2 = 1
n k 1 SSR

Julio Cceres Delpiano (UC3M) Econometria I 10/07 52 / 68


Varianza de los estimadores MCO. Estimacin de 2

Teorema 3.3. (Estimacin insesgada de 2 ). Bajo las condiciones de


Gauss-Markov RLM.1.5,

E (2 ) = 2

Estimador de , o error estndar de regresin, o SER,.

p
= 2

puede aumentar o disminuir cuando se incluye una variable


adicional en la regresin.

Julio Cceres Delpiano (UC3M) Econometria I 10/07 53 / 68


Varianza de los estimadores MCO. Errores estndar de los
EMCO

Desviacin estndar de j :


sd ( j ) = [SST j (1 R j )](1/2 )

Error estndar de j :


se ( j ) = [SST j (1 R j )](1/2 )

Slo es vlida en presencia de RLM.5 (si no, hay que cambiar sd ( j )


y se ( j )

Julio Cceres Delpiano (UC3M) Econometria I 10/07 54 / 68


Distribuciones muestrales de los Estimadores MCO
RLM.6 (Normalidad) El error poblacional u es independiente de las
variables explicativas x1 , x2 , . . . , xk y se distribuye normalmente con
media cero y varianza 2 , u Normal (0,2 )
RLM.6 es un supuesto mucho ms fuerte que los anteriores. Como u
es independiente de xj ,
E (u jx1 , x2 , . . . , xk ) = E (u ) = 0
Var (u jx1 , x2 , . . . , xk ) = Var (u ) = 2 ,
por lo que implica RLM.3 y RLM.5.
RLM.1-6 se nombran como los supuestos clsicos del modelo de
regresin lineal (MLC), y al modelo que satisface estos supuestos
como el modelo lineal clsico satisface las condiciones de
Gauss-Markov junto con el supuesto de normalidad.
Bajo MLC los EMCO 0 , 1 , . . . , k satisfacen una propiedad de
eciencia ms fuerte que bajo Gauss-Markov: los EMCO son los
estimadores insesgados de mnima varianza (ya no se requiere que
sean lineales).
Julio Cceres Delpiano (UC3M) Econometria I 10/07 55 / 68
Distribuciones muestrales de los Estimadores MCO

Un resumen de las condiciones MLC para el modelo poblacional es

y jx Normal(0 + 1 x1 + . . . + k xk , 2 )
Justicacin de la normalidad: como u es el resultado de la suma de
muchos factores inobservables que afectan a y, se puede invocar el
Teorema Central del Lmite.

Julio Cceres Delpiano (UC3M) Econometria I 10/07 56 / 68


Distribuciones muestrales de los EMCO Normalidad de los
errores se traslada a normalidad de las distribuciones
muestrales de los EMCO.

Teorema 4.1 (Distribuciones muestrales normales). Bajos los


supuestos MLC, RLM.1-6, condicional en los valores muestrales de las
variables independientes

j N ( j , V ( j )), donde

2
V ( j ) = SST j (1 R j2 )

j j
y por tanto sd ( j )
N (0, 1)

Julio Cceres Delpiano (UC3M) Econometria I 10/07 57 / 68


Contraste de Hiptesis sobre un nico parmetro
poblacional: el test de la t.

El problema es hacer contrastes de hiptesis sobre j .


j es una propiedad desconocida de la poblacin, y nunca la
conoceremos con certeza, pero podemos hacer hiptesis sobre su
valor, y hacer inferencia estadstica para contrastar nuestra hiptesis.
Teorema 4.2 (Distribucin del estimador MCO estandarizado). Bajos
los supuestos MLC, RLM.1-6,

j j
se ( j )
tn k 1

Julio Cceres Delpiano (UC3M) Econometria I 10/07 58 / 68


Contraste de Hiptesis sobre un nico parmetro
poblacional: el test de la t.

El Teorema 4.2 es importante porque permite contrastar hiptesis


sobre j .
En la mayora de las aplicaciones, el inters primordial es contrastar la
hiptesis nula.

H0 : j = 0
Signicado: como j mide el efecto parcial de xj sobre (el valor
esperado de) y, despus de controlar por todas las otras variables
independientes, H0 signica que, una vez que se ha tenido en cuenta
x1 , . . . , xj 1 , xj +1 , . . . , xk , xj no tiene efecto sobre el valor esperado
de y .

Julio Cceres Delpiano (UC3M) Econometria I 10/07 59 / 68


Contraste de Hiptesis sobre un nico parmetro
poblacional: el test de la t.

El estadstico de contraste se llama estadstico t o cociente t ( t


ratio) de j :

j
t = se ( j )
j

La regla de rechazo depender de la hiptesis alternativa


correspondiente y del nivel de signicacin elegido.
Si H1 : j > 0 signica que no nos preocupamos de alternativas de H0
para las que H1 : j < 0. Por alguna razn descartamos que j < 0.
Regla de decisin: necesitamos un nivel de signicacin o probabilidad
de rechazar H0 cuando es cierta (error de tipo I), por ejemplo 5 %.

Julio Cceres Delpiano (UC3M) Econometria I 10/07 60 / 68


Contraste de Hiptesis sobre un nico parmetro
poblacional: el test de la t.

Como t se distribuye como una t bajo H0 , por lo que tiene media


j
cero, bajo la alternativa j > 0, el valor esperado de t es positivo:
j
buscamos un valor sucientemente grande (y positivo) de t para
j
rechazar H0 : j = 0 en favor de H1 : j > 0.
Valores negativos de j o t no proporcionan evidencia en favor de
j
H1 .
La denicin de "sucientemente grande", con un 5% de nivel de
signicacin, es el percentil 95% en una tn k 1 , c.
Por tanto la regla de rechazo es que H0 se rechaza en favor de H1, al
nivel de signicacin del 5%, si
t > c.
j

Julio Cceres Delpiano (UC3M) Econometria I 10/07 61 / 68


Contraste de Hiptesis sobre un nico parmetro
poblacional: el test de la t.

Por tanto, si H0 se rechaza al 5%, tambin se rechazar al 10%..


Cuanto ms grande es n, ms se parece la t a la normal.

Julio Cceres Delpiano (UC3M) Econometria I 10/07 62 / 68


Contraste de Hiptesis sobre un nico parmetro
poblacional: el test de la t.

En aplicaciones es frecuente contrastar la hiptesis nula H0 : j = 0


contra una alternativa bilateral, H1 : j 6= 0.
Si H0 se rechaza en favor de H1 al 5% se habla de que xj es
estadsticamente signicativo (o estadsticamente diferente de cero.

Julio Cceres Delpiano (UC3M) Econometria I 10/07 63 / 68


Contraste de Hiptesis: el test de la t. Otras hiptesis
sobre j

En general podemos estar interesados en contrastar H0 : j = aj


donde aj es un valor hipottico para j .
El estadstico t apropiado es
j a j
t= se ( j )

Julio Cceres Delpiano (UC3M) Econometria I 10/07 64 / 68


Contraste de Hiptesis: el test de la t. p-valores para
contrastes de la t

dado el valor del estadstico t, cul es el menor nivel de signicacin


para el que la hiptesis nula se rechaza? El p-valor es una
probabilidad 2 (0, 1) .
Este valor es el p-valor del contraste. Se obtiene usando la
distribucin de una variable tn k 1 y comparndola con el valor del
estadstico t.

Julio Cceres Delpiano (UC3M) Econometria I 10/07 65 / 68


Intervalos de Conanza

( j cse ( j ), j + cse ( j ))
Signicado: si se obtienen sucesivas muestras aleatorias y se computa
el intervalo de conanza para cada una de ellas, entonces el valor
poblacional j (desconocido) estar contenido en el intervalo de
conanza para un 95% de las muestras.

Julio Cceres Delpiano (UC3M) Econometria I 10/07 66 / 68


Combinacin lineal de parmetros

Ejemplo

Julio Cceres Delpiano (UC3M) Econometria I 10/07 67 / 68


Contraste de mltiples restricciones lineales: el contraste
de la F

Estadstico de la F :

(SSR R SSR NR )/q


F = SSR NR /(n k 1 )
Fq,(n k 1) o
2
(R NR R R2 )/q
F = 2
(1 R R / (n k 1 )
Fq,(n k 1)

Julio Cceres Delpiano (UC3M) Econometria I 10/07 68 / 68