Вы находитесь на странице: 1из 33

Facultad de Ciencias

Económicas

ECONOMETRÍA I
ANÁLISIS DE SUPUESTOS

Mg. Beatriz Castañeda


Correlación Parcial
En el modelo de regresión múltiple interesa medir cuán relacionada está la
variable dependiente con cada una de las variables independientes, luego de
eliminar completamente el efecto de las otras variables independientes en el
modelo.

Ejemplo
Sea el modelo: Yi   1   2 X 2 i   3 X 3 i   i

y sean los modelos auxiliares

1) Yˆi  ˆ 1  ˆ 2 X 3 i 2) Xˆ 2 i  ˆ1  ˆ2 X 3 i

Eliminamos de Y y X2 la influencia lineal de X3 y obtenemos:

de 1) Y *  Yi  Yˆi de 2) X *2 i  X 2 i  Xˆ 2 i

Al coeficiente de correlación entre Y* y X*2 se denomina correlación parcial


entre Y y X2.

2 Mg. Beatriz Castañeda


rYX 2 : Correlación simple entre Y y X2
X2
rYX 3 : Correlación simple entre Y y X3 Y
X3
rX 2 X 3 : Correlación simple entre X 2 y X3

rYX 2 . X 3 : Correlación parcial entre Y y X 2 ( controlada por X 3

rYX 2  rYX 3 rX 2 X 3 ˆ
 2  rY 2.3
SY .3
rYX 2 . X 3  S 2.3
1 rX22 X 3 1 rYX
2
3

SY.3 : Desv. est. de los residuos en la regresión de Y en X3

S2.3 : Desv. est. de los residuos en la regresión de X2 en X3

3 Mg. Beatriz Castañeda


Sesgo por variable omitida
Modelo 1. Yi   1   2 X 2 i   3 X 3 i   i
Modelo 2. Yi   1   2 X 2 i  ui ˆ 2  ˆ 2  ˆ 3ˆ2
Modelo 3. X 3 i   1   2 X 2 i  a i

Modelo 1. Modelo 2. Modelo 3.


 S 33 S y 2  S 23 S y 3 
 ˆ 2   S 22 S 33  S 23 2
 ˆ 2 
S y2 S
ˆ   S 1
xx S xy   S S S S  ˆ2  23
S 22 S 22
 3 
22 y 3 23 y 2
 S 22 S 33  S 232 

S 33 S y 2  S 23 S y 3 S 22 S y 3  S 23 S y 2  S 23 
ˆ 2  ˆ 3ˆ2    
S 22 S 33  S 232
S 22 S 33  S 23  S 22 
2

S 22 S 33 S y 2  S 22 S 23 S y 3  S 23 S 22 S y 3  S 23 S 23 S y 2

S 22 ( S 22 S 33  S 23
2
)
S y2
  ˆ 2
S 22
Mg. Beatriz Castañeda 4
Análisis del modelo
Supuestos del modelo Violación del supuesto

1) Las variables X son no colineales Multicolinealidad

2) Las perturbaciones tienen No normalidad de las


distribución normal perturbaciones

3) Regresores son no estocásticos Regresores estocásticos

4) Las perturbaciones tienen Heterocedasticidad


varianza constante

5) Las perturbaciones son Autocorrelación


incorrelacionadas

Mg. Beatriz Castañeda 5


Problema de Multicolinealidad

ˆ MCO  ( X ´ X ) 1 X ´Y

Si alguna variable X es combinación lineal de las otras, entonces

 ( X´ X )  K  No existe ( X ´ X ) 1

Por lo tanto no podríamos obtener los estimadores de los coeficientes del


modelo, lo que nos llevaría a reformular el modelo en función de las otras
variables teniendo en cuenta la relación lineal.

Si no existe colinealidad perfecta pero las correlaciones son muy altas,


esto implicaría distorsiones en las estimaciones de los coeficientes, pues su
varianza sería muy grande (estimadores poco precisos).

Mg. Beatriz Castañeda 6


Problema de Multicolinealidad

Sea el modelo Yi   1   2 X 2 i   3 X 3 i   i

 S 22 S 23   S 22 r23 S 2 S 3 
x´ x  ( n  1)  2
 ( n  1)  
 S 23 S3   r23 S 2 S 3 S 32 

1  S 2
 r23 S 2 S 3 
( x´ x ) 1  2 2 2 
3

( n  1)[ S 2 S 3  r23 S 2 S 3 ]   r23 S 2 S 3
2 2
S 22 

S 32  2  2
V ( ˆ 2 )  
( n  1) S 22 S 32 (1  r232 ) ( n  1) S 22 (1  r232 )

S 2
 2
 2
V ( ˆ 3 )  2 
 
 Si r23 1
( n  1) S 22 S 32 (1  r232 ) ( n  1) S 32 (1  r232 )
1
 FIV Factor de incremento
1  r232 varianza
Mg. Beatriz Castañeda 7
Consideremos el modelo restringido
 2

Yi   1   21 X 2 i  ui V ( ˆ 21 )  u
( n  1) S 22
En cambio para el modelo sin
Yi   1   2 X 2 i   3 X 3 i   i
restricción

   2
2 2
1
V ( ˆ 2 )  u  donde
1
(1  r232 ) ( n  1) S 22  u2 u 2

Si r23 = 0 V ( ˆ 2 )  V ( ˆ 21 )

Así FIV  1 Indica en que medida irá creciendo la varianza del estimador
1  r232 cuando las variables estén correlacionadas.

1
En general FIV  Ri2 : es el coeficiente de determinación en el
modelo de Xi dadas las otras variables
1  Ri2
Xs

Mg. Beatriz Castañeda 8


Detección del problema de Multicolinealidad

1. Característica típica de la multicolinealidad es que todos los coeficientes


de regresión pueden ser no significativamente diferentes de cero a nivel
individual, aunque en conjunto todas las variables sean muy
significativas.

2. Al examinar la matriz de correlación de las variables regresoras, R, y su


inversa R-1, se encuentra que el i-ésimo elemento de la diagonal
principal de R-1 (tii) es el factor de incremento de varianza (FIV) del
coeficiente de la variable Xi.

1 Indica una alta multicolinealidad


Si t ii  FIV ( X i )   10
1  Ri2

Indica la porción de la variable que no es explicada


Tolerancia = 1- R2i
por las otras variables

Mg. Beatriz Castañeda 9


3. Al examinar los valores propios de (X´X) o R y calcular el índice de
condicionamiento

Máximo valor propio de R


IC 
Mínimo valor propio de R

Se tiene el siguiente criterio

IC > 30 Existe alta multicolinealidad

10  IC  30 Existe multicolinealidad moderada

IC < 10 Matriz de datos está bien definida

Mg. Beatriz Castañeda 10


4. Test de Farrar Glauber*

i) Test de ortogonalidad H 0 : Las X son ortogonales entre sí


H 1 : Las X no son ortogonales entre sí

Estadística

 calc
2
 
  n  1  ( 2 k6 5 ) ln R  calc
2
  k2( k 1) / 2

K: nº de variables explicativas
R: matriz de correlaciones simples

 2( k ( k 1) / 2 )
 calc
2

R.C.
* http://www.rochester.edu/college/psc/clarke/405/FarrarGlauber.pdf

Mg. Beatriz Castañeda 11


ii. Test F
Para determinar que regresor se encuentra más colineado con las
demás variables.

Se obtiene la regresión de cada variable en función del resto de variables


y se calcula el R² para el modelo de cada variable.

2
H 0 : Rmax 0 2
H 1 : Rmax 0

Estadística
2
Rmax /( k  1)
Fi   F( k 1, n k ) K: nº de variables explicativas
(1  Rmax ) /( n  k )
2

F( k ,n  k )
Fi
R.C
Mg. Beatriz Castañeda 12
iii. Test t
Para determinar que regresor se encuentra más correlacionado con
una de las otras variables
2
H 0 : rmax 0 2
H 1 : rmax 0

Estadística

rmax n k
rmax es el coeficiente de correlación
T  t n k
1  rmax
2 parcial entre un par de variables

 
t(n-k)
- t1-/2 0 t1-α
R.C. R.C

Mg. Beatriz Castañeda 13


Tratamiento

1. Eliminar o excluir regresores del modelo, eligiendo aquellos que tengan


mayor multicolinealidad con las otras variables, es decir, FIV > 10

2. Incluir información externa a los datos de manera que se rompa el


problema de multicolinealidad (Se considera que este problema es un
“problema de la muestra a mano”)

3. Utilizar un modelo multiecuacional

4. Estimar los coeficientes utilizando el método de “regresión cresta”, el cual


es un método exploratorio que consiste en utilizar una modificación a la
matriz (X´X)
Eligiendo  desde 0.01 hasta obtener resultados estables, es
( X´ X )   I decir, tales que las varianzas de los estimadores no cambien
significativamente al cambiar algunos datos

5. Utilizar restricciones lineales para los coeficientes


6. Utilizar un modelo de componentes principales

Mg. Beatriz Castañeda 14


Modelos con variables cualitativas
15

En el análisis de la relación estructural entre las variables económicas,


encontramos que además de variables cuantitativas, en algunos casos,
la variable dependiente se ve impactada por variables de naturaleza
categórica o cualitativa, como por ejemplo:

1. El nivel de los salarios depende de la edad, experiencia en el área,


género, nivel de instrucción.
2. El precio de venta o alquiler de una casa o local depende de sus
dimensiones, área construida, zona de ubicación, servicios e
instalaciones.
3. Demanda de un bien suntuario depende del ingreso, precio, estabilidad
política en el país.

Mg. Beatriz Castañeda


Modelos con variables cualitativas
16

Para evaluar el impacto de éstas variables, se definen variables cuantitativas


artificiales denominadas “dummy” , dicotómicas o binarias.

Género: femenino, masculino Variable: Sexo (1 = masculino, 0= femenino)

Variables:

Zona: Norte, Centro, Sur Norte (1= zona norte, 0= otra zona
Centro (1= zona centro, 0= otra zona
Norte=0 y Centro =0  zona sur

Mg. Beatriz Castañeda


Impacto de la omisión de variables categóricas en el
modelo
17

Y: Precio de alquiler X: Superficie Zona: A , B

Y ŷ Y
Y ŷ
ŷ A ŷ A ŷ B
     
    ŷ   ŷ A
 
ŷ B   
       
    ŷ B
    
X X X

Error en la estimación Oculta la relación


del efecto de las Genera relación
variables cuantitativas artificial

Mg. Beatriz Castañeda


Especificación del modelo
18

1. Efecto aditivo o diferencial


Cuando se asume que el efecto de las v. cuantitativas es el mismo para
todos los grupos definidos por las categorías de la v. categórica.

Yi   1   2 X i   3 Zona   i Zona: 0=Zona A, 1=Zona B

Si está en la Zona A  Yi  1   2 X i   i

Si está en la zona B ,  Yi  1   3   2 X i   i

β3 indica el efecto diferencial por la zona, esto es, el cambio en el precio


medio que produce la zona B sobre la A

H0: β3 = 0 No hay efecto de la zona sobre el precio de alquiler


Mg. Beatriz Castañeda
La inclusión de las variables dummy permite:
19

a. Tener en cuenta la diferencia en el nivel medio de respuesta debido al atributo para


igualdad de valores X
b. Estimar óptimamente el efecto de las variables cuantitativas X, utilizando toda la
información disponible
Sean 3 zonas A, B y C, entonces definimos 2 variables dummy

Zona A: 1=Zona A, 0= otra zona Zona B: 1=Zona B, 0= otra zona

A
1 X1 1 0
 ... ...
Yi  1   2 X i   3 Zona A   4 Zona B   i  ... ... 
1 X 1 0

B
 
1 X 0 1
Zona A,  Yi   1   3   2 X i   i X   ... ... ... ...
 
1 X 0 1
Zona B ,  Yi  1   4   2 X i   i
C
1 X 0 0
 
 ... ... ... ...
Zona C  Yi  1   2 X i   i 1
 Xn 0 0 

Mg. Beatriz Castañeda


20

Yi  1   2 X i   3 Zona A   4 Zona B   i

β3 indica el efecto diferencial de la zona A frente a la C

β3 – β4 indica el efecto diferencial de la zona A frente a la B

H0: β3 = 0 y β4 = 0
No hay efecto de la zona sobre el precio de alquiler

H0: β3 - β4 = 0
No hay efecto diferencial de la zona A frente a la zona B , sobre el precio medio de
alquiler

Mg. Beatriz Castañeda


21
Y
2. Efecto multiplicativo o interactivo. ŶB
Cuando se asume que el efecto de las v.
cuantitativas cambia para los grupos definidos Ŷ A
por las categorías de la v. categórica.

X
Yi  1   2 X i   3 Zona * X i   i Zona: 0=Zona A, 1=Zona B

Zona A  Yi   1   2 X i   i Zona B ,  Yi  1  (  2   3 ) X i   i

β3 indica el cambio en el efecto de la variable superficie sobre el precio de


alquiler al pasar de la zona A a la B
H0: β3 = 0
No hay efecto de la zona sobre el precio de alquiler
Mg. Beatriz Castañeda
22

Y
ŶB
Zona: 0=Zona A, 1=Zona B
Ŷ A

A
1 x 0
Yi  1   2 X i   3 Zona * X i   i  ... ... ...
 
1 x 0
X  

B

Zona A  Yi  1   2 X i   i 1 x x
 ... ... ...
 

1 x x
Zona B ,  Yi   1  (  2   3 ) X i   i

Mg. Beatriz Castañeda


23
Y
3. Efecto multiplicativo o interactivo entre ŶB
variables cualitativas, cuando se asume
que hay interacción en el efecto de dos o Ŷ A
más variables cualitativas.

Yi   1   2G   3 I   4G * I   5 X i   i X

Y: salario X: Experiencia laboral G: 0=mujer , 1=varón

1 0 0 0 X Mujer sin inst. sup

I: 0= sin inst. superior 1 0 1 0 X Mujer con inst. sup


1= con inst. superior X  
1 1 0 0 X Varón sin inst. sup
 
1 1 1 1 X Varón con inst. sup

Varón con inst . sup .  Yi  ( 1   2   3   4 )   5 X i   i


Mg. Beatriz Castañeda
Análisis de Cambio o quiebre estructural
Las políticas económicas, el cambio tecnológico, u otros eventos de impacto
social, ocurridos en el tiempo pueden ocasionar un cambio en la estructura de la
relación entre la variable dependiente y las variables independientes.
Test de Chow - Punto de quiebre

Sean m1 y m2 muestras observadas en dos periodos

H 0 : 1   2   H 0 : 1   2
No hay cambio Hay cambio estructural

Y1   X 1  Y1   X 1 0   1    1 
MR Y    X     MSR Y    0     
X 2    2   2 
 2  2  2 

[ SCE ( MR)  SCE ( MSR )] / K [e´e  (e1'e1  e2' e2 )] / k


F  ' es F( k ,T  2 k )
SCE ( MSR ) /(T  2k ) (e1e1  e2 e2 ) /(T  2k )
'

Mg. Beatriz Castañeda 24


Analizar si existe quiebre estructural entre los periodos
Ejemplo correspondientes a las muestras

 50 300   300  '


T1  50 X X1  
'
1  XY 
'
1 1  Y1 Y1  2100
 300 2100  2000
 50 300   300  '
T2  50 X X2  
'
2  X Y 
'
2 2  Y2Y2  2500
 300 2500   2200

Modelo Restringido Yt   1   2 X t   t , para t  1, T

100 600   600  '


T  100 X X'
 XY 
'
 Y Y  4600
 600 4600   4200

 2, 4 
̂    SCE (MR )  4600  3960  640
 0 ,6 

Mg. Beatriz Castañeda


Modelo sin Restricción D1: 0=m2 , 1=m1 D2: 0=m1, 1=m2

Yt   11 D1   21 D1 X 1t   12 D 2   22 D 2 X 2 t   t , para t  1, T

 50 300 0 0   300 
300 2100 0 0   2000 
X 'X    X 'Y    Y 'Y  4600
 0 0 50 300   300 
   
 0 0 300 2500   2200 

 2 
0,67  SCE (MSR)  4600  3965  635
ˆ   
 2,57  e1' e1  e2' e2  160  475  635
 
 0,57 
0,05
( 640  635) / 2
F  0,378
635 / 96 F( 2 ,96 )
3.09
Mg. Beatriz Castañeda
Análisis de Cambio o quiebre estructural
27

Test de Chow - Predictivo

Se aplica cuando el punto de quiebre es cercano al final del periodo muestral


y no se cuenta con información suficiente para estimar el segundo modelo.
Compara la suma de cuadrados del modelo restringido estimado con toda la
muestra con la suma de cuadrados del modelo estimado con la primera parte.

H 0 : No hay cambio estructura l

[ SCE (T )  SCE (T1 )] / T2


F  F(T , T1  k )
SCE (T1 ) /(T1  k ) 2

Mg. Beatriz Castañeda


Quiebre estructural - Análisis recursivos
28

1. Residuos recursivos et  Yt  x t' ˆ t 1


Residuo de la predicción de Y t obtenida con los coeficientes estimados hasta
el periodo t-1
et
residuo normalizado w t  ; t  k  1, ..., T
1 x (X'
t
'
t 1 X t 1 ) x t

Si t es normal, entonces wt es normal N(0, ²)


4
Este gráfico presenta los residuos
2 recursivos normalizados, el cual
evidencia la existencia de un quiebre
0
estructural que se inicia a mediados
-2 del año 98, fecha en la que los
-4
residuos salen de las bandas, además
de que las bandas de confianza se
-6
1 99 6 1997 1998 1999 2 000
ensanchan
Rec urs i ve Res id ual s ± 2 S .E .

Mg. Beatriz Castañeda


Quiebre estructural - Análisis recursivos
29
2. Prueba Cusum
Esta prueba se basa en la suma acumulada de los residuos normalizados. Si la
gráfica de los residuos permanece dentro de las bandas , indica estabilidad

1 t
Wt   w r ; t  k  1, ..., T ; ˆ  Se de toda la muestra
ˆ r  k 1

Si el modelo es estable E(Wt) = 0


40
Este gráfico evidencia la existencia de un
quiebre estructural, aunque los valores salen de
20
las bandas a mediados del año 99, podemos
apreciar que la dinámica a de los residuos
0
cambia a mediados del año 98.
Esta prueba es débil en el sentido de que si los
-20
errores muestran signos contrarios, se podrían
compensar
-40
1996 1997 1998 1999 2000

CUS UM 5% S ignifi c anc e

Mg. Beatriz Castañeda


Quiebre estructural - Análisis recursivos
30
3. Prueba Cusum cuadrado

Esta prueba se basa en la suma acumulada de los residuos normalizados al cuadrado.


t
 w r2
r  k 1
St  T
; t  k  1, ..., T Si el modelo es estable E(St) =( t-k) / (T-k)

 w r2
r  k 1 1.2

1.0

0.8

Este gráfico evidencia la existencia de un 0.6

quiebre estructural. 0.4

La fecha probable de quiebre es en el 0.2


entorno del punto más alejado de las 0.0
bandas o aquel donde cambia la dinámica
-0.2
del estadístico, aprox. a mediados del 98. 1996 1997 1998 1999 2000

CUSUM of Squares 5% Significance

Mg. Beatriz Castañeda


Quiebre estructural - Análisis recursivos
31

4. Test predictivo de un periodo

Esta prueba se basa en los residuos recursivos y el nivel de significancia de la prueba T para
la hipótesis de estabilidad con el pronóstico de la observación t, dada la información hasta t-
1

4
2
0 H 0 : Hay estabilidad
-2
-4
0.00 et
-6 T
Nivel de 0.05 Set
significancia
0.10
Prueba T
0.15
1996 1997 1998 1999 2000

One-Step Probability Recursive Residuals

Este gráfico evidencia la existencia de un quiebre estructural.


La fecha probable de quiebre es aproximadamente a mediados del 98.

Mg. Beatriz Castañeda


Quiebre estructural - Análisis recursivos
32
5. Test predictivo de n periodos
Esta prueba se basa en los residuos y el nivel de significancia de la prueba F para la hipótesis
de estabilidad con los pronósticos de las observaciones t hasta T, dada la información hasta
t-1
4
2
0
H 0 : Hay estabilidad
-2
-4
[ SCE (T )  SCE (T1 )] / T2
.00
-6 F  F(T , T1  k )
Nivel de .05
SCE (T1 ) /(T1  k ) 2

significancia
.10
Prueba F
.15
1995 1996 1997 1998 1999 2000

N-Step Probability Recursive Residuals

Menor significancia implica mayor discrepancia entre el modelo para la primera muestra (T1) con el
modelo para la muestra total (T). La presencia de quiebre se evidencia cuando la probabilidad es
cercana a cero hasta t y luego la probabilidad va en aumento conforme se incorporen datos del
segundo proceso generador de datos

Mg. Beatriz Castañeda


Quiebre estructural - Análisis recursivos
33
4 .4 1 .9 5
6. Test coeficientes
1 .9 0
recursivos 4 .0

1 .8 5
3 .6
1 .8 0
Estima los coeficientes 3 .2
1 .7 5
del modelo de manera 2 .8
recursiva, si el modelo 1 .7 0

es estable las 2 .4
1996 19 97 1998 1999 2000
1 .6 5
19 96 1997 1998 19 99 2000
estimaciones de los Re c u rs i v e C(1 ) Es ti m a te s ± 2 S.E. Re c u rs i v e C(2 ) Es ti m a te s ± 2 S.E.

coeficientes deben -1 .7

tender a ser -1 .8

convergentes y la -1 .9

varianza del estimador -2 .0

tiende a reducirse, -2 .1

conforme crece la -2 .2

muestra. -2 .3

-2 .4
19 96 19 97 19 98 1999 2000

Re c u rs i v e C(3 ) Es ti m a te s ± 2 S.E.

Mg. Beatriz Castañeda