Академический Документы
Профессиональный Документы
Культура Документы
doc
CAPTULO 9
HETEROCEDASTICIDAD.
______________________________________
Manual de Econometra. Captulo 9, pgina 1 .
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC
funcin de sus ventas y otras variables; un modelo que explica las ventas de una
compaa en funcin de su marketing-mix. Ntese que en todos los ejemplos los
datos muestrales son transversales, las unidades muestrales tienen diferente
"tamao" (familias de bajos y altos ingresos, empresas de dimensin reducida y
grande, etc.) y que la variable dependiente se mide en trminos absolutos
(millones de ptas. por ejemplo). Un hecho frecuente es que la dispersin absoluta
sea mayor en las unidades de mayor volumen precisamente por este motivo
'estructural', si bien es posible que la dispersin relativa sea ms homognea. As,
aunque los dividendos distribudos por las sociedades grandes estn muy
dispersos en torno al valor esperado, es posible que el ratio dividendos distribudos
sobre beneficios, dados los beneficios y dems caractersticas de la sociedad,
tenga una dispersin similar, independiente del tamao de las sociedades.
Los errores de especificacin de la forma funcional tambin pueden producir
1
______________________________________
Manual de Econometra. Captulo 9, pgina 3 .
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC
Y i = 0 + 1 X i + U i ; (i = 1,2,...n); var( U i ) =
(9.1)
Los errores Uj de este modelo son la media de los nj errores de las empresas de la
zona j. Tienen esperanza nula y son por construccin heterocedsticos, ya que la
______________________________________
Manual de Econometra. Captulo 9, pgina 4 .
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC
in=1j U i
; (j = 1,2,...J)
nj
E( U j ) = 0 j = 1,2,...J
(9.2)
Var( U j ) = ; (j = 1,2,...J)
nj
2
Ejercicio 9.1.- Si en el ejemplo anterior los J datos son valores agregados en vez
de medios (ventas y gastos en publicidad totales de las nj empresas del grupo)
obtenga la expresin de las varianzas de las perturbaciones
172; n2(Ingeniera) =
Y i = Log ( Salarioi ) = 1 + 2 S i + 3 T 1i + 4 T 2i + 5 T 3i + 6 E i + 7 E 2 i + u i ;
S i = MUJERi ; T 1i = Dummy de Medicina; T 2 i = Dummy de Economa T 3i = Dummy de Ingeniera;
E = exp eriencia laboral
Ahora supongamos que la varianza del error aleatorio difiere entre las titulaciones.
2
2.
FORMAS
FUNCIONALES.
HETEROCEDASTICIDAD
ADITIVA
MULTIPLICATIVA.
Hemos visto que cuando la heterocedasticidad es un problema producido por el
plan de muestreo o por la agregacin de variables, generalmente conocemos,
excepto por un factor de escala, las varianzas de los errores de cada una de las
observaciones, que dependen del nmero de unidades muestrales desagregadas
contenido en cada observacin agregada. Conocemos, pues, la matriz y el
mtodo de MCG puede aplicarse sin dificultad, obteniendo estimadores ELIO como
se indicaba en la leccin anterior. El nico parmetro a estimar, aparte de los
2
.
Pero cuando la heterocedasticidad obedece a otras causas, que hemos llamado
'estructurales' o bien es consecuencia de una especificacin incorrecta de la
forma funcional, las varianzas de los n errores son desconocidas. Si no hay
autocorrelacin, la matriz V es diagonal y contiene n valores desconocidos. Con
una muestra de tamao n no se pueden estimar libremente esas n varianzas y los
K parmetros de regresin por falta de grados de libertad. Pero para aplicar MCGF
es preciso tener, como sabemos, una estimacin consistente de la matriz V ( o ,
ya que en este caso podemos considerarlas equivalentes). Una posibilidad es
2
i.
(9.3)
0+ 1 Z i ; i = 1,2,...N
4)Var( U i ) = e
5)Var( U i ) = 12 ; (i = 1,2,... n1 )
= 22 ;
(i = n1 + 1,...N )
donde Zi representa alguna variable explicativa del modelo u otra ajena al mismo.
En las formas 1) y 2) la varianza del error es directamente proporcional a la
______________________________________
Manual de Econometra. Captulo 9, pgina 7 .
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC
tener
varianzas
negativas.
El
esquema
3)
recibe
el
nombre
de
sospecha, e incluso nos puede ayudar a detectar las variables (Z) responsables de
los cambios de varianza entre observaciones. En abscisas se representan las
posibles Z (generalmente, los regresores, uno cada vez), o los valores ajustados de
Y. En ordenadas, los residuos de la regresin MCO en valor absoluto o sus
cuadrados. Veamos algunos ejemplos: La figura 9.3 representa una situacin
homocedstica: los errores son independientes de los valores de Y ajustados, y
por tanto, podemos pensar que tambin lo son del conjunto de regresores. En la
figura 9.4, los errores cuadrticos crecen linealmente con Xr (una de las variables
explicativas del modelo): sospechamos una forma 1) de heterocedasticidad, donde
Zi es Xri. En la figura 9.5, la relacin parece ser cuadrtica (heterocedasticidad de
la forma 2).
Existen mltiples test estadsticos para detectar la heterocedasticidad, cuya
hiptesis nula es siempre que los errores son homocedsticos.
Uno de los contrastes clsicos es el de Goldfeld y Quandt (1972), adecuado
cuando sospechamos que dos o ms submuestras o grupos de individuos
perfectamente identificables pueden diferenciarse en la varianza de sus
respectivos errores. Es el caso 5) del apartado anterior. Por ejemplo, supongamos
que para explicar el precio de los coches en Espaa se recurre a un conjunto de
variables de prestacin: velocidad mxima, potencia del motor, etc.. La muestra
abarca una amplia gama de modelos incluyendo los pequeos utilitarios y los
familiares. Es posible que el grupo de modelos base, los ms pequeos, baratos y
sencillos de cada marca, tengan desviaciones respecto al precio esperado, dadas
sus caractersticas, que los modelos familiares, ms grandes y de mayor precio.
Supongamos, pues, un modelo con heterocedasticidad de la forma 5), es decir,
hay dos submuestras independientes de tamaos respectivos n1 y n2, con n1>k y
2
1
2
2
respectivamente. Podramos
______________________________________
Manual de Econometra. Captulo 9, pgina 10 .
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC
(9.4)
2
Y 2 = X 2 2 + U 2 ; U 2 ~ N(0; 2 I 2 )
SCERR1
S1
~ n 1-k
2
(9.5)
SCERR2
2
2
S2
2
2
~ n 2- k
2
H0:
2
2
entre ambas distribuciones , cada una de ellas dividida entre sus grados de
libertad. Si se cumple H0, se verifica que:
S2
n2 - k ~
F n 2 - k,n 1- k
S1
n1 - k
(9.6)
Este contraste es exacto para muestras finitas admitiendo la posibilidad de que los
coeficientes de regresin de ambas submuestras sean diferentes. Para el modelo
restringido (coeficientes iguales), solamente es vlido asintticamente.
Este contraste de Goldfeld y Quandt puede extenderse al caso de g grupos, y
muestra de tamao n. La hiptesis nula de homocedasticidad es:
H 0 : 12 = 22 = ... = g2 = 2
E (uu ' ) = V = I n
2
(9.7)
12 I n
0
E (uu ' ) = V =
M
0
22 I n
M
0
...
0
...
0
O
M
... g2 I n
(9.8)
RV = n Ln 2 ni Ln i2 ~ 2 g 1
2
(9.9)
i =1
suficiente
para
estimar
el
modelo.
Es
recomentable
descartar
Supongamos,
por
ejemplo,
una
pauta
lineal
de
heterocedasticidad:
Var( U i ) = E( U i2 ) = i2 = 0 + 1 Z 1i + ...+ p Z p i ; i = 1,2,...n
Aproximando el cuadrado de las perturbaciones, desconocidas, mediante el
cuadrado de los residuos MCO, se estima por regresin la ecuacin que 'explica'
linealmente el cuadrado de los residuos MCO en funcin de las Z:
ei = d 0 + d 1 Z 1 i + ...+ d p Z p i + vi ; (i = 1,2,...n)
La hiptesis nula de homocedasticidad es la de nulidad conjunta de los
coeficientes d, excluyendo el trmino independiente, que se pone a prueba con el
______________________________________
Manual de Econometra. Captulo 9, pgina 13 .
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC
estadstico F:
H 0 : d 1 = d 2 = ... = d p = 0
Esta es la base de una prolfica familia de contrastes, entre los cuales el ms
destacado representante es el de Breusch y Pagan.
El contraste de Breusch y Pagan, que ya se ha presentado en el captulo 5,
detecta incluso pautas no lineales de comportamiento de la varianza de la
perturbacin:
i2 = f ( 0 + 1 Z 1 i + ...+ p Z p i )
La hiptesis nula, de homocedasticidad, es que todos los coeficientes excepto 0
son nulos:
H 0 : 1 = 2 = ... = p = 0
Para realizar el test se siguen los siguientes pasos: 1) se estima el modelo original
por MCO y se calculan los residuos MCO; 2) se calcula la serie eN de residuos
tipificados, restando a cada uno la media y dividiendo entre la desviacin tpica. Si
el modelo tiene constante, la media de los residuos es cero y en este caso tipificar
es simplemente dividir entre la desviacin tpica (
N^2
serie e
e' e
).
n
Se calcula tambin la
estos ltimos, e
nR 2 ~ 2 (q ) ,
-1
los
covarianzas es [7.3].
Recordemos tambin que las medidas de bondad del ajuste y los contrastes de
significacin y de restricciones sobre los parmetros pueden ser engaosas debido
a la mala estimacin de la precisin de los estimadores, sin que a priori pueda
conocerse la direccin del sesgo.
En el caso concreto de un modelo heterocedstico pero sin autocorrelacin, los
estimadores de MCG son de hecho estimadores de mnimos cuadrados
ponderados porque, la transformacin [7.10] consiste en ponderar a cada
individuo de la muestra inversamente a la desviacin tpica de su respectiva
perturbacin. En efecto, en este caso la matriz V= es diagonal de forma que la
matriz C de [7.5] es la matriz identidad y P es tambin diagonal:
______________________________________
Manual de Econometra. Captulo 9, pgina 16 .
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC
V = = ; C = I n ; P = - 2 = V - 2
12
2
V =
...
*
ri
1
2
1
P=
22
...
1
2n
GR
UP
O
DE
FA
MIL
IAS
INGRESOS
NETOS/A
O (Millones
de ptas.)
Gasto
medio de
las
familias
del grupo
Varianza
del gasto
dentro del
grupo
S2y
210
220
230
235
240
0.8
227
116
405
415
450
540
580
478
4866
650
600
790
820
900
752
12296
550
700
1020
1200
980
890
54560
Solucin:
a) La estimacin del modelo por MCO es la siguiente:
Y i = 186 . 648 + 125 . 9694 X
(t
= 0 . 7486 ;
= 7 . 3220
F = 53 . 61
= 154 . 9167
i
+ 110 . 5
(t
= 0 . 6289 ;
1
Xi
= 5 . 5227
F = 30 . 50067
a) i2 = 2 X 2i
b) i2 = 2 X 22i
c) i2 = 2 X 1i2 X 22i
d) i2 = 2 X 1i X 2i
Yi
X
= 1
2i
1
X
2i
X
1
b) Y i =
+ 2 + 3
1
X 2i
X 2i
X
c)
2i
3i
2i
X 3i
X 2i
Ui
X 2i
Yi
Ui
1
1
1
= 1
+ 2
+ 3
+
X 2 i X 3i
X 21 X 3 i
X 3i
X 2 i X 2 i X 3i
covarianzas de los errores , es decir, determinar los pesos wi por los que
ponderar a cada individuo de la muestra. Hay dos posibilidades para determinar
dichos pesos. La primera consiste en admitir alguna hiptesis especfica acerca de
______________________________________
Manual de Econometra. Captulo 9, pgina 19 .
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC
wiY i = wi 1+ wi 2 X
+ ... + w i
1
con w i =
i
2i
Ki
[7.3], frmula que contiene las varianzas desconocidas i. White (1980) demostr
2
i
por e i,
siendo como de costumbre ei el residuo minimocuadrtico de la observacin isima. Todos los paquetes economtricos dan la opcin de calcular los
estimadores consistentes de White, o la correccin de White de la s varianzas
de los estimadores. Con esos trminos, se estn refiriendo a la estimacin de la
matriz de varianzas-covarianzas de los estimadores MCO que acabamos de
presentar.
Ejemplo. Observa atentamente y comenta los siguientes resultados, del modelo
explicativo del salario de 600 licenciados universitarios con el que ya hemos
trabajado en el captulo 6. Qu se ha hecho en cada estimacin y por qu?
Estimacin 1
Dependent Variable: LOG(SALARIO)
Method: Least Squares
Sample: 1 600
Included observations: 600
______________________________________
Manual de Econometra. Captulo 9, pgina 21 .
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
EXPER
EXPER^2
INGENIERO
MEDICINA
ECONOMIA
MUJER
HARVARD
POSGRADO
12.58346
0.017376
-0.000711
0.188897
0.145605
0.093852
-0.091262
0.195579
0.031638
0.016769
0.002316
9.23E-05
0.013384
0.016136
0.013465
0.009081
0.016143
0.009881
750.3996
7.503810
-7.706221
14.11378
9.023679
6.970193
-10.04968
12.11571
3.202046
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
0.0014
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
0.476313
0.469224
0.110915
7.270516
472.5676
1.944500
12.75184
0.152242
-1.545225
-1.479271
67.19209
0.000000
Estimacin 2
Dependent Variable: LOG(SALARIO)
Method: Least Squares
Date: 10/28/01 Time: 18:25
Sample: 1 600
Included observations: 600
Weighting series: 1/RESID
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
EXPER
EXPER^2
INGENIERO
MEDICINA
ECONOMIA
MUJER
HARVARD
POSGRADO
12.58582
0.017251
-0.000705
0.187151
0.141893
0.091417
-0.091320
0.193591
0.032478
0.002295
0.000291
1.03E-05
0.001405
0.001816
0.001488
0.000286
0.002048
0.000723
5484.304
59.25447
-68.17610
133.1850
78.13480
61.43859
-318.7607
94.54385
44.90079
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
Weighted Statistics
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
1.000000
1.000000
0.017002
0.170843
1597.819
12.79008
211.6233
-5.296063
-5.230109
22658.27
______________________________________
Manual de Econometra. Captulo 9, pgina 22 .
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC
Durbin-Watson stat
0.028731
Prob(F-statistic)
0.000000
0.476236
0.469146
0.110923
1.942783
12.75184
0.152242
7.271588
Unweighted Statistics
R-squared
Adjusted R-squared
S.E. of regression
Durbin-Watson stat
Estimacin 3
Coefficient
Std. Error
t-Statistic
Prob.
C
EXPER
EXPER^2
INGENIERO
MEDICINA
ECONOMIA
MUJER
HARVARD
POSGRADO
12.58346
0.017376
-0.000711
0.188897
0.145605
0.093852
-0.091262
0.195579
0.031638
0.017261
0.002524
0.000100
0.012327
0.015941
0.012654
0.009088
0.020375
0.011118
729.0193
6.885542
-7.113170
15.32370
9.133909
7.416805
-10.04158
9.598800
2.845817
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
0.0046
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
0.476313
0.469224
0.110915
7.270516
472.5676
1.944500
12.75184
0.152242
-1.545225
-1.479271
67.19209
0.000000
______________________________________
Manual de Econometra. Captulo 9, pgina 24 .
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC
Y t = Y t -1 + X t + U t ; U t ~ N(0, ht )
Var( U t ) = ht = 0 + 1 U t2-1
La variable endgena depende de su propio valor con un retardo, en una regresin
de Y contra s misma por lo que recibe el nombre autoregresivo y de alguna/s
exgenas. En este modelo, la varianza de la perturbacin aleatoria en el momento
t condicionada a la informacin disponible hasta el perodo anterior, depende del
cuadrado de la propia perturbacin en t-1 (de ah que el orden de este sencillo
modelo ARCH sea 1) y por tanto el modelo es heterocedstico, en la medida en
que U va variando a lo largo del tiempo tambin lo hace la varianza ht. Los
modelos ARCH se estiman por procedimientos iterativos de estimacin no lineal.
La propia existencia de efectos ARCH, es decir, de heterocedasticidad condicional,
puede contrastarse mediante contrastes especficos que se pueden encontrar
descritos en la literatura especializada.
______________________________________
Manual de Econometra. Captulo 9, pgina 25 .
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC
CAPTULO 9. RESUMEN
Para detectar la
nula siempre es
puede ser ms o menos general. Hemos estudiado los test de Goldfeld y
Quandt y sus extensiones, el de Breusch y Pagan y el de White
APENDICE 9.1
Y i = X i eu i ; ui _N (0, )
ln Y i = + ln X i + ui
con = ln
E( eu ) = e 2
i
Var( eu ) = e ( e - 1)
de forma que la esperanza del error del modelo estimado, vi, es:
E( vi ) = E( Y i - 0 - 1 X i ) =
E( X i eui - 0 - 1 X i )
1
= X i e 2 - 0 - 1 X i
2
______________________________________
Manual de Econometra. Captulo 9, pgina 27 .
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC
Var( vi ) = E[ vi - E( vi ) ] 2
1
= E[ X i eui - 0 1 X i - X i e 2 + 0 1 X i ]
1
= E[ X i ( eui - e 2 ) ] 2
2
= 2 X i2 e ( e - 1)
2
______________________________________
Manual de Econometra. Captulo 9, pgina 28 .
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC