Академический Документы
Профессиональный Документы
Культура Документы
Heteroscedsticidad
En Econometra se dice que un modelo de regresin lineal presenta
Heteroscedsticidad cuando la varianza de las perturbaciones no es
constante a lo largo de las observaciones.
Esto implica el incumplimiento de una de las hiptesis bsicas sobre las
que se asienta el modelo de regresin lineal.
De ella se deriva que los datos con los que se trabaja son
heterogneos, ya que provienen de distribuciones de probabilidad con
distinta varianza.
Existen diferentes razones o situaciones en las que cabe encontrarse
con perturbaciones heteroscedsticas. La situacin ms frecuente es en
el anlisis de datos de corte transversal, ya que los individuos o
empresas o unidades econmicas no suelen tener un comportamiento
homogneo.
Otra situacin en la que se presenta heteroscedasticidad es en
muestras cuyos datos son valores que se han obtenido agregando o
promediando datos individuales
2
Consecuencias Heteroscedsticidad
Las principales consecuencias que derivan del
incumplimiento de la hiptesis de homocedasticidad en
los resultados de la estimacin de mnimos cuadrados
son:
Error en el clculo del estimador de la matriz de
varianzas y covarianzas de los estimadores de mnimos
cuadrados.
Prdida de eficiencia en el estimador mnimo
cuadrtico.
Por lo dems los estimadores de mnimos cuadrados
siguen siendo los mejores estimadores que pueden
obtenerse. Siguen siendo insesgados, pero dejan de ser
de varianza mnima
3
Solucin
Para resolver lo anterior se dispone de
los siguientes:
Anlisis de varianza de dos factores con
una sola muestra por grupo
Anlisis de varianza de dos factores con
varias muestras por grupo
Ver Ejemplo
Suponga que usted haya experimentado
con levadura para una receta de panes
dulces. Parece ser que la cantidad de
azcar y la temperatura del agua
afectan
el
tamao
de
los
panes. Basndose en los siguientes
datos, realizar un anlisis de varianza
para averiguar lo que es significativo de
estas recetas.
6
Agua Fr a
Agua Ti bi a
Agua Ca l i e nt e
Poc o Az c a r
75
87
60
Az c a r Nor ma l
74
82
55
Muc ho Az c a r
70
79
53
Anlisis de varianza de dos factores con una sola muestra por grupo
RESUMEN
Cuenta
Suma
Promedio
Varianza
Poco Azcar
222
74
183
Azcar Normal
211
70,33333333
192,333333
Mucho Azcar
202
67,33333333
174,333333
Agua Fra
219
73
Agua Tibia
248
82,66666667
16,3333333
Agua Caliente
168
56
13
ANLISIS DE VARIANZA
Origen de las variacionesSuma de cuadrados Grados de libertadPromedio de los cuadrados
Filas
66,88888889
33,44444444
23,1538462
0,00632195
6,94427191
Columnas
1093,555556
546,7777778
378,538462
2,7622E-05
6,94427191
Error
5,777777778
1,444444444
Total
1166,222222
Resultado Prueba F
El resultado del ANOVA (Anlisis de varianza) indica el valor estadstico
de la "F." En este caso el valor de la "F" por las filas (cantidad de
azcar) es 23.15. Para saber si estos resultados son significativos (o
sea, si la probabilidad "P" tiene un valor menor a 0.05), el valor de la
"F" observado necesita ser al menos 6.94 (o sea, el valor crtico de la
F).
Entonces, como el valor de "F" observado es de 23.15 y es mucho
mayor que el valor crtico de la F (6.94), estamos seguros que los
resultados de nuestras pruebas son significativas. El valor de la "F"
para las columnas (temperatura del agua) es igual a 378.53. Esto es
tambin significativo, porque el valor de "F" crtico es solamente 6.94.
En otras palabras, existe una relacin significativa en la cantidad de
azcar, la temperatura del agua y el tamao de los panes dulces. La
probabilidad muestra a qu nivel los resultados son estadsticamente
significativos.
10
1 b t
=
y
bt i 1 j 1 ij
i = i. - .. = yi. - y..
j = . j - .. = y. j - y..
Suma de
Grados de
Cuadrados
F calculada
variacin
Cuadrados
libertad
Medios
Tratamientos
SCA
t-1
CMA / CME
Bloques
SCB
b -1
CMB / CME
Error Experimental
SCE
(t - 1)(b-1)
Total
SCT
t.b -1
Variacin total
Variacin debida
Variacin debida
a los tratamientos
SCT
a los bloques
SCA
SCB
12
Variacin propia de
las observaciones
SCE
mismos
variable
pero en
sujetos
13
15
16
Hombres
Mujeres
Total
Cuenta
Suma
Promedio
Varianza
10
10
20
809
673
1482
80,9
67,3
74,1
84,7666667 19,5666667 98,0947368
Cuenta
Suma
Promedio
Varianza
10
10
20
674
846
1520
67,4
84,6
76
18,7111111 38,0444444 104,736842
Total
Cuenta
Suma
Promedio
Varianza
20
1483
74,15
96,9763158
20
1519
75,95
106,05
ANLISIS DE VARIANZA
Origen de las variaciones
Suma de cuadrados
Grados de
Promedio
libertad de los cuadradosF
Probabilidad
Valor crtico para F
Muestra
36,1
1
36,1 0,8963995 0,35006116 4,11316528
Columnas
32,4
1
32,4 0,80452476 0,3757033 4,11316528
Interaccin
2371,6
1
2371,6 58,8892261 4,3769E-09 4,11316528
Dentro del grupo 1449,8
36 40,2722222
Total
3889,9
39
17
Prueba F
El resultado del ANOVA (Anlisis de varianza) indica el valor
estadstico de la "F." En este caso el valor de la "F" de la
muestra (receta anterior y receta nueva) es 0.896.
Para saber si estos resultados son significativos (o sea, si la
probabilidad "P" tiene un valor menor a 0.05), el valor de la "F"
necesita ser al menos 4.11 (o sea, el valor crtico de la F).
Entonces, como el valor de nuestra "F" es de 0.896 y es no es
mayor que el valor crtico de la F, no podemos decir que existe
alguna diferencia significativa.
Sin embargo, a la vez necesitamos interpretar qu significa el
valor de F que est relacionado al efecto de una interaccin.
Siempre un efecto de interaccin sobrepasa el efecto principal.
18
Prueba F
En este caso tenemos un gran efecto de
interaccin (el valor de la "F"=58.89).
En otras palabras, s existe una diferencia
significativa entre la opinin de los hombres y
de las mujeres relacionada a la receta
anterior y a la nueva.
La probabilidad demuestra a qu nivel los
resultados son estadsticamente significativos.
19
1 b t
=
y
bt i 1 j 1 ij
i = i. - .. = yi. - y..
j = . j - .. = y. j - y..
Suma de
Grados de
Cuadrados
F calculada
variacin
Cuadrados
libertad
Medios
Tratamientos
SCA
t-1
CMA / CME
Bloques
SCB
b -1
CMB / CME
Error Experimental
SCE
(t - 1)(b-1)
Total
SCT
t.b -1
Variacin total
Variacin debida
Variacin debida
a los tratamientos
SCT
a los bloques
SCA
SCB
21
Variacin propia de
las observaciones
SCE
EXCEL
reseta
nueva
reseta
anterior
Hombres
85
74
96
62
80
78
90
79
85
80
68
64
62
69
73
61
64
72
70
71
Mujeres
69
65
63
70
72
59
64
70
68
73
85
75
97
80
88
81
91
83
84
82
22