Вы находитесь на странице: 1из 22

Heterocedasticidad (unidad 9) y

Autocorrelacin (unidad 10) Exam


Pablo Bernard M
Ing. Comercial MBA Finanzas

Heteroscedsticidad
En Econometra se dice que un modelo de regresin lineal presenta
Heteroscedsticidad cuando la varianza de las perturbaciones no es
constante a lo largo de las observaciones.
Esto implica el incumplimiento de una de las hiptesis bsicas sobre las
que se asienta el modelo de regresin lineal.
De ella se deriva que los datos con los que se trabaja son
heterogneos, ya que provienen de distribuciones de probabilidad con
distinta varianza.
Existen diferentes razones o situaciones en las que cabe encontrarse
con perturbaciones heteroscedsticas. La situacin ms frecuente es en
el anlisis de datos de corte transversal, ya que los individuos o
empresas o unidades econmicas no suelen tener un comportamiento
homogneo.
Otra situacin en la que se presenta heteroscedasticidad es en
muestras cuyos datos son valores que se han obtenido agregando o
promediando datos individuales
2

Consecuencias Heteroscedsticidad
Las principales consecuencias que derivan del
incumplimiento de la hiptesis de homocedasticidad en
los resultados de la estimacin de mnimos cuadrados
son:
Error en el clculo del estimador de la matriz de
varianzas y covarianzas de los estimadores de mnimos
cuadrados.
Prdida de eficiencia en el estimador mnimo
cuadrtico.
Por lo dems los estimadores de mnimos cuadrados
siguen siendo los mejores estimadores que pueden
obtenerse. Siguen siendo insesgados, pero dejan de ser
de varianza mnima
3

Solucin
Para resolver lo anterior se dispone de
los siguientes:
Anlisis de varianza de dos factores con
una sola muestra por grupo
Anlisis de varianza de dos factores con
varias muestras por grupo

Anlisis de varianza de dos factores


con una sola muestra por grupo
En el anlisis bifactorial de la varianza se
presenta cuando dos factores (variables
independientes) afectan a la variable
respuesta (variable dependiente). Para cada
factor tendremos varios niveles que dividen a
la poblacin total en grupos de tratamiento.
En el anlisis de la varianza con dos factores
desempea un papel importante la posible
interaccin entre los mismos.
5

Ver Ejemplo
Suponga que usted haya experimentado
con levadura para una receta de panes
dulces. Parece ser que la cantidad de
azcar y la temperatura del agua
afectan
el
tamao
de
los
panes. Basndose en los siguientes
datos, realizar un anlisis de varianza
para averiguar lo que es significativo de
estas recetas.
6

Agua Fr a

Agua Ti bi a

Agua Ca l i e nt e

Poc o Az c a r

75

87

60

Az c a r Nor ma l

74

82

55

Muc ho Az c a r

70

79

53

Anlisis de varianza de dos factores con una sola muestra por grupo
RESUMEN

Cuenta

Suma

Promedio

Varianza

Poco Azcar

222

74

183

Azcar Normal

211

70,33333333

192,333333

Mucho Azcar

202

67,33333333

174,333333

Agua Fra

219

73

Agua Tibia

248

82,66666667

16,3333333

Agua Caliente

168

56

13

ANLISIS DE VARIANZA
Origen de las variacionesSuma de cuadrados Grados de libertadPromedio de los cuadrados

ProbabilidadValor crtico para F

Filas

66,88888889

33,44444444

23,1538462

0,00632195

6,94427191

Columnas

1093,555556

546,7777778

378,538462

2,7622E-05

6,94427191

Error

5,777777778

1,444444444

Total

1166,222222

Resultado Prueba F
El resultado del ANOVA (Anlisis de varianza) indica el valor estadstico
de la "F." En este caso el valor de la "F" por las filas (cantidad de
azcar) es 23.15. Para saber si estos resultados son significativos (o
sea, si la probabilidad "P" tiene un valor menor a 0.05), el valor de la
"F" observado necesita ser al menos 6.94 (o sea, el valor crtico de la
F).
Entonces, como el valor de "F" observado es de 23.15 y es mucho
mayor que el valor crtico de la F (6.94), estamos seguros que los
resultados de nuestras pruebas son significativas. El valor de la "F"
para las columnas (temperatura del agua) es igual a 378.53. Esto es
tambin significativo, porque el valor de "F" crtico es solamente 6.94.
En otras palabras, existe una relacin significativa en la cantidad de
azcar, la temperatura del agua y el tamao de los panes dulces. La
probabilidad muestra a qu nivel los resultados son estadsticamente
significativos.
10

Si aplicamos el Mtodo de los Mnimos Cuadrados, para


estimar los parmetros
.. y..

1 b t
=
y
bt i 1 j 1 ij

Donde b son los bloques y t los


tratamientos

i = i. - .. = yi. - y..
j = . j - .. = y. j - y..

eij = yij - .. - i - j = yij - yi. - y. j + y..


Cada componente del modelo contribuye a la
variabilidad total. La particin de la Suma de
Cuadrados Total involucrar tres fuentes de variacin.
11

Tabla de Anlisis de varianza para dos


criterios de clasificacin
Fuente de

Suma de

Grados de

Cuadrados

F calculada

variacin

Cuadrados

libertad

Medios

Tratamientos

SCA

t-1

CMA = SCA / t-1

CMA / CME

Bloques

SCB

b -1

CMB = SCB / b-1

CMB / CME

Error Experimental

SCE

(t - 1)(b-1)

Total

SCT

t.b -1

CME = SCE / (t-1)(b-1)

( yij y..) 2 t ( yi . y..) 2 b ( y. j y..) 2 ( yij yi. y. j y.. ) 2


i

Variacin total

Variacin debida

Variacin debida

a los tratamientos
SCT

a los bloques

SCA

SCB
12

Variacin propia de
las observaciones
SCE

Anlisis de varianza de dos factores con


varias muestras por Grupo
En este modelo de anlisis de varianza tenemos los
sujetos con observaciones o puntuaciones en la misma
pero en condiciones distintas o en la misma condicin
tiempos distintos2. Como se trata de los mismos
tenemos muestras relacionadas o emparejadas.

mismos
variable
pero en

sujetos

Tambin puede tratarse de sujetos fsicamente distintos pero


igualados en variables relevantes (variables que controlamos
con esta igualacin); en este caso se trata tambin de muestras
relacionadas. En la presentacin de los datos las filas son los
sujetos, y las columnas son las condiciones.

13

Suponga que usted tiene un restaurante y ha creado una nueva


receta de salsa para las enchiladas.
Por alguna razn parece ser que a sus clientes varones les gusta
ms la salsa anterior que la nueva.
Pero tambin parece ser que a sus clientes femeninas prefieren
la nueva salsa que la anterior.
Usted decide realizar una prueba con un grupo de 10 mujeres y
10 varones dndole a probar las dos salsas, basndose en una
escala de 100 puntos para el sabor de las dos salsas.
Existe alguna relacin significativa desde el punto de vista de
los clientes varones y clientes femeninas y cmo ven la nueva y
la anterior salsa para las enchiladas?
14

15

16

Anlisis de varianza de dos factores con varias muestras por grupo


RESUMEN

Hombres

Mujeres

Total

Cuenta
Suma
Promedio
Varianza

10
10
20
809
673
1482
80,9
67,3
74,1
84,7666667 19,5666667 98,0947368

Cuenta
Suma
Promedio
Varianza

10
10
20
674
846
1520
67,4
84,6
76
18,7111111 38,0444444 104,736842

Total

Cuenta
Suma
Promedio
Varianza

20
1483
74,15
96,9763158

20
1519
75,95
106,05

ANLISIS DE VARIANZA
Origen de las variaciones
Suma de cuadrados
Grados de
Promedio
libertad de los cuadradosF
Probabilidad
Valor crtico para F
Muestra
36,1
1
36,1 0,8963995 0,35006116 4,11316528
Columnas
32,4
1
32,4 0,80452476 0,3757033 4,11316528
Interaccin
2371,6
1
2371,6 58,8892261 4,3769E-09 4,11316528
Dentro del grupo 1449,8
36 40,2722222
Total

3889,9

39

17

Prueba F
El resultado del ANOVA (Anlisis de varianza) indica el valor
estadstico de la "F." En este caso el valor de la "F" de la
muestra (receta anterior y receta nueva) es 0.896.
Para saber si estos resultados son significativos (o sea, si la
probabilidad "P" tiene un valor menor a 0.05), el valor de la "F"
necesita ser al menos 4.11 (o sea, el valor crtico de la F).
Entonces, como el valor de nuestra "F" es de 0.896 y es no es
mayor que el valor crtico de la F, no podemos decir que existe
alguna diferencia significativa.
Sin embargo, a la vez necesitamos interpretar qu significa el
valor de F que est relacionado al efecto de una interaccin.
Siempre un efecto de interaccin sobrepasa el efecto principal.

18

Prueba F
En este caso tenemos un gran efecto de
interaccin (el valor de la "F"=58.89).
En otras palabras, s existe una diferencia
significativa entre la opinin de los hombres y
de las mujeres relacionada a la receta
anterior y a la nueva.
La probabilidad demuestra a qu nivel los
resultados son estadsticamente significativos.

19

Si aplicamos el Mtodo de los Mnimos Cuadrados, para


estimar los parmetros
.. y..

1 b t
=
y
bt i 1 j 1 ij

Donde b son los bloques y t los


tratamientos

i = i. - .. = yi. - y..
j = . j - .. = y. j - y..

eij = yij - .. - i - j = yij - yi. - y. j + y..


Cada componente del modelo contribuye a la
variabilidad total. La particin de la Suma de
Cuadrados Total involucrar tres fuentes de variacin.
20

Tabla de Anlisis de varianza para dos


criterios de clasificacin
Fuente de

Suma de

Grados de

Cuadrados

F calculada

variacin

Cuadrados

libertad

Medios

Tratamientos

SCA

t-1

CMA = SCA / t-1

CMA / CME

Bloques

SCB

b -1

CMB = SCB / b-1

CMB / CME

Error Experimental

SCE

(t - 1)(b-1)

Total

SCT

t.b -1

CME = SCE / (t-1)(b-1)

( yij y..) 2 t ( yi . y..) 2 b ( y. j y..) 2 ( yij yi. y. j y.. ) 2


i

Variacin total

Variacin debida

Variacin debida

a los tratamientos
SCT

a los bloques

SCA

SCB
21

Variacin propia de
las observaciones
SCE

EXCEL
reseta
nueva

reseta
anterior

Hombres
85
74
96
62
80
78
90
79
85
80
68
64
62
69
73
61
64
72
70
71

Mujeres
69
65
63
70
72
59
64
70
68
73
85
75
97
80
88
81
91
83
84
82
22

Вам также может понравиться