Вы находитесь на странице: 1из 73

Escuela Superior Politcnica del Litoral.

Facultad de Ciencias Sociales y Humansticas.

Mtodos
Estadsticos III
Preparado por: Ph.D. David Sabando Vera
dsabando@espol.edu.ec
1

El modelo de Regresin Lineal


Simple.

y = b0 + b1x + u

El anlisis de regresin se refiere al estudio de la


dependencia de una variable (variable dependiente)
de una o ms otras variables (variables explicativas)
con el fin de estimar o predecir el valor promedio
poblacional de la primera en trminos de los valores
conocidos o fijos (en el muestreo repetido) de las
segundas.

una poblacin total de 60 familias y sus ingresos


semanales (X) y el gasto de consumo semanal (Y)

E(Y | Xi) es una funcin de Xi


E(Y | Xi) = f (Xi)
Funcin de esperanza condicional o regresin
poblacional
Asumiendo que es una funcin lineal de Xi

E(Y | Xi) = 1 + 2Xi


7

EL SIGNIFICADO DEL TRMINO LINEAL


Linealidad en las variables
La primera significado de linealidad es que
la expectativa condicional de Y es una funcin
lineal de Xi, la curva de regresin en este caso
es una lnea recta.
E (Y | X i) = 1 + 2 X 2 i no es una funcin
lineal
Linealidad en los Parmetros
Si la expectativa condicional de Y, E (Y | X i) ) es una funcin lineal
de los parmetros, la 's; que puede o no puede ser lineal en la
variable X.

E (Y | X i)) = 1 + 2 X 2 i
es lineal (en el parmetro) modelo de regresin.
8

qu sucede con el consumo de una familia en relacin con su


nivel de ingreso (fijo)?
el consumo de una familia en particular no necesariamente
aumenta a medida que lo hace el nivel de ingreso. Por ejemplo,
en la tabla anterior se observa que en el nivel de ingreso de 100
dlares existe una familia cuyo consumo, de 65, es menor que
el consumo de dos familias cuyo ingreso semanal es slo de 80
dlares. Sin embargo, hay que advertir que el consumo
promedio de las familias con ingreso semanal de 100 es mayor
que el consumo promedio de las familias con un ingreso
semanal de 80 dlares (77 y 65).

10

qu se puede decir sobre la relacin


entre el consumo de una familia y un
nivel determinado de ingresos?
El nivel de ingresos de Xi, el consumo de una familia en particular se
agrupa alrededor del consumo promedio de todas las familias en ese nivel
de Xi, es decir, alrededor de su esperanza condicional. Por consiguiente,
expresamos la desviacin de un Yi en particular alrededor de su valor
esperado de la manera siguiente:

Una parte
determinstica
y otra
estocstica o
aleatoria
11

Como E(Yi | Xi) es lo mismo que E(Y | Xi)


As, el supuesto de que la lnea de
regresin pasa a travs de las medias
condicionales de Y implica que los
valores de la media condicional de ui
(condicionados al valor dado
de X ) son cero.
12

por qu no se crea un modelo de regresin


mltiple con tantas variables como sea
posible?
1. Vaguedad de la teora:
2. Falta de disponibilidad de datos:
3. Variables centrales y variables perifricas:
4. Aleatoriedad intrnseca en el
comportamiento humano:
5. Variables representantes (proxy)
inadecuadas:
6. Principio de parsimonia:
7. Forma funcional incorrecta:
13

14

15

16

Yi = E(Y | Xi ) + ui
cmo se debe construir la FRM para que
los
estn tan cerca de los verdaderos
1 y 2 como sea posible, aunque nunca se
lleguen a conocer los verdaderos 1 y 2?
17

18

Recordemos que:

19

Seleccionar la FRM de modo que


la suma de los residuos
sea
la menor posible.

20

Minimizar la siguiente funcin:

21

Ecuaciones normales
22

23

Ejemplo:
Se relacionan el salario promedio por hora (Y ) y los aos de escolaridad (X ).
La economa laboral bsica indica que, entre muchas variables, la escolaridad
es un determinante importante de los salarios.

24

25

26

Ejemplo:
ESTUDIANTES Y VENTAS TRIMESTRALES
EN 10 RESTAURANTES ARMANDS PIZZA PARLORS

27

Grfico de dispersin.

28

Grfico:

30

Supuestos del modelo de Regresin Lineal.

31

Supuestos del modelo de Regresin Lineal.

32

33

34

Precisin o errores estndar de las


estimaciones de mnimos cuadrados

35

error estndar de estimacin o el


error estndar de la regresin (ee).

36

37

38

39

Coeficiente de correlacin lineal

40

41

Ejemplo:
Se relacionan el salario promedio por hora (Y ) y los aos de escolaridad (X ).
La economa laboral bsica indica que, entre muchas variables, la escolaridad
es un determinante importante de los salarios.

42

43

44

Deber.
Del libro de Econometra de Gujarati, pag. 87 - 91

45

El coeficiente de educ tiene una interpretacion porcentual multiplicandolo por 100:


wage aumenta 8.3% por cada ano mas de educacion. Esto es a lo que los
economistas se refieren cuando hablan de rendimiento de un ano mas de
educacion.
46

El coeficiente de log(sales) es la elasticidad estimada de salary (sueldo) respecto a


sales (ventas). Esto implica que por cada aumento de 1% en las ventas de la empresa
hay un aumento de aproximadamente 0.257% en el sueldo de los CEO la
interpretacin usual de una elasticidad.

47

48

El modelo de Regresin Lineal


Mltiple.

49

El modelo de Regresin Lineal


Multiple.
Supuestos:

50

Luego de tener el modelo anterior, estimamos los betas


desconocidos, a travs de datos de una muestra, y
obtenemos:

Proceso de estimacin de los betas por


MCO

minimizar
51

Ecuaciones normales
52

53

Con los betas estimados


tenemos la funcin estimada

54

Interpretacin de los betas


estimados
Sabemos que un cambio total o variacin total

55

Si solo queremos saber el efecto de la


variacin individual sobre la total,
manteniendo las dems variables
constante (ceteris paribus)

56

EJEMPLO: Empleando las 526 observaciones sobre trabajadores en la


base de datos WAGE1.RAW, las variables educ (aos de educacin),
exper (aos de experiencia en el mercado laboral) y tenure (aos de
antigedad en el empleo actual) se incluyen en una ecuacin para
explicar log(wage). La ecuacin estimada es

Solucin usando excel


Solucin usando Gretl

57

EJEMPLO: Empleando las 526 observaciones sobre trabajadores en la


base de datos WAGE1.RAW, las variables educ (aos de educacin),
exper (aos de experiencia en el mercado laboral) y tenure (aos de
antigedad en el empleo actual) se incluyen en una ecuacin para
explicar log(wage). La ecuacin estimada es

58

Aqu la nica diferencia es que tambin tienen una


interpretacin ceteris paribus. El coeficiente .092 significa
que manteniendo exper y tenure constantes, se predice que
un ao ms de educacin incrementa log(wage) en .092, lo
que se traduce en un aumento aproximado de 9.2%
[100(.092)] en wage en promedio. Es decir, si se toman dos
personas con los mismos niveles de experiencia y
antigedad laboral, el coeficiente de educ es la diferencia
proporcional con el salario predicho cuando en sus niveles
de educacin hay una diferencia de un ao.

59

Anlisis del modelo estimado para


la validacin y contraste.
1. Planteamiento del estudio economtrico (especificacin)
2. Estimacin del modelo (MCO)
3. Valoracin y contraste del modelo
a. Anlisis preliminares (signos)
b. Anlisis de significatividad individual (t-student)
c. Anlisis de significatividad conjunta (F-snedecor y
Rs cuadrados)

60

3. Valoracin y contraste del


modelo.
a. Anlisis preliminares (signos)

61

Ejemplo:

Solucin con Gretl


Solucin con excel
62

b. Anlisis de significatividad
individual (t-student)
Bajo el supuesto que

Y todos los dems que hemos


mencionado

63

Recordando:
Los elementos de una prueba estadstica
1. Hiptesis nula, H0
2. Hiptesis alternativa, H1
3. Nivel de significancia,
4. Estadstico de prueba
5. Criterio de decisin de rechazo.

64

La prueba de significancia queda:


Nivel de significancia
Estadstico de prueba:
con n-k-1 grados de libertad

Criterio de decisin:

Si el p-valor < entonces se rechaza Ho.

Solucin usando Gretl

Intervalos de confianza de los betas.

Solucin usando Gretl

66

c. Anlisis de significatividad conjunta


(F-snedecor)

Utilizando ANOVA

67

68

Tabla ANOVA

69

70

Solucin usando
Gretl
71

Ejemplo:

72

Ejemplo:

73