Академический Документы
Профессиональный Документы
Культура Документы
Y = + X +
Considerando la muestra (xi, yi) para i=1,n
Yi = + X i+ei
Suposiciones del modelo:
La variable X es no aleatoria.
Los errores i son variables aleatorias con media 0 y varianza
constante 2.
Los errores i y j (ij=1,n) son independientes entre si.
4
Imprecisin de la teora
Datos no disponibles
Variables deficientes proxy
Principio de Parsimonia
Omisin de variables relevantes
Mala especificacin de la forma funcional
VARIABLES
VARIABLE
INDEPENDIENTE
VARIABLE
DEPENDIENTE
V. EXPLICATIVA
V. CONTROL
V. PREDICTORA
V. REGRESOR
V. EXPLICADA
V. RESPUESTA
V. PREDICHA
V. REGRESADA
Notacin alternativa:
Yi = 0 + 1 Xi + i (Y es funcin lineal de X)
6
: expresa la magnitud
del cambio de y por
cada unidad de x
E(y|x)
E(y|x)=+x
E(y|x)
x
{
Constante
Parmetro de
intercepcin
X
E(y|x)
=
x
Es la pendiente
Parmetro de pendiente
Caso Homocedstico
yi
ga
sto
f(yi)
.
.
x1=80
x2=100
renta
xi
Caso Heterocedstico
i
f(yi)
to
s
a
.
x1
x2
x3
renta
xt
10
Q(, ) =
n
i =1
2
i
(y
i =1
xi ) 2
i=1
i=1
n
i =1
nxi yi xi yi
n
nxi2 (xi )2
i =1
Donde:
i=1
equivalentemente
xy
xx
= y x
Sxx = ( xi x ) 2
i =1
11
(RRP)
E(y) = + x
y4
e4 {
y3
y2
y1
e2 {.
(RRM)
y = b0 + b1x
.}e3
e1
}
.
x1
x2
x3
x4
x
12
13
14
b)
c)
La varianza de es
Sxx
2
1
x
y la de es ( +
)
n Sxx
Nota: la covarianza:
15
b)
e x
i =1
c)
i i
=0
)
ei yi = 0
i =1
16
s2 =
) 2
(
y
y
i i)
i =1
n2
e
i =1
2
i
n2
(MSE)
17
( yi y ) 2 =
)
( yi yi ) 2 +
i =1
i =1
(y
i =1
y)2
SSR =
2
(
x
x
)
i
i =1
18
El Coeficiente de Determinacin
Es una medida de la bondad de ajuste del modelo
R2 =
SSR
SST
19
~ N( , )
Sxx
2
1 x2 2
~ N ( , ( + ) )
n S xx
20
Las sumas de cuadrados son formas cuadrticas del vector aleatorio Y y por
lo tanto se distribuyen como una Chi-cuadrado. Se pueden establecer los
siguientes resultados:
i)
ii)
iii)
SST
SSE
SSR
~ '(2n 1)
2
( n2)
~ '(21)
Equivalentemente
(n 2) s 2
~ (2n 2 )
E ( SSR ) = E ( 2 S xx ) = 2 + 2 S xx
21
22
media y varianza
Sxx
( t ( n 2, / 2 )
s
Sxx
, + t ( n 2, / 2 )
s
Sxx
23
1 x2 )
1 x2
( t ( n 2, / 2 ) s
+
, + t ( n 2, / 2 ) s
+
)
n Sxx
n Sxx
)
24
=0
A
>0
B
1< 0
25
Caso II
Ho: =*
Ha: *
t=
Caso III
Ho: =*
Ha: >*
*
s
Sxx
Regla de Decisin
Rechazar Ho,
Rechazar Ho
~ t( n 2)
Rechazar Ho
si tcal<-t(,n-2)
si |tcal |>t(/2,n-2)
si tcal>t(,n-2)
*Un P-value cercano a cero, sugirira rechazar la hiptesis nula.
26
Caso II
Ho: = *
Ha: *
t=
Caso III
Ho: = *
Ha: > *
*
2
1 x
( +
) 2
n S xx
Regla de Decisin
Rechazar Ho,
Rechazar Ho
~ t( n 2 )
Rechazar Ho
si tcal<-t(,n-2)
si |tcal |>t(/2,n-2)
si tcal>t(,n-2)
*Un P-value cercano a cero, sugirira rechazar la hiptesis nula.
27
28
y es independiente de
30
Luego,
31
recta estimada
lmite inferior del
intervalo
lmite
superior del
intervalo
32
por
33
Problema:
No conocemos
ni
.
34
Idea:
Definir
Se puede ver que
estar en
35
36
37
y la regresin
Interpretacin de
vs
38
y la regresin
Entonces:
39
26
24
22
pressure
28
30
Modelo 1)
195
200
205
boil.point
210
40
0.0
-0.2
pressure.star
0.2
0.4
Modelo 2)
-0.4
-0.2
0.0
0.2
0.4
boil.point.star
con
41
El Coeficiente de Correlacin
Mide el grado de asociacin lineal entre las variables X y Y y se
define como:
Cov( X , Y )
=
x y
a) 1 1
b) La media condicional de Y dado X es E(Y / X ) = + x ,
y
donde:
y =
=
x
Notar que:
) Sxx
r=
Syy
r2 =
)2
Sxx
Syy
r =
Sxy
SxxSyy
SSR
SST
43
t=
r n2
1 r2
44
- Normales
- Homocedsticos
- Independientes
45
46
Solucin
Se calculan los estadsticos bsicos de las variables X e Y,
47
48
49
50
El coeficiente de correlacin es
51
52
53
54
55
56
57
58
59
60
61
62
63
64