Академический Документы
Профессиональный Документы
Культура Документы
CAPITULO 4
MODELO LINEAL GENERAL
CONTENIDO
Inferencia estadstica
Prediccin
Y f ( X 2 , X 3 , X 4 ,..., X k )
,
Y 1 2 X 2 3 X 3 4 X 4 ... k X k
Si se tiene las siguientes observaciones:
Yi
X 2 i X 3i X 4 i
...
X ki
i 1,2,3,..., n
Yi 1 2 X 2i 3 X 3i 4 X 4i ... k X ki
Yi 1 2 X 2i 3 X 3i 4 X 4i ... k X ki i
,
E ( i ) 0
Media
E[ i E ( i )][ j E ( j )] 0
E ( i j ) 0
Covarianza
E[ i E ( i )]
E ( i2 ) 2
Varianza
i ~ NID (0, 2 )
X 2i , X 3i , X 4i ,..., X ki
Son fijas !!
Yi 1 2 X 2i 3 X 3i 4 X 4i ... k X ki i
Se deduce:
E (Yi ) 1 2 X 2i 3 X 3i 4 X 4i ... k X ki i
FRP
Puesto que:
E ( i ) 0
X 2i , X 3i , X 4i ,..., X ki
E (Yi ) 1 2 X 2i 3 X 3i 4 X 4i ... k X ki i
FRP
Yi 1 2 X 2i 3 X 3i 4 X 4i ... k X ki i
,
Y1 1 2 X 21 3 X 31 4 X 41 ... k X k1 1
Y2 1 2 X 22 3 X 32 4 X 42 ... k X k 2 2
Y3 1 2 X 23 3 X 33 4 X 43 ... k X k 3 3
...............................................................................
Yn 1 2 X 2 n 3 X 3n 4 X 4 n ... k X kn n
Y1 1 X 21
Y 1 X
22
2
Y3 1 X 23
... ... ...
Yn 1 X 2 n
X 31
X 32
X 33
...
X 3n
... X k1 1 1
... X k 2 2 2
... X k 3 3 3
En resumen:
Y XB U
ESTIMACIN
Funcin de regresin muestral
Dada una muestra de n pares de valores para las variables involucradas en
el modelo y asumiendo un mtodo apropiado se puede postular que la
estimacin muestral es la siguiente:
,
Yi 1 2 X 2i 3 X 3i 4 X 4i ... k X ki
Se puede escribir tambin:
Y1 1 2 X 21 3 X 31 4 X 41 ... k X k 1
Y2 1 2 X 22 3 X 32 4 X 42 ... k X k 2
......................................................................
Yn 1 2 X 2 n 3 X 3n 4 X 4 n ... k X kn
FRM
ESTIMACIN
Funcin de regresin muestral
En resumen:
Y XB
FRM
Considerando que:
,
E Y Y
E Y XB
Entonces:
e1 Y1 Y1
e Y
Y2
2
2
2
e
i E ' E (Y XB )' (Y XB ) (Y ' B ' X ' )' (Y XB )
E' E
Sea mnimo.
B
X ' XB X ' Y
Ecuaciones normales
De donde:
B ( X ' X ) 1 X ' Y
Yi 1 2 X 2i
Entonces:
Y1
Y
2
Y Y3
...
Yn
1 X 21
1 X
22
X
... ...
1 X 2n
n
X'X
X 2i
Y
X 'Y
X
Y
2i i
X
X
2i
2
2i
X
10
7
10
5
8
8
6
7
9
10
80
8
Suma
Promedio
X
1
1
1
1
1
1
1
1
1
1
10
7
10
5
8
8
6
7
9
10
Y
11
10
12
6
10
7
9
10
11
10
96
9,6
X'
1
10
1
7
X'X
10
80
80
668
X'Y
96
789
1
10
XY
110
70
120
30
80
56
54
70
99
100
789
78,9
1
5
1
8
(X'X)-1
BETA
1
8
1
6
X2
100
49
100
25
64
64
36
49
81
100
668
66,8
1
7
2,3857 -0,286
-0,286 0,0357
3,6
0,75
1
9
1
10
Yi 1 2 X 2i 3 X 3i
X'X
Entonces:
Y1
Y
2
Y Y3
...
Yn
1 X 21
1 X
22
X 1 X 23
... ...
1 X 2 n
X 31
X 32
X 33
...
X 3n
n
X 2i
X 3i
X
X
X X
2i
2
2i
2i
3i
2i
3i
X 'Y X Y
X Y
X
X X
X
2i i
3i i
2
3i
3i
X=
1
1
1
1
1
1
1
1
1
14
15
18
25
30
59
85
75
150
150
140
120
100
95
60
30
20
5
Y
15
20
50
45
26
80
90
120
160
606
67,33
X'
X2
14
15
18
25
30
59
85
75
150
471
52,33
X3
150
140
120
100
95
60
30
20
5
720
80,00
1
1
1
1
14 15 18 25
150 140 120 100
X'X
X'Y
9
471
720
471
41101
20050
606
48685
28720
1
30
95
Y*X2
210
300
900
1125
780
4720
7650
9000
24000
48685
5409,44
1 1
59 85
60 30
720
20050
80450
Y*X3
2250
2800
6000
4500
2470
4800
2700
2400
800
28720
3191,11
1
1
75 150
20
5
(X'X)-1
BETA
X2*X3
2100
2100
2160
2500
2850
3540
2550
1500
750
20050
2227,78
67,4641721
0,6054026
-0,3976697
1 1
2 2
Var Cov ( B ) E
1 1
...
k K
2 2 ... k k
Var Cov (B )
E ( 1 1 )( 1 1 )
E ( 1 1 )( 2 2 )
E ( 2 2 )( 1 1 ) E ( 2 2 )( 2 2 )
...
...
E ( K K )( 1 1 ) E ( K K )( 2 2 )
... E ( 1 1 )( K K )
... E ( 2 2 )( K K )
...
...
... E ( K K )( K K
B ( X ' X ) 1 X ' Y
Y adems:
Y XB U
Reemplazando:
B ( X ' X ) 1 X ' ( XB U )
B ( X ' X ) 1 X ' XB ( X ' X ) 1 X 'U
B B ( X ' X ) 1 X 'U
B B ( X ' X ) 1 X 'U
Siendo:
E Y XB
E XB U X ( X ' X ) 1 X ' ( XB U )
E XB U X ( X ' X ) 1 X ' XB X ( X ' X ) 1 X 'U )
E XB U XB X ( X ' X ) 1 X 'U )
E U X ( X ' X ) 1 X 'U
E [ I X ( X ' X ) 1 X ' ]U
Si hacemos que:
A [ I X ( X ' X ) 1 X ' ]
E ' E 1
a12
a
21
... n a31
...
ak1
...
...
...
...
a1n
a2 n
a3n
...
1
2
3
...
a13
a21
a31
...
a14
a21
a31
...
ak 1
ak1 ... ak 1n n
E' E
a a a
1 i1
E ' E 1 1ai1
1 i2
2 1ai 2
1 i3
1
2
... 1ain 3
...
n
E[ E ' E ] 2Tr [ A]
E[ E ' E ] 2Tr [ I X ( XX ) 1 X ' ]
E[ E ' E ] 2 {Tr [ I ] Tr [ X ( XX ) 1 X ' ]}
E[ E ' E ] 2 {Tr [ I ] Tr [ X ' X ( XX ) 1 ]}
E[ E ' E ] 2 [n k ]
Por tanto:
E' E
nk
Y
X2
15
14
20
15
50
18
45
25
26
30
80
59
90
85
120
75
160
150
606
471
67,33 52,33
X3
Y*X2
150
210
140
300
120
900
100
1125
95
780
60
4720
30
7650
20
9000
5
24000
720
48685
80,00 5409,44
Y*X3
2250
2800
6000
4500
2470
4800
2700
2400
800
28720
3191,11
X2*X3
2100
2100
2160
2500
2850
3540
2550
1500
750
20050
2227,78
YEST
16,2894
20,8715
30,6411
42,8323
47,8476
79,3227
106,993
104,916
156,286
606
67,33
E
-1,2894
-0,8715
19,3589
2,16773
-21,848
0,67726
-16,993
15,084
3,71379
3,1E-12
0,00
Como:
E'E/n-3
231,6266049
(X'X)-1
Entonces:
1148,079214 -9,271341811 -7,964283787
VAR(B)
-9,271341811 0,081286473
-7,964283787 0,062716872
0,062716872
0,05852626
E*E
1,66243908
0,75943468
374,768677
4,69905879
477,318943
0,4586753
288,772321
227,527867
13,7922139
1389,75963
231,63
yi y i ei
Elevando al cuadrado y aplicando el operador de sumatoria se tiene:
2
2
2
y
e
i i i 2 yi e
Como:
y e 0
i
Entonces:
2
2
2
y
i i i
Y Y nY Y ' Y nY E ' E
Y Y nY B ' X ' Y nY E ' E
SEC i
i
R2
2
STC yi2
y
i
B ' X ' Y nY
R
Y ' Y nY
2
r r
2
x y
x y
i
2
i
2
i
r11
r
21
r31
.
.
rk1
r12
r22
r32
.
.
rk 2
r13
. . r1k
r11
r
12
r23 . . r2 k
r33 . . r32 r13
. . . . .
. . . . .
rk 3 . . rkk r1k
r21
r31 . . rk1
r22
r32
r23
.
r33
.
.
r3k
r2 k
. . rk 2
. . rk 3
. . .
. . .
. . rkk
x
y
x
2i i 2 2i 3 x2i x3i 4 x2i x34 ... k x2i xki
2
x
y
x
x
x
3i i 2 3i 2i 3 3i 4 x3i x4i ... k x3i xki
...
...
...
...
...
...
...
...
...
x
y
x
x
x
x
x
x
...
x
ki i 2 ki 2i 3 ki 3i 4 ki 4i
k ki
...
...
...
...
...
...
...
...
S1r21
S1r31
S 3 r23
S 3 r33
S 4 r24
S 4 r34
... S k r2 k
... S k r3k
S1r41
...
S 3 r43
...
S 4 r44
...
... S k r4 k
...
...
S1rk 1
S 2 r22
S 3 rk 3
S 3 r23
S 4 rk 4
S 4 r24
... S k rkk
... S k r2 k
S 2 r32
S 2 r42
S1r33
S1r43
S 4 r34
S 4 r44
... S k r3k
... S k r4 k
...
...
...
...
...
S 2 rk 2
S1rk 3
S 4 rk 4
...
S k rkk
r21
r31
r23
r33
r24
r34
... r2 k
... r3 k
r41
...
r43
...
r44
...
... r4 k
... ...
S1S 3 S 4 ...S k rk 1
2
S 2 S 3 S 4 ...S k r22
r32
r42
rk 3
r23
rk 4
r24
... rkk
... r2 k
r33
r43
r34
r44
... r3k
... r4 k
...
...
...
...
...
rk 2
rk 3
rk 4
...
rkk
r21
r31
r23
r33
r24
r34
... r2 k
... r3k
r41
...
r43
...
r44
...
... r4 k
... ...
S1 rk 1
2
S 2 r22
r32
r42
rk 3
r23
rk 4
r24
r33
r43
r34
r44
... rkk
S1 12
... r2 k
S 2 11
... r3k
... r4 k
...
...
...
...
...
rk 2
rk 3
rk 4
...
rkk
r21
r31
r23
r33
r24
r34
... r2 k
... r3k
r41
...
r43
...
r44
...
... r4 k
... ...
S1 rk 1
3
S 3 r22
r32
r42
rk 3
r23
rk 4
r24
r33
r43
r34
r44
... rkk
S1 13
... r2 k
S 3 11
... r3k
... r4 k
...
...
...
...
...
rk 2
rk 3
rk 4
...
rkk
r21
r31
r23
r33
r24
r34
... r2 k
... r3k
r41
...
r43
...
r44
...
... r4 k
... ...
S1 rk 1
4
S 4 r22
r32
r42
rk 3
r23
rk 4
r24
r33
r43
r34
r44
... rkk
S1 14
... r2 k
S 4 11
... r3k
... r4 k
...
...
...
...
...
rk 2
rk 3
rk 4
...
rkk
r21
r31
r23
r33
r24
r34
... r2 k
... r3k
r41
...
r43
...
r44
...
... r4 k
... ...
S1 rk 1
k
S 2 r22
r32
r42
rk 3
r23
rk 4
r24
r33
r43
r34
r44
... rkk
S1 1k
... r2 k
S k 11
... r3k
... r4 k
...
...
...
...
...
rk 2
rk 3
rk 4
...
rkk
S1 12
2
S 2 11
12
r21 r23 . . . r2 k
r31 r33 . . . r3k
.
. . . . .
.
. . . . .
.
. . . . .
rk1 rk 3 . . . rkk
r22
r23 . . . r2 k
r32
r33 . . . r3k
.
11
.
.
.
. . .
. . .
.
.
. . .
rk 2
rk 3 . . . rkk
S1 1i
2
Si 11
Por tanto, se puede escribir:
13
1k
11
12
y i
x 2i
x3i ...
xki 0
S1
S2
S3
Sk
INFERENCIA ESTADSTICA
Supuestos del modelo clsico de regresin lineal normal (MCRLN)
El MCRLN supone que:
E ( i / X i ) 0
Media
E[ i E ( i )]2 E[ i2 ] 2
Covarianza
E[ i E ( i )][ j E ( j )] 0
Varianza
i ~ NID(0, 2 )
Nota:
Toda variable que es funcin lineal de una variable aleatoria es
tambin una variable aleatoria.
Existe una relacin entre distribuciones de probabilidad.
INFERENCIA ESTADSTICA
Supuestos del modelo clsico de regresin lineal normal (MCRLN)
Yi 1 2 X 2i 3 X 3i 4 X 4i ... k X ki i
E (Yi ) 1 2 X 2i 3 X 3i 4 X 4i ... k X ki i
Media
Varianza
Covarianza
Yi ~ NID ( 1 2 X 2i 3 X 3i ... k X k , 2 )
INFERENCIA ESTADISTICA
Propiedades de los estimadores MCO bajo el supuesto de normalidad
Z1
1 1
~ N (0,1)
2 2
Xi
2
x
i
2 2
Z2
~ N (0,1)
2
2
x
i
2
(n 2) 2 ~ n2 2
O alternativamente,
2
e
i ~ 2
n2
2
INFERENCIA ESTADISTICA
Teoremas tiles relacionadas con la distribucin normal
Teorema 1:
Z i ~ NI (0,1)
Teorema 2:
Z1 ~ N (0,1)
V2 ~ k2
2
2
Z
~
i n
i 1
Z1
~ tk
V2
k
Teorema 3:
V1 ~ k21
V2 ~ k22
Teorema 4:
t k2 F1,k
V1 / k1
~ Fk1 ,k 2
V2 / k 2
INFERENCIA ESTADSTICA
Utilizando los teoremas planteados se deducen
Considerando que:
Z2
2 2
~ N (0,1)
2
V2 (n 2) 2 ~ n2 2
2
x
i
tn2
2 2
2
2
x
i
2
(n 2) 2
n2
2 2 2 2
2
S 2
xi2
INFERENCIA ESTADSTICA
Utilizando los teoremas planteados se deducen
Por el teorema 1:
2 2
Z2
~ N (0,1)
2
2
x
i
2
2
]
x
2 i
2
Z 22 [ 2 2 2 ]2 2
1
2
2
x
i
Como tambin:
[ 2 2 ]2 xi2
V2 (n 2)
~ n2 2
F1,n 2
2
1
2
( n 2) 2
n2
INFERENCIA ESTADSTICA
En resumen se tiene las siguiente variables aleatorias
Z1
1 1
X
n x
2
i
~ N (0,1)
2
i
1 1
X
n x
2
i
2
i
~ tn2
2 2
Z2
~ N (0,1)
2
2
x
i
2 2
2
x
i
[ 2 2 ]2 xi2
~ F1,n 2
2
~ tn2
INFERENCIA ESTADSTICA
Intervalos de confianza para los coeficientes de Regresin
Pr[t / 2
Pr[ 2 t / 2
2 2
t / 2 ] 1
2
2
x
i
2
2 2 t / 2
2
xi
2
1
2
xi
INFERENCIA ESTADSTICA
Intervalos de confianza para los coeficientes de Regresin
2
(n 2) 2 ~ n2 2
Pr[ 12 / 2 2 2/ 2 ] 1
Pr[ 12 / 2
2
(n 2) 2 2/ 2 ] 1
2
2
Pr[(n 2) 2 2 (n 2) 2 ] 1
/ 2
1 / 2
INFERENCIA ESTADSTICA
Prueba de hiptesis
La relacin entre la variable endgena y exgena viene dada por la
dependencia lineal del valor medio de la variable endgena respecto de la
variable exgena:
E (Yi / X i ) 1 2 X i
La hiptesis de no relacin entre la variable endgena y la variable exgena
es:
H0 : 2 0
Si no tenemos ningn conocimiento previo respecto a los valores de los
parmetros de la regresin, la hiptesis alternativa ser:
H A : 2 0
INFERENCIA ESTADSTICA
Prueba de hiptesis
Para contrastar la hiptesis nula utilizamos el estadstico de prueba
deducido:
t
2
2 2
2
2
x
i
t
2
2
2
2
x
i
INFERENCIA ESTADSTICA
No existe relacin entre la variable endgena y la exgena
Debido a que el estadstico de prueba sigue una distribucin t se puede
utilizar para determinar si un valor t particular es grande o pequeo
estableciendo intervalos de confianza como el siguiente:
Pr[t / 2
Donde:
2 2
t / 2 ] 1
2
xi2
INFERENCIA ESTADSTICA
Esquema de prueba de significancia individual
Se rechaza la
hiptesis nula
Se rechaza la
hiptesis nula
Area A = rea B
(A+B) = el nivel
deseado
de
significancia
Area A
Area B
- Valor
critico
+ Valor
critico
INFERENCIA ESTADSTICA
Determinacin de los valores crticos
Distribucin de t Student
0.025
0.025
- 2.086
+ 2.086
INFERENCIA ESTADSTICA
Prueba de significancia individual Ejemplo hipottico.
Hiptesis:
H A : 2 0
H0 : 2 0
Estadstico de prueba:
tn2
Regla de decisin:
2
0.6470
11.65
2
86.9187
2
28,160
x
i
Se rechaza
Se rechaza
Se acepta
0.05
-2.306
Valor critico
0.05
2.306
Valor critico
11.65
INFERENCIA ESTADSTICA
Algunos aspectos prcticos
Si el nmero de grados de libertad es 20 y si el nivel de significancia, se
fija en 0.05, entonces la hiptesis nula puede ser rechazada si el t
calculado excede a 2 en valor absoluto.
Cmo se formula las hiptesis?: no existe regla prctica
Rechazar o no rechazar la hiptesis nula depende en forma crtica del
nivel de significancia: Rechazar la hiptesis nula siendo esta verdadera
(error tipo I).
Una vez que se ha obtenido un estadstico de prueba se puede obtener
la probabilidad exacta de cometer un error tipo I: el nivel de significancia
ms bajo al cual puede rechazarse una hiptesis nula.
0.05
0.05
INFERENCIA ESTADSTICA
Prueba de significancia global
Puede demostrarse que:
E ( SEC ) E ( 22 x i ) 2 22 xi2
2
ei
[1]
E ( SRC ) E (
n2
) E ( 2 ) 2
[2]
Hiptesis:
H 0 : 2 0
INFERENCIA ESTADSTICA
No existe relacin entre la variable endgena y la exgena
Estadstico de prueba:
F1,n 2
[ 2 2 ]2 xi2
F1,n 2
22 xi2
Pr[
2 2
Fk1 ,k2 , ] 1
2
2
x
i
INFERENCIA ESTADSTICA
Esquema de prueba de significancia individual
Se rechaza la
hiptesis nula
Nivel de significancia
deseado
+ Valor
critico
PRUEBAS DE HIPTESIS
Determinacin de los valores crticos
Distribucin F Snedecor
+ 4.11
INFERENCIA ESTADSTICA
Prueba de significancia global Ejemplo hipottico.
Hiptesis:
H A : 2 0
H0 : 2 0
Estadstico de prueba:
22 xi2 [0.418631][28,160]
F1,8
135.6285
2
86.9187
Regla de decisin:
Se acepta
Se rechaza
0.05
0.90
0.10
0.05
3.46
Valor critico
135.6285
INFERENCIA ESTADSTICA
Tabla ANOVA ejemplo hipottico.
SUMA DE CUADRADOS
GRADOS
DE
LIBERTAD
yi2 22 x i
ei
n-2
STC
n-1
FUENTE DE VARIACIN
2
i
Regla de decisin:
FC FT
Se rechaza la hiptesis.
SUMA PROMEDIO DE
CUADRADOS
22 xi2
ei / n 2
2
PREDICCIN
Prediccin
PREDICCIN
Prediccin media
Supongamos que para un valor:
X 0 100
Deseamos predecir:
E (Y0 / X 0 ) 100
Deseamos predecir:
PREDICCIN
Prediccin media
PREDICCIN
Prediccin individual