Академический Документы
Профессиональный Документы
Культура Документы
MLTIPLE
Y = XB + U
donde:
B: Matriz de coeficientes.
U: Matriz de errores.
Y 0 1 X
Se puede argumentar que esta es la ecuacin de regresin en la poblacin. Como
generalmente no tenemos datos de una poblacin, sino de una muestra, podemos
estimar los parmetros (0 y 1) con lo que se conoce como el mtodo de mnimos
cuadrados ordinarios (MCO). La ecuacin quedara de la siguiente forma:
y 0 1 x e
y 0 1 x
ei yi y i
Grficamente, los residuos son las diferencias verticales entre los puntos en el
grfico de dispersin y la lnea de regresin:
ei yi 0 1 xi yi 0 1 xi
Vean que los residuos son estimaciones del error que cometemos al usar el
modelo de regresin en lugar de los datos observados.
e
i 1
i 0
n n
El mtodo de mnimos cuadrados ordinarios MCO se llama as, porque uno puede
encontrar los valores de 0 y 1 para minimizar la SCE, o sea, para minimizar el
error en conjunto:
SCE SCE
0, y 0
0 1
Este es un sistema de ecuaciones con dos incgnitas, que con ms tiempo los
pondra a resolver.
x i x yi y
1 i 1
n , y 0 y 1 x
x
i 1
i x
2
0 se interpreta como:
1 se interpreta como:
De la SCE del error se deriva una medida importante que es el error estndar de
estimacin Se. Segn el libro de frmulas, el error estndar de estimacin en una
regresin lineal simple es:
n n n
yi2 0 * yi 1 * xi * y i SCE
i 1 i 1 i 1
Se
n2 n2
se se se
s 1
SC x n sx * n 1
xi x
2
i 1
1 x2
s 0 se *
n SCx
SCE SCR
R2 1
SC.Total SC.Total
Y 0
Para 1:
1 m
tc
s 1
Para 0:
0 k
tc
s 0
donde ambos tc tienen una distribucin t de Student con n-2 grados de libertad.
0 se interpreta como:
j se interpeta como:
En este curso, no vamos a tratar de calcular ninguno de estos modelos, sino nada
ms interpretarlos.
De esta forma es que se tiene que interpretar. Si uno tiene una matriz de
correlaciones bivariadas de Pearson, es fcil calcular los coeficientes de correlacin
parcial controlando por una nica tercera variable (Z) de la siguiente forma:
Y 0 1 Z1 2 Z 2 ... k Z k
X 0 1 Z1 2 Z 2 ... k Z k
> peso.altura=lm(peso~altura)
> summary(peso.altura)
Call:
lm(formula = peso ~ altura)
Residuals:
Min 1Q Median 3Q Max
-51.1264 -8.1598 -0.7992 6.7584 71.4243
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -44.59251 3.78279 -11.79 <2e-16 ***
altura 0.72120 0.02403 30.01 <2e-16 ***
---
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
> peso.regresion=lm(peso~altura+cintura+cadera)
> summary(peso.regresion)
Call:
lm(formula = peso ~ altura + cintura + cadera)
Residuals:
Min 1Q Median 3Q Max
-47.7359 -4.0489 -0.1967 3.5991 53.8161
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -124.24714 2.53130 -49.08 <2e-16 ***
altura 0.67298 0.01420 47.41 <2e-16 ***
cintura 0.39179 0.01514 25.89 <2e-16 ***
cadera 0.46439 0.01610 28.84 <2e-16 ***
---
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Response: peso
Df Sum Sq Mean Sq F value Pr(>F)
altura 1 131976 131976 2613.63 < 2.2e-16 ***
cintura 1 200955 200955 3979.67 < 2.2e-16 ***
cadera 1 42008 42008 831.93 < 2.2e-16 ***
Residuals 2501 126289 50
---
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Correlaciones:
> antropometria=cbind(peso,altura,cintura,cadera)
> cor(antropometria, use="pairwise.complete.obs")
peso altura cintura cadera
peso 1.0000000 0.512771864 0.67398220 0.650411615
altura 0.5127719 1.000000000 0.08454247 0.008700766
cintura 0.6739822 0.084542469 1.00000000 0.687275211
cadera 0.6504116 0.008700766 0.68727521 1.000000000