Вы находитесь на странице: 1из 21

Análisis de correlación en

regresión múltiple
Calidad del modelo de ajuste
• Si SCR = 0 el modelo de ajuste será
perfecto.
ˆ
SCR = 0 ⇒ e' e = 0 ⇒ e = 0 ⇒ Y = Y
• Si SCR ≠ 0 el modelo de ajuste no será
perfecto. El vector de los residuos no será
nulo y, en consecuencia, los valores
observados y estimados serán diferentes
entre sí.
Calidad del modelo de ajuste (II)
• Si SCR es pequeña, la calidad del modelo
de ajuste será buena pero ¿cómo sabremos
si SCR es grande o pequeña?
• Tendremos que comparar SCR con otra
“suma de cuadrados”. Para obtener esa otra
suma llevaremos a cabo un análisis de la
desviación de cada observación respecto a
la media.
Análisis de la desviación de cada
observación
• Dada una observación cualquiera podemos
expresar la desviación de la variable dependiente
respecto a la media del siguiente modo:

yi − y
• Esta desviación la podemos descomponer en dos
partes:

yi − y = ( yˆ i − y ) + ( yi − yˆ i )
Análisis de la desviación de cada
observación (II)

• yi − y es la desviación respecto a la media


• yˆ i − y es la desviación que es explicada por las
variables explicativas
• yi − yˆ i es el residuo o la desviación que no
explican las variables explicativas
Cuadrados de las desviaciones
• Si calculamos los cuadrados de las desviaciones:

( yi − y ) 2
= ( yi − y ) + ( yi − yi ) + 2( yˆ i − y )( yi − yˆ i )
ˆ 2
ˆ 2

• Esta expresión se cumple para todos los


individuos. Por tanto, si las sumamos para todos
ellos:
n n n n

∑( y − y ) = ∑ ( yˆ i − y ) + ∑ ( yi − yˆ i ) + 2∑ ( yˆ i − y )( yi − yˆ i )
2 2 2
i
i =1 i =1 i =1 i =1
Sumas de cuadrados de las
desviaciones
• Pero, como se puede comprobar fácilmente,
n

∑ ( yˆ
i =1
i − y )( yi − yˆ i ) = 0

• Y en consecuencia:

n n n
(
∑ iy − y ) 2
= (
∑ iˆ
y − y ) 2
+ (
∑ i i
y − ˆ
y ) 2

i =1 i =1 i =1
Sumas de cuadrados de las
desviaciones (II)
• Suma total de cuadrados (STC): es una medida de la variabilidad de la
variable dependiente cuando no tomamos en consideración la
información que nos proporcionan las variables explicativas.
n
(
∑ iy − y ) 2

i =1
• Suma de cuadrados de los residuos (SCR): es una medida de la
variabilidad de la variable dependiente cuando tomamos en
consideración la información que nos proporcionan las variables
explicativas. n
(
∑ i i
y − ˆ
y ) 2

i =1
• Suma de cuadrados explicada (SCE): es la parte de la variabilidad de
la variable dependiente que es explicada por las variables
n
independientes.
∑ ( yˆ − y)
2
i
i =1
Sumas de cuadrados de las
desviaciones (III)

n
(
∑ iˆ
y − y ) 2

∑( y − y)
2 i =1
i
i =1

n
(
∑ i i
y − ˆ
y ) 2

i =1
Coeficiente de determinación
• Es la proporción de la variabilidad de la
variable dependiente que queda explicada
por las variables independientes:
n
(
∑ i i
y − ˆ
y ) 2

SCE SCR
R =
2
= 1− = 1− i =1
n
STC STC
(
∑ iy − y ) 2

i =1

0 ≤ R ≤1
2
Coeficiente de determinación (II)
• Es una medida de la calidad del ajuste:
– Si R 2 ≈ 0 la calidad del ajuste no es buena y,
en principio, las variables explicativas no
explican la variabilidad de la variable
dependiente.
– Si R 2 ≈ 1 la calidad del ajuste es buena y, en
principio, las variables explicativas explican la
variabilidad de la variable dependiente.
Coeficiente de determinación
(III)
• Cuando añadimos una nueva variable explicativa al
modelo de ajuste R2 siempre aumenta (¿por qué?):

R 2 ( X 1 ,..., X j ) ≤ R 2 ( X 1 ,..., X j , X j +1 )

• Para poder comparar modelos con un número diferente de


variables explicativas utilizaremos otro coeficiente al que
llamaremos coeficiente de determinación corregido (o
ajustado).
Coeficiente de determinación
corregido
n
(
∑ i i
y − ˆ
y ) 2

i =1
n − k −1 s2
R = 1−
2
n
= 1− 2
sy
(
∑ iy − y ) 2

i =1
n −1

• s 2 : varianza estimada de la variable dependiente cuando tomamos en


cuenta la información de las variable explicativas.

• s y2: varianza estimada de la variable dependiente cuando no tomamos


en cuenta la información de las variables explicativas.
Coeficiente de correlación parcial
(k=2)

• RY2 / X 1 : Porcentaje de variación explicado por X1

• 1 − R 2
Y / X 1 : Porcentaje de variación no explicado por X1

2
R
• Y / X 1 , X 2 : Porcentaje de variación explicado por el conjunto {X1, X2}

R 2
• Y / X1 , X 2
− R 2
Y / X 1 : Diferencia entre los porcentajes de variación

explicados por X1 y por el conjunto {X1, X2}

1 − RY2 / X 1 , X 2 RY2 / X 1 , X 2 − RY2 / X 1


R 2
YX 2 / X 1 = 1− =
1− R 2
Y / X1 1 − RY2 / X 1
Coeficiente de correlación parcial(II)
(k=2)

1 − RY2 / X1 , X 2 RY2 / X 1 , X 2 − RY2 / X1


2
RYX 2 / X1
= 1− =
1− R 2
Y / X1 1 − RY2 / X 1

1 − RY2 / X 1 , X 2
1 − RY2 / X 1

RY2 / X 1 , X 2
RY2 / X 1
Coeficiente de correlación parcial(III)
(k=2)

1 − RY2 / X1 , X 2 RY2 / X 1 , X 2 − RY2 / X1


2
RYX 2 / X1
= 1− =
1− R 2
Y / X1 1 − RY2 / X 1

1 − RY2 / X 1 , X 2
1 − RY2 / X 1

RY2 / X 1 , X 2 − RY2 / X 1
Coeficiente de correlación parcial
(caso general)

• RY2 / X 1 ,..., X j−1 : Porcentaje de variación explicado por el conjunto {X1,..., Xj-1}

• 1 − R 2
Y / X 1 ,..., X j −1 : Porcentaje de variación no explicado por {X1,..., Xj-1}

2
R
• Y / X 1 ,..., X j : Porcentaje de variación explicado por {X1,..., Xj-1 , Xj}

R 2
• Y / X 1 ,..., X j
− R 2
Y / X 1 ,..., X j −1 : Diferencia entre los porcentajes de variación

explicados por {X1,..., Xj-1 , Xj} y por {X1,..., Xj-1}

1 − RY2 / X 1 ,..., X j RY2 / X 1 ,..., X j − RY2 / X 1 ,..., X j−1


2
RYX j / X 1 ,..., X j −1
= 1− =
1− R 2
Y / X 1 ,..., X j −1 1 − RY2 / X 1 ,..., X j−1
Coeficiente de correlación parcial (II)
(caso general)
1 − RY2 / X1 ,..., X j RY2 / X1 ,..., X j − RY2 / X1 ,..., X j−1
2
RYX j / X 1 ,..., X j −1
= 1− =
1 − RY2 / X1 ,..., X j −1 1 − RY2 / X 1 ,..., X j−1

1 − RY2 / X1 ,..., X j
1 − RY2 / X 1 ,..., X j−1

RY2 / X 1 ,..., X j
RY2 / X 1 ,..., X j−1
Coeficiente de correlación parcial (III)
(caso general)
1 − RY2 / X1 ,..., X j RY2 / X1 ,..., X j − RY2 / X1 ,..., X j−1
2
RYX j / X 1 ,..., X j −1
= 1− =
1 − RY2 / X1 ,..., X j −1 1 − RY2 / X 1 ,..., X j−1

1 − RY2 / X1 ,..., X j
1 − RY2 / X 1 ,..., X j−1

RY2 / X 1 ,..., X j − RY2 / X 1 ,..., X j−1


Coeficiente de correlación parcial (IV)
(caso general)

1 − RY2 / X 1 ,..., X j RY2 / X1 ,..., X j − RY2 / X1 ,..., X j−1


rYj = RYX
2
j / X 1 ,..., X j −1
= 1− =
1− R 2
Y / X 1 ,..., X j −1 1 − RY2 / X 1 ,..., X j −1
Ejercicio

En el ejemplo de los alquileres, calcular los


coeficientes de correlación parcial de las
variables explicativas.