Вы находитесь на странице: 1из 9

REGRESION Y CORRELACION MULTIPLE

9.16. Introduccin
El anlisis de regresin mltiple es una tcnica en la que se utilizan diversas variables
independientes para estimar el valor de una variable dependiente desconocida; por lo tanto, cada una
de estas variables de prediccin explica parte de la variacin total de la variable dependiente.
Adems, el anlisis de correlacin mltiple mide la intensidad total de la asociacin entre todas
estas variables.
Para estimar la variable dependiente podemos utilizar ms de una variable independiente y, de esta
manera, intentar aumentar la precisin de la estimacin. Este proceso conocido como anlisis de
regresin y correlacin mltiple, est basado en las mismas suposiciones y procedimientos del
anlisis de regresin y correlacin simple.
Considerar el caso del corredor inmobiliario que desea relacionar el nmero de inmuebles que la
firma vende en un mes con la cantidad de publicidad mensual. Ciertamente, podemos encontrar una
ecuacin de estimacin sencilla que relacione a estas dos variables. Podemos hacer ms precisa la
ecuacin incluyendo en el proceso de estimacin el nmero de vendedores que emplea cada mes?
Probablemente la respuesta sea si. Y ahora, como empleamos tanto el nmero de vendedores como
los gastos de publicidad para predecir las ventas mensuales de casas, debemos usar regresin
mltiple, no simple, para determinar la relacin.
La principal ventaja de la regresin mltiple es que nos permite usar ms informacin disponible
para estimar la variable dependiente. En algunas ocasiones, la correlacin entre dos variables puede
resultar insuficiente para determinar una ecuacin de estimacin confiable. Sin embargo, s
agregamos los datos de ms variables independientes, podemos determinar una ecuacin de
estimacin que describa la relacin con mayor precisin.

PASOS EN EL ANLISIS DE REGRESIN Y CORRELACIN MLTIPLE: Implica un proceso de tres


pasos:
1) Describir la ecuacin de regresin mltiple.
2) Examinar el error estndar de estimacin mltiple.
3) Utilizar el anlisis de correlacin mltiple para determinar qu tan bien describe la ecuacin de
regresin los datos observados.
Adems, en la regresin mltiple podemos observar cada una de las variables independientes y
probar si contribuyen significativamente a la forma en que la regresin describe los datos de la
variable dependiente.
Afortunadamente, hay disponibles muchos paquetes de computacin para hacer regresiones
mltiples y otros anlisis estadsticos. Tales paquetes realizan las complejas y laboriosas operaciones
numricas y permiten concentrarse en el anlisis de la significacin de la ecuacin de estimacin
resultante. Analizaremos los resultados de la regresin mltiple obtenidos por el paquete estadstico
SPSS.
La regresin mltiple permite tambin ajustar tanto rectas como curvas. Haciendo uso de las
tcnicas de las variables ficticias, hasta podemos incluir factores cualitativos como el sexo, en la
regresin mltiple. Las variables ficticias y el ajuste de curvas son solamente dos de las muchas
tcnicas de modelado que se pueden emplear en la regresin mltiple para aumentar la precisin de
nuestras ecuaciones de estimacin.

1
9.17. Regresin lineal mltiple: dos variables independientes
Consideremos el caso en el que una variable dependiente Y, se relaciona en forma lineal a dos
variables independientes X1 y X2 ( Y podra ser el ingreso, X1 la escolaridad y X2 la experiencia
laboral).

Y b0 b1 X 1 b2 X 2

Esta ecuacin nos da el valor estimado de Y , de la variable dependiente para cualquier par de
valores especificados de las variables independientes. Los valores b0 , b1 y b2 se denomina
coeficientes de regresin estimados o coeficientes de regresin parcial.

La ecuacin de regresin mltiple de tres variables (que relaciona Y con X1 y X2 ) corresponde a un


plano en el espacio tridimensional, denominado plano de regresin.

EJEMPLO 93. La SAT est tratando de estimar la cantidad mensual de impuestos no pagados
descubiertos por su departamento de auditoria. En el pasado, la SAT estimaba esta cantidad sobre la
base del nmero esperado de horas de trabajo de auditorias de campo. En los ltimos aos, sin
embargo, las horas de trabajo de auditorias de campo se han vuelto un factor de prediccin errtico
de los impuestos reales no pagados. Como resultado de ello, la SAT est buscando otro factor con el
cual pueda mejorar la ecuacin de estimacin.

El departamento de auditorias tiene un registro del nmero de horas que sus computadoras usan para
detectar impuestos no pagados. Podramos combinar esta informacin con los datos referentes a las
horas de trabajo de auditorias de campo y obtener una ecuacin de estimacin ms precisa para los
impuestos no pagados descubiertos cada mes? En la siguiente tabla se presentan esos datos
correspondientes a los ltimos 10 meses.

MES j Y X1 X2 * * * * R E G R E S I O N M U LT I PLE * * * *
Enero 1 29 45 16 Estadsticos descriptivos
Febrero 2 24 42 14 Media s Etiqueta
Marzo 3 27 44 15 Y 27.200 1.814 IMPUESTOS NO PAGADOS (millones $)
AUDITORIA CAMPO (cientos horas
Abril 4 25 45 13 X1 44.100 1.197
trabajo)
Mayo 5 26 43 13 X2 14.700 1.160 COMPUTADORA (cientos horas)
Junio 6 28 46 14
Julio 7 30 44 16
Agosto 8 28 45 16
Setiembre 9 28 44 15 Nmero de Casos = 10
Octubre 10 27 43 15
Correlacin, 1-cola Sig:
Y X1 X2

Y 1.000 0.502 0.771


. 0.070 0.004
X1 0.502 1.000 0.184
0.070 . 0.305
X2 0.771 0.184 1.000
0.004 0.305 .

2
* * * * R E G R E S I O N M U LT I PLE * * * *

Variable Dependiente
Ecuacin Nmero 1 IMPUESTOS NO PAGADOS (millones $)
Y

Bloque Nmero 1. Mtodo: Enter X1 X2

Variable(s) Entradas en Etapa Nmero


1.. X2 COMPUTADORA (cientos horas)
2.. X1 AUDITORIA CAMPO (cientos horas trabajo)

Anlisis de Correlacin Anlisis de Varianza


R 0.85377 gl Suma de cuadrados Media de Cuadrados
R2 0.72892 Regresin 2 21.57613 10.78806
R2 ajustado 0.65147 Error 7 8.02387 1.14627
Error Estndar syx 1.07064
F = 9.41147 Signif F = 0.0104

Anlisis de Regresin: ------------------Variables en la


Ecuacin------------------
Variable b sb Beta t Sig t
X1 0.563660 0.303274 0.372106 1.859 0.1054
X2 1.099469 0.313139 0.702959 3.511 0.0098
Constante -13.819629 13.323300 -1.037 0.3341

La ecuacin de estimacin obtenida es: Y 13.819629 0.563660 X 1 1.099469 X 2

Por consiguiente, en el pronstico para noviembre, si el nmero de horas de trabajo en auditora de


campo permanecera alrededor de 4300 horas y el nmero de horas en computadora aumentar a
aproximadamente a 1600, entonces:
X1 = 43 4300 horas de trabajo en auditoras de campo
X2 = 16 1600 horas de tiempo de computadora
Sustituyendo estos valores en la ecuacin de regresin obtenemos:
Y 13.819629 0.563660 43 1.099469 16 28.009255 Millones $

Entonces, el departamento de auditoras espera encontrar una evasin de impuestos de 28 Millones $


aproximadamente, para esta combinacin de factores.

3
EJEMPLO 94. Los datos que siguen muestran el nmero de habitaciones, el nmero de baos y los
precios a los cuales se vendieron recientemente ocho casas unifamiliares en cierto distrito.
a) Obtener una ecuacin lineal que permita predecir el precio de venta promedio de una casa
unifamiliar del distrito dado en trminos del nmero de habitaciones y del nmero de baos.
b) Estimar el precio de venta promedio de casas de 3 habitaciones y 2 baos
j Y X1 X2 * * * * R E G R E S I O N M U LT I PLE * * * *
1 88.8 3 2 Estadsticos descriptivos
2 84.3 2 1 Media s Etiqueta
3 93.8 4 3 Y 89.625 5.154 PRECIO (miles $)
4 84.2 2 1 X1 3.125 1.126 N HABITACIONES
5 89.7 3 2 X2 2.000 0.756 N BAOS
6 84.9 2 2
7 98.4 5 3
8 92.9 4 2
Nmero de Casos = 8

Correlacin, 1-cola Sig:


Y X1 X2

Y 1.000 0.996 0.869


. 0.000 0.003
X1 0.996 1.000 0.839
0.000 . 0.005
X2 0.869 0.839 1.000
0.003 0.005 .
* * * R E G R E S I O N M U LT I PLE * * * *
Variable Dependiente
Ecuacin Nmero 1 PRECIO (miles $)
Y
Bloque Nmero 1. Mtodo: Enter X1 X2
Variable(s) Entradas en Etapa Nmero
1.. X2 N BAOS
2.. X1 N HABITACIONES
Anlisis de Correlacin Anlisis de Varianza
R 0.99815 gl Suma de cuadrados Media de Cuadrados
R2 0.99631 Regresin 2 185.26917 92.63458
R2 ajustado 0.99484 Error 5 0.68583 0.13717
Error Estndar
0.37036
syx
F = 675.34326 Signif F = 0.0000

Anlisis de Regresin: ------------------Variables en la


Ecuacin------------------
Variable b sb Beta t Sig t
X1 4.133333 0.228591 0.902985 18.082 0.0000
X2 0.758333 0.340497 0.111221 2.227 0.0764
Constante 75.191667 0.418000 179.884 0.0000

a) La ecuacin lineal de prediccin es: Y 75.191667 4.133333 X 1 0.758333 X 2

b) Sustituyendo valores en la ecuacin de regresin obtenemos:

Y 75.191667 4.133333 3 0.758333 2 89.108 miles $ $ 89,108

4
EJEMPLO 95. Un reporte de ventas muestra el nmero de vestidos vendidos, el nmero de horas trabajadas
y los meses de experiencia, de 10 vendedoras de medio tiempo seleccionadas al azar del departamento de
vestidos de una gran tienda.
a) Ajustar una ecuacin de la forma Y b0 b1 X 1 b2 X 2 a estos datos.
b) Utilizar la ecuacin obtenida para predecir las ventas realizadas por una vendedora de medio tiempo
que trabaja 5 horas y que tiene 3 meses de experiencia.

j Y X1 X2 * * * * R E G R E S I O N M U LT I PLE * * * *
1 4 6 0 Estadsticos descriptivos
2 2 4 2 Media s Etiqueta
3 16 16 4 Y 10.300 5.851 VESTIDOS VENDIDOS
4 10 10 6 X1 10.200 4.566 HORAS TRABAJADAS
5 12 12 8 X2 7.500 5.401 MESES DE EXPERIENCIA
6 8 8 10
7 14 12 12
8 18 16 14
9 16 14 16 Nmero de Casos = 10
10 3 4 3

Correlacin, 1-cola Sig:


Y X1 X2

Y 1.000 0.987 0.761


. 0.000 0.005
X1 0.987 1.000 0.662
0.000 . 0.018
X2 0.761 0.662 1.000
0.005 0.018 .

* * * R E G R E S I O N M U LT I PLE * * * *

Variable Dependiente
Ecuacin Nmero 1 VESTIDOS VENDIDOS
Y

Bloque Nmero 1. Mtodo: Enter X1 X2

Variable(s) Entradas en Etapa Nmero


1.. X2 MESES DE EXPERIENCIA
2.. X1 HORAS TRABAJADAS

Anlisis de Correlacin Anlisis de Varianza


R 0.99777 gl Suma de cuadrados Media de Cuadrados
R2 0.99554 Regresin 2 306.72533 153.36266
R2 ajustado 0.99426 Error 7 1.37467 0.19638
Error Estndar syx 0.44315
F = 780.94240 Signif F = 0.0000

Anlisis de Regresin: ------------------Variables en la


Ecuacin------------------
Variable b sb Beta t Sig t
X1 1.103343 0.043189 0.860957 25.547 0.0000
X2 0.206890 0.036511 0.190967 5.666 0.0008
Constante -2.505775 0.358987 -6.980 0.0002

a) La ecuacin pedida es: Y 2.505775 1.103343X 1 0.206890 X 2

b) Sustituyendo valores en la ecuacin:


Y 2.505775 1.103343 5 0.206890 3 3.62261 4 vestidos vendidos

5
EJEMPLO 96. Considerar el estudio de la relacin entre escolaridad, experiencia laboral e ingreso
anual. En la tabla se presentan los datos de veinte personas seleccionadas aleatoriamente.
a) Estimar una ecuacin de regresin mltiple
b) Predecir los ingresos anuales de alguien con 11 aos de escolaridad y 20 aos de experiencia laboral.

j Y X1 X2 * * * * R E G R E S I O N M U LT I PLE * * * *
1 5.0 2 9 Estadsticos descriptivos
2 9.7 4 18 Media s Etiqueta
3 28.4 8 21 Y 24.417 9.788 INGRESO (miles $ por ao)
4 8.8 8 12 X1 12.050 4.478 ESCOLARIDAD (aos)
5 21.0 8 14 X2 12.650 5.461 EXPERIENCIA LABORAL (aos)
6 26.6 10 16
7 25.4 12 16
8 23.1 12 9
9 22.5 12 18 Nmero de Casos = 20
10 19.5 12 5
11 21.7 12 7
12 24.8 13 9 Correlacin, 1-cola Sig:
13 30.1 14 12 Y X1 X2
14 24.8 14 17
15 28.5 15 19 Y 1.000 0.846 0.268
16 26.0 15 6 . 0.000 0.127
17 38.9 16 17 X1 0.846 1.000 -0.107
18 22.1 16 1 0.000 . 0.327
19 33.1 17 10 X2 0.268 -0.107 1.000
20 48.3 21 17 0.127 0.327 .

* * * R E G R E S I O N M U LT I PLE * * * *

Variable Dependiente
Ecuacin Nmero 1 INGRESO (miles $ por ao)
Y

Bloque Nmero 1. Mtodo: Enter X1 X2

Variable(s) Entradas en Etapa Nmero


1.. X2 EXPERIENCIA LABORAL (aos)
2.. X1 ESCOLARIDAD (aos9

Anlisis de Correlacin Anlisis de Varianza


R 0.91923 gl Suma de cuadrados Media de Cuadrados
R2 0.84498 Regresin 2 1538.22525 769.11262
R2 ajustado 0.82674 Error 17 282.20025 16.60001
Error Estndar syx 4.07431
F = 46.33204 Signif F = 0.0000

Anlisis de Regresin: ------------------Variables en la


Ecuacin------------------
Variable b sb Beta t Sig t
X1 1.933393 0.209949 0.884438 9.209 0.0000
X2 0.649365 0.172159 0.362261 3.772 0.0015
Constante -7.096855 3.626412 -1.957 0.0670

a) La ecuacin de regresin mltiple es: Y 7.096855 1.933393X 1 0.649365X 2

b) Sustituyendo valores en la ecuacin:


Y 7.096855 1.933393 11 0.649365 20 27.158 miles $ por ao
Y $ 27,158 por ao

6
EJEMPLO 97. Una empresa quiere saber si tendra posibilidades de satisfacer su nivel de inversin
requerido para el prximo ao, dado que el banco le ha ofrecido facilitarle no ms de 38 millones de
soles. Se conoce que tiene que colocar el prximo ao 35 y 11 millones de unidades 1 y 2,
respectivamente. En los ltimos 6 aos las inversiones requeridas para los 2 nicos productos que
fabrica la empresa son:
a) Calcular la lnea de regresin que mejor se ajuste.
b) Contestar la interrogante de empresa.
j Y X1 X2 * * * * R E G R E S I O N M U LT I PLE * * * *
1 11 9 4 Estadsticos descriptivos
2 36 36 9 Media s Etiqueta
3 26 17 11 Y 22.500 9.690 INVERSION (Millones de S/.)
4 30 28 14 X1 20.500 9.975 UNIDADES 1 (Millones)
5 17 13 21 X2 11.167 5.845 UNIDADES 2 (Millones)
6 15 20 8

Nmero de Casos = 6

Correlacin, 1-cola Sig:


Y X1 X2

Y 1.000 0.891 0.154


. 0.009 0.386
X1 0.891 1.000 -0.005
0.009 . 0.496
X2 0.154 -0.005 1.000
0.386 0.496 .

* * * R E G R E S I O N M U LT I PLE * * * *

Variable Dependiente
Ecuacin Nmero 1 INVERSION (Millones de S/.)
Y

Bloque Nmero 1. Mtodo: Enter X1 X2

Variable(s) Entradas en Etapa Nmero


1.. X2 UNIDADES 1 (Millones)
2.. X1 UNIDADES 2 (Millones)

Anlisis de Correlacin Anlisis de Varianza


R 0.90469 gl Suma de cuadrados Media de Cuadrados
R2 0.81847 Regresin 2 384.27090 192.13545
R2 ajustado 0.69745 Error 3 85.22910 28.40970
Error Estndar syx 5.33008
F = 6.76302 Signif F = 0.0773

Anlisis de Regresin: ------------------Variables en la


Ecuacin------------------
Variable b sb Beta t Sig t
X1 0.866117 0.238970 0.891570 3.624 0.0361
X2 0.262239 0.407805 0.158185 0.643 0.5660
Constante 1.816259 7.049881 0.258 0.8134

a) La ecuacin de regresin mltiple es: Y 1.816259 0.866117 X 1 0.262239 X 2

b) Sustituyendo valores en la ecuacin:


Y 1.816259 0.866117 35 0.262239 11 35.015 Millones de S/.
La empresa podr satisfacer el nivel de inversin requerido (35 < 38 Millones de S/.)

7
EJEMPLO 98. A partir del ejemplo 93, suponer que el departamento de auditoras de la SAT agrega a
su modelo la informacin correspondiente a las recompensas pagadas a informantes. La SAT desea
incluir esta tercera variable independiente X3 , ya que percibe una cierta relacin entre estos pagos y
la evasin de impuestos descubierta. En la tabla se recogi la informacin correspondiente a los
ltimos diez meses.
j Y X1 X2 X3 * * * * R E G R E S I O N M U LT I PLE * * * *
1 29 45 16 71 Estadsticos descriptivos
2 24 42 14 70 Media s Etiqueta
3 27 44 15 72 Y 27.200 1.814 IMPUESTOS NO PAGADOS (millones $)
71 AUDITORIA CAMPO (cientos horas
4 25 45 13 X1 44.100 1.197
trabajo)
5 26 43 13 75 X2 14.700 1.160 COMPUTADORA (cientos horas)
6 28 46 14 74 X3 72.500 2.273 RECOMPENSA INFORMANTES (miles $)
7 30 44 16 76
8 28 45 16 69
9 28 44 15 74 Nmero de Casos = 10
10 27 43 15 73
Correlacin, 1-cola Sig:
Y X1 X2 X4
Y 1.000 0.502 0.771 0.404
. 0.070 0.004 0.123
X1 0.502 1.000 0.184 -0.061
0.070 . 0.305 0.433
X2 0.771 0.184 1.000 -0.105
0.004 0.305 . 0.386
X4 0.404 -0.061 -0.105 1.000
0.123 0.433 0.386 .

Variable Dependiente
Ecuacin Nmero 1 IMPUESTOS NO PAGADOS (millones $)
Y
Bloque Nmero 1. Mtodo: Enter X1 X2 X3
Variable(s) Entradas en Etapa Nmero
1.. X3 RECOMPENSA INFORMANTES (miles $)
2.. X2 COMPUTADORA (cientos horas)
3.. X1 AUDITORIA CAMPO (cientos horas trabajo)
Anlisis de Correlacin Anlisis de Varianza
R 0.99167 gl Suma de cuadrados Media de Cuadrados
R2 0.98340 Regresin 3 29.10878 9.70293
R2 ajustado 0.97511 Error 6 0.49122 0.08187
Error Estndar syx 0.28613
F = 118.51727 Signif F = 0.0000
Anlisis de Regresin: ------------------Variables en la
Ecuacin------------------
Variable b sb Beta t Sig t
X1 0.596972 0.081124 0.394097 7.359 0.0003
X2 1.176838 0.084074 0.752425 13.998 0.0000
X3 0.405109 0.042234 0.507753 9.592 0.0001
Constante -45.796348 4.877651 -9.389 0.0001

a) Ajustar una ecuacin de la forma Y b0 b1 X 1 b2 X 2 b3 X 3


La recta pedida es : Y 45.796348 0.596972 X 1 1.176838 X 2 0.405109 X 3
b) Predecir los impuestos no pagados que se esperan descubrir en noviembre, si las horas de trabajo en
auditoras de campo y en computadora sern 4300 y 1500, respectivamente, y las recompensas
pagadas a informantes ascendern a $ 75000.
Y 45.796348 0.596972 43 1.176838 15 0.405109 75 27.909 Millones $
La SAT espera descubrir 27.909 Millones $ de evasin de impuestos en noviembre

8
EJEMPLO 99. La informacin anexa se ha obtenido de una muestra aleatoria de inquilinos de
departamentos en una ciudad determinada. Se intenta predecir el alquiler (en $ por mes) basndonos
en el tamao del departamento (N de habitaciones) y su distancia del centro de la ciudad (en
Kilmetros).
a) Determinar la ecuacin de regresin que mejor se ajuste.
b) Si alguien busca un departamento con 4 habitaciones y a 12 Kilmetros de la ciudad, qu
alquiler espera pagar?

j Y X1 X2 * * * * R E G R E S I O N M U LT I PLE * * * *
1 230 2 1 Estadsticos descriptivos
2 880 6 1 Media s Etiqueta
3 300 3 2 Y 356.667 262.958 ALQUILER ($/mes)
4 340 4 3 X1 3.000 1.789 N HABITACIONES
5 200 2 10 X2 3.500 3.391 DISTANCIA (Kilmetros)
6 190 1 4

Nmero de Casos = 6

Correlacin, 1-cola Sig:


Y X1 X2

Y 1.000 0.923 -0.449


. 0.004 0.186
X1 0.923 1.000 -0.429
0.004 . 0.198
X2 -0.449 -0.005 1.000
0.186 0.198 .

* * * R E G R E S I O N M U LT I PLE * * * *

Variable Dependiente
Ecuacin Nmero 1 ALQUILER ($/mes)
Y

Bloque Nmero 1. Mtodo: Enter X1 X2

Variable(s) Entradas en Etapa Nmero


1.. X2 DISTANCIA (Kilmetros)
2.. X1 N HABITACIONES

Anlisis de Correlacin Anlisis de Varianza


R 0.92451 gl Suma de cuadrados Media de Cuadrados
R2 0.85471 Regresin 2 295501.66445 147750.83222
R2 ajustado 0.75785 Error 3 50231.66889 16743.88963
Error Estndar syx 129.39818
F = 8.82416 Signif F = 0.0554

Anlisis de Regresin: ------------------Variables en la


Ecuacin------------------
Variable b sb Beta t Sig t
X1 131.524634 35.804872 0.894739 3.673 0.0349
X2 -5.046605 18.887227 -0.065082 -0.267 0.8066
Constante -20.244119 157.432901 -0.129 0.9058

a) La ecuacin de regresin mltiple es: Y 20.244119 131.524634 X 1 5.046605 X 2

b) Sustituyendo valores en la ecuacin: Y 20.244119 131.524634 4 5.046605 12 $ 445.30