Вы находитесь на странице: 1из 13

REGRESIN MLTIPLE.

Muchos problemas de regresin involucran ms de una variable regresiva, Tales modelos se denominan regresin mltiple. Como ejemplo, suponga que la vida til de una herramienta de corte depende de la velocidad y del Angulo de corte. Un modelo de regresin mltiple que podra describir esta relacin es

y = b0 + b1 x1 + b2 x2 + E Donde y representa la vida de la herramienta, x1 la rapidez de corte y x2 el ngulo de corte. Este es un modelo de regresin mltiple con dos regresores. El trmino lineal se emplea debido a que la ecuacin anterior es la funcin lineal de los parmetros desconocidos b0, b1 y b2. El parmetro b0 define la ordenada al origen del plano. Alguna veces llamamos b1 y b2 coeficientes de regresin parciales, porque b1 mide el cambio esperado en y por un cambio unitario en x1 cuando x2 se mantiene constante, y b2 mide el cambio esperado en y por un cambio unitario en x2 cuando x1 se mantiene constante.

En general, la variable dependiente o respuesta y puede relacionarse con k variables independientes. El modelo y = b0 + b1 x1 + b2 x2 + . + bk xk + E Se denomina modelo de regresin mltiple con k variables independientes.

TERMINOLOGA DE REGRESIN MLTIPLE. Variable de Respuesta (Y, ): El elemento de salida del proceso. Factor o Variable de Prediccin (X): Variable incontrolada o controlada cuya influencia est siendo estudiada Espacio de Inferencia: Rango de operacin de los factores estudiados. Adecuacin: Valor pronosticado de la variable de respuesta, dada una combinacin especfica de configuraciones de los factores Residuales: La diferencia entre un valor adecuado (pronosticado) y un valor experimental real Multicolinearidad: Condicin en la que dos o ms variables predictoras (Variables X) se correlacionan entre s R2: Medida de cunta variacin es explicada por medio de la ecuacin de regresin. Es la suma de los cuadrados del modelo de regresin dividido entre la suma total de cuadrados. Su raz cuadrada es el coeficiente de correlacin r" R2 Ajustado: Un valor ajustado que se usa para comparar los modelos con diferentes nmeros de trminos Estadstica C-p de Mallows: Un parmetro de regresin usado para ayudar a determinar qu modelo de regresin mltiple debe elegirse (se desea baja; Pauta: desea C-p cantidad de trminos en el modelo) VIF: Factor de inflacin de la varianza. Calcula el grado de multicolinearidad Un VIF grande implica que al menos una variable es redundante VIF > 10: alto grado de multicolinearidad - (Ri2 > 9 ) VIF > 5: grado moderado de multicolinearidad (0.8 < Ri2 < 0.9) Pauta: Asegrese de que VIF < 5 cuando sea posible y debe ser <10

EJERCICIOS DE REGRESIN MULTIPLE 1.- Se piensa que la energa elctrica que consume una planta qumica se relaciona con la temperatura ambiental promedio (X1), el nmero de das del mes (X2), la pureza promedio del producto (X3) y las toneladas del producto generadas (X4), se dispone de los datos histricos del ao pasado, mismos que se presentan en la siguiente tabla. Y 240 236 290 274 301 316 300 296 267 276 288 261 X1 25 31 45 60 65 72 80 84 75 60 50 38 X2 24 21 24 25 25 26 25 25 24 25 25 23 X3 91 90 88 87 91 94 87 86 88 91 90 89 X4 100 95 110 88 94 99 97 96 110 105 100 98

A) B) C) D)

Ajuste el modelo de regresin mltiple para estos datos Pruebe la significacin del la regresin Calcule los residuos de ste modelo. Analice los residuos. Verifique la posibilidad de reducir el modelo y obtenga un pronstico del consumo de energa elctrica para una temperatura promedio de 55, 22 das del mes, una pureza promedio del producto de 93 y 107 toneladas del producto generadas. E) Determine seleccin hacia adelanta

2.- Hald informa acerca de los datos relativos al desprendimiento de calor, en caloras por gramo de cemento (Y) para diversas cantidades de ingredientes (X1,X2,X2,X4) , los datos aparecen en la siguiente tabla.

Numero de observacin 1 2 3 4 5 6 7 8 9 10 11 12 13

Y 78.5 74.3 104.3 87.6 95.9 109.2 102.7 72.5 93.1 115.9 83.8 113.3 109.4

X1 7 1 11 11 7 11 3 1 2 21 1 11 10

X2 26 29 56 31 52 55 71 31 54 47 40 66 68

X3 6 15 8 8 6 9 17 22 18 4 23 9 8

X4 60 52 20 47 33 22 6 44 22 26 34 12 12

a) b) c) d) e) f)

Ajuste un modelo de regresin mltiple de stos datos. Pruebe la significacin del modelo Construya los intervalos de confianza correspondientes al 95% Analice lo residuales, Determine seleccin hacia adelanta Pronostique una vez obtenidas las conclusiones de los puntos anteriores el desprendimiento de calor por gramo de cemento si para los ingredientes x1, x2, x3, x4 son 5, 35,12 y 18 respectivamente.

3.- Un embotellador de bebidas gaseosas analiza las rutas de servicio de las mquinas expendidotas en un sistema de distribucin. Le interesa predecir el tiempo necesario para que el representante de ruta atienda las mquinas expendedoras en una tienda. sta actividad de servicio consiste en abastecer las mquinas con productos embotellados y algo de mantenimiento y limpieza. El Ingeniero Industrial responsable del estudio ha sugerido que las dos variables ms importantes que afectan el tiempo de entrega (Y) son la cantidad de cajas de producto abastecido (X1) y la distancia caminada por el representante (X2). El ingeniero ha reunido 25 observaciones de tiempo de entrega que se muestran en la siguiente tabla. Observacin 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 a) b) c) d) e) Tiempo de entrega (min.) (Y) 16.68 11.50 12.03 14.88 13.75 18.11 8.00 17.83 79.24 21.50 40.33 21.00 13.50 19.75 24.00 29.00 15.35 19.00 9.50 35.10 17.90 52.32 18.75 19.83 10.75 Cantidad de cajas (X1) 7 3 3 4 6 7 2 7 30 5 16 10 4 6 9 10 6 7 3 17 10 26 9 8 4 Distancia (pies) X2 560 220 340 80 150 330 110 210 1460 605 688 215 255 462 448 776 200 132 36 740 140 810 450 635 150

Ajuste un modelo de regresin mltiple de stos datos. Pruebe la significacin del modelo Construya los intervalos de confianza correspondientes al 95% Analice lo residuales, Determine seleccin hacia adelante

f) Pronostique una vez obtenidas las conclusiones de los puntos anteriores el tiempo de entrega para una cantidad de cajas de 15 y una distancia de 275 pies.

4.- En el rea de desarrollo de una empresa se pretende obtener un nuevo polmetro de bajo peso molecular (Y1), de lograrse esto, se obtendra un polmetro que funcione como dispersante en la industria de la cermica. De acuerdo a conocimientos tcnicos que se tienen, se considera que los factores crticos son X1: persulfato de sodio (NaPS), X2: cido hipofosforoso (H3PO2) y X3: isopropanol (IPA). Para encontrar las condiciones ptimas se realiz un experimento y se obtuvieron los siguientes datos (los valores de los factores estn codificados). Adems de Y1, se midi la viscosidad (Y2) X1 0 -1 1 -1 1 -1 1 0 -1 1 0 0 0 0 0 X2 0 -1 -1 1 1 0 0 0 0 0 -1 1 -1 1 0 X3 0 0 0 0 0 -1 -1 0 1 1 -1 -1 1 1 0 Y1 8392 9895 9204 7882 7105 8939 4548 8598 9152 8992 10504 7462 9368 7772 8440 Y2 1075 2325 1575 690 420 1188 930 920 1275 860 5600 540 1225 620 1015

a) Ajuste el modelo de regresin mltiple para la variable Y1 b) Ajuste el modelo de regresin mltiple para la variable Y2 c) El modelo explica la variacin observada en Y1? Argumente con base en significancia del modelo, residuales y coeficientes de determinacin.

5.- Suponga que el Gerente de ventas de una gran compaa distribuidora de partes para automviles, desea calcular desde abril las ventas totales de la regin. Segn las ventas regionales, tambin pueden estimarse las ventas totales de la compaa. S, con base en la experiencia, se encuentra que los estimados de abril de las ventas anuales son razonablemente exactos, entonces en aos futuros podra utilizarse el pronstico de abril para revisar los planes de produccin y mantener el inventario correcto en las tiendas al menudeo. Varios factores parecen estar relacionados con las ventas, incluyendo el nmero de tiendas al menudeo en la regin que almacena las partes comercializadas por la compaa, el nmero de automviles registrados en la zona hasta abril 1, y el ingreso personal total para el primer trimestre del ao. Finalmente se seleccionaron cinco variables independientes como las ms importantes (de acuerdo al gerente de ventas). Despus se recopilaron datos para un ao reciente. Tambin se registraron las ventas anuales totales en ese ao segn cada regin. Obsrvese en la tabla anexa que para la regresin 1 se tuvieron 1739 tiendas al menudeo que almacenan las partes de auto de la empresa, que hubo 9 270 000 automviles registrados en la regin hasta el 1 de abril y que las ventas para ese ao fueron por $ 37 702 000 dlares. N de Nmero de automviles Ingreso tiendas de registrados personal menudeo (millones) (mmdd) X3 X1 X2 1739 9.27 85.4 1221 5.86 60.7 1846 8.81 68.1 120 3.81 20.2 1096 10.31 33.8 2290 11.62 95.1 1687 8.96 69.3 241 6.28 16.3 649 7.77 34.9 1427 10.92 15.1 Antigedad promedio N de de los Supervisores autos X5 (aos) X4 3.5 9.0 5.0 5.0 4.4 7.0 4.0 5.0 3.5 7.0 4.1 13.0 4.1 15.0 5.9 11.0 5.5 16.0 4.1 10.0

Ventas anuales Y 37.702 24.196 32.055 3.611 17.625 45.919 29.600 8.114 20.116 12.994

6.- El seor Mike Wilde, es presidente del sindicato de profesores del distrito escolar de Ostego. Al prepararse para futuras negociaciones, al presidente le gustara investigar la estructura de los sueldos de personal docente en el distrito. Considera que existen tres factores que afectan el pago laboral de un profesor: aos de experiencia, una calificacin de la efectividad en la enseanza asignada por el director y si el profesor tiene o no grado de maestra. Una muestra aleatoria de 20 profesores dio como resultado los siguientes datos. Sueldo (mdd) Y 21.1 23.6 19.3 33.0 28.6 35.0 32.0 26.8 38.6 21.7 15.7 20.6 41.8 36.7 28.4 23.6 31.8 20.7 22.8 32.8 Maestra: 1 S 0 No Determine la ecuacin de regresin, Que sueldo estimara usted para un profesor con cinco aos de experiencia, una calificacin de 60 dada por el director y sin maestra. Aos de experiencia X1 8 5 2 15 11 14 9 7 22 3 1 5 23 17 12 14 8 4 2 8 Calificacin de director X2 35 43 51 60 73 80 76 54 55 90 30 44 84 76 68 25 90 62 80 72 Maestra X3 0 0 1 1 0 1 0 1 1 1 0 0 1 0 1 0 1 0 1 0

7.- Un productor de comida para cerdos desea determinar que relacin existe entre la edad de un cerdo cuando comienza a recibir un complemento alimenticio de reciente creacin. El peso inicial del animal y el aumento de peso de un periodo de una semana con el complemento alimenticio. La siguiente informacin es el resultado de un estudio de ocho lechones.
Nmero de lechn 1 2 3 4 5 6 7 8 Peso inicial (lbs) 39 52 49 46 61 35 25 55 Edad inicial (semanas) 8 6 7 12 9 6 7 4 Aumento de peso 7 6 8 10 9 5 3 4

a) calcule la ecuacin que mejor describa estas tres variables b) Cunto podemos esperar que un cerdo aumente de peso en una semana con el complemento alimenticio, si tiene nueve semanas de edad y pesa 48 libras. 8.- Walmart es una de las compaas ms grandes y exitosas de Estados Unidos, con ms de 2,400 tiendas en operacin y ventas anuales por 82 mil millones de dlares. En el inicio la compaa daba una excelente tasa de rendimiento (ROE) a sus accionistas, pero su desempeo en este rubro ha decado. Junto con el crecimiento rpido, la empresa se ha expandido ms all del concepto original de tienda y ahora incluye Sams Club que es una operacin de margen muy bajo con fuerte rotacin de inventario. Los siguientes datos muestran cifras para los anos fiscales que terminan en enero de la fecha mostrada, el inventario, el porcentaje de tiendas que eran Sams Club y ROE
Ao 1985 1986 1987 1989 1990 1991 1992 1993 1994 1995 1996 Inventario miles de millones de dlares 1.2 1.5 2.2 2.8 3.6 4.7 6.2 7.8 9.8 11.5 14.4 Porcentaje Sams Club 1.5 2.6 4.8 7.0 7.7 81 8.6 10.8 12.2 17.7 17.7 ROE (%) 36.7 33.3 35.2 37.1 37.1 35.8 32.6 30.0 28.5 26.6 24.9

Desarrolle una ecuacin de regresin mltiple para pronosticar ROE para Walmart con base en las dos variables dadas. Que consejo dara a los administradores de la empresa para aumentar ROE

9.- La reserva Federal de Estados Unidos realiza un estudio preliminar para determinar la relacin entre ciertos indicadores econmicos y el cambio porcentual anual en el producto interno bruto (PIB), dos de los indicadores examinados son el monto del dficit del gobierno federal (en miles de millones de dlares) y el promedio industrial Dow Jones (el valor medio del ao). Los datos correspondientes a seis aos son: Y Cambio en el PIB 2.5 -1.0 4.0 1.0 1.5 3.0 X1 Dficit federal 100 400 120 200 180 80 X2 Dow Jones 2,850 2,100 3,300 2,400 2,550 2,700

Que porcentaje de cambio en el PIB se esperara en un ao en el cual el dficit federal fue de 240,000 millones de dlares y el promedio Dow Jones fue de 3,000? 10.- Un estudiante graduado que quiere comparar un auto Neptuno usado investig los precios. Piensa que el ao del modelo y el nmero de millas recorridas influyen en el precio de compra. Los datos siguientes corresponden a 10 autos con precio (Y) en miles de dlares, ao (X1) y millas recorridas (X2) en miles. Encuentre la ecuacin y pronostique cuanto pagara si desea comprar un auto Neptuno 1991 con alrededor de 40,000 millas recorridas. Y Precio en miles de dlares 2.99 6.02 8.87 3.92 9.55 9.05 9.37 4.20 4.80 5.74 X1 Ao 1987 1992 1993 1988 1994 1991 1992 1988 1989 1991 X2 Millas en miles 55.6 18.4 21.3 46.9 11.8 36.4 28.2 44.2 34.9 26.4

11.- Una persona est pensando vender su casa. Con el fin de decidir el precio que pedir por ella, ha reunido datos de 12 ventas recientes. Registr el precio de venta ( en miles de dlares) , el nmero de pies cuadrados de construccin (en ciento de pies cuadrados), el nmero de pisos, el nmero de baos y la antigedad de la casa en aos.
Precio de venta 49.65 67.95 81.15 81.60 91.50 95.25 100.35 104.25 112.65 149.70 160.65 232.50 Pies cuadrados 8.9 9.5 12.6 12.9 19.0 17.6 20.0 20.6 20.5 25.1 22.7 40.8 Pisos 1 1 2 2 2 1 2 2 1 2 2 3 Baos 1 1 1.5 1.5 1.0 1.0 1.5 1.5 2.0 2.0 2.0 4.0 Antigedad 2 6 11 8 22 17 12 11 9 8 18 12

Si la casa de sta persona tiene 1, 800 pies cuadrados (18 cientos de pies cuadrados), un piso, 1.5 baos y seis aos de antigedad, que precio de venta puede esperar
12.- Una industria acerera ha estado buscando los factores que influyen en la cantidad de acero (en millones de toneladas) que puede vender cada ao. La administracin sospecha que los siguientes son los factores principales: la tasa anual de inflacin del pas, el precio promedio por tonelada de acero importado que acota los precios (en dlares) y el nmero de automviles ( en millones) que los fabricantes de autos de Estados Unidos planea producir ese ao. Los datos son los siguientes: Y Millones de toneladas vendidas 4.2 3.1 4.0 4.7 4.3 3.7 3.5 X1 Tasa de Inflacin 3.1 3.9 7.5 10.7 15.5 13.0 11.0 X2 Cota de Importaciones 3.10 5.00 2.20 4.50 4.35 2.60 3.05 X3 Nmero de automviles 6.2 5.1 5.7 7.1 6.5 6.1 5.9

Ao 1993 1992 1991 1990 1989 1988 1987

Cuantas toneladas de acero esperar vender la compaa en un ao en el que la tasa de inflacin es de 7.1 los fabricantes de automviles norteamericanos planean producir 6.0 millones de autos y la cota promedio del acero importado por tonelada de $3.50

13.- El gerente de ventas distrital de un importante fabricante de automviles est estudiando las ventas. Especficamente le gustara determinar qu factores afectan el nmero de autos vendidos en una distribuidora. Para investigar, selecciona al azar 12 distribuidores. De ellos obtiene el nmero de vehculos vendidos el ltimo mes, los minutos de publicidad radiofnica comprados en dicho periodo, el nmero de vendedores de tiempo completo empleados en la distribuidora, y si sta se localiza en la ciudad o no. La informacin es la siguiente:
Autos vendidos en el ltimo mes(Y) 127 138 159 144 139 128 161 180 102 163 106 149 Publicidad (X1) 18 15 22 23 17 6 25 26 15 24 18 25 Fuerza ventas (X2) 10 15 14 12 12 12 14 17 7 16 10 11 Ciudad (1:si, 2:no) (X3) 1 2 1 1 2 1 1 1 2 1 2 1

14.- El seor Steve Douglas fue contratado como gerente en entrenamiento por una importante empresa financiera. Como primer proyecto, se le pidi que estudiara la utilidad bruta en la industria qumica. Que factores afectan las utilidades en esa industria? Steve selecciona al azar una muestra de 16 compaas y obtiene datos respecto a la cantidad de empleados, el nmero de dividendos consecutivos pagados de acciones comunes, el valor total de inventario al inicio del presente ao y la ganancia bruta de cada empresa. Sus descubrimientos son:
Compaa 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Ganancia bruta (mmd) (Y) 2800 1300 1230 1600 4500 5700 3150 640 3400 6700 3700 6440 1280 4160 3870 980 Nmero de empleados (X1) 140 65 130 115 390 670 205 40 480 810 120 590 440 280 650 150 Dividendos consecutivos (X2) 12 21 42 80 120 64 43 14 88 98 44 110 38 24 60 24 Inventario inicial (mmd) (X3) 1800 320 820 76 3600 8400 508 870 5500 9875 6500 9130 1200 890 1200 1300

a) Determine la ecuacin de regresin. La Master Chemical Company emplea 220 personas, ha pagado 64 dividendos consecutivos de acciones comunes y tiene un inventario valuado en $ 1 500,000 (dlares) al principio del ao. Cual es la ganancia bruta calculada?