Вы находитесь на странице: 1из 11

REGRESION LINEAL MULTIPLE

El Analisis de Regresin Lineal Mltiple permite establecer la relacin que se produce entre
una variable dependiente Y y un conjunto de variable independientes (X1, X2, , Xn). El
analisis de regresion lineal multiple, a diferencia del simple, se aproxima ms a situaciones
de anlisis real puesto que los fenmenos, hechos y procesos sociales, por definicin, son
complejos y, en consecuencia, deben ser explicados en la medida de lo posible por la serie
de variables que, directa o indirectamente, participan en su concrecin. (Mora & Rodriguez,
2003, p. 130)

1. EXPLICACION TEORICA DEL MODELO

1.1 Modelo general


Segn Suriach, Clar & del Barrio (2002) para explicar el Modelo de Regresin Lineal
Mltiple (MRLM) se deben considerar dos caractersticas importantes
1) Al tratarse de un MRLM se supone que el comportamiento de una determinada
variable, que se denomina variable endgena o variable dependiente y que se
representa con la letra Y, es causado y, por tanto, puede ser explicado adecuadamente,
por un conjunto de n variables que denominaremos explicativas (independientes o
exgenas) y que, en general, se representan mediante la letra X. Es decir:

Y = (X1, X2, X3,..., Xn).

2) La segunda caracterstica del modelo de regresin a considerar se refiere a la


linealidad. Esto quiere decir que la relacin que hipotticamente existe entre la
variable endgena y las k explicativas es de tipo lineal; por lo tanto, se puede expresar
la variable dependiente como combinacin lineal de las variables explicativas. Aunque
no es estrictamente necesario, normalmente se especifica el MRLM incluyendo en las
variables explicativas un trmino independiente. As, a menudo se considera que la
variable X1 es una constante igual a la unidad:

X1 = 1.
Por lo tanto, el MRLM queda del modo siguiente:

= + 11 + 22 + +

Siendo:

Y: la variable independiente o respuesta.

X1, X2Xn: son las variables explicativas, independientes o factores.

, , . . : son parmetros que miden la influencia que las variables


explicativas tienen sobre la variable respuesta, pero hay una regla donde o es la
interseccin constante, las mayores a 1, ( > 0) sern los parmetros respectivos a
cada variable independiente.

n: es el nmero de parmetros independientes a tener en cuenta en la regresin.

: perturbacin aleatoria.

En el anlisis de regresion lineal multiple la construccion de su correspondiente


ecuacion se realiza seleccionando las variables una a una, paso a paso. La finalidad
perseguida es buscar de entre todas las posibles variables explicativas aquellas que
mas y mejor expliquen a la variable dependiente sin que ninguna de ellas sea
combinacin lineal de las restantes. Este procedimiento implica que: (1) En cada paso
solo se introduce aquella variable que cumple unos criterios de entrada; (2) Una vez
introducida, en cada paso se valora si alguna de las variable cumplen criterios de
salida; y (3) En cada paso se valora la bondad de ajuste de los datos al modelo de
regresin lineal y se calculan los parmetros del modelo de regresin lineal y se
calculan los parmetros del modelo verificado en dicho paso.
El proceso se inicia sin ninguna variable independiente en la ecuacin de regresin y
el proceso concluye cuando no queda ninguna variable fuera de la ecuacin que
satisfaga el criterio de seleccin (garantiza que las variables seleccionadas son
significativas) y/o el criterio de eliminacin (garantiza que una variable seleccionada
no es redundante).
I. Verificacin de los criterios de probabilidad de entrada: El p-valor asociado
al estadistico T, o probabilidad de entrada, nos indica si la informacion
proporcionada por cada una de las variables es redundante. Si ste es menor que
un determinado valor crtico, la variable ser seleccionada. El SPSS por defecto
establece en 0.05 el valor crtico de la probabilidad de entrada.
El criterio de tolerancia puede ser aplicado como un criterio adicional a la
probabilidad de entrada. ste ayuda a identificar si alguna de las variables del
modelo es una combinacin lineal de las restantes.Si dicho valor es prximo a
0, la variable analizada ser una combinacin lienal de las restantes variable
independientes introducidas. Si el valor de tolerancia se aproxima a 1 puede
redudir la parate de la variabilidad de Y no explicada por las restantes. En
sntesis, si la tolerancia para una variable es muy pequea se excluir del modelo.

II. Verificacin del criterio de probabilidad de salida: Si el p-valor asociado al


estadistico T, o probabilidad de salida, es mayor que un determinado valor
crtico, la variable ser eliminada. El SPSS por defecto establece en 0.1 el valor
crtico de la probabilidad de salida.

III. Lmite al nmero de pasos: Para evitar que el proceso de seleccin se convierta
en un proceso cclico se debe establecer un nmero limite de pasos.
Normalmente este lmite es el que equivale al doble del nmero de variables
independientes

IV. Caractersticas estadsticas:

NORMALIDAD: Para cada valor de X, Y es una variable aleatoria con


distribucin Normal con media x.
HOMOSCEDASTICIDAD: Todas las distribuciones poblacionales
tienen la misma varianza.
LINEALIDAD: Las medias x de las distintas poblaciones estn
relacionadas linealmente con X.

Aplicaciones fundamentales en la Ingenieria Industrial

Una de las aplicaciones mas importantes en el dia a dia de un ingeniero industrial, son
los pronosticos, debido a que estos son empleados tanto en la industria como en la vida
cotidiana, la regresion lineal, permite terner una vision de comportamiento de la
situacion. Dichos pronosticos son aplicados en una empresa por el ingeniero industrial
en reas como:

Financiera y contable
Produccion
Ventas
Marketing
Procesos industriales
Implentacion de sistemas informaticos.

En tanto al diseo experimental, con la metodologa 2k es posible mejorar procesos


mediante la realizacin de experimentos, determinando qu variables tienen un efecto
significativo. A partir de esas variables se obtiene una recta de regresin que modeliza
el efecto. Por ejemplo se podra obtener la relacin entre la temperatura y la presin
en un proceso industrial.

Dichos campos de aplicacin, nos permiten concluir que la regresin lineal esta
aplicada a todo el entorno en el cual vivimos, desde la resistencia del cemento y el
comportamiento financiero de una planta, hasta la produccin mundial de petrleo y
la recesin de 24 nebulosas.

1.2 Coeficientes beta


El coeficiente Beta es el coeficiente de regresin estandarizado. Expresa la pendiente de
la recta de regresin en el caso de que todas la variables estn transformadas en
puntuaciones Z.

a. Procedimiento directo.
, se define del modo
La contribucin media de una variable que tiene media
siguiente:

=

El coeficiente beta asociado a una variable se define as:


=
= , , ,

donde y son las desviaciones tpicas de e Y, respectivamente.

Alternativa de obtencion de los coeficientes beta


Otro modo de obtener los coeficientes beta consiste en transformar previamente el
modelo, dividiendo todas las variables por su desviacin tpica correspondiente, y
estimar el modelo transformado.
= 1 1 + 2 2 + 3 3 + + + + + = 1 ,

1 2 3
= 1 + 2 + 3 + + + + + = 1 .
1 2 3

De hecho, el clculo de los coeficientes beta no es ms que un cambio de escala de las


variables del modelo. Este cambio es til en casos aplicados.

b. Calcularlos en el spss
c. Significancia respecto a los Xj
Si tras haber realizado el contraste se tiene que rechazar la hiptesis nula, esto
significar que, en la poblacin, el parmetro j es significativamente distinto de cero
y, por tanto, la variable que se le asocia es estadsticamente relevante a la hora de
explicar la evolucin de la variable endgena. En caso contrario, el parmetro j no
es significativamente distinto de cero y, en consecuencia, la variable explicativa que
lo acompaa no tiene un efecto estadsticamente significativo.

1.3 Intervalos de confianza para j


El calculo de intervalos de confianza para la estimacion de parametros son tecnicas que
nos permiten hacer declaraciones sobre que valores podemos esperar para un parametro.
El intervalo calculado dependera de:
Lo estimado en la muestra(porcentaje, media,), el intervalo de confianza esta
formado por valores ligeramente menores y mayores que la aproximacion
ofrecida por la muestra.
El tamao muestral, cuantos mas datos hayan participado en el calculo, mas
pequeo esperamos que sea la diferencia entre el valor estimado y el valor real
desconocido.
La probabilidad(nivel de confianza), con la que el metodo dara una respuesta
correcta. Niveles de confianza habituales para los intervalos de confianza son el
95% y 99%.

1.4 Qu significa o?

1.5 Qu se entiende por variables de ruido?

Las variables de ruido son variables que no se pueden controlar durante la operacin
normal del proceso.

1.6 Coeficiente de determinacin

En estadstica, el coeficiente de determinacin, denominado R y pronunciado R


cuadrado, es un estadstico usado en el contexto de un modelo estadstico cuyo principal
propsito es predecir futuros resultados o probar una hiptesis. El coeficiente determina
la calidad del modelo para replicar los resultados, y la proporcin de variacin de los
resultados que puede explicarse por el modelo.

En el caso de regresin lineal, el R es simplemente el cuadrado del coeficiente de


correlacin de Pearson, lo cual es slo cierto para la regresin lineal simple. Si existen
varios resultados para una nica variable, es decir, para una X existe una Y, Z... el
coeficiente de determinacin resulta del cuadrado del coeficiente de determinacin
mltiple. En ambos casos el R adquiere valores entre 0 y 1. Existen casos dentro de la
definicin computacional de R donde este valor puede tomar valores negativos.

1.7 Coeficiente de correlacin de Pearson:

El coeficiente de correlacin de Pearson es una medida de la relacin lineal entre dos


variables aleatorias cuantitativas. A diferencia de la covarianza, la correlacin de Pearson
es independiente de la escala de medida de las variables.
De manera menos formal, podemos definir el coeficiente de correlacin de Pearson como
un ndice que puede utilizarse para medir el grado de relacin de dos variables siempre y
cuando ambas sean cuantitativas.

Interpretacin

El valor del ndice de correlacin vara en el intervalo [-1,1], indicando el signo el


sentido de la relacin:
Si r = 1, existe una correlacin positiva perfecta. El ndice indica una dependencia
total entre las dos variables denominada relacin directa: cuando una de ellas
aumenta, la otra tambin lo hace en proporcin constante.
Si 0 < r < 1, existe una correlacin positiva.
Si r = 0, no existe relacin lineal. Pero esto no necesariamente implica que las
variables son independientes: pueden existir todava relaciones no lineales entre las
dos variables.
Si -1 < r < 0, existe una correlacin negativa.
Si r = -1, existe una correlacin negativa perfecta. El ndice indica una dependencia
total entre las dos variables llamada relacin inversa: cuando una de ellas aumenta, la
otra disminuye en proporcin constante.
APLICACIN DE UN MODELO DE REGRESION LINEAL MULTIPLE

DEFINICION DEL PROBLEMA

La empresa trancem S.A.S. (transportadora de cemento) es una empresa filial de Holcim


(Colombia) S.A, que presta el servicio de carga de cemento y los materiales desde y hacia la
planta de Nobsa. Esta operacin la cumple en alianza estratgica con 50 transportadores que
disponen de 250 vehculos para cubrir rutas a nivel nacional. La gestin de Trancem se ha
enfocado en desarrollar prcticas orientadas a ofrecer un servicio de calidad, definido por la
puntualidad de entrega, la frecuencia la actitud de servicio y la responsabilidad ambiental.

Teniendo en cuenta lo anterior la empresa desea optimizar el consumo de gasolina diaria en


sus vehculos, para esto se realiz un anlisis concluyendo que los factores que ms inciden
en el consumo de gasolina son:

- El nmero de horas-maquina trabajadas durante el da.

- La distancia recorrida por los transportes realizados durante el da (en kilmetros).

- El rendimiento promedio de los motores (en horas/litro).

- Peso transportado durante el da (en toneladas).

- Temperatura promedio del da (en C).

Consumo Nmero de Rendimiento


Distancia de Peso Temperatura
diario de horas- promedio
transporte transportado promedio
gasolina maquina motores
320 20 630 2.4 48.25 22
200 10 398 4 48.05 19
785 50 1395 1.8 48.65 25
376 22 720 2.6 48.34 27
2405 120 4230 0.6 50.24 31
893 40 1752 0.1 49.24 18
1930 93 4000 0.05 50.13 23
8010 380 15780 0.01 52.1 27
1540 75 3080 0.04 49.75 17

Вам также может понравиться