Вы находитесь на странице: 1из 17

MODELO DE REGRESION MULTIPLE

En un modelo de regresin, al utilizar ms de una variable explicativa es posible incrementar el poder explicativo y la utilidad del modelo en la toma de muchas decisiones de negocio

MODELO DE REGRESION LINEAL


El Modelo de regresin mltiple incorpora dos o ms variables independientes .el modelo de regresin mltiple con k variables independientes se expresa como:

El modelo de regresin kXk +


En donde: ! son los coe"icientes de regresin y ! es el termino de error aleatorio.

Y= 0 + 1X1 + 2X2 + +

mltiple

#e estima el modelo utilizando los datos muestrales as$:

El modelo de

= b0 + b1X1 + b2X2 ++ bkXk regresin mltiple

En donde: %! es el valor estimado para la variable dependiente b! son los estimados para los coe"icientes poblacionales

&os b se denominan coe"icientes parciales o netos de regresin y tienen la misma interpretacin 'ue en la regresin simple .(or tanto b , es la cantidad por la cual ) cambiar si * cambia en una unidad, asumiendo 'ue todas las otras variables independientes se mantienen constantes. Esta suposicin no "ue necesaria ba+o la

regresin simple por'ue no hab$a otras variables independientes para mantener constantes. &a regresin mltiple implica los mismos supuestos 'ue para la regresin lineal simple, ms otros dos. El primer supuesto re'uiere 'ue el nmero de observaciones n, exceda el nmero de variables independientes ,, en por lo menos -. En la regresin mltiple hay k./ parmetros por estimar: los coe"icientes para las variables independientes k ms el termino del intercepto. (or tanto los grados de libertad, n debe exceder a k en par lo menos -, de manera 'ue n01k./2 es por lo menos /. El segundo supuesto involucra la relacin entre las variables independientes. 3e'uiere 'ue ninguna de las variables independientes este linealmente relacionada. (or e+emplo, si * !*.*, 4 'uizs * !5.6* , entonces una relacin lineal existir$a entre dos o ms variables independientes y surgir$a un problema grave.

EVALUACION DEL MODELO


7espu8s de haber estimado el modelo, es necesario evaluarlo para determinar si proporciona un a+uste y explicacin satis"actorios para los datos 'ue se han recolectado. Existen varias pruebas 'ue pueden practicarse para tomar esta decisin. A. EL ERROR ESTANDAR DE ESTIMACION

9l igual 'ue la regresin simple, el error estndar de estimacin puede utilizarse como medida de bondad de a+uste. :ienen la misma interpretacin 'ue con la regresin simple. Mide los grados de dispersin de los valores ) alrededor del plano de regresin. ;laro 'ue entre menos de dispersin se presente, ms pe'ue<o ser el #e y ms preciso ser en su prediccin y pronostico

El error estndar de estimacin

En donde: n0k0/! es el nmero de grados de libertad

k! es el nmero de variables a la derecha =1)0%2> ! suma de los errores elevada al cuadrado

B. COEFICIENTE DE DETERMINACION MULTIPLE 9l igual 'ue con la regresin mltiple, el coe"iciente de determinacin mltiple se utiliza como una medida de bondad de a+uste. 4tra similitud entre el modelo simple y un modelo 'ue contiene dos o ms variables explicativas es la interpretacin del coe"iciente de determinacin. En ambos casos la porcin del cambio en ) se explica mediante todas las variables independientes en el modelo. El coe!iciente de determinacin es el "#e mide la !#er$a de la relacin entre Y % las &ariables independientes (ara medir dicha porcin del cambio total de ), explicada por el modelo de regresin, se utiliza la relacin de la variacin explicada con la variacin total, de la misma manera como se hizo en el caso de la regresin simple. &a variacin se entiende como la variacin en los valores ) observados 1) 2 de su medida 12. &a variacin en ), 'ue se explica mediante el modelo, se re"le+a por la suma de los cuadrados de la regresin 1#;32. &a variacin total en ) es a su vez medida por la suma total de cuadrados 1#;:2. (or tanto,

oe!iciente de determinacin mltiple

7ebido a 'ue #;:!#;3 .#;E, tambi8n se tiene:

C. COEFICIENTE DE DETERMINACION CORREGIDO ?n modelo de esta naturaleza puede parecer 'ue se a+usta muy bien a los datos, pero producir resultados in"ortunados en todo intento por predecir o pronosticar el valor de la variable independiente. (or consiguiente es una prctica comn en regresin mltipley correlacin reportar el coe"iciente de determinacin corregido. 3epresentado con el s$mbolo > .Este estad$stico se a+usta a la medida del poder explicativo para el nmero de grados de libertad. 7ebido a 'ue el grado de libertad para #;E es n0k0/, agregar otra variable explicativa termina en la perdida de otro grado de libertad. > decrecer si se adiciona una variable 'ue no o"rece su"iciente poder explicativo como para +usti"icar su perdida en los grados de libertad. #i se reduce demasiado se debe considerar su retiro. El coe"iciente de determinacin corregido se obtiene dividiendo #;E )#;: por sus respectivos grados de libertad.

oe!iciente de determinacin mltiple corregido

?na "rmula ms conveniente es:

oe!iciente de determinacin corregido

'

mltiple

D. EVALUACION DEL MODELO COMO UN TODO 7ado el modelo de regresin, una de las primeras preguntas 'ue se plantean es:@ A:iene algn valor explicativoB@ Esto puede responderse me+or realizando el anlisis de varianza 19C4D92. El procedimiento del 9C4D9 prueba si alguna de las variables independientes tiene una relacin con la variable dependiente. #i una variable independiente no est relacionada con la variable relacionada con , entonces de 'ue todos los valores es cero. Es decir , su coe"iciente deber$a ser cero. Es decir, si no est

. El procedimiento 9C4D9 prueba la hiptesis nula no

son cero contra la alternativa de 'ue por lo menos un

#i no se rechaza la hiptesis nula, entonces no hay relacin lineal entre

y cual'uiera

de las variables independientes. (or otra parte, la hiptesis nula se rechaza, entonces por lo menos una variable independiente est relacionada linealmente con . El proceso 9C4D9, necesario para probar la hiptesis nula. #e establece una tabla 9C4D9 y se utiliza la prueba E. &a tabla proporciona el "ormato general para una tabla 9C4D9 para la regresin mltiple. (abla )*+,) -enerali$ada. /#ente &ariacin de 0#ma de -rados c#adrados libertad 0 3 4 de #adrado medio ,alor /

Entre m#estras 1tratamiento2

5entro de las m#estras 0 E 1error2 ,ariacin total 0 (

n6k61

n61

E. PRUEBAS INDIVIDUALES PARA LOS COEFICIENTES DE REGRESIN PARCIAL El siguiente paso lgico es probar cada coe"iciente individualmente para determinar cul es 1cuales son2 signi"icante1s2. (rimero se prueba la publicidad. El proceso es id8ntico a la regresin simple:

En donde

! es el coe"iciente de regresin poblacional para la publicidad. estandar con grados de libertad.

#e utiliza la prueba

7r#eba de 8iptesis para la signi!icancia del coe!iciente de regresin parcial

En donde

=es el error estndar del coe!iciente de regresin9

EJEMPLO 1
Muchos programas de estudios pre m8dicos usan los promedios de las cali"icaciones del M;9: de los estudiantes egresados como un indicador de la calidad de sus programas. &as variables 'ue se sabe in"luencian esos promedios del M;9:1 y) son: la combinacin de las cali"icaciones del #9: en matemticas y en oratoria 1 x12 y el F(9 (x2) de los prospectos a m8dicos. &a tabla muestra las medidas de x1, x2y y de seis estudiantes 'ue han cursado un programa de pre medicina y 'ue han presentado el M;9:
Estudiante 1 2 " % & ( Calificacin SAT (X1) 12!! 1"&! 1!!! 12&! 1%2& 1"%! GPA (X2) "#$ "#% 2#' "#" "#' "#1 Calificacin promedio del MCAT ( ) 12#% 1"#" '#2 1!#( 1"#2 11#2

;on esta in"ormacin podemos encontrar una ecuacin lineal 'ue nos permita predecir el promedio de cali"icaciones del M;9: para un estudiante si se conocen su F(9 y su cali"icacin combinada del #9:.
= b0 + b1 x1 + b2 x 2 . Es &a ecuacin lineal para los datos del e+emplo tiene la "orma y posible encontrar los valores de b5, b/, y b- usando el m8todo de m$nimos cuadrados, al igual 'ue en el m8todo de regresin lineal simple. El m8todo en este caso re'uiere resolver tres ecuaciones lineales con tres incgnitas, estas ecuaciones, conocidas como ecuaciones normales, son:

y = nb
1

+ b1 ( x1 ) + b2 ( x 2 )
0 1 1 2 1 2 2 2

x y = b ( x ) + b ( x ) + b ( x )

y = b0 ( x 2 ) + b1 ( x1 x 2 ) + b2

( x )
2 2

:a sig#iente tabla organi$a los clc#los para obtener las ec#aciones.


X1 12!! 1"&! 1!!! 12&! 1%2& 1"%! *&(& X2 "#$ "#% 2#' "#" "#' "#1 2!#% 12#% 1"#" '#2 1!#( 1"#2 11#2 ('#' X1)2 1%%!!!! 1$22&!! 1!!!!!! 1&(2&!! 2!"!(2& 1*'&(!! '(&122& X2)2 1%#%% 11#&( $#%1 1!#$' 1&#21 '#(1 *!#12 X1X2 %&(! %&'! 2'!! %12& &&&*#& %1&% 2&$$(#& X1 1%$$! 1*'&& '2!! 1"2&! 1$$1! 1&!!$ $'1!" X2 %*#12 %&#22 2(#($ "%#'$ &1#%$ "%#*2 2%!#2

:as ec#aciones normales para este e;emplo son.


69.9 = 6b0 + 7,565b1 + 20.4b2 89,103 = 7565b0 + 9,651,225b1 + 25,886.5b2 240.2 = 20.4b0 + 25,886.5b1 + 70.12b2

3esol&iendo el sistema de ec#aciones lineales obtenemos. b5 ! 0-.6GH, b/!5.556I-6, b- ! -./J/. :a ec#acin de regresin es.
y = 2.537 + 0.005425 x1 + 2.161x 2

0#ma de c#adrados

&a suma total de cuadrados ##:, se descompone en dos componentes: suma de cuadrados para la regresin, y suma de cuadrados del error. ##: ! ##3 . ##E &a suma de cuadrados para la regresin es a'uella parte de la suma total de cuadrados 'ue se atribuye a las variables independientes. Mientras 'ue la suma de cuadrados del error es a'uella porcin de la suma de cuadrados total y 'ue no se debe a las variables independientes, por ello se llama suma de cuadrados del error.
SST = ( y y ) = 12.9950
2

(y y SSE = ) = 2.2403
2

SSR = SST SSE = 10.7547

-rados de libertad para la regresin.


glT = gl R + gl E glT = n 1 gl R = k gl E = n ( k + 1)

7onde: k ! nmero de variables independiente lc#lo de c#adrados medios.


MSR = SSR 10.7547 = = 5.3773 gl R 2 SSE 2.2403 = = 0.7468 gl E 3

MSE =

7onde: M#3! ;uadrado medio de la regresin M#E! ;uadrado medio del error. 7r#eba de 8iptesis (ara determinar si el modelo lineal describe adecuadamente los datos, se usa la prueba E. (ara los datos del e+emplo las hiptesis son:

H 0 : 1 = 2 = 0

H1 : 1 0 o 2 0

El valor del estad$stico E se encuentra dividiendo M#3 entre M#E.


F = MSR 5.3773 = = 7.20 MSE 0.7468

Kuscando el valor cr$tico para F (1, n 2) = F0.05 (1,4) !H.H/. ;omo H.H/ L H.-5 no podemos rechazar M 5, lo cual nos indica 'ue podr$a ser arriesgado utilizar la ecuacin de regresin con propsitos predictivos. oe!iciente de determinacin mltiple
R2 = SSR SST

R2 =

10.7547 = 0.8276 82.8% 12.995

Esto signi"ica 'ue aproximadamente el NGO de la variacin en el promedio de las cali"icaciones se atribuye a la variacin de las variables independientes y solamente el /HO de la variacin de la variable dependiente no se atribuye a eso.

EJEMPLO 2
El gerente de ventas de la distribucin P 5eli&er%< realiza un estudio del sistema de reparto de sus periodos considerando las variables. Y. tiempo en minutos 'ue demora la empresa del periodo. X1. peso en kg. de los periodos. X2: distancia recorrida en km. #u ob+etivo es determinar una relacin lineal para predecir el tiempo de reparto de un pedido utilizando la in"ormacin proporcionada por el peso del pedido y la distancia de la entrega. (ara esto, selecciono una muestra al azar de /5 repartos observando los siguientes resultados. ) */ *G5 /H -N /5 H -6 Q J -G H J -5 J 6 /N J 6 /6 6 I /6 G I /G G /5 -

;alcula la recta de regresin lineal mltiple

C!/5

Cotacin de matrices

#;:! #;E . #;3

/=E*(E 5E 0=@) 5E -3)5+0 5E @E5>) ,)3>)?>:>5) =)53)5+0 :>?E3()5 =)53A(> ) 5 3E-3E0>C* 3E-3E0>C* E33+3 (+(): I5NG5I 6Q-/ I/I--6 H Q -5I,/65,N6N

3)BC* / -GH,QGQ

EXPERIMENTOS FACTORIALES
El dise<o experimental es una t8cnica estad$stica 'ue permite identi"icar y cuanti"icar las causas de un e"ecto dentro de un estudio experimental. En un dise<o experimental se manipulan deliberadamente una o ms variables, vinculadas a las causas, para medir el e"ecto 'ue tienen en otra variable de inter8s. El dise<o experimental prescribe una serie de pautas relativas 'u8 variables hay 'ue manipular, de 'u8 manera, cuntas veces hay 'ue repetir el experimento y en 'u8 orden para poder establecer con un grado de con"ianza prede"inido la necesidad de una presunta relacin de causa0e"ecto. El dise<o experimental encuentra aplicaciones en la industria, la agricultura, la mercadotecnia, la medicina, la ecolog$a, las ciencias de la conducta, etc. constituyendo una "ase esencial en el desarrollo de un estudio experimental.

&as tres razones principales para realizar Experimento Eactorial son: /.0 (ara obtener in"ormacin de los e"ectos medios de todos los "actores de un experimento simple de tama<o moderado. -.0 (ara ampliar la base de las in"erencias de un "actor para probarlo ba+o condiciones variadas de otros. G.0(ara evaluar la manera en interactan con cada uno. ()?:) )*+,) @+5E:+ 5E E/E (+0 />D+0 E?EC:E D93R9;RSC 9 K RC:E39;;R4C E3343 :4:9& la cuallos e"ectos de 7)3) 2 los /) (+3E0 "actores

7E #?M9 7E F3974# 7E ;?973974# ;?973974# &RKE3:97 ME7R4# ##9 ##K ##9K ##E ##: 9T/ KT/ 190/2 NK0/2 9K 1C0/2 9KC0/ M#9 M#K M#9K M#E

E4 M#9UM#E M#KUM#E M#9KUM# E

EJEMPLO
&a salida mxima de volta+e de un tipo particular de bater$a, se piensa 'ue puede ser in"luenciado por el material usado en los platos y por la temperatura en la localizacin en la cual la bater$a es colocada. #e hacen cuatro replicas en el experimento en un experimento "actorial, para tres tipos de temperatura y tres materiales. &os resultados son: E9;:43 :EM(E39:?39 1K2

/ /G5 HI E9;:43 192 M9:E3R9& G /65 /6Q /GN /JN /HGN

/66 /N5 /NN /-J //5 /J5

G5 N5 /GJ /5J /HI /65 /-Q/

I5 H6 /-//6 /-5 /GQ

-5 N-6 6N QJ NHH5

H5 6N H5 I6 /5I J5

QQN

/G55

/65/

GHQQ

n!I

(rimero se hace la suma de los cuadrados de todas las muestras, menos la suma del total de renglones y columnas, entre la multiplicacin de renglones de columnas V W de muestras a!G b!G

7espu8s se hace la suma de los totales al cuadrado del "actor, a:

9hora se hace la suma de los totales al cuadrado del "actor, b:

9hora sumamos las cuatro muestras de cada combinacin y las evaluamos igual. eso es la suma de cuadrados de la interseccin ab e+emplo: /G5./66.HI./N5 !6GQ

##9K!

QJ/G.HH

(or ltimo la sumatoria de los cuadrados de los errores

#e deben sacar los cuadrados medios de los dos "actores as$ como de la interaccin y errores de la siguiente manera:

#e hace una prueba de "actores E:

#e hace pruebas para cada uno de los "actores y la interseccin.

9l menos una de las

no es igual a cero Q6O

Xuedando la tabla 9C4D9 de la siguiente manera: 5E 0=@) 5E -3)5+0 =)53)5+0 :>?E3()5 10EFG9H2 2 5E =)59 @E5>+0 IGJ19FE /+ H9K1 G9GI 2F9KH G9GI G9IE 29HG L

/=E*(E0 ,)3>) >C* (>7+ 5E @)(9

(E@7E3)(=3)

GK11F9H2

1KIIK9GE

E33+3 (+():

Dolta+e (romedio 1#alida2

>(E3)

>+*

KE1G9HH 1F2G09HI HHEJE9KE

J 2H GI

2J0G9JJ EHI921

/H6 /65

&a gr"ica del tipo de material 0 temperatura es la siguiente:


Material /-6 /55 H6 65 -6

Material G

Material /

65

J6

N5

El material tipo - se comporta ms estable. 7a me+or volta+e a las di"erentes temperaturas. ;onclusiones: a. &os datos re"le+an evidencias su"icientes 'ue el tipo de material se a"ecta al volta+e de salida, considerado al nivel de signi"icancia del 6O b. &os datos presentan evidencias su"icientes 'ue las temperaturas usada 06 en el experimentos si a"ectan al volta+e de salida, considerando un nivel de signi"icancia del 6O c. &os datos demuestran evidencias su"icientes ove el tipo de material usado y las temperaturas consideradas en el experimento tienen e"ecto con+unto sobre el volta+e de salida considerado k un nivel de signi"icancia del 6O

Вам также может понравиться