Академический Документы
Профессиональный Документы
Культура Документы
En un modelo de regresin, al utilizar ms de una variable explicativa es posible incrementar el poder explicativo y la utilidad del modelo en la toma de muchas decisiones de negocio
Y= 0 + 1X1 + 2X2 + +
mltiple
El modelo de
En donde: %! es el valor estimado para la variable dependiente b! son los estimados para los coe"icientes poblacionales
&os b se denominan coe"icientes parciales o netos de regresin y tienen la misma interpretacin 'ue en la regresin simple .(or tanto b , es la cantidad por la cual ) cambiar si * cambia en una unidad, asumiendo 'ue todas las otras variables independientes se mantienen constantes. Esta suposicin no "ue necesaria ba+o la
regresin simple por'ue no hab$a otras variables independientes para mantener constantes. &a regresin mltiple implica los mismos supuestos 'ue para la regresin lineal simple, ms otros dos. El primer supuesto re'uiere 'ue el nmero de observaciones n, exceda el nmero de variables independientes ,, en por lo menos -. En la regresin mltiple hay k./ parmetros por estimar: los coe"icientes para las variables independientes k ms el termino del intercepto. (or tanto los grados de libertad, n debe exceder a k en par lo menos -, de manera 'ue n01k./2 es por lo menos /. El segundo supuesto involucra la relacin entre las variables independientes. 3e'uiere 'ue ninguna de las variables independientes este linealmente relacionada. (or e+emplo, si * !*.*, 4 'uizs * !5.6* , entonces una relacin lineal existir$a entre dos o ms variables independientes y surgir$a un problema grave.
9l igual 'ue la regresin simple, el error estndar de estimacin puede utilizarse como medida de bondad de a+uste. :ienen la misma interpretacin 'ue con la regresin simple. Mide los grados de dispersin de los valores ) alrededor del plano de regresin. ;laro 'ue entre menos de dispersin se presente, ms pe'ue<o ser el #e y ms preciso ser en su prediccin y pronostico
B. COEFICIENTE DE DETERMINACION MULTIPLE 9l igual 'ue con la regresin mltiple, el coe"iciente de determinacin mltiple se utiliza como una medida de bondad de a+uste. 4tra similitud entre el modelo simple y un modelo 'ue contiene dos o ms variables explicativas es la interpretacin del coe"iciente de determinacin. En ambos casos la porcin del cambio en ) se explica mediante todas las variables independientes en el modelo. El coe!iciente de determinacin es el "#e mide la !#er$a de la relacin entre Y % las &ariables independientes (ara medir dicha porcin del cambio total de ), explicada por el modelo de regresin, se utiliza la relacin de la variacin explicada con la variacin total, de la misma manera como se hizo en el caso de la regresin simple. &a variacin se entiende como la variacin en los valores ) observados 1) 2 de su medida 12. &a variacin en ), 'ue se explica mediante el modelo, se re"le+a por la suma de los cuadrados de la regresin 1#;32. &a variacin total en ) es a su vez medida por la suma total de cuadrados 1#;:2. (or tanto,
C. COEFICIENTE DE DETERMINACION CORREGIDO ?n modelo de esta naturaleza puede parecer 'ue se a+usta muy bien a los datos, pero producir resultados in"ortunados en todo intento por predecir o pronosticar el valor de la variable independiente. (or consiguiente es una prctica comn en regresin mltipley correlacin reportar el coe"iciente de determinacin corregido. 3epresentado con el s$mbolo > .Este estad$stico se a+usta a la medida del poder explicativo para el nmero de grados de libertad. 7ebido a 'ue el grado de libertad para #;E es n0k0/, agregar otra variable explicativa termina en la perdida de otro grado de libertad. > decrecer si se adiciona una variable 'ue no o"rece su"iciente poder explicativo como para +usti"icar su perdida en los grados de libertad. #i se reduce demasiado se debe considerar su retiro. El coe"iciente de determinacin corregido se obtiene dividiendo #;E )#;: por sus respectivos grados de libertad.
'
mltiple
D. EVALUACION DEL MODELO COMO UN TODO 7ado el modelo de regresin, una de las primeras preguntas 'ue se plantean es:@ A:iene algn valor explicativoB@ Esto puede responderse me+or realizando el anlisis de varianza 19C4D92. El procedimiento del 9C4D9 prueba si alguna de las variables independientes tiene una relacin con la variable dependiente. #i una variable independiente no est relacionada con la variable relacionada con , entonces de 'ue todos los valores es cero. Es decir , su coe"iciente deber$a ser cero. Es decir, si no est
y cual'uiera
de las variables independientes. (or otra parte, la hiptesis nula se rechaza, entonces por lo menos una variable independiente est relacionada linealmente con . El proceso 9C4D9, necesario para probar la hiptesis nula. #e establece una tabla 9C4D9 y se utiliza la prueba E. &a tabla proporciona el "ormato general para una tabla 9C4D9 para la regresin mltiple. (abla )*+,) -enerali$ada. /#ente &ariacin de 0#ma de -rados c#adrados libertad 0 3 4 de #adrado medio ,alor /
n6k61
n61
E. PRUEBAS INDIVIDUALES PARA LOS COEFICIENTES DE REGRESIN PARCIAL El siguiente paso lgico es probar cada coe"iciente individualmente para determinar cul es 1cuales son2 signi"icante1s2. (rimero se prueba la publicidad. El proceso es id8ntico a la regresin simple:
En donde
#e utiliza la prueba
En donde
EJEMPLO 1
Muchos programas de estudios pre m8dicos usan los promedios de las cali"icaciones del M;9: de los estudiantes egresados como un indicador de la calidad de sus programas. &as variables 'ue se sabe in"luencian esos promedios del M;9:1 y) son: la combinacin de las cali"icaciones del #9: en matemticas y en oratoria 1 x12 y el F(9 (x2) de los prospectos a m8dicos. &a tabla muestra las medidas de x1, x2y y de seis estudiantes 'ue han cursado un programa de pre medicina y 'ue han presentado el M;9:
Estudiante 1 2 " % & ( Calificacin SAT (X1) 12!! 1"&! 1!!! 12&! 1%2& 1"%! GPA (X2) "#$ "#% 2#' "#" "#' "#1 Calificacin promedio del MCAT ( ) 12#% 1"#" '#2 1!#( 1"#2 11#2
;on esta in"ormacin podemos encontrar una ecuacin lineal 'ue nos permita predecir el promedio de cali"icaciones del M;9: para un estudiante si se conocen su F(9 y su cali"icacin combinada del #9:.
= b0 + b1 x1 + b2 x 2 . Es &a ecuacin lineal para los datos del e+emplo tiene la "orma y posible encontrar los valores de b5, b/, y b- usando el m8todo de m$nimos cuadrados, al igual 'ue en el m8todo de regresin lineal simple. El m8todo en este caso re'uiere resolver tres ecuaciones lineales con tres incgnitas, estas ecuaciones, conocidas como ecuaciones normales, son:
y = nb
1
+ b1 ( x1 ) + b2 ( x 2 )
0 1 1 2 1 2 2 2
x y = b ( x ) + b ( x ) + b ( x )
y = b0 ( x 2 ) + b1 ( x1 x 2 ) + b2
( x )
2 2
3esol&iendo el sistema de ec#aciones lineales obtenemos. b5 ! 0-.6GH, b/!5.556I-6, b- ! -./J/. :a ec#acin de regresin es.
y = 2.537 + 0.005425 x1 + 2.161x 2
0#ma de c#adrados
&a suma total de cuadrados ##:, se descompone en dos componentes: suma de cuadrados para la regresin, y suma de cuadrados del error. ##: ! ##3 . ##E &a suma de cuadrados para la regresin es a'uella parte de la suma total de cuadrados 'ue se atribuye a las variables independientes. Mientras 'ue la suma de cuadrados del error es a'uella porcin de la suma de cuadrados total y 'ue no se debe a las variables independientes, por ello se llama suma de cuadrados del error.
SST = ( y y ) = 12.9950
2
(y y SSE = ) = 2.2403
2
MSE =
7onde: M#3! ;uadrado medio de la regresin M#E! ;uadrado medio del error. 7r#eba de 8iptesis (ara determinar si el modelo lineal describe adecuadamente los datos, se usa la prueba E. (ara los datos del e+emplo las hiptesis son:
H 0 : 1 = 2 = 0
H1 : 1 0 o 2 0
Kuscando el valor cr$tico para F (1, n 2) = F0.05 (1,4) !H.H/. ;omo H.H/ L H.-5 no podemos rechazar M 5, lo cual nos indica 'ue podr$a ser arriesgado utilizar la ecuacin de regresin con propsitos predictivos. oe!iciente de determinacin mltiple
R2 = SSR SST
R2 =
Esto signi"ica 'ue aproximadamente el NGO de la variacin en el promedio de las cali"icaciones se atribuye a la variacin de las variables independientes y solamente el /HO de la variacin de la variable dependiente no se atribuye a eso.
EJEMPLO 2
El gerente de ventas de la distribucin P 5eli&er%< realiza un estudio del sistema de reparto de sus periodos considerando las variables. Y. tiempo en minutos 'ue demora la empresa del periodo. X1. peso en kg. de los periodos. X2: distancia recorrida en km. #u ob+etivo es determinar una relacin lineal para predecir el tiempo de reparto de un pedido utilizando la in"ormacin proporcionada por el peso del pedido y la distancia de la entrega. (ara esto, selecciono una muestra al azar de /5 repartos observando los siguientes resultados. ) */ *G5 /H -N /5 H -6 Q J -G H J -5 J 6 /N J 6 /6 6 I /6 G I /G G /5 -
C!/5
Cotacin de matrices
/=E*(E 5E 0=@) 5E -3)5+0 5E @E5>) ,)3>)?>:>5) =)53)5+0 :>?E3()5 =)53A(> ) 5 3E-3E0>C* 3E-3E0>C* E33+3 (+(): I5NG5I 6Q-/ I/I--6 H Q -5I,/65,N6N
3)BC* / -GH,QGQ
EXPERIMENTOS FACTORIALES
El dise<o experimental es una t8cnica estad$stica 'ue permite identi"icar y cuanti"icar las causas de un e"ecto dentro de un estudio experimental. En un dise<o experimental se manipulan deliberadamente una o ms variables, vinculadas a las causas, para medir el e"ecto 'ue tienen en otra variable de inter8s. El dise<o experimental prescribe una serie de pautas relativas 'u8 variables hay 'ue manipular, de 'u8 manera, cuntas veces hay 'ue repetir el experimento y en 'u8 orden para poder establecer con un grado de con"ianza prede"inido la necesidad de una presunta relacin de causa0e"ecto. El dise<o experimental encuentra aplicaciones en la industria, la agricultura, la mercadotecnia, la medicina, la ecolog$a, las ciencias de la conducta, etc. constituyendo una "ase esencial en el desarrollo de un estudio experimental.
&as tres razones principales para realizar Experimento Eactorial son: /.0 (ara obtener in"ormacin de los e"ectos medios de todos los "actores de un experimento simple de tama<o moderado. -.0 (ara ampliar la base de las in"erencias de un "actor para probarlo ba+o condiciones variadas de otros. G.0(ara evaluar la manera en interactan con cada uno. ()?:) )*+,) @+5E:+ 5E E/E (+0 />D+0 E?EC:E D93R9;RSC 9 K RC:E39;;R4C E3343 :4:9& la cuallos e"ectos de 7)3) 2 los /) (+3E0 "actores
7E #?M9 7E F3974# 7E ;?973974# ;?973974# &RKE3:97 ME7R4# ##9 ##K ##9K ##E ##: 9T/ KT/ 190/2 NK0/2 9K 1C0/2 9KC0/ M#9 M#K M#9K M#E
EJEMPLO
&a salida mxima de volta+e de un tipo particular de bater$a, se piensa 'ue puede ser in"luenciado por el material usado en los platos y por la temperatura en la localizacin en la cual la bater$a es colocada. #e hacen cuatro replicas en el experimento en un experimento "actorial, para tres tipos de temperatura y tres materiales. &os resultados son: E9;:43 :EM(E39:?39 1K2
-5 N-6 6N QJ NHH5
H5 6N H5 I6 /5I J5
QQN
/G55
/65/
GHQQ
n!I
(rimero se hace la suma de los cuadrados de todas las muestras, menos la suma del total de renglones y columnas, entre la multiplicacin de renglones de columnas V W de muestras a!G b!G
9hora sumamos las cuatro muestras de cada combinacin y las evaluamos igual. eso es la suma de cuadrados de la interseccin ab e+emplo: /G5./66.HI./N5 !6GQ
##9K!
QJ/G.HH
#e deben sacar los cuadrados medios de los dos "actores as$ como de la interaccin y errores de la siguiente manera:
Xuedando la tabla 9C4D9 de la siguiente manera: 5E 0=@) 5E -3)5+0 =)53)5+0 :>?E3()5 10EFG9H2 2 5E =)59 @E5>+0 IGJ19FE /+ H9K1 G9GI 2F9KH G9GI G9IE 29HG L
(E@7E3)(=3)
GK11F9H2
1KIIK9GE
E33+3 (+():
>(E3)
>+*
J 2H GI
2J0G9JJ EHI921
/H6 /65
Material G
Material /
65
J6
N5
El material tipo - se comporta ms estable. 7a me+or volta+e a las di"erentes temperaturas. ;onclusiones: a. &os datos re"le+an evidencias su"icientes 'ue el tipo de material se a"ecta al volta+e de salida, considerado al nivel de signi"icancia del 6O b. &os datos presentan evidencias su"icientes 'ue las temperaturas usada 06 en el experimentos si a"ectan al volta+e de salida, considerando un nivel de signi"icancia del 6O c. &os datos demuestran evidencias su"icientes ove el tipo de material usado y las temperaturas consideradas en el experimento tienen e"ecto con+unto sobre el volta+e de salida considerado k un nivel de signi"icancia del 6O