Академический Документы
Профессиональный Документы
Культура Документы
Práctica No. V
Objetivo:
Utilizar un paquete estadístico que permita visualizar la relación que guardan las
variables.
Interpretar el proceso metodológico para la construcción de un modelo de regresión y
correlación lineal múltiple. Manipulará un conjunto de datos con el fin de obtener los
parámetros del modelo, (matriz de covarianza, coeficientes de regresión, coeficiente de
determinación ajustado) analizará, e interpretara la salida de los datos, para hacer
predicciones de sucesos futuros, y tomar decisiones profesionales en el ramo de Gestión
Empresarial.
Introducción:
La regresión es una técnica estadística que se utiliza para resolver problemas comunes
en los negocios, la cual consiste en un método matemático que modela la relación entre
variables, una llamada variable dependiente, la cual suponemos se ve afectada por los
cambios producidos por dos o más variables independientes, y un término aleatorio
(comúnmente llamado error).
En un enfoque sistémico podríamos entender mediante el siguiente dibujo la relación
que guarda la variable respuesta y y la variable o variables de entrada xi
El modelo de regresión lineal múltiple asume que la respuesta y se ve afectada por los
valores de entrada xi, i=1,….k mediante una relación lineal de la forma:
y 0 1x1 2 x2 ..... k xk e
La representación gráfica de este modelo general no sería posible, sólo sería factible
hacer una representación gráfica de un modelo con dos variables predictivas, las cuales
al graficarse en un plano cartesiano describirían un plano, como se muestra en la sig.
gráfica.
e
n
ˆ ,ˆ , ˆ ,.....ˆ k que minimicen el valor de
2
i
Se elegirán aquellos valores de 0 1 2 i , la
suma de los cuadrados de los errores.
ˆ ,ˆ , ˆ ,.....ˆ k resultantes de este procedimiento reciben el
Los estimadores de 0 1 2
nombre de estimadores de mínimos cuadrados.
e
2 2
i
i 1 i 1
Supongamos que n > k observaciones están disponibles. Sea xij la j-ésima observación
de la variable xi , los datos para la regresión lineal múltiple se encuentran en la tabla.
y x1 x2 … xk
y1 x11 x21 … xk1
y2 x12 x22 … xk2
. . .
. . . .
. . . .
yn x1n x2n … xkn
Ajustemos el modelo :
yˆ i ˆ0 ˆ 1 j x1 ˆ2 x2 j ..... ˆk xkj e j
k
yˆ i ˆ0 ˆi xij e j
i 1
ˆ
Al igual que en el caso de regresión lineal simple 0 se define como la ordenada al
origen.
Por la naturaleza de los datos encontraremos k+1 ecuaciones normales de mínimos
cuadrados una para cada coeficiente de regresión desconocido.
Es más sencillo resolver las ecuaciones normales si se expresan en notación matricial.
De tal manera que el modelo en términos de las observaciones es expresado en forma
matricial:
y = Xβ + ε
donde:
Para calcular
2
SS error
2
n k 1
Donde
n
SS error y i yˆ i
2
i 1
en forma matricial
SS error y´ y ´X ´Y
2
n
n
y i
SS Totales S yy yi
2 i 1
i 1 n
Apliquemos lo presentado en un Ejemplo:
39.8
( X ´ X ) X ´ y 3
1
.25
Significancia de la regresión
2
Ejemplo 15-9 Diseño y Análisis de Experimentos Douglas C. Montgomery Ed. Iberoamericana
Instituto Tecnológico de Querétaro
Regresión Lineal Múltiple
M.C. G. Patricia Yscapa Morán
5
MANUAL DE PRÁCTICAS ESTADÍSTICA II
n n n
( yi y ) 2 ( yi y ) 2 ( yi yi ) 2
i 1 i 1 i 1
Recordemos que ahora el modelo contiene varias variables predictoras de ahí que el
planteamiento de la hipótesis alterna sea que al menos una de ellas si le es
significativa a la variable repuesta
ANOVA
Fórmulas conceptuales
Fuente df SS MS F
Regresión k n SS Modelo MS Modelo
( y
i 1
i y)2
k MS Error
Error n-k-1 n SS error
residual (y
i 1
i yi ) 2
n k 1
Total n-1 n
(y
i 1
i y)2
ANOVA
Simplificada
Fuente df SS MS F
Regresión k 1 SS Modelo MS Modelo
̂ T ( x , y ) (i1 y ) 2
n
k MS Error
n
Error n-k-1 SSTotales SS Modelo SS error
residual n k 1
n
Total n-1
n
( yi ) 2
y
i 1
2
i i 1
n
s yy
ANOVA
Fuente df SS MS F P
Regresión 2 130.5 65.25 59.318 0.000329
Error
5 5.5 1.1
residual
Total 7 136
Conclusión Interpretación
Enfrentemos Existe evidencia suficiente para
P vs α decir que al menos una de las
0.000 < 0.02 variables (la temperatura o la
H0 ; 0 presión) le es significativa a el
Como P < α se rechaza i rendimiento.
Análisis de Correlación.
SS Modelo 130.5
De ahí que: r 0.9596
2
SSTotales 136
Cuando existen muchos términos en el modelo es preferible utilizar el coeficiente de
SS Modelo n 1
determinación ajustado r ajust.
2
*
SSTotales ( n k 1)
2
al utilizar r ajust. baja el valor de éste cuando el término que se agrega no aporta algo
al modelo.
En nuestro ejemplo
SS Modelo n 1 130.5 (8 1)
r 2 ajust. * * 0.9434
SSTotales ( n k 1) 136 (8 2 1)
Conclusión Interpretación
r2=0.9434 El 94.34% de la variabilidad total se ve explicada por el
r2=94.34% modelo
Conclusión Interpretación
r = 0.9713
El 97.13% de las variables (x i,y) están relacionadas
r =97.13%
Material y equipo:
Computadora
Excel
Metodología:
7. Una vez activadas todas las casillas descritas da click en Aceptar para visualizar
los resultados obtenidos.
Matriz XPXI1
s MSE
Donde:
n 1
R-Sq (adj)= 1 (1 R 2 )
n k 1
4. Analisis de Varianza
Análisis de varianza
Fuente GL SC CM F P
Regresión 2 130.500 65.250 59.32 0.000
Error residual 5 5.500 1.100 ̂ 2
Total 7 136.000
Esta matriz es conveniente almacenarla para encontrar en forma manual los valores de
los coeficientes de regresión y los errores estándar de cada uno de ellos.
Gráficas
Residual Plots for RIESGO
Normal Probability Plot Versus Fits
99
10
90
Residual
0
Percent
50
-10
10
1 -20
-20 -10 0 10 20 0 15 30 45 60
Residual Fitted Value
6
Frequency
Residual
0
4
-10
2
0 -20
-16 -8 0 8 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30
Residual Observation Order
Cuatro gráficas en una hoja las gráficas muestran si los datos tienen las condiciones para
ser analizados, recuerde que estas condiciones son: NID (0, 2 ) que los errores tengan
comportamiento normal, independientes con media cero y varianza constante.
Normalidad para la población donde son extraídos los datos
Homogeneidad de varianza.
Aleatoriedad en la extracción de la muestra
Sugerencias didácticas:
1. Realizar visitas industriales con el objetivo de consultar casos reales de
aplicación de los conceptos de regresión lineal múltiple en las empresas.
2. Obtener información de la vida real para diseñar, y llevan a cabo la aplicación de
la regresión lineal múltiple.
3. Realizar los ejemplos propuestos del libro en el software Minitab16 y entregar
un reporte escrito según rúbrica.
4. Leer artículos referentes a la aplicación de la regresión lineal múltiple.
5. Al final de la práctica y entrega del reporte que el alumno se autoevalúe
preguntándose algunos aspectos
Aspectos Si No Algo que Aportar Acciones
Soy capaz de
expresar de forma
ordenada y
comprensible todos
los conceptos
anteriores.
Soy capaz de
analizar una
Instituto Tecnológico de Querétaro
Regresión Lineal Múltiple
M.C. G. Patricia Yscapa Morán
18
MANUAL DE PRÁCTICAS ESTADÍSTICA II
regresión lineal
múltiple.
Soy capaz de
utilizar el software
Soy capaz de
trabajar sin
interferir con los
demás.
Soy capaz de
utilizar dar una
opinión de mi
desempeño
honestamente
Bibliografía: