Вы находитесь на странице: 1из 25

Anlisis de regresin lineal

Logro de la sesin

Al finalizar la sesin, el estudiante modela una


variable cuantitativa Y en funcin de otra
variable cuantitativa X para su prediccin,
en problemas aplicados en ingeniera
industrial.
Temario

Anlisis de regresin lineal simple

Predicciones:
Estimacin puntual
Estimacin por intervalo
Se puede estimar la ganancia anual de la
empresa conociendo la inversin en
Investigacin y Desarrollo?

El vicepresidente de
Computadoras S.A,
compaa dedicada a la
fabricacin y venta de
computadores porttiles y de
escritorio, opina que las
ganancias anuales de la
empresa dependen de la
inversin en investigacin y
desarrollo.

Sin embargo, el presidente de


la compaa no est de
acuerdo y ha solicitado
pruebas.
El vicepresidente necesita pruebas respecto a
la relacin entre las ganancias y la inversin
en investigacin y desarrollo

Qu modelo puede presentar el vicepresidente que


sustenten su teora?
Qu variables tendr que medir?
Cul es la ecuacin que ayudar a predecir las
ganancias anuales en funcin de la inversin en
Investigacin y Desarrollo?
Qu precisin se puede esperar al usar este modelo
de toma de decisiones?
Cunto ser la ganancia anual, si se invierte una
cantidad en Investigacin y Desarrollo?
Anlisis de regresin
lineal
Regresin lineal simple

Es el estudio de la relacin lineal existente entre


una variable aleatoria Y, llamada variable
dependiente y otra variable X, llamada variable
independiente o explicativa.
El objetivo principal es estimar Y para un valor
especifico de X.
El modelo de regresin poblacional tiene la
siguiente forma:
Yi 0 1 X i ei i=1, 2, , n

Variable Error ~ NID(0, 2)


dependient Parmetro Variable
e s predictora
(independiente
)
Diagrama de dispersin

Los pares de observaciones


pueden representarse
grficamente en un
diagrama de dispersin o
nube de puntos.
Segn el diagrama de
dispersin se puede
establecer algn tipo de
relacin lineal entre las
variables.
Si el diagrama de
dispersin indica la
existencia de una relacin
de tipo lineal, entonces se
utilizan los datos para
estimar un modelo.
Estimacin de parmetros

El procedimiento matemtico utilizado para el


proceso de estimacin es el de mnimos
cuadrados.
El mtodo consiste en determinar una ecuacin
que ocasione que la suma de los errores al
cuadrado sea mnima.
Los parmetros estimados estn expresados
por: 0 y 1 x

n
n
n

n x y i i x y
i i
1 i 1 i 1 i 1
2
n
n

n x
i 1
2
i xi
i 1
Modelo o ecuacin estimada

Y 0 1 X
Donde:

(0)
Coeficiente de interseccin
Es el valor de Y, cuando x = 0.
Coeficiente de regresin poblacional ( 1 )
estimado
Mide el cambio que se producir en la variable
dependiente Y por un cambio unitario en la
variable X.
1 > 0
La relacin de X e Y puede ser:
1 < 0
Directa: (pendiente positiva)
Inversa: (pendiente negativa)
Supuestos del modelo
Se debe verificar si los
NORMALIDAD DE residuos o errores siguen
LOS RESIDUOS una distribucin normal

H0: Los errores se distribuyen


normalmente
H1: Los errores no se distribuyen
normalmente

Estadstico de prueba: Anderson Darling


Si P-valor > alfa No se rechaza H0
Se cumple el supuesto
Se debe de Normalidad
verificar la no
AUTOCORRELACI de errores.
autocorrelacin de los
N DE LOS
residuos o errores
RESIDUOS
H0: Los errores no estn
0 1 3 4
autocorrelacionados
No hay Autocorrelaci
Autocorrelaci
n positiva Autocorrelaci n negativa H1: Los errores estn
n
1 DW 3 autocorrelacionados

Estadstico de prueba: Durbin Watson


Si 1 DW 3 No se rechaza H0
Validacin del modelo lineal
Hiptesis:
H0 : 1 0 (No existe relacin lineal entre
H1 : 1 0 X e Y)
(Existe relacin lineal entre X e
Y)
Estadstico de prueba:
Fuentes
Grados
de Suma de Cuadrado F
de
variaci cuadrados medio calculado
libertad
n
Regresi 1 SCR CMR (1) Fc = (1)/(2)
n
Error n2 SCE = SCT - CME (2)
SCR
Total n1 SCT
Supuestos: Normalidad en los residuos y No
autocorrelacin de los residuos.
Decisin: Si P-valor , se rechaza Ho Donde:
SCR: Suma de cuadrado
regresin
SCE: Suma de cuadrado error
Ajuste del modelo
Coeficiente Medida de bondad de ajuste
de Mide la proporcin de la variabilidad total
de Y que es explicada por X a travs del
determinaci
modelo de regresin lineal simple.
n
R2 SCR
R2 siendo : 0 R 2 1
SCT

Coeficiente Expresa la proporcin de la variabilidad de


de no Y que no es explicada por el modelo de
determinaci regresin lineal simple.
n SCR
1-R2 1 R2 1
SCT
Mide la asociacin lineal entre Y y X.
El coeficiente de correlacin toma valores
Coeficiente entre -1 y 1
de r = -1 -> Asociacin perfecta
correlacin inversa
R r = 0 -> No hay Asociacin
Donde: r = 1 -> Asociacin perfecta directa
SCR: Suma de cuadrado
regresin
SCT: Suma de cuadrado total
Prediccin por intervalo

Intervalo de 1 ( x0 x ) 2
confianza para el IC ( yi ) y i t ( / 2,GLE ) Se
n SCX
valor medio

Intervalo de
1 ( x0 x ) 2
confianza para el IC (Yi ) y i t ( / 2,GLE ) Se 1
n SCX
valor individual

0 0 1x0
y Se CME

Donde: GLE:
error Grado de libertad del
Se: Desviacin estndar del
error X0: Valor de la variable X
CME: Cuadrado medio del (dato)
error : Valor de la media de X
t: Distribucin T-Student n: Tamao de la muestra
SCX: Suma de cuadrado de X : Nivel de significacin
Ejemplo de Aplicacin
El vicepresidente de la empresa Computadoras S.A con el objetivo
de probar que existe relacin lineal entre las ganancias anuales y la
inversin en investigacin y desarrollo (ID) en miles de dlares, ha
obtenido la siguiente informacin mensual:
Ganancia
20 25 34 30 33 34 36 35 40 37 41 20
anual (Y)
Inversin en
2 4 5 4 6 5 5 7 8 7 8 2
ID (X)

A un nivel de significacin del 5%.


1) Verifique si se cumplen los supuestos.
2) Valide el modelo.
3) Presente el modelo estimado e interprete los coeficientes
estimados.
4) Determine la varianza total de la variable dependiente explicada a
travs del modelo.
5) Estime la ganancia anual, si se invierten $ 20 000 en ID.
6) Estime e interprete, con un nivel de confianza del 95%, la ganancia
anual si se invierten $ 32 000 en ID.
7) Estime e interprete, con un nivel de confianza del 95%, la ganancia
Solucin
1) Verifique si cumplen los supuestos
NORMALIDAD DE LOS
ERRORES
H 0: Los errores se distribuyen normalmente
H1: Los errores no se distribuyen normalmente

Estadstico de prueba: AD=0.471


Probabilidad: P-valor = 0.200 > 0.05
Decisin: No se rechaza H0
Conclusin: A un nivel de significacin del 5%, los errores se distribuyen
normalmente.
Se cumple el supuesto de Normalidad de errores.
Solucin
1) Verifique los supuestos
AUTOCORRELACIN DE
ERRORES
H : Los errores no estn autocorrelacionados
0
H1: Los errores estn autocorrelacionados

Estadstico de prueba: DW=1.97971


Decisin: No se rechaza H0
Conclusin: A un nivel de significacin del 5%, los errores no estn
autocorrelacionados.
Se cumple el supuesto de No autocorrelacin
de errores.

Estadstico de Durbin-Watson = 1.97971


Solucin
2) Valide el modelo
HIPTESIS:
Ho: 1 = 0 No existe relacin lineal entre la inversin en ID, y la ganancia
anual
Nivel
H1: 1de
0significacin: 0.05
Existe relacin lineal entre la inversin en ID, y la ganancia anual
Anlisis de regresin: Ganancia anual Inversin en ID
Anlisis de Varianza

Fuente GL SC Ajust. MC Ajust. Valor F Valor p


Regresin 1 478.41 478.412 71.94 0.000
Inversin en ID 1 478.41 478.412 71.94 0.000
Error 10 66.50 6.650
Falta de ajuste 4 48.84 12.209 4.15 0.060
Error puro 6 17.67 2.944
Total 11 544.92

Estadstico de prueba: F=71.94


P-valor: 0.000
Decisin: Se rechaza H0
Conclusin: Con un nivel de significancia del 5%, existe relacin lineal
entre la ganancia anual y la inversin en investigacin y desarrollo.
Solucin
3) Presente el modelo estimado e interprete los
coeficientes estimados
Coeficientes
EE del
Trmino Coef coef. Valor T Valor p VIF
Constante 15.20 2.13 7.15 0.000
Inversin en ID 3.216 0.379 8.48 0.000 1.00

Ecuacin de regresin
Y = 15.20 + 3.216 X

4) Determine la varianza total de la variable


dependiente explicada a travs del modelo

Resumen del modelo


R-cuad. R-cuad.
S R-cuad. (ajustado) (pred)
2.57885 87.80% 86.58% 83.95%

El 87.8% de la variabilidad de la ganancia es explicada por la


inversin en investigacin y desarrollo.
Solucin
5) Estime la ganancia anual, si se invierten $ 20 000 en
ID
Prediction for Ganancia anual
Valor de
Variable configuracin
Inversin en ID 20

EE de
Ajuste ajuste IC de 95% IP de 95%
79.5225 5.64254 (66.9502, 92.0949) (65.6993, 93.3457)

6) Estime e interprete, con un nivel de confianza del


95%, la ganancia anual si se invierten $ 32 000 en ID
Prediction for Ganancia anual
Valor de
Variable configuracin
Inversin en ID 32

EE de
Ajuste ajuste IC de 95% IP de 95%
118.117 10.1709 (95.4549, 140.779) (94.7378, 141.496)


Solucin
7) Estime e interprete, con un nivel de confianza del
95%, la ganancia promedio anual si se invierten $ 30
000 en ID

Prediction for Y = Ganancia anual

Valor de
Variable configuracin
Inversin en ID 30

EE de
Ajuste ajuste IC de 95% IP de 95%
111.685 9.41471 (90.7074, 132.662) (89.9347, 133.435) XX

A un nivel de confianza del 95%, se estima que el intervalo 90.7074


;132.662] contiene a la ganancia promedio anual, si se invierte 30
mil dlares en ID
Se prueba los supuestos del modelo

Se valida el modelo estimado

Se realiza la prediccin puntual o por


intervalo de confianza
Indique V o F segn corresponda en los
siguientes enunciados:
1. Uno de los supuestos de un modelo de regresin es que V
no exista autocorrelacin de los errores.

2. El coeficiente de no determinacin expresa la V


proporcin de variabilidad explicada con el modelo de
regresin.

3. A travs del modelo de regresin se pueden realizar V


estimaciones futuras respecto a la variable
independiente.
Bibliografa
Montgomery,D y Runger,G (2006) Probabilidad y
Estadstica aplicadas a la Ingeniera. MxicoDF, Ed.
LIMUSA, SA de CV Grupo Noriega de editores
Material producido por la Universidad Peruana de Ciencias
Aplicadas
Campomanes, Fanny ; Luna, Walter
Autor:
COPYRIGHT UPC 2016 - Todos los derechos
reservados.

Вам также может понравиться