Вы находитесь на странице: 1из 10

Estadistica Industrial 9/10/2017

Cuando se tiene dos variables. La ecuacin se


representa de la siguiente forma:
ESTADSTICA INDUSTRIAL Y = b 0 + b 1 X 1 + b 2 X 2
REGRESIN MLTIPLE : Valor estimado correspondiente a la variable
Y dependiente
Donde:
MG. ROSMERI MAYTA H X1 y X2: variables independientes
bo: es la intercepcin con el eje Y
2017 b1: es el cambio neto en Y por cada cambio unitario en X1,
manteniendo X2 constante. Se denomina coeficiente de
regresin neta .
b2: Coeficiente de regresin

9/10/2017 Rosmeri Mayta H. 1 9/10/2017 Rosmeri Mayta H. 4


Estadistica Industrial Estadistica Industrial

Visualizacin: se puede representar una


OBJETIVOS ecuacin de regresin mltiple con dos
variables, como un plano
Escribir la relacin entre 2 o ms variables
independientes y una dependiente utilizando la ecuacin
de regresin mltiple.
Calcular e interpretar el error estndar mltiple de
estimacin y el coeficiente de determinacin.
Interpretar la matriz de correlacin.
Realizar el cuadro de ANOVA y explicarlo.
Realizar la prueba de hiptesis para determinar si los
coeficientes de regresin son diferentes de cero (prueba
global).
Realizar una prueba de hiptesis para cada uno de los
coeficientes de regresin
9/10/2017 Rosmeri Mayta H. 2 9/10/2017 Rosmeri Mayta H. 5
Estadistica Industrial Estadistica Industrial

Ecuacin General de Regresin


REGRESIN MLTIPLE
Mltiple
La regresin mltiple y el anlisis de
correlacin mltiple consiste en estimar una
variable dependiente, utilizando dos o ms Y = a + b1 X 1 + b2 X 2 + b3 X 3 .........bk X k
variables independientes.
Donde:
El modelo genrico ser X1, X2, X3...Xk: Variables independientes

Y = f ( X 1 , X 2 , X 3 ,....)
Variable Variables
dependiente independientes
9/10/2017 Rosmeri Mayta H. 3 9/10/2017 Rosmeri Mayta H. 6
Estadistica Industrial Estadistica Industrial

Mg. Rosmeri Mayta H. 1


Estadistica Industrial 9/10/2017

MTODO DE MNIMOS CUADRADOS Anlisis de correlacin mltiple

Para calcular los coeficientes, se utiliza el Se utilizan los tres coeficientes


mtodo de Mnimos cuadrados, este mtodo Coeficientes de correlacin Mltiple
nos garantiza que la suma de cuadrados de los
errores sea mnimo. Las ecuaciones normales Coeficiente de determinacin Mltiple
son: Coeficiente de no determinacin
Y = nb 0 + b1 X1 + b 2 X 2 Coeficiente de correlacin mltiple:
X1Y = b 0 X1 + b1 X12 + b 2 X1X 2 Es la medida de la fuerza de asociacin
X 2 Y = b 0 X 2 + b1 X1 X 2 + b 2 X 22 entre la variable dependiente y dos o mas
Donde bo, b1 y b2 son los coeficientes de regresin variables independientes
estimados.
9/10/2017 Rosmeri Mayta H.
Estadistica Industrial
7 9/10/2017 Rosmeri Mayta H.
Estadistica Industrial
10

Error estndar mltiple


El error estndar de estimacin en el anlisis de
regresin mltiple mide el error para los valores de Y Sus valores varan de 0 a 1 siempre es es
con respecto al plano de regresin ( cuando positivo
intervienen 2 variables independendientes).
0.95: indica una asociacin muy fuerte
entre las variables dependientes e
(Y Y )
2

SY .12...k = independientes.
n (k + 1)
Donde: 0.08: Indica una relacin muy dbil
Y: es la observacin
: es el valor estimado a partir de la ecuacin de regresin
n: nmero de observaciones.
9/10/2017 Rosmeri Mayta H. 8 9/10/2017 Rosmeri Mayta H. 11
K: nmero de variables independientes
Estadistica Industrial Estadistica Industrial

Consideraciones acerca de la regresin y la


COEFICIENTE DE DETERMINACIN
correlacin mltiples
Es la proporcin ( porcentaje) de la
Las variables independientes y las variables dependientes tienen
una relacin lineal. variacin total en la variable dependiente
y que se explica por medio del conjunto de
La variacin en la diferencia entre los valores real y pronosticado es
la misma para todos los valores ajustados de Y. Esto es (Y-Y) debe variables independientes. .R2
ser aproximadamente igual para todos los valores de Y. Cuando tal
sea el caso, las diferencias presentan homoscedastidad. COEFICIENTE DE LA NO DETERMINACIN:

Los residuos, calculados de Y-Y, estn distribuidos en forma Mide la proporcin de la variacin total en
normal con media igual a 0.
la variable dependiente y, que no se debe
Las observaciones sucesivas de la variable dependiente no estn
correlacionadas. Si tal consideracin no se cumple, la situacin se
a las variables independientes. Se obtiene
denomina auto correlacin. Tal auto correlacin ocurre con
frecuencia cuando se recopilan datos sucesivamente en intervalos
1-.R2
de tiempo.

9/10/2017 Rosmeri Mayta H. 9 9/10/2017 Rosmeri Mayta H. 12


Estadistica Industrial Estadistica Industrial

Mg. Rosmeri Mayta H. 2


Estadistica Industrial 9/10/2017

PRUEBA GLOBAL Tabla ANOVA

Se usa para poner a prueba la capacidad de las FV GL SS MS F

variables independientes, para explicar el Regressions k SSR MSR=SSR/K MSR/MSE


comportamiento de la variable dependiente Y.
Procedimiento Error n-(k+1) SSE MSE=SSE/(n-(k+1))
1)
Ho: 1=2=3........k Total n-1 SST

Ha: No todas las son iguales a cero.


Donde : 1,2,3,....,k = coeficientes de Suma de cuadrado total: SS total =
regresin neta en la poblacin. Suma de cuadrado del error SSE = (Y Y')
2

2) Nivel de significancia Suma de cuadrado debido a la regresion: SSR = SS total - SSE


3) Se utiliza el estadstica F
9/10/2017 Rosmeri Mayta H. 13 9/10/2017 Rosmeri Mayta H. 16
Estadistica Industrial Estadistica Industrial

Coeficiente de Determinacin (r2)

Del cuadro de Anova se obtiene


SSR Si Fk es > Ft, entonces se rechaza la
R 2 Y 12 = hiptesis nula y se acepta la alternativa
TotalSS

9/10/2017 Rosmeri Mayta H. 14 9/10/2017 Rosmeri Mayta H. 17


Estadistica Industrial Estadistica Industrial

PRUEBA DE HIPTESIS INDIVIDUAL PARA


CADA UNO DE LOS COEFICIENTES
4.-Definir la regin de aceptacin y critica
el F (,k, n-k-1) (tablas)
Se usa para probar las variables individualmente para
determinar cuales coeficientes de regresin podran ser
cero y cuales no.
Si una es cero, esto implica que tal variable
independiente en particular, no es de ningn valor para
explicar cualquier variacin en el valor dependiente.
1) Plantear la hiptesis
Para: Variable 1 Variable 2 ..... Variable k
Ho: 1=0 Ho: 2=0 Ho: k=0
Ha: 10 Ha: 20 Ha: k0

9/10/2017 Rosmeri Mayta H. 15 9/10/2017 Rosmeri Mayta H. 18


Estadistica Industrial Estadistica Industrial

Mg. Rosmeri Mayta H. 3


Estadistica Industrial 9/10/2017

ESTIMACIN DEL INTERVALO DE


CONFIANZA
2) Definir el nivel de significancia Es la estimacin del valor de poblacin de
3) El estadstico a utilizar es t un coeficiente de regresin. El anlisis de
4)Definir la R.A y R,C regresin se puede obtener una
estimacin de intervalo de confianza
Calcular el t cal y el t (, n-k-1) (tablas)
: el nivel de significancia
K: Numero de variables independientes
.n : Tamao de la muestra

9/10/2017 Rosmeri Mayta H. 19 9/10/2017 Rosmeri Mayta H. 22


Estadistica Industrial Estadistica Industrial

Estimacin de intervalo para los


coeficientes de regresin parcial
5) Calcular el valor de t para cada uno de
los coeficientes
Tk =( b1-1) / Sb1
Tk =( b2-2) / Sb2
bk tnp1Sbk
Tk =( b3-3) / Sb3
Si el Tk es > Tt, entonces se rechaza la
hiptesis nula ( se realiza para cada uno
de los coeficientes) y se acepta la
alternativa
9/10/2017 Rosmeri Mayta H. 20 9/10/2017 Rosmeri Mayta H. 23
Estadistica Industrial Estadistica Industrial

Si el Tk es > Tt, entonces se rechaza la K: Indica la variable independiente


hiptesis nula ( se realiza para cada uno correspondiente.
de los coeficientes) y se acepta la P: Numero de variables independientes
alternativa Sbk: es el error estndar de la variable
independiente k

9/10/2017 Rosmeri Mayta H. 21 9/10/2017 Rosmeri Mayta H. 24


Estadistica Industrial Estadistica Industrial

Mg. Rosmeri Mayta H. 4


Estadistica Industrial 9/10/2017

PROBLEMA
La empresa Saisberry Realty vende casas en la costa de Estados Unidos.
Una de las preguntas que los posibles compradores hacen con mas Source DF Seq SS
frecuencia es: Si adquirimos este inmueble Cuanto tendramos que pagar Temperat 1 140215
por su calefaccin durante el invierno?. Se ha pedido al departamento de Aislamie 1 24980
investigacin de la compaa que elabore algunos lineamientos con Numero_v 1 48
respecto a costos de calefaccin para casas unifamiliares. Se considero Antigu_c 1 5985
que cuatro variables estn relacionadas con tales costos: (1) la temperatura
Unusual Observations
exterior media diaria,(2) el numero de pulgadas de aislamiento trmico en
Obs Temperat costo_ca Fit StDev Fit Residual St Resid
el desvn ,( 3) numero de ventanas y (4) la antigedad del calefactor. Para
2 29.0 360.0 294.0 44.4 66.0 2.32R
investigar dicho departamento selecciono una muestra aleatoria de 20
inmuebles vendidos recientemente. Luego determin el costo de calentar R denotes an observation with a large standardized residual
una casa en enero pasado, y tambin la temperatura externa durante dicho
mes en la regin, el nmero de pulgadas de aislante en el desvn, y la
antigedad del sistema calorfico. La informacin muestral se encuentra en
la siguiente tabla.

9/10/2017 Rosmeri Mayta H. 25 9/10/2017 Rosmeri Mayta H. 28


Estadistica Industrial Estadistica Industrial

Numero de

a. Calcular la ecuacin de regresin


Temperatura Aislamiento Antigedad
Costo de Calef Exterior media En el desvn ventanas Del calefactor
CASAS (en dlares) F (pulgadas (aos)

mtiple
1 250 35 3 10 6
2 360 29 4 1 10
3 165 36 7 9 3
8

b.-Interprete los coeficientes de regresin


4 43 60 6 9
5 92 65 5 8 6
6 200 30 5 9 5
7 355 10 6 14 7

8 290 7 10
9
10 c. Calcular e interprete los coeficientes de
11

determinacin y no determinacin
9 230 21 9 11
10 120 55 2 9 5
11 73 54 12 11 4
12 205 48 5 10 1
13
14
400
320
20
39
5
4
12
10
15
7 d. Realizar la prueba de hiptesis global e
8

individual.
15 72 60 8 6
16 272 20 5 10 8
17 94 58 7 10 3
18 190 40 8 11 11
19 235 27 9 14 8
20 139 30 7 9 5

9/10/2017 Rosmeri Mayta H. 26 9/10/2017 Rosmeri Mayta H. 29


Estadistica Industrial Estadistica Industrial

Regression Analysis

The regression equation is


costo_calef_Y = 425 - 4.57 Temperatura_x1 - 14.9 Aislamiento_desvan_X2

MODELO CURVILINEO
+ 0.24 Numero_vent.x3 + 6.13 Antigu_calefac_x4

Predictor Coef StDev T P


Constant 424.74 79.23 5.36 0.000
Temperat -4.5719 0.8272 -5.53 0.000
Aislamie -14.906 5.140 -2.90 0.011
Numero_v 0.244 4.953 0.05 0.961
Antigu_c 6.126 4.175 1.47 0.163

S = 52.72 R-Sq = 80.4% R-Sq(adj) = 75.2%

Analysis of Variance

Source DF SS MS F P
Regression 4 171227 42807 15.40 0.000
Residual Error 15 41689 2779
Total 19 212916
9/10/2017 Rosmeri Mayta H. 27 9/10/2017 Rosmeri Mayta H. 30
Estadistica Industrial Estadistica Industrial

Mg. Rosmeri Mayta H. 5


Estadistica Industrial 9/10/2017

MODELO DE REGRESIN CURVILNEO MODELO CENTRADO


Una de las relaciones no lineales ms Un planteamiento alternativo al modelo de regresin
comunes es la relacin polinomial curvilneo consiste en centrar los datos mediante la
curvilnea entre dos variables en la que Y sustraccin de la media de la variable explicativa de
cada valor del modelo. Este modelo de regresin
aumenta (o disminuye) con una rapidez centrada se presenta en la ecuacin.
variable para diferentes valores de X. Este
modelo da una relacin polinomial entre X
Yi = b'0 +b'1 ( X 1i X 1 ) + b11 (X 1i X 1 )
2
e Y puede expresarse como

9/10/2017 Rosmeri Mayta H. 31 9/10/2017 Rosmeri Mayta H. 34


Estadistica Industrial Estadistica Industrial

PRUEBA DE SIGNIFICANCIA DEL


MODELO CURVILINEO
.Prueba global
1) Plantear la hiptesis
Yi = 0 +1X1i +11X21i +i Ho: 1=0 Ho: 11=0
Ha: No todos los beta son iguales a
cero
2) Definir el nivel de significancia
3) El estadstico a utilizar es F
Calcular el valor de F
9/10/2017 Rosmeri Mayta H. 32 9/10/2017 Rosmeri Mayta H. 35
Estadistica Industrial Estadistica Industrial

0 = Interseccin Y 4)Calcular el F cal y el F (,k, n-k-1) (tablas)


1 = Efecto lineal en Y : el nivel de significancia. k= 2
11= Efecto curvilneo en Y K: Numero de variables independientes
i= Error aleatorio en Y para la .n : Tamao de la muestra
observacin 5) Si el Fcal es > Ft, entonces se rechaza la
hiptesis nula

9/10/2017 Rosmeri Mayta H. 33 9/10/2017 Rosmeri Mayta H. 36


Estadistica Industrial Estadistica Industrial

Mg. Rosmeri Mayta H. 6


Estadistica Industrial 9/10/2017

5)
5) Calcular el valor de t para cada uno de
los coeficientes
Tk =( b11-11) / Sb11

Si el Tcal es > Tt, entonces se rechaza la


hiptesis nula ( se realiza para cada uno
de los coeficientes) y se acepta la
alternativa

9/10/2017 Rosmeri Mayta H. 37 9/10/2017 Rosmeri Mayta H. 40


Estadistica Industrial Estadistica Industrial

PRUEBA DE HIPTESIS PARA PROBAR PRUEBA DE HIPTESIS PARA PROBAR


EL EFECTO CURVILINEO EL EFECTO LINEAL

1) Plantear la hiptesis 1) Plantear la hiptesis


Para: Variable 1 Variable 2 ..... Para: Variable 1 Variable 2 .....
Variable k Variable k
Ho: 11=0 (La inclusin del efecto curvilineo no mejora Ho: 1=0 (La inclusin del efecto lineal no mejora de
de forma significativa el modelo forma significativa el modelo
Ha: 110 (La inclusin del efecto curvilineo mejora de Ha: 10 (La inclusin del efecto lineal mejora de forma
forma significativa el modelo significativa el modelo

9/10/2017 Rosmeri Mayta H. 38 9/10/2017 Rosmeri Mayta H. 41


Estadistica Industrial Estadistica Industrial

2) Definir el nivel de significancia 2) Definir el nivel de significancia


3) El estadstico a utilizar es t 3) El estadstico a utilizar es t
Calcular el valor de t para cada uno de los
4)Calcular el t cal y el t (, n-k-1) (tablas dos coeficientes
colas) Tk =( b1-1) / Sb1
: el nivel de significancia k=2
K: Numero de variables independientes
.n : Tamao de la muestra
9/10/2017 Rosmeri Mayta H. 39 9/10/2017 Rosmeri Mayta H. 42
Estadistica Industrial Estadistica Industrial

Mg. Rosmeri Mayta H. 7


Estadistica Industrial 9/10/2017

Calcular el t cal y el t (, n-k-1) (tablas dos


colas)
: el nivel de significancia k=2
K: Numero de variables independientes
.n : Tamao de la muestra
4) Si el Tk es > Tt, entonces se rechaza la
hiptesis nula ( se realiza para cada uno
de los coeficientes) y se acepta la
alternativa
9/10/2017 Rosmeri Mayta H. 43 9/10/2017 Rosmeri Mayta H. 46
Estadistica Industrial Estadistica Industrial

PRUEBA DE HIPTESIS DEL MODELO


MODELO CURVILINEO CURVILINEO
PROBLEMA Prueba global
1) Plantear la hiptesis
Se tiene los datos de precio y ventas de Para: Variable 1 Variable 2 .....
un determinado producto realizar la Variable k
prueba de hiptesis del efecto lineal y Ho: 1 = 11 = 0
curvilneo Ha: 1 110

9/10/2017 Rosmeri Mayta H. 44 9/10/2017 Rosmeri Mayta H. 47


Estadistica Industrial Estadistica Industrial

2) = 0.05
3) El estadstico a utilizar es F
4) El Ft (0.05,2, n-k-1) : el nivel de significancia
k=2
.n : Tamao de la muestra
F(2,12) = 3.89
5) Calcular el valor de F para cada uno de los
coeficientes
Fk = 6221.2/165.6= 37.56
9/10/2017 Rosmeri Mayta H. 45 9/10/2017 Rosmeri Mayta H. 48
Estadistica Industrial Estadistica Industrial

Mg. Rosmeri Mayta H. 8


Estadistica Industrial 9/10/2017

Si el Fk es > Ft, Si el Tkl es > Tt


37.56 >3.89 ,entonces se rechaza la Como 2.64 >2.17 entonces se rechaza la
hiptesis nula y se acepta la alternativa hiptesis nula , se concluye la inclusin
del efecto curvilneo mejora de modo
significativo el modelo.

9/10/2017 Rosmeri Mayta H. 49 9/10/2017 Rosmeri Mayta H. 52


Estadistica Industrial Estadistica Industrial

PRUEBA DE HIPTESIS PARA PROBAR PRUEBA DE HIPTESIS PARA PROBAR


EL EFECTO CURVILINEO EL EFECTO LINEAL

1) Plantear la hiptesis 1) Plantear la hiptesis


Para: Variable 1 Variable 2 ..... Para: Variable 1 Variable 2 .....
Variable k Variable k
Ho: 11=0 (La inclusin del efecto curvilneo no mejora Ho: 1=0 (La inclusin del efecto lineal no mejora de
de forma significativa el modelo forma significativa el modelo
Ha: 110 (La inclusin del efecto curvilneo mejora de Ha: 10 (La inclusin del efecto lineal mejora de forma
forma significativa el modelo significativa el modelo

9/10/2017 Rosmeri Mayta H. 50 9/10/2017 Rosmeri Mayta H. 53


Estadistica Industrial Estadistica Industrial

2) = 0.05 2) = 0.05
3) El estadstico a utilizar es t
4) Calcular el t cal y el t (0.05, 12) = 2.17 (tabla dos colas) 3) El estadstico a utilizar es t
: el nivel de significancia k=2 4) Calcular el t cal y el t (0.05, 12) = 2.17 (tabla
K: Numero de variables independientes
dos colas)
.n : Tamao de la muestra
5) Calcular el estadstico y tomar la decisin : el nivel de significancia k=2
Calcular el valor de t para cada uno de los coeficientes K: Nmero de variables independientes
Tkl = 465/ 176.2=2.64
.n : Tamao de la muestra

9/10/2017 Rosmeri Mayta H. 51 9/10/2017 Rosmeri Mayta H. 54


Estadistica Industrial Estadistica Industrial

Mg. Rosmeri Mayta H. 9


Estadistica Industrial 9/10/2017

5) Calcular el valor de t para cada uno de


los coeficientes
Tk = -1088,7/349.5= -3.11
Si el Tk es > Tt
Como -3.11 <-2.17 entonces se rechaza la
hiptesis nula , se concluye que la
inclusin del efecto lineal mejora el
modelo del efecto curvilneo

9/10/2017 Rosmeri Mayta H. 55


Estadistica Industrial

Mg. Rosmeri Mayta H. 10

Вам также может понравиться