Академический Документы
Профессиональный Документы
Культура Документы
1
13/03/2017
Objetivos:
Reconocer posibles relaciones entre variables.
Medir el grado de asociacin entre dos variables.
Identificar el tipo de vinculacin entre dos variables.
Modelar la relacin funcional que existe entre dos variables.
Evaluar la calidad del ajuste realizado.
Contenidos:
Diagrama de dispersin.
Anlisis de correlacin.
Covarianza y Coeficiente de correlacin.
Anlisis de regresin.
Tipos de regresiones.
Ajuste del modelo de regresin por mnimos cuadrados.
Evaluacin de la regresin.
2
13/03/2017
EJEMPLO
Superficie Consumo
(m2 ) (lts)
69 20
135 40
121 35
103 35
97 26
78 24
3. Anlisis de regresin:
1. Ajuste de un modelo de regresin
2. Anlisis de la utilidad del modelo
3. Anlisis de residuos
4. Prediccin.
3
13/03/2017
3. Anlisis de regresin:
1. Ajuste de un modelo de regresin
2. Anlisis de la utilidad del modelo
3. Anlisis de residuos
4. Prediccin.
Variable dependiente y
En el ejemplo:
4
13/03/2017
1. GRFICO DE DISPERSIN
45
40
35
30
Consumo (L)
25
20
15
10
5
0
0 50 100 150
Supericie (m 2)
3. Anlisis de regresin:
1. Ajuste de un modelo de regresin
2. Anlisis de la utilidad del modelo
3. Anlisis de residuos
4. Prediccin.
5
13/03/2017
3. Anlisis de regresin:
1. Ajuste de un modelo de regresin
2. Anlisis de la utilidad del modelo
3. Anlisis de residuos
4. Prediccin.
2. ANLISIS DE CORRELACIN
Covarianza:
Parmetro poblacional: Cov (x,y)= xy = E[(x-x)(y-y)]
El estimador de xy es:
1 n
x, y = ( xi x )( yi y )
n 1 i =1
6
13/03/2017
Coeficiente de correlacin:
Cov ( x , y ) xy
Parmetro poblacional : = =
x y x y
Estimador r: SS xy Donde:
r= n
SS xx .SS yy ( x i ) 2
n n
SSxx = ( xi x ) 2 = x i
2
i =1
i =1 i =1 n
n n
( y i ) 2
SSyy = (y i y ) 2 = y i2 i =1
i =1 i =1 n
n n
n n
( xi )( y i )
SSxy = (x i x )( yi y ) = xi y i i =1 i =1
i =1 i =1 n
40 40
40
35 35
35
30 30
30
y
y
25 25
25
20 20
20
15 15 15
10 10 10
50 70 90 110 130 150 50 70 90 110 130 150 50 70 90 110 130 150
x x x
7
13/03/2017
SSxx = 3129
SSyy = 302
SSxy = 924
x , y = 924/5 = 184.8
924
r= =0.95
3129 . 302
Conclusin de la prueba:
8
13/03/2017
3. Anlisis de regresin:
1. Ajuste de un modelo de regresin
2. Anlisis de la utilidad del modelo
3. Anlisis de residuos
4. Prediccin.
3. Anlisis de regresin:
1. Ajuste de un modelo de regresin
2. Anlisis de la utilidad del modelo
3. Anlisis de residuos
4. Prediccin.
9
13/03/2017
3. ANLISIS DE REGRESIN
Qu forma podra tener un modelo que describiera la
posible relacin entre estas dos variables?
10
13/03/2017
Hiptesis y Supuestos
f(y)
Yi = 0 + 1xi + i con i~N(0;2)
yE(Y
11 y
y212|x2)
121) E(Y
1|x
y31E(Y
y323|xy333
) E(Y
y414|xy4)42
Y
x1
x2
x3
x4
x Y = 0 + 1x + con i~N(0;2)
3. ANLISIS DE REGRESIN
11
13/03/2017
Grficamente:
y
ei
x
n
Es decir: ei
2
debe ser mnimo
i=1
12
13/03/2017
SS xy
Pendiente: 1 =
SS xx
Ordenada al origen: 0 = y 1 x
y = 0 + 1x
Unidad 6: Regresin y Correlacin
Donde:
ei : residuos ei = yi - y i
y i : valores predichos
obtenidos para cada valor de xi con
la ecuacin de prediccin: y i = 0 + 1 x i
Lnea de mnimos cuadrados SSE menor de todos los modelos de lnea recta.
13
13/03/2017
30
Consumo (L)
Ordenada al origen: 25
15
10
y = 0 + 1 x y = 0.3100 + 0.2954 x
Por qu?
14
13/03/2017
Anlisis de varianza
Coeficiente de determinacin R2
Conclusin: ..
15
13/03/2017
Estadstico de prueba:
0 valor hipotetizado de 0
t=
1 x2
s +
n SS xx
ANLISIS DE VARIANZA
Se descompone la variabilidad en 2:
n
y)2
Variabilidad
SCR: suma de cuadrados de la regresin (SSR)
SCR = ( y
i =1
i
explicada
n
16
13/03/2017
COEFICIENTE DE DETERMINACIN R2
R2 vara entre 0 y 1.
41
y = 0.3100 + 0.2954 x
RESOLUCION DEL EJEMPLO 36
Consumo
EN INFOSTAT
30
25
Anlisis de regresin lineal
Variable N R 19
66 84 102 120 138
Consumo 6 0,90 SCR/SCT Superficie
17
13/03/2017
Volviendo al comienzo:
cules fueron los supuestos en los que nos basamos para la
adopcin del modelo?
Supuestos:
residuos independientes
los residuos son variables aleatorias con distribucin normal con media
0 y varianza constante: ~ N(0; 2).
18
13/03/2017
19
13/03/2017
1,88
Q-Q Plot
Cuantiles observados(RDUO_Consumo)
4,26 n= 6 r= 0,948 (RDUO_Consumo)
Res. estudentizados_Consumo
1,07
2,42
0,26
0,59
-0,55
-1,25
-1,36 -3,09
19,72 25,08 30,44 35,81 41,17 -3,09 -1,25 0,59 2,42 4,26
Predichos Cuantiles de una Normal(4,4409E-016,5,802)
3. Anlisis de regresin:
1. Ajuste de un modelo de regresin
2. Anlisis de la utilidad del modelo
3. Anlisis de residuos
4. Prediccin.
20
13/03/2017
3. Anlisis de regresin:
1. Ajuste de un modelo de regresin
2. Anlisis de la utilidad del modelo
3. Anlisis de residuos
4. Prediccin.
Lmites de prediccin
21
13/03/2017
RESUMEN
1. Diagrama de dispersin: visualizar la relacin entre las variables.
2. Anlisis de correlacin (coeficiente de correlacin estimado r y prueba
de hiptesis para ): grado de asociacin entre las variables.
3. Anlisis de regresin:
Ajuste de un modelo de regresin:
Modelo de lnea recta: y = 0 + 1x +
Estimar los parmetros desconocidos (0 y 1): mtodo de mnimos
cuadrados.
Evaluar la utilidad del modelo: Inferencias acerca de 0, y 1, anlisis de
varianza y coeficiente de determinacin R2.
Corroborar supuestos del error aleatorio () del modelo: Anlisis de
residuos.
4. Si estamos satisfechos con el modelo lo podemos utilizar para predecir.
Unidad 6: Regresin y Correlacin
22