Академический Документы
Профессиональный Документы
Культура Документы
LINEALES
1
Relaciones entre variables y regresión
• El término regresión fue introducido por Galton (1889)
refiriéndose a la “ley de la regresión universal”:
3
Diagramas de dispersión , nube de puntos o “Scaterplot”
Tenemos las alturas y los pesos de 30 individuos representados en un
diagrama de dispersión.
70
30
140 150 160 170 180 190 200
4
Variable independiente x (altura)
REGRESION LINEAL SIMPLE
Finalidad Modelo
y x
Estimar los valores de y (variable
dependiente) a partir de los valores
de x (variable independiente)
y ŷ
y
b
y x
=tg q coeficiente de regresión
a q (pendiente)
Ordenada en
el origen
(intercepto) x
x 5
Relación directa e inversa
330 100
( y μ y )( x μx )
y xy
centroide yy N
+
y Estimación de xy
+ x x
cov
( y y )( x x )
n
x x Es un estimador sesgado
r (Rho ) en la poblaciòn
8
CORRELACION LINEAL
Finalidad
Medir la intensidad de la asociación lineal entre dos variables
aleatorias
coeficiente de correlación r xy / x y
r s xy / s x s y
covarianza poblacional
coeficiente de
determinación r2 r2
Proporción de varianza compartida por las
dos variables
9
Propiedades de r
• Es adimensional
• Sólo toma valores entre -1y +1
• Las variables NO estàn correlacionadas r=0
• Relación lineal perfecta entre dos variables r = +1 o r=-1
– Excluimos los casos de puntos alineados horiz. o
verticalmente.
• Cuanto más cerca esté r de +1 o -1 mejor será el grado de relación
lineal.
– Siempre que no existan observaciones anómalas.
Relación
inversa Relación
perfecta directa
Variables
casi
NO correlacionadas
perfecta
-1 0 +1 10
0
0 Y
10 = 0.134
20 X + 2.122
30 40 X 50 Correlación
60 70 80 90negativa
0 2 Y =4 X 6 8X 10 12 14 16
0
2
2
4
4
6
6
8
Y
8
10
10
12
-1 r 0
12
14
14
r=-1
16
16
0 r +1
14
14
12
r=+1
12
10
10
Y
8
Y
6
6
4
4
2 2
0 0
0 10 20 30 40 50 60 70 80 90 0 2 4 6 8 10 12 11 14 16
X X
16 Y = 0.093 X + 4.335 8 Y=4
14
7
12 6
10 5
Y
Y
8 4
6 3
4 2
2 1
0 0
20 25 30 35 40 45 50 55 60 20 25 30 35 40 45 50 55
X X
16 #¡DIV/0!
14 r=0
12
10
Ausencia de correlación
Y
0
0 1 2 3 4 5 6
X
12
Animación: Evolución de r y diagrama de dispersión
13
ESTIMACION DE r (rho) r Cov s .s
x y
14
Animación: Residuos del modelo de regresión
15
ESTADISTICOS USUALES
ˆs 2y.x
( y ˆ
y ) 2 2
Varianza residual (insesgada)
n2 n2
2 SCRegresión 2
Coeficiente
de Determinación R2
R (0 R 1)
SCtotal
2
S
R 1 e2
2
SY
16
¿Cómo medir la bondad de una regresión?
17
Interpretación de la variabilidad en Y
2
S Y
18
Interpretación del residuo ( y yˆ )
2
S e
19
Bondad de un ajuste
Resumiendo: La dispersión del error residual será una fracción de
la dispersión original de Y Y
Cuanto menor sea la dispersión del error
residual mejor será el ajuste de regresión.
faja de
confianza
para ŷ x
x x
22
y
ex
y
ey
x x
y r=0 y r=0
x x
24
Los problemas de regresión y de correlación lineales
se parecen pero difieren
En la finalidad
En las variables
REGRESION CORRELACION
x variable NO hay distinción entre
independiente fija variable dependiente e
independiente
y variable x e y son variables
dependiente aleatoria aleatorias
25
Cálculos en correlación y regresión
r Cov Testar: Ho : r 0
s x .s y
rs y y a bx
b a y bx
sx
26