Академический Документы
Профессиональный Документы
Культура Документы
Regresin a la media
Conclusin: los padres muy altos tienen tendencia a tener hijos que
heredan parte de esta altura, aunque tienen tendencia a acercarse
(regresar) a la media. Lo mismo puede decirse de los padres muy
bajos.
Francis Galton
Primo de Darwin
Estadstico y aventurero
Fundador (con otros) de
la estadstica moderna
para explicar las teoras
de Darwin.
Qu vamos a estudiar
Altura
en cm.
Peso
en Kg.
162
61
154
60
180
78
158
62
171
66
169
60
166
54
176
84
163
68
...
...
Pesa 50 kg.
Mide 161 cm.
Pesa 76 kg.
ue
q
ce
e
r
Pa
s
e
p
el
nta
e
um
a
o
la
n
co
a
r
u
t
al
10 kg.
10 cm.
Incorrelacin
280
230
180
130
80
30
140
150
160
170
180
190
200
Para
380
320
340
360
400
420
r= 0.415
r^2 = 0.172
150
160
170
180
La distribucin de Y,
independientemente del valor de X, se
denomina distribucin marginal.
190
360
370
380
390
r= 0.984
r^2 = 0.969
350
150
160
170
180
190
Incorreladas: Sxy =0
1
S xy ( xi x )( yi y )
n i
10
S xy
SxS y
11
Propiedades de r
Es adimensional
Slo toma valores en [-1,1]
Las variables son incorreladas r=0
Relacin lineal perfecta entre dos variables r=+1 o r=-1
-1
Variables
incorreladas
Relacin
directa
casi
perfecta
+1
12
correlaciones positivas
13
correlaciones negativas
14
15
Preguntas frecuentes
16
17
Regresin
= Variable dependiente
predicha
explicada
= Variable independiente
predictora
explicativa
Es
Y = f(X) + error
Regresin
= b0 + b1X
b0 (ordenada en el origen, constante)
b1 (pendiente de la recta)
= b0 + b 1 X
b1=0,5
b0=85 cm
21
b1=0,5
b0=85 cm
22
i ei2
SY
b1 r
SX
b0 y b1 x
24
25
26
Interpretacin de la variabilidad en Y
En primer lugar olvidemos que existe la
variable X. Veamos cul es la variabilidad
en el eje Y.
27
28
Bondad de un ajuste
Resumiendo:
Cuanto
S
R 1
S
2
2
e
2
Y
2
e
S
29
2
Y
Descomposicin de la varianza
30
por qu?
por qu?
32
1 variable explicativa
Modelos de regresin
Simple
Lineal
2+ variables explicativas
Mltiple
No lineal
Lineal
No lineal
33
16
12
14
10
12
8
10
8
6
4
4
Desv. tp. = 8,64
Media = 173,3
N = 59,00
0
155,0
165,0
160,0
175,0
170,0
185,0
180,0
195,0
190,0
Media = 170,8
N = 59,00
0
160,0
165,0
162,5
170,0
167,5
175,0
172,5
180,0
177,5
182,5
190
180
170
b0=89,985
b1=0,466
Aprecias regresin a la media?
160
150
150
160
170
180
190
del Padre
Eso significa que el 57% de las predicciones del modelo sonAltura
correctas?
Cmo lo interpretas?
Correlaciones
Correlacin de Pearson
R
,759a
R cuadrado
,577
R cuadrado
corregida
,569
Coeficientes no
estandarizados
Modelo
1
Coeficientesa
Altura del
Padre
,759
1,000
Error tp. de la
estimacin
3,480
a. Variables
Bioestadstica.
U. Mlaga.
predictoras:
(Constante), Altura del Padre
(Constante)
Altura del Padre
B
89,985
,466
Error tp.
9,180
,053
200
Qu hemos visto?
Ordenada en el origen
Pendiente
Residuo, error
Bondad del ajuste, coef. determinacin