Академический Документы
Профессиональный Документы
Культура Документы
CONTINUAS
continuas.
1
Frecuencia absoluta conjunta: nij recibe el nombre de
n ij
Frecuencia relativa conjunta: f i j recibe el nombre de
N
frecuencia relativa conjunta de la clase ij y representa la
Distribuciones marginales
de las variables.
2
Recordemos que se pueden calcular de forma sencilla a
columnas:
k
distribucin marginal absoluta de Y ser n . j i1
n ij .
m k
conjunta y son la de X f i .
j1
f i j y la de Y f . j f ij .
i1
3
Ejemplo: (ver Tabla 8.1 de Pea y Romo)
HIJOS
menos 160 a 165 a 170 a 175 a 180 a 185 a ms
PADRES 160 164 169 174 179 184 189 190 ni.
menos 160 4 4 1 0 0 0 0 0 9
160 a 164 2 7 10 3 0 0 0 0 22
165 a 169 0 3 20 25 9 4 0 0 61
170 a 174 0 4 18 26 30 19 1 0 98
175 a 179 0 0 2 17 22 20 4 1 66
180 a 184 0 0 0 5 15 17 8 2 47
185 a 189 0 0 0 0 1 4 2 1 8
Ms 190 0 0 0 0 0 0 1 0 1
n.j 6 18 51 76 77 64 16 4 312
HIJOS
menos 160 a 165 a 170 a 175 a 180 a 185 a ms
PADRES 160 164 169 174 179 184 189 190 fi.
Menos 160 0,013 0,013 0,003 0 0 0 0 0 0,029
160 a 164 0,006 0,022 0,032 0,009 0 0 0 0 0,069
165 a 169 0 0,009 0,064 0,080 0,029 0,013 0 0 0,195
170 a 174 0 0,013 0,057 0,083 0,096 0,061 0,003 0 0,313
175 a 179 0 0 0,006 0,054 0,070 0,064 0,013 0,003 0,21
180 a 184 0 0 0 0,016 0,048 0,054 0,025 0,006 0,149
185 a 189 0 0 0 0 0,003 0,013 0,006 0,003 0,025
Ms 190 0 0 0 0 0 0 0,003 0 0,003
f.j 0,019 0,057 0,162 0,242 0,246 0,205 0,05 0,012 1
4
Distribuciones condicionadas
determinada altura.
HIJOS
menos 160 a 165 a 170 a 175 a 180 a 185 a ms
PADRES 160 164 169 174 179 184 189 190 ni.
165 a 169 0 3 20 25 9 4 0 0 61
5
Las frecuencias relativas condicionadas se obtienen
HIJOS
185
menos 165 a 170 a 175 a 180 a ms
PADRES 160
160 a 164
169 174 179 184
a
190
189
165 a 169 0 3/61=0,049 0,328 0,410 0,148 0,065 0 0
(0,049+0,328+0,41+0,148+0,065=1).
6
En nuestro ejemplo, la distribucin de la altura de los hijos
HIJOS
185
menos 160 a 165 a 175 a 180 a ms
PADRES 160 164 169
170 a 174
179 184
a
190
189
180 a 184 0 0 0 5/47=0,106 0,32 0,362 0,17 0,042
padres.
7
Diagrama de dispersin
8
Ejemplo: (Ejercicio 8.6 de Pea y Romo)
X 28 28 32 35 38 44 49 52 58 62 66 70
Y 2,2 2,2 3,8 4,2 4,2 5,3 7,3 6,4 6,7 5,3 6 5,1
8
(49;7,3)
6
(70;5,1)
SALARIO
(28;2,2)
2
20 30 40 50 60 70 80
EDAD
no lineal)
9
La covarianza
i 1 x i x y i y i 1 x i y i
N N
cov(x,y) xy
N N
La covarianza ser:
lineal.
variables.
10
Ejemplo: (Ejercicio 8.1 de Pea y Romo)
X: 2 3 4 5 6
Y: 5 7 8 13 14
16
14
12
10
Y
4
1 2 3 4 5 6 7
y:
N N
x i x y i x xiyi
cov(x,y) i1
i1
xy
N N
11
xi yi xi x yi y ( x i x ) x( y i y ) xi yi
2 5 -2 -4,4 8,8 10
3 7 -1 -2,4 2,4 21
4 8 0 -1,4 0 32
5 13 1 3,6 3,6 65
6 14 2 4,6 9,2 84
20 47 24 212
N N
xi
20 yi
47
x i1
4 y i1
9 ,4
N 5 N 5
luego:
24 212
cov(x,y) 4 9 ,4 4 ,8
5 5
u a x b y v c y d la covarianza ser:
co v (u ,v ) a c co v ( x , y )
12
El coeficiente de correlacin
unidades de medida.
cov(x,y)
r r(x,y)
S xS y
es lineal.
13
El coeficiente de correlacin es siempre un valor entre 1 y
1, es decir, 1 r ( x , y ) 1 .
absoluto, igual a 1.
14
Ejemplo: (continuacin Ejercicio 8.1 de Pea y Romo)
X: 2 3 4 5 6
Y: 5 7 8 13 14
c o v ( x , y ) 4 , 8 as como x 4 e y 9 ,4 .
cov(x,y)
Para calcular r r ( x , y ) , necesitamos las desviaciones
S xS y
tpicas:
xi yi x i2 y i2
2 5 4 25
3 7 9 49
4 8 16 64
5 13 25 169
6 14 36 196
20 47 90 503
x i2
90
Sx i1
x 2
4 2
1 ,4 1 4 1
N 5
y i2
503
Sy i1
y 2
9 ,4 2
3 ,4 9 8 6
N 5
cov(x,y) 4 ,8
r(x,y) 0 ,9 7 relacin lineal
S xS y 1 ,4 1 4 1 3 ,4 9 8 6
positiva alta
15
Conviene combinar la informacin que proporciona el
Romo).
16
Correlacin espuria: correlacin entre variables debida a
Ejemplos:
verano.
17
La recta de regresin
relacin.
conjunto de datos?
y b 0 b 1 x
18
- b 1 : es la pendiente de la recta. Nos dice cmo vara en
- b 0 : es la ordenada en el origen.
residuo=error de prediccin= y i y i y i b 0 b 1 x i
19
Como resultado de aplicar este criterio tenemos:
cov(x,y) S y cov(x,y) S y
b1 r
S x2 S y S x2 S x
b0 y b1x
variables.
variables.
20
Ejemplo: Ejercicio 9.8 de Pea y Romo (cont. Del ejercicio
8.6)
X 28 28 32 35 38 44 49 52 58 62 66 70
Y 2,2 2,2 3,8 4,2 4,2 5,3 7,3 6,4 6,7 5,3 6 5,1
xi
562 yi
5 8 ,7
x i1
4 6 ,8 3 y i1
4 ,8 9
N 12 N 12
x i2
28766
Sx i1
x 2
4 6 ,8 3 2 1 4 ,2 9
N 12
y i2
3 1 6 ,7 3
Sy i1
y 2
4 ,8 9 2
1 ,5 7
N 12
( xi x )( yi y )
1 9 6 ,1 8 3 4
cov(x,y) i1
1 6 ,3 5
N 12
cov(x,y) 1 6 ,3 5
r 0 ,7 3
S xS y 1 4 , 2 9 1 ,5 7
21
Luego:
cov(x,y) S y 1 6 ,3 5 1 ,5 7
b1 r 0 ,7 3 0 ,0 8
S x2 S x 1 4 ,2 9 2
1 4 ,2 9
b 0 y b 1 x 4 , 8 9 0 , 0 8 4 6 , 8 3 1 ,1
y i 1 , 1 0 , 0 8 x i
6
SALARIO
1,1+0,08x
1-
20 40 60 80
EDAD
22
Con estos datos, la prediccin del salario para un licenciado
de 25 aos ser:
y 1 , 1 0 , 0 8 2 5 3 , 1
respectivamente:
y 1 , 1 0 , 0 8 3 0 3 , 5
y 1 , 1 0 , 0 8 4 0 4 , 3
la recta de regresin.
Se define como:
( y i y i ) 2
Sr i1
N
recta de regresin.
23
Ejemplo: (continuacin salario-edad)
y i 1 , 1 0 , 0 8 x i Residuo= y i y i ( y i y i ) 2
1 ,1 0 , 0 8 2 8 3 , 3 4 2 , 2 3 , 3 4 1 ,1 4 1,2996
1 ,1 0 , 0 8 2 8 3 , 3 4 2 , 2 3 , 3 4 1 ,1 4 1,2996
1 ,1 0 , 0 8 3 2 3 , 6 6 3 , 8 3 , 6 6 0 ,1 4 0,0196
1 ,1 0 , 0 8 3 5 3 , 9 0 4 ,2 3 ,9 0 0 ,3 0,09
1 ,1 0 , 0 8 3 8 4 ,1 4 4 , 2 4 ,1 4 0 , 0 6 0,0036
1 ,1 0 , 0 8 4 4 4 , 6 2 5 ,3 4 ,6 2 0 ,6 8 0,4624
1 ,1 0 , 0 8 4 9 5 , 0 2 7 ,3 5 ,0 2 2 ,2 8 5,1984
1 ,1 0 , 0 8 5 2 5 , 2 6 6 , 4 5 , 2 6 1 ,1 4 1,2996
1 ,1 0 , 0 8 5 8 5 , 7 4 6 ,7 5 ,7 4 0 ,9 6 0,9216
1 ,1 0 , 0 8 6 2 6 , 0 6 5 ,3 6 ,0 6 0 ,7 6 0,5776
1 ,1 0 , 0 8 6 6 6 , 3 8 6 6 ,3 8 0 ,3 8 0,1444
1 ,1 0 , 0 8 7 0 6 , 7 5 ,1 6 , 7 1 , 6 2,56
13,8764
( y i y i ) 2
1 3 ,8 7 6 4
Sr i1
1 ,1
N 12
24
Como se cumple que:
S r
1 r 2
S y
regresin.
Ejemplo:
S
Si r=0,7, tendremos que
r
1 0 ,7 2
0 , 7 1 por lo que
S y
x.
25
Ntese que mientras que en el clculo del coeficiente de
fuera x sera:
x c 0 c 1 y con:
cov(x,y) S cov(x,y) S y
c1 r x
b1 r
S y2 S y S x2 S x
c0 x c1y b0 y b1x
c1 b1 r y c0 b0 0
26