Академический Документы
Профессиональный Документы
Культура Документы
17 REGRESIN
Y CORRELACIN
SIMPLE
OBJETIVOS
Al finalizar el Tema 17, el participante ser capaz de:
1. Utilizar diagramas de dispersin para visualizar la
relacin entre dos variables.
2. Identificar relaciones simples entre variables
3. Utilizar la ecuacin de regresin para predecir valores
futuros.
4. Aplicar el anlisis de correlacin para describir el
grado hasta el cul dos variables estn relacionadas
linealmente entre si.
Y Y Y
X X X
(d) Curvilinea inversa (e) Lineal inversa (d) Ninguna relacin
con ms dispersin
PACIENTE 1 2 3 4 5 6 7 8 9 10
COMPLEMENTO
1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5
EN Kg: X
AUMENTO DE
8 10 9 12 14 13 15 17 14 14
PESO : Y
PACIENTE 1 2 3 4 5 6 7 8 9 10
COMPLEMENTO
1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5
EN Kg: X
AUMENTO DE
8 10 9 12 14 13 15 17 14 14
PESO : Y
20
15
10
0
0.0 2.0 4.0 6.0
15
10
0
0.0 2.0 4.0 6.0
20
Aumento de peso
15
(Kg)
10
5
0
0.0 2.0 4.0 6.0
Complemento nutricional (Kg)
Ejemplo:
En Y = 10 + 2X
cuando X aumenta en 1, Y aumenta en 2
En Y = 5 - 0,8X
cuando X aumenta en 1, Y disminuye en 0,8
Y = b0 + b1 X
Variable Variable
Dependiente Independiente
X
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
Cuando cambios en X, provoca variaciones en Y
en sentido inverso (X aumenta, Y disminuye o
viceversa), las variables estn inversamente
relacionadas. Se observa en la ecuacin el signo
-. Y
Ejemplo: o
Y = 20 - 3X
o o
o o
o
o
X
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
C) Grado de la ecuacin:
La ecuacin es de primer grado si la
variable independiente est elevada al
exponente 1. Su grfica genera una lnea
recta (por lo que tambin se le llama
ecuacin lineal)
Ejemplo: Y = 30 + 4 X
12
11
10
. . (5,10.5)
9
8
7
6
. . (3,7.5)
(4,9)
5
4
3
2
.(1,4.5)
(2,6)
1 2 3 4 5 X
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
E) Forma general:
La ecuacin simple de primer grado tiene la
siguiente forma general
Y = b0 + b1 X
Donde:
b1: pendiente, o sea, el cambio en Y cuando X = 1.
b0: el valor autnomo, es decir, Y = b0 cuando X = 0.
En la grfica es la interseccin con el eje Y
Ejemplo:
Y
Y = 3 + 1.5X
b0 = 3
.
X
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
17.3 Regresin lineal simple
Es una tcnica estadstica que permite
determinar la mejor ecuacin que represente la
relacin entre dos variables relacionadas.
= error
Yi - Y
10
8
. Lnea de
estimacin
6
Y
Min Y - Y
2
4 Error= -6
i
2
. Error= 2
X
2 4 6 8 10 12 14
Y nb 0 + b1 X
1.0 8.0 1.0 8.0
1.5 10.0 2.3 15.0
XY b 0 X b1 X 2 2.0
2.5
9.0
12.0
4.0
6.3
18.0
30.0
3.0 14.0 9.0 42.0
2
XY 442 y 126,3 ,en las ecuaciones normales,
X
obtenemos el siguiente sistema de ecuaciones.
126 = 10b0 + 32,5b1
442 = 32,5b0 + 126,3b1
Resolviendo el sistema tenemos: b0 = 7,479
b1= 1,576 ,por lo tanto,
Y 7,479 1,576X
Y
.
Yi
Y
1.5
2.0
10.0
9.0
9.843
10.630
.
2.5 12.0 11.418
3.0 14.0 12.206
Valor 3.5 13.0 12.994
observado Valor 4.0 15.0 13.782
estimado 4.5 17.0 14.570
5.0 14.0 15.358
2
(Y - Y)
Syx =
n2
14
21,20 21,20
Sy x = 2,65
10 2 8
Syx =1,628
variacion explicada
r2
variacion total
r2 =
Y - Y 2
Y - Y
2
i
9 5 7 14 10 45
Y=
5 5
Y = 9 unidades
Y Y
Y 2
Y Y Y
9.055 12.6 -3.545 12.5699
9.843 12.6 -2.758 7.6038
10.630 12.6 -1.970 3.8793
11.418 12.6 -1.182 1.3964
12.206 12.6 -0.394 0.1551
12.994 12.6 0.394 0.1553
13.782 12.6 1.182 1.3971
14.570 12.6 1.970 3.8805
15.358 12.6 2.758 7.6055
16.146 12.6 3.546 12.5720
126.0 126.0 0.0 51.2
Y Y Y Y Y Y 2
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
4to Paso: Se compara la variacin explicada y
la variacin total.
variacion explicada
Y - Y
2
r2
variacion total
r2 = i
Y -Y
2
51,2
r2 = 0,707
72,4
r= r2
Sus valores oscilan entre -1 y 1
Cuando r es positivo, indica que X e Y
estn directamente relacionados.
r = 0,707
r = 0,84
i = Yi - Yi
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
Podemos evaluar lo adecuado del modelo de
regresin ajustado mediante el grfico de los
residuos (eje vertical) con respecto a los
correspondientes valores de Xi de la variable
independiente (eje horizontal).
El grfico muestra un
3
adecuado ajuste entre 2
el incremento de peso
Residuos
1
tendencia. Variable X 1
i1
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
Los valores estandarizados nos permiten tomar en
cuenta la magnitud de los residuos en unidades
que reflejen la variacin estandarizada alrededor
de la lnea de regresin.
1.5
1
0.5
0
-0.5 0 5 10 15 20
-1
-1.5
-2
b. Normalidad
D i2
n
i
i1
2
Change Statistics
R Square
Model Change F Change df1 df2 Sig. F Change Durbin-Watson
1 .707a 19.336 1 8 .002 1.517
a. Predictors: (Constant), Complemento
b. Dependent Variable: AUMENTO
2
se estima mediante la siguiente formula:
n
Y 2
b 2SC
Y 2
n 1 x
S 2
i 1
n2
yx
Pr( t 0 t t 0 )
b1 1
Pr t 0 t0 1
Sy x
SCx
Sy x S y x
Pr b1 t 0 1 b1 t 0 1
SCx SCx
b0 0 b0 0
t n2
Sb0 1 x
2
Sy x
n SCx
donde:
Y Y
2
b 2 SC
2
n 0 x
S 2y x
n2
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
-t0 t0
Pr( t 0 t t 0 )
b
Pr t 0 0 0
t0 1
S
b 0
Pr b0 t 0Sb0 0 b0 t 0Sb0 1
1 X
Y N y / X0 , 2 0
X
2
n SCx
Pr y t 0S y y / X0 y t 0S y 1
donde:
1 X x
2
S y S 2y x 0
n SCx
1 X
Y N y / X0 , 2 1 0
X
2
n SCx
Pr y t 0S y Y / X0 y t 0S y 1
donde:
2
1 X0 x
S y S y x 1
2
n SC x
2
Error
Experimental
Y
2
n
b12SCx n 2 S2y x
Total SCtotal n 1
b0 Y b1 X
Xi Yi X Y
i i
442
32,5126
n 10 32,5
b1 1,57
X 2
126,25
32,5 20,62
i
X 2
n
i
10
Y 7,49 1,57X
Interpretacin:
b0= Se espera que el peso que un nio que no
consume este complemento nutricional sea
7,49 Kg.
b1= Por cada Kg. de complemento nutricional, el
peso del nio se incrementar en 1,57 Kg.
Sy x Sy x
Pr 1,57 t 0,10 8 1 1,57 t 0,10 8 1 0,10
SCx SCx
Sy x Sy x
Pr 1,57 1,86 1 1,57 1,86 0,90
4,54 4,54
1660
126
2
1,57 20,62
2
10 72,7 50,82
S 2
yx 2,69
8 8
S y x 1,642
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
1,642 1,642
Pr 1,57 1,86 1 1,57 1,86 0,90
4,54 4,54
1 3,80 3,25
2
SY 1,642 1
10 20,62
Interpretacin
Y 7,49 1,57(5,51)
Y 16,14
E. Prueba de Hiptesis acerca de
1
1. Hp: 1= 0
Ha: 1 0
2. =
Fc
CMeregresin
0,10
3. CMeerror
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
Supuestos
- La muestra seleccionada al azar
- La poblacin se distribuye al azar
- Los valores de X fijas y de Y variables (o
aleatorias)
- Asunciones de la regresin lineal simple
4. Criterios de decisin
F1-/2 F/2
0,0041 5,32
Pr 16,91 1,86S Y Y X0 16,91 1,86 S Y 1
Estadsticas de la regresin
Coeficiente de correlacin mltiple 0.99582747
Coeficiente de determinacin R^2 0.99167236
R^2 ajustado 0.98959045
Error tpico 1.5310881
Observaciones 6
ANLISIS DE VARIANZA
GL SC CMe F cal P-valor
Regresin 1 1116.62308 1116.62308 476.328138 2.60786E-05
Residuos 4 9.37692308 2.34423077
Total 5 1126
Paciente 1 2 3 4 5 6 7 8 9 10 11
Prueba nueva 50 55 60 65 70 75 80 85 90 95 100
Prueba estandar 61 61 59 71 80 76 90 106 98 100 114
2
5. El coeficiente de correlacin de muestra, r, no es nada ms que r
y no podemos interpretar su significado directamente como un
porcentaje del mismo tipo
21. Una valor pequeo de r2 implica que no existe una relacin de causa-
efecto significativa entre X y Y