Академический Документы
Профессиональный Документы
Культура Документы
MOMENTO TRES
UNIDAD 3. REGRESION Y DETERMINACION
PRESENTADO POR:
TUTOR
ARNOL ORTIZ
MAYO 2015
LABORATORIO REGRESION Y CORRELACION LINEAL
1. Se quiere estudiar la asociación entre consumo de sal y tensión arterial. A una serie de
voluntarios se les administra distintas dosis de sal en su dieta y se mide su tensión arterial
un tiempo después.
80
60
40
20
0
0 1 2 3 4 5 6
DOSIS DE SAL
D
O
S
I
El diagrama de dispersión insinúa una tendencia lineal
b. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la
otra. Es confiable?
Después de una inspección en la gráfica de dispersión, que una línea recta es la mejor
curva que se ajusta al conjunto de puntos se procede entonces a emplear el método de la
regresión lineal simple. “1 Información tomada del Módulo 100105 estadística descriptiva”.
Ecuación de la recta: Ŷ a bX
Dónde:
a: Intercepto de la variable Y
Variable independiente
Pendiente de la recta
n XY X Y 6 2284.7 292.2
b 6.31
2
n X
2
X
(20.8)(645) 46.28
6 79.82 (20.8) 2
b= 6,31
a= 85,62
Y = 85,62 + 6,31X
c. Determine el porcentaje de explicación del modelo y el grado de relación de las dos
variables.
2 Y b XY
Y a
Se
n 2
Se2 = 7,91075
Se = 2,812605554
2
Y 69673
sy2 y2 107.52 1.0048
n 6
Yprom. = 645/6
Yprom. = 107,5
2
2.81
R2 1 1 1.79 r R2 1.34
Se
s y2 1.0048
Con los resultados obtenidos se puede asegurar que la ecuación de la recta es una muy
buena estimación de la relación entre las dos variables. El R2 afirma además que el
modelo explica el 94% de la información. Y el valor de r confirma además el grado de
relación entre las variables: el incremento en la tensión arterial está directamente
relacionado (en un 97%) con el suministro de mayores dosis de sal en el organismo.
d. Si a un paciente se le administra una dosis de sal de 6,5. ¿Cuál es la tensión arterial
esperada?
Y = 85,62 + 6,31(6,5) Y =
126,63
Si a un paciente se le suministra una dosis de sal de 6.5, su tensión arterial esperada será de
126,63
X 10 20 30 40 50 60 70
Y 35 28 23 20 18 15 13
b. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la
otra. Es confiable?
Tiempo en No de días _ _
(min) X Y XY X² Xi-X (Xi- X )²
10 35 350 100 -30 900
20 28 560 400 -20 400
30 23 690 900 -10 100
40 20 800 1600 0 0
50 18 900 2500 10 100
60 15 900 3600 20 400
70 13 910 4900 30 900
∑X=280 ∑Y=152 ∑XY=5.110 ∑X²=14000 ∑(Xi- X
0 )²=2800
a). diagrama de dispersión
40
35
30
DURACION EN MINUTOS
25
20
15
10
0
0 20 40 60 80
Y Linear (Y )
DIAS
b.) Encuentre el modelo matemático que permite predecir el efecto de una variable Sobre la
otra. Es confiable?
El modelo matemático que permite predecir el efecto de una variable es =
Y=a+bx;
Y=0.346+35.57.R²=0.945
Podemos asegurar que la ecuación de la recta es confiable porque R² está cercano a 1y tiene
un grado alto de confiabilidad.
c). Determine el porcentaje de explicación del modelo y el grado de relación de las dos
variables.
Estatura 121 123 108 118 111 109 114 103 110 115
cm
Peso kg 25 22 19 24 19 18 20 15 20 21
Estatura Peso
(cm) ( kg)
121 25
123 22
108 19
118 24
111 19
25
20
PESO (Kg)
15
10 y = 0.4212x - 27.377
R² = 0.8102
5
0
100 105 110 115 120 125
ALTURA (cm)
b. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra.
Es confiable?
Y=0,4212X-27,377
d. Cuál es el peso que debería tener un estudiante que mida 130 cm?
Según el modelo matemático, un estudiante que mida 130 cm debería pesar 27,4 Kg.
PACIENTE (X) (Y) Peso
EDAD
1 3 12,5
2 31 60
3 62 72,5
4 64 58
5 4 16,5
6 65 57,6
7 55 78,6
8 1 5,2
9 18 53,8
10 42 45,8
11 23 60,2
12 8 19,7
13 71 62,7
14 53 78,6
15 20 52,7
16 2 8,9
17 73 70
18 25 80,9
19 35 78,9
20 5 15,9
21 24 56
22 23 52,9
23 19 78,5
24 54 85,8
25 19 65,2
26 21 60
27 56 67,2
28 43 85
29 5 24,5
30 21 65,4
31 54 60,6
32 51 85
33 26 57,3
34 22 67,9
35 0 2,6
36 26 75,3
37 73 45,2
38 85 50,2
39 7 23
40 16 45
41 52 65,7
42 4 16,7
43 20 60,5
44 68 57,8
45 54 60,3
46 44 78,5
47 3 15,3
48 81 65,2
49 20 65,6
50 40 78,4
51 40 57,9
52 0 3,4
53 61 58,3
54 23 56,8
55 34 60
56 31 72
57 17 58,6
58 3 14,2
59 59 65,7
60 19 60,8
61 0 3,1
62 44 85
63 75 60,8
64 75 55,9
65 82 70
66 33 73,8
67 39 78,5
68 23 67,2
69 37 67,2
70 48 58,8
71 50 62,3
72 94 70,2
73 17 54,9
74 55 78,1
75 59 62,9
76 23 65
77 87 62,9
78 34 72,9
79 24 61,6
80 1 9,7
81 19 64,3
82 25 58,9
83 5 18,3
84 24 56,9
85 0 3,1
86 52 45,8
87 24 68,9
88 2 11,9
89 49 65,9
90 68 78
91 5 16,9
92 37 85,8
93 54 67,2
94 26 63,2
95 1 9,4
96 33 72,9
97 0 3,9
98 21 63,8
99 13 30,5
100 23 52,6
101 39 85,9
102 19 67,9
103 24 58,2
104 45 55
105 57 60,5
106 51 87,5
107 17 55,2
108 26 70
109 16 45,9
110 22 54
111 25 60,8
112 55 65,8
113 23 70,8
114 58 78,6
115 48 87,2
116 39 79,5
117 36 72,9 ANALISIS REGRESIÓN Y CORRELACIÓN LINEAL
118 60 67,5 SIMPLE
119 47 58,2 1. Identificar dos variables cuantitativas de la
120 17 64,3 situación estudiada que puedan estar relacionadas.
2. DIAGRAMA DE DISPERSION DE LA EDAD Y PESO DE LOS PACIENTES
(Y) Peso
100
80
60
40
20
0
0 20 40 60 80 100
X Y
Media 33 49,45
varian 659,7894 692,5394
za 74 74
∑Y − b∑X
𝑎=
n
6718 − (0.6x4083) 4268.2
𝑎= = = 35.5
120 120
Y=35.5+0.6X
2
𝑆𝑒 2
𝑅 =1− 2
𝑆𝑦
∑ 𝑦 2 − 𝑎 ∑ 𝑦 − 𝑏 ∑ 𝑥𝑦
Se = √
𝑛−2
437809,28 − 35.5(6718) − 0.6(267090,5)
Se = √
120 − 2
39065.98
Se = √
118
39065.98
Se = √
118
Se = √ 331.067
Se = 18.19
2
𝑆𝑒 2
𝑅 =1− 2
𝑆𝑦
(18.19)2
𝑅2 = 1 −
692,539474
330.876
𝑅2 = 1 −
692,539474
𝑅 2 = 1 −0.47
𝑅 2 = 0.53
SOLUCION AL PROBLEMA.
c. El porcentaje de explicación del modelo está dado por la representación porcentual del
coeficiente de determinación, así; R²*100% = 0,53*100% = 53%.
Para hallar el grado de relación de las variables debamos sacar la raíz cuadrada del coeficiente
de determinación, √R² = √0,53 = 0,728, en donde su valor porcentual sería; 0,728*100% = 72.8%,
lo cual indica que las dos variables (edad y peso) y que estas variables tienen una relación del
72.8%.
d. con el modelo matemático Y=35.5+0.6X, se puede definir cuál será el peso KG de un paciente
solo con reemplazar el valor de x.
Y=35.5+0.6X
Y=35.5+0.6 (70)
Y=35.5+1.8
y = 35.5+42
y = 77.5
Gracias a este resultado podemos definir que un paciente de 70 años de edad, se puede predecir
un promedio en su peso de 77.5.
ANALISIS REGRESIÓN Y CORRELACIÓN LINEAL MÚLTIPLE
1. Identificar una variable cuantitativa dependiente y varias variables independientes del
estudio de investigación
VARIABLE VARIABLE
CUANTITATIVA CUANTITATIVA
DEPENDIENTE INDEPENDIENTE
PESO EDAD
12,5 3
60 31
72,5 62
58 64
16,5 4
57,6 65
78,6 55
5,2 1
53,8 18
45,8 42
60,2 23
19,7 8
62,7 71
78,6 53
52,7 20
8,9 2
70 73
80,9 25
78,9 35
15,9 5
56 24
52,9 23
78,5 19
85,8 54
65,2 19
60 21
67,2 56
85 43
24,5 5
65,4 21
60,6 54
85 51
57,3 26
67,9 22
2,6 0
75,3 26
45,2 73
50,2 85
23 7
45 16
65,7 52
16,7 4
60,5 20
57,8 68
60,3 54
78,5 44
15,3 3
65,2 81
65,6 20
78,4 40
57,9 40
3,4 0
58,3 61
56,8 23
60 34
72 31
58,6 17
14,2 3
65,7 59
60,8 19
3,1 0
85 44
60,8 75
55,9 75
70 82
73,8 33
78,5 39
67,2 23
67,2 37
58,8 48
62,3 50
70,2 94
54,9 17
78,1 55
62,9 59
65 23
62,9 87
72,9 34
61,6 24
9,7 1
64,3 19
58,9 25
18,3 5
56,9 24
3,1 0
45,8 52
68,9 24
11,9 2
65,9 49
78 68
16,9 5
85,8 37
67,2 54
63,2 26
9,4 1
72,9 33
3,9 0
63,8 21
30,5 13
52,6 23
85,9 39
67,9 19
58,2 24
55 45
60,5 57
87,5 51
55,2 17
70 26
45,9 16
54 22
VARIABLE
60,8 25 VARIABLE CUANTITATIVA
CUANTITATIVA
65,8 55 DEPENDIENTE
INDEPENDIENTE
70,8 23
ESTATURA EDAD
78,6 58
87,2 48 0,65 3
79,5 39 1,74 31
72,9 36 1,58 62
67,5 60 1,59 64
1 4
58,2 47
1,65 65
64,3 17
1,7 55
0,73 1
1,62 18
1,53 42
1,65 23
1,18 8
1,69 71
1,58 53
1,53 20
0,85 2
1,64 73
1,75 25
1,6 35
1,03 5
1,55 24
1,58 23
1,78 19
1,66 54
1,7 19
1,79 21
1,72 56
1,68 43
1,03 5
1,63 21
1,73 54
1,68 51
1,58 26
1,65 22
0,45 0
1,78 26
1,5 73
1,64 85
1,16 7
1,52 16
1,58 52
0,98 4
1,65 20
1,59 68
1,61 54
1,79 44
0,96 3
1,67 81
1,7 20
1,68 40
1,62 40
0,53 0
1,59 61
1,56 23
1,65 34
1,68 31
1,56 17
0,96 3
1,67 59
1,61 19
0,57 0
1,8 44
1,56 75
1,62 75
1,67 82
1,8 33
1,75 39
1,65 23
1,72 37
1,59 48
1,63 50
1,65 94
1,52 17
1,72 55
1,63 59
1,86 23
1,63 87
1,75 34
1,57 24
0,76 1
1,78 19
1,62 25
1,06 5
1,68 24
0,57 0
1,51 52
1,76 24
0,86 2
1,62 49
1,71 68
1,1 5
1,86 37
1,71 54
1,59 26
0,82 1
1,76 33
0,47 0
1,62 21
1,4 13
1,51 23
1,81 39
1,66 19
1,6 24
1,63 45
1,58 57
1,67 51
1,72 17
1,65 26
1,56 16
1,63 22
1,67 25
1,64 55
1,61 23
1,68 58
1,8 48
1,72 39
1,75 36
1,67 60
1,55 47
1,72 17
1
X2 = ∑X2i
𝑁
181,52
X2 = 120
= 1.5
1
X3 = ∑X3i
𝑁
6718
X3 = = 55.9
120
1
S12 = ∑𝑋1𝑖 2 − 𝑋1
𝑁
203031
S12 = − 34.025 = 1657.9
120
1
S22 = ∑𝑋2𝑖 2 − 𝑋2
𝑁
287,74
S22 = − 1.5 = 0.89
120
1
S32 = ∑𝑋3𝑖 2 − 𝑋3
𝑁
437809,28
S32 = − 55.9 = 3592.51
120
LAS COVARIANZAS SON:
1
S12 = ∑X1i X2i − 𝑋1. 𝑋2
𝑁
6713,23
S12 = − 34.025 𝑥 1.5
120
S12 = 55.94 − 51.03 = 4.91
1
S13 = ∑X1i X3i − 𝑋1. 𝑋3
𝑁
267090.5
S13 = − 34.025 𝑥 55.9
120
S13 = 2225.7 − 1901.9 = 323.8
1
S23 = ∑X2i X3i − 𝑋2. 𝑋3
𝑁
11000.2
S23 = − 1.5 𝑥 55.9
120
S23 = 91.6 − 83.85 = 7.75
60
40
20
0
0 0.5 1 1.5 2
EDAD
100
DIAGRAMA DE DISPERSION DE CORRELACION
90
ENTRE LA VARIABLE CUANTITATIVA DEPENDIENTE (
80 EDAD) E INDEPENDIENTE(PESO)
70
60
PESO
50
40
30
20
10
0
0 10 20 30 40 50
EDAD 60 70 80 90 100
80
y = 0,624x - 0,9099
60
R² = 0,3749
40
20
0
0 20 40 60 80 100
Series1 Linear (Series1)
Linear (Series1) Linear (Series1)
ECUACION REGERESION (EDAD Y
ESTATURA)
100
80
60 y = 40,787x - 27,672
40
R² = 0,3417
20
0
0 0.5 1 1.5 2
-20