Вы находитесь на странице: 1из 7

Tarea 2. Regresin mltiple.

Valentina Pezoa Salas.


Martes 21 de Noviembre, 2017.
Tratamiento de datos estadsticos y diseo de experimentos.
Ingeniera Civil Qumica, Universidad de Concepcin.

Problema 1. Se requiere investigar la relacin entre la concentracin de licor verde Na2S y la


produccin de papel de una mquina.

a) Calcula la recta de regresin con la Concentracin de licor verde (Col_3) como Y y


Produccin (X1) como X.

La recta de regresin est dado por: Col_3 = -30,7598 + 0,100863*X1

b) Dibuja el diagrama de dispersin con la recta ajustada. Cree que el ajuste es adecuado?
Basa tu respuesta en alguna medida estadstica.

Grfico del Modelo Ajustado

78

73

68
Col_3

63

58

53

48
790 840 890 940 990 1040
X1

Error Estadstico
Parmetro Estimacin Estndar T Valor-P
CONSTANTE -30,7598 2,05482 -14,9696 0,0000
X1 0,100863 0,00227886 44,2601 0,0000
Anlisis de Varianza
Fuente Suma de Cuadrados Gl Cuadrado Medio Razn-F Valor-P
Modelo 2236,58 1 2236,58 1958,95 0,0000
Residuo 111,889 98 1,14172
Total (Corr.) 2348,47 99
R-cuadrada = 95,2357 porciento
R-cuadrado (ajustado para g.l.) = 95,1871 porciento
Error estndar del est. = 1,06851
Error absoluto medio = 0,844142
Estadstico Durbin-Watson = 2,26256 (P=0,9062)
Autocorrelacin de residuos en retraso 1 = -0,136496

Segn se puede observar en el grfico, los datos estn cercanos a la recta que los ajusta, esto adems
se puede complementar utilizando estadsticos como R2 el cual es un 95,24% y R2 ajustado es 95,19%
lo que significa que el modelo de regresin es lo suficientemente bueno ya que la variable de inters
queda explicada por la variable regresora. El valor-p de la variable independiente (Produccin X1) es
significativo en el ajuste y en el anlisis de varianza el valor-p 0 < 0.05 indica que no hay relacin
entre el modelo y los residuos.

c) Calcula la media de ambas variables y predice la concentracin de licor verde cuando


Produccin (X1) sea igual a dicha media.

Resumen Estadstico para X1 Resumen Estadstico para Col_3


Recuento 100 Recuento 100
Promedio 900,464 Promedio 60,0634
Desviacin Estndar 47,1242 Desviacin Estndar 4,87052
Coeficiente de Variacin 5,23333% Coeficiente de Variacin 8,10896%
Mnimo 790,941 Mnimo 48,7123
Mximo 1039,01 Mximo 75,0662
Rango 248,069 Rango 26,354
Sesgo Estandarizado 0,291794 Sesgo Estandarizado 0,123299
Curtosis Estandarizada 0,078467 Curtosis Estandarizada 0,110909

La media para la variable Produccin X1 es de 900,464 ton/da y para la variable Col_3 es de 60,06
g/L. La concentracin de licor verde se obtiene reemplazando en la ecuacin obtenida en a) cuando
produccin X1 es igual a dicha media es:

Cuando la produccin es 900,464 ton/da, la concentracin de licor verde es 60,064 g/L.

d) Cul sera la prediccin si la Produccin (X1) es 2000? Podras fiarte de esta prediccin?
Razona tu respuesta.

Si la produccin X1 es igual a 2000 ton/da se obtiene una concentracin de licor verde de 170,97
g/L. No podra fiarme de esta prediccin debido a que el estudio est hecho sobre un intervalo de
produccin X1 [790.941,1039] para el cual aplican las conclusiones obtenidas y el valor 2000 ton/da
est por fuera de los lmites de ste.
Problema 2. Se requiere calcular la relacin existente entra la dureza de lminas de acero reducido
en fro y la temperatura de recocido.

a) Calcula la recta de regresin de Dureza (Col_3) sobre Temperatura (X3) y represntala. La


relacin entre ambas variables es positiva o negativa? Razona tu respuesta.

Grfico del Modelo Ajustado

64

60

56
Col_3

52

48

44

40
1000 1100 1200 1300 1400
X3

Mediante el estudio de las variables con regresin mltiple se obtuvo la siguiente recta de regresin:

Col_3 = 151,685 - 0,0813188*X3

Esta ecuacin es una regresin lineal simple, luego haciendo el estudio para ste tipo de regresiones
se obtiene un coeficiente de correlacin r = -0,9598, el cual indica que la relacin entre ambas
variables es negativa, lo que se traduce en que cuando la temperatura aumenta la dureza disminuye.

b) Cmo es la calidad del ajuste? Razona tu respuesta.

Error Estadstico
Parmetro Estimacin Estndar T Valor-P
CONSTANTE 151,685 2,88746 52,5324 0,0000
X3 -0,0813188 0,00240216 -33,8523 0,0000

Anlisis de Varianza
Fuente Suma de Cuadrados Gl Cuadrado Medio Razn-F Valor-P
Modelo 1486,27 1 1486,27 1145,98 0,0000
Residuo 127,1 98 1,29694
Total (Corr.) 1613,37 99
R-cuadrada = 92,1221 porciento
R-cuadrado (ajustado para g.l.) = 92,0417 porciento
Error estndar del est. = 1,13883
Error absoluto medio = 0,951456
Estadstico Durbin-Watson = 1,73263 (P=0,0883)
Autocorrelacin de residuos en retraso 1 = 0,110744

La calidad del ajuste es muy buena, debido a que el R2=92,12% y el R2 ajustado=92,04%, lo que indica
que el modelo de regresin es suficientemente bueno y la variable de inters (Dureza) queda
explicada por la variable independiente (temperatura). Ambos parmetros (constante y X3) son
significativos en el modelo, la mayor cantidad de suma de cuadrados esta descrito por el modelo y
no por los residuos, esto adems indica que no hay relacin entre los residuos y el modelo ya que el
valor-p es inferior a 0,05. Esto se comprueba con el valor del estadstico Durbin-Watson en este caso
1,73, el cual indica que entre 1,5 y 2,5 se puede asumir una independencia entre los residuales.

c) Estima la dureza de una lmina si la temperatura de recocido (X3) es 1250.

Sustituyendo en la expresin obtenida en a) la dureza de la lmina es de 50,04 Rockwell T-30 cuando


la temperatura es de 1250F.

d) En la dureza de una lmina tambin influye el contenido en cobre (C). Calcula la regresin
que se obtendra si considersemos tanto la variable Temperatura (X3) como Contenido de
Cobre (C) como independientes y la variable Dureza (Col_3) como dependiente.

Error Estadstico
Parmetro Estimacin Estndar T Valor-P
CONSTANTE 152,598 3,17299 48,0928 0,0000
X3 -0,0813895 0,00241048 -33,7648 0,0000
C -8,26851 11,7623 -0,702968 0,4838
Anlisis de Varianza
Fuente Suma de Cuadrados Gl Cuadrado Medio Razn-F Valor-P
Modelo 1486,91 2 743,455 570,28 0,0000
Residuo 126,456 97 1,30367
Total (Corr.) 1613,37 99

R-cuadrada = 92,162 porciento


R-cuadrado (ajustado para g.l.) = 92,0004 porciento
Error estndar del est. = 1,14178
Error absoluto medio = 0,953523
Estadstico Durbin-Watson = 1,73806 (P=0,0929)
Autocorrelacin de residuos en retraso 1 = 0,109331

La regresin que se obtendra seria la siguiente:

Col_3 = 152,598 - 0,0813895*X3 - 8,26851*C

Debido a que el parmetro C no es significativo, se debera considerar eliminarlo.


Anexo
Datos Problema 1.

X1 A1 Col_3 X1 A1 Col_3 X1 A1 Col_3


1 879,63 -1,078 56,88536 35 944,601 1,0276 65,48766 68 983,6 0,0023 68,3625
2 917,55 0,8847 62,64012 36 947,684 -1,311 63,45775 69 860,32 1,1911 57,22354
3 918,3 1,8106 63,64056 37 903,295 1,1627 61,49224 70 956,86 1,147 66,8325
4 914,88 1,1312 62,61956 38 849,486 1,1698 56,11839 71 911,65 0,7668 61,93171
5 878,5 -1,158 56,6924 39 858,844 1,6597 57,54411 72 854,91 -0,496 54,99441
6 940,01 0,4572 64,45833 40 883,619 -2,412 55,94992 73 886,79 0,324 59,00292
7 903,65 1,0305 61,39568 41 944,574 0,6329 65,09028 74 876,92 -2,033 55,65813
8 1012,7 -1,913 69,35753 42 938,84 0,9475 64,83155 75 880,94 0,0235 58,11724
9 915,16 -0,507 61,00958 43 953,303 -0,176 65,15454 76 918,08 -1,191 60,61657
10 826,17 -0,2 52,41618 44 913,94 0,4622 61,85617 77 949,23 -1,077 63,84674
11 931,56 0,7244 63,88014 45 932,251 0,808 64,03311 78 809,49 1,2216 52,17067
12 888,25 0,824 59,64938 46 832,999 -0,772 52,52791 79 855,52 -0,261 55,29078
13 897,62 -0,699 59,06231 47 853,131 0,6341 55,94722 80 938,28 -1,194 62,63377
14 912,87 0,1619 61,44861 48 857,563 0,7559 56,51223 81 867,73 1,2678 58,04099
15 830,36 -0,321 52,71523 49 954,057 -0,855 64,55061 82 903,81 0,169 60,55031
16 830,32 -2,962 50,0702 50 905,637 0,2752 60,83893 83 861,15 0,5548 56,66936
17 899,07 -1,326 58,58148 51 862,905 -1,832 54,45815 84 867,75 0,3434 57,1187
18 974,29 -0,352 67,07747 52 985,303 1,0234 69,55374 85 906,83 -0,826 59,85672
19 969,49 0,1092 67,05809 53 927,593 -0,863 61,896 86 898,46 -0,612 59,23425
20 914,52 -0,409 61,04231 54 790,941 -0,382 48,71225 87 896,36 1,2784 60,91469
21 928,92 -0,529 62,36305 55 948,838 2,1719 67,05573 88 916,12 0,2298 61,84132
22 866,5 1,1044 57,75467 56 945,034 0,0011 64,50452 89 906,74 0,3509 61,02487
23 906,64 1,6172 62,28116 57 883,758 0,4417 58,81751 90 887,29 -1,397 57,33231
24 846,13 0,0145 54,62729 58 935,964 -1,517 62,079 91 888,11 1,4057 60,21695
25 809,71 -0,913 50,05793 59 905,661 1,068 61,63406 92 903,11 -2,565 57,74577
26 858,79 0,113 55,99152 60 949,608 0,0752 65,036 93 975,26 0,3358 67,86212
27 860,44 0,3519 56,39573 61 869,132 -0,466 56,44758 94 835,96 -1,195 52,40054
28 849,69 -0,048 54,9212 62 846,75 -0,034 54,64057 95 904,79 -0,828 59,65113
29 853,38 -0,076 55,26242 63 902,156 2,4373 62,65285 96 929,98 -0,656 62,34176
30 931,58 0,2237 63,38189 64 911,57 -0,844 60,31258 97 938,59 -0,16 63,69937
31 800,81 0,4942 50,57498 65 1039,01 1,1653 75,06625 98 819,52 1,229 53,1806
32 928,26 0,2211 63,04715 66 970,743 -1,482 65,59262 99 904,84 -0,991 59,49255
33 909,07 1,9355 62,84282 67 843,644 -0,647 53,71707 100 905,17 0,1023 60,61892
34 949,02 0,1924 65,09442
Datos Problema 2.

X3 A3 Col_3 C X3 A3 Col_3 C
1 1199,19 48,011 52,0758 0,109146 26 1174,38 51,1319 57,1815 0,0939205
2 1147,46 51,1068 59,31 0,118986 27 1208,54 49,9675 53,2843 0,112648
3 1230,59 51,4608 53,0136 0,0856693 28 1217,35 48,9255 51,5375 0,109617
4 1210,67 48,311 51,4574 0,0858026 29 1203,82 47,5763 51,2707 0,0919502
5 1274,72 51,3214 49,3438 0,0783922 30 1150,95 50,3641 58,2881 0,104573
6 1179,61 49,3075 54,9387 0,101222 31 1179,58 49,9068 55,5404 0,0953403
7 1175,59 51,3431 57,2959 0,0962492 32 1208,6 50,0736 53,3856 0,0979982
8 1158,55 50,517 57,833 0,123582 33 1124,32 50,8959 60,9503 0,100467
9 1213,17 50,8166 53,763 0,0943534 34 1174,08 51,7491 57,8227 0,1004
10 1174,2 51,8082 57,8722 0,101318 35 1215,28 48,5298 51,3074 0,0852083
11 1215,42 51,4136 54,18 0,0970171 36 1239,27 50,8446 51,703 0,10603
12 1229,49 49,8536 51,4944 0,0813282 37 1213,15 49,1188 52,0668 0,09406
13 1316,95 48,3362 42,9802 0,0926527 38 1224,72 50,8089 52,8313 0,0866716
14 1244,63 48,3571 48,7867 0,102249 39 1238,91 51,145 52,0322 0,106904
15 1168,79 51,2046 57,7014 0,0924514 40 1122,21 50,0227 60,2459 0,0963532
16 1164,97 49,3873 56,1897 0,0945136 41 1175,45 51,1479 57,1119 0,116425
17 1277,78 50,1714 47,949 0,0899687 42 1206,14 50,7629 54,2717 0,0951707
18 1197,91 48,8267 52,9939 0,108427 43 1250,38 50,9483 50,9179 0,109626
19 1241,22 48,0516 48,754 0,0924627 44 1232,15 51,1317 52,5597 0,0849819
20 1174,21 50,4988 56,562 0,0980937 45 1285,62 48,5241 45,6745 0,1204
21 1237,85 51,1307 52,1027 0,11275 46 1153,8 49,0721 56,7681 0,107957
22 1258,98 47,991 47,2726 0,107573 47 1126,2 50,5337 60,4377 0,113546
23 1139,23 48,5747 57,4363 0,087215 48 1120,23 50,1203 60,5019 0,107428
24 1145,1 49,9555 58,3475 0,103981 49 1237,18 52,1973 53,2229 0,081654
25 1179,32 50,8983 56,5527 0,110752 50 1185,35 49,5296 54,7016 0,109083
Datos Problema 2. Continuacin

X3 A3 Col_3 C X3 A3 Col_3 C
51 1120,02 48,5297 58,9281 0,103654 76 1236,41 52,2761 53,3633 0,100227
52 1181,23 48,6468 54,1484 0,0924491 77 1279,06 49,1638 46,839 0,118545
53 1179,05 50,0211 55,6971 0,0886011 78 1248,53 50,2745 50,3921 0,107349
54 1185,68 51,0156 56,1612 0,096692 79 1185,3 49,3516 54,5276 0,0961595
55 1151,25 50,3883 58,2883 0,111647 80 1203,7 47,6851 51,3891 0,102337
56 1239,29 50,4479 51,3047 0,101147 81 1205,16 49,3465 52,9337 0,0926793
57 1235,84 50,4404 51,5732 0,103772 82 1279,15 50,8071 48,4751 0,100285
58 1240,16 49,1853 49,9725 0,0915924 83 1135,18 49,9607 59,1463 0,101721
59 1197,9 49,1713 53,3393 0,117946 84 1180,67 51,5594 57,1058 0,0999343
60 1211,25 49,4231 52,5231 0,105348 85 1151,27 50,7877 58,6861 0,0981668
61 1166,61 48,7879 55,4591 0,0942503 86 1243,16 52,0297 52,5769 0,0983421
62 1156,63 49,3603 56,8299 0,102303 87 1272,04 50,7655 49,0023 0,0972052
63 1200,71 51,2771 55,2203 0,0940299 88 1199,43 51,4394 55,485 0,102496
64 1185,9 51,0098 56,1378 0,0861623 89 1220,15 49,9361 52,3241 0,110592
65 1107,62 49,1307 60,5211 0,0862252 90 1202,07 49,9306 53,765 0,102586
66 1224,5 49,9152 51,9552 0,0995406 91 1242,39 51,0708 51,6796 0,109949
67 1208,42 49,3464 52,6728 0,0938631 92 1186,24 50,0556 55,1564 0,121903
68 1282,95 48,7732 46,1372 0,109997 93 1178,69 50,1234 55,8282 0,0890475
69 1200,75 49,2929 53,2329 0,110714 94 1242,27 50,2894 50,9078 0,110451
70 1264,37 49,9291 48,7795 0,0928358 95 1183,73 48,5201 53,8217 0,0907277
71 1146,88 51,1833 59,4329 0,0927643 96 1128,58 51,6987 61,4123 0,0918539
72 1365,08 49,5445 40,3381 0,095805 97 1143,51 51,922 60,4412 0,0932198
73 1185,02 49,4018 54,6002 0,100704 98 1198,2 51,2318 55,3758 0,099003
74 1194,62 50,337 54,7674 0,117972 99 1215,73 51,5412 54,2828 0,0963308
75 1086,5 48,7871 61,8671 0,103395 100 1206,8 51,299 54,755 0,0973622