Академический Документы
Профессиональный Документы
Культура Документы
Presentado por:
Agustn Cardona Naranjo
Docente:
Julio Fernando Suarez Cifuentes
Objetivos
1. Aplicar por lo menos una variable contina a casos reales de la ingeniera qumica
(exponencial).
2. Aplicar un caso de ingeniera a una variable discreta (poisson).
3. A un caso o proceso de ingeniera aplicar los conceptos de regresin lineal vistos en
la clase de probabilidad y estadstica.
Objetivos especficos del objetivo 3:
3.1 A las variables de la regresin lineal hacer el anlisis con logaritmo.
INTRODUCCIN
En el presente trabajo se tratara de modelar algunos casos de la ingeniera con
distribuciones de probabilidad y de regresin lineal, para ello se baso en la consulta del
material bibliogrfico para poder tener un respaldo solido. de esta forma se desarrolla los
casos de estudio y poder cumplir con los objetivos planteados, de tal forma se obtuvo un
anlisis serio de las variables involucradas, por lo que la dinmica del trabajo ser definir y
explicar las variables obtenidas y hacer un anlisis de los resultados obtenidos durante el
transcurso del trabajo.
VARIABLE CONTINUA: DISTRIBUCIN EXPONENCIAL
Revisin Bibliogrfica:
La distribucin exponencial es una distribucin continua de probabilidad para describir el
tiempo que se tarda en realizar una actividad. Esta distribucin es un caso especial de la
distribucin gamma. Esta funcin se usa para modelar las vidas de las bateras, de
transistores, de valeros, etc. Una variable aleatoria exponencial puede ser usada para medir
el tiempo que transcurre entre las ocurrencias de un evento.
Una variable aleatoria continua X se dice que est exponencialmente distribuida si su
funcin de densidad es:
Para X 0, 0
Donde: es un parmetro de la distribucin, y e una constante igual a 2.71828
X y s2 de la variable aleatoria exponencial X son E(X) = 1/ y V(X) = 1/2,
respectivamente. Se puede demostrar que el promedio y la desviacin estndar de una
distribucin exponencial son iguales el uno al otro, esto es: = = 1/.
Por otro lado, Keller et al. (1990) afirma que, en el caso de una variable aleatoria
exponencial X, se puede demostrarse que la probabilidad de que X pueda tomar un valor
P(X a) =
dx = -
P(X a) = 1
P(X a) =
CASO DE ESTUDIO TOMADO DEL ARTCULO: METABOLIC AND PROCESS
ENGINEERING OF CLOSTRIDIUM CELLULOVORANS FOR BIOFUEL
PRODUCTION FROM CELLULOSE.
Revisin Bibliogrfica.
La grafica 1 muestra que mientras se consume la celulosa, se produce acido butrico para la
posterior produccin de butanol y acido actico intermediario para la produccin de etanol
segn el ciclo de la bacteria mencionada en el artculo (clostridium Cellulovorans), se
escoge la celulosa y no la glucosa porque con una menor concentracin de celulosa en g/l,
se obtiene los mismos productos que con glucosa. Por lo que para completar la tarea
metablica o actividad de produccin se hace lo mismo con menos materia prima.
4
0
Celulosa
Tiempo<-c(0,25,49,68,91);Tiempo
Celulosa<-c(8.87,7,4.25,1.26,0);Celulosa
20
40
60
80
Tiempo
Entonces: sea x una variable aleatoria que indica la duracin de celulosa si se sabe que la
duracin media para degradar los compuestos celulsicos es de 91 horas (tiempos iguales
para el consumo total tanto de celulosa como glucosa a las condiciones planteadas por el
artculo al que se hace mencin al principio).
Primero defino los intervalos para calcular las probabilidades intervalo=91/7=13 por lo que
se eligen 8 intervalos a continuacin se hace la siguiente tabla:
X~Exponencial(=
Gx(x)=
0.1154
0.2485
26-39
0.1000
0.3485
39-52
0.0867
0.4352
52-65
0.0752
0.5104
65-78
0.0652
0.5756
78-91
0.0565
0.6321
91 +
0.3679
1.0000
Cdigo
>pexp(c(13), rate=1/91, lower.tail=TRUE)
[1] 0.1332459
Anlisis
La probabilidad puntual de que se consuma
el sustrato entre 0-13 horas es del 13.3246
%
> pexp(c(26), rate=1/91, lower.tail=TRUE) La probabilidad acumulada de que se
consuma el sustrato entre 0-26 horas es del
[1] 0.2487374
24.8737 %
> pexp(c(39), rate=1/91, lower.tail=TRUE) La probabilidad acumulada de que se
consuma el sustrato entre 0-39 horas es del
[1] 0.3488401
34. 8840%
> pexp(c(52), rate=1/91, lower.tail=TRUE) La probabilidad acumulada de que se
consuma el sustrato entre 0-52 horas es del
[1] 0.4356045
43.5604 %
> pexp(c(65), rate=1/91, lower.tail=TRUE) La probabilidad acumulada de que se
consuma el sustrato entre 0-65 horas es del
[1] 0.5108079
51.0810 %
> pexp(c(78), rate=1/91, lower.tail=TRUE) La probabilidad acumulada de que se
consuma el sustrato entre 0-78 horas es del
[1] 0.5759907
57.5991 %
Intervalo (0-91)=0,6325 acumulada La probabilidad acumulada de que se
consuma el sustrato entre 0-91 horas es del
hasta ese putno
63.25%.
>pexp(c(91),rate=1/91, lower.tail=FALSE) La probabilidad acumulada de que se
consuma el sustrato entre 91 horas o ms es
[1] 0.3675117
del 100% y la puntual del 36.7512%.
Tabla 3. Anlisis de Probabilidades puntuales y acumuladas a 8 intervalos de tiempo
VARIABLE DISCRETA: DISTRIBUCIN DE POISSON
Fundamentos para realizar el ejercicio (Revisin Bibliogrfica):
La distribucin Poisson es una distribucin de probabilidad discreta, porque se forma
contando algo. La distribucin de Poisson fue desarrollada por el francs Simeon Denis
Poisson, quin la describi en 1837.
Aplicaciones de la distribucin de Poisson:
1. Las aplicaciones de la distribucin pueden ser enfocadas a estudiar el nmero de txicos
encontrados en un volumen de aire emitido por una industria (contaminacin del aire).
Otras aplicaciones son en la meteorologa, para encontrar la frecuencia imprevista de
tempestades, ciclones, tornados, granizadas, inundaciones, fuegos forestales, etc., en ciertas
regiones del mundo. Otras aplicaciones importantes de la distribucin de Poisson son para
encontrar el nmero de accidentes, entre los trabajadores, como por ejemplo, en una
industria, en estudios de higiene industrial y seguridad entre otros.
Condiciones que se requieren para aplicar la distribucin de Poisson:
1. Un experimento consiste en contar el nmero de veces de que un cierto evento ocurra
(x), durante una unidad de tiempo o espacio.
2. La probabilidad de que un evento ocurra es pequea para cada unidad de tiempo o
espacio.
3. El nmero de eventos que ocurran en una unidad de tiempo o espacio es
independiente del nmero de eventos que ocurren en las otras susodichas unidades.
4. Tericamente, un nmero infinito de ocurrencias del evento deben ser posibles en el
intervalo.
Funciones probabilsticas de la distribucin Poisson:
Cuando la distribucin de Poisson es apropiada, la probabilidad de observar
exactamente x nmero de ocurrencias por unidad de medicin (horas, minutos,
centmetros cbicos, pginas, etc.), es decir, el nmero de resultados que ocurren en un
intervalo de tiempo dado o en una regin especfica, se encuentra usando las ecuaciones
de abajo:
Donde:
= promedio de ocurrencias por intervalo = np
Donde: n = tamao de la muestra
p = la probabilidad
e = 2.71828... (Base de los logaritmos Neperianos)
x = 0, 1, 2,....., , es decir, los valores de la variable aleatoria X, esto es, el nmero de
resultados que ocurren en un intervalo de tiempo.
De acuerdo a la frmula de arriba, la distribucin de Poisson tiene un solo parmetro
simbolizado por la letra griega . Si conocemos este valor del promedio podemos
escribir la distribucin de probabilidad completa. Este parmetro puede ser
interpretado como el promedio de las ocurrencias, por intervalo de tiempo o espacio que
caracteriza el proceso generado por la distribucin de Poisson.
Donde:
= np es una constante dada. Es el nmero promedio de resultados por unidad de tiempo o
regin. Aqu, debido a que es positiva para todos los posibles valores de X, entonces:
Grafica 6. Presin y tiempo de deformacin (se debe pasar a tiempo), lectura de para
hallar tiempo.
A 1650C y 90MPa con una media de 0.5 de deformados el tiempo para la formacin de las
microestructuras (Nota: se aclara que en la grafica esta a diferentes presiones a las cuales se
forman las microestructuras); en todos los casos siguen una distribucin de poisson, para
ese punto el tiempo es igual a:
(Dato ledo de la tabla 6), Con este dato encontramos el tiempo en el cual
ocurren las deformaciones para esta temperatura a la presin dada, entonces se calcula de
la siguiente manera:
Donde
entonces
si lo pasamos a horas
Son:
Cabe resaltar que no tienen el mismo comportamiento de tiempo. Para todos los casos solo
basta con observar la lnea que se trazo, paso por los tres intervalos de temperatura tocando
todos los puntos a pesar de estar a diferentes temperaturas pero a la misma presin pero
variando en el tiempo, con un promedio de deformacin de cristales de 0.5 m.
Ahora se cuenta que la deformacin del proceso tiene un promedio de 0,5m cada 5.76
horas a la temperatura y presin dadas (tambin cabe resaltar que el promedio se mantiene
por todo el proceso a pesar de que las presiones y temperaturas cambien pero para mi caso
lo trabaje a 1650C y 90MPa); cabe resaltar que los intervalos de tiempo son diferentes
para las tres temperaturas.
X: variable aleatoria que denota la deformacin por unidad de tiempo.
Ahora puedo hacer la siguiente pregunta Cul es la probabilidad de que un policristal se
deforme 0.5m durante un tiempo cualquiera?, y esto se explica por la difusin y
transferencia de calor ya que el calor debe penetrar a travez de la estructura del policristal y
en ese transcurso asa el interior de la estructura ocurrirn deformaciones.
Tambin se puede hallar la probabilidad de que se registre distinto nmero de
deformaciones en las mismas 5.76 horas.
El lambda =0.5
Calculando con la funcin de densidad se halla la siguiente tabla para el caso en x vale de
0 m de deformacin hasta 10 m de deformacin: entonces X=1,2,3,4,5,6,7,8,9,10.
x
0
P(x)=f(x)
P(x)
0.6065
0.3033
0.0758
0.0126
0.0016
0.0002
1.3163E-5
9.4018E-7
5.7861E-8
3.2664E-9
10
1.6323E-10
Suma
1.0000
Tabla 4. Probabilidades puntuales
para la deformacin de policristales
Ahora se procede a calcular lo anterior en el cdigo de R:
Cdigo R
Anlisis de resultados
> dpois(0,0.5)
La probabilidad de que un policristal se deforme 0 m a
1650C y 90MPa es del 60.6531%
[1] 0.6065307
> dpois(1,0.5)
La probabilidad de que un policristal se deforme 1 m a
1650C y 90MPa es del 30.3265%
[1] 0.3032653
> dpois(2,0.5)
La probabilidad de que un policristal se deforme 2 m a
1650C y 90MPa es del 7.5816%
[1] 0.07581633
> dpois(3,0.5)
La probabilidad de que un policristal se deforme 3 m a
1650C y 90MPa es del 1.2636%
[1] 0.01263606
> dpois(4,0.5)
La probabilidad de que un policristal se deforme 4 m a
[1] 0.001579507 1650C y 90MPa es del 0.157951% (Pbaja)
> dpois(5,0.5)
La probabilidad de que un policristal se deforme 5 m a
[1] 0.0001579507 1650C y 90MPa es del 0.0157951% ( Pmuy baja)
> dpois(6,0.5)
La probabilidad de que un policristal se deforme 6 m a
[1] 1.316256e-05 1650C y 90MPa es del 0.00131625% (Pmuy baja)
> dpois(7,0.5)
La probabilidad de que un policristal se deforme 7 m a
[1] 9.401827e-07 1650C y 90MPa es del 9.401827e-05% (Pmuy baja)
> dpois(8,0.5)
La probabilidad de que un policristal se deforme 8 m a
[1] 5.876142e-08 1650C y 90MPa es del 5.876142e-06 % (Pmuy baja)
> dpois(9,0.5)
La probabilidad de que un policristal se deforme 9 m a
[1] 3.264523e-09 1650C y 90MPa es del 3.264523e-07% (Pmuy baja)
> dpois(10,0.5)
La probabilidad de que un policristal se deforme 10 m a
[1] 1.632262e-10 1650C y 90MPa es del 1.632262e-08% (Pmuy baja)
Tabla 5. Anlisis Probabilidades puntuales para la deformacin de
policristales
Observando la tabla anterior se puede concluir que los datos calculados con la funcin y los
calculados con el programa R son muy parecidos con la diferencia en que en R el clculo se
hace de inmediato.
Alternativa: Si se da la probabilidad de tener, de manera exacta, (y) ocurrencias en un
intervalo (t) veces mayor o menor que el de referencia en la medicin entonces la
distribucin de probabilidades de Y nmero de xitos en la nueva unidad de referencia
viene dada por:
Anlisis de resultados
La probabilidad de que los policristales se
deformen entre 0.5 m y 1 m en 2 horas es del
36.7879 %.
> c1<-ppois(1,2);c1
[1] 0.4060058
> c2<-(c1-c);c2
[1] 0.2706706
La probabilidad de que los policristales se
>
deformen entre 0.5 m y 1 m en 5 horas es del
> d<-ppois(0,2.5);d
20.5212 %.
[1] 0.082085
> d1<-ppois(1,2.5);d1
[1] 0.2872975
> d2<-(d1-d);d2
[1] 0.2052125
La probabilidad de que los policristales se
>
deformen entre 0.5 m y 1 m en 6 horas es del
> e<-ppois(0,3);e
14.9361 %.
[1] 0.04978707
> e1<-ppois(1,3);e1
[1] 0.1991483
> e2<-(e1-e);e2
[1] 0.1493612
Tabla 6. Anlisis de las probabilidades de deformacin a diferentes
tiempos con un intervalo de deformacin de 0.5 m-1 m de
policristales
MODELO DE REGRESION CON 3 VARIABLES INDEPENDIENTES X1, X2 y X3.
Para este anlisis se busco una referencia bibliogrfica en la base de datos science direct y
se eligi el artculo: H2 production by sorption enhanced steam reforming ofbiomassderived bio-oil in a fluidized bed reactor: An assessment ofthe effect of operation variables
using response surface methodology. Para poder construir mi base de datos. La siguiente
tabla fue extrada de dicho artculo.
1
2
3
4
5
6
Y
65.50
92.48
74.17
94.71
51.86
86.37
X1
90.22
98.77
95.05
99.75
77.74
98.56
X2
94.72
96.53
97.28
96.55
87.35
96.25
X3
516
634
516
634
516
634
516
634
575
475
Rendimiento H2 (% )
500
600
60
75 85 95
75 85 95
20
95
X1
600
85
X2
500
X3
20
60
85
95
Los errores tpicos de los estimadores de los parmetros beta0 y beta1 se encuentran en la
columna Std Error de la salida anterior. En el ejemplo, sus valores son 19.3687 y 0.2098
respectivamente.
La columna t value contiene el estadstico t, es decir, cociente entre cada estimador y su
error tpico. Estos cocientes son la base para llevar a cabo los contrastes (H0: beta0 = 0) y
(H0:beta1 = 0). Los correspondientes p-valores aparecen en la columna Pr (>|t|). En este
caso son muy pequeos por lo que se rechazan ambas hiptesis para los niveles de
significacin habituales. Por lo que los Bj son diferentes de cero y los Xj deben ir en el
modelo. Con un R-Cuadrado de 0.9338 que est muy cercano a 1 por lo que los valores se
ajustan relativamente bien.
> Yest1<-ajuste1$fitted.values # obtener los valores ajustados (estimados) por el modelo
> Error1<- ajuste1$residuals # generar los valores de los errores
> cbind(datos[,1],Yest1,Error1)
originales
Yest1
Error1
65.50
68.94786
-3.447862
1
92.48
88.01028
4.469721
2
74.17
79.71646
-5.546455
3
94.71
90.19521
4.514789
4
51.86
41.12342
10.736577
5
86.37
87.54208
-1.172079
6
64.28
60.43109
3.848913
7
88.33
90.30669
-1.976687
8
85.35
88.12175
-2.771755
9
22.48
31.13516
-8.655162
10
Tabla 12. Valores estimados del rendimiento de
H2 (%)
> mean(Error1) #verificacin de la suma cero
[1] 2.203099e-17 #se puede concluir que es cero
Ahora se procede a verificar el modelo con todos los datos en R:
> datos1<-as.data.frame(datos)
> (ajuste2.lm<-lm(datos[,1]~datos[,2]+datos[,3]+datos[,4]))
> summary(ajuste2.lm)
Call:
Residuals:
Min
1Q
Median
3Q
Max
-3.8386
-1.7701
-0.2681
1.6199
4.6214
Tabla 13. Resumen del rendimiento de H2 (%)
~Selectividad (%)+pureza H2 (Vol. %)+Temperatura(C)
Coefficients:
Estimate
Std. Error
t value
Pr(>|t|)
-330.73119
47.41835
-6.975
0.000432 ***
(Intercept)
-1.13045
0.72982
-1.549
0.172368
datos[, 2]
4.08418
0.97726
4.179
0.005818 **
datos[, 3]
0.21964
0.04512
4.868
0.002800 **
datos[, 4]
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Residual standard error: 3.153 on 6 degrees of freedom
Multiple R-squared: 0.9869, Adjusted R-squared: 0.9803
F-statistic: 150.5 on 3 and 6 DF, p-value: 4.915e-06
Tabla 14.Modelo: rendimiento de H2 (%) ~Selectividad H2 (%)+pureza
H2(Vol.%)+Temperatura(C)
El modelo generado es: Y= -330.7312 1.13045X1+ 4.0842X2 + 0.2196X3
Inferencia en el modelo de regresin simple:
Los errores tpicos de los estimadores de los parmetros beta0 y beta1 se encuentran en la
columna Std Error de la salida anterior. En el ejemplo, sus valores se visualizan en la tabla
14.
La columna t value contiene el estadstico t, es decir, cociente entre cada estimador y su
error tpico. Estos cocientes son la base para llevar a cabo los contrastes (H0: beta0 = 0) y
(H0:beta1 = 0). Los correspondientes p-valores aparecen en la columna Pr (>|t|). En este
caso son muy pequeos por lo que se rechazan ambas hiptesis para los niveles de
significacin habituales. Por lo que los Bj son diferentes de cero y los Xj deben ir en el
modelo. Con un R-Cuadrado de 0.9869 que est muy cercano a 1 por lo que los valores se
ajustan bien (este es el modelo que a pesar de involucrar todas las variables tiene un R
mayor que el resto de los modelos).
Residuals:
Min
1Q
Median
3Q
Max
-8.655
-3.279
-1.574
4.314
10.737
Tabla 16. Resumen del rendimiento de H2 (%)
~Selectividad H2 (%)
Coefficients:
Estimate
Std. Error
t value
Pr(>|t|)
-6.825
0.000134 ***
(Intercept) -132.1996 19.3687
2.2295
0.2098
10.625
5.39e-06 ***
X1
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Residual standard error: 6.134 on 8 degrees of freedom
Multiple R-squared: 0.9338, Adjusted R-squared: 0.9255
F-statistic: 112.9 on 1 and 8 DF, p-value: 5.39e-06
Tabla 17.Modelo: rendimiento de H2 (%) ~Selectividad H2 (%)
El modelo generado es: Y= -132.1996 2.2295 Nota: este modelo ya haba sido hecho
previamente con una variacin del cdigo y se puede observar en la tabla 11, por lo que no
se volver a repetir el anlisis.
> Y2<-lm(Y~X2);summary(Y2)
Call:
lm(formula = Y ~ X2)
Residuals:
Min
1Q
Median
3Q
Max
-11.9261
-6.0040 0.8892
5.2331 11.4362
Tabla 18. Resumen del rendimiento de H2 (%)
~+pureza H2(Vol.%)
Coefficients:
Estimate
Std. Error
t value
Pr(>|t|)
-5.777
0.000416 ***
(Intercept) -290.0031 50.2039
3.8662
0.5346
7.233
8.96e-05 ***
X2
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Residual standard error: 8.684 on 8 degrees of freedom
Multiple R-squared: 0.8674, Adjusted R-squared: 0.8508
Y= -100.1918+ 0.3057X3
Inferencia en el modelo de regresin simple:
Los errores tpicos de los estimadores de los parmetros beta0 y beta1 se encuentran en la
columna Std Error de la salida anterior. En el ejemplo, sus valores se visualizan en la tabla
21.
La columna t value contiene el estadstico t, es decir, cociente entre cada estimador y su
error tpico. Estos cocientes son la base para llevar a cabo los contrastes (H0: beta0 = 0) y
(H0:beta1 = 0). Los correspondientes p-valores aparecen en la columna Pr (>|t|). En este
caso son muy pequeos por lo que se rechazan ambas hiptesis para los niveles de
significacin habituales. Por lo que los Bj son diferentes de cero y los Xj deben ir en el
modelo. Con un R-Cuadrado de 0.7574 este valor no es muy cercano a 1 pero los valores
todava se ajustan relativamente bien.
> Y4<-lm(Y~X1+X2);summary(Y4)
Call:
lm(formula = Y ~ X1 + X2)
Residuals:
Min
1Q
Median 3Q
Max
-7.4496 -4.1058
-0.9335 4.4786 10.2369
Tabla 22. Resumen del rendimiento de H2 (%)
~Selectividad H2 (%)+pureza H2(Vol.%)
Coefficients:
Estimate Std. Error
t value Pr(>|t|)
-2.451
0.0440 *
(Intercept) -153.9622 62.8105
1.9743
0.7307
2.702
0.0306 *
X1
0.4820
1.3148
0.367
0.7248
X2
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Residual standard error: 6.495 on 7 degrees of freedom
Multiple R-squared: 0.9351, Adjusted R-squared: 0.9165
F-statistic: 50.4 on 2 and 7 DF, p-value: 6.976e-05
Tabla 23.Modelo: rendimiento de H2 (%) ~Selectividad H2
(%)+pureza H2 (Vol.%)
Y= -153.9622+ 1.9743X1+ 0.4820X2
Los errores tpicos de los estimadores de los parmetros beta0 y beta1 se encuentran en la
columna Std Error de la salida anterior. En el ejemplo, sus valores se visualizan en la tabla
25.
La columna t value contiene el estadstico t, es decir, cociente entre cada estimador y su
error tpico. Estos cocientes son la base para llevar a cabo los contrastes (H0: beta0 = 0) y
(H0:beta1 = 0). Los correspondientes p-valores aparecen en la columna Pr (>|t|). En este
caso son muy pequeos por lo que se rechazan ambas hiptesis para los niveles de
significacin habituales. Por lo que los Bj son diferentes de cero y los Xj deben ir en el
modelo. Con un R-Cuadrado de 0.9487 este valor es cercano a 1 los valores se ajustan
relativamente bien al modelo lineal.
> Y6<-lm(Y~X2+X3);summary(Y6)
Call:
lm(formula = Y ~ X2 + X3)
Residuals:
Min
1Q
Median
3Q
Max
-3.6151 -2.2802 -0.7828 2.9898 3.9456
Tabla 26. Resumen del rendimiento de H2
(%) ~pureza H2 (Vol. %)+Temperatura(C)
Coefficients:
Estimate
Std. Error t value
Pr(>|t|)
20.37920
-12.914
3.88e-06 ***
(Intercept) -263.17230
2.62467
0.28389
9.245
3.58e-05 ***
X2
0.15857
0.02403
6.600
0.000304 ***
X3
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Residual standard error: 3.454 on 7 degrees of freedom
Multiple R-squared: 0.9816, Adjusted R-squared: 0.9764
F-statistic: 187.1 on 2 and 7 DF, p-value: 8.393e-07
Tabla
27.Modelo:
rendimiento
de
H2
(%)
~pureza
H2(Vol.%)+Temperatura(C)
Y= -263.1723+ 2.6247X2+ 0.1586X3
Inferencia en el modelo de regresin simple:
Los errores tpicos de los estimadores de los parmetros beta0 y beta1 se encuentran en la
columna Std Error de la salida anterior. En el ejemplo, sus valores se visualizan en la tabla
27.
La columna t value contiene el estadstico t, es decir, cociente entre cada estimador y su
error tpico. Estos cocientes son la base para llevar a cabo los contrastes (H0: beta0 = 0) y
(H0:beta1 = 0). Los correspondientes p-valores aparecen en la columna Pr (>|t|). En este
caso son muy pequeos por lo que se rechazan ambas hiptesis para los niveles de
significacin habituales. Por lo que los Bj son diferentes de cero y los Xj deben ir en el
modelo. Con un R-Cuadrado de 0.9816 este valor es cercano a 1 los valores se ajustan
relativamente bien al modelo lineal.
> Y7<-lm(Y~X1+X2+X3);summary(Y7)
Call:
lm(formula = Y ~ X1 + X2 + X3)
Residuals:
Min
1Q
Median
3Q
Max
-3.8386 -1.7701 -0.2681 1.6199 4.6214
Tabla 28. Resumen del rendimiento de H2
(%)
~Selectividad
H2
(%)+pureza
H2(Vol.%)+Temperatura(C)
Coefficients:
Estimate
Std. Error
t value
Pr(>|t|)
-6.975
0.000432 ***
(Intercept) -330.73119 47.41835
-1.13045
0.72982
-1.549
0.172368
X1
4.08418
0.97726
4.179
0.005818 **
X2
0.21964
0.04512
4.868
0.002800 **
X3
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Residual standard error: 3.153 on 6 degrees of freedom
Multiple R-squared: 0.9869, Adjusted R-squared: 0.9803
F-statistic: 150.5 on 3 and 6 DF, p-value: 4.915e-06
Tabla 29.Modelo: rendimiento de H2 (%) ~Selectividad H2 (%)+pureza
H2 (Vol.%)+Temperatura(C)
El modelo generado es: Y= -330.7312 1.13045X1+ 4.0842X2 + 0.2196X3 Nota: no
repito el anlisis ya que esta hecho en la tabla 14. (Se puede concluir que este es el modelo
que mejor ajusta los datos teniendo en cuenta que se tienen 3 variables independientes).
Ahora se hace un anlisis con regresin no lineal aplicando log para cumplir con el objetivo
especfico 3.1:
> Y8<-lm(log(Y)~log(X1));summary(Y8)
Call:
lm(formula = log(Y) ~ log(X1))
Residuals:
Min
1Q
Median 3Q
Max
-0.31127 -0.05465 -0.01217
0.02477 0.31102
Tabla 30. Resumen del log rendimiento de H2 (%) ~log
Selectividad H2 (%)
Coefficients:
Estimate Std. Error
t value
Pr(>|t|)
-5.332
7e-04 ***
(Intercept) -12.0316 2.2563
3.5993
0.4996
7.204
9.21e-05 ***
log(X1)
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Residual standard error: 0.1681 on 8 degrees of freedom
Multiple R-squared: 0.8664, Adjusted R-squared: 0.8497
F-statistic: 51.89 on 1 and 8 DF, p-value: 9.211e-05
Tabla 31.Modelo: log rendimiento de H2 (%) ~log Selectividad H2
(%)
Para el caso de log se puede observar que el R-cuadrado baja con respecto al modelo que
hizo previamente a los datos de la base sin ningn tipo de tratamiento previo para hallar el
modelo, este comportamiento tambin se repite para el resto de los datos, cabe resaltar que
los p-valores son bajos Por lo que los Bj son diferentes de cero y los Xj deben ir en el
modelo. Los modelos que se obtienen a continuacin como ya se haba mencionado
presentan la misma tendencia que el modelo de la tabla 31(salvo unas excepciones). Y se
observaran a continuacin.
> Y9<-lm(log(Y)~log(X2));summary(Y9)
Call:
lm(formula = log(Y) ~ log(X2))
Residuals:
Min
1Q
Median
3Q Max
-0.17322 -0.14023 0.04800
0.09086 0.20592
Tabla 32. Resumen del log rendimiento de H2 (%) ~log
pureza H2 (vol. %)
Coefficients:
Estimate
Std. Error
t value
Pr(>|t|)
-26.8519
3.5993
-7.460
7.19e-05 ***
(Intercept)
6.8445
0.7929
8.633
2.51e-05 ***
log(X2)
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Residual standard error: 0.1432 on 8 degrees of freedom
Multiple R-squared: 0.9031, Adjusted R-squared: 0.8909
F-statistic: 74.53 on 1 and 8 DF, p-value: 2.515e-05
Tabla 33.Modelo: log rendimiento de H2 (%) ~log pureza H2 (vol. %)
Log*(Y= -26.8519+ 6.8445X2) este modelo ajusta mejor los datos involucrados que el
modelo que se observa en la tabla 19.
Inferencia en el modelo de regresin simple:
Los errores tpicos de los estimadores de los parmetros beta0 y beta1 se encuentran en la
columna Std Error de la salida anterior. En el ejemplo, sus valores se visualizan en la tabla
33.
La columna t value contiene el estadstico t, es decir, cociente entre cada estimador y su
error tpico. Estos cocientes son la base para llevar a cabo los contrastes (H0: beta0 = 0) y
(H0:beta1 = 0). Los correspondientes p-valores aparecen en la columna Pr (>|t|). En este
caso son muy pequeos por lo que se rechazan ambas hiptesis para los niveles de
significacin habituales. Por lo que los Bj son diferentes de cero y los Xj deben ir en el
modelo. Con un R-Cuadrado de 0.9031 que es cercano a 1 por lo que los valores todava se
ajustan relativamente bien.
> Y10<-lm(log(Y)~log(X3));summary(Y10)
Call:
lm(formula = log(Y) ~ log(X3))
Residuals:
Min
1Q
Median
3Q
Max
-0.59597 -0.09251 -0.02281
0.19205 0.34644
Tabla 34. Resumen del log rendimiento de H2 (%)~log
Temperatura(C)
Coefficients:
Estimate Std. Error
t value
Pr(>|t|)
5.1832
-2.894
0.02007 *
(Intercept) -15.0006
3.0356
0.8186
3.708
0.00597 **
log(X3)
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Residual standard error: 0.2789 on 8 degrees of freedom
Multiple R-squared: 0.6322, Adjusted R-squared: 0.5862
F-statistic: 13.75 on 1 and 8 DF, p-value: 0.005971
Tabla 35.Modelo:log rendimiento de H2 (%)~log Temperatura(C)
El modelo que se visualiza en la tabla 35, no es mejor modelo que el que se encuentra en la
tabla 21. Por lo que me quedo con el anlisis de la tabla 21.
> Y11<-lm(log(Y)~log(X1)+log(X2));summary(Y11)
Call:
lm(formula = log(Y) ~ log(X1) + log(X2))
Residuals:
Min
1Q
Median
3Q
Max
-0.17729 -0.11856 0.02764 0.07664 0.24076
Tabla 36. Resumen del log rendimiento de H2 (%)
~log selectividad H2 (%)+log pureza H2(Vol.%)
Coefficients:
Estimate
Std. Error
t value
Pr(>|t|)
6.7699
-3.469
0.0104 *
(Intercept) -23.4847
0.9368
1.5674
0.598
0.5689
log(X1)
5.1711
2.9196
1.771
0.1198
log(X2)
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Residual standard error: 0.1493 on 7 degrees of freedom
Multiple R-squared: 0.9078, Adjusted R-squared: 0.8814
F-statistic: 34.45 on 2 and 7 DF, p-value: 0.0002383
Estimate
Std. Error t value
Pr(>|t|)
3.3752
-3.785
0.00685 **
(Intercept) -12.7750
3.3541
0.9470
3.542
0.00945 **
log(X1)
0.2923
0.9350
0.313
0.76369
log(X3)
Signif. Codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Residual standard error: 0.1785 on 7 degrees of freedom
Multiple R-squared: 0.8683, Adjusted R-squared: 0.8306
F-statistic: 23.07 on 2 and 7 DF, p-value: 0.0008297
Tabla 39.Modelo: log rendimiento de H2 (%) ~log selectividad H2
(%)+log Temperatura(C)
El modelo que se visualiza en la tabla 39, no es mejor modelo que el que se encuentra en la
tabla 25. Por lo que me quedo con el anlisis de la tabla 25.
> Y13<-lm(log(Y)~log(X2)+log(X3));summary(Y13)
Call:
lm(formula = log(Y) ~ log(X2) + log(X3))
Residuals:
Min
1Q
Median
3Q
Max
-0.16244 -0.03676 -0.01765 0.03098 0.20151
Tabla 40. Resumen del log rendimiento de H2 (%)
~log pureza H2 (Vol.%)+log Temperatura(C)
Coefficients:
Estimate
Std. Error
t value
Pr(>|t|)
-27.3845
2.9301
-9.346
3.34e-05 ***
(Intercept)
5.4891
0.8779
6.253
0.000423 ***
log(X2)
1.0560
0.4653
2.269
0.057542
log(X3)
Signif. Codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Residual standard error: 0.1162 on 7 degrees of freedom
Multiple R-squared: 0.9441, Adjusted R-squared: 0.9282
F-statistic: 59.16 on 2 and 7 DF, p-value: 4.118e-05
Tabla 41.Modelo: log rendimiento de H2 (%) ~log pureza H2 (Vol. %)+log
Temperatura(C)
El modelo que se visualiza en la tabla 41, no es mejor modelo que el que se encuentra en la
tabla 27. Por lo que me quedo con el anlisis de la tabla 27.
> Y14<-lm(log(Y)~log(X1)+log(X2)+log(X3));summary(Y14)
Call:
lm(formula = log(Y) ~ log(X1) + log(X2) + log(X3))
Residuals:
Min
1Q
Median
3Q
Max
-0.120893 -0.031666
0.004532 0.036873 0.072390
Tabla 42. Resumen del log rendimiento de H2 (%) ~log
selectividad H2 (%)+log pureza H2 (Vol. %)+log
Temperatura(C)
Coefficients:
Estimate
Std. Error
t value
-46.1663
5.6036
-8.239
(Intercept)
-4.9984
1.4121
-3.540
log(X1)
12.3440
2.0104
6.140
log(X2)
2.6719
0.5387
4.960
log(X3)
Signif. Codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Pr(>|t|)
0.000173 ***
0.012225 *
0.000854 ***
0.002553 **
datos a la regresin lineal que los dems modelos, tambin cabe resaltar que los valores
estimados de la tabla 15 son muy cercanos a los valores que tenamos en un principio en
nuestra base de datos, cabe resaltar que cuando se hace el anlisis con log al modelo en
algunos casos mejora un poco la correlacin, pero nunca fue superior al modelo presentado
en la tabla 14. Por lo que el tratamiento de los datos con log en este caso no es necesario, ya
que los datos se ajustan bien sin ningn tipo de transformacin adicional.
Finalmente la estadstica con distribuciones y modelos de regresin ayudan a estructurar
mejor el anlisis de los procesos y eventos en la ingeniera no solo en la qumica si no en
todas las disciplinas en donde se relacione la observacin de lo que esta sucediendo.
Bibliografa
1- Xiaorui Yang, Mengmeng Xu, Shang-Tian Yang n. Metabolic and process
engineering of Clostridium cellulovorans for biofuel production from cellulose.
Department of Chemical and Biomolecular Engineering and Department of
Molecular Genetics, The Ohio State University, 151 West Woodruff Avenue,
Columbus, OH 43210, USA. Metabolic Engineering 32 (2015) 3948.
2- Mara V. Gila,b, Javier Fermosoc, Fernando Rubieraa, De Chenb,. H2production
Web-grafa
3- Araya alpizar carlomangno. Estadistica para laboratorista qumico. Recuperado
de:https://books.google.com.co/books?id=IibtfIBQLMoC&pg=PA54&lpg=PA54&
dq=como+aplicar+la+distribuci%C3%B3n+de+poisson+en+quimica&source=bl&o
ts=gl8sf0ArE&sig=VHq2arhdScbfi8aYLLqXhl4_eZM&hl=es&sa=X&ved=0ahUK
Ewiyjrv_9bPJAhWCKiYKHTmzDMEQ6AEIJDAB#v=onepage&q=como%20apli
car%20la%20distribuci%C3%B3n%20de%20poisson%20en%20quimica&f=false
4- Recuperadode:http://materiales.unex.es/miembros/personal/jjmelendez/ES/Investiga
ci%C3%B3n-ES.html
5- Recuperadode:http://www.virtual.unal.edu.co/cursos/ciencias/2001065/html/un2/co
nt_232_74.html
6- Recuperadode:https://www.uam.es/personal_pdi/ciencias/joser/paginaR/regresion.ht
ml.
7- Recuperadode:http://ldc.usb.ve/~moises/estadistica/Ej_Regresion_Lineal_Multiple_
Zoritza.pdf.