Trabajo Final de Probabilidad y Estadística

Trabajo final de probabilidad y estadstica
Ejemplos de las distribuciones y regresin lineal en la ingeniera qumica
Presentado por:
Agustn Cardona Naranjo
Docente:
Julio Fernando Suarez Cifuentes
Universidad Nacional de Colombia-Sede Manizales
Objetivos
1. Aplicar por lo menos una variable contina a casos reales de la ingeniera qumica
(exponencial).
2. Aplicar un caso de ingeniera a una variable discreta (poisson).
3. A un caso o proceso de ingeniera aplicar los conceptos de regresin lineal vistos en
la clase de probabilidad y estadstica.
Objetivos especficos del objetivo 3:
3.1 A las variables de la regresin lineal hacer el anlisis con logaritmo.
INTRODUCCIN
En el presente trabajo se tratara de modelar algunos casos de la ingeniera con
distribuciones de probabilidad y de regresin lineal, para ello se baso en la consulta del
material bibliogrfico para poder tener un respaldo solido. de esta forma se desarrolla los
casos de estudio y poder cumplir con los objetivos planteados, de tal forma se obtuvo un
anlisis serio de las variables involucradas, por lo que la dinmica del trabajo ser definir y
explicar las variables obtenidas y hacer un anlisis de los resultados obtenidos durante el
transcurso del trabajo.
VARIABLE CONTINUA: DISTRIBUCIN EXPONENCIAL
Revisin Bibliogrfica:
La distribucin exponencial es una distribucin continua de probabilidad para describir el
tiempo que se tarda en realizar una actividad. Esta distribucin es un caso especial de la
distribucin gamma. Esta funcin se usa para modelar las vidas de las bateras, de
transistores, de valeros, etc. Una variable aleatoria exponencial puede ser usada para medir
el tiempo que transcurre entre las ocurrencias de un evento.
Una variable aleatoria continua X se dice que est exponencialmente distribuida si su
funcin de densidad es:
Para X 0, 0
Donde: es un parmetro de la distribucin, y e una constante igual a 2.71828
X y s2 de la variable aleatoria exponencial X son E(X) = 1/ y V(X) = 1/2,
respectivamente. Se puede demostrar que el promedio y la desviacin estndar de una
distribucin exponencial son iguales el uno al otro, esto es: = = 1/.
Por otro lado, Keller et al. (1990) afirma que, en el caso de una variable aleatoria
exponencial X, se puede demostrarse que la probabilidad de que X pueda tomar un valor
ms grande que un nmero especificado no negativo a, es e-a. Esto se puede expresar

usando clculo integral, es decir:
P(X a) =
dx = -
El clculo de las funciones exponenciales involucra la evaluacin de integrales de

probabilidad entre los lmites de a y b. Para esto, se da una tabla de probabilidades
exponenciales. Las siguientes frmulas se usan con esa tabla.
P(a X b) =
P(X a) = 1
P(X a) =
CASO DE ESTUDIO TOMADO DEL ARTCULO: METABOLIC AND PROCESS
ENGINEERING OF CLOSTRIDIUM CELLULOVORANS FOR BIOFUEL
PRODUCTION FROM CELLULOSE.
Revisin Bibliogrfica.
La grafica 1 muestra que mientras se consume la celulosa, se produce acido butrico para la
posterior produccin de butanol y acido actico intermediario para la produccin de etanol
segn el ciclo de la bacteria mencionada en el artculo (clostridium Cellulovorans), se
escoge la celulosa y no la glucosa porque con una menor concentracin de celulosa en g/l,
se obtiene los mismos productos que con glucosa. Por lo que para completar la tarea
metablica o actividad de produccin se hace lo mismo con menos materia prima.
Grafica 1. Cintica de fermentacin de naturaleza de tipo C. cellulovorans usando (B),

Celulosa (tomada del articulo).
Para hacer nuestra base de datos se observara el consumo de celulosa hasta que la bacteria
la consumido completamente.
Grafica 2. Observacin de los puntos del consumo de Celulosa en el tiempo para la

construccin de la base de datos para la funcin exponencial (tomada del artculo).
Tiempo (horas)
celulosa (g/l)
8.87
0
7.00
25
4.25
49
1.26
68
0.00
91
Tabla 1. Base de datos del consumo
de la celulosa en horas.
La representacin en R seria de la siguiente forma:
4
0
Celulosa
Tiempo<-c(0,25,49,68,91);Tiempo
Celulosa<-c(8.87,7,4.25,1.26,0);Celulosa
20
40
60
80
Tiempo
Figura 3. Representacin en R del consumo de sustrato (celulosa).
Entonces: sea x una variable aleatoria que indica la duracin de celulosa si se sabe que la
duracin media para degradar los compuestos celulsicos es de 91 horas (tiempos iguales
para el consumo total tanto de celulosa como glucosa a las condiciones planteadas por el
artculo al que se hace mencin al principio).
Primero defino los intervalos para calcular las probabilidades intervalo=91/7=13 por lo que
se eligen 8 intervalos a continuacin se hace la siguiente tabla:
X~Exponencial(=
Gx(x)=
Con la funcin de densidad se obtiene la siguiente grafica desarrollando la integral:

x
Gx(x)
P(Li<=X<=Ls)
Fx(x)
0.1331
0.1331
0-13
13-26
0.1154
0.2485
26-39
0.1000
0.3485
39-52
0.0867
0.4352
52-65
0.0752
0.5104
65-78
0.0652
0.5756
78-91
0.0565
0.6321
91 +
0.3679
1.0000
Tabla 2. Probabilidades puntuales y acumuladas a 8

intervalos de tiempo
En lenguaje R el cdigo queda de la siguiente manera:
Desarrollo en R de la Distribucin Exponencial acumulada a excepcin del primero y el
ltimo que no estn acumuladas:
Cdigo
>pexp(c(13), rate=1/91, lower.tail=TRUE)
[1] 0.1332459
Anlisis
La probabilidad puntual de que se consuma
el sustrato entre 0-13 horas es del 13.3246
%
> pexp(c(26), rate=1/91, lower.tail=TRUE) La probabilidad acumulada de que se
consuma el sustrato entre 0-26 horas es del
[1] 0.2487374
24.8737 %
[1] 0.3488401
34. 8840%
[1] 0.4356045
43.5604 %
[1] 0.5108079
51.0810 %
[1] 0.5759907
57.5991 %
Intervalo (0-91)=0,6325 acumulada La probabilidad acumulada de que se
hasta ese putno
63.25%.
>pexp(c(91),rate=1/91, lower.tail=FALSE) La probabilidad acumulada de que se
consuma el sustrato entre 91 horas o ms es
[1] 0.3675117
del 100% y la puntual del 36.7512%.
Tabla 3. Anlisis de Probabilidades puntuales y acumuladas a 8 intervalos de tiempo
VARIABLE DISCRETA: DISTRIBUCIN DE POISSON
Fundamentos para realizar el ejercicio (Revisin Bibliogrfica):
La distribucin Poisson es una distribucin de probabilidad discreta, porque se forma
contando algo. La distribucin de Poisson fue desarrollada por el francs Simeon Denis
Poisson, quin la describi en 1837.
Aplicaciones de la distribucin de Poisson:
1. Las aplicaciones de la distribucin pueden ser enfocadas a estudiar el nmero de txicos
encontrados en un volumen de aire emitido por una industria (contaminacin del aire).
Otras aplicaciones son en la meteorologa, para encontrar la frecuencia imprevista de
tempestades, ciclones, tornados, granizadas, inundaciones, fuegos forestales, etc., en ciertas
regiones del mundo. Otras aplicaciones importantes de la distribucin de Poisson son para
encontrar el nmero de accidentes, entre los trabajadores, como por ejemplo, en una
industria, en estudios de higiene industrial y seguridad entre otros.
Condiciones que se requieren para aplicar la distribucin de Poisson:
1. Un experimento consiste en contar el nmero de veces de que un cierto evento ocurra
(x), durante una unidad de tiempo o espacio.
2. La probabilidad de que un evento ocurra es pequea para cada unidad de tiempo o
espacio.
3. El nmero de eventos que ocurran en una unidad de tiempo o espacio es
independiente del nmero de eventos que ocurren en las otras susodichas unidades.
4. Tericamente, un nmero infinito de ocurrencias del evento deben ser posibles en el
intervalo.
Funciones probabilsticas de la distribucin Poisson:
Cuando la distribucin de Poisson es apropiada, la probabilidad de observar
exactamente x nmero de ocurrencias por unidad de medicin (horas, minutos,
centmetros cbicos, pginas, etc.), es decir, el nmero de resultados que ocurren en un
intervalo de tiempo dado o en una regin especfica, se encuentra usando las ecuaciones
de abajo:
Donde:
= promedio de ocurrencias por intervalo = np
Donde: n = tamao de la muestra
p = la probabilidad
e = 2.71828... (Base de los logaritmos Neperianos)
x = 0, 1, 2,....., , es decir, los valores de la variable aleatoria X, esto es, el nmero de
resultados que ocurren en un intervalo de tiempo.
De acuerdo a la frmula de arriba, la distribucin de Poisson tiene un solo parmetro
simbolizado por la letra griega . Si conocemos este valor del promedio podemos
escribir la distribucin de probabilidad completa. Este parmetro puede ser
interpretado como el promedio de las ocurrencias, por intervalo de tiempo o espacio que
caracteriza el proceso generado por la distribucin de Poisson.
Otra manera de ver la distribucin de Poisson es usando la funcin dada:

Abajo:
Donde:
= np es una constante dada. Es el nmero promedio de resultados por unidad de tiempo o
regin. Aqu, debido a que es positiva para todos los posibles valores de X, entonces:
CASO DE ESTUDIO TOMADO DEL TEXTO: MECANISMOS DE

DEFORMACIN PLSTICA A ALTA TEMPERATURA DE POLICRISTALES
CERMICOS.
Revisin Bibliogrfica:
Los cermicos avanzados han sido objeto de atencin preferente por parte de cientficos e
ingenieros a lo largo del siglo XX. En gran medida, este inters se basa en las peculiares
propiedades fsicas que algunos de estos sistemas presentan, que los hacen ptimos para
ciertas aplicaciones funcionales; pensemos, por ejemplo, en el UO2 en aplicaciones
nucleares, en el ZrO2 como componente de clulas de combustible o en los YBaCuO
superconductores. Otros cermicos, en cambio, son interesantes por sus potenciales
aplicaciones estructurales; por ejemplo, en 1986 se puso de manifiesto que algunos
cermicos a base de ZrO2 exhiban el comportamiento superplstico caracterstico de los
metales.
La identificacin de los mecanismos de deformacin en policristales se realiza mediante
una secuencia de ensayos mecnicos, que permiten caracterizar macroscpicamente el
proceso, y de observaciones de la microestructura de las muestras antes y despus de la
deformacin. La comparacin de ambas microestructuras permite obtener informacin
acerca de los procesos primarios y de acomodacin activos y, por tanto, identificar el
mecanismo de deformacin.
Anlisis del problema: sea x la variable aleatoria que mida la deformacin de los
policristales en un intervalo de tiempo a condiciones de temperatura como se muestran en
las siguientes graficas tomadas de los siguientes grficos, con los cuales haremos el anlisis
para la distribucin de poisson:
Grafica 4 y 5. Presin y tiempo de deformacin (se debe pasar a tiempo) (4). Y

Frecuencia de deformacin y no deformacin de los policristales (5) con tendencia de
poisson.
Los ensayos mecnicos a alta temperatura (entre 1450 C y 1650 C) revelaron un
exponente de tensin sistemticamente menor que uno (con un valor promedio en torno a
0.5) para ambas muestras en todas las condiciones experimentales. Las observaciones
micro estructurales eran consistentes, en principio, con un mecanismo de deslizamiento de
fronteras de grano acomodado por disolucin - precipitacin. Estos resultados eran
sorprendentes porque los distintos modelos comnmente invocados para explicar la
fluencia de este tipo de materiales predicen exponentes de tensin iguales a uno o
comprendidos entre uno y dos. Y por este caso en particular tienen una distribucin que
tiene una tendencia de poisson tanto para la configuracin de los policristales cuando se
deforman como tambin, cuando no estn deformados(antes de someterse a las
temperaturas), con una media de 5m, para cualquiera de los casos. La temperatura a la
cual se someten a deformacin es de 1450 C, 1550C y 1650 C, se puede hallar el
tiempo en el cual ocurre dicha deformacin a las condiciones de presin (que son las
mismas para las tres temperaturas), para este caso se tomo a 1650 C para realizar el
ejercicio.
Grafica 6. Presin y tiempo de deformacin (se debe pasar a tiempo), lectura de para
hallar tiempo.
A 1650C y 90MPa con una media de 0.5 de deformados el tiempo para la formacin de las
microestructuras (Nota: se aclara que en la grafica esta a diferentes presiones a las cuales se
forman las microestructuras); en todos los casos siguen una distribucin de poisson, para
ese punto el tiempo es igual a:
(Dato ledo de la tabla 6), Con este dato encontramos el tiempo en el cual
ocurren las deformaciones para esta temperatura a la presin dada, entonces se calcula de
la siguiente manera:
Donde
entonces
si lo pasamos a horas
Son:
Cabe resaltar que no tienen el mismo comportamiento de tiempo. Para todos los casos solo
basta con observar la lnea que se trazo, paso por los tres intervalos de temperatura tocando
todos los puntos a pesar de estar a diferentes temperaturas pero a la misma presin pero
variando en el tiempo, con un promedio de deformacin de cristales de 0.5 m.
Ahora se cuenta que la deformacin del proceso tiene un promedio de 0,5m cada 5.76
horas a la temperatura y presin dadas (tambin cabe resaltar que el promedio se mantiene
por todo el proceso a pesar de que las presiones y temperaturas cambien pero para mi caso
lo trabaje a 1650C y 90MPa); cabe resaltar que los intervalos de tiempo son diferentes
para las tres temperaturas.
X: variable aleatoria que denota la deformacin por unidad de tiempo.
Ahora puedo hacer la siguiente pregunta Cul es la probabilidad de que un policristal se
deforme 0.5m durante un tiempo cualquiera?, y esto se explica por la difusin y
transferencia de calor ya que el calor debe penetrar a travez de la estructura del policristal y
en ese transcurso asa el interior de la estructura ocurrirn deformaciones.
Tambin se puede hallar la probabilidad de que se registre distinto nmero de
deformaciones en las mismas 5.76 horas.
El lambda =0.5
Calculando con la funcin de densidad se halla la siguiente tabla para el caso en x vale de
0 m de deformacin hasta 10 m de deformacin: entonces X=1,2,3,4,5,6,7,8,9,10.
x
0
P(x)=f(x)
P(x)
0.6065
0.3033
0.0758
0.0126
0.0016
0.0002
1.3163E-5
9.4018E-7
5.7861E-8
3.2664E-9
10
1.6323E-10
Suma
1.0000
Tabla 4. Probabilidades puntuales
para la deformacin de policristales
Ahora se procede a calcular lo anterior en el cdigo de R:
Cdigo R
Anlisis de resultados
> dpois(0,0.5)
La probabilidad de que un policristal se deforme 0 m a
1650C y 90MPa es del 60.6531%
[1] 0.6065307
> dpois(1,0.5)
1650C y 90MPa es del 30.3265%
[1] 0.3032653
> dpois(2,0.5)
1650C y 90MPa es del 7.5816%
[1] 0.07581633
> dpois(3,0.5)
1650C y 90MPa es del 1.2636%
[1] 0.01263606
> dpois(4,0.5)
[1] 0.001579507 1650C y 90MPa es del 0.157951% (Pbaja)
> dpois(5,0.5)
[1] 0.0001579507 1650C y 90MPa es del 0.0157951% ( Pmuy baja)
> dpois(6,0.5)
[1] 1.316256e-05 1650C y 90MPa es del 0.00131625% (Pmuy baja)
> dpois(7,0.5)
[1] 9.401827e-07 1650C y 90MPa es del 9.401827e-05% (Pmuy baja)
> dpois(8,0.5)
[1] 5.876142e-08 1650C y 90MPa es del 5.876142e-06 % (Pmuy baja)
> dpois(9,0.5)
> dpois(10,0.5)
Tabla 5. Anlisis Probabilidades puntuales para la deformacin de
policristales
Observando la tabla anterior se puede concluir que los datos calculados con la funcin y los
calculados con el programa R son muy parecidos con la diferencia en que en R el clculo se
hace de inmediato.
Alternativa: Si se da la probabilidad de tener, de manera exacta, (y) ocurrencias en un
intervalo (t) veces mayor o menor que el de referencia en la medicin entonces la
distribucin de probabilidades de Y nmero de xitos en la nueva unidad de referencia
viene dada por:
Donde Promedio de ocurrencias por intervalo unidad de medida considerada en X y

t= Nmero de intervalos unidades de medida especificados donde u (y)=t.
Tambin se puede proceder a trabajar y hallar sus correspondientes probabilidades
variando el tiempo (con esto tambin se varia el lambda) para saber el porcentaje de
deformacin de policristales en el proceso (recuerde que el promedio de deformaciones es
de 5 m).
Ahora se toma varios intervalos de tiempo (1, 2, 3, 4, y 5 horas), con lo cual quedara
mejor ilustrado mi ejemplo y se observara como van evolucionando las deformaciones a
diferentes lambdas.
y= variable aleatoria que indica el promedio de deformacin a 2, 3, 4, 5 y 6 horas a las
condiciones elegidas en nuestro proceso de deformacin de policristales. Hallar la
probabilidad de que en los tiempos dados se deforme entre 0.5 m y 1 m.
Entonces t1=0.5*1=0.5; t2=0.5*2=1;
t5=0.5*6=3.
t3=0.5*3=1.5; t4=0.5*4=2; t5=0.5*5=2.5;
Reemplazo los calculados anteriormente en el cdigo de R menos para el primero ya que

el lambda no vara la probabilidad queda de la siguiente forma:
P (0.5<=y<=1) = p (y<=1) - p (y<=0) esto lo pasamos al cdigo de R:
Codigo
> a<-ppois(0,1);a
[1] 0.3678794
> a1<-ppois(1,1);a1
[1] 0.7357589
> a2<-(a1-a);a2
[1] 0.3678794
>
> b<-ppois(0,1.5);b
[1] 0.2231302
> b1<-ppois(1,1.5);b1
[1] 0.5578254
> b2<-(b1-b);b2
[1] 0.3346952
>
> c<-ppois(0,2);c
[1] 0.1353353
Anlisis de resultados
La probabilidad de que los policristales se
deformen entre 0.5 m y 1 m en 2 horas es del
36.7879 %.

55.7825 %.

27.0671%.
> c1<-ppois(1,2);c1
[1] 0.4060058
> c2<-(c1-c);c2
[1] 0.2706706
>
> d<-ppois(0,2.5);d
20.5212 %.
[1] 0.082085
> d1<-ppois(1,2.5);d1
[1] 0.2872975
> d2<-(d1-d);d2
[1] 0.2052125
>
> e<-ppois(0,3);e
14.9361 %.
[1] 0.04978707
> e1<-ppois(1,3);e1
[1] 0.1991483
> e2<-(e1-e);e2
[1] 0.1493612
Tabla 6. Anlisis de las probabilidades de deformacin a diferentes
tiempos con un intervalo de deformacin de 0.5 m-1 m de
policristales
MODELO DE REGRESION CON 3 VARIABLES INDEPENDIENTES X1, X2 y X3.
Para este anlisis se busco una referencia bibliogrfica en la base de datos science direct y
se eligi el artculo: H2 production by sorption enhanced steam reforming ofbiomassderived bio-oil in a fluidized bed reactor: An assessment ofthe effect of operation variables
using response surface methodology. Para poder construir mi base de datos. La siguiente
tabla fue extrada de dicho artculo.
Tabla 7. Datos experimentales del rendimiento de H2.
Ahora se procede al anlisis de nuestro problema de estudio y de las variables que

intervienen y la posterior explicacin del modelo de regresin lineal al cual ajustamos
dichas variables.
los datos de la tabla 7 son los datos obtenidos de la Produccin de H2 (en trminos de su
rendimiento) por absorcin mejorada de reformado con vapor, de la biomasa derivada de
bio-aceite en un reactor de lecho fluidizado: Una evaluacin del efecto de las variables de
operacin utilizando la metodologa de superficie de respuesta. Ahora se procede a definir
mi variable dependiente y las tres variables independientes. Se arranca nuestro ejercicio con
3 variables independientes para ver cul de todas o si todas ajustan el rendimiento, todo
enfocado a cumplir los objetivos propuestos al inicio del trabajo.
Variable dependiente:
Y= Rendimiento H2 (%)
Variables independientes:
X1= Selectividad H2 (%)
X2= Pureza H2 (vol. %)
X3=Temperatura (C)
Ahora se procede a resolver el modelo en R con 10 observaciones para cada variable:
Datos de entrada en R:
> Y<-c(65.5, 92.48, 74.17, 94.71, 51.86, 86.37, 64.28, 88.33, 85.35, 22.48)
> X1<-c(90.22, 98.77, 95.05, 99.75, 77.74, 98.56, 86.4, 99.8, 98.82, 73.26)
> X2<-c(94.72, 96.53, 97.28, 96.55, 87.35, 96.25, 92.29, 96.42, 98.94, 81.44)
> X3<-c(516, 634, 516, 634, 516, 634, 516, 634, 575, 475)
Los datos se visualizan en el siguiente data.frame:
>datos<-data.frame(Y,X1,X2,X3);datos
1
2
3
4
5
6
Y
65.50
92.48
74.17
94.71
51.86
86.37
X1
90.22
98.77
95.05
99.75
77.74
98.56
X2
94.72
96.53
97.28
96.55
87.35
96.25
X3
516
634
516
634
516
634
64.28 86.40 92.29

7
88.33 99.80 96.42
8
85.35 98.82 98.94
9
10 22.48 73.26 81.44
Tabla 8. Base de datos
516
634
575
475
> pairs(datos,main="Rendimiento H2 (% )")# matriz de grficos bidimensionales.
Rendimiento H2 (% )
500
600
60
75 85 95
75 85 95
20
95
X1
600
85
X2
500
X3
20
60
85
95
Grafica 7. Matriz de grficos bidimensionales.

En la grafica 7 se puede observar un comportamiento bastante lineal en la base de datos que
se ha construido, se podra decir que casi todas se pueden explicar con el modelo lineal.
MATRIZ DE CORRELACION: correlacin de orden cero (correlacin simple:marginal)
> R<-cor(datos);R
Y
X1
X2
X3
1.0000000
0.9663441
0.9313163
0.8702770
Y
0.8302457
X1 0.9663441 1.0000000 0.9526421
0.6625810
X2 0.9313163 0.9526421 1.0000000
1.0000000
X3 0.8702770 0.8302457 0.6625810
Tabla 9. Matriz de correlacin de orden cero
La matriz de correlacin R es una matriz cuadrada n X n constituida por los coeficientes de

correlacin de cada pareja de variables; de manera que tendr unos en su diagonal
principal, y en los elementos no diagonales (i,j) los correspondientes coeficientes de
correlacin rij . La matriz de correlacin ser, obviamente, simtrica, y conservar las
propiedades de ser definida-positiva y tener un determinante no negativo.
El ajuste de la regresin lineal se puede hacer por a) MRLS, Y b) MRLM: a continuacin
presentare 2 ejemplos (1 es al azar y el otro con todas las variables ya que como se ver
ms adelante es el modelo que mejor ajusta los datos); del primero para observar que dan
iguales y el resto lo hago con MRLM incluido el caso no lineal con logaritmos ya que en lo
personal me parece ms sencillo el cdigo.
a. MRLS:
> (ajuste1<-lm(datos[,1]~datos[,2]))
> summary(ajuste1)
Call:
lm(formula = datos[, 1] ~ datos[, 2])
Residuals:
Min
1Q
Median
3Q
Max
-1.574
4.314 10.737
-8.655 -3.279
Tabla 10. Resumen del rendimiento de H2 (%)
~pureza H2 (vol. %)
Coeficientes:
Estimate
Std. Error
t value
Pr(>|t|)
19.3687
-6.825
0.000134 ***
(Intercept) -132.1996
2.2295
0.2098
10.625
5.39e-06 ***
datos[, 2]
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Residual standard error: 6.134 on 8 degrees of freedom Multiple Rsquared: 0.9338, Adjusted R-squared: 0.9255 F-statistic: 112.9 on 1
and 8 DF, p-value: 5.39e-06
Tabla 11. Modelo: rendimiento de H2 (%) ~pureza H2 (vol. %)
El modelo generado es: Y= -132.1996 + 2.2295X1
Inferencia en el modelo de regresin simple:
Los errores tpicos de los estimadores de los parmetros beta0 y beta1 se encuentran en la
columna Std Error de la salida anterior. En el ejemplo, sus valores son 19.3687 y 0.2098
respectivamente.
La columna t value contiene el estadstico t, es decir, cociente entre cada estimador y su
error tpico. Estos cocientes son la base para llevar a cabo los contrastes (H0: beta0 = 0) y
(H0:beta1 = 0). Los correspondientes p-valores aparecen en la columna Pr (>|t|). En este
caso son muy pequeos por lo que se rechazan ambas hiptesis para los niveles de
significacin habituales. Por lo que los Bj son diferentes de cero y los Xj deben ir en el
modelo. Con un R-Cuadrado de 0.9338 que est muy cercano a 1 por lo que los valores se
ajustan relativamente bien.
> Yest1<-ajuste1$fitted.values # obtener los valores ajustados (estimados) por el modelo
> Error1<- ajuste1$residuals # generar los valores de los errores
> cbind(datos[,1],Yest1,Error1)
originales
Yest1
Error1
65.50
68.94786
-3.447862
1
92.48
88.01028
4.469721
2
74.17
79.71646
-5.546455
3
94.71
90.19521
4.514789
4
51.86
41.12342
10.736577
5
86.37
87.54208
-1.172079
6
64.28
60.43109
3.848913
7
88.33
90.30669
-1.976687
8
85.35
88.12175
-2.771755
9
22.48
31.13516
-8.655162
10
Tabla 12. Valores estimados del rendimiento de
H2 (%)
> mean(Error1) #verificacin de la suma cero
[1] 2.203099e-17 #se puede concluir que es cero
Ahora se procede a verificar el modelo con todos los datos en R:
> datos1<-as.data.frame(datos)
> (ajuste2.lm<-lm(datos[,1]~datos[,2]+datos[,3]+datos[,4]))
> summary(ajuste2.lm)
Call:
lm(formula = datos[, 1] ~ datos[, 2] + datos[, 3] + datos[, 4])
Residuals:
Min
1Q
Median
3Q
Max
-3.8386
-1.7701
-0.2681
1.6199
4.6214
~Selectividad (%)+pureza H2 (Vol. %)+Temperatura(C)
Coefficients:
Estimate
Std. Error
t value
Pr(>|t|)
-330.73119
47.41835
-6.975
0.000432 ***
(Intercept)
-1.13045
0.72982
-1.549
0.172368
datos[, 2]
4.08418
0.97726
4.179
0.005818 **
datos[, 3]
0.21964
0.04512
4.868
0.002800 **
datos[, 4]
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Residual standard error: 3.153 on 6 degrees of freedom
Multiple R-squared: 0.9869, Adjusted R-squared: 0.9803
F-statistic: 150.5 on 3 and 6 DF, p-value: 4.915e-06
Tabla 14.Modelo: rendimiento de H2 (%) ~Selectividad H2 (%)+pureza
H2(Vol.%)+Temperatura(C)
El modelo generado es: Y= -330.7312 1.13045X1+ 4.0842X2 + 0.2196X3
columna Std Error de la salida anterior. En el ejemplo, sus valores se visualizan en la tabla
14.
modelo. Con un R-Cuadrado de 0.9869 que est muy cercano a 1 por lo que los valores se
ajustan bien (este es el modelo que a pesar de involucrar todas las variables tiene un R
mayor que el resto de los modelos).
> Yest2<-ajuste2.lm$fitted.values # obtener los valores ajustados (estimados) por el

modelo.
> Error2<- ajuste2.lm$residuals # generar los valores de los errores
> sum(Error2)
[1] 3.885781e-16
> cbind(datos[,1],Yest2,Error2)
originales
Yest2
Error2
65.50
67.46975
-1.9697529
1
92.48
91.11479
1.3652097
2
74.17
72.46517
1.7048250
3
94.71
90.08863
4.6213703
4
51.86
51.47737
0.3826274
5
86.37
90.20861
-3.8386139
6
64.28
61.86352
2.4164831
7
88.33
89.50116
-1.1711631
8
85.35
87.94213
-2.5921317
9
22.48
23.39885
-0.9188540
10
Tabla 15. Valores estimados del rendimiento de
H2 (%)
De la tabla 15 se puede inferir que al generar con el modelo los nuevos datos del
rendimiento de H2 estos no estn tan lejanos de los datos originales por lo que es una muy
buena aproximacin de los datos reales.
> mean(Error2)
[1] 3.887407e-17 # se puede decir que el error es cero.
Ahora se har un anlisis de todas las variables involucradas con la opcin b) MRLM:
> Y1<-lm(Y~X1);summary(Y1)
Call:
lm(formula = Y ~ X1)
Residuals:
Min
1Q
Median
3Q
Max
-8.655
-3.279
-1.574
4.314
10.737
~Selectividad H2 (%)
Coefficients:
Estimate
Std. Error
t value
Pr(>|t|)
-6.825
0.000134 ***
(Intercept) -132.1996 19.3687
2.2295
0.2098
10.625
5.39e-06 ***
X1
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Tabla 17.Modelo: rendimiento de H2 (%) ~Selectividad H2 (%)
El modelo generado es: Y= -132.1996 2.2295 Nota: este modelo ya haba sido hecho
previamente con una variacin del cdigo y se puede observar en la tabla 11, por lo que no
se volver a repetir el anlisis.
Call:
Residuals:
Min
1Q
Median
3Q
Max
-11.9261
-6.0040 0.8892
5.2331 11.4362
~+pureza H2(Vol.%)
Coefficients:
Estimate
Std. Error
t value
Pr(>|t|)
-5.777
0.000416 ***
(Intercept) -290.0031 50.2039
3.8662
0.5346
7.233
8.96e-05 ***
X2
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1

Tabla 19.Modelo: rendimiento de H2 (%) ~+pureza H2 (Vol.%)
Y= -290.0031+ 3.8662X2
19.
modelo. Con un R-Cuadrado de 0.8674 que es cercano a 1 por lo que los valores todava se
Call:
Residuals:
Min
1Q
Median 3Q
Max
-22.5561
-5.6135 -0.0543 7.6234 16.5984
Tabla 20. Resumen del rendimiento de H2(%)
~Temperatura(C)
Coefficients:
Estimate
Std. Error
t value Pr(>|t|)
-2.882
0.02045 *
(Intercept) -100.19182 34.76611
0.30574
0.06118
4.997
0.00106 **
X3
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
F-statistic: 24.97 on 1 and 8 DF, p-value: 0.001056
Tabla 21.Modelo: rendimiento de H2(%) ~Temperatura(C)
Y= -100.1918+ 0.3057X3
21.
modelo. Con un R-Cuadrado de 0.7574 este valor no es muy cercano a 1 pero los valores
todava se ajustan relativamente bien.
> Y4<-lm(Y~X1+X2);summary(Y4)
Call:
lm(formula = Y ~ X1 + X2)
Residuals:
Min
1Q
Median 3Q
Max
-7.4496 -4.1058
-0.9335 4.4786 10.2369
~Selectividad H2 (%)+pureza H2(Vol.%)
Coefficients:
Estimate Std. Error
t value Pr(>|t|)
-2.451
0.0440 *
(Intercept) -153.9622 62.8105
1.9743
0.7307
2.702
0.0306 *
X1
0.4820
1.3148
0.367
0.7248
X2
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Tabla 23.Modelo: rendimiento de H2 (%) ~Selectividad H2
(%)+pureza H2 (Vol.%)
Y= -153.9622+ 1.9743X1+ 0.4820X2

23.
modelo. Con un R-Cuadrado de 0.9351 este valor es cercano a 1 los valores se ajustan
relativamente bien al modelo lineal.
Call:
Residuals:
Min
1Q
Median
3Q
Max
-9.5229 -2.8970 -0.3965
2.4136
8.5950
Tabla 24. Resumen del rendimiento de H2(%)
~Selectividad H2 (%)+Temperatura(C)
Coefficients:
Estimate
Std. Error
t value
Pr(>|t|)
-7.390
0.000151 ***
(Intercept) -137.13942 18.55862
1.81044
0.35437
5.109
0.001386 **
X1
0.07686
0.05396
1.424
0.197344
X3
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Tabla 25.Modelo: rendimiento de H2(%) ~Selectividad H2
(%)+Temperatura(C)
Y= -137.1394+ 1.8104X1+ 0.07686X2
25.
Call:
Residuals:
Min
1Q
Median
3Q
Max
-3.6151 -2.2802 -0.7828 2.9898 3.9456
Tabla 26. Resumen del rendimiento de H2
(%) ~pureza H2 (Vol. %)+Temperatura(C)
Coefficients:
Estimate
Std. Error t value
Pr(>|t|)
20.37920
-12.914
3.88e-06 ***
2.62467
0.28389
9.245
3.58e-05 ***
X2
0.15857
0.02403
6.600
0.000304 ***
X3
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Tabla
27.Modelo:
rendimiento
de
H2
(%)
~pureza
Y= -263.1723+ 2.6247X2+ 0.1586X3
27.
> Y7<-lm(Y~X1+X2+X3);summary(Y7)
Call:
lm(formula = Y ~ X1 + X2 + X3)
Residuals:
Min
1Q
Median
3Q
Max
-3.8386 -1.7701 -0.2681 1.6199 4.6214
Tabla 28. Resumen del rendimiento de H2
(%)
~Selectividad
H2
(%)+pureza
Coefficients:
Estimate
Std. Error
t value
Pr(>|t|)
-6.975
0.000432 ***
(Intercept) -330.73119 47.41835
-1.13045
0.72982
-1.549
0.172368
X1
4.08418
0.97726
4.179
0.005818 **
X2
0.21964
0.04512
4.868
0.002800 **
X3
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Tabla 29.Modelo: rendimiento de H2 (%) ~Selectividad H2 (%)+pureza
H2 (Vol.%)+Temperatura(C)
El modelo generado es: Y= -330.7312 1.13045X1+ 4.0842X2 + 0.2196X3 Nota: no
repito el anlisis ya que esta hecho en la tabla 14. (Se puede concluir que este es el modelo
que mejor ajusta los datos teniendo en cuenta que se tienen 3 variables independientes).
Ahora se hace un anlisis con regresin no lineal aplicando log para cumplir con el objetivo
especfico 3.1:
> Y8<-lm(log(Y)~log(X1));summary(Y8)
Call:
lm(formula = log(Y) ~ log(X1))
Residuals:
Min
1Q
Median 3Q
Max
-0.31127 -0.05465 -0.01217
0.02477 0.31102
Tabla 30. Resumen del log rendimiento de H2 (%) ~log
Selectividad H2 (%)
Coefficients:
Estimate Std. Error
t value
Pr(>|t|)
-5.332
7e-04 ***
(Intercept) -12.0316 2.2563
3.5993
0.4996
7.204
9.21e-05 ***
log(X1)
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Tabla 31.Modelo: log rendimiento de H2 (%) ~log Selectividad H2
(%)
Para el caso de log se puede observar que el R-cuadrado baja con respecto al modelo que
hizo previamente a los datos de la base sin ningn tipo de tratamiento previo para hallar el
modelo, este comportamiento tambin se repite para el resto de los datos, cabe resaltar que
los p-valores son bajos Por lo que los Bj son diferentes de cero y los Xj deben ir en el
modelo. Los modelos que se obtienen a continuacin como ya se haba mencionado
presentan la misma tendencia que el modelo de la tabla 31(salvo unas excepciones). Y se
observaran a continuacin.
Call:
Residuals:
Min
1Q
Median
3Q Max
-0.17322 -0.14023 0.04800
0.09086 0.20592
pureza H2 (vol. %)
Coefficients:
Estimate
Std. Error
t value
Pr(>|t|)
-26.8519
3.5993
-7.460
7.19e-05 ***
(Intercept)
6.8445
0.7929
8.633
2.51e-05 ***
log(X2)
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Tabla 33.Modelo: log rendimiento de H2 (%) ~log pureza H2 (vol. %)
Log*(Y= -26.8519+ 6.8445X2) este modelo ajusta mejor los datos involucrados que el
modelo que se observa en la tabla 19.
33.
modelo. Con un R-Cuadrado de 0.9031 que es cercano a 1 por lo que los valores todava se
Call:
Residuals:
Min
1Q
Median
3Q
Max
-0.59597 -0.09251 -0.02281
0.19205 0.34644
Tabla 34. Resumen del log rendimiento de H2 (%)~log
Temperatura(C)
Coefficients:
Estimate Std. Error
t value
Pr(>|t|)
5.1832
-2.894
0.02007 *
3.0356
0.8186
3.708
0.00597 **
log(X3)
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Tabla 35.Modelo:log rendimiento de H2 (%)~log Temperatura(C)
El modelo que se visualiza en la tabla 35, no es mejor modelo que el que se encuentra en la
tabla 21. Por lo que me quedo con el anlisis de la tabla 21.
> Y11<-lm(log(Y)~log(X1)+log(X2));summary(Y11)
Call:
lm(formula = log(Y) ~ log(X1) + log(X2))
Residuals:
Min
1Q
Median
3Q
Max
-0.17729 -0.11856 0.02764 0.07664 0.24076
Tabla 36. Resumen del log rendimiento de H2 (%)
~log selectividad H2 (%)+log pureza H2(Vol.%)
Coefficients:
Estimate
Std. Error
t value
Pr(>|t|)
6.7699
-3.469
0.0104 *
0.9368
1.5674
0.598
0.5689
log(X1)
5.1711
2.9196
1.771
0.1198
log(X2)
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Tabla 37.Modelo:log rendimiento de H2 (%) ~log selectividad H2

(vol. %)+log pureza H2 (Vol.%)
Call:
Residuals:
Min
1Q
Median
3Q
Max
-0.31633 -0.04774 -0.00897
0.02572 0.29631
~log selectividad H2 (%)+log Temperatura(C)
Coefficients:
Estimate
Std. Error t value
Pr(>|t|)
3.3752
-3.785
0.00685 **
3.3541
0.9470
3.542
0.00945 **
log(X1)
0.2923
0.9350
0.313
0.76369
log(X3)
Signif. Codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Tabla 39.Modelo: log rendimiento de H2 (%) ~log selectividad H2
(%)+log Temperatura(C)
Call:
Residuals:
Min
1Q
Median
3Q
Max
-0.16244 -0.03676 -0.01765 0.03098 0.20151
~log pureza H2 (Vol.%)+log Temperatura(C)
Coefficients:
Estimate
Std. Error
t value
Pr(>|t|)
-27.3845
2.9301
-9.346
3.34e-05 ***
(Intercept)
5.4891
0.8779
6.253
0.000423 ***
log(X2)
1.0560
0.4653
2.269
0.057542
log(X3)
Signif. Codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Tabla 41.Modelo: log rendimiento de H2 (%) ~log pureza H2 (Vol. %)+log
Temperatura(C)
> Y14<-lm(log(Y)~log(X1)+log(X2)+log(X3));summary(Y14)
Call:
lm(formula = log(Y) ~ log(X1) + log(X2) + log(X3))
Residuals:
Min
1Q
Median
3Q
Max
-0.120893 -0.031666
0.004532 0.036873 0.072390
selectividad H2 (%)+log pureza H2 (Vol. %)+log
Temperatura(C)
Coefficients:
Estimate
Std. Error
t value
-46.1663
5.6036
-8.239
(Intercept)
-4.9984
1.4121
-3.540
log(X1)
12.3440
2.0104
6.140
log(X2)
2.6719
0.5387
4.960
log(X3)
Signif. Codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Pr(>|t|)
0.000173 ***
0.012225 *
0.000854 ***
0.002553 **

Tabla 43.Modelo: log rendimiento de H2 (%) ~log selectividad H2 (%)+log pureza H2
(Vol. %)+log Temperatura(C)
CONCLUSIONES
Muchas cosas se pueden modelar con la distribucin exponencial, y ms cuando los datos
que son objeto de estudio representan muy bien la forma de dicha distribucin para el caso
de estudio con Clostridium cellulovorans, el comportamiento cuando este va consumiendo
como sustratos los materiales celulsicos, para dar lugar a la formacin de nuevos
productos. Se encontr que el tiempo para degradar estos materiales es de 91 horas, lo que
nos hace pensar que este tipo de microorganismos mantienen una tasa metablica ya sea
que se utilice como sustrato celulosa o glucosa y esto es debido a la capacidad enzimtica
que toda bacteria tiene para de esta forma obtener la energa necesaria para la obtencin de
biomasa y para la produccin de analitos de inters que son utilizados por el hombre como
es el caso de cidos y alcoholes (comnmente etanol o butanol). Entonces con la
distribucin exponencial se puede saber con exactitud la probabilidad de consumo de
sustrato para nuestro caso, claro que tambin se puede modelar otras variables del proceso
ya que por lo regular siguen una distribucin exponencial como un caso particular
hablemos por ejemplo de la produccin de biomasa del microorganismo ya que esta
biomasa tambin sigue una distribucin exponencial por lo que tambin se podra saber con
exactitud la probabilidad de producir biomasa en un determinado momento.
La distribucin de poisson tiene un valor especial y es que al conocer el promedio de un
evento en un intervalo de tiempo determinado como puede ser el caso de la deformacin de
un policristal a condiciones de presin y temperatura dadas. Se puede encontrar la
probabilidad de que ocurra dicho evento en un tiempo cualquiera siguiendo las condiciones
iniciales del problema, ya que si nos remontamos al caso de estudio el intervalo de tiempo
varia con respecto a la presin para cada temperatura dada (1450 C, 1550C y 1650C),
por lo que la probabilidad de que ocurra el mismo evento a temperaturas distintas al mismo
intervalo de tiempo es muy bajo, pero afortunadamente el histograma de deformaciones
sigue un comportamiento de poisson, por lo que dicho modelo explica muy bien la
probabilidad de deformacin de policristales para el caso particular al cual las
observaciones fueron tomadas.
El modelo que mejor representa los datos es el presentado en la tabla 14 ya que el Rcuadrado como se ha comentado antes es el mayor de todos por lo que ajusta mejor los
datos a la regresin lineal que los dems modelos, tambin cabe resaltar que los valores
estimados de la tabla 15 son muy cercanos a los valores que tenamos en un principio en
nuestra base de datos, cabe resaltar que cuando se hace el anlisis con log al modelo en
algunos casos mejora un poco la correlacin, pero nunca fue superior al modelo presentado
en la tabla 14. Por lo que el tratamiento de los datos con log en este caso no es necesario, ya
que los datos se ajustan bien sin ningn tipo de transformacin adicional.
Finalmente la estadstica con distribuciones y modelos de regresin ayudan a estructurar
mejor el anlisis de los procesos y eventos en la ingeniera no solo en la qumica si no en
todas las disciplinas en donde se relacione la observacin de lo que esta sucediendo.
Bibliografa
1- Xiaorui Yang, Mengmeng Xu, Shang-Tian Yang n. Metabolic and process
engineering of Clostridium cellulovorans for biofuel production from cellulose.
Department of Chemical and Biomolecular Engineering and Department of
Molecular Genetics, The Ohio State University, 151 West Woodruff Avenue,
Columbus, OH 43210, USA. Metabolic Engineering 32 (2015) 3948.
2- Mara V. Gila,b, Javier Fermosoc, Fernando Rubieraa, De Chenb,. H2production
by sorption enhanced steam reforming ofbiomass-derived bio-oil in a

fluidized bed reactor: An assessment ofthe effect of operation variables
using response surface methodology. -a). Instituto Nacional del Carbn,
INCAR-CSIC, Apartado 73, 33080 Oviedo, Spain; b).Department of Chemical
Engineering, Norwegian University of Science and Technology, Sem Slands vei 4,
Trondheim NO-7491, Norway; c).IMDEA Energy Institute, Thermochemical Processes
Unit, Avenida Ramn de la Sagra 3, 28935 Mstoles, Spain. Catalysis Today 242 (2015) 1934.
Web-grafa
3- Araya alpizar carlomangno. Estadistica para laboratorista qumico. Recuperado
de:https://books.google.com.co/books?id=IibtfIBQLMoC&pg=PA54&lpg=PA54&
dq=como+aplicar+la+distribuci%C3%B3n+de+poisson+en+quimica&source=bl&o
ts=gl8sf0ArE&sig=VHq2arhdScbfi8aYLLqXhl4_eZM&hl=es&sa=X&ved=0ahUK
Ewiyjrv_9bPJAhWCKiYKHTmzDMEQ6AEIJDAB#v=onepage&q=como%20apli
car%20la%20distribuci%C3%B3n%20de%20poisson%20en%20quimica&f=false
4- Recuperadode:http://materiales.unex.es/miembros/personal/jjmelendez/ES/Investiga
ci%C3%B3n-ES.html
5- Recuperadode:http://www.virtual.unal.edu.co/cursos/ciencias/2001065/html/un2/co
nt_232_74.html
6- Recuperadode:https://www.uam.es/personal_pdi/ciencias/joser/paginaR/regresion.ht
ml.
7- Recuperadode:http://ldc.usb.ve/~moises/estadistica/Ej_Regresion_Lineal_Multiple_
Zoritza.pdf.

Trabajo Final de Probabilidad y Estadística

Загружено:

Сведения о документе

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

Trabajo Final de Probabilidad y Estadística

Загружено:

Авторское право:

Доступные форматы

Trabajo final de probabilidad y estadstica

Ejemplos de las distribuciones y regresin lineal en la ingeniera qumica

Universidad Nacional de Colombia-Sede Manizales

ms grande que un nmero especificado no negativo a, es e-a. Esto se puede expresar

El clculo de las funciones exponenciales involucra la evaluacin de integrales de

Grafica 1. Cintica de fermentacin de naturaleza de tipo C. cellulovorans usando (B),

Grafica 2. Observacin de los puntos del consumo de Celulosa en el tiempo para la

Figura 3. Representacin en R del consumo de sustrato (celulosa).

Con la funcin de densidad se obtiene la siguiente grafica desarrollando la integral:

Tabla 2. Probabilidades puntuales y acumuladas a 8

Otra manera de ver la distribucin de Poisson es usando la funcin dada:

CASO DE ESTUDIO TOMADO DEL TEXTO: MECANISMOS DE

Grafica 4 y 5. Presin y tiempo de deformacin (se debe pasar a tiempo) (4). Y

Donde Promedio de ocurrencias por intervalo unidad de medida considerada en X y

t3=0.5*3=1.5; t4=0.5*4=2; t5=0.5*5=2.5;

Reemplazo los calculados anteriormente en el cdigo de R menos para el primero ya que

La probabilidad de que los policristales se

La probabilidad de que los policristales se

Tabla 7. Datos experimentales del rendimiento de H2.

Ahora se procede al anlisis de nuestro problema de estudio y de las variables que

64.28 86.40 92.29

> pairs(datos,main="Rendimiento H2 (% )")# matriz de grficos bidimensionales.

Grafica 7. Matriz de grficos bidimensionales.

La matriz de correlacin R es una matriz cuadrada n X n constituida por los coeficientes de

lm(formula = datos[, 1] ~ datos[, 2] + datos[, 3] + datos[, 4])

> Yest2<-ajuste2.lm$fitted.values # obtener los valores ajustados (estimados) por el

F-statistic: 52.31 on 1 and 8 DF, p-value: 8.957e-05

Inferencia en el modelo de regresin simple:

Tabla 37.Modelo:log rendimiento de H2 (%) ~log selectividad H2

Residual standard error: 0.07142 on 6 degrees of freedom

by sorption enhanced steam reforming ofbiomass-derived bio-oil in a

Вам также может понравиться

t3=0.53=1.5; t4=0.54=2; t5=0.5*5=2.5;