Академический Документы
Профессиональный Документы
Культура Документы
ALGORITMOS EFICIENTES PARA LA OPTIMIZACION DINAMICA DE PROCESOS DISTRIBUIDOS. por Eva Balsa Canto
Memoria presentada para optar al grado de Doctor por la Universidad de Vigo. Abril, 2001.
Autorizacion
Los Doctores Julio Rodr guez Banga, Cient co Titular del Instituto de Investigaciones Marinas de Vigo (C.S.I.C.), y Antonio Alvarez Alonso, Profesor Titular del Departamento de Ingenier a Qu mica de la Universidad de Vigo,
CERTIFICAN: que la memoria adjunta, titulada `'Algoritmos e cientes para la optimizacion dinamica de procesos distribuidos", que para optar al grado de Doctor en Qu mica presenta Da. Eva Balsa Canto, ha sido realizada bajo su inmediata direccion en el Instituto de Investigaciones Marinas del C.S.I.C.. Y considerando que constituye trabajo de Tesis, autorizan su presentacion en la Universidad de Vigo. Y para que conste, expedimos el presente certi cado en Vigo, a diecisiete de abril del dos mil uno.
Agradecimientos
Han sido muchos los que de una manera u otra han contribuido al desarrollo de esta tesis. Es por ello, que dedico estas primeras l neas a expresar mi mas sincero agradecimiento: A mis directores, los Doctores Julio Rodr guez Banga y Antonio Alvarez Alonso, por haberme brindado la oportunidad de realizar este trabajo, por su apoyo y dedicacion y, muy especialmente, por haberme ense~ado lo que se acerca de simulacion n y optimizacion de procesos. Al Doctor Vassilios Vassiliadis, por haber contribuido de manera decisiva al desarrollo de los metodos de optimizacion de segundo orden, y por haber hecho, junto a todos los compa~eros del departamento de Ingenier a Qu mica de la Universidad n de Cambridge, mi estancia en el Reino Unido mas agradable. A los Doctores Nico Scheerlinck y Bart Nicola , de la Universidad Catolica de Lovaina al Doctor Jose Saa y a Isidro Sanchez y Javier Vazquez. Todos ellos han participado en diversos aspectos del cap tulo de esta memoria dedicado al procesamiento termico con hornos microondas-conveccion, tanto en el desarrollo de modelos y herramientas de simulacion, como en la realizacion del montaje experimental que ha permitido la validacion de los resultados. Este trabajo se ha enmarcado en el desarrollo de un proyecto nanciado por la Comunidad Europea (FAIR CT96-1192) y una extension nanciada por la Comision Interministerial de Ciencia y Tecnolog a (CICyT, ALI97-1939-CE). Durante este per odo he disfrutado, ademas, de una beca predoctoral concedida por la Excma. Diputacion de Pontevedra. A PSE Ltd. por la concension de una licencia academica para el uso de gPROMS. A mi compa~era Carmen por haberme aclarado muchos aspectos de los procesos n qu micos y de biotecnolog a que se consideran en este trabajo y, ademas, por contribuir, junto a otros compa~eros Marigel, Isa, Cruz y un largo etcetera, a un d a a n d a mas ameno. A Fran, ademas, por facilitarme la impresion de esta tesis. A mis amigas, Bego~a y Patricia, y a mis amigos de Lugo, por todos estos a~os de n n buenos momentos. A mis padres, Mariano y Gloria, y mis hermanas, Montse y Cecilia, porque sin ellos, ni esta tesis, ni otras muchas cosas, habr an sido posibles. Y a Mart n, por su apoyo e in nita paciencia.
ii
iii
iv
Resumen
Muchos de los procesos de la industria qu mica, biotecnologica y alimentaria transcurren en modo discontinuo o semicontinuo. Por ello, su descripcion debe realizarse mediante modelos dinamicos constituidos por ecuaciones diferenciales y algebraicas frecuentemente no lineales. A menudo, es preciso ademas incorporar la dependencia espacial de las variables de estado relevantes mediante sistemas de ecuaciones en derivadas parciales (procesos distribuidos). A n de calcular las mejores pol ticas de operacion de dichos procesos (control optimo), es preciso disponer de tecnicas de optimizacion dinamica robustas y e cientes con las que hacer frente a las di cultades que surgen de la presencia de restricciones sobre estados y controles y al caracter multimodal (no convexo) derivado de posibles discontinuidades y a la no linealidad intr nseca de estos procesos. En la primera parte de esta memoria se realiza una revision bibliogra ca del estado actual del modelado y simulacion dinamica de procesos. Igualmente, se presentan los conceptos clave de la optimizacion (estacionaria y dinamica) de procesos, prestando especial atencion al estado actual de los metodos de control optimo desde el punto de vista de la ingenier a de procesos. Asimismo, se justi ca la eleccion del esquema de parametrizacion de control como el punto de partida de esta tesis. Dicho esquema transforma el problema original de control optimo en un problema de programacion no lineal con restricciones (NLP), que requiere ademas la resolucion de un problema de valor inicial (dinamica del sistema) para cada evaluacion. En esta tesis se ha perseguido aumentar la e ciencia y robustez de la resolucion del NLP externo, as como disminuir en lo posible el coste computacional de la resolucion del problema de valor inicial. En la segunda parte de este trabajo se presenta el desarrollo de nuevos metodos de optimizacion dinamica basados en el esquema de parametrizacion de control con dos tipos de metodolog as. Por una parte, se desarrollan nuevos metodos deterministas locales que hacen uso del calculo e ciente de las sensibilidades parametricas de primer y segundo orden para evaluar de forma muy e ciente el gradiente y el Hessiano v
vi
Resumen
(o Hessiano proyectado) de la funcion objetivo. Por otra parte, dada la frecuente no convexidad del NLP, se propone la combinacion de un metodo global de tipo estocastico con un metodo determinista local, formando un metodo h brido, a n de sumar sus ventajas a la vez que se evitan varios de sus inconvenientes. Estas nuevas metodolog as se aplican a la solucion de diversos problemas de complejidad creciente, tomados de la bibliograf a reciente y de gran interes en los sectores qu mico y biotecnologico, incluyendo problemas multi-objetivo, y procesos de una y varias etapas. Por ultimo, en la tercera parte de esta memoria se presenta la aplicacion de estos nuevos metodos a la resolucion de problemas de optimizacion dinamica de procesos distribuidos. Para la resolucion de los problemas de valor inicial, se considera el uso del metodo numerico de las l neas y el metodo de elementos nitos, que transforman las ecuaciones en derivadas parciales originales en un conjunto de ecuaciones diferenciales y algebraicas de dimension elevada. Estas metodolog as se aplican al calculo de las pol ticas optimas de operacion de un conjunto de problemas distribuidos, incluyendo dos de especial relevancia para la industria alimentaria: la esterilizacion termica de alimentos y el procesamiento termico de alimentos en hornos mixtos microondas-conveccion. En el caso de microondas estas pol ticas se validan experimentalmente con un prototipo construido al efecto. Dado que el proceso de simulacion de sistemas distribuidos requiere un tiempo de computacion signi cativo, en el ultimo cap tulo se presenta una metodolog a que, basada en la proyeccion del modelo distribuido sobre hiperplanos de dimension baja, permite reducir su orden manteniendo sus propiedades de representacion. Las grandes ventajas del uso de modelos de orden reducido se ilustran con su aplicacion a la simulacion, dise~o y optimizacion dinamica del proceso de esterilizacion termica n de alimentos.
Objetivos
El objetivo fundamental de esta tesis ha sido el desarrollo de metodos avanzados de optimizacion dinamica de procesos distribuidos, buscando estrategias mas e cientes y robustas que las existentes en la actualidad. Para ello se ha elegido el esquema de parametrizacion de control y se han jado los siguientes subobjetivos: Desarrollar un metodo determinista local, basado en el uso de informacion de segundo orden, con el n de aumentar la velocidad de convergencia. Desarrollar un metodo h brido de optimizacion global, basado en la combinacion de un metodo estocastico y un metodo determinista local, para la resolucion de problemas multimodales (no convexos). Evaluar dichos metodos mediante su aplicacion a la resolucion de un amplio conjunto de problemas representativos de optimizacion dinamica, tanto de procesos concentrados como distribuidos, prestando especial atencion a la esterilizacion termica de alimentos y al procesamiento termico en hornos mixtos microondas-conveccion. Validar experimentalmente las pol ticas optimas obtenidas para el caso del procesamiento termico de alimentos en hornos mixtos microondas-conveccion. Acelerar la resolucion de problemas de optimizacion dinamica de sistemas distribuidos mediante el uso de modelos de orden reducido.
vii
viii
Objetivos
Indice
Agradecimientos Resumen Objetivos Indice Indice de tablas Indice de guras Notacion i v vii ix xv xix xxv
Introduccion
1 Modelado y simulacion dinamica de procesos
1.1 Desarrollo y tipos de modelos . . . . . . . . . . . . . . . . . . . . . 1.2 Solucion de ecuaciones diferenciales ordinarias (ODEs) . . . . . . . 1.2.1 Metodo expl cito de Euler . . . . . . . . . . . . . . . . . . . 1.2.2 Metodos Runge-Kutta . . . . . . . . . . . . . . . . . . . . . 1.2.3 Metodo de Adams . . . . . . . . . . . . . . . . . . . . . . . 1.2.4 Metodo impl cito de Euler . . . . . . . . . . . . . . . . . . . 1.2.5 Metodos BDF . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2.6 Codigos de resolucion de ODEs . . . . . . . . . . . . . . . . 1.2.7 RK vs BDF en problemas con discontinuidades . . . . . . . 1.3 Solucion de ecuaciones diferenciales ordinarias y algebraicas (DAEs) 1.4 Solucion de ecuaciones en derivadas parciales (PDEs) . . . . . . . . 1.4.1 Metodo de diferencias nitas . . . . . . . . . . . . . . . . . . 1.4.2 Metodo numerico de las l neas (NMOL) . . . . . . . . . . . . ix . . . . . . . . . . . . .
1
10 13 13 15 17 17 18 18 19 19 20 22 22
Indice
1.4.3 Metodos de residuo ponderado . . . . . . . . . . . . . . . . . . 23 1.4.4 Metodo de elementos nitos . . . . . . . . . . . . . . . . . . . 25 1.4.5 Metodos espectrales . . . . . . . . . . . . . . . . . . . . . . . . 27
2 Optimizacion estacionaria
2.1 2.2 2.3 2.4 2.5
Formulacion del problema de optimizacion no lineal (NLP) Generalidades . . . . . . . . . . . . . . . . . . . . . . . . . Condiciones de optimalidad . . . . . . . . . . . . . . . . . Manejo de restricciones . . . . . . . . . . . . . . . . . . . . Metodos de optimizacion local . . . . . . . . . . . . . . . . 2.5.1 Solucion del problema unidimensional . . . . . . . . 2.5.2 Metodos directos . . . . . . . . . . . . . . . . . . . 2.5.3 Metodos indirectos . . . . . . . . . . . . . . . . . . 2.6 Metodos de optimizacion global . . . . . . . . . . . . . . . 2.6.1 Metodos deterministas . . . . . . . . . . . . . . . . 2.6.2 Metodos estocasticos . . . . . . . . . . . . . . . . . 3.1 Formulacion matematica . . . . . . . . . 3.2 Breve revision historica . . . . . . . . . . 3.3 Metodos de optimizacion dinamica . . . 3.3.1 Programacion dinamica . . . . . 3.3.2 Principio maximo de Pontryagin . 3.3.3 Metodos directos . . . . . . . . . 3.4 Estudio comparativo . . . . . . . . . . . 3.5 Parametrizacion de control (CVP) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . .
29
30 31 33 35 36 37 37 38 43 45 47 52 54 55 55 56 60 62 64
3 Optimizacion dinamica
51
67
69
70 70 73 75 75 76 83
Indice
xi . 84 . 87 . 89 . 92 . 96 . 99 . 101 . 101 . 102 . 115 . 118 . 122 . 123 . 126 . 127 . 142 . 142 . 144 . 144 . 149 . 155
4.5 Metodo de Newton Truncado . . . . . . . . . . . . . . . . . . . . . 4.5.1 Implementacion practica de TNHp . . . . . . . . . . . . . . 4.5.2 Algunas particularidades acerca de la resolucion de IVPs . . 4.5.3 TNHp vs TNfd . . . . . . . . . . . . . . . . . . . . . . . . . 4.5.4 TNHp: resolucion de problemas en parametros concentrados 4.5.5 Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . 4.6 RTNHp: Control optimo de procesos qu micos y bioqu micos . . . . 4.6.1 RTNHp: TNHp con re nado . . . . . . . . . . . . . . . . . . 4.6.2 Optimizacion dinamica de bioreactores . . . . . . . . . . . . 4.6.3 Optimizacion de procesos qu micos de dimension elevada . . 4.7 Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
121
157
. 160 . 161 . 163 . 164 . 170 . 171 . 173 . 174 . 176
159
xii
Indice
6.5 Optimizacion dinamica de procesos distribuidos: ejemplos . . . . . 6.5.1 Control de la temperatura de una barra . . . . . . . . . . 6.5.2 Control optimo del calentamiento de un cilindro . . . . . . 6.5.3 Difusion a traves de una membrana . . . . . . . . . . . . . 6.5.4 Optimizacion de la esterilizacion de conservas de alimentos 6.6 Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . .
. 176 . 176 . 181 . 183 . 185 . 189 . 192 . 195 . 197 . 198 . 200 . 201 . 201 . 202 . 203 . 203 . 204 . 205 . 206 . 207 . 208 . 219
7.1 Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.2 Problemas del calentamiento con microondas . . . . . . . . . . . . 7.3 Modelo matematico del proceso . . . . . . . . . . . . . . . . . . . 7.3.1 Modelos de complejidad media . . . . . . . . . . . . . . . . 7.3.2 Modelos rigurosos: ecuaciones de Maxwell . . . . . . . . . 7.4 Simulacion del proceso . . . . . . . . . . . . . . . . . . . . . . . . 7.4.1 Resolucion numerica de las ecuaciones de Maxwell . . . . . 7.4.2 Resolucion numerica de la ecuacion de conduccion de calor 7.5 Problema de optimizacion dinamica . . . . . . . . . . . . . . . . . 7.5.1 Formulacion general . . . . . . . . . . . . . . . . . . . . . 7.5.2 Resolucion con TNHp . . . . . . . . . . . . . . . . . . . . 7.5.3 Problemas considerados . . . . . . . . . . . . . . . . . . . 7.6 Desarrollo de un controlador robusto . . . . . . . . . . . . . . . . 7.7 Validaciones experimentales . . . . . . . . . . . . . . . . . . . . . 7.8 Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.9 Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
191
8.1 Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 222 8.2 Obtencion de modelos de orden reducido para procesos distribuidos . 224 8.2.1 Expansion de Karhunen-Loeve . . . . . . . . . . . . . . . . . . 226 8.2.2 POD de un conjunto de datos . . . . . . . . . . . . . . . . . . 228 8.2.3 Proyeccion sobre el espacio reducido . . . . . . . . . . . . . . 231 8.2.4 Condiciones frontera no homogeneas . . . . . . . . . . . . . . 232 8.2.5 Presencia de terminos no lineales . . . . . . . . . . . . . . . . 233 8.2.6 Generacion del modelo reducido de forma automatica: ejemplo ilustrativo . . . . . . . . . . . . . . . . . . . . . . . . . . . 235 8.3 Aplicacion al procesamiento termico de alimentos . . . . . . . . . . . 239 8.4 Esterilizacion termica de alimentos envasados . . . . . . . . . . . . . 242
221
Indice
8.4.1 Dise~o del proceso . . . . . . . . . . . . . . . . . . n 8.4.2 Optimizacion dinamica . . . . . . . . . . . . . . . . 8.4.3 Obtencion del modelo de orden reducido . . . . . . 8.4.4 Validacion del modelo de orden reducido . . . . . . 8.4.5 Resultados del problema de dise~o . . . . . . . . . n 8.4.6 Resultados del problema de optimizacion dinamica 8.5 Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . .
Conclusiones Apendices
Apendice I . Apendice II . Apendice III Apendice IV Apendice V . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
263
. 271 . 275 . 279 . 283 . 289
269
Referencias
295
xiv
Indice
Indice de Tablas
1.1 Tipos de ecuaciones en derivadas parciales. . . . . . . . . . . . . . . . 21 4.1 Niveles de tolerancia de integracion y optimizacion . . . . . . . . . . 77 4.2 Resultados obtenidos con metodos tipo quasi-Newton para la optimizacion dinamica del Oscilador de van der Pol. . . . . . . . . . . . . 78 4.3 Resultados obtenidos con metodos tipo quasi-Newton para la optimizacion dinamica del problema de mezcla de catalizadores. . . . . . 80 4.4 Resultados obtenidos con metodos tipo quasi-Newton para la optimizacion dinamica del problema de Nishida. . . . . . . . . . . . . . . 82 4.5 Comparacion de integradores en la resolucion de problemas de optimizacion dinamica con el metodo TNHp. . . . . . . . . . . . . . . . 91 4.6 Resultados obtenidos para el caso del Oscilador de van der Pol con el metodo TNHp. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 4.7 Resultados obtenidos para el problema de mezcla de catalizadores con el metodo TNHp. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 4.8 Resultados obtenidos para el problema de Nishida con el metodo TNHp. 97 4.9 Resumen de resultados obtenidos por distintos metodos. . . . . . . . 100 4.10 Resultados obtenidos con el TNHp para el caso P 4.4a. . . . . . . . . 105 4.11 Resultados obtenidos con el RTNHp para el caso P 4.4a (r = 2 int toli=10;6, int tolf =10;8). . . . . . . . . . . . . . . . . . . . . . . 106 4.12 Resultados obtenidos con el TNHp para el caso P 4.4b. . . . . . . . . 106 4.13 Resultados obtenidos con el RTNHp para el caso P 4.4b (r = 2 int toli=10;6, int tolf =10;8). . . . . . . . . . . . . . . . . . . . . . . 106 4.14 Resultados obtenidos con el TNHp para el caso P 4.4c. . . . . . . . . 107 4.15 Resultados obtenidos con el RTNHp para el caso P 4.4c (r = 2 int toli=10;6, int tolf =10;8). . . . . . . . . . . . . . . . . . . . . . . 107 4.16 Tabla resumen de resultados para la optimizacion dinamica del bioreactor de Park-Ramirez. . . . . . . . . . . . . . . . . . . . . . . . . . . 108 xv
xvi
Indice de Tablas
4.17 Resultados presentados por Tholudur y Ramirez (1997) para el bioreactor de Lee-Ramirez. . . . . . . . . . . . . . . . . . . . . . . . . . . 111 4.18 Resultados obtenidos con el TNHp para el caso P 4.5a. . . . . . . . . 112 4.19 Resultados obtenidos con el RTNHp para el caso P 4.5a (r = 2 int toli=10;6, int tolf =10;8). . . . . . . . . . . . . . . . . . . . . . . 112 4.20 Resultados obtenidos con el TNHp para el caso P 4.5b. . . . . . . . . 112 4.21 Resultados obtenidos con el RTNHp para el caso P 4.5b (r = 2 int toli=10;6, int tolf =10;8). . . . . . . . . . . . . . . . . . . . . . . 113 4.22 Resultados obtenidos con el TNHp para el caso P 4.5c. . . . . . . . . 113 4.23 Resultados obtenidos con el RTNHp para el caso P 4.5c (r = 2 int toli=10;6, int tolf =10;8). . . . . . . . . . . . . . . . . . . . . . . 113 4.24 Resultados obtenidos en la optimizacion dinamica del problema del P 4.6a con el metodo TNHP. . . . . . . . . . . . . . . . . . . . . . . . 116 4.25 Resultados obtenidos con el RTNHp para el caso P 4.6a (r = 2 int toli=10;7, int tolf =10;8). . . . . . . . . . . . . . . . . . . . . . . 116 4.26 Resultados obtenidos en la optimizacion dinamica del problema del P 4.6b con el metodo TNHP. . . . . . . . . . . . . . . . . . . . . . . . 117 4.27 Resultados obtenidos con el RTNHp para el caso P 4.6b (r = 2 int toli=10;7, int tolf =10;8). . . . . . . . . . . . . . . . . . . . . . . 117 4.28 Tabla resumen de resultados para la optimizacion dinamica del CSTR.118 5.1 Resultados obtenidos para la optimizacion dinamica del proceso de pirolisis con metodos estocasticos. . . . . . . . . . . . . . . . . . . . . 130 5.2 Resultados obtenidos para la optimizacion dinamica del proceso de Denbigh con metodos estocasticos. . . . . . . . . . . . . . . . . . . . 132 5.3 Resultados obtenidos para la optimizacion dinamica del proceso de obtencion de etanol con metodos estocasticos. . . . . . . . . . . . . . 134 5.4 Resultados obtenidos para la optimizacion dinamica del proceso de obtencion de penicilina con metodos estocasticos. . . . . . . . . . . . 135 5.5 Resultados obtenidos para la optimizacion dinamica del sistema lineal con metodos estocasticos. . . . . . . . . . . . . . . . . . . . . . . . . 136 5.6 Resultados obtenidos para la optimizacion dinamica del problema del CSTR con metodos estocasticos. . . . . . . . . . . . . . . . . . . . . . 138 5.7 Resultados obtenidos para la optimizacion dinamica del problema del desplazamiento de dos farmacos con metodos estocasticos, caso P 5:7a. 139
Indice de Tablas
xvii
5.8 Resultados obtenidos para la optimizacion dinamica del problema del desplazamiento de dos farmacos con metodos estocasticos, caso P 5:7b. 139 5.9 Tabla resumen de resultados para problemas de una etapa y tiempo nal libre. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145 5.10 Tabla resumen de resultados problemas de una etapa de tiempo nal m nimo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146 5.11 Resumen de resultados para el problema de la columna de destilacion. 153 5.12 Estudio del efecto de SC 2 y el punto inicial en la convergencia del metodo HyMDO. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154 6.1 6.2 6.3 6.4 6.5 Resultados de simulacion del IVP extendido para un proceso distribuido.178 Resultados obtenidos para el problema de calentamiento de una barra.180 Resultados para el problema de control de la temperatura en un cilindro.182 Resultados para el problema de difusion a traves de una membrana. . 184 Resultados obtenidos para el problema de esterilizacion con el metodo TNHp. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187
7.1 Propiedades termof sicas del cilindro de patata. . . . . . . . . . . . . 208 7.2 Resultados obtenidos para el calentamiento optimo de una patata. . . 210 8.1 Parametros del problema de esterilizacion de pate de cerdo. . . . . . . 244
xviii
Indice de Tablas
Indice de Figuras
1 2 Clasi cacion de los subsectores de la industria de procesos. . . . . . . 3 Esquema de objetivos y aplicaciones de la ingenier a de procesos. . . . 5 1.1 Esquema gra co del desarrollo de una ecuacion de balance. . . . . . . 10 1.2 Estudio de estabilidad y precision del metodo de Euler: solucion segun el metodo de Euler (l nea discontinua) vs solucion real (l nea continua). 15 1.3 Comparacion metodo de diferencias nitas y elementos nitos. . . . . 26 3.1 Parametrizacion de control. . . . . . . . . . . . . . . . . . . . . . . . 65 3.2 Esquema de resolucion del problema de optimizacion dinamica mediante parametrizacion de control, seguido en este trabajo. . . . . . . 66 4.1 Oscilador de van der Pol: Per l de control optimo obtenido con un metodo quasi-Newton y variables de estado correspondientes. . . . . . 4.2 Mezcla de catalizadores: Per l de control optimo obtenido con un metodo quasi-Newton y variables de estado correspondientes. . . . . . 4.3 Problema de Nishida: Per l de control optimo obtenido con un metodo quasi-Newton y variables de estado correspondientes. . . . . . . . . . 4.4 Diagrama de ujo del metodo de Newton Truncado. . . . . . . . . . . 4.5 Implementacion practica de los metodos de segundo orden. . . . . . . 4.6 Estudio comparativo de las curvas de convergencia de los metodos TNHp y TNfd para la resolucion del problema CSTR (tomando como referencia J = 21:812). . . . . . . . . . . . . . . . . . . . . . . . . . . 4.7 Estudio comparativo de las curvas de convergencia de los metodos TNHp y TNfd para la resolucion el problema del oscilador de van der Pol (tomando como referencia J = 2:8673). . . . . . . . . . . . . . . 4.8 Comparacion de pol ticas optimas de operacion obtenidas con TNHp y TNfd para la resolucion del problema de mezcla de catalizadores. . 4.9 Pol tica de operacion ( = 100) para el caso de mezcla de catalizadores segun Dolan y More (2001). . . . . . . . . . . . . . . . . . . . . . . . xix 79 81 83 86 88 93 94 95 96
xx
Indice de Figuras
4.10 Pol tica de operacion optima para el caso P 4.1 ( = 500, J = 2:86728). 98 4.11 Pol tica de operacion optima para el problema P 4.2 ( = 150, J = 0:0480556). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 4.12 Pol tica de operacion optima para el problema P 4.3 ( = 150, J = 1:00891). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 4.13 Pol ticas de operacion optimas para los casos P 4.4a ( = 120, J = 93:441), P 4.4b ( = 120, J = 32:663) y P 4.4c ( = 120, J = 32:467) respectivamente. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109 4.14 Pol ticas de operacion optimas para los casos P 4.5a ( = 120, J = 6:1516), P 4.5b ( = 120, J = 5:75711) y P 4.5c ( = 120, J = 5:56789) respectivamente. . . . . . . . . . . . . . . . . . . . . . . . . 114 4.15 Pol ticas de operacion optima para el problema P 4.6a ( = 120, J = 20:0955). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117 4.16 Pol ticas de operacion optima para el problema P 4.6b ( = 66, J = 21:8167). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117 5.1 Ejemplo ilustrativo de la de nicion de puntos no dominantes o Pareto optimal. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124 5.2 Comportamiento t pico de un metodo determinista local, uno estocastico y un h brido en la resolucion de un problema unidimensional multimodal. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126 5.3 Curva Pareto para el proceso de pirolisis. . . . . . . . . . . . . . . . . 131 5.4 Curvas de convergencia de los metodos estocasticos en la resolucion de problemas P 5:1 a P 5:7b. . . . . . . . . . . . . . . . . . . . . . . . 141 5.5 Comportamiento t pico del metodo h brido. . . . . . . . . . . . . . . 143 5.6 Ajuste del metodo h brido para la resolucion del problema de obtencion de penicilina. . . . . . . . . . . . . . . . . . . . . . . . . . . . 144 5.7 Per les de control optimo y estados correspondientes para los problemas de tiempo nal libre (P 5:1-P 5:4). . . . . . . . . . . . . . . . . . 147 5.8 Per les de control optimo y estados correspondientes para los problemas de tiempo nal m nimo (P 5:5-P 5:7b). . . . . . . . . . . . . . . . 148 5.9 Esquema de operacion de un proceso multietapa. . . . . . . . . . . . 149 5.10 Esquema de una columna de destilacion. . . . . . . . . . . . . . . . . 151 5.11 Comportamiento t pico del metodo HyMDO: Valor objetivo frente a las tolerancias SC 1 y SC 2. . . . . . . . . . . . . . . . . . . . . . . . . 154
Indice de Figuras
xxi
5.12 Per l de control y fraccion molar de los componentes principales (1 y 6) correspondientes, para el problema de destilacion. . . . . . . . . . 155 6.1 Esquema de resolucion del problema de optimizacion dinamica mediante metodos CVP. . . . . . . . . . . . . . . . . . . . . . . . . . . . 165 6.2 Esquema de aplicacion del metodo NMOL para un problema unidimensional. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 166 6.3 Estructura basica del Jacobiano de los sistemas de ODEs obtenidos de aplicar NMOL (casos 1D y 2D). . . . . . . . . . . . . . . . . . . . 170 6.4 Comportamiento de LSODES en la simulacion de sistemas distribuidos con sensibilidades. . . . . . . . . . . . . . . . . . . . . . . . . . . 179 6.5 Per l de control y distribucion de temperaturas en el proceso de calentamiento de una barra ( = 320, J = 4:4 10;5). . . . . . . . . . . 180 6.6 Per l de control para el calentamiento de una barra unidimensional obtenido con gOPT ( = 80). . . . . . . . . . . . . . . . . . . . . . . 180 6.7 Aplicacion del metodo NMOL a la simulacion del problema de calentamiento de un cilindro. . . . . . . . . . . . . . . . . . . . . . . . . . 182 6.8 Per l de control y distribucion de temperaturas en el proceso de calentamiento de un cilindro ( = 40, J = 3:73 104). . . . . . . . . . . 182 6.9 Esquema del proceso de difusion a traves de una membrana. . . . . . 183 6.10 Per l de control y distribucion de concentraciones correspondiente en el problema de difusion a traves de una membrana. . . . . . . . . . . 185 6.11 Per l de control optimo para el problema de esterilizacion obtenido con TNHp, = 14, J = 0:4713. . . . . . . . . . . . . . . . . . . . . . 188 6.12 Distribucion de temperaturas a tiempo nal para el problema de esterilizacion. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188 6.13 Distribucion de retencion de nutrientes a tiempo nal para el problema de esterilizacion. . . . . . . . . . . . . . . . . . . . . . . . . . . 188 7.1 Espectro electromagnetico. . . . . . . . . . . . . . . . . . . . . . . . . 192 7.2 Esquema basico de un horno microondas. . . . . . . . . . . . . . . . . 193 7.3 Ejemplo de distribucion de potencia en el interior del horno (plano vertical). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 194 7.4 Distribucion real de temperaturas en los planos medios de un cilindro y un paralelep pedo: calentamiento solo con microondas. . . . . . . . 195 7.5 Distribucion real de temperaturas en los planos medios de un cilindro y un paralelep pedo: calentamiento solo por conveccion forzada. . . . 196
xxii
Indice de Figuras
7.6 Pantalla t pica mostrando la temperatura dentro del horno, la potencia del microondas y la potencia de la conveccion forzada. . . . . . . . 207 7.7 Situacion de los alimentos en el interior del horno. Seleccion de planos medios. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 208 7.8 Curva Pareto para el calentamiento de un cilindro de patata P 7:1. . . 209 7.9 Comparacion de tiempos de calculo de los distintos metodos para el problema P 7:1. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209 7.10 Per les de control y distribucion nal de temperaturas para el caso del calentamiento de un cilindro de patata. . . . . . . . . . . . . . . . 211 7.11 Per les de control y temperaturas maxima y m nima para el calentamiento de un cilindro de gel TX-151 (tf = 600s). . . . . . . . . . . . 212 7.12 Distribucion real de temperaturas en el plano medio de un cilindro: calentamiento mixto optimo. . . . . . . . . . . . . . . . . . . . . . . . 212 7.13 Per les de control optimos para el calentamiento de un paralelep pedo, modelo lineal. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213 7.14 Distribucion de temperaturas en el interior de un paralelep pedo a tiempo nal, modelo lineal. . . . . . . . . . . . . . . . . . . . . . . . . 213 7.15 Malla utilizada para la simulacion del calentamiento de un paralelep pedo, caso no lineal. Cortes a de N. Scheerlinck, Univ. de Lovaina. . . . . . 215 7.16 Curvas de convergencia del metodo ICRS/DS en la solucion del problema P 7:5. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215 7.17 Per les de control optimos para el calentamiento de un paralelep pedo, modelo no lineal. . . . . . . . . . . . . . . . . . . . . . . . . . . . 216 7.18 Distribucion de temperaturas en el interior de un paralelep pedo a tiempo nal: calentamiento mixto optimo. . . . . . . . . . . . . . . . 216 7.19 Distribucion de temperaturas en el plano medio de un paralelep pedo: calentamiento mixto optimo. . . . . . . . . . . . . . . . . . . . . . . . 217 7.20 Distribucion real de temperaturas en el plano medio de un paralelep pedo: calentamiento mixto optimo. . . . . . . . . . . . . . . . . . . 217 7.21 Per l optimo de calentamiento de un paralelep pedo: solo conveccion. 218 7.22 Distribucion de temperaturas en el interior de un paralelep pedo a tiempo nal, solo conveccion (modelo nolineal). . . . . . . . . . . . . 218 7.23 Distribucion real de temperaturas en el plano medio de un paralelep pedo: calentamiento solo conveccion optimo. . . . . . . . . . . . . . 218 8.1 Evolucion de un sistema dinamico disipativo. . . . . . . . . . . . . . . 226
Indice de Figuras
xxiii
8.2 Resultado t pico de la simulacion de la variable transformada ! en el caso del calentamiento de una esfera. Estos snapshots seran utilizados para la generacion del modelo reducido. . . . . . . . . . . . . . . . . 237 8.3 Energ a capturada por las primeras autofunciones emp ricas en el problema de calentamiento de una esfera. . . . . . . . . . . . . . . . . 237 8.4 Cuatro primeras autofunciones emp ricas para el caso del calentamiento de una esfera. . . . . . . . . . . . . . . . . . . . . . . . . . . 238 8.5 Comparacion de los modelos nominal (l neas) y reducido (s mbolos) en la simulacion del proceso de calentamiento de una esfera. . . . . . 239 8.6 Per l de temperatura t pico (CRT) durante un proceso de esterilizacion.245 8.7 Snapshots t picos para la variable ! en el problema de esterilizacion. 249 8.8 Snapshots t picos para la variable en el problema de esterilizacion. 249 8.9 Snapshots t picos para la variable lnCN en el problema de esterilizacion. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 250 8.10 Energ a capturada por las primeras autofunciones emp ricas en el problema de esterilizacion de alimentos. . . . . . . . . . . . . . . . . 250 8.11 Autofunciones emp ricas para la descripcion de la variable ! en el problema de esterilizacion. . . . . . . . . . . . . . . . . . . . . . . . . 251 8.12 Autofunciones emp ricas para la descripcion de la variable en el problema de esterilizacion. . . . . . . . . . . . . . . . . . . . . . . . 252 8.13 Autofunciones emp ricas para la descripcion de la variable lnCN en el problema de esterilizacion. . . . . . . . . . . . . . . . . . . . . . . 253 8.14 Comparacion de los modelos nominal (l neas) y reducido (s mbolos): simulacion de la distribucion de temperaturas en el proceso de esterilizacion (se muestran las T en varios puntos del alimento). . . . . . 256 8.15 Comparacion de los modelos nominal (l nea) y reducido (s mbolo): simulacion de la letalidad en el punto cr tico. . . . . . . . . . . . . . 256 8.16 Comparacion de los modelos nominal (l nea) y reducido (s mbolo): simulacion de la retencion volumica media de nutrientes. . . . . . . . 256 8.17 Resultados obtenidos con el modelos reducido para el problema de dise~o del proceso de esterilizacion: retencion de nutrientes. . . . . . 258 n 8.18 Resultados obtenidos con el modelos reducido para el problema de dise~o del proceso de esterilizacion: tiempo de calentamiento. . . . . 258 n 8.19 Per l de control optimo y temperatura en el punto cr tico para el proceso de esterilizacion de alimentos. Resultados obtenidos con el modelo reducido. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 260
xxiv
Indice de Figuras
8.20 Evolucion temporal de la retencion volumica media de nutrientes correspondiente a la pol tica optima de operacion. . . . . . . . . . . . . 260 8.21 Evolucion temporal de la letalidad en el punto cr tico correspondiente a la pol tica optima de operacion. . . . . . . . . . . . . . . . . . . . 260 8.22 Comparacion de las curvas de convergencia de la optimizacion del proceso de esterilizacion utilizando el modelo nominal y el modelo reducido. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 261
Notacion
Abreviaturas
BDF CG CP CVP DAEs FE HyMDO IDP int tol IVP KKT K-L Mt ncg nf ng nh ni NLP NMOL nnz NRO Nv ODEs opt tol Metodo de integracion que hace uso de la backward di erentiation formula Metodo de gradiente conjugado Metodo de parametrizacion total Metodo de parametrizacion de control Ecuaciones diferenciales ordinarias y algebraicas Metodo de elementos nitos Metodo h brido estocastico-determinista para optimizacion dinamica Metodo de programacion dinamica iterativa Tolerancia de integracion Problema de valor inicial Condiciones de optimalidad de Karush-Kunh-Tucker Expansion de Karhunen-Loeve Metodo de optimizacion Numero de iteraciones del metodo de gradiente conjugado Numero de evaluaciones de la funcion objetivo Numero de evaluaciones del gradiente Numero de evaluaciones del Hessiano Numero de iteraciones que realiza el metodo de optimizacion Problema de optimizacion no lineal Metodo numerico de las l neas Numero de elementos no nulos de una matriz Numero de iteraciones de re nado Nivel de tolerancias de optimizacion e integracion Ecuaciones diferenciales ordinarias Tolerancia de optimizacion
En esta seccion solo se incluye una relacion de las abreviaturas y s mbolos mas utilizados a lo largo de esta memoria.
xxv
Notacion
SC 1 y SC 2
SQP Tcpu TN TNFd TNHp
Ecuaciones en derivadas parciales, diferenciales ordinarias y algebraicas Ecuaciones en derivadas parciales Proper orthogonal decomposition Metodo quasi-Newton Metodos de integracion Runge-Kutta y Runge-KuttaFehlberg Metodo de Newton truncado con re namiento para optimizacion dinamica Tolerancias de optimizacion para los metodos estocastico y determinista respectivamente Metodo de programacion cuadratica secuencial Tiempo de computacion Metodo de Newton truncado Metodo de Newton truncado con calculo para optimizacion dinamica (diferencias nitas) Metodo de Newton truncado para optimizacion dinamica (exacto)
S mbolos
ai
dk f F1 , F2 , F3 g h H
J J0 Jtot
ceq
cin
L n
p req y rin R s
t, t0 y tf
Coe cientes temporales modelos de orden reducido Vector de restricciones de camino de igualdad y desigualdad Vector que depende de la direccion de busqueda Vector de ecuaciones diferenciales ordinarias Condiciones frontera de primer, segundo y tercer orden Vector de restricciones algebraicas de desigualdad Vector de restricciones algebraicas de igualdad Hessiano de la funcion objetivo con respecto a las variables de decision Funcion objetivo Valor de la funcion objetivo correspondiente al vector v0 Funcion objetivo total en problemas multiobjetivo Jacobiano de un conjunto de ODEs Lagrangiano Dimension del vector de ecuaciones diferenciales ordinarias Vector de direcciones conjugadas Vector de restricciones puntuales de igualdad y desigualdad Matriz de correlacion Direccion de busqueda Tiempo, tiempo inicial y tiempo nal
Notacion
xxvii
u uL y uU v v0 , v k y v w wL y wU x x yx xt y _ y z _ z z0
E
x ~
Vector de variables de control L mites inferior y superior para las variables de control Vector de variables de decision Vector inicial, intermedio y nal en la solucion del problema de optimizacion Vector de parametros independientes del tiempo L mites inferior y superior para los parametros independientes del tiempo Solucion aproximada de una ecuacion en derivadas parciales Vector de variables de estado distribuidas Primera y segunda derivadas espaciales del vector de variables x Derivada parcial con respecto al tiempo de las variables distribuidas Vector de variables de estado no distribuidas Derivada con respecto al tiempo de las variables no distribuidas Vector de variables dependientes del tiempo Derivada temporal de las variables z Vector de condiciones iniciales Dimension del vector de restricciones de igualdad Vector de ecuaciones en derivadas parciales, ordinarias y algebraicas Vector de condiciones iniciales Hamiltoniano del sistema Dimension del vector de restricciones de desigualdad Nucleo de una ecuacion integral lineal Operador espacial lineal Residuo en los metodos de residuo ponderado Dimension del vector de parametros independientes del tiempo Operador espacial general Vector de autovalores Multiplicadores de Lagrange Nivel de discretizacion espacial en los metodos NMOL y FE Nivel de discretizacion de control Dimension del vector de variables de decision Dimension del vector de variables de control Vectores de funciones espaciales Dominio espacial de de nicion del proceso Vector de coordenadas espaciales
F F0
H I K L R
~
',
xxviii
Notacion
Introduccion
Bioqumica
Figura 1: Clasi cacion de los subsectores de la industria de procesos. Por ejemplo, en la industria alimentaria son frecuentes los procesos de fermentacion (fabricacion de quesos, yogures etc.) que tambien se usan, con otros nes, en la industria biotecnologica (p. ej. obtencion de antibioticos). Igualmente, algunos procesos de preservacion de alimentos que se llevan a cabo en la industria agroalimentaria hacen uso de productos qu micos organicos o inorganicos generados por la industria qu mica. Por otro lado, existen multitud de operaciones comunes en los subsectores biotecnologico y alimentario: esterilizacion, centrifugacion, cromatograf a, dialisis, etc.
4 En terminos generales, la industria qu mica basica se encarga de la produccion de productos destinados principalmente a otras industrias de transformacion (acidos, bases, sales organicas e inorganicas, etc.), mientras que la qu mica de especialidades se dedica a la obtencion de productos tales como papel, carburantes, pinturas, tintes, pol meros y otros productos de alto valor a~adido (perfumes, cosmeticos, etc.). La n industria agroalimentaria se dedica a la transformacion de materias primas de origen vegetal y/o animal en nuevos alimentos y a su tratamiento con el n de transformarlos en productos con la calidad requerida para su consumo. Por ultimo, la industria biotecnologica y bioqu mica, incluye todo tipo de procesos que hacen uso o guardan relacion con sistemas biologicos, y se dedican, por ejemplo, a la elaboracion de farmacos, algunos aditivos alimentarios, etc. Las mayores exigencias del mercado, tanto en calidad como en cantidad de producto, la mayor demanda de exibilidad operacional, el aumento del coste de la energ a y la incorporacion de legislaciones y regulaciones que exigen mayor proteccion del medio ambiente, son algunos de los factores que han llevado a la industria de procesos a realizar grandes inversiones en investigacion con el n de minimizar costes, disminuir el impacto ambiental y aumentar la e ciencia energetica. La ingenier a de procesos persigue la consecucion de estos objetivos mediante la aplicacion de tecnicas sistematicas, asistida por ordenadores, para el estudio completo de procesos, incluyendo su control y seguridad, la proteccion del medio ambiente y el uso e ciente de la energ a, desde los puntos de vista de desarrollo, dise~o n y operacion (Bogle, 2000). En la gura 2, se resumen las necesidades fundamentales de la industria de procesos as como las distintas herramientas de la ingenier a de procesos que contribuiran a cubrir dichas necesidades.
Ingeniera de procesos
Figura 2: Esquema de objetivos y aplicaciones de la ingenier a de procesos. las aplicaciones de interes (Aris, 1993). Estos mecanismos de representacion son los modelos matematicos que, en general, se basan en las leyes f sicas de conservacion de masa, energ a y momento y en las ecuaciones constitutivas asociadas a transformaciones cineticas y propiedades f sicas. La mayor a de los procesos de los sectores biotecnologico y alimentario, de interes en esta tesis, transcurren en modo discontinuo (por lotes, o en batch) o semicontinuo, permitiendo la obtencion de productos de alto valor a~adido, y de varios productos n en una unica planta (plantas multiproposito). Los procesos discontinuos son inherentemente dinamicos y, por lo tanto, sus modelos matematicos estan formados por sistemas de ecuaciones algebraicas y diferenciales ordinarias (DAEs) (Pantelides et al., 1988). Sin embargo, muchos procesos qu micos y bioqu micos tienen ademas un caracter distribuido, esto es, al menos algunas de sus variables de estado estan distribuidas de forma espacial (Silebi y Schiesser, 1992 Aris, 1993 Oh, 1995) de manera que no solo dependen del tiempo sino que, ademas, dependen de la posicion y, por lo tanto, estan descritos, en general, por conjuntos de ecuaciones diferenciales ordinarias, ecuaciones en derivadas parciales y ecuaciones algebraicas (PDAEs). Dentro de este ultimo grupo se incluyen muchos de los procesos relacionados con la tecnolog a de alimentos (Singh y Heldman, 1993), y en particular con tecnicas
6 de preservacion basadas en el procesamiento termico, objeto de particular atencion en esta tesis. Por ultimo, en este tipo de procesos es habitual la presencia de discontinuidades (p.ej., eventos discretos), por lo que se han desarrollado modelos denominados h bridos, que combinan cualquiera de los modelos dinamicos anteriores con dichas discontinuidades (Barton y Pantelides, 1994). Estos modelos matematicos suelen ser muy complejos y en la mayor a de los casos no sera posible encontrar soluciones anal ticas, lo que ha motivado el desarrollo de herramientas informaticas adecuadas para su resolucion numerica (simulacion). En este sentido, han sido muchos los metodos numericos que se han desarrollado tanto para la resolucion de DAEs (Lioen y Swart, 1999) como para la resolucion de sistemas mas complejos descritos por PDAEs y sistemas h bridos (Schiesser, 1994 Ascher y Petzold, 1998 Langtangen, 1999). En la actualidad se dispone ademas de diversas herramientas de desarrollo de modelos y simulacion de procesos dinamicos con entornos amigables para el usuario (Jensen y Gani, 1998). Algunas permiten la simulacion de procesos distribuidos poco complicados a partir de la transformacion de PDAEs en DAEs mediante el uso de distintas tecnicas de discretizacion, destacando gPROMS (PSE Ltd., Londres, Reino Unido) y ACM (Aspen Custom Modeler, Aspentech, Cambridge, Ma, USA). La evolucion de estas herramientas a entornos cada vez mas so sticados que incluyan librer as de operaciones basicas de las industrias biotecnologica y alimentaria, as como nuevas metodolog as de simulacion mas e ciente de procesos distribuidos, permitiendo la generacion automatica de modelos de orden reducido, contribuiran al mejor desarrollo y comprension de los procesos.
Optimizacion y control
La simulacion de procesos no es un n en s misma, sino que se dedica habitualmente a la optimizacion de algun aspecto del dise~o o la operacion del proceso. En terminos n generales optimizar consiste en calcular los valores de ciertas variables de decision con el n de maximizar o minimizar una cierta funcion (o funcional), cumpliendo un conjunto de restricciones. En el contexto de procesos, las variables de decision incluyen distintos parametros relacionados con el dise~o del proceso y/o variables que representan acciones ejercin das desde el exterior (controles). En cuanto a los objetivos, estos dependeran del tipo de problema de optimizacion a resolver, pudiendo estar relacionado con el dise~o, la n con guracion o la operacion del proceso (Biegler et al., 1997). Estos objetivos estan relacionados, en general, con la minimizacion de la energ a consumida, del coste de
7 produccion, del tiempo de proceso o bien con la maximizacion de la cantidad y/o calidad de producto. Recientemente, se han dedicado grandes esfuerzos a la resolucion de problemas que simultanean todos estos objetivos. Estos son los llamados problemas de s ntesis (Grossmann et al., 1999 Lin y Floudas, 2000), que en el caso de procesos en estado estacionario resultan en problemas de optimizacion no lineal que incluyen variables enteras y reales (Mixed Integer Non Linear Programming, MINLP). La optimizacion de la operacion de procesos dinamicos requiere el calculo de las pol ticas optimas de operacion (variables de control del proceso) con el n de minimizar (o maximizar) un cierto funcional. La busqueda en este caso se hace en espacios de funciones, lo que implica un grado de complejidad superior. Aunque originalmente su solucion pertenece al campo del analisis variacional, la di cultad derivada del caracter no lineal de la mayor a de los procesos de interes, y sobre todo de la presencia de restricciones (San y Stephanopoulos, 1989 Cuthrell y Biegler, 1989 Banga y Seider, 1996) han llevado al desarrollo de tecnicas alternativas basadas en la parametrizacion de los estados y/o del control, transformando as el problema original en un problema de programacion no lineal (NLP). Por ultimo, el proceso debe dotarse de esquemas de regulacion y control capaces de cancelar los efectos negativos que, sobre la operacion, puedan tener posibles perturbaciones u otras eventualidades tales como fallos inesperados o escenarios de puesta en marcha o parada, garantizando el cumplimiento de los objetivos marcados. El control de procesos es una tarea compleja, ya que se enfrenta al problema de la falta de instrumentacion adecuada que permita obtener datos en l nea acerca del estado de sistema. Sera necesario pues el uso de tecnicas de identi cacion y estimacion que permitan predecir el estado del sistema a partir de un numero, generalmente limitado, de medidas. De esta forma, un controlador puede de nirse como un dispositivo que invirtiendo la dinamica de la planta, determina e implementa la cantidad de accion necesaria para devolver los estados relevantes del proceso a los valores de nidos por la consigna. Esta consigna correspondera al estado calculado a traves de la resolucion de un problema de optimizacion dinamica.
Motivacion
La optimizacion de procesos constituye un area de investigacion muy activa, como lo prueba la enorme cantidad de trabajos publicados en las ultimas decadas. Tres han sido los enfoques principales (Biegler, 2000) adoptados por los distintos investigadores:
8 El puramente matematico, que se centra en el estudio teorico de la optimizacion (condiciones de optimalidad, existencia de soluciones, etc.). El del analisis numerico que se orienta al desarrollo e implementacion de nuevos metodos de optimizacion e cientes. El mas practico (ingenieril), orientado a la resolucion robusta y able de problemas reales. Esta tesis se enmarca en un punto intermedio entre el enfoque numerico y practico, centrandose en el estudio y desarrollo de nuevas alternativas para la optimizacion dinamica de procesos distribuidos, y en su aplicacion a casos de interes industrial, en especial de las areas biotecnologica y alimentaria. En los ultimos a~os se han presentado una gran variedad de metodos, cada vez n mas e cientes y robustos, con el n ultimo de utilizarlos en aplicaciones en tiempo real. Sin embargo, el estado actual en el contexto de sistemas dinamicos distribuidos tiene todav a muchas carencias, originadas por: El uso de metodos de optimizacion poco e cientes, en el sentido de que requieren un elevado numero de evaluaciones de la funcion objetivo (es decir, de simulaciones) para alcanzar una solucion. El uso de metodos de simulacion que, en aras de la precision, implican un elevado coste computacional para cada evaluacion. Este trabajo se centrara pues en la mejora del rendimiento y robustez del proceso de optimizacion, desarrollando metodos alternativos que intenten reducir estas dos di cultades: por una parte, presentando nuevas estrategias de optimizacion, tanto locales como globales, mas e cientes y robustas y, por otra, desarrollando metodos mas e cientes de simulacion de procesos distribuidos.
El modelo matematico de un proceso consiste en un conjunto de ecuaciones (tanto las derivadas de leyes f sicas de conservacion como las de tipo constitutivo) con el que pretende imitar el comportamiento de dicho proceso. En este cap tulo se presentan los aspectos mas relevantes del desarrollo de modelos dinamicos para el caso general de procesos distribuidos. Estos modelos estan formados por sistemas de ecuaciones en derivadas parciales, diferenciales ordinarias y algebraicas (PDAEs) cuya solucion e ciente sera de vital importancia para el posterior calculo de las pol ticas optimas de operacion. Sin embargo, la solucion de PDAEs requiere, en la mayor a de los casos, el uso de tecnicas numericas que, como se vera, consisten en transformar las PDEs en un sistema de ODEs o DAEs, que se podra resolver utilizando una herramienta de integracion adecuada. Es por ello que, para comenzar, se revisan los metodos mas relevantes para la resolucion de ODEs y DAEs, para nalizar con un repaso de las tecnicas mas habituales para la resolucion numerica de PDEs. 9
10
Generacin
11
La forma generica de las ecuaciones resultantes sera: Acumulacion= Flujo entrada - Flujo salida + Generacion donde la generacion puede ser de tipo interno o externo, via por ejemplo reactiva en el primer caso, o debido a la presencia de campos externos, tales como electrico, magnetico o gravitatorio, en el segundo. Los parametros de los modelos se calculan, habitualmente, a partir de datos experimentales. Sin embargo, en muchas ocasiones no es posible medir las habitualmente llamadas magnitudes fundamentales, por lo que se usan otras alternativas que nos permiten determinar las primeras. As , la masa, energ a y momento se pueden caracterizar mediante la densidad, concentracion, temperatura, presion y velocidad de ujo, que se pueden medir con mas facilidad. Las relaciones entre unas y otras vendran dadas por las ecuaciones constitutivas del medio. Estas ecuaciones constitutivas seran de tipo termodinamico, tales como equilibrio de fases, ecuaciones de estado, cineticas etc. Los modelos de los procesos qu micos concentrados en regimen transitorio estaran formados por sistemas mixtos de ecuaciones algebraicas y diferenciales ordinarias (DAEs) (Pantelides et al., 1988). Los sistemas de DAEs se pueden clasi car segun el ndice, es decir, el numero de veces que hay que derivar un sistema de DAEs para que se convierta en un sistema de ODEs. Los sistemas de ndice 1 se comportan de manera similar a los sistemas de ODEs y se pueden resolver utilizando metodolog as parecidas. Los sistemas de ndice superior aunque menos frecuentes en la practica, s aparecen en algunos casos (Pantelides et al., 1988) lo que ha llevado a que en los ultimos a~os se hayan desarrollado tecnicas de reduccion de ndice (Jarvis, 1993 y n Feehery, 1998) que permiten considerar este tipo de sistemas de forma mas sencilla. Cuando las variables del proceso no solo dependen del tiempo, sino que ademas dependen de la posicion, es necesario aplicar los balances microscopicos en todo el dominio de de cinicion. Surgen, entonces, ecuaciones en derivadas parciales, muchas veces combinadas con DAEs, constituyendo sistemas de PDAEs.
12
primeras son distribuidas, es decir, dependen tanto del tiempo como de la posicion ( ) y las segundas solo dependen del tiempo. Por otra parte x = @ x=@ , x = _ @ 2 x=@ 2 , xt = @ x=@t, y = dy=dt. Para garantizar la existencia de una solucion al sistema 1.1, es necesario imponer condiciones iniciales y condiciones frontera de la forma: Condiciones iniciales: F 0(x(t0 ) y(t0) t0) = 0 (1.2) Condiciones frontera: De primer orden, tambien llamadas de Dirichlet:
x( t) = F1 ( t)
De segundo orden, o de Neumann:
(1.3)
xn ( t) = F2 ( t)
De orden mixto o de Robin:
(1.4)
(1.5)
donde n es el vector normal a la super cie. La solucion anal tica de este sistema es posible unicamente en un numero muy reducido de problemas. En general los problemas distribuidos que se consideraran en este trabajo estan relacionados con el procesamiento termico de alimentos. Desafortunadamente los modelos de estos procesos son muy no lineales (Fryer, 1994 Verboven et al., 1997) y la solucion anal tica queda descartada. Muchos investigadores se han dedicado al desarrollo de tecnicas e cientes que nos permitan su resolucion numerica. En los libros de Schiesser (1994) y Langtangen (1999) se examinan algunas de las metodolog as mas utilizadas para el caso particular de problemas relacionados con el procesamiento termico, Jaluria y Torrance (1986) y Chandra y Singh (1995) hacen un estudio de la aplicacion de distintos metodos.
13
(1.6)
z = z0 +
Z tf
t0
f (z t)dt
(1.7)
En general, todos los metodos de resolucion numerica de ODEs se basan en la idea de resolver numericamente la integral en la ec. (1.7). Para ello se divide el eje temporal en un numero de intervalos nt de duracion t y se calculan los valores de las variables dependientes en un intervalo dado, en funcion de sus valores en intervalos adyacentes. Las condiciones iniciales impuestas al sistema constituyen el punto de partida de todos los metodos. El valor de t controla, de alguna manera, la precision del resultado, es decir, el error cometido en relacion a la solucion anal tica, si existiese, del problema. Sin embargo, tan importante como la precision es la estabilidad del metodo, que como se vera, es un factor de vital importancia en la resolucion de los llamados problemas r gidos (sti ), caracterizados por tener constantes temporales muy separadas. Estos dos conceptos determinan la eleccion de un metodo u otro para la resolucion de un determinado problema y por lo tanto, la descripcion de cada metodo se acompa~a de un breve analisis de precision y estabilidad. n
14
(1.8)
Precision
Se denominara z a la solucion \real" del problema. El analisis de precision del metodo pretende predecir la diferencia que habra entre la solucion numerica y la solucion real. En el caso del metodo de Euler es facilmente comprobable (Silebi y Schiesser, 1992) que el error es proporcional a t ya que es un metodo de primer orden. El error total vendra dado por = (tf ; t0 ) t lo que lleva a elevar el numero de intervalos notablemente para aumentar la precision del resultado.
Estabilidad
Para hacer el estudio de estabilidad se considera un problema muy sencillo cuya solucion anal tica es conocida: _ z = Az (1.9) donde A es una matriz de coe cientes constantes con autovalores . Por simplicidad se estudiara el caso unidimensional cuya solucion anal tica es z(t) = z0e t que suponiendo que < 0, decae exponencialmente con el tiempo. Aplicando la formula general del metodo de Euler (ec. (1.8)) para la resolucion de la ecuacion se obtiene zi+1 = zi (1 + t) que, en principio, no se parece a una funcion exponencial. Si se analiza en detalle la solucion, es facil deducir que para ciertos valores del producto t, la solucion se vuelve inestable (ej., t = ;3), su magnitud crece con el tiempo, y para otros, (ej. t = ;2) es estable pero oscilatoria. Estos resultados llevan a concluir que la reduccion del tama~o de paso no conduce n siempre a una mejor solucion, sino que hay que tener en cuenta, ademas, cierto criterio de estabilidad del metodo, que para el caso de Euler se expresa en la forma:
j
t <2
j
(1.10)
En la gura 1.2, se ilustran los conceptos de precision y estabilidad en la solucion del problema (1.9) con A = = ;1, para distintas condiciones iniciales y distintos valores de t. Es importante resaltar que a medida que se requiere mayor precision, el numero de pasos y, por lo tanto, el coste computacional, crecen notablemente.
15
10 5 z(t) 0 -5 -10
t=2.0
10 5 z(t) 0 -5 -10 0
t=1.5
6 8 Tiempo
10
12
6 8 Tiempo
10
12
10 5 z(t) 0 -5 -10
t=0.5
10 5 z(t) 0 -5 -10 0
t=0.05
6 8 Tiempo
10
12
6 8 Tiempo
10
12
Figura 1.2: Estudio de estabilidad y precision del metodo de Euler: solucion segun el metodo de Euler (l nea discontinua) vs solucion real (l nea continua). En general sera el criterio de precision el que determinara el valor de t. De hecho, en la mayor a de las ocasiones es posible que la solucion sea estable pero imprecisa lo que llevara a una reduccion de su valor. Sin embargo, en los problemas r gidos, con constantes temporales muy distintas, es decir, autovalores muy separados, el tama~o n de paso vendra determinado precisamente por el criterio de estabilidad, llegando, en ocasiones, a ser tan peque~o, que su solucion mediante el metodo de Euler es n prohibitiva.
16
en serie de Taylor, que en el caso unidimensional resultar a: q q t2 2 zi+1 = zi + t dz (ti ) + 2! d z (ti ) + : : : + qt! d z (ti) (1.11) dt dt2 dtq o lo que es lo mismo: q;1 q;1 t2 (1.12) zi+1 = zi + tf (ti ) + 2! df (ti ) + : : : + (q t 1)! d q;f (ti ) dt ; dt 1 El metodo de Euler aproxima la pendiente de la funcion f en el intervalo ti ; ti+1 , por un valor constante, su valor en ti , es decir, se queda en la aproximacion de primer orden, lo que implica la necesidad de un numero de intervalos (nt) muy elevado y en una perdida de e ciencia muy importante. Lamentablemente la ec. (1.12) no es muy util para desarrollar metodos de orden superior ya que requiere las derivadas de la funcion f , informacion, en general, no disponible. Sin embargo, todav a es posible aumentar mas la precision, sin usar las derivadas. Para ello se tomara un numero superior de puntos intermedios colocados de manera determinada que permitiran aproximar de alguna manera las derivadas en la expresion polinomica (1.12). Esta es la base de los metodos Runge-Kutta de orden superior, entre los cuales el mas utilizado es el de orden 4 (RK4), tambien llamado clasico ya que fue el desarrollado por los matematicos alemanes Runge y Kutta a nales del siglo XIX (Iserles, 1996). Se ha demostrado que los metodos RK son mas precisos que un metodo de Euler a igualdad de tama~o de paso, y que esta precision aumenta a medida que aumenta n el orden del metodo. Sin embargo, es facil demostrar que el criterio de estabilidad apenas se modi ca: si para el metodo de Euler la condicion era j tj < 2 para el metodo RK4 resulta j tj < 2:785 (Silebi y Schiesser, 1992), lo que no aumenta demasiado su rango de aplicacion a problemas r gidos.
17
error local cometido por el de orden inferior y reajustar el tama~o de paso si n es que esta por encima de una cierta tolerancia pre jada. Una implementacion de esta idea es el llamado metodo Runge;Kutta; Fehlberg (RKF45), que calcula dos estimaciones, una de orden 4 y otra de orden 5, utilizando para ambos casos los mismos valores de las constantes, lo que reduce el coste computacional de chequear el error. Este metodo ha resultado ser muy e ciente permitiendo incluso la solucion de sistemas r gidos.
zi+1 = zi + t
q X j =;1
bj fn;j
(1.13)
Los mas populares son los metodos de Adams-Bashforth (revisados en Quarteroni et al. 2000), metodos expl citos que han probado ser muy precisos.
18
valores de t. De hecho cada metodo presenta una region de estabilidad fuera de la cual el comportamiento sera erroneo. Sin embargo los metodos impl citos son incondicionalmente estables. Asimismo son mas exactos, permitiendo intervalos temporales mas largos, pero requieren la solucion de un sistema de ecuaciones en cada t lo que en la mayor a de los casos es muy costoso desde el punto de vista computacional. A partir del desarrollo del metodo impl cito de Euler se han desarrollado otros metodos impl citos como Runge-Kutta impl cito (que es una extension del metodo Runge-Kutta tradicional pero que hace uso expl cito del Jacobiano del sistema) o el metodo de Adams-Moulton y el popular BDF (backward di erentiation formula).
zi+1 =
k zi;k +
t 0 f (zi+1 ti+1)
(1.15)
donde q es el orden del metodo y k y 0 son constantes para un orden dado. Estas constantes determinaran el buen funcionamiento del metodo en terminos de precision y estabilidad. En su trabajo, Gear presenta los valores adecuados para los casos q 6. Visto de otra forma, en realidad este metodo aproxima el valor de f (zi+1 ti+1) mediante el uso de informacion de los valores de z en instantes anteriores y es esta idea precisamente la que le da el nombre de diferencias anteriores (backward di erences). Estos y otros metodos se revisan ampliamente en el libro de Ascher y Petzold (1998).
LSODA: modi cacion de LSODE por Petzold (1983) permitiendo el cambio de un metodo Adams a uno BDF dependiendo de la rigidez del problema3.
LSODA: http://www.netlib.org/odepack/lsoda.f
20
de los modelos que aparecen en ingenier a de procesos estan constituidos en realidad por conjuntos de ecuaciones diferenciales ordinarias y algebraicas (DAEs). Gear (1971) amplio la aplicacion de los metodos BDF a la solucion de problemas expresados en DAEs mediante la resolucion del sistema de ecuaciones (ec. (1.15)), debidas a la resolucion de las ODEs, y las AEs presentes originalmente en el problema, de manera simultanea mediante el metodo de Newton. El uso de BDF no es la unica posibilidad y muchos de los sistemas de DAEs pueden resolverse utilizando los metodos que se consideraron para la solucion de problemas r gidos, es decir, los metodos impl citos y los expl citos de paso variable (Petzold, 1982 Brenan et al., 1989) con las modi caciones adecuadas. Para la resolucion de DAEs se dispone de una gran variedad de codigos (Lioen y Swart, 1999). Algunos ejemplos son: DDASSL: desarrollado por Petzold (1982), es un metodo BDF implementado en Fortran4. DASOLV: desarrollado por Jarvis y Pantelides (1992), es un metodo BDF que incluye ademas rutinas adecuadas para la resolucion de sistemas dispersos5 . RADAU5: metodo Runge-Kutta impl cito de orden 5 (descrito en Hairer y Wanner, 1996)6. GELDA: metodo para la resolucion de sistemas de DAEs lineales de ndice arbitrario, dispone de una version basada en Runge-Kutta y otra basada en BDF (Kunkel et al., 1997) 7.
21
En general se distinguira entre operadores lineales y no lineales y, dentro de los primeros, entre el pticos, hiperbolicos y parabolicos. En la tabla 1.1 se muestran sus formas generales y algunos ejemplos. Tipo Orden en El ptica 2 Parabolica 2 er orden Hiperbolica 1 1 Hiperbolica 2o orden 2 Orden en t Ejemplo 0 Ec. de Laplace: r2x = 0 1 Ec. de Fourier: xt = kr2 x 1 Ec. de adveccion: xt = ;vrx 2 Ec. de ondas: xtt = c2r2 x
En muchos casos practicos aparecen tambien combinaciones de estos como por ejemplo en la ecuacion de conveccion: xt = ;vrx + r2 x. Debido a la falta de un metodo universal para la resolucion exacta de ecuaciones en derivadas parciales, se han invertido grandes esfuerzos en desarrollar metodos numericos que permitan su resolucion aproximada. Estos metodos han ido evolucionando de manera muy rapida a medida que ha aumentado la capacidad computacional, y hoy en d a estan su cientemente desarrollados como para permitir la resolucion de problemas muy complejos. Aqu se revisan los metodos mas empleados prestando especial atencion a sus respectivas ventajas e inconvenientes. En primer lugar se consideran dos metodos especialmente faciles de utilizar, el metodo de diferencias nitas y el metodo numerico de las l neas. Ambos aproximan las derivadas espaciales utilizando diferencias nitas. A continuacion se revisaran otros metodos que con el n de transformar el problema original de dimension in nita en uno de dimension nita, es decir, en un conjunto de ODEs (o DAEs), realizan una proyeccion de las PDEs en un conjunto nito de funciones espaciales que contienen la informacion necesaria acerca de la geometr a del sistema. A estos metodos se les denomina de residuo ponderado (weighted residual methods) entre los que se destaca el metodo de Galerkin. El tipo de funcion espacial elegida determina el tipo de metodo: en general, pueden ser funciones locales como, por ejemplo, en el caso de los metodos de elementos nitos o pueden ser globales como en el caso de las autofunciones asociadas al operador espacial.
22
23
espacial y del metodo de resolucion del sistema de ODEs resultante. Es importante resaltar que, en ocasiones, este sistema de ODEs resulta ser r gido precisamente debido a la discretizacion espacial. En este caso sera necesario utilizar un metodo adaptativo o un metodo impl cito como los considerados en la seccion 1.2. Sin embargo, los sistemas de ODEs resultantes suelen tener dimension elevada, dependiendo del nivel de discretizacion y por supuesto, de la dimension espacial del problema, lo cual limita la aplicacion de ciertos metodos. Por ejemplo, el uso de metodos BDF garantiza la estabilidad de la solucion, sin embargo es necesario el calculo del Jacobiano del sistema y, en terminos generales, esto puede ser muy costoso (Schiesser, 1991). En ese caso el uso de metodos que usan informacion sobre la dispersion del problema, como por ejemplo LSODES9 (Hindmarsh, 1983), seran de gran utilidad. Nuevas implementaciones del NMOL tratan de mejorar su precision a traves del uso de mallas adaptativas que permiten re nar la discretizacion all donde el problema lo requiere a medida que se evoluciona en el tiempo. En Li (1998) y Li y Petzold (1999) se realiza un analisis detallado de estas tecnicas y se presentan algunas mejoras. Otros autores han aumentado la e ciencia simulando de manera paralela varias \l neas" o, lo que es lo mismo, varias ODEs (Rice y Lujan, 2000), en combinacion con metodos adaptativos.
(x) = 0
(1.17)
donde se asume que las condiciones B son constantes en el tiempo. La clave de este tipo de metodos es la separacion de variables: se asume que la solucion del problema se puede aproximar, con la precision deseada, por una serie de la forma:
9
LSODES: http://www.netlib.org/odepack/
24
x= ~
ai(t)'i( )
(1.18)
donde x es la aproximacion del campo x, los coe cientes ai son funciones temporales ~ y 'i( ) son funciones espaciales, habitualmente denominadas funciones base o de prueba, que veri can las condiciones frontera y que suelen ser ortogonales entre s . Una vez seleccionado el tipo de funciones espaciales que, como se vera, pueden ser locales o globales, el objetivo sera minimizar la diferencia entre la funcion real x( t) y la aproximacion x( t). Aunque el error k x ; x k no se puede calcular, s ~ ~ es posible calcular el residuo que resulta de aplicar el operador ( ) a la funcion x: ~
R
= (~) x
(1.19)
y se asume que, si se minimiza este residuo, se minimiza tambien el error entre las funciones real y aproximada. De hecho, esto es demostrable en algunos casos sencillos (Langtangen, 1999). El metodo mas utilizado para minimizar el residuo es el denominado de residuo ponderado y consiste en encontrar los coe cientes temporales tales que la media ponderada de R en el dominio se anule para un conjunto de funciones de prueba Wi que, en principio, pueden coincidir, o no, con las funciones 'i. Esto es equivalente a imponer la condicion de que el residuo sea ortogonal a las funciones Wi, que matematicamente se formula:
donde (f g) = fgd , es el denominado producto interior del correspondiente espacio de Hilbert. Queda por determinar que sucede con las condiciones frontera. En este sentido, si el operador espacial diferencial es de orden 2m a todas aquellas condiciones frontera de orden menor que m, se les denominara esenciales (por ejemplo condiciones de Dirichlet) ya que las funciones de prueba deben veri carlas necesariamente. En el caso de restricciones cuyo orden sea superior o igual a m las restricciones se dicen naturales ya que se incorporan de manera natural en el metodo de residuo ponderado (Langtangen, 1999). A continuacion se consideran varios tipos de metodos que se enmarcan en el de residuo ponderado, y cuyas diferencias radican en la eleccion de las funciones Wi .
(R Wi ) =
Z
R
Wi d = 0
(1.20)
25
Metodo de colocacion
En este caso se toman funciones Wi = ( ; i), donde la ( ; i) es la funcion delta de Dirac centrada en un punto i . El resultado es un conjunto de ecuaciones que fuerzan a que el residuo se anule en esos puntos prede nidos. Se podr a pensar que el metodo de diferencias nitas que se considero en la seccion 1.4.1 es un caso particular de este.
Metodo de Galerkin
Las funciones de peso Wi coinciden con las funciones base 'i. En este caso se puede ver que el resultado es un conjunto de ecuaciones diferenciales cuya variable @ independiente es el tiempo. Para ello supongase, por ejemplo un operador @t ; L, donde L( ) es el operador espacial, imponiendo la condicion (1.20) resulta: d (' x) = (' L(~)) (1.21) i x dt i ~ o lo que es lo mismo:
k X
k X
j = 1 ::: k
(1.22)
El conjunto (1.22) no es mas que un conjunto de k ecuaciones diferenciales ordinarias facilmente resoluble con algunos de los metodos vistos. Un estudio comparativo de los distintos metodos de residuo ponderado lleva a la conclusion de que el metodo de Galerkin produce resultados de mayor precision y su rango de aplicacion es mas amplio que el del resto de los metodos (Fletcher, 1984).
26
bajo, lo que permite resolver de manera sencilla problemas especi cados en dominios con geometr as complicadas (en O~ate et al. 1991, se recopilan distintos trabajos y n aplicaciones del metodo de elementos nitos). De forma similar al metodo de diferencias nitas, el dominio espacial se discretiza de alguna forma. La malla de discretizacion espacial esta formada por un conjunto de elementos compuestos, generalmente, por el mismo numero de vertices y aristas, pero que pueden adoptar formas diferentes. De esta manera, la malla puede adaptarse mejor a formas irregulares. Las funciones espaciales se calculan utilizando polinomios de interpolacion (funciones de forma) entre los distintos vertices. Las funciones globales Wi son polinomios que se anulan en la mayor a de los elementos salvo en el considerado. En el caso de problemas bidimensionales los elementos son, habitualmente, triangulares mientras que en los problemas tridimensionales suelen ser tetraedricos. Como ejemplo, se presenta en la gura 1.3 una comparacion entre las mallas generadas por el metodo de diferencias nitas y el de elementos nitos en un caso bidimensional. En ella se aprecia la mayor e ciencia del metodo de elementos nitos sobre el de diferencias nitas, al necesitar menos nodos para asegurar el mismo grado de precision.
Figura 1.3: Comparacion metodo de diferencias nitas y elementos nitos. En los trabajos de Fletcher(1984) y de Langtangen (1999) se examinan diversos aspectos de la aplicacion del metodo de elementos nitos. Otros metodos alternativos que surgen como modi caciones del metodo de elementos nitos son el metodo de volumenes nitos, en el que el dominio se divide en peque~as regiones llamadas volumenes de control (discutidos, por ejemplo, en n Schiesser, 1994), o el metodo de elementos frontera (BEM, ver por ejemplo Chen y
27
Zhou, 1992) que transforma el operador diferencial de nido en el dominio de frontera en operadores integrales de nidos unicamente en la frontera de manera que solo la frontera es discretizada y por lo tanto se reduce el coste computacional. Si se comparan los metodos de diferencias nitas (FD), elementos nitos (FEM) y elementos frontera (BEM) se deduce que para geometr as regulares el metodo FD es generalmente el mas facil de aplicar. No obstante, generalmente requiere modi caciones especiales para considerar ciertas di cultades que habitualmente aparecen en los problemas con fronteras irregulares. Aunque los metodos FEM y BEM son mas complicados de implementar, permiten resolver estos casos de manera mas sencilla.
28
El problema de optimizacion consiste en calcular el conjunto de variables (denominadas de decision) tales que minimizan (o maximizan) una cierta funcion objetivo o de coste. Si bien se pueden hacer diversas clasi caciones de problemas de optimizacion, existen dos que merece la pena destacar: Segun la linealidad y el tipo de variables de decision: optimizacion lineal, no lineal, combinatoria y mixta. Segun la naturaleza de la funcion objetivo: optimizacion local y global. La solucion de estos problemas en general no es trivial y es por ello que se han desarrollado numerosas tecnicas que permiten la solucion de los distintos tipos de problemas. A lo largo del cap tulo se revisaran los metodos mas relevantes para la optimizacion de problemas no lineales, tanto locales como globales. En primer lugar se plantean algunas generalidades en relacion a la evaluacion de metodos y se establecen las condiciones de optimalidad, tanto para problemas sin restricciones como problemas generales con restricciones. Dado que en la mayor a de los problemas practicos, las variables de decision estan sometidas a restricciones, se comentaran brevemente algunos aspectos practicos acerca del manejo de restricciones. Se naliza con una revision de los metodos mas relevantes de optimizacion no lineal, tanto locales como globales. 29
30
J (v)
y que veri ca las restricciones:
hi (v) = 0 i gi(v) 0 i
2 E 2 I
donde J es una funcion escalar de varias variables v 2 R ~ que se denominara funcion objetivo o coste. hi y gi son tambien funciones escalares que determinan el espacio de valores posibles para v, son las denominadas restricciones de igualdad y desigualdad, respectivamente. Notese que los problemas de optimizacion, se formulan, habitualmente, como problemas de minimizacion para los problemas de maximizacion basta con cambiar el signo de la funcion objetivo. Dentro de esta formulacion general se incluyen algunos casos especiales mas sencillos tales como: Problema de optimizacion no lineal sin restricciones. Problemas lineales (linear programming, LP): aquellos en los que la funcion objetivo y las restricciones son lineales. Problemas con restricciones lineales: aquellos en los que las restricciones son lineales.
2.2. Generalidades
31
Como se vera una de las di cultades mas habituales en la resolucion de problemas de este tipo es la multimodalidad, es decir, la presencia de varias soluciones, que se denominaran locales, frente a la mejor de todas ellas que es la global. Esto llevara al uso de metodos especiales (metodos de optimizacion global) que intentan evitar las limitaciones de otros metodos que tienden a quedarse \atrapados" en soluciones locales (metodos de optimizacion local).
2.2 Generalidades
En la resolucion de problemas de optimizacion sin restricciones, los metodos locales buscan un vector v 2 R ~ tal que J (v ) < J (v) para todos los valores de v cercanos a v . En el caso de metodos globales el objetivo es mas ambicioso y se pretende encontrar el valor v de entre todos los posibles valores de v. Todos ellos son procesos iterativos que partiendo de un valor inicial para las variables (v0 ), generan una secuencia de valores, habitualmente llamada mapa del algoritmo, que minimiza la funcion objetivo hasta alcanzar la solucion dentro de una tolerancia preespeci cada. El metodo de iteracion se suele expresar en la forma: vk+1 = vk + dk (2.4) en donde vk+1 es el valor actual de aproximacion al optimo y dk una funcion que dependera de la direccion de busqueda, siendo la manera en que se calcula dk la que distingue el tipo de metodo de optimizacion. En una primera clasi cacion se distinguira entre metodos deterministas y metodos probabil sticos o estocasticos, tanto locales como globales. En cuanto a los metodos deterministas, suelen buscar la veri cacion de las condiciones de optimalidad. Estos metodos calculan las direcciones de busqueda de manera sistematica y en muchos casos requieren el calculo del gradiente o el gradiente y el Hessiano de la funcion objetivo y garantizan, en la mayor parte de los problemas, convergencia dentro de un nivel de precision especi cado. Dentro de este tipo de metodos los habra locales y globales. Los primeros, generalmente muy rapidos, encuentran uno de los, posiblemente, multiples m nimos de la funcion considerada, mientras que los segundos localizan el mejor de todos esos m nimos. Por supuesto, en el caso de los problemas convexos, el optimo local coincide con el global y un metodo local sera su ciente. Notese que, para el problema general, no existe ningun metodo que garantice la optimalidad en tiempo nito (Guus et al, 1995). El segundo grupo de metodos (estocasticos) no usan informacion sobre la estructura del problema. Hacen uso de secuencias pseudo-aleatorias y valores previos de
32
la funcion objetivo para calcular las direcciones de busqueda. En general, tienen caracter global y convergen al optimo con probabilidad aproximandose a 1 a medida que el numero de iteraciones (k) aumenta. A la hora de seleccionar un metodo en favor de otro, hay que tener en cuenta una serie de aspectos: generalidad y robustez, sensibilidad a parametros, e ciencia y, por ultimo, velocidad de convergencia (Bazaraa et al., 1993): 1. Generalidad y robustez: La generalidad del algoritmo se re ere al rango de problemas al que se puede aplicar. La robustez se re ere a la capacidad de resolver los problemas para los que el algoritmo ha sido desarrollado con cierta precision e independientemente del punto inicial elegido. 2. Sensibilidad a parametros: La mayor a de los algoritmos requieren la seleccion, a priori, de algunos parametros. Normalmente estos parametros guardan relacion con el tama~o de paso, factores de aceleracion y criterio de n convergencia, entre otros. A este respecto, se preferira un metodo cuya solucion sea lo mas insensible posible a esta seleccion. 3. E ciencia: Este criterio esta relacionado con el tiempo invertido en la preparacion del problema para su optimizacion y el tiempo de computacion requerido para su solucion. En este sentido se pueden utilizar criterios basados en numero de iteraciones, numero de evaluaciones de la funcion objetivo o bien tiempo total de computacion1. 4. Convergencia: Aunque no siempre es posible calcularla, se de ne aqu la velocidad de convergencia (V ) teorica: lim jjvk+1 ; v jqj = V < 1 k!1 v ; v
k
(2.5)
Si q = 1 y V < 1, la secuencia se dice que tiene convergencia lineal si q > 1 o si q = 1 y V = 0, entonces se habla de convergencia superlineal y si q = 2 entonces la convergencia es cuadratica. En general este criterio de convergencia solo se puede utilizar para los metodos deterministas que requieren del gradiente o del Hessiano para calcular dk .
En este trabajo, usaremos este ultimo criterio, por considerarlo el mas objetivo. Para que la comparacion con otros autores sea razonable, todos los tiempos de calculo se transforman a la misma maquina (PC Pentium III/450Mhz, utilizado en este trabajo) y para ello se utilizara el numero de MFlops de cada ordenador segun la rutina Linpack-100. Valores tabulados en http://www.netlib.org/performance/html/PDStop.html
1
33
Para garantizar y mejorar la convergencia de algunos algoritmos, dk se modi ca mediante el uso de lo que habitualmente se llama busqueda lineal (line search) o bien un metodo de region de con anza (trust region) (ver por ejemplo, Nash y Sofer, 1996). En el primer caso dk = k sk y en el segundo dk = s siendo k s k 4k . El metodo de busqueda lineal es el mas antiguo y mas utilizado y en los libros de optimizacion se dedica especial atencion a la solucion de este problema ya que condiciona la e ciencia del algoritmo total.
Teniendo en cuenta que un m nimo local es aquel que veri ca que J (v) ; J (v ) 0 en una vecindad de v , de la expresion anterior se deduce que una condicion de m nimo ha de ser necesariamente:
r
J (v ) = 0 (2.7) Sin embargo, esta condicion solo garantiza un punto estacionario. Para determinar si es un maximo, un m nimo o un punto de silla, habra que analizar el Hessiano de la funcion, resultando (para un m nimo):
)>0 (2.8) Es importante resaltar que estas condiciones se han calculando suponiendo que el punto v puede estar en cualquier lugar en el espacio (R ~). Sin embargo, en los casos practicos lo normal es que este sometido a algun tipo de restriccion, y las condiciones anteriores ya no son validas. Supongase que el problema de optimizacion responde a la formulacion general que se presentaba en la seccion 2.1 en la que las variables de decision estaban sujetas a una serie de restricciones. En ese caso se de nira un punto v como factible si veri ca esas restricciones y no factible en otro caso. En cuanto a las restricciones de desigualdad se denominan activas cuando se cumple la igualdad e inactivas en otro caso.
r
2 J (v
34
En la mayor parte de los casos, tanto la funcion objetivo como las restricciones seran funciones no lineales de las variables de decision ya que los modelos cuadraticos o lineales son demasiado simpli cados para la mayor a de las aplicaciones practicas. Por lo tanto, los resultados fundamentales procederan del desarrollo del calculo matematico en el siglo XVIII, siendo el concepto basico el de Lagrangiano y los multiplicadores de Lagrange. La caracterizacion de las condiciones necesarias de optimalidad en problemas restringidos se generalizo a partir de los resultados de Lagrange en el conocido teorema de Karush-Kuhn-Tucker, que recopila y estructura un conjunto de investigaciones llevadas a cabo por numerosos autores en los a~os cuarenta, entre los que tambien n ha de citarse a Fritz John. Para detalles sobre su desarrollo ver por ejemplo Nash y Sofer (1996) o Bazaraa et al. (1993) donde se hace un analisis riguroso del calculo de las condiciones de optimalidad para los casos con restricciones lineales y no lineales. Aqu se presentan las condiciones Karush-Kunh-Tucker (KKT) en su formulacion mas general para el problema planteado en las ecs. (2.1)-(2.3): Asumiendo que los gradientes de las restricciones de igualdad y desigualdad son linealmente independientes en el optimo v (condicion de regularidad) existe un vector ( h, g ) de multiplicadores de Lagrange de tal forma que:
r
J (v ) +
g g (v i i
E X
i=1
hh (v i i g i
)+
I X
i=1
g g (v i i
)=0
I
(2.9) (2.10)
)=0
0 i = 1 :::
La expresion g gi(v ) = 0 se denomina habitualmente complementary slackness i condition y distingue entre restricciones activas e inactivas. Sea I = i : gi (v ) = 0 el conjunto de restricciones activas, entonces las condiciones KKT de primer orden pueden escribirse en la forma:
r
J (v ) +
E X
i=1 g i
hh (v i i
)+
X
i2I
g g (v i i
)=0
(2.11) (2.12)
0 i2I
Supongase ahora que tanto la funcion objetivo como las restricciones son dos veces diferenciables, y que v es un punto tal que veri ca la condicion KKT de primer orden y que los valores de los multiplicadores en ese punto son h y g . Se de ne el Lagrangiano del sistema como sigue:
35
L(v) = J (v) + h T h(v) + g T g(v) (2.13) Sea C el cono de direcciones d tales que gi(v )T d = 0 para los ndices i cuyos multiplicadores de Lagrange son positivos, gi(v )T d 0 para los ndices i restantes y hi(v )T d = 0 para todas las restricciones de igualdad. Entonces las condiciones KKT de segundo orden (para un m nimo) pueden escribirse de la forma:
r r r
dT 2L(v )d > 0 d = 0 C
r 8 6 2
(2.14)
(v ) = J (v) + p(k)P (h g)
(2.15)
36
donde p(k) es el parametro de penalizacion que en ocasiones se mantiene constante a lo largo del proceso de optimizacion o se puede modi car en cada iteracion y P (h g) es una medida de la violacion de las restricciones. La forma de la funcion P determina el tipo de metodo de penalizacion, de entre los que merece la pena destacar dos tipos de metodos: Metodos que generan mapas de puntos no factibles alcanzando una solucion al problema original asintoticamente. Destacan los metodos de penalizacion cuadratica, en los que P es una suma ponderada del cuadrado de las violaciones de las restricciones, o los de penalizacion exacta, en los que P es la suma ponderada de los valores absolutos de las violaciones de las restricciones. Metodos denominados de punto interior (interior point methods), que generan secuencias de puntos factibles. Tambien denominados metodos de barrera, hacen uso de las funciones de barrera (penalty barrier functions), que evitan que los puntos generados sean no factibles. Estas funciones son de tipo logar tmico y aunque en su version clasica solo se pod an aplicar a restricciones de desigualdad, hoy d a existen versiones modi cadas que permiten su aplicacion a cualquier tipo de restriccion (Polyak, 1992 Vassiliadis y Floudas, 1997). Un metodo alternativo es el denominado de los multiplicadores (ver por ejemplo Nocedal y Wright, 1999). Este metodo hace uso de un Lagrangiano modi cado con un termino cuadratico en la violacion de las restricciones, de nido de tal forma que garantiza que el Hessiano del Lagrangiano sea positivo de nido en un punto estacionario v . Una vez encontrado el vector v que minimiza el Lagrangiano aumentado, se actualizan los multiplicadores de Lagrange, y as sucesivamente hasta encontrar los valores optimos. La principal limitacion de este metodo es que requiere la solucion de una secuencia de problemas de optimizacion.
37
los que solo hacen uso de la funcion objetivo, directos, y los que usan informacion adicional (gradiente o gradiente y Hessiano) o indirectos.
38
La principal desventaja de estas estrategias radica en el hecho de que a medida que ~ aumenta, pierden e ciencia y es por este motivo que durante algunos a~os n quedaron relegados a un segundo plano. Sin embargo Wright (1996) propone la recuperacion de este tipo de estrategias directas y presenta nuevas modi caciones al metodo de Nelder y Mead que aumentan su e ciencia. Lewis et al. (2000) revisan el pasado y el presente de los metodos de busqueda directa, y proponen nuevas metodolog as que permiten la resolucion de problemas con restricciones generales (Lewis y Torczon, 2000). Sin embargo, incluso en estos metodos mejorados, el numero de evaluaciones de la funcion objetivo sigue siendo muy elevado y para problemas en los que la evaluacion de la funcion objetivo es costosa son muy ine cientes.
(2.16)
39
(vk ) + rM(vk )s = 0
s=
;rM
(2.17) (2.18)
vk+1 = vk
; rM
Los metodos de optimizacion que se veran a continuacion hacen uso del metodo de Newton para la resolucion de la ecuacion de optimalidad de primer orden (ec. (2.7)). Por consiguiente, la direccion de busqueda vendra dada por la expresion, que a partir de este momento denominaremos ecuacion de Newton:
r
2 J (vk )sk
= ;rJ (vk )
(2.19) (2.20)
resultando:
en donde aparece el Hessiano de la funcion objetivo, lo cual es deseable ya que mejora las propiedades de convergencia (Fletcher, 1987), alcanzando convergencia cuadratica en la proximidad de la solucion. Sin embargo, utilizar la direccion de busqueda tal como aparece en la expresion (2.20), metodo de Newton tradicional, tiene algunas limitaciones: El Hessiano podr a ser singular o no ser de nido positivo en algun momento, bien durante el proceso de optimizacion o en la solucion obtenida. En el primer caso, se pueden utilizar tecnicas de modi cacion del Hessiano para transformarlo en una matriz de nida positiva, de manera que as se garantizar a una direccion de busqueda descendente (Gill et al., 1981). En el segundo caso, una vez se ha obtenido un punto estacionario se puede comprobar si es un punto de in exion mediante peque~as perturbaciones de n la solucion y observando que sucede con la funcion en un entorno del punto hallado. Este metodo no es muy riguroso. Sin embargo en la practica es muy util. Si la dimension del problema de optimizacion (~) es elevada el calculo del Hessiano (o su inverso) puede ser inviable o, como m nimo, muy costoso.
40
Como alternativas se presentan los metodos de Newton modi cados que hacen uso de metodos de busqueda lineal para garantizar la convergencia y los quasiNewton que, en general, tratan de aproximar la direccion de Newton asintoticamente. Los metodos quasi-Newton son bastante populares, en el sentido de que han sido utilizados para la resolucion de un gran numero de problemas con exito. Hay diversos tipos, pero todos ellos se basan en aproximar el Hessiano por una matriz B, que se actualiza en cada iteracion, y calcular la direccion de busqueda mediante la solucion de una ecuacion de Newton aproximada:
J (vk ) (2.21) El tipo de metodo quasi-Newton viene determinado por las condiciones impuestas a la matriz Bk , que en general se destinaran a mantener las mejores propiedades del Hessiano, es decir, que sea simetrica y de nida positiva. Destacan los llamados metodos del grupo Broyden, basados en el uso de la formula BFGS (desarrollada por Broyden, Fletcher, Goldfarb y Shano en 1970) para actualizar el inverso de la matriz Bk . Simultaneamente se presento, con el mismo n, la llamada formula de Davidon-Fletcher-Powell (DFP). Sin embargo el mismo Powell recomendar a el uso de la BFGS por ser mas robusta y tener mejores propiedades de convergencia (Bazaraa et al., 1993).
;r
Bk sk =
41
de alguna manera, cual ser a el mas adecuado para la resolucion de un determinado problema. El metodo de gradiente conjugado, se basa en la resolucion de la ecuacion de Newton de manera iterativa generando direcciones de busqueda mutuamente conjugadas con respecto al Hessiano. Solo requiere una memoria aproximada de 4~ lo que lo hace un rme candidato para la resolucion de problemas de dimension elevada. Sin embargo, realiza un elevado numero de evaluaciones de la funcion objetivo lo que para algunos problemas puede ser una limitacion importante. El L-BFGS esta basado en el metodo BFGS original que aproximaba el inverso del Hessiano del sistema utilizando la formula que le da nombre. Sin embargo, este metodo requer a guardar en memoria toda la matriz y operar con ella, lo que para problemas grandes resultaba muy costoso. En el metodo L-BFGS, sin embargo, esta matriz se calcula mediante la reserva en memoria de una serie de vectores correspondientes a un numero m de iteraciones, que la de nen expl citamente y que dependen exclusivamente de v y del gradiente de la funcion a minimizar. El TN esta basado en la resolucion aproximada de la ecuacion de Newton (ec. (2.20)) utilizando un metodo iterativo, habitualmente el metodo de gradiente conjugado, que se para (trunca) antes de llegar a la solucion. Consta, pues, de dos iteraciones, una exterior en la que se genera una secuencia de puntos utilizando direcciones de busqueda cuyo calculo requiere una iteracion interna para resolver aproximadamente la ecuacion de Newton. En el trabajo de Nash y Nocedal (1991) y en el de Baysal et al. (1999) se hace un analisis comparativo de estos tres metodos, CG, L-BFGS y TN, estudiando las ventajas y desventajas de cada uno de ellos en la resolucion mas de 100 problemas de hasta 10000 variables, en el primero, y en la resolucion de problemas relacionados con la con guracion de moleculas grandes, en el segundo. En el primero se concluye que CG realiza muchas mas evaluaciones de la funcion objetivo. As pues, en los problemas de dimension elevada, en los que el coste de computacion para evaluar la funcion objetivo sea reducido, este tipo de algoritmos puede resultar de utilidad pero en caso contrario no son competitivos. Esto se con rma en el trabajo de Baysal et al. (1999) donde el metodo CG es claramente inferior (hasta 4 veces mas lento) dado que el calculo de las funciones objetivo y sus gradientes es bastante costoso. En cuanto a la comparacion entre L-BFGS y TN, en ambos trabajos se concluye que ninguno de los dos es claramente superior aunque s podr an establecerse ciertas pautas de comportamiento de cada uno de ellos que los hacen mas o menos adecua-
42
dos segun el tipo de problema. L-BFGS, tiende a utilizar menos evaluaciones de la funcion objetivo y su gradiente, sin embargo en terminos de tiempo de computacion ninguno de los dos resulta vencedor, ya que el TN realiza menos iteraciones compensando as el coste superior de cada una de ellas. Por ultimo, el metodo TN resolvio con exito todos los problemas mientras que L-BFGS fallo en algunas ocasiones. La e ciencia relativa del TN deriva de que realiza muy pocas iteraciones y por lo tanto, cualquier mejora que se pueda introducir a la iteracion interior, resulta en un aumento considerable de e ciencia. Algunas de estas posibles mejoras estan contempladas en el trabajo de Nash (2000). Hasta ahora se han presentado metodos indirectos que permiten la resolucion de problemas sin restricciones o problemas con restricciones mediante el uso de funciones de penalizacion. Sin embargo, como se comento en la seccion 2.4, existen metodos desarrollados para la resolucion de problemas con restricciones a traves del uso de las condiciones de optimalidad de KKT y son los que se presentan a continuacion.
43
ecuaciones generalmente grande, para calcular la direccion de busqueda tanto para las variables de optimizacion como para los multiplicadores de Lagrange. Esto puede ser terriblemente costoso y por lo tanto, en los ultimos a~os se han dedicado muchos n esfuerzos al desarrollo de estrategias e cientes, similares a las que se vieron en el caso sin restricciones, para el metodo de Newton. Una revision sobre estos y otros aspectos puede encontrarse en los trabajos de Boggs y Tolle (1996) y en Nocedal y Wright (1999).
44
tanto deterministas como estocasticos para buscar optimos globales. La mayor a se recogen en lo libros de Horst y Pardalos (1995), Pinter (1996) y Floudas (2000). En esas revisiones se discuten tecnicas de caracter general que presentan un rango de aplicabilidad elevado. Sin embargo, el tipo de problema a resolver delimita el tipo de metodo a utilizar. En primer lugar se revisan aqu los tipos de problemas y los posibles metodos a utilizar para luego estudiar con algo mas de detalle las distintas tecnicas. Se distinguen los siguientes tipos de problemas: Problemas combinatorios: incluyen variables enteras y/o reales y tienen un numero nito de soluciones habitualmente muy elevado. Si la funcion es lineal, el problema se puede resolver exactamente con metodos adecuados para la resolucion de problemas mixtos que usan por ejemplo la tecnica de ramicacion y poda (branch and bound, BB). Algunos metodos heur sticos como templado simulado (simulated annealing, SA), busqueda tabu (tabu search, TS) y algoritmos geneticos (genetic algorithms, GAs) se han aplicado con bastante exito a la resolucion aproximada de este tipo de problemas. Problemas no lineales sin restricciones, o con restricciones tipo l mite, multimodales. Para su solucion se han desarrollado numerosas estrategias deterministas basadas en el llamado particionamiento que requieren normalmente algun procesado previo del problema con el n de transformarlo en una combinacion de problemas mas sencillos. Por otra parte, se han desarrollado varios metodos que resuelven este tipo de problemas de manera heur stica, estos incluyen los antes mencionados SA y GAs, adaptados para variables de decision reales y otros como los clustering methods o los de busqueda aleatoria (random search). Por ultimo estan los problemas multimodales no lineales con restricciones. Estos no han recibido tanta atencion como los anteriores ya que en general son mas complicados. Sin embargo, al igual que suced a con los problemas unimodales, muchos de los metodos anteriores se pueden aplicar a la solucion de este tipo de problemas en combinacion, por ejemplo, con funciones de penalizacion. Una primera clasi cacion permite distinguir entre metodos deterministas y metodos estocasticos.
45
46
cacion y poda y la aritmetica de intervalos que, en esencia, se basa en el hecho de que un punto v se puede especi car como un intervalo v ; v + ] y desarrolla las operaciones aritmeticas propias entre intervalos3. En particular, los l mites inferior y superior que requiere el metodo de rami cacion y poda, se obtienen directamente de la evaluacion de las funciones mediante el uso de la aritmetica de intervalos lo que implica que los resultados se encuentran en cajas a cada paso del algoritmo. Las ideas basicas sobre la aplicacion de los metodos de intervalos se revisan en el art culo de Ratschek y Rokne (1995). En ese trabajo se discuten diversas posibilidades, entre las que destacan el metodo de Newton de intervalos para problemas diferenciables y sin restricciones y tecnicas h bridas en que se combinan las tecnicas de intervalos con algoritmos locales directos para casos no diferenciables y con restricciones. En los ultimos a~os se ha intentado mejorar la e ciencia de estos metodos. As , n por ejemplo, en Leclerc (1992) se sugieren diversas ideas para mejorar su e ciencia a traves del uso de tecnicas de aceleracion y de la paralelizacion del metodo en Casado et al. (2000), se proponen tecnicas de subdivision de intervalos en las cercan as del optimo que parecen mejorar sustancialmente la e ciencia. Algunas de estas ideas y otra nuevas han sido implementadas en lo que se ha llamado GlobSol y ParaGlobsol (Kearfott4) y aplicadas a la solucion de problemas reales en Corlis y Kearfott (1999). Los metodos de planos de corte fueron propuestos por Tuy en los a~os 60 n para la resolucion de problemas de optimizacion con restricciones lineales. La idea se basa en el hecho de que en presencia de restricciones lineales el optimo estara en un vertice de la region factible. El metodo comienza en uno de estos vertices y sus bordes constituyen un cono que incluye la region factible. A continuacion se va reduciendo el tama~o del cono mediante el uso de \cortes" que permiten eliminar n regiones no candidatas al optimo global. En cada corte se resuelve un subproblema que dara lugar a otro cono y as sucesivamente hasta encontrar la solucion. La principal limitacion de estos metodos es que pueden requerir un numero in nito de cortes o generar soluciones c clicas no llegando a converger (Floudas y Visweswaran, 1995). Aqu se han presentado las tecnicas mas utilizadas, sobre todo las dos primeras. Existen otras, como por ejemplo las denominadas outer approximation o inner approximation en las que el problema se aproxima por funciones cuadraticas que se van re nando sucesivamente. Este tipo de estrategias se usa habitualmente en comPara mas detalles en aritmetica de intervalos revisar la pagina web http://cs.utep.edu/intervalcomp/main.html 4 Informacion e informes relacionados: http://www.mscs.mu.edu/ globsol/
3
47
binacion con rami cacion y poda. Aunque la mayor a de estos metodos han resultado ser bastante robustos el esfuerzo computacional requerido crece muy rapidamente, en ocasiones exponencialmente, con el tama~o del problema. Por ello muchos de estos metodos deben n completarse con algun tipo de metodo local para mejorar su e ciencia (Pinter, 1996).
48
tan muchas formas diferentes, segun la dimension del problema a resolver, metodo para establecer la direccion de busqueda, etc. Su principal limitacion consiste en la convergencia local, que con frecuencia se produce, al optimo mas cercano al punto inicial. Para evitar la convergencia local Maza y Yuret (1994) presentan el llamado Dynamic Hill Climbing (DHC) que opera en dos iteraciones de manera que la exterior controla precisamente la convergencia a un optimo global mediante un metodo semejante al multistart. Dentro de los metodos de busqueda aleatoria se enmarcan por ejemplo los tradicionales Luus-Jaakola (Luus y Jaakola, 1973), utilizado todav a hoy por ejemplo en la resolucion de problemas de optimizacion dinamica (Bojkov et al., 1993 Luus y Hennessy, 1999) o el metodo de busqueda aleatoria controlada (Controlled Random Search, CRS) (Goulcher y Casares, 1978) y sus modi caciones (ICRS, Banga y Casares, 1987), ampliamente utilizado en los ultimos a~os para la optimizacion n dinamica de procesos (Banga y Seider, 1996 Banga et al., 2000 entre otros). El metodo de templado simulado, propuesto por Kirkpatrick et al.(1983), se podr a incluir dentro del grupo de los escaladores. Su fundamento es una analog a del proceso termodinamico por el cual los metales se calientan o enfr an hasta alcanzar un estado cristalino de m nima energ a. Se plantea un paralelismo entre el comportamiento de las moleculas en el interior del solido, que van colocandose en los diferentes niveles energeticos, y las soluciones intermedias por las que pasa el algoritmo hasta alcanzar la solucion. Cada punto se genera a partir del anterior, y si mejora la funcion objetivo se acepta incondicionalmente. En cambio, si no la mejora se puede aceptar con una cierta probabilidad. Dicha probabilidad esta basada en la analog a con el proceso f sico de enfriamiento y sera funcion de la temperatura. Entre los trabajos recientes destaca el de T. Wang (2000) donde se presenta el llamado CSA que combina el metodo SA con el metodo de los multiplicadores de Lagrange para manejar restricciones. Por ultimo, se han presentado otros tipos de metodos que de alguna manera pretenden introducir conocimiento o memoria en la busqueda. Destaca el de busqueda tabu (Tabu Search, TS) (Glover, 1986). Sin embargo, hasta el momento, este metodo solo se ha utilizado en problemas de optimizacion combinatoria.
49
algorithms, EAs) o algoritmos geneticos (genetic algorithms, GAs). Estos algoritmos fueron introducidos en los a~os 70 por Holland y han sido aplicados a n problemas practicos por primera vez por Goldberg, que los revisa extensamente en Goldberg (1989). Los algoritmos geneticos establecen una analog a entre el conjunto de soluciones de un problema y el conjunto de individuos de una poblacion natural, codi cando la informacion de cada solucion a modo de cromosoma (Michalewicz, 1996). Se introduce una funcion de evaluacion de los cromosomas, que habitualmente se denomina de calidad ( tness) y que esta basada en la funcion objetivo del problema. Por otra parte se introduce un mecanismo de seleccion de manera que los cromosomas con mejor funcion objetivo se seleccionan para construir nuevas generaciones a traves de los procesos de mutacion y recombinacion. En los primeros trabajos las soluciones se representaban por cadenas binarias. Este tipo de representacion de los datos permite entender muy facilmente los conceptos de mutacion y recombinacion. En las implementaciones actuales se usan representaciones en punto otante que para muchos problemas son mas naturales. Basado tambien en la idea de evolucion surge el metodo de Di erential Evolution5 (Storn y Price, 1997). Este metodo se basa en la generacion de nuevos puntos a traves del calculo de diferencias entre miembros de una poblacion. Este metodo ha demostrado su capacidad en un rango muy elevado de aplicaciones de ah su creciente popularidad. Es importante destacar que el uso de este tipo de algoritmos ha crecido de forma espectacular en los ultimos a~os. Especial mencion merecen los llamados n algoritmos memeticos (Memetic Algorithms) (Moscato, 1989) tambien basados en poblaciones y que han resultado ser mucho mas rapidos que los algoritmos geneticos tradicionales al menos para algunas clases de problemas. Basicamente, combinan metodos de busqueda local con el operador de recombinacion con el n de introducir informacion y conocimiento en la busqueda. Pero, una vez mas, estos metodos se han desarrollado para la solucion de problemas combinatorios. Por ultimo, algunos autores han buscado otras fuentes de inspiracion para el desarrollo de nuevos metodos de optimizacion global. En particular Dorigo et al. (1992) y Bonabeau et al. (2000) se inspiran en el comportamiento de las comunidades de hormigas. Estas tienen la habilidad de encontrar el camino mas corto desde el hormiguero a la comida y vuelta, a pesar de no tener nocion de direccion. El origen de esta habilidad se encuentra en el hecho de que segregan feromonas que permiten marcar el camino a seguir, de tal forma que la probabilidad de seguir un
5
50
camino u otro aumenta a medida que aumenta la cantidad de feromonas depositada en tal camino. Estas son las ideas basicas en las que se sustentan los llamados ant colony methods. Inicialmente desarrollados para la resolucion de problemas combinatorios, muy recientemente han aparecido las primeras modi caciones para la resolucion de problemas NLP (Jayaraman et al., 2000).
El problema de optimizacion dinamica, tambien llamado de control optimo en lazo abierto, consiste en calcular las trayectorias temporales que deben seguir ciertas variables manipulables (controles) para alcanzar un cierto objetivo, normalmente formulado como la maximizacion o minimizacion de una funcion de coste. En este cap tulo se presenta la formulacion matematica del tipo general de problema que se considerara a lo largo de este trabajo. Asimismo se revisaran los metodos numericos que se han planteado a lo largo del tiempo para la resolucion de este tipo de problemas, con especial enfasis en los metodos mas utilizados en la actualidad. Por ultimo, se comparan las distintas metodolog as para la resolucion de problemas tanto en parametros concentrados como distribuidos, lo que justi cara la seleccion del metodo de parametrizacion de control como punto de partida para el desarrollo de nuevos metodos de optimizacion dinamica.
51
52
J = (x( tf ) y(tf ) tf ) +
Z tf
t0
t)dt
(3.1)
con una serie de restricciones dinamicas que constituyen el modelo matematico del proceso: _ F (x x x xt y y u w t) = 0 (3.2) donde F 2 R es el conjunto de PDAEs , 2 R 3 son las variables espaciales, x( t) 2 X R son las variables de estado que dependen tanto del tiempo como de la posicion, y(t) 2 Y R es el subconjunto de variables que _ depende unicamente del tiempo, x = @ x=@ , x = @ 2 x=@ 2, xt = @ x=@t, y = dy=dt, u 2 U R son las variables de control (entradas al sistema) y w 2 W R son parametros independientes del tiempo. Las relaciones entre las distintas variables incluidas en el vector F expresan la dinamica del sistema. La mayor a de estas ecuaciones representan balances de alguna entidad creada o destruida en el proceso a estudiar. Las ecuaciones diferenciales surgen de la descripcion de balances de materia o energ a transitorios y las ecuaciones algebraicas describen procesos en equilibrio o de nen propiedades f sicas del sistema. En el caso de procesos distribuidos, las variables que describen el estado del sistema son ademas funciones del espacio. El resultado es un conjunto de ecuaciones algebraicas, diferenciales y en derivadas parciales (PDAEs). Los valores de las variables al comienzo del proceso deben estar expresados por un numero su ciente y no redundante de condiciones iniciales para asegurar la resolucion del sistema de PDAEs:
(3.3)
Sin embargo, para poder resolver las ecuaciones en derivadas parciales, es preciso, ademas, imponer condiciones frontera al sistema, tal y como se comento en el cap tulo 1, y que de forma abreviada se expresan:
53
(x u w
t) = 0
(3.4)
Durante su operacion, los procesos deben satisfacer ciertos requerimientos: de seguridad (por ejemplo rangos de temperaturas, presiones, concentraciones de productos qu micos, que no entra~en riesgos), de produccion (por ejemplo especi can ciones en la calidad o cantidad de producto nal, en duracion del proceso, etc.), de impacto ambiental (impuestos por las regulaciones ambientales) y algunos otros que son inherentes a la operacion o de caracter economico. Con el n de expresar estas condiciones, se imponen restricciones sobre las distintas variables y parametros que afectan al desarrollo del proceso. De entre estas restricciones las habra que deben veri carse en determinados momentos del proceso (son las denominadas restricciones puntuales, point constraints), a tiempo nal (endpoint constraints) o bien durante todo el tiempo de procesamiento (restricciones de camino, path constraints). Un primer tipo de restricciones puede afectar a diversas variables (tanto de estado como de control) del proceso y se expresan como sigue:
en donde las ecs. (3.5) y (3.6) corresponden a las restricciones puntuales, incluyendo las de tiempo nal (tk = tf ) y las ecs. (3.7) y (3.8) expresan las restricciones de camino. Por ultimo, un segundo tipo de restricciones, que tambien deben veri carse durante todo el tiempo de proceso, son las que afectan unicamente a las variables de control y a los parametros invariantes con el tiempo, y que normalmente expresan rangos de validez:
uL u(t) uU wL w wU
(3.9) (3.10)
54
55
todo/nada (on/o o bang-bang). Mas tarde en los a~os 60, R. Kalman y sus colaboradores, publicaron un trabajo n en el que discuten el problema de control optimo en lazo cerrado para un determinado grupo de problemas y proponen las ecuaciones de dise~o del regulador cuadratico n lineal (LQR). Durante las ultimas decadas, se han desarrollado diversas tecnicas de tipo directo que, aproximando las variables de estado y de control del sistema, permiten resolver, de manera mas sencilla el problema de optimizacion dinamica.
56
de control. Una vez encontrado el optimo, se optimiza el penultimo dejando el valor del ultimo elemento jo y as sucesivamente hasta generar el per l de control optimo secuencialmente hacia atras, es decir, hasta llegar a t0 . El proceso se repetira un numero de iteraciones pre jado. Para evitar buscar en un espacio in nito de soluciones, inicialmente se generan un numero de trayectorias de control posibles y a continuacion se generan una serie de nuevas trayectorias, permitiendo peque~as n modi caciones de las anteriores, de entre las que se seleccionara la mejor como la optima. Este metodo ha sido aplicado a la resolucion de problemas en parametros concentrados (por ejemplo, Luus, 1990 Bojkov y Luus, 1994 a y b Dadebo y McAuley, 1995 Tholudur y Ramirez, 1997 Sayer et al., 2000) con cierto exito en cuanto a resultados se re ere. Sin embargo, el coste computacional es muy elevado limitando su aplicacion a problemas de dimension peque~a. n En los libros de Bertsekas (1995 I y II) se puede encontrar una revision extensa del desarrollo y aplicacion de las estrategias basadas en programacion dinamica.
z(t0) = z0
Z tf
t0
J = (z(tf ) tf ) +
57
La dinamica del sistema corresponde a un conjunto de restricciones de manera que, igual que en el caso estacionario, se de ne un vector de variables , que en este caso seran funciones del tiempo, y se adjuntan a la funcion objetivo J resultando:
f ; g
Z tf ~ _ J = (z(tf ) tf ) + L(z(t) u(t) t) + T f (z u t) z dt (3.14) t0 Con el n de simpli car la formulacion se de nira el Hamiltoniano del sistema como sigue:
H
= L(z(t) u(t) t) +
T f (z
u t)
(3.15)
T (t
f )z(tf ) +
T (t
0 )z(t0 ) +
Z tf
t0
fH
Dado que las variables de decision son las funciones del tiempo u se calcula la ~ variacion que experimenta J ante peque~as variaciones en u: n ~ J = (@z @
"
T)
#
t=tf
Z tf @ z]t=t0 + t ( @ z + _ T ) z + @ u u dt (3.17) @ 0
f H H g
Si se eligen las variables adjuntas de tal forma que anulen los terminos en z se simpli ca notablemente la expresion (3.17): _ = ; @ H = ; @L ; @z @z con la condicion a tiempo nal:
T (t f) = T @f
@z
(3.18)
@ (3.19) @ z(tf ) ~ En un maximo o en un m nimo las variaciones de J (ec. (3.16)) con respecto a las variables de decision u deben anularse. Teniendo en cuenta ademas las expresiones (3.18) y (3.19) queda:
H
u=0
(3.20) (3.21)
y ademas para garantizar que se trata de un m nimo debe veri carse que:
H
uu
58
Por lo tanto para el caso de tiempo nal jo sin restricciones la aplicacion del principio maximo de Pontryagin resulta en la resolucion del sistema de ecuaciones diferenciales original (ec. (3.11)) mas las ecuaciones de Euler-Lagrange que dependen de las variables adjuntas (ec. (3.18)). Como consecuencia, el problema original se transforma en un problema de condiciones iniciales para los estados (ec. (3.12)) y nales para las variables adjuntas (ec. (3.19)) (Two Point Boundary Value Problem, TPBVP). Excepto en casos muy particulares, sera necesario emplear metodos numericos para resolver este tipo de problemas. Sin embargo, aunque la resolucion de problemas de condicion inicial (Initial Value Problems, IVP) esta al orden del d a, las condiciones de optimalidad resultan, al menos, en TPBVPs y sera necesario el uso de metodolog as espec cas, hasta el momento, menos desarrolladas. Las tecnicas mas utilizadas son las basadas en metodos de linealizacion (quasilinearization methods) (Miele y Wang, 1993) que radican en resolver una sucesion de TPBVPs lineales (relativamente sencillos), a traves, por ejemplo de la ecuacion matricial de Riccati. Sin embargo las matrices resultantes son densas y, para aplicaciones realistas, el coste computacional crece rapidamente. Otra posibilidad, consiste en usar metodos de gradiente para el calculo de secuencias de control hasta veri car las condiciones de optimalidad. Los metodos de gradiente muestran muy buen comportamiento en las primeras iteraciones sin embargo la convergencia es muy lenta lo que hizo que estos metodos se abandonasen rapidamente para ser sustituidos por metodos que usasen informacion de segundo orden. Es conveniente considerar el analisis de tres casos particulares que aparecen con cierta frecuencia en aplicaciones de ingenier a qu mica:
59
las variables adjuntas. Salvo en casos muy sencillos, encontrar los instantes en los que se producen estos cambios sera complicado.
Arcos singulares
Existen problemas en los que en ciertos intervalos temporales se cumple la primera condicion de optimalidad (Hu = 0) pero la matriz Huu es singular. Esto sucede en problemas en los que el Hamiltoniano es no lineal en los estados pero lineal en los controles, lo que es muy habitual por ejemplo en bioreactores discontinuos, cuya solucion suele ser una combinacion bang-singular-bang (Bonvin, 1998). Para resolver estos problemas hay que imponer nuevas condiciones sobre las derivadas del Hamiltoniano que permitan obtener una expresion de las variables de control.
60
en el tiempo como en el espacio, convirtiendose as en un conjunto de ecuaciones algebraicas que se resolvera siguiendo alguna de las tecnicas propuestas anteriormente. Transformar el problema original en PDEs en un sistema de DAEs y aplicar lo expuesto anteriormente para sistemas en parametros concentrados. En Neittaanmaki y Tiba (1994) se recopilan algunos problemas resueltos de esta forma. El principio maximo ha sido utilizado para la resolucion de problemas reales en trabajos como los de Nadkarni y Hatton (1985), Bermudez y Mart nez (1994) y Mart nez et al. (2000).
Parametrizacion total
Este metodo fue propuesto por Polak (1971), quien sugirio la idea de discretizar las variables de control y aproximar las ecuaciones diferenciales por ecuaciones algebraicas utilizando el metodo de diferencias nitas. El resultado era un problema de optimizacion no lineal con restricciones que se pod a resolver con un algoritmo NLP adecuado. Unos a~os despues, Tsang et al. (1975) proponen el uso de un metodo de colon cacion, en lugar de diferencias nitas, para aumentar la e ciencia y la calidad de los resultados. Biegler (1984) sugiere el uso de polinomios de Lagrange para aproximar las variables de estado y de control, utilizando un metodo de programacion cuadratica secuencial (sequential quadratic programming, SQP) para resolver el NLP, en lo que llamo SOCOLL. Mas tarde, el uso de elementos nitos tanto para las variables de estado como de control (Cuthrell y Biegler, 1987) mejorar an los resultados anteriores. Von Stryk (1993) presento DIRCOL, herramienta de optimizacion dinamica basada en parametrizacion total, que hace uso de un metodo de colocacion
61
para las variables de estado y control y resuelve el NLP resultante usando un metodo SQP estandar. Es en este hecho precisamente en donde aparece una de las principales limitaciones del metodo de parametrizacion total: el tama~o de los problemas NLP suele n ser muy grande, y la necesidad de calcular el gradiente y el Hessiano de la funcion objetivo y de las restricciones supone un elevado coste computacional, sobre todo en aplicaciones realistas. Para superar estos problemas, en los ultimos a~os se han publicado una serie de n trabajos enfocados al aumento de la e ciencia de estos metodos, que proponen dos tipos de estrategias (revisadas en Barclay et al., 1997) segun el tipo de problemas a resolver: Para problemas con muchos grados de libertad, es decir, con varias variables de control, el uso de informacion de primer y segundo order completa (fullspace SQP) aprovechando la informacion acerca de su estructura y dispersion para aumentar la e ciencia del algoritmo (Lucia et al., 1990). Para problemas dinamicos de dimension elevada, es decir, mayor numero de estados que de variables de control, utilizar los llamados SQP reducidos, que hacen uso de proyecciones o aproximaciones de porciones del Hessiano. Alkaya et al. (1999) hacen una revision, con numerosas referencias bibliogra cas, de distintas posibilidades a este respecto. El metodo de parametrizacion total junto con metodos SQP modi cados ha sido utilizado con exito para la solucion de multiples problemas practicos en parametros concentrados. Al margen de los trabajos ya mencionados, que tambien incluyen aplicaciones, Cervantes y Biegler (1998) aplicaron esta estrategia para la optimizacion de diversos procesos qu micos (p.ej., destilacion continua y destilacion reactiva) Lang, et al. (1999) optimizaron un proceso de cristalizacion discontinua, etc. En cuanto su aplicacion a la optimizacion de procesos distribuidos, no han sido muchas, destacando los trabajos de Goldberg y Troltzsch (1997), Kleis y Sachs (2000), Mittelmann y Maurer (2000) y Cervantes et al. (2000).
62
Esta estrategia ha sido utilizada para la optimizacion dinamica de procesos en parametros concentrados por numerosos investigadores, ya que como se vera en la seccion 3.4, ofrece ciertas ventajas sobre los otros metodos. En particular, en procesos qu micos y bioqu micos, destacan los trabajos de Bojkov et al. (1993) Vassiliadis et al. (1994 a y b) Banga y Seider (1996) Banga et al. (1997) Carrasco y Banga (1997) Feehery y Barton (1998) Zhou et al. (2001), entre otros. En los ultimos a~os este es el metodo que, preferentemente, se ha empleado para n la optimizacion dinamica de procesos distribuidos (Banga et al., 1991 Banga et al., 1994 Petzold et al., 1996 Blatt y Schittkowski, 1997 Saa et al., 1998 Quirijns et al., 2000) ya que ha resultado ser el metodo mas e ciente.
63
los l mites en las variables de optimizacion (ecs. (3.9) y (3.10)). Transforman as el problema original con restricciones en un nuevo problema sin restricciones, cuya solucion resulta, una vez mas, en un TPBVP que hay que resolver numericamente. Como posibles alternativas quedan los metodos directos: el metodo de parametrizacion total y el metodo de parametrizacion de control. En relacion a cual de los dos metodos es mejor, todav a no se ha llegado a un acuerdo. Los principales criterios a tener en cuenta son, por una parte la facilidad de implementacion y uso y, por otra, la e ciencia y su facilidad para considerar restricciones de camino (Feehery, 1998). En cuanto a la facilidad de uso, el metodo CVP (tambien llamado secuencial), resulta mejor para problemas de dimension grande (es decir, numero de estados elevado). La solucion de este tipo de problemas, que incluye los problemas distribuidos, con el metodo de parametrizacion total (o simultaneo) supone el uso de tecnicas especiales para determinar los valores iniciales para el proceso de resolucion del problema de optimizacion no lineal, lo que determina de manera de nitiva la convergencia del metodo. Por otra parte, los metodos de tipo CVP pueden aprovechar las ventajas de los integradores dispersos para resolver de manera muy e ciente estos IVPs. De hecho, se puede demostrar que el metodo de colocacion empleado en la parametrizacion total es equivalente a utilizar un metodo Runge-Kutta impl cito (Cuthrell y Biegler, 1989), y este tipo de metodos no siempre es e ciente viendose superado en algunos tipos de problemas por los integradores basados en metodos BDF. En cuanto a la e ciencia, es dif cil extraer una conclusion. Para problemas grandes, los metodos secuenciales son mas atractivos. Sin embargo, muchos metodos de optimizacion requieren el uso del gradiente, y en ocasiones del Hessiano de la funcion objetivo, y su calculo puede ralentizar el proceso de optimizacion. El principal atractivo del uso del metodo de CP es, precisamente, el modo en que se consideran las restricciones de camino, ya que en esta metodolog a se minimiza la funcion objetivo y la violacion de las restricciones simultaneamente. Sin embargo, en Feehery (1998) y Feehery y Barton (1998), se presentan dos nuevas estrategias e cientes para resolver el problema de las restricciones de camino en el caso de metodos de parametrizacion de control. Por todos estos motivos en este trabajo se utilizara el metodo de parametrizacion de control por su facilidad de uso y por su e ciencia y robustez. Hasta el momento es el mas empleado en la resolucion de problemas de optimizacion dinamica de procesos distribuidos.
64
u = u(v)
(3.22)
u(ji)(t) =
Mj X k=1
uijk`(kMj ) ( (i) ) t
ti;1 ti]
(3.23) (3.24)
siendo el tiempo normalizado en el elemento i: (i) = t ; ti;1 ti ; ti;1 y los polinomios de Lagrange de orden Mj :
`(kMj ) = 1 Mj = 1 Mj Y k `(kMj ) = Mj 2
;
0
(3.25) (3.26)
k =1 k k =k
0 06
con i = 1 : : : , j = 1 : : : y k = 1 : : : Mj . La seleccion de los puntos normalizados k no afecta a la solucion ya que aproximaciones diferentes del mismo orden son equivalentes. Sin embargo, resulta util seleccionar 1 = 0 y Mj = 1, y los elementos intermedios se colocan de manera arbitraria o bien equidistantes. De esta forma, para aproximaciones de ordenes Mj = 1 o Mj = 2, es decir, elementos constantes o lineales, resulta sencillo veri car los l mites de las variables de control.
0
65
Sin embargo, para aproximaciones de orden mayor deben establecerse relaciones entre los distintos parametros polinomicos que complican la solucion del problema de optimizacion. Es por ello que, en general, las aproximaciones mas convenientes son las de ordenes inferiores, tal como se muestra en la Figura 3.1.
Control Aproximacin lineal ( )
t0 t1
t2 Tiempo
t -1
tf
Figura 3.1: Parametrizacion de control. El problema de optimizacion dinamica se ha transformado en un problema de optimizacion no lineal en el que las variables son, ahora, el conjunto formado por los parametros invariantes con el tiempo w y los coe cientes de las aproximaciones polinomicas uijk . De niremos pues el vector de variables de optimizacion:
v = w uijk ]T
j
(3.27)
siendo v 2 V R ~, donde el valor de ~ = f ( Mj ). El nuevo problema de optimizacion a resolver se formula de la siguiente manera: Encontrar el vector de parametros v y tf que minimiza la funcion objetivo:
J = (x( tf ) z(tf ) tf ) +
sujeto al conjunto de PDAEs:
Z tf
t0
L(x( t) z(t) v
t)dt
(3.28)
_ F (x x x x t z z v t ) = 0
(3.29)
66
y probablemente a restricciones de camino o de punto tales como las presentadas en la formulacion general (seccion 3.1). Por ultimo, los parametros podran tomar valores maximos y m nimos que dependeran del orden del polinomio utilizado. En el caso particular de utilizar elementos constantes (orden 0), resultan:
wL w wU uL uijk uU
(3.30) (3.31)
El esquema general del proceso de resolucion del nuevo problema de optimizacion se presenta en la Figura 3.2 donde se observa que consta de dos iteraciones: una iteracion externa que resuelve el NLP y una iteracion interna que se encarga de calcular el valor de la funcion objetivo (ec. (3.1)) y las posibles restricciones resolviendo el IVP (ecs. (3.29)).
v
Convergencia No
? Si
Solucin
Figura 3.2: Esquema de resolucion del problema de optimizacion dinamica mediante parametrizacion de control, seguido en este trabajo.
67
En este cap tulo se desarrollan dos nuevas estrategias de optimizacion dinamica basadas en el metodo CVP y en metodos deterministas que hacen uso de informacion de segundo orden exacta para la resolucion de NLPs. Los metodos que se proponen se han desarrollado para la resolucion de problemas cuya dinamica viene expresada en DAEs sin que esto suponga una limitacion, como se vera, para su posterior aplicacion a procesos distribuidos dado que, como se presentaba en el cap tulo 1, la resolucion de PDEs puede pasar por su transformacion en DAEs. Tras una breve revision en la que se repasan los distintos metodos para el calculo del gradiente de la funcion objetivo con respecto a las variables de decision, se presenta el calculo original de las sensibilidades parametricas de segundo orden. Este conjunto de ecuaciones permitira el calculo de la informacion de segundo orden exacta que lleva al desarrollo de dos tipos de metodos deterministas locales: uno que hace uso del Hessiano y otro que hace uso del Hessiano proyectado. Como primeros resultados, se presenta la optimizacion dinamica de varios procesos concentrados tomados de la bibliograf a. Esto permitira comparar los resultados obtenidos con los de otros autores y evaluar as la calidad de los metodos desarrollados en este trabajo. 69
70
4.1 Introduccion
Como se ha visto en el cap tulo 2, los metodos deterministas locales han sido tradicionalmente considerados como los mas e cientes para la resolucion de determinados problemas, en particular, aquellos que no son multimodales y cuya funcion objetivo tiene expresion anal tica y es diferenciable. La aplicacion de estos metodos requiere, en la mayor a de los casos, el calculo del gradiente de la funcion objetivo con respecto a las variables de decision. Es por ello que el calculo del gradiente para sistemas dinamicos ha sido objeto de estudio de muchos investigadores resultando en el desarrollo de varias metodolog as que se analizan en el trabajo de Rosen y Luus (1991) y posteriormente en el de Vassiliadis (1993). Aqu se resumen sus conclusiones. Tres son los metodos posibles para el calculo del gradiente: el uso de las llamadas ecuaciones adjuntas (adjoint equations), el metodo de diferencias nitas y el metodo de sensibilidades parametricas. El metodo de diferencias nitas permite calcular informacion de primer orden de manera muy sencilla y es facilmente implementable. Sin embargo, la precision obtenida depende del valor del parametro de perturbacion elegido, lo que lo puede hacer impracticable para ciertos tipos de problemas o para los casos en los que el numero de parametros de optimizacion es elevado. El metodo de las ecuaciones adjuntas permite el calculo del gradiente, pero a menudo el sistema de DAEs esta mal condicionado y su solucion, incluso en los casos en los que no hay mal condicionamiento, no es sencilla. Por otra parte, ha resultado ser muy ine ciente, sobre todo en los problemas en los que la dimension del modelo dinamico es elevada. El calculo de sensibilidades requiere la integracion de un mayor numero de ecuaciones, sin embargo, hoy en d a existen tecnicas que permiten su resolucion de manera muy e ciente. Ademas, el sistema de DAEs resultante es mas estable que el sistema que resulta de utilizar ecuaciones adjuntas lo que ha llevado a que sea este, en general, el metodo preferido.
71
ser evaluadas e cientemente. Leis y Kramer (1985) presentaron el desarrollo teorico de este metodo, indicando claramente que el sistema de DAEs original y el de sensibilidades de primer orden tienen el mismo Jacobiano, lo que se puede aprovechar para aumentar la e ciencia de su resolucion. Caracotsios y Stewart (1985), presentaron algunos trabajos que continuaban con las l neas de sus predecesores y una implementacion en DASSL (Petzold, 1982) que, como se ve a en el cap tulo 1, es un integrador basado en BDF. Siguiendo estos trabajos, se han hecho avances signi cativos en la implementacion del calculo y simulacion de sensibilidades de primer orden para sistemas de DAEs. Jarvis (1993) describe varios avances en la aplicacion de metodos BDF en la integracion del sistema conjunto. En el trabajo de Vassiliadis (1993) se hace uso de sensibilidades parametricas de primer orden para calcular, de manera e ciente, el gradiente de la funcion objetivo con respecto a las variables de decision y se presenta su aplicacion a la resolucion de un conjunto de problemas de optimizacion dinamica. Keeping y Pantelides (1995) introducen algunos avances en la paralelizacion de la evaluacion de las sensibilidades y muestran un aumento en la velocidad de calculo muy signi cativa. Maly y Petzold (1996) presentan algunos nuevos resultados tanto en aspectos teoricos como en la implementacion practica de la evaluacion e ciente de sensibilidades. En trabajos mas recientes, Li y Petzold (1999) hacen especial hincapie en casos en los que el numero de parametros es elevado destacando el desarrollo de nuevos codigos programados en MPI (message passage interface) que permiten la resolucion en paralelo del sistema extendido. Galan et al. (1999) realizaron el calculo de sensibilidades de primer orden para sistemas h bridos discretos-continuos y, continuando con este trabajo, Tolsma y Barton (2000), desarrollaron nuevos codigos para resolver ciertos problemas que pueden surgir en casos en los que aparecen discontinuidades ocultas.
Derivacion matematica
Considerese un proceso dinamico distribuido. Tras aplicar cualquiera de los metodos vistos en el cap tulo 1, resultara un conjunto de DAEs de la forma:
f (_ z u w) = 0n z
con las condiciones iniciales:
t0 tf ]
(4.1) (4.2)
z(t0) = z0 (w)
72
_ donde: z z 2 R n son las nuevas variables de estado y sus derivadas temporales respectivamente. El vector z incluye las variables y que solo dependen del tiempo y las resultantes de aplicar el metodo de Galerkin (en cualquiera de sus versiones) o el NMOL a las variables distribuidas x. u 2 R son las variables de control , y w 2 R es el vector de parametros invariantes con el tiempo. Las funciones f son tales que: f : R n R n R R 7! R n. Dependiendo de la implementacion, las variables de control se pueden aproximar, utilizando el metodo CVP, por algun tipo de aproximacion que incluye algunos o todos los parametros en el conjunto v: (4.3) segun el procedimiento habitual del metodo de parametrizacion de control (Vassiliadis, 1993) descrito en detalle en la seccion 3.3.3. Por ejemplo, para el caso de una parametrizacion constante donde el nivel de discretizacion es , v es un vector que incluye las componentes de las variables de control en cada elemento temporal mas los parametros invariantes con el tiempo presentes en la formulacion del problema, es decir, su dimension sera ~ = + . Las sensibilidades de primer orden resultan de aplicar la regla de la cadena al sistema de nido por las ecs. (4.1)-(4.2) con respecto a los parametros v: _ @f @z + @f @z + @f @u + @f = 0 _ @z @v @z @v @u @v @v n y las condiciones iniciales: @ z (t ) = @ z0 (v) @v 0 @v El Jacobiano del sistema en 4.4 es la matriz: " # @f @f _ @z @z
~
u = u(v)
que es la misma que la que resulta en los pasos de integracion de las ecs. (4.1), como ya se se~ala en el trabajo de Leis y Kramer (1985). Este es el concepto clave n de la integracion e ciente de las ecs. (4.4) simultaneamente con las ecs. (4.1): no es preciso calcular el Jacobiano para las sensibilidades, por lo que la resolucion del sistema total de DAEs se puede hacer de una forma desacoplada y muy e ciente.
73
9 8" < @ f # @2z " @ f # @2z = _ : @ z I ~ @ v2 + @ z I ~ @ v2 + _ 82 ! 3" # < _ _ @ z T 5 @2f @ z + @2f @ z + @2f @ u + @2f + 4In +: _ _ _ _ @v @ z2 @ v @ z@ z @ v @ u@ z @ v @ v@ z 2 ! 3" # _ @ z T 5 @2f @ z + @2f @ z + @2f @ u + @2f + + 4In _ @v @ z@ z @ v @ z2 @ v @ u@ z @ v @ v@ z 2 " # ! 3" # _ @ f I @ 2 u + 4I @ u T 5 @2f @ z + @2f @ z + @2f @ u + @2f + + n _ @ u ~ @ v2 @v @ z@ u @ v @ z@ u @ v @ u2 @ v @ v@ u " 2 #9 _ @ f @ z + @2f @ z + @2f @ u + @2f = = 0 + @ z@ v @ v @ z@ v @ v @ u@ v @ v @ v2 (4.7) n ~ ~ t t0 tf ] _
2
@ 2 z (t ) = @ 2 z0 (v) @ v2 0 @ v2
(4.8)
La parte de la ec. (4.7) en el segundo par de llaves (\fg") representa lo que sera la
74
parte derecha de la ecuacion y depende de productos1 de tensores que corresponden a las derivadas de primer y segundo orden del sistema original de ecs. (4.1).
Hessiano proyectado
A primera vista no se aprecia el parecido entre las expresiones de las sensibilidades de primer y segundo orden. En esta seccion se aclara este punto presentando, como primer paso, el producto de un vector invariante con el tiempo p 2 R ~ con las matrices de orden 2 (Hessianos) para cada estado, es decir, con @2vz2i para todo @ t 2 t0 tf ]. En primer lugar, el resultado de la ec. (4.7) es multiplicado por p para obtener:
8 < :
9 =
8 < p+:
9 =
p = 0n ~
(4.9)
de donde, comparando terminos, y reordenando, se obtiene la siguiente expresion: @ f ST + @ f ST + A(_ z u v) = 0 _ z (4.10) n ~ _ @z @z siendo A(_ z u v) la matriz de dimension n ~ dada por: z
! 3"
! 3" # _ @ z T 5 @2f @ z + @2f @ z + @2f @ u + @2f + _ @v @ z@ z @ v @ z2 @ v @ u@ z @ v @ v@ z " # 2 2 !T 3 " 2 # _ @ f I @ u + 4I @ u 5 @ f @ z + @2f @ z + @2f @ u + @2f + + @ u ~ @ v2 n _ @v @ z@ u @ v @ z@ u @ v @ u2 @ v @ v@ u " 2 #9 _ @ f @ z + @2f @ z + @2f @ u + @2f = p + _ (4.11) @ z@ v @ v @ z@ v @ v @ u@ v @ v @ v2
1
A B
0 B B B B B @
a1 a
B 2 1B
1
a1 a
.. .
B 2 2B
2
a1 n;1
an;1 an
1B B 1
.. .
an;1 an
2B B 2
.. .
a2 n
.. .
B ;1 B
a1 n a
n
B B
an
an n
B 1 2 B C C C .. C . C BA ;1 B
n
75
_ y donde S S 2 R n ~ son las matrices cuyas columnas son, respectivamente, los _ productos matriz-vector si si 2 R n, con: 2 2 _ si = @ vz2i p si = @ vz_2i p i = 1 : : : n 8t 2 t0 tf ] (4.12) @ @ Finalmente, las condiciones iniciales para estas nuevas ecuaciones vienen dadas por:
0 pT h @2z01 (v)i 1 @ v2 B C ... B C T =B C (S(t0 )) B C @ h2 iA
(4.13)
Con estos resultados, esta claro que las ecs. (4.10) constituyen un conjunto de sensibilidades de primer orden, similar a la ec. (4.4). La unica complicacion surge en el calculo del termino de la derecha ;A(z z u v) que, a primera vista, parece _ requerir un esfuerzo signi cativo. Sin embargo, el aprovechamiento de su estructura y su posible caracter disperso pueden reducirlo notablemente. El calculo de las matrices de segundo orden para cada zi i = 1 : : : n se puede ver, en terminos de la ec. (4.7), como la resolucion ~ veces de la ec. (4.10), cada una de las cuales con p = ei, siendo ei vectores unidad. De la solucion del problema iesimo resultan las columnas de @2vz2i (o sus las, ya que estas matrices son simetricas). @
pT
@ z0 n (v) @ v2
76
Una vez generadas las rutinas con dichas ecuaciones, y siguiendo el esquema presentado en la gura 3.2, se elige un metodo de resolucion de problemas NLP adecuado. Se han usado con exito las rutinas de optimizacion de la librer a IMSL (1995), que minimizan una funcion de ~ variables sujetas a l mites usando metodos quasi-Newton. Con el n de comprobar el efecto que produce el uso del Hessiano exacto se seleccionaron tres rutinas que di eren en los requerimientos en cuanto a gradiente y Hessiano: Metodo qN-1.- DBCONF: usa un gradiente calculado por diferencias nitas (no hace uso de las sensibilidades de primer y segundo orden). Por lo tanto, el IVP esta formado unicamente por las n ecuaciones diferenciales originales. Metodo qN-2.- DBCONG: Requiere el calculo de gradiente exacto: el problema de valor inicial esta constituido ahora por el sistema original y el sistema de sensibilidades de primer orden (ecs. (4.1) y (4.4)). Metodo qN-3.- DBCOAH: Requiere el gradiente y Hessiano que en esta implementacion se obtiene mediante la integracion del IVP extendido, es decir, un total de n + n ~ + n ~ ~ ecuaciones diferenciales. Dado que el Hessiano es una matriz simetrica no es necesario integrar todas las sensibilidades de segundo orden, de manera que solo se integran las correspondientes a una seccion triangular. Se demostrara que el uso de informacion de segundo orden obtenida a traves del calculo de las sensibilidades presentadas aumenta la robustez del metodo de optimizacion. Para ello se consideraran varios problemas estandar tomados de la bibliograf a del area.
77
Nivel Integracion Optimizacion N1 10;5 10;3 N2 10;7 10;5 N3 10;9 10;7 Tabla 4.1: Niveles de tolerancia de integracion y optimizacion considerados ~ = , ya que solo hay una variable de control), Nv es el nivel de integracion, Mt es el metodo, J es el valor de la funcion objetivo en el optimo, ni es el numero de iteraciones que realiza el codigo de optimizacion, nf , ng y nh son el numero de evaluaciones de la funcion objetivo, el gradiente y el Hessiano, respectivamente y Tcpu es el tiempo de computacion (en segundos) en un PC Pentium III/450 MHz (62 M ops, segun Linpack-100)2.
P
Este es un problema clasico considerado como test para metodos de optimizacion. Ha sido resuelto por multitud de autores como, por ejemplo, Morison (1984), Gritsis (1990), Vassiliadis (1993), Tanartkit y Biegler (1995), entre otros. La formulacion del problema de optimizacion es como sigue: sujeto a la dinamica del sistema: 2 y1 = 1 ; y2 y1 ; y2 + u _ y2 = y1 _ 2 2 y3 = y1 + y2 + u2 _ y a los l mites en la variable de control:
;
min J = y3(tf ) u( )
con el vector de condiciones iniciales y(0) = 0 1 0 ]T , y 0 t tf con tf = 5. Como valor inicial para las variables de optimizacion se toma un per l de control constante u0(t) = 0:7, y los resultados obtenidos mediante los tres metodos y para los distintos niveles de tolerancia y discretizacion se resumen en la tabla 4.2.
Programa Fortran para la resolucion de un sistema de 100 100 ecuaciones lineales por el metodo de Gauss, habitualmente utilizado como referencia
2
78
Nv Mt L1 qN-1 qN-2 qN-3 L2 qN-1 qN-2 qN-3 L3 qN-1 qN-2 qN-3 Nv Mt L1 qN-1 qN-2 qN-3 L2 qN-1 qN-2 qN-3 L3 qN-1 qN-2 qN-3
=5 J 3:7724110 3:1244086 3.1244117 3:9361915 3:1244198 3.1244206 3:1244274 3:1244207 3.1244207 = 10 J 3:8151326 2:9260927 2.9261666 4:6532216 2:9261880 2.9261879 2:9990286 2:9261881 2.9261881
4 7 12 5 16 13 5
5 38 15 6 38 16 6
=7 J 3:8151326 2:9880627 2.9881236 3:6131949 2:9989599 2.9881205 2:9990286 2:9989606 2.9881206 = 15 J 4:0438623 3:5197676 2.8928487 4:8838627 2:9343444 2.8928992 2:9596461 2:9434537 2.8929002
4 26 11 5 13 14 5
5 91 16 6 32 20 9
5 4 27 ; 12 ; 6 5 15 ; 15 ; 6 5
; ;
Tabla 4.2: Resultados obtenidos con metodos tipo quasi-Newton para la optimizacion dinamica del Oscilador de van der Pol. De los resultados se extrae que el metodo qN-1 invierte un gran esfuerzo computacional para alcanzar valores suboptimos incluso utilizando tolerancias estrictas. Esto se debe, claramente, al uso de un gradiente aproximado por diferencias nitas. Por el contrario, los metodos qN-2 y qN-3 se comportan muy bien, siendo el metodo qN-3 superior. Esto es particularmente evidente en el caso de = 15, donde el metodo qN-2 no converge a una solucion aceptable mientras que el metodo qN-3 converge al objetivo en 4-5 iteraciones incluso para valores de tolerancia menos estrictos, ya que hace uso de informacion de primer y segundo orden exactas. El per l de control optimo para valor de discretizacion = 15 y nivel de tolerancia L3, as como las variables de estado correspondientes se presentan en la gura 4.1.
Todos los resultados referentes al tiempo de computacion ( ), incluidos en este cap tulo, se expresan en segundos y corresponden a un PC Pentium III/450Mhz).
3
Tcpu
79
Control u 1.1 0.9 0.7 0.5 0.3 0.1 -0.1 -0.3 1.0 2.0 3.0 4.0 3.0 2.5 2.0 1.5 1.0 0.5 0.0 5.0 -0.5 -1.0
Variables de estado y3
Tiempo
Figura 4.1: Oscilador de van der Pol: Per l de control optimo obtenido con un metodo quasi-Newton y variables de estado correspondientes.
El problema considera un reactor de ujo de piston, con dos catalizadores, donde tienen lugar las siguientes reacciones:
S1 * S2 )
; !
S3
El objetivo es encontrar la mezcla optima de los dos catalizadores para maximizar la produccion de la especie S3. Propuesto inicialmente por Gunn y Thomas (1965), fue considerado tambien por otros autores como Logsdon (1990) y Vassiliadis (1993). La formulacion matematica es como sigue: sujeto a: max J = 1 ; y1(tf ) ; y2(tf ) u( ) (4.19)
y los l mites para la variable de control: 0 u(t) 1 con condiciones iniciales y(0) = 1 0 ]T , y con 0 t tf , tf = 1. Como valor inicial para el metodo de optimizacion se uso u0(t) = v0 = 0:17, y los resultados obtenidos se presentan en la tabla 4.3.
80
Nv Mt L1 qN-1 qN-2 qN-3 L2 qN-1 qN-2 qN-3 L3 qN-1 qN-2 qN-3 Nv Mt L1 qN-1 qN-2 qN-3 L2 qN-1 qN-2 qN-3 L3 qN-1 qN-2 qN-3
=5 J 0.0453216 0.0475994 0.0476516 0.0388323 0.0476516 0.0476517 0.0452864 0.0476516 0.0476516 = 10 J 0.0448889 0.0479706 0.0480194 0.0460454 0.0480134 0.0480237 0.0477757 0.0480134 0.0480238
=7 J 0.0445168 0.0480104 0.0480516 0.0440223 0.0480521 0.0480521 0.0459102 0.0480521 0.0480521 = 15 J 0.0445474 0.0477499 0.0480238 0.0438642 0.0480549 0.0480552 0.0424346 0.0480552 0.0480553
Tabla 4.3: Resultados obtenidos con metodos tipo quasi-Newton para la optimizacion dinamica del problema de mezcla de catalizadores. Tal y como se observaba en el caso anterior, el metodo qN-1 es incapaz de llegar a soluciones aceptables, realizando un numero elevado de evaluaciones de la funcion objetivo que en ocasiones resultan en tiempos de computacion equivalentes a los requeridos por qN-2 o qN-3 para llegar al optimo. Los metodos qN-2 y qN-3 alcanzan buenos resultados, siendo una vez mas el metodo qN-3 el mas e ciente en terminos de numero de iteraciones y evaluaciones. A pesar de las diferencias en numero de evaluaciones, los tiempos de computacion del metodo qN-3 son comparables a los requeridos por el qN-2, ya que el calculo de la informacion de segundo orden exacta es bastante costoso. Esto es especialmente notable en el caso de = 15 en el que qN-2 alcanza una solucion mas rapidamente (aunque ligeramente peor) lo que indica peque~os problemas de convergencia debido al uso de diferencias nitas. n En la gura 4.2 se presenta el per l de control optimo obtenido con el metodo qN-3, para nivel de discretizacion = 15 y nivel de tolerancia L3 as como las variables de estado correspondientes a ese control optimo.
81
Control u
Variables de estado y1
0.5 0.3 0.1 -0.1 0.0 0.2 0.4 0.6 Tiempo 0.8 1.0 0.4 0.2 y2 0.0 0.0 0.2 0.4 0.6 Tiempo 0.8 1.0
Figura 4.2: Mezcla de catalizadores: Per l de control optimo obtenido con un metodo quasi-Newton y variables de estado correspondientes.
P
Este problema fue presentado por Nishida et al. (1976) y se formula como sigue:
i=1
yi2(tf )
(4.23)
sujeto a:
y1 = _ y2 = _ y3 = _ y4 = _
y los l mites para la variable de control: 1:0 u +1:0 (4.28) con las condiciones iniciales: yi(0) = 10, i = 1 : : : 4, y con 0 t tf , tf = 4:2. Como per l inicial de control para la optimizacion se tomo u0(t) = v0 = 0:0 y los resultados obtenidos se resumen en la tabla 4.4 donde se observa un patron de comportamiento semejante al de los problemas anteriores.
;
82
Nv Mt L1 qN-1 qN-2 qN-3 L2 qN-1 qN-2 qN-3 L3 qN-1 qN-2 qN-3 Nv Mt L1 qN-1 qN-2 qN-3 L2 qN-1 qN-2 qN-3 L3 qN-1 qN-2 qN-3
=5 J 4.2930712 3.0486480 3.0486480 3.0756979 3.0497825 3.0497824 3.5501229 3.0497835 3.0497835 = 10 J 4.2928681 1.6709727 1.6715155 2.0826751 1.6716994 1.6716299 1.9573821 1.6716309 1.6716309
=7 J 4.1519554 3.5450668 3.5452666 4.1110154 3.5460495 3.5460481 4.2938651 3.5460517 3.5460517 = 15 J 1.6368032 1.2344903 1.2344903 2.1299251 1.2346949 1.2346948 1.7088882 1.2346974 1.2346974
Tabla 4.4: Resultados obtenidos con metodos tipo quasi-Newton para la optimizacion dinamica del problema de Nishida. En este problema, el metodo qN-1 falla claramente y no alcanza mas que soluciones suboptimas, mientras que los metodos qN-2 y qN-3 alcanzan soluciones comparables. Es preciso resaltar que en este caso, a pesar de realizar un menor numero de iteraciones, el metodo qN-3 invierte mas tiempo de computacion debido al coste de evaluar la informacion de segundo orden. Por supuesto, esta limitacion podr a solucionarse con una evaluacion e ciente, probablemente en paralelo, de las sensibilidades. En la gura 4.3 se presentan tanto el per l de control optimo como la evolucion de los estados correspondientes.
83
Control u
Variables de estado y1 y2 y3 y4
0.0
1.0
2.0 Tiempo
3.0
4.0
-15.0
0.0
1.0
2.0 Tiempo
3.0
4.0
Figura 4.3: Problema de Nishida: Per l de control optimo obtenido con un metodo quasi-Newton y variables de estado correspondientes.
4.4.3 Conclusiones
Los resultados obtenidos muestran claramente que el comportamiento de un algoritmo basado en CVP para la solucion de problemas de optimizacion dinamica se mejora notablemente mediante el uso de informacion de segundo orden exacta. El numero de evaluaciones de la funcion objetivo y gradiente se reducen considerablemente y los resultados nales son, al menos, tan buenos como los obtenidos por metodos que usan gradiente exacto y un Hessiano aproximado por diferencias nitas. De los resultados obtenidos se extrae la conclusion de que un nivel de tolerancias adecuado es de nitivo para la correcta resolucion del problema. Esto es especialmente relevante para metodos que hacen uso de diferencias nitas (qN-1 y qN-2). Los tiempos de computacion obtenidos son peque~os. Sin embargo, crecen n rapidamente con la dimension del problema y con el nivel de discretizacion debido, fundamentalmente, al calculo y manejo del Hessiano completo. Este coste podr a reducirse a traves de una simulacion e ciente de las sensibilidades de segundo orden, resolviendolas en paralelo. Sin embargo, existe otra posibilidad aprovechando que, como se ve a en el cap tulo 2, se han desarrollado metodos de optimizacion que usan proyecciones del Hessiano y que estan especialmente indicados para la resolucion de problemas de dimension elevada. Esta idea se estudiara en las siguientes secciones.
84
2 J (vk )sk
= ;rJ (vk )
Hs = b
(4.29)
Esta resolucion puede hacerse de manera exacta con metodos como el de reduccion de Gauss. Sin embargo, y con el n de ahorrar esfuerzo computacional, el metodo de Newton Truncado hace uso del metodo de Gradiente Conjugado. El metodo de gradiente conjugado (GC) se presento en el cap tulo 2 como un algoritmo de optimizacion y, efectivamente, para la resolucion de sistemas de ecuaciones, resuelve un problema de minimizacion cuadratico4 equivalente:
min
1 (s) = 2 sT Hs ; bT s
(4.30)
El metodo GC basa la resolucion de ese problema de minimizacion en la busqueda de direcciones conjugadas, es decir, direcciones tales que:
pT Hp = 0
(4.31)
El hecho de que los vectores sean conjugados proporciona unas propiedades muy atractivas que facilitan enormemente la resolucion del sistema de ecuaciones, transformandolo en un problema de minimizacion de un sumatorio de problemas unidimensionales. Aqu no se detallan los pasos para llegar a este nuevo problema, simplemente se indica que inicialmente se asume que un vector solucion se puede expresar como una combinacion lineal de estos vectores:
s0 =
4
aipi
(4.32)
Notese que en el m nimo el gradiente debe anularse, lo que para una funcion cuadratica equivale a un sistema de ecuaciones.
85
El metodo GC asume que la solucion se puede expresar en funcion de un conjunto de direcciones conjugadas y los coe cientes ai , e itera hasta reducir lo que se denomina residuo krik = kb ; Hsk hasta un cierto valor su cientemente peque~o GC . n Es importante destacar el hecho de que este sistema de ecuaciones se resolvera en cada iteracion para el calculo de la direccion de busqueda, es decir, el metodo de Newton Truncado realiza dos iteraciones: una externa, que se denotara por k, en la que genera una secuencia de puntos que minimizan la funcion objetivo J (v), y otra interna i en la que se calcula la direccion de busqueda a traves del metodo de gradiente conjugado. Para clari car este punto en la gura 4.4 se presenta un diagrama de ujo donde se describen ademas los pasos del metodo de gradiente conjugado en detalle. En el se observa en el diagrama de ujo que no se require toda la matriz H, es decir, el Hessiano, sino que basta con su proyeccion sobre un vector p. Para el caso de sistemas dinamicos, esta informacion se puede obtener de manera muy e ciente, a partir del producto matriz-vector estudiado en la seccion 4.3. Es decir, mediante el uso de las expresiones (4.10) y (4.13), se puede obtener, con un coste computacional equivalente al del calculo del gradiente, la informacion exacta requerida por el metodo de Newton Truncado. Se presenta aqu este metodo, que se denominara TNHp, para la resolucion de problemas de optimizacion dinamica y se estudian sus propiedades a traves de la solucion de un conjunto de problemas tomados de la bibliograf a.
y sustituyendo en la expresion (4.30), resulta un nuevo problema de minimizacion donde las variables son los coe cientes ai, y dado que el problema es muy sencillo la aplicacion de la primera condicion de optimalidad resulta en una expresion para los ai: T pi ai = pb Hp (4.33) T
i i
86
Solucin v*
No
Gradiente Conjugado : si+1=si +ai p i Convergencia Si ? ||ri ||< No b i =r i Tr i /r i-1Tr i-1 p i =r i + b i p i-1 ai = r i Tr i /p i TA p i si+1=si +ai p i r i+1=r i -ai A p i
s* k
GC
Iteracin interna
87
88
1er PASO
Dinmica del problema
Manipulacin simblica
2 PASO
Simulacin IVP Extendido
Estados z (t)
2 orden s2(t)
Objetivo y Restricciones
Gradiente
Hessiano / Hp
Nuevo v
u(v,t)
89
90
DDASSLSO, metodo BDF que permite la resolucion de DAEs y el calculo e ciente de sensibilidades con respecto a parametros, desarrollado por Petzold8 . En la tabla 4.5 se resumen los resultados de TNHp (obtenidos para un nivel de tolerancias L2 segun la tabla 4.1), donde P , indica el problema de optimizacion considerado Mt, el integrador utilizado de entre los citados anteriormente , el nivel de discretizacion de la variable de control ni =nf =ncg , el numero de iteraciones, evaluaciones de la funcion objetivo e iteraciones internas realizadas en la optimizacion % error, el tanto por ciento de error cometido en el resultado nal relativo9 al mejor obtenido por los tres metodos, que se se~alara con un . Por ultimo, RCPU repren senta el cociente entre el tiempo de calculo utilizado por el metodo considerado y el mas rapido (que se indicara #). De los resultados se deduce que, efectivamente, la calidad de la integracion afecta a los resultados de optimizacion, aunque no se han observado demasiadas diferencias en cuanto al valor objetivo salvo en el caso P 4.2 con nivel de discretizacion = 120, en el que LSODA y DDASSLS0 presentan convergencia a un optimo local. Sin embargo, s son apreciables las diferencias en tiempo de computacion: por ejemplo DDASSLS0 y LSODA pueden llegar a ser en torno a 10 y 3 veces mas lentos, respectivamente, que RKF45, que parece tener, en terminos generales, un mejor comportamiento. Tambien se observa que el numero de iteraciones internas no se ve, en general, afectado por el metodo de integracion lo que indica un buen comportamiento en la resolucion del sistema extendido. Sin embargo, hay que destacar que s aparecen diferencias a medida que aumenta el nivel de discretizacion y especialmente en el P 4.4 que presenta, ademas, un arco singular, por lo que la precision de las iteraciones internas es mas relevante. Se concluye, pues, que para el caso de ODEs poco o nada r gidas, el metodo RKF45 parece ser el mejor candidato para la resolucion de los IVP extendidos y por lo tanto, sera este el que se empleara en la resolucion de los problemas que as lo permitan.
8 9
;J j
91
P P
4.1 15 25 50 100
4.2 15 30 60 120
4.4 15 25 60 120
Mt (IVP) ni=nf =ncg % error RCPU RKF45 7/8/29 2 10;4 # LSODA 7/8/27 3 10;4 2.1 DDASSLS0 7/8/29 * 4.6 ;4 RKF45 7/8/29 6 10 # LSODA 7/8/29 5 10;4 2.9 DDASSLS0 7/8/29 * 5.6 ;3 RKF45 8/9/31 1 10 # LSODA 8/9/31 1 10;3 3.1 DDASSLS0 8/9/31 * 5.0 RKF45 11/12/41 4 10;3 # LSODA 11/12/41 4 10;3 3.0 DDASSLS0 11/12/41 * 4.0 ;3 RKF45 15/16/39 2 10 # LSODA 15/16/39 2 10;3 1.6 DDASSLS0 15/16/39 * 10.0 ;3 RKF45 30/31/91 5 10 # LSODA 30/31/90 5 10;3 1.6 DDASSLS0 30/31/91 * 10.1 ;3 RKF45 60/61/184 9 10 # LSODA 60/61/185 4 10;3 1.7 DDASSLS0 60/61/184 * 9.6 RKF45 120/121/382 * # LSODA 101/102/322 2.9 1.3 DDASSLS0 115/116/378 1.4 7.2 RKF45 13/18/52 * 1.6 LSODA 8/15/29 2 10;2 # DDASSLS0 7/12/29 2 10;2 5.8 RKF45 11/17/54 * 1.2 LSODA 11/17/42 6 10;3 # DDASSLS0 9/13/39 7 10;3 4.4 RKF45 14/19/57 4 10;3 # LSODA 16/21/68 * 1.3 ;3 3.8 DDASSLS0 13/26/55 5 10 RKF45 14/28/80 8 10;3 # LSODA 18/24/82 4 10;3 1.1 DDASSLS0 24/27/108 * 3.5
Tabla 4.5: Comparacion de integradores en la resolucion de problemas de optimizacion dinamica con el metodo TNHp.
92
93
NIT 0 -0.1 TNHp (=11) log10[(J-J*)/J*] -0.6 -1.1 -1.6 -2.1 -2.6 TNfd (=11) 10 20 30 40 50
20
40
NIT 60
100
120
50
NIT 100
150
200
Figura 4.6: Estudio comparativo de las curvas de convergencia de los metodos TNHp y TNfd para la resolucion del problema CSTR (tomando como referencia J = 21:812).
94
5 log10[(J-J*)/J*]
10
15 NIT
20
25
30
1.0 0.5 0.0 -0.5 -1.0 -1.5 -2.0 -2.5 -3.0 -3.5
10 log10[(J-J*)/J*]
20
NIT
30
40
50
70
80
Figura 4.7: Estudio comparativo de las curvas de convergencia de los metodos TNHp y TNfd para la resolucion el problema del oscilador de van der Pol (tomando como referencia J = 2:8673).
95
Converge a per les de control con mucho \ruido". Esto es especialmente importante en los casos en los que hay arcos singulares, el Hamiltoniano del sistema es insensible al control y eso se traduce habitualmente en problemas de convergencia para los metodos deterministas. Para re ejar este aspecto se muestra en la gura 4.8 la comparacion de los per les optimos obtenidos por ambos metodos en la resolucion del problema de mezcla de catalizadores.
=5
1 0.8 Control u 0.6 0.4 0.2 0 TNHp TNfd Control u
=30
1 0.8 0.6 0.4 0.2 0 0 TNHp TNfd
0.2
0.8
0.2
0.8
=50
TNHp TNfd Control u
=100
TNHp TNfd
0.8
0.2
0.8
Figura 4.8: Comparacion de pol ticas optimas de operacion obtenidas con TNHp y TNfd para la resolucion del problema de mezcla de catalizadores. Para el valor de = 100 se observa el buen comportamiento del TNHp frente al TNfd: una informacion de Hessiano exacta parece la clave para obtener per les suaves en los arcos singulares. Tambien otros metodos que no usan informacion de segundo orden obtenida mediante diferencias nitas, pero s a partir de aproximaciones, presentan problemas de este tipo, como se re eja en la gura 4.9, lo que viene a con rmar esta hipotesis.
96
Figura 4.9: Pol tica de operacion ( = 100) para el caso de mezcla de catalizadores segun Dolan y More (2001).
97
u0(t) = 0:7, J0 = 5:43815 ni =nf =ncg J 25 7=8=29 2:87631 50 8=9=31 2:86942 100 11=12=41 2:86787 200 16=17=62 2:86769 500 47=48=161 2:86728
u0(t) = 0:1, J0 = 15:14833 Tcpu ni=nf =ncg J Tcpu 0:3 25 10=11=44 2:87631 0:5 1:6 50 9=17=34 2:86937 1:6 5 100 13=21=48 2:86778 5 32 200 21=29=63 2:86739 34 314 500 59=60=177 2:86728 360
;
Tabla 4.6: Resultados obtenidos para el caso del Oscilador de van der Pol con el metodo TNHp.
u0(t) = 0:17, J0 = 0:0338832 ni=nf =ncg J 25 11=12=27 0:0480527 50 23=24=65 0:0480554 100 40=41=101 0:0480555 150 61=62=149 0:0480556
u0(t) = 0:95, J0 = 0:0040861 ni=nf =ncg J 25 14=15=43 0:0480527 50 22=23=56 0:0480553 100 41=42=99 0:0480555 150 61=62=142 0:0480556
Tabla 4.7: Resultados obtenidos para el problema de mezcla de catalizadores con el metodo TNHp.
u0(t) = 0:0, J0 = 4:29386 ni=nf =ncg J 25 25=26=81 1:11371 50 50=51=156 1:01746 100 100=101=318 1:01397 150 150=151=468 1:00891
u0(t) = 0:5, J0 = 4:41397 ni =nf =ncg J 25 25=26=75 1:11371 50 50=51=151 1:01745 100 100=101=316 1:01397 150 150=151=472 1:012275
;
Tabla 4.8: Resultados obtenidos para el problema de Nishida con el metodo TNHp.
98
1 0.8
Control, u
Figura 4.10: Pol tica de operacion optima para el caso P 4.1 ( = 500, J = 2:86728).
1 0.8
Control, u
0.2
0.8
1.0
Figura 4.11: Pol tica de operacion optima para el problema P 4.2 ( = 150, J = 0:0480556).
1.5 1
Control, u
Figura 4.12: Pol tica de operacion optima para el problema P 4.3 ( = 150, J = 1:00891).
99
4.5.5 Conclusiones
Se han resuelto tres problemas t picos de optimizacion dinamica de diferentes caracter sticas con el n de evaluar la calidad del metodo propuesto (TNHp). Para ello se han considerado varios niveles de discretizacion y dos puntos iniciales diferentes. Recordando los criterios de evaluacion de metodos de optimizacion que se ve an en la primera seccion del cap tulo 2 y aplicandolos al metodo TNHp se concluye: 1. Generalidad y robustez: El metodo es aplicable a un conjunto de problemas bastante diverso incluyendo casos muy no lineales. Sin embargo, al tratarse de un metodo determinista, no sera aconsejable para la resolucion de problemas multimodales. En cuanto a robustez, ha alcanzado practicamente los mismos resultados desde distintos puntos iniciales, incluso puntos muy lejanos, para todos los casos considerados, lo que demuestra un comportamiento robusto. 2. E ciencia: Para evaluar la e ciencia del metodo se compararan los resultados con aquellos obtenidos por otros metodos, como el qN-3, presentado tambien en este trabajo, o los metodos IDP, Luus-Jaakola y DAEOPT a traves de los resultados publicados por otros autores. En la tabla 4.9 se presenta un resumen de resultados para todos los casos considerados, utilizando la siguiente notacion: P , indica el caso de optimizacion dinamica Mt, indica el metodo utilizado para resolver el problema /Aprox., indica el nivel de discretizacion y el tipo de aproximacion utilizados (como tipos de aproximacion se distinguen, c y l que indican aproximacion utilizando elementos constantes y lineales respectivamente, por ultimo algunos metodos utilizan elementos de longitud variable (v-c o v-l) J , indica el valor optimo alcanzado y Tcpu indica el tiempo de computacion en segundos en un Pentium/III a 450MHz (los valores tomados de la bibliograf a han sido transformados teniendo en cuenta las tablas de transformacion del Linpack 10010).
10
http://www.netlib.org/performance/html/PDStop.html
100
/Aprox. J Tcpu (s) P 10/v-l 2:868095 29 15/c 2:8929002 2:87 100/c 2:86787 5 500/c 2:86728 314 P 4.2 DAEOPT (Vassiliadis, 1993) 6/v-c 0:0480557 2:5 Varios (Dolan y More,2001) varios/c 0:047186 ; 0:048069 1:6 ; 1027 qN-3 15/c 0:0480553 10:5 TNHp 50/c 0:0480554 0:9 150/c 0:0480556 15.6 P 4.3 qN-3 15/c 1:2346948 20:5 TNHp 25/c 1.11371 0.5 150/c 1:00891 28
P
Tabla 4.9: Resumen de resultados obtenidos por distintos metodos. Observando los resultados detallados en la tabla, se concluye que el metodo TNHp demuestra ser muy e ciente en la resolucion de los tres problemas considerados no solo en valores de J alcanzados sino tambien en tiempos de computacion. En particular en el problema P 4.1 el TNHp alcanza un valor objetivo mejor que el obtenido usando DAEOPT (metodo CVP basado en un SQP reducido que hace uso de informacion de primer orden exacta) practicamente 6 veces mas rapido. En el problema P 4.2, su comportamiento no es tan bueno: si se comparan los valores objetivo resulta ligeramente peor que el presentado por Vassiliadis (1993). En cuanto a los valores que aparecen en el trabajo de Dolan y More (2001), son muy variados, y los propios autores reconocen que son oscilatorios, con per les de control muy ruidosos, como ya se mostraba en la gura 4.9. Por ultimo en cuanto al caso P 4.3, no hay resultados de otros autores que permitan ofrecer una comparacion mas detallada. Sin embargo, una vez mas TNHp resulta muy superior al qN-3, alcanzando un mejor valor objetivo 40 veces mas rapido. Por otra parte hay que destacar su superioridad frente al metodo qN-3, presentado tambien en este trabajo, a pesar de realizar un numero mas elevado de evaluaciones tanto de la funcion objetivo como del gradiente y de la informacion de segundo orden. Notese tambien que el aumento en el nivel de discretizacion produce un incremento no lineal del tiempo de computacion dado que el numero de iteraciones
101
internas del metodo TN crece tambien rapidamente. Esto con rma una vez mas que una evaluacion mas e ciente de las sensibilidades de segundo orden es vital para reducir los tiempos de computacion.
102
Paso 3.- Calcular el numero de optimizaciones (NRO) y el paso de reduccion de la 1 tolerancia tol usando las expresiones fi = r(NRO;1) y tol = NRO (int toli ; int tolf ) Paso 4.- Optimizacion inicial (k = 1): calcular, usando TNHp, el per l optimo para u1(t) que corresponde al nivel de discretizacion inicial i y las tolerancias int toli , opt toli. Paso 5.-Bucle de optimizacion re nando el nivel de discretizacion, k=2 Si (k <= NRO) entonces k = k;1 r Reducir la tolerancia de integracion: int tolk = int tolk;1- tol Ajustar la tolerancia de optimizacion: opt tolk = int tolk tol ratio Optimizacion k: usando uk;1 como per l inicial, calculo de uk usando TNHp k =k+1 Fin Algunos valores t picos para los parametros del metodo RNTHp son i = 15 ; 20, r = 2, tol ratio = 100:0. A continuacion se aplica este metodo a la solucion de varios problemas de di cultad media-alta.
S+X
P + nX
103
El problema de optimizacion dinamica de estos bioreactores es una tarea dif cil ya que sus modelos son habitualmente muy no lineales y en ocasiones hay restricciones sobre los estados. La variable manipulable es, normalmente, la alimentacion (F) y, como ya se comento en el cap tulo 3, los per les optimos suelen ser de tipo bang-singular-bang (Modak et al., 1986 Bonvin, 1998) lo que complica su solucion notablemente. Algunos autores, tales como San y Stephanopoulos (1984, 1989), Lim et al. (1986), Hong (1986), Modak et al. (1989) y Shioya (1992) , utilizaron el principio maximo de Pontryagin para la resolucion de problemas de este tipo. Dado que las combinaciones en un per l bang-singular-bang son variadas (Lim et al., 1986) y la secuencia depende tanto del tipo de proceso como de las condiciones iniciales, el problema consiste en encontrar los tiempos en los que se producen los cambios y la forma del per l. Para ello estos autores han propuesto ciertas tecnicas y condiciones sobre el Hamiltoniano para poder calcular las pol ticas de operacion. Sin embargo el uso del principio maximo sigue siendo muy complicado. De hecho, en el trabajo de San y Stephanopoulos (1989) se reconocen estas di cultades y se presenta como alternativa el uso de la concentracion de sustrato (S) como variable de control para evitar as la aparicion de arcos singulares. Otros autores como Luus (1992), Gupta (1995), Tholudur y Ramirez (1997), se decantan por el uso del metodo IDP, mientras que la mayor a de los investigadores usan metodos directos en combinacion con distintos algoritmos de optimizacion no lineal. As por ejemplo, Andres-Toro et al. (1997) y Roubos et al. (1999) optaron por el uso de algoritmos geneticos Vassiliadis (1993, 1994 a) hace uso de un metodo determinista de primer orden por ultimo Banga et al.(1994), Banga y Seider (1996), Banga et al.(1997) y Carrasco y Banga (1997) hacen uso de algoritmos estocasticos. Aqu se presenta el uso de los metodos TNHp y RTNHp para la resolucion de dos casos de estas caracter sticas comparando los resultados con los publicados por otros investigadores.
P
El problema fue formulado originalmente por Park y Ramirez y ha sido resuelto por varios autores (Yang y Wu, 1994 Luus, 1995 Banga et al., 1995 Tholudur y Ramirez, 1997). El objetivo es maximizar la prote na segregada en un cultivo de una levadura (microorganismo). El modelo dinamico tiene en cuenta el crecimiento de los microorganismos y la generacion de producto (polipeptidos en este caso) mediante los
104
donde y1 e y2 son, respectivamente, la concentracion de prote na y polipetido total (L;1 ), y3 es la densidad de microorganismos (g=L), y4 es la concentracion de sustrato (g=L) , y5 es el volumen en el reactor (L) y u es la alimentacion de nutriente (glucosa) (L=h). El problema de optimizacion dinamica consiste en encontrar u(t) en el intervalo t 2 t0 tf ] para maximizar: J = y1(tf )y5(tf ) (4.42) donde J es la masa total de prote na producida a tiempo nal. Las condiciones iniciales son:
u y1 = g1 (y2 y1) y y1 _ 5 uy y2 = g2y3 y 2 _ 5 uy y3 = g3y3 y 3 _ 5 u y4 = 7:3g3y3 + y (20 y4) _ 5 y5 = u _ g1 = 0:4:75g3g 12 + 3 4 g2 = 0:1y+ y exp ( 5y4) 4 21:87y4 g3 = (y + 0:4) (y + 62:5)
; ; ; ; ; ; ;
y(0) = 0 0 1 5 1]
(4.43)
Con el n de poder comparar los resultados obtenidos con los presentados en la bibliograf a se consideraran tres casos particulares:
P
4.4a: resuelto por Vassiliadis (1993), con tiempo nal tf = 22 h y veri cando la restriccion en el volumen a tiempo nal:
y5(tf ) 14:35
y los l mites:
(4.44)
0 u 10 (4.45) Para obtener una solucion factible se ha usado una funcion de penalizacion cuadratica como las presentadas en la seccion 2.4.
105
4.4b: resuelto por Luus (1992) y Banga et al. (1995), con tiempo nal tf = 15 h y las restricciones en la variable de control: 0 u 2:0
P
(4.46)
4.4c: el mismo que P 4.4b, pero con peque~as modi caciones en el modelo n introducidas por Tholudur y Ramirez (1997), y con los l mites en la variable de control: 0 u 2:5 (4.47) Todos ellos se han resuelto utilizando TNHp con varios niveles de discretizacion y RTNHp en el modo descrito. Los resultados se presentan en las tablas 4.10-4.15 siguiendo la notacion habitual. En las tablas de resultados obtenidos con el metodo RTNHp se a~ade una columna para indicar el numero de optimizacion (NRO) y los n valores de evaluaciones y tiempo de computacion son acumulativos. En relacion al uso del TNHP se han considerado dos tolerancias de integracion (10;7 y 10;8), con el n de evaluar su impacto en el resultado nal. El per l inicial elegido es u0 = 0:5, y los resultados aparecen en las tablas 4.10 para el caso P 4.4a 4.12 el caso P4.4b y 4.14 para el caso P 4.4c. En relacion a la optimizacion con RTNHp se han elegido 10;6 y 10;8 como valores inicial y nal para la tolerancia de integracion respectivamente. Los resultados aparecen en las tablas 4.11, 4.13 y 4.15. Como referencia, los resultados presentados en la bibliograf a reciente se resumen en la tabla 4.16.
int tol : 10;7 ni=nf =ncg 15 9=14=31 30 10=14=42 60 16=23=79 120 19=27=95
int tol : 10;8 J Tcpu ni =nf =ncg 92.977 6.4 15 16=21=68 93.377 22 30 15=18=65 93.388 118 60 15=19=74 93.441 388 120 23=30=114
Tabla 4.10: Resultados obtenidos con el TNHp para el caso P 4.4a. Para el caso P 4.4a, se observa que el metodo TNHp converge a muy buenos resultados rapidamente incluso para valores elevados de ( ). No se perciben diferencias muy importantes entre los resultados obtenidos por los dos niveles de tolerancia aunque el uso de tolerancias mas estrictas aumenta el coste computacional.
106
NRO 1 2 3 4 5
15 30 60 120 240
Tabla 4.11: Resultados obtenidos con el RTNHp para el caso P 4.4a (r = 2 int toli=10;6, int tolf =10;8). En cuanto a la solucion con RTNHp, es claro que los resultados mejoran notablemente, ya que no solo permite mejorar los valores de la funcion objetivo sino que ademas el tiempo de computacion se reduce de manera considerable.
int tol : 10;7 ni=nf =ncg 15 12=26=50 30 21=31=118 60 27=33=168 120 24=28=121
int tol : 10;8 J Tcpu ni=nf =ncg 32.028 7.4 15 15=27=59 32.574 38.7 30 24=34=144 32.662 159 60 29=36=215 32.663 366 120 35=41=205
NRO 1 2 3 4 5
20 40 80 160 320
Tabla 4.13: Resultados obtenidos con el RTNHp para el caso P 4.4b (r = 2 int toli=10;6, int tolf =10;8). Con respecto al caso P 4.4b, el comportamiento es semejante, aunque el uso de tolerancias de integracion y optimizacion mas estrictas parece tener mas relevancia que en el caso anterior.
107
int tol : 10;7 ni=nf =ncg 15 16=30=60 30 23=62=69 60 19=60=79 120 19=39=92
int tol : 10;8 J Tcpu ni =nf =ncg 32.110 7.5 15 16=30=60 32.269 21 30 20=64=66 32.443 72.6 60 18=50=76 32.467 241 120 31=59=207
NRO 1 2 3 4 5
20 40 80 160 320
Tabla 4.15: Resultados obtenidos con el RTNHp para el caso P 4.4c (r = 2 int toli=10;6, int tolf =10;8). Por ultimo, para el caso P 4.4c, en concordancia con los resultados obtenidos en los dos casos anteriores, tanto TNHP como RTNHp convergen rapidamente a muy buenas soluciones. En este caso el uso de tolerancias mas estrictas apenas in uye salvo en el caso = 120 en que el objetivo experimenta una ligera mejor a. Los resultados presentados en la tabla 4.15 re ejan, una vez mas, que RTNHp alcanza soluciones, en ocasiones, mejores, y siempre con menor coste computacional.
108
/Aprox. J Tcpu (s) P 4.4a 10/v-c 93.232 128 10/v-l 93:361 85 TNHp 30/c 93:377 22 RTNHp 60/c 93:379 30.8 240/c 93:553 496 P 4.4b SA (Yang y Wu,1994) ** 32:681 N.D. 11 IDP (Luus, 1994) ** 32:64 N.D. IDP (Luus, 1995) ** 32:686 4808 ICRS/DS (Banga et al. 1995) 7/v-l 32:562 18 ; 53 TNHp 120/c 32:691 759 RTNHP 160/c 32:688 428 P 4.4c FIDP (Tholudur y Ramirez, 1997) 50 ; 200/c 32:31 ; 32:47 N:D: TNHp 60/c 32:443 75 RTNHp 40/c 32:388 44 320/c 32:480 451
P
Tabla 4.16: Tabla resumen de resultados para la optimizacion dinamica del bioreactor de Park-Ramirez. Si se comparan los resultados con los obtenidos por otros autores, se observa que para el caso P 4.4a, el mejor valor obtenido (J = 93:553), se obtiene en tan solo 513 s, destacando el hecho de que, con el metodo RTNHp, en menos de ha alcanzado un valor objetivo de J = 93:358. Para el caso P 4.4b, se observa que, una vez mas, tanto con TNHp como con RTNHp se mejoran los resultados en terminos de funcion objetivo, con reducciones en el tiempo de computacion de hasta 11 veces respecto a los valores presentados en la bibliograf a. De manera semejante, en el caso P 4.4c, los resultados obtenidos con TNHp y RTNHp, son comparables o mejores que los obtenidos por otros autores. Algunos ejemplos de per les optimos se muestran en las guras 4.13. Es importante resaltar la suavidad de estos per les frente a los encontrados por otros autores, que se han visto obligados a utilizar tecnicas manuales de ltrado (como por ejemplo FIDP) para suavizar los per les debido a la presencia de picos en las soluciones originales.
109
1.5
Control, u
0.5
10
15 Tiempo (h)
20
25
2 1.6
Control, u
Tiempo (h)
10
15
Control, u
1.5 1 0.5 00
10 Tiempo (h)
15
Figura 4.13: Pol ticas de operacion optimas para los casos P 4.4a ( = 120, J = 93:441), P 4.4b ( = 120, J = 32:663) y P 4.4c ( = 120, J = 32:467) respectivamente.
110
P
Este problema fue formulado por Lee y Ramirez (1994) y considerado mas tarde por otros autores, como Tholudur y Ramirez (1996) y Carrasco y Banga (1997), que indicaron que la funcion objetivo era muy poco sensible a las modi caciones en las variables de control. Para subsanar este problema Tholudur y Ramirez (1997) presentaron un modelo modi cado en el que parece aumentar esta sensibilidad. Esta es la formulacion que se considerara en este trabajo. En este caso dos son las corrientes de entrada al reactor, una es la alimentacion y la otra es un inductor que modi ca la velocidad de crecimiento de los microorganismos favoreciendo la produccion de prote na. El objetivo es maximizar el bene cio del proceso, es decir, la diferencia entre el valor del producto obtenido (prote na) y el coste del inductor: Encontrar u1(t) y u2(t) en t 2 t0 tf ] para maximizar:
J = y4(tf )y1(tf ) Q
;
Z tf
t0
u2(t)dt
con:
y3 y + y R (y )] 2 14:35 + y3 + y3 =111:5 6 7 R 5 0 RR = 0:22:22 y + 5 + : Rfp = 14:35 +0y233yy32=111:5 00::0005+ yy5 022 5 3+ 3 0:09y5 k1 = k2 = 0:034 + y
=
5
111
donde las variables de estado son el volumen del reactor y1, la densidad de microorganismos y2, la concentracion de nutrientes y3, la concentracion de prote na y4, la concentracion del inductor y5, y el efecto que produce el inductor sobre el crecimiento de los microorganismos viene dado por y6 y y7. Las dos variables de control son la corriente de glucosa u1 y la de inductor u2. Q es la razon entre el coste del inductor y el valor de produccion de prote na. El tiempo nal de operacion se toma como tf = 10 h. Las condiciones iniciales son:
(4.60)
u1(t) 1 u2(t) 1
(4.61) (4.62)
Tholudur y Ramirez usaron el metodo IDP (Iterative Dynamic Programming) de Luus y su FIDP (Filtered Iterative Dynamic Programming) para la resolucion de este problema, considerando tres posibles valores de Q. En particular, Q = 0 (sin considerar el coste del inductor), Q = 2:5 y Q = 5:0, casos que aqu se denominaran P 4.5a, P 4.5b y P 4.5c respectivamente. En su trabajo concluyen que el metodo FIDP tiene ventajas sobre el IDP, sobre todo en lo concerniente a la suavidad de los per les encontrados. Sus resultados se resumen en la tabla 4.17. Case P 4.5a P 4.5b P 4.5c Q 0.0 2.5 5.0 J 6.16 5.77 5.58
Tabla 4.17: Resultados presentados por Tholudur y Ramirez (1997) para el bioreactor de LeeRamirez. En esta tesis, para los tres casos se utilizo un per l de control inicial constante (u1 0 = u2 0 = 0:5). Dado que en el caso del bioreactor de Park y Ramirez no se notaron mayores incidencias en el uso de tolerancias de integracion mas estrictas y despues de observar el mismo comportamiento en la solucion de este problema aqu
112
solo se presentan los resultados obtenidos para una tolerancia de integracion 10;7 (relativa y absoluta). Estos resultados aparecen en las tablas 4.18, 4.20 y 4.22 para el metodo TNHp y 4.19, 4.21 y 4.23 para el metodo RTNHp.
NRO 1 2 3 4
15 30 60 120
Tabla 4.19: Resultados obtenidos con el RTNHp para el caso P 4.5a (r = 2 int toli=10;6, int tolf =10;8).
113
NRO 1 2 3 4
15 30 60 120
Tcpu 23 61 80 1152
Tabla 4.21: Resultados obtenidos con el RTNHp para el caso P 4.5b (r = 2 int toli=10;6, int tolf =10;8).
NRO 1 2 3 4
15 30 60 120
Tabla 4.23: Resultados obtenidos con el RTNHp para el caso P 4.5c (r = 2 int toli=10;6, int tolf =10;8). Notese que los resultados obtenidos son muy semejantes a los proporcionados en el trabajo de Tholudur y Ramirez (1997), y los tiempos de computacion son muy reducidos (en este sentido no es posible hacer una comparacion ya que estos autores no incluyen los tiempos de calculo en su trabajo). Como ejemplo, se han calculado soluciones dentro de un 0:001% del mejor valor obtenido usando FIDP, en menos de 1 minuto para el caso de P 4.5a y menos de 30 s para P 4.5b y P 4.5c usando RTNHp. Esto es especialmente destacable dado que el problema tiene dos variables de control.
114
Algunos ejemplos de per les de control para los tres casos se muestran en las guras 4.14.
P 4.5a (=120, J=6.1516) 1 0.8 0.6 0.6 0.4 0.4 0.2 0 0.2 0 4 5 6 7 Tiempo (h) P 4.5b (=120, J=5.75711) 1 2 3 8 9 10 0 0 1 2 3 4 5 6 7 Tiempo (h) 8 9 10 u1 1 0.8 u2
0.15 0.1 0.05 0 0 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0.01 0.03 0.02 1 2 3 4 5 6 Tiempo (h) 7 8 9 10 0.04 0.02 0 0 0.05 u1 0.04 u2
4 5 6 7 Tiempo (h)
9 10
0 0
4 5 6 Tiempo (h)
9 10
5 6 7 Tiempo (h)
10
Figura 4.14: Pol ticas de operacion optimas para los casos P 4.5a ( = 120, J = 6:1516), P 4.5b ( = 120, J = 5:75711) y P 4.5c ( = 120, J = 5:56789) respectivamente.
115
max J = y8(tf ) u( )
y1 = u4 (u1 + u2 + u4)y1 17:6y1y2 23y1y6u3 _ y2 = u1 (u1 + u2 + u4)y2 17:6y1y2 146y2y3 _ y3 = u2 (u1 + u2 + u4)y3 73y2y3 _ y4 = (u1 + u2 + u4)y4 + 35:2y1y2 51:3y4y5 _ y5 = (u1 + u2 + u4)y5 + 219y2y3 51:3y4y5 _ y6 = (u1 + u2 + u4)y6 + 102:6y4y5 23y1y6u3 _ y7 = (u1 + u2 + u4)y7 + 46y1y6u3 _ y8 = 5:8 (u1 + u2 + u4)y1 u4] 3:7u1 4:1u2 + (u1 + u2 + u4) _ (23y4 + 11y5 + 28y6 + 35y7) 5u2 0:099 3
; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ;
y con las condiciones iniciales: y(0) = 0:1883 0:2507 0:0467 0:0899 0:1804 0:1394 0:1046 0:0000 ]T y 0 t 0:2 (h). Los l mites en las variables de control: 0 0 0 0
20 6 4 20
116
Con el n de comparar los resultados con los obtenidos con otras metodolog as se considera la solucion de dos casos. El primero considera unicamente tres variables de control (P 4.6a) dejando el valor de u4 jado a 6.0, el segundo caso considera las cuatro variables de control (P 4.6b) tal como se indica en la formulacion del problema.
Este caso fue resuelto por Luus (1990) usando IDP. Los resultados obtenidos con el TNHp y con el RTNHp se presentan en las tablas 4.24 y 4.25 respectivamente.
10 20 40 60 120
Tabla 4.24: Resultados obtenidos en la optimizacion dinamica del problema del P 4.6a con el metodo TNHP.
NRO 1 2 3 4
10 20 40 80
Tcpu 3 8 30 43
Tabla 4.25: Resultados obtenidos con el RTNHp para el caso P 4.6a (r = 2 int toli=10;7, int tolf =10;8).
Este caso fue resuelto por Luus (1990) y Bojkov et al. (1993). Los resultados obtenidos en este trabajo con los metodos TNHp y RTNHp se presentan en las tablas 4.26 y 4.27 respectivamente. Los per les de control optimos obtenidos para cada uno de los casos se presentan en las guras 4.15 y 4.16.
117
Ni=Nf =ncg J Tcpu 11 44=50=264 21:7572 15 22 67=75=346 21:7824 47 44 116=117=705 21:7953 307 66 195=200=1224 21:8134 622 Tabla 4.26: Resultados obtenidos en la 4.6b con el metodo TNHP.
P
Ni=Nf =ncg J Tcpu 11 33=41=174 21:7154 10 22 72=81=450 21:7957 64 44 139=144=786 21:8157 259 66 190=194=1679 21:8167 600 optimizacion dinamica del problema del
J 21.4333 21.7629 21.8043 21.8071 Tcpu 6.7 38 100 119
NRO 1 2 3 4
10 20 40 80
Tabla 4.27: Resultados obtenidos con el RTNHp para el caso P 4.6b (r = 2 int toli=10;7, int tolf =10;8).
20 18 16 14 12 10 8 6 4 2 0 0 20 18 16 14 u1 12 10 u2 8 6 4 u3 0.04 0.08 0.12 Tiempo (h) 0.16 0.2 2 0 0 u1 u2 u3 u4
0.04
0.16
0.2
Figura 4.15: Pol ticas de operacion optima para el problema P 4.6a ( = 120, J = 20:0955).
Figura 4.16: Pol ticas de operacion optima para el problema P 4.6b ( = 66, J = 21:8167).
En la tabla 4.28 se incluyen los resultados obtenidos por los autores antes mencionados lo que permite comparar con los obtenidos en este trabajo.
118
4.6a
4.6b
/Aprox. 10/c 40/c 10/c 40/c 40/c 80=c 11/c 11/c 11/c 80/c
J Tcpu (s) 20.0895 1278 20:0953 20:0895 3:4 20:0932 38 20:0954 30 20:0955 43 21:757 N.D. 21:744 7:8 21:7572 15 21:8071 119
Tabla 4.28: Tabla resumen de resultados para la optimizacion dinamica del CSTR. Comparando los resultados obtenidos con los metodos TNHp y RTNHp con los presentados en la bibliograf a se concluye, de nuevo, que los metodos presentados en este trabajo son superiores, alcanzando soluciones similares o mejores, en tiempos de calculo inferiores. Notese, por ejemplo, que para alcanzar el valor J = 20:0954, el metodo RTNHp, ha sido del orden de 400 veces mas rapido que IDP.
4.7 Conclusiones
Como se ha demostrado a lo largo de este cap tulo, el uso de informacion de segundo orden exacta mejora las propiedades de convergencia de los metodos deterministas locales, lo que deriva en una reduccion del coste computacional. La comparacion con metodos que hacen uso de informacion calculada por diferencias nitas, con rma esta hipotesis. Si bien es verdad que los metodos quasi-Newton resultan en costes computacionales elevados, debido al calculo del Hessiano exacto, a pesar de realizar un numero muy reducido de simulaciones, tanto el metodo TNHp como el RTNHp han probado tener muy buenas cualidades para la resolucion de problemas de dimension elevada, compensando el aumento del numero de simulaciones con la reduccion del coste de cada una de ellas. El uso de estos metodos ha permitido la solucion robusta, y a la vez e ciente, de varios problemas de complejidad creciente. En particular, en la solucion de los problemas de optimizacion de bioreactores, han demostrado su capacidad para afrontar la presencia de arcos singulares, obteniendo per les de control muy suaves.
4.7. Conclusiones
119
La comparacion con los resultados obtenidos con otros metodos bien establecidos en la actualidad, tales como IDP, ha con rmado una vez mas el buen comportamiento de los metodos de segundo orden. Se observa que a metodos como IDP les cuesta mucho esfuerzo la resolucion de algunos de estos problemas, resultando en costes computacionales hasta dos ordenes de magnitud superiores a los obtenidos con RTNHp, para alcanzar valores objetivos muy semejantes y, en ocasiones, peores. Por otro lado, la sencillez de aplicacion de los metodos propuestos en este trabajo es otro factor a tener en cuenta.
120
El caracter no lineal de muchos procesos qu micos y bioqu micos implica que los problemas de control optimo asociados sean dif ciles de resolver. El uso del metodo CVP resulta, con frecuencia, en problemas de optimizacion no convexos. Por lo tanto, es preciso reemplazar el uso de metodos locales por otros que aumenten la probabilidad de encontrar el optimo global. Esto es especialmente importante en problemas multiobjetivo y/o en problemas multietapa. En este cap tulo se presenta un metodo h brido que aprovecha ciertas propiedades globales de un metodo estocastico combinandolo con un metodo local determinista para incrementar la e ciencia de la busqueda. Para ello se evaluan varios metodos tanto estocasticos como deterministas, lo que permite seleccionar los mas adecuados para el desarrollo del h brido. Las ventajas de este h brido se ilustran considerando varios problemas de una sola etapa, as como un problema multietapa formulado con una funcion de coste multiobjetivo. 121
122
5.1 Introduccion
Muchos de los metodos de optimizacion dinamica disponibles, y en especial los metodos deterministas locales, pueden converger a soluciones suboptimas o locales en presencia de varios optimos o regiones no convexas. Este parece ser el caso mas habitual en la optimizacion dinamica de procesos no lineales y/o con discontinuidades (Barton et al., 1998). Tal como y se comento en el cap tulo 2, existen multitud de metodos que permiten la solucion de problemas multimodales (no convexos) y se incluyen dentro de las estrategias de optimizacion global. Como se dijo entonces, la aplicacion de metodos deterministas globales requiere de un tiempo de computacion muy elevado y, en ocasiones, de una fase previa de preprocesado del problema. Solo recientemente se han aplicado estos metodos a la solucion de ciertas clases de problemas de optimizacion dinamica (Esposito y Floudas, 2000 a y b). En cambio, los metodos estocasticos permiten la resolucion aproximada de este tipo de problemas aunque no es posible garantizar su optimalidad global. Debido precisamente a su implementacion y manejo sencillos, este tipo de metodos ha despertado gran interes y se ha aplicado a la solucion de problemas de optimizacion dinamica con resultados muy positivos. Algunos ejemplos se presentan en los trabajos de Banga et al. (1991), Bojkov et al. (1993) y Ali et al. (1997), que hacen uso de metodos estocasticos secuenciales adaptativos, otros investigadores como Seywald et al. (1995), Yamashita y Shima (1997), Wang y Chiou (1997), Andres-Toro et al. (1997) y Roubos et al. (1999), hicieron uso de metodos basados en poblaciones. Por ultimo, Roubos et al. (1997), Simutis y Lubbert (1997) y Balsa-Canto et al. (1998), han presentado estudios comparativos de distintos metodos. No obstante, es preciso reconocer las limitaciones de los metodos estocasticos para alcanzar soluciones muy precisas, ya que la velocidad de convergencia decrece rapidamente a medida que se aproximan a la solucion. Un metodo determinista local, en cambio, presenta un comportamiento complementario, es decir, si el punto inicial esta proximo al global, la velocidad de convergencia es muy elevada (superlineal en el caso de un metodo tipo Newton). En el trabajo de Carrasco y Banga (1998) se hizo un primer intento de combinar un metodo estocastico y uno determinista (con el n de compensar sus defectos) formando un metodo h brido. Aqu se extienden y se mejoran los resultados presentados en ese trabajo.
123
124
5 4 3 2 1 0 -2 -1 0 1 v1 2 3 4 f2=v2 1 f1=(v1-2)
2
16 14 12 10 8 6 4 2 0 0
f1
8 10 12 14 16 f2
Figura 5.1: Ejemplo ilustrativo de la de nicion de puntos no dominantes o Pareto optimal. Metodo basado en preferencias: requiere decidir un orden de preferencia entre los distintos objetivos y expresarlo matematicamente. De esta manera el problema multiobjetivo se transforma en un problema de un solo objetivo que generalmente consiste en una suma ponderada de los objetivos individuales:
Jtot =
nobj X i=1
wi Ji
(5.1)
donde Ji puede ser la violacion de una restriccion siendo as semejante a un metodo de penalizacion de los considerados en el cap tulo 2. Metodo de generacion: tambien denominado epsilon-constraint, consiste en generar varias soluciones para identi car las no dominadas y la decision sobre la mas adecuada se toma a posteriori. Por ejemplo, para un problema con dos objetivos: min J = J1 J2] se tratar a de resolver el problema equivalente: min J1 sujeto a: para varios valores de ". (5.2) (5.3) (5.4)
J2 "
125
El metodo de generacion resulta muy practico en los casos en los que las preferencias no estan claras o son dif ciles de cuanti car. Sin embargo, su uso se ve limitado a problemas de dos o tres objetivos dado que el manejo de datos en mas dimensiones se hace impracticable. Por otra parte la generacion de todos estos puntos puede ser bastante costosa. Estas limitaciones del metodo de generacion han llevado a que tradicionalmente se use el metodo basado en preferencias (Gen y Cheng, 2000).
J z u w tf ]
sujeto a la dinamica del sistema (ODEs o DAEs): _ z = f (z u w t)
(5.5)
(5.6)
y posiblemente a restricciones algebraicas tanto para los estados como para las variables de control. Este problema, de tiempo nal libre (y en ocasiones de tiempo nal m nimo), se puede convertir en un problema equivalente de tiempo nal jo. Para ello se hace un cambio de variable t = T donde es la nueva variable temporal de nida en el intervalo de duracion ja (0 f ), y T es un factor de escala a calcular en el proceso de optimizacion, de manera que la duracion efectiva del proceso sera f T . El sistema dinamico resultante se formula como sigue:
0 1 zn+2f (z u w t) C _ @ z0 = B zn+1 A
0
(5.7)
(5.8)
126
v0
v*
Figura 5.2: Comportamiento t pico de un metodo determinista local, uno estocastico y un h brido en la resolucion de un problema unidimensional multimodal.
127
Existen dos cuestiones esenciales a la hora de desarrollar un metodo h brido, por una parte, elegir los metodos tanto estocastico como determinista apropiados (dise~o) y por otra, decidir los criterios de parada que determinan la cantidad de n trabajo que realiza cada metodo (ajuste). Con el n de seleccionar dos candidatos adecuados para el desarrollo del metodo h brido se han probado diversos metodos tanto estocasticos como deterministas, seleccionados segun los resultados presentados en la bibliograf a mas reciente, considerando la solucion de varios problemas de control optimo, no lineales y de complejidad media-alta, tomados de la bibliograf a.
128
numero de fallos es elevado. A medida que el metodo avanza el espacio de busqueda se va adaptando, es decir, se va reduciendo en torno a la zona donde probablemente estara la solucion. Sin embargo esta adaptacion debe ser lenta para evitar soluciones locales.
GENOCOP III (Michalewicz, 1996): algoritmo genetico que parte de una poblacion de referencia y una de busqueda y realiza una serie de operaciones (hasta 10 diferentes) entre sus miembros basadas en las originales de mutacion y recombinacion. El usuario debe seleccionar un conjunto de parametros (hasta 11), que incluyen, entre otros, los tama~os de las poblaciones, el numero de hin jos que se produciran en cada iteracion, tipo y frecuencia de aplicacion de cada operador etc. El metodo se ha modi cado convenientemente para permitir la resolucion de problemas de optimizacion dinamica (GENOCOP/DS). Di erential evolution (DE) (Storn y Price, 1997): algoritmo basado tambien en una poblacion que genera candidatos al optimo sumando la diferencia ponderada entre dos miembros de la poblacion, seleccionados aleatoriamente, a uno tercero. Si este nuevo punto mejora la funcion objetivo entonces sustituye a otro en la poblacion y se repite el proceso. El calculo del peso depende de un parametro a elegir por el usuario. La seleccion de puntos es aleatoria con una probabilidad que depende de otro parametro (probabilidad de recombinacion). Se dispone ademas de 10 estrategias diferentes para generar el nuevo punto aunque todas ellas basadas en los conceptos anteriores. Este metodo tambien se ha modi cado convenientemente para la solucion de problemas de optimizacion dinamica (DE/DS).
Con objeto de comparar estos metodos se presentara a continuacion la solucion de un conjunto de problemas de control optimo de una etapa tanto de tiempo nal libre como de tiempo nal m nimo. Todos ellos son multiobjetivo y se adoptara el metodo de las preferencias (seccion 5.2) para su resolucion. Es decir, el objetivo total (Jtot ) sera una suma ponderada de los objetivos individuales. Para la mayor a de los metodos se han utilizado los parametros de busqueda aconsejados por sus autores, salvo en el caso de GENOCOP, con el que se han realizado diversas pruebas, seleccionando la mejor en cada caso.
129
Este problema fue considerado por Luus (1990 a), Rosen y Luus (1992), Carrasco y Banga (1997) y Esposito y Floudas (2000 b) en su version de tiempo nal jo. La tecnolog a para la produccion de petroleo a partir de esquisto se basa en la pirolisis de la roca. El calentamiento de la roca rompe los enlaces de la macromolecula constituyente (querogeno), liberando peque~as moleculas de hidrocarburos, n ademas de nitrogeno, azufre y componentes oxigenados. El potencial valor economico del proceso depende de la cantidad de macromolecula presente en el esquisto. El problema de control optimo consiste en encontrar la pol tica optima de calentamiento y el tiempo de procesado para maximizar la concentracion de hidrocarburo (Bojkov y Luus, 1996). La formulacion matematica del problema de optimizacion es como sigue: Encontrar u(t) y tf para maximizar:
J = y2(tf )
sujeto a la dinamica del proceso:
donde y1 es la concentracion de macromolecula e y2 es la concentracion de hidrocarburo siendo el estado inicial: (5.12) Las constantes ki son los factores dependientes de la temperatura que in uyen en la velocidad de reaccion y que dependen de la temperatura segun la ecuacion de Arrhenius ki = ki0 e;Ei=RT , i = 1 :: 5, donde los valores de energ a de activacion Ei=R y los factores de frecuencia ki0 se tabulan a continuacion: i ki0(s;1) Ei=R(K ;1) 1 exp(8:86) 20300=1:9872 2 exp(24:25) 37400=1:9872 3 exp(23:67) 33800=1:9872 4 exp(18:75) 28200=1:9872 5 exp(20:70) 31000=1:9872 La temperatura esta sujeta a unos valores maximo y m nimo aceptables: 698:15 u 748:15 (5.13)
yT (0) = 1 0]
130
Notese que en este caso el problema tiene dos funciones objetivo, por una parte maximizar la concentracion de hidrocarburo a tiempo nal y, por otro, minimizar el tiempo de proceso para obtener tal concentracion. Aqu se resolvera este problema por el metodo de preferencias, para ello se de nira una nueva funcion objetivo, a maximizar, de la forma:
Jtot = !1 J !2tf (5.14) Los resultados obtenidos con los metodos estocasticos se presentan en la tabla 5.1 siguiendo la notacion habitual1 donde, ademas, se incluye, como medida para comparar los resultados, el valor del objetivo total Jtot .
;
u0(t) = 700, tf0 = 9:2, !1 = 1:0, !2 = 0:001, Jtot0 = 0:237218 Mt J tf (min) Jtot (max) Tcpu(s) ICRS/DS 0:353793 9:0001 0:344793 4:3 GENOCOP/DS 0:353648 9:0011 0:344647 146 DHC/DS 0:353778 9:0000 0:344778 5:8 DE/DS 0:353802 9:0000 0:344801 37:2
Tabla 5.1: Resultados obtenidos para la optimizacion dinamica del proceso de pirolisis con metodos estocasticos. A modo de ejemplo, y dado que son dos los objetivos de la optimizacion, se presenta la solucion de este problema por el metodo de generacion (o epsilon-constraint). Para ello se calculan una serie de puntos, que constituyen la llamada curva Pareto, a traves de la solucion del problema para un numero de tiempos nales jos. En la gura 5.3 se muestran los resultados que estan en concordancia con los obtenidos por el metodo de preferencias.
TC P U
131
tf
10
12
14
Figura 5.3: Curva Pareto para el proceso de pirolisis. 5:2: Sistema de reacciones de Denbigh
El proceso, tal como fue formulado por Luus y Dong (1995), consiste en 5 reacciones que tienen lugar en serie-paralelo en un reactor tipo discontinuo:
A+B A+B X X Y
; ! ; ! ; ! ; ! ; !
X P Y Q Z
Las especies qu micas A y B son los reactivos, Y es el producto deseado, X es un producto intermedio y P, Q, y Z son residuos. Las concentraciones de A, X e Y, se denotaran y1, y2 e y3, respectivamente. La aplicacion del principio de conservacion de la masa en el sistema de reacciones conduce al siguiente sistema de ODEs:
132
yT (0) = 1 0 0]
(5.18)
Las constantes ki se ajustan a la ecuacion de Arrhenius ki = ki0 e;Ei=RT , i = 1 :: 5, donde ki0 son los factores de frecuencia y Ei las energ as de activacion que aparecen en la tabla: i Ei =R(K ;1) ki0 (s;1) 1 3000 103 2 6000 107 3 3000 10 4 0 10;3 5 3100 1 El objetivo del problema de control optimo es calcular tanto el tiempo de proceso como el per l de temperatura para maximizar la concentracion de producto. Matematicamente, se trata de encontrar u(t) y tf para maximizar:
(5.19)
273 u 415 (5.20) Notese que el objetivo del problema se puede formular segun la ec. (5.14). Los resultados obtenidos para este caso se presentan en la tabla 5.2.
u0(t) = 344, tf0 = 500:0, !1 = 1:0, !2 = 1 10;4, Jtot0 = 0:160816 Mt J tf (s) Jtot (max) Tcpu(s) ICRS/DS 0:548862 466:7 0:544201 14 GENOCOP/DS 0:548847 468:3 0:544052 139 DHC/DS 0:548849 462:5 0:544224 27 DE/DS 0:548850 461:6 0:544234 38
Tabla 5.2: Resultados obtenidos para la optimizacion dinamica del proceso de Denbigh con metodos estocasticos. 5:3: Produccion de etanol en un fermentador semicontinuo
La optimizacion dinamica de este proceso, que tiene como nalidad la obtencion de etanol a partir de la fermentacion anaerobica de glucosa por la levadura Sacharomyces cerevisiae, fue considerada por Hong (1986), Chen y Hwang (1990 a y b), Luus (1993)
133
y Banga et al. (1997) en su version de tiempo nal jo y por Bojkov y Luus (1996) en la version de tiempo nal libre que se considerara en este trabajo. El objetivo es calcular el tiempo de proceso y el per l de entrada de nutrientes (caudal de alimentacion del bioreactor semicontinuo) con el n de maximizar la produccion de etanol. Encontrar u(t) y tf para maximizar:
J = y3(tf )y4(tf )
con las restricciones de la dinamica del proceso:
(5.21)
y1 = g1y1 _
y u y1 4
! !
g1 =
y2 0:22+y2
y g2 =
1 1+y3 =71:5
donde y1 representa la concentracion de microorganismos, y2 la concentracion de sustrato, y3 la concentracion de producto (todas ellas expresadas en g=L) e y4 el volumen (L) que, en este caso, esta limitado por el volumen del reactor ya que al tratarse de un proceso en semicontinuo no hay salida al exterior:
y4(tf ) 200 El estado inicial del sistema viene dado por: h iT y(t0) = 1 150 0 10
los l mites para la variable de control: 0 u 12
(5.26) (5.27)
(5.28)
Para considerar la restriccion a tiempo nal se utiliza la penalizacion por rechazo que se presentaban en la seccion 2.4 del cap tulo 2. Los resultados obtenidos para este caso se presentan en la tabla 5.3.
134
u0(t) = 3:0, tf0 = 61:1, w1 = 1:0, w2 = 1:0, Jtot0 = 13613 Mt J tf (h) Jtot (max) Tcpu(s) ICRS/DS 20564 61:04 20533 78 GENOCOP/DS 20198 52:91 20145 441 DHC/DS 20611 61:0 20550 48 DE/DS 20830 61:06 20768 339
Tabla 5.3: Resultados obtenidos para la optimizacion dinamica del proceso de obtencion de etanol con metodos estocasticos.
P
Este problema fue considerado por diversos autores en su version de tiempo nal jo, como Cuthrell y Biegler (1989), Luus (1993 b) y Banga et al. (1997). Aqu se considera el caso mas general con tiempo nal libre. Este problema es semejante al anterior, siendo el objetivo la maximizacion de la produccion de penicilina a partir de la fermentacion aerobica de la fuente de carbono (glucosa) mediante Penicillum chrysogenum. El sustrato contiene fuentes de nitrogeno, habitualmente licor de ma z macerado, que ademas contiene compuestos de carbono que seran su cientes para la primera fase del proceso. Si toda la glucosa fuera a~adida al medio al inicio de la fermentacion, el resultado ser a un crecimiento n masivo que conducir a a una alta viscosidad lo que afectar a negativamente a la transferencia de ox geno y la mezcla de la masa con el resultado de una produccion disminuida. El metodo de alimentacion discontinua controla el crecimiento y supera los problemas de la represion catabolica. El objetivo sera encontrar la pol tica optima de la velocidad de alimentacion y el tiempo de proceso para maximizar la produccion. Encontrar u(t) y tf para maximizar:
J = y2(tf )y4(tf )
Con las restricciones de la dinamica del sistema, que viene dada por:
(5.29)
y1 = h1 y1 _
y u 5001y 4
;
!
y u 5002y 4
y2 = h2 y1 0:01y2 _
;
(5.30) (5.31)
con
h1 = 0:11
y3 0:006y1 +y3
y h2 = 0:0055
y3 0:0001+y3 (1+10y3 )
y donde y1, y2 e y3 son la concentracion de biomasa, de penicilina y de sustrato (g=L) respectivamente e y4 es el volumen (L). Las condiciones iniciales son:
y(0) = 1:5 0 0 7
iT
(5.34)
Es evidente que un producto pensado para consumo humano debe ser producido en condiciones adecuadas para evitar efectos indeseables. Antes de su comercializacion tendra que someterse a rigurosas pruebas de toxicidad, por lo que las concentraciones de las sustancias presentes estaran sometidas a restricciones que garanticen el correcto desarrollo del proceso (Cuthrell y Biegler, 1989): 0 y1 40 (5.35) 0 y3 25 (5.36) 0 y4 10 (5.37) Y, por ultimo, los l mites en la variable de control: 0 u 50 (5.38) Para manejar las restricciones de camino se utiliza una vez mas el metodo de descartar los puntos no factibles. Los resultados obtenidos para este caso se presentan en la tabla 5.4.
u0(t) = 11:25, tf0 = 129:25, w1 = 1:0, w2 = 0:002, Jtot0 = 80:43 Mt J tf (h) Jtot (max) Tcpu(s) ICRS/DS 87:84 130:9 87:58 94 GENOCOP/DS 86:96 128:9 86:70 808 DHC/DS 87:02 129:25 86:75 3 DE/DS 87:88 132:3 87:62 119
Tabla 5.4: Resultados obtenidos para la optimizacion dinamica del proceso de obtencion de penicilina con metodos estocasticos.
136
P
Este problema fue considerado por (Dadebo y McAuley, 1995) y consiste en encontrar el per l de control para minimizar el tiempo nal de un proceso dado alcanzando un estado nal deseado. Su formulacion matematica es: Encontrar u(t) para minimizar: J = tf (5.39) con las restricciones que expresan la dinamica del sistema:
y1 = y2 _ y2 = 2y2 y1 + u _
; ;
y(0) = 10 1] y(tf ) = 0 0]
Los l mites para la variable de control son: ;1:0 u 1:0 (5.44) Este tipo de problemas se puede plantear como uno multiobjetivo (3 objetivos en este caso) donde se dara mayor peso a la veri cacion de las restricciones a tiempo nal. Donde, ahora, el objetivo a minimizar sera de la forma:
Jtot = w1tf + wi+1 violi (5.45) i=1 donde violi representa la violacion de cada una de las restricciones a tiempo nal. Los resultados obtenidos para este caso se presentan en la tabla 5.5 donde el termino violf indica la violacion de las restricciones a tiempo nal.
j j E
E X
u0(t) = 0:25, tf0 = 4:001 w1 = 0:55, w2 = w3 = 4:0, Jtot0 = 8:466 Mt J = tf violf Jtot (min) Tcpu(s) ;6 ICRS/DS 4:398 (3 8) 10 2:419 8:4 ;7 GENOCOP/DS 4:769 (2 0:2) 10 2:623 116 ;6 0:38 DHC/DS 4:349 3 10 3:912 1:5 DE/DS 4:397 (1 1) 10;6 2:418 18:0
;
Tabla 5.5: Resultados obtenidos para la optimizacion dinamica del sistema lineal con metodos estocasticos.
137
Se considera el proceso que tiene lugar en dos tanques agitados no lineales que operan en serie, tal como fue descrito por Bojkov y Luus (1994 a), y cuya dinamica es:
y1 _ y2 _ y3 _ y4 _
donde:
= ;3y1 + R1 = ;11:1558y2 + R1 ; 8:1558(y2 + 0:1592)u1 = 1:5(0:5y1 ; y3) + R2 = 0:75y2 ; 4:9385y4 + R2 ; 3:4385(y4 + 0:122)u2 10 1 ) exp y2 + 0:6932 ! ; 1010(0:4748 + y1) exp y + 015 :6932 ; 1:4280 2 ! ;10 7 (0:4236 ; y ) exp 10 2 y4 + 0:6560 ! ; 1010(0:5764 + y3) exp y + 015 :6560 ; 0:5086 4 107(0:5251 ; y
;
R1 = 1:5
;
1:5
(5.50)
R2 = 1:5
;
1:5
Los l mites para las variables de control: juj j 1 j=1 2 Y el estado inicial:
El problema, tal como lo formularon y resolvieron Bojkov y Luus (1994 a), consiste en llevar el sistema al origen partiendo del estado inicial (5.53) en tiempo m nimo. Encontrar u1(t) y u2(t) para minimizar:
J = tf (5.54) Notese que en este caso son 5 los objetivos del proceso de optimizacion. Los resultados obtenidos se presentan a continuacion en la tabla 5.6.
138
w1 = 0:3, w2 = 2:65, w3 = 1:0, w4 = 2:0, w5 = 1:25, Jtot0 = 0:64061 Mt J = tf violf Jtot (min) Tcpu(s) ;4 ICRS/DS 0:32096 (5 0:007 2 4) 10 0:09866 75 ;4 0:09946 GENOCOP/DS 0:32700 (5 0:00001 0:5 0:0007) 10 212 ;2 DHC/DS 0:32999 (0:0008 0:2 0:0002 1) 10 0:11356 1:4 DE/DS 0:32234 (1 2 3 1) 10;4 0:09796 76
Tabla 5.6: Resultados obtenidos para la optimizacion dinamica del problema del CSTR con metodos estocasticos. 5:7: Problema de desplazamiento de dos farmacos en un paciente
Este problema fue considerado inicialmente por Bell y Katusiime (1980) y a~os n despues por Maurer y Wiegand (1992), Bojkov y Luus (1994 a y b), y Dadebo y McAuley (1995). El problema se basa en el modelo cinetico que simula la interaccion de dos farmacos, warfarina y fenilbutazona, en la sangre de un paciente: 1 y1 = C D2 C2(0:02 y1) + 46:4y1(u 2y2)] _ 3 1 D2 C (u 2y ) + 46:4y (0:02 y )] y2 = C _ 1 2 2 1
; ;
(5.55)
con D = 1 + 0:2y1 + 0:2y2, C1 = D2 + 232 + 46:4y2, C2 = D2 + 232 + 46:4y1 y C3 = C1C2 ; (46:4)2y1y2. Las condiciones inicial y nal en los estados y el control son:
siendo y1 e y2 las concentraciones de warfarina y fenilbutazona, respectivamente. Cuando se inyecta el anticoagulante (warfarina) al paciente, solo una porcion circula a lo largo del cuerpo mientras que la otra se queda en el plasma y los tejidos.
139
Sin embargo, si a continuacion se inyecta un analgesico al mismo paciente, el anticoagulante de los tejidos se desplaza y empieza a circular por el cuerpo pudiendo alcanzar niveles toxicos ( ). Es, por lo tanto, necesario garantizar que eso no sucede, de manera que se impone una restriccion sobre su concentracion:
y1(t)
0 t tf ( > 0:02)
(5.59)
Ademas se sabe que cuanto mayor es la velocidad de inyeccion de fenilbutazona, u, mayor es el pico de concentracion de warfarina. El problema consistira pues en regular la entrada de fenilbutazona para que los dos farmacos alcancen un estado estacionario en el ujo sangu neo en un tiempo m nimo pero siempre veri cando la restriccion de toxicidad (5.59). Aqu se consideran dos versiones del mismo problema, la primera (P 5:7a) tal como fue planteada en el trabajo de Bojkov y Luus (1994 a), en la que no se impone ninguna restriccion a la concentracion de anticoagulante y la segunda (P 5:7b) tal como se formula en el trabajo de Dadebo y McAuley (1995), en la que se impone la restriccion (5.59).
2 3 2 9
Tabla 5.7: Resultados obtenidos para la optimizacion dinamica del problema del desplazamiento de dos farmacos con metodos estocasticos, caso P 5:7a.
4 5 1 7
violf 1 2 7 8
Tcpu(s) 16 141 5 26
Tabla 5.8: Resultados obtenidos para la optimizacion dinamica del problema del desplazamiento de dos farmacos con metodos estocasticos, caso P 5:7b.
140
141
2000
P 5.2 0 0 2000
-0.2 -0.3
J tot
Jtot
-0.4 -0.5 -0.6
-0.55
x10
P 5.3 2000
-1.3 -1.5
10000
-80 -82
P 5.4 5000
Evaluaciones 15000
25000
J tot
-1.7 -1.9
-2.1 -90 9 8 7
Jtot
J tot
2000
8000
x10
3.0
Jtot
1.0
Jtot
2.0
Figura 5.4: Curvas de convergencia de los metodos estocasticos en la resolucion de problemas P 5:1 a P 5:7b.
142
143
luego a esta de forma rapida mediante el metodo local. El ajuste del metodo h brido consiste en seleccionar adecuadamente los valores de los criterios de parada SC 1 y SC 2 para ambos metodos. Esto es especialmente interesante, como se vera, en el caso de problemas de optimizacion dinamica de dimension elevada. El valor asignado a SC 1, controla, de alguna manera, la robustez del metodo HyMDO, es decir, la probabilidad de convergencia a la solucion global. Por lo tanto, se seleccionara un valor tal que asegure que el metodo estocastico alcance un punto dentro del radio de convergencia del metodo determinista. El valor asignado a SC 2 sera crucial para la e ciencia del metodo, es decir, para minimizar el tiempo de computacion. El comportamiento t pico del metodo HyMDO con respecto a la funcion objetivo en el punto de corte, es decir, en el cambio del metodo estocastico al metodo determinista, se muestra en las guras 5.5, donde se asume un problema de minimizacion.
Tiempo de CPU total (HyMDO)
Tiempo de computacin
Determinista Local
Regin admisible
Figura 5.5: Comportamiento t pico del metodo h brido. De la gura se extrae que si el metodo estocastico itera demasiado (SC 1 muy estricto) el coste computacional aumenta considerablemente mientras que el tiempo de computacion para el metodo determinista disminuye. Por otra parte el valor objetivo nal mejora a medida que el punto de corte se acerca al optimo. Para garantizar la e ciencia y la robustez del metodo lo ideal sera encontrar los valores de SC 1 y SC 2 que permitan mantenerse dentro de la zona marcada como admisible, n es decir, la de un error nal su cientemente peque~o obtenido en el menor tiempo de calculo posible. Sin embargo, la seleccion de estos criterios es (muy probablemente) dependiente del problema y aunque para problemas de dimension peque~a se pueden extraer n
144
unos criterios generales que ofrecen buenos resultados, para problemas de dimension elevada sera necesario un ajuste espec co del metodo.
0.01
SC1 0.05
0.1
10
10 10
10
10 10 SC2
10
10 10
Figura 5.6: Ajuste del metodo h brido para la resolucion del problema de obtencion de penicilina. En la gura se observa el comportamiento que se predec a en la descripcion teorica del metodo. Aunque el metodo h brido alcanza soluciones dentro del 0:2% del optimo independientemente del valor de las tolerancias, s es notable su efecto en
145
el tiempo de computacion, lo que permite seleccionar unos valores en favor de otros. En este caso parece claro que la mejor solucion de compromiso robustez-e ciencia corresponde a los valores de tolerancia SC 1=5 10;2 y SC 2=1 10;5. Es dif cil establecer un criterio general de seleccion de las tolerancias. Sin embargo, los resultados obtenidos para el caso de la penicilina se reproducen en mayor o menor medida para el resto de los problemas, lo que lleva a concluir que estos valores de tolerancia pueden ser adecuados como valores recomendados por defecto para la resolucion de este tipo de problemas.
Mt DE/DS gOPT HyMDO IDP (Bojkov y Luus, 1996) DE/DS gOPT HyMDO IDP (Bojkov y Luus, 1996) DE/DS gOPT HyMDO IDP (Bojkov y Luus, 1996) DE/DS gOPT HyMDO IDP (Luus, 1993)
J 0.353802 0.352085 0.353808 0.353821 0.548850 0.543600 0.5491 0.5491 20830 20824 20839 20838 87.88 87.70 87.88 87.95
tf 9.0000 9.4603 9.137 9.2709 461.6 522 485 485 61.06 64.78 61.17 61.3 132.3 124.5 132.37 132.0
Tcpu 37.2 1.4 5.2 N.d. 38 3 46 N.d. 339 25 57.0 1045 119 46 24 N.d.
Tabla 5.9: Tabla resumen de resultados para problemas de una etapa y tiempo nal libre. En todos los casos el metodo h brido ha obtenido las mejores soluciones en tiempos muy competitivos. Esposito y Floudas (2000 b) consideraron la solucion del problema P 5:1, en su formulacion de tiempo nal jo, con un metodo determinista global ( BB basado
146
en el metodo de rami cacion y poda). Evidentemente los resultados no son totalmente comparables ya que consideran un valor de tiempo nal jo tf = 10. Estos autores alcanzar un valor objetivo de J = 0:35343, el optimo global para una discretizacion de control de 10 elementos de longitud ja. Sin embargo, notese que los tiempos de calculo presentados oscilan entre los 1209 y los 11988 s en una estacion HP J2240, para diversas condiciones impuestas al optimizador. Estos tiempos son muy superiores a los del metodo h brido, lo que con rma las limitaciones actuales de los metodos deterministas globales para la solucion e ciente de problemas de optimizacion dinamica.
5:5 5:6
5:7a 5:7b
Mt DE/DS gOPT HyMDO IDP DE/DS gOPT HyMDO IDP (Dadebo y McAuley, 1995) IDP (Bojkov y Luus, 1994b) DE/DS gOPT HyMDO IDP (Bojkov y Luus, 199) DE/DS gOPT HyMDO IDP (Dadebo y McAuley, 1995)
J = tf violf 4.397 (1 1) 10;6 4.397 (1 0:3) 10;6 4.397 (0:7 1) 10;7 4.41 (1 1) 10;7 0.32234 (1 2 3 1) 10;4 0.32349 (0:5 1 0:8 0:1) 10;4 0.32280 (0:9 0:7 1 1) 10;4 0.32143 < 1 10;3 0.32715 < 1 10;4 221.463 (0:09 5) 10;7 226.093 (1 0:1) 10;6 221.434 < 4 10;7 221.956 < 3 10;3 265.522 (0:07 8) 10;4 263.826 (0:1 1) 10;5 261.767 < 8:5 10;6 263.619 < 1 10;4
Tcpu 18 0.56 0.29 N.d. 76 126:3 10 1097 3135 15 0.4 1 43 26 14.5 46 N.d.
Tabla 5.10: Tabla resumen de resultados problemas de una etapa de tiempo nal m nimo. Los per les de control obtenidos con el metodo h brido para estos problemas as como los correspondientes estados se presentan en las guras 5.7-5.8.
147
738 728 718 708 698 0.0 2.0 4.0 6.0 Tiempo (min) 8.0 10.0
0.0 0.0
2.0
8.0
10.0
P 5.2 (J=0.5491, tf=485 s) 410 390 370 350 330 310 290 270 0 100 200 300 Tiempo (s) 400 500
Control, u
1.0
Estados
0.8 0.6 0.4 0.2 0.0 0 100 200 300 Tiempo (s) 400
y1 y2 y3
500
12.0 10.0
Control, u
200 160
Estados
8.0 6.0 4.0 2.0 0.0 0.0 10.0 20.0 30.0 40.0 50.0 60.0 Tiempo (h)
120 80 40 0 0.0
y1 y2 y3 y4
P 5.4 (J=87.88, tf=132.37 h) 40.0 35.0 30.0 25.0 20.0 15.0 10.0 5.0 0.0 0.0 20.0 40.0 60.0 80.0 100.0120.0 Tiempo (h)
40.0 35.0 30.0 25.0 y1 20.0 y2 y3 15.0 y4 10.0 5.0 0.0 0.0 20.0 40.0 60.0 80.0 100.0120.0 Tiempo (h)
Control, u
Figura 5.7: Per les de control optimo y estados correspondientes para los problemas de tiempo nal libre (P 5:1-P 5:4).
Estados
148
P 5.5 (J=tf=4.397)
12 10 8 6 4 2 0 0 -2 -4 -6
y1 y2
Estados
Tiempo
1.5 1.0
Controles
0.25 0.2
Estados
0.5 0.0 -0.5 -1.0 -1.5 Tiempo P 5.7a (J=tf=221.431) 8.0 7.0 6.0 5.0 4.0 3.0 2.0 1.0 0.0
y1 y2 y3 y4
0.03 y1 0.02
Control, u
0.01 0
50
100 Tiempo
150
200
P 5.7b (J=tf=261.767) 9.0 0.028 8.0 0.026 7.0 6.0 0.024 5.0 y1 4.0 0.022 3.0 2.0 0.02 1.0 0.0 0.018 0.0 50.0 100.0 150.0 200.0 250.0 0 Tiempo
4 3 2 y2 1 0
Control, u
50
200
250
Figura 5.8: Per les de control optimo y estados correspondientes para los problemas de tiempo nal m nimo (P 5:5-P 5:7b).
149
Res1
Res2
ResN-1
ResN
Figura 5.9: Esquema de operacion de un proceso multietapa. La formulacion matematica del problema de optimizacion dinamica de un proceso multietapa es (Vassiliadis et al., 1994 a): _ Encontrar z(t), z(t), u(t), w, tk para k = 1 2 : : : N a n de minimizar: _ J (z(tf ) z(tf ) u(tf ) w tf ) (5.60) donde J es la funcion objetivo que en general supone una combinacion de objetivos a cumplir en cada etapa. Las restricciones originadas por la dinamica del sistema: _ fk (z z u w t) = 0 (5.61)
150
donde t 2 tk;1 tk ] k = 1 : : : N ; 1 y t 2 tN ;1 tf ] z(t) 2 Z R n son las variables diferenciales y algebraicas u(t) 2 U R son las variables de control y w 2 V R son los parametros invariantes con el tiempo. Notese que esta formulacion tambien es valida para procesos distribuidos. En este trabajo se supone que el sistema de DAEs es de orden 1 y que el numero de ecuaciones se conserva a lo largo de las etapas. Los valores de las variables al inicio de la primera etapa deben estar relacionados mediante un conjunto de condiciones iniciales: (5.62) Asimismo, los valores inicial y nal de etapas sucesivas estaran relacionados a traves de las llamadas condiciones de union: _ Jk (z(tk ) z(tk ) u(tk ) z(t;) z(t; ) u(t;) w tk) k _ k k (5.63) Tambien es posible la presencia de restricciones puntuales en las variables de estado. Aqu se asume que estas restricciones suceden al nal de una etapa, a~adiendo n etapas si fuese preciso para exibilizar esta condicion: _ C0 (z(t0) z(t0) u(t0 ) w t0) = 0
req (z(t;) z(t;) u(t;) w tk ) = 0 k k _ k k eq (z(t ) z(t ) u(t ) w t ) = 0 rN f _ f f f in (z(t; ) z(t; ) u(t; ) w t ) 0 rk k _ k k k _ rin(z(tf ) z(tf ) u(tf ) w tf ) 0 N
Ademas tambien es posible la presencia de restricciones de camino: _ ceq (z(t) z(t) u(t) w t) = 0 k _ cin(z(t) z(t) u(t) w t) 0 k
Las variables de control pueden verse sometidas a rangos de validez que pueden o no variar en las distintas etapas: (5.70) y los parametros invariantes con el tiempo tambien pueden estar sujetos a restricciones del tipo: wL (w) wU (5.71) Por ultimo, se impone una duracion m nima y/o maxima a cada etapa.
151
Caldera
Calentador
Los componentes basicos de una columna de destilacion que opera en discontinuo son: un recipiente vertical en el que se realiza la separacion, con platos para facilitar la separacion de componentes, un calentador para calentar la mezcla produciendose as la evaporacion de los componentes mas volatiles, un condensador para enfriar y condensar el vapor que sale por la parte superior de la columna y un tanque de acumulacion donde se reserva el vapor condensado para despues introducirlo de nuevo en la columna. El esquema general de una columna de estas caracter sticas se presenta en la gura 5.10.
152
Tanto la teor a como la practica de los procesos de destilacion pueden ser muy complicadas y por ello el desarrollo de modelos, su simulacion y optimizacion han despertado un gran interes entre la comunidad cient ca e industrial. En relacion al desarrollo de modelos y su simulacion, lo interesante es obtener modelos que predigan de manera precisa la operacion de la columna. Sin embargo, tales modelos son, habitualmente, demasiado complicados y el coste computacional de resolucion crece muy rapidamente. En destilacion discont nua los distintos componentes de la mezcla pueden desaparecer de la columna. Por lo tanto, el modelo sera dinamico e incluira los balances de masa y energ a, el equilibrio de fases y la hidraulica de platos. Una formulacion general se puede encontrar en Mujtaba (1989). El sistema de DAEs resultante es muy no lineal y con frecuencia r gido, debido tanto a las diferencias entre las distintas volatilidades de los componentes de la mezcla como a las diferencias entre los volumenes de la caldera y los platos (Mujtaba, 1989). Por otra parte, en el caso de varios cortes (cuts) intermedios, el proceso se convierte en multietapa y sera necesario imponer condiciones de union adecuadas. El caso que se considera en este trabajo consiste en la separacion de una mezcla de 10 componentes mediante el uso de una columna de 20 platos (Vassiliadis et al., 1994 a). La formulacion matematica de este problema consta de 444 ecuaciones de las cuales 232 son diferenciales y las 212 restantes son algebraicas. Se consideraran 18 variables de decision, es decir, el valor de control (relacion de re ujo) en cada uno de los nueve elementos (3 etapas con 3 elementos de control cada una), mas la duracion de cada uno de los elementos. Inicialmente se carga una cantidad de 10 kmol de mezcla en la caldera. La columna se opera en tres etapas: en la primera se obtendra un corte rico en el componente 1, en la segunda un o cut y en la tercera un corte rico en el componente 6. Se requiere que tanto el corte pesado como el ligero tengan una cantidad de al menos el 90% de su componente principal. Ademas, deben obtenerse, al menos, 2 kmol de corte ligero y 1.4 kmol de corte pesado en cada lote. El objetivo sera encontrar la relacion de re ujo para minimizar el tiempo de proceso veri cando todas las restricciones impuestas al nal de cada etapa. El comportamiento de la columna se modeliza suponiendo volumenes molares jos y volatilidades relativas constantes para los distintos componentes. Las condiciones de union se imponen para anular la acumulacion al nal de la primera y segunda etapas, mientras que se fuerza la continuidad de la composicion tanto de la caldera como de la columna.
153
Este caso fue considerado en el trabajo de Vassiliadis et al. (1994 a) que obtuvo un tiempo nal m nimo de 15 h usando DAEOPT (metodo basado en CVP que hace uso de un metodo SQP, desarrollado por Vassiliadis, 1992), con un tiempo de computacion de unas 12 h en una estacion de trabajo Silicon Graphics IRIS. Aqu se hara un estudio detallado de la solucion de este problema mediante el uso del metodo HyMDO. En la tabla 5.11 se resumen los resultados obtenidos para tres per les de control iniciales, donde V iol0 es el valor de la violacion de las restricciones correspondiente al valor inicial de control, y el Tcpu corresponde a una estacion de trabajo SUN Sparc 10 (de 23 MFlops segun el Linpack 100):
V iol0 Mt tf V iolf Tcpu(h) 2:449 DAEOPT 15:0 < 7:0 10;5 9:3 HyMDO 14:581 < 2:0 10;4 6:9 U02 18:0 0:8138 DAEOPT 14:501 < 4:0 10;4 16:1 HyMDO 14:557 < 2:0 10;4 4:4 U03 19:8 0:4 DAEOPT 14:840 < 1:3 10;4 10:5 HyMDO 14:498 < 6:0 10;4 4:0 Tabla 5.11: Resumen de resultados para el problema de la columna de destilacion.
U0 J0 U01 9:0
154
0.01
0.1
10
-3
5x10 10 10
-3
-2
-3
5x10 10 SC2
-3
-2
10
-3
5x10 10
-3
-2
Figura 5.11: Comportamiento t pico del metodo HyMDO: Valor objetivo frente a las tolerancias SC 1 y SC 2. esa gura no se pueden extraer conclusiones ya que la escala no permite cuanti car las diferencias en los tiempos de computacion. Con el n de destacar el efecto de SC 2, se presentan en la tabla 5.12 los resultados obtenidos para un conjunto de 1 valores, incluyendo Tcpu que es el tiempo de computacion requerido por el metodo estocastico para alcanzar el valor de corte y Tcpu que es el tiempo de computacion total, ambos en horas, para distintos puntos iniciales.
1 SC 2 Tcpu(h) tf Tcpu(h) 0:001 1:9 14:581 6:9 U01 0:005 1:9 14:804 6:4 0:01 1:9 14:968 6:1 0:001 0:9 14:557 4:5 U02 0:005 0:9 14:529 4:2 0:01 0:9 14:663 4:0 0:001 0:8 14:498 4:08 U03 0:005 0:8 14:498 4:07 0:01 0:8 14:498 4:04 Tabla 5.12: Estudio del efecto de SC 2 y el punto inicial en la convergencia del metodo HyMDO.
Es importante resaltar que todas las soluciones obtenidas estan muy proximas al optimo y la reduccion en tiempo de computacion es muy importante (4 veces mas rapido que el resultado presentado por Vassiliadis (1994 a), cuyo objetivo sue peor
5.5. Conclusiones
155
que el obtenido en este trabajo). En la gura 5.12 se muestra el per l de control (relacion de re ujo en cada etapa) para el caso con tiempo nal m nimo de 14:498 y una violacion nal en las restricciones de 6:0 10;4 y las correspondientes fracciones molares de los componentes 1 y 6, de interes en el proceso.
1.0 1.0
0.6 1 etapa 0.4 0.2 0.0 0.0 2.0 4.0 6.0 8.0 10.0 12.0 14.0 Tiempo 2 etapa 3 etapa
Fraccin molar
0.8
Control, u
0.8 0.6 0.4 0.2 0.0 0.0 2.0 4.0 6.0 8.0 10.0 12.0 14.0 Tiempo Componente 1 Componente 6 1 etapa 2 etapa 3 etapa
Figura 5.12: Per l de control y fraccion molar de los componentes principales (1 y 6) correspondientes, para el problema de destilacion.
5.5 Conclusiones
En este cap tulo se ha considerado la resolucion de un tipo de problemas de optimizacion dinamica particularmente complicados debido a que sus NLPs asociados son habitualmente multimodales o no convexos. Para resolverlos de forma robusta y e ciente se ha propuesto el uso de un metodo h brido estocastico-determinista que combina las virtudes de ambos tipos de metodos e intenta compensar sus defectos. Con la solucion de un conjunto de problemas de una y varias etapas se han demostrado las capacidades de esta nueva metodolog a. En relacion a los problemas de una etapa, es especialmente relevante el hecho de que el metodo h brido ha alcanzado, en todos los casos, soluciones semejantes o mejores que las obtenidas con otros metodos, o las presentadas por otros autores, y ademas en tiempos de calculo considerablemente inferiores. Notese por ejemplo, que en el problema P 5:3 se han obtenido reducciones de hasta 18 veces si se compara con IDP y de entre 7 y 5 veces en la resolucion de los casos P 5:1 y P 5:4 respectivamente, si se compara con DE/DS, alcanzando en todos estos casos soluciones superiores.
156
Estas diferencias se hacen mas notables en la resolucion de los problemas de tiempo nal m nimo, donde el metodo HyMDO es muy superior. As , en todos los casos ha mejorado el valor objetivo, bien en valor de tf bien en la violacion nal de las restricciones. Las diferencias en tiempos de calculo para la resolucion de estos problemas, fueron, ademas, considerables: entre 40 y 300 veces mas rapido que IDP y entre 8 y 60 veces mas rapido que DE/DS. Asimismo se ha considerado la resolucion de un problema de optimizacion dinamica de un proceso multietapa relacionado con destilacion discontinua. Para este problema los tiempos de computacion para metodos estocasticos puros son prohibitivos, ya que el modelo dinamico del proceso tiene una dimension elevada. El uso del metodo h brido no solo ha proporcionado nuevas soluciones superiores a las publicadas, sino que lo ha hecho de manera e ciente, reduciendo en hasta 4 veces el tiempo de calculo requerido por DAEOPT (Vassiliadis, 1994 a).
157
Muchos procesos en tecnolog a de alimentos, ingenier a qu mica o biotecnolog a son de tipo distribuido. Las variables del proceso no solo dependen del tiempo sino que dependen ademas de la posicion. Algunos ejemplos son los procesos de polimerizacion, cristalizacion, tratamiento termico de alimentos, etc. En este cap tulo se presenta la aplicacion del metodo TNHp para la resolucion de problemas de optimizacion dinamica de procesos de este tipo. Para ello, se plantea el uso del metodo numerico de las l neas (NMOL) para transformar el problema formulado en PDEs en un problema formulado en ODEs o DAEs. De la aplicacion del metodo NMOL resulta un sistema de DAEs de dimension elevada e inusualmente r gido. De este hecho surge la motivacion de buscar tecnicas que permitan aumentar la e ciencia de la resolucion del IVP. Dentro del marco del metodo TNHp se hace un estudio teorico de la estructura del Jacobiano del IVP y la del correspondiente al IVP extendido. Como se vera el Jacobiano nal es muy disperso, por lo que la utilizacion de un integrador adecuado permitira reducir el coste de cada simulacion y por lo tanto, el de la optimizacion. Por ultimo se considerara la solucion de varios problemas de complejidad creciente lo que permitira valorar las ventajas y desventajas de esta nueva metodolog a. 159
160
6.1 Introduccion
En los procesos considerados hasta el momento las variables de estado depend an unicamente del tiempo. Sin embargo, todas las unidades que intervienen en un proceso estan distribuidas en el espacio. Por ejemplo, en columnas de destilacion, intercambiadores de calor, reactores, etc. En muchas ocasiones la aproximacion de modelos concentrados (DAEs) es su ciente para la aplicacion de interes ya que las variaciones de las variables de estado con respecto a la posicion no son relevantes. Sin embargo, en muchos otros procesos de gran interes industrial esto no es as . As por ejemplo, muchos procesos relacionados con la transferencia de calor a ciertos materiales (procesamiento termico de alimentos, fundicion de metales, fabricacion de nuevos materiales, etc.), procesos de difusion (tales como reacciones en reactores de ujo en piston o procesos de difusion a traves de membranas en bioqu mica) y otros relacionados con la dinamica de uidos (procesamiento termico de l quidos, etc.), las variables de estado del proceso dependen de la posicion ademas del tiempo. Tales procesos se describen de manera natural por medio de ecuaciones en derivadas parciales, diferenciales ordinarias y algebraicas (PDAEs), que expresan las leyes f sicas de conservacion de la energ a, la masa y el momento. Considerando los procesos que guardan relacion con la tecnolog a de alimentos, en los ultimos a~os se han hecho numerosos avances en lo que a la preservacion n de alimentos y al desarrollo de nuevos productos se re ere. Desde el momento en que se adquiere el alimento hasta su consumo, este experimenta una degradacion en sus propiedades organolepticas. Las tecnicas de preservacion intentan reducir esta degradacion actuando sobre los microorganismos que la producen, modi cando para ello las condiciones de humedad y temperatura del alimento, que de otro modo podr an favorecer la accion de estos microorganismos. El intento de encontrar las condiciones que optimicen el proceso en algun sentido (reduccion de tiempo de procesado, maximizacion del contenido de nutrientes, reduccion del consumo de energ a etc.), lleva a la formulacion de modelos rigurosos en los que se tendra en cuenta tanto la trasferencia de energ a como de masa y a la resolucion de problemas de optimizacion dinamica. Este tipo de problemas ha desn pertado un gran interes en los ultimos a~os debido a su importancia en la industria de alimentos. Prueba de ello son los numerosos trabajos publicados en el area como Banga et al. (1994), Alvarez-Vazquez y Mart nez (1999) y Kleis y Sachs (2000) as como otros trabajos que plantean estrategias de solucion y aplicaciones tomadas de distintos ambitos caso de Lurie (1993), Neittaanmaki y Tiba (1994), Petzold et al.
6.1. Introduccion
161
(1996), Blatt y Schittkowski (1997) o Biros y Gattas (2000), entre otros muchos. Aqu se presenta el uso del metodo TNHp para la resolucion de problemas de optimizacion dinamica de procesos distribuidos. Para ello se repasan en primer lugar los aspectos mas relevantes de los fenomenos de interes en este trabajo, es decir, la transferencia de energ a y masa, que se consideraran en el desarrollo de los modelos, para pasar a continuacion al estudio de una tecnica adecuada para su simulacion.
2 velocidad de 3 2 velocidad de 3 2 velocidad de 3 6 entrada de 7 6salida de energ a7 7 6 7 6 6 acumulacion de 7 6 7 = 6 energ a cinetica 7 - 6 cinetica e 7 7 6 7 6 4 energ a cinetica 5 6 6 5 4 e interna por 7 5 4 interna por 7 e interna 2 6 + 6 4 2 velocidad neta 3 3 velocidad neta 6 de trabajo 7 de adicion de 7 - 6 comunicado por 7 6 7 7 6 7 5 6 calor por 4 el sistema a los 7 5
alrededores 1 v(U + 2 v2)) ( q) + (v g) ( pv) ( v)
; r ; r ; r
conveccion
conveccion
(6.1)
(6.2) Operando sobre esta expresion se obtiene una ecuacion de variacion para la energ a interna U :
@ (U + 1 v2) = ( @t 2
; r
162
; r
q)
p(
v)
( : rv )
"
(6.3)
"
"
contribucion contribucion reversible al irreversible al aumento de aumento de energ a energ a interna interna debido a la por debido a la disipacion viscosa compresion
Si se considera un solido, la velocidad de conduccion por unidad de seccion transversal, es decir, el ujo de calor, es proporcional al gradiente de temperaturas (ecuacion de Fourier):
q = kA T
; r
(6.4)
donde q es el ujo, A es la super cie normal al ujo, k es la conductividad termica y rT es el gradiente de temperatura. La conductividad termica es una propiedad f sica de cada sustancia, y puede variar ligeramente en funcion de la temperatura. En el caso de que el material considerado no sea homogeneo o isotropo, sera preciso determinar la conductividad para la direccion del ujo considerado. Teniendo en cuenta la ec. (6.4) y expresando (6.3) en funcion de la temperatura resulta:
cTt = (k T )
r r
(6.5)
Si se considera el caso general en que existen fuentes de calor en el solido (p. ej. generacion debida a reacciones qu micas, o a campos electricos, etc.), hay que a~adir un termino en el segundo miembro del balance, resultando: n
cTt = (k T ) + q_
r r
(6.6)
Los pasos intermedios para llegar a esta expresion se desarrollan en detalle en Bird et al. (1964). El calor que se conduce a traves del solido es a menudo introducido (o eliminado) mediante un proceso de conveccion: por ejemplo, la perdida de calor a traves de las paredes de un horno, o el calentamiento de un solido debido a la presencia de aire caliente. Estos son los llamados procesos de conduccion-conveccion que como se vera tienen especial relevancia en el procesamiento termico de alimentos. El fenomeno
6.1. Introduccion
163
de conveccion vendra impuesto en las condiciones frontera, y teniendo en cuenta que en este tipo de fenomeno el ujo de calor es proporcional a la diferencia de temperaturas (ecuacion de Newton de enfriamiento), resulta:
@T = h (T (6.7) @ n k ext T ) donde n es la direccion normal a la super cie, h es el coe ciente de transferencia de calor que es una medida de la resistencia que ofrece el solido al ujo de calor y Text es la temperatura exterior. La conveccion podra ser de dos tipos: natural, en la que el solido esta expuesto a la temperatura de un uido (por ejemplo, aire) cuyo movimiento es inducido por cambios de densidad asociados con diferencias de temperatura o forzada, en la que el uido que rodea al solido es obligado a moverse por medios mecanicos. Por ultimo para poder resolver el sistema sera necesario establecer una condicion inicial de temperatura en el solido, que podra ser bien una constante o bien una funcion del espacio.
;
J= D c
; r
(6.8)
donde D es el coe ciente de difusion y es caracter stico tanto del soluto como del medio en el que se disuelve, y c es la concentracion. En la difusion, los desplazamientos o transferencias moleculares se hacen a expensas de los movimientos intr nsecos propios de esas part culas desde las zonas de mayor concentracion a las zonas de menor concentracion. De esta forma, la difusion es un mecanismo de transferencia de materia en la que no intervienen los movimientos moleculares masivos, tales como el ujo de un gas. Haciendo el balance de materia correspondiente a la entidad que difunde se obtiene:
164
componente A
3 2 7 7 - 6 6 7 6 5 4
3 7 7 7 7 7 = 0 7 7 7 5
(6.9)
cAt = v cA + D 2cA + rA (6.10) donde v es la velocidad de difusion, y rA es un termino de produccion debido a posibles reacciones qu micas. Todos los calculos desarrollados se detallan en el libro de Bird et al. (1964) o en el de Welty et al. (1996). Esta expresion se utiliza, generalmente, para la difusion en soluciones l quidas diluidas a temperatura y presion constantes. Para difusion en solidos o uidos estacionarios v = 0, y la ecuacion resultante es similar a la de transferencia de calor (6.6). La difusion puede producirse tanto entre sustancias colocadas en ntimo contacto como tambien cuando entre ellas se interpongan membranas semipermeables o super cies porosas. La condicion inicial en los procesos de transferencia de materia viene dada en funcion de la concentracion de la especie en difusion que podra ser un valor constante o una funcion espacial. En cuanto a las condiciones frontera t picas, son similares a las que se presentaron para el caso de conduccion de calor: de primer orden, jando la concentracion en la frontera, o bien de segundo orden expresando el ujo de masa desde el exterior. En este ultimo caso el ujo puede ser nulo cuando la super cie es impermeable o adquirir un cierto valor cuando es semipermeable o porosa.
165
Figura 6.1: Esquema de resolucion del problema de optimizacion dinamica mediante metodos CVP. En el cap tulo 1, se comentaba que en la mayor a de los casos es imposible encontrar una solucion anal tica a un sistema descrito por PDEs, lo que lleva al uso de metodos numericos. En esta tesis se utilizaran tres de estas metodolog as lo que permite comparar y establecer cual es la mas adecuada para la solucion de un problema dado. En particular, en este cap tulo, se considera el uso del metodo numerico de las l neas, que sera de gran utilidad en la resolucion de problemas de nidos en dominios de geometr a sencilla. El metodo numerico de las l neas (NMOL) (Schiesser, 1991) es una tecnica para la resolucion de PDEs de tipo parabolico o hiperbolico a traves de su transformacion en un conjunto de ODEs o DAEs que puede ser resuelto con un integrador estandar. Se basa en la discretizacion del dominio espacial utilizando distintas metodolog as que emplean mallas uniformes, no uniformes o adaptativas (Li, 1998 y Li y Petzold, 1999). Aqu se considera el caso mas sencillo de malla uniforme en el espacio. El valor de la variable dependiente en un punto de la malla se calcula a partir de los valores en los puntos adyacentes, siendo el numero de puntos utilizados el que determina el tipo u orden del metodo. Lo habitual es utilizar 3 o 5 puntos, es decir, metodos de segundo o cuarto orden respectivamente, dependiendo del tipo de problema a resolver. A continuacion se presentan las formulas de ambos metodos. A n de ilustrar el proceso de obtencion de estas formulas, a continuacion se detallan los pasos seguidos para la obtencion de la formula de orden 2 (mas detalles en los libros de Schiesser 1991 y 1994). Supongase un problema unidimensional (los resultados son facilmente extrapolables a casos 2D o 3D) x = x( ). Se considerara que una buena aproximacion de
166
x( ) = a0 + a1 (
siendo:
i ) + a2 (
i)
2+a
3(
i)
3+
(6.11)
Si se utiliza una malla de elementos equidistantes, tal como se muestra en la gura 6.2:
L
1 n an = n! @ @x(n i )
(6.12)
-4
-3
-2
Figura 6.2: Esquema de aplicacion del metodo NMOL para un problema unidimensional. utilizando la expresion (6.11) para calcular el valor del campo en dos puntos no consecutivos de la malla se obtiene: 1 2x (6.13) x( i;1) = x( i) + @x( i ) ( i;1 ; i) + 2! @ @ (2 i ) ( i;1 ; i)2 + @ 1 2x x( i+1) = x( i) + @x( i ) ( i+1 ; i) + 2! @ @ (2 i) ( i+1 ; i)2 + (6.14) @ y restando las dos expresiones anteriores resulta: con 4 = i+1 ; i. De esta manera es posible calcular directamente el valor de la derivada espacial en funcion de los valores del campo en dos puntos no consecutivos de la malla. Sin embargo, esta expresion es valida unicamente para i = 2 : : : ; 1. Para el primer y
@x( i ) = x( @
i+1 ) ; x( i;1 )
24
+ O(4 2)
(6.15)
167
ultimo puntos de la malla habra que calcular otras expresiones, y as para aproximar el valor de la derivada espacial en el punto 1 se utilizaran los valores del campo en los puntos 2 y 3: 1 2x x( 2) = x( 1 ) + @x@( 1 ) + 2! @ @ (2 2 ) ( )2 + 1 2x x( 3) = x( 2 ) + @x@( 1 ) 2 + 2! @ @ (2 2 ) (2 )2 +
4 4 4 4
(6.16) (6.17)
y restando:
@x( 1 ) = 3x( 1 ) + 4x( 2) x( 3) + ( 2) (6.18) @ 2 De igual manera calculando las aproximaciones para ;2 y ;1 y restando, se obtiene la siguiente expresion:
; ; 4 O 4
@x( ) = 3x( ) 4x( ;1) + x( ;2 ) + ( 2) (6.19) @ 2 Ahora se dispone de una aproximacion de la primera derivada espacial para cada punto de la malla. De igual manera se proceder a para la obtencion de las formulas de 4 orden. Escritas de forma compacta resultan:
; 4 O 4
4 0 ;4 72 36 0 ;36 72
;
1> = 1 >x ~ 3
(6.20)
32 ;6 ;12 2 16 ;2 20 6 ;96 50
(6.21)
Una aplicacion recursiva de estas formulas permite el calculo de las derivadas espaciales de segundo orden y la sustitucion directa en la PDE original lleva a un conjunto de ODEs, una por cada nodo de la malla. El numero de ODEs resultante depende por tanto del nivel de discretizacion espacial ( ) elegido, aumentando de manera notable a medida que aumenta la no
168
linealidad y la dimension espacial del problema. Por otra parte, la rigidez del sistema de ODEs aumenta a medida que aumenta el nivel de discretizacion ya que los autovalores del Jacobiano son inversamente proporcionales a 4 2 (Schiesser, 1991) lo que permite seleccionar un metodo adecuado para su resolucion. A este respecto, Mageroy (1997) hace una comparacion de varios metodos de integracion para la resolucion de sistemas de ODEs resultado de aplicar el metodo NMOL. En particular, compara un metodo Runge-Kutta expl cito modi cado para ampliar la region de estabilidad, un metodo BDF y un metodo de Rosenbrock que no es mas que una modi cacion de un metodo Runge-Kutta impl cito. Para comparar las distintas metodolog as resuelve un conjunto de problemas de muy diversas caracter sticas concluyendo que el uso de un metodo BDF es lo mas adecuado en la mayor a de las situaciones.
169
xt = a( t)x + b( t)x + c(t ) (6.22) donde aparecen tanto terminos de difusion como de conveccion. Se suponen ademas dos tipos de condiciones frontera: una de segundo orden x (0 t) = 0 (t) y otra de primer orden x(L t) = L(t), e iniciales: x( 0) = x0 ( ). Para la solucion de este problema se aplica el metodo NMOL utilizando una malla de nodos, como se mostraba en la gura 6.2. El Jacobiano (J) del sistema de ODEs resultante, para el caso en el que la aproximacion es de segundo orden, queda como sigue:
B B
2 ;2 ; 6 ; 2 22 6 6 2 ; 6. . 6. . 6. . 6 60 0 6 6 .. .. 6. . 6 60 0 6 60 0 4
h
b1 b1
h b2
b3
0 0
.. . 0 .. . 0 0 0
.. . 0 .. . 0 0 0
0 0 0 .. .. .. . . . i 0 2 .. .. .. . . . 0 0 0 0 0 0
:: :: :: ::
b
0 0 0 .. .
;
.. . 0 0 0
0 0 0 .. .
ai
::
::
::
.. . 0 0 0
;bi
h
0 0 0 .. .
ai
.. . 0 0 0
0 0 0 0 0 0 .. .. .. . . . i 0 2 .. .. .. . . . 2 0 2 0 0 0 0
:: :: ::
b h
::
::
;
b
0 0 0 .. . 0 .. .
:: ::
2h ;b 2h
;1
;2
;b
0 0 0 .. . 0 .. .
h
;2
b b h
0 0 0 .. . 0 .. .
2h
a a
;1 + + 72
;1
0 0 0 .. . 0 .. . ;2 0 ;5 ;1 0 2 ;11 4 2
a
b h
0 07 7 07 7 .. 7 .7 7 07 7 .. 7 .7 7 7 07 7
b
(6.23)
2z 3 2c 3 2 3 z1 3 _ (a1 3b1) 0 7 1 1 6 z2 7 6 c2 7 6 z2 7 _ 7 6 7 6 7 6 7 b2 0 6z 7 6c 7 6 7 7 6 3 7 6 3 7 6 7 z3 7 _ 7 0 6 7 3 6 .. 7 6 .. 7 2 6 7 6 7 6 7 ... 7 0 6. 7 6. 7 6 7 7 7 1 6 j11 . j1 7 6 7 6 7 1 6 7 ... 7 = 6 ... .. ... 7 6 zi 7 + 6 ci 7 + 6 7 (6.24) 6 7 6 7 2h 6 7 zi 7 2h 4 _ 7 56 . 7 6 . 7 6 7 ... 7 6 .. 7 6 .. 7 6 7 0 j1 j 6 7 6 7 7 6 7 6 7 6 7 7 6 7 b 2 6 z ;27 6 c ;27 7 6 7 z ;27 _ 7 2h 3b L 6 7 6 7 6 6 z ;17 6 c ;17 6 (a ;1 + 1 ) L 7 7 4 5 4 5 z ;15 _ 4 5 2h (3a + 52bh ) L z z _ c donde h = y jik denotan cada uno de los elementos del Jacobiano dado en la expresion (6.23). Las condiciones iniciales correspondientes seran: 2 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 4
; B ; B
;
zi(0) = x0 ( i) (6.25) donde x0 ( i) no es mas que la variable dependiente al inicio del proceso evaluada en cada nodo de la malla.
170
Aunque estos resultados son validos unicamente para un caso particular, s son utiles para observar la estructura, practicamente en banda, del Jacobiano. En terminos generales, se puede esperar que esta estructura se repetira para todos los problemas unidimensionales, debido precisamente a que el valor de la variable dependiente se aproxima en cada punto, utilizando sus valores en puntos adyacentes. Evidentemente, el ancho de la banda depende del orden de las formulas utilizadas. En el caso de dominios espaciales de mas dimensiones el Jacobiano presentara mas bandas semejantes a la del caso unidimensional. En la gura 6.3 se representan los esquemas basicos para los casos uni y bi-dimensional, siendo el caso 3D una ampliacion de este ultimo.
Figura 6.3: Estructura basica del Jacobiano de los sistemas de ODEs obtenidos de aplicar NMOL (casos 1D y 2D). Este tipo de problemas podr a resolverse con un integrador apropiado para Jacobianos en banda. Sin embargo, en TNHp este sistema de ODEs ira acompa~ado n por las correspondientes sensibilidades y por lo tanto sera necesario estudiar la estructura del Jacobiano total.
171
En particular, para este n son posibles dos metodos: bien el llamado metodo directo desacoplado, implementado en DASSLSO (Petzold et al., 1996) para el caso de sensibilidades de primer orden con respecto a parametros, o bien la aportacion de informacion sobre el Jacobiano del sistema total al integrador. Esta ultima parece ser la metodolog a mas sencilla para el caso de sensibilidades con respecto a parametros de control dado que no solo los elementos del Jacobiano, sino que tambien su estructura, var an con el tiempo. Para problemas concentrados no se hizo uso de esta propiedad del sistema de sensibilidades ya que, como los problemas considerados no eran (o eran poco) r gidos el uso de un metodo Runge-Kutta fue su ciente. Sin embargo para procesos distribuidos se hace necesario el aprovechamiento de esta y otras propiedades del Jacobiano para una simulacion mas e ciente. En la seccion anterior se estudio la estructura del Jacobiano del sistema de ODEs que resultaba de aplicar el metodo NMOL. A continuacion se presenta el calculo del Jacobiano para el sistema extendido en funcion del Jacobiano original.
_ donde s1 y s1 2 Rn: ~ y el sub ndice i se re ere al parametro vi . Y las sensibilidades de segundo orden proyectadas:
~ ~ X @2f X @2f @f _ s2i = @ z s2i + @ z@v p(k)s1i + @v @v p(k)
8
i 1 ::: ~
2
(6.27)
k=1
k=1
i 1 : : : ~ (6.28)
2
_ Z = f (Z v)
(6.29)
172
donde Z = z1 zn s11 s1n: ~ s21 s2n: ~]T . Sea J el Jacobiano del sistema original (ec. (6.26)) que bien podr a ser como el presentado en la ec. (6.23):
@f J = @ z J Rn
2
(6.30)
Las componentes del Jacobiano para el sistema de sensibilidades de primer orden seran: _ @ s1i = J @ s1i n
n
(6.31) (6.32)
_ @ s1i = @ J s + @ J = (J ) 1i n n @ z @ z 1i @vi Y las del Jacobiano para sensibilidades de segundo orden proyectadas: _ @ s2i = J @ s2i n
n
(6.33)
n
(6.34)
~ ~ _ @ s2i = @ J s + X @ 2 J p(k)s + X @ 2 J p(k) = (J ) (6.35) 2i 1i 2i n n @z @z k=1 @ z@vk k=1 @vi @vk El Jacobiano completo a tiempo nal, es decir, cuando todas las sensibilidades estan activas quedara:
8 > > > > > > > > > > > < JT = > > > > > > > > > > > :
0 J 0 0 0 SJ 0 0
... ...
0 0 J 0 0 0 SJ 0 0
... ...
0 0 0 J 0 0 0 SJ
... ...
0 0 0 0 0 0 0 0
... ...
...
0 0 0 0 J 0 0 0
... ...
0 0 0 0
J2~ 0
0 0
...
0 J 0 0
0 0 0 0
0 0 0 0
0 0 0 0 0 0 0 0 J
... ...
SJ 0 0 0
0 0 J 0
0 0 0 J
9 > > > > > > > > > > > = > > > > > > > > > > >
(6.36)
173
174
esta informacion para saber la posicion exacta del elemento no nulo. Para ello contabiliza el numero de elementos no nulos hasta el primer elemento no nulo de la columna y lo anota. Es decir, los ndices de las las i de los elementos no nulos en la columna j se recogen en el vector jan (jan(k) = i), e ian(j ) k ian(j + 1) con ian(n + 1) = nnz + 1. Por ejemplo, para una matriz:
2 3 0 0 07 60 6 0 0 7 6 7 6 0 07 6 7 60 0 7 4 5
0 0 0 0 los vectores de dispersion ser an: jan = 1 3 2 3 3 4 1 4 2 4 5] e ian = 1 3 5 7 9 11]. En este trabajo se han realizado las modi caciones necesarias en el proceso de integracion para realizar de manera automatica el calculo del Jacobiano exacto del sistema IVP extendido (JT ) y de su estructura, es decir los vectores iant y jant, a partir de los datos para el Jacobiano del sistema original (J, ian y jan), teniendo en cuenta que estos se modi can a lo largo del tiempo de proceso. A continuacion se muestra un caso particular que ayudara a comprender este ultimo punto.
z = Jz + Bu _
(6.37)
175
las distintas sensibilidades se activan tambien sus correspondientes componentes del Jacobiano total. Considerando el caso de una unica variable de control, la actualizacion del Jacobiano sera como sigue: Intervalo t0 - t1 :
8 > > > > > > < JT = > > > > > > : 8 > > > > > > < JT = > > > > > > :
J 0 0 0
. . .
0 J 0 0
. . .
0 0 0 0
. . .
0 0 0 0
. . .
0 0 0 0
. . .
0 0 0 0 0 J 0 0 0
. . .
. . .
. . .
Intervalo t1 - t2 :
0 J 0 0
. . .
0 0 J 0
. . .
0 0 0 0
. . .
0 0 0 0
. . .
0 0 0 0 0 J 0 0 0
. . .
. . .
. . .
Intervalo t ;1 - tf :
8 > > > > > > < JT = > > > > > > :
0 J 0 0
. . .
0 0 J 0
. . .
0 0 0 J
. . .
0 0 0 0
. . .
0 0 0 0 0
. . .
. . .
En el caso de mas de una variable de control ( > 1) es inmediato adaptar la formulacion anterior. Bastara con a~adir tantas J como variables de control en las n posiciones adecuadas a medida que se van activando los elementos de control. Por supuesto, en los casos no lineales, ademas de a~adir la matriz J cada vez n que se activa un elemento de control, es decir, un conjunto de sensibilidades, sera necesario a~adir las J1i y J2i correspondientes, ademas de las matrices constantes n SJ necesarias.
176
177
Principio Maximo de Pontryagin en Ramirez (1994), alcanzando una distribucion de temperatura nal dentro del 5% del valor deseado. La formulacion matematica del problema es como sigue: Encontrar Text (t) para minimizar:
ZL J = (Tobj T ( tf ))2 dx (6.38) 0 sujeto a la dinamica del sistema que en este caso corresponde a la ecuacion de conduccion de calor unidimensional y sin termino de generacion: Tt = T (6.39) donde T es la temperatura y la variable espacial. Las condiciones frontera son de conveccion en ambos extremos de la barra, y en el origen es donde se encuentra al fuente de calor: T (0 t) = h(T Text) (6.40) mientras que el extremo nal de la barra esta aislado, es decir, no hay ujo de calor: T (L t) = 0 (6.41) Inicialmente la barra esta a una temperatura ja e independiente de la posicion T ( 0) = 0. En este caso la variable de control es la temperatura exterior Text.
; ;
178
el numero de veces que entra en la rutina de Jacobiano bien para evaluarlo o bien para calcular su estructura Tcpu3 es el tiempo de computacion, de una simulacion (en el caso de = 0 en el que se integra unicamente el sistema original el tiempo de computacion corresponde a 50 simulaciones). Los casos en los que se produjeron errores de integracion se marcaran con un s mbolo ;. 0 4 10 20 25
neq 21
105 231 441 546
nnz 64
320 704 1344 1664
MF 10 222 121 21 10 222 121 21 10 222 121 21 10 222 121 21 10 222 121 21 10 222 121 21 10 222 121 21 10 222 121 21
TC P U
nf 263 115 101 100 1144 428 380 380 1837 874 874 874
;
941 1399 941 1239 941 1239 1131 1655 1131 1459 1131 1459 1697 2588 1697 2196 1697 2196 2395 4062 2395 3282 2395 3282 3178 5902 3178 4366 3178 4366
; ; ; ; ; ; ; ;
ntf 263 127 101 100 1144 852 384 380 1837 3194 764 764
10239 1259 1259 15330 1484 1459 56188 2196 2196 216262 3282 3282 846080 4366 4366
; ; ; ; ;
ntj 0 0 55 44 0 0 1680 1260 0 0 9240 6930 0 0 26460 17640 0 0 40404 26754 0 0 158508 104958 0 0 625695 413595 0 0 2460843 1620864
Tcpu 0:44 0:27 0:35 0:27 0:24 0:096 0:096 0:09 0:9 0:44 0:42 0:41
2:6 2:3 2:2 4:0 3:5 3:3 11:4 9:3 8:0 65:5 49:3 37 442 365 217
; ; ; ; ;
Tabla 6.1: Resultados de simulacion del IVP extendido para un proceso distribuido.
3
El tiempo de computacion
179
Aunque el problema considerado es unidimensional y muy sencillo, los resultados muestran las mejoras esperadas segun el desarrollo presentado anteriormente. El aumento en el numero de discontinuidades de control (valores de altos) perjudica al metodo de Adams que por otra parte requiere un elevado numero de evaluaciones de la funcion debido a la rigidez del problema. En cuanto a los otros metodos basados en BDF, parece claro que a medida que aumenta la dimension del problema el coste computacional invertido en el calculo del Jacobiano y su estructura (metodos MF = 222 y MF = 121) aumenta de manera excesiva. En la gura 6.4 se re eja claramente este comportamiento y destaca el hecho de que, aunque el crecimiento en el tiempo de computacion no es lineal para ninguno de los tres casos, s es mas suave en el caso del metodo MF = 21.
450
Tiempo de computacin (s)
1000
4000
Figura 6.4: Comportamiento de LSODES en la simulacion de sistemas distribuidos con sensibilidades. Estas diferencias aumentan a medida que aumenta la dimension y dispersion del Jacobiano, por lo que una buena seleccion sera de vital importancia en la resolucion de problemas de nidos en dominios 2D y 3D.
180
10 80 160 320
Tmin ni =nf =ncg Tcpu (s) 0:196 3=4=7 1:3 0:195 2=3=8 29 0:195 2=3=8 87 0:196 4=5=13 767
T(x,t f)
0.200 0.199 0.198 0.197 0.196 0.0 0.2 0.4 0.6 Posicin 0.8 1.0
Figura 6.5: Per l de control y distribucion de temperaturas en el proceso de calentamiento de una barra ( = 320, J = 4:4 10;5). Ademas, y con el n de ofrecer una comparacion con uno de los metodos actuales mas conocidos, se resolvio este problema con gOPT. Para ello se consideraron las mismas condiciones que con TNHp, y varios niveles de discretizacion de la variable de control. El mejor resultado corresponde a = 10, alcanzando valores de Tmax = 0:202 y Tmin = 0:197 en 15 iteraciones y en un tiempo de computacion de 11:6 s. Para niveles de discretizacion superiores, el metodo converge a soluciones suboptimas siendo los per les de control obtenidos muy ruidosos. A modo de ejemplo, en la gura 6.6 se muestra el per l obtenido para el caso = 80.
0.5
Control, Text
0.4 0.3 0.2 0.1 0.0 0.0 0.1 0.2 Tiempo 0.3 0.4
Figura 6.6: Per l de control para el calentamiento de una barra unidimensional obtenido con gOPT ( = 80).
181
J P (Text Tobj )2dt (6.42) 0 sujeto a la dinamica del sistema que, en este caso, esta descrita por la ecuacion de conduccion de calor en dos dimensiones, ya que se asume simetr a axial: Tt = kc (Trr + (1=r)Tr + Tzz ) (6.43) donde Z es el vector de diferencias de temperatura con respecto a la deseada (Tobj ) dentro del cilindro, M es una matriz de pesos que cuanti ca la importancia de alcanzar uniformidad frente a los movimientos del control, r y z son las variables radial y axial respectivamente y P es un factor que penaliza la movilidad de la variable de control. Inicialmente todo el cilindro esta a la misma temperatura:
;
= Z(tf )T MZ(tf ) +
Z tf
(6.44)
Tr (0 z t) = Tz (r 0 t) = 0:0 (6.45) (6.46) Tr (R z t) = h (Text T (R z t)) k Tz (r L t) = h (Text T (r L t)) (6.47) k indicando la condicion de simetr a en el centro y que el calentamiento se produce por en el extremo del cilindro, respectivamente. Los parametros del sistema son: R = 1:75 cm, L = 1:75 cm, k = 6:48 10;3 Wm;1oC ;1 , = 1:067 kg m;3 , c = 3:542 JkgoC ;1 y h = 17:85 10;4 Wm;2o C ;1. Y los valores maximo y m nimo para la temperatura exterior son 25oC y 200oC respectivamente. Debido a la condicion de simetr a, es su ciente desarrollar el modelo en el plano medio del cilindro, tal como se muestra en la gura 6.7 donde se explica la aplicacion del NMOL a la geometr a considerada en este problema. Tanto en la direccion radial como en la axial se ha considerado un nivel de discretizacion de 11 elementos, lo que resulta en un total de N = 121 ODEs.
;
182
2R
Figura 6.7: Aplicacion del metodo NMOL a la simulacion del problema de calentamiento de un cilindro. Los resultados obtenidos se presentan en la tabla 6.3 y el per l de control optimo as como la distribucion de temperatura en el interior del cilindro se presentan en las guras 6.8.
M = 100IN y P = 0:01
5 10 20 40 4:00 3:84 3:78 3:73
Tmin ni=nf =ncg Tcpu(s) 99:037 3=4=8 22 98:760 3=4=9 47 98:904 3=4=9 164 98:948 3=4=9 835
Control, Text
T(r,z,tf)
1500
1 z 0.5
0 0
1 0.5 r
1.5
Figura 6.8: Per l de control y distribucion de temperaturas en el proceso de calentamiento de un cilindro ( = 40, J = 3:73 104).
183
Con el n de evaluar estos resultados, este problema fue resuelto con un metodo de optimizacion estandar basado en el uso de CVP en combinacion con un metodo SQP (gOPT). A modo de ejemplo, en el apendice II se presentan los cheros para la resolucion de este problema con gOPT. Los resultados concuerdan con los obtenidos en este trabajo. El mejor valor objetivo de 3:74 104 se obtuvo con = 20 en 18 iteraciones pero con un tiempo de computacion casi de 2322 s, es decir, unas 15 veces superior al empleado por TNHp.
II
1
La membrana consta de una prote na inactiva mezclada con una enzima. A tiempo t = 0 la membrana no contiene ni sustrato ni producto. Por difusion, el sustrato S presente en el compartimento I comienza a penetrar en la membrana, donde la enzima E es un catalizador de una reaccion que produce un cierto producto P.
Este proceso viene descrito por el correspondiente balance de materia y el uso de la ecuacion de Fick:
cs = cs + F (cs) F (cs) = t
con las siguientes condiciones de contorno:
cs 1+cs
(6.48) (6.49)
cs(0 t) =
cs(1 t) =
donde , y son constantes que en este trabajo se jan a un valor 10 y cs es la concentracion de sustrato. Supongase que se dispone de dos activadores a, uno en cada compartimento, que tambien difunden hacia la membrana, de manera que el proceso de difusion del sustrato se ve modi cado en la forma:
ca cs 1+ca 1+cs
(6.50)
184
Z tf J = (cs(0:5 t) arctan(30:0t)) dt (6.53) 0 Para ello se utilizan como variables de control las concentraciones de los activadores en los extremos de la membrana (a1 y a2 ), que estan sometidas a los l mites 0 ai 100. Para aproximar la solucion de las PDEs presentes en el problema se ha utilizado una malla de 11 elementos y formulas de segundo orden. Los resultados obtenidos con el metodo TNHp se presentan en la tabla 6.4 y el per l de control optimo y la concentracion nal obtenida aparecen en las guras 6.10. OBJ ni =nf =ncg Tcpu 10 0:94079 10=15=22 38:8 15 0:93660 8=11=17 48:5 25 0:93307 12=15=24 130:0
;
con las condiciones frontera: ca (0 t) = a1 (t) ca(1 t) = a2 (t) (6.52) El objetivo es regular la concentracion de sustrato (cs) en cierto punto ( = 0:5), para hacerla lo mas proxima posible a la deseada zd = arctan(30:0t), en un tiempo de proceso tf = 1:0. Matematicamente:
ca = ca t
(6.51)
Tabla 6.4: Resultados para el problema de difusion a traves de una membrana. Este problema se resolvio con PDECON (Blatt y Schittkowski, 1997) un programa desarrollado recientemente para la resolucion de problemas de control optimo de proceso distribuidos unidimensionales. PDECON hace uso del NMOL para transformar las PDES en ODEs y a continuacion resuelve el problema de optimizacion utilizando el metodo CVP y un optimizador SQP (NLPQL, Schittkowski, 1985 y 1986). Para la solucion de este problema se han considerado dos tipos de aproximaciones para las variables de control: una que usa elementos constantes y otra constituida por 10 elementos lineales. Esta segunda aproximacion proporciono el mejor resultado de J = 0:9432 en 19 iteraciones y 81 s de tiempo de computacion. Este resultado es inferior (tanto en objetivo, como en numero de iteraciones y tiempo de computacion) a los obtenidos en este trabajo utilizando el metodo TNHp. A n de ilustrar el uso de PDECON se presenta en el apendice III la implementacion de este problema.
185
Controles, a1 y a 2
Activador 1 Activador 2
Concentracin substrato
50.0
10.0 8.0 6.0 4.0 2.0 0.0 0 0.2 0.4 0.6 Tiempo 0.8 1 zd (0.5,t) cs(0.5,t)
0.8
1.0
Figura 6.10: Per l de control y distribucion de concentraciones correspondiente en el problema de difusion a traves de una membrana.
186
! !
(6.54)
sujeto a la dinamica del sistema que viene dada por la ecuacion de transferencia de calor por conduccion:
(6.55)
Como ya se dijo se impondran dos restricciones a tiempo nal, una en la temperatura del punto mas caliente:
T (x y z t = tf ) T0 Fs(tf ) Fs D
r z VT
2
(6.61)
y una segunda en la letalidad asociada con todo el recipiente: (6.62) donde Fs D = 1200s en este caso, y Fs es la media volumetrica de la letalidad microbiologica a tiempo nal:
Z VT Z tf Fs(tf ) = log V1 exp ; ln 10 exp T (r z t) ; TM ref ln 10 dt dV DM ref 0 ZM ref T 0 (6.63) Estas expresiones derivan de asumir cineticas de pseudo-primer orden para la degradacion termica tanto de los nutrientes como de los microorganismos:
dCM (t) = ( ln 10 )C (t) exp( T (r z t) TM ref ) dt DM ref M zM ref
; ;
"
! ! #
(6.64)
187
dCN (t) = ( ln 10 )C (t) exp( T (r z t) TN ref ) dt DN ref N zN ref La temperatura del autoclave esta sometida a los l mites:
; ;
(6.65)
20:0 Tret
140:0oC
(6.66)
Con el n de resolver este problema se ha utilizado el metodo NMOL con una malla de 11 11 elementos y formulas de segundo orden. El problema resultante consta de 363 ODEs. Los resultados obtenidos para un per l de control u0 = 123 o C , se presentan en la tabla 6.5.
188
140 120 Control, Tret 100 80 60 40 20 0 1000 2000 3000 4000 5000 6000 7000 8000 Tiempo, s
Figura 6.11: Per l de control optimo para el problema de esterilizacion obtenido con TNHp, = 14, J = 0:4713.
T =71.11 o C max 70 T (o C) 60 50 40 30 20 0 0 0.02 0.04 z CN 0.6 0.5 0.4 0.3 0.2 0.1 0 0.01 0.02 0.03 r 0.04 0.06 0.01 0.02 r 0.03 0.04 z 0.02 0 0.04 0.06
Figura 6.13: Distribucion de retencion de nutrientes a tiempo nal para el problema de esterilizacion.
6.6. Conclusiones
189
6.6 Conclusiones
En este cap tulo se ha presentado la solucion de un conjunto de problemas de optimizacion dinamica de procesos distribuidos aplicando el metodo TNHp. Como se ha visto, el uso de un metodo adecuado de resolucion del IVP interno aumenta la e ciencia del metodo TNHp alcanzando muy buenas soluciones en tiempos de computacion razonables. Comparado con otros metodos de optimizacion que tambien hacen uso del metodo NMOL y un esquema CVP, TNHp alcanza, cuando menos, tan buenos resultados en terminos de valor objetivo, pero siendo superior en terminos de e ciencia (hasta 10 veces mas rapido que gOPT en la solucion del problema de calentamiento uniforme de una barra y 2 veces mas rapido que PDECON en la solucion del problema de difusion a traves de una membrana). Ademas, el uso de informacion de segundo orden bene cia al proceso de optimizacion, evitando la convergencia a soluciones suboptimas y generando per les de control mas suaves que los obtenidos con otros metodos. Sin embargo, a medida que el numero de ecuaciones aumenta, bien porque la no linealidad del modelo aumenta, bien porque aumenta la dimension del dominio de de nicion del problema, o porque aumenta el numero de variables de control, la e ciencia se reduce debido al coste que supone calcular las sensibilidades. Esto es especialmente notable en el problema de esterilizacion en el que los tiempos de computacion resultantes impiden el uso de este metodo para aplicaciones en tiempo real tales como optimizacion en l nea o bien control predictivo basado en modelo. Esto llevara a la busqueda de metodos alternativos para la simulacion del proceso distribuido, como los basados en el uso de modelos de orden reducido, tal como se discutira en el cap tulo 8.
190
El trabajo descrito en este cap tulo fue parte de una de las tareas del proyecto europeo \FAIR Project CT96-1192: Optimal control of microwave combination ovens for food heating", cuyo objetivo fue la mejora de la operacion de hornos mixtos microondas-conveccion, con el n de maximizar la uniformidad de la temperatura en el seno del alimento, minimizando as , las perdidas de calidad debidas a posibles calentamientos excesivos. Para comenzar, se presentan unas nociones basicas sobre el proceso de calentamiento por microondas, y se resaltan las motivaciones de la combinacion de estos dos modos de calentamiento. La resolucion del problema de optimizacion dinamica requiere un modelo que describa lo mas elmente posible el proceso. Se presentan los modelos desarrollados en el proyecto, as como las tecnicas numericas adecuadas para su simulacion. El desarrollo de un controlador robusto acompa~ado de un adecuado montaje experin mental permitieron la validacion experimental de los resultados obtenidos fuera de l nea (o -line) mediante optimizacion dinamica. Por ultimo, se plantean los problemas de optimizacion dinamica considerados y se presentan resultados, con sus correspondientes validaciones experimentales. 191
192
7.1 Introduccion
Los hornos microondas son aquellos que, alimentados mediante energ a electrica, producen ondas electromagneticas de una determinada frecuencia (microondas) siendo su principal nalidad la de calentar y/o procesar alimentos. Dentro del espectro de frecuencias, las microondas se situan entre la radiofrecuencia y el infrarrojo, es decir, su frecuencia estara comprendida entre unos cientos y unos miles de MHz, o lo que es lo mismo, su longitud de onda esta comprendida entre unos pocos mil metros y varios cent metros.
Longitud de onda 10
-14
10
-12
10
-10
10
-8
10
-6
10
-4
10
-2
10
10
Radio
10
20
10
18
10
16
10 10 Frecuencia
14
12
10
10
10
10
Figura 7.1: Espectro electromagnetico. La frecuencia t pica generada por los hornos microondas es de alrededor de 2:45 GHz, jado legalmente debido a la necesidad de no interferir con los valores utilizados por el ramo de las comunicaciones. Si se introduce un alimento dentro de un horno de estas caracter sticas, el campo electromagnetico in uye sobre las cargas electricas (habitualmente ligadas) del alimento, de manera que las del mismo signo se repeleran y las de signo distinto se atraeran. Esto produce un movimiento oscilatorio entre moleculas, y en consecuencia, un calentamiento. Sin embargo, para que esto se produzca las moleculas han de tener una con guracion dipolar, es decir, deberan tener carga positiva a un lado y negativa al otro. Las moleculas de agua cumplen este requisito, y puesto que es el constituyente fundamental de los alimentos, presente en hasta un 90%, el calentamiento con microondas se produce en todo el volumen (aunque no de forma homogenea, sobre todo para solidos grandes) y de manera muy rapida. Por otro lado, dado que las microondas son re ejadas por las super cies metalicas, y la cavidad donde se situa el alimento es metalica, practicamente toda la energ a se invierte en calentar el alimento, lo que acelera todav a mas el proceso. Ademas, los recipientes de los alimentos, fabricados con materiales adecuados (plasticos, cristal, etc)
7.1. Introduccion
193
son transparentes a las microondas y por lo tanto solo se calentaran por conduccion debido al aumento de temperatura que experimentan los alimentos.
Control y Temporizador
Cavidad metlica
Figura 7.2: Esquema basico de un horno microondas. El magnetron esta formado por un tubo de vac o cil ndrico, recorrido por un lamento que actua como catodo. Rodeando al lamento se encuentra el anodo constituido por una serie aspas y dos lamentos de ferrita (iman) que rodean el conjunto. Cuando se aplica tension al lamento metalico, este se calienta y emite electrones que se ven atra dos por el anodo. Las trayectorias de los electrones, que en condiciones normales ser an en l nea recta en direccion al anodo, se ven modi cadas por la presencia del campo magnetico que crea el iman y que debe estar bien ajustado para que los electrones sigan la trayectoria deseada. Los electrones inducen cargas positivas en las aspas y si todo funciona adecuadamente la carga de las aspas cambiara de positiva a negativa 2.45 millones de veces por segundo produciendo as las microondas que, a traves de una antena conectada a una de las aspas, se introducen en una gu a de ondas que las dirige a la cavidad del horno. La gu a de ondas consiste en un conducto de seccion habitualmente rectangular que, con las dimensiones adecuadas, permite la propagacion de las ondas de una determinada frecuencia sin demasiadas perdidas.
194
La cavidad del horno es simplemente una caja metalica donde se coloca el alimento. Al entrar las microondas en la cavidad, son agitadas por una especie de ventilador que hace que se dirijan a todas las direcciones (hoy en d a es habitual conducir las ondas por dos gu as de onda e introducirlas en la cavidad por dos puntos diferentes de manera que se hacen interferir obteniendo el mismo efecto que si hubiese un agitador pero evitando el componente mecanico), re ejandose una y otra vez sobre las paredes metalicas hasta que son absorbidas por el alimento. Notese que, tras un breve transitorio, la distribucion de las ondas dentro del horno sera estacionaria, y viene dada por los modos de resonancia para esa cavidad. Por ello, hay regiones de campo alto y otras de campo nulo, tal como se muestra en la gura 7.3.
Figura 7.3: Ejemplo de distribucion de potencia en el interior del horno (plano vertical). La mayor a de los hornos disponen ademas de un soporte o plato giratorio que hace que el alimento aproveche mejor la distribucion no homogenea de las microondas. Para evitar el calentamiento excesivo del magnetron, el horno dispone de un ventilador que lo refrigera con aire externo. En el caso de un horno mixto como el utilizado en este trabajo, se dispone ademas de una resistencia adicional y otro ventilador que produce el movimiento del aire calentado por la resistencia en el interior del horno, provocando as la conveccion (forzada) que tambien contribuye al calentamiento del alimento. Tanto el proceso de calentamiento con microondas como el funcionamiento de un horno microondas t pico se describen con detalle en los libros de Decaerau (1985) y Bu er (1993).
195
Figura 7.4: Distribucion real de temperaturas en los planos medios de un cilindro y un paralelep pedo: calentamiento solo con microondas.
196
En el calentamiento por conveccion, en cambio, los efectos obtenidos son muy diferentes, produciendose un calentamiento muy acusado en el exterior del alimento, mientras el interior permanece fr o, tal y como se muestra en las guras 7.5.
35 Direccin axial (-L,L) 30 25 20 15 10 5 5 70 60 50 z 40 30 20 10 10 20 30 40 50 60 70 80 90 100 110 120 x 10 15 20 25 30 Direccin radial (-R,R) 35 70 65 60 55 50 45 40 35 30 25 30 25 45 40 35
Figura 7.5: Distribucion real de temperaturas en los planos medios de un cilindro y un paralelep pedo: calentamiento solo por conveccion forzada. Todos estos efectos son muy importantes para la seguridad del consumidor, ya que muchos microorganismos patogenos pueden sobrevivir en las zonas fr as, si no se alcanza una temperatura m nima. Asimismo, el calentamiento excesivo de los bordes del alimento puede causar deshidratacion y perdida del color que hace que el alimento sea menos atractivo para el consumo. Es por ello que muchos fabricantes proponen el uso de aparatos que combinan el calentamiento con microondas con el convencional (habitualmente, por conveccion forzada). Estos hornos mixtos (microondas-conveccion) intentan paliar los problemas que presentan los hornos microondas tradicionales, al tiempo que mantienen sus ventajas. Sin embargo, esta combinacion de modos de calentamiento complica
197
el modo de operacion de los hornos. En las ultimas decadas se han dedicado muchos esfuerzos a la resolucion de problemas de optimizacion del procesamiento termico de alimentos, de manera que se veri quen ciertos requerimientos de seguridad y calidad (por ejemplo, Banga et al., 1991). Estos trabajos han demostrado la posibilidad de mejorar los procesos tanto en terminos de reduccion de su duracion como del aumento de la calidad de producto tratado. De la misma manera, el uso de tecnicas de optimizacion y control adecuadas podr an mejorar la operacion de los hornos mixtos de manera signi cativa. Sin embargo, la complejidad de los modelos matematicos que describen el proceso han limitado la aplicacion de metodos de optimizacion. Como se ha dicho, el desarrollo de este trabajo se ha enmarcado en el proyecto \FAIR Project CT96-1192: Optimal control of microwave combination ovens for food heating", cuyo objetivo fue la mejora de la operacion de hornos mixtos. Aqu se resumiran los resultados obtenidos haciendo especial hincapie en la solucion de problemas de optimizacion dinamica con el metodo TNHp y HyMDO. Asimismo se describira el uso de metodos estocasticos para la optimizacion de un modelo riguroso con discontinuidades en los estados, caracter stica que di culta el uso de metodos de optimizacion deterministas.
T ( 0) = T0 ( )
Se asume que las perdidas por evaporacion son peque~as. Si no, habr a que tener en n cuenta las ecuaciones de transporte de materia (difusion de agua). En la frontera se produce el fenomeno de conveccion que vendra dado por las siguientes condiciones: @T = h(T ; T ) en ;k (7.3) horno @n
198
En estas expresiones es la densidad expresada en (kg m;3 ), C es la capacidad calor ca en (J kg;1 ), k es la conductividad termica (W m;1), Q es la distribucion de potencia (W m;3) y T es la temperatura en oC . La funcion Q es el termino de generacion debido al calentamiento por microondas y en general vendra dada por la expresion:
Q( t) = P (t)Q0( ) (7.4) donde Q0 es la distribucion de potencia electromagnetica en el interior del producto a un nivel de potencia del 100% y P (t) es el nivel de potencia aplicado (entre un 0 y un 100%), y constituira una variable de control del proceso. El calculo del termino de generacion Q0 requiere el calculo de la distribucion de campo en el interior del alimento. Debido a la complejidad que esto supone, se han desarrollado modelos (de complejidad media) que, aunque aproximados, permiten calcular de manera sencilla la distribucion de temperaturas en el interior del alimento. Por otra parte, los modelos mas rigurosos resultan de la resolucion de las ecuaciones de Maxwell y el calculo de la magnitud del vector de Poynting. En este trabajo, se consideraran los dos tipos de modelos. El primero, de complejidad media, se utilizara para la descripcion del proceso de calentamiento de alimentos cuya geometr a es cil ndrica. La solucion de las ecuaciones de Maxwell permitira el estudio de geometr as mas generales, tales como un paralelep fpedo o un paralelep pedo de aristas y esquinas redondeadas.
199
se basa en la aplicacion de la \ley" de Lambert (Ohlsson et al., 1971) para calcular el termino de generacion debido a las microondas. Esta \ley" a rma que la potencia transmitida en una direccion ( ) en el seno del alimento decae exponencialmente a medida que penetra en el dependiendo de un factor de atenuacion ( ):
p = p0e(;2
(7.6)
Notese que la aproximacion de Lambert solo es valida para laminas semi-in nitas pero Chen et al. introdujeron una serie de parametros heur sticos que permiten predecir el calentamiento de cilindros de forma adecuada. Las condiciones frontera impuestas en este modelo consideran tanto perdidas por conveccion como perdidas por evaporacion (Ev ):
(7.7) (7.8)
Debido a la geometr a, las caracter sticas del alimento y las condiciones de calentamiento, se imponen ademas dos condiciones de simetr a:
Tr (0 z t) = 0 Tz (r 0 t) = 0
(7.9)
Las perdidas por evaporacion se calcularon utilizando el correspondiente balance de materia y la ecuacion de Clausius-Clapeyron:
Ev = ky Vp(T ) Pp] Hv (T ) ky = Vp(Tm;Pp Ev = m(p1 p2T ) ) Hv (T ) = p1 p2 T El termino de generacion vendra dado por: h i Q0r = 2 (T ) R P000r e(;2 (T )(R;r)) r h i Q0z = 2 (T )P000z e(;2 (T )(0:5L;r)) Q0 = Q0r + Q0z
; 4 ) ; 4 ;
0r z donde: P000r = 2PRL y P000z = 2P0R2 . Notese que para evitar la singularidad en r = 0, el valor de la variable radial debe veri car r > ", donde " es una cantidad in nitesimal. El factor de atenuacion vendra dado por la expresion general:
v hq i u t 2 u 0 1 + ( 00 = 0)2 1 = 2
;
(7.14)
200
# @E + @P M + 0 @t @t (7.18) donde los vectores E y B representan los campos electrico y magnetico, respectivamente y los vectores P y M, representan la polarizacion y magnetizacion, y los coe cientes 0 y 0 son las permitividades electrica y magnetica del medio, respectivamente. La ec. (7.15) resume la Ley de Coulomb de la fuerza entre dos cargas puntuales ( f , es la densidad de cargas libres) mas los efectos electricos de la materia _ debido a la presencia de un campo eletrico ( P, es la densidad de carga ligada en materiales dielectricos). La ec. (7.17) representa la Ley de Faraday de la induccion debido a la presencia de un campo magnetico no estacionario. La ec. (7.18) representa el hecho de que no existen monopolos magneticos o de otra forma, cargas magneticas libres. Por ultimo la ec. (7.18) incluye la Ley de Ampere que describe la fuerza entre corrientes electricas y los efectos magneticos de la materia. La energ a para estos campos generales descritos por las ecuaciones de Maxwell se puede calcular a partir del llamado vector de Poynting, que se de ne:
r r
(7.16) (7.17)
S=E H
(7.19)
y que representa la rapidez con la que uye la energ a electromagnetica por unidad de super cie. Se trata de un ujo de potencia y su direccion es la misma que la del ujo instantaneo de energ a. Por lo tanto, sera muy util a la hora de resolver las ecuaciones de Maxwell. El calculo detallado del vector de Poynting esta descrito en numerosos libros, por ejemplo, Reitz et al. (1986) o Wangsness (1992). En el supuesto de que los campos incidentes sobre un cierto material dielectrico (por ejemplo, un alimento) var en de forma sinusoidal con el tiempo (e;iwt), caso de las microondas, es posible obtener una expresion para el promedio temporal del vector de Poynting lo que lleva a una expresion para la densidad de energ a: 1 (7.20) p = 2 jE j2 que es la que se invierte en calentar tal material dielectrico.
201
202
del campo electrico. Las simulaciones demuestran la presencia de ondas estacionarias en la cavidad. Esto signi ca que la energ a del campo se distribuira, esencialmente, en los maximos de tales ondas, y esto es lo que produce los puntos fr os y calientes dentro del alimento. Notese ademas que el alimento actua de hecho como una segunda cavidad de resonancia, dentro de la del horno.
CUt + KU = f
(7.22)
donde U es el vector que contiene la temperatura en cada nodo, C es la matriz de elementos nitos que incluye la densidad y la capacidad calor ca c, y K se puede ver como la suma de dos matrices Km y Kh. La primera incluye la conductividad termica (k) y representa la resistencia a la transferencia de calor por conduccion y la segunda incluye el coe ciente de transferencia de calor (h) y representa la resistencia a la transferencia de calor en la super cie. Por ultimo, f es el vector que incluye las contribuciones debidas a la conveccion en la frontera (fh) y las debidas a la presencia de microondas, calculadas con el metodo FD-TD (fq ). Con el n de resolver este sistema de manera e ciente, las matrices C, Km, Kh y los vectores fh y fq se construyen reuniendo las contribuciones de cada nodo e incorporandolas en matrices o vectores de dimensiones y 1 respectivamente. Las contribuciones de cada elemento (j ) se calculan en la forma:
Cj =
!j
(7.23)
Kjm
"
donde es el dominio de de nicion del proceso, j es el dominio de de nicion de cada elemento, ; es la frontera del dominio de de nicion total y ;j es la frontera del dominio de de nicion de cada elemento. Toda esta metodolog a se ha implementado en Fortran dando lugar a CHAMPSPACK (Coupled Heat and Mass Transfer Simulation Package, Scheerlink y Nicolai, 1999), herramienta que permite simular procesos de transferencia de calor de interes en este trabajo, de manera muy e ciente. En este codigo se contempla la resolucion del sistema de ODEs (7.22) teniendo en cuenta el caracter disperso de las matrices C, K y el vector f . Para ello se ha realizado una implementacion usando LSODES (Hindmarsh, 1983). Todos los detalles referentes al desarrollo y solucion numerica de los modelos que describen en el proceso se encuentran en los informes realizados a lo largo del desarrollo del proyecto (modelo de microondas: Wappling-Raaholt y Ohlsson, 1999) desarrollo y simulacion del modelo combinado: Nicola et al., 1999).
El problema de optimizacion dinamica consiste en el calculo de las pol ticas optimas de operacion de la temperatura dentro del horno (Thorno(t)) y la potencia (P (t)) de microondas con el n de alcanzar un objetivo determinado:
F
J = Z(tf )T Z(tf )
(7.28)
donde Z es el vector de diferencias de temperatura con respecto a la deseada (Tobj ) dentro del alimento. Todo ello sujeto a la dinamica del proceso (ecs. (7.1)-(7.3)) y a una restriccion en el m nimo de temperatura dentro del alimento: obj min T ( t)] Tmin (7.29)
204
F
2 : Maximizar la uniformidad de la calidad del producto nal, estimada en terminos de los llamados C-values (Ohlsson, 1988), que constituyen una medida de lo procesado que esta el alimento:
J = max(CZref ( t))
(7.30)
sujeto a la dinamica del proceso y a una restriccion en el valor m nimo a alcanzar: obj min CZref ( t)] Crefmin (7.31) y otra en el valor de temperatura maximo:
obj max T ( t)] Tmax
(7.32)
CZref =
Z tf
t=0
10
(T ;Tref )
Zref
dt
(7.33)
con Zref el incremento de temperatura necesario para aumentar la velocidad de aumento de C 10 veces. Para la resolucion de los problemas de optimizacion dinamica se utilizaran varios de los metodos vistos a lo largo de esta tesis, en particular, HyMDO, TNHp e ICRS/DS.
q horno
1 _ s1 P = C Ks1 P + Fq ]
;
1 Thorno
(7.36)
205
En el problema F 2 se requiere el calculo de los valores de CZref en cada nodo, sera necesario el calculo de las sensibilidades de segundo orden proyectadas. En ese caso el sistema IVP extendido incluira las ecuaciones (7.34-7.36) ademas de las que siguen:
" # log(10) 10(z;Tref )=Zref log(10) s X s p + s sc2i = Z _ Zref c1i k c1k k c2i ref
ref
que corresponden al calculo de los C-values, y de las correspondientes sensibilidades de primer orden y segundo orden proyectadas. Notese que en este caso tambien es posible aprovechar la estructura del Jacobiano total para una simulacion mas e ciente, tal y como se explico en el cap tulo 6. Con tal n se han realizado los cambios convenientes en CHAMPSPAK para la generacion de los vectores de dispersion y el Jacobiano total a partir de los datos correspondientes al Jacobiano del sistema de ODEs original.
7:1: considera el proceso de calentamiento de un cilindro de patata para maximizar la uniformidad de la calidad del producto nal (problema tipo F 2).
En el resto de los problemas que se consideraran el objetivo sera maximizar la uniformidad en temperatura (problema tipo F 1), a un tiempo nal dado:
P
7:3: considera el calentamiento optimo de un cilindro de un gel TX-151, representativo de diversos tipos de alimentos.
P
7:4: considera el calentamiento optimo de un paralelep pedo de gel TX-151, usando un modelo lineal. 7:5: considera el calentamiento optimo de un paralelep pedo, usando un modelo no lineal.
206
Montaje experimental
Los experimentos se realizaron en un horno mixto microondas-conveccion modi cado convenientemente para la validacion de los resultados (Saa et al., 1998) e instalado en el IIm-CSIC. La temperatura del horno se mide con un termistor (PT-312) y se controla mediante un controlador de potencia del dispositivo de conveccion forzada (OMRON G3PX 220 EHN-CT 10). La temperatura en la super cie del alimento se mide mediante el uso de sensores infrarrojo. La potencia de microondas se controla por un rele de estado solido (OMRON G3PX-220 BVD). El algoritmo de control se desarrollo en Matlab con una herramienta de adquisicion y control (Humosoft Real Time Toolbox 2.60) y ejecutado en un PC que dispone de una tarjeta de adquisicion de datos (PCL-818L DAQ card, Advantech). Asimismo se desarrollo una herramienta software en Matlab 4.2c que complementa al controlador, permitiendo la visualizacion del proceso. En la gura 7.6 se muestra una pantalla ejemplo en la que se muestra el comportamiento real de las variables de control, veri cando el ajuste a los per les de control calculados numericamente.
207
Figura 7.6: Pantalla t pica mostrando la temperatura dentro del horno, la potencia del microondas y la potencia de la conveccion forzada.
208
z Plano medio
z Plano medio
Origen de coordenadas
Origen de coordenadas
Figura 7.7: Situacion de los alimentos en el interior del horno. Seleccion de planos medios. Aqu se presenta un resumen de resultados de los obtenidos para la optimizacion dinamica de algunos alimentos tipo considerados en el proyecto. En particular, se han resuelto varios problemas correspondientes a los formulados para dos tipos de geometr as basicas. Sin embargo, solo fue posible la validacion experimental able de los per les optimos obtenidos para el tipo de problema F 1, de manera que aqu se prestara especial atencion a su resolucion. En Banga et al. (1999) se recoge una revision mas extensa de los resultados.
7.8 Resultados
Caso 7:1
P
Para la simulacion de este proceso se ha utilizado el metodo NMOL con una malla de 11 11 elementos y formulas de segundo orden. Se considera un cilindro de patata de dimensiones R = L = 0:0175 m y cuyas propiedades termof sicas de la patata se presentan en la tabla 7.1. Las propiedades dielectricas del medio vienen dadas por las siguientes expresiones (Mudget, 1986): 2:827 10;3T 2 + 1:736 10;5T 3 00 = 21:0272 ; 0:45496T + 8:552 10;3 T 2 ; 5:31 10;5 T 3 +1:1 10;7T 4
;
0 = 67:0476 ; 0:1111T
(7.40) (7.41)
Aqu se consideraron los valores constantes para un valor de temperatura de 80oC . : 1067 kg m;3 ] Chen et al. (1993) ;1 o C ;1 ] c: 3542 J kg Chen et al. (1993) k: 0.648 W m;1 oC ;1] Chen et al. (1993) ;1 ] 59.016 m Ohlsson (1971), Mudget (1986) h: 17.85 W m;2 oC ;1] Chen et al. (1993) Tabla 7.1: Propiedades termof sicas del cilindro de patata.
7.8. Resultados
209
El problema considerado consiste en minimizar el tiempo de proceso para alcanzar un valor de C lo mas uniforme posible, y centrado en 8 min (el mejor valor desde el punto de vista organoleptico). Este es un problema multiobjetivo como los considerados en el cap tulo 5. En este caso, debido al caracter difusivo del proceso, es muy dif cil conseguir uniformidad total en el valor de C-value en el interior del cilindro. Parece logico pensar que cuanto mayor sea el tiempo de proceso mayor sera la uniformidad. Es por ello que en este caso se ha optado por resolver el problema mediante el metodo de generacion de la curva Pareto. Para la resolucion de este problema se han utilizado los metodos presentados en esta tesis, y aqu solo se resumen los resultados obtenidos mediante el metodo HyMDO. Se ha realizado un ajuste del metodo resolviendo el problema para un conjunto de valores de tolerancia de optimizacion tanto para el metodo estocastico (ICRS/DS) como para el determinista (gOPT), de la misma manera que se hizo para los problemas que se presentaban en el cap tulo 5. Se concluye que los valores de tolerancia mas adecuados para ICRS/DS (SC 1), corresponden a funciones de corte en el intervalo J = 20 ; 100, ya que los errores relativos al resultado nal son inferiores al 5% para la tolerancia de optimizacion de gOPT, el valor mas adecuado parece ser SC 2 = 5 10;2, ya que reduce el tiempo de computacion de manera muy notable. En la gura 7.8, se muestra la curva Pareto obtenida por el metodo h brido. Tambien se incluyen ademas las obtenidas por cada uno de los metodos individuales que lo constituyen. Asimismo en la gura 7.9 se muestran los tiempos de computacion requeridos por cada uno de los metodos en una estacion de trabajo Sun UltraSparc a 200 MHz (90 MFlops segun Linpack-100), re ejando claramente la superioridad del metodo h brido.
23.0 HyMDO gOPT Tcpu (h) 18.0 J ICRS/DS 3.5 3.0 2.5 2.0 1.5 1.0 0.5 8.0 1500 0.0 2000 tf (s) 2500 3000 1500 2000 2500 tf (s) 3000 ICRS/DS gOPT HyMDO
13.0
Figura 7.9: Comparacion de tiempos de calculo de los distintos metodos para el problema P 7:1.
210
Notese que el tiempo de computacion con el h brido llega a reducirse hasta casi 4 veces respecto a gOPT, alcanzandose ademas resultados ligeramente mejores y evitandose el fallo de convergencia de gOPT en el caso de tf = 1500 s. Se observa que a tiempos de tf = 3000 s se obtiene una uniformidad aceptable de C-value proxima al valor deseado C = 8 min.
Caso 7:2
P
El objetivo es calentar un cilindro de patata similar al de P 7:1 hasta alcanzar una temperatura lo mas uniforme posible alrededor de 70 oC , siendo 25 ; 200 oC el rango permitido para la temperatura del horno y 0 ; 190 W para la potencia de microondas. Para la simulacion del proceso se ha usado CHAMPSPACK, con una malla uniforme consistente en 21 21 nodos. Para la optimizacion se han considerado dos niveles de discretizacion para los controles = 5 y = 10 lo que dio lugar a un total de 4851 y 9261 ODEs respectivamente. El per l inicial para la optimizacion fue Thorno = 150oC y P = 100 W . Los resultados, para varios tiempos de proceso, se presentan en la tabla 7.2, donde se utiliza la notacion habitual y el tiempo de computacion se expresa en segundos en un PC Pentium III/450MHz.
Tabla 7.2: Resultados obtenidos para el calentamiento optimo de una patata. A modo de ejemplo, en las guras 7.10 se presentan los per les de control correspondientes a tf = 600 y un nivel de discretizacion = 5. Asimismo se muestra la distribucion nal de temperaturas. Nuevamente, conforme el tf crece, se logra una mejor uniformidad. Y al reves, si se desea un proceso mas rapido, el precio a pagar es una mayor anchura en la distribucion de temperaturas dentro del alimento a tiempo nal (peor uniformidad). Ademas se observa que = 5 es su ciente desde el punto de vista practico, lo que simpli ca su implementacion en un horno real.
7.8. Resultados
100 90 80 70 60 50 40 30 20 60 50 P (W) 40 30 20 10 0 100 200 300 400 500 600 Tiempo Distribucin de temperatura a tf 0.016 z (m) 0.012 0.008 0.004 0 0 0.004 0.008 0.012 0.016 r (m) 70.15 70.1 70.05 70 69.95 69.9 69.85 N de nodos 0 0
211
Thorno (oC)
Figura 7.10: Per les de control y distribucion nal de temperaturas para el caso del calentamiento de un cilindro de patata.
Caso 7:3
P
Similar al caso anterior, se considera ahora el calentamiento de un cilindro de gel TX-151 de dimensiones R = L = 0:025 m. El objetivo sera calentar el cilindro hasta alcanzar una temperatura deseada de 50 oC , considerando una restriccion de camino en la temperatura maxima ya que a partir de cierto valor el gel comienza a sufrir deformaciones:
Tmax (t) 80oC (7.42) Para la simulacion del proceso se ha utilizado CHAMPSPACK con una malla de 21 21 nodos. Los per les de control obtenidos con TNHp, as como las temperaturas maxima y m nima, se presentan en las gura 7.11. En la gura 7.12 se muestra la distribucion real de temperaturas correspondiente, donde se observa que los efectos no deseados del calentamiento solo con microondas o solo con conveccion, se suavizan de manera notable alcanzando una mayor uniformidad. Asimismo, resulta evidente que con pocos elementos de control ( = 5) se logra un valor de J muy bueno.
212
120 100 80 60 40 20 0 0 100 200 300 Tiempo 400 Tmax=52.1 Tmin=48.0 500 600 Thorno P Tmax Tmin
Figura 7.11: Per les de control y temperaturas maxima y m nima para el calentamiento de un cilindro de gel TX-151 (tf = 600s).
35 Direccin axial (-L,L) 30 25 20 15 10 5 5 10 15 20 25 30 Direccin radial (-R,R) 35 25 40 35 30 45
Figura 7.12: Distribucion real de temperaturas en el plano medio de un cilindro: calentamiento mixto optimo.
Caso 7:4
P
La geometr a tipo paralelep pedo es especialmente complicada tanto en los relativo a su calentamiento homogeneo como respecto a su simulacion numerica. A lo largo del proyecto se fueron re nando los distintos modelos para representar lo mejor posible el proceso real. Aqu se considera el modelo lineal (ecs. (7.23)), que aunque imperfecto, se ajusto mas a la realidad y que incluye ademas las modi caciones del coe ciente de transferencia de calor con la posicion detectadas experimentalmente. La simulacion con CHAMPSPACK, implica resolver un sistema de 1500 ODEs (malla de 1134 hexaedros).
7.8. Resultados
213
El problema de control optimo consiste en calcular los per les de temperatura y potencia con el n de calentar el paralelep pedo hasta alcanzar una temperatura lo mas uniforme posible alrededor de 70 oC en un tiempo de proceso de 1500 s. Dado que el gel no resiste temperaturas muy elevadas se han considerado los siguientes l mites para las variables de control: 20 Thorno 100oC y 0 P 1, donde la potencia esta normalizada a la maxima emitida por el horno (esta carga absorbe el 100% de la potencia emitida). El coste computacional de la optimizacion con TNHp en este caso se eleva a 1:8 h (en un PC Pentium III/450MHz) ya que, para un valor de discretizacion de control = 5, el IVP extendido consta de 16500 ODEs, lo que aumenta notablemente el tiempo de cada simulacion. Los per les de control y la distribucion real de temperatura a tiempo nal se muestran en la guras 7.13-7.14, donde se observa que no es posible alcanzar una temperatura muy uniforme en tan poco tiempo de proceso.
120 100
o T horno( C)
50
P (% Pmax)
40 30 20
10
0.0 1500
Figura 7.13: Per les de control optimos para el calentamiento de un paralelep pedo, modelo lineal.
0.05 0.04 z (m) 0.03 65 0.02 60 0.01 0 0 0.05 0.1 x(m) 0.15 55 Ditribucin de temperatura a tf 75 N de nodos 70 350 300 250 200 150 100 50 0 45 50 55 60 65 70 75 80 85 Histograma de temperaturas a tf
Figura 7.14: Distribucion de temperaturas en el interior de un paralelep pedo a tiempo nal, modelo lineal.
214
Caso 7:5
La validacion experimental del modelo lineal llevo a la conclusion de que era insu ciente para la simulacion del proceso real debido a que no ten a en cuenta el fenomeno de evaporacion que se produce a temperaturas en torno a los 100 oC . El modelo de conduccion fue pues modi cado introduciendo un termino correspondiente al cambio de fase, lo que resulto en el siguiente conjunto de ecuaciones: (7.43) donde R es una funcion no lineal de la temperatura que se activa cuando se alcanzan los 99oC . Las nuevas sensibilidades de primer orden quedan:
;
z = RC ( Kz + Hq Thorno(t)Fh + Q0 P (t)) _ 1
1 _ s1 Thorno = CR2 R(;Ks1 Thorno + Hq Fh) ; @T@ R (;Kz + Hq ThornoFh + Q0) horno (7.44) " # 1 R ;Ks + F ] ; @ R ;Kz + H T F + Q P ] _ s1 P = CR2 (7.45) 1P q q horno h 0 @P 1 _ s2 Thorno = CR2 Ks2 Thorno R
;
"
"
(7.47)
La simulacion de este modelo con CHAMPSPACK requiere resolver 5742 ODEs (la malla correspondiente se muestra en la gura 7.15) lo que supone 120582 ODEs para el IVP extendido.
7.8. Resultados
215
y z x
Figura 7.15: Malla utilizada para la simulacion del calentamiento de un paralelep pedo, caso no lineal. Cortes a de N. Scheerlinck, Univ. de Lovaina. En este caso el objetivo es encontrar los per les de control para maximizar la uniformidad de temperatura en torno a 70 oC , en un tiempo total de proceso de 2500 s. Tanto TNHp como HyMDO, tuvieron problemas de convergencia debido a la presencia de discontinuidades en los estados. Esto llevo al uso del metodo estocastico ICRS/DS, que permitio alcanzar soluciones adecuadas. Aunque el proceso total requirio de 6 h de tiempo de computacion, representando las curvas de convergencia ( gura 7.16) se observa que en menos de 3 h ya se alcanzo una solucion aceptable, lo que se considera razonable dado el coste de cada simulacion. Esto ilustra las ventajas de los metodos estocasticos en ciertas circunstancias.
1200 Funcin objetivo 1000 800 600 400 200 0 0 100 200 300 400 500 600 Nmero de evaluaciones 110 100 90 80 70 60 50 40 0 Tmin T max
Figura 7.16: Curvas de convergencia del metodo ICRS/DS en la solucion del problema P 7:5.
216
Los mejores per les de control obtenidos as como la distribucion de temperaturas a tiempo nal se muestran en las guras 7.17 y 7.18, respectivamente. Asimismo, en la gura 7.19, se representa la distribucion de temperaturas en el plano medio del paralelep pedo lo que permite comparar con los resultados experimentales ( gura 7.23). Se observa una buena concordancia (diferencias 5 oC ) entre predicciones y resultados experimentales. En cualquier caso, puede sorprender que los per les optimos no permitan reducir mas la no homogeneidad de la temperatura, pero es preciso resaltar que la geometr a tipo paralelep pedo es la peor posible para ese n.
10.0 100 8.0 Thorno (oC) 80 60 40 20 0 500 1000 1500 Tiempo (s) 2000 6.0 4.0 2.0 0.0 2500 P (% Pmax)
Thorno P
Figura 7.17: Per les de control optimos para el calentamiento de un paralelep pedo, modelo no lineal.
55
60
65
70
75
Figura 7.18: Distribucion de temperaturas en el interior de un paralelep pedo a tiempo nal: calentamiento mixto optimo.
7.8. Resultados
217
0.1 0.09 0.08 0.07 0.06 0.05 0.04 0.03 0.02 0.01 0 0
Histograma de temperaturas a tf
z (m)
55
60
65
70
75
80
Figura 7.19: Distribucion de temperaturas en el plano medio de un paralelep pedo: calentamiento mixto optimo.
60 50 40 z 30 20 10 50 10 20 30 40 50 x 60 70 80 90 100 65 60 55 70
Figura 7.20: Distribucion real de temperaturas en el plano medio de un paralelep pedo: calentamiento mixto optimo. Con el n de ilustrar los bene cios del uso optimo de hornos mixtos frente al uso de hornos convencionales que calientan unicamente por conveccion, se ha resuelto el problema de control optimo equivalente pero utilizando la temperatura como unica variable de control (potencia de microondas nula). Como se pod a esperar, dado que el calentamiento por conveccion es mas lento, el per l optimo obtenido equivale a mantener la temperatura en su valor maximo la mayor parte del tiempo de proceso. En las guras 7.21 y 7.22, se representa el per l de control y la distribucion de temperaturas resultante a tiempo nal, respectivamente.
218
100 90 80 70 60 50 40 30 20 10 0
horno
(o C)
500
2000
2500
Figura 7.22: Distribucion de temperaturas en el interior de un paralelep pedo a tiempo nal, solo conveccion (modelo nolineal).
70 60 50 40 30 20 10 10 20 30 40 50 x 60 70 80 90 100 110 z 65 60 55 50 45 40 35 30 25
z (m)
Figura 7.23: Distribucion real de temperaturas en el plano medio de un paralelep pedo: calentamiento solo conveccion optimo.
7.9. Conclusiones
219
La validacion experimental de estos per les demuestra que, para el mismo tiempo de proceso, la uniformidad aumenta al utilizar la combinacion de conveccion y microondas obtenida. Si se comparan los resultados experimentales para los procesos de calentamiento por conveccion y mixto se observa que la temperatura obtenida en el segundo caso no solo es mayor sino que ademas es mas uniforme, suavizando los puntos fr os y calientes resultantes del calentamiento con microondas.
7.9 Conclusiones
Desde el punto de vista global, los objetivos expuestos inicialmente se cumplieron dado que se demostro que es posible suavizar los efectos no deseados de los dos modos de calentamiento por separado empleando pol ticas mixtas optimas, alcanzando resultados satisfactorios de uniformidad. Desde el punto de vista de la optimizacion, casi todos los problemas fueron resueltos satisfactoriamente con los metodos presentados en esta tesis (TNHp e HyMDO). Sin embargo la presencia de discontinuidades en el modelo no lineal correspondiente al paralelep pedo (P 7:5), causo di cultades a la resolucion con metodos deterministas limitando el uso de TNHp o HyMDO. Existen al menos tres posibilidades para resolver este problema. Por una parte, desarrollar el modelo en funcion de la entalp a evitar a la existencia de tales discontinuidades. Por otra, emplear tecnicas que reduzcan el efecto de la discontinuidad, mediante una aproximacion utilizando una funcion arcotangente. La primera resultaba demasiado costosa ya que supone rede nir la implementacion de CHAMPSPACK desde el principio. La segunda metodolog a permitir a la solucion de problemas con discontinuidades utilizando TNHp y se ha reservado para implementaciones futuras del metodo. En esta ocasion, se opto por una tercera v a, el uso del metodo estocastico ICRS/DS. En cuanto a la e ciencia de los metodos, se ha visto que, como era de esperar, los tiempos de computacion han ido aumentando a medida que la complejidad del modelo aumentaba. As , para TNHp se pasa de algo mas de dos minutos para la optimizacion del calentamiento de un cilindro a mas de una hora para la optimizacion del paralelep pedo lineal. El HyMDO, aunque mas e ciente que sus metodos constituyentes, tambien requirio mas de 1 h para la resolucion de problemas del tipo F 2. Por ultimo, la resolucion del problema de calentamiento del paralelep pedo no lineal necesito de alrededor de 3 h de tiempo de computacion. Es evidente que la simulacion del proceso es un factor determinante para la reso-
220
lucion de problemas de optimizacion dinamica de procesos distribuidos, tal y como ya se observaba en el cap tulo 6 con la resolucion del problema de esterilizacion y se con rma en la resolucion de los problemas vistos en este cap tulo. Surge pues la necesidad de utilizar modelos de orden reducido, es decir, modelos que, aunque de dimension peque~a, predicen el comportamiento del proceso de manera tal que n permiten la optimizacion de forma muy e ciente. Este sera el objeto de estudio del siguiente cap tulo de esta tesis.
En los cap tulos anteriores, se han presentado y evaluado diversas metodolog as tipo CVP para la optimizacion dinamica de procesos concentrados y distribuidos. Estas metodolog as tienen en comun que transforman el problema original en un problema tipo NLP maestro que requiere la solucion de un IVP, ya sea simple o extendido, para cada evaluacion. Desafortunadamente, y particularmente para aquellos procesos cuyo modelo es costoso en lo relativo a su simulacion (p. ej. procesos distribuidos como el tratamiento termico de alimentos), el esquema CVP requiere esfuerzos de calculo considerables dado el gran tama~o de los IVP que es preciso n resolver. Como resultado, hay una perdida de la e ciencia global del proceso de optimizacion. Esto ha llevado a la busqueda de metodos de aceleracion de las simulaciones basados en la reduccion del modelo dinamico. En este cap tulo se propone el uso de modelos de orden reducido generados a partir del metodo de descomposicion en funciones emp ricas (proper orthogonal decomposition, POD), que proporciona modelos de precision equivalente pero cuya solucion es considerablemente mas rapida, permitiendo as la resolucion de problemas que requieren gran numero de simulaciones en tiempos de computacion muy competitivos. En particular, se presenta la aplicacion de esta nueva metodolog a a la simulacion, dise~o y optimizacion dinamica del procesamiento termico de alimentos, con n resultados muy satisfactorios. 221
222
8.1 Introduccion
A lo largo de este trabajo se han presentado nuevas metodolog as de optimizacion dinamica y se han aplicado con exito a la solucion de problemas tanto concentrados como distribuidos. Sin embargo, y a pesar de haber demostrado ser muy e cientes en la resolucion de problemas concentrados, para el caso de sistemas distribuidos, el coste computacional crece de manera muy rapida debido, precisamente, a la necesidad de resolver numericamente el sistema de PDAEs que describe el proceso utilizando tecnicas como NMOL o elementos nitos (FE). Esta limitacion restringe la posibilidad de aplicaciones industriales en tiempo real, tales como la optimizacion en l nea o el control predictivo basado en modelo (model predictive control, MPC). Sin embargo, como se ha dicho en otras ocasiones, estas aplicaciones son de vital importancia para el buen desarrollo del proceso y para garantizar un alto rendimiento as como la veri cacion de las restricciones. Esto ha motivado la busqueda de modelos, denominados de orden reducido, que simulen el proceso de manera rapida pero a la vez rigurosa. La derivacion de modelos de orden reducido a partir de modelos muy complejos, ha sido objeto de estudio por parte de muchos autores, sobre todo en el area de control de procesos, pero la mayor a se han limitado a la reduccion de modelos lineales. Los metodos mas utilizados son el balance and truncate (B&T) (Tombs y Postlethwaite, 1987 Varga, 1991a), singular perturbation approximation (SPA) (Kokotovic, 1987 Liu y Anderson, 1989 Varga, 1991b) y Hankel norm approximation (HNA) (Glover, 1984). Tanto el primero de estos metodos (B&T) como el ultimo (HNA), se basan en el calculo de los llamados valores singulares de Hankel a traves de la solucion de las ecuaciones de Lyapunov. Estos coe cientes son invariantes temporales cuyos valores decaen rapidamente permitiendo la generacion de modelos reducidos y rigurosos. El uso de las llamadas tecnicas de balanceo permiten evitar el mal condicionamiento que en ocasiones surge en la resolucion de las ecuaciones matriciales. El metodo SPA se basa en la separacion de escalas temporales que presentan muchos procesos, e introduce un parametro (perturbacion) que multiplica a ciertos estados del sistema y cuyo valor permitira reducir la dimension del modelo original. Estos metodos parten de un sistema de ODEs lineal de dimension elevada y mediante diferentes tecnicas reducen su dimension. Recientemente se han desarrollado varios programas en MATLAB que generan automaticamente estos modelos1 y que estan descritos en Varga (1999).
1
http://www.win.tue.nl/niconet/NIC2/NICtask2A.html
8.1. Introduccion
223
Estas tecnicas ser an aplicables, por ejemplo, a los sistemas de ODEs resultantes de aplicar NMOL o FE a la solucion de una PDE, siempre y cuando esta fuese lineal. Sin embargo, la mayor a de los procesos de interes, y en particular los procesos de la industria de alimentos, son habitualmente no lineales (siendo la principal fuente de no linealidad los terminos cineticos) lo que impide utilizar esos metodos de reduccion de modelos. Es por ello que, en los ultimos a~os, muchos autores han hecho uso de metodos n espectrales, presentados en el cap tulo 1, que hacen uso de funciones espaciales globales que combinadas con un metodo de residuo ponderado, resultan en modelos aproximados de dimension reducida. Estos metodos se han aplicado con exito en el area de ingenier a de procesos, en particular en la resolucion de problemas de identi cacion, construccion de observadores y en el desarrollo de sistemas de control robusto (Sanchez et al, 2000 Alonso et al., 2000 y en los all citados). En la mayor a de estos trabajos se hace uso de las autofunciones propias del operador espacial, aprovechando la propiedad de los procesos disipativos de poseer escalas temporales tales que es posible separar dinamicas lentas y rapidas. Sin embargo, no siempre es sencillo calcular las autofunciones propias o simplemente conducen a un numero elevado de ecuaciones diferenciales. Esto es especialmente importante en el area de dinamica de uidos y turbulencia, en la que es preciso considerar la solucion de la ecuacion de Navier-Stokes. Es por ello que precisamente en el seno de la dinamica de uidos se desarrollo una nueva metodolog a de reduccion de modelos, la expansion de Karhunen-Loeve (tambien denominado proper orthogonal decomposition, POD) (Sirovich, 1987). Este metodo ha sido utilizado y revisado por diversos investigadores (Berkooz et al., 1993 Bangia et al., 1997, entre otros), demostrando que se trata de una herramienta e ciente aplicable a la simulacion de problemas generales no lineales que incluyen procesos de reaccion, difusion y conveccion. Debido al exito alcanzado en la simulacion de procesos muy no lineales, esta tecnica se ha vuelto muy popular en los ultimos a~os y se ha aplicado a la solucion n de un amplio rango de problemas. As , por ejemplo, en identi cacion y control de procesos (Burl, 1993 Shavrtsman y Kevrikidis, 1998 Alonso et al., 2001), estimacion de parametros (Park et al., 1998) y optimizacion estacionaria (Theodoropoulou et al., 1998 Bendersky y Christo des, 1999 y 2000). Aqu se presentara su uso para la derivacion de modelos de orden reducido de procesos distribuidos de complejidad arbitraria, relacionados con el tratamiento termico de alimentos. Asimismo se presentaran nuevas tecnicas de transformacion que sim-
224
pli can el uso del metodo de Galerkin y el manejo de terminos no lineales. Para nalizar, se presenta el uso de estos modelos para la resolucion de los problemas de dise~o y optimizacion dinamica de un problema de considerable interes n industrial, la esterilizacion termica de alimentos.
xt = (x) + (x) (8.1) donde ( ) denota un operador lineal parabolico de nido en un dominio con frontera suave y donde (x) es una funcion no lineal del campo x. La ec. (8.1) puede interpretarse como un sistema de dimension in nita en un espacio de Hilbert equipado con un producto interior y una norma de nidas como sigue: R (f g) = fgd y f 2= (f f ) 2 En general, la solucion a la ec. (8.1), se puede expresar en la forma:
L L k k
x( t) = ~
1 X
i=1
ai(t)'i ( )
(8.2)
en esta expresion los coe cientes ai son funciones del tiempo mientras que la base 1 f'i gi=1 contiene la dependencia espacial de la solucion. Cada elemento de esta base se puede considerar como la solucion de la ecuacion integral lineal:
K
Z 'i = i ( 0)'i( 0)d 0 (8.3) donde = ( 1 2 3) son las variables espaciales, i es un parametro asociado con cada uno de los elementos de la base y es el denominado nucleo (kernel) de la ecuacion integral. Se asume que las soluciones de una ecuacion integral de este tipo son ortonormales (Courant y Hilbert, 1937), por lo tanto ('i 'j ) = ij . Dependiendo de la naturaleza del nucleo ( 0 ), dos son los tipos de funciones espaciales posibles:
K K
1. La base espectral, que se deriva de la construccion del nucleo K como la funcion de Green asociada al operador espacial lineal L. 2. La expansion Karhunen-Loeve (proper orthogonal decomposition, POD) (Holmes et al., 1996), que se deriva de un nucleo o funcion de correlacion. Por simplicidad se dira que la primera base esta constituida por la autofunciones propias del operador espacial y que la segunda esta constituida por las llamadas autofunciones emp ricas. La naturaleza disipativa de los procesos de conveccion y difusion, hace que los parametros asociados a cada autofuncion ( i), que no son mas que las constantes de tiempo, esten ordenados de manera que los ultimos elementos de la serie se desvanecen mas rapidamente que los primeros. Como consecuencia, la precision de la aproximacion puede garantizarse con un conjunto nito, y habitualmente peque~o, n de terminos en la serie (8.2). En la gura 8.1 se representa esquematicamente el comportamiento t pico de un proceso dinamico disipativo. En ella se re eja que cualquier punto del dominio de de nicion del proceso evolucionara hasta un hiperplano de dimension baja, representado en la gura como un plano, y permanecera en ella en el futuro. Esta propiedad resulta muy atractiva y constituye la base del desarrollo de modelos de orden reducido. El tipo de funciones espaciales utilizadas sera determinante en la e ciencia del resultado nal. En este trabajo se propone el uso de las autofunciones emp ricas cuyas propiedades se ajustan a la solucion de un amplio rango de problemas y tienen ademas otras caracter sticas que las convierten en una opcion muy atractiva para el desarrollo de modelos de orden reducido:
226
Figura 8.1: Evolucion de un sistema dinamico disipativo. En primer lugar, se puede demostrar que este conjunto de funciones es optimo, en el sentido de que, a igual precision, requiere menor numero de funciones espaciales que cualquier otra expansion (Sirovich, 1987 Berkooz et al, 1993). En segundo lugar, se calculan de manera muy sencilla a partir de datos experimentales o de datos obtenidos por simulacion directa, para cualquier tipo de proceso distribuido independientemente de la geometr a o la no linealidad del mismo. A continuacion se presenta el calculo teorico de esta base de autofunciones emp ricas.
Dado un conjunto de funciones x( ), el problema consiste, por lo tanto, en encontrar un conjunto de funciones base '( ) representativo del conjunto original. Este problema de optimizacion se puede formular como la maximizacion de su proyeccion sobre el conjunto de funciones originales. Matematicamente se expresa como sigue: max J = max < (' x)2 > ; (' ') ; 1] (8.4) ' ' A continuacion se resumen los pasos para la solucion de esta ecuacion (Courant y Hilbert, 1937): 1. Sea '( ) = ' ( ) + " ( ), donde ' corresponde al optimo, " es un parametro y es una funcion prueba en la vecindad de ' . 2. Maximizar el objetivo por el metodo de las variaciones, supone calcular: # " dJ ' = ' + " ( )] (8.5) d" "=0 lo que supone la solucion de la ecuacion integral lineal:
Z " Z
0
!
;
'( ) ( )d = 0
(8.6)
(8.7)
que es la solucion al problema variacional equivalente a la expresion (8.3), pero donde el nucleo K ya se de ne como un operador de correlacion.
K
(8.8)
ZZZ
r
'(r z)
(8.9)
228
A primera vista esta ecuacion parece semejante a la ec. (8.7). Sin embargo la presencia del radio en el diferencial de volumen complica su resolucion ya que el nucleo, ahora, no es simetrico (Citriniti, 1996). Con el n de resolver este problema utilizando la teor a de Hilbert Schmidt sera necesario reformular el problema y conseguir que el nucleo sea simetrico. Para ello se multiplica toda la ecuacion por p r, resultando:
ZZZ
r z
'(r z) (8.10)
(8.11)
< rx r0x0 > dr0d 0dz0 = (r z) r z De tal forma que el nucleo 0 =< rx r0x0 > es ahora simetrico.
p p K p p
ZZZ
(8.12)
con:
` k 1 X(xT ; wT )(x ; w ) ; X ('T ' ; 1) J ('j x) = ` (8.13) j j j j j j j j =1 j =1 donde wi = Pk=1 aij 'j , es la proyeccion del vector de datos uj en la nueva base. La j solucion a este problema de optimizacion (Luenberger, 1969) lleva al calculo de las funciones 'j que satisfacen:
R'j =
j 'j
(8.14)
xi = 'ai + "
(8.16)
k donde " es un vector de error, ortogonal a la base SB , que indica la distancia a la que se encuentra cada dato del conjunto Sd del subespacio. La distancia media entre k el conjunto de datos Sd y la base calculada SB se calcula como sigue: ` ` k X X X 2 Dav = 1 d2 = 1 xT xj i j ` ` i=1 j =1
;
` Notese que k = ` implica que Dav = 0, es decir, SB y Sd son equivalentes, y por lo tanto: ` X i=1 i
i=1
(8.17)
=1 `
` X j =1
xT xj j
(8.18)
as que los autovalores proporcionan una medida de lo proximos que estan los datos a la base de autofunciones emp ricas. De forma que cuanto mas proximo esta k de l menor es la distancia. Combinando las expresiones (8.17) y (8.18), se obtiene:
1 0 l 12 X A Dav = @ i
La seleccion de la dimension del subespacio se realiza en funcion de la cantidad de energ a capturada por el modelo reducido, y de nida:
i=k+1
(8.19)
230
Pk = Pil=1
i i=1 i
(8.20)
En este caso, conduce a un conjunto de autofunciones emp ricas . Sin embargo, esta funciones no son validas para expresar el campo ya que, por la forma en que se calculan, no permiten recuperar la dinamica del sistema en el origen (r = 0). Para subsanar este problema, en este trabajo se propone un metodo para recuperar las autofunciones 'i a partir de las funciones i, teniendo en cuenta que se i relacionan de la forma 'i = pr . Para ello se aproximaran las primeras, con la mayor precision posible, mediante el calculo simbolico de polinomios tales que veri quen las condiciones de contorno. Habitualmente, en el origen se impone una condicion de simetr a tal que:
"
)
@'i @r
#
r=0
=0
(8.23)
se asume que el polinomio es de la forma g(r) = rP (r), garantizando as el cumplimiento de la ec. (8.25).
# ! @'i r @ i i (8.24) @r r=0 = r @r 2r = 0 El termino de la derecha @@ri 2ri se aproxima por un polinomio g(r) tal que se veri que la ec. (8.24), es decir: ! r g (r ) 0 (8.25) lim r !0 r
; p !
@ i i (8.26) @r 2r = rP (r) resolviendo la ecuacion diferencial resulta la siguiente expresion para las funciones :
;
= c0 r +
p
N X 2cj+1 j+2 r j =0 3 + 2j
(8.27)
'i = c0 +
N X 2cj+1 j+3=2 r j =0 3 + 2j
(8.28)
( t) = xt ; (L(~) + (~)) ~ x x
(8.29)
Proyectando el residuo sobre las funciones prueba, e imponiendo la condicion de ortogonalidad resulta:
Z
R
( t)'i( )d = 0 i = 1 ::: N
(8.30)
Substituyendo la ec. (8.2) en la ec. (8.29), aplicando la condicion de ortogonalidad (8.30) y usando la propiedad de ortonormalidad de las funciones prueba, se obtiene el siguiente conjunto de ecuaciones diferenciales:
232
ai(t) = _
k X
k X
(8.31) (8.32)
ai (0) =
x( 0)'i( )d
i = 1 ::: N
x( t) = ~
k+NB X i=1
ai(t)'i( )
(8.33)
donde NB es el numero de condiciones frontera no homogeneas y las funciones 'i no veri can las condiciones frontera. Estas se imponen a la hora de calcular los coe cientes ai mediante la proyeccion sobre las condiciones frontera del proceso. El sistema de ODEs resultante consiste en k + NB ecuaciones y por lo tanto, a medida que aumenta la dimension del problema aumenta tambien el tama~o del modelo n reducido. Aqu se presenta el uso de un metodo alternativo, que no requiere el aumento del numero de ODEs y que consiste en trasformar el problema con condiciones frontera no homogeneas en uno equivalente pero con condiciones frontera homogeneas. Para ello se transformara el problema original en una forma adecuada dependiendo del tipo de condicion frontera. La transformacion propuesta consiste en de nir un nuevo campo !, como sigue:
!( t) = x( t)
( t)
(8.34)
donde, para el caso de condiciones frontera de primer orden se veri ca que: = F1 (t ) y para el caso de condiciones frontera de segundo orden, satisface: (8.35) sera una funcion que
@ = F (t ) (8.36) @n 2 Estas transformaciones conducen a PDEs en las que aparecen expl citamente las variables de control, o sus derivadas temporales.
(8.37)
Es evidente que la integral (8.37) no tiene una solucion anal tica en los terminos ai. Sin embargo, se puede obtener su valor, como funcion de los coe cientes temporales, bien mediante resolucion numerica o bien haciendo un desarrollo en serie de Taylor del termino exponencial, alrededor de un valor seleccionado previamente de los coe cientes ai . La primera posibilidad, requiere un elevado tiempo de computacion, y esto es especialmente indeseable en aplicaciones de dise~o y optin mizacion. La segunda posibilidad no es rigurosa y no es valida a no ser que las condiciones de simulacion esten proximas a la referencia. Una tercera posibilidad consiste en utilizar el denominado metodo de la transformada rapida de Fourier (fast Fourier transform, FFT) descrito por ejemplo en Gottlieb y Orszag (1977) y Fletcher (1984). Muy brevemente el metodo hace uso de desarrollos en serie adecuados (tales como las series de Fourier) para evaluar de manera recursiva los terminos diferenciales del operador espacial. Estas ideas se combinan con un metodo de colocacion que supone la evaluacion de los terminos no lineales en un conjunto dado de puntos del dominio espacial que se pueden hacer coincidir, por ejemplo, con los ceros de la ultima autofuncion emp rica utilizada para
234
el desarrollo en serie del campo (ver por ejemplo, Theodoropoulou et al., 1998, que aplican esta metodolog a a un problema unidimensional). Sin embargo, este metodo de colocacion puede dar como resultado un elevado numero de ODEs, p. ej. en casos en los que el dominio de de nicion del proceso es bidimensional o tridimensional. Tambien se ha considerado la aproximacion de los terminos no lineales utilizando redes neuronales (Rico-Mart nez et al, 1995). Sin embargo, es bien conocido que el entrenamiento de la red neuronal requiere la solucion de un problema de optimizacion y la implementacion practica del modelo conlleva mucha labor previa. En este trabajo se propone una nueva alternativa, que se basa en la de de nicion de dos nuevos campos y v como sigue: = exp(v) (8.38)
v = g(u) (8.39) El sistema resultante consiste en 3 PDEs acopladas, una para cada campo (x, y v). As , suponiendo que la parte lineal del operador espacial, corresponde al operador Laplaciano ( ( ) = 2( )), las ecuaciones resultantes quedaran:
L r
1. Es muy facil de utilizar, lo unico que requiere es una reformulacion del problema, que se puede realizar automaticamente con un programa de manipulacion simbolica. 2. El sistema de PDEs resultante es completamente equivalente al original (8.1), donde los terminos no lineales son polinomicos, facilmente manejables en el metodo de Galerkin. 3. Cada una de estas variables puede aproximarse por un desarrollo en serie de la forma (8.2), donde las funciones espaciales pueden calcularse utilizando el metodo POD.
4. Por ultimo, aunque supone un incremento de ODEs en el modelo reducido, el numero de ecuaciones nal sera siempre menor que el resultante de usar el metodo de colocacion, salvo quizas en el caso unidimensional.
236
Tr (0 t) = 0 T (R t) = Text(t)
y a las condiciones iniciales:
(8.44) (8.45)
T (r 0) = T0 (8.46) donde, Text es la temperatura en el medio que rodea a la esfera y var a con el tiempo. A continuacion se detallan los pasos a seguir para el desarrollo del modelo de orden reducido:
En primer lugar, y dado que la condicion frontera en r = R es no homogenea, se hacen las transformaciones adecuadas segun lo expuesto en la seccion 8.2.4. En este caso se hara una transformacion del primer tipo (ec. (8.35)), ya que la condicion frontera es de primer orden. La nueva PDE queda como sigue:
(8.47)
Siguiendo los pasos descritos en la seccion 8.2, se simula un modelo nominal obtenido a partir del uso del NMOL (Schiesser, 1991), bajo un numero de condiciones para obtener, de esta forma, el conjunto de datos (Sd). En la gura 8.2 se muestran los resultados t picos de resolver la ecuacion 8.47.
0 5 10 w 15 20 25 30 0.04 0.03 0.02 r (m) 0.01 0 0 2000 6000 4000 Tiempo (s)
8000
Figura 8.2: Resultado t pico de la simulacion de la variable transformada ! en el caso del calentamiento de una esfera. Estos snapshots seran utilizados para la generacion del modelo reducido. La solucion del problema de autovalores dado en la ec. (8.21) resulta en el calculo de las autofunciones emp ricas que se usaran en el metodo de Galerkin. En la gura 8.3 se muestra la energ a capturada por las primeras autofunciones.
100 99.5 Energa (%) 99 98.5 98 97.5 1
3 4 5 Nmero de autofunciones
Figura 8.3: Energ a capturada por las primeras autofunciones emp ricas en el problema de calentamiento de una esfera. Para este caso particular, se observa que la cuarta autofuncion ya captura un 99:9999% de la energ a total, as que en esta ocasion se utilizaran 4 funciones prueba para el desarrollo del modelo. En la gura 8.4 se muestran estas cuatro funciones espaciales.
238
0.04 0.02 0 0 0.25 3 0.2 0.15 0.1 0.05 0 0.05 0.1 0 0.01 0.02 0.03 r (m) 0.04 0.01 0.02 0.03 r (m) 0.04
0.1 0.15 0.2 0 0.2 0.15 0.1 0.05 0 0.05 0.1 0.15 0 0.01 0.02 0.03 r (m) 0.04
4
0.01
0.04
Figura 8.4: Cuatro primeras autofunciones emp ricas para el caso del calentamiento de una esfera. Para el desarrollo del modelo de orden reducido se aplicara el metodo de Galerkin. Con tal n se obtienen las funciones 'i a partir de las i calculadas en el apartado anterior, por el metodo propuesto en la seccion 8.2.2. Aplicando el metodo de Galerkin se obtiene el modelo de orden reducido:
X ai = diT_ext + bi j aj i = 1 : : : k _
k j =1
(8.48)
di = 'i rdr (8.49) r Z 2' bi j = ( 'i( @@r2j + 1 @'j )rdr) (8.50) r @r r El modelo de orden reducido obtenido, consistente en 4 ODEs, se comparo con el nominal calculado usando NMOL, para varios per les de control, con
239
resultados muy satisfactorios. A modo de ejemplo, se muestra en la gura 8.5, la evolucion temporal de la temperatura en varios puntos en el interior de la esfera calculada con el modelo nominal y con el modelo de orden reducido, demostrandose la adecuada capacidad predictiva del modelo reducido, con un error maximo de 0:28 o C .
Temperatura ( C) 100
o
90
80
70
60
50
40
1000
2000
3000
5000
6000
7000
8000
Figura 8.5: Comparacion de los modelos nominal (l neas) y reducido (s mbolos) en la simulacion del proceso de calentamiento de una esfera.
240
La optimizacion dinamica de este tipo de procesos continua siendo un problema de gran interes para la comunidad cient ca. Ejemplos de algunos trabajos recientes son los de Terajima y Nonaka (1996), Chalabi et al. (1999), Willigenburg y Straten (1999), Alvarez-Vazquez y Mart nez (1999) y Kleis y Sachs (2000). La mayor a de estos trabajos se basan en el uso de modelos mas o menos rigurosos basados en las leyes de conservacion, expresadas, generalmente, como balances microscopicos. De hecho, la practica totalidad de los metodos de la ingenier a de procesos se basan en el uso de modelos, y aunque el potencial del uso de modelos matematicos es enorme (Fryer, 1994 Verboven et al., 1997), es habitual que la complejidad de tales modelos implique un elevado coste computacional de simulacion. Por supuesto, las aplicaciones en tiempo real, tales como optimizacion en l nea o control predictivo basado en modelo (MPC) que requieren una simulacion rapida del modelo, quedan descartadas. Ejemplos claros de esto son los procesos de tratamiento termico de alimentos considerados en los cap tulos anteriores. Esta situacion es frecuente en la ingenier a de alimentos, y en particular en el procesado termico ya que los modelos consisten PDAEs no lineales. Por lo tanto, la resolucion de problemas de dise~o y optimizacion, que requieren un numero elevado n de simulaciones (Banga et al., 1991), se vuelve demasiado costosa para aplicaciones industriales en tiempo real. En los ultimos a~os se han dedicado grandes esfuerzos a la busqueda de moden los simpli cados del procesamiento termico de alimentos, que conserven el caracter predictivo del modelo riguroso basado en primeros principios pero cuya solucion sea mas rapida. As se han desarrollado modelos semiemp ricos (por ejemplo, Noronha et al., 1995 Kim y Teixeira, 1997), que aunque utiles en determinadas situaciones (Teixeira et al., 1999), tienen algunas limitaciones: 1. Tienen caracter local, es decir son validos unicamente para un alimento particular y unas condiciones experimentales particulares. 2. Debido a su naturaleza semi-empirica, no es posible conocer a priori la precision que proporcionan o asegurar su robustez. 3. Por ultimo, no pueden utilizarse para calcular ciertas magnitudes relevantes tales como la retencion de nutrientes o propiedades organolepticas. Aqu se presentara el uso del metodo POD descrito para la derivacion de modelos de orden reducido que describan de manera rigurosa el procesamiento termico, superando as estas limitaciones.
241
t)
(8.51)
valida en un dominio de nido por las coordenadas espaciales , siendo v(x), f (x), k(x) y q(x t) funciones no lineales del campo, v(x) y k(x) corresponden a terminos de conveccion y conduccion respectivamente, mientras que q(x t) incluye posibles efectos de generacion de calor. Esta formulacion permite la descripcion de practicamente todos los procesos de calentamiento de alimentos, incluyendo solidos y l quidos. En el caso de la esterilizacion termica de alimentos solidos, x = T , q = v = 0 y la Eqn. (8.51) resulta:
! @f (T ) T (k(T ) T ) (8.52) @t con la condicion inicial T ( t = 0) = T0( ). Donde k(T ) es la conductividad termica y f (T ) una funcion no lineal de la forma:
Tt = f (1 ) T
r r ;
f (T ) = (T )c(T )
(8.53)
siendo y c la densidad y la capacidad calor ca del alimento, respectivamente. La ecuacion (8.52), describe la dinamica de evolucion de la temperatura en el solido. La degradacion de las esporas de microorganismos y la de los nutrientes puede describirse tambien utilizando la ecuacion (8.51) con las siguientes sustituciones:
242
El campo general u se sustituye por la concentracion de la especie de interes Ci(t ). El termino general de generacion q(u t) se sustituye por la correspondiente cinetica de degradacion dependiente de la temperatura ri (Ci T ) Si se asume que la especie de interes no se distribuye ni por conveccion ni por difusion como sucede, por ejemplo, en los alimentos solidos, v = k = 0, y se obtiene:
dCi(t ) = r (C T ) (8.54) i i dt La cinetica de la destruccion termica de microorganismos o la degradacion de nutrientes se asume que satisface una cinetica de pseudo-primer orden de acuerdo con un modelo TDT (thermal death time, Stumbo, 1973), de manera que la ec. (8.54) resultante es: dCi(t) = ( ln 10 )C (t) exp( T (r z t) Ti ref ) (8.55) dt Di ref i zi ref donde el sub ndice i se re ere bien a las esporas de microorganismos bien a los nutrientes de interes. Di ref y zi ref se corresponden con los parametros cineticos a la temperatura de referencia Ti ref . Con el n de resolver la ec. (8.51), deben imponerse ademas condiciones frontera adecuadas.
; ;
@T = k @ 2 T + 1 @T + 1 @ 2 T + @ 2 T @t c @r2 r @r r2 @ 2 @z2
(8.56)
243
donde las propiedades de los alimentos se han supuesto independientes de la posicion y de la temperatura. Si se considera ademas un medio isotropo, de manera que se pueden imponer condiciones de simetr a, la ec. (8.56) se reduce a:
! @T = @ 2 T + 1 @T + @ 2 T (8.57) @t @r2 r @r @z2 donde es la difusividad termica. Las condiciones frontera en el exterior del cilindro, son de la forma:
T (R z t) = Tret (t) T (r L t) = Tret (t)
(8.58) (8.59)
Notese que sera igualmente sencillo considerar coe cientes de transferencia de calor en la super cie del envase. Sin embargo, la anterior es la formulacion habitual en la bibliograf a. Las condiciones de simetr a son (considerando un cuarto del plano medio): @T (0 z t) = 0 (8.60) @r @T (r 0 t) = 0 (8.61) @z
T (r z 0) = T0 (8.62) La degradacion termica de las esporas microbianas o de la calidad se modelizan utilizando el modelo TDT (ec. (8.55)). La expresion de la cinetica correspondiente a los nutrientes, permite el calculo de la retencion volumica media a tiempo nal, lo que dara una medida precisa de la calidad del producto:
1 Z VT exp ; ln 10 Z tf exp T (r z t) ; TN ref ln 10 dt dV (8.63) retN (tf ) = V DN 0 ZN ref T 0 Ademas se considerara la letalidad en el punto cr tico como medida de la destruccion de los microorganismos:
;
! !
Z tf Tc(t) TM ref Fc(t = tf ) = 10 ZM ref dt (8.64) 0 Los parametros del caso estudiado se presentan en la tabla 8.1, y corresponden a un pate de cerdo, tal y como fue considerado por Teixeira et al.(1975) y Banga et al. (1991), entre otros.
244
Radio envase (R, m) 0:04375 Altura envase (2L, m) 0:1160 2 s;1 ) (m 1:5443 10;7 T0(oC ) 71.11 Microorganismo Bacillus Stearothermophilus zM ref (oC ) 10:0 DM ref (s) 240:0 TM ref (oC ) 121:11 Nutriente Tiamina zN ref (oC ) 25:56 DN ref (s) 10716:0 oC ) TN ref ( 121:11 Tabla 8.1: Parametros del problema de esterilizacion de pate de cerdo.
245
T (Temperatura e enfriamiento)
Tiempo subida
Perodo calentamiento tf
Figura 8.6: Per l de temperatura t pico (CRT) durante un proceso de esterilizacion. La letalidad microbiana se mide habitualmente de dos formas: en la primera se calcula una media volumetrica (Fs) y en la segunda se calcula la letalidad en el punto cr tico (Fc), que para geometr as regulares, condiciones frontera simetricas y alimentos calentados por conduccion, se toma como el centro geometrico. Para el caso considerado en este trabajo y desde el punto de vista practico, es su ciente considerar que el punto cr tico coincide con el centro geometrico del cilindro. Sin embargo, es importante destacar que para alimentos no homogeneos y anisotropos, el punto de menor letalidad al nal del proceso no coincide con el centro geometrico, y de hecho, no es un punto estacionario (Banga et al., 1993). Para un valor deseado de letalidad, Fc obj , y para unas temperaturas de calentamiento y enfriamiento dadas, el problema de dise~o puede enunciarse como sigue: n Encontrar el tiempo de calentamiento (th) para una cierta temperatura de calentamiento (Th) con el que alcanzar un valor deseado de letalidad (Fc obj ) a tiempo nal (es decir, despues del per odo de enfriamiento). El problema es equivalente a encontrar los ceros de la funcion Fc = Fc obj que se de ne como una funcion unidimensional de th: 0 = Fc(tf ) ; Fc obj =
Z tf
0
10
(8.65)
246
transferencia de calor, con las condiciones frontera dependientes de la temperatura en el autoclave Tret(t). Para la solucion de la ecuacion no lineal (ec. (8.65)) se ha utilizado el metodo de Muller implementado en la rutina DZREAL de IMSL. El dise~o del proceso termico de un alimento envasado con una geometr a dada, se n realiza habitualmente para un conjunto de temperaturas de calentamiento y un rango de valores deseados para la letalidad en el punto cr tico. Ademas, se suele calcular la retencion de nutrientes equivalente para cada una de las soluciones obtenidas, de forma que es posible evaluar la in uencia de la condiciones de proceso en la calidad del producto nal. Los resultados obtenidos se presentan en modo gra co, representando la retencion de nutrientes frente a la temperatura de calentamiento, con un numero de curvas que corresponden a distintos valores de la letalidad (ver por ejemplo, Teixeira et al., 1969). Estas curvas son muy utiles para visualizar el impacto que tiene el cambio en las condiciones de operacion en la calidad nal del producto. De hecho es muy facil identi car que procesos corresponden a una mayor retencion de nutrientes para cada valor de la letalidad. En cuanto al tiempo de computacion requerido para la resolucion del problema de dise~o, la resolucion de la ec. (8.65) requiere un numero reducido de evaluaciones n del modelo, de manera que se puede resolver rapidamente en un PC. Sin embargo, el calculo de las curvas mencionadas, que es el objetivo real, requiere la resolucion de esa ecuacion un numero de veces relativamente elevado. Notese que para la evaluacion de la funcion es necesario resolver el sistema de ecuaciones que describe el proceso (es decir, la ecuacion de conduccion de calor y la letalidad microbiana). Una vez se ha calculado el tiempo de calentamiento, se calcula la retencion de los nutrientes integrando la correspondiente cinetica. Por consiguiente, como se vera, el uso de modelos de orden reducido puede jugar un papel muy importante en la reduccion del tiempo de computacion total, garantizando, una buena precision en los resultados.
247
Cuando el problema se reduce a encontrar el mejor per l de calentamiento constante (per l CRT), la solucion se obtiene facilmente mediante el proceso de dise~o n descrito en la seccion anterior o de manera mas precisa, combinando un metodo de optimizacion con el proceso de dise~o. n El problema de encontrar el per l general optimo de temperatura es mas complicado. Teixeira et al. (1975) fueron los primeros en considerar las ventajas de usar un per l de calentamiento variable para maximizar la retencion de nutrientes. Para ello utilizaron un metodo ad hoc basado en la evaluacion de diferentes per les de formas prede nidas sin utilizar ningun metodo de optimizacion. Saguy y Karel (1979) fueron los primeros en formular el problema como un problema de optimizacion dinamica, presentado una solucion basada en el uso del principio maximo de Pontryagin, y concluyendo que los per les variables (per les VRT) apenas ofrec an mejoras con respecto a los per les CRT en cuanto a la retencion de nutrientes se re ere. Nadkarni y Hatton (1985) criticaron esta metodolog a y presentaron una alternativa basada en el principio maximo distribuido. Sin embargo, algunos trabajos posteriores sugieren que los resultados obtenidos no eran optimos, probablemente debido a algun error en la simulacion del proceso en la etapa de enfriamiento. En el trabajo de Banga et al. (1991) se propone el uso de un metodo directo basado en CVP, a n de transformar el problema original en un NLP que se resuelve utilizando un metodo de optimizacion estocastico (ICRS/DS). Se consideraron varias funciones objetivo, concluyendo que, para los casos en los que se maximizaba la calidad super cial o se minimizaba el tiempo de proceso, los per les VRT pod an ser muy competitivos, mejorando en muchos casos los resultados obtenidos con los clasicos CRT. Estos resultados fueron con rmados posteriormente por otros autores (ver por ejemplo las revisiones de Silva et al., 1993 o Durance, 1997). El problema sigue siendo objeto de estudio como lo prueban los numerosos trabajos publicados al respecto (Terajima y Nonaka, 1996 Chalabi, Willigenburg y Straten, 1999 AlvarezVazquez y Mart nez, 1999 Kleis y Sachs, 2000). Aqu se considerara la resolucion del problema de maximizacion de la retencion nal de nutrientes, retN (tf ), imponiendo una restriccion sobre la letalidad y otra sobre la temperatura nal en el punto cr tico. Para ello se utilizara un metodo directo basado en CVP, y el modelo de orden reducido obtenido de la aplicacion del metodo POD. La formulacion matematica del problema es como sigue: Encontrar Tret (t) en el intervalo t 2 t0 tf ] para maximizar: sujeto a:
J = retN (tf )
(8.66)
248
- la dinamica del sistema ecs. (8.55)-(8.63), - una restriccion a tiempo nal en la temperatura maxima permitida en el interior del alimento: Tc(r z t = tf ) Tmax tf 8r z 2 VT (8.67) - una restriccion en el valor de letalidad en el punto cr tico a tiempo nal: Fc(t = tf ) Fc obj (8.68) - l mite superior e inferior para la temperatura del autoclave, la maxima re ejando las limitaciones f sicas debido al l mite de presion en el interior del autoclave y la m nima debida a la temperatura del medio de enfriamiento: min max Tret Tret Tret (8.69)
ln 10 ( @! @ ; @! @ ) Di ref @r @r @z @z (8.72)
249
Notese que con esta transformacion, la no linealidad de tipo exponencial que aparec a en el modelo original se reduce a un termino bilineal en las derivadas espaciales de ! y , permitiendo la aplicacion del metodo de Galerkin. Las condiciones iniciales para (8.70) y (8.72) son: !(r z 0) = T0 ; Tret (0) (8.73) ln 10 !(r z 0)) ; 1 (r z 0) = exp( D (8.74)
i ref
@lnCN = ( ln 10 ) exp( Tret (t) TN ref )( (r z t) + 1) @t DN ref zN ref donde, por conveniencia, se usa lnCN en lugar de CN .
; ;
(8.75)
Se ha simulado el modelo nominal utilizando el metodo NMOL (Schiesser, 1991). En las guras 8.7-8.9, se muestran resultados t picos y, a modo de ejemplo, 4 snapshots de la matriz Sd para cada una de las variables.
8000 8000
Tiempo (s)
Tiempo (s)
6000
6000 4000 2000 0 0.05 0.03 z (m) 0.01 0 0.04 0.02 r (m)
0.8
0.6
0.4
0.2
250
8000
Tiempo (s)
6000 4000 2000 0 0.05 0.03 z(m) 0.01 0 0.22 0.18 0.14 0.1 0.06 0.02 0.04 0.02 r (m)
Figura 8.9: Snapshots t picos para la variable lnCN en el problema de esterilizacion. Una vez recopilados los datos se resuelve el problema de autovalores. En la gura 8.10 se muestra la energ a capturada por las primeras autofunciones, para cada una de las tres variables.
100 99.5 99 98.5 98 97.5 97 96.5 96 95.5 95 1 Ln CN
Energa (%)
3 4 5 Nmero de autofunciones
Figura 8.10: Energ a capturada por las primeras autofunciones emp ricas en el problema de esterilizacion de alimentos.
251
De la gura 8.3 se deduce que para describir el proceso de manera muy precisa, basta con tomar 5 autofunciones para describir la variable !, otras 5 para , y 3 para lnCn capturando, de esta forma un 99:999% de la energ a total. Estas autofunciones se muestran en las guras (8.11) - (8.13).
1 0 -0.02 -0.04 0.05 0.025 z (m) -0.05 0.05 0.04 0.025 z (m) 0.04 0 0 4 0.02 r (m) 0.05 0 2
0 0 3
0.02 r (m)
0.05 0 -0.05 0.05 0.025 z (m) 0.05 0 -0.05 0.05 0.04 0.025 z (m) 5
0 0
0.02 r (m)
Figura 8.11: Autofunciones emp ricas para la descripcion de la variable ! en el problema de esterilizacion.
252
0.02 0 -0.02 -0.04 0.04 0 0 0.02 r (m) 0.05 0.025 z (m) 0.04 0 0 0.02 r (m)
4
0 0
0.02 r (m)
Figura 8.12: Autofunciones emp ricas para la descripcion de la variable en el problema de esterilizacion.
253
-0.02 -0.025
0.05
0 0
0.02 r (m)
Figura 8.13: Autofunciones emp ricas para la descripcion de la variable lnCN en el problema de esterilizacion. Cada una de estas variables puede aproximarse por un desarrollo en serie de la forma:
!(r z t) = ~
k! X i=1 k i=1
a!i (t)'!i(r z)
~ (r z t) = X a i (t)' i(r z)
X ~ lnCN (r z t) = aNi(t)'Ni(r z)
kN i=1
Como paso previo a la generacion del modelo reducido se calculan las funciones ' a partir de las funciones , tal y como se hizo para el caso del calentamiento de la esfera. El modelo de orden reducido se calcula sustituyendo las
254
expresiones (8.76-8.78) en las ecuaciones (8.70-8.75) y proyectando sobre las autofunciones propias calculadas para !, y lnCN . De esta forma, se obtiene la dinamica de los coe cientes temporales a!i , a i y aNi :
k! X j =1
b!ij a!j i = 1 k!
j
(8.79) (8.80)
con i j = 1 k y k = 1 k! .
X ln aNi = ( D 10 ) exp( Tret(tz) TN ref )(cNi + bNij a j ) _ (8.81) N ref N ref j con i = 1 kN j = 1 k Donde los terminos b y c en las ecuaciones (8.79)-(8.81) se calculan a partir de la proyeccion de Galerkin:
; ;
b!ij = b
Z
VT
(8.82)
ij
Z
VT
(8.83)
(8.84)
bNij =
Z
VT
'Ni' j dV i = 1 kN j = 1 N
(8.85)
c!i =
Z
VT
'!i(r z)dV i = 1 k!
(8.86)
255
c i=
Z
VT
(8.87)
cNi =
Z
VT
'Ni(r z)dV i = 1 kN
(8.88)
Finalmente, se obtiene el modelo reducido que consta de un total de 14 ODEs: 5 ODEs describen la distribucion de temperaturas, 8 ODEs describen la degradacion de nutrientes y la ecuacion restante describe la letalidad en el punto cr tico (Fc).
256
110 100 90 80 70 60 50 40 30
Temperatura ( o C) Tret
20 0
1000
2000
3000
6000
7000
8000
Figura 8.14: Comparacion de los modelos nominal (l neas) y reducido (s mbolos): simulacion de la distribucion de temperaturas en el proceso de esterilizacion (se muestran las T en varios puntos del alimento).
25 20 15 10 5 0 0 2000 4000 6000 Tiempo (s) 8000 F (s) C Nominal Reducido RetN(t) 1 0.98 0.96 0.94 0.92 0.9 0.88 0.86 0.84 0.82 0 Nominal Reducido
2000
8000
Figura 8.15: Comparacion de los modelos nominal (l nea) y reducido (s mbolo): simulacion de la letalidad en el punto cr tico.
Figura 8.16: Comparacion de los modelos nominal (l nea) y reducido (s mbolo): simulacion de la retencion volumica media de nutrientes.
257
Como se observa en las guras, el modelo de orden reducido representa con gran precision la dinamica del proceso, siendo practicamente indistinguibles los resultados obtenidos por uno y otro modelos. Esto es especialmente importante si se tiene en cuenta que el tama~o del modelo nominal es 240 veces el tama~o del modelo n n reducido. No es, por tanto, sorprendente que en 1 s (PC Pentium III/ 450 MHz) se realicen 64 evaluaciones del modelo reducido, mientras que la simulacion del modelo nominal requiere 1193 s de tiempo de computacion. Parece, pues, evidente que el modelo reducido calculado en este trabajo sera un muy buen candidato para la solucion rapida y precisa de los problemas de dise~o y optimizacion descritos en las n secciones 8.4.1 y 8.4.2 respectivamente.
258
tados se muestran en las guras 8.17 y 8.18 donde la retencion nal de nutrientes y los tiempos de computacion se representan frente a la temperatura del autoclave para varios valores de la letalidad.
0.6 0.5 0.4 0.3 0.2 0.1 0 110 115 120 125 130 Temperatura (oC) 135 140 Fc = 8 min Fc = 10 min Fc = 12 min Fc = 14 min Fc = 16 min Fc = 18 min Retencin (%)
Figura 8.17: Resultados obtenidos con el modelos reducido para el problema de dise~o del proceso de esterilizacion: retencion de nutrientes. n
350 300 250 200 150 100 50 0 th ( tiempo de calentamiento, min) Fc = 8 min Fc = 10 min Fc = 12 min Fc = 14 min Fc = 16 min Fc = 18 min
110
115
120
135
140
Figura 8.18: Resultados obtenidos con el modelos reducido para el problema de dise~o del proceso de esterilizacion: tiempo de calentamiento. n
259
260
140 120 Temperatura ( o C) 100 80 60 40 20 Perfil ptimo de temperatura Tret Temperatura en el punto crtico Tc 0 1000 2000 3000 4000 5000 6000 7000 8000 Tiempo (s)
Figura 8.19: Per l de control optimo y temperatura en el punto cr tico para el proceso de esterilizacion de alimentos. Resultados obtenidos con el modelo reducido.
F C
2000
100 95 90 85 80 75 70 65 60 55 50 45 8000 0
Retencin (%)
2000
8000
Figura 8.20: Evolucion temporal de la Figura 8.21: Evolucion temporal de la retencion volumica media de nutrientes letalidad en el punto cr tico corresponcorrespondiente a la pol tica optima de diente a la pol tica optima de operacion. operacion.
261
El uso del modelo nominal llevo a resultados similares pero con un tiempo nal de computacion de 720 s. Por lo tanto, se ha reducido el tiempo total en 15 veces, ya que la optimizacion del modelo reducido ha requerido un menor numero de evaluaciones de la funcion, lo que supone una ventaja adicional. Aunque estos resultados demuestran las ventajas de usar un modelo de orden reducido, una comparacion mas detallada permitira extraer nuevas conclusiones. En la gura 8.22 se presenta una comparacion de las curvas de convergencia de los dos procesos de optimizacion. En esta gura destaca la superioridad del uso del modelo reducido en terminos de e ciencia: empezando con un per l inicial que resulta en una retencion de menos de un 32%, se alcanza un valor de aproximadamente un 46% en tan solo 0:27 s, casi el mismo tiempo de computacion requerido para realizar la primera evaluacion del modelo nominal (0:20 s). Ademas, el uso del modelo reducido lleva a un valor de retencion por encima de un 47%, su ciente para la mayor a de las aplicaciones practicas, con solo 12 s de calculo.
48 46 44 Retencin (%) 42 40 38 36 34 32 30 -2 10 -1 10 Modelo de orden reducido Modelo nominal 0 1 2 10 10 10 Tiempo de CPU ( escala logartmica) 3 10
Figura 8.22: Comparacion de las curvas de convergencia de la optimizacion del proceso de esterilizacion utilizando el modelo nominal y el modelo reducido. Estos resultados demuestran que el modelo reducido puede ser utilizado de manera e ciente no solo para la resolucion de problemas de optimizacion dinamica, sino
262
tambien para aplicaciones como optimizacion en tiempo real, o en control predictivo basado en modelo.
8.5 Conclusiones
En este cap tulo se ha presentado una nueva metodolog a para el desarrollo de modelos reducidos aplicados a la resolucion de problemas tales como el de dise~o y n optimizacion dinamica. Se ha aplicado con exito esta nueva metodolog a al problema de esterilizacion termica de alimentos, obteniendose aceleraciones de hasta 15 veces respecto a modelos nominales. Las posibilidades de este metodo son muy amplias, ya que es facilmente aplicable a la resolucion de problemas distribuidos de muy diversa ndole, con terminos no lineales, e independientemente de la geometr a.
Conclusiones
263
Conclusiones
En este trabajo se ha abordado el desarrollo de nuevas metodolog as de optimizacion dinamica de procesos distribuidos, con enfasis en su e ciencia y robustez. Como punto de partida, se ha elegido el esquema de parametrizacion del control, metodo directo que transforma el problema original en un problema de programacion no lineal (NLP) principal con un subproblema de valor inicial. A continuacion se detallan los principales resultados y aportaciones realizadas y se apuntan algunas l neas de trabajo para el futuro. La primera parte de esta investigacion se ha centrado en el desarrollo de metodos de optimizacion deterministas locales, que hacen uso de informacion de segundo orden exacta para resolver mas e cazmente el NLP principal. Como resultados mas relevantes cabe destacar: El calculo teorico riguroso de las sensibilidades parametricas de segundo orden y sus proyecciones. Esta derivacion se ha hecho para procesos generales distribuidos, descritos por sistemas de ecuaciones en derivadas parciales, diferenciales ordinarias y algebraicas. En este contexto se ha desarrollado e implementado una herramienta computacional, basada en calculo simbolico, que permite la generacion automatica de dicho conjunto de sensibilidades, de tal forma que facilita su aplicacion a la resolucion de diversos tipos de problemas de optimizacion de sistemas dinamicos. La implementacion de un nuevo metodo determinista local, basado en el metodo de parametrizacion de control y un metodo Newton modi cado (qN3), que hace uso de la evaluacion de las sensibilidades parametricas obtenidas teoricamente para calcular de forma muy e ciente el gradiente y el Hessiano exactos. El desarrollo de un segundo metodo determinista local (TNHp), basado en un metodo de Newton Truncado, que hace uso del gradiente y Hessiano proyectado, calculados a partir de las sensibilidades de primer y segundo orden 265
266
Conclusiones
proyectadas. Esta estrategia permite la resolucion e ciente de problemas de optimizacion dinamica de dimension elevada. El metodo se ha complementado con una tecnica de re nado de la aproximacion del control, RTNHp, que permite alcanzar niveles de discretizacion de control muy elevados con un moderado coste computacional, posibilitando la solucion e ciente de problemas cuyas pol ticas optimas tienen formas caprichosas. La validacion de estos metodos considerando la resolucion de un amplio conjunto de problemas de control optimo del ambito de la ingenier a de procesos, demostrado la superioridad de los nuevos metodos que hacen uso de informacion exacta frente a los que emplean diferencias nitas. Estos nuevos metodos (y en particular TNHp) tambien se han comparado muy favorablemente con los codigos de optimizacion dinamica mas establecidos en la actualidad (IDP y gOPT), siendo capaces de igualar, y en varias ocasiones mejorar, soluciones previamente publicadas. El problema NLP principal que resulta de aplicar la parametrizacion del control es frecuentemente multimodal debido a la naturaleza no lineal de la dinamica de muchos procesos, as como a la presencia de diversos tipos de restricciones. La segunda parte de este trabajo se ha ocupado del estudio y desarrollo de metodos de optimizacion global para resolver estos problemas de forma robusta. Como aportaciones mas relevantes se se~alan: n El analisis comparativo de varios metodos de optimizacion global de tipo estocastico, tanto secuenciales como basados en poblaciones, as como de varios metodos deterministas locales para re nar las soluciones de los primeros. La implementacion de un nuevo metodo h brido de optimizacion global, HyMDO, basado en la combinacion de los metodos estocastico y determinista mas competitivos. En una primera etapa, el metodo estocastico permite alcanzar la vecindad del optimo global. A continuacion, en una segunda etapa, el metodo determinista local permite re nar la solucion de forma e ciente. La aplicacion de esta nueva metodolog a a la resolucion de un conjunto de problemas de control optimo multiobjetivo y/o multietapa. El metodo h brido ha demostrado ser muy robusto, igualando o incluso superando los resultados obtenidos con otros metodos globales, con la ventaja adicional de una gran reduccion del tiempo calculo.
Conclusiones
267
La tercera parte de este trabajo se ha dedicado a la resolucion de problemas de optimizacion dinamica de procesos distribuidos, con enfasis en procesos termicos de la industria alimentaria, mediante el uso de las herramientas desarrolladas previamente. Como resultados principales destacan: La extension del metodo TNHp para la resolucion de problemas de control optimo de procesos distribuidos, mediante el estudio teorico y practico de metodos de resolucion avanzada del problema de valor inicial extendido. Estos metodos hacen uso de las propiedades del Jacobiano total del sistema, incrementando la e ciencia del proceso global de optimizacion. La aplicacion de esta metodolog a a la resolucion de un conjunto de problemas entre los que destaca el control optimo de la esterilizacion termica de alimentos y el de optimizacion dinamica del procesamiento termico de alimentos en hornos mixtos microondas-conveccion. En este ultimo caso se ha realizado una validacion experimental de las pol ticas optimas obtenidas. Estos estudios pusieron de evidencia una limitacion fundamental: el elevado coste de cada simulacion de un sistema dinamico distribuido limita la aplicacion de tecnicas iterativas que requieren un numero signi cativo de dichas simulaciones. Por ello, la ultima parte de este trabajo se concentro en tratar de reducir dicha limitacion. Como aportacion mas relevante destaca: El desarrollo teorico del calculo de modelos de orden reducido, basados en la expansion de Karhunen-Loeve (o metodo de descomposicion ortogonal propia) con extensiones apropiadas para el manejo de terminos no lineales as como de geometr as cil ndricas y esfericas. Ademas se ha desarrollado una herramienta computacional que permite generar de forma automatica tales modelos. Su aplicacion a la simulacion, dise~o y optimizacion dinamica del proceso de n esterilizacion termica de alimentos. Los resultados con rman su gran potencial, permitiendo una reduccion muy signi cativa de tiempos de calculo en problemas de diversa ndole con independencia de la geometr a o grado de no linealidad.
268
Conclusiones
geometr as tridimensionales generales, que combinen los fenomenos de transferencia de masa y energ a con los de momento, y todo ello considerando posibles terminos de generacion no lineales. Esto permitira la optimizacion dinamica, posiblemente en tiempo real, de procesos con ujo, lo que supone abarcar la practica totalidad de los procesos de interes en la industria alimentaria y biotecnologica. Asimismo, se pretende desarrollar controladores predictivos basados en modelo (MPC, model predictive controllers) que puedan operar en tiempo real y que sean facilmente transferibles a estos sectores industriales.
Apendices
269
Apendice I
En este apendice se muestran algunos modulos programados en MathematicaTMpara la generacion del sistema de ODEs a partir del uso del metodo NMOL y la informacion relevante para la integracion e ciente del sistema extendido. 1. Introduccion de datos:
(*DECLARACION DEL PROBLEMA EN PDEs, CASO 2D. DATOS A INTRODUCIR POR EL USUARIO*) tit: Titulo del problema a resolver nodes: N de ODEs acopladas al sistema de PDEs ncontrol: Numero variables de control (V i]) lx: Longitud segun eje x (r si coordenadas cilindricas) lz: Longitud segun eje z nx: Nivel de discretizacion espacial segun x/r nz: Nivel de discretizacion espacial segun z cftx0/cftxl:Tipo de condicion de contorno inicial/final en x/r cftz0/cftzl:Tipo de condicion de contorno inicial en z Tipos posibles: Dirichlet(1) U=...(U) Neumann (2) UX=...(U) cfx0, cfxl :Condicion de contorno inicial/final en x/r cfz0, cfzl:Condicion de contorno inicial/final en z ci : Condicion inicial coordtype: sistema coordenadas: cartesianas (1) /cilindricas (2) !!OJO, en el caso de cilindricas esto va a afectar al calculo en r=0 dado que existe una singularidad!! fd: Metodo de discretizaci\'{o}n fd=2, METODO DE ORDEN 2 (3 PUNTOS) fd=4, METODO DE ORDEN 4 (5 PUNTOS) PDE: UT: UT=f(U,UX,UXX) ODES: Ecuaciones diferenciales ordinarias
271
272
Apendice I.
nx=11 nz=11 nt=nx*nz+nodes cftx0=2 cfx0=0 cftz0=2 cfz0=0 cftxl=2 cfxl=h*(c 1]-U) cftzl=2 cfzl=h*(c 1]-U) ci=25.0 coordtype=2 fd=2 UT=k1*(UXX+(1/R)*UX+UZZ) (*Para el caso R=0*) If coordtype==2, UT2=k1*(2*UXX+UZZ) ]
273
{rdelta(-50F 1]]+96F 2]]-72F 3]]+32F 4]]-6F 5]])}, {rdelta(-6F 1]]-20F 2]]+36F 3]]-12F 4]]+2F 5]])}, Table rdelta(2F i-2]]-16F i-1]]+0F i]]+16F i+1]]2F i+2]]),{i,3,NDIM-2}], {rdelta(-2F NDIM-4]]+12F NDIM-3]]-36F NDIM-2]]+ 20F NDIM-1]]+6F NDIM]])}, {rdelta(6F NDIM-4]]-32F NDIM-3]]+72F NDIM-2]]96F NDIM-1]]+50F NDIM]])} ]] End ] EndPackage ]
274
Apendice I.
If fd==2,UYY=DERV12 nz,UY,rdz] ] If fd==4,UYY=DERV14 nz,UY,rdz] ] For j=1,j<=nz,UZZ i,j]]=UYY j]] j++] i++]
(*CALCULO DE UT: en el caso se coordenadas cilindricas se aplica L'hopital, para evitar la singularidad*) If coordtype==2,UT 1]]=UT2 1]] ]
4. Calculo del Jacobiano y calculo de los vectores que indican la estructura dispersa correspondiente:
(*CALCULO DEL JACOBIANO*) MJ=Table mj i,j],{i,1,nt},{j,1,nt}] UTColumnform=Join Flatten UT],ODES] k=1 For i=1,i<=nt, For j=1,j<=nt, MJ i,j]]=Simplify D UTColumnform i]],y j]]] j++ ] i++ ] (*CALCULO DE INFORMACION RELATIVA A DISPERSION*) k=1 For j=1,j<=nt, For i=1,i<=nt, If ToString MJ i,j ]]]!="0",ja k]=i k=k+1 ] i++ ] ia j+1]=k j++ ] nnz=k-1 JA=Table ja j],{j,1,nnz}] ia 1]=1 IA=Table ia j],{j,1,nt+1}]
Apendice II
En este apendice se muestran los cheros de implementacion del problema de optimizacion dinamica del calentamiento de un cilindro, para su resolucion con gOPT. 1. Fichero .gPROMS donde se implementa el modelo dinamico del sistema:
#********************************************************** #cilidro.gPROMS #Calentamiento de un cilindro de patata por conduccion #********************************************************** DECLARE TYPE Temperature = 25.0 : 0.0 : 1000 UNIT = "DEGC" Numero = 0.0 : -1E300 : 1E300 NoType = 0.0 : -1e8 : 1e8 END # Declare #********************************************************** MODEL Cyl_Solid #********************************************************** PARAMETER # Propiedades del material K AS REAL RHO AS REAL Cp AS REAL H AS REAL alphat AS REAL # Geometria Rtot, Ltot AS REAL ZL AS REAL PI AS REAL DISTRIBUTION_DOMAIN raxis zaxis
AS AS
( 0 : Rtot ) ( 0 : Ltot )
275
276
Apendice II.
VARIABLE Tsolid AS DISTRIBUTION (raxis,zaxis) Text AS # Variables optimizacion Tmin AS Tmax AS Tdif AS zeta_avr AS SET PI := 4.0 * ATAN(1.0) ZL := 2.0 * Ltot alphat := K/(RHO*Cp)
BOUNDARY # Condicion frontera @ z=Ltot FOR r := 0|+ TO Rtot|- DO PARTIAL (Tsolid( r , Ltot ),zaxis) = H*(Text-Tsolid(r,Ltot))/K END # for r # Condicion frontera @ r=Rtot FOR z := 0|+ TO Ltot|- DO PARTIAL (Tsolid( Rtot , z ),raxis) = H*(Text-Tsolid(Rtot,z))/K END # for z PARTIAL (Tsolid( Rtot , Ltot ),raxis) = H*(Text-Tsolid(Rtot,Ltot))/K # Condiciones de simetria @ r=0 y @ z=0 PARTIAL (Tsolid(0| , 0|+:Ltot ),raxis) = 0.0 PARTIAL (Tsolid(0 : Rtot , 0| ),zaxis) = 0.0 EQUATION # Ecuacion de Fourier FOR r := 0|+ TO Rtot|- DO FOR z := 0|+ TO Ltot|- DO $Tsolid(r,z) = alphat*(PARTIAL(Tsolid(r,z),raxis,raxis) + (1.0/r)*PARTIAL(Tsolid(r,z),raxis) + PARTIAL(Tsolid(r,z),zaxis,zaxis)) END # for r END # for z Tmin=MIN(Tsolid( , )) Tmax=MAX(Tsolid( , )) Tdif=Tmax-Tmin # Funcion objetivo zeta_avr = (2.0/(Rtot*Rtot*Ltot))*INTEGRAL (r:= 0:Rtot , z:= 0:Ltot r*(Tsolid(r,z)-100)^2)
277
END # model Cyl_Solid #********************************************************** #PROCESS cil1 #********************************************************** UNIT cilindro
AS
Cyl_Solid
SET WITHIN cilindro DO # system dependent parameters K := 6.48E-3 RHO := 1.067 Cp := 3.542 H := 17.85E-4 Rtot := 1.75 Ltot := 1.75 # Malla NMOL raxis := CFDM, 2, 10 ] zaxis := CFDM, 2, 10 ] END # within cilindro ASSIGN WITHIN cilindro DO Text := 150.0 END # within cilindro
# # # # # #
#DEGC
PRESET WITHIN cilindro DO FOR r:= 0|+ to Rtot|- DO FOR z:= 0|+ to Ltot|- DO Tsolid(r,z) := 25.0 END # for r END # for z Tmin := 25.0 Tmax := 25.0 Tdif := 0.0 zeta_avr:= 5625.0 # es decir (100-25)^2 END # within cilindro INITIAL WITHIN cilindro DO FOR r:= 0|+ to Rtot|- DO FOR z:= 0|+ to Ltot|- DO Tsolid(r,z) = 25.0 END # for r END # for z
278
END # within cilindro SCHEDULE CONTINUE FOR 1500 END # process
Apendice II.
2. Fichero .gOPT donde se especi can las caracter sticas de la parametrizacion de control, as como restricciones, parametros etc.
# CIL1.gOPT # Tiempo final de proceso tf=1500 HORIZON 1500. : 1500. : 1500. # Discretizacion de control: elementos temporales INTERVALS 10 150.0 : 150.0 : 150.0 150.0 : 150.0 : 150.0 150.0 : 150.0 : 150.0 150.0 : 150.0 : 150.0 150.0 : 150.0 : 150.0 150.0 : 150.0 : 150.0 150.0 : 150.0 : 150.0 150.0 : 150.0 : 150.0 150.0 : 150.0 : 150.0 # Perfil inicial de control: elementos constantes PIECEWISE-CONSTANT cilindro.Text INITIAL-PROFILE 100.0 : 25.0 : 200.0 100.0 : 25.0 : 200.0 100.0 : 25.0 : 200.0 100.0 : 25.0 : 200.0 100.0 : 25.0 : 200.0 100.0 : 25.0 : 200.0 100.0 : 25.0 : 200.0 100.0 : 25.0 : 200.0 100.0 : 25.0 : 200.0 100.0 : 25.0 : 200.0 MINIMISE cilindro.zeta_avr
Apendice III
En este apendice se muestran los cheros de implementacion del problema de optimizacion dinamica del proceso de difusion a traves de una membrana, para su resolucion con PDECON. 1. Fichero .for donde se incluye la dinamica del sistema, la funcion objetivo y las restricciones, si hubiese:
C membrane.for SUBROUTINE SYSFUN(NOPAR,NPAR,MAXPAR,NOOPAR,NPDE,MAXPDE,NCPL, / MAXCPL,NRES,NEQU,NCONF,MAXCOF,MAXDDP, / NTIME,NDIS,MAXDIS,NNDIS,MMAX, / NMAX,MAXTIM,OPAR,U,U0,UX,UXX,UP,V,V0,VP, / C,CX, / f,z,G,DG,X,T,IAREA,LEFT,RIGHT,IFLAG, / S,DDPLOT,ODPLOT,TIME,FLUX,FLUXX, / FLUXU,FLUXUX,FLUXPX) C IMPLICIT NONE INTEGER NOPAR,MAXPAR,NOOPAR,NPDE,MAXPDE,NCPL,MAXCPL, / NRES,NEQU,NCONF,MAXCOF,MAXDDP,NTIME, / NDIS,MAXDIS,NNDIS,MMAX,NMAX,MAXTIM, / IAREA,IFLAG INTEGER NPAR(MAXCOF) DOUBLEPRECISION OPAR(MAXPAR),U(MAXPDE),U0(MAXPDE),UX(MAXPDE), / UXX(MAXPDE),UP(MAXPDE),V(MAXCPL),V0(MAXCPL), / VP(MAXCPL),C(MAXPDE),CX(MAXPDE),f,z, / G(MMAX),DG(MMAX,NMAX),X,T,S(MAXCOF), / DDPLOT(MAXDDP),ODPLOT(MAXTIM,MAXCPL), / TIME(MAXTIM),FLUX(MAXPDE),FLUXX(MAXPDE), / FLUXU(MAXPDE,MAXPDE),FLUXUX(MAXPDE,MAXPDE), / FLUXPX(MAXPDE) LOGICAL LEFT,RIGHT INTEGER I,J,K,L
279
280
C C C
Apendice III.
C C 100 C C 200
C C 300
C C 700 C C 800
C C 900 C C 1000
IF ((IFLAG.LE.0).OR.(IFLAG.GT.10)) RETURN CONSTANT DATA C GOTO (100,200,300,400,500,600,700,800,900,1000) IFLAG RETURN FLUX FUNCTION C CONTINUE RETURN RIGHT-HAND SIDE OF PDE'S C CONTINUE UP(1) = UXX(1)-10.*U(2)/(1.+U(2))*U(1)/(1.+U(1)) UP(2) = UXX(2) RETURN INITIAL VALUES OF PDE'S C CONTINUE U0(1) = 0.0 U0(2) = 0.0 RETURN RIGHT-HAND SIDE OF ODE'S C CONTINUE RETURN INITIAL VALUES OF ODE'S C CONTINUE RETURN BOUNDARY FUNCTIONS C CONTINUE IF (LEFT) THEN C(1) = 10. C(2) = S(1) ENDIF IF (RIGHT) THEN C(1) = 10. C(2) = S(2) ENDIF RETURN BOUNDARY GRADIENTS C CONTINUE RETURN INTEGRAND OF COST FUNCTION C CONTINUE f=(U(1)-(5.853752459*DATAN(30.0D+0*T)))**2 RETURN CONSTRAINTS C CONTINUE RETURN EVALUATION OF FLUXU, FLUXUX, FLUPX C CONTINUE RETURN
281
C END C
282
TSTART= TSTOP = XSTART= COMP1
Apendice III.
0.0000E+00 1.0000E+00 0.0000E+00 1.0000E+00 7 1 1 1 1 0.0000000000E+00 0.0000000000E+00 0.0000000000E+00 0.0000000000E+00 0.0000000000E+00 0.0000000000E+00 0.0000000000E+00 0.0000000000E+00 0.0000000000E+00 0.0000000000E+00 0.0000000000E+00 0.0000000000E+00 0.0000000000E+00 0.0000000000E+00 0.0000000000E+00 0.0000000000E+00 0.0000000000E+00 0.0000000000E+00 0.0000000000E+00 0.0000000000E+00 0.0000000000E+00 0.0000000000E+00 0.0000000000E+00 0.0000000000E+00 0.0000000000E+00 0.0000000000E+00 0.0000000000E+00 0.0000000000E+00 0.0000000000E+00 0.0000000000E+00 0.0000000000E+00 0.0000000000E+00 0.0000000000E+00 0.0000000000E+00
OPAR1 OPAR2 OPAR3 OPAR4 OPAR5 OPAR6 OPAR7 OPAR8 OPAR9 OPAR10 OPAR11 OPAR12 OPAR13 OPAR14 OPAR15 OPAR16 OPAR17 OPAR18 OPAR19 OPAR20 OPAR19 OPAR20 OPAR21 OPAR22 OPAR23 OPAR24 OPAR25 OPAR26 OPAR27 OPAR28 OPAR29 OPAR30 OPAR19 OPAR20 integ 0
0.0000000000E+00 0.0000000000E+00 0.0000000000E+00 0.0000000000E+00 0.0000000000E+00 0.0000000000E+00 0.0000000000E+00 0.0000000000E+00 0.0000000000E+00 0.0000000000E+00 0.0000000000E+00 0.0000000000E+00 0.0000000000E+00 0.0000000000E+00 0.0000000000E+00 0.0000000000E+00 0.0000000000E+00 0.0000000000E+00 0.0000000000E+00 0.0000000000E+00 0.0000000000E+00 0.0000000000E+00 0.0000000000E+00 0.0000000000E+00 0.0000000000E+00 0.0000000000E+00 0.0000000000E+00 0.0000000000E+00 0.0000000000E+00 0.0000000000E+00 0.0000000000E+00 0.0000000000E+00 0.0000000000E+00 0.0000000000E+00
1.0000000000E+02 1.0000000000E+02 1.0000000000E+02 1.0000000000E+02 1.0000000000E+02 1.0000000000E+02 1.0000000000E+02 1.0000000000E+02 1.0000000000E+02 1.0000000000E+02 1.0000000000E+02 1.0000000000E+02 1.0000000000E+02 1.0000000000E+02 1.0000000000E+02 1.0000000000E+02 1.0000000000E+02 1.0000000000E+02 1.0000000000E+02 1.0000000000E+02 1.0000000000E+02 1.0000000000E+02 1.0000000000E+02 1.0000000000E+02 1.0000000000E+02 1.0000000000E+02 1.0000000000E+02 1.0000000000E+02 1.0000000000E+02 1.0000000000E+02 1.0000000000E+02 1.0000000000E+02 1.0000000000E+02 1.0000000000E+02
Apendice IV
En este apendice se muestran los cheros de implementacion del problema de optimizacion dinamica del proceso de esterilizacion de alimentos para su resolucion con gOPT. 1. Fichero .gPROMS donde se implementa el modelo dinamico del sistema:
#********************************************************** #lata.gPROMS #Esterilizacio de un alimento envasado (cilindro) #**********************************************************
= 25.0 : -273 : 1000 UNIT = "DEGC" 0.0 : -1e30 : 1e30 = 0.0 : -1e3 : 1e30
#********************************************************** MODEL cylcan #********************************************************** PARAMETER # Parametros del modelo alfa AS REAL # Definicion de la geometria : # Rtot: radio del cilindro Ltot: semi-altura del cilindro Rtot, Ltot AS REAL Tref_microorg AS REAL zeta_microorg AS REAL Dref_microorg AS REAL Cmicroorg_initial AS REAL
283
284
Tref_nutrient zeta_nutrient Dref_nutrient Cnutrient_initial DISTRIBUTION_DOMAIN raxis zaxis AS AS AS AS
Apendice IV.
REAL REAL REAL REAL
AS AS
( 0 : Rtot ) ( 0 : Ltot )
VARIABLE T AS DISTRIBUTION (raxis,zaxis) Cmicroorg AS DISTRIBUTION (raxis,zaxis) Cnutrient AS DISTRIBUTION (raxis,zaxis) Tret AS Fc AS Cmicroorg_avr AS Cnutrient_avr AS Fs AS
BOUNDARY # @ z = Ltot T (0|+ : Rtot|- , Ltot)= Tret # @ r = Rtot T (Rtot, 0|+ : Ltot|-) = Tret T (Rtot , Ltot) = Tret # condiciones de simetria @ r = 0 y @ z = 0 PARTIAL (T(0| , 0|+ : Ltot ),raxis) = 0 PARTIAL (T(0 : Rtot , 0| ),zaxis) = 0
EQUATION
# Ecuacion de conduccion de calor FOR r := 0|+ TO Rtot|- DO FOR z := 0|+ TO Ltot|- DO $T(r,z)*(1.0/alfa) = PARTIAL(T(r,z),raxis,raxis) + (1.0/r)*PARTIAL(T(r,z),raxis) + PARTIAL(T(r,z),zaxis,zaxis) END # for z END # for r # Letalidad en el punto critico (centro) $Fc =10^((T(0,0)-Tref_microorg)/zeta_microorg)
285
# Concentraci\'{o}n de microorganismos/nutrientes en cada punto FOR r := 0 TO Rtot DO FOR z := 0 TO Ltot DO $Cmicroorg(r,z) = - (2.302585/Dref_microorg)*Cmicroorg(r,z)* EXP(2.302585*(T(r,z)-Tref_microorg)/zeta_microorg) $Cnutrient(r,z) = - (2.302585/Dref_nutrient)*Cnutrient(r,z)* EXP(2.302585*(T(r,z)-Tref_nutrient)/zeta_nutrient) END # for z END # for r # Concentracion volumetrica media de microorganismos y nutrientes Cmicroorg_avr = (2.0/(Rtot*Rtot*Ltot))*INTEGRAL (r:= 0:Rtot , z:= 0:Ltot r*Cmicroorg(r,z))
Cnutrient_avr = (2.0/(Rtot*Rtot*Ltot))*INTEGRAL (r:= 0:Rtot , z:= 0:Ltot r*Cnutrient(r,z)) # Definicion de la letalidad Fs asociada con todo el envase Fs = -Dref_microorg * log10(Cmicroorg_avr/Cmicroorg_initial)
AS
cylcan
SET WITHIN can DO alfa := Rtot := Ltot := Tref_microorg := zeta_microorg := Dref_microorg := Cmicroorg_initial := Tref_nutrient := zeta_nutrient := Dref_nutrient := Cnutrient_initial := raxis := CFDM, zaxis := CFDM, 1.5443e-07 0.04375 0.058 121.11 10.0 240.0 1.E8 121.11 25.56 10716.0 1.0 2, 10 ] 2, 10 ]
286
Apendice IV.
ASSIGN WITHIN can DO Tret := 123.0 END # within can PRESET WITHIN can DO Cmicroorg_avr Cnutrient_avr Fs Fc
:= := := :=
: : : :
: : : :
FOR z:= 0|+ to Ltot|- DO FOR r:= 0|+ to Rtot|- DO T(r,z) := 71.11 : 0.0 : 1000. END # for r END # for z FOR z:= 0 to Ltot DO FOR r:= 0 to Rtot DO Cmicroorg(r,z) := 1.0E8 Cnutrient(r,z) := 1.0 END # for r END # for z END # within can INITIAL WITHIN can DO FOR z:= 0|+ to Ltot|- DO FOR r:= 0|+ to Rtot|- DO T(r,z) = 71.11 END # for r END # for z FOR z:= 0 to Ltot DO FOR r:= 0 to Rtot DO Cmicroorg(r,z) = Cmicroorg_initial Cnutrient(r,z) = Cnutrient_initial END # for r END # for z Fc = 0 END # within can SOLUTIONPARAMETERS
287
2. Fichero .gOPT donde se especi can las caracter sticas de la parametrizacion de control, as como restricciones, parametros etc.
# ESTERL.gOPT # Tiempo final de proceso tf=7830 s HORIZON 7830. : 7830. : 7830. # Discretizacion de control: elementos temporales INTERVALS 10 783.0 : 783.0 : 783.0 783.0 : 783.0 : 783.0 783.0 : 783.0 : 783.0 783.0 : 783.0 : 783.0 783.0 : 783.0 : 783.0 783.0 : 783.0 : 783.0 783.0 : 783.0 : 783.0 783.0 : 783.0 : 783.0 783.0 : 783.0 : 783.0 783.0 : 783.0 : 783.0
# Restriccion en la temperatura final nodo mas caliente ENDPOINT-INEQUALITY can.T(1,1) -1.0E30: 71.11 # Restriccion en la letalidad final ENDPOINT-INEQUALITY can.Fs 1200.0 : 1.0E30 # Perfil inicial de control: elementos constantes PIECEWISE-CONSTANT can.Tretort INITIAL-PROFILE
288
123.0 123.0 123.0 123.0 123.0 123.0 123.0 22.0 22.0 22.0 : : : : : : : : : : 20.0 20.0 20.0 20.0 20.0 20.0 20.0 20.0 20.0 20.0 : : : : : : : : : : 140.0 140.0 140.0 140.0 140.0 140.0 140.0 140.0 140.0 140.0
Apendice IV.
MAXIMISE can.Cnutrient_avr
Apendice V
En este apendice se muestran algunos modulos programados en MathematicaTMpara la generacion del modelo de orden reducido para un caso unidimensional, se consideran los casos particulares descritos en el cap tulo 8: Caso en el que el operador espacial se expresa en coordenadas cartesianas, en el que todas las operaciones se realizan numericamente. Caso en el que el operador espacial se expresa en coordenadas cil ndricas o esfericas, en el que hay que calcular los polinomios de aproximacion. 1. Introduccion de datos:
(*:*************************************************************) (*:ESTE NOTEBOOK GENERA UN MODELO DE ORDEN REDUCIDO MEDIANTE EL*) (*:EL METODO DE K-L DECOMPOSITION (POD), A PARTIR DE UNA MATRIZ*) (*:DE DATOS QUE DESCRIBAN LA DINAMICA DEL SISTEMA (SD) *) (*:*************************************************************) (*: DATOS QUE DEBE INTRODUCIR EL USUARIO *) (*: DATOS GENERACION DE LAS AUTOFUNCIONES EMPIRICAS: *) (*: 1.- TITLE: TITULO DEL PROBLEMA *) (*: 2.- PATHDAT: FICHERO EN EL QUE SE ENCUENTRA LA MATRIZ SD *) (*: 3.- ENERGY: VALOR DE *ENERGIA* QUE SE DESEA CAPTURAR EN *) (*: TANTO POR 1 *) (*: DATOS METODO DE GALERKIN: *) *) (*: 4.- NL: 1 SI EL OPERADOR ES NO LINEAL , 0 SI ES LINEAL (*: 5.- xt: en la forma "f(x,x_chi,x_{chi,chi})" con x el campo*) (*: 6.- NB: numero de condiciones frontera *) (*: 7.- bctype: tipo de condiciones frontera: *) (*: "Dirichlet":1 ,"Neuman":2 *) (*: 8.- bc1,bc2: condiciones frontera homogeneas *) (*: 9.- ci: condiciones iniciales en la forma f(x,u) *) (*: 10.- Otros parametros especificos del problema *) (*: 11.- coord= Tipo de coordenadas, 1:cartesianas, *) (*: 2:cilindricas o esfericas *) (*:*************************************************************)
289
290
Apendice V.
1]]
291
(*:*************************************************************) (*:CALCULO DE LA ENERGIA RELATIVA ASOCIADA A CADA AUTOVALOR *) (*:*************************************************************) TOTAL = Sum LAMBDA i]],{i,1,NEIGS}] For i = 1, i <= NEIGS, SUMENERGY i] = Sum LAMBDA j]], {j, 1, i}] RELENERGY i] = SUMENERGY i]/TOTAL If Re RELENERGY i]] <= ENERGY, NODES = i ] REN = Table Re RELENERGY i]], {i, 1, NODES + 5}] NEQ = NODES Print "--> EL N DE MODOS CAPTURANDO EL", ENERGY*100, "% DEL TOTAL ES:", NODES] ListPlot REN, PlotJoined -> True] Print "--> EL N DE ECUACIONES DEL MODELO REDUCIDO SERA:", NODES]
4. Crea aproximaciones polinomicas para las autofunciones (en el caso de problemas en coordenadas no cil ndricas esta seccion no es necesaria):
(*:*************************************************************) (*:SI COORD=2, CREA APROXIMACIONES POLINOMICAS: AUTOFUNCIONES *) (*:*************************************************************) << Graphics`MultipleListPlot` NEQ = NODES If coord==2, ord = 6 idr=1/dr pol = Table Sqrt r]+(2/(3+2*i))r^(i+2),{i,1,ord}] For i = 1, i <= NODES, VPsiR i] =Table {rr j]],(idr^0.5)*VPsi i]] j]]}, {j, 1, n}] Psi i] = Fit VPsiR i], pol, r] PsiLIST i] = Table {r, Psi i]}, {r, 0, lr, dr}] MultipleListPlot VPsiR i], PsiLIST i], SymbolShape -> {PlotSymbol Triangle, 4], PlotSymbol Star, 2]}, PlotJoined -> {False, True}, PlotRegion -> {{0.1, 1.0},{0.1,1.0}}] Print i, "Autovalor:", LAMBDA i]], " ", Re RELENERGY i]]] (*:Comprueba condicion de ortonormalidad*) Table Phi i] = Psi i]/Sqrt r], {i, 1, NEQ}] Print MatrixForm Table Integrate Phi i]*Phi j]*r,{r, 0,lr}],{i,1,NEQ},{j,1,NEQ}]]] ] ]
292
Apendice V.
5. De nicion del campo (~) y proyeccion sobre las autofunciones emp ricas (Metodo x de Galerkin):
(*:*************************************************************) (*:PROYECCION OPERADOR SOBRE LA BASE DE AUTOFUNCIONES EMPIRICAS*) (*:*************************************************************) <<Miscellaneous`PDEsToODEs` If coord==2, x=Simplify Sum a i]*Phi i],{i,1,NEQ}] OPERATOR=Simplify ToExpression xt]] XR=D x,{r,1}] XRR=D x,{r,2}] B=Table b i],{i,1,NODES}] Print "-->ODES RESULTANTES: \n"] For i=1,i<=NODES, B i]]=Integrate Phi i]*OPERATOR*r,{r,0,lr}] Print "ap ",i,"]=",Simplify B i]]],"\n"] i=i+1 ] ]
If coord==1, (*:CALCULO DE DERIVADAS ESPACIALES*) VPsiR=Table vpsir i,j],{i,1,NEQ},{j,1,NR}] VPsiR=Table vpsirr i,j],{i,1,NEQ},{i,1,NR}] fd=4 den=fd! rdr=1./(den*dr) For i=1,i<=NEQ, PSID=. PSID=DERV14 NR,VPsi i],rdr] VPsiR i]]=FID VPsiRR i]]=DERV14 NR,VPsiR i]],rdr] i=i+1 ] (*: DEFINICION CAMPO Y SUS DERIVADA*) x=Sum a i]*VPsi i],{i,1,NEQ}] XR =Sum a i]*VPsiR i]],{i,1,NEQ}] XRR =Sum a i]*VPsiRR i]],{i,1,NEQ}] (*:PROYECCION SOBRE LA BASE DE AUTOFUNCIONES EMPIRICAS*) OPERATOR=Simplify ToExpression xt]] Print "-->ODES RESULTANTES: \n"] For i=1,i<=NODES,ap i]=Simplify dr*(VPsi i].OPERATOR)] Print "ap(",i,")=",ap i],"\n"] i=i+1 ] ]
293
(*:**************************************************************) (*:PROYECCION DE LAS CONDICIONES INICIALES *) (*:**************************************************************) v=. cini=ToExpression ci] CINI=Table cini,{i,1,l}] If coord==2, INIT=Table a i] 0]==Simplify Integrate Phi i]*r*cini,{r,0,lr}]], {i,1,NODES}] ] If coord==1, INIT=Table a i] 0]==Simplify cini.VPsi i]],{i,1,NODES}] ]
6. Crea chero de salida en formato .f90, con las ecuaciones diferenciales resultantes y la distribucion de temperaturas en el interior de la barra:
(*:CREA FICHERO DE SALIDA ODES.F90 CON LAS ECUACIONES, LA FUNCION v=. strm=OpenWrite "c:\msdev\projects\eva\odes.f90",PageWidth ->50] WriteString strm,"\n\n CONDICIONES INICIALES\n\n"] Table WriteString strm,"y0(",i,")=",FortranForm Simplify INIT i]]]],"\n"], {i,1,NODES}] WriteString strm,"\n\n ODES MODELO REDUCIDO\n\n"] Table WriteString strm,"yp(",i,")=",FortranForm Simplify B i]]]], "\n"], {i,1,NODES}] (*:DISTRIBUCION DE TEMPERATURAS*) WriteString strm,"\n\n CALCULO DE LA DISTRIBUCION DE TEMPERATURAS\n\n"] v=. For i=1,i<=NR, r=rr i]] WriteString strm,"temp(",i,")=",FortranForm TEMP],"\n"] r=. i=i+1 ] Close strm]
294
Apendice V.
Referencias
295
Referencias
1] Adjiman, C.S., S. Dallwing, C.A. Floudas, y A. Neumaier. A global optimization method, BB, for general twice-di erentiable constrained NLPs {I. Theoretical advances. Comp. & Chem. Eng., 22(9):1159{1179, 1998. 2] Ali, M.M., C. Storey, y A. Torn. Application of stochastic global optimization algorithms to practical problems. J. of Opt. Th. and Appl., 95(3):545{563, 1997. 3] Alkaya, D., S. Vasantharajan, y L.T. Biegler. \Succesive Quadratic Programming: Applications in the Process Industry", en Encyclopedia of Optimization, editado por C. A. Floudas, Kluwer, 1999. 4] Alonso, A. A., J. R. Banga, y R. P. Mart n. A complete dynamic model for the thermal processing of bioproducts in batch units and its application to controller design. Chem. Eng. Sci., 52(8):1307{1322, 1998. 5] Alonso, A. A., J. R. Banga, y I. Sanchez. Passive control design for distributed parameter process systems: Theory and applications. AIChE J., 46(8):1593{ 1606, 2000. 6] Alonso, A. A., C.E. Frouzakis, y I.G. Kevrekidis. Optimal sensor placement and reduced order observer design for distributed process systems. En prensa, AIChE J., 2001. 7] Alonso, A. A. e I. Sanchez. Control of microwave ovens. Informe tecnico EU FAIR Project CT96-1192, Dept. Ingenier a Qu mica, Univ. de Vigo, Espa~a, n 1999. 8] Alvarez-Vazquez, L. J. y A. Mart nez. Modelling and control of natural convection in canned foods. IMA J. Appl. Math., 63(3):247{265, 1999. 9] Aris, R. Ends and beginings in the mathematical modelling of chemical engineering systems. Chem. Eng. Sc., 48(14):2507{2517, 1993. 297
298
Referencias
10] Ascher, U. M. y L.R. Petzold. Computer Methods for Ordinary Di erential Equations and Diferential-Algebraic Equations. SIAM, Philadelphia, 1998. 11] Balsa-Canto, E., A. A. Alonso, y J. R. Banga. Dynamic optimization of bioprocesses: deterministic and stochastic strategies. ACoFop IV (Automatic Control of Food and Biological Processes), Goteborg, Suecia, 1998. 12] Balsa-Canto, E., E.F. Carrasco, A.A. Alonso, y J.R. Banga. Optimal control of bioprocesses using a hybrid method. En preparacion, 2001. 13] Banga, J. R., A. A. Alonso, J. M. Gallardo, y R. P. Mart n. Mathematical modeling and simulation of the thermal processing of anisotropic and non homogeneous conduction heated canned foods: Application to canned tuna. J. Food Eng., 18(4):369{387, 1993. 14] Banga, J. R., A. A. Alonso, R. I. P. Mart n, y R. P. Singh. Optimal control of heat and mass transfer in food and bioproducts processing. Comp. & Chem. Eng., 18:S699{S705, 1994. 15] Banga, J. R., A. A. Alonso, y R. P. Singh. Stochastic dynamic optimization of batch and semicontinuous bioprocesses. Biotechnol. Prog., 13:326{335, 1997. 16] Banga, J. R. y J.J. Casares. ICRS: Application to a wastewater treatment plant model. In Process Optimisation, IChemE Symposium Series No. 100, 183{192, Pergamon Press, Oxford, Reino Unido, 1987. 17] Banga, J. R., R. Irizarry, y W. D. Seider. Stochastic optimization for optimal and model-predictive control. Comp. & Chem. Eng., 22(4-5):603{612, 1998. 18] Banga, J. R., R. Irizarry-Rivera, y W. D. Seider. Stochastic optimization for optimal and model-predictive control. AIChE Annual Meeting, Miami, 1995. 19] Banga, J. R., R. P. Mart n, J. M. Gallardo, y J. J. Casares. Optimization of thermal processing of conduction-heated canned foods: Study of several objective functions. J. Food Eng., 14(1):25{51, 1991. 20] Banga, J. R. y W. D. Seider. Global optimization of chemical processes using stochastic algorithms. En \State of the Art in Global Optimization", editado por C. A. Floudas y P. M. Pardalos, Kluwer Academic Pub., Dordrecht, Holanda, 563{583, 1996.
Referencias
299
21] Banga, J. R., A. A. Alonso, y R. P. Singh. Stochastic optimal control of fed-batch bioreactors. AIChE Annual Meeting, San Francisco, 1994. 22] Banga, J. R., J. Saa, E. Balsa-Canto, J.M. Gallardo, R.P. Mart n, y J. M. Vazquez. Optimal control of microwave combination ovens for food heating. Informe tecnico EU FAIR Project CT96-1192, Lab. de Ingenier a Qu mica, IIM-CSIC, Espa~a, 1999. n 23] Banga, J. R., K. J. Versyck, y J.F. Van Impe. Numerical strategies for optimal experimental design for parameter identi cation of non-linear dynamic (bio-)chemical processes. European Symposium on Computer Aided Process Engineering-10, editado por S. Pierucci, 37{42, Elsevier, 2000. 24] Bangia, A. K., P.F. Batcho, I. G. Kevrekidis, y G.E. Karniadakis. Unsteady two-dimensional ows in complex geometries: Comparative bifurcation studies with global eigenfunction expansions. SIAM. J. Sci. Comput., 18(3):775{805, 1997. 25] Barclay A., P.E. Gill y J.B. Rosen. SQP methods and their application to numerical optimal control. Informe tecnico NA 97-3, Dept. de Matematicas, Univ. de California, 1997. 26] Barton, P.I. y C.C. Pantelides. Modelling of combined discrete / continuous processes. AIChE J., 40:966{979, 1994. 27] Barton, P.I., R.J. Allgor, W.F. Feehery y S. Galan Dynamic Optimization in a Discontinuous World. Ind. Eng. Chem. Res., 37:966{981, 1998. 28] Barton, P.I., E.M.B. Smith, y C.C. Pantelides. Combined discrete/continuous process modelling using gPROMS. AIChE Annual Meeting, 1991. 29] Baysal, C., H. Meirovitch, y I. M. Navon. Performance of e cient minimization algorithms as applied to models of peptides and proteins. J. Comput. Chem., 20(3):354{364, 1999. 30] Bazaraa, M.S., H.D. Sherali, y C.M. Shetty. Nonlinear Programming: Theory and Applications (2a edicion). John Wiley & Sons, Nueva York, 1993. 31] Bell, D.J. y F. Katusiime. A time-optimal drug displacement problem. Optimal Control Appl. Methods, 1:217{225, 1980.
300
Referencias
32] Bell, M.L. y R.W.H. Sargent. Optimal control of inequality constrained DAE systems. Comp. & Chem. Eng., 24:2385{2404, 2000. 33] Bendersky, E. y P.D. Christo des. A computationally e cient method for optimization of transport-reaction processes. Comp. & Chem. Eng., 23(s):447{ 450, 1999. 34] Bendersky, E. y P.D. Christo des. Optimization of transport-reaction processes using nonlinear modelo reduction. Chem. Eng. Sci., 55(19):4349{4366, 2000. 35] Berkooz, G., P. Holmes, y L. Lumley. The Proper Orthogonal Decomposition in the analysis of turbulent ows. Ann. Rev. Fluid Mech., 25:539{375, 1993. 36] Bermudez, A. y A. Mart nez. A state constrained optimal control problem related to the sterilization of canned foods. Automatica, 30(2):319{329, 1994. 37] Bertsekas, D.P. Dynamic Programming and Optimal Control. Vol. I. Athena Scienti c, Belmont, Massachusetts, 1995. 38] Bertsekas, D.P. Dynamic Programming and Optimal Control. Vol. II. Athena Scienti c, Belmont, Massachusetts, 1995. 39] Biegler, L.T. Solution of dynamic optimization problems by succesive quadratic programming and orthogonal collocation. Comp. & Chem. Eng., 8(3/4):243{248, 1984. 40] L.T. Biegler. Optimization. Notas sobre diversos temas relacionados con el analisis numerico disponibles en http://www.lehigh.edu/ wes1/apci, 2000. 41] Biegler, L.T., I.E. Grossmann, y A.W. Westerberg. Systematic Methods of Chemical Process Design. Prentice Hall PTR., Upper Saddle River, New Jersey, 1997. 42] Bird R. B., W.E. Stewart y E.N. Lightfoot. Fenomenos de Transporte. Reverte, Barcelona, Espa~a, 1964. n 43] Biros, G. y O. Gattas. A lagrange-newton-krylov-schur method for PDEconstrained optimization. SIAG/OPT Views-and-News, 11(2), 2000.
Referencias
301
44] Blatt, M. y K. Schittkowski. PDECON: A FORTRAN code for solving control problems based on ordinary, algebraic and partial di erential equations. Informe tecnico, Dep. de Matematicas, Univ. de Beirut, 1997. 45] Boggs, P.T. y J.W. Tolle. Sequential quadratic programming. Acta Numerica, 1{52, 1995. 46] Bogle, D. CAPE.NET A Thematic Network in Computer Aided Process Engineering. CAPE.Net 2000, Univ. College of London, Reino Unido, 2000. 47] Bojkov, B., R. Hansel, y R. Luus. Application of direct search optimization to optimal control problems. Hungar. J. Ind. Chem., 21:177{185, 1993. 48] Bojkov, B. y R. Luus. Application of Iterative Dynamic Programming to time optimal control. Chem. Eng. Res. Des., 72:72{80, 1994a. 49] Bojkov, B. y R. Luus. Time-optimal control by Iterative Dynamic Programming. Ind. Eng. Chem. Res., 33:1486{1492, 1994b. 50] Bojkov, B. y R. Luus. Optimal control of nonlinear systems with unspeci ed nal times. Chem. Eng. Sci., 51(6):905{919, 1996. 51] Bonabeau, E., M. Dorigo, y G. Theraulaz. Inspiration for optimization form social insect behaviour. Nature, 406:39{42, 2000. 52] Bonnans, J.F. y H. Zidani Optimal Control Problems with Partially Polyhedric Constraints SIAM J. Cont. and Opt., 37(6):1726{1741, 1999. 53] Bonvin, D. Optimal operation of batch-reactors{ a personal view. J. Proc. Control, 8(5-6):355{368, 1998. 54] Brenan, K. E., S. L. Campbell, y L. R. Petzold. Numerical Solution of InitialValue Problems in Di erential-Algebraic Equations, North-Holland, Nueva York, 1989. 55] Bryson, A. E. y Y. C. Ho. Applied Optimal Control. Hemisphere, Washington, 1988. 56] Bu er, C. R. Microwave Cooking and Processing. Van Nostrand Reinhold, Nueva York, 1993. 57] Burl, J. B. Reduced-order system identi cation using the Karhunen-Loeve transform. Int. J. of Modelling & Simulation, 13(4):183{188, 1993.
302
Referencias
58] Caracotsios, M. y W. E. Stewart. Sensitivity analysis of initial value problems with mixed odes and algebraic equations. Comp. & Chem. Eng., 9:359{365, 1985. 59] Carnahan, B., H.A. Luther, y J.O. Wilkes. Calculo Numerico: Metodos, Aplicaciones. Rueda, Madrid, Espa~a, 1979. n 60] Carrasco, E. F. y J. R. Banga. A hybrid method for the optimal control of chemical processes. En IEE Conf. Publ. 455(Vol. 2): 925-930. The Institution of Electrical Engineers, 1998. 61] Carrasco, E.F. y J. R. Banga. Dynamic optimization of batch reactors using adaptive stochastic algorithms. Ind. Eng. Chem. Res., 36(6):2252{2261, 1997. 62] Casado, L. G., I. Garc a, y T. Csendes. A new multisection technique in interval methods for global optimization. Computing, 65:263{269, 2000. 63] Casas, E. y F. Troltzsch. Second-order necessary optimality conditions for some state-constrained control problems of semilinear elliptic equations. Appl. Math. & Opt., 39:211{227, 1999. 64] Cervantes, A. y L.T. Biegler. Large- scale DAE optimization using a simultaneous NLP formulation. AIChE J., 44(5):1038, 1998. 65] Cervantes, A., S. Tonelli, A. Brandolin, J. A. Bandoni y L. T. Biegler. LargeScale Dynamic Optimization for Grade Transitions in a Low Density Polyethylene Plant. Enviado para su publicacion (2000). 66] Chalabi, Z. S., L.G. Van Willigenburg, y G. Van Straten. Robust optimal receding horizon control of the thermal sterilization of canned foods. J. Food Eng., 40(3):207{218, 1999. 67] Chandra, P.K. y R.P. Singh. Applied Numerical Methods for Food and Agricultural Engineers. CRC Press, Florida, 1995. 68] Chen, C.T. y C. Hwang. Optimal on-o control for fed-batch fermentation processes. Ind. Eng. Chem. Res, 29:1869{1875, 1990 b. 69] Chen, D.D., R.K. Singh, K. Haghighi, y P.E. Nelson. Finite element analysis of temperature distribution in microwaved cylindrical potato tissue. J. Food Eng., 18:351{368, 1993.
Referencias
303
70] Cheng, C.T. y C. Hwang. Optimal control computation for di erentialalgebraic process systems with general constraints. Chem. Eng. Commun, 97:9{26, 1990 a. 71] Chen, G. y J. Zhou. Boundary Element Methods. Academic Press Cop., Londres, Reino Unido, 1992. 72] Citriniti, J. H. Experimental Investigation Into the Dynamics of the Axisymetric Mixing Layer Utilizing the Proper Orthogonal Decomposition. Tesis Doctoral, Univ. de Nueva York, Bu alo, 1996. 73] Corlis, G. F. y R. B. Kearfott. Rigorous Global Search: Industrial Applications. En \Developments in Reliable Computing", editado por T. Csendes, Kluwer Academic Publishers, Dordrecht, The Netherlands, 1999. 74] Courant, R. y D. Hilbert. Methods of Mathematical Physics. Wiley, Nueva York, 1937. 75] Cuthrell, J.E. y L.T. Biegler. On the optimization of di erential-algebraic process systems. AIChE J., 33(8):1257{1270, 1987. 76] Cuthrell, J.E. y L.T. Biegler. Simultaneous optimization and solution methods for batch reactor control pro les. Comp. & Chem. Eng., 13:49, 1989. 77] Dadebo, S. A. y K. B. McAuley. Dynamic optimization of constrained chemical engineering problems using Dynamic Programming. Comp. & Chem. Eng., 19(5):513{525, 1995. 78] de Andres-Toro, B., J.M. Giron-Sierra, J.A. Lopez-Orozco y C. FernandezConde. Evolutionary optimization of an industrial batch fermentation process. European Control Confenrence, ECC, 1997. 79] de la Maza, M. y D. Yuret. Dynamic hill climbing. AI Expert, 9(3):26{31, 1994. 80] Decareau, R. V. Microwaves in the Food Processing Industry. Academic Press, Londres, Reino Unido, 1985. 81] DePourcq, M. Field and power-density calculations in closed microwave systems by three-dimensional nite di erences. IEE Proc. H, Microwave Antennas Propag., 132(6):360{368, 1985.
304
Referencias
82] Dolan, L. y J. More. Benchmarking optimization software with performance pro les. Dept. de Ciencia de la computacion y matematicas, Argonne National Laboratory, en preparacion-ANL/MCS-P861-1200, 2001. 83] Dorigo, M., V. Maniezzo, y A. Colorni. The ant system:optimization by a colony cooperating agents. IEEE Transactions on Systems, Man & Cybenetics B, 26(2):29{41, 1996. 84] Dunker, A.M. The decoupled direct method for calculating sensitivity coe cients in chemical kinetics. J. of Chemical Physics, 81:2385{2393, 1984. 85] Durance, T. D. Improving canned food quality with variable retort temperature processes. Trends in Food Sci. & Technol., 8(4):113{118, 1997. 86] Edgar, T. F. y D. M. Himmelblau. Optimization of Chemical Processes. McGraw Hill, Nueva York, 1988. 87] Esposito, W. R. y C. A. Floudas. Global optimization of nonconvex problems with di erential-algebraic constraints. In \European Symposium on Computer Aided Process Engineering-10", S. Pierucci (Ed.), Elsevier, Amsterdam, Holanda, 73{78, 2000. 88] Esposito, W. R. y C.A. Floudas. Deterministic global optimization in nonlinear optimal control problems. J. of Global Opt., 17:97{126, 2000. 89] Feehery, W. F. Dynamic Optimization with Path Constraints. Tesis Doctoral, MIT, Cambridge, Massachusetts, 1998. 90] Feehery, W. F. y P.I. Barton. Dynamic optimization with state variable path constraints. Comp. & Chem. Eng., 22(9):1241{1256, 1998. 91] Fikar, M., M.A. Lati , F. Fournier, y Y. Cre . Control vector parameterization versus iterative dynamic programming in dynamic optimization of a distillation column. Comp. & Chem. Eng., 22(S):5625{5628, 1998. 92] Fletcher, C.A.J. Computational Galerkin Methods. Springer-Verlag, Nueva York, 1984. 93] Fletcher, R. Practical Methods of Optimization. John Wiley & Sons, Nueva York, (2a edicion), 1987.
Referencias
305
94] Floudas, C.A. Nonlinear and Mixed-Integer Optimization: Fundamentals and Applications. Oxford University Press, Nueva York, 1995. 95] Floudas, C.A. Recent advances in global optimization for process synthesis, design and control: Enclosure of all solutions. Comp. & Chem. Eng., S963{ 973, 1999. 96] Floudas, C.A. Deterministic Global Optimization: Theory, Methods and Applications. Kluwer Academics, Holanda, 2000. 97] Floudas, C.A. y V. Visweswaran. A global optimization algorithm (GOP) for certain classes of nonconvex NLPs: I. Theory. Comp. & Chem. Eng., 14:1397{1417, 1990. 98] Fryer, P. Mathematical models in food processing. Chem. & Ind. London, 13:515{518, 1994. 99] Galan, S., W. F. Feehery, y P. I. Barton. Parametry sensitivity functions for hybrid discrete/continuous systems. Appl. Num. Math., 31(1):17{47, 1999. 100] Gear, C. W. Simultaneous numerical solution of di erential-algebraic equations. IEEE Trans. Circuit Theory, CT-18:89{95, 1971. 101] Gear, C. W. Numerical Initial Value Problems in Ordinary Di erential Equations. Prentice-Hall, Engelwood Cli s, New Jersey, 1971. 102] Gear, C. W. Runge-kutta starters for multistep methods. ACM Trans. on Math. Soft., 6(3):263{279, 1980. 103] Gen, M. y R. Cheng. Genetic Algorithms & Engineering Optimization. John Wiley & Sons, Nueva York, 2000. 104] Gill, P. E., W. Murray, y M. H. Wright. Practical Optimization. Academic Press, Nueva York, 1981. 105] Glover, F. Future paths for integer programming and links to arti cial intelligence. Comp. Oper. Res., 5:533{549, 1986. 106] Glover, K. All Optimal Hankel Norm Approximation of linear multivariable systems and their l-in nity error bounds. Int. J. Control, 36:1145{1193, 1984. 107] Goh, C.J. y K.L. Teo. Control parameterization: A uni ed approach to optimal control problems with general constraints. Automatica, 24(1):3{18, 1988.
306
Referencias
108] Goldberg, D.E. Genetic Algorithms in Search, Optimization & Machine Learning. Addison Wesley Longman, 1989. 109] Goldberg, H. y Troltzsch. Optimal control: Theory, algorithms and applications. Kluwer Academic Publishers, 1997. 110] Gottlieb, D. y S. A. Orszag. Numerical Analysis of Spectral Methods: Theory and Applications. Society for Industrial and Applied Mathematics, Philadelphia, Pennsylvania, 1977. 111] Goulcher, R. y J.J. Casares Long. The solution of steady-state chemical engineering optimisation problems using a random-search algorithm. Comp. & Chem. Eng., 2:33{36, 1978. 112] Gritsis, D. The Dynamic Simulation and Optimal Control of Systems Described by Index Two Di erential-Algebraic Equations. Tesis Doctoral, Imperial College, Univ. de Londres, Reino Unido, 1990. 113] Grossmann, I.E., J.A. Caballero, y H. Yeomans. Advances in mathematical programming for automated design, integration and operation of chemical processes. Proccedings of the International Conference on Process Integration (PI'99), Copenague, Dinamarca, 1999. 114] Guay, M. y D.D. McClean. Optimization and sensitivity analysis for multiresponse parameter estimation in systems of ordinary di erential equations. Comp. & Chem. Eng., 19:1271{1285, 1995. 115] Gunn, D.J. y W.J. Thomas. Mass transport and chemical reaction in multifunctional catalyst systems. Chem. Eng. Sci., 20:89{100, 1965. 116] Gupta, Y. P. Semiexhaustive search for solving nonlinear optimal control problems. Ind. Eng. Chem. Res., 34:3878{3884, 1995. 117] Guus, C., E. Boender, y H.E. Romeijn. Stochastic methods, en Handbook of Global Optimization. Kluwer Acacemic Publichser, editado por R. Horst y P.M. Pardalos, 1995. 118] Haghighi, K. y L.J. Segerlind. Modeling simultaneous heat and mass transfer in an isotropic sphere - a nite element approach. Trans. ASAE, 31:629{637, 1988.
Referencias
307
119] Hairer, E. y G. Wanne. Solvind Ordinary Di erential Equations II: Sti and Di erential Algebraic Problems. Springer-Verlag, 1996. 120] Hartl, R.F., S.P. Sethi, y R.G. Vickson. A survey on the maximum principles for optimal control problems with state constraints. SIAM Review, 37(2):181{ 218, 1995. 121] Hestenes, M. R. y E. Stiefel. Methods of conjugate gradients for solving linear systems. J. of Research of the National Bureau of Standards, 29:409{439, 1952. 122] Hestenes, M. R. Applications of Mathematics 12: Conjugate Direction Methods in Optimization. Springer-Verlag, Berlin, 1980. 123] Hindmarsh, A.C. ODEPACK, a Systematized Collection of ODE Solvers, 55{ 64. North Holland, Amsterdam, 1983. 124] Holdsworth, S. D. Thermal Processing of Packaged Foods. Chapman & Hall, 1996. 125] Holman, J. P. Heat Transfer. McGraw Hill, Singapur, 1990. 126] Holmes, P., J. L. Lumley, y G. Berkooz. Turbulence, Coherent Structures, Dynamical Systems and Symmetry. Cambridge University Press, 1996. 127] Hong, J. Optimal substrate feeding policy for a fed batch fermentation with substrate and product inhibition kinetics. Biotechnol. and Bioeng., 28:1421{ 1431, 1986. 128] Horst, R. y P.M. Pardalos. Handbook of Global Optimization. Kluwer Academic, 1995. 129] IMSL. IMSL Math Library Reference. IMSL Inc., Sugar Land, TX, 1995. 130] Iserles, A. A First Course in the Numerical Analysis of Di erential Equations. Cambridge University Press, Cambridge, U.K., 1996. 131] Jaluria, Y. Design and Optimization of Thermal Systems. McGraw-Hill, Nueva York, 1998. 132] Jaluria, Y. y K.E. Torrance. Computational Heat Transfer. Hemisphere Publishing Corporation, 1986.
308
Referencias
133] Jarvis, R. B. y C. C. Pantelides. Dasolv, user's manual, version 1.0. Informe tecnico, Centre for Process Systems Engineering, Imperial College, Londres, Reino Unido, 1992. 134] Jarvis, R. B. Robust Dynamic Simulation of Chemical Engineering Processes. Tesis Doctoral, Univ. de Londres, Reino Unido, 1993. 135] Jayaraman, V.K., B.D. Kulkarni, S. Karale, y P. Shelokar. Ant colony framework for optimal design and scheduling of batch plants. Comp. & Chem. Eng., 24:1901{1912, 2000. 136] Jensen, A. K. y R. Gani. Development of novel unit processes: Review of computer aided modeling tools. CAPE- NET: TWG1. Dept. Ingenier a Qu mica, Univ. de Dinamarca, 1998. 137] Jensen, T. Dynamic Control of Large Dimension Nonlinear Chemical Processes. Tesis Doctoral, Univ. Princeton, 1964. 138] Kearfott, R. B. GlobSol: Algorithm development and code re nement. Univ. de Southwestern Louisiana, http://www.mscs.mu.edu/ globsol/. 139] Keeping, B.R. E cient Methods for the Solution of Large Systems of Di erential Algebraic-Equations. Tesis Doctoral, Univ. de Londres, Reino Unido, 1995. 140] Keeping, B.R. y C.C. Pantelides. On the implementation of optimisation algorithms for large scale transient systems on a mimd computer. AIChE Annual Meeting, 1995. 141] Kim, K. H. y A.A. Teixeira. Predicting internal temperature response to conduction-heating of odd-shaped solids. J. Food Proc. Eng., 20(1):51{64, 1997. 142] Kirkpatrick, S., C. D. Gelatt, y M. P. Vecchi. Optimization by simulated annealing. Science, 220:671{680, 1983. 143] Kleis, D. y E. W. Sachs. Optimal control of the sterilization of prepackaged food. SIAM J. on Optimization, 10(4):1180{1195, 2000. 144] Kokotovic, P.V. Singular Perturbation Methods in Control : Analysis and Design Academic Press, 1987.
Referencias
309
145] Kraft, D. Algorithm:733: TOMP { fortran modules for optimal control calculations. ACM Trans. Math. Soft., 20(3):262, 1994. 146] Kunkel, P., V. Mehrmann, W. Rath, y J. Weickert. A new software package for linear di erential-algebraic equations. SIAM J. of Scient. Comp., 18(1):115{ 138, 1997. 147] Kunz, K.S. y R.J. Luebbers. The Finite Di erence Time Domain Method for Electromagnetics. CRC Press, Boca Raton, Florida, 1993. 148] Lang, Y-D., A. Cervantes, y L.T. Biegler. Dynamic optimization of a batch crystallization process. I & EC Research, 38(4):1469-1477, 1999. 149] Langtangen, H.P. Computational Partial Di erential Equations. SpringerVerlag, Berlin, Alemania, 1999. 150] Lapidus, L. y R. Luus. Optimal Control of Engineering Processes. Waltham, MA: Blaisdell, 1967. 151] Leclerc, A.P. E cient and Reliable Global Optimization. Tesis Doctoral Univ. Estatal de Ohio, 1992. 152] Lee, J. y W.F. Ramirez. Optimal fed-batch control of induced foreign protein production by recombinant bacteria. AIChE J., 40(5):899, 1994. 153] Leis, J. R. y M. A. Kramer. Sensitivity analysis of systems of di erential and algebraic equations. Comp. & Chem. Eng., 9(3):93{96, 1985. 154] Lewis, R. M. y V. Torczon. A globally convergent augmented lagrangian pattern search algorithm for optimization with general constraints and simple bounds. In review for SIAM J. on Optimization. Informe tecnico 98-31, 2000. 155] Lewis, R. M., V. Torczon, y M. W. Trosset. Direct search methods: Then and now. J. of Comp. and Appl. Math, 124(1-2):191{207, 2000. 156] Li, S. Adaptive Mesh Methods and Software for Time-Dependent Partial Differential Equations. Tesis Doctoral, Univ. de Minnesota, 1998. 157] Li, S. y L. Petzold. Design of new DASPK for sensitivity analysis. Informe tecnico, UCSB, 1999.
310
Referencias
158] Lim, H. C., Y.J. Tayeb, J. M. Modak, y P. Bonte. Computational algorithms for optimal feed rates for a class of fed-batch fermentation: numerical results for penicillin and cell mass production. Biotechnol. and Bioeng., 28:1408, 1986. 159] Lin, X. y C.A. Floudas. Design, synthesis and scheduling of multipurpose batch plants via an e ective continuous-time formulation". European Symposium on Computer Aided Process Engineering - 10, editado por S. Pierucci, 1159{1164, Elsevier, 2000. 160] Lin, Y.E., R.C. Anantheswaran, and V.M. Puri. Finite element analysis of microwave heating of solid foods. J. Food Eng., 25:85, 1995. 161] Lioen, W.M. y J.J. B. de Swart. Test set for initial value problem solvers. Informe tecnico, CWI, Amsterdan, Holanda, 1999. 162] Liu, D. C. y J. Nocedal. On the limited memory BFGS method for large scale optimization. Mathematical Programming, 45:503{528, 1989. 163] Liu, Y. y B.D.O. Anderson. Singular Perturbation Approximation of balanced systems. Int. J. Control, 50:1379{1405, 1989. 164] Logsdon, E.M. E cient Determination of Optimal Control Pro les for Differential Algebraic Systems. Tesis Doctoral, Carnegie Mellon Univ., 1990. 165] Lucia, A., J. Xu, y G.C. D'Couto. Sparse quadratic programming in chemical process optimization. Ann. Opp. Res., 42:55, 1990. 166] Luenberger, D. Optimization by Vector Space Methods. Wiley, Nueva York, 1969. 167] Lurie, K. A. Applied Optimal Control Theory of Distributed Systems. Plenum Press, Nueva York, 1993. 168] Luus, R. Optimal control by Dynamic Programming using accessible grid points and region contraction. Hung. J. Ind. Chem., 17:523{543, 1989. 169] Luus, R. Application of Dynamic Programming to high-dimensional non-linear optimal control problems. Int. J. Control, 52(1):239{250, 1990. 170] Luus, R. Optimal control by Dynamic Programming using systematic reduction in grid size. Int. J. Control, 51(5):995{1013, 1990.
Referencias
311
171] Luus, R. On the application of dynamic iterative programming to singular optimal control problems. IEEE Trans. Autom. Control, 37(11):1802, 1992. 172] Luus, R. Application of Dynamic Programming to di erential algebraic process systems. Comp. & Chem. Eng., 17:373{377, 1993a. 173] Luus, R. Optimization of fed-batch fermentors by iterative dynamic programing. Biotechnol. and Bioeng., 17:599{602, 1993b. 174] Luus, R. Optimal control of batch reactors by Iterative Dynamic Programming. J. Proc. Control, 4(4):218{226, 1994. 175] Luus, R. Sensitivity of control policy on yield of a fed-batch reactor. IASTED Int. Conf. on Modelling and Simulation, Pittsburg, 1995. 176] Luus, R. y V. Dong. Use of Iterative Dynamic Programming in optimizaciton of reactor systems. En IFAC Symposium on Dynamics and Control of Chemical Reactors, Distillation Columns and Batch Processes, 45{49, Helsingor, Dinamarca, 1995. 177] Luus, R. y D. Hennessy. Optimization of fed-batch reactors by the Luus-Jakola optimization procedure. Ind. Eng. Chem. Res., 38(5):1948{1955, 1999. 178] Luus, R. y T.H.I. Jaakola. Optimisation of non-linear functions subject to equality constraints. IEC Process. des. Dev., 12:380{383, 1973. 179] Mageroy, E. Numerical integration of systems arising from the method of lines. Informe tecnico-377, Dept. Matematicas, Univ. de Auckland, Nueva Zelanda, 1997. 180] Maly, T. y L.R. Petzold. Numerical methods and software for sensitivity analysis of di erential-algebraic systems. Applied Numerical Mathematics, 20:57{79, 1996. 181] Mart nez, A., C. Rodr guez, y M. E. Vazquez-Mendez. Theoretical and numerical analysis of an optimal control problem related to wastewater treatment. SIAM J. Cont. and Opt., 38:1534 { 1553, 2000. 182] Maurer, H. y M. Wiegand. Numerical solution of a drug displacement problem with bounded state variables. Optimal Control Appl. Methods, 13:43{55, 1992.
312
Referencias
183] Michalewicz, Z. Genetic Algorithms + Data Structures = Evolution Programs. Springler-Verlag, (3a edicion), 1996. 184] Miele, A. y T. Wang. Parallel computation of 2-point boundary-value problems via particular solutions. J. of Opt. Th. and App., 79:5{29, 1993. 185] Mittelmann, H.D. y H. Maurer. Solving elliptic control problems with interior point and SQP methods: Control and state constraints. En preparacion, 2000. 186] Modak, J. M., P. Bonte, y H. C. Lim. An improved computational algorithm for singular control problems in chemical reaction engineering. Chem. Eng. Commun., 86:165, 1989. 187] Modak, J. M., H.C. Lim, y Y.J. Tayeb. General characteristics of optimal feed rate pro les for various fed-batch fermentation processes. Biotechnol. and Bioeng., XXVIII:1396{1407, 1986. 188] Morison, K.R. Optimal Control of Processes Described by Systems of Di erential-Algebraic Equations. Tesis doctoral, Imperial College, Univ. de Londres, Reino Unido, 1984. 189] Mudget, R. E. Microwave properties of heating characteristics of foods. Food Technology, 2:121{135, 1986. 190] Mujtaba, I. M. Optimal Operational Policies in Batch Distillation. Tesis doctoral, Imperial College, Univ. de Londres, Reino Unido, 1989. 191] Nadkarni, M. M. y T. A. Hatton. Optimal nutrient retention during the thermal processing of conduction{heated canned food: Application of the distributed minimum principle. J. Food Sci., 50:1312{1321, 1985. 192] Nash, S. G. Newton-type minimization via the Lanczos method. SIAM J. Num. Anal., 21:770{778, 1984. 193] Nash, S. G. y A. Sofer. Linear and Nonlinear Programming. McGraw-Hill, 1996. 194] Nash, S. G. A survey on Truncate-Newton methods. J. of Comp. and Appl. Math, 124:45{59, 2000.
Referencias
313
195] Nash, S. G. y J. Nocedal. A numerical study of the limeited memory BFGS method and the Truncated Newton method for large scale optimization. SIAM. J. Optimization, 1(3):358{372, 1991. 196] Neittaanmaki, P. y D. Tiba. Optimal Control of Nonlinear Parabolic Systems. Marcel Dekker, Inc., 1994. 197] Nicola ,B. , N. Scheerlinck, H. Stigter, y J. Van Impe. Modelling and simulation of combined microwave-convection heating. Informe tecnico, EU FAIR Project CT96-1192, KULeuven, Belgica, 1999. 198] Nishida, N., Y.A. Liu, L. Lapidus, y S. Hiratsuka. An e ective computational algorithm for suboptimal singular and/or bang-bang control. AIChE J., 22(3):505{523, 1976. 199] Nocedal, J. y S. Wright. Numerical Optimization. Springer, Nueva York, 1999. 200] Noronha, J., M. Hendrickx, A. Van Loey, y P. Tobback. New semi-empirical approach to handle time-variable boundary conditions during sterilisation of non-conductive heating foods. J. Food Eng., 24(2):249{268, 1995. 201] Oh, M. Modelling and Simulation of Combined Lumped and Distributed Processes. Tesis doctoral, Imperial College, Univ. de Londres, Reino Unido, 1995. 202] Ohlsson, T. The C-value as a tool in optimizing thermal processes. SIK Service serie Nr 786, Gotteborg, Suecia, 1988. 203] Ohlsson, T. y N.E. Bengtsson. Microwave heating pro les in foods - a comparison between heating experiments and computer simulation. Microwave Energy Applications Newsletter, IV(6), 1971. 204] Oliveira, L.S., A.S. Franca, E.K. Kang, K. Haghighi y F. Milner. Adaptive nite element analysis of coupled transport problems. International Winter Meeting - Nashville, Tennessee, American Society of Agricultural Engineers ASAE, 1992. 205] O~ate, E., J. Periaux, and A. Samulesson Edts. The Finite Element Method n in the 1990's: A Book Dedicated to O.C. Zienkiewicz. CIMNE, Barcelona, Espa~a, 1991. n
314
Referencias
206] Pantelides, C.C., D. Gritsis, K. R. Morison y R. W. H. Sargent. The mathematical modelling of transient systems using di erential-algebraic equations. Comp. & Chem. Eng., 12(5):449{454, 1988. 207] Park, H. M., T.H. Kim y D.H. Cho. Estimation of parameters in ow reactors using the Karhunen-Loeve decomposition. Comp. & Chem. Eng., 23:109{123, 1998. 208] Park, S. y W. F. Ramirez. Optimal production of secreted protein in fed-bath reactors. AIChE J., 34(9):1550, 1988. 209] Petzold, L. Di erential/Algebraic equations are not ODEs. SIAM J. Sci. Stat. Comput., 3(3):367{384, 1982. 210] Petzold, L. R., J. B. Rosen, P.E. Gill, L.O. Jay y K. Park. Numerical optimal control of parabolic PDEs using DASOPT. En IMA Workshop on Large Scale Optimization, 1996. 211] Petzold, L.R. A description of dassl: A di erential/algebraic system solver. Informe tecnico 82-8637, Sandia National Labs., 1982. 212] Petzold, L. R. Automatic selection of methods for solving sti and nonsti systems of ordinary di erential equations. SIAM J. Sci. Stat. Comput., 4:136{ 148, 1983. 213] Pinter, J. Global Optimization in Action. Continuous and Lipschitz Optimization: Algorithms, Implementations and Applications. Kluwer Academics, Holanda, 1996. 214] Polak, E. Computational Methods in Optimization. Academic Press, Nueva York, 1971. 215] Polyak, R. Modi ed Barrier Functions (theory and methods). Mathematical Programming, 54:177{222, 1992. 216] Quarteroni, A., R. Sacco y F. Saleri. Numerical Mathematics. Springer-Verlag, Nueva York, U.S.A., 2000. 217] Quirijns, E.J., L.G. Van Willigenburg y A.J.B. Van Boxtel. New perspectives for optimal control of drying processes. ADCHEM 2000: International Symposium on Advanced Control of Chemical Processes, IFAC, 2000.
Referencias
315
218] Ramaswamy, H.S., G.B. Awuah y B.K. Simpson. Heat transfer and lethality considerations in aseptic processing of liquid/particle mixtures: A review. Crit. Rev. in Food Sci. Nutr., 37(3):253{286, 1997. 219] Ramesh, M. N. Optimum sterilisation of foods by thermal processing - a review. Food Sci. & Technol. Today, 9(4):217{227, 1993. 220] Ramirez, W. F. Process Control and Identi cation. Academic Press, San Diego, 1994. 221] Rao, S. S. Engineering Optimization: Theory and Practice. John Wiley & Sons, 1996. 222] Ratschek, H. y J. Rokne. Interval methods, En \Handbook of Global Optimization", 751{828. Kluwer Academics, editado por R. Horst y P. M. Pardalos, 1995. 223] Raymond, J.P. y H. Zidani. Hamiltonian pontryagin's principles for control probems governed by semilinear parabolic ecuations. Appl. Math. & Opt., 39:143{177, 1999. 224] Reitz, J.R., F.J. Milford y R. W. Christy. Fundamentos de la Teor a Electromagnetica. Addison-Wesley Iberoamericana, Delaware, 1986. 225] Reklaitis, G. V., A. Ravindran y K. M. Ragsdel. Engineering Optimization: Methods and Applications. John Wiley & Sons, Nueva York, 1983. 226] Rice, J.R. y M. Lujan. MOL: Method of lines application. Enviado, Dept. de Ciencias de la Computacion, Univ. de Purdue, 2000. 227] Rico-Mart nez, R., K. Krischer y Y.G. Kevrekidis. \Nonlinear system identi cation using neural networks: dynamics and instabilities" en Neural Networks in Chemistry and Chemical Engineering, A. Bulsari, 1995. 228] Risman, P. O. Microwave oven loads for power measurements. Microwave World, 14(1):14{19, 1993. 229] Rosen, O. y R. Luus. Global optimization approach to nonlinear optimal control. J. of Opt. Th. and App., 73(3):S415{S419, June 1992.
316
Referencias
230] Roubos, J.A., C. D. de Gooijer, G. Van Straten y A.J.B. Van Boxtel. Comparison of optimization methods for fed-batch cultures of hybridoma cells. Bioprocess Eng., 17(2):99{102, 1997. 231] Roubos, J.A., G. Van Straten y A.J.B. Van Boxtel. An evolutionary strategy for fed-batch bioreactor optimization: Concepts and Performance. J. of Biotechnology, 67:173{187, 1999. 232] Saa, J., A. A. Alonso y J.R. Banga. Optimal control of microwave heating using mathematical models of medium complexity. Presentado en ACoFoP (Automatic Control of Good and Biological Processes), Goteborg, Sweden, 2123, 1998. 233] Saa, J., J. Vazquez, A.A. Alonso y J.R. Banga. Hardware and software for data acquisition, monitorization and control of a microwave combination oven. Informe tecnico, Lab. de Ingenier a Qu mica, IIM-CSIC. Espa~a, 1998. n 234] Saguy, I. y M. Karel. Optimal retort temperature pro le in optimizing thiamine retention in conduction-type heating of canned foods. J. Food Sci., 44:1485{1490, 1979. 235] Sahinidis, N. V. y M. Tawarmalani. Applications of global optimization to process and molecular design. Comp. & Chem. Eng., 24:2157{2169, 2000. 236] San, K.Y. y G. Stephanopoulos. A note on the optimality criteria for maximum biomass production in a fed-batch fermentor. Biotechnol. and Bioeng., 26:1261{1264, 1984. 237] San, K.Y. y G. Stephanopoulos. Optimization of a fed-batch penicillin fermentation: a case of singular optimal control with state constraints. Biotechnol. and Bioeng., 34:72{78, 1989. 238] Sanchez, I., J.R. Banga y A.A. Alonso. Temperature control in microwave combination ovens. J. Food Eng., 46:21{29, 2000. 239] Sayer, C., G. Arzamendi, J.M. Asua, E.L. Lima y J.C. Pinto. Dynamic optimization of semicontinuous emulsion copolymerization reactions: Composition and molecular weight distribution. En European Symposium on Computer Aided Process Engineering-10, editado por S. Pierucci, Elsevier, Amsterdam, Holanda, 2000.
Referencias
317
240] Scheerlinck, N. y B. Nicola . CHAMPSPACK: Fortran Subroutines for Finite Element Computations of Coupled Heat and Mass Transfer Problems with Internal Heat Generation and Convective Boundary Conditions. User's Manual, Version F1.1. Univ. Catolica de Lovaina, Belgica, 1999. 241] Schiesser, W. E. Computational Mathematics in Engineering and Applied Science: ODEs, DAEs and PDEs. CRC Press, Inc., 1994. 242] Schiesser, W. E. The Numerical Method of Lines. Academic Press, Nueva York, 1991. 243] Schittkowski, K. NLPQL: A FORTRAN subroutine solving constrained nonlinear programming problems. Annals of Operations Research, 7(3-4):485{500, 1985/86. 244] Seywald, H., R.R. Kumar y S.M Deshpande. Genetic algorithm approach for optimal control problems with linearly appearing controls. J. Guid. Contr. Dyn., 18(1):177{182, 1995. 245] Shioya, S. Optimization and control in fed-batch bioreactors. Adv. Biochem. Eng. Biotechnol., 46:111{142, 1992. 246] Shlager, K. L. y J. B. Schneider. A selective survey of the nite-di erence time-domain literature. IEEE Ant. and Prop. Magazine, vol. 37, no. 4, pp. 39-56, 1995, 37(4):39{56, 1995. 247] Shuler, M.L. y F. Kargi. Bioprocess Engineering. Prentice Hall, Englewood Cli s, New Jersey, 1992. 248] Shvartsman, S. Y. y I. G. Kevrikidis. Nonlinear model reduction for control of distributed systems: A computer{assisted study. AIChE J., 44(7):1579{1595, 1998. 249] Silebi, C.A. y W.E. Schiesser. Dynamic Modeling of Transport Process Systems. Academic Press, Londres, 1992. 250] Silva, C. L. M., F.A.R. Oliveira y M. Hendrickx. Modelling optimum processing conditions for the sterilization of prepackaged foods. Food Control, 4(2):67{78, 1993. 251] Simutis, R. y A. Lubbert. A comparative study on random search algorithms for biotechnical process optimization. J. of Biotechnology, 52:245{256, 1997.
318
Referencias
252] Singh, R. P. y D.R. Heldman. Introduction to Food Engineering. Academic Press, California, 1993. 253] Siouris, G. M. An Engineering Approach to Optimal Control and Estimation Theory. John Wiley & Sons, Inc., Nueva York, 1996. 254] Sirovich, L. Turbulence and the dynamics of coherent structures. Part I: Coherent structures. Quaterly of Appl. Math., 561{571, 1987. 255] Storn, R. y K. Price. Di erential Evolution - a simple and e cient heuristic for global optimization over continuous spaces. J. Global. Optim., 11:341{359, 1997. 256] Stumbo, C. R. Thermobacteriology in Food Processing. Academic Press, Nueva York, 1973. 257] Tanartkit, P. y L.T. Biegler. Stable decomposition for dynamic optimization. I&EC Res., 34:1253{1266, 1995. 258] Teixeira, A. A., J. R. Dixon, J. W. Zahradnik y G. E. Zinsmeister. Computer optimization of nutrient retention in thermal processing of conduction-heated foods. Food Technol., 23:137{42, 1969. 259] Teixeira, A. A., G. E. Zinsmeister y J. W. Zahradnik. Computer simulation of variable retort control and container geometry as a possible means of improving thiamine retention in thermally processed foods. J. Food Sci., 40:656{659, 1975. 260] Teixeira, A. A., M.O. Balaban, S.P.M. Germer, M.S. Sadahira, R.O.T. Neto y A.A. Vitali. Heat transfer model performance in simulation of process deviations. J. Food Sci., 64(3):488{493, 1999. 261] Terajima, Y. y Y. Nonaka. Retort temperature pro le for optimum quality during conduction-heating of foods in retortable pouches. J. Food Sci., 61(4):673{678, 1996. 262] Theodoropoulou, A., R. A. Adomaitis y E. Za riou. Model reduction for optimization of rapid thermal chemical vapor deposition systems. IEEE Trans. on Semiconduct. Manufact., 11(1):85{98, 1998. 263] Tholudur, A. y W. F. Ramirez. Optimization of fed-batch bioreactors using neural network parameter function models. Biotechnol. Prog., 12:302, 1996.
Referencias
319
264] Tholudur, A. y W. F. Ramirez. Obtaining smoother singular arc policies using a modi ed Iterative Dynamic Programming algorithm. Int. J. Control, 68(5):1115{1128, 1997. 265] Tolsma, J. E. y P.I. Barton. Hidden discontinuities and parametric sensitivity calculations. SIAM J. on Scienti c Computing, enviado, 2000. 266] Tombs, M.S. y I. Postlethwaite. Truncated balanced realization of stable, non-minimal state-space systems. Int. J. Control, 46:1319{1330, 1987. 267] Tsang, T.H., D.M. Himmelblau y T.F. Edgar. Optimal control via via collocation and nonlinear programming. J. of Control, 21:763{768, 1975. 268] Van Remmen, H.H.J., C.T. Ponne, H.H. Nijuis, P.V. Bartels y P.J.A.M Kerkhof. Microwave heating distributions in slabs, spheres and cylinders with relation to food processing. J. of Food Science, 61(6):1105{1117, 1996. 269] Varga, A. E cient minimal realization procedure based on balancing. En IMACS/IFAC Symp. MCTS, editado por S. G. Tzafestas A. El Moudui, P. Borne, Lille, Francia, 1991 a. 270] Varga, A. Balancing-free square-root algorithm for computing singular perturbation approximations. En 30-Th IEEE CDC, 2, 1062{1065, Brighton, Reino Unido, 1991 b. 271] Varga, A. Model reduction routines for SLICOT. Informe tecnico NICONET 1999-8, Univ. Tecnica de Eindhoven, 1999. 272] Vassiliadis, V. S. DAEOPT | a di erential-algebraic optimization solver. Informe tecnico, Imperial College, Londres, Reino Unido, 1992. 273] Vassiliadis, V. S. Computational Solution of Dynamic Optimization Problems with General Di erential-Algebraic Constraints. Tesis Doctoral, Imperial College, Univ. de Londres, Reino Unido, 1993. 274] Vassiliadis, V. S., C. C. Pantelides y R. W. H. Sargent. Solution of a class of multistage dynamic optimization problems. 1. Problems without path constraints. Ind. Eng. Chem. Res., 33(9):2111{2122, 1994a. 275] Vassiliadis, V. S., C. C. Pantelides y R. W. H. Sargent. Solution of a class of multistage dynamic optimization problems. 2. Problems with path constraints. Ind. Eng. Chem. Res., 33(9):2123{2133, 1994b.
320
Referencias
276] Vassiliadis, V. S. y C.A. Floudas. The modi ed barrier function approach for large-scale optimization. Comp. & Chem. Eng., 21:855{874, 1997. 277] Verboven, P., N. Scheerlinck, J. De Baerdemaeker y B. M. Nicola . Possibilities and limitations of computational uid dynamics for thermal food process optimization. En \Processing Foods: quality optimization and process assessment", editado por Oliveira, F. y Oliveira, J., 41-66, CRC Press, Boca Raton, 1997. 278] Von Stryk, O. Numerical solution of optimal control problems by direct collocation. Optimal Control- Calculus of Variations, Optimal Control Theory and Numerical Methods, editado por R. Bulirsch, A. Miele, J. Stoer, K.H. Well, 129{143, Birkhauser, Basel, 1993. 279] Wang, F.S. y J.P. Chiou. Optimal control and optimal time location problems of di erential-algebraic systems by di erential evolution. Ind. Eng. Chem. Res., 36(12):5348{5357, 1997. 280] Wang, T. Global Optimization for Constrained Nonlinear Programming. Tesis Doctoral, Univ. de Illinois, 2000. 281] Wangsness, R. K. Campos Electromagneticos. Limusa, Mexico, 1992. 282] Wappling-Raaholt, B. y T. Ohlsson. Modelling and simulation of microwave heating. Informe tecnico, EU FAIR Project CT96-1192, SIK, Suecia, 1999. 283] Welty, J.R., C. E. Wicks y R.E. Wilson. Fundamentos de Transferencia de Momento, Calor Y Masa. Limusa, 1996. 284] Wolfram, S. The Mathematica Book. Cambridge University Press, Cambridge, Reino Unido, 1996. 285] Wright, M. H. Direct search methods: Once scorned, now respectable. En Numerical Analysis 1995 (Procceedings of the 1995 Dundee Biennal Conference in Numerical Analysis), editado por D.F. Gri ths and G.A. Watson, Adison Wesley Longman, Harlow, Reino Unido, 1996. 286] Wycko , P. S. Numerical Solution of Di erential Equations Through Empirical Eigenfunction Expansions. Tesis Doctoral, MIT, Massachusetts, 1995.
Referencias
321
287] Yamashita, Y. y M. Shima. Numerical computational method using genetic algorithm for the optimal control problem with terminal constraints and free parameters. Nonlinear Analysis-Theory Methods & Applications 30(4):22852290, 1997. 288] Yang, R.L. y C. P. Wu. Global optimal control by accelerated simulated annealing. Presentado en First Asian Control Confence, Tokyo, Japon, 1994. 289] Yee, K. S. Numerical solution of initial boundary value problems involving maxwell's equations in isotropic media. IEEE Trans. Ant. Prop., 14(4):302{ 307, 1966. 290] Zhou, J.L., A.L. Tits y C.T. Lawrence. User's guide for FFSQP v3.6. Informe tecnico SRC-TR-92-107r2, I.S.R., Univ. de Maryland, 1996. 291] Zhou, Z.G., Z.S. Zhang, X. Wanga, Y.C. Dai y W.K. Yuan. Optimal control of batch electrochemical reactor using k-l expansion. Chem. Engng. Sci., 56:1485{1490, 2001.
322
Referencias
324
Aparecera en: \Global Optimization - Selected Case Studies", editado por Janos Pinter, Kluwer Academic Publishers, 2001. E. Balsa-Canto, J.R. Banga, A.A. Alonso y V.S. Vassiliadis, \Dynamic optimization of chemical and biochemical processes using restricted second order information". En: European Symposium on Computer Aided Process Engineering-10. Serie: Computer-Aided Chemical Engineering, 8. Editado por: S. Pierucci. Elsevier, 2000. ISBN: 0-444-50520-2
325
E. Balsa-Canto, V.S. Vassiliadis, J.R. Banga y A.A. Alonso, \E cient dynamic optimization of distributed parameter process systems", Annual meeting 1999 of the American Institute of Chemical Engineers (AIChE), noviembre, 1999, Dallas, USA. V.S. Vassiliadis, E. Balsa-Canto y J.R. Banga, \A hybrid strategy for the optimal control of multistage chemical processes", Annual meeting 1999 of the American Institute of Chemical Engineers (AIChE), noviembre, 1999, Dallas, USA. E. Balsa-Canto, V.S. Vassiliadis y J.R. Banga, \Dynamic optimization of a class of multistage systems using a hybrid stochastic-deterministic method", 19th IFIP TC7 Conference on Process Modelling and Optimization, julio, 1999, Cambridge, U.K. E. Balsa-Canto, J.R. Banga y V.S. Vassiliadis, \E cient optimal control of bioprocesses using second order information", Annual meeting 1998 of the American Institute of Chemical Engineers (AIChE), noviembre, 1998, Miami Beach, Fl, USA. V.S. Vassiliadis, E. Balsa-Canto, J.R. Banga, \ Second order information analysis in control vector parameterization methods for the solution of optimal control problems", Annual meeting 1998 of the American Institute of Chemical Engineers (AIChE), noviembre, 1998, Miami Beach, Fl, USA. E. Balsa-Canto, A.A. Alonso y J.R. Banga, \Dynamic optimization of bioprocesses: deterministic and stochastic strategies", ACoFoP IV (Automatic Control of Food an Biological Processes), septiembre, 1998, Goteborb, Suecia.
326
J. R. Banga, J. Saa, E. Balsa-Canto, A.A. Alonso, S. Galt, M. Idebro, B.M. Nicola , T. Ohlsson, I. Sanchez, N. Scheerlinck, H. Stigter, J. Van Impe y B. Wppling-Raaholt. \Optimal control of microwave heating using rigurous models"