Вы находитесь на странице: 1из 344

Simulación y optimización

avanzadas en la industria
química y de procesos: HYSYS

Susana Luque Rodríguez


Aurelio B. Vega Granda
Departamento de Ingeniería Química
y Tecnología del Medio Ambiente
Universidad de Oviedo
Tercera edición
ISBN: 84-689-3028-8
D.L. AS/3604-2005

Editora: Susana Luque Rodríguez

© Los autores, 2005.


TODOS LOS DERECHOS RESERVADOS.
Ninguna parte de esta publicación se puede
reproducir, guardar o transmitir de ningún modo,
electrónico o de otro tipo, sin el permiso de los
autores.

Impreso y encuadernado en España


Universidad de Oviedo, Oviedo
Índice general

ÍNDICE GENERAL

Página
Tema 1. Introducción. La simulación de procesos en la industria química actual 1
Susana Luque Rodríguez y Aurelio B. Vega Granda

I. Termodinámica y modelización rigurosa de procesos


Tema 2. Termodinámica de sistemas no ideales 17
Julio L. Bueno de las Heras
Tema 3. Modelos de predicción de propiedades físico-químicas 47
M. Carmen Pazos Medina
Tema 4. Implementación de modelos de propiedades físicas en simuladores 77
comerciales y criterios de selección
Aurelio B. Vega Granda
Tema 5. Modelos rigurosos de separaciones de equilibrio 97
Fernando V. Díez Sanz
Tema 6. Modelos rigurosos de operaciones unitarias 107
Aurelio B. Vega Granda

II. Simulación de procesos en la industria química y de procesos. HYSYS


Tema 7. Modos de simulación de procesos 125
Aurelio B. Vega Granda
Tema 8. Métodos de resolución de ecuaciones no lineales I: métodos tipo Newton 137
José Ramón Álvarez Saiz
Tema 9. Métodos de resolución de ecuaciones no lineales II: métodos que no 149
requieren derivadas y de primer orden
José Ramón Álvarez Saiz
Tema 10. Recirculaciones: partición y seccionado de corrientes 163
Susana Luque Rodríguez
Tema 11. Simulación en diseño y operación de procesos. Aplicaciones 179
Aurelio B. Vega Granda

III. Optimización de diagramas de flujo con HYSYS


Tema 12. Introducción a la programación no lineal (NLP) con restricciones 195
José Ramón Álvarez Saiz
Tema 13. Programación cuadrática sucesiva (SQP) 217
José Ramón Álvarez Saiz
Tema 14. Optimización de procesos con simuladores modulares 231
Susana Luque Rodríguez
Tema 15. Optimización de procesos con simuladores orientados a ecuaciones 243
Susana Luque Rodríguez
Tema 16. Optimización en diseño y operación en la industria química. Aplicaciones 257
Susana Luque Rodríguez
i
Índice general

Tema H1. Introducción al uso de HYSYS. Modelos simples de operaciones unitarias 275
Aurelio B. Vega Granda y Susana Luque Rodríguez
Tema H2. Simulación de procesos con HYSYS. Aspectos básicos 289
Susana Luque Rodríguez y Aurelio B. Vega Granda
Tema H3. Simulación de procesos con HYSYS. Sistemas de reacción y 303
recirculaciones
Aurelio B. Vega Granda y Susana Luque Rodríguez
Tema H4. Simulación de procesos con HYSYS. Especificaciones de diseño 313
Susana Luque Rodríguez y Aurelio B. Vega Granda
Tema H5. Simulación de procesos con HYSYS. Optimización de diagramas de flujo 327
Susana Luque Rodríguez y Aurelio B. Vega Granda

ii
Introducción.
La simulación de procesos en la
industria química actual

Susana Luque Rodríguez


Aurelio B. Vega Granda

Departamento de Ingeniería Química


y Tecnología del Medio Ambiente
Universidad de Oviedo
Introducción y planificación del curso. La simulación de procesos en la industria química actual

ÍNDICE

1. INTRODUCCIÓN ........................................................................................................3
2. ORGANIZACIÓN DEL CURSO................................................................................4
2.1. Objetivos del curso................................................................................................4
2.2. Programa del curso................................................................................................4
2.3. Evaluación.............................................................................................................6
2.4. Bibliografía............................................................................................................6
3. LA SIMULACIÓN DE PROCESOS EN LA INDUSTRIA QUÍMICA ACTUAL .7
4. DISEÑO GLOBAL DE PROCESOS QUÍMICOS Y EL “MODELO DE
CEBOLLA”...................................................................................................................9
5. MODELIZACIÓN EN PROCESOS QUÍMICOS ..................................................12
5.1. Los métodos numéricos como herramienta para la modelización de procesos en
ingeniería química ...............................................................................................13
6. TENDENCIAS ACTUALES EN EL DISEÑO DE PROCESOS ...........................16
7. BIBLIOGRAFÍA ........................................................................................................16

1. INTRODUCCIÓN
El desarrollo de modelos de balances de materia y energía es la base para la evaluación de
procesos y la toma de decisiones en el diseño de nuevas plantas o modificaciones de las ya
existentes. El modelo del diagrama de flujo comprende un conjunto grande de ecuaciones no
lineales que describen:
1. las condiciones de las unidades del proceso mediante corrientes de proceso
2. las ecuaciones específicas de cada unidad (leyes de conservación y ecuaciones de
diseño específicas)
3. los datos y relaciones de éstos con las propiedades físicas de las sustancias procesadas
En este curso veremos todos estos aspectos incluyendo la influencia que tiene el
comportamiento real (no ideal) de los sistemas en equilibrio, así como el desarrollo de
modelos detallados, que se encuentran implementados en los simuladores comerciales.
Los modelos detallados se basan en relaciones de equilibrio entre fases (para lo cual se
repasarán algunos conceptos termodinámicos) y balances de materia y energía.
Los cálculos en los simuladores comerciales se simplifican bastante al no incluir en muchos
casos las propiedades de transporte. Es decir, se aprovecha la posibilidad de llevar a cabo los
balances de materia y energía sin conocer la capacidad o geometría de las unidades. Esto
implica que para llevar a cabo una estimación económica del proceso, tras la simulación se
tiene que llevar a cabo un diseño de las unidades, que incluya su dimensionado y estimación
de coste. Los simuladores comerciales tienen esta opción disponible, habitualmente como un
paquete informático adicional, al que se pueden incorporar los datos obtenidos en la
simulación.
3
Introducción y planificación del curso. La simulación de procesos en la industria química actual

Otra de las implicaciones importantes de esta forma de trabajo es que, aunque resulta correcta
para nuevos diseño de plantas o secciones de planta, su aplicación a simulación de equipos
existentes es más problemática (ya que se precisarían modelos del funcionamiento de dichos
equipos). En otros casos, por ejemplo en operaciones no controladas por el equilibrio sino por
un proceso de velocidad, los modelos basados en consideraciones termodinámicas tampoco
son adecuados.
En el curso también se abordarán los métodos de resolución de los sistemas de ecuaciones no
lineales que resultan de los modelos de las unidades del proceso y de las propiedades físico-
químicas de las corrientes involucradas. Para ello se introducirán métodos numéricos que
permiten trabajar con sistemas a gran escala, como los habitualmente encontrados en
simulación de procesos. Con este objetivo se introducirán brevemente los algoritmos de
resolución más habituales en los simuladores comerciales.
Una vez que se tienen las ideas de simulación de procesos y de la estructura de los modelos de
proceso, se va a considerar un aspecto clave en diseño de procesos. El objetivo de muchas
simulaciones en Ingeniería es el desarrollo de un modelo predictivo que se pueda usar en
mejorar el proceso. Con esta idea se verán las estrategias de optimización para procesos
químicos con variables continuas. En particular nos centraremos en el algoritmo de
programación cuadrática sucesiva (SQP o “Successive Quadratic Programming”) que se ha
convertido en el estándar en optimación de procesos.

2. ORGANIZACIÓN DEL CURSO


2.1. Objetivos del curso
El curso profundiza en las herramientas actualmente disponibles para la simulación de
procesos reales de la industria química y de procesos.
Se pretende que los participantes adquieran:
• los conocimientos teóricos básicos necesarios para comprender la implementación de
los modelos en los simuladores y su resolución
• las estrategias actualmente empleadas en optimización de procesos químicos
• experiencia en la formulación y resolución de problemas industriales de diseño y
optimización, con una herramienta informática que en la actualidad emplea la
industria de procesos: HYSYS v. 3.

2.2. Programa del curso


El curso consta de 30 horas lectivas, 15 de las cuales se imparten en el aula 26 y 15 en aula de
informática (aula D, edificio de departamentos), con una ratio máxima de 2
alumnos/ordenador. El curso es convalidable por 4.5 créditos de libre configuración.
El curso se ha estructurado en tres bloques temáticos:
I. Introducción. Termodinámica y modelización rigurosa de procesos
II. Simulación de procesos en la industria química y de procesos: HYSYS
III. Optimización de diagramas de flujo con HYSYS

4
Introducción y planificación del curso. La simulación de procesos en la industria química actual

El curso incluye, además de los aspectos teóricos básicos necesarios para comprender la
implementación de los modelos en los simuladores y su resolución, un gran número de horas
de clases en las que es posible, mediante el acceso directo a un ordenador con un programa de
simulación comercial (HYSYS, v.3.) adquirir experiencia en la formulación y resolución de
problemas industriales de diseño y optimización, con las mismas herramientas que en la
actualidad emplea la industria de procesos.

El temario detallado del curso se indica a continuación:


Tema Título Profesor/a Duración
(h)
0 Introducción y planificación del curso. La simulación Susana Luque 1
de procesos en la industria química actual
I. Introducción. Termodinámica y modelización rigurosa de procesos
1 Termodinámica de sistemas no ideales Julio Bueno 1
2 Modelos de predicción de propiedades físico-químicas Carmen Pazos 1
3 Implementación de modelos de propiedades físicas y Aurelio Vega 1
criterios de selección
4 Modelos rigurosos de separaciones de equilibrio Fernando Díez 1
5 Modelos rigurosos de operaciones unitarias Aurelio Vega 1
II. Simulación de procesos en la industria química y de procesos HYSYS
6 Modos de simulación de procesos Aurelio Vega 1
7 Métodos de resolución de ecuaciones no lineales I: José R. Álvarez 1
métodos tipo Newton
8 Métodos de resolución de ecuaciones no lineales II: José R. Álvarez 1
métodos que no requieren derivadas y de primer orden
9 Recirculaciones: partición y seccionado de corrientes Susana Luque 1
10 Simulación en diseño y operación de procesos. Aurelio Vega 1
Aplicaciones
III. Optimización de diagramas de flujo con HYSYS
11 Introducción a la programación no lineal (NLP) con José R. Álvarez 1
restricciones
12 Programación cuadrática sucesiva (SQP) José R. Álvarez 1
13 Optimización de procesos con simuladores modulares Susana Luque 1
14 Optimización de procesos con simuladores orientados Susana Luque 1
a ecuaciones
15 Optimización en diseño y operación en la industria Susana Luque / 1
química. Aplicaciones Aurelio Vega
H1 Introducción al uso de HYSYS. Modelos simples de Aurelio Vega / 2
operaciones unitarias Susana Luque
H2 Simulación de procesos con HYSYS. Aspectos básicos Aurelio Vega / 3
Susana Luque
H3 Simulación de procesos con HYSYS. Sistemas de Aurelio Vega / 3
reacción y recirculaciones Susana Luque
H4 Simulación de procesos con HYSYS. Especificaciones Susana Luque / 3
de diseño Aurelio Vega
H5 Simulación de procesos con HYSYS. Optimización de Susana Luque / 3
diagramas de flujo Aurelio Vega
5
Introducción y planificación del curso. La simulación de procesos en la industria química actual

La carga docente se haya repartida de forma relativamente uniforme, como se muestra en la


figura 1.

II. Simulación
I.Termodiná- de procesos
mica y 17 %
modelización
rigurosa
20 %
III.
Optimización
de diagramas
de flujo
13 %

HYSYS
50 %

Fig. 1. Distribución de la carga docente del curso, según bloques temáticos

2.3. Evaluación
A los efectos de la obtención del certificado de homologación de créditos de libre
configuración es obligatoria la asistencia en un 80 % como mínimo.
La evaluación se llevará a cabo mediante la realización de una prueba escrita (1 hora de
duración, inmediata a la finalización del curso) y un trabajo adicional sobre alguno de los
temas tratados en el curso, que los alumnos tendrán que entregar antes del 31 de julio a los
directores del curso.

2.4. Bibliografía
La documentación que se entrega está fundamentalmente obtenida de las siguientes fuentes:
• Biegler, L.T., Grossmann, I.E., Westerberg, A.W., “Systematic Methods of Chemical
Process Design”, Prentice Hall, Nueva Jersey (1997).
• Hyprotech “HYSYS user’s guide”, disponible en
http://engineering.eng.rowan.edu/~hesketh/hysyshelp/Menu.pdf, en
www.hyprotech.com y en support.aspectech.com
• Seider, W.D., Seader, J.D., Lewin, D.R., “Process Design Principles”, John Wiley &
Sons, Nueva York (1999).
Otros libros de consulta son los siguientes:
• Bequette, B.W., “Process Dynamics: Modeling, Analysis and Simulation”, Prentice
Hall, New Jersey (1998).
• Ingham, J., Dunn, I.J., Keinzle, E., Prenosil, J.E., “Chemical Engineering Dynamics”,
Verlagsgesellschaft, Weinheim (1994).
• Turton, R., Bailie, R.C., Whiting, W.B., Shaeiwitz, J.A., “Analysis, Synthesis, and
Design of Chemical Processes”, Prentice Hall, Nueva Jersey (1998).

6
Introducción y planificación del curso. La simulación de procesos en la industria química actual

3. LA SIMULACIÓN DE PROCESOS EN LA INDUSTRIA


QUÍMICA ACTUAL

En un proceso químico, la transformación de materias primas en los productos deseados


habitualmente conlleva más de una etapa. El proceso suele constar de una serie de etapas de
transformación intermedias que involucran, por ejemplo, reacción, separación, mezcla,
calentamiento, enfriamiento, cambio de presión, reducción o aumento del tamaño de partícula,
etc. Una vez que se han seleccionado las etapas individuales, es necesario interconectarlas
para llevar a cabo la transformación global.

Materias Productos
¿PROCESO?
primas deseados

Fig. 2. Esquema genérico del diseño de un proceso químico

El diseño de un proceso involucra una descripción abstracta de lo que se quiere, y otra


descripción más detallada (esto es, más refinada) en cada una de las etapas del diseño,
construcción y operación del proceso. Por ejemplo, la dirección de la empresa desea mejorar
el valor futuro de la empresa, lo que constituye la descripción abstracta de sus deseos. En
consecuencia genera y selecciona entre las alternativas posibles a llevar a cabo en la empresa
para lograr este fin; esto representa una descripción más detallada de lo que se quiere llevar a
cabo. Esta descripción se transforma en la descripción abstracta para aquellos que trabajan en
las siguientes etapas del diseño. Por ejemplo, en el diseño preliminar del proceso, la
descripción abstracta podría ser convertir el exceso de etileno de la planta en alcohol etílico.
La descripción más detallada será el diseño preliminar necesario para llevar a cabo este fin.
Denominamos síntesis al proceso de transformar la descripción abstracta en otra más
detallada, y comprende varias etapas como se indica en la figura 3.
La primera etapa es la generación del concepto, donde se identifican las claves principales en
que se basará el diseño. Para el ejemplo anterior, deberemos decidir si nos restringimos a la
química que se encuentra en la bibliografía, si sólo consideramos procesos convencionales
bien contrastados o por el contrario optamos por procesos novedosos. Se debe considerar aquí
también si se compra un proceso llave en mano, etc.
En la siguiente etapa consideramos la generación de alternativas, para ello se suele partir de
fuentes bibliográficas (patentes, artículos científicos, enciclopedias de tecnología).
La siguiente etapa es el análisis de cada una de las alternativas propuestas para evaluar su
funcionamiento. Típicamente, esto significa llevar a cabo los balances de materia y energía
del proceso para calcular los flujos, temperaturas, presiones, composiciones, etc.

7
Introducción y planificación del curso. La simulación de procesos en la industria química actual

Descripción
En la siguiente etapa tenemos que evaluar el
inicial funcionamiento del proceso, tanto desde el
punto de vista de su rentabilidad económica,
Entradas y Resultados como flexibilidad, seguridad, de impacto
medioambiental, etc. Finalmente, se requiere
Especific ación Etapas
del Pr oblema llevar a cabo una optimización para mejorar el
Gener ación diseño. Al final de todo este proceso se espera
de
Conc eptos tener el mejor diseño que satisface nuestro
(Nuevo)
Enfoque del objetivo inicial, y habremos transformado una
Diseño
Gener ac ión descripción abstracta en una más detallada
de
Alter nativas que da lugar al diagrama de flujo del proceso.
Alter nativas
de Diseño

Análisis
Un DIAGRAMA DE FLUJO (Process
Repr esentac ión Flow Diagram, PFD) no es más que la
representación de las etapas del proceso
Evaluac ión
Coste,
y sus interconexiones.
Segur idad,
etc .
Comparación
y
Por tanto, una vez que se ha definido la
Optimizac ión
estructura del diagrama, es posible llevar a
cabo un ANALISIS y SIMULACIÓN del
Descripción proceso. La simulación requiere un modelo
refinada
matemático del proceso que intenta predecir
el comportamiento del proceso si éste se
Fig. 3. Etapas en la síntesis de un proceso construyese (Fig. 4).
químico

Materias ¿Productos?
PROCESO
primas

Fig. 4. Flujo de información en la simulación de procesos

Una vez que se tiene un modelo del proceso, suponiendo conocidos unos caudales,
composiciones, temperaturas y presiones de las corrientes correspondientes a las materias
primas, la simulación permite predecir caudales, composiciones, temperaturas y presiones de
las corrientes producto. También permite el dimensionado de equipos y el cálculo del
consumo de materias primas y energía. De esta forma se puede evaluar el diseño.
En la evaluación del diseño hay muchos aspectos involucrados: la economía del proceso es el
primer criterio obvio, pero no el único. Los procesos químicos se han de diseñar como parte
de un desarrollo industrial sostenible, que permite mantener la capacidad de nuestro
ecosistema para seguir permitiendo las actividades industriales y la vida. En la práctica, esto
significa que se deben minimizar las emisiones de residuos y que los subproductos residuales
no han de ser perjudiciales para el medio ambiente. El desarrollo sostenible también implica
que el consumo energético sea el mínimo posible. El proceso, además, ha de cumplir con
8
Introducción y planificación del curso. La simulación de procesos en la industria química actual

criterios de seguridad e higiene (salud). La puesta en marcha, la parada en caso de emergencia


y la facilidad de control son otros factores importantes. La flexibilidad (posibilidad de operar
en otras condiciones, tales como materias primas diferentes o diferentes especificaciones de
productos) puede ser también importante, al igual que la disponibilidad anual de tiempo.
Algunos de estos factores se pueden cuantificar fácilmente (economía), otros con frecuencia
no. Para estos últimos el criterio del ingeniero de diseño juega un papel importante.
Una vez que se ha evaluado el diseño básico, es posible mejorar éste realizando cambios, es
decir, optimizándolo. La OPTIMIZACIÓN puede involucrar la síntesis de estructuras
alternativas (optimización estructural) en cuyo caso se realizaría una nueva simulación y
evaluación, y así sucesivamente. O, alternativamente, se puede realizar una optimización
paramétrica de una estructura, modificando las condiciones de operación.

El hecho de que hasta los procesos ya establecidos y que llevan operando un gran número
de años se siguen modificando hoy en día es una muestra de lo difícil que todo este
mecanismo de SÍNTESIS+SIMULACIÓN+OPTIMIZACIÓN resulta en la práctica.

4. DISEÑO GLOBAL DE PROCESOS QUÍMICOS Y EL “MODELO


DE CEBOLLA”

El diseño del proceso comienza en el reactor. El diseño del reactor dicta las necesidades de
separación y recirculación del proceso.
Producto
Subproductos
Alimentación Reactor
+ Reactivos no
reaccionados

Pero no toda la alimentación reacciona, además, también se generan subproductos, que es


preciso separar para obtener el producto en la pureza requerida.
Recirculación
de reactivos

Alimentación
Reactor Producto

Subproducto

En este diagrama de flujo, las necesidades energéticas (calentamiento/enfriamiento) se


obtienen de sistemas auxiliares externos (vapor y agua de refrigeración), por lo que es ineficaz
energéticamente. Por ello se debe intentar recuperar la energía: integración energética
(intercambio de calor entre las corrientes que tienen que enfriarse y los que tienen que

9
Introducción y planificación del curso. La simulación de procesos en la industria química actual

calentarse, resultando en una red de cambiadores de calor (HEN)–cuya estructura tiene


muchas posibilidades).

Sin embargo, si cambiamos el reactor o las condiciones del mismo, se modifica el problema
de separación y recirculación. Por ejemplo, si queremos, aumentado el tamaño del reactor,
aumentar la conversión, el resultado será que hay menos reactivos no reaccionados, más
cantidad de producto y una cantidad significativamente mayor de subproductos, por lo que
puede ser necesaria una secuencia diferente de los procesos de separación posterior.

Recirculación
de reactivos

Alimentación
Reactor Producto

Subproducto

Si además realizamos la integración energética, tendremos nuevos esquemas de HEN.

Los diferentes diagramas de flujo se pueden evaluar mediante simulación y cálculos


económicos (por ejemplo, dando como resultado que una de las opciones es más prometedora
que las demás). Sin embargo, no podemos estar seguros de haber encontrado el diagrama de

10
Introducción y planificación del curso. La simulación de procesos en la industria química actual

flujo óptimo antes de haber optimizado las condiciones de operación para cada uno de ellos
(por ejemplo, puede haber otra alternativa con más posibilidades de mejora).
Por lo tanto, la complejidad de la síntesis de procesos es doble:
• ¿Podemos identificar todas las estructuras posibles?
• ¿Podemos optimizar cada estructura para obtener una comparación válida? (en la
optimización de una estructura puede haber muchas maneras en las que llevar a cabo
una tarea dada, y también muchas formas de interconectar las tareas individuales...)
Todo esto implica simular y optimizar un gran número de opciones, lo que supone una
complejidad abrumadora. Por ello, para desarrollar una metodología es preciso tener una idea
clara de la estructura del problema. Si el proceso requiere un reactor, entonces el diseño
comienza con éste. Como hemos visto, la selección del reactor dicta los problemas posteriores
de separación y recirculación, que son los pasos siguientes en el diseño. Conjuntamente con el
reactor, definen las necesidades energéticas del proceso, por que el diseño de la HEN viene a
continuación. Las necesidades energéticas que no se pueden suplir mediante integración
energética originan las necesidades de sistemas auxiliares (vapor, agua de refrigeración, etc.).
Esta jerarquía se puede representar simbólicamente por las capas de una cebolla, diagrama
que enfatiza la naturaleza secuencial (o jerárquica) del diseño de procesos químicos:

REACTOR

SEPARACIONES Y
RECIRCULACIONES

Fig. 5. Diagrama de “cebolla” del diseño jerarquizado de procesos químicos


Por supuesto, algunos procesos no necesitan un reactor (por ejemplo, en refino de petróleo).
En estos casos el diseño comienza con el sistema de separación y va también hacia la parte
exterior. La jerarquía se mantiene. En la práctica hay muchas opciones y para su evaluación
completa es preciso llegar al diseño completo, lo cual muchas veces no es posible,
prácticamente hablando.
Por lo tanto, como vemos, la tarea de diseño involucra un procedimiento iterativo, en el cual
la etapa de síntesis está siempre seguida por una etapa de análisis, la cual determina si la
estructura y los parámetros propuestos funcionarán como se espera. Si las metas de diseño no
se alcanzan, se requiere un nuevo paso de síntesis para crear o una solución factible o una
solución mejorada.
En cualquier caso, para el diseño de un proceso siempre se necesita un modelo matemático
del proceso que nos permita efectuar el análisis y optimización de las diferentes alternativas
posibles.

11
Introducción y planificación del curso. La simulación de procesos en la industria química actual

5. MODELIZACIÓN EN PROCESOS QUÍMICOS

Es sabido que el procedimiento metodológico fundamental para resolver un problema en


ingeniería consiste en representarlo de una manera adecuada, para lograr una sustitución del
sistema real (equipo, proceso, etc.) por uno más adecuado para su tratamiento formal. Por lo
general, las herramientas lógico-matemáticas nos brindan un marco útil para representar
mediante un sistema de símbolos y reglas, el comportamiento de los sistemas reales.
Bajo el método científico, por ejemplo, se consolidan leyes y teorías en diversas ramas del
conocimiento, las cuales son expresables por medio de sistemas de ecuaciones diferenciales.
En otras palabras, se logra construir un nuevo sistema, del cual conocemos sus reglas de
juego y símbolos, como un resultado de un proceso de abstracción de la realidad. Obviamente,
dado la infinita complejidad de los fenómenos fisicoquímicos, estas construcciones abstractas,
conocidas genéricamente como modelos, son sólo meras aproximaciones de la realidad. En
efecto, no es otra cosa lo que se realiza cuando en física utilizamos ecuaciones para describir
el movimiento de una partícula, o resolvemos los balances correspondientes aplicando las
leyes de conservación de la materia, energía o cantidad de movimiento; o bien cuando nos
enfrentamos al diseño de un equipo según los procedimientos que conocemos a partir del
campo de las operaciones unitarias.
De aquí se desprende que si bien el sistema real a estudiar es único, puede existir un número
muy grande de modelos asociados al mismo. En efecto, para obtener un modelo que pueda
resolverse (es decir que sea útil), resulta necesario adoptar un conjunto de hipótesis. Por
ejemplo, si consideramos la fricción, si es importante o no contemplar el intercambio de
energía por radiación, etc. Las necesidades de exactitud que el problema a resolver nos
impone, determinan el conjunto de hipótesis a utilizar. En resumen, dado el sistema real y los
objetivos tecnológicos perseguidos, existirá un conjunto de hipótesis adecuadas que
determinarán las características del modelo, o sistema de ecuaciones a resolver.
Resulta evidente que no todo sistema de ecuaciones puede resolverse fácilmente, al menos
desde el punto de vista analítico. Esto impuso a lo largo de la historia limitaciones
importantes al tipo de modelos que podían resolverse, o de otra forma, la necesidad de recurrir
a hipótesis inadecuadas o restrictivas (supersimplificaciones) para al menos poder tratar el
problema. Es por ello también que en los orígenes de las ciencias tecnológicas los modelos
podían ser considerados en gran medida como empíricos, esto es, con parámetros
incorporados que surgían de experiencias, y no a partir de los primeros principios o leyes
fundamentales. No debe extrañar que aún hoy, pese a todos nuestros avances, exista la
necesidad de utilizar permanentemente parámetros en nuestros modelos, que no son otra cosa
que la medida de nuestra ignorancia, y por lo tanto, implican la necesidad de reemplazar las
leyes básicas por aproximaciones causales obtenidas de datos experimentales. Este es el caso,
por ejemplo, de la estimación de las propiedades de equilibrio de mezclas de comportamiento
altamente no ideal.
A medida que evolucionaron las diversas ramas de las matemáticas y con la incorporación de
la ciencia de la computación, poderosa herramienta complementaria al análisis numérico y
simbólico, se abrieron caminos revolucionarios. Contar con herramientas más potentes para
resolver sistemas de ecuaciones, o lo que es lo mismo, relativizar la necesidad de adoptar
hipótesis inadecuadas al plantear modelos para resolver problemas complejos, resultó un gran
paso adelante. Más aún, la velocidad de cálculo provocó que la dimensión abordable se
incrementara rápidamente. En efecto, si bien el grado de complejidad conceptual para resolver
12
Introducción y planificación del curso. La simulación de procesos en la industria química actual

la inversa de una matriz de dimensión tres es equivalente al de una de cinco mil, resulta obvio
que la complejidad operativa no resulta comparable. La computación ha acabado literalmente
con dicha limitación, haciendo ahora tratables problemas cuya dimensión es tal, que décadas
atrás ni siquiera era pensable plantearlos.
Dentro de este contexto, el propósito de los siguientes capítulos es mostrar cómo implementar
modelos para resolver problemas comunes en el campo de la ingeniería química, cómo
resolverlos desde el punto de vista computacional, y otro punto importante, qué tipos de
problemas (modelos) surgen al cubrir distintos aspectos de la ingeniería. En este punto resulta
necesario comentar que los problemas de diseño, optimización, simulación dinámica o
estacionaria, supervisión o diagnóstico de fallos en tiempo real, etc., tienen cada uno
particularidades específicas, lo cual a su vez implica la conveniencia de utilizar modelos
apropiados para cada caso.

5.1. Los métodos numéricos como herramienta para la modelización de procesos en


ingeniería química
La simulación digital constituye una poderosa herramienta para la resolución de las
ecuaciones que describen a los sistemas en ingeniería química. Las principales
dificultades que se plantean son principalmente:
a) Encontrar la solución de un sistema de ecuaciones algebraicas no lineales (que
usualmente se efectúa mediante un método iterativo.
b) Efectuar la integración numérica de ecuaciones diferenciales ordinarias y en derivadas
parciales mediante ecuaciones discretizadas en diferencias finitas que aproximan a las
soluciones de las ecuaciones diferenciales continuas.
Los métodos numéricos son una clase de algoritmos para resolver una amplia variedad de
problemas matemáticos. Únicamente se emplean operaciones lógicas y aritméticas; por
consiguiente, pueden implementarse fácilmente sobre ordenadores digitales.
En realidad, los métodos numéricos fueron desarrollados muchos años antes que surgieran los
ordenadores electrónicos digitales. En efecto, un gran número de los métodos numéricos
usualmente utilizados datan de los comienzos de las matemáticas modernas. Sin embargo, el
empleo de tales métodos estuvo restringido hasta la llegada de los ordenadores,
incrementándose drásticamente al llegar a la mayoría de edad con la introducción de los
ordenadores electrónicos digitales.
La combinación de métodos numéricos y ordenadores digitales constituye una poderosa
herramienta para el análisis matemático. Por ejemplo, los métodos numéricos son capaces de
manejar no linealidades, modelos asociados a geometrías complejas y sistemas de ecuaciones
acopladas que son necesarios para la modelización eficiente de muchos sistemas
fisicoquímicos que se presentan en ingeniería.
En la práctica, rara vez se consideran enfoques analíticos a los problemas de ingeniería en
razón de la complejidad de los sistemas a resolver. Aún en problemas para los que podrían
obtenerse con cierto esfuerzo soluciones analíticas, los métodos numéricos son poco costosos,
fáciles de emplear y con frecuencia se dispone de ellos en programas comerciales.
Es sabido que si un problema no puede resolverse analíticamente, lo mejor es programarlo en
un ordenador (mediante un algoritmo adecuado). Este punto de vista se debe, sin lugar a
13
Introducción y planificación del curso. La simulación de procesos en la industria química actual

dudas, al enorme poder de cálculo de los métodos numéricos. Sin embargo, también es cierto
que existen muchos problemas que son imposibles de resolver utilizando métodos numéricos.
Para diversos problemas no se ha encontrado todavía un modelo matemático completo y
seguro, de manera que resulta obvio que es imposible encontrarles una solución numérica. La
dimensión de otros problemas es tan grande que su solución está más allá de los límites
prácticos en términos de la tecnología computacional disponible. Por ejemplo, en problemas
fluido-dinámicos que involucran flujos turbulentos, en estimaciones meteorológicas o
c1imáticas (campos de vientos, presiones, temperaturas, etc.), y como veremos más adelante,
en diversos problemas que se plantean en el área de la ingeniería química, existen serias
limitaciones en el área de diseño y de optimización en tiempo real, etc.
En los últimos años se han desarrollado grandes programas computacionales comerciales para
simular el comportamiento de sistemas de ingeniería de todo tipo. Usualmente, estos
programas se diseñan para que sean utilizados por aquellos profesionales de la ingeniería sin
un conocimiento intensivo de su funcionamiento interno.
Por otra parte, existen bibliotecas (en continua expansión) de subrutinas de cálculo que
utilizan sofisticados métodos numéricos para realizar una amplia variedad de tareas
matemáticas, cubriendo virtualmente todos los campos del análisis numérico, aplicaciones
estadísticas, etc. Resulta obvio que cuando se disponga de programas o subprogramas que han
sido probados y demostrado su buen funcionamiento, lo más razonable es utilizarlos. No
obstante, es altamente valioso el conocimiento del funcionamiento de tales herramientas, dado
que por lo general el usuario de tales programas o subrutinas encontrará dificultades en su
utilización. Estas dificultades pueden provenir de múltiples causas. Por ejemplo, es necesario
remarcar que los métodos numéricos no están completamente libres de dificultades en todas
las situaciones en las que se los utilice. Por otra parte, aún en el caso que no presenten
dificultades de cálculo, podrían no funcionar de manera óptima en todas las situaciones que se
planteen.
Siempre debe tenerse presente que la exactitud y la estabilidad numérica afectan a la ecuación
discretizada utilizada (algoritmo de integración). En la literatura respectiva se han propuesto
muchos algoritmos. Algunos de ellos trabajan mejor que otros sobre determinados problemas
(por ejemplo más rápido y por consiguiente son menos costosos para un grado especificado de
exactitud). Desgraciadamente no existe un algoritmo que funcione en forma óptima para todos
los problemas que se plantean.
Por otra parte, el usuario en búsqueda de una subrutina de cálculo para realizar una
determinada tarea, puede encontrar una agobiante variedad de subprogramas que pueden ser
aplicables, pero el material descriptivo rara vez dará una indicación sobre la eficiencia de la
subrutina para resolver un problema específico. Esto sucede además, en la mayoría de los
productos comerciales más elaborados, por ejemplo, para la modelización en ingeniería.
Dentro de este contexto, es muy probable que el ingeniero que espera utilizar un programa o
una subrutina de una biblioteca para resolver un problema matemático determinado encuentre
dificultades inesperadas, a menos que tenga una preparación adecuada. En efecto, la selección
y aplicación de un método numérico en una situación específica, por lo general resulta más
una actividad propia de un arte que de una ciencia. Por último, nunca resulta trivial la
interpretación de los resultados obtenidos.
Por consiguiente, el usuario que no tenga la habilidad ni el conocimiento para seleccionar y
utilizar un método numérico para aplicar a un problema específico y efectuar la programación
del método, encontrará una severa restricción en el rango de problemas que puede manejar.
En general deberá buscar a alguien con la información necesaria, si es que existe ese alguien a
14
Introducción y planificación del curso. La simulación de procesos en la industria química actual

quien consultar. Más aún, en esta situación resultará poco probable que el usuario pueda
formular las preguntas correctas y el consultor suministrar las respuestas adecuadas, dado que
el nivel de conocimientos de ambos resultaría muy diferente, dificultando la comunicación
entre ambos.
En resumen, en los últimos tiempos se ha desarrollado una gran variedad de paquetes
informáticos para resolver numéricamente sistemas de ecuaciones que se plantean en
problemas en modelización en ingeniería. En teoría, estos paquetes relevan al ingeniero de
adquirir conocimientos acerca de los métodos de integración numérica. Supervisan
automáticamente los errores y la estabilidad del método ajustando el paso o intervalo de
integración para satisfacer un criterio de exactitud. En la práctica, es sabido que estos
lenguajes no resuelven todos los problemas. En su afán por generalizar, usualmente se
vuelven ineficientes en muchas aplicaciones específicas, por ejemplo, desde el punto de vista
del tiempo computacional. En estos casos resulta más conveniente desarrollar un programa
específico escrito, por ejemplo, en lenguaje FORTRAN, BASIC o PASCAL.
Con respecto a los productos informáticos que utilizan para la modelización un lenguaje de
alto nivel, debe remarcarse que el tiempo de formulación y de resolución del modelo se
reduce, en especial para aquellos ingenieros que no dominan métodos de programación y
utilizan el ordenador ocasionalmente. Cualquiera que sea la situación, es evidente que la
utilización de un paquete integrado que facilite escribir un modelo para simulación y permita
directamente la resolución numérica requiere el aprendizaje de un nuevo lenguaje y de un
nuevo utilitario.
En el caso que se conozca algún lenguaje de programación, dado que las técnicas numéricas
programadas de manera sencilla funcionan bien, deberá compararse el esfuerzo que implica
desarrollar un programa específico para el problema que se desea resolver, con el uso de
subprogramas. En efecto, la experiencia demuestra que es más conveniente el desarrollo
propio, ya que no sólo es computacionalmente más eficiente, sino que además garantiza al
estudiante o ingeniero el conocimiento de cómo funciona el programa (por ejemplo, un
simulador para un equipo dado) y cuáles son las hipótesis realizadas y las técnicas utilizadas.
Esta metodología permite la supervisión del programa y su modificación, para manejar de
manera más fácil y eficiente nuevas situaciones que se planteen.
Una solución intermedia es programar el modelo particular (sistema específico de ecuaciones
a resolver), utilizando para el cálculo alguno de los métodos disponibles para tal fin,
aprovechando la disponibilidad de los numerosos paquetes numéricos de resolución, tanto de
sistemas de ecuaciones algebraicas como de ecuaciones diferenciales, ordinarias o a derivadas
parciales. En muchos lugares (universidades, institutos de investigación, etc.) y en el mercado,
se dispone de bibliotecas de subrutinas de cálculo como las IMSL, NAG, Numerical Recipes,
entre otras.
En general, para cada rama, tanto de las matemáticas, de la estadística y/o de las aplicaciones
de ingeniería, se han presentado en el mercado un gran número de aplicaciones para resolver
muchos problemas de modelización de procesos, tales como diseño, simulación, síntesis,
optimización, etc. Además, desde el punto de vista del alcance, los hay diseñados para un uso
general así como para uno específico (por ejemplo, hornos, procesos petroquímicos, procesos
que manipulan sólidos, sistemas con electrolitos, reactores biológicos, síntesis de moléculas,
etc.).
No es el objetivo del presente curso efectuar un análisis detallado del software disponible
comercialmente ni de las aplicaciones específicas desarrolladas, ni realizar una descripción
15
Introducción y planificación del curso. La simulación de procesos en la industria química actual

exhaustiva de todos los paquetes informáticos existentes, dado que el mercado actual es muy
dinámico. Sí resulta importante que el alumno adquiera habilidad para comprender claramente
el alcance general de los instrumentos computacionales disponibles, las tendencias, la
necesidad de disponer de capacidad para generar sus propias herramientas para modelizar
problemas específicos o para adquirir o utilizar nuevos productos.

6. TENDENCIAS ACTUALES EN EL DISEÑO DE PROCESOS


Las tendencias actuales en el diseño de procesos pasan por:
• Reducción de los costes de las materias primas
• Reducción de la inversión de capital
• Reducción del consumo energético
• Incremento de la flexibilidad del proceso y reducción del almacenamiento de
productos
• Mayor énfasis en seguridad
• Mayor atención a la calidad
• Mejor comportamiento medioambiental
Para la consecución de todos estos objetivos la simulación de procesos juega un papel muy
importante, ya que:
• Reduce el tiempo de diseño de la planta, permitiendo al diseñador comprobar
varias configuraciones de planta
• Ayuda a optimizar el proceso, permitiendo responder a preguntas del tipo “y
si”, así como determinar las condiciones de proceso óptimas para unas
restricciones dadas.
• Predice los costes de planta y la viabilidad económica

7. BIBLIOGRAFÍA

• Seider, W.D., Seader, J.D., Lewin, D.R., “Process Design Principles”, John Wiley & Sons,
Nueva York (1999)
• Biegler, L.T., Grossmann, I.E., Westerberg, A.W., “Systematic Methods of Chemical
Process Design”, Prentice Hall, Nueva Jersey (1997).
• Turton, R., Bailie, R.C., Whiting, W.B., Shaeiwitz, J.A., “Analysis, Synthesis, and Design
of Chemical Processes”, Prentice Hall, Nueva Jersey (1998).
• Scenna, N.J.; Editor, “Modelado, Simulación y Optimización de Procesos Químicos”,
Universidad Tecnológica Nacional, F.R. Rosario (1999). Versión electrónica

16
I. Termodinámica y modelización rigurosa de
procesos

Termodinámica de
sistemas no ideales
Julio L. Bueno de las Heras

Departamento de Ingeniería Química


y Tecnología del Medio Ambiente
Universidad de Oviedo
Termodinámica de sistemas no ideales

ÍNDICE

CONTEXTO, OBJETIVOS Y CONTENIDO ...............................................................19


1. MODELOS PARA DESCRIBIR PROCESOS QUÍMICOS ..................................19
1.1. El modelo termodinámico .....................................................................................22
2. MODELO TERMODINÁMICO PARA EQUILIBRIO ENTRE FASES .............25
2.1. Equilibrio de sustancias puras ...............................................................................25
2.2. Equilibrio de mezclas multicomponentes..............................................................34
3. PRINCIPALES LIBROS RECOMENDADOS .......................................................45

CONTEXTO, OBJETIVOS Y CONTENIDO

Estamos en un curso sobre modelización avanzada de procesos químicos.


La modelización es una forma eficaz de aproximarse a una realidad compleja sustituyéndola por
interpretaciones fragmentarias o particularmente focalizadas de sus distintas facetas o elementos
integrantes. Lenguaje, filosofía y matemáticas, por citar obviedades, son ámbitos de modelización,
donde fonemas vehiculizan conceptos de acuerdo con convenios idiomáticos, morfológicos y
sintácticos; donde conceptos, definiciones y convenios aproximan ordenadamente a la percepción de la
realidad material e inmaterial al socaire de teorías o principios; y donde operadores, ecuaciones,
algoritmos, transformaciones y otros recursos configuran probablemente su interpretación cuantitativa
más eficaz, abstracta, y universal.
La Termodinámica es una ciencia teórica y experimental que aporta un eficaz bagaje de modelos,
capaces de describir las complejas relaciones de equilibrio que se producen entre las sustancias
químicas. Los modelos termodinámicos pretenden interpretar y predecir el comportamiento físico-
químico de la materia en equilibrio estático o dinámico.
De introducir y justificar de forma somera estos modelos de forma práctica se trata en este tema, y
de describirlos de forma resumida se ocupa el siguiente.

1. MODELOS PARA DESCRIBIR PROCESOS QUÍMICOS

Parece asumido que un proceso químico es un conjunto armónico, espontáneo o finalista, de


transformaciones de la energía, incluida la materia como forma sustanciada de aquélla. La
naturaleza es un bullente escenario de procesos químicos, buena parte de los cuales,
probablemente los más complejos, son las transformaciones que configuran las distintas
formas de la vida. Generalmente el concepto de proceso químico se aplica a transformaciones
artificiales, con las que se pretende producir unas sustancias a partir de otras, aislar unas
sustancias de otras, o modificar sus características.
Los procesos químicos naturales son el resultado de complejos fenómenos interactivos y evolutivos. Los
procesos químicos artificiales son el resultado de una selección inteligente entre las más afortunadas
sugerencias, resultantes ocasionalmente de casualidades y frecuentemente de pruebas sucesivas, ejecutadas con
variopintas tácticas y recompensadas con diferente fortuna. La experiencia -saber qué- y la habilidad técnica -
saber hacer- terminan por suscitar, antes o después, el pensamiento reflexivo - saber por qué-. La reflexión
19
Termodinámica de sistemas no ideales

tiene una proyección generalista, el conocimiento filosófico y científico de la realidad tangible - y una finalidad
práctica - el conocimiento estratégico que permite adelantarse a la experiencia o encauzarla para hacerla más
eficaz.
Las ingenierías son las disciplinas resultantes de la aplicación sistemática de la intuición - de ahí su componente
artística-, de principios heurísticos - de ahí su componente “ingeniosa”- y de conocimientos científicos a la
resolución de problemas preexistentes, a la satisfacción de necesidades y a la búsqueda de retos, resolviendo
eficazmente el compromiso entre tiempo, medios y objetivos (ingenio = maquina). Toda ingeniería se vincula a
máquinas, a artefactos o a protocolos pautados capaces de coordinar ordenadamente esfuerzos para hacer cosas
útiles. La Ingeniería de Procesos ofrece recursos versátiles para la gestión de situaciones complejas integradas
por fenómenos interrelacionados. La Química y la Ingeniería Química ofrecen recursos eficaces para dar
contenido científico riguroso de esos fenómenos. La convolución de un saber hacer genérico y de un saber qué
concreto crea el ámbito científico y profesional de la Ingeniería de los Procesos Químicos.

Fig.1. Modelos y conceptos termodinámicos en su contexto

20
Termodinámica de sistemas no ideales

La pieza clave del conocimiento científico analítico y sintético- el learning object por
excelencia- es su unidad lógica, el modelo.
Ante la imposibilidad radical o coyuntural del conocimiento absoluto- probablemente vedado
a la humana condición- no existe otra forma de construcción del edificio de la ciencia que la
aproximación analógica - el como-si, el modelo -. Los modelos son válidos en tanto explican
la realidad y permiten interpretar o predecir sus cambios. Si un modelo falla se sustituye, o
más frecuentemente, se apuntala con otros modelos que tratan de explicar sus desviaciones,
hasta que resulta más rentable intelectualmente introducir otro modelo radicalmente
innovador, que ha de resolver lo que el anterior resolvía y ser capaz de superar con elegancia
y éxito sus limitaciones Los modelos han de resolver, también, muchos compromisos,
principalmente los que existen entre precisión y tiempo, y los que existen entre complejidad y
disponibilidad de información.

Figura 2. Modelización lógica típica de ingeniería de procesos:

Un proceso complejo resulta de la interrelación de unidades más sencillas tipo caja negra, convencionalmente
identificadas, sometidas a condicionantes externos, interconectadas a través del flujo de información común y
provistas de ciertos grados de libertad.

Fig.3. Modelización fenomenológica típica en Ingeniería Química


21
Termodinámica de sistemas no ideales

El subsistema - la pieza funcionalmente diferencial- en un proceso químico es la operación


básica. El modelo de operaciones básicas en un modelo basado en ecuaciones de diseño de
etapas discernibles y repetitivas dentro de los procesos. Miles de procesos que manejan y
producen millones de sustancias químicas se configuran a partir de una decenas de
operaciones básicas. El modelo de operaciones básicas, que se describe en la Fig. 3. muestra
cómo se integran los modelos de equilibrio (Termodinámica) con los modelos cinéticos
(Fenómenos de transporte y Reactividad Química) y con los modelos estequiométricos,
que no son otra cosa que traducciones del principio de conservación.

1.1. El modelo termodinámico


La Termodinámica es una ciencia que nació de la necesidad de optimizar el rendimiento de
procesos de separación y de conversión termomecánica.. La Termodinámica clásica es una
termodinámica macroscópica de equilibrio. La Termodinámica actual abarca la energética de
reacciones y buena parte de los fenómenos de transporte y reactividad química en el contexto
de la llamada Termodinámica de los procesos irreversibles, proyectándose en el ámbito
corpuscular a través de los modelos de Termodinámica Estadística.

Fig. 4. El “modelo Termodinámico”


resulta de la integración de
definiciones, recursos, principios y
modelos de comportamiento a
distintos niveles de descripción.

a. Ámbito de la termodinámica
El procedimiento termodinámico se basa en la introducción coherente de propiedades de
interés práctico - P, V, T, H, F, G, S, F...- asume unos principios generales de evidencia
22
Termodinámica de sistemas no ideales

incuestionable - por el momento cuatro- y adopta unos formalismos matemáticos - relaciones


de Maxwell- derivados de las cualidades atribuidas a estas propiedades - ligadas por
ecuaciones diferenciales exactas en campos continuos-.
En torno a este ámbito formal, la Termodinámica discurre en dos dominios paralelos y permeables. En el
dominio experimental se nutre de constantes aportaciones de la experimentación sistemática y de la propia
práctica de los procesos, que son fuente inagotable de datos. El análisis de estos datos ha permitido inferir
algunos principios generales de la naturaleza concernientes a las relaciones energéticas - equilibrio térmico,
equivalencia teórica y práctica entre calor-trabajo y orígenes de entropía, así como la correlación de estos para
deducir modelos empíricos de comportamiento. En el dominio teórico la Termodinámica desarrolla modelos
ideales - gas ideal, principio de estados correspondientes, mezcla ideal...- que contrasta con la evidencia
experimental introduciendo sucesivas correcciones - modelos de estado de fluido reales, discrepancias del
P.E.C., fugacidades, modelos para mezclas reales, coeficientes de actividad, etc.- Los modelos de estado son
relaciones PVT macroscópicas que permiten obtener formas prácticas de las relaciones entre otras propiedades
termodinámicas de significación más compleja y que, auxiliados por modelos de estructura molecular
(corpusculares y estadísticos) permiten una explicación mecanística de las propias teorías de estado y una
interpretación rigurosa de las propiedades.

b. Propiedades y principios termodinámicos


Las propiedades termodinámicas son las piezas conceptuales con las que explicar las leyes y
describir los fenómenos. La única restricción en la definición de propiedades termodinámicas
está en su utilidad, en su coherencia interna y en la coherencia de su incorporación al contexto
de otras propiedades predefinidas y consolidadas. Las propiedades termodinámicas básicas se
introducen a partir de la experiencia, y parece consensuado que sean P y V. La temperatura T
se introduce a partir de la evidencia conocida como “principio cero” y las demás propiedades
energéticas -U, H, F y G y sus derivadas- se introducen a partir de los principios primero y
segundo. Los conceptos de entropía -S- y reversibilidad surgen de la evidencia titulada
“tercer principio”. Salvo en el caso de la temperatura, el volumen y la entropía, no es preciso
especificar ningún origen, atendiéndose sólo a las variaciones que experimentan en el
transcurso de los procesos.
Hay otras propiedades termodinámicas que permiten describir otros fenómenos -eléctricos o magnéticos- o
modelizar otras situaciones más complejas, como es el caso sistemas multifásicos y multicomponentes. Por
ejemplo, la composición como descriptor de mezclas, la tensión superficial, como descriptor de la energía
vinculada a la presencia de interfases, las funciones de trabajo para describir las vías de comunicación del
sistema termodinámico con el entorno o el potencial químico para describir la tendencia hacia equilibrio entre
fases o a través de reacciones químicas.
El calor y el trabajo son formas de relacionarse los sistemas con otros sistemas concretos o
con un entorno abstracto, modificando su estado. Como es sabido, el estado es reproducible
en todas sus propiedades cuando un número determinado de propiedades intrínsecas
independientes adopta los mismos valores (coordenadas de estado), pero se puede cambiar de
estados con muy diferentes intercambios de calor y de trabajo.
Las leyes de la termodinámica son evidencias experimentales de carácter general, independientes de cualquier
teoría de estado. La naturaleza establece también una correspondencia biunívoca entre los valores de un
determinado número de propiedades de estado del sistema y ese estado. Ese número depende de la complejidad
del sistema a través de un modelo de estado o regla lógica que establece dos grados de libertad para fases
simples de un solo componente, un grado de libertad más por cada componente y un grado menos por cada fase
más en equilibrio. Es la llamada regla de las fases, que bien podría ser considerada como una ley o principio
termodinámico más.

23
Termodinámica de sistemas no ideales

c. Termodinámica formal
La naturaleza ha establecido que las sustancias puras ven definido inequívocamente su estado
termodinámico, es decir, el valor de todas sus propiedades termodinámicas, cuando dos de
éstas adoptan valores concretos. Trasponiendo esta evidencia al ámbito matemático, resulta
que cualquier variable de estado se vincula a una superficie continua Z(X,Y), en principio
indefinida, pero en la práctica reducida e las coordenadas de existencia de la materia en los
distintos estados en los que esta se pueda encontrar.
Una vez establecida una correspondencia entre definiciones (propiedades) y funciones matemáticas
(coordenadas), los propios mecanismos matemáticos permiten establecer relaciones que podrían no ser evidentes
por un procedimiento inductivo directo. Los principales mecanismos matemáticos de relación son las llamadas
relaciones de Maxwell, que establecen relaciones bien conocidas, como:
dz= (∂z/∂x)y dx + (∂z/∂Y)x dY = mdx + n dY
∂m/∂Y = ∂n/∂X
y las de ellas derivadas, que permiten establecer relaciones concatenadas entre variables termodinámicas del
tenor :
(∂G/∂P)T=V -(∂S/∂P)T=(∂V/∂T)P
F= G- P(∂G/∂P)T F= H-S(∂U/∂S)V-V(∂U/∂V)S
que facilitan acometer la resolución de problemas termodinámicos con gran eficacia en un campo imagen que no
precisa sentido físico evidente, pero sí muy fiable en los cálculos:

Fig.5. Simulación gráfica de algunas cualidades de las diferenciales exactas útiles


en la formulación y análisis de rutas termodinámicas

24
Termodinámica de sistemas no ideales

De hecho el estado de una substancia viene integrado por tantas superficies continuas de
estado yuxtapuestas como fases en las que tenga existencia, limitadas por las coordenadas de
existencia de la substancia (por ejemplo, hasta temperaturas inferiores a las de autoreactividad
o descomposición química, que son puertas a otros escenarios de fases). El equilibrio entre
fases para sustancias puras será una región común a dos superficies de estado- asimilable una
línea- y el equilibrio entre tres fases será una región común a tres superficies de estado -
asimilable a un punto-.
En situaciones termodinámicas más complejas, por ejemplo sistemas multicomponentes, la
definición del estado va vinculada matemáticamente a la de un hiperespacio

2. MODELO TERMODINÁMICO PARA EQUILIBRIO ENTRE


FASES

2.1. Equilibrio de sustancias puras


a. Relaciones entre propiedades termodinámicas
Según el primer principio, un cambio discreto de energía interna se debe al balance:
U = Calor recibido + trabajo realizado sobre el sistema =
=- calor cedido- trabajo realizado por el sistema sobre el entorno
En ausencia de otras formas posibles de trabajo distintas al mecánico de expansión
compresión, restricción que se mantendrá en lo sucesivo en tanto no se diga lo contrario, para
un cambio diferencial y reversible, y de acuerdo con el tercer principio, dS= dq/T, resulta
dU = dq - pdV = TdS - pdV
Si el proceso no es reversible, ni el calor es TdS ni el trabajo se puede calcular mediante la integración de la
función continua pdV, aunque sí se puede deducir su balance neto a través de los cambios de energía interna. De
la misma forma, si se conocen estos datos, calor recibido y trabajo realizado, sí que se puede calcular el cambio
de energía interna experimentado por el sistema. El concepto de trabajo útil va vinculado a la capacidad de
producir cambios en el entorno y, por tanto, al grado de reversibilidad, por lo que es un concepto vinculado al
tipo de proceso. De hecho hay procesos de expansión que no producen trabajo útil alguno, como la expansión
libre irreversible de gases, lo cual no quiere decir que no haya cambios del tipo p∆V o V∆p invertidos en
turbulencia interna y, por tanto, en un aumento de entropía no predecible teóricamente, pero sí evaluable a partir
de las condiciones finales (por ejemplo en coordenadas P, T).
La entalpía se define incluyendo el término de entidad PV en la forma
H = U + PV
por lo que para un cambio diferencial resulta
dH= dq + VdP= TdS+VdP
Las propiedades que pueden definirse sin una vinculación a la materia se denominan propiedades de campo.
Las más intuitivas son P y T. Las propiedades vinculadas a la materia se denominan propiedades de densidad
(V, U, H y S). Si se definen para un sistema lo hacen en forma extensiva, pero si se refieren a una unidad de
referencia lo hacen de forma intensiva (por ejemplo la densidad, el volumen molar o la energía interna
específica). Obviamente, y para mayor generalidad, las propiedades se correlacionan en sus formas intensivas.

25
Termodinámica de sistemas no ideales

De la misma forma se introducen las funciones de trabajo útil - funciones de Gibbs y


Helmoltz- excluyendo de las formas energéticas anteriores la fracción vinculada al desorden
térmico, y por tanto, la parte de la capacidad energética incapaz de ser puesta en juego en la
producción de trabajo útil reversible. Así:
F = U - TS
dF= -pdV-SdT
G = H - TS
dG= Vdp-SdT
Como se verá más adelante, la función de Gibbs es igual para fases en equilibrio, es decir, que
no depende de la densidad, por lo que resulta la propiedad más adecuada para definir el
equilibrio, junto con la presión y la temperatura que son propiedades de campo. Su utilidad se
pone de manifiesto al tratar de mezclas en equilibrio, ya que a partir de ella se define el
concepto de potencial químico µ.
La ventaja de las formulaciones típicas de las propiedades termodinámicas es su significación en situaciones
simples, como cambios isotermos, isóbaros, isócoros, etc. Así los cambios de entalpía pueden calcularse a partir
del balance calorífico en condiciones isóbaras, y la variación de la función de Gibbs, G, representa el trabajo de
flujo en condiciones isotermas. Gracias a las características de estado, un proceso real entre dos estados conduce
a los mismos cambios en propiedades de estado que estos cambios producidos a través de procesos ficticios, lo
que es un excelente recurso para optar por sendas de cálculo alternativas cuando se disponga de los datos
oportunos.
Cualquier formulación termodinámica representa casos particulares de una forma no restringida de vinculación
de las propiedades tomadas como variables dependientes de otra pareja tomada como variables dependientes De
hecho, cualquier propiedad puede analizarse en función de cambios experimentados en otras dos cualesquiera, es
decir, que serían posibles formulaciones U(P,V), F(P,T), G(H,S), V(H,G), H(F,G) etc. Estas otras formas más
infrecuentes de las formulaciones no suelen introducirse directamente como las anteriores, sino que suelen
aparecer en el contexto de cálculos, y su único problema es la posible incomodidad del manejo de las
propiedades implicadas, cuestión menor que se resuelve gracias a las relaciones formales ya mencionadas.

b. Estado de componentes puros


En principio cualquier pareja de propiedades puede adoptarse como coordenadas para definir
el estado, pero la práctica ha decantado P y T como variables primarias, no tanto por su
simplicidad teórica (de hecho el concepto de entropía pudiera ser más simple o primigenio
con respecto al de temperatura) como por su carácter de propiedades de campo y su más fácil
mensurabilidad experimental.

b.1. Modelos ideales


El modelo de estado ideal es el modelo de gas perfecto. El gas ideal puede definirse a partir de
distintas interpretaciones (Leyes de Boyle, Joule, Gay Lussac y Amagat) que no son más que
aspectos parciales del modelo de Clapeyron, PV= nRT. Una evidencia de que estas leyes son
redundantes está en que pueden obtenerse unas a partir de otras. Por ejemplo, la misma
relación de Joule:
dU = dq - pdV = TdS - pdV (si PV= RT) dUT= 0
Llevando este modelo a las relaciones termodinámicas en las formas dependientes de PVT
que pueden inferirse de las relaciones de Maxwell se obtienen relaciones teóricas que

26
Termodinámica de sistemas no ideales

permiten estimar los cambios de las propiedades energéticas en condiciones de idealidad, por
ejemplo variaciones de energía interna o entalpía simplemente a partir de calores específicos
ideales:
∆U ∗ = ∫ c v dT ∆H ∗ = ∫ c p dT
∗ ∗
y

y análogamente para otras propiedades termodinámicas.


En fluidos reales estos cambios pueden tomarse como referencia sobre la que evaluar los
modelos reales a partir de discrepancias (Ver Figura 6).

b.2. Modelos para fluidos reales


En la Figura 7 se presentan las evidencias experimentales de la discrepancia entre un gas real
y un gas ideal. La naturaleza pone de manifiesto que estas discrepancias cuantitativas pueden
hacerse cualitativas, apareciendo fases condensadas imprevisibles por el modelo de fluido
ideal, de forma que, en distintas regiones, las sustancias pueden encontrase en distinto estado
de agregación y que el estado de agregación de distintas sustancias las mismas coordenadas
de estado puede no ser el mismo.
El concepto de estado de agregación concierne a las relaciones intermoleculares, por lo que en la termodinámica
clásica se ha definido tradicionalmente en función de la manifestación macroscópica estereotipada de estas
interacciones: Estado sólido, cohesionado de forma invariante debido a las fuertes interacciones, estado líquido
deformable pero cohesionado debido a interacciones fuertes pero difusas y estado gaseoso, deformable y
escasamente cohesionado. La naturaleza permite todas las formas de equilibrio binario (SL, SV y LV) en un
amplio intervalo de condiciones, y permite el equilibrio ternario en el llamado punto triple (SLV), por debajo de
cuya temperatura y presión no puede darse el estado líquido. Otro punto característico es el llamado punto
crítico, por encima de cuya temperatura no puede existir estado líquido.

Fig.6. Interpretación de un cambio real a partir de cambios virtuales

27
Termodinámica de sistemas no ideales

El estado de fluidos reales se puede modelizar por ecuaciones que introducen desviaciones
con respecto al modelo de Clapeyron (Fig.7). Las principales correlaciones corresponden a los
tipos de discrepancia aditiva (modelos de virial) y discrepancia factorial (modelos de
coeficiente de compresibilidad), existiendo modelos mixtos, como los de Van der Waals,
Beattie-Bridgeman, Benedict-Webb-Rubin, Redlich-Kwong, etc.

RT ⎛ B C D RT a
Onnes P= 1 + + + +...⎞⎠ Van der Waals P= − 2
V ⎝ V −b V
2
V V V3
RT RT a
Factor de compresibilidad P = Z Redlich-Kwong P = − 0,5
V V − b T V (V + b)

La correlación del coeficiente de compresibilidad es muy útil para cálculo de propiedades de fases de un solo
componente. Sin embargo, para cálculos rigurosos y para la deducción de equilibrio en sistemas
multicomponentes son más útiles las formas paramétricas con adecuadas reglas de mezcla para definir los
coeficientes particulares.

Fig.7. Evidencia experimental de las discrepancias entre fluidos reales y gas ideal al
correlacionar determinadas propiedades o grupos de propiedades.

En la Fig. 8 en se puede apreciar que estas diferencias meramente cuantitativas dan lugar, en otras regiones, a
discrepancias cualitativas de las sustancias son calificadas convencionalmente como sólidos, líquidos o gases en
función de cuál sea su estado de agregación en la región de estado que coincide con las condiciones ambientales
más frecuentes (recuadro), pero que, en principio, cualquier sustancia puede encontrase en cualquier estado si su
estructura es estable en sus coordenadas definitorias. Si bien diagramas caricaturescos como los de la figura
ponen de manifiesto que hay múltiples formas de discrepar de la idealidad, también ponen de manifiesto una
cierta analogía morfológica en torno a puntos o regiones características. Estos diagramas ponen de manifiesto
también que las propiedades de campo son iguales en fases en equilibrio, mientras que las propiedades de
densidad, vinculadas a la agregación, difieren entre fases en equilibrio.
La ecuación de Van der Waals permite inferir el modelo del factor de compresibilidad de una
forma generalizada que se sustancia en el llamado Principio de Estados correspondientes,
(PEC), que Young extendió con gran éxito a las regiones condensadas y que otros autores han
extendido, a su vez, a la correlación de propiedades de transporte.
Según este principio, muchas substancias presentan un estado similar cuando se encuentran en
situaciones homólogas con respecto al punto crítico. La mejor concordancia se observa
cuando estas coordenadas son las llamadas coordenadas reducidas, Pr=P/Pc, Tr=T/Tc.
El valor de la compresibilidad en el punto crítico adopta un valor teórico a partir del modelo de Van der Waals,
zc=3/8, que no coincide con los valores observados en la realidad, que oscilan en torno a zc=0,27 como valor

28
Termodinámica de sistemas no ideales

más frecuente para muchas substancias de interés. Según este principio, las discrepancias existentes entre
modelos ideales y reales (Fig.9) son o adoptan formas funcionales análogas en las mismas coordenadas
termodinámicas reducidas (primer nivel de discrepancia) pero, además, las discrepancias observadas en
sustancias que no tienen una compresibilidad crítica similar a la predicha por el modelo pueden correlacionarse a
su vez (segundo nivel de discrepancia) en función de parámetros característicos, como el factor de Riedel o de
Pitzer o, con un mayor sentido práctico, en función de la diferencia entre el valor real y el teórico del coeficiente
de compresibilidad, [zc - 0,27].

Fig. 8. Representación cualitativa de las regiones de estado de sustancias puras en las


coordenadas más frecuentes

Fig.9. Discrepancia de la idealidad. Inferencia de la correlación del coeficiente de


compresibilidad y de las discrepancias de otras funciones termodinámicas

De esta forma, las discrepancias indicadas en la figura 6 están integradas por dos
componentes:

29
Termodinámica de sistemas no ideales

Fig.10. Morfología de los diagramas termodinámicos de uso más frecuente

Primera componente de discrepancia :


f1(P *-P)= f2(Tr,Pr).
Las funciones f1 y f2 han de esbozarse teóricamente a partir de las diferencias resultantes de
calcular las respectivas funciones a través de las distintas ecuaciones de estado, P * a partir de
P*V*= RT y P a partir de PV= zRT. ej:

H∗ − H Pr ⎛ ∂ z ⎞
V*-V= RT(1-z) /P =α = RT r ∫ ⎜
2 ⎟ dPr
Tc 0 ⎝ ∂ Tr ⎠ P Pr
r

y análogamente (U*-U)/Tc=f(Pr,Tr), (S*-S)=f(Tr,Pr), (Véase Fig.10), así como las funciones termodinámicas
derivadas, (cp* - cp), (kp* - kp), Estas ecuaciones permiten deducir los diagramas de discrepancia de cualquier
propiedad a partir del diagrama matriz z(Tr,Pr) o tener una guía para una más eficaz correlación de datos
experimentales.
Segunda componente:
f1(P *- P) (zc#0,27) =f1(P *- P)PEC + f2(Tr,Pr)
Un caso particular es la función de Gibbs, que da lugar a una correlación más útil, en forma
de discrepancia factorial, a través de la introducción del concepto de fugacidad, una presión
aparente vinculada a la presión real, que permite formular la variación isotérmica de G con el
mismo tipo de expresión que la deducida para el gas ideal (ver figura 11):
(G*2-G*1)T = RT ln (P*2/P*1) P*1= P1= P0= 1 (G*= G0 +RTlnP)T
(baja presión, ideal = real) (G= G0+ RTlnf)T
(G2-G 1)T = RT ln (P2/P1) f<P

30
Termodinámica de sistemas no ideales

P f
G − G = ∫1 α dP = − RT ln

P
por lo que la correlación de la discrepancia se hace en forma factorial, introduciendo el
concepto de coeficiente de fugacidad ø= f/P
Nótese que el modelo matemático puede tener limitaciones que hay que sortear. De hecho, si el concepto de baja
presión o presión en la que el modelo real y el ideal conducen a valores similares de la función en estudio se
asimilase a 0 y no a 1, la formulación matemática conduciría a una expresión embarazosa de manejar y sin
sentido físico práctico.

Fig.11. Introducción del concepto de fugacidad y su correspondiente correlación


generalizada de acuerdo con el PEC.

c. Equilibrio de fases en componentes puros


Las condiciones de equilibrio entre fases de componentes puros pueden determinarse
experimentalmente o predecirse a partir de estimaciones teóricas. Cualquier pareja de
propiedades invariantes, dX=0, dY=0, puede ser elegida para definir el equilibrio. Sin
embargo las propiedades de campo no dan lugar a ambigüedades matemáticas, ya que sus
valores son independientes del estado de agregación entre fases en equilibrio (P,T), mientras
que las propiedades energéticas, como se ha visto, experimentan una discontinuidad
vinculada al balance energético del propio cambio de estado. Por ello se prefiere utilizar la
función de Gibbs, que no da lugar a indeterminación cuando dP=0 y dT=0 (dGPT=0, es decir,
que G pasa por un mínimo).
En la práctica suelen correlacionarse los datos obtenidos para sustancias de interés de acuerdo con formulaciones
sugeridas por la teoría, ya que facilitan detectar las formas de correlación más efectiva.
Aquí no nos referiremos a ellos, pero unos métodos eficaces para la estimación de propiedades termodinámicas
macroscópicas es a partir de los parámetros característicos de los modelos moleculares, y viceversa. De esta
forma pueden estimarse directamente muchas propiedades, como las propiedades críticas desconocidas
experimentalmente o los parámetros de Riedel y Pitzer, y acceder por esta vía a todas las posibilidades de las
correlaciones basadas en el PEC. Una forma derivada de ésta es la estimación de propiedades de densidad a
partir de contribuciones de grupo, de forma que muchas propiedades macroscópicas de moléculas complejas,
particularmente orgánicas, pueden inferirse por sencillas reglas de combinación en función de la aportación que
cada grupo funcional hace al conjunto en función de su entidad absoluta y de su influencia relativa.

31
Termodinámica de sistemas no ideales

Fig.12. Regiones de estado típicas de los diagramas de fases

Fig.13. Teoría y experimentación se complementan recíprocamente para abrir vías


opcionales de estimación y correlación de propiedades

Veamos algunos ejemplos:


Las condiciones de equilibrio entre fases (LV vaporización-condensación, S-L, fusión
solidificación, y S-V, sublimación condensación) pueden hacerse directamente tabulando
datos de presión de vapor en función de la temperatura, o de calores latentes de cambio de
estado en función d e las condiciones de equilibrio o deducirse a partir de los modelos
disponibles. En la práctica suelen correlacionarse los datos obtenidos para sustancias de
interés de acuerdo con formulaciones sugeridas por la teoría, ya que facilitan acertar con las
formas de correlación más eficaz o con sentido físico más evidente.
32
Termodinámica de sistemas no ideales

Así, en condiciones de equilibrio líquido vapor la teoría permite deducir la relación de


Clapeyron para la presión de vapor:
∆Hv
ln Pv = − +k
RT
en función de la entalpía de vaporización y la temperatura absoluta, a la que se remedan otras
A
ecuaciones del tipo ln Pv = − y similares, como las ecuaciones de Antoine o Kirchov,
bT + c
encuentran una significación física razonable para sus parámetros de ajuste A, b y c,
singulares para cada substancia. Otra forma sería el diagrama de Cox (Ver fig.12.a)
De la misma forma, los calores específicos del gas ideal suelen correlacionarse por
expresiones de ajuste del tipo:
c*p= a+ bT + cT2
En la bibliografía hay numerosas correlaciones de datos. En la Figura 14 se presentan algunas de ellas. Si se
permite una recomendación, lo más conveniente es no perder una referencia global con el manejo de gráficos tan
dispares y, a la vez, tan similares morfológicamente; trátese de ubicar estas propiedades en el contexto de los
diagramas de estado de más amplio escenario, Tipos I,II y III ( los dos primeros referidos ya en la Figura 8)

Fig.14. Morfología de algunas correlaciones de datos frecuentes en la bibliografía.


a. Diagrama de Cox, b. Diagrama de Brown para densidades de olefinas; c y d. Otros diagramas para
propiedades energéticas de hidrocarburos.

d. Aplicaciones prácticas
La Termodinámica de fases de un solo componente es la base para la caracterización de
mezclas multicomponentes, pero por sí misma tiene interés práctico en las llamadas
operaciones termomecánicas. Las operaciones termomecánicas son transformaciones en las
que se pretende modificar las características de estado de un fluido (básicamente
compresiones, expansiones e intercambios de calor) , en las que se pretende convertir el
calor en trabajo (máquinas y motores térmicos) o en las que se pretende acceder de forma
autosuficiente a determinadas regiones de estado (licuaciones o solidificaciones totales o
parciales).
Frecuentemente el fluido que experimenta estas transformaciones experimenta un ciclo, es
decir, que pasa sucesivamente por las condiciones iniciales dando lugar a transformaciones
con un balance neto nulo de calor y trabajo. La utilidad de los ciclos está precisamente en
conseguir calor o trabajo en unas condiciones más inaccesibles a partir de consumirlo en otras

33
Termodinámica de sistemas no ideales

más accesibles, siempre con las limitaciones impuestas por las reglas del juego, los llamados
principios de la termodinámica.
La razón de los procesos cíclicos es doble:
Por una parte, hay ciclos cerrados. Hay fluidos que se emplean como vehiculizantes de materia y energía, y
debido a su costo o a las dificultades de su manejo, permanecen encerrados en un circuito sin salidas ni entradas
netas, más que las accidentales debidas a pérdidas y fugas y a la necesidad de reponer el material. Por ello es
preciso llevarlos a las condiciones iniciales para reutilizarlos, procurando aprovechar inteligentemente -dentro
del propio proceso o enlazando con otros- los balances energéticos de estas operaciones subsidiarias de
recuperación. Tal es el caso de las centrales térmicas que utilizan agua ultrapura en circuito cerrado (Ciclo de
Rankine) o de las máquinas frigoríficas (ciclo inverso).
Por otra parte hay ciclos abiertos, en los que se mantienen las condiciones de cada etapa y se reiteran las
transformaciones termomecánicas, pero el fluido que circula va cambiando total o parcialmente. Ello se debe a
que parte de las transformaciones son irreversibles (caso del motor de explosión interna de acuerdo con los
ciclos de Carnot, Otto, etc.), a que parte del material se destina a un uso específico y se retira fraccionalmente
(caso de los ciclos de licuación de Linde y Claude, por ejemplo) o a que se producen pérdidas que no compensa
paliar (máquinas de vapor).

2.2. Equilibrio de mezclas multicomponentes


a. Propiedades termodinámicas para mezclas
La extensión de los conceptos termodinámicos a mezclas multicomponentes pasa por dos
etapas. En primer lugar caracterizar la mezcla monofásica y sus propiedades. En segundo
lugar caracterizar las condiciones de equilibrio entre fases multicomponentes.
Ello requiere introducir nuevas propiedades termodinámicas - las necesarias para caracterizar
las proporciones entre los distintos integrantes de la mezcla, la composición -y redefinir
adecuadamente todas las propiedades termodinámicas a tenor de la disponibilidad de este
nuevo grado de libertad, estableciendo criterios precisos para identificar la contribución de
cada sustancia a las propiedades de la mezcla.
Luego habrá de resolverse el problema de cómo extender las ecuaciones de estado a mezclas,
mediante adecuadas reglas de ponderación de la participación de cada componente en los
parámetros del modelo. Finalmente requiere establecer las condiciones de equilibrio entre
fases y traducirlas a variables fácilmente medibles o controlables.
Para sistemas de dos o más componentes, todas las propiedades extensivas dependen de la
cantidad de cada componente presente, y todas las propiedades intensivas dependen de las
proporciones en las que estos componentes estén presentes. De acuerdo con lo visto, todas
podrán expresarse en función de otras dos propiedades independientes y, además, también
serán función de la masa o del número de moles de cada uno de los componentes:
U = f(S, V, n1, n2, ... ni)
U = f(P,T, n1, n2, ... ni)
...
H = f(P,S, n1, n2, ... ni)
H = f(P,T, n1, n2, ... ni)
...
G = f(P,T, n1, n2, ... ni)

34
Termodinámica de sistemas no ideales

A = f(T,V, n1, n2, ... ni)


...
De forma que sus variaciones se escribirán:
⎛ ∂Z ⎞ ⎛ ∂Z ⎞ ⎛ ∂Z ⎞
dZ = ⎜ ⎟ dX + ⎜ ⎟ dY + ⎜ ⎟ dn +...
⎝ ∂ X ⎠ Y ,nA,nB,... ⎝ ∂ Y ⎠ X , nA,nB... ⎝ ∂ nA ⎠ X ,Y ,nB A

así, por ejemplo:


dU = -SdT +VdP + Σ ⎜⎛ ∂ U ⎞⎟ dni
⎝ ∂ ni ⎠ S ,V

⎛ ∂ G⎞
dG = T dS - P dV + Σ ⎜ ⎟ dni
⎝ ∂ni ⎠ P, T, nj

y análogamente para cualquier propiedad expresada de cualquier forma.


⎛ ∂Z ⎞
Cualquiera de los términos del tipo ⎜ ⎟ sirve para definir la contribución de cada
⎝ ∂n A ⎠ X ,Y ,nB
componente a las propiedades de la mezcla, y recibe el nombre de potencial químico µ. Se
puede demostrar que todas las expresiones de este tipo conducen al mismo valor, por lo que
cualquiera de ellas podría representar al potencial químico:
Si se define el potencial químico como:
⎛ ∂U ⎞
µ i = ⎜⎜ ⎟⎟
∂n
⎝ i ⎠ S,V ,n j

la ecuación anterior adopta la forma:


dU = T dS - P dV + Σµi dni
⎛ ∂G ⎞
y si se define como µ i = ⎜⎜ ⎟⎟
⎝ ∂n i ⎠ T ,P ,n j

dG = -S dT + V dP + Σµi dni
⎛ ∂G ⎞ ⎛ ∂G ⎞
siendo, como es sabido − S = ⎜ ⎟ ; V=⎜ ⎟
⎝ ∂T ⎠ P ,n i ⎝ ∂P ⎠ T , n i
Se ha preferido esta última forma de expresión como la más afortunada, ya que presupone la constancia de las
dos variables termodinámicas más vinculadas al concepto de potencial, la temperatura como indicador del
potencial impulsor térmico y la presión como indicador del potencial impulsor mecánico. Además, se verá a
continuación que esta forma de definición permite considera al potencial químico en su sentido físico de
propiedad parcial. (En lo sucesivo no se volverá a reiterar la justificación de por qué se prefieren P y T como
coordenadas para definir el estado de un sistema).
Si se utilizan como formas prácticas de expresar la composición la fracción másica o,
preferentemente, la fracción molar:
n
xi = i
Σni
35
Termodinámica de sistemas no ideales

las expresiones anteriores adoptan formas específicas más prácticas (referidas a la unidad de
masa, a un mol), por ejemplo: dG = -S dT + V dP + Σµi dxi siendo G, S y V propiedades
molares.
Nótese que el potencial químico ya se define como una propiedad molar y que, de disponerse de simbología
adecuada, las propiedades molares se suelen representar con una tilde como la letra ñ y que las propiedades
específicas lo hacen bajo un ángulo, como el acento circunflejo francés.

b. Modelos de mezcla
b.1. Mezcla ideal
Sean o no ideales las susbtancias que componen una mezcla, el concepto de idealidad de
mezcla está vinculado a la función que define las propiedades de la mezcla a partir de las de
sus componentes. Arbitrariamente podría considerase mezcla ideal aquella en la que esta
dependencia es lineal, definiéndose a P y T preestablecidas:
ZP, T = (Z A + ZB + ...) P, T = Σ P ,T Zi
y en coordenadas molares o específicas Z = Σ i Zi .Esta definición, modelo lineal, puede
aceptarse teóricamente para propiedades energéticas como H ó U y para el volumen.
La ley de Amagat de aditividad lineal de volúmenes molares para gases, como traducción de la ley de Dalton de
aditividad de moles (principio de conservación de la materia) son ejemplos de mezcla ideal lineal. De partida
cabe esperar que los líquidos no sigan exactamente este comportamiento. Esta sencilla regla de mezcla permite
también aplicar a una mezcla modelos definidos para sustancias puras. En el modelo del factor de
compresibilidad las reglas de mezcla ideal pueden aplicarse a la definición de las coordenadas del nodo crítico
ideal:
m
Tc = ΣxiTc
m
i ;P
c
m m
= Σxi Pc i ;V
m
c
m
= ΣxiV c i ;
o a la definición de los parámetros del modelo característicos de la mezcla, por ejemplo, los coeficientes de Van
del Waals o de virial.
Sin embargo se verá que esta sencilla regla resulta inadecuada para otras propiedades como la
entropía o las funciones de trabajo G y A(F), que, incluso en el caso de gases, experimentan
variaciones por el mero hecho de producirse la mezcla, por lo que el concepto de mezcla ideal
se vinculará, para esas propiedades, a la predicción teórica a partir de las ecuaciones de
definición.
En efecto, la aditividad de volúmenes molares lleva a la aditividad de presiones parciales. Por el mero hecho de
integrarse en una mezcla a P y T constantes, cada componente pasa de encontrarse a la presión P a encontrarse a
la presión parcial Pi, con el consiguiente cambio vinculado de entropía y energía libre, que puede escribirse bien
en función de presiones (comportamiento individual supuesto ideal) o más adecuadamente, en función de
fugacidades, tomado como referencia común la fugacidad de cada componente puro en una mezcla a baja
presión:
fi P
∆Gi, mPT = RT ln ≅ RT ln i = RT ln xi
f P
Esta discrepancia teórica, aditiva de la linealidad, permite introducir el concepto de función
de mezcla,
V m PT = [Σx iVi ]PT
H m PT = [Σxi Hi ]PT

36
Termodinámica de sistemas no ideales

S m PT = [Σx i Si ]PT + ∆SPT


m

G mPT = [Σxi Gi ]PT + ∆G PT


m

i i
m m
de forma que ∆GRT = Σ ni RT ln xi , y para un mol: ∆GRT = Σ x i RT ln xi
Obviamente, las teorías atómico moleculares permiten aventurar explicaciones sobre la idealidad o no idealidad
de las mezclas. Las disoluciones líquidas ideales se presentan cuando los diámetros moleculares son iguales, no
existen interacciones químicas y las fuerzas intermoleculares entre moléculas de la misma especie o de otras son
similares. Estos mismos requerimientos se aplican a la fase gaseosa, donde a bajas presiones las moléculas no
están próximas entre sí y el comportamiento se aproxima al de una disolución o mezcla gaseosa ideal (moléculas
de volumen nulo con respecto al volumen del sistema sin fuerzas intermoleculares). Como ejemplo ilustrativo
puede servir el incremento o decremento de volumen que darían lugar canicas de distintos tamaños al ser
empaquetadas juntas.

b.2. Mezcla real


La propiedad que una mezcla real exhibe para una determinada composición puede diferir por
exceso o por defecto de la propiedad predicha en condiciones de mezcla ideal. Esa
discrepancia puede cuantificarse al menos por tres vías compatibles, definiendo las
correspondientes propiedades

Discrepancia aditiva Discrepancias factoriales:

Propiedades en exceso Pseudopropiedades Pseudocompociciones

Es la forma más frecuente de Valor de la composición que daría lugar en una Valor de la propiedad molar del componente
mezcla ideal a similar valor de la propiedad puro que daría lugar en una mezcla ideal de la
aproximarse experimentalmente partiendo de las mismas propiedades de los misma composición a similar valor de la
al comportamiento de la mezcla componentes puros. propiedad.
real
En determinadas condiciones sirve para En determinadas condiciones sirve para
introducir el concepto de propiedad parcial . introducir el concepto de actividad

Fig.15. Definición de propiedades para una mezcla monofásica binaria

37
Termodinámica de sistemas no ideales

Así en el caso de la función de Gibbs, puesto que se define habitualmente en forma de P y T,


se introduce directamente el concepto de propiedad molar parcial, que se suele representar
con una raya recta

y análogamente para otras propiedades

El concepto de propiedad parcial representa la repercusión que sobre la propiedad de la


mezcla, a presión y temperatura constante, tiene la variación diferencial en la composición de
cada componente en torno a un valor dado. Las propiedades parciales son pues función de las
propiedades molares a cada presión y temperatura, de la composición y de la naturaleza de los
demás componentes de la mezcla.
Otra propiedad interesante es la actividad. Así como la fugacidad no se introdujo en la
ecuación de estado, la introducción de una pseudocomposición no se ha hecho en la forma
insinuada, sino también a través de la variación isotérmica de la energía libre, de forma que se
pueda aplicar a la mezcla real la misma formulación que a la mezcla real. Así se introduce la
actividad y su relación con la forma elegida para medir la composición. el coeficiente de
actividad:
f
∆Gi, mPT = RT ln i = RT ln ai = RT ln γ i xi
f
i
∆GPT
m
= Σ x i RT ln γ i x i
forma que la discrepancia con el comportamiento ideal, la función en exceso, se puede
escribir, para la función de trabajo, como:
∆GPT
E
i [
= Gi, propiedad parcial
− Gi , propiedad molar ]
PT , xi
= RT ln ai − RT ln xi = RT ln γ i
i
∆GPT = Σ x i RT ln γ i
E

38
Termodinámica de sistemas no ideales

Esta expresión permite derivar los datos experimentales, generalmente obtenidos en forma de funciones en
exceso (o defecto) de variables más fácilmente medibles, como V (por picnometría), H o U (por calorimetría),
al cálculo de coeficientes de actividad, que es una forma más versátil de modelizar la no idealidad a efectos de
correlaciones de equilibrio.
En efecto, el volumen parcial molar del componente y puede calcularse a partir de su definición o a partir de la
relación de Maxwell en función de la energía libre molar parcial, que es el potencial químico.

⎛ ∂V ⎞ ⎛ ∂µ ⎞
v i = ⎜⎜ ⎟⎟ vi = ⎜ i ⎟
⎝ ∂n i ⎠ T , P , n j ⎝ ∂P ⎠ T
pudiendo formularse su variación en exceso respecto a la mezcla ideal en función del coeficiente de actividad a
partir de la propia definición de potencial químico:

⎛ ∂ ln γ i ⎞ ⎛⎜ ∆V iE ⎞
=
⎝ ∂P ⎠ T, x ⎝ RT ⎠ T , x
y análogamente sucedería para medidas calorimétricas:

⎛ ∂ ln γ i ⎞ ⎛ ∆HiE ⎞
=⎜
⎝ ∂T ⎠ P ,x ⎝ RT 2 ⎠ P, x

Las mezclas reales pueden clasificarse en función del tipo de propiedades termodinámicas que
discrepan del comportamiento ideal, ya que no suelen ser todas o, al menos, no suelen serlo
con la misma intensidad. Cuando sólo existen discrepancias en G y S las mezclas se
denominan semiideales. Cuando también se presentan discrepancias en exceso en H y U se
tienen las llamadas soluciones regulares, etc.

c. Equilibrio entre fases


c.1. Cálculo y correlación de coeficientes de actividad
Datos experimentales, obtenidos generalmente a partir de propiedades en exceso , V
(picnometría) y U y H (calorimetría) permiten obtener coeficientes de actividad en distintas
condiciones de presión , temperatura y composición, a través de las ecuaciones de
equivalencia. Tras ser depurados por tests de consistencia, estos coeficientes permiten
calcular las constantes de Van Laar de sustancias, por ejemplo en mezclas binarias a partir de
datos de equilibrio LV.
La formulación de la función de Gibbs para cada fase en condiciones isotérmicas permite obtener las llamadas
ecuaciones de Gibbs-Duhem, cuya solución puede acometerse por medio de diversos procedimiento, Margules,
Redlich Kister y Van Laar, entre otros.
La ecuación de Gibbs Duhem en su forma general para cada fase:

⎛i ⎞
i i

⎝ Σ xi dµi ⎠ TP = Σ x id(Gi + RT ln ai ) TP = Σ x i (d ln γ i )TP = 0


adopta la forma
⎛ ∂ ln γ 1 ⎞ ⎛ ∂ ln γ 2 ⎞
x1 − (1− x1 ) =0
⎝ ∂x ⎠ PT ⎝ ∂x ⎠ PT
cuya solución, según el modelo de Van Laar es:

39
Termodinámica de sistemas no ideales

A B
ln γ 1 = 2 ; ln γ 2 = 2
⎛ ⎛
⎜ 1 + Ax1 ⎞⎟ ⎜ 1 + Bx2 ⎞⎟
⎝ Bx2 ⎠ ⎝ Ax1 ⎠
adoptando las constantes los valores :
2 2
⎡ x ln γ 2 ⎤ ⎡ x ln γ 1 ⎤
A = ln γ 1 1 + 2 ; B = ln γ 2 1 + 1
⎢⎣ x1 ln γ 1 ⎥⎦ ⎢⎣ x2 ln γ 2 ⎥⎦

Estas constantes permiten estimar coeficientes de actividad en otras condiciones, con el objeto
de estimar y correlacionar condiciones de equilibrio en más amplias regiones.

Por otra parte si para cada fase puede escribirse una ecuación de este tipo, con tantas
incógnitas como componentes n, el número de grados de libertad será L=n+2-F, la llamada
regla de las fases, que no es otra cosa que un principio de consistencia lógica.
Estas relaciones establecen que a P y T constante, los potenciales químicos de todos los
componentes habrán de ser iguales en todas las fases, por lo que se tendrá la base de las
relaciones de equilibrio. Desafortunadamente el potencial químico no es muy manejable, ni
matemática ni experimentalmente, por lo que el equilibrio se define a partir de su relación de
definición con la presión y la temperatura, resultando que, a igualdad de potencial químico
resulta igualdad de actividad, por lo que puede emplearse esta variable para correlacionar el
equilibrio.

40
Termodinámica de sistemas no ideales

c.2. Determinación experimental del equilibrio


En la Fig. 16 se ilustra un procedimiento para la obtención experimental de datos de
equilibrio.

Fig.16. Procedimiento
experimental para obtener datos
de equilibrio isóbaro de mezclas
binarias en la región LV.

c.3. Formulación analítica del equilibrio


c.3.1. Formulación general
Las ecuaciones de estado pueden utilizarse para describir equilibrio en sistemas
multicomponentes utilizando adecuadas reglas de combinación para definir sus parámetros
característicos. Todas las ecuaciones de estado se pueden aplicar a mezclas utilizando reglas
de mezcla para combinar constantes de las especies puras.
La ecuación del gas ideal se utiliza ampliamente, tanto para gases puros como para mezclas gaseosas. Las reglas
de mezcla son lineales y corresponden a los modelos de Dalton y Amagat. La ley de los gases ideales es
generalmente bastante precisa para presiones hasta una atmósfera. Por encima de tres o cuatro atmósferas da
lugar a desviaciones con respecto a los datos experimentales del 10% y superiores.
Cuando un gas o vapor no se comporta como un gas ideal resulta difícil formular una ecuación de estado exacta
debido a la necesidad de tener en cuenta las interacciones moleculares. El principio de los estados
correspondientes permite utilizar las correlaciones de substancias puras para mezclas si se definen
adecuadamente las coordenadas del nodo crítico, que en condiciones de idealidad obedecen a relaciones de
mezcla lineal. No obstante hay fuertes discrepancias que no pueden ser asumidas por este planteamiento simple,
por lo que han de utilizarse reglas de mezcla más complejas.

41
Termodinámica de sistemas no ideales

La ecuación de estado del virial proporciona una buena base teórica para el cálculo de las relaciones P-v-T de
especies puras, tanto polares como no polares, y de mezclas en fase vapor para densidades inferiores a la del
punto crítico. Los coeficientes del virial pueden obtenerse a partir de parámetros moleculares.
El resto de las ecuaciones paramétricas derivadas de la de Van der Waals tienen en común que son de tercer
orden en volumen y que resultan aplicables en un amplio intervalo de valores de presión. La ecuación Redlich-
Kwong da muy buenos resultado para predecir hiperespacios de equilibrio. Cuando se emplea en función del
factor de compresibilidad pueden utilizarse las siguientes reglas de mezcla:

1 A2 h ⎛ A2 ⎞ A2
Z= − y
3 2

Z − Z + BP⎜ ⎟
− BP − 1⎟ Z − (BP )2 = 0
1 − h B (1 + h ) ⎝ B ⎠ B
C C C C
siendo A = ∑ A i y i A = ∑ A i x i y B = ∑ Bi y i B = ∑ Bi x i
i =1 i =1 i =1 i =1

Mientras que las reglas de mezcla para los parámetros característicos son:
C ⎛ C ⎞
( )1 / 2
C
a = ∑ ⎜⎜ ∑ y i y j a ij ⎟⎟ a ij = a i a j b = ∑ yi bi
i =1 ⎝ j=1 ⎠ i =1

c.3.2. Formulación particular: Equilibrio L-V


Se ha visto que equilibrio se alcanza a P y T constante cuando los potenciales químicos de
todos los componentes son iguales en cada fase. En el caso particular de un sistema de n
componentes con una fase líquida y una fase vapor en equilibrio se cumple que:
TV = TL
PV = PL
µ1V = µ1L
µ2V = µ2L
...

µnV = µnL
Prausnitz demostró que en el equilibrio:
f1V = f1L
f2V = f2L
...
fnV = fnL
Para un gas ideal puro la fugacidad es igual a la presión y, para un componente de una mezcla
gaseosa ideal, es igual a su presión parcial, pi = yiP. Si la fugacidad reemplaza al potencial
químico como criterio de equilibrio, las condiciones de equilibrio se pueden expresar en
términos de valores experimentales de presión, volumen, temperatura y concentración.
Para equilibrio LV f iV = y i f iVo , f iL = x i f iLo
Para una mezcla binaria, la temperatura y la presión determinan las composiciones de las
fases en equilibrio. Para mezclas que tienen más de dos componentes, se dispone de otro
grado de libertad para cada componente. Por este motivo, resulta conveniente definir una
relación de equilibrio, o volatilidad absoluta, como el cociente entre las fracciones molares

42
Termodinámica de sistemas no ideales

yi
de una especie en dos fases que se encuentran en equilibrio K i = y la volatilidad
xi
Ki
relativa, como: α ij =
Kj
Para formar una relación de equilibrio entre actividades o fugacidades puede recurrirse a las
posibles definiciones para una u otra fase en función del grado de idealidad de la mezcla y de
los propios componentes con respecto al comportamiento del gas ideal, pudiendo utilizarse
formulaciones simétricas o asimétricas:
fiV = γiV yi y f iVo fiL = γiL xi f iLo o bien fiV = φiV yi P y fiL = φiL xi P
K adopta las formas
⎛γ ⎞⎛ f iLo ⎞ φ
K i = ⎜⎜ iL ⎟⎟⎜ o ⎟ y K i = iL
⎜ ⎟
⎝ γ iV ⎠⎝ f iV ⎠ φ iV
para formulaciones simétricas y
φ iL P φ iL γ iL f iLo γ νo
Ki = = y Ki = = iL iL
γ iV f iV
o
γ iV ν iV
o
φ iV P φ iV
para formulaciones asimétricas.

c.4. Representación gráfica de diagramas de equilibrio


Los diagramas de estado para fases multicomponentes resultan hiperespacios de complejo
trazado, salvo en el caso particular de sistemas binarios. En la Figura 17 se muestra un amplio
hiperespacio para una mezcla binaria ideal en la región SLG utilizando composición y
propiedades de campo como coordenadas.

Fig. 17. Hiperespacio de equilibrio SLV para sistemas ideales en


coordenadas de campo y composición.

43
Termodinámica de sistemas no ideales

En la Fig. 18 se muestra un hiperespacio más restringido, región LV, utilizando propiedades


de densidad en las coordenadas. En la Figura 19 se representan las proyecciones más
habituales del hiperespacio de la figura 17 en las coordenadas habitualmente utilizadas para
describir el equilibrio LV.

Fig.18. Hiperespacio de equilibrio LV en coordenadas de


campo, de densidad y composición

Fig. 19. Regiones de equilibrio LV en coordenadas PT , Pxy(T) y Txy(P) como fragmento


del hiperespacio descrito en la Fig. 15
44
Termodinámica de sistemas no ideales

3. PRINCIPALES LIBROS RECOMENDADOS

• HOUGEN, WATSON, RAGATZ, Principios de los procesos químicos: (II)


Termodinámica, Ed.Reverté (1964)
• SMITH, VAN NESS, Introducción a la Termodinámica en Ingeniería Química, Ed.
McGraw Hill (1986)
• REID, SHERWOOD, PRAUSNITZ, Properties of Gases and Liquids, Ed. McGraw
Hill (1977)

45
I. Termodinámica y modelización rigurosa de
procesos

Modelos de predicción de
propiedades físico-químicas
M. Carmen Pazos Medina

Departamento de Ingeniería Química


y Tecnología del Medio Ambiente
Universidad de Oviedo
Modelos de predicción de propiedades físico-químicas

ÍNDICE

1. INTRODUCCIÓN ............................................................................................................49
2. MODELOS DE ECUACIONES DE ESTADO..............................................................51
2.1. Propiedades termodinámicas para las fases líquida y vapor a partir de modelos de
ecuaciones de estado ................................................................................................56
2.1.1. Ecuación de estado R-K .................................................................................57
2.1.2. Ecuación de estado S-R-K..............................................................................60
3. MODELOS DE COEFICIENTES DE ACTIVIDAD....................................................61
3.1. Disoluciones regulares. Correlación de Chao-Seader (C-S)....................................62
3.2. Mezclas no ideales que contienen compuestos polares ...........................................66
3.3. Ecuación de Wilson .................................................................................................68
3.4. Ecuación NRTL (Non-Random Two-Liquid)..........................................................69
3.5. Ecuación UNIQUAC (Universal Quasi-Chemical) .................................................70
3.6. Modelos de contribución de grupos: UNIFAC ........................................................72
3.7. Determinación de los parámetros de interacción molecular ....................................75
4. BIBLIOGRAFÍA ..............................................................................................................75

1. INTRODUCCIÓN

Los datos de equilibrio entre fases son indispensables para el cálculo y diseño de los equipos
donde se desarrollan las operaciones que impliquen transferencia de materia entre ellas.
El número y la complejidad de los sistemas que pueden presentarse con las cuatro
combinaciones de fases (líquido-gas, líquido-líquido, sólido-gas y sólido-líquido) que resultan
prácticas desde el punto de vista de la transferencia de materia es tan grande, que sólo muy
raramente se localizan los correspondientes datos de equilibrio experimentales en la
bibliografía.
Descartada la obtención experimental de tales datos en cada situación particular, dada la
dificultad y delicadeza de las técnicas disponibles para ello, aun en los casos más sencillos de
sistemas de dos componentes, no queda más remedio que recurrir a su predicción
termodinámica basándose en el mínimo número de datos posibles sobre los componentes
(presiones de vapor, constantes críticas, etc.), o sobre las distintas mezclas binarias que
puedan considerarse con ellos, ya que casi nunca se encontrarán datos sobre mezclas de orden
superior de dichos componentes.
En este tema se van a presentar las dos alternativas más importantes para la predicción, no
sólo de datos de equilibrio, sino también de otras propiedades termodinámicas, como la
entalpía, y la densidad de las fases en equilibrio: modelos de ecuaciones de estado y modelos
de coeficientes de actividad.
Sin embargo, y debido a la limitación de tiempo, se centrará el estudio de estos modelos en el
equilibrio vapor-líquido. Antes de pasar a su presentación, se van a recordar muy brevemente
las expresiones que describen el equilibrio entre fases.

49
Modelos de predicción de propiedades físico-químicas

Para una mezcla binaria, la temperatura y la presión determinan las composiciones de las
fases en equilibrio. Para mezclas que tienen más de dos componentes, se dispone de otro
grado de libertad para cada componente. Por este motivo, resulta conveniente definir una
relación de equilibrio, como el cociente entre las fracciones molares de una especie en dos
fases que se encuentran en equilibrio. Para el equilibrio vapor-líquido, la constante se
denomina valor K o relación de equilibrio vapor-líquido.
yi
Ki = (1)
xi
Para los cálculos de procesos por etapas de equilibrio que intervienen en la separación de dos
o más componentes, se definen factores de separación formando cocientes de relaciones de
equilibrio. Para el caso del equilibrio vapor-líquido, se define la volatilidad relativa, como:
Ki
α ij = (2)
Kj
Los valores K se conocen también como volatilidad absoluta.
Equilibrio vapor-líquido
fiV = fiL (3)
Para formar una relación de equilibrio se sustituyen las fugacidades por las expresiones
equivalentes en función de fracciones molares, Las sustituciones pueden ser muy diversas.
Dos parejas comunes, son:
Pareja 1
fiV = γiV yi f iVo (4)

fiL = γiL xi f iLo (5)


Pareja 2
fiV = φiV yi P (6)
fiL = φiL xi P (7)
o
Siendo, f la fugacidad de la especie en la mezcla, f la fugacidad de la especie pura, φ el
coeficiente de fugacidad en la mezcla y γ el coeficiente de actividad en la mezcla. x e y
representan las fracciones molares en las fases líquida y vapor, respectivamente. Los
subíndices i, V y L, indican, respectivamente, componente, fase vapor y fase líquida.
Estas ecuaciones representan dos formulaciones simétricas y otras dos no simétricas para los
valores K. Las simétricas son:
⎛γ ⎞⎛ f iLo ⎞
K i = ⎜⎜ iL ⎟⎟⎜ o ⎟ (8)
⎜ ⎟
⎝ γ iV ⎠⎝ f iV ⎠
φ
K i = iL (9)
φ iV
Las formulaciones no simétricas son:
φ iL P φ iL
Ki = = (10)
γ iV f iV
o
γ iV ν iV
o

50
Modelos de predicción de propiedades físico-químicas

γ iL f iLo γ νo
Ki = = iL iL (11)
φ iV P φ iV
νo representa el coeficiente de fugacidad de la especie pura.
Con independencia de la formulación termodinámica que se utilice para predecir los valores
K, la exactitud depende de la veracidad de las correlaciones particulares empleadas para
estimar las diferentes magnitudes termodinámicas. Para aplicaciones prácticas, la elección de
la formulación del valor K es un compromiso entre consideraciones de exactitud, complejidad
y conveniencia. Las formulaciones más importantes son las representadas por las ecuaciones
(9) y (11). La primera, es la denominada expresión del valor K en forma de ecuación de
estado, mientras que la segunda corresponde a la expresión del valor K en forma de
coeficiente de actividad.
En la Tabla 1 se presentan las expresiones más útiles y por tanto más empleadas para la
estimación de valores K en el equilibrio vapor-líquido. Se incluyen las dos expresiones
rigurosas mencionadas, a partir de las cuales se deducen otras expresiones aproximadas.

Tabla 1. Expresiones para la estimación de valores K en el equilibrio vapor-líquido

Formas rigurosas: Aplicación recomendada

φiL Mezclas de hidrocarburos y gases


Ecuación de estado Ki =
φiV
ligeros desde T criogénicas hasta
región crítica
γ fo γ νo
Coef. actividad K i = iL iL = iL iL
φiV P φiV
Todas las mezclas desde T
ambiente hasta casi crítica

Formas aproximadas:
Pis Disoluciones ideales a P próxima a
Ley Raoult (ideal) Ki =
P
atmosférica

γ Ps Disoluciones líquidas no ideales a P


Ley Raoult modificada K i = iL i próxima a atmosférica
P
γ iL ν iVS Pis ⎛ 1 P ⎞
Corrección Poynting Ki = exp⎜ ∫ v iL dP ⎟ Disoluciones líquidas no ideales a P
P ⎜ RT PS ⎟ moderada por debajo de T crítica
⎝ i ⎠
Hi
Ley Henry Ki = Especies a P baja o moderada a T
supercrítica
P

Como se puede apreciar, se requieren correlaciones para coeficientes de fugacidad y


coeficientes de actividad. A continuación se presentan de forma resumida los modelos de
ecuaciones de estado.

2. MODELOS DE ECUACIONES DE ESTADO


Los procedimientos de diseño del equipo para las operaciones de separación requieren el
conocimiento de entalpías y densidades, además de las relaciones de equilibrio entre fases. La
termodinámica clásica proporciona un medio de obtener todas estas magnitudes a partir de las

51
Modelos de predicción de propiedades físico-químicas

relaciones P-v-T, que se conocen como ecuaciones de estado. Si bien se han propuesto un
gran número de ecuaciones de estado, la mayoría para la fase vapor, relativamente pocas
resultan adecuadas para los cálculos prácticos de diseño. Algunas de éstas se indican en la
Tabla 2.
Todas las ecuaciones de estado se pueden aplicar a mezclas utilizando reglas de mezcla para
combinar constantes de las especies puras.

Tabla 2. Ecuaciones de estado de mayor utilidad en cálculos de ingeniería química


Nombre Ecuación Constantes y funciones
RT
Gas ideal P= Ninguna
v
ZRT
Generalizada P= Z = f(Pr, Tr, Zc o ω)
v
RT a b = 0.08664RTc/Pc
Redlich-Kwong (R-K) P= − 2
v − b v + bv a = 0.42748R2Tc2.5/PcT0.5
b = 0.08664RTc/Pc
Soave-Redlich-Kwong RT a
P= − 2 a = 0.42748R2Tc2[1 + fw(1-Tr0.5)]2 /Pc
(S-R-K o R-K-S) v − b v + bv
fw = 0.48 + 1.574ω - 0.176ω2
b = 0.07780RTc/Pc
RT a
Peng-Robinson (P-R) P= − 2 a = 0.45724R2Tc2[1 + fw(1-Tr0.5)]2 /Pc
v − b v + 2bv − b 2
fw = 0.37464+ 1.54226ω - 0.26992ω2

La ecuación del gas ideal se utiliza ampliamente, tanto para gases puros como para mezclas
gaseosas. Cuando cada una de las especies de una mezcla, así como la mezcla misma, sigue la
ley de los gases ideales, se cumplen la ley de Dalton de la aditividad de las presiones parciales
y la ley de Amagat de la aditividad de los volúmenes de las especies puras. La ecuación de
mezcla en función de la densidad molar, ρ/M, es:
C
∑ ni
ρ 1 P
= = = i =1 (12)
M v RT V
La ley de los gases ideales es generalmente exacta para presiones hasta una atmósfera. A tres
atmósferas, la ecuación (12) puede presentar desviaciones con respecto a los datos
experimentales de hasta un 10%. Este hecho se debe a que esta ecuación no tiene en cuenta el
tamaño molecular o volumen ocupado por las moléculas, ni las fuerzas de interacción entre
éstas. Todas las otras ecuaciones de estado incluidas en la Tabla 2 tratan de corregir estas dos
deficiencias.
Aunque no se ha incluido en la Tabla 2, la ecuación de van der Waals, P = RT/(v –b) – a/v2, en
donde a y b son constantes que dependen de las especies y pueden estimarse a partir de los
valores de presión y temperatura crítica, se puede considerar la primera ecuación de estado
para gases no ideales. A pesar de que su intervalo de aplicación es bastante estrecho y no se
52
Modelos de predicción de propiedades físico-químicas

emplea prácticamente en la actualidad, se debe destacar que en su desarrollo se puso de


manifiesto que todas las especies pueden tener volúmenes molares reducidos iguales, para los
mismos valores de presión reducida y temperatura reducida. Este hecho, conocido como
principio de los estados correspondientes, ha sido el punto de partida para el desarrollo de la
ecuación de estado generalizada, indicada en la Tabla 2.
La ecuación de estado generalizada define el factor de compresibilidad, Z, el cual es función
de la temperatura absoluta reducida Tr = T/Tc, de la presión absoluta reducida Pr = P/Pc y del
factor de compresibilidad crítica, Zr, o del factor acéntrico, el cual se determina a partir de
datos experimentales P-v-T.
El factor acéntrico, introducido por Pitzer y col., tiene en cuenta las diferencias de forma
molecular y se determina a partir de la curva de presión de vapor:
⎡ ⎛ PS ⎞ ⎤
ω i = ⎢− log ⎜⎜ i ⎟⎟ ⎥ − 1.000 (13)
⎢ ⎝ c ⎠ Tr = 0.7 ⎥⎦
P

Esta definición conduce a un valor de ω prácticamente igual a cero para moléculas de simetría
esférica (gases nobles, por ejemplo). Algunos valores típicos de ω son 0, 0.263, 0.489 y
0.644, para metano, tolueno, n-decano y alcohol etílico, respectivamente.
En 1949, Redlich y Kwong publicaron una ecuación de estado que, como la de van der Waals,
solamente tiene dos constantes que pueden determinarse directamente a partir de la
temperatura y presión críticas. Además, la ecuación R-K tiene una exactitud comparable a
otras ecuaciones más complejas y es capaz de aproximar la región líquida. La ecuación de van
der Waals falla considerablemente en este aspecto. Sin embargo, la ecuación R-K presenta la
desventaja de que su aplicabilidad se restringe a sistemas que no se desvíen mucho de la
idealidad.
Cuando la ecuación R-K se aplica a mezclas, se utiliza la expresión indicada en la Tabla 2, o
bien se transforma y combina con la ecuación de estado generalizada para llegar a la ecuación
siguiente:
1 A2 h
Z= − (14)
1 − h B (1 + h )

⎛ A2 ⎞ A2
3 2

Z − Z + BP⎜ ⎟
− BP − 1⎟ Z − (BP)2 = 0 (15)
⎝ B ⎠ B

La resolución analítica de esta ecuación lleva a la obtención de tres raíces. En general, para
temperaturas supercríticas, donde solo existe una fase, se obtiene una raíz real y dos raíces
complejas. Por debajo de la temperatura crítica, donde pueden coexistir una fase líquida y una
vapor, se obtienen tres raíces reales, correspondiendo el mayor valor de Z (mayor v) a la fase
vapor (ZV), y el menor valor de Z (menor v) a la fase líquida (ZL). El valor intermedio no
tiene uso práctico.
Para aplicar la ecuación R-K a mezclas, se necesitan reglas de mezcla para obtener los valores
medios de las constantes A y B para cada componente en la mezcla:
C C
A = ∑ Ai yi o bien A = ∑ Ai xi (16)
i =1 i =1

53
Modelos de predicción de propiedades físico-químicas

C C
B = ∑ Bi y i o bien B = ∑ Bi x i (17)
i =1 i =1

1/ 2 1/ 2
⎛ a ⎞ ⎛ 0.4728 ⎞
A i = ⎜⎜ 2 i 2.5 ⎟
⎟ =⎜ ⎟ (18)
⎜ P T 2.5 ⎟
⎝R T ⎠ ⎝ c r ⎠
bi 0.0867
Bi = = (19)
RT Pc Tr
BP
h = (20)
Z
Si se utiliza la ecuación de la Tabla 2 directamente, las reglas de mezcla son:
C ⎛ C ⎞
a = ∑ ⎜⎜ ∑ y i y j a ij ⎟⎟ (21)
i =1 ⎝ j=1 ⎠

(
a ij = a i a j )1 / 2 (22)
C
b = ∑ yi bi (23)
i =1

La principal dificultad de la ecuación R-K es su incapacidad para predecir con exactitud la


presión de vapor. Tomando como base el trabajo realizado por Wilson, Soave adicionó un
tercer parámetro, el factor acéntrico de Pitzer, a la ecuación R-K y obtuvo una concordancia
casi exacta con los datos de presión de vapor de hidrocarburos puros, al mismo tiempo que
mejoraba la capacidad de la ecuación para predecir propiedades de la fase líquida. Esta
ecuación de estado fue aceptada de inmediato para su aplicación a mezclas conteniendo
hidrocarburos y/o gases ligeros, debido a su simplicidad y precisión.
La modificación de Soave de la ecuación R-K, denominada ecuación de estado S-R-K (o R-
K-S), es la siguiente:
RT a
P= − 2 (24)
v − b v + bv
b = 0.08664RTc/Pc (25)
a = 0.42748R2Tc2[1 + fw(1-Tr0.5)]2 /Pc (26)
fw = 0.48 + 1.574ω - 0.176ω2 (27)
Cuatro años después de la publicación de la ecuación S-R-K, Peng y Robinson presentaron
una modificación adicional a las ecuaciones de estado R-K y S-R-K, en un intento de mejorar
el ajuste a los valores experimentales en la región crítica y para volúmenes molares de
líquidos. En la Tabla 3 se muestra esta ecuación de estado junto a la S-R-K.
Las principales características de la ecuación P-R se indican a continuación:
• Intervalo más amplio de condiciones de operación
• Mayor número de componentes, tanto hidrocarburos como no hidrocarburos.
• En reglas de mezcla emplea coeficientes de interacción binarios (kij), obtenidos de
datos experimentales.
54
Modelos de predicción de propiedades físico-químicas

• Genera, al igual que la ecuación S-R-K, todos los valores de las propiedades
termodinámicas y datos de equilibrio directamente.
• No se puede emplear con mezclas líquidas no ideales de compuestos polares.

Tabla 3. Comparación entre las ecuaciones de estado S-R-K y P-R

Otra base teórica para sustancias polares y no polares es la ecuación de estado del virial,
debida a Thiesen y Onnes, que no se ha incluido en la Tabla 2. Una representación habitual de
esta ecuación de estado es la que se indica a continuación, en donde los coeficientes del virial
B, C y superiores pueden en principio obtenerse a partir de la mecánica estadística:
B C
Z = 1+ + + ...... (28)
v v2
A partir de esta ecuación se han realizado modificaciones que han conducido a otras
ecuaciones de estado como, por ejemplo, la ecuación de Benedict-Webb-Rubin (B-W-R). Esta
ecuación de estado, debido al elevado número de constantes que precisa (al menos ocho), tan
55
Modelos de predicción de propiedades físico-químicas

solo se ha aplicado a sustancias puras en condiciones criogénicas. Sin embargo, una


modificación de la ecuación B-W-R, realizada por Lee y Kesler, con una importante extensión
para su aplicación a mezclas, llevada a cabo por Plocker, ha conducido a la ecuación de
estado L-K-P, mostrada en la Tabla 4, de la que pueden destacarse las siguientes
características:
• Resulta de una modificación de la ecuación B-W-R, basada en la generalización de los
estados correspondientes.
• Las constantes de la ecuación vienen dadas en función de la temperatura y de la
presión reducidas y del factor acéntrico, obtenidos a partir de datos P-v-T de metano,
argon y kripton (ϖ = 0) y de un fluido de referencia, n-octano (ϖ = 0.398).
• Describe adecuadamente mezclas de hidrocarburos y gases ligeros, en fase líquida y
vapor, en un amplio intervalo de presiones y temperaturas.
• Se utiliza mucho en simuladores para el cálculo de entalpías y entropías con otros
modelos (expresiones semi-empíricas para coeficientes de actividad, presión de vapor,
etc.).

Tabla 4 Ecuación de estado L-K-P


Compuestos puros Mezclas

2.1. Propiedades termodinámicas para las fases líquida y vapor a partir de modelos
de ecuaciones de estado
Si se dispone de ecuaciones para el calor específico o la entalpía del gas ideal (presión nula),
así como de una ecuación de estado, se pueden deducir en forma consistente propiedades
termodinámicas por aplicación de las ecuaciones de la termodinámica clásica indicadas en la
Tabla 5. Para una temperatura y composición dadas, estas ecuaciones representan el efecto de
la presión, para valores superiores a los que se puede considerar comportamiento de gas ideal.

56
Modelos de predicción de propiedades físico-químicas

Tabla 5. Ecuaciones útiles de la termodinámica clásica para la estimación de propiedades

• Entalpía de mezcla

(h − h ) = Pv − RT − ∫
o
V ∞
v⎡

⎛ ∂P ⎞ ⎤
P −T⎜ ⎟ ⎥dv
⎝ ∂T ⎠ v ⎦

• Entropía de mezcla

(s − s ) = ∫ ⎛⎜⎝ ∂∂TP ⎞⎟⎠ dv − ∫


o
V ∞
v

v R
v
dv
v

• Coeficiente de fugacidad del componente puro


⎡ 1 P⎛ RT ⎞ ⎤ ⎡ 1 ∞⎛ RT ⎞ ⎤
ν o = exp ⎢ ∫0 ⎜⎝ v − ⎟ dP ⎥ = exp ⎢ ∫v ⎜P− ⎟dv − lnZ + (Z − 1)⎥
⎣ RT P ⎠ ⎦ ⎣ RT ⎝ v ⎠ ⎦
• Coeficiente de fugacidad de mezclas
⎧ ⎡⎛ ⎤ ⎫

⎪ 1 ⎢⎜ ∂P ⎟ RT ⎥ ⎪

φi = exp ⎨ ∫V ⎢⎜⎝ ∂Ni ⎟⎠ −

dV − ln ⎬Z
⎪⎩ RT ⎣ T ,V ,N j
V
⎦ ⎪⎭

C
V = v∑ Ni
i =1

2.1.1. Ecuación de estado R-K


Entalpía
La capacidad calorífica molar de los gases se expresa habitualmente como un polinomio de
temperatura:
c opV = a 1 + a 2 T + a 3 T 2 + a 4 T 3 + a 5 T 4 (29)

La integración de la ecuación (29) conduce a una ecuación de la entalpía molar del gas ideal
a la temperatura T con respecto a la temperatura de referencia To,
T 5 (
a k T k − T ok )
H oV = o
∫ c pV dT = ∑ (30)
To k =1 k
Cuando no es válida la suposición de la ley del gas ideal, se debe introducir una corrección
para tener en cuenta el efecto de la presión sobre la entalpía. Para una especie pura o para
mezclas a la temperatura T y presión P, la entalpía del vapor es:
C

⎣i =1
(
H V = ⎡⎢ ∑ y i H iV
o ⎤


) (
+ H V − H oV ) (31)

La ecuación (32) resulta adecuada para utilizar con ecuaciones de estado que son funciones
explícitas de la presión como las de la Tabla 2.
Por otra parte, la entalpía de la fase líquida resulta igual a:

57
Modelos de predicción de propiedades físico-químicas

C
(
H L = ⎡⎢ ∑ x i H iV
⎣i =1
) (
o ⎤


+ H L − H oV ) (32)

Para especies puras a temperaturas inferiores a la crítica, la ecuación (32) se puede escindir en
las contribuciones separadas que se muestran en la Figura 1.

Figura 1. Contribuciones a la entalpía

Utilizando la ecuación de estado R-K, se obtienen las siguientes expresiones para la entalpía
molar de la mezcla:
⎡ BP ⎞⎤
C
( o
H V = ∑ y i H iV )
+ RT ⎢ Z V − 1 −
3A 2 ⎛
ln⎜⎜1 +
2B ⎝
⎟⎥
Z V ⎟⎠⎥⎦
(33)
i =1 ⎢⎣

⎡ BP ⎞⎤
C
( o
H L = ∑ x i H iV )
+ RT ⎢ Z L − 1 −
3A 2 ⎛
ln⎜⎜1 +
2B ⎝
⎟⎥
Z L ⎟⎠⎦
(34)
i =1 ⎣
Coeficiente de fugacidad de una especie pura
Si P < PiS , νo es el coeficiente de fugacidad del vapor y si P > PiS , νo es el coeficiente de
fugacidad del líquido. La presión de saturación corresponde a la condición ν oL = ν oV .

⎡ A 2 ⎛ BP ⎞⎤
ν oV = exp ⎢ Z V − 1 − ln (Z V − BP ) − ln ⎜1 + ⎟⎥ (35)
⎢⎣ B ⎜⎝ Z V ⎟⎠⎥⎦

⎡ A 2 ⎛ BP ⎞⎤
ν oL = exp ⎢ Z L − 1 − ln (Z L − BP ) − ln ⎜1 + ⎟⎥ (36)
⎣ B ⎜⎝ Z L ⎟⎠⎦

58
Modelos de predicción de propiedades físico-químicas

Presión de vapor
Para una temperatura T < Tc, la presión de
saturación (presión de vapor), PiS, se puede
estimar a partir de la ecuación de estado R-
K igualando las ecuaciones (35) y (36) y
calculando P por un procedimiento
iterativo. Los resultados, obtenidos por
Edmister, se muestran en la Figura 2. La
curva de presión de vapor R-K no
representan satisfactoriamente los datos
para un amplio intervalo de formas
moleculares, como indican las curvas
experimentales para metano, tolueno, n-
decano y alcohol etílico. Este hecho, ya
mencionado anteriormente, constituye uno
de los principales fallos de la ecuación R-
K. Aparentemente, las constantes críticas
Tc y Pc son por sí solas insuficientes para
generalizar el comportamiento termodiná-
mico. Sin embargo, la generalización
mejora notablemente si se incorpora a la
ecuación una tercera constante que
represente las diferencias genéricas de las
curvas de presión de vapor reducida. Esta
modificación es la que condujo a la Figura 2 Presión de vapor reducida
ecuación de estado S-R-K.
Alternativamente, la presión de vapor se puede estimar a partir de muchas correlaciones
empíricas, como la conocida ecuación de Antoine.
Asimismo, y como ya se ha mencionado, cuando una ecuación de estado resulta adecuada
para la presión de vapor de la fase vapor, pero inadecuada para la fase líquida, se puede
utilizar la corrección de Poynting. Si el líquido es incompresible, se llega a:
⎛ PS
ν oL = ⎜⎜ i
⎞ o ( )
⎡ v P − PiS ⎤
⎟ ν VS exp ⎢ L (37)
⎟ ⎥
⎝ P ⎠ ⎣ RT ⎦
Para presiones muy altas, la corrección de Poynting para gases ligeros es importante. A bajas
presiones, ν oVS es igual a la unidad y el argumento del término exponencial tiende a cero. Por
tanto, ν oL tiende a la relación entre la presión de vapor y la presión total.
Coeficientes de fugacidad de mezclas
⎡ B A 2 ⎛ 2A i B ⎞ ⎛ BP ⎞⎤
φ iV = exp ⎢(Z V − 1) i − ln (Z V − BP ) − ⎜ − i ⎟ ln ⎜⎜1 + ⎟⎥ (38)
⎣⎢ B B ⎝ A B⎠ ⎝ Z V ⎟⎠⎥⎦

⎡ Bi A 2 ⎛ 2A i B ⎞ ⎛ BP ⎞⎤
φ iL = exp ⎢(Z L − 1) − ln (Z L − BP ) − ⎜ − i ⎟ ln ⎜⎜1 + ⎟⎟⎥ (39)
⎣ B B ⎝ A B ⎠ ⎝ Z L ⎠⎦

59
Modelos de predicción de propiedades físico-químicas

2.1.2. Ecuación de estado S-R-K


Las expresiones que se obtienen utilizando esta ecuación de estado se indican a continuación
y resultan aplicables, tanto a la fase líquida como a la fase vapor, siempre que se utilice la
composición de la fase y el factor de compresibilidad adecuados.
(
Z 3 − Z 2 + Z A − B − B 2 − AB = 0 ) (40)

⎡ A ⎛ Z + Bi ⎞⎤
ν io = exp ⎢ Z − 1 − ln (Z − B i ) − i ln ⎜ ⎟⎥ (41)
⎣ Bi ⎝ Z ⎠⎦

⎡ Bi A ⎛⎜ 2A i0.5 B ⎞ ⎛ Z + B ⎞⎤
φ i = exp ⎢(Z − 1) − ln (Z − B) − ⎜ 0.5 − i ⎟⎟ ln ⎜ ⎟⎥ (42)
⎣⎢ B B⎝ A B ⎠ ⎝ Z ⎠⎦⎥

⎧ ⎡ m i Tr0.5 m j Tr0.5 ⎤⎫
⎪ 1 ⎛ Z+B⎞ C C
H= H oV + RT ⎨Z − 1 − ln ⎜ ⎟ ∑ ∑ y i y j A ij ⎢1 − i

j
⎥ ⎪⎬ (43)
⎪⎩ B ⎝ Z ⎠i =1 j=1 ⎢ 0.5
2a i 0.5
2a j ⎥⎪
⎣ ⎦⎭
En la ecuación (41), Z es el factor de compresibilidad para la especie pura. Las constantes Ai,
Bi, A y B para especies puras son:
Pri
* A i = 0.42747 a i (44)
Tr2i
Pri
* B i = 0.08664 (45)
Tr
i

Las reglas de mezcla para especies no polares son las mismas de la ecuación original R-K. Por
ejemplo, para mezclas en fase vapor,
C ⎛ C ⎞
A = ∑ ⎜⎜ ∑ y i y j A ij ⎟⎟ (46)
i =1 ⎝ j=1 ⎠
(
A ij = A i A j )1 / 2 (47)
C
B = ∑ y i Bi (48)
i =1

Excepto para el hidrógeno, las ecuaciones S-R-K pueden aplicarse a gases ligeros tales como
nitrógeno, monóxido de carbono, dióxido de carbono y sulfuro de hidrógeno, si se incorporan
los parámetros kij de interacción, obtenidos a partir de datos experimentales, en la forma
siguiente:
Aij = (1 - kij)(AiAj)1/2 (49)
En la Figura 3 se muestra la capacidad de la correlación S-R-K para predecir valores K para
un sistema multicomponente de 10 especies, incluso cuando la presión se aproxima a la
presión de convergencia. Los cálculos del equilibrio entre fases con las ecuaciones S-R-K
requieren una estimación inicial de las composiciones de las fases.

60
Modelos de predicción de propiedades físico-químicas

Sin embargo, la correlación S-R-K,


análogamente a lo que ocurre con la
ecuación R-K, no es capaz de
predecir la densidad del líquido con
buena exactitud. Por esta razón,
como ya se ha mencionado, han
aparecido posteriores desarrollos,
como el de Peng y Robinson,
dirigidos a mejorar las predicciones
de la densidad del líquido y del
equilibrio entre fases en la región
crítica. Sin embargo, el uso de tales
ecuaciones está en general limitado a
moléculas no polares relativamente
pequeñas.

Figura 3. Ajuste de datos experimentales del valor K y


los obtenidos con la ecuación S-R-K

Cuando se tratan disoluciones más complejas en las que intervienen compuestos polares, se
emplea para el cálculo de los valores K la siguiente ecuación:
γ iL f iLo γ νo
Ki = = iL iL (50)
φ iV P φ iV
Los coeficientes de fugacidad de los componentes puros en fase líquida y de los componentes
en fase gaseosa se obtienen, evidentemente, a partir de una ecuación de estado. Los
coeficientes de actividad en fase líquida se obtienen a partir de los modelos de coeficientes de
actividad que se tratan a continuación.

3. MODELOS DE COEFICIENTES DE ACTIVIDAD


Los coeficientes de actividad pueden calcularse experimentalmente cuando se conoce el
equilibrio vapor-líquido. Pero habitualmente lo que se pretende es predecir dicho equilibrio,
sobre todo para sistemas multicomponentes, por medio de los coeficientes de actividad.
Existen diferentes métodos o correlaciones basados en la energía libre de Gibbs en exceso con
la cual se pueden obtener los coeficientes de actividad. Estas correlaciones expresan la
influencia de la composición y de la temperatura en los coeficientes de actividad. La
influencia de la presión sólo se hace efectiva cuando se opera a presiones elevadas,
61
Modelos de predicción de propiedades físico-químicas

circunstancia que impide el empleo de estos modelos termodinámicos para la determinación


del equilibrio a presiones elevadas.
Inicialmente se emplearon las ecuaciones de Van Laar y de Margules, descritas en trabajos y
libros de Termodinámica, las cuales son correlaciones puramente empíricas que dan buenas
descripciones del equilibrio vapor-líquido de mezclas binarias. En el caso de mezclas
multicomponentes, se requiere un mayor número de parámetros, con lo que su complejidad
aumenta sin conseguir mejoras apreciables con respecto a otras correlaciones.
Las ecuaciones que mejores ajustes presentan para mezclas multicomponentes, sin aumentar
el número de parámetros requerido, son cuatro: Scatchard-Hildebrand, que se basa en el
concepto de disoluciones regulares y sólo requiere propiedades de los componentes puros; y
Wilson, NRTL y UNIQUAC, que se basan en la existencia de interacciones entre las
distintas moléculas de las que consta la mezcla. Estas, al igual que las ecuaciones de Van Laar
y de Margules, derivan de las energías libres de Gibbs en exceso necesitando, al menos un
dato experimental de equilibrio líquido-vapor, para determinar los parámetros binarios de
interacción.
Por otra parte, la ecuación de Scatchard-Hildebrand también puede resultar de utilidad para
sistemas en los que no se dispone de datos experimentales. En este sentido, sin embargo, se
emplean más las correlaciones basadas en contribuciones de grupos, como UNIFAC y
ASOG.

3.1. Disoluciones regulares. Correlación de Chao-Seader (C-S)


Para las especies menos volátiles de una mezcla, la dependencia de los valores K con respecto
a la composición se debe principalmente al comportamiento no ideal de la disolución líquida.
Prausnitz, Edmister y Chao demostraron que la relativamente simple teoría de las
disoluciones regulares de Scatchard y Hildebrand puede utilizarse para estimar las
desviaciones del comportamiento ideal de mezclas líquidas de hidrocarburos. Ellos
expresaron los valores K según la ecuación (50). Chao y Seader simplificaron y ampliaron la
aplicación de esta ecuación a una correlación general de hidrocarburos y de algunos gases
ligeros en la forma de un conjunto compacto de ecuaciones especialmente adecuadas para su
utilización en ordenadores.
Las correlaciones sencillas para los coeficientes de actividad en fase líquida, basadas
exclusivamente en las propiedades de los componentes puros, no son generalmente exactas.
Sin embargo, para mezclas de hidrocarburos, la teoría de las disoluciones regulares resulta
adecuada y se utiliza mucho. La teoría se basa en la premisa de que la no idealidad se debe a
diferencias de las fuerzas de van del Waals de atracción de las especies presentes. Las
disoluciones regulares tienen un calor mezcla endotérmico y todos los coeficientes de
actividad son superiores a la unidad. Estas disoluciones son regulares en el sentido de que las
moléculas se dispersan al azar. Las desiguales fuerzas atractivas entre parejas de moléculas
similares y diferentes inducen a provocar la segregación de las mismas. Sin embargo, puede
suponerse que esta segregación tiende a ser contrarrestada por la energía térmica dando lugar
a que las concentraciones moleculares locales sean idénticas a las concentraciones globales de
la disolución. Por tanto, la entropía en exceso es cero, de forma que la entropía de las
disoluciones regulares es igual a la de las disoluciones ideales, en las que las moléculas están
dispersas al azar.

62
Modelos de predicción de propiedades físico-químicas

Para una disolución real, la energía libre molar, g, es la suma de las energías libres molares de
la disolución ideal y la energía libre molar en exceso gE, debida a los efectos de la no
idealidad. Para una disolución líquida,

( )
C C C
g = ∑ x i g i + RT ∑ x i ln x i + g E = ∑ x i g i + RT ln x i + g iE (51)
i =1 i =1 i =1

en donde la energía libre molar en exceso es la suma de las energías parciales molares en
exceso.
La energía libre parcial molar en exceso está relacionada con el coeficiente de actividad de la
fase líquida por:
g iE 1 ⎛⎜ ∂ n T g E ⎞

= ln γ i = (52)
RT RT ⎜⎝ ∂ n i ⎟
⎠ P ,T , n j

Para una disolución líquida regular multicomponente, la energía libre molar en exceso es:
⎡1 C C 2⎤
( )
C
g E = ∑ (x i v iL ) ⎢ ∑ ∑ Φ i Φ j δ i − δ j ⎥ (53)
i =1 ⎣ 2 i =1 j=1 ⎦
Φ es la fracción en volumen y suponiendo volúmenes aditivos,
x j v jL x j v jL
Φj = C
= (54)
vL
∑ x i v iL
i =1

δ es el parámetro de solubilidad,
1/ 2
⎛ λ j − RT ⎞
δj = ⎜ ⎟ (55)
⎜ v jL ⎟
⎝ ⎠
A partir de estas ecuaciones se obtiene una expresión para el coeficiente de actividad:
2
⎛ C ⎞
v iL ⎜⎜ δ i − ∑ Φ j δ j ⎟⎟
ln γ iL = ⎝ j=1 ⎠ (56)
RT
Cuando las diferencias de tamaños moleculares, reflejados por los volúmenes molares del
líquido, son apreciables, pueden añadirse a la contribución de la energía libre de una
disolución regular la siguiente corrección de tamaño de Flory-Huggins para disoluciones
atérmicas (entalpía en exceso igual a cero):
C ⎛Φ ⎞
g E = RT ∑ x i ln ⎜⎜ i ⎟⎟ (57)
i =1 ⎝ xi ⎠
⎛v ⎞ v
ln γ iL = ln⎜⎜ iL ⎟⎟ + 1 − iL (58)
⎝ vL ⎠ vL
La expresión completa para el coeficiente de actividad de una especie en una disolución
regular, incluyendo la corrección de Flory-Huggins, es:

63
Modelos de predicción de propiedades físico-químicas

⎧ ⎡ C ⎤
2 ⎫
⎪ v iL ⎢δ i − ∑ Φ j δ j ⎥ ⎪
⎪ ⎣ j=1 ⎦ ⎛v ⎞ v ⎪
γ iL = exp ⎨ + ln ⎜⎜ iL ⎟⎟ + 1 − iL ⎬ (59)
⎪ RT ⎝ vL ⎠ vL ⎪
⎪ ⎪
⎩ ⎭
A partir de la correlación de Chao-Seader también se pueden calcular los coeficientes de
o
fugacidad de los componentes puros en fase líquida, ν iL , mediante una expresión empírica en
función de Tr, Pr y ω. Para condiciones hipotéticas del líquido (P<PiS o T>Tci) la correlación
o
fue ampliada calculando ν iL a partir de datos de equilibrio vapor-líquido. La ecuación C-S
o
para ν iL es:
o (o) (1)
log ν iL = log ν iL + ω i log ν iL (60)

log ν iL
(o)
= A0 +
A1
Tri
(
+ A 2 Tri + A 3 Tr2i + A 4 Tr3i + A 5 + A 6 Tri + A 7 Tr2i Pri )
(61)
( )
+ A 8 + A 9 Tri P − log Pri
2
ri

(1)
log ν iL = A 10 + A 11Tri +
A 12
Tri
(
+ A 13 Tr3i + A 14 Pri − 0.6 ) (62)

Las constantes para la ecuación (62) son:


A10 = -4.23893 A11 = 8.65808 A12 = -1.22060
A13 = -3.15224 A14 = -0.025
Las constantes para la ecuación (61) son:
Fluido simple, ω=0 Metano Hidrógeno
A0 2.05135 1.36822 1.50709
A1 -2.10899 -1.54831 2.74283
A2 0 0 -0.02110
A3 -0.19396 0.02889 0.00011
A4 0.02282 -0.01076 0
A5 0.08852 0.10486 0.008585
A6 0 -0.02529 0
A7 -0.00872 0 0
A8 -0.00353 0 0
A9 0.00203 0 0

Las condiciones de aplicabilidad de la correlación C-S son:


T < 500 ºF (260 ºC). No se aconseja para temperaturas inferiores a 0 ºF.
P < 1000 psia (6.89 MPa)
Para hidrocarburos (excepto metano), 0.5 < Tri < 1.3 y la presión crítica de la mezcla <
0.8.
Para sistemas que contienen metano y/o hidrógeno, Tr < 0.93, y fracción molar de
metano < 0.3. Fracción molar de otros gases disueltos <0.2.
64
Modelos de predicción de propiedades físico-químicas

En la predicción de los valores K de parafinas y olefinas, la fracción molar de


aromáticos en la fase líquida habrá de ser < 0.5. Por el contrario, en la predicción de los
valores K de aromáticos, la fracción de aromáticos en la fase líquida habrá de ser > 0.5.
A partir de la correlación C-S para el valor K se pueden calcular otras propiedades
termodinámicas. La ecuación de estado R-K (Tabla 2) se emplea para determinar la densidad
y la ecuación (33) para obtener la entalpía de la mezcla en fase vapor. La entalpía del gas ideal
o
H iV se calcula con la ecuación (30). La entalpía de la mezcla en fase líquida se calcula a
o
partir de las ecuaciones de ν iL y γiL con la correlación C-S. La ecuación de partida es la
siguiente:
C ⎡ ⎛ ∂ ln ν iL
o
⎞ ⎛ ∂ ln γ iL ⎞ ⎤
H L = ∑ x i ⎢H iV
o
− RT 2 ⎜⎜ ⎟ − RT 2 ⎜⎜
⎟ ⎟⎟ ⎥ (63)
i =1 ⎢⎣ ⎝ ∂T ⎠P ⎝ ∂T ⎠ P , x i ⎥⎦
Derivando el coeficiente de fugacidad del componente líquido puro con respecto a la
temperatura se obtiene la siguiente relación para los efectos combinados de la presión y el
calor latente de cambio de fase vapor a líquido:

⎛ ∂ ln ν iL ⎞ ⎡ A
( )
o
2.30258 RT 2
RT 2 ⎜
⎜ ∂T
⎟ = H iV

o
− H iL =
Tci
(
⎢− 21 + A 2 + Tri 2A 3 + 3A 4 Tri )
⎝ ⎠P ⎢⎣ Tri
(64)
⎛ ⎞⎤
(
+ Pri A 6 + 2A 7 Tri ) ⎜
A
+ A 9 Pr2i + ωi ⎜ A 11 − 122
+ 3A T 2⎟
13 ri

⎟⎥
⎝ T ri ⎠⎦
Las constantes Ai son las de las ecuaciones (61) y (62).
La derivada del coeficiente de actividad en la fase líquida conduce a la entalpía en exceso de
la especie H iE (calor de mezcla). Para disoluciones regulares, H iE >0 (endotérmica).
2
⎛ ∂ ln γ iL ⎞ ⎛ ⎞
= (H iL − H iL ) = − H iL
C
RT ⎜⎜
2
⎟⎟ E
= − v iL ⎜⎜ δ i − ∑ Φ j δ j ⎟⎟ (65)
⎝ ∂T ⎠ P, x i ⎝ j=1 ⎠

Una ecuación para el volumen molar de la fase líquida, consistente con la correlación C-S, se
deduce sumando los volúmenes molares de las especies y efectuando la corrección del
volumen en exceso (volumen de mezcla):
⎡ ⎛ ∂ ln γ iL ⎞ ⎤
( )
C C
v L = ∑ x i v iL + v iLE = ∑ x i ⎢ v iL + RT⎜⎜ ⎟⎟ ⎥ (66)
i =1 i =1 ⎢⎣ ⎝ ∂P ⎠ T , x i ⎥⎦

Para disoluciones regulares γiL se puede considerar independiente de la presión, y v iLE = 0 .


Para el cálculo de los volúmenes molares de los componentes se puede utilizar la siguiente
ecuación:

v iL =
2.30258 RT
PCi
[ (
A 5 + A 6 Tri + A 7 Tr2i + 2Pri A 8 + A 9 Tri + ω i A 14 ) ] (67)

La correlación de Chao y Seader se utiliza ampliamente en las industrias del petróleo y gas
natural, habiéndose aplicado al diseño de una gran variedad de separaciones de hidrocarburos
ligeros por destilación.
65
Modelos de predicción de propiedades físico-químicas

3.2. Mezclas no ideales que contienen compuestos polares


En los líquidos que contienen especies polares diferentes, especialmente cuando se forman o
se rompen enlaces de hidrógeno, casi nunca es válida la suposición de disolución líquida
ideal. Ewell, Harrison y Berg propusieron una clasificación muy útil de las moléculas basada
en el potencial de asociación o de solvatación debidas a la formación de enlaces de hidrógeno.
Si una molécula contiene un átomo de hidrógeno unido a un átomo dado (O, N, F y, en ciertos
casos, C), el átomo activo de hidrógeno puede formar un enlace con otra molécula que
contenga un átomo dador. La clasificación de la Tabla 6 permite una estimación cualitativa de
las desviaciones de la ley de Raoult para parejas binarias, si se usa conjuntamente con la Tabla
7. Desviaciones positivas corresponden a valores de γiL>1.

Tabla 6. Clasificación de las moléculas según su potencial de formación de enlaces de


hidrógeno
Clase Descripción Ejemplos
Moléculas capaces de formar redes Agua, glicoles, glicerina, aminoalcoholes,
I tridimensionales con enlaces de hidrógeno hidroxilaminas, hidroxiácidos, polifenoles y amidas
fuertes.
Alcoholes, ácidos, fenoles, aminas primerias y
Otras moléculas que contienen tanto
secundarias, oximas, compuestos nitro y nitrilos con
II átomos de hidrógeno activos como otros
átomos de H en α, amoniaco, hidracina, fluoruro de
átomos donadores (O, N, F).
hidrógeno y cloruro de hidrógeno.
Éteres, cetonas, aldehídos, ésteres, aminas terciarias
Moléculas que contienen átomos donadores
III (incluyendo las de tipo piridina), compuestos nitro y
pero no hidrógenos activos.
nitrilos sin átomos de H en α.
Moléculas que contienen átomos de
hidrógeno activos pero no átomos
donadores con dos o tres átomos de cloro CHCl3, CH2Cl2, CH3CHCl2, CH3ClCH2Cl,
IV
sobre el mismo átomo de carbono y uno o CH2ClCHClCH2Cl y CH2ClCHCl2.
más átomos de cloro sobre átomos de
carbono adyacentes.
Todas las demás moléculas que no tienen Hidrocarburos, sulfuro de carbono, sulfuros,
V átomos de hidrógeno activos ni átomos mercaptanos, y derivados halogenados no incluidos en la
donadores. clase IV.

Tabla 7. Interacciones moleculares que causan desviaciones de la ley de Raoult


Tipo de desviación Clases Efecto sobre el enlace de hidrógeno
Siempre negativa. III + IV Solamente se forman enlaces-H.
Cuasi-ideal; siempre positiva o III + III; III + V; IV + IV;
No intervienen enlaces-H.
ideal. IV + V; V + V.
Generalmente positiva, pero I + I; I + II; I + III; II + II;
Se forman y se rompen enlaces-H.
algunas veces negativa. II + III.
I + IV (frecuentemente con Se forman y se rompen enlaces-H, pero
Siempre positiva. solubilidad limitada); la disociación de las Clases I o II es el
II + IV. efecto más importante.
Siempre positiva. I + V; II + V. Solamente se rompen enlaces-H.

Los efectos de la disolución no ideal pueden incorporarse en las formulaciones del valor K, tal
y como se ha visto, en dos formas diferentes. La primera utiliza el coeficiente de fugacidad φi,
juntamente con la ecuación de estado y adecuadas reglas de mezcla. Este método es el más

66
Modelos de predicción de propiedades físico-químicas

empleado para tratar no idealidades en fase vapor. Sin embargo, φiV refleja los efectos
combinados de un gas no ideal y de una mezcla gaseosa no ideal. A bajas presiones ambos
efectos son despreciables. A presiones moderadas una mezcla en fase vapor puede ser todavía
ideal, aún cuando la misma no siga la ley de los gases ideales. Sin embargo, en fase líquida las
no idealidades pueden ser muy importantes aún a bajas presiones. Como ya se ha visto, el
coeficiente de fugacidad, φiL, puede utilizarse para expresar las no idealidades en fase líquida
de especies no polares.
Cuando están presentes especies polares, la técnica habitual para tratar no idealidades de
o
disoluciones es retener φiV pero sustituir φiL por el producto de γiL por ν iL , donde el primero
tiene en cuenta las desviaciones del comportamiento ideal:
γ νo
K i = iL iL (68)
φ iV
o
Para bajas presiones, ν iL = PiS P y φiV = 1.0, de forma que la ecuación (68) se transforma en
una modificación de la ley de Raoult para el valor K:
γ iL PiS
Ki = (69)
P
C
P = ∑ x i γ iL PiS (70)
i =1

Para presiones moderadas, se puede aplicar la siguiente ecuación:

⎛ PiS ⎞⎛⎜ ν iVS



K i = γ iL ⎜ ⎟ o ⎟
o ⎞ ( )
⎟ exp ⎡⎢ v iL P − Pi ⎤⎥
S
(71)
⎜ ⎟
⎝ P ⎠⎝ ν iV ⎠ ⎣⎢ RT ⎦⎥
Para el caso general se aplica directamente la ecuación (68). Los modelos de coeficientes de
actividad más conocidos (algunos de los cuales se presentan con más detalle en los apartados
siguientes) se indican en la Tabla 8, con estas ecuaciones se pueden calcular volúmenes,
entalpías y entropías en exceso.

Tabla 8 Ecuaciones empíricas y semi-teóricas para la estimación de coeficientes de


actividad de mezclas líquidas binarias

67
Modelos de predicción de propiedades físico-químicas

3.3. Ecuación de Wilson


La correlación semi-empírica de Wilson,
publicada en 1964, es una extensión de la
ecuación teórica de Flory-Huggins. Las
moléculas no sólo difieren en tamaño, como
ocurre en la ecuación de Flory-Huggins, sino
también en las fuerzas intermoleculares, por
lo que la ecuación de Wilson introduce una
contribución debida a las energías de
interacción entre las moléculas. Supone que la
distribución de las moléculas no es al azar,
sino que se distribuyen en términos
probabilísticos, según la distribución de
energías de Boltzmann, en función de las
energías intermoleculares e introduce el
concepto de composición local (xji), fracción
molar del componente j de la mezcla que
rodea a una molécula central i.
En la Figura 4 se muestra esquemáticamente
la composición local para una disolución
binaria globalmente equimolar. Alrededor de
una molécula central de tipo 1 la fracción
molar local de moléculas de tipo 2 es 5/8. Figura 4. Concepto de composiciones locales
La siguiente expresión representa la probabilidad de encontrar a una molécula de componente
j alrededor de la molécula central i, con respecto a la probabilidad de encontrar a una
molécula de componente i alrededor de la molécula central i.
x ji
=
(
x j exp − λ ji RT ) (72)
x ii x i exp(− λ ii RT )
siendo: xji y xii la composición local del componente i rodeado de moléculas del componente j
o i; λji y λii las energías de interacción entre las moléculas j e i o i e i (λji = λij y λii ≠ 0); R la
constante universal de los gases ideales y T la temperatura de la mezcla.
La fracción volumétrica local, ξi, del componente i en una mezcla multicomponente se define
como el cociente entre el volumen molar que ocupan las moléculas del componente i
alrededor de la molécula i central, y el volumen total que ocupan todas las moléculas que
rodean a la molécula i central:
x ii v i x i v i exp(− λ ii RT ) xi
ξi = = = (73)
( )
C C C
∑ x ji v j ∑ x j v j exp − λ ji RT ∑ x j Λ ji
j=1 j=1 j=1

vi y vj son los volúmenes molares de los componentes i y j; Λji ≠ Λij y Λii = 1, parámetro
característico de dos componentes de la mezcla, cuya dependencia con la temperatura es igual
a:
vi ⎛ λ ji − λ jj ⎞
Λ ji = exp⎜⎜ − ⎟ (74)
vj ⎝ RT ⎟⎠

68
Modelos de predicción de propiedades físico-químicas

Sustituyendo la fracción volumétrica de la energía libre de Gibbs molar en exceso por la


fracción volumétrica local se obtiene la ecuación de Wilson:
gE C ⎛C ⎞
= − ∑ x i ln⎜⎜ ∑ x j Λ ij ⎟⎟ (75)
RT i =1 ⎝ j=1 ⎠
Mediante la relación entre la energía libre de Gibbs molar en exceso y los coeficientes de
actividad, se obtiene la siguiente expresión:

1 ⎛⎜ ∂n i g E ⎞
⎟ ⎛C ⎞ C x Λ
ln γ i = = − ln⎜⎜ ∑ x j Λ ij ⎟⎟ + 1 − ∑ C k ki (76)
RT ⎜⎝ ∂n i ⎟
⎠ T ,P,n j ⎝ j=1 ⎠ k =1
∑ x j Λ kj
j=1

Los parámetros binarios de interacción λij - λii y λij - λjj (o Λij y Λji) se deben determinar
inicialmente a partir de datos experimentales de equilibrio vapor-líquido para mezclas binarias
y posteriormente emplearse en el cálculo de los coeficientes de actividad de cada uno de 1os
componentes de la mezcla multicomponente.

3.4. Ecuación NRTL (Non-Random Two-Liquid)


La ecuación NRTL, introducida por Renon y Prausnitz en 1968, se basa en la teoría quasi-
química de Guggenheim que establece que las moléculas no se distribuyen aleatoriamente en
una disolución, por lo que incorpora un parámetro que indica el efecto de la no-aleatoriedad.
Además, al igual que la correlación de Wilson, emplea el concepto de composición local con
la inclusión del parámetro αji en la exponencial:
x ji (
x j exp − α ji g ji RT )
= (77)
x ii x i exp(− α ji g ii RT )

En la ecuación (77), gji tiene el mismo significado que λji en la ecuación de Wilson, es decir,
la energía de interacción entre las moléculas j e i.
La obtención de la expresión para la energía libre de Gibbs en exceso molar se realiza
mediante la teoría de dos líquidos de Scott, llegando a la siguiente ecuación:
gE ⎛ τ 21G 21 τ12 G 12 ⎞
= x 1 x 2 ⎜⎜ + ⎟⎟ (78)
RT ⎝ x 1 + x 2 G 21 x 2 + x 1G 12 ⎠
g ji − g ii
τ ji = (79)
RT
(
G ji = exp − α ji τ ji ) (80)

Para una mezcla binaria, hay tres parámetros ajustables: (g12-g22), (g21-g11), y α12.
Para mezclas multicomponentes, la ecuación NRTL se expresa como:
C

C
∑ τ ji G ji x j
j=1
gE = ∑ xi C
(81)
i =1
∑ G ki x k
k =1

69
Modelos de predicción de propiedades físico-químicas

Los coeficientes de actividad se obtienen fácilmente a partir de la energía libre de Gibbs:


C
∑ τ ji G ji x j C ⎡ C
τ rj G rj x r ⎤⎥
x G ⎢ ∑
j=1 j ij r =1
ln γ i = C +∑ C ⎢τ ij − C ⎥ (82)
∑ G ki x k
j=1
∑ G kj x k ⎢ ∑ G kj x k ⎥
k =1 k =1 ⎣⎢ k =1 ⎦⎥
Los parámetros de interacción, que se deben determinar inicialmente a partir de datos
experimentales de equilibrio de mezclas binarias, son las energías de interacción
intermoleculares, (gij-gii) y (gij-gjj) (o τij y τji), y el parámetro de no-aleatoriedad, αij.
El parámetro αij, tal y como se indica en la Tabla 9, oscila entre 0.2 y 0.47 y es adimensional.
Suele expresar el doble del inverso del número de coordinación, es decir, el número de
moléculas que están alrededor de la molécula central, por lo que dependerá de la naturaleza
química de los componentes.
La principal ventaja de este método estriba en la buena determinación del equilibrio líquido-
líquido para mezclas binarias. Para el equilibrio V-L de ciertos sistemas, por ejemplo mezclas
de agua y compuestos orgánicos, da mejores resultados que la ecuación de Wilson, aunque en
general sus predicciones son peores. Al igual que la correlación de Wilson, incluye la
influencia de la temperatura en los parámetros τij.
Su dificultad radica en el ajuste de tres parámetros para mezclas binarias, en lugar de los dos
que se emplean tanto en la ecuación de Wilson como en el método UNIQUAC.

Tabla 9 Valores del parámetro de no aleatoriedad de la ecuación NRTL


αij Ámbito de aplicación
0.20 Mezclas de hidrocarburos saturados y especies polares no asociadas (n-heptano-acetona).
Mezclas de compuestos no polares (benceno-n-heptano), excepto fluorocarbonos y parafinas.
Mezclas de especies no polares y polares no asociadas (benceno-acetona). Mezclas de especies
0.30 polares que presentan desviaciones negativas con respecto a la ley de Raoult (acetona-cloroformo) y
desviaciones positivas moderadas (etanol-agua). Mezclas de agua y especies polares no asociadas
(agua-acetona).
Mezclas de hidrocarburos saturados y perfluorocarbonos homólogos (n-hexano-perfluoro-n-
0.40
hexano).
Mezclas de un alcohol u otra especie fuertemente autoasociada con especies no polares (etanol-
0.47 benceno). Mezclas de tetracloruro de carbono con acetonitrilo o nitrometano. Mezclas de agua con
butil-glicol o piridina.

3.5. Ecuación UNIQUAC (Universal Quasi-Chemical)


La correlación UNIQUAC fue introducida por Abrams y Prausnitz en 1975 y tiene una base
mecánica-estadística. Este modelo generaliza un análisis previo de Guggenheim y lo amplía a
mezclas de moléculas que difieren apreciablemente, tanto en la forma como en el tamaño. Al
igual que en las ecuaciones de Wilson y NRTL, se emplean concentraciones locales. Sin
embargo, en vez de fracciones en volumen locales y fracciones molares locales, UNIQUAC
utiliza la fracción de área local, θij, como variable primaria de concentración, que se
determina representando una molécula como un conjunto de segmentos unidos. Cada
molécula está caracterizada por dos parámetros estructurales, que se determinan con relación
a un segmento estándar, que se toma como una esfera equivalente de una unidad monomérica
de una molécula lineal de polimetileno de longitud infinita. Los dos parámetros estructurales

70
Modelos de predicción de propiedades físico-químicas

son el número relativo de segmentos por molécula, r (parámetro de volumen) y la superficie


relativa de la molécula, q (parámetro de superficie).
En el modelo UNIQUAC, la energía libre de Gibbs en exceso consta de dos contribuciones:
• Una debida a las diferencias de tamaño y forma de las moléculas, llamada combinatorial
o configuracional, que para un sistema binario se expresa como:
E
g combinator Φ Φ z⎛ θ θ ⎞
ial
= x 1 ln 1 + x 2 ln 2 + ⎜⎜ q 1 x 1 ln 1 + q 2 x 2 ln 2 ⎟⎟ (83)
RT x1 x2 2 ⎝ Φ1 Φ2 ⎠
x i ri
Φi = (84)
x 1 r1 + x 2 r2
xiqi
θi = (85)
x 1q 1 + x 2 q 2
Φ1 y Φ2 son las fracciones volumétricas de las moléculas 1 y 2; θ1 y θ2, las fracciones
superficiales; r1 y r2, los volúmenes de van der Waals respecto a un estándar; q1 y q2, las
áreas de van der Waals respecto a un estándar y z, el número de coordinación, que suele
oscilar entre 6 y 12.
• Y otra debida a las interacciones energéticas entre las moléculas, llamada residual.
g Eresidual
= −q 1 x 1 ln (θ1 + θ 2 τ 21 ) − q 2 x 2 ln (θ 2 + θ1 τ12 ) (86)
RT
⎡ − (u 21 − u 11 ) ⎤
τ 21 = exp ⎢ ⎥ (87)
⎣ RT ⎦
⎡ − (u 12 − u 22 ) ⎤
τ12 = exp ⎢ ⎥ (88)
⎣ RT ⎦
u11, u22, u12 = u21 son las energías de interacción intermoleculares 1-1, 2-2 y 1-2,
respectivamente.
Mientras que la contribución combinatorial contiene dos variables (Φi, θi) que dependen de la
composición, y se obtiene únicamente a partir de parámetros estructurales (ri, qi) de los
componentes puros, la contribución residual tan sólo depende de una variable (θi), aunque
posee dos parámetros binarios ajustables: u21-u11 y u21-u22 (o τ21 y τ12).
La expresión del coeficiente de actividad para una mezcla multicomponente se obtiene
directamente por diferenciación de la energía libre de Gibbs, resultando la siguiente
expresión:
Φ z θ Φ C
ln γ i = ln γ iC + ln γ iR = ln i + q i ln i + l i − i ∑ x j l j
xi 2 Φi x i j=1
⎛C ⎞ C θ j τ ij (89)
− q i ln⎜⎜ ∑ θ j τ ji ⎟⎟ + q i − q i ∑ C
⎝ j=1 ⎠ j=1
∑ θ k τ kj
k =1

z
li = (ri − q i ) − ri + 1 (90)
2
71
Modelos de predicción de propiedades físico-químicas

Los parámetros estructurales ri y qi se determinan a partir de medidas cristalográficas (ángulos


de enlace y distancias de enlace).
Las ventajas que presenta con respecto a los dos métodos anteriores son:
• Predice el equilibrio líquido-líquido con sólo dos parámetros.
• Sus parámetros poseen una menor dependencia con la temperatura debido a su
mejor base teórica.
• Resulta aplicable a disoluciones que posean moléculas de diferentes tamaños, ya
que incluyen en su ecuación contribuciones estructurales.

Este modelo termodinámico es la base de otro modelo de contribución de grupos,


llamado UNIFAC (UNIQUAC Functional Activity Coefficients), que está ampliamente
extendido y se emplea para la predicción de los coeficientes de actividad en fase líquida
de mezclas binarias para las que no se posee información experimental o ésta es escasa.

3.6. Modelos de contribución de grupos: UNIFAC


Los modelos termodinámicos de contribuciones de grupos más establecidos en la actualidad
son el método ASOG, introducido por Deal y Derr en 1968, y el método UNIFAC de
Fredenslund y colaboradores, en 1975. Ambos modelos predicen los coeficientes de actividad
de la fase líquida de mezclas de no-electrolitos considerando la mezcla líquida como una
disolución de grupos en lugar de una disolución de moléculas. Los grupos son las unidades
estructurales que constituyen una molécula, de tal forma que, si bien el número de moléculas
es infinito, el número de grupos es limitado. El hecho de que estos métodos operen con
grupos presenta la ventaja de que simplemente con una serie reducida de grupos se pueden
predecir los coeficientes de actividad de infinidad de mezclas muy diferentes entre sí.
Así, por ejemplo, en una disolución de tolueno y acetona, las contribuciones de grupo pueden
deberse a 5 grupos CH aromáticos, 1 grupo C aromático y 1 grupo CH3 del tolueno; y 2
grupos CH3 más 1 grupo CO carbonilo de la acetona. Alternativamente, pueden emplearse
grupos más grandes para formar 5 grupos CH aromáticos y un grupo CCH3 del tolueno; y un
grupo CH3 y un grupo CH3CO de la acetona. Cuanto más grandes sean los grupos funcionales
tomados, mayor es la exactitud de la representación molecular, aunque disminuye la ventaja
del método de contribución de grupos, ya que se requiere un mayor número de grupos. En la
práctica se pueden utilizar unos 50 grupos funcionales para representar miles de mezclas
líquidas multicomponentes.
Ambos métodos permiten calcular los coeficientes de actividad mediante dos términos o
contribuciones al igual que el modelo UNIQUAC: una combinatorial, debida a las diferencias
de forma y tamaño de las moléculas, y una residual, debida a las interacciones energéticas
entre los grupos, aunque difieren en algunos aspectos. Sin embargo, la aplicabilidad del
modelo ASOG es mucho menor que la del modelo UNIFAC, debido a la escasez de
parámetros de interacción de grupos que se encuentran publicados. A continuación se describe
de manera breve el modelo UNIFAC.
UNIFAC se basa en el modelo termodinámico UNIQUAC, y en la bibliografía se encuentran
numerosos trabajos en los que se han determinado las contribuciones de un elevado número

72
Modelos de predicción de propiedades físico-químicas

de grupos. El intervalo de aplicabilidad está comprendido entre 300 y 425 K y bajas presiones
de operación.
En este método, los parámetros moleculares de volumen y de área en los términos
combinatoriales se sustituyen por:
ri = ∑ ν (ki ) R k (91)
k

q i = ∑ ν (ki ) Q k (92)
k

ν (ki ) el número de grupos funcionales de tipo k en la molécula i, y Rk y Qk, los parámetros de


volumen y de área, respectivamente, para el grupo funcional de tipo k.
El término residual de la ecuación (89), que está representado por ln γ iR , se sustituye por la
expresión:
(
ln γ iR = ∑ ν (ki ) ln Γk − ln Γk( i ) ) (93)
k
todos los grupos
funcionales de
la mezcla

Γk es el coeficiente de actividad residual del grupo funcional k en la mezcla real, y ln Γk(i ) es la


misma magnitud pero en una mezcla de referencia que solamente contiene moléculas de tipo
i. Se requiere esta última magnitud, ya que γ iR → 1.0, cuando x1 → 1.0. Tanto ln Γk(i ) como
Γk tienen la misma forma que el término residual de la ecuación (89). Por tanto,
⎡ ⎤
⎢ ⎛ ⎞ θ m Tkm ⎥
ln Γk = Q k ⎢1 − ln⎜⎜ ∑ θ m Tmk ⎟⎟ − ∑ ⎥ (94)
⎢⎣ ⎝m ⎠ m ∑ θ n Tnm ⎥
n ⎦
θm es la fracción de área del grupo m, dada por una ecuación análoga a la (85):
XmQm
θm = (95)
∑ XnQn
n

Xm es la fracción molar del grupo m en la disolución:


( j)
∑ vm x j
j
Xm = ( j)
(96)
∑ ∑ vn x j
j n

y Tmk es un parámetro de interacción de grupo dado por una ecuación similar a la (89):
⎛ a ⎞
Tmk = exp⎜ − mk ⎟ (97)
⎝ T ⎠
amk ≠ akm y cuando m = k, entonces amk = 0 y Tmk = 1.0. Para Γk(i ) , también es aplicable la
ecuación (94), y los términos θ corresponden al componente i puro.

73
Modelos de predicción de propiedades físico-químicas

Se dispone de amplias tablas de valores para Rk, Qk, amk, y akm, algunos de los cuales se
indican a modo de ejemplo en la Tabla 10, que van siendo puestas al día a medida que se
obtienen nuevos datos experimentales. Aunque los valores de Rk y Qk son diferentes para cada
grupo funcional, los valores de amk son iguales para todos los subgrupos de un grupo
principal. Por tanto, la cantidad de datos experimentales que se requieren para obtener valores
de amk y akm, y el tamaño del banco de datos para estos parámetros no son tan grandes como
cabría esperar.

Tabla 10. Valores de los parámetros volumétricos (Rk), de superficie (Qk) y de interacción
(amk) para algunos grupos funcionales
Grupos y subgrupos

Grupo Subgrupo k Rk Qk
1 CH2 CH3 1 0.9011 0.848
CH2 2 0.6744 0.540
CH 3 0.4469 0.228
C 4 0.2195 0.000
3 ACH ACH 10 0.5313 0.400
(AC = carbono aromático)
4 ACCH2 ACCH3 12 1.2663 0.968
ACCH2 13 1.0396 0.660
5 OH OH 15 1.0000 1.200
7 H 2O H2O 17 0.9200 1.400
9 CH2CO CH3CO 19 1.6724 1.488
CH2CO 20 1.4457 1.180
13 CH2O CH3O 25 1.1450 1.088
CH2O 26 0.9183 0.780
CH-O 27 0.6908 0.468
15 CNH CH3NH 32 1.4337 1.244
CH2NH 33 1.2070 0.936
CHNH 34 0.9795 0.624

Parámetros de interacción amk


1 3 4 5 7 9 13 15 19
1 CH2 0.00 61.13 76.50 986.50 1318.00 476.40 251.50 255.70 597.00
3 ACH -11.12 0.00 167.00 636.10 903.80 25.77 32.14 122.80 212.50
4 ACCH2 -69.70 -146.80 0.00 803.20 5695.00 -52.10 213.10 -49.29 6096.00
5 OH 156.40 89.60 25.82 0.00 353.50 84.00 28.06 42.70 6.712
7 H 2O 300.00 362.30 377.60 -229.10 0.00 -195.40 540.50 168.00 112.60
9 CH2CO 26.76 140.10 365.80 164.50 472.50 0.00 -103.60 -174.20 481.70
13 CH2O 83.36 52.13 65.69 237.70 -314.70 191.10 0.00 251.50 -18.51
15 CNH 65.33 -22.31 223.00 -150.00 -448.20 394.60 -56.08 0.00 147.10
19 CCN 24.82 -22.97 -138.40 185.40 242.80 -287.50 38.81 -108.50 0.00

74
Modelos de predicción de propiedades físico-químicas

3.7. Determinación de los parámetros de interacción molecular


El equilibrio entre fases se puede predecir conocidos los coeficientes de actividad de los
componentes que integran el sistema y su dependencia con la composición y la temperatura.
Esto último se determina mediante las correlaciones o modelos termodinámicos presentados
en los apartados precedentes, los cuales incluyen unos parámetros ajustables que se deben
conocer inicialmente. Estos parámetros corresponden a interacciones binarias
intermoleculares, y se pueden determinar a partir de mezclas binarias de las formas siguientes:
a. Datos de equilibrio líquido-vapor en el intervalo de composición. Mediante un proceso
iterativo en el que se tienen en cuenta los errores experimentales, de forma que se
minimiza la energía libre de Gibbs del sistema, y los resultados son termodinámicamente
consistentes (verifican la ecuación de Gibbs-Duhem).
b. Datos de azeótropos. La determinación de los parámetros de interacción se realiza
fácilmente a partir de datos de equilibrio del azeótropo, debido a que las composiciones de
ambas fases coinciden.
c. Datos de solubilidad para mezclas parcialmente insolubles. Su cálculo es semejante al
del equilibrio vapor-líquido.
d. Datos de coeficientes de actividad a dilución infinita. El componente para el que se
pretende determinar el coeficiente de actividad se encuentra en una cantidad muy pequeña
con respecto al otro componente. Los modelos termodinámicos poseen expresiones del
coeficiente de actividad a dilución infinita, de forma que, conocido su valor para cada uno
de los componentes, se determina fácilmente el valor de los parámetros binarios de
interacción.
De todos ellos, el más empleado es el de los coeficientes de actividad a dilución infinita, por
su sencillez, rapidez y facilidad de obtención. Además, como su valor normalmente es el más
elevado, hay menor incertidumbre en la interpolación que en la extrapolación de datos.
La determinación experimental de los coeficientes de actividad a dilución infinita se realiza
mediante técnicas cromatográficas y ebullométricas. Tales técnicas son complementarias, ya
que las primeras se emplean cuando los solutos tienen una volatilidad muy alta con respecto al
disolvente (componente de la mezcla en concentración elevada), y las segundas cuando la
volatilidad es similar.

4. BIBLIOGRAFÍA
• Biegler, L.T.; Grossmann; I.E.; Westerberg, A.W., Systematic Methods of Chemical
Process Design, Prentice Hall, New Jersey (1997)
• Gess, M.A.; Danner, R.P.; Nagvekar, M., Thermodynamic Analysis of Vapor-Liquid
Equilibria: Recommended Models and Standard Data Base, DIPPR (1991)
• Henley, E.J.; Seader, J.D., Operaciones de Separación por Etapas de Equilibrio en
Ingeniería Química, Reverté, Barcelona (1988)
• Walas, S.M., Phase Equilibria in Chemical Engineering, Butterworth, Boston (1985)
• Seader, J.D; Henley, E.J., Separation Process Principles, John Wiley & Sons, New
York (1998)
75
I. Termodinámica y modelización rigurosa de
procesos

Implementación de modelos de
propiedades físicas en simuladores
comerciales y criterios de selección
Aurelio B. Vega Granda

Departamento de Ingeniería Química


y Tecnología del Medio Ambiente
Universidad de Oviedo
Implementación de modelos de propiedades físicas en simuladores comerciales y criterios de selección

ÍNDICE

1. INTRODUCCIÓN ......................................................................................................79
2. MÉTODOS DE PROPIEDADES IMPLEMENTADOS EN HYSYS....................86
2.1. Ecuaciones de estado .............................................................................................86
2.2. Modelos de actividad.............................................................................................88
2.3. Métodos semiempíricos .........................................................................................92
2.4. Métodos de presión de vapor.................................................................................93
3. SELECCIÓN DE MÉTODOS DE PROPIEDADES...............................................93

1. INTRODUCCIÓN
A la hora de afrontar cualquier simulación de un proceso químico hay que considerar en
primer lugar qué datos termodinámicos son necesarios para llegar a cabo esa simulación. Con
carácter general, se puede decir que estos datos serán:
• Para resolver los balances de materia se necesitarán valores de la constante de
equilibrio entre fases, K, para columnas, flash, …
• Para los balances de energía se precisarán datos de entalpías, especialmente para el
caso de cambiadores de calor.
• Se necesitarán entropías para compresores y expansores (turbinas).
• Energía libres para el equilibrio químico.
• Volumen molar para el dimensionado de equipos.
• Propiedades de transporte también para el dimensionado de equipos.

También habrá que estimar algunas propiedades, como:


• Propiedades de componentes puros: presión de vapor, calor de vaporización, ..
• Propiedades de mezclas: densidad, viscosidad, …
• Equilibrios entre fases (LV, LL, VLL) para los sistemas multicomponentes.

Para llevar a cabo todas estas tareas los simuladores comerciales disponen de una serie de
información básica, a partir de la cual se calculan todas las propiedades anteriores. Esta
información básica está compuesta por:
• Propiedades de componentes puros: almacenadas como parámetros dependientes de la
temperatura y/o presión, o bien almacenados como valores (propiedades críticas,
puntos de ebullición, etc.).
• Datos de equilibrio entre fases (LV, LL, VLL), generalmente almacenados como
parámetros de interacción.

79
Implementación de modelos de propiedades físicas en simuladores comerciales y criterios de selección

En el caso del simulador HYSYS los datos disponibles se resumen en:


• Base de datos con 1500 componentes puros.
• Base de datos con 16000 ajustes binarios para el equilibrio entre fases.
• Posibilidad de añadir nuevos componentes (pseudocomponentes).

Evidentemente, el elemento vital del proceso de modelización y simulación es la


especificación de las propiedades termofísicas.

Para la estimación de propiedades, existe una información mínima necesaria, que es:
• Si el punto de ebullición , PB < 370 ºC, se necesita como mínimo el PB.
• Si PB > 370 ºC, se precisa el PB y la densidad del líquido.
• Si el PB es desconocido se necesita como mínimo el peso molecular y la densidad

En cualquier caso, ¡cuanta mayor información se suministre mejor¡, siendo


recomendable:
• Estructura molecular
• Peso molecular
• Punto de ebullición

Para comprender mejor la importancia decisiva del modelo de propiedades en cualquier


simulación, a continuación se presentan algunos ejemplos clarificadores.

En las figuras siguientes se muestran los diagramas ternarios para el sistema benceno-
heptano-dimetilformamida, estimados empleando el modelo termodinámico de Margules y
NRTL. Como se puede observar existen claras discrepancias entre ambos, así por ejemplo el
máximo de la curva binodal se encuentra para la estimación de Margules alrededor de 0.5 %
de benceno, mientras que la estimación NRTL lo sitúa alrededor del 0.36. A la vista de estos
dos diagramas, necesarios por ejemplo para el diseño de una separación por extracción L-L,
¿cuál es la estimación correcta?.

80
Implementación de modelos de propiedades físicas en simuladores comerciales y criterios de selección

Otro ejemplo es el sistema de refrigeración siguiente:

En la tabla mostrada los valores en azul corresponden a valores fijados por el usuario, por
tanto corresponden a las especificaciones del problema. Los valores en negro que se
mostrarán en las siguientes tablas corresponden a valores calculados por el programa, en este
caso HYSYS.

Los resultados obtenidos con dos modelos termodinámicos: Peng-Robinson (PR), y NRTL
presentan grandes diferencias. Así para la corriente “Alimento” se pueden observar las
diferencias existentes en cuanto a la fracción de vapor, según las cuáles para el modelo PR se
trata de una corriente en forma de vapor, mientras que para NRTL es una mezcla L-V.

TERMODINAMICA PR NRTL

81
Implementación de modelos de propiedades físicas en simuladores comerciales y criterios de selección

Para la corriente “Producto”, los resultados muestran también serias discrepancias en la


fracción de vapor y en menor medida en la temperatura de la misma.

TERMODINAMICA PR NRTL

Lo mismo ocurre en las corrientes “Ref ent E-102” pero en este caso con grandes diferencias
en las temperaturas.

TERMODINAMICA PR NRTL

Y en la corriente “Salida E-100”, donde las diferencias se centran en fracción de vapor y


flujo molar.

82
Implementación de modelos de propiedades físicas en simuladores comerciales y criterios de selección

TERMODINAMICA PR NRTL

A partir de estos ejemplos, y otros muchos que se podrían poner, se resume que el uso de la
termodinámica, como el de otras muchas cosas, no es tan sencillo.

Para complicar aún más las cosas, a continuación se muestra una simulación para separar por
destilación etilbenceno y estireno, usando tres simuladores distintos, pero empleando todos
ellos el mismo modelo termodinámico (ecuación de estado de Soave-Redlich-Kwong). Como
se puede observar existen serias discrepancias entre los resultados proporcionados por los tres
simuladores.
Modelo:
SRK-EOS
en los tres simuladores

Etilbenceno:
51,0 kmol/h
Estireno:
47,8 kmol/h

Producto de colas (kmol/h)


Simul1 Simul2 Simul3
Etilbenceno 2,90 8,55 5,63
Ref.: Sadeq et al. AIChE Annual Meeting, 1995 Estireno 26,76 21,10 24,03

83
Implementación de modelos de propiedades físicas en simuladores comerciales y criterios de selección

Por otra parte, entre el 50 y el 80 % de los costes de los procesos químicos corresponden a los
procesos de separación los procesos de separación, lo cual es un gran incentivo para estudiar
el equilibrio entre fases, ya que los procesos de separación se encuentran controlados por el
equilibrio entre fases, ver figura siguiente. Entre todos los procesos de separación la
destilación es la tecnología dominante, representando el 95 % de todas las separaciones del
mundo. De todo esto se deduce la gran atención que se ha prestado al equilibrio liquido-vapor
(LV).

Procesos de separación controlados por el


equilibrio
Por adición de energía o de otra sustancia, una mezcla
homogénea se separa en (al menos) dos fases de
diferente composición.
Destilado
Coste de los procesos químicos de
producción
Corriente
Están fuertemente influenciados por los procesos de
lateral
separación (50-80%). Esto es un gran incentivo para F
conocer el equilibrio entre fases del proceso.
Producto
Destilación de colas
Es la tecnología dominante, el 95% de todas las
separaciones en el mundo (más de 40000 columnas en
USA, con una inversión de 8000 M$ y una energía
equivalente a 54 Mton/año de crudo, es decir el 15%
del consumo industrial de energía en USA).

La constante de equilibrio LV se puede determinar, partir de dos formas genéricas:

Forma simétrica Forma asimétrica

φ γ iL f iLo γ iLν iLo


K i = iL Ki = =
φiV φiV P φiV

S ien d o , f la fu gacid ad d e la esp ecie en la m ez cla, f o la fu g acid ad d e la esp e cie p u ra, φ el


coeficien te d e fu g acid ad e n la m ez cla, γ el co eficien te d e activ id ad en la m ezcla, y ν o el
coeficien te d e fu g acid ad d e la esp ecie p u ra. L o s su b ín d ices i, V y L , in dican ,
resp ectiv am en te, co m p o n en te, fase v ap o r y fase líq uid a.

Estas dos formas implican el cálculo de los coeficientes de fugacidad del componente puro
como de la mezcla, y/o coeficiente de actividad, lo que se puede hacer a través de una
ecuación de estado, un modelo de actividad, modelos empíricos, o métodos de presiones de
vapor. Los métodos más utilizados en la práctica son a partir de las ecuaciones o los modelos
de actividad. En la siguiente tabla se comparan estos métodos.

84
Implementación de modelos de propiedades físicas en simuladores comerciales y criterios de selección

Ecuación de Estado (EOS) Modelos de actividad


• Capacidad limitada para representar • Pueden representar líquidos altamente no
líquidos no ideales ideales
• Se necesitan pocos parámetros • Se necesitan muchos parámetros binarios
• Parámetros se extrapolan razonablemente • Parámetros son altamente dependientes
bien con la temperatura de la temperatura
• Consistente en la región crítica • Inconsistente en la región crítica

La otra posible comparación es entre comportamiento ideal y no-ideal, que se muestra a


continuación:

„ ¿Qué significa comportamiento ideal?


„ Ley gases ideales y ley de Raoult

„ ¿Qué sistemas se comportan idealmente?


„ Componentes no polares de tamaño y forma similar

„ ¿Qué controla el grado de no idealidad?


„ Interacción molecular (p.e. Polaridad, forma y tamaño de las moléculas)

„ ¿Cómo se estudia el grado de no idealidad de un sistema?


„
Representación de propiedades (p.e. Diagramas TXY y XY)

Toda la información relativa al cálculo de las propiedades físicas y del flash se encuentran en
HYSYS en lo que se denomina “Fluid Package”, e incluye:
• Los modelos de propiedades (Property Package) que proporcionan predicciones
seguras de las propiedades físicas, termodinámicas y de transporte.
• Componentes
• Parámetros
• Coeficientes binarios
• Reacciones químicas

Además toda la información se organiza en entornos donde se permite acceder e introducir


información en un área determinada, mientras las otras áreas están en espera. Existen dos
tipos de entornos, que se indican a continuación:

85
Implementación de modelos de propiedades físicas en simuladores comerciales y criterios de selección

„ Entorno base
„ Entorno base de simulación. Permite crear, definir, y modificar los Fluid
Package. La información mínima:
„ Al menos 1 Fluid Package
„ Al menos 1 componente
„ Un Fluid Package especificado como Fluid Package por defecto
„ Entorno de caracterización de aceites

„ Entorno de simulación
„ Entorno diagrama de flujo principal
„ -
Entorno de sub-diagrama de flujo de columna

En esta sección vamos a presentar en primer lugar información más detallada sobre la
implementación en HYSYS de cada uno de los modelos de propiedades físicas.
Posteriormente, proporcionaremos la selección de los métodos de cálculo de propiedades,
donde indicaremos para varios procesos típicos en la industria química los métodos
recomendados para la estimación de las propiedades termodinámicas.

2. MÉTODOS DE PROPIEDADES IMPLEMENTADOS EN HYSYS


2.1. Ecuaciones de estado
HYSYS ofrece actualmente la ecuación de estado mejorada de Peng-Robinson (PR), y la de
Soave-Redlich-Kwong (SRK). Además, ofrece varios métodos que son modificaciones de
éstas, tales como Zudkevitch-Joffe (ZJ) y Kabadi-Danner (KD). Lee-Kesler-Plocker (LKP) es
una adaptación de la ecuación para mezclas de Lee-Kesler, que a su vez es una modificación
de la ecuación Benedit-Webb-Rubin (BWR). De éstas, la de Peng-Robinson es la que presenta
un intervalo mayor de aplicación y una mayor variedad de sistemas a los que es aplicable. Las
ecuaciones de estado de Peng-Robinson y Soave-Redlich-Kwong proporcionan directamente
todas las propiedades termodinámicas y de equilibrio requeridas. Aunque las formas de estas
ecuaciones son comunes a otros simuladores comerciales, han sido mejoradas
significativamente por Hyprotech para extender su intervalo de aplicabilidad.

PR y SRK
Los métodos PR y SRK contienen parámetros de interacción binaria mejorados para todos los
pares hidrocarburo-hidrocarburo, así como para la mayoría de sistemas binarios hidrocarburo-
no hidrocarburo.

Para los componentes no presentes en la base de datos de HYSYS o para pseudocomponentes


de la clase hidrocarburo, los parámetros de interacción HC-CH se generan automáticamente
para mejorar las predicciones del equilibrio L-V.

86
Implementación de modelos de propiedades físicas en simuladores comerciales y criterios de selección

La ecuación PR aplica un tratamiento especial en los parámetros de interacción de ciertos


componentes como He, N2, H2, CO2, H2S, H2O,CH3OH, EG y TEG.

Kabadi-Danner (KD)
Este modelo es una modificación de la ecuación original SRK, modificada para mejorar el
equilibrio L-V de los sistemas H2O-hidrocarburo, particularmente en la región diluida. La
modificación está basada en una regla de mezcla asimétrica, donde la interacción en la fase
acuosa (con fuerte presencia de puentes de hidrógeno) se calcula basada tanto en la
interacción entre los hidrocarburos y el agua, como en la perturbación provocada por el
hidrocarburo en la interacción H2O-H2O.

Lee-Kesler-Plöcker (LKP)
Esta ecuación es un método general exacto para las sustancias no polares y para las mezclas.
Plöcker aplicó la ecuación de Lee-Kesler a las mezclas, desarrollando reglas de mezclas para
las propiedades pseudocríticas.

Peng-Robinson Stryjek-Vera (PRSV)


Es una doble modificación de la ecuación de estado PR, que extiende su aplicabilidad a
sistemas moderadamente no ideales. Se ha demostrado que reproduce las curvas de presión de
vapor de componentes puros y mezclas de forma más exacta que el método de PR,
especialmente a bajas presiones de vapor.

Se ha extendido satisfactoriamente para manejar sistemas no ideales, dando resultados tan


buenos como los obtenidos usando funciones de energía de Gibbs en exceso, tales como
Wilson, NRTL o UNIQUAC.

Una de las modificaciones de la ecuación de PR introducidas por Stryjek-Vera es la expansión


del término α que se transforma en una función del factor acéntrico y de un parámetro
empírico κ usado para ajustar las presiones de vapor de los componentes puros. Para los
pseudocomponentes generados para representar las fracciones de petróleo, HYSYS regresiona
automáticamente este término para cada pseudocomponente frente a las curvas de presión de
vapor de Lee-Kesler. La segunda modificación consiste en un nuevo conjunto de reglas de
mezcla. De las dos reglas de mezcla propuestas en el artículo original, HYSYS solamente ha
incorporado la expresión de Margules para el término cruzado.

Aunque solamente se han ajustado en HYSYS un número limitado de pares binarios, la


experiencia aunque limitada sugiere que PRSV se puede emplear como modelo para sistemas
moderadamente no ideales, tales como los sistemas agua-alcohol, y algunos sistemas
hidrocarburo-alcohol. También se puede emplear para sistemas de hidrocarburos con buena
exactitud.

87
Implementación de modelos de propiedades físicas en simuladores comerciales y criterios de selección

Opciones de aguas ácidas


La opción de aguas ácidas está disponible para las ecuaciones de estado PR y SRK. La opción
Sour PR combina la ecuación de estado PR con el modelo API Sour de Wilson para el manejo
de sistemas de aguas ácidas, mientras que el Sour SRK utiliza la ecuación SRK con el modelo
de Wilson.
Las opciones Sour emplean la ecuación de estado correspondiente para calcular las
fugacidades de las fases liquida y vapor de hidrocarburos, así como la entalpía para las tres
fases. Los valores de la constante de equilibrio para la fase acuosa se calcula con el método
API Sour de Wilson que toma en consideración la ionización en la fase acuosa del H2S, CO2 y
NH3. El modelo original es aplicable para temperaturas entre 20 ºC y 140 ºC, y hasta
presiones de 50 psi. El empleo de las ecuaciones de estado PR o SRK para corregir la no
idealidad de la fase vapor extiende su intervalo de aplicación, pero debido a la falta de datos
experimentales, no se puede fijar un intervalo exacto. El intervalo de presión aceptable para el
modelo empleado en HYSYS depende de la concentración de gases ácidos y agua, pero
funciona bien para presiones parciales de agua menores de 100 psi.

Esta opción se puede emplear en desorbedores de aguas ácidas, procesos de hidrotratamiento,


columnas de crudo, o cualquier proceso que contenga hidrocarburos, gases ácidos y agua.

Cálculo de la entalpía con modelos de ecuaciones de estado


Con cualquiera de los modelos de ecuaciones de estado, excepto LKP se puede especificar si
la entalpía se calcula mediante la ecuación de estado correspondiente o bien se hace a través
del método de Lee-Kesler.

La opción de cálculo de entalpía mediante la ecuación de Lee-Kesler, resulta en um modelo


combinado en el que los valores del equilibrio L-V se hacen mediante la ecuación de estado
correspondiente, mientras que los cálculos de entalpías y entropías se hacen mediante la
ecuación de Lee-Kesler.

Las entalpías calculadas mediante la ecuación de Lee-Kesler pueden ser ligeramente más
exactas para los hidrocarburos pesados, pero requieren más recursos computacionales debido
a que se tiene que emplear un método separado.

2.2. Modelos de actividad


Aunque las ecuaciones de estado han demostrado ser muy fiables en la predicción de las
propiedades de los sistemas constituidos por hidrocarburos en un amplio intervalo de
condiciones de operación, su aplicación ha quedado limitada a los componentes no polares o
ligeramente polares. Los sistemas químicos polares o no ideales tradicionalmente se han
tratado con modelos duales. En estos modelos se emplea una ecuación de estado para predecir
los coeficientes de fugacidad de la fase vapor, y un modelo de coeficientes de actividad para
la fase líquida. Aunque se ha hecho un esfuerzo considerable para extender las ecuaciones de
estado a este tipo de sistemas (por ejemplo, PRSV), la predicción de las propiedades en
sistemas químicos está dominada principalmente por los modelos de actividad.

Los modelos de actividad son de naturaleza mucho más empírica que los modelos de
ecuaciones de estado. Por ejemplo, no se pueden usar de una forma tan fiable como las
88
Implementación de modelos de propiedades físicas en simuladores comerciales y criterios de selección

ecuaciones de estado para aplicaciones generalizadas o para extrapolar fuera de las


condiciones ensayadas.

En la siguiente Tabla se resume los modelos recomendados para diferentes aplicaciones.

La no idealidad de la fase vapor se puede tener en cuenta para cada modelo de actividad
seleccionando las ecuaciones de estado de Redlich-Kwong, PR, o SRK como modelo para la
fase vapor. Cuando se usa alguna de estas ecuaciones de estado para la fase vapor, siempre se
corrige la fase líquida con el factor de Poynting. Si se produce dimerización en la fase vapor,
se debería emplear la ecuación de Virial como ecuación de estado.

Hay que tener en cuenta, que todos los parámetros binarios de interacción en la base de datos
de HYSYS están obtenidos usando el modelo de gas ideal para la fase vapor, por lo que
debería emplearse este modelo.

Observaciones generales
Estos modelos duales no se pueden emplear con el mismo grado de flexibilidad y fiabilidad
con que las ecuaciones de estado se pueden emplear en sistemas de hidrocarburos. Para
asegurar un buen nivel de fiabilidad, se debe tener en cuenta algunas observaciones:

• Comprobar que el modelo seleccionado es aplicable al sistema considerado, y comprobar


que tal ajusta las presiones de vapor de los componentes puros. Aunque las presiones de
vapor de los componentes puros normalmente ajustan de manera aceptable, los parámetros
se han ajustado en un intervalo amplio de temperaturas. Se puede mejorar la exactitud
ajustando los parámetros en el intervalo de temperatura deseado.
• La generación automática de parámetros de interacción mediante UNIFAC es una
herramienta muy útil y disponible para todos los modelos de actividad. Sin embargo, se
debe usar con precaución. Los valores estándar ajustados en HYSYS producen resultados
mucho mejores en los sistemas binarios que los parámetros generados por UNIFAC.
• Siempre que sea posible se deben usar parámetros de interacción obtenidos por regresión
de datos experimentales. Los parámetros de interacción en HYSYS se han obtenido

89
Implementación de modelos de propiedades físicas en simuladores comerciales y criterios de selección

ajustando datos experimentales, sin embargo, es posible mejorar los resultados ajustando
los parámetros con datos experimentales en el intervalo de operación esperado. Dado que
los datos de parámetros de interacción presentes en HYSYS se han obtenido a partir de
datos a presión atmosférica, se debe tener precaución al extrapolar a presiones más altas o
bajas.
• Hay que comprobar la exactitud de las predicciones (tanto en cuanto a temperatura como
composición) en el caso de sistemas con azeótropos.
• Si se sospecha la presencia de tres fases, se podrían requerir ajustes adicionales para
reproducir de forma fiable las condiciones de equilibrio LLV.

2.2.1. Modelos de actividad disponibles en HYSYS

Margules
Las ecuación de Margules fue la primera representación desarrollada para la energía en
exceso de Gibbs, y no tiene ninguna base teórica, aunque es útil para estimaciones rápidas y
para interpolación de datos. HYSYS dispone de la ecuación de Margules extendida a sistemas
multicomponentes con hasta 4 parámetros ajustables por par binario (dos independientes de la
temperatura, y otros dependientes).

Van Laar
La ecuación de Van Laar fue la primera representación de la energía en exceso de Gibbs con
significado físico. La ecuación implementada en HYSYS es una versión modificada por Null,
que es bastante útil en muchos sistemas, particularmente para el equilibrio de distribución L-
L. Se puede usar para sistemas con desviaciones positivas y negativas de la ley de Raoult, sin
embargo, no permite predecir máximos o mínimos en el coeficiente de actividad. Por tanto, no
va bien en sistemas con hidrocarburos halogenados y alcoholes. Tiene tendencia predecir dos
fases líquidas, cuando en realidad no existen.

Wilson
La experiencia demuestra que la ecuación de Wilson se puede emplear para extrapolar con
razonable fiabilidad a otras condiciones de operación empleando los mismos parámetros de
interacción. También representa satisfactoriamente casi todos las disoluciones liquidas no
ideales, excepto electrolitos y disoluciones con miscibilidad limitada. Por tanto, no se puede
emplear en problemas que involucren equilibrio L-L. Predice bastante bien los equilibrios
ternarios usando parámetros ajustados a partir de datos binarios.
La ecuación implementada en HYSYS contiene de 2 a 4 parámetros por par binario. Hay que
tener en cuenta que aún poniendo los 4 parámetros a cero no se reduce el par binario a una
disolución ideal, ya que mantiene un pequeño efecto debido a la diferencias de tamaño de las
moléculas.

90
Implementación de modelos de propiedades físicas en simuladores comerciales y criterios de selección

NRTL
Esta ecuación es una extensión de la ecuación de Wilson, que es capaz de representar los
equilibrios L-V, L-L y L-L-V. Como la ecuación de Wilson es termodinámicamente
consistente y se puede aplicar a sistemas ternarios o de orden superior usando parámetros
ajustados a partir de datos de equilibrio binarios. Contiene 5 parámetros por cada par binario
(independientes y dependientes de la temperatura). Debido a su estructura matemática puede
producir intervalos falsos de miscibilidad.

Extended and General NRTL


Son variaciones del modelo NRTL, que emplean más parámetros binarios de interacción. Se
aplican a sistemas:
• Con un amplio intervalo de puntos de ebullición entre sus componentes.
• Cuando se necesite la solución simultánea de los equilibrios L-V y L-L, y exista entre los
componentes un amplio intervalo de puntos de ebullición o de concentración.

UNIQUAC
Es capaz de representar los equilibrios L-V, L-L y L-L-V con exactitud comparable a la
ecuación NRTL, pero sin necesidad del parámetro de aleatoriedad. Su principal ventaja es que
se puede obtener una buena representación de los equilibrios L-V y L-L para una amplia
variedad de mezclas de no electrolitos usando sólo dos parámetros por par binario. Parámetros
que presentan muy poca dependencia con la temperatura, lo que la hace más válida para
extrapolaciones.

Chien-Null
En realidad no se trata de un nuevo modelo, sino de un marco para aplicar los modelos de
actividad existentes de un forma binario por binario. De esta forma, el modelo de Chien-Null
permite seleccionar para cada par binario el modelo de actividad que mejor se ajuste,
independientemente de los empleados en el resto de pares binarios.

Una precaución a tener con los modelos de Wilson, NRTL y UNIQUAC son las dimensiones
de los parámetros de interacción (cal/mol-g para el independiente de la temperatura, y
cal/mol-g K para el dependiente de la temperatura) ya que en la bibliografía pueden tener
dimensiones diferentes al tener integrada la constante universal de los gases R (por ejemplo,
DECHEMA, Chemistry Data Series).

Ley de Henry
La ley de Henry no se puede seleccionar explícitamente como un método, aunque HYSYS la
emplea cuando se selecciona un modelo de actividad y entre los componentes se encuentra un
componente no condensable. HYSYS considera no condensables los siguientes componentes:
metano, etano, etileno, acetileno, hidrógeno, helio, argón, nitrógeno, oxígeno, óxido nítrico,
sulfuro de hidrógeno, dióxido de carbono, y monóxido de carbono.

91
Implementación de modelos de propiedades físicas en simuladores comerciales y criterios de selección

La ecuación extendida de Henry en HYSYS se usa para modelizar las interacciones


soluto/disolvente en la región diluida.

La ecuación tiene la siguiente forma:


B
ln H ij = A + + C ln T + D T
T
donde:
i = soluto o componente no condensable
j = disolvente o componente condensable
Hij = coeficiente de Henry entre i y j en kPa
T = temperatura absoluta
A = coeficiente introducido en la matriz de parámetros como aij
B = coeficiente introducido en la matriz de parámetros como aji
C = coeficiente introducido en la matriz de parámetros como bij
D = coeficiente introducido en la matriz de parámetros como bji

Un ejemplo del uso de los coeficientes de la ley de Henry se muestra a continuación:

Si HYSYS no contiene los coeficientes necesarios y no están disponibles, los estimará. Para
ello marcamos el par binario presionado el ratón sobre él, y a continuación se presiona sobre
el botón “Individual Pair”. Los parámetros de obtienen ajustando las fugacidades calculadas
usando las correlaciones de Chao-Seader y Prausnitz-Shair para la fugacidad en el estado
estándar y disolución regular.

2.3. Métodos semiempíricos


Los métodos de Chao-Seader (CS) y Grayson-Streed (GS) son métodos empíricos antiguos.
La correlación GS es una extensión del método CS con énfasis especial en el hidrógeno.
HYSYS solo obtienen los datos de equilibrio a partir de estos métodos, mientras que las
entalpías y entropías se obtienen, tanto para la fase vapor como la fase líquida mediante el
método de Lee-Kesler.
92
Implementación de modelos de propiedades físicas en simuladores comerciales y criterios de selección

La correlación GS se recomienda para simular sistemas de hidrocarburos pesados con alto


contenido en hidrógeno, tales como unidades de hidrotratamiento.

La siguiente tabla muestra los intervalos aproximados de aplicabilidad:


Método Temperatura (ºC) Presión (kPa)
CS 18 a 260 < 10 000
GS 18 a 425 < 20 000
Condiciones de aplicabilidad:
Para todos los hidrocarburos excepto CH4 0.5 < Tri < 1.3
Prmezcla < 0.8
Si están presentes CH4 o H2 Tr < 0.93
Fracción molar CH4 < 0.3
Fracción molar de gases
disueltos < 0.2

Cuando se predicen valores de K para:


Fracción molar de
Mezclas de parafinas u olefinas
aromáticos en la fase
líquida < 0.5
Mezclas de aromáticos Fracción molar de
aromáticos en la fase
líquida > 0.5

2.4. Métodos de presión de vapor


Se pueden emplear para mezclas ideales a bajas presiones, tales como sistemas de
hidrocarburos, cetonas o alcoholes donde las mezclas se comporten aproximadamente como
ideales.

Para el cálculo de entalpías y entropías se emplea el método de Lee-Kesler, excepto para el


caso del agua que se trata separadamente mediante las tablas de vapor. En todos los cálculos
en las tres fases se supone que la fase acuosa es agua pura, y que la solubilidad del agua en la
fase hidrocarburo se puede describir usando la ecuación de solubilidad del queroseno del API
Data Book.

Los métodos disponibles son: Modificado de Antoine, Braun K10, y EssoK.

3. SELECCIÓN DE MÉTODOS DE PROPIEDADES

En la siguiente tabla se muestran algunos sistemas típicos y las correlaciones recomendadas.

Para aceites, gases, y aplicaciones petroquímicas se recomienda la ecuación de estado de


Peng-Robinson (PR), ya que Hyprotech ha mejorado esta ecuación para ser exacta para una
amplia variedad de sistemas y en un amplio intervalo de condiciones. Resuelve rigurosamente
93
Implementación de modelos de propiedades físicas en simuladores comerciales y criterios de selección

sistemas de una, dos o tres fases con un alto grado de eficacia y fiabilidad, y es aplicable en
un amplio intervalo de condiciones de presión (< 100 MPa) y temperatura (> -456 ºC). La
misma ecuación predice satisfactoriamente la distribución de componentes tales como aceites
pesados, disoluciones acuosas de glicoles y etanol, así como sistemas con gases ácidos o
aguas ácidas, aunque existen modelos específicos para las aguas ácidas (Sour PR y Sour
SRK).

Aunque la ecuación de Soave-Redlich-Kwong (SRK) proporciona resultados comparables en


muchos casos a la ecuación PR, se ha constatado que su intervalo de aplicación es
significativamente más limitado, y nos es tan fiable para sistemas no ideales. Por ejemplo,
(temperaturas > -225 ºC, y presiones < 35 MPa) y no se debe emplear para sistemas con
etanol y glicoles.

Como una alternativa, la ecuación de estado de Peng-Robinson-Stryjek-Vera (PRSV) puede


manejar los mismos sistemas que la ecuación PR con exactitud equivalente o mejor, y además
es más adecuada para el tratamiento de sistemas moderadamente no ideales, donde rivaliza en
exactitud con los métodos tradicionales de coeficientes de actividad. Las únicas desventajas
son el aumento del tiempo de cálculo, y la necesidad de parámetros adicionales de
interacción.

Las ecuaciones de estado PR y PRSV realizan cálculos rigurosos de flash en tres fases para
sistemas acuosos que contienen etanol, o glicoles, así como sistemas que contengan en la
segunda fase otros hidrocarburos o no hidrocarburos. Para SRK el único componente que
inicia una fase acuosa es el agua. Los modelos de Chao-Seader (CS) y Grayson-Streed (GS)

94
Implementación de modelos de propiedades físicas en simuladores comerciales y criterios de selección

también se pueden emplear en cálculos de flash en tres fases pero están restringidos a usar
agua pura en la segunda fase líquida.

La ecuación PR también se puede emplear para sistema con crudo petrolífero, que
tradicionalmente han sido tratados con modelos termodinámicos duales (coeficiente de
actividad para la fase líquida, y ecuación de estado o comportamiento de gas ideal para la fase
vapor). Las mejoras introducidas en las ecuaciones PR y SRK permite a estos métodos
representar correctamente las condiciones de vacío y los componentes pesados (principal
problema de los métodos de ecuaciones de estado tradicionales), así como manejar los ligeros
y sistemas de alta presión.

Los modelos de actividad, que manejan sistemas altamente no ideales, son de naturaleza
mucho más empírica. Los sistemas polares o no ideales se han tratado tradicionalmente con
modelos duales, en los que una ecuación de estado se usa para predecir los coeficientes de
fugacidad en la fase vapor, y el modelo de coeficientes de actividad se usa en la fase líquida.
Dado que los parámetros del modelo de coeficientes de actividad se determinan a partir de
datos experimentales en un intervalo determinado, estos métodos no se pueden usar de una
manera fiable para una aplicación generalizada.

Aunque el campo de aplicación de los métodos CS y GS es restringido, es recomendable su


utilización en algunos problemas que contengan principalmente agua en fase líquida o vapor,
debido a que incluyen correlaciones especiales para representar de forma fidedigna las tablas
de vapor. La correlación de Chao-Seader (CS) se puede emplear para mezclas de
hidrocarburos ligeros, mientras que la de Grayson-Streed (GS) se recomienda para sistemas
con alta concentración de hidrógeno, debido al tratamiento especial dado al hidrógeno en el
desarrollo de este modelo. Esta correlación puede ser ligeramente más exacta en la simulación
de torres de vacío.

Los modelos K de presión de vapor, Antoine, Braun K10 y EssoK se han diseñado para
manejar los sistemas de los hidrocarburos más pesados a bajas presiones. Estas ecuaciones se
han aplicado tradicionalmente al fraccionamiento de los hidrocarburos más pesados, por lo
que proporcionan un buen medio para la comparación con los métodos más rigurosos. Sin
embargo, no se deben emplear para la predicción del equilibrio L-V en sistemas que operen a
altas presiones o que contengan cantidades significativas de hidrocarburos ligeros. En la Tabla
siguiente se presentan los métodos de propiedades empleados en HYSYS junto con los
métodos disponibles para el cálculo del equilibrio L-V, y de entalpía/entropía.

95
Implementación de modelos de propiedades físicas en simuladores comerciales y criterios de selección

96
I. Termodinámica y modelización rigurosa de
procesos

Modelos rigurosos de
separaciones de equilibrio
Fernando V. Díez Sanz

Departamento de Ingeniería Química


y Tecnología del Medio Ambiente
Universidad de Oviedo
Modelos rigurosos de separaciones de equilibrio

ÍNDICE

1. INTRODUCCIÓN ............................................................................................................99
2. CÁLCULOS FLASH........................................................................................................99
2.1. Estrategias para cálculos flash..................................................................................101
2.2. Secuencia TP para cálculos flash..............................................................................102
2.3. Método inside-out para cálculos flash......................................................................102
3. PROCESOS POR ETAPAS ...........................................................................................103
4. BIBLIOGRAFÍA ............................................................................................................106

1. INTRODUCCIÓN

En este tema se estudiarán los modelos rigurosos de etapas de equilibrio, adecuados para su
implementación en programas de ordenados dedicados a la simulación y diseño de procesos.
Los modelos que se estudiarán están basados exclusivamente en las relaciones de equilibrio
entre fases y en los balances de materia y energía. Esta aproximación simplifica mucho los
cálculos, ya que sólo es necesario tener en cuenta las propiedades termodinámicas, sin que sea
necesario considerar las propiedades de transporte. Además, los balances de materia y energía
se pueden realizar sin conocer la capacidad y geometría de los equipos. Por otra parte, los
modelos que se estudiarán están limitados a estado estacionario, sin que se consideren
operaciones discontinuas, ni comportamiento dinámico de operaciones estacionarias.
Se estudiarán dos tipos de cálculos: cálculos flash, y cálculos para procesos por etapas en
contracorriente. Aunque estos cálculos se desarrollarán referidos a operaciones de destilación,
pueden aplicarse también a otras operaciones unitarias muy frecuentes en la industria química,
como absorción y extracción con disolventes.

2. CÁLCULOS FLASH

Estos cálculos son al mismo tiempo los cálculos más básicos y los que se realizan más
frecuentemente en los programas de simulación. La destilación flash, evaporación rápida o
destilación en equilibrio, es una operación en una etapa, en la que una mezcla líquida se
evapora parcialmente, de modo que resultan una fase líquida y una fase vapor en equilibrio,
que se separan y extraen del equipo. De forma más general, un cálculo flash consiste en
determinar el estado de un sistema después de una transformación física o química, por
ejemplo la adición o retirada de calor, o cambios en la presión o composición del sistema.
Consideremos el sistema representado en la Fig. 1. Asumiremos que la alimentación está
completamente definida, de modo que se conoce su caudal, composición y entalpía. Si la
alimentación contiene NC componentes, podremos escribir las siguientes ecuaciones:

99
Modelos rigurosos de separaciones de equilibrio

Fig. 1. Esquema de una unidad flash (Biegler y cols., 1977)

Balances de materia:

fi = vi + Li i = 1,……., NC [1]

Donde fi, vi y Li son los caudales molares del componente i en la alimentación, corriente
vapor y corriente líquida, respectivamente.

Relaciones de equilibrio:

γi fi0 xi = Φi P yi i = 1,……., NC [2]

Donde xi e yi son las fracciones molares en el líquido y vapor, respectivamente, fi0 es


la fugacidad del componente puro, γi es el coeficiente de actividad, Φi el coeficiente de
fugacidad, todas estas variables referidas al componente i, y P la presión total del sistema.

Balance de entalpía:

F Hf + Q = V Hv + L HL [3]

Donde F, V y L son los flujos molares de alimentación, vapor y líquido,


respectivamente, Hf, Hv y HL las respectivas entalpías molares, y Q el calor añadido o retirado
del sistema.

100
Modelos rigurosos de separaciones de equilibrio

Disponemos, entonces, de un total de (2*NC + 1) ecuaciones. Las variables del sistema son
las composiciones del líquido y del vapor, la P y T de las corrientes de salida y Q, en total
(2 * NC + 3). Hay, por tanto, dos grados de libertad para especificar en este problema.
Este modelo puede modificarse, de modo que sea más fácil de utilizar para los cálculos:

Balances de materia:

z i F = V y i + L xi i = 1,……., NC [4]

Donde zi, yi y xi son las fracciones molares del componente i en la alimentación, vapor
y líquido, respectivamente.

Balance de entalpía:

F Hf + Q = V Hv + L HL [5]

Expresiones de equilibrio:

yi = Ki xi i = 1,……., NC [6]

Donde Ki = γi fi0 / Φi P i = 1,……., NC [7]

De esta forma tenemos (3* NC + 5) variables (P, T, L, V, Q, y las fracciones molares en


líquido y vapor, y Ki para cada componente), y (3 * NC + 1) ecuaciones. Las dos ecuaciones
adicionales más útiles para describir el sistema son:

F = L + V (balance total de materia) [8]

Σ yi – Σ xi = 0 [9]

2.1. Estrategias para cálculos flash


El modelo flash puede considerarse entonces formado por las ecuaciones 4 a 9, conservando
el sistema 2 grados de libertad. Ciertamente, pueden darse muchas posibilidades respecto de
las variables fijadas y las que se obtienen resolviendo el sistema. Para hacer frente a la gran
variedad de problemas que pueden plantearse, se han desarrollado muchos sistemas de
cálculo. De estas alternativas posibles, es muy común que los grados de libertad se escojan
entre las variables V/F, Q, P y T.
101
Modelos rigurosos de separaciones de equilibrio

2.2. Secuencia TP para cálculos flash


El caso más sencillo se presenta cuando los grados de libertad escogidos son P y T, ya que no
requiere iteración para el balance de energía. La secuencia de cálculo sería la siguiente:

1. Fijados zi, especificar T y P.


2. Suponer un valor de V/F
3. Calcular los valores de Ki
4. Calcular xi e yi
5. Calcular (Σ yi – Σ xi); si es igual a 0, o a un valor dentro de la tolerancia aceptada, el
problema está resuelto. En otro caso, continuar.
6. Proponer otro valor de V/F y continuar en 3.

Si dada la naturaleza del sistema las relaciones de equilibrio dependen de la concentración de


las fases, es necesaria una estimación previa de xi e yi en el punto 1, que ha de ser
comprobada después.
Las especificaciones T y P son comunes para mezclas en la que todos los componentes tienen
puntos de ebullición próximos, como las que se encuentran en destilación, para las que V/F
varía entre 0 y 1 en un intervalo estrecho de temperatura. Cuando los componentes de la
mezcla tienen puntos de ebullición muy distintos, como en los sistemas de absorción,
pequeños cambios en V/F pueden provocar grandes cambios en T, y se suelen utilizar la
especificaciones V/F, T o V/F, P.
Cuando se especifica el calor intercambiado Q, es necesario resolver el balance de energía en
el algoritmo de solución. Esto se puede hacer, por ejemplo, suponiendo una temperatura y
resolviendo para esta temperatura el problema T, P. Una vez resuelto este problema, se
resuelve el balance de energía y se comprueba si la temperatura supuesta es correcta,
reiterando el proceso las veces necesarias.

2.3. Método inside-out para cálculos flash


Los métodos indicados anteriormente presentan dos inconvenientes principales. En primer
lugar, son adecuados bien para mezclas con intervalos de ebullición pequeños, o bien para
mezclas con intervalos de puntos de ebullición amplios, pero no tienen aplicabilidad general.
Por otra parte, necesitan evaluar frecuentemente funciones termodinámicas no ideales,
especialmente cuando es necesario incorporar el balance de energía.
Para hacer frente a estos problemas, Boston y Britt desarrollaron el método “inside-out” o
dentro-fuera. En este método se utilizan dos bucles de cálculo. En el bucle externo se utilizan
ecuaciones aproximadas para calcular valores de las constantes de equilibrio y las entalpías.
Estos valores se utilizan para resolver las ecuaciones del proceso flash en un bucle interno. La
solución del bucle interno se utiliza para revisar los valores de las propiedades
termodinámicas del bucle externo, terminando el proceso cuando las propiedades
termodinámicas aproximadas coinciden con el grado de exactitud requerido con las obtenidas
por los métodos rigurosos.

102
Modelos rigurosos de separaciones de equilibrio

Por ejemplo, para resolver un problema con especificaciones P, Q, se pueden utilizar las
siguientes ecuaciones para las propiedades termodinámicas:

Ki = αi Kb [10]

Ln (Kb) = A + B (1/T – 1/T*) [11]

H’v = C + D (T - T*) [12]

H’L = E + F (T - T*) [13]

donde H’v y H’L son las entalpías en base másica referidas a las temperatura T*, Kb es un
valor medio para la mezcla, y αi es la volatilidad relativa. Los valores de A, B, C, D, E, F y αi
se ajustan con los resultados obtenidos suponiendo sistemas no ideales. Para la iteración en el
bucle interno se puede utilizar la variable:

R = Kb / (Kb + L/V) [14]

que es adecuada tanto para sistemas con puntos de ebullición próximos como dispares.
La secuencia de cálculo sería la siguiente:
1. Iniciar valores de A, B, C, D, E, F y αi
2. Suponer R
3. Resolver el sistema de los bances de materia y suma
4. Resolver el balance de entalpía
5. Si el error en el balance de entalpía es mayor que el admitido, volver a 2. En caso
contrario, ir a 6.
6. Con los resultados obtenidos, recalcular los valores de A, B, C, D, E, F y αi que
ajusten a las propiedades termodinámicas del sistema, y volver a 2, hasta que el
sistema converja.

3. PROCESOS POR ETAPAS

Una columna de destilación, ejemplo típico de un proceso de separación de etapas de


equilibrio, se puede modelizar como una cascada de etapas de equilibrio flash
interconectadas. Los modelos se basan en la consideración de que se alcanza el equilibrio en
103
Modelos rigurosos de separaciones de equilibrio

cada plato, y en los balances de materia y energía entre platos. La Fig. 2 muestra un esquema
de una columna de destilación típica, formada por NT platos, numerados desde la parte
superior a la inferior y denotados por el subíndice j. En el sistema hay presentes NC
componentes, denotados por el subíndice i. Cada plato contiene unas determinadas cantidades
de líquido y vapor, en equilibrio, con composiciones xij e yij, respectivamente. De cada plato
sale una corriente de vapor Vj hacia el plato superior, y una corriente líquida Lj hacia el plato
inferior. Cada plato puede recibir una alimentación (líquido, vapor, o ambos) Fj, de
composición zij, y de él pueden retirarse corrientes de producto líquido PLj o vapor, PVj, así
como retirar o añadir una cantidad de energía Qj. Dada la composición, presión y temperatura
de cada corriente, se puede determinar su entalpía con los modelos termodinámicos
adecuados.

Fig. 2. Esquema de una columna de destilación (Biegler y cols., 1977)

Las ecuaciones resultantes del modelo son las siguientes:

Balances de materia:

Fj zij + Lj-1 xi,j-1 + Vj+1 yi,j+1 –(PLj + Lj) xij – (Vj + PVj) yij = 0 [15]
i = 1, …….. NC j = 1, …….. NT

104
Modelos rigurosos de separaciones de equilibrio

Relaciones de equilibrio:

yij = Kij xij [16]


i = 1, …….. NC j = 1, …….. NT

Ecuaciones de suma:

Σi xij = 1 Σi yij = 1 [17]


j = 1, …….. NT

Balances de energía:

Fj HFj + Lj-1 HL,j-1 + Vj+1 Hv,j+1 – (PLj + Lj) Hij – (Vj + PVj) Hvj + Qj = 0
j = 1, …….. NT [18]

Este conjunto de ecuaciones se denomina ecuaciones de materia, equilibrio, suma y calor, en


inglés Mass, Equilibrium, Summation and Heat (MESH). Para el condensador y el calderín
estas ecuaciones se simplifican, al ser menor el número de corrientes que intervienen. El
sistema combinado consiste en [(NT + 2)(2 * NC + 3) + 2] ecuaciones, y
[(NT + 2)(2 * NC + 5) + 3] variables. Si se especifican el número de platos, y las
localizaciones, caudal, composición y entalpía de las alimentaciones, quedan (NT + 1) grados
de libertad. Una especificación típica para este problema sería la presión en cada plato, y la
relación de reflujo.
La resolución del problema requiere la resolución del sistema de ecuaciones MESH, para lo
que se han propuesto decenas de sistemas. Uno de los sistemas más utilizados consiste en la
aplicación del método de Newton-Raphson al conjunto de las ecuaciones MESH. También se
aplican métodos inside-out, similares a los aplicados a separaciones flash, en los que en un
primer paso se consideran valores de K y entalpías independientes de las concentraciones, a
continuación se resuelven las ecuaciones MESH simplificadas resultantes, se comprueba la
exactitud de la predicción de las variables termodinámicas, y se reitera el proceso hasta que se
obtiene una solución satisfactoria.

105
Modelos rigurosos de separaciones de equilibrio

4. BIBLIOGRAFÍA

• L. B. Biegler, I. E. Grossmann y A. W. Westerberg, “Systematic Methods of Chemical


Process Design”, Prentice Hall, Upper Saddle River (N. J., EE.UU.), 1977.
• R. H. Perry y D. W. Green, “Manual del Ingeniero Químico”, 7ª Ed., McGraw Hill,
Madrid, 2001.
• W.L McCabe, J.C. Smith, “Operaciones básicas de Ingeniería Química”, Ed. Reverté,
Barcelona (1975).

106
I. Termodinámica y modelización rigurosa de
procesos

Modelos rigurosos de
operaciones unitarias
Aurelio B. Vega Granda

Departamento de Ingeniería Química


y Tecnología del Medio Ambiente
Universidad de Oviedo
Modelos rigurosos de operaciones unitarias

ÍNDICE

1. INTRODUCCIÓN ....................................................................................................109
2. INTERCAMBIADOR DE CALOR (HEAT EXCHANGER) .............................. 110
3. SEPARADOR/SEPARADOR DE 3 FASES/TANQUE ......................................... 111
4. REACTORES QUÍMICOS ..................................................................................... 112
4.1. Reacciones en HYSYS ........................................................................................ 113
4.2. Reactor de conversión ......................................................................................... 115
4.3. CSTR. Reactor continuo de tanque agitado......................................................... 116
4.4. Reactor de equilibrio ........................................................................................... 117
4.5. Reactor de Gibbs ................................................................................................. 118
4.6. Reactor de flujo de pistón (PFR) ......................................................................... 118

1. INTRODUCCIÓN

En este capítulo presentaremos un sumario de los modelos rigurosos de operaciones unitarias


más complejas disponibles en HYSYS, que permiten resolver los balances de materia y
energía sin necesidad de suponer un comportamiento ideal.
El desarrollo de los balances de materia y energía es un componente básico en función del
cual se tomarán decisiones durante las etapas de evaluación y diseño del proceso. El posible
diagrama de flujo se considera como un conjunto muy elevado de ecuaciones no lineales que
describen:
• La interconexiones entre las distintas unidades del diagrama de flujo a través de las
corrientes de proceso.
• Las ecuaciones específicas de cada unidad, descritas mediante las leyes de
conservación, así como las ecuaciones constitutivas de la unidad.
• Los datos subyacentes y las expresiones que los relacionan con las propiedades físicas.
En este capítulo nos centraremos en los dos primeros apartados para presentar una
representación detallada de las unidades de operación. El principal objetivo de este capítulo es
alcanzar un mejor conocimiento del nivel de detalle de los modelos empleados en los
simuladores comerciales, en concreto en HYSYS.
En el capítulo anterior se han desarrollado los modelos rigurosos de las operaciones de
separación de equilibrio, así como su resolución. Ahora trataremos con modelos de unidades
menos detalladas, que incluyen operaciones de transferencia y intercambio llevadas cabo por
bombas, compresores, cambiadores de calor, así como modelos para reactores químicos.

109
Modelos rigurosos de operaciones unitarias

2. INTERCAMBIADOR DE CALOR (HEAT EXCHANGER)


Esta operación realiza un balance de materia y energía a ambos lados de la unidad. Es muy
flexible, de manera que puede calcular temperaturas, presiones, flujos de calor flujos de
materia o UA.
Esta operación permite dividir la curva de calor a ambos lados del intercambiador en
intervalos, de manera que en lugar de calcular la transferencia de energía en las condiciones
terminales del cambiador, se calcula en cada uno de los intervalos, que posteriormente se
suman para obtener la transferencia global.
Los cálculos llevados a cabo en esta operación están basados en los balances de energía a los
fluidos caliente y frío:
(Mfrío (Hout-Hin)frío – Qfugas) – (Mcaliente (Hout-Hin)caliente – Qpérdidas) = Error balance

donde: M = flujo másico de fluido


H = entalpía
Qfugas = Pérdidas de calor por fugas en el fluido frío
Qpérdidas = Pérdidas de calor en el fluido caliente

El error del balance, en la mayoría de las aplicaciones es cero.


La corriente de energía del cambiador también se puede definir en términos del coeficiente
global de transmisión de calor, el área disponible, y la diferencia media logarítmica:
Q = UA ∆Tln Ft
∆T1 − ∆T2
∆Tln =
ln (∆T1 / ∆T2 )
∆Τ1 = Τcaliente,out – Tfrío,in
∆Τ2 = Τcaliente,in – Tfrío,out

donde: U = coeficiente global de transmisión de calor


A = superficie disponible para la transmisión de calor
∆Tln = diferencia media logarítmica

110
Modelos rigurosos de operaciones unitarias

Ft = factor de corrección
El coeficiente global de transmisión de calor se calcula a partir de la expresión:
1
U=
⎡1 Do ⎛ 1 ⎞⎤
⎢ + ro + rw + ⎜⎜ ri + ⎟⎟⎥
⎣ ho Di ⎝ hi ⎠⎦

donde: ho, hi = coeficientes individuales de transmisión de calor el fluido en los tubos


externo e interno, respectivamente.
ro, ri = factor de ensuciamiento en los tubos exterior e interior, respectivamente.
rw = resistencia de la pared del tubo.
Do, Di = diámetros de los tubos externo e interno, respectivamente.
Para fluidos sin cambio de fase, los coeficientes individuales de transmisión de calor se
calculan de acuerdo con la ecuación empírica de Sieder-Tate:
0.8 1/ 3 0.14
k ⎛ Di Gi ⎞ ⎛ C p ,i µ i ⎞ ⎛ µi ⎞
hi = 0.023 m ⎜⎜ ⎟⎟ ⎜⎜ ⎟⎟ ⎜ ⎟
⎜µ ⎟
Di ⎝ µi ⎠ ⎝ km ⎠ ⎝ i ,w ⎠

donde: Gi = densidad de flujo másico del fluido en los tubos internos = velocidad ×
densidad
µi = viscosidad del fluido en los tubos internos
µi,w = viscosidad del fluido en los tubos internos, en la pared del tubo
Cp,i = calor específico del fluido en los tubos internos
km = conductividad térmica del fluido referida a las condiciones medias en la
masa global

3. SEPARADOR/SEPARADOR DE 3 FASES/TANQUE

• Separador: dispone múltiples entradas, y una corriente de producto de salida vapor y otra
líquida. El separador divide el contenido en la unidad en sus fases líquida y vapor en
equilibrio.
• Separador de 3 fases: dispone de múltiples entradas y tres salidas, una vapor y dos
líquidas. La operación divide el contenido de la operación es sus fases constituyentes
vapor, líquida ligera y líquida pesada.
• Tanque: dispone de múltiples entradas y una sola fase líquida de salida. Se utiliza para
simular tanques de almacenamiento.

111
Modelos rigurosos de operaciones unitarias

Para determinar las condiciones y fases producto se realiza un flash P-H. La presión es la
menor presión de alimentación menos la caída de presión a través del tanque. La entalpía es la
entalpía combinada de las alimentaciones más o menos el intercambio de energía (duty):
Hfeed ± Duty = Hvapor + Hpesada + Hligera

El separador y el separador de 3 fases proporcionan un alto grado de flexibilidad en cuanto a


la forma de resolver la operación. Además, de la aplicación estándar (alimentación a separar
completamente definida, a la presión y entalpía del tanque), el separador puede también usar
una composición conocida de producto para determinar la composición de la otra corriente
producto, y por un balance la composición de la alimentación. Para usar el separador para
calcular hacia atrás se debe conocer:
• La composición de un producto
• La temperatura o presión de una corriente producto
• Dos (para el separador) o 3 (para el separador de 3 fases) flujos

4. REACTORES QUÍMICOS
Todos los reactores, excepto el PFR, comparten el mismo formulario, siendo las principales
diferencias función del tipo de reacción (conversión, cinética, equilibrio).

Cada tipo específico de reactor solo admite un tipo particular de reacción, por ejemplo un
reactor de conversión sólo admite reacciones de conversión (reacciones en las que la
conversión está fijada).
Existe una gran flexibilidad cuando se definen y agrupan reacciones, se puede:
• Definir las reacciones dentro del Administrador Base (Basis Manager), agruparlas
en un conjunto y después asociarlo al reactor.

112
Modelos rigurosos de operaciones unitarias

• Crear reacciones en el Reaction Package en el diagrama de flujo principal,


agruparlas en un conjunto y asociarlas al reactor.
• Crear reacciones y conjuntos de reacciones en el Entorno Base (Basis
Environment) y hacer cambios en Reaction Package del Entorno Principal (Main
Environment).
No obstante, hay que tener cuidado con algunas sutilezas. Cuando se hacen cambios en las
reacciones en el formulario del propio reactor, esos cambios solamente serán válidos en ese
determinado reactor. Modificaciones en las reacciones en el Entorno Base o en Reaction
Package se reflejan automáticamente en todos los reactores que usen ese conjunto de
reacciones, siempre que no se hubieran hecho cambios locales.

4.1. Reacciones en HYSYS


La siguiente figura muestra las relaciones que existen entre los distintos tipos de reacción en
HYSYS y los diferentes reactores.

Reacciones y reactores en HYSYS


„ Reacciones en HYSYS „ Reactores en HYSYS
„ Conversión „ Conversión
„ Equilibrio „ Gibbs
„ Gibbs „ Equilibrio
„ van’t Hoff
„ CSTR
„ K vs. T
„ K fixed „ PFR
„ Cinéticas
„ Directa e inversa
„ Directa y K equilibrio
„ Catalíticas heterogéneas

24

4.1.1. Reacciones de conversión


Se requiere:
• Coeficientes estequiométricos
• Conversión del componente base
• NA = Nao (1 - X)

113
Modelos rigurosos de operaciones unitarias

• Los moles de reactivos disponibles para conversión incluyen cualquier cantidad


producida en otras reacciones y se calculan simultáneamente, excepto en las
marcadas como secuenciales
• Cuando hay reacciones competitivas
• A+ B→C B+D →E
se puede usar el Rango para especificar qué valor de conversión se debe alcanzar
antes (p.e. Si la reacción 1 tiene Rango 1, la conversión especificada para la reacción
2 solo se aplicará a la cantidad de B que quede después de haberse alcanzado la
conversión 1).

4.1.2. Reacciones de equilibrio


La constante de equilibrio se expresa:
N

j =1
[
K = ∏ ([base] j )
νj
]
• Reacciones de Gibbs: La constante de equilibrio se calcula a partir de la energía libre
de Gibbs ideal
• Van´t Hoff: Se supone que el ln K es solo una función de la temperatura:
• ln K = A + B/T + C * T + D ln T
• K vs. T: Se especifican datos de K a distintas temperaturas, que HYSYS ajustará a la
expresión anterior.
• K fijo, e independiente de la temperatura.

4.1.3. Reacciones cinéticas


• Directa e inversa
Se definen en función de los parámetros de la ecuación de Arrhenius para la reacción
directa (y opcionalmente la inversa), los coeficientes estequiométricos, y los órdenes
de reacción directos (e inversos):
R P
rA = k ∗ ∏ (base ) j j − k '∗ ∏(base )i i
n n'

j =1 i =1

k = A ∗ exp(− E / RT )
k ' = A'∗ exp(− E ' / RT )
V
FA0 = FA + ∫ rA dV = 0

• Velocidad simple
Similar a la anterior, excepto que la constante de velocidad de la reacción inversa se
obtiene a partir de datos de equilibrio:
k ' = k / K eq

114
Modelos rigurosos de operaciones unitarias

4.1.4. Reacciones catalíticas heterogéneas


• Involucran catalizadores sólidos
• Adsorción y desorción de reactivos y productos
• Reoxidación superficial
Para una reacción del tipo:
aA + bB → cC
dependiendo del mecanismo de reacción, la velocidad de reacción puede ser:
k + K A K B C AC B
Modelo de Langmuir-Hinshelwood: r=
(1 + K AC A + K B C B + K P C P )2
k + K B C AC B
Modelo de Eley-Rideal: r=
(1 + K B C B + K P C P )
kK A
Modelo de Mars-van Krevelen: r=
1 + (a / b )(k / k *)C A C B− n
La forma general para introducir estos modelos en HYSYS es:
R P
β
k f ∏ C iα i − k r ∏ C j j
i =1 j =1
r= 2
⎡ M
⎛ M
⎞⎤

γk
⎢1 + ⎜ K k ∏ Cg g ⎟⎥
⎣ k =1 ⎝ g =1 ⎠⎦
donde Kf, kr y Kk se expresan en forma de ecuación de Arrhenius.

Existen 4 tipos de reactores que comparten el mismo formulario: CSTR, reactor de


conversión, reactor de equilibrio, reactor de Gibbs.
La página de Parámetros permite especificar la caída de presión, el volumen de reactor, y
flujo de energía (duty). La presión se emplea en el cálculo de las reacciones, y el volumen del
reactor es necesario para calcular el tiempo de residencia.

4.2. Reactor de conversión


El reactor de conversión es un reactor en el que tienen lugar reacciones de conversión fija.
Cada reacción prosigue hasta que se alcanza la conversión especificada o hasta que se agote
un reactivo limitante.

115
Modelos rigurosos de operaciones unitarias

En la página de reacciones se tiene que asociar un conjunto de reacciones (Reaction Set) al


reactor y especificar la conversión para cada reacción del conjunto. El conjunto de reacciones
solo puede contener reacciones de conversión.

4.3. CSTR. Reactor continuo de tanque agitado


El CSTR es un reactor en el que tiene lugar una reacción cinética, de manera que la
conversión depende de las velocidades de reacción.

116
Modelos rigurosos de operaciones unitarias

Las corrientes de entrada se suponen instantánea y perfectamente mezcladas con el contenido


del reactor, de manera que la composición de la corriente de salida es idéntica a la del
contenido del reactor. Dado un volumen de reactor, una constante de velocidad de reacción y
la estequiometría de cada reacción, se calcula la conversión de cada componente que entra al
reactor.

4.4. Reactor de equilibrio


En este reactor solo pueden tener lugar reacciones de equilibrio, de manera que las corrientes
de salida se encuentran en equilibrio físico y químico. Dado que HYSYS calcula la actividad
de cada componente en la mezcla a partir de las fugacidades de los componentes puros, ni el
proceso de mezcla ni los componentes tienen que ser ideales.
La constante de equilibrio se calcula a la temperatura del reactor mediante la expresión:
B
ln K = A + + C T + D ln T
T
donde T es la temperatura absoluta, y A, B, C, D son constantes.

[
K = ∏ ([Base] j ) ]
N
νj

j =1

donde: K = constante de equilibrio


[Base]j = base para el componente j (concentración, presión parcial, etc.)
νj = coeficiente estequiométrico para el componente j
N = número de componentes

117
Modelos rigurosos de operaciones unitarias

4.5. Reactor de Gibbs


Calcula las composiciones de salida de tal forma que a la salida del reactor se alcanza el
equilibrio químico y entre fases. Sin embargo, no necesita utilizar una estequiometría
específica para la reacción, ya que la composición de la mezcla de salida se calcula
minimizando la energía libre de Gibbs (condición de equilibrio). Al igual que el reactor de
equilibrio no necesita suponer comportamiento ideal ni los componentes puros ni la mezcla.
En la página de composición se pueden ver los flujos de las corrientes de alimentación y
productos en base molar. En este formulario se puede fijar algunos componentes como inerte
de manera que se excluyen de los cálculos de minimización de la energía libre de Gibbs. Se
puede especificar la velocidad de producción de cualquier componente como una restricción a
la composición de equilibrio.

El flujo de producto se calcula basado en los valores fijados en la Frac. Spec. y Fixed Spec.
como:
Total Prod = FracSpec × Total Feed + FixedSpec

4.6. Reactor de flujo de pistón (PFR)


Generalmente consiste en una bancada de tubos cilíndricos. El flujo de modeliza como flujo
de pistón, por lo que no existen gradientes radiales de materia ni energía, lo que implica que la
mezcla radial es despreciable. Conforme los reactivos avanzan a lo largo del reactor son
continuamente consumidos, por lo que existe una variación axial de concentración y
temperatura. Para obtener la solución del PFR (perfiles axiales de composición, temperatura,
etc.) se divide el reactor en varios subvolúmenes. En cada uno de estos subvolúmenes se
considera velocidad de reacción espacialmente uniforme. En balance molar a cada
subvolumen j es:
dN j
F jo − F j + ∫ r j dV =
V dt
Dado que se considera velocidad de reacción uniforme en cada subvolumen, el tercer término
se reduce a rj V. En estado estacionario, el lado derecho de la ecuación es cero, de manera que
la ecuación se reduce a:

118
Modelos rigurosos de operaciones unitarias

F jo = F j + r jV

La página de Parámetros está divida en tres partes, relacionadas con los cálculos de la caída
de presión, la transmisión de calor, y también para decidir si la operación se incluye en los
cálculos.
La caída de presión en el reactor se puede especificar directamente, o se puede calcular
mediante la ecuación de Ergum:
∆P g c ϕ s D p ε 3 150(1 − ε )
= + 1.75
L ρ V 1− ε 2
Vρ / µ

donde: ∆P = caída de presión a través del reactor


gc = factor de proporcionalidad de la ley de Newton para las unidades de la
fuerza gravitacional
L = longitud del reactor
ϕs = esfericidad de la partícula
Dp = diámetro de la partícula
ρ = densidad del fluido
V = velocidad superficial o velocidad del fluido con la torre vacía
ε = porosidad
µ = viscosidad del fluido
En la sección de transmisión de calor hay que indicar si se especifica directamente el
intercambio de energía, o lo calcula HYSYS a partir de datos que se deben especificar en la
página de transmisión de calor.
La página de Transmisión de Calor (Heat Transfer) cambia dependiendo de la selección
indicada anteriormente. Cuando se ha seleccionado anteriormente “Direct Q Value” aparece
un cuadro de dialogo en el que hay que indicar el nombre de la corriente de energía, el valor
del flujo de calor, y si es preciso calentar o enfriar.

Cuando se ha seleccionado la opción fórmula, HYSYS calculará rigurosamente el flujo de


calor en cada subvolumen usando coeficientes locales de transmisión de calor para el interior
y exterior de los tubos usando las siguientes fórmulas:

119
Modelos rigurosos de operaciones unitarias

Q j = U j A(Tbulkj − Toutj )

1 1 1
= +
U hout hw

donde: Qj = flujo de calor en el subvolumen j


Uj = coeficiente global de transmisión de calor en el subvolumen j
A = área superficial del tubo PFR
Tbulkj = temperatura global del fluido
Toutj = temperatura en el exterior del tubo PFR (fluido de utilidad)
hout = coeficiente local para la transmisión de calor en el exterior (fluido de
utilidad)
hw = coeficiente local para la transmisión de calor en el interior del tubo
En los cálculos se desprecia la resistencia de la pared del tubo a la transmisión de calor.
En cada subvolumen, el calor se transmite radialmente del fluido del PFR al fluido de
utilidad. Los dos grupos de cuadros de dialogo que aparecen nos permiten especificar los
valores necesarios para evaluar la transmisión de calor.

La ecuación usada para determinar la temperatura del fluido de utilidad en cada subvolumen
es:
Q j = mρC p (Tout , j − Tout , j +1 )

y los parámetros que aparecen en el cuadro de dialogo “Heat Medium Side Heat Transfer
Infos Group” son:

Wall Heat Transfer Coefficient = hout


Mole flow = m
Heat capacity = Cp

120
Modelos rigurosos de operaciones unitarias

Inlet temperatura = temperatura del fluido de utilidad a la entrada del PFR


Calculated duty = Qj

En el cuadro de dialogo “Tube Side Heat Transfer Info Group” se puede especificar
directamente el valor del coeficiente local de transmisión de calor, hw, que se puede calcular a
través de una ecuación empírica:
hw = A flujo B
debiéndose asignar valores a las constantes A y B, o bien escogiendo la opción estándar se
calcula a partir de ecuación:
N u = A Re B Pr C
Nu k g
hw =
Dp

En la página de Reacciones, hay que asociar un conjunto de reacciones al PFR. Los tipos de
reacciones permitidas son cinéticas, catalíticas heterogéneas, o simples.
También deberemos especificar el número de segmentos en que se desea dividir el reactor. La
fracción mínima en que se dividirá un segmento (Minimum Step Fraction), y la longitud de
paso mínima (Minimum Step Length) que es el producto de la longitud del reactor por la
fracción de paso mínima.

Durante el cálculo de cada segmento, HYSYS intentará obtener una solución a lo largo de
toda la longitud del segmento. Si la solución no converge, el segmento se divide en dos
partes, y HYSYS intentará de nuevo obtener una solución en la primera mitad del segmento
dividido. El segmento se seguirá subdividiendo en mitades hasta que se alcanza una solución,
en cuyo caso se calculará la porción restante del segmento. Si el segmento se divide hasta un
punto en que su longitud es menor que la longitud de paso mínima, entonces se interrumpen
los cálculos.
121
Modelos rigurosos de operaciones unitarias

Si se ha especificado una porosidad menor que 1 aparece el cuadro del grupo de datos de
catalizador, en el que hay que proporcionar la siguiente información:
• Diámetro de la partícula de catalizador, Dp
• Esfericidad de la partícula, ϕs, definida como el área superficial de la esfera con el
mismo volumen que la partícula dividido por el área de la partícula.
• Densidad del sólido, ρs, incluyendo el espacio poroso de la partícula (microporosidad).
• Densidad, ρb, definida como: ρb = ρs(1-εm), siendo εm la microporosidad.
• Capacidad calorífica del sólido
En la pestañas “Worksheet” y “Performance” se nos presentan los resultados de la
simulación en diferentes formas.

122
Modelos rigurosos de operaciones unitarias

123
II. Simulación de procesos en la industria
química y de procesos: HYSYS

Modos de simulación de
procesos
Aurelio B. Vega Granda

Departamento de Ingeniería Química


y Tecnología del Medio Ambiente
Universidad de Oviedo
Modos de simulación de procesos

ÍNDICE

1. INTRODUCCIÓN ....................................................................................................127
2. MODOS DE SIMULACIÓN ...................................................................................130
2.1. Modo modular .....................................................................................................133
2.2. Modo orientado a ecuaciones ..............................................................................135

1. INTRODUCCIÓN
Los simuladores de procesos actuales se pueden clasificar en los siguientes tipos según la
estructura bajo la cual se plantea el modelo matemático que representa el proceso a simular:
-simuladores globales u orientados a ecuaciones
-simuladores modulares secuenciales
-simuladores híbridos o modular secuencial-simultáneo
Bajo el enfoque de la simulación global u orientada a ecuaciones, se plantea el modelo
matemático que representa al proceso (unidad, corrientes de interconexión, y algunas veces
modelos termodinámicos) construyendo un gran sistema de ecuaciones algebraicas que
representa a todo el conjunto o planta a simular y que se resuelve simultáneamente. De esta
forma el problema se traduce en resolver un gran sistema de ecuaciones algebraicas, por lo
general altamente no lineales. Como ejemplo puede citarse que en problemas típicos de
simulación de columnas de destilación por métodos rigurosos el sistema de ecuaciones puede
llegar a contener más de mil variables. De ello se desprende la magnitud del sistema que
represente el modelo de una planta completa típica.
En la década del 70, cuando se generan los primeros simuladores, no existían los medios
apropiados (principalmente hardware) para la resolución numérica de sistemas de ecuaciones
de gran dimensión. Es por ello que los primeros simuladores comerciales adoptaron
principalmente la arquitectura modular secuencial, en detrimento de la global.
El principal problema asociado a la filosofía de resolución global u orientada a ecuaciones es
la convergencia del sistema y la consistencia de las soluciones que se encuentran. En efecto,
los sistemas altamente no lineales como los que corresponden a modelos de plantas químicas
pueden, por ejemplo, producir múltiples soluciones (un ejemplo es el caso de los reactores
adiabáticos con reacciones exotérmicas). Además, la solución numérica para grandes sistemas
exige inicializaciones apropiadas, es decir próximas a un entorno de la solución, de lo
contrario pueden presentarse serios problemas de convergencia.
Históricamente, estas dificultades han sido la causa que ha limitado el desarrollo de este tipo
de simuladores en forma masiva. Una de las críticas fundamentales para la operabilidad de los
mismos que se realizaba a menudo por parte de usuarios no entrenados, era la imposibilidad
de identificar los sectores de la planta en correspondencia con el sistema de ecuaciones que lo
representa, dado que una vez que el sistema total se ha ensamblado, éste esta integrado y se
pierde la correspondencia biunívoca entre el equipo y el subsistema de ecuaciones que lo
representa. De esta manera, si existieran inconvenientes durante la simulación, resulta difícil

127
Modos de simulación de procesos

asignar el problema a un sector específico de la planta, o bien inicializar convenientemente.


Las principales características (virtudes y defectos históricamente remarcados) se resumen a
continuación:
• Cada equipo se representa por las ecuaciones que lo modelizan. El modelo es la
integración de todos los subsistemas.
• Desaparece la distinción entre variables de proceso y parámetros operativos, por lo
tanto se simplifican los problemas de diseño.
• Resolución simultánea del sistema de ecuaciones algebraicas (no lineales)
resultante.
• Mayor velocidad de convergencia.
• Necesita una mejor inicialización (mejor cuanto mayor sea el problema a resolver).
• A mayor complejidad, menor fiabilidad en los resultados y más problemas de
convergencia (soluciones sin sentido físico).
• Más difícil de usar por "no especialistas".
Una ventaja importante es que puede lograrse una velocidad de convergencia mayor que en
los simuladores modulares secuenciales. Además, dado que el sistema se plantea orientado a
ecuaciones, es posible incorporar fácilmente las expresiones de restricción para definir
problemas de optimización en forma directa, ya que basta solo con plantear las restricciones y
la función de optimización. Esta flexibilidad es imposible en los simuladores modulares
secuenciales, debido a que los módulos están orientados y definidos en forma rígida; esto es,
resulta imposible agregar restricciones y/o variables, además de la expresión analítica de la
función de optimización.
Los simuladores modulares secuencia/es se basan, en módulos de simulación independientes
que siguen aproximadamente la misma filosofía que las operaciones unitarias, es decir, cada
equipo: bomba, válvula, intercambiadores, etc.; se modeliza a través de modelos específicos
para los mismos y además, el sentido de la información coincide con el "flujo físico" en la
planta. Esta estructura tiene como ventaja el hecho de que cada sistema de ecuaciones se
resuelve con una metodología que resulta adecuada para el mismo, ya que es posible analizar
bajo todas las circunstancias posibles, el comportamiento del método de resolución propuesto,
esto es sistemas ideales, no ideales, topologías diversas del equipo, distintas variantes, etc.
Dado que se puede analizar específicamente la rendimiento de los distintos métodos de
resolución es factible lograr un modelo robusto y eficiente para cada módulo específico.
El enfoque en la teoría modular secuencial, por definición, supone que se conocen
(especifican} las variables de las corrientes de entrada, o sea las alimentaciones a los
equipos, mientras que deben calcularse las corrientes de salida y los correspondientes
parámetros de operación si correspondiera. Esto impone cierta rigidez que sacrifica, según sea
el caso, la posibilidad de encontrar asignaciones tales que minimicen el tiempo de cálculo
(secuencias acíclicas de resolución del sistema de ecuaciones asociado). Sin embargo esto
resulta conveniente desde otro punto de vista, ya que de esta manera se impone una dirección
al flujo de información entre módulos. Por otra parte, las combinaciones posibles de
especificación de variables son enormes, incrementándose de forma drástica la cantidad de
módulos a disponer si se quisiera cubrir todas las posibilidades.
Por ejemplo, en los intercambiadores de calor en contracorriente si se suponen conocidas las
corrientes de entrada, (esto es, la presión, la temperatura, la composición y el estado de fase, -
128
Modos de simulación de procesos

vapor, líquido o mezcla- ); dado que para calcular las corrientes de salida el sistema de
ecuaciones correspondientes queda determinado sólo cuando se asignan ciertos parámetros de
equipo, será necesario que el usuario los asigne como datos. Una opción simplificada de
cálculo implica la necesidad de fijar como parámetros de equipo el factor UA, (producto del
coeficiente global de transferencia y el área de intercambio).
En general, fijada la orientación en el cálculo (esto es, dadas las entradas calcular las salidas
del equipo), lograr que el sistema de ecuaciones sea compatible y tenga tantas incógnitas
como ecuaciones no implica necesariamente una única opción, ya que debemos analizar las
variables o parámetros de operación del equipo. En efecto, en la mayoría de los casos
existirán varias combinaciones de valores posibles, es decir, existirán varias posibilidades de
asignación de parámetros de equipos. Además, existen variantes para cada módulo que tienen
en cuenta varios factores, como puede ser la topología, -por ejemplo, el número de entradas y
salidas a una torre de destilación, o si hay condensadores parciales o totales-, o bien el nivel
de las hipótesis realizadas (si se considera hidráulica de platos o no, pérdidas de calor al
ambiente, etc.).
Resumiendo, en un simulador modular se define cada módulo por un sistema de ecuaciones
independiente que se resuelve de la manera óptima, subordinados sin embargo a las
limitaciones que ha impuesto la especificación de variables seleccionada. Esto implica una
ventaja en el sentido que se podrían utilizar progresivamente distintos niveles de cálculo
dependiendo de la etapa del proyecto en la que se realiza la simulación, o bien en función de
los datos disponibles hasta el momento, aprovechando el conocimiento que proviene de la
experiencia y análisis del método de convergencia para cada caso en particular. No obstante,
uno de los problemas que se originan es la conexión de los módulos según el proceso a
simular y las rigideces que ello impone.
En la década de los 70 se desarrollaron métodos avanzados para la descomposición y
resolución de diagramas de flujo modulares, conduciendo al desarrollo de simuladores
modulares simultáneos. En este tipo de simuladores aunque los modelos de las unidades
permanecen intactos, la resolución de las corrientes del diagrama de flujo se llevan a cabo de
una forma global o simultánea, en lugar de secuencial. Además, se incorporaron algoritmos y
modelos más generales (tales como tratamiento de sólidos) junto con métodos numéricos más
sofisticados. Este desarrollo fue motivado por el proyecto ASPEN en el Instituto de
Tecnología de Massachussets (MIT).
En las décadas de los 80 y 90, se desarrolló de forma considerable el modo de simulación
orientado a ecuaciones, especialmente para modelización y optimización en línea. Además,
los nuevos conceptos de ingeniería informática condujeron a interfases amigables e incluso a
algoritmos más potentes. Finalmente, el espectacular desarrollo de los ordenadores personales
contribuyó a la rápida extensión de la simulación. Actualmente, los simuladores modulares
más importantes incluyen ASPEN PLUS de Aspen Technology Inc., HYSYS de Hyprotech
Ltd. (actualmente Aspen Technology), PRO/II de Simulations Sciences Inc., y CHEMCAD de
Chemstations. Simuladores orientados a ecuaciones incluyen SPEEDUP de Aspen
Technology Inc., así como una serie de programas para la modelización y optimización en
tiempo real.

129
Modos de simulación de procesos

2. MODOS DE SIMULACIÓN

Para facilitar una descripción más clara de las estrategias de simulación de proceso, vamos a
presentar un ejemplo sencillo de un diagrama de flujo.
Consideremos el diagrama de flujo de la figura, que corresponde a un diagrama de flujo
propuesto por Williams y Otto como un proceso químico típico.

Columna de destilac ión


Decantador

Cambiador
Reactor de c alor

Azeótr opo
(P=10% E)
Recir culación
(Combustible)

Las corrientes de alimentación de los componentes puros A y B se mezclan con una corriente
de reciclo y entran a un reactor continuo de tanque agitado, donde tienen lugar las siguientes
reacciones:
A+ B→C
C+B→P+E
P+C→G
Aquí C es un producto intermedio, P es el producto principal, E es un subproducto, y G es un
residuo tipo aceite. Tanto C como E se pueden vender debido a su valor como combustibles,
mientras que G se debe tratar como un residuo y por tanto con un coste. La planta consta de
un reactor, un cambiador de calor para enfriar el efluente de salida del reactor, un decantador
para separar el residuo G de los reactivos y productos, y una columna de destilación para
separar el producto deseado P. Debido a la formación de un azeótropo, parte del producto
(equivalente al 10 % en peso del flujo de componente E) queda retenido en la corriente de
colas de la columna. La mayoría del producto de colas se recicla al reactor, y el resto se usa
como combustible. El modelo de la planta se puede definir sin el balance de energía, de
manera que se va a simplificar el problema considerando reacciones isotérmicas. El resto de
unidades también se simplificarán para no complicar en exceso el ejemplo y emplearlo solo
con fines ilustrativos. La información topológica para el diagrama de flujo se muestra en la
siguiente tabla.

130
Modos de simulación de procesos

Unidad Tipo Entrada Salida


1 Reactor F1, F2, FR Feff
2 Intercambiador Feff Fex
3 Decantador Fex Fd, Fwaste
4 Columna Fd Fprod, Fbottom
5 Divisor Fbottom Fpurge, FR

Vamos a considerar ahora los modelos de las unidades en el orden en que se ejecutan en el
diagrama de flujo. Todos los flujos se expresan en forma de flujos másicos.

Modelo para el reactor


Las composiciones de los distintos componentes en le reactor se obtienen a partir de las
cinéticas. Por simplicidad supondremos reactor isotérmico (con temperatura prefijada en 674
ºR). Las ecuaciones para este reactor vienen dadas por:
A
Feff = (F1A + FRA ) − (k 1 X A X B )Vρ
FeffB = (F2B + FRB ) − (k 1 X A + k 2 X c )X B Vρ
c
Feff = FRC + (2 k 1 X A X B − 2k 2 X B X C − k 3 X p X C )Vρ
FeffE = FRE + (2k 2 X B X C )Vρ
FeffP = FRP + (k 2 X B X C − 0.5k 3 X p X C )Vρ
Feffj
XJ =
(FeffA + FeffB + FeffC + FeffE + FeffP + FeffG )
j = A, B, C, E, G, P

Con constantes de velocidad de reacción dadas por:


k1 = 5.9755 ⋅ 10 9 exp(− 12000 / T )h −1 ( fracción en peso) −1
k 2 = 2.5962 ⋅ 1012 exp(− 15000 / T )h −1 ( fracción en peso) −1
k 3 = 9.6283 ⋅ 1015 exp(− 20000 / T )h −1 ( fracción en peso) −1
Siendo Xj la fracción en peso del componente j, V el volumen del reactor, T su temperatura, y
ρ la densidad de la mezcla.

Modelo para el intercambiador de calor


Dado que no es necesario el balance de energía, las ecuaciones para esta unidad son
simplemente que las salidas son iguales a las entradas:
Fexj = Feffj
j = A, B, C, E, G, P

131
Modos de simulación de procesos

Decantador
Esta unidad supone separación perfecta entre el componente G y el resto de componentes, de
manera que las ecuaciones son:
Fdj = Fexj j = A, B, C, E, P
FdG = 0
G
Fwaste = FexG
j
Fwaste =0 j = A, B, C, E, P

Columna de destilación
Esta unidad supone una separación de componente P puro por cabezas, pero supone que una
parte del producto P se pierde por colas junto el resto de componentes debido a la formación
de un azeótropo con el componente E, conduciendo a las ecuaciones:
j
Fbottom = Fdj j = A, B, C, E
j
Fprod =0 j = A, B, C, E
P
Fbottom = 0.1FdE
P
Fprod = FdP − 0.1FdE

Divisor de flujo
Las ecuaciones para esta unidad son:
j
Fpurgue = ηFbottom
j
j = A, B, C, E, P
FRj = (1 − η) Fbottom
j
j = A, B, C, E, P

A pesar de las simplificaciones del modelo del proceso, tenemos 58 variables y 54 ecuaciones.
También, obsérvese que el sistema no se puede resolver secuencialmente debido a la corriente
de reciclo, y a la necesidad de resolver las ecuaciones del reactor simultáneamente.
En concreto, el sistema tiene 4 grados de libertad, y las especificaciones para estas variables
conducen a diferentes problemas de simulación. Por ejemplo, si especificamos los flujos F1 y
F2, el volumen del reactor V, y la fracción de división η, entonces tenemos un problema de
evaluación de funcionamiento que trata con un proceso o diseño ya existente. Esto se
considera la entrada normal al proceso dado que la secuencia de cálculo sigue el flujo de
materia en el mismo. Por otra parte, si especificamos 4 flujos de salida
P A B E
( F prod , F purge , F purge , F purge ) estamos ante un problema de diseño y se necesita calcular las
entradas a partir de estas especificaciones. Intuitivamente, se puede ver que la resolución del
problema de evaluación es más simple que el de diseño. En efecto, para algunos valores de las
especificaciones de diseño podría no haber solución. Sin embargo, los dos tipos de problemas
132
Modos de simulación de procesos

necesitan ser considerados en las herramientas de simulación. Con esta descripción del
proceso Williams-Otto, vamos a considerar las estrategias de resolución de los modos
modular y orientado a ecuaciones.

2.1. Modo modular


En este tipo de modo, las unidades de proceso están encapsuladas como procedimientos,
donde las corrientes de salida (y otra información calculada) se evalúa a partir de las
corrientes de entradas y los parámetros de diseño. Estos procedimientos se resuelven de una
manera secuencial, que a grandes rasgos sigue de forma paralela al flujo de materia en el
proceso. Los simuladores están construidos de una manera jerárquica con tres niveles, como
se muestra en la figura.

Topología del
diagrama de
flujo

Modelos de
operaciones
unitarias

Modelos de
propiedades
físicas

El nivel superior se encarga de la topología del diagrama de flujo, siendo su tarea principal
ordenar la secuencia de los módulos de las unidades, inicializar el diagrama de flujo,
identificar los bucles de reciclo (particionado), seccionarlas corrientes, y asegurar la
convergencia de estas corrientes en los balances globales de materia y energía. El nivel
intermedio se encarga de los procedimientos de las operaciones unitarias, y representa la
biblioteca de modelos de unidades, cada una resuelta con un procedimiento especializado. Las
entradas desde el nivel superior incluyen las corrientes de entrada y parámetros de cada
unidad, y las salidas de unidad (corrientes y parámetros) se retroalimentan al nivel superior
una vez calculada la unidad. La biblioteca de unidades incluye separadores, reactores y
unidades de transferencia. Finalmente, el nivel más bajo trata con los modelos de propiedades
físicas. Esto incluye los modelos termodinámicos para el equilibrio entre fases, entalpías,
entropías, densidades, etc. Este nivel es llamado frecuentemente por los procedimientos de las
operaciones unitarias, y también por el nivel superior para la inicialización del diagrama de
flujo y el cálculo de corrientes.
En cada nivel, una tarea clave es la resolución de un sistema de ecuaciones no lineales que
puede representar los cálculos del equilibrio entre fases, que involucran modelos
termodinámicos no ideales; también los balances de materia y energía que representan los
modelos de las operaciones unitarias acoplados a estas relaciones termodinámicas. La

133
Modos de simulación de procesos

resolución de estos sistemas requiere un proceso iterativo que no está al alcance de la


resolución manual o de herramientas de hojas de cálculo.
Además, la topología del diagrama de flujo o los reciclos tratan con la descomposición
estructural del diagrama de flujo y la secuenciación de las unidades, donde es preciso
identificar los bucles de reciclo y las corrientes de seccionado. Una vez identificados, los
valores de las corrientes se determinan mediante un proceso iterativo.

2.1.1. Resolución del proceso Williams-Otto en modo modular


En el modo modular agrupamos las ecuaciones del proceso dentro de cada unidad y
ejecutamos estas unidades en secuencia. La primera tarea consiste en identificar las corrientes
que rompen todos los bucles de reciclo (particionado). Dado que el diagrama de flujo tiene
solo un reciclo, cualquiera de las corrientes en el reciclo se puede usar como corriente de
seccionado. Escogemos como corriente de seccionado la corriente de entrada al reactor y
consideramos el proceso como se muestra en la figura.

Ahora resolveremos las unidades de acuerdo con la tabla de topología que hemos mostrado
anteriormente (reactor, cambiador, decantador, columna de destilación, divisor) donde las
corrientes de salida de cada unidad se calculan a partir de las entradas. Para cada módulo,
necesitamos estar seguros que están especificadas todas las entradas. Especificamos los flujos
de alimentación F1 y F2, el volumen del reactor, y la fracción de purga del divisor de flujo.
Entonces, inicializamos el problema suponiendo un valor para el flujo de la corriente de
reciclo FR y evaluamos un valor calculado para esta corriente. La ejecución secuencial de las
unidades, comenzando por el reactor, nos permite obtener la corriente de entrada en cada
unidad.
El problema de convergencia viene dado por la ecuación de punto fijo:
FR = g(FR)
Donde g(FR) se encuentra implícitamente después de la ejecución de la secuencia de unidades.
El valor de FR se determina después de varios pasos por el diagrama de flujo mediante un
proceso iterativo. Estos pasos iterativos son los procesos dominantes en la simulación, de
manera que el algoritmo de convergencia del reciclo determina la eficacia de la simulación.
La resolución este diagrama de flujo en el nivel superior es sencillo si se supone que todas las
corrientes de salida se pueden determinar rápidamente dentro de cada unidad. Para este

134
Modos de simulación de procesos

proceso se requiere un esquema de resolución iterativa robusto para las ecuaciones del reactor.
La estructura de este diagrama de flujo es un simple y único bucle de reciclo, pero
frecuentemente nos encontramos con topologías mucho más complejas, donde la
determinación de buenas corrientes de seccionado está lejos de ser trivial.

2.2. Modo orientado a ecuaciones


En el modo orientado a ecuaciones se combinan las ecuaciones de la topología del diagrama
de flujo (por ejemplo, las corrientes de conexión) con las ecuaciones de las unidades (y si es
posible, con las ecuaciones de las propiedades físicas) en un gran sistema de ecuaciones. Esta
estructura permite mucha más flexibilidad al especificar las variables independientes como
parámetros y resolver para las restantes. Además, la solución de este sistema de ecuaciones se
lleva a cabo por un algoritmo general de resolución de ecuaciones no lineales. En casi todos
los casos se emplea el método de Newton-Raphson. En la figura se muestra la estructura de la
simulación orientada a ecuaciones, donde se puede ver que los modelos de propiedades
físicas, dado su número y naturaleza no lineal, se mantiene como un procedimiento
independiente, y se mantiene separado de las ecuaciones de las operaciones unitarias y de
conexión.

Topología del
diagrama de flujo

Operaciones unitarias

Modelos de
propiedades físicas

En el modo modular, estábamos interesados en sacar provecho de la topología del diagrama


de flujo mediante el seccionado de corrientes y de los procedimientos especializados para la
resolución de las operaciones unitarias. Por el contrario, con la simulación orientada a
ecuaciones aplicamos directamente estrategias de resolución simultánea en gran escala a las
ecuaciones para todo el diagrama de flujo. Estos grandes sistemas de ecuaciones tienen una
estructura dispersa, en el sentido de que solamente una pequeña fracción del número total de
variables participan en una ecuación dada.
Debido a su estructura, los simuladores orientados a ecuaciones tienden a converger mucho
más rápido que los modulares. Sin embargo, los simuladores modulares son mucho más
fáciles de inicializar debido a que ejecutan las unidades de proceso en secuencia de acuerdo
con la estructura del diagrama de flujo. Los simuladores orientados a ecuaciones no tienen
esquemas de inicialización análogos, de manera que se requiere un considerable esfuerzo para
inicializar estos problemas (esencialmente, se necesitan agrupar las ecuaciones en una
estructura modular).

135
Modos de simulación de procesos

Aplicando al proceso Williams-Otto el modo orientado a ecuaciones, combinamos todas las


ecuaciones del proceso y las resolvemos simultáneamente. Como ya hemos visto, las
ecuaciones del diagrama de flujo son:

A
Feff = (F1A + FRA ) − (k 1 X A X B )Vρ
FeffB = (F2B + FRB ) − (k 1 X A + k 2 X c )X B Vρ
c
Feff = FRC + (2 k 1 X A X B − 2k 2 X B X C − k 3 X p X C )Vρ
FeffE = FRE + (2k 2 X B X C )Vρ
FeffP = FRP + (k 2 X B X C − 0.5k 3 X p X C )Vρ
Feffj
XJ = j = A, B, C, E, G, P
(F A
eff + Feff
B
+ Feff
C
+ Feff
E
+ Feff
P
+ Feff
G
)
Fexj = Feffj j = A, B, C, E, G, P
F =Fd
j j
ex j = A, B, C, E, P
FdG = 0
G
Fwaste = FexG
j
Fwaste =0 j = A, B, C, E, P
F j
bottom =F d
j
j = A, B, C, E
j
Fprod =0 j = A, B, C, E
P
Fbottom = 0.1FdE
P
Fprod = FdP − 0.1FdE
j
Fpurgue = ηFbottom
j
j = A, B, C, E, P
F = (1 − η) F
j
R
j
bottom j = A, B, C, E, P

La estructura de estas ecuaciones tiene un fuerte impacto en la eficacia del proceso de


resolución. En particular, obsérvese que muy pocas variables aparecen en una ecuación dada
(normalmente, dos o tres), de manera que esta dispersión debe ser aprovechada. Dado que la
estructura del problema se explota al nivel de ecuaciones, hay un gran campo de acción para
especificar los cuatro grados de libertad. También, las ecuaciones de este ejemplo se pueden
simplificar considerablemente. Por ejemplo, como se ve en el modelo, las ecuaciones y
variables correspondientes al intercambiador de calor y decantador se pueden eliminar de
forma trivial.

136
II. Simulación de procesos en la industria
química y de procesos: HYSYS

Métodos de resolución de ecuaciones


no lineales I: métodos tipo Newton
José Ramón Álvarez Saiz

Departamento de Ingeniería Química


y Tecnología del Medio Ambiente
Universidad de Oviedo
Métodos de resolución de ecuaciones no lineales I: Métodos tipo Newton

ÍNDICE

1. INTRODUCCIÓN ....................................................................................................139
2. MÉTODOS TIPO NEWTON ..................................................................................140
3. FUNCIONES ACOTADAS Y DERIVADAS ..........................................................141
3.1. Funciones acotadas y derivadas...........................................................................141
3.2. Proximidad a la solución .....................................................................................142
3.3. Singularidad del Jacobiano. Modificación del paso del método de Newton.......145
3.4. Métodos de continuación: tratamiento de la singularidad del Jacobiano ............148
4. BIBLIOGRAFÍA ......................................................................................................148

1. INTRODUCCIÓN

La resolución de ecuaciones algebraicas no lineales es la tarea principal en la simulación de


procesos en estado estacionario. Para ambos modos, modular y orientado a ecuaciones, hay
que resolver las ecuaciones obtenidas a partir de las operaciones unitarias, las propiedades
físicas y la topología derivada de los diagramas de flujo.
Los problemas se pueden plantear en un formato estándar: resolver f(x) = 0, o bien en el
formato denominado de punto fijo, es decir: x = g(x).
Ambas formas son equivalentes, y los métodos que se describen a continuación se pueden
aplicar a ambos formatos, ya que
f(x) = x – g(x)= 0
o bien:
x = x + h(f(x)) = g(x).
donde h es cualquier función siempre que h(y) = 0 si y solo si y = 0.
De hecho el formato de punto fijo es más sencillo de operar cuando se requiere la
convergencia de corrientes de recirculación trabajando en modo modular.
Este tema corresponde a la descripción de los métodos tipo Newton utilizando el formato
estándar. El método de Newton-Raphson es el más utilizado en la resolución de ecuaciones
no lineales. En la simulación de procesos es el algoritmo esencial para el modo orientado a
ecuaciones y se utiliza a menudo para la resolución de las ecuaciones de las operaciones
unitarias, en particular para los modelos de separación detallados. También se verán métodos
quasi-Newton o Broyden.
En el tema siguiente se abordarán los métodos de punto fijo de primer orden. A diferencia
de los de Newton, no requieren información de las derivadas de las ecuaciones, pero
convergen más lentamente. Se utilizan en convergencia de recirculaciones y en otros
procedimientos de cálculo cuando las derivadas son difíciles de obtener.

139
Métodos de resolución de ecuaciones no lineales I: Métodos tipo Newton

2. MÉTODOS TIPO NEWTON

Considérese el problema en su forma estándar f(x) = 0, donde x es un vector de n variables


reales y f() es un vector de n funciones reales. Si se establece una estimación de las variables
en un punto dado, x´, se puede realizar una expansión en serie de Taylor para extrapolar
alrededor del punto de resolución (x*):
f i ( x*) ≡ 0 = f i ( x ' ) + ∂f i ( x ' ) / ∂x T ( x * − x ' ) + 1 / 2( x * − x ' )T ∂ 2 f i ( x ' ) / ∂x 2 ( x * − x ' ) + ....
i = 1,...n
o bien:
f i ( x*) ≡ 0 = f i ( x ' ) + ∇f i ( x ' )T ( x * − x ' ) + 1 / 2( x * − x ' )T ∇ 2 f i ( x ' )( x * − x ' ) + ....
i = 1,...n
donde ∇f i ( x ) y ∇ 2 f i ( x ) son el vector gradiente y la matriz Hessiana de la función f(x),
respectivamente.
Si se trunca la serie (sólo dos primeros términos), se tiene:
f ( x '+ p ) ≡ 0 = f ( x ') + J ( x ') p
Donde se ha definido el vector p = (x* - x’) como dirección de búsqueda y la matriz J con
elementos
{J }ij = ∂f i
∂x j
para la fila i y la columna j de la matriz J. Esta matriz se denomina Jacobiano. Si J no es
singular, se puede resolver directamente para obtener p, con una aproximación lineal a la
solución de las ecuaciones no lineales:
p = −(J ( x ' ) ) f ( x ')
−1

Esto permite una estrategia recursiva para encontrar el vector solución x*

pk = − J k( ) f (x )
−1 k
x k +1 = x k + p k
Siendo x0 la primera estimación, k el contador de iteraciones y J k ≡ J ( x k ) . La estrategia
recursiva se puede formalizar en el siguiente algoritmo básico para el método de Newton:
Algoritmo
0. Suponer x0, k = 0
1. Calcular f(xk), Jk
2. Calcular pk = -(Jk)-1 f(xk)
3. Establecer xk+1 = xk + pk
4. Comprobar convergencia: Si f(xk)T f(xk) ≤ ε1 y pk ≤ ε2, terminar (ε1 y ε2 son valores
próximos a cero)
5. En caso de no convergencia, k = k+1, volver al paso 1

140
Métodos de resolución de ecuaciones no lineales I: Métodos tipo Newton

El método de Newton tiene algunas propiedades de convergencia muy adecuadas. En


particular, tiene una rápida velocidad de convergencia cerca de la solución. De manera más
precisa, el método de Newton converge a una velocidad cuadrática dada por la expresión:
xk − x *
2
≤K
x k −1 − x *

donde ||x|| ≡ (xTx)1/2 es la norma Euclídea que define la longitud de un vector x determinado.
Una forma de interpretar esta relación es considerar que si K = 1 y se tiene un decimal de
precisión para xk-1, es decir ||xk-1 – x*|| = 0.1, entonces, en la siguiente iteración se tendrán dos
dígitos de precisión, cuatro, ocho, y así sucesivamente.
Por otro lado, esta convergencia tan rápida solamente tiene lugar si el método funciona
adecuadamente. El método puede fallar en problemas de simulación complicados. Las
condiciones suficientes de manera cualitativa para la convergencia del algoritmo de Newton
son:
• Las funciones f(x) y J(x) existen y están acotadas para cualquier valor de x
• La suposición inicial x0, debe de estar cerca de la solución real.
• La matriz J(x) no debe de ser singular para ningún valor de x.

3. FUNCIONES ACOTADAS Y DERIVADAS

3.1. Funciones acotadas y derivadas


Mediante un análisis detallado, se pueden evitar los casos en los que las funciones resultan
divididas por cero, o bien no tienen valores posibles, como es el caso del logaritmo de un
número negativo. Además se pueden especificar nuevas variables añadiendo también nuevas
ecuaciones. En los dos ejemplos siguientes se detallan estas consideraciones:

Ejemplo 1:
Para resolver f(t) = 10 – e3/t = 0, se observa que para valores de t próximos a cero, el término
exponencial aumenta de valor muy rápidamente, así como la derivada de la función, -3e3/t. Si se define
una nueva variable x = 3/t, y se añade la ecuación xt –3 = 0, se tienen mayor número de ecuaciones a
resolver, pero en este caso las funciones están perfectamente acotadas, de modo que se debería de
resolver el sistema:
f1(x) = 10 – ex = 0
f2(x) = xt – 3 = 0
siendo la matriz jacobiana:
⎡− e x 0⎤
J(x) = ⎢ ⎥
⎣ t x⎦

141
Métodos de resolución de ecuaciones no lineales I: Métodos tipo Newton

Hay que destacar que tanto ambas funciones f1 y f2 como J tienen valores acotados y definidos para
valores finitos de x, sin embargo J puede llegar a ser singular para determinados valores de x y t.

Ejemplo 2:
Para la función f(x) = ln x – 5 = 0, la función no tiene soluciones válidas para valores negativos de x.
Este problema se puede reformular introduciendo una nueva variable y una nueva ecuación.
Se define x2 = ln x1 o bien f1 = x1 – exp(x2) = 0. El sistema de ecuaciones que resulta es:
f1 = x1 – exp(x2) = 0
f2 = x2 – 5 = 0
siendo la matriz jacobiana:
⎡1 − e x 2 ⎤
J(x) = ⎢ ⎥
⎣0 1 ⎦
De nuevo en este caso ambas funciones y las derivadas tienen valores acotados.

3.2. Proximidad a la solución


En general, asegurar un punto de partida próximo a la solución no es práctico, de tal modo
que normalmente se comienza por una estimación lejana, o arbitraria, y lo que importa es el
control de acercamiento, esto es, el paso de aproximación del método de Newton para
asegurar que se progresa hacia la solución. Con este objetivo, el paso de acercamiento se
modifica, de tal modo que el nuevo punto es solamente una fracción del paso máximo que
predice el método de Newton para cada iteración.
x k +1 = x k + αp k
siendo α un número entre 0 y 1, y pk el paso en la dirección predicha por la iteración del
método de Newton. Si α = 1 el paso a dar es el predicho por el método de Newton. Para
evaluar α automáticamente se ha de llevar a cabo un método que proporcione una
convergencia adecuada. Para ello se define una función objetivo a minimizar:
φ( x ) = 1 / 2 f ( x ) T f ( x )
Utilizando α para calcular el nuevo punto se tiene: x k +1 = x k + αp k
realizando una expansión de Taylor de la función objetivo φ(x) se tiene:
φ( x k +1 ) = φ( x k ) + αdφ / dα + α 2 / 2d 2 φ / dα 2 + ...
o bien:
φ( x k +1 ) = φ( x k ) + ∇φ( x k )T (αp k ) + α 2 / 2 p kT ∇ 2 φ( x k ) p k + ...
Definimos nuevamente Jk
∂f i
J k ≡ J(xk ) {J ( x )}
k
ij =
∂x j

a partir de donde se obtiene la derivada de φ(x):

142
Métodos de resolución de ecuaciones no lineales I: Métodos tipo Newton

∇φ( x k ) T = f ( x k ) T J k
y el paso del método de Newton:

p k = −(J ( x k ) ) f (x k )
−1

Multiplicando la derivada de φ(x) por pk y sustituyendo el valor del intervalo se llega a :


∇φ( x k ) T p k = −( f ( x k ) T J k ( J k ) −1 f ( x k )) = − f ( x k ) T f ( x k ) = −2φ( x k ) < 0
Y si α→ 0, en la expansión de Taylor tenemos:
φ( x k +1 ) − φ( x k ) ≈ −2αφ( x k ) < 0
Para un α suficientemente pequeño, el paso de la iteración del método de Newton hace que
φ(x) disminuya. Esta propiedad permite crear un algoritmo y mejorar la estimación de φ(x).
Se podría minimizar entonces la función φ(xk + αpk) y encontrar un valor de α óptimo. Este
proceso, no obstante, resulta excesivo debido a la gran cantidad de cálculos a realizar y la
posible dirección cambiante, sobre todo en las últimas iteraciones. En lugar de esta opción, se
elegirá un paso de iteración αk que proporciona suficiente disminución de la función φ(x).
Esta aproximación se conoce como la búsqueda de la línea de Armijo, y se ilustra en la fig. 1.
Comenzando en el origen, se observa la pendiente negativa incluso cuando α = 0, y también
se observa que hay un valor del paso de iteración para el cual φ(xk + αpk) es mínimo. En vez
de una minimización directa de α, se define como condición suficiente para reducir el valor
de la función, cuando φ(xk + αpk) está por debajo de la cuerda de Armijo, esto es:
φ( x k + αp k ) − φ( x k ) ≤ −2δαφ( x k )
siendo δ la fracción de la pendiente (normalmente comprendida entre 0 y ½) que define esta
cuerda. De esta manera se asegura que hay una disminución satisfactoria de φ(x) que es al
menos una fracción, δ, de la velocidad de disminución en el punto presente, xk.

Fig. 1. Esquema para la búsqueda de la línea de Armijo (Biegler et al., 1997)

143
Métodos de resolución de ecuaciones no lineales I: Métodos tipo Newton

Si esta relación se satisface para un valor suficientemente alto de α, se toma este paso como
válido. En caso contrario, se considera el caso de la figura 1 donde α = 1. En este caso el
valor de φ(xk + αpk) se encuentra por encima de la cuerda de Armijo, en consecuencia, no hay
reducción de la función φ(xk), por lo que hay que elegir un paso de iteración más pequeño.
Hay que procurar también que este paso no sea demasiado pequeño (en el intervalo, por
ejemplo, comprendido entre αj y αu), de otro modo, los movimientos en la dirección x
tenderán a cero antes de que la función converja. Para lograr este propósito se hace una
interpolación cuadrática para α, definiendo una función de interpolación φq(α) basada en tres
parámetros: el valor de φ(x) en un punto base, xk, en el nuevo punto de iteración, xk + αpk, y
la pendiente en el punto base, ∂φq(0)/ ∂α =-2 φ( xk). La minimización de φq(α) se puede hacer
analíticamente, de modo que se llega a un valor de α ( denominado αq) que normalmente se
encuentra dentro del intervalo antes mencionado. Basándose en estas propiedades, se describe
a continuación el algoritmo de búsqueda de la línea de Armijo, ello requiere sustituir el paso 3
del algoritmo de Newton detallado en el apartado 2.

MÉTODO DE BÚSQUEDA DE LA LÍNEA DE ARMIJO


a. Hacer α = 1
b. Evaluar φ( x k + αp k )
c. Si φ( x k + αp k ) − φ( x k ) ≤ −2δαφ( x k ) , el intervalo es el correcto. Hacer
x k +1 = x k + αp k e ir al paso 4 en el algoritmo de Newton. En caso contrario
continuar con el paso d.
αφ( x k )
d. Hacer λ=max{η, αq}, donde α q = αφ( x k ) α q =
(2α − 1)φ( x k ) + φ( x k + αp k )
hacer α=λα y volver al paso b.
Típicamente, δ = η = 0.1. Este procedimiento proporciona robustez y confianza al método de
Newton, especialmente si el valor inicial está lejos de la solución real. Sin embargo, si no se
encuentra la longitud del paso después de 5 iteraciones por este algoritmo, la dirección del
método de Newton, pk puede ser no adecuada debido al mal planteamiento del problema (por
ejemplo, porque J(xk) sea casi singular). Ello llevaría al fracaso del método de búsqueda,
recomendándose en este caso la inspección de las ecuaciones del problema. En el caso
extremo de que J(xk) sea singular, entonces no existiría el paso del método de Newton y el
algoritmo de Newton no se podría aplicar. En este caso se pueden adoptar las estrategias para
resolver el problema que se detallan a continuación.

Ejemplo: Sea la función : f ( x ) = 0.05 x 4 − 3

La derivada de la función será


df ( x ) = 0 .2 x 3
dx
Y de acuerdo con el método de Newton, el siguiente punto se obtendrá mediante la expresión:

144
Métodos de resolución de ecuaciones no lineales I: Métodos tipo Newton

f (xk )
x k +1 =
df ( x )
dx k
De este modo se pueden calcular los nuevos valores de x mediante un número de iteraciones que se
muestran en la siguiente tabla, que implican el valor de la función, la derivada, y el nuevo valor
calculado.

k x f(x) df(x) xk+1


0 10 497 200 7.515
1 7.515 156.473 84.882 5.672
2 5.672 48.736 36.488 4.336
3 4.336 14.672 16.303 3.436
4 3.436 3.969 8.113 2.947
5 2.947 0.770 5.118 2.796
6 2.796 0.057 4.373 2.783
7 2.783 0.000 4.312 2.783

Este mismo proceso de iteración que se describe numéricamente en la tabla, se muestra gráficamente
en la siguiente figura:

3.3. Singularidad del Jacobiano. Modificación del paso del método de Newton
Si el Jacobiano es singular o casi singular, en cuyo caso el problema está mal planteado, el
paso del método de Newton es casi ortogonal a la dirección del gradiente máximo para la
función φ(x). La dirección del gradiente máximo está definida como -∇φ(x) y, para un paso
pequeño, el gradiente da la máxima reducción para la función φ(x). Como resultado, se podría
considerar el gradiente máximo en vez de la dirección de Newton, cuando la dirección de
Newton no es la adecuada. El gradiente máximo viene dado por la siguiente expresión:
p sd = −∇φ( x k ) = J ( x k ) T f ( x k )
Este paso tiene la propiedad de ser el gradiente máximo, pero solamente una velocidad lineal
de convergencia que viene definida por:

145
Métodos de resolución de ecuaciones no lineales I: Métodos tipo Newton

x k − x * < x k −1 − x *

Una ventaja de los métodos del gradiente máximo es que siempre que
p sd = − J ( x k ) T f ( x k ) ≠ 0
se tendrá un nuevo punto más cerca de la solución, incluso si la matriz J es singular. Sin
embargo, este método puede ser muy lento.
Un método de compromiso para llegar a la solución es combinar métodos de gradiente
máximo y de Newton. Dos de estas estrategias son el método de Levenberg-Marquardt y el
método de la “pata de perro” de Powell. En el primero se combinan ambos pasos y se
resuelve el siguiente sistema lineal de ecuaciones para encontrar la dirección de avance.
(J ( x )
) J ( x k ) + λI p k = − J ( x k ) T f ( x k )
k T

siendo λ un escalar positivo que ajusta la dirección y la longitud del paso. Para λ = 0 se
obtiene directamente el método de Newton.

(
p k = − J ( x k )T J ( x k ) )−1
J ( x k ) T f ( x k ) = − J ( x k ) −1 f ( x k )
En el otro extremo, si λ se hace grande, y domina sobre J(xk)T J(xk), el sistema de ecuaciones
se aproxima a :
p k = −(λI ) J ( x k ) T f ( x k ) = − J ( x k ) −1 f ( x k ) / λ
−1

que es el paso del método del gradiente máximo, con un tamaño de paso muy pequeño.
Valores intermedios de λ dan direcciones de avance que están comprendidas entre el arco
definido por el gradiente máximo y el paso de Newton, tal y como se muestra en la figura 2a.
Una desventaja del método de Levenberg-Marquardt es la necesidad de resolver un sistema de
ecuaciones lineales cada vez que se cambia λ. Esto puede resultar costoso, ya que el algoritmo
puede necesitar varios cálculos de λ antes de tener el paso de iteración apropiado. En vez de
esto se considera un algoritmo que combina el método de Newton y el del gradiente máximo
y elige una dirección de avance entre los das métodos automáticamente. Este método
denominado “pata de perro” se ilustra en la figura 2b y fue desarrollado por Powell. Este
método utiliza un paso que es combinación lineal del paso del método de Newton y el del
gradiente máximo. Si el paso calculado es menor que el del gradiente máximo, se tomará este
último como paso de la iteración.
Para desarrollar este método se necesita primero encontrar la longitud adecuada (dado por un
escalar β) en la dirección del gradiente máximo.
p sd = J T f ( x k )
Se considera entonces la minimización de una función cuadrática que se construye de la
linealización de las ecuaciones en la dirección del gradiente máximo.

(
Minβ 1 / 2 f ( x k ) + βJp sd ) ( f (x
T k
) + β Jp sd )
Sustituyendo la definición dada para el método del gradiente máximo:
[ ][
β = f ( x k ) T JJ T f ( x k ) / f ( x k ) T J ( J T J ) J T f ( x k ) = p sd ] 2
/ Jp sd
2

146
Métodos de resolución de ecuaciones no lineales I: Métodos tipo Newton

Fig. 2a. Método Levenberg-Marquardt Fig. 2b. Método “pata de perro” de Powell
(Biegler et al., 1997) (Biegler et al., 1997)

El paso psd se conoce como paso de Cauchy. Se puede demostrar que la longitud de este paso
nunca es superior a la longitud del paso de Newton: pN = -J-1 f(xk). Para una fracción de
longitud de paso deseada γ, se puede calcular la dirección de avance para el método “pata de
perro” de Powell. Si se desea ajustar la fracción de la longitud γ automáticamente, la
dirección de avance, p, se puede determinar de la siguiente manera:
Para γ ≤ β p sd , p = γp sd / p sd

Para γ ≥ p N , p = p N

Para p N > γ > β p sd , p = ηp N + (1 − η)β p sd

( )(
siendo η = γ − β p sd / p N − β p sd )
Si la fracción de la longitud de paso γ es pequeña, se elige la dirección del gradiente máximo;
si es grande, se elige el paso de Newton. Para valores de γ entre los pasos de Newton y
Cauchy, se elige una combinación lineal de estos pasos, como se ha mostrado en la figura 2.
Como esta aproximación se necesitan solamente dos direcciones predeterminadas y cálculos
sencillos para la determinación del tamaño del paso, y es más rápido que el método de
Levenberg-Marquardt. Incluso en los casos en los que el jacobiano está mal condicionado, y
consiguientemente el paso de Newton se hace demasiado largo, este método sencillamente se
autorregula considerando pasos de Cauchy con fracciones de longitud γ.
Finalmente, debe mencionarse que las aproximaciones de ambos métodos se agrupan en una
clase general de algoritmos denominada métodos de la región de confianza. Para estos
problemas, la fracción de la longitud del paso γ corresponde al tamaño de la región alrededor
del punto xk en la que la aproximación cuadrática de p (basado en una linealización de f(x),
esto es ½(f(xk + J p)T (f(xk) + J p)) es una representación apropiada de φ(x).
Una minimización aproximada de este modelo cuadrático necesita el ajuste bien de λ, bien de
η para cada iteración en los métodos de Levenberg-Marquardt o de Powell, respectivamente.

147
Métodos de resolución de ecuaciones no lineales I: Métodos tipo Newton

Mientras que los métodos de la región de confianza pueden ser más costosos que la estrategia
de la búsqueda de la línea de Armijo, poseen una mayor capacidad de convergencia,
particularmente para aquellos problemas con problemas de condicionamiento inicial.

3.4. Métodos de continuación: tratamiento de la singularidad del Jacobiano


Para jacobianos singulares o mal condicionados de partida, se pueden tener en cuenta los
métodos de continuación. Estos métodos, a diferencia de los métodos de la región de
confianza, no se resuelven forzando la función f(x) a cero. En su lugar, se evalúa la función
para un valor inicial f(x0) y se resuelve un problema incluso más simple, por ejemplo f(x) –0.9
f(x0) = 0. Se espera que este planteamiento no precise un cambio excesivo para x, de tal modo
que el método de resolución (por ejemplo, Newton) no tenga dificultades a la hora de
resolverlo. Si se llega a solucionar el problema modificado con 0.9, se reduce este parámetro
de continuación a 0.8 y se repite la resolución del problema. Finalmente, reduciendo el
parámetro a 0, se logra resolver el problema original.
Con esta aproximación hay que tener en cuenta dos aspectos:
• La rapidez en la reducción del parámetro de continuación
• El coste de este método en comparación con los vistos previamente.
El uso de un parámetro fijo es una forma algebraica del método de continuación. Existen
diferentes modificaciones al método que incluyen por ejemplo, alternar el parámetro de
continuación con una variable, en el momento en el que se detecta un jacobiano singular. La
sustitución de este parámetro puede dar lugar a un jacobiano no singular, de tal modo que se
incrementa la posibilidad de éxito en problemas más difíciles, aunque no sin un aumento del
coste computacional.

4. BIBLIOGRAFÍA

• AspenTech, ASPEN Plus 11.1 User guide (2002).


• Biegler, L.T., Grossmann, I.E., Westerberg, A.W., “Systematic Methods of Chemical
Process Design”, Prentice Hall, Nueva Jersey (1997).
• Hyprotech, HYSYS user’s guide.
• Seider, W.D., Seader, J.D., Lewin, D.R., “Process Design Principles”, John Wiley & Sons,
Nueva York (1999)

148
II. Simulación de procesos en la industria
química y de procesos: HYSYS

Métodos de resolución de ecuaciones


no lineales II: métodos que no
requieren derivadas
José Ramón Álvarez Saiz
Departamento de Ingeniería Química
y Tecnología del Medio Ambiente
Universidad de Oviedo
Métodos de resolución de ecuaciones no lineales II: Métodos que no requieren derivadas y de primer orden

ÍNDICE

1. INTRODUCCIÓN ....................................................................................................151
2. MÉTODO DE LA SECANTE .................................................................................151
3. MÉTODO DE BROYDEN. CASO MULTIVARIABLE.......................................152
4. MÉTODOS DE PRIMER ORDEN.........................................................................155
5. MÉTODOS DE SUSTITUCIÓN DIRECTA..........................................................156
6. MÉTODOS DE RELAJACIÓN..............................................................................157
6.1. Método del valor propio dominante (DEM)........................................................157
6.2. Método de Wegstein ............................................................................................158
7. BIBLIOGRAFÍA ......................................................................................................161

1. INTRODUCCIÓN

Los métodos considerados hasta ahora requieren el cálculo del jacobiano en cada iteración.
Este proceso es probablemente el que más tiempo de cálculo consume para algunos
problemas, especialmente si hay procedimientos no lineales anidados. Una alternativa sencilla
al cálculo exacto de las derivadas es la aproximación por el uso de diferencias finitas, dado de
manera genérica por:
⎛ ∂f


⎟ =
( ) ( )
f x k + he j − f x k
⎜ ∂x ⎟ h
⎝ j ⎠ xk
en donde cada elemento i del vector ej viene dado por (ej)i = 0 si i ≠ j o (ej)i = 1 si i = j, y h es
un escalar cuyo valor normalmente se encuentra entre 10-6 y 10-3. Esta aproximación requiere
una evaluación/iteración de n funciones adicionales.
Por otro lado, se pueden considerar los métodos Quasi-Newton donde el jacobiano se
aproxima mediante diferencias de x y de f(x) obtenidas de iteraciones previas.

2. MÉTODO DE LA SECANTE

En el caso de los métodos Quasi-Newton, hay una fuerte motivación para evitar la evaluación
(y descomposición) del jacobiano. El fundamento de estos métodos se puede comprender
considerando una única ecuación con una única variable, tal y como se muestra en la Fig. 1:

151
Métodos de resolución de ecuaciones no lineales II: Métodos que no requieren derivadas y de primer orden

f(x)

xc
xd xb xa x

Fig. 1. Comparación del método de Newton y el de la secante para una única ecuación
(adaptado de Biegler et al., 1997)

Si se aplica el método de Newton al sistema comenzando desde xa, se obtiene un nuevo punto
xc a partir de la tangente a la curva en el punto xa, como se muestra en la Fig. 1, que responde
a la relación:
Paso de Newton: x c = x a − f ( x a ) / f ' ( x a )
Donde f’(x) es la pendiente. Si no se dispone de esta derivada, se puede realizar una
aproximación mediante diferencias entre dos puntos, por ejemplo, xa y xb. En la Fig. 1, el
nuevo punto calculado sería xd resultado de prolongar la secante entre los puntos xa y xb. La
expresión para obtener xd sería:
⎡ xb − xa ⎤
Paso de secante: x d = x a − f ( x a ) ⎢ a ⎥
⎣ f (x ) − f (x )⎦
b

Incluso se puede definir una relación general para la secante, de tal modo que para un escalar
B, se tiene:
B( x b − x a ) = f ( x b ) − f ( x a )
x d = x a − B −1 f ( x a )
ya que f(xd) = 0
El método de la secante se recomienda en simulación de procesos para especificaciones
generadas por el usuario dentro del diagrama de flujo y resuelve una especificación de cada
vez. Este método es adecuado si la función a resolver es discontinua y no monotónica, o bien
plana, en un determinado intervalo.

3. MÉTODO DE BROYDEN. CASO MULTIVARIABLE

En el caso multivariable, se necesitan considerar condiciones adicionales para obtener el paso


mediante la secante. En este caso se define una matriz B que sustituye al jacobiano y que
satisface la relación de la secante, de tal modo que:
B k +1 ( x k +1 − x k ) = f ( x k +1 ) − f ( x k )

152
Métodos de resolución de ecuaciones no lineales II: Métodos que no requieren derivadas y de primer orden

y suponiendo que f(xk+1) ≈ 0, Bk se puede emplear para calcular el cambio en x:

x k +1 = x k − B k ( ) f (x )
−1 k

Sin embargo, para el caso multivariable, la secante no es suficiente para definir B. En este
caso, dada una matriz Bk, se calcula el menor cambio para Bk+1 respecto de Bk que satisface la
ecuación de la secante. Este es un problema de minimización con restricciones que se puede
formular del siguiente modo:
Min B k +1 − B k
F

sujeto a la restricción:
B k +1 s = y
siendo:
(
y = f x k +1 − f x k ) ( )
s = x k +1 − x k
y ||B||F es la norma de Frobenius dada por la expresión:

[∑ ∑ B ] i j ij
1/ 2

Este problema se puede plantear y resolver más fácilmente con variables escalares. Sean bij
tales que:
( )
bij = B k ij , bij = B k +1 ( )
ij

e yi, y si los elementos de los vectores y y s, respectivamente. Entonces se tiene:

∑∑ (b − bij )
2
Min ij
i j

sujeto a:

∑b s
j
ij j = y i i = 1,...n

Se pretende encontrar los mejores valores de bij que componen los elementos de la nueva
matriz Bk+1. Este es un problema de optimización estrictamente convexo que tiene un mínimo
único. Construyendo la función de Lagrange correspondiente:
⎛ ⎞
L = ∑ ∑ (bij − bij ) + ∑ i λ i ⎜⎜ ∑ bij s j − y i ⎟⎟
2

i j i ⎝ j ⎠
Las condiciones estacionarias de dicha función son:
∂L = 2(bij − bij ) + λ i s j = 0 ⇒ bij = bij − λ i s j / 2
∂bij

para encontrar λi se aplica la relación de la secante de nuevo:


λi
y i = ∑ bij s j = ∑ bij s j − ∑s 2
j
j j 2
153
Métodos de resolución de ecuaciones no lineales II: Métodos que no requieren derivadas y de primer orden

λi
=
∑b s − y
ij j i

2 ∑s 2
j

Sustituyendo ahora λi/2 en la condición estacionaria para bij y escribiendo en notación


matricial se llega a la fórmula de Broyden:

B k +1 = B k +
( y − B s )s k T

sT s
Mediante esta relación se puede calcular la nueva dirección de avance mediante la resolución
del sistema lineal de ecuaciones:
B k +1 p k +1 = − f x k +1 ( )
Sin embargo, también se puede calcular pk+1 de manera explicita mediante la actualización de
la inversa de Bk+1 mediante una modificación de la fórmula de Broyden. Para este caso, se
aplica la fórmula de Sheman-Morrison-Woodbury para una matriz cuadrada A con un
conjunto actualizado de vectores x y v:
A −1 xv T A −1
(A + xv ) T −1
= A −1 −
1 + v T A −1 x
como la matriz xvT tiene solo un valor propio (eigenvalor) positivo, tiene un rango igual a
uno, denominándose la relación (A + xvT) una actualización de A de rango uno. Si se tiene en
cuenta que:
A = Bk A + xv T = B k +1
( )
x = y − B k s / sT s v=s
simplificando se tendrá que si Hk = (Bk)-1

H k +1 = H k +
(s − H y )s k T
Hk
sT H k y
El algoritmo completo de Broyden se puede establecer de la siguiente manera:

1. Suponer x0 y B0 (por ejemplo = J0 o I) y calcular H0 ( por ejemplo (J0)-1)


2. Si k = 0, ir al paso 3, si no, calcular f(x k), y = f(x k) – f(x k-1), s = x k – x k-1 y Hk o Bk
3. Calcular la dirección de avance como pk = Hk f(x k) o resolviendo Bkpk = -f(x k)
4. si ||pk||≤ ε1 y ||f(xk)||≤ ε2 detener el proceso, si no, encontrar un paso α y actualizar las
variables de modo que xk+1 = xk +α pk
5. Establecer k = k+1. Ir al paso 2

El método de Broyden se ha utilizado ampliamente en la simulación de procesos,


especialmente cuando el número de ecuaciones es relativamente pequeño. Por ejemplo, este
método se usa para cálculos flash por el método “inside-out” y para convergencia de
recirculaciones en diagramas de flujo. Las fórmulas actualizadas de rango uno para el método

154
Métodos de resolución de ecuaciones no lineales II: Métodos que no requieren derivadas y de primer orden

de Broyden que aproximan el jacobiano aseguran convergencia rápida. De hecho, el método


converge de manera superlineal de acuerdo con la expresión:
x k +1 − x *
lim →0
k →∞ xk − x *

que es más lento que el método de Newton, pero significativamente más rápido que el del
gradiente máximo.
Por otro lado, tanto Hk como Bk son generalmente matrices densas, aunque recientes estudios
han considerado la utilización de fórmulas de actualización que se benefician de estructuras
menos densas. Además, también es posible que ambas matrices puedan estar mal
condicionadas inicialmente (independientemente) a través de las actualizaciones de rango
uno. Para evita esto, se puede emplear un proceso de actualización más estable mediante
factores de descomposición de la matriz Bk. En particular, las fórmulas de actualización de
Broyden se han desarrollado para los factores LU o los factores QR de Bk.
Finalmente, no hay garantía de que el método de Broyden produzca una dirección de descenso
de la función. Como resultado, la inecuación de Armijo puede no satisfacerse incluso aunque
se apliquen métodos de búsqueda de línea. Sin embargo, muchas implementaciones en
ingeniería de procesos utilizan simplemente los pasos completos de Broyden, a no ser que los
residuos aumenten mucho su valor.
El método de Broyden es muy útil en la convergencia de bucles de recirculación, cuando se
especifican una o más especificaciones de diseño o cuando se tienen ambos requerimientos
simultáneamente.
La aplicación del método de Broyden puede romper el comportamiento oscilatorio que a
veces se observa en la convergencia, tal y como se muestra en la Fig. 2.

Fig. 2. Oscilación en la convergencia

4. MÉTODOS DE PRIMER ORDEN

Estos métodos no calculan o aproximan la matriz jacobiana y tienen una estructura mucho
más simple. Sin embargo, convergen a velocidad lineal, lo que puede resultar demasiado lento
en algunos casos.

155
Métodos de resolución de ecuaciones no lineales II: Métodos que no requieren derivadas y de primer orden

Estos métodos se desarrollaron con el formato de punto fijo, x = g(x), donde x y g(x) son
vectores de variables de n corrientes.
Estos métodos se utilizan a menudo en la convergencia de las corrientes de recirculación,
siendo normalmente x una estimación inicial de la corriente, y g(x) el valor calculado después
de realizar los cálculos de las unidades conectadas por el diagrama de flujo hasta volver a la
corriente de recirculación (después de un paso completo por el diagrama de flujo).

5. MÉTODOS DE SUSTITUCIÓN DIRECTA

El método más sencillo para el modo del punto fijo es el de sustitución directa. En este caso se
define xk+1 = g(xk), con un valor inicial estimado de x0. Se considera una expansión en serie
de Taylor de la función g (x):
T
⎛ ∂g ⎞
( ) (
g x k = g x k −1 + ⎜ ⎟) (
x k − x k −1 + ... )
⎝ ∂x ⎠ x k −1
Si se supone que ∂ g /∂x ≠0, por lo que éste es el término dominante cerca de la solución x*.
Si se supone también que es prácticamente constante cerca de la solución, entonces:
T
⎛ ∂g ⎞
x k +1
−x =g x −g x
k
( ) (
k k −1
) =⎜ ⎟

(
x k − x k −1 )
⎝ ⎠x
x k −1

y en consecuencia para:
T
k +1 k +1 ⎛ ∂g ⎞
x − x = ∆x
k
= Γ∆x k
Γ=⎜ ⎟
⎝ ∂x ⎠
se pueden escribir las expresiones de la norma:
∆x k +1 ≤ Γ ∆x k

A partir de esta expresión se puede demostrar que la convergencia es lineal, pero la velocidad
de las iteraciones depende de ||Γ||. Si se utiliza la norma euclídea, entonces ||Γ|| = |λ|max, que es
el mayor valor propio de Γ, de tal modo que para las iteraciones se tendría:

∆x k +1 ≤ λ ( max k
) ∆x 0

Una condición necesaria y suficiente para que el método converja es que |λ|max <1. Esta
relación se conoce como una contracción “mapping” si |λ|max <1. Es más, la velocidad de
convergencia depende de la proximidad de |λ|max a cero. El número de iteraciones (niter) para
llegar a ||∆x|| < δ (una tolerancia cercana a 0) se puede estimar mediante la expresión:
[
niter ≥ ln δ / ∆x 0 / ln λ ] max

Por ejemplo, si δ = 10-4 y ||∆ x 0|| = 1, se tienen el siguiente número de iteraciones:


|λ|max = 0.1, n = 4
156
Métodos de resolución de ecuaciones no lineales II: Métodos que no requieren derivadas y de primer orden

|λ|max = 0.5, n = 14
|λ|max = 0.99, n = 916
Este método asegura una convergencia lenta pero segura. Es un método útil en el caso de que
otros métodos aplicados sean inestables. Se utiliza sobre todo en la convergencia de
recirculaciones. En las Figs. 3a y 3b se muestra la diferencia entre una convergencia rápida y
otra más lenta

Fig. 3a. Convergencia rápida Fig. 3b. Convergencia lenta

6. MÉTODOS DE RELAJACIÓN

Para problemas donde |λ|max es próximo a 1, la sustitución directa como se ha visto, tiene una
convergencia muy lenta. Para evitar este fenómeno se modifica el punto o valor de la función
g(x) de modo que se reduce |λ|max. El objetivo de este método es modificar la función de
manera que:
( ) ( )
x k +1 = h x k ≡ ϖg x k + (1 − ϖ )x k
donde ω se adapta dependiendo de los cambios en x y g(x).
Los dos métodos más utilizados para la convergencia de las recirculaciones son el método del
valor propio dominante (DEM) y el método iterativo de Wegstein.

6.1. Método del valor propio dominante (DEM)


Para este método se estima el valor de |λ|max mediante la relación:

max ∆x k
λ ≈
∆x k −1

después de, por ejemplo, 5 iteraciones.


A partir de la transformación de la ecuación del punto fijo se tiene:
∂h k
( ) (
∆x k +1 = x k +1 − x k = h x k − h x k −1 ≈ ) ∂x
( ) (
x − x k −1 = Φ x k − x k −1 )
157
Métodos de resolución de ecuaciones no lineales II: Métodos que no requieren derivadas y de primer orden

siendo Φ = ∂h/∂x = ωΓ+(1-ω)I. Se estima el factor de relajación ω de tal modo que se


minimiza |λ|max para Φ. Si ω = 1 se tiene el método de sustitución directa, para valores de
comprendidos entre 0 y1 se tiene una interpolación, y para ω>1 se tiene una extrapolación.
Para elegir un valor óptimo de ω se considera el mayor valor propio para Φ, dado por:
(Φ − θI ) = 0
sustituyendo el valor de Φ, se llega a:
[ϖ(Γ − (ϖ − 1 + θ) / ϖI )] = 0
A partir de esta expresión se deduce que (ω-1+θ)/ω corresponde al valor propio de Γ y
entonces θ = 1 +ω(λ-1). Para encontrar |θ|max es preciso calcular el mayor y el menor de los
valores propios de Γ, así como el factor de relajación. De hecho, representando |θ|max frente a
ω se puede demostrar que el óptimo ω* tiene lugar cuando:

(1 + ϖ(λ min
−1 )) = (1 + ϖ(λ
2 max
−1 ))
2
(
→ ϖ* = 2 / 2 − λmax − λmin )
λmax se puede calcular a partir de los cambios en x, aunque λmin no es tan fácil de determinar,
y para el método del valor propio dominante(DEM) se ha de hacer una suposición muy
importante que implica que λmax, λmin >0 y que λmax ≈ λmin. En definitiva, se llega a que
ω*=1/(1-λmax).
Es importante destacar que si se modifica esta suposición, y que los valores propios máximo y
mínimo de Φ son muy diferentes, el método no converge. Esta aproximación se ha hecho
extensiva al método generalizado del valor propio dominante (GDEM) en el que se estiman
varios valores propios para la determinación del siguiente paso de iteración.

6.2. Método de Wegstein


Por otro lado, el método de Wegstein calcula el factor de relajación aplicando un método de la
secante independientemente para cada componente de x:
k −1
( ) f (xx ) −− xf (x )
k
x ik +1 = x ik − f i x k k
i i
k −1
i i

Si se definen

k
fi(x ) = x – gi(x ) k k
y si =
( ) (
g i x k − g i x k −1 )
x ik − x ik −1
se tiene:
k −1
( ) f (xx ) −− xf (x )
k
x ik +1 = x ik − f i x k k
i i
k −1
i i

i [
= x − x − gi x
k k
i ( )]k x ik − x ik −1
( )
x ik − g i x k − x ik −1 + g i x k −1 ( )
[
= x ik − x ik − g i x k ( )] x k
x ik − x ik −1
( )
− x ik −1 + g i x k −1 − g i x k ( )
i

158
Métodos de resolución de ecuaciones no lineales II: Métodos que no requieren derivadas y de primer orden

[ ( )]1 −1 s
= x ik − x ik − g i x k
i

( )
= ϖ i g x k i + (1 − ϖ i )x ik

donde ωi = 1/[1 – si].


Esta aproximación funciona adecuadamente en diagramas de flujo en los que los componentes
no interaccionan excesivamente (por ejemplo, reactores sin recirculación). Las interacciones
debidas a bucles de recirculación pueden generar dificultades a este método.
Para garantizar un funcionamiento estable, los factores de relajación de ambos métodos, DEM
y Wegstein, se acotan y se evitan extrapolaciones excesivamente grandes.
Los algoritmos mencionados en este apartado 6 se pueden resumir en los siguientes pasos:
1. Comenzar con una estimación de x0 y g(x)
2. Realizar un número finito de iteraciones (normalmente entre 2 y 5) y comprobar la
convergencia en cada iteración
3. Método del valor propio dominante: Aplicar la aceleración ω*=1/(1-λmax) con un valor
acotado de ω para encontrar el siguiente punto y volver al paso 2.
Método de Wegstein: Aplicar la aceleración: ωi = 1/[1 – si]. Para un valor acotado de ωi
para encontrar el siguiente punto. Iterar hasta convergencia.
Se muestra a continuación un ejemplo para ilustrar la aplicación de los métodos de primer
orden, en el que se destaca el funcionamiento del método y la velocidad de convergencia.

Ejemplo: Resolver el sistema:


(
x 1 = 1 − 0.5 exp 0.7(1 − x 2 )
−1
)
x 2 = 2 − 0.3 exp (0.5(x 1 − x 2 ))
Utilizando el método de sustitución directa, comenzando por x1 = 0.8 y x 2 = 0.8, se estima el valor
propio máximo mediante una secuencia de iteraciones
La sustitución directa implica: xk+1 = g(xk), obteniéndose las siguientes iteraciones:

k x1k x2k
0 0.8 0.8
1 0.9248 1.3323
2 1.10378 1.0726
3 1.02478 1.10933
4 1.0368 1.12796
5 1.04284 1.11447
6 1.038503 1.11778

Este método converge hacia x1 = 1.03957 y x2 = 1.11756 en 7 iteraciones con ||∆xk|| < 10-3.
A partir de estas iteraciones se puede estimar el máximo valor propio mediante:

159
Métodos de resolución de ecuaciones no lineales II: Métodos que no requieren derivadas y de primer orden

|λ|max = ||x5 – x4||/|| x4 – x3|| = 0.6666


También a partir de ||∆x5|| = 0.01478 y δ = 10-3 se puede estimar el número de iteraciones necesarias
para del método de sustitución directa:
niter = ln(δ/||∆x 5||) / ln |λ|max = 7

El método de Wegstein es el más rápido y fiable para la convergencia de recirculaciones. Es


aplicable a cualquier número de corrientes y presenta la posibilidad de ajuste de parámetros
tales como cota superior e inferior y la aceleración del paso de iteración. En la Fig. 4. se
muestra gráficamente la aproximación del método de Wegstein, en la Fig. 5 se muestra una
ventana de HYSYS donde se pueden introducir los parámetros de este método

Fig. 4. Convergencia del método de Wegstein

Fig. 5. Ventana de dialogo de HYSYS para el ajuste de parámetros del método de Wegstein

160
Métodos de resolución de ecuaciones no lineales II: Métodos que no requieren derivadas y de primer orden

7. BIBLIOGRAFÍA

• AspenTech, ASPEN Plus 11.1 User guide (2002).


• Biegler, L.T., Grossmann, I.E., Westerberg, A.W., “Systematic Methods of Chemical
Process Design”, Prentice Hall, Nueva Jersey (1997).
• Hyprotech, HYSYS user’s guide.
• Seider, W.D., Seader, J.D., Lewin, D.R., “Process Design Principles”, John Wiley & Sons,
Nueva York (1999)

161
II. Simulación de procesos en la industria
química y de procesos: HYSYS

Recirculaciones: partición y
seccionado de corrientes
Susana Luque Rodríguez

Departamento de Ingeniería Química


y Tecnología del Medio Ambiente
Universidad de Oviedo
Recirculaciones: partición y seccionado de corrientes

ÍNDICE

1. INTRODUCCIÓN ....................................................................................................165
2. PARTICIONADO (PARTITIONING).....................................................................166
3. SECCIONADO (TEARING)....................................................................................168
4. EFECTO DE LAS ESTRATEGIAS DE SECCIONADO SOBRE LOS
MÉTODOS TIPO NEWTON ..................................................................................175
5. DESCOMPOSICIÓN PARA SIMULACIÓN ORIENTADA A ECUACIONES 177
6. BIBLIOGRAFÍA ......................................................................................................178

1. INTRODUCCIÓN

En este tema se van a abordar tres aspectos relacionados con la topología de los diagramas de
flujo y las recirculaciones: particionado (partitioning), establecimiento de orden para
resolución (precedence ordering) y seccionado de corrientes (tearing). Para definir estos
conceptos usaremos un diagrama de flujo ejemplo de la bibliografía (Biegler et al., 1997, p.
272), mostrado en la figura 1, el cual queremos resolver de la forma más eficaz posible.

Figura 1. Diagrama de flujo ejemplo para el particionado y establecimiento de orden (Biegler


et al., 1997).
165
Recirculaciones: partición y seccionado de corrientes

2. PARTICIONADO (PARTITIONING)

En el diagrama de flujo de la figura 1, las unidades A, B, C, D y E se encuentran en un bucle


(con recirculación) y, por lo tanto, tendrán que ser calculadas conjuntamente. Observando con
detalle, se puede concluir que las unidades F y G también se tienen que añadir al grupo
anterior, que se puede resolver en primer lugar, dado que no hay recirculaciones de otras
unidades del diagrama de flujo hacia ninguna de estas unidades.
Las unidades que se resuelven como un grupo se llaman particiones, y encontrarlas se
denomina particionado o “partitioning” mientras que el orden en que se deben resolver se
conoce como “precedence ordering”. El agrupamiento es único, mientras que el orden puede
no serlo y depende del diagrama de flujo particular.
El ejemplo es sencillo y no va a haber muchos problemas en buscar las particiones y
evaluarlas. Sin embargo, algunos diagramas de flujo tienen cientos de unidades y estas tareas
son más difíciles. Para ello, existe un algoritmo que se va a aplicar en este ejemplo.
Se puede empezar por cualquier unidad, por ejemplo, la unidad I, y ésta se pone en una lista,
llamada lista 1:
Lista 1: I
La lista se extiende siguiendo las corrientes de salida a partir de la última unidad de la lista y
continuando hasta que se encuentra una unidad repetida o bien no hay más corrientes. En el
ejemplo, I tiene una corriente de salida que entra en J, la cual a su vez tiene una corriente de
salida que va a L y así sucesivamente, obteniéndose la siguiente lista:
Lista 1: IJKLMNL
Sin embargo, la unidad L se repite en la secuencia, lo cual indica la existencia de un bucle que
va de L a M, de M a N y de N de nuevo a L. Por lo tanto estas unidades deben estar en un
grupo, por lo que se unen y consideran como una entrada única en la lista 1.
Lista 1: IJK {LMN}
Se continúa trazando el camino con corrientes de salida:
Lista 1: IJK {LMN} OPK
Y de nuevo se observa una unidad (K) que se repite, existiendo un bucle desde K al grupo
{LMN} a través de O, P y K, agrupando todas estas unidades en un bucle, la lista 1 tiene el
aspecto siguiente:
Lista 1: IJ{KLMNOP}
y continuamos, para obtener:
Lista 1: IJ{KLMNOP}SQRJ
Donde nuevamente se repite la unidad J:
Lista 1: I{JKLMNOPSQR}
En este punto no hay unidades del último grupo de las que salgan corrientes hacia otras
unidades del diagrama de flujo. Se elimina este grupo de la lista 1 y se pasa a una segunda
lista. (lista 2)
Lista 2: {JKLNOPSQR}
166
Recirculaciones: partición y seccionado de corrientes

y esas unidades se eliminan del diagrama de flujo, puesto que su análisis ha concluido.
Volviendo a la lista 1, ésta está constituida por la unidad I, que no ha sido enviada a la lista 2:
Lista 1: I
Y se buscan más corrientes de salida que no vayan a unidades ya eliminadas, observándose
que no existe ninguna, por lo que la unidad I se elimina de la lista 1 y pasa a estar a la cabeza
de la lista 2, eliminándola también del diagrama de flujo:
Lista 2: I{JKLMNOPSQR}
Lista 1:
La lista 1 está vacía y para continuar se toma otra unidad cualquiera del diagrama de flujo
restante y se coloca en la lista, por ejemplo, la unidad F:
Lista 1: F
Y nuevamente se continúa el trazado de corrientes de salida:
Lista 1: FH
y nuevamente se para, puesto que H no tiene más salidas (excepto a unidades que ya han sido
eliminadas y puestas en la lista 2), por lo que se elimina de la lista 1 y se coloca a la cabeza de
la lista 2:
Lista 2: HI{JKLMOPSQR}
Lista 1: F
Comenzando meramente en la unidad F seguimos la lista 1:
Lista 1: FGCDEABC
Observándose que la unidad C se repite, por lo que se agrupa junto con las unidades que hay
entre las dos apariciones de c:
Lista 1: FG{CDEAB}
Continuamos el trazado obteniendo:
Lista 1: FG{CDEAB}F
y agrupando F y G con las otras unidades se tiene:
Lista 1: {FGCDDEAB}
En este punto se observa que no hay más corrientes de salida, por que este grupo se elimina de
la lista 1 y se coloca a la cabeza de la lista 2, eliminando también las unidades
correspondientes del diagrama de flujo:
Lista 2: {FGCDEAB}HI{JKLMNOPSQR}
Lista 1:
La lista 1 está vacía y ya no quedan más unidades en el proceso, con lo cual se ha acabado el
análisis. La lista 2 es l lista de particiones con un orden de cálculo. Se puede resolver primero
la partición {FGCDEAB}, luego la unidad H, a continuación la unidad I y finalmente la
partición restante {JKLMNOPSQR}.
El algoritmo funciona independientemente de la unidad con la que se empiece en la lista 1.
Proporciona un conjunto de particiones (es decir, de unidades agrupadas) único. Sin embargo,

167
Recirculaciones: partición y seccionado de corrientes

el orden entre particiones puede variar, aunque ello no sucede en este ejemplo sencillo que se
acaba de emplear.

3. SECCIONADO (TEARING)

El siguiente paso es cómo se van a resolver las particiones que contienen más de una unidad.
En el ejemplo hay dos. La primera es sencilla, por lo que se va a ilustrar la metodología de
seccionado aplicada a la segunda (más grande), cuyo diagrama de flujo se muestra en la figura
2.
En esta parte del diagrama de flujo se ven que en algunas unidades hay una sola corriente que
entra y una sola que sale, por lo que éstas unidades se pueden eliminar, ya que no añaden nada
a la topología del diagrama base, quedando el diagrama como se muestra en la figura 3.

Figura 2. La segunda partición del diagrama Figura 3. Reducción de la segunda partición


de flujo de la figura 1. Todas las del diagrama de flujo mostrada en la
corrientes y unidades que no figura 2. La reducción se consigue
pertenecen a esta partición se han eliminando las unidades que tiene
eliminado (Biegler et al., 1997). una sola entrada y una sola salida
(Biegler et al., 1997).

El diagrama se puede rescribir de forma esquemática y numerando las corrientes como se


muestra en la figura 4.
Comparando las figuras 2 y 3, se observa que si se decide seccionar la corriente 8 (la unión
entre S y K) sería posible seleccionar para seccionar cualquier otra de las corrientes que hay
en el camino ente ambas unidades. Para problemas pequeños como éste, es posible encontrar
un buen sistema de seccionado mediante inspección directa, pero en diagramas más complejos
se necesita un procedimiento sistemático. La selección de la(s) corriente(s) a seccionar es muy

168
Recirculaciones: partición y seccionado de corrientes

importante, porque el funcionamiento de los algoritmos de punto fijo depende en gran medida
de dicha elección.

Figura 4. Topología de la partición de la figura 3 (Biegler et al., 1997).

Con este objetivo se va a considerar inicialmente un método genérico sencillo, que


posteriormente se utilizará para introducir otras metodologías habitualmente empleadas. El
método trata el problema de elección de corrientes a seccionar como una optimización con
variables binarias (0-1) o como una programación entera. Introducido en 1973, se conoce
como “set covering problem” y permite una flexibilidad considerable en la selección del
sistema deseado de corrientes seccionadas. Además, la formulación con variables enteras
permite interpretar una gran variedad de métodos basados en la teoría gráfica de un modo
compacto. La selección se trata como un problema de minimización (del número de corrientes
o variables seccionadas) sujeto a la restricción de que se deben romper todos los bucles al
menos una vez. El primer paso es la identificación de bucles, lo cual se ilustrará con el
siguiente ejemplo.

Ejemplo: Búsqueda de bucles en la figura 4


Comenzamos con cualquier unidad en la partición; por ejemplo, la unidad K
K − (1) → L − (2) → M − (3) → L
Y observamos que L se repite, por lo que las dos corrientes 2 y 3 que conectan las dos apariciones de L
se sitúan en una lista de bucles, denominada lista 3:
Lista 3: {2, 3}
Comenzamos de nuevo en la unidad justo antes del bucle y buscamos otros caminos alternativos:
K − (1) → L − (2) → M − (3) → L

(7) → S − (8) → K
Ahora K se repite, por lo que se colocan las corrientes {1, 2, 7, 8} en la lista de bucles:
Lista 3: {2, 3}, {1, 2, 7, 8}

169
Recirculaciones: partición y seccionado de corrientes

Volvemos a S y buscamos un camino alternativo que salga de esta unidad, encontrando que no hay. En
M sucede lo mismo. Si volvemos a L encontramos otro camino alternativo:
K − (1) → L − (2) → M − (3) → L
│ │
│ (7) → S − (8) → K

(4) → O − (5) → K
repitiéndose nuevamente K, por lo que se añade {1, 4, 5} a la lista de bucles:
Lista 3: {2,3}, {1, 2, 7, 8}, {1, 4, 5}
Volviendo a la unidad O en la última rama, es posible identificar otro camino alternativo:

K − (1) → L − (2) → M − (3) → L


│ │
│ (7) → S − (8) → K

(4) → O − (5) → K

(6) → S − (8) → K
en la nuevamente se repite K, por lo que se coloca {1, 4, 6, 8} en la lista de bucles:
Lista 3: {2,3}, {1, 2, 7, 8}, {1, 4, 5}, {1, 4, 6, 8}
Volviendo a S, O, L y finalmente a K, se encuentra que ninguna de estas unidades tienen caminos
alternativos saliendo de ellas. Dado que se ha regresado a la primera unidad de la lista, el análisis está
completo y hay únicamente cuatro bucles en esta partición. Un listado de los mismos en una tabla de
incidencias se muestra a continuación:

Tabla 1.Tabla de incidencias de bucles para la partición


Corriente
Bucle 1 2 3 4 5 6 7 8
1 X X
2 X X X X
3 X X X
4 X X X X

La tabla de incidencias es la base para una matriz, A, con elementos:


aij = 1 si la corriente j está en el bucle i
0 en caso contrario
De este modo, la estructura de la matriz es idéntica a la tabla de incidencias. Se define a
continuación la selección de las corrientes a seccionar a través de una variable entera yj para
cada corriente j. Los valores óptimos de estas variables determinan:
yj = 1 si la corriente j se secciona
0 en caso contrario
Para asegurar que cada bucle se rompe al menos una vez por seccionado de corriente, se
escriben las siguientes restricciones para cada bucle i:
170
Recirculaciones: partición y seccionado de corrientes

n
∑ a ij y j ≥ 1 i= 1, L
j =1

donde n es el número de corrientes y L el número de bucles. Una vez se dispone de las


ecuaciones de los bucles, se formula una función objetivo coste para la sección de corrientes a
seccionar:
∑wj yj
j

y asignamos un valor wj al coste de seccionar la corriente j. Este coste frecuentemente lo dicta


el tipo de problema de convergencia de recirculación. Los métodos más populares para ello
son:
• wj = 1 (todas las corrientes iguales) lo cual permite minimizar el número de
corrientes seccionadas. Esta opción origina que se obtengan muchos sistemas
de corrientes seccionadas posibles. Es el caso más común.
• wj = nj, donde nj es el número de variables en la corriente j.
• wj = Σ aij (suma de las restricciones del bucle) el coeficiente que se obtiene
indica el número de bucles que se rompen si se secciona la corriente j. Romper
un bucle más de una vez origina un retraso en la iteración de variables en el
algoritmo de punto fijo y un peor funcionamiento del mismo. Minimizando el
número de bucles que se rompen simultáneamente se busca un sistema de
ecuaciones de seccionado no redundante para mejorar el funcionamiento del
algoritmo.
El “set covering problem” viene entonces dado por:
n
Min ∑ w j y j
yj
j =1
n
donde ∑ a ij y j ≥ 1 i=1–L
j =1
yj = {0, 1}
La solución a este problema es combinatorial y una cota superior del número de alternativas
es 2n. Sin embargo, con sencillas reglas de reducción se puede hacer este problema y el
subsiguiente esfuerzo para su resolución mucho menor. Las reglas permiten aplicar el “set
covering problem” sólo a las variables enteras que permanecen después de su reducción. Para
facilitar la solución, la metodología más extendida es la de rama y acotamiento (Branch &
Bound), aunque hay algoritmos más eficaces especializados para este tipo de problemas.
Se define ri como el vector fila i de la matriz A y cj como el vector columna de la matriz A.
Las siguientes propiedades permiten reducir el tamaño del problema:
• Si ri tiene solo un elemento distinto de 0, (ri)k, hacer yk = 1 y elegir la corriente k
para seccionar. Se eliminan esta fila y columna, dado que es un bucle de una
corriente consigo misma.
• Si la fila k domina la fila l (todas las corrientes de l están también en k), entonces
se borra rk (una corriente seccionada en rl automáticamente satisface rk). Es un
bucle cubierto con otro bucle.

171
Recirculaciones: partición y seccionado de corrientes

• Si ck domina cj y wk ≤ wj, o para algún grupo de columnas, S, ΣkεS ck domina cj y


ΣkεS wk ≤ wj, entonces se puede eliminar la columna j, dado que yk siempre
contendrá la solución óptima.
Estas reglas se aplican sistemáticamente para reducir la matriz de bucles. Si no proporcionan
mejora es preciso iniciar una búsqueda combinatorial en las corrientes a seccionar restantes.
No obstante, las soluciones óptimas generadas por este procedimiento de reducción y
búsqueda no son únicas si las desigualdades en wj no son estrictas. En estos casos, este
procedimiento encontrará un sistema óptimo de seccionadas, pero pueden existir otras
soluciones que funcionen con una eficacia análoga.
Para ilustrar la aplicación de estas reglas, se continuará con el ejemplo anteriormente visto

Ejemplo: Seccionado de corrientes


Consideramos ahora la partición del diagrama de flujo del ejemplo anterior. De la tabla 1 se puede
obtener la matriz de bucles directamente, como se muestra en la tabla 2:

Tabla 2.Matriz de incidencia de bucles, A, para la partición de la figura 4


Corriente
Bucle 1 2 3 4 5 6 7 8
1 1 1
2 1 1 1 1
3 1 1 1
4 1 1 1 1

Para resolver este problema, se van a considerar dos casos posibles:


1.Minimización del número de corrientes a seccionar
2.Minimización del número de veces que se rompen los bucles
y se van a emplear las propiedades de reducción en la matriz A.

Caso 1. Minimización del número de corrientes a seccionar


En este caso, se especifican todos los valores wj de las corrientes como la unidad. Tras
inspeccionar la matriz A, se observa que no hay ninguna fila que domine, por lo que no es
posible eliminar ninguna por ahora.
Por otro lado, la columna 2 domina a la 3, la columna 4 domina a las columnas 5 y 6 y la columna 1
domina a las columnas 4, 7 y 8.Por lo tanto, eliminando las corrientes 3, 4, 5, 6, 7 y 8 se llega a la
siguiente tabla reducida:
Corriente
Bucle
1 2
1 1
2 1 1
3 1
4 1

172
Recirculaciones: partición y seccionado de corrientes

A continuación, puesto que las filas 2 y 4 dominan a la fila 3, es posible eliminar dichas filas 2 y 4, y
obtener una representación mínima del problema:
Corriente
Bucle
1 2
1 1
3 1

Ambas filas tienen sólo un elemento y es preciso seleccionar las corrientes 1 y 2 para romper los
bucles. Este es el mínimo número de corrientes a seccionar. Sin embargo, el bucle 2, con corrientes {1,
2, 7, 8} se rompe dos veces. Siguiendo la información de la figura 4, el primer paso sería suponer
inicialmente los datos de la corriente 2 y luego calcular la unidad M, lo cual permite obtener la
corriente 3, que junto con una estimación inicial de la corriente 1 permite calcular la unidad L.
Continuando con el diagrama de flujo, se tiene que el orden de cálculo de las unidades es MLOSK,
como se muestra a continuación:

Las consecuencias que esta selección tiene sobre la doble ruptura del bucle 2 (marcado con líneas
gruesas) son evidentes. Para la resolución de esta partición, se han de estimar las corrientes 1 y 2 y se
calculan el resto en el orden mostrado. El nuevo valor que la unidad L calcula para la corriente 2
influye en el siguiente cálculo de M, pero dicho cálculo se basa en el valor anterior de 1. El nuevo
valor de 1 impactará en el siguiente cálculo de L pero no de la unidad M. En realidad, impacta L y
todas las unidades siguientes cuando el cálculo se realiza la segunda vez. Su nuevo valor no afectará M
hasta que calculemos esa unidad una tercera vez.. Esto retrasa la transmisión de información en este
bucle un poco y reduce la velocidad de convergencia para la sustitución sucesiva.

Caso 2. Minimización del número de veces que se rompen los bucles


En este caso los valores de wj para la función objetivo vienen dados por wj = ∑i aij , que es la suma
para cada corriente de los valores de su columna correspondiente. Dado que los wj son distintos, las
reducciones de filas y columnas del caso anterior no son aplicables. En su lugar calculamos wj y
adicionamos el valor a la información de la matriz A.

Tabla 3.Matriz de incidencias, A, para la minimización del número de veces que se rompen los bucles
Corriente
Bucle 1 2 3 4 5 6 7 8
w1 = 3 w2 = 2 w3 = 1 w4 = 2 w5 = 1 w6 = 1 w7 = 1 w8 = 2
1 1 1
2 1 1 1 1
3 1 1 1
4 1 1 1 1

No hay líneas dominantes de nuevo, pero hay combinaciones de columnas que dominan otras:
• Las columnas 3 y 7 dominan a la columna 2 [(w3 + w7) ≤ w2]

173
Recirculaciones: partición y seccionado de corrientes

• Las columnas 5 y 6 dominan a la columna 4


• Las columnas 5, 6 y 7 dominan a la columna 1
• Las columnas 6 y 7 dominan a la columna 8
Lo cual lleva a la siguiente matriz reducida:

Corriente
Bucle 3 5 6 7
w3 = 1 w5 = 1 w6 = 1 w7 = 1
1 1
2 1
3 1
4 1

Como hay solo un elemento en cada fila, se ha alcanzado una solución óptima ( ∑ w j y j = 4 ) con las
j
corrientes 3, 5, 6 y 7 que rompen cada bucle una sola vez.
Sin embargo, hay varias soluciones óptimas en este caso. Por ejemplo, se pueden seccionar las
corrientes 1 y 3, que por inspección también se ve que es una solución óptima. En realidad, tenemos
una familia de soluciones óptimas: {1, 3}, {3, 5, 8}, {3, 5, 6, 7}, {2, 5, 6}, {2, 4}, {3, 4, 7}, siendo todas
ellas no redundantes.
Si elegimos la solución {1, 3}, se puede entonces calcular la unidad L, que proporciona las corrientes 2
y 4. A continuación, se pueden calcular las unidades O y M en cualquier orden, dando las corrientes 5,
6 y 7, lo cual permite calcular la unidad S y finalmente la unidad K.

El orden no es necesariamente único, puede ser LOMSK o bien LMOSK.


Si decidimos resolver el diagrama de flujo por sustituciones sucesivas, se elige un grupo de corrientes
a seccionar y se estiman inicialmente sus valores. Supóngase que se elige {1, 3}. En este caso se
pueden calcular las unidades en el orden LOMSK, lo cual permite obtener nuevos valores de las
corrientes 1 y 3. A continuación se usan éstos valores calculados comenzando de nuevo el cálculo
LMOSK y repitiendo hasta lograr la convergencia.
Estas familias de grupos de corrientes a seccionar (por ejemplo, {1, 3} y {3, 5, 6, 7}) proporcionan los
mismos valores de las variables de las corrientes si se emplea un algoritmo de sustitución directa.
También hay algoritmos basados en teoría gráfica para identificar las familias de grupos de variables a
seccionar no redundantes, y -por lo tanto- para generar corrientes a seccionar que presentan una
convergencia más rápida.

174
Recirculaciones: partición y seccionado de corrientes

4. EFECTO DE LAS ESTRATEGIAS DE SECCIONADO SOBRE


LOS MÉTODOS TIPO NEWTON

En último lugar, se va considerar el empleo un algoritmo de Newton o quasi–Newton en la


convergencia de un diagrama de flujo en modo modular. Para ello se forma (o aproxima) la
matriz jacobiana por las ecuaciones de las corrientes seccionadas. Se rescriben las ecuaciones:
x = g(x) f(x) = x – g(x) = 0
donde x son valores de las corrientes seccionadas y g(x) es el valor calculado tras dar un paso
por las unidades del bucle. Estas ecuaciones se resuelven mediante las iteraciones de Newton–
Raphson o Broyden aplicadas a f (x) = 0.
Un caso extremo para resolver las ecuaciones es seccionar todas las corrientes en los bucles.
Aplicado al ejemplo que se ha analizado, por ejemplo, para la unidad K:
S1 = G(S5, S8) o bien F(S1, S5, S8) = S1 – G(S5, S8) = 0
En este caso, se define el vector SJ como los valores de la corriente J y G(*,*) representa
funciones implícitas que relacionan las corrientes de salida de una unidad con las de entrada.
Escribiendo ecuaciones análogas para todas las unidades se llega a obtener un sistema de
ecuaciones de las corrientes. La linealización de dicho sistema leva a las ecuaciones que
definen el paso de Newton, como se ha visto en los temas anteriores y se ilustra en la figura 5.
En la matriz de las ecuaciones se observa que la diagonal es la matriz identidad mientras que
los elementos que no están en la diagonal son los jacobianos ∂G ∂SI con respecto a las
corrientes de entrada, SI.
Para apreciar el efecto de la selección de corrientes a seccionar, una corriente que no ha
convergido corresponde a FJ ≠ 0. Por otro lado, si una corriente se calcula directamente
como salida de una unidad, el término de la derecha correspondiente es nulo. Por lo tanto, si
se seccionan todas las variables, todos los elementos del término de la derecha en la figura 5
la derecha serían vectores no nulos. Si sólo se seccionasen 1 y 3, solo F1 y F3 serían no nulos,
como se muestra en la figura 6.

Figura 5. Ecuaciones linealizadas para la partición del diagrama de flujo (Biegler et al., 1997).

En el caso de que todas las unidades sean lineales, las estrategias de sustitución directa de
primer orden siguen estando afectadas por la selección del sistema de corrientes seccionadas y
por el acondicionamiento (y los valores propios) de las matrices unidad. Por otro lado, en un
175
Recirculaciones: partición y seccionado de corrientes

sistema lineal, el método de Newton converge en solo una iteración, independientemente de la


localización de los elementos no nulos en la matriz de la derecha. A partir de esto es posible
generalizar una observación importante:
Mientras que todos los bucles de recirculación se rompan, la selección de las corrientes a
seccionar tiene poca influencia en la velocidad de convergencia con los métodos de Newton o
Broyden.

Figura 6. Ecuaciones linealizadas con S1 y S3 como corrientes seccionadas (Biegler et al.,


1997).

En este caso, un criterio razonable para la selección de corrientes a seccionar está basado en la
reestructuración de las filas y columnas de la matriz de la figura 6 para identificar la
estructura de una estrategia de convergencia de reciclo. En la aplicación de los métodos de
Newton o Broyden, los elementos jacobianos de las unidades individuales puede que no estén
disponibles directamente. En su lugar, se emplean aproximaciones por perturbaciones finitas
diferenciales de las fórmulas quasi–Newton. Por ello, no es necesario mantener la estructura
lineal de la matriz I.
En su lugar, se separan las corrientes y ecuaciones a seccionar y se permutan el resto de las
variables de corrientes y ecuaciones para obtener una forma de bloque triangular. Por ejemplo,
si elegimos S1 y S3 y éstas se mantiene constantes, es fácil ver que las corrientes en la
diagonal se pueden calcular directamente de corrientes que se determinan a partir de S1 y S3.
Consecuentemente, S2, S4, S5, S6, S7 y S8 son funciones implícitas de S1 y S3 y pueden
eliminarse simbólicamente del sistema de ecuaciones, lo cual resulta en un sistema a resolver
mucho más pequeño, con solo las variables de corrientes S1 y S3. Dado que la matriz
jacobiana se constituye por diferencias finitas, una metodología con menos variables es
siempre más sencilla de implementación.
Por ello, para los métodos de Broyden o Newton, es deseable obtener el mínimo número de
variables de corrientes que rompen todos los bucles de recirculación.

176
Recirculaciones: partición y seccionado de corrientes

5. DESCOMPOSICIÓN PARA SIMULACIÓN ORIENTADA A


ECUACIONES

Dado que la simulación orientada a ecuaciones considera el conjunto entero de ecuaciones del
diagrama de flujo y adopta una estrategia simultánea para su resolución, parecería que no
sería tan necesario el análisis de la estructura del diagrama de flujo. En realidad las estrategias
de descomposición son una parte importante de este modo simultáneo, pero se introducen en
una etapa posterior, durante la resolución de las ecuaciones. En estos casos, el método de
Newton es el más eficaz y más habitualmente empleado para la resolución del sistema de
ecuaciones. Además, se suelen introducir varias modificaciones del mismo, para asegurar la
convergencia en un amplio intervalo de problemas no lineales.
Sin embargo, a la vez que un problema de simulación orientado a ecuaciones se hace mayor,
el coste computacional dominante corresponde a la evaluación del paso de Newton a través de
la resolución de un sistema de ecuaciones lineales:
(Jk) pk = - f(xk)
Para problemas de diagramas de flujo a gran escala, se ha visto en los temas anteriores que las
ecuaciones y la matriz J tiene una estructura dispersa. En problemas con más de unos pocos
cientos de variables, es importante explotar esta estructura tanto para una eficaz
descomposición de J y la subsiguiente resolución del sistema de ecuaciones lineales, como
para el almacenamiento de la matriz descompuesta. De otro modo, si no se explota la
estructura dispersa de la matriz para un sistema de n ecuaciones, el número de elementos a
almacenar es n2 y el coste computacional para descomponer la matriz correspondiente es
proporcional a n3. Consecuentemente, incluso para sistemas relativamente pequeños de 1000
variables y ecuaciones, el gasto computacional puede ser muy elevado. Por otro lado, si se
tiene en cuenta que la mayor parte de estos elementos son nulos (y la descomposición se
organiza de modo que permanezcan como valores nulos durante el proceso de resolución),
entonces en muchos casos tanto el almacenamiento como el esfuerzo computacional para
calcular el paso de Newton pueden llegar a crecer sólo linealmente con el tamaño del
problema, en el mejor de los casos.
En la actualidad existen varios algoritmos y paquetes informáticos excelentes fácilmente
accesibles y aplicables de a los problemas de simulación de procesos. En general estos
métodos se pueden clasificar en estructuras especializadas y generales. En el primero de estos
tipos, se tiene matrices que presentan una estructura regular, la cual no cambia con el tamaño
del problema; ejemplos de esto son matrices con los elementos no nulos agrupados alrededor
de la diagonal, matrices aproximadamente diagonales y matrices con una estructura de bloque
en sus bordes. Por otro lado, la descomposición de estructuras generales requiere un análisis
previo de la estructura y determinación de la secuencia de descomposición que reduzca la
aparición de nuevos elementos no nulos y no incremente las necesidades de almacenamiento.
Con este objetivo se emplean reglas heurísticas, que se encuentran a su vez implementadas en
las rutinas de cálculo.
Como resultado, los algoritmos basados en el método de Newton para la resolución de
sistemas de ecuaciones no lineales y los métodos de descomposición para la descomposición
de la matriz dispersa del sistema lineal son aspectos clave en un simulador orientado a
ecuaciones.

177
Recirculaciones: partición y seccionado de corrientes

6. BIBLIOGRAFÍA
• AspenTech, ASPEN Plus 11.1 User guide (2002).
• Biegler, L.T., Grossmann, I.E., Westerberg, A.W., “Systematic Methods of Chemical
Process Design”, Prentice Hall, Nueva Jersey (1997).
• Hyprotech, HYSYS user’s guide.
• Scenna, N.J. (Ed.), “Modelado, Simulación y Optimización de Procesos Químicos”,
Universidad Tecnológica Nacional, F.R. Rosario (1999). Versión electrónica
http://www.modeladoeningenieria.edu.ar
• Seider, W.D., Seader, J.D., Lewin, D.R., “Process Design Principles”, John Wiley & Sons,
Nueva York (1999)

178
II. Simulación de procesos en la industria
química y de procesos: HYSYS

Simulación en diseño y operación de


procesos. Aplicaciones
Aurelio B. Vega Granda

Departamento de Ingeniería Química


y Tecnología del Medio Ambiente
Universidad de Oviedo
Simulación en diseño y operación de procesos. Aplicaciones

ÍNDICE

1. PROCESO DE PRODUCCIÓN DE PROPILENGLICOL..................................181


2. SELECCIÓN DE UN MODELO DE PROPIEDADES ........................................182
2.1. Cálculo de los coeficientes binarios de interacción.............................................184
3. DEFINICIÓN DE LA REACCIÓN QUÍMICA ....................................................184
4. ENTORNO DE SIMULACIÓN ..............................................................................187
4.1. Definir las corrientes de alimentación .................................................................187
4.2. Añadir la operación unitaria Mixer .....................................................................187
4.3. Añadir la operación reactor CSTR ......................................................................188
4.4. Añadir la columna de destilación ........................................................................190
5. RESULTADOS..........................................................................................................193
6. BIBLIOGRAFÍA ......................................................................................................194

1. PROCESO DE PRODUCCIÓN DE PROPILENGLICOL

El propilenglicol (12-C3diol) se obtiene por reacción del óxido de propileno (12C3Oxide) y


agua, y posterior separación en una columna de destilación. En la figura se presenta un
diagrama de flujo del proceso.

Las condiciones de las corrientes de alimentación al sistema, se indican en la Tabla siguiente.


Las corrientes de alimentación se mezclan previamente en un mezclador (Mixer). La corriente
resultante se introduce en un reactor CSTR que funciona a temperatura constante de 60 ºC y a
presión de 1.1 atm. El reactor tiene un volumen de 7.929 m3, se supone caída de presión nula,
y se mantiene un nivel de líquido de 85 %.
La reacción química que tiene lugar es:
H2O + C3H6O → C3H8O2

181
Simulación en diseño y operación de procesos. Aplicaciones

Nombre Prop Oxide Water Feed


Temperatura (ºC) 23.89 23.89
Presión (atm) 1.1 1.1
Flujo molar (kgmole/h) 68.04
Flijo másico (kg/h) 4990
Composición de las corrientes
Óxido de propileno 1 0
Agua 0 1
Propilenglicol 0 0

Los datos cinéticos para esta reacción son:


⎛ −E ⎞
⎜ ⎟
r = Ae ⎝ RT ⎠
C OP A = 1.7 × 1013 lbmol/ft3 E = 7.5 × 104 kJ/kgmol-K
Siendo COP la concentración molar de óxido de propileno en lbmol/ft3.

2. SELECCIÓN DE UN MODELO DE PROPIEDADES

Lo primero que hay que hacer es seleccionar el modelo de propiedades (Fluid Package)
dentro del Simulation Basis Manager que será lo primero que aparece si se inicia un nuevo
caso. Aquí presionando sobre el botón Add añadiremos un nuevo modelo.

La elección del paquete de propiedades de realiza en la página Prop Pkg. En nuestro ejemplo
elegiremos UNIQUAC.

182
Simulación en diseño y operación de procesos. Aplicaciones

El siguiente paso es añadir los componentes utilizados en la simulación, pera ello se


selecciona la página Components.

En la casilla Match, se introduce H2O (o water). Una vez aparece el componente en azul, se
presiona el botón Add Pure, o se presiona la tecla Enter. En la sección Current Component
List aparecerá H2O. Se vuelve a la casilla Match, se hace clic para marcar el componente
anterior y se introduce el siguiente componente PropylenOxide, se presiona Add Pure, y se
repite el procedimiento con el PropylenGlycol.
Una vez seleccionados todos los componentes aparecerá en la pantalla, dentro de la sección
Current Component List, una lista con los tres componentes adicionados.

183
Simulación en diseño y operación de procesos. Aplicaciones

2.1. Cálculo de los coeficientes binarios de interacción


Ir a la página Binary Coeffs, si aparecen algunos coeficientes binarios sin calcular (esto es, si
hay guiones de color rojo), presionar el botón Unknowns only

3. DEFINICIÓN DE LA REACCIÓN QUÍMICA

Se cierra el Fluid Package:


Basis 1, y una vez en el
Basis Manager se va a la
página Reactions. Se
presiona el botón Add
Comps.... Aparecerán los
componentes en el recuadro
Selected Reaction
Components, y se debe
pulsar en Add This Group of
Components, después cerrar
el formulario.
En el Simulation Basis Manager en la pestaña Reactions habrán aparecido los componentes
adicionados dentro de la sección Rxn Components. Pulsar ahora sobre el botón Add Rxn para
añadir la reacción.

184
Simulación en diseño y operación de procesos. Aplicaciones

Aparecerá una pantalla titulada Reactions donde se debe elegir el tipo de reacción a definir.
En nuestro caso seleccionaremos Kinetic.

Agregar los componentes de la reacción seleccionándolos de la lista desplegable en el campo


superior de la pantalla. Aparecerán los pesos moleculares de cada componente. Completar los
coeficientes estequiométricos, recordando que se deben poner valores negativos para los
reactivos y positivos para los productos. Verificar que el campo denominado Balance Error
sea igual a cero. Nótese que los órdenes de reacción aparecen automáticamente, y son iguales
a los coeficientes estequiométricos, aunque se pueden modificar. De hecho el orden respecto
del agua es cero.
Pasar a la página Basis donde seleccionaremos Molar Concn, en el campo Base Component
colocaremos 12C3Oxide seleccionándolo de la lista desplegable del campo superior. En el
campo Rxn Phase seleccionar CombinedLiquid. Tener en cuenta las unidades de las
velocidades de reacción y de la base, ya que son las que determinarán las unidades de la
constante de velocidad en la ecuación de Arrhenius.

Pasar a la página Parameters e introducir los valores de los parámetros de la reacción con las
unidades correspondientes. Para el caso de E, es posible introducir el valor y seleccionar la
unidad correspondiente de la lista desplegable.

185
Simulación en diseño y operación de procesos. Aplicaciones

Una vez introducidos todos los datos el cartel en rojo Not Ready cambiará por el de Ready en
color verde, indicándonos que HYSYS ya cuenta con datos suficientes para la reacción
elegida.
La reacción que hemos definido se encuentra dentro del grupo de reacciones denominado
Global Rxn Set, y es necesario adicionarlo al paquete de propiedades que hemos definido,
para ello en la página Reactions se pulsa sobre el botón Add to FP. Aparecerá una pantalla
titulada Add “Global Rxn Set”, donde seleccionaremos el paquete Basis-1 NC-3
PP:UNIQUAC, y cuando se haya coloreado de azul pulsaremos sobre el botón Add Set to
Fluid Package. La palabra Basis-1 aparecerá en el recuadro Assoc. Fluid Pkgs.

Hasta aquí hemos definido las bases del caso. Pulsando sobre el botón Return to Simulation
Environment entraremos en el entorno de simulación.

186
Simulación en diseño y operación de procesos. Aplicaciones

4. ENTORNO DE SIMULACIÓN

4.1. Definir las corrientes de alimentación


Al entrar en el entorno de simulación, y dependiendo de la configuración del programa
entraremos en una ventana denominada PFD (Process Flow Diagram) o en la ventana
correspondiente al Workbook.
Si entramos en el Workbook definiremos en primer lugar las corrientes de alimentación,
posicionándonos en la celda **New** y añadiendo además del nombre los datos que se han
indicado al principio.
En la pestaña Compositions se añaden las composiciones de las corrientes, con lo cual quedan
definidas completamente las alimentaciones al mezclador y en consecuencia se calcularan el
resto de sus propiedades mediante un flash.

4.2. Añadir la operación unitaria Mixer


A continuación en la pestaña Unit Ops procederemos a añadir la operación unitaria Mixer,
para lo cual pulsamos sobre el botón Add UnitOp. Aparecerá una nueva ventana en la cual
podremos seleccionar la unidad Mixer.

187
Simulación en diseño y operación de procesos. Aplicaciones

Al pulsar sobre el botón Add aparecerá el formulario de entrada de datos del Mixer. En él
indicaremos los nombres de las corrientes de alimentación y de salida. Estos datos son
suficientes para llevar a cabo los cálculos necesarios para determinar las propiedades de la
corriente de salida del Mixer.

4.3. Añadir la operación reactor CSTR


Al igual que se hizo con el Mixer se
añade el reactor CSTR. En la página
de conexiones se introducen los
nombres de las corrientes
correspondientes como se hizo en la
unidad anterior. En la página de
parámetros se introduce el volumen
del reactor, 7.929 m3, el nivel de
líquido en el reactor y se selecciona
Cooling (la reacción es exotérmica y
por tanto es preciso refrigerar el
reactor)

En la pestaña Reactions hay que


asignar un conjunto de reacciones al
reactor. Se abre el menú desplegable
de la celda Reaction Set y se
selecciona Global Rxn Set, con lo que
aparecerá el cartel amarillo indicando
que está sin especificar el flujo de
energía en el reactor. Esto es debido a
que el reactor tiene un grado de
libertad. En este punto hay que
especificar o la temperatura de la
corriente de salida (en cuyo caso
HYSYS calculará el flujo de energía)
o bien el flujo de energía en el reactor

188
Simulación en diseño y operación de procesos. Aplicaciones

(en cuyo caso HYSYS calculará la temperatura de la corriente de salida).


En principio vamos a suponer que el reactor opera de forma isotérmica, de manera que en la
pestaña Worksheet especificamos 23.89 ºC para la corriente de salida del reactor. HYSYS
calculará el proceso. No hay cambio de fase en el reactor bajo condiciones isotérmicas por lo
que el flujo de la corriente de vapor es cero. A continuación vamos a examinar la conversión
alcanzada en el reactor. Para ello nos dirigimos a la pestaña Reactions del reactor y
seleccionamos la página Results, con lo que veremos que la conversión es muy baja 40.3 %.

Para aumentar la conversión entorno al 85-95 % se tiene que aumentar la temperatura del
mismo, de manera que vamos aumentar la temperatura de la salida del reactor hasta
conversión aproximada del 95 %. Veremos como a 60 ºC la conversión es del 94.7 %.

189
Simulación en diseño y operación de procesos. Aplicaciones

4.4. Añadir la columna de destilación


HYSYS dispone de una serie de plantillas de columna preconstruidas que se pueden instalar y
personalizar cambiando las corrientes de conexión, el número de etapas y las especificaciones
por defecto. Entre éstas se encuentra la columna de destilación, que añadiremos de la misma
forma que hicimos con el resto de operaciones unitarias.

Cuando se instalan columnas preconstruidas HYSYS proporciona cierta información por


defecto, como por ejemplo 10 etapas en la columna, más condensador y más calderín. En la
primera pantalla hay que especificar el número de etapas, las corrientes de alimentación y de
salida, plato de las alimentaciones, y si el condensador es total o parcial.
Al pulsar sobre el botón Next (que solamente está activo cuando se han introducido todos los
datos necesarios) aparece otro formulario donde hay que especificar el perfil de presiones en
la columna a través de las presiones en el condensador y calderín. La siguiente página
corresponde a opciones de estimación que no son necesarias. La siguiente página es la final y
190
Simulación en diseño y operación de procesos. Aplicaciones

corresponde a las especificaciones. Para una columna con condensador parcial, definidas las
alimentaciones y fijados el número de platos, y perfil de presiones, quedan tres grados de
libertad, y en consecuencia son necesarias tres especificaciones que HYSYS fija por defecto
en flujo molar de líquido y vapor en cabezas, y relación de reflujo. Estas especificaciones se
pueden posteriormente cambiar y adaptar a nuestras expectativas. Usaremos 0.0 lbmol/h para
el flujo de vapor en cabezas, y 1.0 para la relación de reflujo, dejando sin valor el flujo de
líquido en cabezas. Pulsando en el botón Done aparecerá el formulario de propiedades de la
columna.

Accediendo a la página Monitor, podremos ver que el número de grados de libertad es cero,
pero también que una de las especificaciones (el flujo molar de líquido en cabezas) no tiene
asignado ningún valor (<empty>).

191
Simulación en diseño y operación de procesos. Aplicaciones

Vamos a añadir una nueva especificación. Pulsar sobre el botón Add Spec y se abrirá una
nueva ventana de especificaciones donde podemos elegir Column Component Fraction,
después pulsamos sobre Add Spec(s)..., con lo que aparecerá la vista de Comp Frac Spec.

Ahora editando el nombre de la especificación lo cambiamos a H2O Fraction, seleccionamos


la etapa Reboiler , le asignamos el valor 0.005, y especificamos como componente H2O.

Pulsamos el botón Close para volver a la vista de propiedades de la columna. La nueva


especificación aparece en la lista Column Specifications. Se desactiva la especificación de
flujo de líquido en cabezas y se activa esta ultima especificación, con lo que comenzará el
cálculo de la columna.

192
Simulación en diseño y operación de procesos. Aplicaciones

5. RESULTADOS

Pulsando sobre el icono del Workbook podremos ver los resultados del proceso completo.

193
Simulación en diseño y operación de procesos. Aplicaciones

6. BIBLIOGRAFÍA

• Hyprotech “HYSYS Tutorial & Applications” (2001).

194
III. Optimización de diagramas de flujo con
HYSYS

Introducción a la programación no
lineal (NLP) con restricciones
José Ramón Álvarez Saiz

Departamento de Ingeniería Química


y Tecnología del Medio Ambiente
Universidad de Oviedo
Introducción a la programación no lineal (NLP) con restricciones

ÍNDICE

1. INTRODUCCIÓN..........................................................................................................197
2. PROGRAMACIÓN NO LINEAL CON RESTRICCIONES ........................................198
2.1. Condiciones para que exista un óptimo en programación no lineal ....................202
3. APÉNDICE: CONCEPTOS BÁSICOS EN OPTIMIZACIÓN.....................................207
3.1. Conceptos básicos................................................................................................207
3.2. Condiciones de optimalidad ................................................................................ 211
4. BIBLIOGRAFÍA ............................................................................................................215

1. INTRODUCCIÓN

Una vez que se tienen las ideas de simulación de procesos y de la estructura de los modelos de
proceso, vamos a considerar un aspecto clave en diseño de procesos. El objetivo de muchas
simulaciones en Ingeniería es el desarrollo de un modelo predictivo que se pueda usar en
mejorar el proceso.
Vamos a ver las mejoras sistemáticas o estrategias de optimización para procesos químicos
con variables continuas. En particular nos centraremos en el algoritmo de programación
cuadrática sucesiva (SQP o “Sucessive Quadratic Programming”) que se ha convertido en el
estándar en optimización de procesos. El método se deriva desde una perspectiva tipo Newton
y en los temas siguientes se verá su aplicación tanto para simulación en modo modular como
en modo orientado a ecuaciones, discutiendo las ventajas y limitaciones de cada uno.
En un nivel práctico, se puede definir el término “optimización” como:
“Dado un sistema o proceso, encontrar la mejor solución al mismo con restricciones”.
Para cuantificar la “mejor solución” se necesita primero una función objetivo que sirva de
indicador de la bondad de la solución. Típicamente en problemas relacionados con la
industria química y de procesos son: costes de capital, operación, rendimiento del producto,
beneficios globales, etc.
Los valores de la función objetivo se determinan por manipulación de las variables del
problema, las cuales pueden representar físicamente tamaños de equipo o condiciones de
operación (temperatura, presión, caudal, composición, etc.). Los límites de operación del
proceso, pureza del producto, validez del modelo y relaciones ente las variables del proceso
han de ser consideradas como restricciones y los valores de las variables se han de ajustar de
forma que se satisfagan dichas restricciones. Frecuentemente, las variables del proceso se
clasifican en:
• Variables de decisión, que representan las grados de libertad de la optimización.
• Variables dependientes, que se pueden resolver mediante las restricciones.

197
Introducción a la programación no lineal (NLP) con restricciones

En el desarrollo del problema de optimización, esta distinción es importante, tanto desde un


punto de vista conceptual como en problemas de optimización de procesos modelizados en
modo modular.
En muchos casos, la búsqueda de un diagrama de flujo mejor mediante la manipulación de las
variables de decisión se lleva a cabo mediante ensayo y error (a través de casos). En lugar de
esto, estamos interesados en métodos de optimización que impliquen una aproximación
sistemática para encontrar el diagrama de flujo óptimo (y esta metodología debe ser tan eficaz
como sea posible). Las áreas relacionadas con la teoría y los conceptos de optimización son la
programación matemática y la investigación operacional:
• Programación matemática: caracterización de las propiedades teóricas de los
problemas de optimización y algoritmos, incluyendo existencia de soluciones,
convergencia hacia estas soluciones y velocidades de convergencia locales.
• Investigación operativa: aplicación e implementación de métodos de optimización
para su uso eficaz y fiable.
• Ingeniería de procesos: aplicación de métodos de optimización a problemas del
mundo real.
Es preciso, pues, familiarizarse con el funcionamiento del algoritmo de optimización,
incluyendo las limitaciones de los métodos (para conocer cuándo pueden fallar). Además,
también se necesita formular problemas de optimización que capturen la esencia del proceso
real, y que sean resolubles por los métodos de optimización actuales.
Este tema se centra en la optimización de sistemas en los que las variables pueden variar de
forma continua en una región (se trata de variables del tipo presión, temperatura, caudales,
etc., o bien dimensiones de equipo) y que incluyen funciones objetivo o restricciones no
lineales, por lo que este tipo de problemas recibe el nombre de programación no lineal
(“nonlinear programming” o NLP).
A continuación, se a ver una introducción a la programación no lineal y la definición de las
condiciones óptimas para la solución del mismo. En el tema siguiente nos centraremos en el
método SQP para resolución de programas no lineales (es el más que usa con más frecuencia,
tanto en ingeniería de procesos como en otras aplicaciones). En los temas siguientes se verá la
aplicación del método SQP a la simulación de procesos en el modo modular secuencial (para
lo cual resulta ser un método muy eficaz) y en el modo orientado a ecuaciones (en cuyo caso
se necesita un algoritmo a gran escala y es preciso adaptar el SQP).

2. PROGRAMACIÓN NO LINEAL CON RESTRICCIONES

Consideramos el problema de programación lineal dado en forma genérica como:


Min f (x)
x
s.a. g(x) ≤ 0
h(x) =0

198
Introducción a la programación no lineal (NLP) con restricciones

donde x es un vector de n variables continuas, f (x)es una función objetivo escalar, g(x) es un
vector de m funciones de restricción en forma de inecuaciones y h(x) es un vector de meq
funciones de restricción en forma de ecuaciones. Las restricciones crean una región para las
variables, x, denominada “región factible” y se requiere que n ≥ meq para que el problema
tenga grados de libertad para la optimización.
Aunque la formulación anterior suele ser la más habitual, los problemas NPL se pueden
expresar de muy diversas formas. Por ejemplo, se puede cambiar el signo de la función
objetivo y de las restricciones:
Max q (x)
x
s.a. w(x) ≤ 0
h(x) =0
para las funciones definidas como q(x) = - f(x) y w(x) = - g(x).
Lo que se pretende es desarrollar un método que encuentre un mínimo local x* para f(x) en
una región posible definida por las restricciones, es decir, f(x*) ≤ f(x) para cualquier x,
satisfaciendo las restricciones en el entorno de x*. Si la región posible no está vacía y la
función objetivo tiene una cota inferior en esta región posible, sabemos que esta solución
local existe.
Una solución local a un NLP es también una solución global bajo las condiciones de
suficiencia siguientes, basadas en el concepto de convexidad. Una función Ф(x) es convexa
para x en un dominio X si y sólo si se satisface la ecuación
Ф [αξ + (1 − α) η] ≤ α φ(ξ) + (1 − α) φ(η)
para cualquier α, 0 ≤ α ≤ 1, en todos los puntos en ξ y η en X. Las condiciones suficientes
para una solución global del NPL son:
• La solución es un mínimo local del NLP.
• f(x) es convexa
• todas las g(x) son convexas
• todas las h(x) son lineales
Las dos últimas condiciones implican que la región factible sea convexa, es decir, que para
cualquier punto ξ y η en X y cualquier α (0 ≤ α ≤ 1), el punto (αξ + (1 − α) η) está también
en la región. En optimización de procesos, estas propiedades indican que cualquier problema
con restricciones en forma de igualdades no lineales es no convexo y, ante la ausencia de
información adicional, no hay garantía de que el óptimo local sea también global si estas
condiciones de convexidad no se cumplen.
Esto se ilustrará con los siguientes ejemplos.

Ejemplo 1. Dimensiones óptimas de un recipiente cilíndrico


Considérese la optimización de un recipiente cilíndrico con un volumen dado. ¿Cuál sería la relación
L/D para este recipiente que supone un coste mínimo?

199
Introducción a la programación no lineal (NLP) con restricciones

Este problema con restricciones se puede formular como un NLP en el que se minimiza el coste
basado en la cantidad de material que se necesitan para fabricar las paredes laterales y las dos bases
del cilindro. Para un grosor pequeño de pared, la cantidad de material es proporcional a la superficie
de dichas piezas. Si el coste de los materiales es de CT para las bases y CL para las paredes laterales,
respectivamente, la función objetivo a minimizar (costes totales), tendrá la forma siguiente:

⎧ πD 2 ⎫
Min ⎨C T + C L πDL = coste⎬
⎩ 4 ⎭
y deberá estar sujeta a la restricción del volumen en la forma
πD 2
V− =0
4
D, L ≥ 0
En este ejemplo, la región factible en las variables D y L es no convexa, puesto que la restricción es no
lineal. Sin embargo, en este ejemplo es posible realizar una modificación en la formulación del
problema y eliminar L en la función objetivo a partir de la expresión L = 4V πD 2 , con lo que el
problema de optimización queda como sigue:

⎧ πD 2 4V ⎫ con D ≥ 0
Min ⎨C T + CL ⎬
⎩ 4 D⎭
ya que al incorporar la restricción en la función objetivo ésta ya no es necesaria.
Si el valor óptimo de D es positivo, podemos encontrar el mínimo de la función por diferenciación del
coste respecto de D e igualando a cero:
d (Coste ) 4VC L
= C T πD − =0
dD D2
Resolviendo para la variable D, se obtiene la expresión siguiente, con L determinado a través de la
especificación del volumen:
1/ 3 1/ 3 2/3
⎛ 4V C S ⎞ ⎛ 4V ⎞ ⎛⎜ C L ⎞⎟
D = ⎜⎜ ⎟⎟ L=⎜ ⎟
⎝ π CL ⎠ ⎝ π ⎠ ⎜⎝ C S ⎟⎠
Además, se puede obtener que la relación de aspecto (L/D) para el cilindro óptimo ha de ser igual a
CT/CL.
Si obtenemos la segunda derivada
d 2 (Coste ) C
2
= C t π + 8V L3 > 0 si D >0
dD D
por lo que la es función convexa en la región factible (abierta) de D. Como resultado, la solución a
este NLP es GLOBAL y no existen más soluciones locales.

Ejemplo 2. Minimización de dimensiones de empaquetado


Considérense a continuación tres objetos cilíndricos de igual altura, pero diferente radio, como se
ilustra en la figura siguiente. Se desea encontrar la caja con el perímetro mínimo que contenga los tres
cilindros, problema que se puede plantear como un NLP.

200
Introducción a la programación no lineal (NLP) con restricciones

En este caso, las variables de decisión son las dimensiones de la caja


(A, B) y las coordenadas del centro de los cilindros (x1, y 1), (x 2, y2), (x 3,
y 3). Los parámetros especificados serían los radios de los cilindros: R1,
2 R2, R 3.
A
Lo que se desea es minimizar el perímetro, 2(A+B), incluyendo como
1 3 restricciones que los cilindros permanezcan en el interior de la caja y
que éstos no se pueden superponer.
Con este objetivo, se puede formular el siguiente NLP:
B
Min (A + B)
x1, y1 ≥ R1 x1 ≤ B – R1, y1 ≤ A – R1
Cilindros en caja enteramente x2, y2 ≥ R2 x2 ≤ B – R2, y2 ≤ A – R2
x3, y3 ≥ R3 x3 ≤ B – R3, y3 ≤ A – R3

(x1 –x2)2 + (y1 – y2)2 ≥ (R1+R2)2


Cilindros no se superponen (x1 –x3)2 + (y1 – y3)2 ≥ (R1+R3)2
(x2 –x3)2 + (y2 – y3)2 ≥ (R2+R3)2

x1, x2, x3, y1, y2, y3, A, B ≥ 0


La función objetivo y las restricciones “en la caja” son lineales y, por lo tanto, convexas. Del mismo
modo, las cotas de las variables son también convexas. Las no convexidades se observan en las
desigualdades (restricciones) no lineales – lo cual se puede verificar en las propiedades que se verán
posteriormente.
Por ello, no es posible asegurar que hay una solución global única. Intuitivamente, podemos imaginar
la existencia de soluciones múltiples, por ejemplo, tras encontrar una solución, observar una
equivalente girando la caja 90º, o bien, tras distribuir aleatoriamente los cilindros y reducir las paredes
de la caja, se puede observar que la solución depende de la posición inicial de los cilindros.
Este problema tiene muchos óptimos locales, debido a que la región factible es no convexa.

Estos dos ejemplos plantean una serie de cuestiones. En primer lugar, ¿cuáles son las
condiciones que caracterizan una solución local en un programa no lineal?. En el ejemplo 1, al
eliminar L las restricciones perdieron su importancia. En el ejemplo 2, por el contrario, la
solución estaba completamente definida por las restricciones. En la solución, estas
restricciones se tienen que cumplir como ecuaciones y, por ello, se denominan activas.
A continuación ser verán las condiciones de optimalidad de Kuhn Tucker, que permiten
definir las soluciones que son óptimos locales.
En segundo lugar, la búsqueda de la solución del NLP viene guiada por la determinación del
conjunto de restricciones que son activas y la resolución de las ecuaciones que representan las
condiciones de optimalidad. En el primer ejemplo, esta tarea fue sencilla, puesto que no se
tuvieron que considerar restricciones activas, y porque fue posible encontrar una solución
analítica a partir de la función objetivo. Sin embargo, en el segundo ejemplo aún es necesario
llevar a cabo esta búsqueda. Estas estrategias de búsqueda se presentarán cuando se desarrolle
el algoritmo SQP en el siguiente tema.
201
Introducción a la programación no lineal (NLP) con restricciones

2.1. Condiciones para que exista un óptimo en programación no lineal


Antes de pasar a presentar matemáticamente las condiciones de optimalidad, se van a
introducir éstas mediante una explicación intuitiva:
Consideremos un diagrama de contorno de la función f(x) en dos dimensiones (Fig.1). El
mínimo de la función se sitúa en x*. Si imaginamos la representación de esta función como
un valle, entonces una “bola” rodando en el valle se pararía en x* (el punto más bajo). En ese
punto estacionario tenemos un gradiente nulo, ∇f(x*)=0, y las derivadas segundas revelan la
curvatura positiva de f(x). En otras palabras, si movemos la bola alejándola de x* en cualquier
dirección, ésta volverá rodando hacia x*.

Figura 1. Diagrama de contorno en minimización sin restricciones (Biegler et al., 1997)

Ahora introducimos dos restricciones en forma de desigualdades, g1(x) ≤ 0 y g2 (x) ≤ 0, en el


problema de minimización, lo cual podríamos visualizar como dos muros en el valle (Fig. 2).
De nuevo, una bola rodando en el valle dentro de la zona delimitada por los muros llegará
hasta el punto más bajo posible. Sin embargo, si x* está en el límite (o borde) de una
restricción (p.ej. g1(x*)=0), entonces esta desigualdad se dice que es activa, la bola se para en
el muro y en ese punto ya no se cumple que ∇f(x*)=0. En su lugar, lo que sucede es que la
bola se queda detenida por un balance de fuerzas: la de “gravedad” (-∇f(x*)). y la fuerza
“normal” que ejerce el muro sobre la bola (-∇g1(x*)). Además, se puede ver en la figura que
la restricción g2 (x) ≤ 0 es inactiva en x* y no participa en este “balance de fuerzas”. Además
de este balance de fuerzas, es de esperar que haya curvatura positiva a lo largo de la
restricción activa, es decir, si movemos la bola separándola de x* en cualquier dirección
siguiendo la valla, ésta volverá rodando hacia x*.
Finalmente, introducimos una restricción h (x)=0, visualizada como si introdujéramos un rail
dentro de la zona vallada (Fig. 3). Una bola rodando sobre el rail en la zona vallada también
se parará en el punto más bajo, x*, el cual está caracterizado también por un balance de
fuerzas: la “fuerza de la gravedad” (-∇f(x*)), la fuerza “normal” debido al muro (-∇g1(x*)) y
la fuerza “normal” que ejerce el rail sobre la bola (-∇h(x*)). Además, es de esperar que exista
curvatura positiva a lo largo de las restricciones activas. Sin embargo, como se puede ver en la
figura 3 ya no tenemos direcciones permitidas en las restricciones activas. En su lugar, la bola

202
Introducción a la programación no lineal (NLP) con restricciones

permanece estacionaria en la intersección del rail y el muro (y ésta es la condición suficiente


para que éste sea el óptimo).

Figura 2. Problema de minimización con restricciones de inecuaciones (Biegler et al., 1997)

Figura 3. Problema de minimización con ecuaciones e inecuaciones (Biegler et al., 1997)

A continuación, se generalizarán estos conceptos, desarrollando las condiciones de


optimalidad para minimización con restricciones, denominadas condiciones de Kuhn Tucker
(KT) o de Karush Kuhn Tucker (KKT).
Por conveniencia en la notación se define una función lagrangiana de la forma siguiente:
L( x , µ, λ ) = f ( x ) + g ( x )T µ + h( x ) T λ = 0
Los vectores µ y λ permiten ponderar las “fuerzas” del balance y se denominan variables
duales o multiplicadores de KT.
La solución del problema de minimización NLP:

203
Introducción a la programación no lineal (NLP) con restricciones

Min f (x)
x
s.a. g(x) ≤ 0
h(x) =0
satisface las condiciones de KT de primer orden, necesarias para que haya un óptimo:

Condiciones de Kuhn Tucker de primer orden:


1. Dependencia lineal de los gradientes (“el balance de fuerzas”):
∇L( x*, µ*, λ *) = ∇f ( x*) + ∇g ( x*) µ * +∇h( x*) λ* = 0
2. Posibilidad de que exista una solución NLP que cumpla todas las restricciones (que la
pelota pueda estar entre los muros y sobre el rail):
g (x*) ≤ 0 , h (x*) =0
3. Condición de complementariedad, bien µi*= 0 (la restricción es inactiva y se ignora en la
condiciones KT) o gi (x*) = 0 (la restricción es activa y el multiplicador es positivo)(la pelota
está bien en el borde del muro o no está en la Fig. 3):
µ*T g (x*) =0
4. Los multiplicadores de las restricciones son no negativos (las fuerzas normales desde los
muros sólo actúan en una dirección):
µ* ≥ 0 (si activa, >0)
5. Los gradientes de las restricciones activas tienen que ser linealmente independientes:
[∇g A ( x*) ∇h( x*)] para i ∈ A , A = {i g i ( x*) = 0}

Estas condiciones son sólo necesarias. Sin embargo, se precisa de condiciones adicionales
para asegurar que x* es una solución local. Por ahora, las condiciones de primer orden sólo
definen x* como un punto estacionario que cumple las restricciones. Es decir, las condiciones
KT 1 a 4 son equivalentes a hacer al gradiente de la función nulo. Para confirmar un óptimo
local se precisa evaluar las derivadas segundas y que estas sean positivas (o, al menos, no
negativas.)
En un problema multivariables, las derivadas segundas se evalúan mediante los términos de
una matriz Hessiana de una función dada. Por ejemplo, la matriz Hessiana de la función
objetivo, ∇xx f (x), está constituida por elementos
∂2 f
{∇ xx f ( x )}ij =
∂x i ∂x j

∂2 f ∂2 f
Además, como = , se cumple que {∇ xx f ( x )}ij = {∇ xx f ( x )} ji y la matriz
∂x i ∂x j ∂x j ∂x i
Hessiana es simétrica.

204
Introducción a la programación no lineal (NLP) con restricciones

La curvatura positiva de la superficie de la función se puede evaluar basándose en la matriz


Hessiana. Por ejemplo, si la función objetivo f (x) tiene curvatura positiva en x*, si su matriz
Hessiana es positiva definida, es decir,
p T ∇ xx f ( x*) p > 0 ∀ vector p ≠ 0
o positiva semidefinida:
p T ∇ xx f ( x*) p ≥ 0 ∀ vector p = 0
Para el problema NPL con restricciones, se definen condiciones de segundo orden usando la
matriz Hessiana de la función Lagrangiana y definiendo direcciones permitidas no nulas para
las variables de optimización basadas en las restricciones activas. Comenzando en la solución,
x*, las direcciones permitidas, p, satisfacen las restricciones activas como igualdades y, por lo
tanto, permanecen en la región factible. Puesto que el cambio en x en esta dirección puede ser
arbitrariamente pequeño, estas direcciones también tiene que satisfacer las correspondientes
linealizaciones de las restricciones y, por lo tanto, están definidas por:
∇h( x*)T p = 0
∇g i ( x*)T p = 0 ∀i ∈ A , A = {i g i ( x*) = 0}

Las condiciones de segundo orden suficientes (y necesarias) requieren curvatura positiva (no
negativa) de la función lagrangiana en estas direcciones permitidas o “restringidas” p. Usando
la matriz de las derivadas segundas para definir esta curvatura, estas condiciones se expresan
en la forma siguiente:
p T ∇ xx L( x*, µ*, λ*) p > 0 condición suficiente

p T ∇ xx L( x*, µ*, λ*) p ≥ 0 condición necesaria


para todas las direcciones permitidas p.

Para ilustrar la condiciones de Kuhn Tucker, se van a considerar los dos ejemplos sencillos de la Fig 4.

-a x a
f(x)

-a x a f(x)

Figura 4. Ilustración de las condiciones KT para el ejemplo (adaptado de Biegler et al., 1997)

Considérese primeramente un problema de una única variable:


Min x2
s.a. –a ≤ x ≤ a, donde a > 0
205
Introducción a la programación no lineal (NLP) con restricciones

el mínimo, x*=0, se encuentra por simple inspección visual. La función lagrangiana para este
problema tiene la forma:
L( x , µ ) = x 2 + µ 1 ( x − a ) + µ 2 ( −a − x ) = 0
estando las condiciones KT de primer orden dadas por:
∇ L( x , µ ) = 2 x + µ 1 − µ 2 = 0
µ 1 ( x − a ) = 0 µ 2 ( −a − x ) = 0
–a ≤ x ≤ a µ1, µ2 ≥ 0
Para que se puedan satisfacer las condiciones de primer orden, se consideran tres casos:
• µ1 = µ2 = 0
• µ1 > 0 y µ2 = 0
• µ1 = 0 y µ2 > 0
(el caso en que µ1 > 0 y µ2 > 0 no puede existir si a>0). Satisfacer estas condiciones requiere la
evaluación de las tres posibles soluciones:
• Si la cota superior es activa: x = a, µ1 = −2a, µ2 = 0
• Si la cota inferior es activa: x = -a, µ2 = −2a, µ1 = 0
• Si ninguna cota es activa: µ1 = µ2 = 0, x = 0
Claramente, sólo la última de las posibilidades cumple las condiciones de KT, puesto que en las dos
primeras opciones se tienen valores negativos para µ1 o µ2. Si se evalúan las condiciones de segundo
orden, las direcciones permitidas p = ∆x, con ∆x >0 y ∆x <0. También se tiene que:
∇ xx L( x*, µ*, λ*) = 2 > 0

p T ∇ xx L( x*, µ*, λ*) p = 2∆x 2 > 0

para todas las direcciones permitidas. Por lo tanto, la solución x*=0 satisface las condiciones
suficientes de primer orden y segundo orden de KT para que exista un mínimo local.
Considérese a continuación una variación del ejemplo anterior. Supóngase que se cambia el signo de la
función objetivo y se tiene que resolver el problema:
Min -x2
s.a. –a ≤ x ≤ a, donde a > 0
En este caso, las posibles soluciones, x*= a o x*=-a se encuentran también por inspección visual. La
función lagrangiana para este problema tiene la forma:
L( x ,µ ) = − x 2 + µ1 ( x − a ) + µ 2 ( −a − x )
estando las condiciones KT de primer orden dadas por:
∇L( x , µ ) = −2 x + µ1 − µ 2 = 0
µ 1 ( x − a ) = 0 µ 2 ( −a − x ) = 0
–a ≤ x ≤ a µ1, µ2 ≥ 0
Para que se puedan satisfacer las condiciones de primer orden, se consideran nuevamente los tres
casos: µ1 = µ2 = 0; µ1 > 0 y µ2 = 0 y µ1 = 0 y µ2 > 0:
• Si la cota superior es activa: x = a, µ1 = 2a, µ2 = 0

206
Introducción a la programación no lineal (NLP) con restricciones

• Si la cota inferior es activa: x = -a, µ2 = 2a, µ1 = 0


• Si ninguna cota es activa: µ1 = µ2 = 0, x = 0
Y en este caso las tres posibles soluciones cumplen las condiciones de KT de primer orden. A
continuación, es preciso evaluar las condiciones de segundo orden. Para el punto x = 0 las direcciones
permitidas p = ∆x >0 y -∆x y se cumple que:
pT ∇ xx L( x*, µ*, λ*) p = −2∆x 2 < 0

por lo que este punto no satisface las condiciones de segundo orden. En los otros dos casos, sin
embargo, se requiere que las direcciones permitidas satisfagan las restricciones activas exactamente.
En estos casos, cualquier punto a lo largo de la dirección permitida, x* tiene que permanecer en la
cota. Consecuentemente, la solución está totalmente definida por la restricción activa. La condición:
pT ∇ xx L( x*,µ*, λ*) p > 0

para todas las direcciones permitidas, se cumple, ya que no hay direcciones permitidas.

Las condiciones KT de primer y segundo orden constituyen una linealización útil para
identificar soluciones locales a problemas no lineales (No obstante, las derivadas segundas no
se suelen calcular en problemas de optimización de procesos, por lo que raramente se
comprueban las condiciones de segundo orden). Sin embargo, se necesitan estrategias de
búsqueda eficaces que permitan localizar los puntos que satisfagan estas condiciones. En el
tema siguiente se vamos a desarrollar un algoritmo de NLP llamado programación cuadrática
sucesiva (“Successive Quadratic Programming” o SQP), el cual tiene unas características
adecuadas para optimización de procesos y se pude usar en muchas aplicaciones, ya que se ha
comprobado que es adaptable a varios tipos de NLP.

3. APÉNDICE: CONCEPTOS BÁSICOS EN OPTIMIZACIÓN

Este epígrafe, tomado del libro de Biegler et al. (1997), presenta de un modo conciso los
conceptos básicos en optimización y las condiciones de optimalidad.

3.1. Conceptos básicos


Se considerará el siguiente problema de optimización con restricciones:
Min f (x)
x
s.a. g(x) ≤ 0
h(x) =0
x ∈ Rn
donde f (x) es la función objetivo, h(x) = 0 es el conjunto de m ecuaciones con n incógnitas x,
y g(x) ≤ 0 corresponde a un conjunto de r restricciones en forma de inecuación. En general, el
207
Introducción a la programación no lineal (NLP) con restricciones

numero de variables n será mayor que el número de ecuaciones m, y la diferencia (n-m) es el


número de grados de libertad del problema de optimización.
Cualquier problema de optimización se puede representar en la forma arriba indicada. Por
ejemplo, si se quiere maximizar una función, según esta notación, el problema sería
equivalente a minimizar esa función puesta en modo negativo. Las inecuaciones que sean
mayores o iguales a cero se pueden pasar a inecuaciones que sean menores o iguales a cero
simplemente con multiplicar los términos de la inecuación por –1 e invirtiendo el signo de la
inecuación.

Figura 1. Región factible para tres inecuaciones (Biegler et al., 1997)

DEFINICIÓN 1
La región factible (“feasible region” o FR) del problema de optimización viene dada por.
FR={x | h(x)=0, g(x) ≤ 0, x ∈ Rn }
La figura 1 muestra un ejemplo de una región factible en dos dimensiones que implica tres
inecuaciones. Los límites de la región vienen dados por los puntos definidos por la siguiente
expresión gi(x)=0, i= 1, 2, 3. El lado no factible de las restricciones viene representado por la
zona rayada. Si se añade la ecuación h(x)=0, la región factible se reduce a la línea recta más
gruesa, como se muestra en la figura 2.

Figura 2. Región factible para tres inecuaciones y una ecuación (Biegler et al., 1997)

208
Introducción a la programación no lineal (NLP) con restricciones

Figura 3. (a) regiones factibles convexas; (b) regiones factibles no convexas (Biegler et al.,
1997)

DEFINICIÓN 2
La región factible FR es convexa si para cualquier x1, x 2 ∈ FR,
x = α x 1 + ( 1-α) x 2 ∈ FR, α ∈ [0,1]
Esta definición se ilustra en la figura 3, la figura 3a muestra un ejemplo de una región factible
convexa, mientras que la región mostrada en la figura 3b es no convexa, porque algunos de
los puntos de la línea que resulta de unir x1y x2 caen fuera de la región factible.
La condición necesaria para que haya una región factible convexa viene dada por la siguiente:
PROPIEDAD 1
Si h(x) = 0 son funciones lineales y g(x) son funciones convexas, entonces FR es una región
factible convexa.

DEFINICIÓN 3
La función f(x) es una función convexa si para cualquier x1, x 2 ∈ R,
f [α x1 + ( 1- α) x 2 ] ≤ f (x1) + ( 1- α) f (x 2) α ∈ [0,1].
La figura 4a presenta un ejemplo de una función convexa, cuyo valor en el intervalo [x1, x 2],
es inferior a la combinación lineal de los valores de la función en los extremos del intervalo.
En contraposición, la figura 4b muestra una función no convexa. Si en la expresión anterior se
tuviera una inecuación estricta para los puntos en el intervalo [x1, x 2], entonces se podría
decir que f (x) es estrictamente convexa.

DEFINICIÓN 4
La función f (x) tiene un mínimo local en x̂ ∈ FR, si y sólo si existe δ > 0, f (x) ≥ f( x̂ ) para
todo | x- x̂ | < δ, x ∈ FR.
Si la desigualdad es estricta se dice que es un mínimo local fuerte (ver figura 5a); de otro
modo, s trataría de un mínimo local débil (véase figura 5b).

209
Introducción a la programación no lineal (NLP) con restricciones

Figura 4. (a) Función convexa; (b) Función no convexa (Biegler et al., 1997)

Figura 5 (a) Función como mínimo local fuerte; (b) función con mínimo local débil (Biegler
et al., 1997)

DEFINICIÓN 5
La función f (x) tiene un mínimo global en x̂ ∈ FR, si y sólo si f (x) ≥ f ( x̂ ) x ∈ FR.
Claramente, todo mínimo global es un mínimo local, pero el inverso no es cierto. La figura 6
representa una función con dos mínimos locales fuertes, siendo uno de ellos el mínimo global.

Figura 6. Función con dos mínimos locales (Biegler et al., 1997)

210
Introducción a la programación no lineal (NLP) con restricciones

3.2. Condiciones de optimalidad

Minimización sin restricciones


Se considérese a continuación el siguiente problema de optimización sin restricciones:
Min f (x)
x
x ∈ Rn
donde se supone que f (x)es una función continua y diferenciable.
Las condiciones de primer orden, aquellas que son necesarias para que exista un mínimo local
en x̂ , vienen dadas por un punto estacionario, esto es, un x̂ que satisfaga ∇f ( xˆ ) = 0 . Esto
implica la resolución de un sistema de n ecuaciones con n incógnitas dado por:
∂f
=0
∂x1
∂f
=0
∂x 2
...
∂f
=0
∂x n
Las condiciones de segundo orden para que exista un mínimo local fuerte, que son
condiciones suficientes, requieren que la matriz Hessiana H de las derivadas parciales
segundas sea positiva definida.
Para dos dimensiones, la matriz Hessiana vienen dada por:
⎡∂2 f ∂2 f ⎤
⎢ ∂x 2 ∂x ∂x ⎥
⎢ 1 1 2 ⎥

⎢ δ f δ f⎥
2 2

⎢ 2 ⎥
⎣ ∂x 2 ∂x1 ∂x 2 ⎦
Como se puede observar, la matriz Hessiana es simétrica.
La matriz H es positiva definida si y sólo si ∆x T H∆x > 0, ∀∆x ≠ 0. Las dos propiedades
siguientes son útiles para determinar en la práctica si la matriz H es positiva definida:
1. H es positiva definida si y sólo si los eigenvalores ρi> 0, i = 1, 2, ..., n.
2. Si H es positiva definida, entonces f (x) es estrictamente convexa
Es decir, la propiedad (1) afirma que la matriz Hessiana es estrictamente positiva si los
eigenvalores calculados a partir de la misma son todos positivos. La propiedad (2)
simplemente indica que aquellas funciones cuya matriz Hessiana es positiva son estrictamente
funciones convexas. Por tanto, analizando únicamente la matriz Hessiana de una función se
puede determinar si ésta es convexa.

211
Introducción a la programación no lineal (NLP) con restricciones

El siguiente teorema determina la condición de suficiencia para que un mínimo local sea
único en un problema de optimización sin restricciones:

TEOREMA 1
Si f (x) es estrictamente convexa y diferenciable, entonces si existe un punto estacionario x̂ ,
este corresponderá a un mínimo local.

Minimización con Igualdades


Consideremos ahora un problema de minimización con restricciones en el que sólo hay
igualdades.
Min f (x)
x
s.a. h(x) =0
x ∈ Rn
en este caso, las condiciones necesarias para que haya un mínimo local con restricciones
vienen dadas por el punto estacionario de la función lagrangiana:
m
L = f ( x) + ∑ λ j hj ( x)
j =1

donde λ j son los multiplicadores de Lagrange. Las condiciones para un punto estacionario
vienen dadas por
∂L m
a. = ∇f ( x ) + ∑ λ j h j ( x ) = 0
∂x j =1

∂L
b. = h j ( x) = 0 j=1,2... m
∂λ j
Obsérvese que (a) y (b) definen un sistema de n+m ecuaciones con n+m incógnitas (x, λ).
Además, la ecuación (a) implica que los gradientes de la función objetivo y las restricciones
en forma de igualdad deben ser linealmente dependientes, mientras que la ecuación (b)
implica la factibilidad de las restricciones en forma de igualdades. Para que las ecuaciones
arriba mencionadas sea válidas se tienen que cumplir condiciones adicionales, que siempre se
verifican si el problema es convexo.
Las condiciones suficientes de segundo orden para que exista un mínimo local fuerte vienen
satisfechas cuando la matriz Hessiana del lagrangiano es definida positiva. Esto es, dada una
dirección permitida p que está en el espacio nulo, ∇hT p = 0 , se tiene que
pT ∇ 2 L( x*, λ*) p > 0 , donde ∇ 2 L( x*, λ*) p = ∇ 2 f ( x*) + λ *i ∇ 2 hi ( x*) .

Minimización con igualdades y desigualdades


Considerando el problema de optimización con restricciones en el que hay igualdades y
desigualdades:

212
Introducción a la programación no lineal (NLP) con restricciones

Min f (x)
x
s.a. g(x) ≤ 0
h(x) =0
x ∈ Rn
en este caso, las condiciones necesarias para que exista un mínimo local en x̂ vienen dadas
por las condiciones Karush-Kuhn-Tucker:
a. Dependencia lineal de los gradientes
m r
∇ f ( x ) + ∑ λ j ∇h j ( x ) + ∑ µ j ∇ g j ( x ) = 0
j =1 j =1

b. Restricciones a la factibilidad
hj(x) = 0 j=1,2...m gj ≤ 0 j=1,2...r
c. Condiciones complementarias
µ j g j ( x ) = 0 µ j ≥ 0 j=1,2...r

donde µj son los multiplicadores de Kuhn-Tucker correspondientes a las desigualdades, los


cuales están restringidos a valores no negativos. Las condiciones complementarias en (c)
implican un valor nulo para los multiplicadores de las desigualdades inactivas (cuando gj < 0),
y en general un valor no nulo para las restricciones en forma de inecuación activas (cuando
gj = 0) La figura 7 muestra una representación geométrica de un punto que satisface las
condiciones de Karush-Kuhn-Tucker. Se puede observar que ∇f viene dado por una
combinación de los gradientes de las restricciones activas ∇g1 , ∇g 2 .

Figura 7. Representación geométrica de un punto que satisface las condiciones de Karush-


Kuhn-Tucker.

Además, los multiplicadores µ j vienen dados por

213
Introducción a la programación no lineal (NLP) con restricciones

⎛ ∂f ⎞
µ j = −⎜ ⎟
⎜ ∂g ⎟ ∂g =0 ,i ≠ j
⎝ j ⎠ i

En otras palabras, representan la disminución de la función objetivo cuando se produce un


incremento en las funciones que representan las restricciones; o alternativamente, el aumento
de la función objetivo cuando se produce una disminución en las funciones que representan
las restricciones. De esto último, se puede deducir que los multiplicadores de las
desigualdades activas deben ser no negativos.
El siguiente teorema es la condición suficiente para que un óptimo local en problemas de
optimización con restricciones sea único.

TEOREMA 2
Si f(x) es una función convexa y la región factible (FR) es también convexa, entonces si existe
un mínimo local en x̂ ,
i. Es un mínimo global
ii. Las condiciones de Karush-Kuhn-Tucker son condiciones necesarias y suficientes.
La dificultad con las ecuaciones en (a), (b), (c) para las condiciones de optimalidad del
problema de optimización es que no se pueden resolver directamente como en el caso en el
que sólo haya igualdades. En general, la solución a estas ecuaciones se puede obtener por
medio de un procedimiento iterativo, el cual, de una forma simplificada, consta de los
siguientes pasos:

Paso 1: Se supone que no hay desigualdades inactivas. Se ajusta el índice de las desigualdades
activas JA=Ø, y los multiplicadores µj=0, j=1,2,...r
Paso 2: Se resuelve la ecuación en (a) y en (b) para x, los multiplicadores λj de las
restricciones en forma de igualdad, y los multiplicadores µj de las restricciones en
forma de desigualdades activas (en la primera iteración no hay ninguna)
m m
∇f ( x ) + ∑ λ j ∇h j ( x ) + ∑ µ j ∇g j ( x ) = 0
j =1 jeJ A

hj(x) = 0 j=1,2...m gj(x)=0 j ∈ JA


Paso 3. Si g(x) ≤ 0 y µj ≥ 0 j=1,2,...r, entonces se para, ya que se ha encontrado la solución.
Si no es así, se va al paso número 4.
Paso 4. a. Si uno o mas multiplicadores µj son negativos, se elimina de JA la desigualdad
activa con el multiplicador negativo de valor absoluto mayor.
b. Se añaden a JA las restricciones en forma de desigualdades que violadas gj(x) > 0
y se vuelve al paso 2.

Este método arriba indicado es un procedimiento muy general, adecuado sólo para cálculos
manuales en problemas pequeños.

214
Introducción a la programación no lineal (NLP) con restricciones

4. BIBLIOGRAFÍA

• AspenTech, ASPEN Plus 11.1 User guide (2002).


• Biegler, L.T., Grossmann, I.E., Westerberg, A.W., “Systematic Methods of Chemical
Process Design”, Prentice Hall, Nueva Jersey (1997).
• Hyprotech, HYSYS user’s guide.
• Seider, W.D., Seader, J.D., Lewin, D.R., “Process Design Principles”, John Wiley & Sons,
Nueva York (1999)

215
III. Optimización de diagramas de flujo con
HYSYS

Programación cuadrática sucesiva


(SQP)
José Ramón Álvarez Saiz

Departamento de Ingeniería Química


y Tecnología del Medio Ambiente
Universidad de Oviedo
Programación cuadrática sucesiva (SQP)

ÍNDICE

1. MÉTODOS DE OPTIMIZACIÓN CON VARIABLES CONTINUAS...............219


1.1. Programación Lineal............................................................................................219
1.2. Programación No Lineal (NLP) ..........................................................................220
2. DERIVACIÓN DE SQP ...........................................................................................223
2.1. Aproximación BFGS para ∇xxL (Broyden, Fletcher, Goldfarb, Shanno)............225
2.2. Características del SQP .......................................................................................225
3. BIBLIOGRAFÍA ......................................................................................................229

1. MÉTODOS DE OPTIMIZACIÓN CON VARIABLES CONTINUAS

1.1. Programación Lineal


Cuando solamente hay funciones lineales en el problema, y las variables continuas x están
restringidas a valores no negativos, se dice que se tiene un problema LP:
Min Z=cTx
s.a. A x ≤ a
x≥0
donde el signo ≤ se usa para indicar que puede haber restricciones en forma de igualdades o
desigualdades. Sabiendo que las funciones lineales son convexas por la Propiedad 1 y por el
Teorema 2, el LP tiene un mínimo único, el cual, no obstante, puede ser débil, pudiendo haber
otros valores de las variables que conduzcan al mismo valor mínimo de la función objetivo.
El método de resolución estándar en el algoritmo Simplex, que explota el hecho de que en un
LP el óptimo yace en el vértice de la región factible (véase la figura 1). En este óptimo se
satisfacen las condiciones Karush-Kuhn-Tucker.
El método Simplex ha sufrido muchas modificaciones durante las tres últimas décadas, y en la
actualidad muchos de los códigos comerciales para ordenadores (OSL, CPLEX, LINDO)
están basados en él. Permite resolver muy eficazmente problemas con muchísimas ecuaciones
(miles de variables y restricciones) pero con un número escaso de variables en cada
restricción. En general, el esfuerzo computacional con el algoritmo simplex depende mucho
del número de restricciones (filas, en terminología de LP), no dependiendo demasiado del
número de variables (columnas). En problemas con muchas filas y relativamente pocas
variables, es aconsejables resolver el LP por medio de su problema dual.
En el caso de que las variables x puedan ser positivas y negativas, en un LP se realiza un
cambio de variable, reemplazando éstas por x=xP-xN, donde xP y xN son no negativas. Si xN es
cero entonces tendremos un valor positivo, si xP es cero el valor será negativo. Esta
manipulación sólo se debe utilizar cuando la variable x aparece con un coeficiente positivo en
la minimización de una función objetivo.
219
Programación cuadrática sucesiva (SQP)

Figura 1. El óptimo yace en el vértice x* para problemas LP (Biegler et al., 1997)

Recientemente se han desarrollado los métodos del punto interior para LP, los cuales están
emplean polinomios acotados. Aunque estos métodos son teóricamente superiores al
algoritmo Simplex, se usan solamente para casos en los que haya un número elevadísimo de
variables y restricciones (por ejemplo, problemas con 100000 restricciones y variables) en los
que se observa un ahorro en la carga computacional considerable.
Hay, sin embargo, clases especiales de problemas LP para aplicaciones concretas que resultan
más eficaces que los códigos LP estándar, por ejemplo, para los problemas de redes de flujo,
donde la matriz de los coeficientes solo tiene elementos con valores 0, 1 o –1. En este caso, el
método Simplex se puede implementar con cálculos computacionales simbólicos para reducir
el orden de magnitud del tiempo de computación.

1.2. Programación No Lineal (NLP)


En este caso el problema se corresponde con
Min f (x)
x
s.a. g(x) ≤ 0
h(x) =0
x є Rn
donde, en general, f (x), h(x), g(x) son funciones no lineales.
Los métodos NLP más eficaces resuelven este tipo de problemas por determinación directa de
un punto que satisfaga las condiciones de Karush-Kuhn-Tucker. Como se ha indicado en el
Teorema 2 del tema anterior, se pueden garantizar la obtención de un mínimo global cuando la
función objetivo y las restricciones son funciones no lineales convexas y las igualdades son
lineales. Como las condiciones de Karush-Khun-Tucker incluyen gradientes de la función
objetivo y de las restricciones, es preciso obtener éstas analíticamente o por medio de
perturbaciones numéricas. Sin embargo, la última opción supone un gran coste computacional
en problemas con un gran número de variables.

220
Programación cuadrática sucesiva (SQP)

Actualmente los dos métodos NLP más utilizados son el algoritmo de programación
cuadrática sucesiva (SQP) y el método de gradiente reducido. En el caso del algoritmo SQP la
idea básica es resolver en cada iteración un problema cuadrático de la forma:
Min ∇f ( x k )T d + 1 / 2d T B K d

s.a. h( x k ) + ∇h( x k )T d = 0

g ( x k ) + ∇g ( x k ) T d ≤ 0
donde xk es el punto actual, Bk es la estimación de la matriz Hessiana de la Lagrangiana, y d
es la dirección de búsqueda predicha. La matriz Bk normalmente se estima con la formula de
actualización BFGS –que se verá más adelante-, y el QP se resuelve con métodos estándar
para programación cuadrática (por ejemplo, la rutina QPSOL). Dado que el punto xk será, en
general, no factible, el siguiente punto xk+1 se ajustará a xk+1= xk+αd, donde el tamaño del
paso α se determina con el objeto de reducir una función de penalización que trata de
compensar las mejoras en la función objetivo con la violación de las restricciones.
Un aspecto importante del algoritmo SQP es el hecho de que el QP, cuando se emplea la
matriz hessiana exacta de la Lagrangiana en B, es equivalente a aplicar el método de Newton,
a las condiciones de Karush-Khun-Tucker. Por ello, es posible obtener una convergencia
rápida con este algoritmo.
En el método de gradiente reducido, la idea básica es resolver una secuencia de subproblemas
con restricciones lineales, donde los subproblemas se resuelven por medio de eliminación de
variables. En el caso particular de la implementación por medio de MINOS, el NLP se
reformula a través de la introducción de variables de holgura para convertir las desigualdades
en igualdades; por medio de esto el NLP se reduce a:
Min f (x)
x
s.a. r(x) = 0
Las aproximaciones lineales de las restricciones se consideran en una Lagrangiana ampliada
para la función objetivo:
[
Min Φ ( x ) = f ( x ) + (λk ) T r ( x ) − r ( x k ) ]
s.a. J(x k)x=b
donde λk es el vector de los multiplicadores de Lagrange, y J(xk) es el jacobiano de la
función r(x) evaluada en el punto xk. El subproblema NLP2, que es un problema de
optimización con restricciones lineales, viene dado por
Min Φ( x )
s.a. Ax=b
donde A es una matriz m x n con m<n. Este problema se puede resolver con un método de
gradiente reducido como se indica a continuación. Primeramente, el vector x se particiona en
un vector v de m variables dependientes, y en un vector u de (n-m) variables independientes.
Se sigue el mismo procedimiento con la matriz A, la cual se particiona en una matriz (m x m)
cuadrada que se denominará B y en la matriz C, de la forma m x (n-m). El gradiente reducido
se puede calcular a partir de la ecuación.

221
Programación cuadrática sucesiva (SQP)

g R = Z T ∇Φ ( x k )
donde xk es un punto dentro de la región factible que satisface las restricciones lineales, y Z es
una matriz de transformación que viene dada por:
Z=[-B –1C ⏐ I]
En el método de gradiente reducido, el paso de Newton, ∆u, se puede calcular en el espacio
reducido por medio de la expresión:
H R ∆u = − g R
donde HR es la matriz Hessiana reducida, la cual se estima a través de una expresión de
actualización quasi-Newton (por ejemplo, la fórmula BFGS). El cambio en las variables
dependientes, ∆v, se obtiene resolviendo las ecuaciones lineales:
B∆v = −C∆u
En resumen, en el método de gradiente reducido, el subproblema NLP2 se resuelve como un
problema de optimización interno, mientras que en la optimización externa el nuevo punto de
evaluación se ajusta a x k +1 = x k + α∆x donde α es un paso que se usa para reducir la
Lagrangiana ampliada en el NLP2, y ∆x =[∆v ⏐ ∆u].
La importancia de los métodos de gradiente reducido es que mediante una implementación
eficaz de la resolución de las ecuaciones anteriormente mostradas, y puesto que es posible
emplear algunas de las herramientas inicialmente desarrolladas para problemas LP a gran
escala, es posible explotar el carácter no denso de las matrices. De este modo, se pueden
resolver problemas de optimización no lineal efectivamente.
A continuación se comparan, a grandes rasgos, los métodos SQP y de gradiente reducido:
1. El método SQP requiere un número menor de iteraciones que los métodos de gradiente
reducido. Sin embargo, hay dificultades para aplicarlo a problemas muy grandes,
debido a que la matriz Bk ( de dimensiones n x n) se puede hacer muy densa debido a
de las actualizaciones del método quasi-Newton. El método SQP es el más adecuado
para los modelos de caja negra (por ejemplo, simuladores de procesos), los cuales
cuentan con un número relativamente pequeño de variables (por ejemplo, unas 50) y
donde los gradientes se pueden obtener por perturbación numérica. No obstante,
también se puede aplicar este método a problemas a gran escala que incluyan pocas
variables de decisión usando técnicas de descomposición.
2. El método de gradiente reducido, que está implementado en MINOS, se ajusta mejor a
problemas que incluyan un número significativo de restricciones lineales, y donde sea
posible sustituir las derivadas analíticas por funciones no lineares. Con esta estructura,
MINOS puede resolver problemas con varios cientos de variables y restricciones.
Comparándolo con el SQP, MINOS requiere un número mayor de evaluaciones de
funciones, pero el tiempo empleado en cada iteración es menor. En el caso límite en
que todas las funciones sean lineales, el método se reduce a un algoritmo SIMPLEX
de programación lineal

222
Programación cuadrática sucesiva (SQP)

2. DERIVACIÓN DE SQP

En NLP para ingeniería de procesos, se usan esencialmente dos métodos en todos los
problemas: gradiente reducido y SQP. Una ventaja de este último es que necesita muchas
menos evaluaciones de funciones que los métodos de gradiente reducido (y otros métodos
posibles). En algunos NLP, como es la optimización de diagramas de flujo, esto supone una
ventaja clave.
El algoritmo SQP se ha venido analizando y probando en análisis numérico y en ingeniería de
procesos desde 1977. Requiere en general menor número de evaluaciones de funciones de
todos los algoritmos NLP actuales. Además, no requiere que los puntos intermedios estén en
la región factible y converge hacia las soluciones óptimas por caminos no posibles. Ambas
características lo hacen muy adecuado en problemas de optimización de diagramas de flujo
donde la evaluación de funciones es costosa.
Por otro lado, el funcionamiento del algoritmo SQP (aunque no la solución final) depende del
tamaño de las funciones y variables. Por ello, es preciso tener cuidado por evitar
planteamientos iniciales incorrectos. Además, la linealización de las restricciones lejos de la
solución pueden dar lugar a problemas QP que no tengan una región posible. En estas
condiciones, se aplican estrategias de relajación para las restricciones linealizadas, aunque no
son siempre efectivas.
El algoritmo SQP que se va a presentar no es eficaz para problemas grandes (>100 variables)
dado que las aproximaciones BFGS y el subproblema QP (en paso 3) se resuelven mediante el
uso de álgebra lineal excesivamente densa, que implica un coste elevado de tiempo de
computación. En estos casos, se deben usar los métodos de espacio reducido, como MINOS
(1982) o adaptaciones de SQP que se verán en los temas siguientes.
Hay varias formas de llegar al algoritmo SQP. Vamos a ver una basada en condiciones KT,
como un sistema de ecuaciones no lineales en x, µ y λ. Estas ecuaciones se pueden resolver
mediante el método de Newton. Esto es en esencia el método SQP y la razón de su éxito. En
el desarrollo que se va a ver se incluirán algunas modificaciones para poder aplicarlo a las
condiciones KT directamente.
Se considera inicialmente una modificación de las condiciones KT. Si se conocen a priori las
{ }
desigualdades activas, se define A = l g l ( x*) = 0 y se hace que las gA(x) sean restricciones
gl(x), l ∈ A con lo que las condiciones KT se pueden simplificar:
∇ X L( x*, µ*, λ *) = ∇f ( x*) + ∇g A ( x*) µ * +∇h( x*) λ* = 0
(gradiente con respecto a x)
gA (x*) = 0
h (x*) = 0
Y la solución se puede obtener resolviendo estas ecuaciones para x, µ y λ.
Aplicando el método de Newton para resolver las ecuaciones en la iteración, i, da lugar al
siguiente sistema de ecuaciones que definen el intervalo de Newton:

223
Programación cuadrática sucesiva (SQP)

⎛ ∇ XX L ∇g A

∇h ⎞⎛ ∆x ⎞
⎟⎜ ⎟ ⎜
(
⎛ ∇ X L x i , µ i , λi )⎞⎟
⎜ ∇g A
T
0 0 ⎟⎜ ∆µ ⎟ = −⎜ gA xi ( ) ⎟
⎜ ∇h T
⎝ 0 0 ⎟⎠⎜⎝ ∆λ ⎟⎠
⎜⎜
⎝ h xi ( ) ⎟⎟

Lo cual corresponde a las condiciones KT del siguiente problema de minimización:

Min ∇f ( x i )T d + 1 / 2d T ∇ XX L( x i , µ i , λi )d

s.a. g A ( x i ) + ∇g A ( x i )T d = 0

h( x i ) + ∇h( x i ) T d = 0

La programación no lineal (NPL) con una función objetivo cuadrática (en la variable vectorial
d) y con restricciones lineales se denomina Programación Cuadrática (QP) y si
∇ XX L( x i , µ i , λi ) es positivo definido, es decir, y T ∇ XX L( x i , µ i , λi ) y > 0 , para todos los
vectores y no nulos, se dispone de algoritmos de pasos finitos efectivos para la resolución de
estos problemas.
La resolución origina un vector solución d con los multiplicadores µ y λ para gA y h,
respectivamente. Haciendo d = ∆x, ∆µ = µ - µi y ∆λ = λ - λi, la solución es equivalente al
intervalo de Newton mencionado inmediatamente antes.
Para relajar el problema e incluir las desigualdades g(x*) ≤ 0 se generaliza el QP,
modificándolo de forma que determine de forma automática el conjunto de desigualdades
activas gA, resolviéndose el siguiente QP:
Min ∇f ( x i )T d + 1 / 2d T ∇ XX L( x i , µ i , λi )d

s.a. g ( x i ) + ∇g ( x i ) T d ≤ 0
h( x i ) + ∇h( x i ) T d = 0
El QP genera una dirección de búsqueda en x y proporciona valores estimados razonables de
los multiplicadores KT. Sin embargo, para su implementación se necesita la evaluación de
derivadas segundas de la función objetivo, las restricciones y unos buenos valores iniciales de
µ y λ para calcular la matriz Hessiana de la función de Lagrange ( ∇ XX L ). Estas dos tareas
son las principales limitaciones del método.
Este es un método propuesto en 1963 y aplicado en 1967, al que le condiciona una
circunstancia clave: si ∇ XX L no es positiva definida se tiene un problema QP no convexo,
difícil de resolver con métodos QP disponibles.
En 1977 se desarrollaron los métodos Quasi-Newton y funciones de penalización exacta para
resolver los NPL. Consisten en una aproximación de ∇ XX L (matriz Hessiana de la función de
Lagrange) por una matriz simétrica positiva definida Bi. Esta aproximación está basada en un
método de secante, muy similar al método de Broyden. En este caso, el cálculo de Bi se basa
en la diferencia del gradiente de la función de Lagrange ente un punto y el siguiente.

224
Programación cuadrática sucesiva (SQP)

2.1. Aproximación BFGS para ∇xxL (Broyden, Fletcher, Goldfarb, Shanno)


Si se considera la aproximación de la matriz hessiana de la función de Lagrange,
∇ XX L mediante una matriz simétrica Bi, se puede llevar a cabo una actualización de la
aproximación mediante una secante:

B i +1 ( x i +1 − x i ) = ∇ X L( x i +1 , µ i +1 , λ i +1 ) − ∇ X L( x i , µ i +1 , λ i +1 )
donde se definen:
s = xi+1 – xi ,

y = ∇ X L( x i +1 , µ i +1 , λ i +1 ) − ∇ X L( x i1 , µ i +1 , λ i +1 )
dando lugar a una matriz simétrica, positiva definida:
Bi+1 s = y
En este caso, ∇ XX L es una matriz simétrica, y se pretende que Bi también lo sea, así como
definida positiva.
Se puede obtener la actualización de la matriz Bi a Bi+1 utilizando la misma estrategia que se
siguió en la derivación del método de Broyden, llegándose finalmente a la expresión:
B i +1 = B i + yy T / s T y − B i ss T B i / s T B i s
Si Bi es positiva definida y s T y > 0 entonces Bi+1 también lo es. Se debe de comprobar que la
condición s T y > 0 sea satisfecha antes de realizar la actualización del valor de Bi.
Esta última expresión es la que se denomina actualización de Broyden-Fletcher-Goldfarb-
Shanno (BFGS). El resultado de esta actualización es la obtención de una aproximación
razonable de la matriz hessiana que es también positiva definida, lo cual convierte al
problema en uno convexo de QP con propiedades de convergencia adecuadas.

2.2. Características del SQP


El método SQP posee una rápida convergencia y necesita pocas evaluaciones de funciones y
de gradientes. En un entorno próximo a solución se obtienen las siguientes velocidades de
convergencia:
• Si Bi = ∇ XX L( x i , µ i , λi ) , la velocidad de convergencia es cuadrática (K positiva)
2
lim i →∞ x i +1 − x * / x i − x * ≤ K

• Si Bi se obtiene a partir de una actualización de BFGS y ∇ XX L( x i , µ i , λi ) es positiva


definida, la velocidad de convergencia es superlineal:
lim i →∞ x i +1 − x * / x i − x * = 0

• Si Bi se obtiene de una actualización de BFGS, la velocidad de convergencia es


superlineal tras dos etapas:
lim i →∞ x i +1 − x * / x i −1 − x * = 0

225
Programación cuadrática sucesiva (SQP)

Como para la resolución de ecuaciones no lineales, el método SQP se puede modificar para
que pueda empezar lejos de la solución. En este caso, se introduce un algoritmo de búsqueda
de línea que usa una dirección de búsqueda generada por el método SQP pero en la que se
modifica el paso de la siguiente forma:
xi+1 = xi + α d α (escalar) 0 < α ≤ 1
α se elige para asegurar la disminución de una función que representa a la función objetivo
más una suma ponderada de las restricciones.
La función elegida para este propósito es la denominada función de penalización exacta (exact
penalty function), y es la elección más habitual para los algoritmos SQP:
P ( x , γ, η) = f ( x ) + ∑ j γ j max(0, g j ) + ∑ j η j h j

donde las factores de ponderación se eligen lo suficientemente grandes de modo que γj > µj,
ηj > λ j , siendo µi y λi los multiplicadores estimados en el algoritmo.

Con esta función y la actualización BFGS, se garantiza que el SQP converge hacia una
solución local si la función objetivo tiene una cota inferior y los subproblemas QP son
resolubles.
Existen distintas funciones disponibles junto con modificaciones del algoritmo SQP, pero los
elementos básicos del mismo se muestran en la tabla I.

Tabla I. Algoritmo SQP básico


0. Se supone x0, y se fija B0 = I (la matriz identidad se elige por defecto). Se evalúan
f(x0), g(x0) y h(x0).
1. En xi, evalúa ∇f ( x i ) , ∇h( x i ) , ∇h( x i ) . Si i>0, se calculan s e y.
2. Si i > 0 y sT y > 0, se actualiza Bi usando la formula BFGS.
3. Se resuelve: Min ∇f ( x i )T d + 1 / 2d T B i d
d
s.a. g ( x i ) + ∇g ( x i )T d ≤ 0

h( x i ) + ∇h( x i ) T d = 0
4. Si d es menor que la mínima tolerancia o las condiciones Kuhn Tucker están dentro
de la mínima tolerancia, el algoritmo se para y ya se tiene la solución.
5. Se busca un tamaño de paso α de forma que 0 < α ≤ 1 y P(xi + α d) < P(xi). Cada
prueba para elegir el tamaño del paso requiere la evaluación adicional de f(x), g(x) y
h(x).
6. Se hace xi+1 = xi + α d, i= i + 1 y se retorna al paso 1.

Para ilustrar el funcionamiento de SQP se va a aplicar éste al siguiente ejemplo

226
Programación cuadrática sucesiva (SQP)

Ejemplo. Funcionamiento de SQP


Se va a considerar la solución del siguiente problema (sencillo) no lineal
Min x2
s.a. − x 2 + 2( x1 ) 2 − ( x1 ) 3 ≤ 0
− x 2 + 2(1 − x1 ) 2 − (1 − x1 ) 3 ≤ 0
La región factible para el problema propuesto se indica en la figura 2, en la que se observa que x* =
[0.5, 0.375]

Figura 2. Región factible y diagrama de contornos para el ejemplo (Biegler et al., 1997)

Se comienza en el origen (x0 = [0, 0]T y B0 = I), se linealizan las restricciones y se resuelve el siguiente
QP:
Min d2+ ½ (d 12 + d 22)
s.a. d 2 ≥ 0
d1 + d 2 ≥ 1
T
De donde se obtiene una dirección de búsqueda con d = [1,0] y multiplicadores µ1 =0 y µ2=1. Los
contornos de esta función cuadrática junto con las restricciones linealizadas se muestra en la figura 3
para la primera iteración del método SQP. Una búsqueda de línea a lo largo de d determina un α = 0.5,
y el nuevo punto es x1 =[0.5, 0]T (fuera de la región posible). A partir de este punto a partir de:

⎡0⎤ ⎡4 x1 − 3( x1 ) 2 ⎤ ⎡− 4( 1 − x1 ) + 3( 1 − x1 ) 2 ⎤
∇ X L( x , µ ) = ⎢ ⎥ + µ 1 ⎢ ⎥ + µ2 ⎢ ⎥
⎣1 ⎦ ⎣− 1 ⎦ ⎣− 1 ⎦
se tiene

s = x 1 − x 0 = [0.5,0]
T

y = ∇ X L( x 1 , µ1 ) − ∇ X L( x 0 , µ1 )
= [− 1.25,0] − [− 1,0] = [− 0.25,0]
T T T

227
Programación cuadrática sucesiva (SQP)

Figura 3. Primera iteración SQP (Biegler et al., 1997)

T 1
Como s y=-0.125 <0, no se puede actualizar la aproximación BFGS y se vuelve a la condición B = I.
En la segunda iteración se resuelve el siguiente QP:
Min d2+ ½ (d 12 + d 22)
s.a. − 1.25d1 − d 2 + 0.375 ≤ 0

1.25d1 − d 2 + 0.375 ≤ 0
Los contornos de esta función cuadrática junto con las restricciones linealizadas se muestra en la
figura 4 para la segunda iteración del método SQP

Figura 4. Segunda iteración SQP. Convergencia en el punto óptimo (Biegler et al., 1997)

T
La solución de este problema cuadrático proporciona una dirección de búsqueda d = [0, 0.375] Una
búsqueda de línea a lo largo de d determina un α = 1( paso completo), de tal modo que el nuevo punto

228
Programación cuadrática sucesiva (SQP)

T
es x2=[0.5, 0.375] . Del problema QP planteado se obtienen unos multiplicadores µ1 =0.5 y µ2=0.5., de
forma que en x2:

⎡0 ⎤ ⎡4 x − 3( x1 ) 2 ⎤ ⎡− 4(1 − x1 ) + 3(1 − x1 ) 2 ⎤ ⎡0⎤


∇ X L( x 2 , µ 2 ) = ⎢ ⎥ + µ1 ⎢ 1 ⎥ + µ 2⎢ ⎥=⎢ ⎥
⎣1 ⎦ ⎣− 1 ⎦ ⎣− 1 ⎦ ⎣0 ⎦
g1 ( x 2 ) = − x 2 + 2( x1 ) 2 − ( x1 ) 3 = 0
g1 ( x 2 ) = − x 2 + 2(1 − x1 ) 2 − (1 − x1 ) 3 = 0 ,
Se cumplen las condiciones KT de primer orden, y el algoritmo se para en x*= x2. Además, como
g1(x*)=0 y g2(x*)=0 no hay direcciones posibles para comprobar la curvatura positiva, por lo que
también se cumplen las condiciones KT de segundo orden. La figura 4 muestra la convergencia del
método en el punto óptimo.

3. BIBLIOGRAFÍA

• AspenTech, ASPEN Plus 11.1 User guide (2002).


• Biegler, L.T., Grossmann, I.E., Westerberg, A.W., “Systematic Methods of Chemical
Process Design”, Prentice Hall, Nueva Jersey (1997).
• Hyprotech, HYSYS user’s guide.
• Seider, W.D., Seader, J.D., Lewin, D.R., “Process Design Principles”, John Wiley & Sons,
Nueva York (1999)

229
III. Optimización de diagramas de flujo con
HYSYS

Optimización de procesos con


simuladores modulares
Susana Luque Rodríguez

Departamento de Ingeniería Química


y Tecnología del Medio Ambiente
Universidad de Oviedo
Optimización de procesos con simuladores modulares

ÍNDICE

1. INTRODUCCIÓN ....................................................................................................233
2. OPTIMIZACIÓN CON SIMULADORES MODULARES .................................233
3. OPTIMIZACIÓN DEL DIAGRAMA DE FLUJO DEL PROCESO WILLIAMS -
OTTO.........................................................................................................................236
4. OPTIMIZACIÓN DEL DIAGRAMA DE FLUJO DE LA SÍNTESIS DE
AMONIACO .............................................................................................................238
5. BIBLIOGRAFÍA ......................................................................................................241

1. INTRODUCCIÓN
En los temas del bloque II se ha definido la simulación en modo modular secuencial y se han
discutido las estrategias de descomposición y resolución de ecuaciones para modelizar un
diagrama de flujo. A continuación, vamos a extender esto a la optimización de procesos.
Además de las especificaciones del diagrama de flujo y las ecuaciones que determinan los
balances de materia y energía, en un problema de optimización se puede identificar un
subconjunto de variables, ~ x , que constituyen los grados de libertad. Estas variables se
seleccionan de entre las variables asociadas a las corrientes de alimentación, las condiciones
del proceso y las variables o especificaciones de las unidades individuales. En simuladores
modulares, la estrategia más eficaz de optimización es la SQP, vista en el tema anterior.

2. OPTIMIZACIÓN CON SIMULADORES MODULARES


Los problemas de optimización en simuladores modulares tienen una estructura del tipo de la
representada en la Figura 1. Los módulos relacionados con el procesado de la alimentación
(PA), reacción (RE), separación y recirculación (SR), tratamiento de la recirculación (TR) y
recuperación del producto (RP) contienen las ecuaciones del modelo y los procedimientos
para su resolución.

TR

Min f(x)
g(x) ≤ 0
c(x) = 0

PA RE SR RP

Figura 1. Estructura de un problema de optimización en un diagrama de flujo modular


(adaptado de Biegler et al., 1997)
233
Optimización de procesos con simuladores modulares

En estos casos, se formulan las funciones objetivo y las restricciones en términos de variables
de corrientes y unidades del diagrama de flujo, siendo funciones implícitas de las variables de
decisión, ~x , que son un subconjunto de las variables del proceso, x. Típicamente, la función
objetivo, f(x), representa costes de procesado, rendimiento del proceso o beneficios globales;
las purezas de producto y los límites de operación habitualmente vienen representados por
desigualdades, g(x); y las especificaciones de diseño implícitas están representadas por
restricciones adicionales en forma de igualdades, c(x).
Como se va a usar un método algorítmico basado en gradientes, tanto la función objetivo
como las restricciones han de ser funciones continuas y diferenciables. Además, en el modo
modular, las derivadas de las relaciones implícitas de los módulos (con respecto de ~
x ) no se
encuentran directamente disponibles, por lo que frecuentemente se obtienen de diferencias
finitas (con evaluaciones adicionales del diagrama de flujo) o mediante la mejora en los
modelos de unidades de forma que se puedan obtener las derivadas exactas.
Los problemas de optimización de diagramas de flujo emplean modelos grandes y complejos
pero con relativamente pocas variables de diseño. Aunque el número de variables del
diagrama de flujo puede ser de varios miles, éstas están “escondidas” dentro del simulador y
los grados de libertad son raramente más de 50-100 variables.
Por todo ello, el modo modular presenta una serie de ventajas para la optimización son:
• facilidad de construcción e inicialización, dado que los procedimientos numéricos
empleados están seleccionados a medida de cada unidad
• facilidad para localizar y eliminar errores, ya que se pueden emplear conceptos
intuitivos para el ingeniero.
Por otro lado, un inconveniente que se presenta es debido a que los modelos de unidades se
tienen que resolver repetidamente, por lo que es necesario una definición cuidadosa del
proceso para evitar el fallo inmediato de dichas unidades.
Los primeros métodos de optimización se basaban en estrategias de caja negra, que
posteriormente dejaron de usarse. En estos métodos se disponía de un algoritmo de
optimación alrededor del simulador. Se necesitaba resolver el diagrama de flujo repetidamente
y un fallo en la convergencia del diagrama de flujo iba en detrimento de la optimización.
Además, como los gradientes se determinan mediante diferencias finitas, éstas habitualmente
fallan debido a errores de redondeo derivados de la convergencia del diagrama de flujo, lo
cual tenía un efecto adverso sobre la estrategia de optimización. Típicamente, una
optimización de diagrama de flujo con diez grados de libertad requería el tiempo equivalente
a varios cientos de simulaciones con la implementación de caja negra.
Desde mediados de los 80, la optimización de diagramas de flujo en modo modular se ha
convertido en una herramienta industrial ampliamente utilizada, lo cual ha sido posible
gracias a tres avances:
• La estrategia SQP requiere pocas evaluaciones de funciones y resulta muy eficaz en
los problemas de optimización que requieren pocas funciones a evaluar.
• Los bucles de convergencia intermedios, como los derivados de las corrientes de
recirculación y las especificaciones “implícitas”, se pueden incorporar como
restricciones en forma de igualdades al problema de optimización, lo cual es
particularmente importante en bucles que de otra forma se harían converger con
métodos de punto fijo, que habitualmente resultan seguros, aunque muy lentos. Con

234
Optimización de procesos con simuladores modulares

SQP se logra una convergencia de las restricciones en forma de igualdades y


desigualdades simultáneamente con el problema de optimización.
• Dado que SQP es un método tipo Newton, se puede incorporar en el simulador
modular a través de un “bloque” (o módulo) de resolución de ecuaciones que se usa
frecuentemente en convergencia de recirculaciones. Como resultado, no es necesario
modificar la estructura del simulador ni de los modelos de operación unitarias.

OPTIMIZACIÓN OPTIMIZACIÓN

OPTIMIZACIÓN

SIMULACIÓN SIMULACIÓN

Figura 2. Evolución desde el método de caja negra (izquierda) a la aproximación de camino


imposible usando SQP (adaptado de Biegler et al., 1997).

Consecuentemente, esta estrategia se ha podido incorporar fácilmente en los simuladores


modulares secuenciales ya existentes y es directamente aplicable a los diagramas de flujos
modelizados en ellos. Como se muestra esquemáticamente en la figura 2, esta estrategia
“rompe” parte del problema de simulación e incorpora parte del mismo en el NLP. El
resultado es una resolución un orden de magnitud más rápida que la caja negra y mucho más
fiable.
Un esquema de una aplicación típica de la estrategia de optimización SPQ en un diagrama de
flujo de proceso se muestra en la figura 3, en la cual se han identificado las variables de
optimización, ~x , así como la corriente a seccionar y las variables de dicha corriente, y. Como
se ha descrito en el bloque II, el problema de simulación se puede describir por la ecuación
h(y) = y - w(y), siendo w(y) los valores calculados para corriente seccionada tras un paso
completo por el diagrama de flujo.
La formulación del problema de optimización sería entonces como sigue:
Min f ( ~ x,y )
s.a. h( ~
x , y ) = y − w( ~
x, y ) = 0
c( ~
x, y )= 0
g( ~
x, y ) ≤ 0
en el que las ecuaciones, h, correspondientes a las recirculaciones (seccionado) y las
especificaciones de diseño se resuelven como parte del problema de optimización.

235
Optimización de procesos con simuladores modulares

3 2

h(y) = 0

4 6 w(y) y
1

~
x
5

Figura 3. Diagrama de flujo típico para optimización de procesos en modo modular secuencial
(adaptado de Biegler et al., 1997).

Este problema se puede resolver empleando los algoritmos SQP o de gradiente reducido
vistos con anterioridad. Cada evaluación de la función objetivo y las restricciones requiere un
paso completo por el diagrama de flujo y se requieren pasos adicionales para los cálculos de
gradientes respecto de ~ x e y. Una vez obtenidos éstos, el SQP resuelve el siguiente
subproblema QP:
Min ∇f ( ~
x i , y i )T d + 1 / 2d T B i d
d
s.a. h( ~
x i , y i ) + ∇h( ~
x i , y i )T d = 0

c( ~
x i , y i ) + ∇c ( ~
x i , y i )T d = 0

g( ~
x i , y i ) + ∇g ( ~
x i , y i )T d ≤ 0
La actualización de ~
x e y se leva a cabo a través de la dirección de búsqueda d:
[~x i +1T
] [
, y i +1T = ~ ]
x iT , y iT + αd

3. OPTIMIZACIÓN DEL DIAGRAMA DE FLUJO DEL PROCESO


WILLIAMS - OTTO

El proceso simulado en el tema 7 se puede extender a un problema de optimización


seleccionando cinco grados de libertad: flujos de alimentación (F1 y F2), volumen del reactor
(V), fracción purgada (v) y temperatura del reactor (T). Todas estas variables están acotadas y,
además, se impone una cota superior a la producción. La figura 4 muestra el diagrama d flujo
del proceso con estas variables señaladas.

236
Optimización de procesos con simuladores modulares

Alimentaciones:
F1 (A) V,T FP
F2 (B)

f(Fd)

Fd

Fwaste

FR (r ecir culación) Fpurga

Purga, ν

Figura 4. Diagrama de flujo típico para optimización de procesos en modo modular secuencial
(adaptado de Biegler et al., 1997)

La función objetivo se define como el retorno de la inversión (ROI) y viene dada en términos
del producto neto de ventas (FP) menos los costes fijos del proceso, el coste de las materias
primas (FA y FB), los sistemas auxiliares de la planta (FV)y el tratamiento de residuos (Fwaste).

Max ROI = [2207 FP + 50FV − 168.F A − 252FB − 2.22FR − Fwaste + 600Vρ − 1041.6] / 6Vρ

Dado que el proceso se modeliza en modo modular, las ecuaciones son las mismas que las
indicadas en el tema 7. Los elementos adicionales del problema NLP son las ecuaciones y
variables de seccionado. En este caso, se eligió para este propósito la corriente de entrada a la
columna de destilación y las variables de seccionado (Fd) representan los flujos de los
componentes A, B, C, E y P en esta corriente. El problema consta de diez variables y cinco
restricciones en forma de ecuaciones :

Max ROI = [2207 FP + 50FV − 168.F A − 252FB − 2.22FR − Fwaste + 600Vρ − 1041.6] / 6Vρ

s.a. Fd − f ( Fd ) = 0

0 ≤ FP ≤ 4763
580 ≤ T ≤ 680

30 ≤ V ≤ 100
0 ≤ ν ≤ 0.99
F1 , F2 , FR ≤ 0

237
Optimización de procesos con simuladores modulares

Los valores iniciales y finales de las variables se muestran en la tabla I y en este caso es difícil
la convergencia del NLP a partir del punto inicial elegido. Además, en este problema hay
varios puntos singulares y soluciones locales. El SQP empleado (tal como se ha descrito en el
tema anterior) encontró la solución óptima en 196 iteraciones (se pueden encontrar más
detalles en el trabajo de Vasantharajan y Biegler, 1988), lo cual indica la necesidad de una
buena inicialización del problema y la importancia del tamaño del problema cuando se emplea
SQP.

Tabla I. Valores de las variables para la optimización del proceso Williams-Otto


Variables Punto inicial Valores óptimos
FRA 8820 46261.4
FRB 39910 143281
C
FR 2360 7585.83
P
FR 7890 18826.5
E
FR 31660 141847
FA 11540 13164.3
FB 31230 29991.2
V 60 30
T 610 674.36
ν 0.5806 0.8998
ROI 124624 131423

4. OPTIMIZACIÓN DEL DIAGRAMA DE FLUJO DE LA SÍNTESIS


DE AMONIACO

A continuación se presenta un ejemplo de un proceso más complejo en el que se lleva a cabo


una optimización mediante el algoritmo del camino imposible. En este caso se va a abordar el
diagrama de flujo del proceso de producción de amoniaco mostrado en la figura 5. Las
corrientes de alimentación con hidrógeno y nitrógeno se mezclan y comprimen, para
posteriormente unirse a una corriente de recirculación antes de pasar por un precalentamiento
hasta la temperatura de reacción. La reacción tiene lugar en un reactor de lecho fijo con varios
lechos (el cual se modeliza como si fuera un reactor de equilibrio), en donde tiene lugar la
conversión parcial de la mezcla de reactivos en amoniaco. La corriente de salida del reactor se
enfría y el producto se separa tras dos tanques de equilibrio con refrigeración intermedia. La
corriente líquida que abandona la segunda etapa sufre una nueva separación de equilibrio
(flash) a menor presión con el objeto de obtener un producto licuado de gran pureza. El vapor
de la separación de equilibrio en dos etapas da lugar a la corriente de recirculación y se
comprime antes de mezclarse con la corriente de alimentación fresca.
Este diagrama de flujo se ha resuelto usando el simulador FLOWTRAN, empleando los datos
económicos suministrados por defecto en el programa. La función objetivo maximiza el valor
actualizado neto de los beneficios, con un 15 % de retorno de la inversión y una vida del
proyecto de 5 años. Las variables para la optimización es este caso se muestran en la figura 5
238
Optimización de procesos con simuladores modulares

y en la tabla II; incluyen las variables de seccionado (flujos de las corrientes seccionadas,
presión y temperatura). Las restricciones incluyen las ecuaciones con las variables
seccionadas (recirculación), cotas inferiores y superiores de la relación de hidrógeno a
nitrógeno en la alimentación al reactor, límites de temperatura en el reactor y pureza de
producto. La composición de la alimentación viene dada por:

Corriente de Hidrógeno Corriente de Nitrógeno


N2 5.2 % 99.8 %
H2 94.0 % -
CH4 0.79 % 0.02 %
Ar 0.01 % -

Sin embargo, en este problema se especifica una producción de amoniaco en lugar de una
alimentación al proceso. Como resultado de esto, los flujos de las corrientes de alimentación
son variables de decisión y se impone una restricción de producción en todo el proceso.

Figura 5. Diagrama de flujo del proceso de producción de amoniaco (Biegler et al., 1997)

El programa NLP viene dado por:

239
Optimización de procesos con simuladores modulares

Max (Beneficios totales al 15 % durante 5 años)


s.a. 105 ton NH3/
Balance de presión
Ausencia de líquido en compresores
1 .8 ≤ H 2 / N 2 ≤ 3 .5
Treact ≤ 1000 ºF
NH3 purgado ≤ 4.5 lbmol/h
Pureza del NH3 producido ≥ 99.9%
Ecuaciones de seccionado

Empleando el algoritmo SQP, se logra la convergencia en sólo cinco iteraciones. Además, a


partir del punto inicial indicado en la tabla II, el NLP es difícil de converger. Como resultado
de ello, la estrategia de “caja negra” habría tenido serias dificultades con este problema. Por
otro lado, la estrategia de optimización del camino imposible requiere únicamente el tiempo
de computación equivalente a 2.2 simulaciones base. Usando SQP, la función objetivo mejora
desde 20.66·106 $ hasta 24.93·106 $. Los valores óptimos de las variables de decisión también
se indican en la tabla II. Se puede encontrar más información sobre este ejemplo en el trabajo
de Lang y Biegler (1987).

Tabla II. Resultado del problema de optimización de producción de amoniaco

Óptimo Punto inicial Cota inferior Cota superior


Función objetivo ($106) 24.9286 20.659
Variables de diseño
1. T entrada al reactor (ºF) 400 400 400 600
2. T entrada Flash 1 (ºF) 65 65 65 100
3. T entrada Flash 2 (ºF) 35 35 35 60
4. T entrada comp. reciclo (ºF) 80.52 107 60 400
5. Fracción purgada (%) 0.0085 0.01 0.005 0.1
6. P entrada al reactor (psia) 2163.5 2000 1500 4000
7. Flujo alimentación 1 (lbmol/h) 2629.7 2632.0 2461.4 3000
8. Flujo alimentación 2 (lbmol/h) 691.78 691.4 643 1000
Variables de seccionado
Flujo (lbmol/h)
N2 1494.9 1648
H2 3618.4 3676
NH3 524.2 424.9
Ar 175.3 143.7
CH4 1981.1 1657
T (ºF) 80.52 60
P (psia) 2080.4 1930

240
Optimización de procesos con simuladores modulares

Dada su eficacia, la estrategia del camino imposible se ha convertido en una herramienta muy
usada en simuladores modulares. Dado que es fácil de implementar y se puede aplicar
directamente a los modelos existentes, su uso se ha convertido en rutinario en el diseño y
operación de procesos. Por otro lado, esta estrategia también requiere modelos de operaciones
unitarias robustos para las corrientes de entrada y las variables de diseño. Además la
convergencia de los modelos en los puntos intermedios del SQP aún puede ser difícil. Con el
objeto de abordar estos casos más complejos, en el tema siguiente se van a introducir las
estrategias de optimización aplicables al modo orientado a ecuaciones, el cual permite una
convergencia más rápida y gran flexibilidad en las especificaciones del problema de
simulación.

5. BIBLIOGRAFÍA

• AspenTech, ASPEN Plus 11.1 User guide (2002).


• Biegler, L.T., Grossmann, I.E., Westerberg, A.W., “Systematic Methods of Chemical
Process Design”, Prentice Hall, Nueva Jersey (1997).
• Hyprotech, HYSYS user’s guide.
• Lang, Y.-D., Biegler, L.T., A unified algorithm for flowsheet optimization, Comp. Chem.
Eng., 11, 143 (1987).
• Scenna, N.J. (Ed.), “Modelado, Simulación y Optimización de Procesos Químicos”,
Universidad Tecnológica Nacional, F.R. Rosario (1999). Versión electrónica
http://www.modeladoeningenieria.edu.ar
• Seider, W.D., Seader, J.D., Lewin, D.R., “Process Design Principles”, John Wiley & Sons,
Nueva York (1999)
• Vasantharajan, S., Biegler, .T., Large-scale decomposition for Successive quadratic
Programming, Comp. Chem. Eng., 12, 1809 (1988).

241
III. Optimización de diagramas de flujo con
HYSYS

Optimización de procesos con


simuladores orientados a ecuaciones
Susana Luque Rodríguez

Departamento de Ingeniería Química


y Tecnología del Medio Ambiente
Universidad de Oviedo
Optimización de procesos con simuladores orientados a ecuaciones

ÍNDICE

1. INTRODUCCIÓN ....................................................................................................245
2. ESTRATEGIA SQP A GRAN ESCALA.................................................................246
3. CARACTERÍSTICAS DE SQP CON HESSIANO REDUCIDO ........................252
4. EJEMPLO. OPTIMIZACIÓN EN TIEMPO REAL CON rSQP........................252
5. BIBLIOGRAFÍA ......................................................................................................255

1. INTRODUCCIÓN

La simulación de procesos orientada a ecuaciones se ha convertido en un método habitual


para diagramas de flujo complejos con recirculaciones anidadas y especificaciones de diseño
implícitas. En esta forma de simulación, la convergencia de las operaciones unitarias y la
estructura de la recirculación se lleva a cabo simultáneamente a través de un sistema de
resolución Newton–Raphson. Además, en el modo orientado a ecuaciones, habitualmente se
dispone de derivadas exactas y el funcionamiento de los métodos de resolución de ecuaciones
y algoritmos de optimización no se ve deteriorado por errores de redondeo en los gradientes.
Por otro lado, se requiere una formulación e inicialización cuidadosa por el usuario lo cual se
lleva a cabo mediante estrategias que varían según el problema.
Cuantas más ecuaciones se incorporan en el NLP, mayor se hace el tamaño del mismo que se
ha de resolver mediante SQP. Los grados de libertad son los mismos, pero el número de
variables incorporadas en el algoritmo se incrementa. Por ejemplo, en la estrategia de caja
negra, las variables de diseño ~ x son las únicas en el problema de optimización. Con el
método del camino imposible en simuladores modulares se incluyen las variables de
corrientes a seccionar y las variables de diseño ( ~
x , y). Finalmente, en simulación orientada a
ecuaciones, todas las variables de las corrientes y de las operaciones unitarias (x) que se
tienen que resolver simultáneamente se han de incorporar en el problema de optimación.
Consecuentemente, el algoritmo de programación no lineal que se emplee debe ser adecuado
para problemas grandes.
A diferencia del modo modular, el coste computacional más significativo en simulación de
procesos orientada a ecuaciones no es la evaluación de funciones del diagrama de flujo, sino
en el algoritmo NLP en sí mismo. Los modelos son sistemas grandes de ecuaciones con
relativamente pocos grados de libertad. Los costes computacionales en los que incurre con el
manejo de grandes sistemas de ecuaciones (linealizadas) tienden a ser dominantes, aunque la
evaluación de funciones de modelos de propiedades físicas también supone un coste
significativo. Por lo tanto, tanto la eficacia del algoritmo como el número de evaluaciones de
funciones son aspectos importantes a tener en cuenta cuando se emplea este modo de
simulación y optimización de procesos.
El algoritmo SQP que se ha presentado en el tema 13 no es adecuado para problemas grandes.
Aunque requiere pocas iteraciones y evaluaciones de funciones para lograr la convergencia, el
algoritmo SQP básico no explota la estructura dispersa de los gradientes de las restricciones y,
245
Optimización de procesos con simuladores orientados a ecuaciones

en particular, la resolución del subproblema QP se lleva a cabo con una matriz densa (por lo
que el esfuerzo para su resolución crece cúbicamente con el tamaño del problema). Por otro
lado, los métodos de gradiente reducido (MINOS) sí son adecuados para muchos problemas
grandes en el modo orientado a ecuaciones. Mientras que SQP resuelve subproblemas QP,
MINOS resuelve subproblemas NLP con restricciones lineales. Debido a ello, requiere
muchas más evaluaciones de funciones. Sin embargo, explota la estructura dispersa de la
matriz de los gradientes de las restricciones y lleva implementados procedimientos de
descomposición matricial muy eficaces. Como resultado de esta descomposición, MINOS es
capaz de resolver un problema de optimización no lineal en el espacio reducido definido por
los grados de libertad de la optimización. Dado que éstos son un número reducido, MINOS
puede resultar muy eficaz para diagramas de flujo simulados en el modo orientado a
ecuaciones. Por otro lado, SQP tiene propiedades de convergencia globales mejores que
MINOS y en la práctica MINOS habitualmente tiene problemas en manejar las restricciones
no lineales que habitualmente se presentan en los modelos de diagramas de flujo.
Basado en las características de la optimización en simulación orientada a ecuaciones y en las
ventajas relativas de SQP y MINOS, se va considerar una estrategia SQP a gran escala que
incorpore mucha de las características que en MINOS permiten resolver problemas grandes a
la vez que se vas a preservar las buenas propiedades de convergencia de SQP. El algoritmo
SQP resultante combina estos dos aspectos, trabaja en el espacio reducido de las variables de
decisión, y aplica algoritmos de descomposición de matrices de estructura dispersa.
Consecuentemente, es más de un orden de magnitud más rápido que el SQP básico en
problemas de optimización de diagramas de flujo.

2. ESTRATEGIA SQP A GRAN ESCALA

Considérese el programa de optimización NPL a gran escala:


Min f(z)
s.a. h(z) = 0
zL ≤ z ≤ zU
Por conveniencia, se convierten las restricciones en forma de desigualdades en igualdades
mediante la incorporación de variables de holgura, s≥0. El NLP se redefine con
[ ]
z T = x T s T con n variables y m restricciones en forma de igualdades.
En la iteración i, el subproblema QP en el SQP se puede escribir como:
Min ∇f ( z i )T d + 1 / 2d T B i d

s.a. h( z i ) + ∇h( z i )T d = 0

z L ≤ z i + d ≤ zU

donde d es la dirección de búsqueda en el espacio de n dimensiones y Bi es la matriz hessiana


n*n de la función lagrangiana o de su aproximación.

246
Optimización de procesos con simuladores orientados a ecuaciones

En problemas grandes, la aproximación BFGS no es práctica, puesto que genera una matriz
grande y densa. En su lugar las aplicaciones de SQP a gran escala se pueden clasificar en dos
estrategias generales:
• ESPACIO COMPLETO: se explota la estructura dispersa del QP directamente, tanto de Bi
como de ∇h, consiguiéndose una factorización eficaz. Un modo de mantener la estructura
dispersa de Bi es usando derivadas segundas exactas del lagrangiano. Esta estrategia es
especialmente buena en problemas con muchos grados de libertad (por ejemplo,
optimización de trayectorias o formas). Sin embargo, en diagramas de flujo, además de la
dificultad de obtener las derivadas segundas, la resolución del QP se puede volver más
difícil, si el Hessiano no es positivo definido. Consecuentemente, se necesita implementar
un algoritmo más complejo.
• ESPACIO REDUCIDO (rSQP): sólo se utiliza la estructura de ∇h y se construye una
proyección de la matriz Hessiana. El orden de la matriz proyectada es igual a los grados de
libertad (n – m) y la matriz sí se puede calcular directamente a partir de derivadas segundas
exactas o mediante una aproximación BFGS. Este método se puede derivar a partir de las
condiciones de optimalidad del QP. Sin considerar, por el momento, las restricciones en
forma de cotas de z, el sistema resultante linear es:
⎡ B ∇h ⎤ ⎡ d ⎤ ⎡∇f ⎤
⎢ T ⎥ ⎢ ⎥ = −⎢ ⎥
⎣∇h 0 ⎦ ⎣λ ⎦ ⎣h ⎦
Se define a continuación una matriz Y n*m y una matriz Z n*(n-m) de modo que:
∇h( z i ) Z = 0 y [Y Z ] es una matriz cuadrada no singular

Dada la no singularidad de la matriz, la dirección de búsqueda se puede particionar en dos


componentes, dY y dZ, respectivamente:
d = Yd Y + Zd Z

La matriz Y es una representación del espacio de rango de ∇h( z i ) y el vector dY contiene las
variables que satisfacen las restricciones. Por otro lado, la matriz Z es una representación del
espacio vacío de ∇h( z i ) T y el vector dZ contiene las variables que se emplean en mejorar la
función objetivo. Aplicando la partición de d y multiplicando la primera línea por la
transpuesta de [Y Z ] , las condiciones de optimalidad se pueden rescribir de la forma
siguiente:
⎡Y T BY Y T BZ R ⎤ ⎡d Y ⎤ ⎡Y T ∇f ⎤
⎢ T ⎥ ⎢ ⎥
⎢ Z BY Z T BZ 0 ⎥ ⎢⎢d Z ⎥⎥ = − ⎢ Z T ∇f ⎥
⎢ RT 0 0 ⎥⎦ ⎢⎣ λ ⎥⎦ ⎢ h ⎥
⎣ ⎣ ⎦
Donde R = Y T ∇h( z i ) es una matriz cuadrada no singular de orden m. Este sistema es igual
que el original, pero es de más fácil descomposición. A partir de la última línea, resolvemos
un sistema disperso de m ecuaciones que permite obtener dY:
RT dY = − h( z i )
Con esta solución, resolvemos un sistema de n-m ecuaciones en dZ incluidas en la segunda
línea:
247
Optimización de procesos con simuladores orientados a ecuaciones

(
Z T BZd Z = − Z T ∇f ( z i ) + Z T BYd Y )
y con ello la dirección de búsqueda está totalmente definida.
Dado que tanto los intervalos de rango como de espacio vacío se desvanecen al llegar a la
convergencia, un modo fácil de calcular los multiplicadores de Lagrange es despreciar los
términos de la matriz Hessiana en la primera fila de matriz, y calcular:
Rλ = −Y T ∇f ( z i )
Para extender esta descomposición para incluir las cotas de las variables, se modifica la forma
de calcular el intervalo de espacio vacío. Después de obtener dY, se obtiene dZ mediante el
siguiente QP:

Min (Z T ∇f ( z i ) + Z T BYd Y ) d Z + 1 / 2d TZ Z T BZd Z


t

s.t. z L ≤ z i + YdY + Zd Z ≤ zU
con las restricciones en forma de igualdad eliminadas. De esta forma, sólo es necesario
calcular (o aproximar mediante BFGS) la proyección del hessiano ZTBY. El término cruzado
ZTBYdY se puede evaluar mediante derivadas segundas exactas o aproximarse mediante
diferencias finitas, aunque frecuentemente este término se supone nulo lo cual, cuando dY es
menor que dZ, no afecta a la convergencia del SQP.
La estrategia SQP con el Hessiano reducido presenta una serie de ventaja sobre el algoritmo
SQP básico. En particular, las matrices Y y Z se pueden seleccionar de forma que sea posible
una factorizaciones eficaz explotando su condición de matrices dispersas. Para ello, se dividen
las variables z en n-m (u) independientes y m (v) variables dependientes. La división se hace
de forma que v se determinan a partir de las restricciones de igualdad una vez se fijan u. En
simulación de diagramas de flujo, por lo tanto, u representa las variables de decisión mientras
que v son las variables dependientes que se calculan en el diagrama de flujo. Se divide a
continuación el sistema disperso de gradientes de restricciones en:
[ ]
∇ z h( z i )T = ∇ u h( z i )T ∇ v h( z i )T = [N C ]

donde C es una matriz cuadrada no singular de orden m. Z viene entonces dado por:
⎡I ⎤
Z =⎢ −1 ⎥
⎣− C N ⎦
y satisface ∇h( z i )T Z = 0 . Y se elige de modo que la matriz n*n [Y Z ] sea no singular, y las
dos posibilidades más habituales para ello son la base de coordenadas y la base ortogonal:
⎡0 ⎤ ⎡ N T C −T ⎤
Y =⎢ ⎥ Y =⎢ ⎥
⎣1 ⎦ ⎣I ⎦
Con la base ortogonal Y T Z = 0 y el paso de espacio de rango dY se determina por una
proyección de mínimos cuadrados y es de longitud mínima. Esto lleva generalmente a menor
número de iteraciones y un funcionamiento más estable de SQP. Por otro lado, el esfuerzo de
cálculo de dY es proporcional a (n-m)3.
Con la base coordenada el cálculo es más sencillo, puesto que sólo involucra una
factorización de la matriz C, es decir, Cd Y = −h( z i ) . En realidad, este paso es equivalente a

248
Optimización de procesos con simuladores orientados a ecuaciones

calcular el intervalo de Newton para resolver el diagrama de flujo (muy adecuado en


implementación de SQP en modelos de procesos grandes). Sin embargo, la determinación de
dY mediante la base de coordenadas también puede originar direcciones de búsqueda largas,
por lo que habitualmente se requiere el uso de márgenes de seguridad para evitar un
funcionamiento pobre durante la resolución del NLP.
La estrategia SQP a gran escala es, sin embargo, muy similar al SQP básico (en la tabla I se
muestra un resumen de la misma). Exceptuando la eliminación de restricciones en forma de
igualdad y la descomposición, la mayor parte de los componentes del SQP básico
permanecen, incluyendo el método de búsqueda de la línea, y la fórmula BFGS aplicada a una
matriz más pequeña (ZTBZ). No obstante, la diferencia clave entre el algoritmo de la tabla I y
el SQP básico es el paso de descomposición para encontrar la dirección de búsqueda en el
QP. Para ilustrar cómo funciona el procedimiento de descomposición en espacio de rango y
espacio vacío se va a abordar un ejemplo de una iteración de un programa QP.

Tabla I. Resumen del algoritmo rSQP


1. Se elige el punto inicial, z0.
2. Para la iteración i, se evalúan funciones y gradientes, ∇f ( z i ) y ∇h( z i ) .
3. Se calculan las matrices base Y y Z.
4. Se resuelve el paso dY en el espacio de rango utilizando una factorización de matriz
dispersa.
(∇h( z ) Y )d
i T
Y = −h( z i )
y, si es necesario, calcula el término cruzado, ZTBYdY.
5. Resuelve el QP reducido para el paso dZ en el espacio vacío:

Min (Z T ∇f ( z i ) + Z T BYd Y ) d Z + 1 / 2d TZ Z T BZd Z


t

s.t. z L ≤ z i + YdY + Zd Z ≤ zU
6. Si la dirección de búsqueda o el error de Kuhn Tucker es menor que la tolerancia cero,
el algoritmo se detiene.
7. En caso contrario, se calcula el paso total d= YdY + Z dZ
8. Se busca un tamaño de paso α de forma que 0 < α ≤ 1 y P (z i + αd ) < P ( z i ) . Cada
prueba de tamaño de paso requiere evaluaciones adicionales de f(z) y h(z).
9. Se actualiza el Hessiano proyectado (ZTBZ) usando la fórmula BFGS.
10. Se hace z i +1 = z i + αd , i = i + 1 y se vuelve al paso 2.

249
Optimización de procesos con simuladores orientados a ecuaciones

Ejemplo. Una iteración del algoritmo rSQP


En la iteración i, se tiene el siguiente QP con n=3 y m=2:

Min ( 5d 1 + d 2 + 4d 3 ) + 1 / 2( d 12 + 4d 22 + 3d 32 )

s.a. d1+2 d2 = 7
2 d 1+3 d3 = 5
-1 ≤ d1 ≤ 5
-2 ≤ d2 ≤ 6
0 ≤ d3 ≤ 4
Los términos del QP se pueden identificar como sigue:

⎡1 0 0 ⎤
∇f z( )i T
= [5 ,1,4] ( )
hz i T
= [− 7 ,−5] ⎢
y Bi = 0 4 0



⎢⎣0 0 3⎥⎦
Las cotas dl QP están dadas por:

z L − z i = [− 1,−2 ,0] z U − z i = [5 ,6 ,4]


T T

y los gradientes de las restricciones se pueden dividir en:

∇h z i( ) = [N C ] = ⎡⎢12
T 2 0⎤
0 3⎥⎦
con C =
⎡2
⎢0
0⎤
3⎥⎦
y
⎡1 ⎤
N= ⎢ ⎥
⎣ ⎣ ⎣ 2⎦
La matriz Z de n* (n-m) es:

⎡1 ⎤
⎡ I ⎤ ⎢
Z =⎢ −1 ⎥
= ⎢− 1 / 2 ⎥⎥
⎣− C N ⎦ ⎢− 2 / 3⎥
⎣ ⎦
y eligiendo la base de coordenadas la matriz Y n*m toma la forma:

⎡ 0 0⎤
⎡0 ⎤ ⎢ ⎥
Y = ⎢ ⎥ = ⎢1 0
⎣ I ⎦ ⎢0 1 ⎥
⎣ ⎥⎦
[ ]
Se puede verificar rápidamente que ∇h( z i )T Z = 0 y que Y Z es una matriz cuadrada no singular.

Para calcular la dirección de búsqueda, d = YdY + Z dZ se consideran los vectores componentes de


rango y espacio vacío. El vector dY de dimensión m se puede evaluar a partir de la siguiente relación:

∇h( z i )T Y = R T = C
Lo cual lleva a:
⎡2 0⎤ ⎡7 ⎤
R T d Y = Cd Y = −h( z i ) o ⎢ ⎥ dY = ⎢ ⎥
⎣0 3⎦ ⎣5⎦

250
Optimización de procesos con simuladores orientados a ecuaciones

y el paso de espacio de rango está dado por d Y = [7 2 , 5 3] . Para el vector Z de dimensiones (n –


T

m), es necesario resolver un QP cuyos elementos se pueden evaluar como sigue:

⎡ 0 0⎤ ⎡0 ⎤
⎢ ⎡ 7 / 2 ⎤
Yd Y = ⎢1 0⎥ ⎢ = ⎢7 / 2 ⎥
⎥ ⎣5 / 3 ⎥⎦ ⎢ ⎥
⎢⎣0 1 ⎥⎦ ⎢⎣5 / 3 ⎥⎦

⎡1 0 0⎤ ⎡1 ⎤
T ⎢ ⎥ ⎢
Z BZ = [1 -1/2 − 2 / 3] 0 4 0 = − 1 / 2 ⎥ = 10 / 3
⎢ ⎥ ⎢ ⎥
⎣⎢0 0 3⎦⎥ ⎣⎢ − 2 / 3⎦⎥
⎡5 ⎤
Z ∇f ( z ) = [1 -1/2 − 2 / 3]⎢1 ⎥ = 11 / 6
T i
⎢ ⎥
⎢⎣4⎥⎦

⎡1 0 0⎤ ⎡0 0⎤
⎡7 / 2 ⎤
Z T BYd Y = [1 -1/2 − 2 / 3]⎢0 4 0⎥ ⎢1 0⎥ ⎢ = −31 / 3
⎢ ⎥ ⎢ ⎥ ⎣5 / 3 ⎥⎦
⎣⎢0 0 3⎦⎥ ⎣⎢0 1 ⎥⎦
La combinación de estos términos en el QP:

(
Min Z T ∇f ( z i ) + Z T BYd Y )d
t
Z + 1 / 2d TZ Z T BZd Z

s.a. z L − z i − Yd Y ≤ Zd Z ≤ zU − z i − Yd Y

da lugar al siguiente QP para obtener dZ:

Min ( −17 / 2 )d Z + ( 10 / 6 )( d Z )2

⎡− 1 ⎤ ⎡1 ⎤ ⎡5 ⎤
⎢ ⎥ ⎢ ⎥
s.a. − 11 / 2 ≤ − 1 / 2 d Z ≤ ⎢5 / 2⎥
⎢ ⎥ ⎢ ⎥ ⎢ ⎥
⎣⎢ − 5 / 3 ⎦⎥ ⎣⎢ − 2 / 3⎦⎥ ⎣⎢7 / 3⎦⎥
cuya solución es
dZ = 5 / 2
Combinando los componentes de rango y espacio vacío, el vector solución es:

⎡0 ⎤ ⎡1 ⎤ ⎡5 / 2 ⎤
⎢ ⎥ ⎢ ⎥
d = YdY + Z dZ = 7 / 2 + − 1 / 2 (5 / 2) = ⎢9 / 4⎥
⎢ ⎥ ⎢ ⎥ ⎢ ⎥
⎢⎣5 / 3 ⎥⎦ ⎢⎣ − 2 / 3⎥⎦ ⎢⎣0 ⎥⎦

251
Optimización de procesos con simuladores orientados a ecuaciones

3. CARACTERÍSTICAS DE SQP CON HESSIANO REDUCIDO

En el ejemplo anterior se puede observar que la descomposición en espacio de rango y


espacio vacío es equivalente a resolver el QP original. Por lo tanto, la estrategia del hessiano
reducido (rSQP) tiene mucho en común con el algoritmo SQP básico. Por otro lado, en el
algoritmo rSQP, el término ZTBiYdY y el Hessiano ZTBiZ se calculan directamente y no se
derivan del Hessiano completo Bi, por lo que no es preciso evaluar o aproximar éste último.
Las propiedades de convergencia local son también similares para rSQP y SQP. Además, si se
incluye el término cruzado ZTBiYdY (por ejemplo, con una aproximación por diferencias
finitas) entonces la velocidad de convergencia pasa de ser superlineal en 2 pasos a 1 paso,
ligeramente mejor que el SQP básico. Otra ventaja de la estrategia reducida es que
proyección que se realiza del Hessiano es positiva definida en la solución local (como se
deriva de las condiciones de optimalidad de segundo orden) mientras que el Hessiano
completo no tiene porqué serlo. Como resultado de esto, el uso de la aproximación BFGS
para ZTBiZ funciona mejor que su aplicación directa sobre Bi.
Por ejemplo, para el problema de Williams-Otto (de tamaño pequeño), eligiendo las variables
de las corrientes de recirculación (seccionado) como variables dependientes y resolviendo el
problema con rSQP, se requieren sólo 38 iteraciones con la base ortogonal para Y (40 si se
emplea la base coordenada), frente a las 196 iteraciones del SQP básico. Como se observa,
pues, el rSQP presenta ventajas incluso para problemas pequeños.
En problemas grandes, las diferencias computacionales entre los dos métodos están
dominadas por las diferencias en los cálculos de álgebra lineal, pudiendo resumirse mediante
las siguientes relaciones:
Coste del SQP básico = k1 m3 + k2 (n-m)β
Coste del rSQP = k3 mα + k4 (n-m)β
donde las constantes ki son del mismo orden de magnitud. El exponente α refleja los costes
asociados a la descomposición de la matriz dispersa y habitualmente se encuentra
comprendido entre uno y dos. El exponente β incluye el coste de resolución del problema QP,
y dependiendo del algoritmo seleccionado toma valores comprendidos entre dos y tres. Por lo
tanto, en problemas donde n-m sea pequeño, la ventaja clave del rSQP radica en la diferencia
entre los dos primeros términos, debida a la eliminación dispersa de las restricciones en forma
de igualdad. Esto lleva a diferencias en el funcionamiento de ambos algoritmos para
problemas de optimización pequeños (por ejemplo, 1000 variables y menos de 10 grados de
libertad) de más de un orden de magnitud. Para problemas de mayor tamaño, la estrategia
rSQP es claramente superior.

4. EJEMPLO. OPTIMIZACIÓN EN TIEMPO REAL CON rSQP

En este ejemplo se van a determinar las condiciones óptimas de operación para una planta de
fraccionamiento tras un proceso de hidrocraqueo. Este problema presenta un proceso existente
en el cual se desea realizar una optimización en línea a intervalos regulares para actualizar las
252
Optimización de procesos con simuladores orientados a ecuaciones

condiciones de operación. Esto se denomina optimización en tiempo real. La planta de


fraccionamiento separa la corriente que sale de una etapa de hidrocraqueo y la parte más
relevante de la misma se muestra en la parte derecha de la figura 1. El proceso tiene 17
componentes, seis unidades de intercambio de calor entre corrientes del proceso y sistemas
auxiliares , dos cambiadores de calor entre corrientes del proceso y los siguientes modelos de
columna: absorbedor/desorbedor (30 platos), debutanizador (20 platos), separador C3/C4 (20
platos) y desisobutanizador (33 platos). Los detalles de estas unidades se puede obtener de
Bailey et al. (1993).

Figura 1. Diagrama de flujo del proceso Sunoco de hidrocraqueo con optimización en tiempo
real (Biegler et al., 1997).

En la resolución de problemas de optimización en tiempo real, se suele emplear un


procedimiento en dos pasos. Primeramente, se resuelve un caso paramétrico para ajustar el
modelo a un punto de operación (la solución de este caso proporciona las condiciones de
operación en ese preciso momento). A continuación, se lleva a cabo la optimización,
comenzando en el punto anteriormente calculado. El modelo del proceso incluye restricciones
en forma de igualdad que se emplean para representar las unidades individuales y
restricciones en forma de cota que representan los límites de operación físicos de las variables
involucradas (por ejemplo, los flujos o las temperaturas siempre han de ser positivos) así
como cotas en variables clave que impiden que haya grandes cambios respecto de las
condiciones de trabajo iniciales. El modelo consiste en 2836 restricciones en forma de
igualdad y sólo diez variables independientes. La estructura de la matriz que genera es
razonablemente dispersa, con 24123 elementos no nulos en el jacobiano.
La función objetivo para la optimización en línea incluye los costes energéticos así como el
valor añadido a las materias primas a lo largo del proceso, y tiene la siguiente forma:

253
Optimización de procesos con simuladores orientados a ecuaciones

Np
P = ∑ z i C iG + ∑ z i C iE + ∑ ∑ z i C Pm − U
i∈E i∈E m =1 i∈Pm

donde:
P = beneficios
zi = flujos de las corrientes

∑z C
i∈E
i
G
i = valor de los productos y materias primas como gasolinas

∑z C
i∈E
i i
E
= valor de los productos y materias primas como combustible

CPm = costes de productos y materias primas como compuestos puros


U = costes de sistemas auxiliares (utilities)
Además de la optimización del caso base, se han considerado cuatro problemas adicionales
para este proceso. Los casos 2 y 3 estudian el efecto del ensuciamiento de los cambiadores de
calor mediante una disminución en los coeficientes de intercambio de calor en los
cambiadores de la alimentación y las colas del desbutanizador y del separador C3/C4. Los
cambios en las condiciones del mercado se reflejan en un incremento del precio del propano
(caso 4) o en un incremento del precio base de la gasolina junto con un incremento de su
octanaje (caso 5). Los valores numéricos para todos los parámetros se muestran en la tabla II.
Para resolver estos casos se empleó un algoritmo rSQP con base coordenada y con una
tolerancia para la convergencia de 10-8. Se ha comparado la resolución de los casos partiendo
de un punto inicial no factible y partiendo del resultado del caso base, así como el
funcionamiento de rSQP y MINOS.
En la tabla II se puede observar como rSQP es 8 veces más rápido de MINOS para la
resolución del caso base. Además, en todos los casos MINOS requiere al menos dos órdenes
de magnitud más de evaluaciones de funciones que rSQP. Dado que la solución del caso base
es el punto de partida para un sistema en línea, resulta también apropiado comparar los
resultados de la inicialización paramétrica. Como se observa en la tabla II, el tiempo de CPU
es un orden de magnitud inferior en SQP comparado con MINOS. Si además se comparan
ambos para el caso de que se inicie el problema con datos imposibles, la ventaja de rSQP
sobre MINOS es de al menos dos órdenes de magnitud. Por lo tanto, se puede concluir que
rSQP es menos sensible que MINOS a una mala inicialización del problema.

254
Optimización de procesos con simuladores orientados a ecuaciones

Tabla II. Resultados numéricos para el problema de la planta Sunoco de fraccionamiento tras
el hidrocraqueo.
Caso 1 Caso 4 Caso 5
Caso 0 Caso 2 Caso 3
(base (Cambio (Cambio
(base) (Fouling 1) (Fouling 2)
optimizado) Mercado 1) Mercado 2)
U (TJ/d ºC)
Alim. debutanizador/colas 6.565 10-4 6.565 10-4 5.000 10-4 2.000 10-4 6.565 10-4 6.565 10-4
Alim. separador/colas 1.030 10-3 1.030 10-3 5.000 10-4 2.000 10-4 1.030 10-3 1.030 10-3
Precio
Propano ($/m3) 180 180 180 180 300 180
Precio base gasolina ($/m3) 300 300 300 300 300 350
Octanaje ($/RONm3) 2.5 2.5 2.5 2.5 2.5 10
Beneficios 230968.96 239277.37 239267.57 236706.82 258913.28 370053.98
Cambio con caso base 8308.41 8298.61 5737.86 27944.32 139085.02
-
($/d, %) (3.6%) (3.6%) (2.5%) (12.1%) (60.2%)
Inicialización imposible
MINOS
Iteraciones (mayor /menor) 5/275 9/788 - - - -
Tiempo de CPU (s) 182 5678 - - - -
rSQP
Iteraciones 5 20 12 24 17 12
Tiempo de CPU (s) 23.3 80.1 54.0 93.9 69.8 54.2
Inicialización paramétrica
MINOS
Iteraciones (mayor / menor) n/a 12/132 14/120 16/156 11/166 11/76
Tiempo de CPU (s) n/a 462 408 1022 916 309
rSQP
Iteraciones n/a 13 8 18 11 10
Tiempo de CPU (s) n/a 58.8 43.8 74.4 52.5 49.7
Tiempo rSQP/MINOS (%) 12.8 12.7 10.7 7.3 5.7 16.1

5. BIBLIOGRAFÍA

• AspenTech, ASPEN Plus 11.1 User guide (2002).


• Bailey, J.K., Hrymak, A.N., Treiber, S.S., Hawkins, R.B., Nonlinear optimization of a
Hydrocracker Fractionation Plant, Comp. Chem. Eng., 17, 123 (1993).
• Biegler, L.T., Grossmann, I.E., Westerberg, A.W., “Systematic Methods of Chemical
Process Design”, Prentice Hall, Nueva Jersey (1997).
• Hyprotech, HYSYS user’s guide.
• Scenna, N.J. (Ed.), “Modelado, Simulación y Optimización de Procesos Químicos”,
Universidad Tecnológica Nacional, F.R. Rosario (1999). Versión electrónica
http://www.modeladoeningenieria.edu.ar
• Seider, W.D., Seader, J.D., Lewin, D.R., “Process Design Principles”, John Wiley & Sons,
Nueva York (1999)

255
III. Optimización de diagramas de flujo con
HYSYS

Optimización en diseño y operación


en la industria química.
Aplicaciones
Susana Luque Rodríguez

Departamento de Ingeniería Química


y Tecnología del Medio Ambiente
Universidad de Oviedo
Optimización en diseño y operación en la industria química. Aplicaciones

ÍNDICE

1. INTRODUCCIÓN ....................................................................................................259
2. FORMULACIÓN DEL PROGRAMA NO LINEAL (NLP).................................260
2.1. Función objetivo ..................................................................................................260
2.2. Restricciones de igualdad ....................................................................................260
2.3. Restricciones de desigualdad (inecuaciones) ......................................................261
2.4. Formulación general ............................................................................................262
2.5. Algoritmo de optimización ..................................................................................262
3. OPTIMIZACIÓN CON HYSYS .............................................................................263
3.1. Parámetros del optimizador .................................................................................264
3.2. Algoritmos de optimización ................................................................................265
3.3. Procedimiento recomendado en optimización.....................................................267
4. EJEMPLO DE OPTIMIZACIÓN: RED DE CAMBIADORES DE CALOR ...268
4.1. Simulación de una red de cambiadores de calor..................................................268
4.2. Optimización de una red de cambiadores de calor ..............................................272
5. BIBLIOGRAFÍA ......................................................................................................274

1. INTRODUCCIÓN

Tras haber efectuado la síntesis de un diagrama de flujo y haber seleccionado la estructura


básica del mismo, el paso siguiente es la optimización del mismo mediante la modificación de
sus parámetros de operación (relacionados bien con las corrientes de proceso o bien con las
unidades seleccionadas). Habitualmente, esto se lleva a cabo sobre el diagrama de flujo más
prometedor tras la evaluación de un caso base, en el que se ha realizado el dimensionado de
los equipos y se ha efectuado una estimación preliminar de los costes de inmovilizado y
operación para obtener una análisis preliminar de los beneficios del proceso. En otros casos,
sin embargo, la optimización se lleva a cabo mucho en una etapa mucho más temprana del
diseño de procesos, mediante el uso de datos de costes aproximados y medidas aproximadas
de los beneficios.
El diseño de procesos utiliza la optimización principalmente con el objetivo de minimizar
costes o maximizar beneficios. Es posible utilizar métodos para optimizar una superestructura
de unidades de proceso (con unidades redundantes) de forma que la optimización (que en ese
caso emplea variables continuas y discretas –habitualmente binarias- siendo éstas últimas las
asociadas a las decisiones de situar o no un equipo en el diagrama de flujo) permite al
seleccionar simultáneamente el mejor diagrama de flujo y optimizarlo respecto a sus variables
continuas, tales como niveles de presión, relaciones de reflujo, tiempos de residencia, y
fracciones separadas. En la práctica, sin embargo, la mayoría de los problemas de diseño no
se resuelven usando superestructuras y algoritmos de optimización mixtos (con variables
enteras y continuas) puesto que la representación del problema resulta demasiado compleja.
En este tema se aplicará lo visto en los temas anteriores para formular un programa no lineal
(NLP) para la optimización de un diagrama de flujo de proceso dado. Esto comprende la
259
Optimización en diseño y operación en la industria química. Aplicaciones

definición de una función objetivo, las restricciones de igualdad, que usualmente representan
especificaciones del proceso, y las restricciones de desigualdad, que normalmente representan
los límites superior e inferior de las variables de operación. Se hará énfasis en el uso de
simuladores de proceso que llevan a cabo la optimización mientras convergen los bucles de
recirculación. Casi de forma universal, los simuladores comerciales usan la Programación
Cuadrática Sucesiva (SQP) para realizar la optimización. En este capítulo se verá cómo
HYSYS aborda un problema de optimización con una red de cambiadores de calor

2. FORMULACIÓN DEL PROGRAMA NO LINEAL (NLP)

La formulación de un programa no lineal comienza con la simulación en estado estacionario


del diagrama de flujo de un proceso para un conjunto nominal de especificaciones o variables
de diseño. Durante la creación del modelo de simulación (que comprende balances de materia
y energía, ecuaciones cinéticas, etc., para las unidades del proceso), se ha de llevar a cabo un
análisis de los grados de libertad. Habitualmente el número de variables, NVariables, excede el
número de ecuaciones, NEcuaciones, de forma que la diferencia entre ambas determina el número
de grados de libertad o variables de diseño, ND. Para la primera simulación o caso base, estos
se fijan de acuerdo a reglas heurísticas (dictadas por la experiencia). Después, gradualmente,
cuando se han llevado a cabo varias simulaciones, la experiencia permite que los valores se
ajusten para obtener el mejor diseño. Además, en los problemas de optimización reales las
unidades de proceso se simulan con modelos más adecuados posibles(muchas veces, si es
necesario se recurre a programación de los mismos), las propiedades termodinámicas y de
transporte se adecuan, con frecuencia utilizando datos experimentales y de planta piloto, y se
evalúa la rentabilidad. Después de completar estos pasos, y teniendo ya una mejor apreciación
de la operación del proceso y alguna indicación de las claves para la optimización, se está ya
preparado para formular un problema no lineal.

2.1. Función objetivo


Los candidatos para la medida de la idoneidad de un diseño, o de la función objetivo, f(x),
(función de las variables de diseño, ~ x ) son las medidas de la rentabiliza del proceso,
comenzando con mediadas aproximadas, como es el ROI (retorno de la inversión) o los costes
anuales. Para un análisis más profundo se usan medidas más rigurosas que incluyen la
variación del valor del dinero con el tiempo y flujos de caja. Estos incluyen el valor
actualizado neto (VAN) y la tasa interna de retorno (TIR). Es frecuente empezar con una
medida aproximada y cambiar a medidas más rigurosas a medida que el diseño avanza y se
perfecciona el modelo del diagrama de flujo.

2.2. Restricciones de igualdad


Cuando se usan simuladores de procesos, la mayoría de restricciones de igualdad, c(x)=0, son
ecuaciones del modelo asociadas con las unidades del proceso. Por ejemplo, una columna de
destilación que se modeliza por etapas en equilibrio de fases con frecuencia tiene varios
260
Optimización en diseño y operación en la industria química. Aplicaciones

cientos de ecuaciones MESH (balances de materia, equilibrio, suma de fracciones molares y


balances de energía). Sin embargo, en la implementación de la mayoría de los simuladores,
estas ecuaciones se resuelven para cada unidad de proceso, conocidos los parámetros del
equipo y las variables de las corrientes (normalmente para las corrientes de alimentación),
usando subrutinas de la librería del programa. Por lo tanto, cuando se usan estos simuladores,
las ecuaciones (o restricciones de igualdad) para las unidades del proceso no se muestran
explícitamente en el NLP. Dados unos valores para las variables de diseño, los simuladores
llaman a estas subrutinas para resolver la ecuación apropiada y obtener las variables
desconocidas que sean necesarias para llevar a cabo la optimización.
Las restricciones de igualdad comprenden potencialmente a todas las variables en el modelo
del diagrama de flujo del proceso. En muchos casos, el simulador provee de todas las
restricciones de igualdad. Sin embargo, ciertas especificaciones, sobre todo aquellas que
comprenden más de una unidad de proceso, pueden requerir que su formulación explícita. Por
ejemplo, si se desea que una corriente producto contenga el 95 % de una especie química
presente en la corriente de alimentación se necesitaría añadir la siguiente restricción
desigualdad:
x i D − 0.95z i F = 0
donde xi es la fracción molar de la especie i en la corriente de producto, con un flujo molar D
y zi es la fracción molar de i en la alimentación, con un flujo molar F.

2.3. Restricciones de desigualdad (inecuaciones)


La mayor ventaja de llevar a cabo procesos de optimización es que es posible incluir
explícitamente las restricciones de desigualdad ( g ( x ) ≤ 0 ) que se usan para limitar la región
de operación factible. Por ejemplo, cuando se opera con una bomba centrífuga, la carga
desarrollada es inversamente proporcional a la cantidad tratada. Por lo tanto, cuando se varía
el flujo mientras se optimiza el proceso, se debe tener cuidado de que el incremento de
presión requerido no exceda el que la bomba puede soportar. Tipos similares de restricciones
son aquellas relacionadas con la relación de reflujo en destilación, la cual debe exceder Rmin, o
con la presión de operación de la torre, de la misma forma que en un cambiador de calor no
se debe violar el gradiente mínimo de temperatura entre las corrientes que intercambian calor,
∆Tmin. En general, el usuario debe especificar cuidadosamente las variables de diseño que
puedan incumplir las restricciones de desigualdad. En algunos casos, los incumplimientos
pueden detectarse cuando se examinan los resultados de la simulación. En otros casos, las
subrutinas son incapaces de resolver las ecuaciones – por ejemplo, cuando la relación de
reflujo se ajusta por debajo de Rmin para una separación especificada de los componentes
clave.
Algunas restricciones de desigualdad incluidas en el NLP simplemente sitúan los límites
(cotas) inferior y superior de las variables, xL y xU. Otras permiten la especificación de, por
ejemplo, un límite inferior de la fracción recuperada de una especie en la corriente de
producto. Por ejemplo, cuando se requiere recuperar más del 95% de la especie i en la
corriente de producto, la ecuación (especificación de diseño) anterior se convierte en:
x i D − 0.95z i F ≥ 0

261
Optimización en diseño y operación en la industria química. Aplicaciones

2.4. Formulación general


Combinando los componentes vistos, el NLP para la optimación de un diagrama de flujo de
proceso se puede escribir como
Min f ( x )
~
x
s.a. c( x) = 0
g( x) ≤ 0
x L ≤ x ≤ xU
Ha de tenerse en cuenta que mientras el algoritmo de optimización ajusta las variables de
diseño, que son un subconjunto de las variables del proceso, las subrutinas resuelven
mediante las NEcuaciones las variables del proceso desconocidas, permitiendo la evaluación de la
función objetivo y las restricciones, procediéndose al ajuste de las variables de decisión para
minimizar el valor de la función objetivo mientras se satisfacen las restricciones.

2.5. Algoritmo de optimización


La forma más directa de mejorar la función objetivo es mediante la simulación repetida. En
este procedimiento, se seleccionan valores de las variables de diseño y se completa una
simulación. Después, usando generalmente una estrategia sistemática, se ajustan las variables
de diseño y se repite la simulación, por ejemplo, usando un análisis de sensibilidad en el
simulador de proceso, en el cual los resultados de la simulación se recalculan mientras que
una variable de diseño se ajusta usando incrementos uniformes entre los límites fijados por el
usuario. Sin embargo, el análisis de sensibilidad puede llevar mucho tiempo y generar
archivos de información muy grandes, la mayoría de los cuales están asociados con procesos
que no son óptimos. Alternativamente, se puede seleccionar un algoritmo de optimización
formal construido dentro del simulador para ajustar las variables de diseño, una estrategia que
es normalmente más eficaz. Dentro de esta posibilidad, las estrategias actuales utilizan la
optimización simultáneamente con la convergencia de los bucles de recirculación. En estas
estrategias, el algoritmo de optimización no converge los bucles de recirculación para cada
grupo de variables de diseño. En su lugar, se lleva a cabo sólo un paso a través de los bucles
de recirculación antes de ajustar las variables de diseño y, por lo tanto, las estrategias se
denominan algoritmos de caminos no factibles. En la mayoría de los casos, la estrategia del
camino no factible tiene éxito al converger los bucles de recirculación hacia un diseño factible
mientras se optimiza el proceso. Por otro lado, cuando se resuelve un NLP para optimizar un
diagrama de flujo es preferible incorporar las especificaciones de diseño como restricciones
de igualdad.
Antes de implementar una optimización de camino no factible, es muy útil realizar búsquedas
preliminares variando las variables de diseño clave, en muchos casos al azar, para tener una
idea inicial del problema de optimización. Para estas búsquedas, es casi mejor no utilizar
algoritmos de optimización que requiere derivadas, o aproximaciones de ella, como SQP. Un
procedimiento común es usar el análisis de sensibilidad del simulador de procesos
mencionado anteriormente.
Como precaución final, no se deben utilizar planteamientos basados en el gradiente, como
SQP, mientras se selecciona una variable de diseño discreta como el número de platos en una

262
Optimización en diseño y operación en la industria química. Aplicaciones

torre de destilación. En estos casos, no tendría sentido estimar las derivadas parciales en la
expresión del gradiente de la función objetivo o su matriz Hessiana, porque las variables de
diseño están restringidas a cantidades enteras. La misma consideración se puede hacer cuando
hay cambios discretos en los costes de los equipos, por ejemplo, cuando una unidad es
reemplazada por dos o más unidades. Esto ocurre con frecuencia cuando el tamaño de las
variables excede por encima de los límites incluidos en las subrutinas para los cálculos de los
costes y tamaño del equipo. Este tipo de cambios discretos es más difícil de detectar cuando
se calculan tamaños y costes para varias unidades de proceso en un análisis de rentabilidad
complejo. Por esa razón, se recomienda frecuentemente levar a cabo la optimización
utilizando inicialmente una función objetivo simple que no incluya discontinuidades.
Después, tras encontrar el óptimo, se pueden realizar estimaciones más rigurosas y
optimizarlas posteriormente, usando métodos simples (que no incluyan derivadas).

3. OPTIMIZACIÓN CON HYSYS

HYSYS tiene incorporado un optimizador que funciona en simulaciones en estado


estacionario (no en el modo dinámico) y que se puede emplear una vez que se ha creado un
diagrama de flujo y éste se ha resuelto en modo simulación (ha convergido para dar una
solución).
El “Optimizer” dispone de su propia hoja de cálculo (SpreadSheet) para definir la función
objetivo y las restricciones que se van a emplear, lo cual proporciona gran flexibilidad al
usuario. Dentro del Optimizer, HYSYS se distingue los siguientes elementos:
• Variables primarias (Primary Variables). Son las variables importadas del diagrama
de flujo cuyos valores se van a manipular para minimizar (o maximizar) la función
objetivo. Es preciso indicar las cotas inferior y superior de dichas variables (para ello
es buena idea usar las opciones DataRecorder o Case Study, de forma que mediante
una manipulación manual de las variables se tenga una idea de los límites de
operación en las mismas), las cuales se utilizan para delimitar el intervalo de búsqueda
así como para normalización de las mismas, que se lleva a cabo mediante la
transformación:
x − x min
x norm =
x max − x min
• Función objetivo (Objective Function), que se va a maximizar o minimizar, y puede
estar definida directamente a partir de las variables primarias o mediante
manipulaciones de éstas que se llevan a cabo en la hoja de cálculo (Spreadsheet).
• Restricciones (Constraint Functions) que pueden tener la forma de igualdades o
desigualdades, y se definen también en la forma deseada en la hoja de cálculo. Se
pueden especificar de forma independiente (en la pestaña Functions) los términos de
la izquierda (LHS) y la derecha (RHS) de las restricciones, así como la relación entre
ambos (<, > o =, en la columna Cond). El usuario también puede decidir multiplicar
las restricciones por una constante de penalización (Penalty Value) en los cálculos de

263
Optimización en diseño y operación en la industria química. Aplicaciones

optimización, cuanto mayor sea el valor de dicha constante, más importancia se le da a


la restricción en el problema de optimización (el valor por defecto es la unidad).
Los métodos de optimización disponibles son los de BOX, mixto y SQP. Todos ellos se
pueden emplear con restricciones en forma de desigualdades, mientras que el SQP es el único
aplicable al caso en que se tengan restricciones en forma de ecuaciones. Para los problemas de
optimización sin restricciones, los métodos disponibles son los de Fletcher-Reeves y Quasi-
Newton.
El usuario también tiene la posibilidad de seleccionar el algoritmo de resolución y los
parámetros de éste, tales como el máximo número de iteraciones y la tolerancia.

3.1. Parámetros del optimizador


Los parámetros asociados al algoritmo de optimización que se pueden seleccionar por el
usuario son los siguientes:
• Número máximo de evaluaciones de funciones (Maximum Function Evaluations),
que no se debe confundir con el máximo número de iteraciones. Durante cada
iteración, la parte relevante del diagrama de flujo se resuelve un número de veces,
dependiendo de factores tales como el algoritmo de optimización y el número de
variables primarias.
• Tolerancia (Tolerance). HYSYS determina el cambio en la función objetivo entre
cada dos iteraciones así como los cambios en las variables primarias normalizadas.
Con esta información HYSYS determina si se cumple la tolerancia especificada por el
usuario.
• Máximo número de iteraciones (Maximum iterations), tras las cuales los cálculos se
detendrán.
• Máximo cambio en iteración (Maximum change/iteration) de las variables primarias
normalizadas (entre dos iteraciones sucesivas). El valor por defecto es 0.3 (por
ejemplo, si se tiene el caudal másico de una corriente entre los límites 0 y 100 kg/h, el
máximo cambio permitido en una iteración será de 30 kg/h).
• Modificación de A/B (Shift A/Shift B). Habitualmente se necesitan derivadas de la
función objetivo y de las restricciones con respecto a las variables primarias, y éstas se
calculan mediante diferenciación numérica empleando la siguiente expresión:
x shift = ShiftA * x + ShiftB

siendo x es la variable que se perturba (normalizada) y xshift es el intervalo de


perturbación (también normalizado). En general, no se suele necesitar cambiar los
valores de Shift A o Shift B. Este último se incluye con el objeto de asegurar que xshift
nunca sea cero.
Las derivadas se calculan con la expresión:
∂y y1 − y 2
=
∂x x shift
en la que y2 es el valor de la variable objeto de estudio correspondiente a x+xshift e y1 es
el valor correspondiente a x.
264
Optimización en diseño y operación en la industria química. Aplicaciones

Antes de cada iteración, el optimizador necesita determinar el gradiente de la


superficie a optimizar en el punto actual, para ello mueve cada variable primaria una
cantidad igual a xshift y calcula la derivada para cada función (objetivo y restricciones)
usando los valores de y en los dos puntos de x. A partir de esta información y de la
historia de la optimización, se seleccionan la dirección de búsqueda y el paso de
iteración. Algunos algoritmos realizan la variación de todas las variables primarias
simultáneamente, mientras que otros las modifican de forma secuencial. Para
determinar cada derivada, por lo tanto, se necesita una evaluación adicional de las
funciones (adicional a la precisada en la iteración del diagrama de flujo); por lo tanto,
si hay dos variables primarias, se tendrán tres evaluaciones de funciones en cada
iteración.

3.2. Algoritmos de optimización


El Optimizer manipula los valores de un conjunto de variables primarias con el objeto de
maximizar o minimizar una función objetivo definida por el usuario, construida a partir de un
número indeterminado de variables de proceso. Las variables primarias pueden fluctuar en un
intervalo que viene dado por sus cotas inferior y superior, respectivamente. Además, los
valores iniciales suministrados por el usuario deben estar comprendidos entre estos límites.
Si HYSYS falla al evaluar la función objetivo o cualquiera de las restricciones, el optimizador
reducirá el paso de la última variable primaria a la mitad y procederá a recalcular el diagrama
del flujo. Si la evaluación de la función falla nuevamente, la optimización se detiene.

Método BOX
Está basado en el método “Complex”, que es una extensión del algoritmo Simplex. Es un
método de optimización de los del tipo “caja negra” que requiere que los puntos intermedios
(durante las iteraciones) estén todos en la región factible. Este método incorpora una
estrategia de búsqueda sistemática que resuelve problema con funciones objetivo no lineales y
restricciones no lineales en forma de inecuaciones. No requiere el cálculo de derivadas y no
permite el uso de restricciones en forma de ecuaciones (que sí se pueden incluir de forma
independiente, como especificaciones de diseño o recirculaciones). No es muy eficaz en
términos de número de evaluaciones de funciones. En general, requiere un gran número de
iteraciones para que la solución converja, pero en los casos en que es aplicable, es un método
muy robusto.
El procedimiento de cálculo es el siguiente:
1. Dado unas condiciones iniciales en la región factible, el programa genera un
“complex” original de n+1 puntos alrededor del centro de la región factible (siendo n
el número de variables).
2. La función objetivo se evalúa en cada punto, y el punto que tiene el mayor valor de la
función se reemplaza por otro punto obtenido mediante extrapolación a través de la
cara del complex (reflejo).
3. Si el nuevo punto presenta un valor de la función objetivo menor, HYSYS intenta de
nuevo una extrapolación. De otro modo, si el nuevo punto es peor que el segundo
mayor punto, HYSYS lleva a cabo una contracción en una dimensión.

265
Optimización en diseño y operación en la industria química. Aplicaciones

4. Si un punto persiste en proporcionar valores elevados, todos los puntos se contraen


alrededor del punto más bajo.
5. El nuevo punto debe satisfacer tanto las cotas de las variables como las restricciones
en forma de desigualdades. Si se sale fuera de ellas, se lleva a la cota más próxima. Si
el punto no satisface las restricciones, se mueve hacia el centro de los puntos restantes
hasta que satisface todas las restricciones.
6. Los pasos 2 a 5 se repiten hasta convergencia.

Método SQP
Permite incluir restricciones en forma de igualdades y desigualdades. Es el método más eficaz
en problemas de minimización con restricciones lineales y no lineales, si se le proporciona
una buena inicialización y el número de variables primarias es pequeño. Permite converger
simultáneamente con el problema de optimización tanto las especificaciones de diseño como
los bucles de recirculación. La versión implementada en HYSYS sigue esencialmente el
algoritmo de Powell.
El método minimiza una aproximación cuadrática de la función de Lagrange con
aproximaciones lineales de las restricciones. La matriz que contiene las derivadas segundas de
la función lagrangiana se estima automáticamente. Usa un método de búsqueda usando la
técnica de búsqueda de “pata de perro” de Powell para forzar la convergencia.

Método Mixto
Este método pretende combinar las ventajas de las características globales de convergencia
del método BOX y la eficacia del SQP. Comienza la minimización con el método BOX con
una convergencia muy relajada (50 veces la tolerancia deseada) y tras convergencia, pasa a
emplear el método SQP para llegar el punto final con la tolerancia deseada. Es capaz de
manejar únicamente restricciones en forma de inecuaciones.

Método de Fletcher Reeves


Este método aplica una modificación del método de gradiente conjugado, y es eficaz para
minimización sin restricciones. El procedimiento a grandes rasgos es como sigue:
1. Dado un punto inicial, evalúa las derivadas de la función objetivo respecto de las
variables primarias.
2. Evalúa la nueva dirección de búsqueda como el conjugado del gradiente anterior.
3. Lleva a cabo una búsqueda en una dimensión a lo largo de la nueva dirección hasta
que localiza un mínimo local.
4. Si alguna variable se sale de sus límites, se limita ésta a su cota.
5. Se repiten los pasos 1 a 4 hasta lograr la convergencia.

Método Quasi-Newton (de BFGS)


En términos de aplicabilidad y limitaciones, es similar al anterior. Calcula la nueva dirección
de búsqueda mediante aproximaciones del inverso de la matriz Hessiana.
266
Optimización en diseño y operación en la industria química. Aplicaciones

3.3. Procedimiento recomendado en optimización


Los problemas de optimización pueden ser muy difíciles de formular y hace que converjan,
por ello, es muy importante tener un buen conocimiento del problema de simulación antes de
adicionar la complejidad que supone una optimización. El procedimiento recomendado para
crear un problema de optimización es el siguiente:
1. Comenzar con una simulación (en lugar de con una optimización). Las razones para
esto son:
a. Es más fácil de detectar los posibles errores en una simulación
b. Se pueden determinar especificaciones que resulten razonables
c. Se puede determinar el intervalo razonable de las variables de decisión
d. Se puede obtener una buena estimación inicial de las corrientes seccionadas
(recirculaciones)
2. A continuación, realizar un análisis de sensibilidad, para encontrar las variables de
decisión que resultan más apropiadas, así como sus intervalos de variación.
3. Una vez que se lleva a cabo la optimización, evaluar la solución usando análisis de
sensibilidad, para determinar si el mínimo es ancho o estrecho.
Las siguientes recomendaciones también resultan útiles en la optimización de diagramas de
flujo con HYSYS y, en general, con cualquier simulador de procesos:
1. El proporcionar cotas superiores e inferiores razonables a las variables es muy
importante. No sólo previene la generación de diagramas de flujo con valores
imposibles (por ejemplo, temperaturas cruzadas en una cambiador de calor) sino
también porque las variables se modifican en el intervalo comprendido entre 0 y 1
definido usando dichas cotas.
2. En los métodos BOX y Mixed, el Maximum Change/Iteration de las variables
primarias se debe reducir. Un valor de 0.05 a 0.1suele ser apropiado.
3. El método Mixed es el que en general requiere el menor número de evaluaciones de
funciones (es decir, es el más eficaz).
4. Si con los métodos BOX, Mixed o SQP no se cumplen bien las restricciones, se puede
probar a aumentar la penalización de las mismas (en 3 ó 6 órdenes de magnitud, hasta
obtener un valor similar al esperado de la función objetivo).
5. Por defecto, HYSYS minimiza el valor de la función objetivo, aunque es posible que
ésta se maximice también. Si se elige la opción Maximize, no obstante, HYSYS
internamente minimiza el valor negativo de la función introducida.

267
Optimización en diseño y operación en la industria química. Aplicaciones

4. EJEMPLO DE OPTIMIZACIÓN: RED DE CAMBIADORES DE


CALOR

4.1. Simulación de una red de cambiadores de calor


La resolución de problemas para determinar la adecuación del empleo de cambiadores de
calor sencillos o múltiples es un problema típico de simulación, en el que equipos existentes
se usan en condiciones de operación o en aplicaciones ligeramente diferentes a las
inicialmente diseñadas. En estos casos, se debe determinar si es posible emplear los equipos
existentes, los cuales tienen limitado su intervalo de funcionamiento por sus valores de UA.
El primer ejemplo ilustrativo trata de optimizar el funcionamiento de tres cambiadores de
calor independientes. La corriente de entrada a un proceso se debe enfriar, para lo cual se
divide en dos, las cuales se enfrían en una batería de cambiadores de calor situados en
paralelo. Una de las corrientes se enfría intercambiando calor con una corriente rica en
metano (corriente de recirculación que sale como destilado en una columna desmetanizadora)
que proviene de una parte posterior del proceso, mientras que la otra parte intercambia calor
con una corriente de una unidad refrigerante que emplea propano, tras lo cual intercambia
calor con la corriente que abandona un calderín lateral de la columna desmetanizadora situada
posteriormente en el proceso.

Las corrientes de entrada al proceso tienen las especificaciones indicadas a continuación. Para
este ejemplo se puede emplear el modelo PR.
Alimentación Cabezas Refrigerante Colas laterales
(Alim) desmetanizador (Ref) (Col)
(Cab)
Condiciones Temperatura (ºF) 20 -142 120 -
Presión (psia) 1000 250 350 251
Flujo molar (lbmol/h) 2745 1542 - 1640
Composición Metano 0.7515 0.9073 0.0000 0.2828
(fracción Etano 0.2004 0.0927 0.0000 0.2930
molar) Propano 0.0401 0.0000 1.0000 0.1414
i-Butano 0.0040 0.0000 0.0000 0.1313
n-Butano 0.0040 0.0000 0.0000 0.1515
268
Optimización en diseño y operación en la industria química. Aplicaciones

En este ejemplo se tienen que incluir en el diagrama de flujo un divisor de corriente, un


mezclador, una válvula y tres cambiadores de calor. La incorporación de datos a todos ellos se
muestra a continuación:

Cambiador de calor E-100

269
Optimización en diseño y operación en la industria química. Aplicaciones

∆P tubos (psia) 10
∆P carcasa (psia) 10
UA (Btu/ºF h) 4.00 e+04
Parámetros Pérdidas calor ninguna
de diseño Modelo HEX Weighted
Intervalos (E-100 in) 10
Intervalos (Cab) 10
Punto rocío/burbuja (Cab) Inactivo

Cambiador de calor E-101


∆P tubos (psia) 5
∆P carcasa (psia) 1
UA (Btu/ºF h) 5.00 e+04
Parámetros
de diseño Pérdidas calor ninguna
Modelo HEX Weighted
Intervalos (E-100 in) 10
Intervalos (Cab) 10

270
Optimización en diseño y operación en la industria química. Aplicaciones

Cambiador de calor E-102

∆P tubos (psia) 5
∆P carcasa (psia) 5
UA (Btu/ºF h) 3.50 e+04
Parámetros Pérdidas calor ninguna
de diseño Modelo HEX Weighted
Intervalos (E-100 in) 10
Intervalos (Cab) 10
Punto rocío/burbuja (Cab) Inactivo

A continuación se incorporan las siguientes especificaciones de corrientes:


• Temperatura de la corriente E-102 out: -40 ºF
• Fracción de vapor de la corriente E-101 Frío out: 1.00
• Temperatura de la corriente E-100 out: -65 ºF
• Presión de la corriente E-101 Frío out: 20 psia
• No comprobar puntos de burbuja/rocío para los las corrientes frías que entran en E-
100 o E-102
Con estos datos, el diagrama de
flujo converge, y se pueden
comprobar los datos calculados
en el Workbook:

271
Optimización en diseño y operación en la industria química. Aplicaciones

4.2. Optimización de una red de cambiadores de calor


A continuación, se va a emplear el Optimizer para determinar la división de corrientes óptima
de forma que se minimice el valor UA global de la red.
Para ello, es preciso eliminar las especificaciones individuales de UA dadas para cada
cambiador, y reemplazarlas por las siguientes especificaciones:
• Temperatura de la corriente Col: -85 ºF
• Flujo de Ref: 495 lbmol/h
• El flujo de E-101 in: es la variable a optimizar, inicialmente se fija en el valor
anteriormente empleado: 1670 lbmol/h
Una vez que se han introducido estas especificaciones, se resuelve automáticamente el
diagrama de flujo de nuevo y los UA calculados que se obtienen se encuentran muy próximos
a los valores anteriormente especificados.

Para proceder a la optimización del proceso, se abre el Optimizer (F5) en el menú Simulation
y el primer paso en la definición del problema es la selección de la variable primaria, fijando
las cotas inferior y superior de la misma en 1450 y 1800 lbmol/h, respectivamente.

272
Optimización en diseño y operación en la industria química. Aplicaciones

A continuación, se importan los


valores de UA de los tres
cambiadores a la hoja de cálculo
(SpreadSheet) del Optimizer, para
lo cual se presiona el botón
SpreadSheet y se selecciona la
pestaña SpreadSheet.

La información importada se
muestra a continuación. En la celda
B4 se introduce la fórmula del
sumatorio de los UA
(+B1+B2+B3). En la celda B5 se
introduce 0.0, valor que se va a
emplear posteriormente en las
restricciones.

En la pestaña Functions del


Optimizer se define la función
objetivo y las restricciones. En
este caso la función objetivo es
la suma de los UA, que
estamos tratando de
minimizar, calor que
importamos desde la celda B4
del SpreadSheet.
Es necesario introducir
restricciones que aseguren que
la solución es razonable. En
este caso, el valor UA de cada
cambiador ha de ser positivo,
para lo cual se completa la
zona de restricciones como se
muestra a la derecha.

En la pestaña Parameters, se elige el método de resolución Mixed, dejando el resto de


parámetros con los valores por defecto del programa.

273
Optimización en diseño y operación en la industria química. Aplicaciones

Para que comience la simulación, se presiona el botón Start, y si se desea seguir la evolución
de la optimización, se puede ir a la pestaña Monitor.

El valor óptimo encontrado para la corriente E-101 in es de 1800 lbmol/h, correspondiente a


un UA global de 1.43·104 But/ºFh, que es aproximadamente un 10 % inferior al valor inicial
de 1.56·104 Btu/ºFh.

5. BIBLIOGRAFÍA

• AspenTech, ASPEN Plus 11.1 User guide (2002).


• Biegler, L.T., Grossmann, I.E., Westerberg, A.W., “Systematic Methods of Chemical
Process Design”, Prentice Hall, Nueva Jersey (1997).
• Hyprotech, HYSYS user’s guide.
• Scenna, N.J. (Ed.), “Modelado, Simulación y Optimización de Procesos Químicos”,
Universidad Tecnológica Nacional, F.R. Rosario (1999). Versión electrónica
http://www.modeladoeningenieria.edu.ar
• Seider, W.D., Seader, J.D., Lewin, D.R., “Process Design Principles”, John Wiley & Sons,
Nueva York (1999)
274
Simulación de procesos con HYSYS

Introducción al uso de HYSYS.


Modelos simples de operaciones
unitarias
Aurelio B. Vega Granda
Susana Luque Rodríguez

Departamento de Ingeniería Química


y Tecnología del Medio Ambiente
Universidad de Oviedo
Introducción al uso de HYSYS. Modelos simples de operaciones unitarias

ÍNDICE

1 INTRODUCCIÓN ....................................................................................................277
2 INTERFACES Y PROCEDIMIENTO OPERATIVO ..........................................278
2.1 Procedimiento operativo......................................................................................279
3 MODELOS SIMPLES DE OPERACIONES UNITARIAS .................................281
3.1 Divisor de componentes (Component splitter) ....................................................281
3.2 Divisor (Te)..........................................................................................................283
3.3 Mezclador (Mixer) ...............................................................................................283
3.4 Válvula.................................................................................................................284
3.5 Compresor (Compressor)/Expansor(Expander) ..................................................285
3.6 Bombas (Pumps)..................................................................................................286
3.7 Enfriador (Cooler)/Calentador (Heater)..............................................................288

1 INTRODUCCIÓN
El programa HYSYS es una extensión de un simulador denominado HYSIM –desarrollado
por Hyprotech para simular procesos de gas natural, refino de petróleo, petroquímica y
combustibles sintéticos- el cual estaba inicialmente desarrollado sólo para llevar a cabo
modelización en estado estacionario. Empleando HYSYS es posible llevar a cabo una
simulación en estado estacionario, posteriormente adicionar controladores y activar el
integrador para llevar a cabo una simulación dinámica. Es un simulador completamente
interactivo que se diferencia de otros simuladores (por ejemplo, ASPEN PLUS, PRO/II o
CHEMCAD) en dos aspectos característicos: interpreta interactivamente los comandos, desde
el momento en que éstos se introducen, mientras que la mayoría de los simuladores
comerciales requieren que se pulse la tecla “Run” una vez que se ha finalizado la
introducción de datos. Además, pese a que -al igual que otros programas de simulación-
utiliza subrutinas o procedimientos para modelizar las unidades de proceso, es capaz propagar
la información hacia adelante o hacia atrás a través de una operación unitaria. Esto hace que
en muchos casos sean innecesarios cálculos iterativos. Cuando se suministra cualquier
información nueva, el programa determina automáticamente qué nueva información puede
calcularse. A continuación, pasa esta información a cualquier otra operación, conectada a la
que dio lugar al cálculo, que a su vez repetirá este proceso hasta que ya no pueda determinarse
nueva información. Esto hace que el programa sea rápido y fácil de usar. Además, al igual que
otros simuladores, HYSYS permite descomponer el diagrama de flujo global en secciones, de
forma que éstas se simulen de forma independiente (por ejemplo, para la estimación de
propiedades físicas).
A continuación se incluyen algunas indicaciones básicas para el uso de HYSYS en problemas
sencillos. Una explicación más detallada, muy útil y fácil de seguir, se puede encontrar en el
manual de referencia de HYSYS, disponible electrónicamente.

277
Introducción al uso de HYSYS. Modelos simples de operaciones unitarias

2 INTERFACES Y PROCEDIMIENTO OPERATIVO


Cuando se trabaja con HYSYS, se emplean cuatro interfaces –mostradas como ventanas-:
(1) El diagrama de flujo del proceso o PFD (Process Flow Diagram), donde se construye
el diagrama de flujo que se quiere simular:

Se puede imprimir directamente


desde el menú del PFD

Con doble click en


cualquier icono se
abre su Property
View
Con el botón derecho del
ratón sobre una corriente
u operación se despliega
el menú correspondiente Con el botón derecho del
ratón sobre una zona vacía
del PFD se accede al menú

(2) El Property View, que es un conjunto de páginas en las que se muestra información en
sobre un elemento del diagrama de flujo, corriente u operación unitaria. A continuación
se muestra uno para una corriente:
Con el botón derecho del ratón
sobre la barra del título se
accede al menú de impresión

En todo el programa, los


valores introducidos por el
usuario aparecen en azul y
los calculados por el
programa en negro

Toda la información de la
corriente se encuentra en las hojas
correspondientes a las pestañas
Se muestra también Presionando estos botones
el status del objeto aparece el Property View de
operación anterior o
posterior

También se puede emplear el navegador de objetos:

Seleccionar el objeto
que se desea ver Los filtros permiten
acceder rápidamente
a un objeto concreto

Presionar el botón Build Presionar el botón View


para entrar en el diagrama para ver la información
de flujo elegido del objeto seleccionado
(Prop Oxide)

(3) El Workbook, que es un conjunto de páginas en las que se muestra información en


forma de tabla, muy similar a una hoja de cálculo:

278
Introducción al uso de HYSYS. Modelos simples de operaciones unitarias

Con el botón derecho


del ratón sobre la barra
del título se accede al
Hacer doble click para menú de impresión,
abrir el Property View donde se pueden
seleccionar las
opciones de impresión

Se pueden introducir
directamente los datos,
tanto de corrientes
como de operaciones

Las pestañas indican


diferentes formas del
Se puede acceder Workbook
directamente a las
operaciones vinculadas

(4) El Summary, una ventana donde se muestra una lista de las corrientes y unidades de
proceso de las que consta el diagrama de flujo.
Seleccionar la
corriente para abrir También se puede
su Property View abrir el Property
View de operaciones

Se puede modificar un elemento de una ventana siempre que ésta se encuentre activa. Para
facilitar su manejo, HYSYS permite tener abiertas dos o más ventanas simultáneamente.
Independientemente de cuál de ellas se encuentre activa, todos los elementos de las demás
ventanas se actualizan simultáneamente cuando el usuario introduce nueva información.

2.1 Procedimiento operativo


Cuando se inicia el programa es posible comenzar una nueva simulación o bien abrir un caso
previamente almacenado en memoria. En el caso de comenzar un nuevo caso, la primera
pantalla corresponde a la selección del paquete termodinámico de predicción de datos de
equilibrio (property prediction package) y de los compuestos químicos involucrados en el
diagrama de flujo. Conjuntamente, éstos constituyen la base de la simulación (Simulation
Basis). En este momento se pueden definir reacciones químicas, que luego estarán disponibles
en la modelización de las operaciones unitarias. Finalmente, es posible especificar el sistema
de unidades deseado (por ejemplo, SI o Field –americano de ingeniería-) y el modo de
nombrar a las corrientes y unidades del proceso.
A continuación, aparece el escritorio (Desktop) de HYSYS, junto con la ventana definida por
omisión (a elección del usuario ésta puede ser el PFD, el Workbook o el Summary).
Empleando las interfaces (ventanas), el usuario puede construir un diagrama de flujo para su
simulación e introducir las variables de diseño (grados de libertad), a partir de los cuales
HYSYS resuelve los balances de materia y energía.

279
Introducción al uso de HYSYS. Modelos simples de operaciones unitarias

2.1.1.1 Introducción de componentes


Una de las primeras informaciones a introducir es la referente a los componentes químicos
que intervienen en el proceso. El programa dispone de una amplia lista de componentes con
sus propiedades, y basta con seleccionarlos. Si no están en la lista, se consideran hipotéticos y
deben de introducirse. El programa pedirá datos sobre los mismos (peso molecular, densidad,
etc.), debiendo introducirse al menos dos de ellos. Si no se consideran necesarios para los
cálculos, se les puede dar cualquier valor.

2.1.1.2 Las operaciones


El programa permite resolver un gran número de Operaciones Unitarias de Ingeniería
Química. Para ello, HYSYS define y utiliza una serie de subrutinas. Un resumen de las
mismas se muestra en la tabla siguiente:
Tabla 1. Resumen de unidades (subrutinas de operación) en HYSYS
Mezcladores y Mixer Mezcla de corrientes
divisiones Tee División de corrientes
Separadores Component Splitter Separador de componentes con dos salidas
Separadores flash Separator Alimentación múltiple, una corriente vapor y una
líquida como producto
3-Phase separator Alimentación múltiple, una corriente vapor y dos
líquida como producto
Tank Alimentación múltiple, una corriente líquida como
producto
Destilación (método Shortcut Column Diseño con el método Fenske-Underwood
abreviado)
Separación multietapa Column Separación multifásica genérica, incluyendo
(simulación basada en absorción, desorción, destilación y extracción
datos de equilibrio) líquido-líquido. Es posible añadir secciones de
columna y recirculaciones adicionales. Todos los
modelos (aplicaciones en refino de petróleo)
soportan dos o tres fases así como reacciones
químicas.
Intercambio de calor Cooler/Heater Calentamiento o refrigeración
Heat Exchanger Intercambio de calor entre dos corrientes de
proceso
Lng Intercambio de calor entre varias corrientes
Reactores Conversion Reactor Se especifica la conversión
Equilibrium Reactor Reacción de equilibrio
Gibbs Reactor Equilibrio químico multifásico (no se requiere la
estequiometría)
CSTR CSTR
PFR PFR
Bombas, compresores Pump Bomba o turbina hidráulica
y turbinas Compressor Compresor
Expander Turbina
Valve Válvula adiabática
Tuberías Pipe Segment Tubería con flujo monofásico o multifásico con
transmisión de calor

280
Introducción al uso de HYSYS. Modelos simples de operaciones unitarias

3 MODELOS SIMPLES DE OPERACIONES UNITARIAS


En este capítulo presentaremos un sumario de los modelos rigurosos de las operaciones
unitarias más simples disponibles en HYSYS, que permiten resolver los balances de materia y
energía sin necesidad de suponer un comportamiento ideal.
El desarrollo de los balances de materia y energía es un componente básico en función del
cual se tomarán decisiones durante las etapas de evaluación y diseño del proceso.
En este capítulo nos centraremos en las operaciones más simples para presentar una
representación detallada de estas unidades de operación. El principal objetivo de este capítulo
es alcanzar un mejor conocimiento del nivel de detalle de los modelos empleados en los
simuladores comerciales, en concreto en HYSYS.

3.1 Divisor de componentes (Component splitter)


Se necesita especificar la fracción de cada componente de la alimentación que sale con la
corriente de cabezas (overhead product). Por tanto, se puede emplear para aproximar la
separación de un proceso no estándar o propietario que no pueda ser tratado con HYSYS.
El divisor de componentes satisface el balance de materia para cada componente:
fi = ai + bi
donde: fi = flujo molar del componente i en la alimentación
ai = flujo molar del componente i en cabezas
bi = flujo molar del componente i en colas
Los flujos molares en cabezas y colas se calculan como:
ai = xi fi bi = (1-xi) fi
siendo xi la fracción (split) del componente i que va por cabezas.
Una vez conocidas la composición, fracción de vapor y presión de las corrientes de salida, se
efectúa un flash P-VF para obtener las temperaturas y flujos de calor.
Un balance global de calor permite obtener el flujo de calor:
hE = hF – ho - hB
donde: hE = entalpía del corriente de energía desconocida
hF = entalpía de la alimentación
ho = entalpía de la corriente de cabezas
hB = entalpía de la corriente de colas
En la página de Conexiones se especifican un número ilimitado de alimentaciones, así como
los nombres de las corrientes de salida (cabezas y colas), y un número ilimitado de corrientes
de energía (de las cuales una se debe dejar como incógnita para que se pueda calcular
mediante el balance de energía).

281
Introducción al uso de HYSYS. Modelos simples de operaciones unitarias

En la página de Parámetros se deben fijar las especificaciones del sistema: fracción de vapor
y presión en cabezas, presión en colas, y si se ha incluido alguna corriente de energía también
la fracción de vapor en colas.

En la página Splits se tiene que especificar para cada componente la fracción de separación
por cabezas.
En la página Worksheet podemos observar los resultados de los cálculos

282
Introducción al uso de HYSYS. Modelos simples de operaciones unitarias

3.2 Divisor (Te)


Esta operación divide una corriente de alimentación en múltiples corrientes de producto, todas
con la misma composición y condiciones que la alimentación. Se usa para simular Tes en
tuberías.
En la página de Conexiones se deben proporcionar los nombres de la alimentación y de las
salidas. En la página Splits se deben fijar N-1 relaciones de flujo, siendo N el número de
salidas, ya que
N
fi
∑r
i =1
i = 1.0 y ri =
F
donde: ri = relación de flujo de la corriente i-ésima
fi = flujo de salida de la corriente i-ésima
F = flujo de la alimentación
N = número de corrientes de salida

3.3 Mezclador (Mixer)


Es una operación que combina dos o más entradas para producir una única salida. Se efectúan
los correspondientes balances de materia y energía completos, es decir, se calcula
rigurosamente una de las temperaturas desconocida, bien a la entrada o a la salida. Si se
conocen todas las propiedades (temperatura, presión, y composición) de todas las corrientes
de entrada, se calculan automáticamente todas las propiedades de la corriente de salida, ya
que se conocen composición, temperatura y entalpía para esta corriente.
En la página de Conexiones se especifican las corrientes de entrada, así como una única
corriente de salida. En la página de Parámetros se debe indicar el tipo de asignación
automática de presión. Por defecto se emplea la asignación de fijar como presión de salida la
más baja de las entradas (Set Outlet to Lowest Inlet), en cuyo caso se deben conocer todas las
presiones excepto la de salida. Si se especifica ecualizar todas (Equaliza All), HYSYS
asignará a todas las corrientes conectadas a la operación la misma presión una vez conocida
una de ellas. Si dos o más corrientes tienen presiones distintas se producirá un error de
consistencia.

283
Introducción al uso de HYSYS. Modelos simples de operaciones unitarias

3.4 Válvula
La operación válvula realiza un balance de materia y energía a dos corrientes. Se necesita
indicar las corrientes de entrada y salida, y se puede especificar la caída de presión a través de
la válvula. HYSYS efectúa un flash basado en la igualdad de materia y energía entre las dos
corrientes. Por ejemplo si sólo se especifica la presión de la corriente de salida, se calcula la
temperatura a la salida mediante un flash isoentálpico (dado que la entalpía de entrada es
conocida).
La operación válvula calculará solo una incógnita de entre las dos corrientes, que puede ser:
temperatura a la entrada, presión a la entrada, temperatura a la salida, presión a la salida.

284
Introducción al uso de HYSYS. Modelos simples de operaciones unitarias

3.5 Compresor (Compressor)/Expansor(Expander)


El compresor se utiliza para aumentar la presión del gas a su entrada. Dependiendo de la
información facilitada, calculará o una propiedad de la corriente (presión o temperatura), o la
eficacia de compresión.
El expansor se usa para disminuir la presión de una gas a alta presión en la entrada y producir
un gas a baja presión y alta velocidad. Un proceso de expansión implica convertir la energía
interna del gas en energía cinética y finalmente en trabajo. El expansor calculará o una
propiedad de la corriente o la eficacia de la expansión .
Para un compresor la eficacia viene dada por la relación entre la potencia isoentrópica (ideal)
requerida y la potencia real requerida. Para un expansor, la eficacia viene dada por la relación
entre la potencia real producida por el fluido y la potencia producida en una expansión
isoentrópica.
Para un compresor o expansor adiabático, HYSYS calcula la compresión (o expansión)
rigurosamente, siguiendo la línea isoentrópica desde la presión de entrada hasta la de salida.
Usando la entalpía en este punto, así como la eficacia especificada, determina entonces la
entalpía a la salida. A partir de este valor y la presión de salida se determina la temperatura a
la salida.
Para un compresor o expansor politrópico, el camino del fluido no es ni adiabático ni
isotérmico. Cuando la eficacia es del 100 %, es el único caso en que el proceso es reversible.
Para procesos irreversibles, la eficacia politrópica es menor del 100 %. Dependiendo de si el
proceso es una expansión o compresión, el trabajo determinado por el proceso reversible
mecánicamente se multiplica o divide por la eficacia real para dar el trabajo real. Las formas
de las ecuaciones para las eficacias politrópicas son iguales a las anteriormente expuestas.
Todas las entropías y entalpías se determinan de forma rigurosa empleando el paquete de
propiedades especificado. En general, el trabajo para un proceso reversible mecánicamente se
puede determinar a partir de la expresión:
W = ∫ PdV

La potencia real requerida es la diferencia entre las entalpías a la entrada y a la salida.


Existen varios métodos para la resolución el compresor/expansor dependiendo de la
información facilitada. En general, la solución es una función del flujo, cambios de presión,
energía aplicada y eficacia. Métodos típicos de resolución son:
1. Conocidos el flujo y la presión de entrada.
2. Especificada la presión de salida.
3. Especificada la eficacia adiabática o politrópica.
4. HYSYS calcula la energía requerida, la temperatura de salida y otra eficacia.
Otra posibilidad de cálculo es:
1. Conocidos el flujo y la presión de entrada.
2. Especificada la eficacia y energía requerida.
3. HYSYS calcula la presión de salida, temperatura y otra eficacia.

285
Introducción al uso de HYSYS. Modelos simples de operaciones unitarias

En la página de Conexiones, como se muestra en la figura, es preciso indicar las corrientes de


entrada, salida y de energía. En la página de Parámetros se puede especificar la energía
necesaria (duty) o permitir que HYSYS la calcule.

3.6 Bombas (Pumps)


Se emplean para aumentar la presión de la corriente líquida a su entrada. Dependiendo de la
información suministrada puede calcular una presión o temperatura desconocidas, o la
eficacia de la bomba.
Los cálculos están basados en la potencia estándar para la potencia de una bomba, que utiliza
el aumento de presión, el flujo de líquido y la densidad:
(Pout − Pin ) × Flujo
Potencia requeridaideal =
densidad del liquido
donde: Pout = presión a la salida
Pin = presión a la entrada
La potencia anterior corresponde a la potencia ideal necesaria para elevar la presión del
líquido. La potencia real se define en términos de la eficacia de la bomba, definida como la
relación entre la potencia ideal y la real.

286
Introducción al uso de HYSYS. Modelos simples de operaciones unitarias

Cuando la eficacia sea menor del 100 %, el exceso de energía provocará una elevación de la
temperatura en la corriente de salida.
Potencia requeridaideal
Potencia requerida real = × 100
% Eficacia
Finalmente, la potencia real es igual a la diferencia de energía entre la salida y la entrada.
Si la alimentación está completamente definida, es posible calcular dos de las siguientes
variables:
• Presión a la salida o caída de presión
• Eficacia
• Energía de la bomba

HYSYS también puede calcular hacia atrás la presión a la entrada.


Adviértase que una bomba con una eficacia del 100 % no corresponde a una compresión
isoentrópica del líquido, ya que los cálculos se hacen con la suposición de que el líquido es
incompresible. Suposición aceptable para líquidos alejados del punto crítico. Sin embargo, si
se desea llevar a cabo un cálculo más riguroso para el bombeo de líquidos compresibles (por
ejemplo, en las proximidades del punto crítico), se debe instalar un compresor para
representar la bomba.

287
Introducción al uso de HYSYS. Modelos simples de operaciones unitarias

3.7 Enfriador (Cooler)/Calentador (Heater)


Los enfriadores y calentadores son intercambiadores de calor en los que solo se está
interesado en una de las partes del intercambio, y por lo tanto lo importante es la energía
requerida para enfriar o calentar una corriente de proceso, pero no se está interesado en las
condiciones o el fluido de utilidad.
Ambas operaciones usan la misma ecuación básica, la única deferencia es la convención para
el signo de la energía.
Para el enfriador a la entalpía de entrada se le resta la corriente de energía del cooler:
Flujo de calorentrada – Energíacooler = Flujo de calorsalida
Para el calentador la corriente de energía se suma a la entrada:
Flujo de calorentrada + Energíacooler = Flujo de calorsalida
Los parámetros aplicables son la caída de presión y el intercambio de energía. Ambos
parámetros se pueden especificar directamente o ser determinados a partir de las corrientes
conectadas a la operación.
Hay que recordar que HYSYS usa el convenio de signo adecuado para la unidad, de manera
que independientemente de la operación hay que especificar siempre un valor positivo para el
intercambio de energía.

288
Simulación de procesos con HYSYS

Simulación de procesos con HYSYS.


Aspectos básicos
Susana Luque Rodríguez
Aurelio B. Vega Granda

Departamento de Ingeniería Química


y Tecnología del Medio Ambiente
Simulación de procesos con HYSYS. Aspectos básicos

ÍNDICE

1. EJEMPLO: SEPARACIÓN DE AMONIACO Y AGUA......................................291


1.1. Análisis de sensibilidad o paramétrico ................................................................297
2. RESOLUCIÓN DE NUEVOS PROBLEMAS......................................................300
2.1. Problema adicional ..............................................................................................300
3. BIBLIOGRAFÍA ......................................................................................................301

1. EJEMPLO: SEPARACIÓN DE AMONIACO Y AGUA


Se trata de un proceso cuyo objetivo es la separación de una corriente de 10000 lb/h, mezcla
de amoniaco (80 % en peso) y agua, en estado de vapor saturado a 250 psia. Para lograrlo se
combinan un condensador (en el que se retira energía a una velocidad de 5.8·106 Btu/h), una
válvula de expansión y un separador flash que trabaja a 100 psia. El objeto de la simulación es
determinar la composición de la corriente líquida que sale del separador, despreciando las
pérdidas energéticas de todos los equipos hacia los alrededores y la caída de presión en el
condensador.
VAPOR

ALIMENTACIÓN Unidad de
Separación

Condensador

LÍQUIDO

Paso 1. Selección del paquete de propiedades y definición de la base para la simulación


En primer lugar es necesario definir el
sistema con el que se trabaja y el método
de predicción de propiedades que se desea
utilizar, lo cual se lleva a cabo mediante el
Simulation Basis manager, apareciendo el
menú mostrado a la derecha.

Dado que se debe definir un nuevo


paquete de propiedades, se debe hacer clic
en el botón Add..., lo que resulta en que

291
Simulación de procesos con HYSYS. Aspectos básicos

en el botón Add..., lo que resulta en que


aparezca la ventana Fluid Package: Basis-
1, en el que se debe seleccionar un método
de predicción de propiedades (en el
manual de HYSYS se describen
brevemente dichos métodos). En este caso
se elige la ecuación de estado Soave-
Redlich-Kwong (SRK), como se muestra a
la derecha.

Para este problema, las especies químicas involucradas son agua y amoniaco, las cuales se
adicionan a la información base del proceso abriendo la hoja correspondiente a la pestaña
Components, como se muestra en la siguiente figura.

Para adicionar un compuesto químico, se


teclea su nombre o su fórmula en el campo
Match. A la vez que se introduce el texto,
HYSYS intenta buscar en su base de datos
el compuesto correspondiente.

Una vez seleccionado el compuesto, éste


se adiciona presionando el botón Add
pure. Después de añadir el agua, la
pantalla se muestra como en la figura de la
derecha.

Si se presiona el botón Close, el programa


devuelve el control al Simulation basis
manager.
A continuación, presionando el botón en la
parte inferior de la ventana (Enter
Simulation Environment...), se entra en la
ventana principal del simulador.

292
Simulación de procesos con HYSYS. Aspectos básicos

Paso 2. Introducción de las especificaciones de corrientes para los balances de materia y


energía
En este ejemplo, el Workbook está
definido como ventana por omisión. Por
ello, las especificaciones de las corrientes
se muestran en forma de hoja de cálculo,
en la que las variables de cada corriente
están dispuestas en columnas.

Inicialmente, el Workbook tiene las cuatro páginas indicadas en la figura: una con los datos de
las corrientes de materia (Material Streams), la siguiente incluyendo las composiciones de
todas las corrientes (Compositions), una página con los requerimientos energéticos de cada
equipo (Energy Streams) y la última, desde donde se puede acceder a las variables y
parámetros de las operaciones unitarias (Unit Ops).
Es posible adicionar más páginas al Workbook yendo al botón Workbook en el menú de
HYSYS, y seleccionando la opción Setup. El sistema de unidades empleado en los datos de
las corrientes se selecciona mediante el botón Tools-Preferences en el menú de HYSYS. En
este ejemplo se ha seleccionado el sistema americano (Field). Sin embargo, en la resolución
de todos los problemas de esta práctica se ha de usar el sistema internacional (SI).
Empleando el Workbook, el usuario introduce valores para las variables. Cuando HYSYS
tiene disponibles todos los datos necesarios (se han suministrado tantos datos como grados de
libertad), procede a calcular directamente los datos desconocidos. Para definir la corriente de
alimentación es preciso seleccionar un nombre para la misma (A, en este caso), como se
muestra en la figura anterior, en la que se han introducido tres de las variables de la corriente,
con la fracción de vapor fijada en la unidad, lo que indica que se trata de vapor saturado.

293
Simulación de procesos con HYSYS. Aspectos básicos

En este punto, la corriente no está


completamente especificada, con varios
datos marcados como vacíos (<empty>),
puesto que la composición de la corriente
no se ha especificado. Para ello se debe
hacer doble clic en el flujo másico en la
columna 2, que abre la ventana Input
Composition for Stream A, en la que se
pueden introducir las fracciones másicas
de amoniaco y agua.

Tras pulsar OK, HYSYS vuelve al


Workbook, en donde las definición de la
corriente ya está completa, como se
muestra a la derecha (y las variables
definidas por el usuario se indican en
azul)

A continuación, se instala el
condensador, usando la operación
Cooler, para lo cual se hace doble click
sobre el icono correspondiente de la
paleta de objetos situada a la derecha
(Mediante la tecla F4 se accede a la
paleta, si ésta no está visible), con lo que
se abre una nueva ventana
correspondiente al Property view del
condensador.

294
Simulación de procesos con HYSYS. Aspectos básicos

Se introducen los nombres de las corrientes


entrante y saliente en la página de
Connections, y la pérdida de carga
(Pressure drop) se especifica en la página
Parameters, donde además es posible
indicar la energía transmitida (Duty). En este
ejemplo, A es la corriente de entrada, B la de
salida y C-DUTY la corriente de energía.
Después de introducir el valor de la pérdida
de carga (nula) y de cerrar la ventana del
Property view del condensador, el
Woorkbook presenta el aspecto mostrado en
la figura de la derecha.

La corriente de salida, B, no está


completamente definida hasta que se
especifique bien la temperatura de salida,
bien la energía eliminada en el
condensador.

La energía se puede especificar en la


página Energy Streams, como se muestra
en la figura, o bien en la página
Parameters del Property view del
condensador, como se ha mencionado.

Tras especificarla, el Workbook tiene el


aspecto indicado a la derecha.

A continuación, se adiciona la válvula de expansión (VLV-


100) al diagrama de flujo, usando la operación Valve, a
cuyo Property view se accede mediante un doble click sobre
el icono de la paleta de objetos. Se introducen los nombres
de las corrientes de entrada y salida (B y C,
respectivamente) en la página Connections, y la pérdida de
carga en la pagina Parameteres (o en el Workbook
introduciendo directamente el valor de la presión de la
corriente de salida).

295
Simulación de procesos con HYSYS. Aspectos básicos

El aspecto que tiene entonces el Workbook


se muestra a la derecha.

El último paso es definir las variables


asociadas con el separador flash, al cual se
accede con un doble clic sobre el icono
Separator, en la paleta de objetos.

Tras introducir los nombres de las corrientes de entrada y salida, VAP y LIQ, en Connections,
el Workbook tiene el aspecto indicado en la figura de la derecha:

Para obtener las fracciones másicas en la


corriente de producto líquido, se hace
doble click en el campo Mass Flow en la
columna de la corriente LIQ.

Finalmente, es posible visualizar el


diagrama de flujo seleccionando el botón
PFD en l barra de herramientas:

296
Simulación de procesos con HYSYS. Aspectos básicos

1.1. Análisis de sensibilidad o paramétrico


Una de las principales ventajas de los programas de simulación es la facilidad para, una vez
establecido un diagrama de flujo, estudiar el efecto de variaciones en las corrientes o las
unidades de proceso.
Para ilustrar esto, modificar en el caso ejemplo desarrollado la energía retirada en el
condensador (tomar, por ejemplo, seis valores comprendidos entre 1·106 y 6·106 Btu/h) y
anotar los flujos y composiciones de la corrientes de salida del separador flash
Esto se puede llevar a cabo usando el
DataBook (en el menú Tools). Esta
herramienta permite seleccionar variables
a modificar y visualizar los resultados de
los cálculos sucesivos en forma gráfica
(de forma que se pueden analizar posibles
efectos transitorios), así como evaluar en
diferentes posibles casos problema el
efecto que sobre las variables clave del
proceso (variables dependientes) tienen
los parámetros modificados (variables
independientes).

Todas las variables que se van a utilizar


(tanto independientes como
dependientes) se han de seleccionar
primeramente en la página Variables del
DataBook, pulsando en el botón Insert...,
tras lo cual aparece la lista de diagramas
de flujo (y sus subdiagramas), los objetos
y las variables asociadas a cada objeto.

De esta forma se puede seleccionar


el Heat flow (flujo de energía) de la
corriente energética C-DUTY
asociada al diagrama de flujo
principal que será la variable
independiente, así como las
variables dependientes en el
ejemplo (flujos de VAP y LIQ y
composición de las mismas):

297
Simulación de procesos con HYSYS. Aspectos básicos

Una vez que se han seleccionado todas ellas, la página Variables del DataBook presenta el
siguiente aspecto:

El siguiente paso es registrar las


coordenadas (denominadas datos
“Data”), lo cual se puede llevar a cabo
de dos formas. La primera alternativa
es usar el Data Recorder, en el cual
los grupos de variables dependientes e
independientes, definidos como states
(estados), se almacenan manualmente
de la forma deseada. Para ello,
primeramente se selecciona en la
pestaña Data Recorder un Scenario
(escenario) o bien se adiciona uno
nuevo (Add...) y se seleccionan las
variables que se han de incluir en el
estudio (en este caso todas),
marcando las casillas correspondientes

298
Simulación de procesos con HYSYS. Aspectos básicos

A continuación, cada solución que


aparece en el Workbook se almacena
en el Data Recorder como un state,
tras activación del botón Record... en
la página Data Recorder. A modo de
ejemplo se muestra el resultado
(denominado State 1, y visualizado
tras pulsar View) en forma de tabla
para el estado actual (resultado de la
simulación anteriormente realizada).
También es posible ver los resultados
en forma gráfica.
Claramente, esta opción no es muy adecuada cuando se quieren evaluar un gran número de
casos. Para estas situaciones es más conveniente elegir la segunda alternativa: la opción Case
Studies, en la cual el estudio paramétrico se hace de forma automática.
Para ello el primer paso es
establecer el problema, en la página
Case Studies del DataBook. Esta
página contiene una lista de
variables dependientes e
independientes a la derecha, y un
nombre asociado al estudio a
efectuar a la izquierda

El intervalo de variación de las


variables independientes (indicado
por una cota inferior, una superior y
el incremento por paso) se ha de
estipular en la página Case Studies
Setup –Main, accesible tras pulsar
el botón View...

Tras completar estos valores, los cálculos se inician pulsando la tecla Start, lo cual hace que
se repitan automáticamente los cálculos de la simulación para cada valor de la variable
independiente definida anteriormente. Los resultados (Results...) se pueden visualizar bien en
forma gráfica o de tabla.

299
Simulación de procesos con HYSYS. Aspectos básicos

De la misma forma se puede, por ejemplo, modificar la condición (fracción de vapor) de la


alimentación (tomando cinco valores entre 0.8 y 1), para un valor dado de la energía retirada
en el condensador y observar el efecto de la misma sobre los flujos y composición de las
corrientes de salida.

2. RESOLUCIÓN DE NUEVOS PROBLEMAS


Para resolver nuevos problemas, se selecciona New case en el menú principal de HYSYS.

2.1. Problema adicional


El tolueno se produce a partir de n-heptano por deshidrogenación con un catalizador de Cr2O3
adsorbido sobre Al2O3:

Como se muestra en el diagrama de flujo siguiente, el n-heptano se calienta desde 65 hasta


800 ºF, y luego se alimenta al reactor, que opera isotérmicamente, y con una conversión del
15 % (molar) de n-heptano a tolueno. La salida del reactor se enfría hasta 65 ºF y se alimenta
a un separador de equilibrio.

Vapor
SOBRECA-
LENTADOR
Aliment.
n-heptano Separ ador
flash
REACTOR
Ener gía CATALÍTICO
Líquido
sobr ecalentador

Suponiendo que todas las unidades trabajan a presión atmosférica, se pide determinar los
flujos de las especies en todas las corrientes. El separador de equilibrio se emplea para
eliminar el hidrógeno y normalmente se usa una columna de destilación para posteriormente
recuperar el tolueno.

300
Simulación de procesos con HYSYS. Aspectos básicos

Una vez resuelto este problema se puede modificar para mejorar la integración energética del
proceso. Para ello se puede introducir un precalentamiento de la alimentación, usando la
corriente de salida del reactor como fuente de energía, lo cual implicaría un menor consumo
energético del proceso.
Para el sistema con recuperación energética, se puede estudiar el efecto que sobre la energía
necesaria en el sobrecalentador y el producto UA del precalentador tiene la temperatura de
precalefacción.

3. BIBLIOGRAFÍA

• Hyprotech “HYSYS user’s guide” (2001).


• Seider, W.D., Seader, J.D., Lewin, D.R., “Process Design Principles”, John Wiley & Sons,
Nueva York (1999)

301
Simulación de procesos con HYSYS

Simulación de procesos con HYSYS.


Sistemas de reacción y
recirculaciones
Aurelio B. Vega Granda
Susana Luque Rodríguez

Departamento de Ingeniería Química


y Tecnología del Medio Ambiente
Universidad de Oviedo
Simulación de procesos con HYSYS. Sistemas de reacción y recirculaciones

ÍNDICE

1. PRODUCCIÓN DE CLORURO DE ETILO ........................................................305


2. RESOLUCIÓN PASO A PASO ...............................................................................305
3. PROBLEMA ADICIONAL: BUCLE DE REACCIÓN EN EL PROCESO DEL
AMONIACO ............................................................................................................. 311
4. BIBLIOGRAFÍA ......................................................................................................312

1. PRODUCCIÓN DE CLORURO DE ETILO


Una de las rutas para obtener cloruro de etilo es por reacción en fase gas del HCl con etileno
en presencia de un catalizador de cloruro de cobre soportado sobre alúmina.
C 2 H 4 + HCl → C 2 H 5 Cl
En el proceso que se muestra en la figura, la corriente de alimentación está compuesta por un
50 % mol de HCl, 48 % mol de C2H4, y 2 % mol de N2 con un flujo de 100 kmol/h a 25 ºC y
1 atm. Dado que la reacción alcanza solamente una conversión de 90 % mol, el producto
cloruro de etilo se separa de los reactivos sin reaccionar, y posteriormente se recicla. La
separación se lleva a cabo en una columna de destilación, donde se supone que se produce una
separación perfecta. El proceso se opera a presión atmosférica y se desprecia la caída de
presión. Para prevenir la acumulación de inertes en el sistema, se hace una purga de 10
kmol/h.

2. RESOLUCIÓN PASO A PASO


Los pasos necesarios para llevar a cabo esta simulación en HYSYS son:

305
Simulación de procesos con HYSYS. Sistemas de reacción y recirculaciones

1. Selección del paquete de


propiedades y definición de la base
Esto se realiza invocando al Simulation
Basis Manager, donde se selecciona
como ecuación de estado Peng-
Robinson, y ethylene, ethyl chloride, and
nitrogen como componentes. Dado que
vamos a suponer separación perfecta en
la columna de destilación, la ecuación de
Peng-Robinson es suficiente.

2. Definición de la reacción de
conversión
En el Simulation Basis Manager, dentro
de la pestaña Reactions hay que definir
la reacción que va tener lugar. Para ello
se pulsa sobre el botón Add to FP con el
objeto de añadir el Fluid Package,
anteriormente definido, al conjunto de
reacciones. Posteriormente se pulsa el
botón Add Comps con lo que aparecerá
otro formulario donde pulsaremos el
botón Add This Group of Components.
Con esto tendremos todos los
componentes que habíamos definido
anterior-mente. Pulsaremos ahora Add
Rxn con el fin de definir la
estequiometría de la reacción, el
componente base, la fase en la que tiene
lugar la reacción, y el valor de la
conversión.

306
Simulación de procesos con HYSYS. Sistemas de reacción y recirculaciones

3. Introducir las especificaciones


Se define la corriente de alimentación
(FEED) con los datos indicados
anteriormente.

4. Se instala la operación unitaria


Mixer, MIX-100
En el Workbook dentro de la pestaña Unit
Ops se selecciona añadir unidad de
operación y se selecciona la unidad
Mixer. Esta unidad se alimenta con las
corrientes FEED y R*, y tiene como
corriente de salida S2. Como R* es una
corriente no definida se inicializa con un
flujo cero y una composición igual a la
de la alimentación. De esta forma se
permite llevar a cabo los cálculos.
Posteriormente generaremos un mecanismo para permitir la actualización de esta
corriente hasta que se alcance la convergencia. También es posible adicionar
posteriormente al Mixer esta corriente de recirculación.
5. Se instala un reactor de conversión
De manera análoga a la instalación del
Mixer se instala un reactor de
conversión. Se le asocia el Reaction Set
previamente definido en el apartado 2.

307
Simulación de procesos con HYSYS. Sistemas de reacción y recirculaciones

6. Se instala el divisor de
componentes (Component Splitter)
D-1
Esta operación va a simular la columna
de destilación en la que se produce la
separación perfecta (100 % de pureza)
del cloruro de etilo por colas, con los
otros tres componentes en la corriente de
cabezas. Para completar la definición de
esta unidad es preciso fijar las presiones
en cabezas y colas, junto con las
temperaturas de las corrientes o las
fracciones de vapor.
Después de efectuar estos pasos el
Workbook aparecerá como se indica en la
figura adjunta.

7. Instalación del divisor de flujo


(Te), TEE-100
Tiene como entrada la corriente de
destilado S4 y como salidas la corriente
de purga W, y la de reciclo R. En el
Workbook se especifica como flujo de W
10 kmol/h de manera que la unidad
quedará completamente definida.

308
Simulación de procesos con HYSYS. Sistemas de reacción y recirculaciones

8. Instalación del reciclo, RCY-1


La corriente R entra en un unidad
matemática de convergencia de reciclo,
que compara las variables
correspondientes a las corrientes R* y R
y comprueba el criterio de convergencia.
Cuando la convergencia no se alcanza en
la primera iteración, se usa el método de
Wegstein para actualizar las variables de
R* después de llevar a cabo otra
iteración sobre el bucle de reciclo.

En la siguiente figura se muestra el diagrama de flujo completo, y en la siguiente los


resultados obtenidos simulando el proceso con HYSYS, con una purga de 10 kmol/h. Los
resultados muestran que el flujo del reciclo es de 6.579 kmol/h y que la alimentación al
reactor S2 contiene 3.09 % mol de nitrógeno.

309
Simulación de procesos con HYSYS. Sistemas de reacción y recirculaciones

También se puede investigar el impacto del flujo de purga sobre el flujo del reciclo y sobre la
composición a la entrada del reactor.

Se accede al Databook a través del


menú Tools/Databook. En la pestaña
Variables se seleccionan las variables
fracción molar de nitrógeno en la
corriente S2, flujo molar de purga W, y
flujo másico de la corriente de reciclo R.

En la pestaña Case Studies se pulsa el


boton Add para añadir un nuevo caso.
Se selecciona el flujo molar de la purga
W como variable independiente, y las
otras dos como variables dependientes.
Se pulsa sobre el botón View

310
Simulación de procesos con HYSYS. Sistemas de reacción y recirculaciones

Se hace variar el flujo molar de la purga


W desde 5 hasta 13 kmol/h en cambios
de 0.5, y se pulsa el botón Start, con lo
que se iniciarán las simulaciones
necesarias. Una vez concluida pulsando
sobre el botón Results se podrán
observar los resultados tanto en forma
gráfica como tabular.

Obsérvese que los limites empleados para el flujo molar de purga están cerca de valores
limites determinados por el balance materia. Cuando el flujo de purga es de 5 kmo/h el flujo
de reciclo es de aproximadamente 1024 kg/h y la fracción molar de nitrógeno en la corriente
S2 es 11 %, mientras que cuando el flujo de purga es de 13 kmol/h el flujo de reciclo cae cero
y la composición en nitrógeno de la corriente S2 es del 2 %. Los resultados del estudio
paramétrico, que se muestra en la gráfica de más abajo, indica el impacto del aumento de flujo
de purga sobre el equilibrio entre costes de operación y equipos (disminuir el reciclo y
tamaños más pequeños de los equipos) y los costes de las materias primas (mayores pérdidas
de materia primas al disminuir el reciclo).

3. PROBLEMA ADICIONAL: BUCLE DE REACCIÓN EN EL


PROCESO DEL AMONIACO

En algunos procesos, las trazas de algunos compuestos, introducidas como impurezas en la


alimentación, o bien como subproductos de reacciones secundarias, pueden presentar graves

311
Simulación de procesos con HYSYS. Sistemas de reacción y recirculaciones

problemas. En un proceso continuo, éstas se acumulan continuamente a no ser que se prevea


un medio para su eliminación, bien mediante reacción, separación, o a través de corrientes de
purga. Dado que la reacción o la separación de especies en baja concentración es
habitualmente costosa, se utilizan corrientes de purga cuando las especies no son tóxicas y
tienen un bajo impacto sobre el medioambiente. Las corrientes de purga también se usan para
eliminar especies presentes en grandes cantidades cuando su separación de otros productos
químicos presentes en la mezcla es difícil.
Como un ejemplo de lo anterior, considérese el proceso de producción de amoniaco
(N2 + 3H2 2 NH3). En este proceso al nitrógeno le acompañan cantidades traza de argón,
que se obtiene del aire, mientras que al hidrógeno le acompañan pequeñas cantidades de
metano, que se obtienen por reformado con vapor (CH4 + H2O 3 H2 +CO). Después del
reformado, el CO y el metano sin reaccionar y el vapor de agua se recuperan, dejando en la
corriente de hidrógeno trazas de metano.
Aunque el nitrógeno y el hidrógeno reaccionan a presión elevada (200 atm), la conversión a
amoniaco es baja (aprox. 20 % en moles) y es necesario recircular grandes cantidades de
nitrógeno e hidrógeno sin reaccionar. La corriente de purga proporciona un medio de eliminar
argón y metano que, de otra forma, se acumularían de forma inaceptable en los tubos del
reactor, que están empaquetados con catalizadores de platino.
Los vapores que se obtienen del separador flash se dividen en purga y recirculación, con la
relación purga/recirculación siendo una variable de decisión clave.
Diagrama de flujo del proceso:

Compresor Purga

Trazas Compresor
Separador
flash
Reactor Condensador
Trazas
parcial

Otros datos.
Alimentación: 77 ºF, 200 atm.
Composición: 73.2 % H2, 24.4 % N2; 2.1 % CH4 y 0.3 % Ar.
Reactor: 932 ºF, 200 atm
Separador flash: -28 ºC, 136.3 atm

4. BIBLIOGRAFÍA
• Hyprotech “HYSYS user’s guide” (2001).
• Seider, W.D., Seader, J.D., Lewin, D.R., “Process Design Principles”, John Wiley & Sons,
Nueva York (1999)

312
Simulación de procesos con HYSYS

Simulación de procesos con HYSYS.


Especificaciones de diseño
Susana Luque Rodríguez
Aurelio B. Vega Granda

Departamento de Ingeniería Química


y Tecnología del Medio Ambiente
Universidad de Oviedo
Simulación de procesos con HYSYS. Especificaciones de diseño

ÍNDICE

1. INTRODUCCIÓN ....................................................................................................315
2. EJEMPLO 1: COLUMNA DE DESPROPANACIÓN..........................................315
2.1. Resolución paso a paso........................................................................................316
3. EJEMPLO 2: SEPARACIÓN DE AMONIACO Y AGUA...................................321
3.1. La operación ADJUST.........................................................................................321
3.2. Aplicación al ejemplo de separación de amoniaco y agua ..................................321
3.3. Resolución paso a paso........................................................................................322
4. MÚLTIPLES ESPECIFICACIONES DE DISEÑO..............................................324
5. PROBLEMA ADICIONAL: COLUMNAS DE DESTILACIÓN CON
INTEGRACIÓN ENERGÉTICA ...........................................................................325
6. BIBLIOGRAFÍA ......................................................................................................325

1. INTRODUCCIÓN

En este tema se va a emplear HYSYS para realizar cambios en un diagrama de flujo de forma
que se cumplan ciertas especificaciones de diseño (pureza de productos, o flujo de corrientes,
por ejemplo) mediante la modificación automática de otras variables del proceso. Esto se
puede llevar a cabo de formas diferentes:
• Si las especificaciones corresponden a la operación de una columna de destilación, es
posible introducirlas directamente en las ventanas correspondientes a la operación
Column.
• Por otro lado, si se trata de otro tipo de especificaciones, que involucran diferentes
partes u operaciones del diagrama de flujo, HYSYS precisa de la adición de una
operación adicional ADJUST, que permite seleccionar con total libertad las variables
independientes (aquellas que se vana modificar) y la dependientes (las que se desean
ajustar a unos valores definidos por el usuario).

2. EJEMPLO 1: COLUMNA DE DESPROPANACIÓN

En este ejemplo, se tiene que separar una mezcla de parafinas en una columna de destilación
de 12 platos ideales con un condensador parcial, con la alimentación entrando en el plato 7
contado desde la parte superior de la columna. Se emplea el modelo de SRK.
La composición de la alimentación (a 250 psia y 225 ºF) es 30 lbmol/h de C2H6, 200 lbmol/h
de C3H8 (LK, considerado como el compuesto clave ligero), 370 lbmol/h de n C4H10 (HK,
considerado como el compuesto clave pesado), 350 lbmol/h de n C5H12 y 50 lbmol/h de n

315
Simulación de procesos con HYSYS. Especificaciones de diseño

C6H14. La presión en el condensador es de 248 psia y de 252 psia en el calderín; estos niveles
de presión se han seleccionado de forma que se pueda emplear agua como medio refrigerante.
Las especificaciones de diseño preliminares requieren una relación de reflujo de 6.06, y un
flujo de destilado como vapor de 226 lbmol/h. Posteriormente, el diseño se ha de modificar
para lograr una recuperación de propano en cabezas de 191 lbmol/h y de butano en colas de
365 lbmol/h.

2.1. Resolución paso a paso


Se selecciona primeramente el
modelo de propiedades físicas y los
componentes, eligiéndolos de entre la
lista de disponibles:

En el Workbook se
introducen los datos de la
alimentación (F) propor-
cionados (mostrados por
HYSYS en azul, mientras
que los datos calculados
por HYSYS aparecen en
negro).

A continuación se introduce una


operación de destilación (modelo
Distillation Column de la paleta de
objetos del PDF) y se incluyen en la
ventana de especificaciones corres-
pondientes (Distillation Column
Input Expert, accesible mediante un
doble click en el icono de la columna
de destilación) todos los datos
proporcionados en el problema.

316
Simulación de procesos con HYSYS. Especificaciones de diseño

En la página Connections se
especifican los nombres de las
corrientes (de materia y energía) que
entran y salen de la columna
(incluidas las salidas laterales, si las
hubiera, así como el número de
platos –y el orden en su numeración-,
y los platos de alimentación y salidas
laterales). También se especifica el
tipo de condensador: total (destilado
como corriente líquida), parcial (dos
corrientes en cabezas en equilibrio,
una líquido y otra vapor) y reflujo
total del líquido (con una única
corriente de destilado en forma de
vapor). Este último caso corresponde
al ejemplo que nos ocupa.

En la siguiente página (Pressure


Profile) se especifican las presiones
de trabajo en calderín y condensador,
así como la pérdida de carga en este
último.

A continuación, en la ventana
Optional Estimates es posible
suministrar valores estimados
(opcionales) de temperatura en
calderín y condensador (supóngase
que estos son 240 F y 100 F,
respectivamente, para el caso objeto
de estudio).

HYSYS resuelve los balances de materia y energía en la columna con la pérdida de carga
introducida y suponiendo un perfil de temperatura lineal entre los valores introducidos como
estimaciones en calderín y condensador. Si no se especifican valores en esta hoja, HYSYS
estima unos valores a partir de cálculos de equilibrio L-V.

Finalmente, la última página (Specifications) permite asignar especificaciones para el


funcionamiento de la columna:

317
Simulación de procesos con HYSYS. Especificaciones de diseño

Una columna de destilación tiene dos


o tres grados de libertad,
dependiendo del tipo de condensador
que se elija. Para condensadores
totales (sin corriente producto de
cabezas en forma de vapor) o
condensadores parciales en los que
todo el condensado se retorna a la
columna como reflujo (sin corriente
producto de cabezas en forma de
líquido), sólo existen dos grados de
libertad.
Existe un grado de libertad adicional cuando se usa un condensador parcial con dos corrientes
producto (una líquido y otra vapor). El número de grados de libertad también aumenta si
existen corrientes laterales, habitualmente resueltas especificando el flujo molar de las
corrientes laterales.
Para la columna despropanizadora, con un condensador parcial y destilado únicamente en
forma de vapor, se seleccionan como especificaciones el flujo de destilado vapor y la relación
de reflujo (las especificaciones por defecto). Posteriormente, en la página Specs del modelo
Column se pueden seleccionar otras especificaciones.
Tras completar la introducción de
la información (presionando
Done), se accede a la ventana del
modelo Column, cuya primea
hoja (Design-Connections)
permite una revisión de una gran
parte de los datos anteriormente
introducidos.

A continuación se pasa a la
página Monitor, y se presio-
na la tecla Run para comen-
zar los cálculos iterativos.
Típicamente la convergen-
cia o se consigue rápida-
mente o no se consigue en
absoluto (debido a que se
han introducido especifica-
ciones imposibles). En esta
página se puede seguir el
curso de las iteraciones y los
perfiles calculados de pre-
sión, temperatura y flujos.

318
Simulación de procesos con HYSYS. Especificaciones de diseño

El PDF para la columna, junto con los datos de flujos molares de cada uno de los
componentes (adicionado al PDF con la opción Add Workbook Table tras pulsar el botón
derecho del ratón sobre una zona vacía del mismo) se muestra a continuación (la selección de
otras variables a mostrar u otras unidades de las mismas se puede llevar a cabo con la opción
Setup... del menú Workbook cuando se está visualizando el Workbook).

Cuando no se logra la convergencia, es conveniente seguir las siguientes pautas:


• Obtener soluciones para las especificaciones por defecto. Los resultados habitualmente
proporcionan una buena inicialización para otras especificaciones.
• Intentar relajar las especificaciones que presentan mayor dificultad para su consecución.
• Modificar el número de platos y la posición de la alimentación y corrientes laterales para
mejorar los perfiles de composición. Cuando los cambios en composición son muy
pequeños en una sección de la columna, se debe de considerar eliminar platos.
Los resultados de la simulación son accesibles desde el Property view de Column, algunas d
cuyas páginas se describen a continuación:
En la pestaña Worksheet se muestra una lista de variables de las corrientes de alimentación y
productos.
La página Summary en la
pestaña Performance pro-
porciona información sobre
presión, temperatura, flujos
de líquido y vapor asociados
con cada plato, así como un
resumen de flujo total de
cada corriente de
alimentación y producto.
También muestra las
necesidades energéticas en
calderín y condensador.

319
Simulación de procesos con HYSYS. Especificaciones de diseño

Mediante Results, en la pestaña


Performance se puede observar en el perfil
de composiciones mostrado a la derecha.
Es posible obtener datos de temperaturas,
presiones, flujos y composición en función
del numero de etapa en forma gráfica o de
tabla. Las gráficas se pueden modificar de
acuerdo a las indicaciones del usuario
usando el Graph Control, accesible
presionando el botón derecho del ratón en
cualquier punto del gráfico.
A continuación, las especificaciones
de diseño consideradas preliminar-
mente se van a reemplazar por
especificaciones de flujo molar de
propano en el destilado (191
lbmol/h) y de butano en colas (365
lbmol/h). Estos cambios se
incorporan en la ventana Specs de la
pestaña Design del Property view de
Column, desde donde se tiene acceso
a una lista de las posibles variables a
especificar, como se muestra a la
derecha.
Tras pulsar el botón Add Spec(s)...,
se puede especificar el valor deseado,
y dar un nombre a la especificación.

Tras añadir las dos nuevas especi-


ficaciones, es necesario actualizar la
lista de especificaciones activas, lo
cual se lleva a cabo en la página
Monitor, desactivando las especifi-
caciones anteriormente empleadas y
activando las nuevas. Tras esto, la
columna converge en una sola
iteración, ajustando la relación de
reflujo a 8.7 y l flujo molar de
destilado a 226 lbmol/h.

320
Simulación de procesos con HYSYS. Especificaciones de diseño

3. EJEMPLO 2: SEPARACIÓN DE AMONIACO Y AGUA

3.1. La operación ADJUST


Otra de las opciones que tiene HYSYS para introducir especificaciones de diseño es mediante
la operación ADJUST, que hace que varíe el valor de una variable de corriente (la variable
independiente) para lograr el valor requerido o especificación (la variable dependiente) en
otra corriente u operación.
En un diagrama de flujo es posible que se requieran ciertas especificaciones de diseño que no
se pueden resolver directamente, y para los cuales es preciso emplear un proceso iterativo.
Con este objetivo se puede introducir la operación ADJUST, de forma que dicho
procedimiento se lleve a cabo de forma automática.
La operación ADJUST permite acoplar variables de corrientes del diagrama de flujo que no
están físicamente conectadas por operaciones. Se puede emplear para una única
especificación de diseño (una variable dependiente) o también es posible instalar ADJUST
múltiples para resolver casos con varias variables simultáneamente. La operación ADJUST
lleva a cabo las siguientes funciones:
• Ajusta la variable independiente hasta que la variable dependiente alcanza un valor
objetivo (Target Value)
• Ajusta la variable independiente hasta que la variable dependiente se iguala al valor de
la misma variable para otro objeto, más una tolerancia opcional.
Para una única especificación de diseño, se puede elegir entre los algoritmos de la secante
(Secant) o de Broyden. A ADJUST también se le suministra un intervalo o paso (Step size) de
variación de la variable que el programa usa inicialmente para variar (aumentando o
disminuyendo) la variable independiente. El algoritmo usa pasos del tamaño especificado
hasta que acota la solución. A partir de ese momento, se emplea bien la estrategia de búsqueda
de la secante (con su propio tamaño de paso) o de Broyden, dependiendo de la elección
previamente efectuada, para converger rápidamente hasta el valor especificado. Si la solución
no se consigue en el máximo número de iteraciones especificadas, la rutina de cálculo se
detendrá y preguntará al usuario si se desea iniciar otra secuencia de iteraciones. Esto se repite
hasta que se alcanza la solución o el usuario decide interrumpir la búsqueda. El algoritmo de
la secante suele proporcionar buena convergencia una vez que la solución ha sido acotada con
los pasos iniciales.

3.2. Aplicación al ejemplo de separación de amoniaco y agua


Supóngase que en el caso ejemplo del tema H1, la separación de amoniaco y agua mediante
un calentamiento y separación de equilibrio, se desea obtener una cantidad determinada de la
corriente líquida, por ejemplo, 4000 lb/h (variable dependiente o especificación de diseño).
Una de las posibles variables a manipular para lograr este objetivo es la cantidad de energía
suministrada en el cambiador de calor (variable independiente). A continuación se indica,
paso a paso, el procedimiento a seguir para lograr dicha especificación empleando la
operación ADJUST.

321
Simulación de procesos con HYSYS. Especificaciones de diseño

3.3. Resolución paso a paso


Se parte inicialmente del ejemplo
del tema H1, previamente
convergido.

En el PDF, se selecciona (mediante


la paleta de objetos), la operación
ADJUST (indicada con una A)

o mediante la opción Add


Operation... (F12) en el menú
Flowsheet, seguido de la opción
ADJUST.

La primera página de ADJUST


(Connections) permite seleccionar
la variable independiente (Adjusted
Variable), la dependiente (Target
Variable), así como el valor
especificado para esta última
(Target value).

En el ejemplo que nos ocupa la


variable independiente es el flujo de
energía (Heat Flow) de C-DUTY y
la variable dependiente es el flujo
másico de la corriente LIQ, que ha
tomar un valor de 4000 lb/h.

322
Simulación de procesos con HYSYS. Especificaciones de diseño

Tras especificar toda esta


información, el aspecto de la hoja
Connections es el mostrado a la
derecha.

La elección del algoritmo de


resolución (secante, en este caso),
la tolerancia (1 lb/h), el paso de la
variable independiente (106 Btu/h)
y en número máximo de iteraciones
se incluyen en la pestaña
Parameters, que por omisión –antes
de introducir los valores antes
mencionados- presenta el aspecto
mostrado a la derecha.
En este caso no se incluyen cotas
inferior ni superior para la variable
independiente.
Cuando se presiona Start, HYSYS
inmediatamente comienza el
procedimiento de convergencia. En
la pestaña Monitor se puede realizar
un seguimiento de los valores de la
variable independiente y de la
variable dependiente. Para este
ejemplo, la historia de las
iteraciones se muestra a la derecha.
ADJUST converge al valor
especificado en 8 iteraciones, para
un valor de C-DUTY de 4.185·106
Btu/h.

323
Simulación de procesos con HYSYS. Especificaciones de diseño

Los datos para todas las corrientes del proceso se pueden revisar en el Workbook.

Tras instalar la operación ADJUST, el PDF muestra el aspecto siguiente:

Si se elimina la operación ADJUST, los nuevos valores permanecen en el diagrama de flujo.

4. MÚLTIPLES ESPECIFICACIONES DE DISEÑO

Para varias especificaciones de diseño (Multiple ADJUST) se puede efectuar una resolución
simultánea de todos los ADJUST incorporados al diagrama de flujo. En estos casos, cuando el
resultado de una de las operaciones ADJUST afecta directamente a otra(s), es posible usar la
opción Simultaneous para minimizar el número de iteraciones del diagrama de flujo. Un
ejemplo de esto se puede encontrar en el manual de Aplicaciones de HYSYS (Looped
Pipeline Example). En estos casos HYSYS usa el algoritmo de Broyden para variar
simultáneamente todos los parámetros ajustables definidos en los ADJUSTs hasta que se
cumplen todas las especificaciones de diseño. El papel que juegan en este caso los pasos o
intervalos iniciales de variación de las variables independientes es diferente. En el ADJUST
individual, el algoritmo usa un valor previamente fijado para sucesivamente ajustar la variable
independiente hasta que la solución se ha acotado. En el caso del algoritmo simultáneo, el
paso de cada variable sirve como cota superior para el ajuste de dicha variable. Es muy
importante en estos casos, que se inicialice la búsqueda con un diagrama de flujo previamente
324
Simulación de procesos con HYSYS. Especificaciones de diseño

convergido, sin valores de las variables de las corrientes que supongan imposibles físicos (por
ejemplo, cruce de temperaturas en una cambiador de calor). La programación de estos ajustes
múltiples se lleva a cabo de forma fácil, instalando todos los ADJUSTs a resolver usando la
opción Simultaneous (en la pestaña Parameters) y luego presionando Start para comenzar los
cálculos.

5. PROBLEMA ADICIONAL: COLUMNAS DE DESTILACIÓN CON


INTEGRACIÓN ENERGÉTICA

El objetivo de esta simulación es simular la deshidratación de metanol por destilación de


doble efecto con división de la alimentación.
La alimentación es una mezcla equimolar a 2700 kmol/h, 25 ºC, y 5.2 bar. Se divide y
alimenta a dos columnas de destilación, una de ellas trabaja a presión más reducida, con las
especificaciones de diseño indicadas en la tabla siguiente.

Columna 1 Columna 2
Presión (bar) 5.20 1.01
Número de platos 16 13
Plato de alimentación* 12 9
Relación de reflujo 1.26 0.834
xD (fracción molar) 0.96 0.96
xB (fracción molar) 0.04 0.04
* Contando desde la parte superior de la columna

Primero, se configuran las dos columnas para que operen independientemente, con la
alimentación igualmente distribuida. A continuación, las columnas se conectan térmicamente,
con la energía que se retira del condensador de la columna de alta presión suministrando la
energía correspondiente a la vaporización que se lleva a cabo en el calderín de la columna de
baja presión

6. BIBLIOGRAFÍA
• Hyprotech “HYSYS user’s guide” (2001).
• Seider, W.D., Seader, J.D., Lewin, D.R., “Process Design Principles”, John Wiley & Sons,
Nueva York (1999)

325
Simulación de procesos con HYSYS

Simulación de procesos con HYSYS.


Optimización de diagramas de flujo
Susana Luque Rodríguez
Aurelio B. Vega Granda

Departamento de Ingeniería Química


y Tecnología del Medio Ambiente
Universidad de Oviedo
Simulación de procesos con HYSYS. Optimización de diagramas de flujo

ÍNDICE

1. INTRODUCCIÓN ....................................................................................................329
2. EJEMPLO: OPTIMIZACIÓN DE UNA TORRE CON SALIDAS LATERALES
....................................................................................................................................330
2.1. Resolución paso a paso .....................................................................................330
3. PROBLEMA ADICIONAL: OPTIMIZACIÓN DE LA PRODUCCIÓN DE
CLORURO DE ETILO............................................................................................337
4. BIBLIOGRAFÍA ......................................................................................................338

1. INTRODUCCIÓN

En este tema se va a mostrar cómo usar simuladores de procesos para optimizar los diagramas
de flujo más prometedores durante el diseño de procesos. Para ello se abordarán las
estrategias de optimación actualmente implementadas en simulación modular de procesos
químicos con variables continuas.
Para cuantificar las condiciones de operación más adecuadas se necesita primero una función
objetivo que sirva de indicador de la bondad de la solución, típicamente: costes de capital,
operación, rendimiento del producto, beneficios globales, etc.
Los valores de la función objetivo se determinan por manipulación de las variables del
problema (variables de decisión o variables independientes, que representan las grados de
libertad de la optimación), las cuales pueden físicamente representar características del equipo
o condiciones de operación (temperatura, presión, caudales, composiciones, etc.). Los límites
de operación del proceso, la pureza del producto, así como las relaciones ente las variables del
proceso han de ser consideradas como restricciones y los valores de las variables se han de
ajustar de forma que se satisfagan dichas restricciones. El resto de variables del proceso se
denominan variables dependientes, y sus valores se pueden obtener mediante las
restricciones.
Los objetivos de este tema son:
• Formulación de un problema de optimización no lineal (NLP), para maximizar o
minimizar una función objetivo ajustando variables continuas en el modelo del
proceso. Opcionalmente, el NLP incluye especificaciones en forma de ecuaciones
(restricciones en forma de igualdades) y expresiones acotadas (restricciones en forma
de inecuaciones).
• Utilización de HYSYS para resolución del NLP, comenzando con un modelo de
simulación del proceso que se ha de optimizar.

329
Simulación de procesos con HYSYS. Optimización de diagramas de flujo

2. EJEMPLO: OPTIMIZACIÓN DE UNA TORRE CON SALIDAS


LATERALES

En este ejemplo, se desea optimizar el funcionamiento de una torre de destilación. La


alimentación consiste en una mezcla de parafinas nC5 a nC9, y se alimenta a una torre de 23
platos. El objetivo es ajustar las condiciones de operación de modo que se obtenga un
destilado (D) concentrado en nC5, una corriente lateral (S1) concentrada en nC6, otra lateral
(S2) concentrada en nC7 y nC8, y una corriente de colas (B) concentrado en nC9. Las
condiciones de operación que se deben ajustar (variables de decisión) son la relación de
reflujo y los flujos de destilado y de las dos corrientes laterales. Esto se consigue formulando
un NLP en el cual se fija el plato de alimentación (11) y los platos de donde se obtienen las
salidas laterales (6 y 16, respectivamente):
Max (DC5 +S1C6+S2C7+S2C8+BC9)
con las restricciones: 5 R 10
0.1 D/F 0.7
0.1 S1/F 0.7
0.1 S2/F 0.7
B/F 0.05
siendo R la relación de reflujo, y D, F, S1, S2 y B flujos molares de destilado, alimentación,
corrientes laterales y producto de colas, respectivamente.
Las corrientes que abandonan la torre se consideran líquidos saturados. Todas las fases
líquidas y vapores se suponen ideales y en equilibrio en cada etapa de la torre. Se emplea el
modelo de propiedades físicas de Chao-Seader.
La composición de la alimentación (a 50 ºC y 175 kPa) es 220 kg/h de nC5, 110 kg/h de nC6,
160 kg/h de nC7, 50 kg/h de nC8 y 400 kg/h de nC9. La presión en el condensador es de
138 kPa y de 145 kPa en el primer plato. La presión en el calderín es de 180 kPa.

2.1. Resolución paso a paso


Se selecciona primeramente el
modelo de propiedades físicas y los
componentes, eligiéndolos de entre la
lista de disponibles:

En el Workbook se introducen los datos de la alimentación proporcionados

330
Simulación de procesos con HYSYS. Optimización de diagramas de flujo

A continuación se introduce una


operación de destilación y se incluyen en
la ventana de especificaciones
correspondientes todos los datos de
diseño proporcionados en el problema
(número de platos, platos de alimentación
y salidas laterales, presión de operación)
además de identificar tanto las corrientes
de materia como de energía asociadas.

Se resuelve inicialmente la columna


(modo simulación) especificando los
cuatro grados de libertad disponibles:
relación de reflujo (5), flujo de destilado
(200 kg/h), y flujo de las corrientes
laterales (2 kmol/h, estos dos últimos se
han de incluir previamente en la página
Specs durante el diseño de la columna).

En la página Monitor se puede ver el


resultado de la simulación, en cuanto a:
• evolución de la convergencia
• perfil de temperaturas, presiones o
flujos
• valores de las especificaciones de
diseño.
En la opción Results, en la ventana
Performance:

se puede observar en el perfil de


composiciones mostrado a la derecha.

331
Simulación de procesos con HYSYS. Optimización de diagramas de flujo

El funcionamiento de la columna es
bastante pobre, con varias zonas de
retromezcla y consiguiéndose una
separación relativamente pobre de las
fracciones pesadas, como también se
puede ver en el Workbook. En realidad la
corriente lateral S2 sólo contiene el 72 %
del heptano y octano alimentados,
mientras que en la corriente de colas sólo
se obtiene el 80 % de nonano presente en
la alimentación.

La interface Optimizer, es accesible desde


el menú principal o mediante F5, y su
estructura sirve de guía al usuario en la
formulación y resolución del problema de
optimización.

Esta aplicación permite optimizar un


diagrama de flujo, determinando los
valores de unas variables indicadas que
optimizan una función objetivo (tal como
la calidad de un producto, los beneficios
económicos o la productividad). También
se puede aplicar para ajustar parámetros
del proceso de forma que su resultado
coincida con datos obtenido de la planta
real (DataReconciliation).
En esta ventana se introduce toda la
información relativa al problema de
optimización.
Las variables independientes que se van a
manipular durante la optimización (R, D,
S1 y S2) se especifican en la página
Variables.

En la pagina Functions se introducen


todas las funciones, incluyendo la
objetivo y las restricciones:
Max (DC5 +S1C6+S2C7+S2C8+BC9)
5 R 10
0.1 D/F 0.7
0.1 S1/F 0.7 La hoja de cálculo interna del Optimizer
0.1 S2/F 0.7 (Spreadsheet) facilita la definición de todas las
B/F 0.05 funciones.

332
Simulación de procesos con HYSYS. Optimización de diagramas de flujo

La selección del algoritmo de resolución


y los parámetros ajustables del mismo
se fijan en la página Parameters.
Para obtener la solución al problema
NLP se presiona Start, siendo posible
seguir la evolución de la resolución en
la página Monitor.
Siempre es adecuado obtener una solución del problema (caso base) en modo simulación, tal
y como se ha hecho.
Para poder llevar a cabo la optimización
del funcionamiento de la columna es
necesario seguir un procedimiento que,
supone cuatro pasos:
Paso 1. Definición de las variables
independientes y sus intervalos de
variación en la página Variables. En
este caso, se seleccionan de entre las
especificaciones de diseño (Spec value)
definidas previamente en la interface de
la columna, denominada T-100.
Una vez seleccionadas las variables,
HYSYS toma como valores iniciales los
resultantes de la simulación realizada.
Por omisión, las cotas inferiores son la
mitad del valor inicial y las superiores
el doble de este valor. No obstante, el
usuario puede modificarlas según
conveniencia. En este caso, se fija una
relación de reflujo mínima de 5. Los
flujos aparecen en las unidades internas
de HYSYS, kmol/s.
Paso 2. A continuación se define tanto
la función objetivo como las restric-
ciones en la pestaña Functions, usando
Spreadsheet, disponible en la parte
inferior de la ventana (el funcionamien-
to de la misma es análogo al de una hoja
de cálculo) para llevar a cabo los cálcu-
los necesarios. Para ello, en la página
Connections se importan todas las
variables del diagrama de flujo que
intervienen en las ecuaciones de la
función objetivo o de las restricciones,
análogamente a la selección de
variables independientes.

333
Simulación de procesos con HYSYS. Optimización de diagramas de flujo

Por ejemplo, se necesita el flujo molar de n-pentano


en el destilado para la función objetivo, por lo que
esta variable se importa y se coloca en la celda A1 de
la hoja de cálculo. De modo análogo se importa el
flujo molar de n-hexano en S1, de n-heptano y n-
octano en S2 y de n-nonano en B, a las celdas A2 a
A5. Los flujos de F, D, S1, S2 se introducen en las
celdas C1 a C4.

El resto de variables involucradas, obtenidas


mediante operaciones (lógicas o matemáticas)
de las variables importadas del diagrama de
flujo se llevan a cabo en el Spreadsheet.
De este modo, por ejemplo, se calcula el valor
de la función objetivo (celda A6), como suma
del contenido de las celdas A1 a A5.

También se calcula el valor de B en la celda


C5, empleando para ello los valores importados
de F, D, S1 y S2, así como las relaciones B/F,
S1/F, S2F y D/F, situándolos en las celdas C7 a
C10.
Finalmente, se introducen las constantes 0.1,
0.7 y 0.05, presentes como cotas en las
restricciones, en las celdas D2, D4 y D6,
respectivamente.
Es posible incluir identificadores del contenido
de cada celda, incluyéndolos en el campo
Variable, en la zona superior de la ventana. El
código de colores es el estándar de HYSYS:
azul para valores definidos por el usuario,
negro para los calculados por HYSYS en la
simulación y rojo para los calculados en la hoja
de cálculo.
En caso de duda, se dispone de una ventana con
ayuda sobre la formulación de funciones
matemáticas o lógicas (Function Help en la
parte inferior de la pantalla).

334
Simulación de procesos con HYSYS. Optimización de diagramas de flujo

En la hoja Formulas se pueden revisar


todas las formulas matemáticas
empleadas en el cómputo de las celdas
del Spreadsheet.

El control del tamaño de la hoja de cálculo,


así como la visualización del contenido de
las celdas calculadas, exportables a la
definición de la función objetivo o de las
restricciones del proceso se puede observar
en la pantalla Parameters del Spreadsheet.

Volviendo a la pantalla Optimizer, en la


pestaña Functions se selecciona la celda
A6 como función objetivo y se elige
maximizar la misma (modificando el
valor por omisión de HYSYS:
Minimize).
Además de las cotas inferior y superior
de las variables de decisión (definidas
en la página Variables), hay
restricciones adicionales.
Las restricciones, originalmente en el
formato:
cota inferior Variable cota superior
se introducen como dos desigualdades:
Variable > cota inferior
Variable < cota superior

Por ejemplo: en B/F 0.05.


Para su formulación, como se ha indicado, primeramente se ha calculado el valor de B en la
celda C5, empleando para ello los valores importados de F, D, S1 y S2. Luego se ha calculado
la relación B/F en la celda C7 y la cota de la restricción (0.05), se ha incluido en la celda D6.
335
Simulación de procesos con HYSYS. Optimización de diagramas de flujo

En Functions se indica que el valor de la celda C7 (correspondiente a B/F), debe ser mayor
que el de la celda D6 (en este caso la constante 0.05). Análogamente se introducen todas las
demás cotas superiores en inferiores (de D/F, S1/F y S2/F) que constituyen las restricciones en
este problema. De esta forma, es posible introducir relaciones más complejas no lineales
como restricciones, refiriéndose al valor de las mismas que se calcula en la hoja de cálculo del
Optimizer.

Paso 3. En la página Parameters del


Optimizer, se seleccionan el algoritmo
de resolución (SQP en este caso), así
como los parámetros modificables del
mismo. El algoritmo SQP requiere el
cálculo de gradientes locales y los
parámetros ajustables Shift A y Shift B
indican en este caso que las
aproximaciones numéricas a los
gradiente se generan mediante
perturbaciones del 1 % de las variables
de decisión.

Paso 4. La optimización comienza


cuando se pulsa Start, en la parte
inferior derecha de la ventana, siendo
posible seguir el progreso del
algoritmo en la página Monitor.
Volviendo al Property View de la
columna se puede observar (Monitor)
que la optimización ha forzado la
relación de reflujo hacia su valor
máximo (10), y ha modificado
ligeramente el flujo de destilado, así
como los de las corrientes S1 y S2.

La solución a los balances de materia y


energía, como se muestra en el Workbook,
indica que la recuperación de todos los
componentes en las corrientes deseadas es
superior al 90 %, lo cual supone una mejora
significativa con respecto a la solución inicial,
tal y como también se puede visualizar con
los perfiles de composición de todos los
componentes de la mezcla.

336
Simulación de procesos con HYSYS. Optimización de diagramas de flujo

3. PROBLEMA ADICIONAL: OPTIMIZACIÓN DE LA


PRODUCCIÓN DE CLORURO DE ETILO

Una de las rutas para producir cloruro de etilo es mediante la reacción de HCl con etileno en
fase gas empleando un catalizador de cloruro de cobre soportado sobre sílice:
C2H4 + HCl → C2H5Cl
Como se muestra en el diagrama de flujo, la corriente de alimentación (100 kmol/h, 25 ºC y 1
atm) está compuesta de 50 % mol HCl, 48 % mol C2H4 y 2 % mol de N2. Dado que la
reacción alcanza sólo una conversión molar del 90 %, el cloruro de etilo producto se separa de
los reactivos sin reaccionar recirculando estos últimos. La separación se lleva a cabo usando
una columna de destilación, en la que se supone que la separación es perfecta. El proceso
opera a presión atmosférica, despreciando las pérdidas de carga. Para prevenir la acumulación
inertes, se retiran 10 kmol/h mediante una purga. Es interesante estudiar el efecto que tiene la
magnitud de la purga sobre la recirculación y la composición de la alimentación al reactor.
Pur ga

Columna
Aliment. de
destilación
REACTOR
CATALÍTICO Pr oducto
pur o

Lo que se pretende es maximizar los beneficios del proceso ajustando el flujo de purga. Para
estimar los costes se emplean las siguientes expresiones:
0.6
⎛ 330 x 24 ⎞
Coste equipos instalados: 500⎜ FR ⎟ €
⎝ 1000 ⎠
Coste de etileno: 1.5·10-3 €/kg
Coste de HCl: 1.0·10-3 €/kg
Producto de ventas del cloruro de etileno: 2.5·10-3 €/kg
Donde FR es el flujo de alimentación al reactor en kg/h.
Se supone un 10 % de ROI (equivalente a considerar que los gastos anuales por el
inmovilizado son un 10 % de la inversión inicial) y que la planta opera 330 días al año.
Con todos estos datos, la función a optimizar es
⎡ ⎛ 330 x 24 ⎞ 0.6 ⎤
FO = 330 * 24 *10 [2.5P − (1.5x Et + x HCl )F] − 0.1⎢500⎜
−3
FR ⎟ ⎥
⎢⎣ ⎝ 1000 ⎠ ⎥⎦

donde xEt y xHCl son las fracciones másicas de etileno y HCl en la alimentación,
respectivamente, y F y P son los flujos de alimentación y producto en kg/h.

337
Simulación de procesos con HYSYS. Optimización de diagramas de flujo

4. BIBLIOGRAFÍA

• Hyprotech “HYSYS user’s guide” (2001).


• Seider, W.D., Seader, J.D., Lewin, D.R., “Process Design Principles”, John Wiley & Sons,
Nueva York (1999)

338

Вам также может понравиться