Академический Документы
Профессиональный Документы
Культура Документы
Responsable:
Resumen
Gran parte de los problemas complejos y críticos a que se enfrenta la ingeniería ambiental, tienen
que ver con las limitaciones en el poder de procesamiento de las computadoras que son utilizadas
para darle solución a dichos problemas. Un clúster, ha sido una herramienta de cómputo que
desde hace algunos años ha dado solución a estas limitaciones. Sin embargo, debido a los costos
tan altos y diseño complejo que tienen, muy pocas instituciones públicas y privadas a nivel
mundial se pueden dar el lujo de contar con tal herramienta.
Introducción
Un clúster básicamente suma los esfuerzos realizados de cada computadora del conjunto para la
solución de un único problema, y que finalmente es visto como si fuera un solo computador ya
que comparten sus recursos y al final, el poder de procesamiento se ve incrementado a diferencia
de que si lo hicieran de forma individual.
Los clúster son usados para la solución de problemas que requieren de cómputo de alto
rendimiento, cómputo de alta disponibilidad y tolerante a fallos. Generalmente los problemas a
resolver se basan en el gran número de operaciones de punto flotante (FLOPS) y que además son
candidatos a resolver mediante la aplicación de técnicas de cómputo paralelo.
Muchos de los cálculos complejos y críticos a que se enfrenta la ingeniería ambiental hoy día como
por ejemplo en investigaciones del cambio climático, pueden ser implementados en un cluster,
para de esta forma, disminuir tiempos de procesamiento y aumentar la exactitud y certeza de los
resultados.
Antecedentes
Los clusters así como las supercomputadoras han sido la evolución de una computadora y
nacieron debido al alto requerimiento del poder de cómputo necesario para la solución de
problemas cada vez más complejos y acotados en tiempo. Un cluster no centralizado como lo
conocemos actualmente, es usado prácticamente desde que se creó la primera red de
computadoras en el año 1969, a través del proyecto ARPANET.
Más adelante y con la creación de sistemas operativos colaborativos basados en red como UNIX y
VAX/VMS, es cuando se empieza a pensar en ejecutar los programas en ambientes distribuidos y
por lo tanto, en el desarrollo de la computación paralela.
Las ventajas del cómputo paralelo, aunado a la distribución y el hecho de compartir los recursos
de archivos, memoria y dispositivos periféricos, dieron a los clusters una ventaja en la ejecución
de tareas que requieren gran capacidad computacional, grandes cantidades de memoria y alta
disponibilidad de los recursos, como aquellos utilizados en la investigación científica.
En México son muy pocos los clusters orientados a investigación científica, uno de los más
potentes, se encuentra en el CINVESTAV-IPN, el cual cuenta con 4 704 núcleos en CPU y 374,144
en GPU. 11,032 GB en RAM, 60 TB de almacenamiento que resulta en una capacidad de
procesamiento de 250 teraflops.
Objetivo General
Desarrollar un cluster de micro-computadoras del tipo Raspberry Pi, así como el software
asociado para su funcionamiento en la ejecución de tareas móviles de procesamiento paralelo y de
alto rendimiento en el estudio de la contaminación ambiental por monóxido de carbono.
Objetivos específicos
Marco teórico
Un cluster ha servido desde los años 90 a dar solución en grandes temas de investigación en la
ciencia, como lo son la astronomía o el estudio del universo por ejemplo. El impacto de los
resultados obtenidos en estas máquinas, han sido de gran relevancia para el desarrollo humano y
el desarrollo tecnológico.
Por ejemplo con la modelación matemática de un evento natural, como lo es el cambio climático,
se puede llegar a predicciones más certeras acerca del clima en nuestros días. Esto no hubiese sido
posible o al menos en tiempos más cortos, si estos modelos matemáticos no se hubieran resuelto
con el potencial de procesamiento de un cluster.
Las instituciones públicas y privadas, tienen en su lista de deseos, la posible solución a una
variedad de problemas de la vida diaria que pudieran ser resueltas con el modelado matemático,
como por ejemplo, el problema de la contaminación ambiental en la CDMX y después, estos
modelos someterlos a pruebas de estrés, simulación de entradas (inputs) que pudieran ser
emulación de factores ambientales de la vida real, simular salidas (outputs) que reflejarían
resultados previos que servirían de retroalimentación del modelo mismo, etc. Todo lo anterior, sin
necesidad de tener el modelo real del objeto de estudio.
Los cluster, no son máquinas que se encuentren en cada laboratorio de investigación, al menos no
hasta ahora. Por lo tanto, el acceso a los mismos, se ve acotado por la falta de recursos y
finalmente los resultados de las investigaciones se ven desplazadas en tiempo y el desarrollo
tecnológico, muchas veces, se ve truncado.
Existen esfuerzos como los de la fundación Rasberry Pi, para el desarrollo de minicluster basados
en su tecnología. Uno de ellos, es el desarrollado por la compañía Idein, que ha logrado una placa
base para un cluster llamado PiZero Cluster, en donde se ven inmersos 16 minicomputadoras
Rasberry Pi Zero. Sin embargo, el desarrollo ha sido orientado a la solución en particular de la
obtención y análisis posterior de datos de diferentes sensores como de audio, video e iluminación.
Empresas como Idein, han visto un potencial en el desarrollo de clusters de bajo costo para lo cual
se encuentran trabajando actualmente.
Impacto o beneficio
El presente proyecto generará un impacto significativo, tanto en las líneas de investigación que se
llevan actualmente en el Instituto Tecnológico de Tlalpan y el TecNM, como son: la relacionada al
estudio de la contaminación ambiental y cambio climático, la cual tiene gran relevancia, dado que
es uno de los temas más importantes que afectan a la salud pública en las grandes urbes como la
Ciudad de México. También podrá ser de gran beneficio en las investigaciones realizadas en otras
instituciones como pueden ser la UNAM, IPN e IMP.
También, puede llegar a ser de gran relevancia en Investigación aplicada que lleven a cabo
instituciones privadas y en la industria. Por dos razones principalmente la primera: los costos
inherentes al equipamiento de un clúster, que comercialmente es muy alto y los costos de
mantenimiento y gasto en el consumo de energía eléctrica; con este proyecto estos costos se
reducirían significativamente, ayudando a las diferentes instituciones a reorientar los subsidios
económicos a otras áreas de la investigación que lo necesiten. La segunda razón tiene que ver con
los tiempos de espera por parte de las investigaciones que requieren de estos clúster (espera para
las ventanas de tiempo dedicadas), que suelen ser muy grande y en ocasiones, imposible de
acceder a estas ventanas de tiempo para aprovechar de estos equipos de hardware y software.
Con este proyecto, se podría dar el caso de que, cada líder investigador o línea de investigación,
pudiera tener su propio clúster, que redundaría en menos tiempo de espera para los resultados
esperados y por lo tanto mejor aprovechamiento de los recursos así como mayor y más rápido
impacto en el desarrollo tecnológico.
Metodología
Vinculación
Referencias