Вы находитесь на странице: 1из 8

Clúster Computing

CURSO:
Sistemas Distribuidos

Trabajo de exposición 1
Clúster Computing

Integrantes:

x
x
x
x
x

Clúster Página 1
Clúster Computing

Introducción

El término clúster se aplica a los conjuntos o conglomerados de computadoras


construidos mediante la utilización de componentes de hardware comunes y que se
comportan como si fuesen una única computadora. Hoy en día desempeñan un papel
importante en la solución de problemas de las ciencias, las ingenierías y del comercio
moderno. La tecnología de clúster ha evolucionado en apoyo de actividades que van
desde aplicaciones de supe cómputo y software de misiones críticas, A continuación, se
detallara más información de clúster computing ¿Qué es ?, ¿para que sirve? Y ejemplo
sobre esta tecnología

Clúster

¿Que es el Clúster Computing?

El término clúster, (del inglés clúster, que significa “grupo” o “racimo”) es aplicado a
los conjuntos o conglomerados de computadoras interconectadas mediante una red de
alta velocidad y que se comportan como si fueran una única computadora. Son
usualmente empleados para mejorar el rendimiento por encima de la que es provista por
un solo computador típicamente siendo más económico que computadores individuales
de rapidez y disponibilidad comparables.

¿Como funciona el Clúster Computing?

Para que un clúster funcione de manera correcta, no es suficiente solo con interconectar
los ordenadores, sino que es necesario proveer un sistema de manejo del clúster, el cual
se encargara de interactuar con el usuario y los procesos que corren en él para optimizar
su funcionamiento. Esta tecnología permite a las organizaciones incrementar su
capacidad de procesamiento usando tecnología estándar, ya sea en componentes de
hardware como de software que pueden adquirirse a un bajo costo. Sin embargo, un
clúster necesita de varios componentes de software y hardware para poder funcionar:

- Nodos
- Almacenamiento
- Sistemas operativos
- Conexiones de red
- Middleware
- Protocolos de comunicación y servicios
- Aplicaciones

Clúster Página 2
Clúster Computing
¿Para qué sirven?

Los clústeres son un conjunto de computadoras que realizan tareas simultáneamente,


comparten trabajos reduciendo la carga que causan estas y tiene una mayor
disponibilidad por encima de la que es provista por un solo computador típicamente
siendo más económico para las empresas al evitar computadores individuales de rapidez
y disponibilidad comparables que son difíciles de reemplazar por uno nuevo

Tipos de clústeres

Los clústeres se pueden clasificar con base a sus características.


HIGH PERFOMANCE (HPC): Son Clústeres en los cuales se ejecutan tareas que
requieren una gran capacidad computacional (CPU), cantidades enormes de memoria
RAM y espacio de almacenamiento; Y están destinados a utilizar la computación
paralela para aplicar más fuerza del procesador a la solución de un problema.

HIGH AVAILABILITY (HA): Son clústeres cuyo objetivo es proveer disponibilidad


y confiabilidad con una cantidad mínima de tiempo de inactividad. Estos clústeres tratan
de brindar la máxima disponibilidad de los servicios que ofrecen. Operan mediante el
uso de software de alta disponibilidad para aprovechar las computadoras redundantes en
grupos o clústeres que proporcionan un servicio continuo cuando los componentes del
sistema fallan. Sin clústeres, si un servidor que ejecuta una aplicación en particular
falla, la aplicación no estará disponible hasta que se repare el servidor bloqueado. El
agrupamiento HA soluciona esta situación detectando fallas de hardware / software y
reiniciando inmediatamente la aplicación en otro sistema sin requerir intervención
administrativa, un proceso conocido como failover. Como parte de este proceso, el
software de clustering puede configurar el nodo antes de iniciar la aplicación en él.

HIGH THROUGHPUT (HTC): Son clústeres cuyo objetivo es ejecutar la mayor


cantidad de tareas en el menor tiempo posible. Sin embargo, el HTC no le preocupan las
operaciones por segundo, sino las operaciones por mes o por año. Por lo tanto, el campo
HTC está más interesado en cuántos trabajos se pueden completar durante un largo
período de tiempo en lugar de en qué tan rápido.

BALANCEO DE CARGA:
Clúster que permite que un conjunto de servidores comparta la carga de trabajo y de
tráfico a sus clientes que actúan como front-end, y que se ocupan de repartir las
peticiones de servicio que reciba el clúster, a otros ordenadores del clúster que forman
el back-end de éste. Un tipo concreto de clúster cuya función es repartir la carga de
proceso entre los nodos en lugar de los servicios es el clúster openMosix.

Clúster Página 3
Clúster Computing
Beneficios

María mercedes siniestra considera los siguientes beneficios:


- Disponibilidad: Capacidad para continuar operando ante la caída de alguno de
los ordenadores del clúster.
- Distribución en paralelo.
- Flexibilidad: Los balanceadores de carga no están amarrados a ninguna
arquitectura específica, en lo que respecta a hardware.
- Costos: El diseño y montaje requiere de inversiones sumamente bajas
comparadas con las alternativas de solución, las cuales son de un costo elevado.
- Escalabilidad: Capacidad para hacer frente a volúmenes de trabajo cada vez
mayores, prestando así un nivel de rendimiento óptimo.
- Expansibilidad: Capacidad de aumentar sus capacidades a través de mejores
técnicas.
- Transferencia de información y todo tipo de servicio por internet de forma
rápida, a bajo costo e ininterrumpidamente.
- Incremento de velocidad de procesamiento ofrecido por los clústeres de alto
rendimiento.
- Incremento del número de transacciones o velocidad de respuesta ofrecido por
los clústeres de balanceo de carga.
- Incremento de la confiabilidad y la robustez

Debido a que un clúster en un conjunto de computadoras que simulan una sola, cada
uno de los nodos son independientes por lo tanto tiene la capacidad de continuar
operando ante la caída de uno de ellos.
Un balanceador de carga es un componente de hardware o software que esta delante de
un conjunto de servidores y se encarga de distribuir y ordenar la carga de trabajo de lo
clientes, hace flexible porque no esta amarrados a ninguna arquitectura específica.
Desventajas

- Empresas y entidades prefieren seguir utilizando el modelo cliente/servidor


tradicional debido al espacio físico o a nuevos problemas que no se daban en la
arquitectura tradicional.
- Espacio físico para el montaje del clúster de balanceo de carga.
- Escalan mal para aplicaciones transaccionales (bases de datos, por ejemplo).

- La administración de muchas maquinas interconectadas implica una mayor


atención y conocimiento que la administración de una gran maquina con muchos
procesadores.
- No hay sistemas operativos distribuidos estables en el mercado que puedan
sumergir los conceptos de seguridad y escalabilidad en los Clusterings.
- No va a ser tan veloz como una 'supercomputadora de verdad', aunque tenga la
misma memoria y numero de procesadores similares, ya que en un clúster se
conectan las computadoras mediante switches de alta velocidad, pero una
supercomputadora conecta sus recursos de forma nativa.

Clúster Página 4
Clúster Computing
Ejemplo de Clúster computing

El clúster de Google (Sistema de Alta disponibilidad)

Requerimiento:
- Dar respuesta a miles de búsqueda por segundos
- Cada Búsqueda:

1. Lee cientos de MB de datos


2. Consume decenas de millones de ciclo de CPU

- Aplicación con alto grado de paralelismo

1. Diferentes búsquedas pueden realizarse en paralelo


2. Cada búsqueda admite paralelismo peticionando el espacio de búsqueda

Solución hardware:

- Varios clústeres de PCs geográficamente distribuidos


- Cada clúster de PCs se compone de:

1. Unos pocos miles de nodos


2. Nodos: CPUs de distintas generaciones, desde Intel Celeron a 533 MHz a Intel-
Pentium III dual a 1.4Ghz
3. Cada nodo con gran capacidad de almacenamiento § Organizados en racks de
40-80 servidores unidos mediante Fast-ethernet
4. Los racks se unen mediante Gigabit-Ethernet

PAPIA (Sistema paralelo de análisis de información de proteínas)

Requerimientos:

• Construir una infraestructura computacional para el análisis de moléculas de


proteínas y secuencias de ADN
1. Manejo de enormes bases de datos
2. Aplicaciones con alto grado de paralelismo

Solución hardware:

- Clúster compuesto de 64 nodos


- Cada nodo consta de:
1. Procesador dual Intel Pentium Pro 200Mz
2. 256 MB de RAM
4.1 GB de disco
- Red de interconexión: Myrinet + fast ethernet
- SO: NetBSD

Clúster Página 5
Clúster Computing
Otros ejemplos

Implementación

Por sus características especiales, hay varias cuestiones particulares asociadas a esta
tecnología que deben ser tenidas en cuenta, cuales son:
- Uno de los principales problemas a los que hay que hacerle frente cuando se
construye un clúster es buscar y eliminar los puntos de fallo únicos para que
no ocurra los incidentes que el servicio deje de funcionar de manera parcial o
total porque suele pasar que a mayor necesidad mayor debe ser la cantidad
de recursos tecnológicos disponibles en él. Es decir, si el servidor central
para repartir las tareas y este servidor cae, todo el clúster quedará inservible.

- Si se trata de un clúster de balanceo de carga o de alta disponibilidad, se


deben establecer garantías de que los servidores seguirán funcionando; pero
si estos servidores están conectados a una red corporativa o a internet
mediante una sola interfaz, un fallo en ella dejaría aislado al sistema.

- Es importante perseguir la redundancia para evitar que el fallo de un solo


componente hardware (recordemos que en un clúster van a integrarse gran
número de elementos con lo que la probabilidad de fallo crece) anule la
funcionalidad de todo el sistema.

- Mantener un clúster sobre una red Ethernet de 10 Mb, puede resultar una
buena decisión si el clúster sólo tiene unos cuantos nodos; pero en el
momento en que se inserten más nodos, la red se convertirá en un cuello de
botella que obligaría a los servidores a estar desocupados en espera de los
datos durante demasiado tiempo.

Clúster Página 6
Clúster Computing
Por otro lado, para que un clúster pueda funcionar de manera adecuada se debe tener los
elementos necesarios para la instalación de un clúster y estos son los principales:
- Un nodo activo, donde corren los servicios
- Un nodo pasivo que funciona como respaldo(Backup).
- Servidores reales.
- Software de administración.
- Protocolos de comunicación y servicios.
- Conexiones de red.
- Ambientes de programación paralela.
- Middleware.

Conclusión

En conclusión, un clúster es un grupo de múltiples ordenadores unidos mediante una red


de alta velocidad, e tal forma que el conjunto es visto como un único ordenador, más
potente que los comunes de escritorio. Sin embargo, cada computadora puede utilizarse
de forma independiente o separada.
En general, el contar con un clúster, abre las puertas hacia nuevas aplicaciones de
computadora, sin embargo, las característica y limitaciones que se han mencionados,
obligan a ejercer un juicio cuidadoso al momento de elegir un clúster como plataforma
para correr una aplicación determinada

Bibliografía
- Clúster de balanceo de carga y alta disponibilidad para servicios web y mail
(2012) Maria Mercedes Siniesterra, Tania Marcela Díaz Henao, Erik
Giancarlo Ruiz López.
- http://lecastillox.blogspot.pe/2009/02/armando-un-cluster.html

- María Mercedes Sinisterra, Tania Marcela Díaz Henao, Erik Giancarlo Ruiz
López. (2012). Clúster de balanceo de carga y alta disponibilidad para
servicios web y mail [archivo PDF]. Recuperado de
https://es.scribd.com/document/325164344/Dialnet-
ClusterDeBalanceoDeCargaYAltaDisponibilidadParaSer-4364562-pdf.
- Clúster (informática). (s.f.). En Wikipedia. Recuperado el 30 de marzo de
2018 de
https://es.wikipedia.org/wiki/Cl%C3%BAster_(inform%C3%A1tica)

- Balance de carga. (s.f.). En Wikipedia. Recuperado el 30 de marzo de 2018


de https://es.wikipedia.org/wiki/Balance_de_carga

- High-availability cluster. (s.f.). En Wikipedia. Recuperado el 30 de marzo de


2018 de https://en.wikipedia.org/wiki/High-availability_cluster

- High-throughput computing. (s.f.). En Wikipedia. Recuperado el 30 de


marzo de 2018 de https://en.wikipedia.org/wiki/High-throughput_computing

Clúster Página 7
Clúster Computing
- Varios Autores. (2006). Cluster Computing: High-Performance, High-
Availability, and High-Throughput Processing on a Network of Computers
[archivo PDF]. Recuperado de
https://www.researchgate.net/publication/226533607_Cluster_Computing_H
igh-Performance_High-Availability_and_High-
Throughput_Processing_on_a_Network_of_Computers.

Clúster Página 8

Вам также может понравиться