Un Data Center es, tal y como su nombre indica, un centro de datos o Centro
de Proceso de Datos (CPD). Esta definicin engloba las dependencias y los
sistemas asociados gracias a los cuales:
Los datos son almacenados, tratados y distribuidos al personal o procesos autorizados para consultarlos y/o modificarlos. Los servidores en los que se albergan estos datos se mantienen en un entorno de funcionamiento ptimo.
Los primeros Data Centers se disearon siguiendo las arquitecturas clsicas de informtica de red, en las que los equipos eran apilables en mesas, armarios o racks.
La necesidad de fcil gestin y de optimizacin del espacio han hecho que se evolucione hacia sistemas basados en equipos cuyas dimensiones permiten aprovechar al mximo el volumen disponible en los racks (equipos enracables), logrando una alta densidad de equipos por unidad de espacio.
Un Datacenter fsico puede alojar Datacenters virtuales, cuyo coste es menor gracias a la virtualizacin. Cada Centro de Datos virtual es independiente del resto y dispone de mximas garantas de seguridad, disponibilidad y flexibilidad.
Los Data Center iniciales tampoco estaban diseados para proporcionar facilidades de red avanzadas, ni los requerimientos mnimos de ancho de banda y velocidad de las arquitecturas actuales. La rpida evolucin de Internet y la necesidad de estar conectados en todo momento han obligado a las empresas a requerir un alto nivel de fiabilidad y seguridad, de tal forma que se proteja la informacin corporativa y est disponible sin interrupciones o degradacin del acceso, con el objetivo de no poner en peligro sus negocios, sean del tamao que sean. El cumplimiento de estos requisitos, cada da ms demandados, es posible dentro de un Data Center. Igual que un banco es el mejor sitio para guardar y gestionar el dinero, un centro de datos lo es para albergar los equipos y sistemas de informacin.
Los datos almacenados, no son datos estticos, estn en constante movimiento, se interrelacionan unos con otros y dan como resultado nuevos datos. Su crecimiento es constante y ello implica no solo que deben estar protegidos mediante las medidas de seguridad adecuadas, sino tambin dotados de estupendos motores que les permitan moverse gilmente por las autopistas de la informacin.
El crecimiento exponencial del nmero de usuarios de los servicios online ha llevado a las empresas a subcontratar la gestin, mantenimiento y administracin de sus equipos informticos y de comunicaciones en los Data Center. Esto les permite centrarse en el desarrollo de su propio negocio y olvidarse de complejidades tecnolgicas derivadas de las caractersticas anteriormente comentadas, as como prestar el servicio sin la necesidad de realizar una inversin elevada en equipamiento dedicado a este fin.
Recuperacin de Desastres en el Data Center
Desarrollar un plan de recuperacin tiene como objetivo regresar a la operativa del negocio al mismo nivel en el que estaba antes de la catstrofe. Si su negocio es tomar pedidos por medio de una lnea telefnica y continuar con la entrega de productos, el esfuerzo de recuperacin debera estar dirigido hacia el restablecimiento de la operacin telefnica y la conexin del personal a los sistemas de procesamiento informtico y telefnico, lo cual permitir que continen los envos.
El plan final podr incluir una instalacin redundante en otro sitio remoto que tenga acceso a los datos obtenidos de las copias de seguridad. Si la operacin no es tan crtica o la instalacin redundante no ha sido considerada por razones presupuestarias, es imprescindible un buen plan de recuperacin.
Un Data Center de respaldo consiste en un sitio de contingencia que reemplazar al de produccin solo con las aplicaciones definidas como crticas para el BCP (Business Continuity Plan). A continuacin se describen las caractersticas de los cuatro tipos de Data Centers que se pueden utilizar para el diseo de un plan de recuperacin de desastres:
Data Center de contingencia estndar: Consiste en disponer de un espacio fsico vaco con la capacidad de contener y soportar las aplicaciones pertenecientes al grupo de DR; preparado con la estructura elctrica y de refrigeracin mnima para cubrir la contingencia de esos equipos. Se debe considerar con la posibilidad de que los equipos se demoren en conseguir en la zona, por ejemplo, Firewalls (cortafuegos) o algn reemplazo similar. Este mtodo tiene un costo bajo, salvo por el desaprovechamiento del espacio, pero los tiempos de restauracin son muy lentos (de das a semanas), ya que se debe conseguir el equipamiento, armar la infraestructura, luego instalar las aplicaciones; y finalmente, restaurar los datos de las cintas.
Data Center en la nube: Utiliza los servicios ofrecidos por los proveedores basados en Internet o a travs de un enlace punto a punto por medio de un proveedor que ofrezca una conexin privada. Los costos son menores y la velocidad de instalacin de los nuevos servidores es muy rpida, estn basados en mquinas virtuales, pero lo que demandar ms tiempo ser la restauracin de los datos, porque las cintas de contingencia deben ser enviadas hacia el proveedor, tambin habr que restaurar las aplicaciones; y luego, restaurar los datos.
Data Center asincrnico (mirror off-line): Consiste en tener otro Data Center duplicado en una ubicacin remota en donde se replican todos los servidores crticos de manera asincrnica. Esto puede realizarse en un sitio privado o contratado por a algn proveedor, pero con la salvedad de que los datos de esas aplicaciones crticas se copian al Data Center de contingencia de manera automtica fuera del horario de operatoria diaria; por ejemplo, por las noches, mediante diversas herramientas. Tiene un costo alto, ya que todos los servidores estn disponibles, pero slo se utiliza la red dedicada para la transferencia de datos al Data Center de respaldo cuando no afecta las operaciones en horario central; por lo cual, en caso de desastre, el tiempo de recuperacin es menor a un da. Generalmente este servicio es empleado por empresas que procesan sus operaciones ms importantes en servidores Mainframe, del rubro bancario, por ejemplo, ya que en caso de desastre no pueden quedarse sin operar, y tener un Mainframe de respaldo resulta imprctico debido a su altsimo costo, pudiendo costar varios millones de dlares solo un Mainframe.
Data Center sincrnico (mirror on- line): Llamado espejado o (mirroring), es una estrategia donde en el Data Center de respaldo propio o rentado a algn proveedor replica todos los datos de la aplicaciones crticas, tomndolos desde el Data Center de produccin, de modo constante en tiempo real, copiando bloque a bloque; de manera tal, que si ocurre un desastre, la recuperacin es instantnea, pudiendo tomar tan solo algunos minutos. Es la estrategia ms rpida y costosa, ya que requiere tener todos los servidores duplicados y exige tener un gran ancho de banda disponible solo para la copia de los datos en tiempo real. Por lo que los costos en infraestructura de red son altos, adems del mantenimiento e la implementacin del software encargado de hacer que esa replicacin funcione: Softek de IBM, Stream de Oracle, u otras soluciones provistas por los fabricantes de la SAN. Est claro que este tipo de soluciones estn reservadas para empresas grandes que manejan presupuestos de infraestructura millonarios y no pueden sufrir interrupciones en la operatoria de sus servicios debido a sus altsimos costos.
Importante: Si se elige una estrategia sincrnica es fundamental que dicho proceso sea monitoreado constantemente a fin de corregir los desvos, ya que de nada sirve una inversin tan grande para luego tener problemas de inconsistencia de datos por problemas de sincronismo.
Ambas estrategias, asincrnicas o sincrnicas son vlidas mientras sean adecuadas entre el balance de costo y tiempo de RTO (Recovery Time Objective), adecuando el tipo de mtodo de replicacin elegido, ya sea por SAN, por red o a nivel de servidores o de base de datos, ya que los tiempos de recuperacin de datos por medio de las cintas magnticas son lentos para las necesidades de negocio de muchas empresas.
Los fabricantes de SAN como EMC, IBM, HP, Hitachi o Dell, entre otros ofrecen soluciones de replicacin que se ajustan a cualquiera de los dos tipos. Tambin para replicacin por red a nivel de sistema operativo o replicacin por red con productos que optimizan el trfico de manera segura y eficiente.
Para decidir cul va a ser la metodologa elegida para el Data Center de contingencia, se debern analizar los costos por las prdidas y los costos por la implementacin de la solucin, adems de la variacin en horas por cada tipo de solucin sobre la base de la complejidad de las aplicaciones que se restaurarn.
Clculo del costo de las interrupciones en el Data Center
Una de las funciones bsicas de un Data Center bien diseado es eliminar los riesgos potenciales que causaran prdidas de gran magnitud, y minimizar el impacto de los eventos no evitables, como las catstrofes naturales. Pero la pregunta es: Sabemos medir econmicamente el impacto en la interrupcin o degradacin de servicios de nuestro Data Center?
Esta es una pregunta que debemos tener en cuenta desde la etapa de diseo hasta el fin de ciclo de vida.
Es altamente recomendable tener una estimacin monetaria de cuanto cuesta por hora la indisponibilidad de una aplicacin o un servidor en particular, ya que nos puede ayudar a buscar un nuevo diseo de solucin cuando sea necesario y la variable econmica se torne fundamental a la hora de convencer a los ejecutivos, en caso de que se requiera una inversin adicional para dicha solucin. Existen tres tipos de costos que deben tenerse en consideracin:
Costos de Oportunidad: representa a todas aquellas utilidades que se perdieron de ganar por indisponibilidad. No poder vender en ese momento, o aun peor: el cliente se va a la competencia (no solo se pierde la venta, sino el cliente).
Costos Directos: son los que influyen directamente en las finanzas de la empresa, por eso son ms fciles de medir como :
Empleados esperando para poder trabajar o prdida de transacciones y operaciones. Tiempo de recuperacin de servicio. Tiempo de testeo post recuperacin. Demandas legales por incumplimiento de obligaciones.
Costos Indirectos: son los costos asociados a posibles situaciones de las cuales no se tiene un gran nivel de certeza, pero se sabe que existen. Por eso son mucho ms difciles de medir, pero impactan en el negocio de la misma manera:
Disminucin del grado de satisfaccin del cliente. Prdida de clientes Daos a la imagen de la compaa
El clculo del costo de la interrupcin debe incluir las variables negativas que impactan en todos los aspectos anteriormente mencionados, ya sea que se calcula por servidor o por aplicacin.
Costo =P * A * E * H
P = Nmero de personas afectadas A = Porcentaje medio de cuanto fueron afectados en sus tareas E = Costo promedio de la hora del personal afectado H = Cantidad de horas de interrupcin
El valor ms difcil de calcular es sin duda el costo promedio por hora de interrupcin. Es importante aclarar que no se est considerando el costo potencial de las acciones que derivaran de la interrupcin. Por ejemplo: costo por transaccin perdida, potencial prdida de clientes, prdida de imagen corporativa, demandas legales, etctera.
El dao a la imagen de la marca es la prdida ms difcil de cuantificar econmicamente, ya que no existe una frmula; se pueden hacer estimaciones, pero siempre con un ndice de confiabilidad bajo.
Cul es la Humedad Correcta de un Data Center?
La humedad es la amenaza menos visible a los equipos dentro de un Data Center. Incluso hasta algunas personas llegan a omitirla dentro de sus consideraciones al momento de monitorear.
La humedad ambiental es la cantidad de vapor de agua presente en el aire. Se puede expresar de dos formas: mediante la humedad absoluta, y de forma relativa o grado de humedad (tambin conocido por las siglas HR). La humedad relativa es la relacin porcentual entre la cantidad de vapor de agua real que contiene el aire y la que necesitara contener para saturarse a la misma temperatura. Por ejemplo, una humedad relativa del 60% quiere decir que de la totalidad de vapor de agua (el 100%) que podra contener el aire a esta temperatura, solo tiene el 60% de vapor.
Otro trmino importante es el punto de condensacin o punto de roco, representado por la temperatura a la cual el agua que est en el aire cambia de estado de gaseoso a lquido, es decir, cuando la HR = 100%. Entonces, el aire se considera saturado.
A medida que aumenta la temperatura del aire, aumenta la capacidad para retener agua, lo cual es otro buen motivo para mantener la temperatura controlada. Esto es un efecto secundario del consumo de aire fro por parte de los equipos informticos. Cuando el aire fro pasa desde el frente de los servidores, sale con mayor temperatura y con mayor capacidad de retener agua.
Cmo cambia el aire cuando circula por dentro del servidor para mantener los componentes a una temperatura regulada?
El aire que ingresa por el frente del servidor para refrigerarlo tiene propiedades distintas cuando sale por la parte trasera. A mayor temperatura, menor HR e igual punto de condensacin. Supongamos que por el frente del servidor ingresa el aire a 22C, probablemente a la salida del equipo la temperatura sea aproximadamente 37C. As mismo la humedad relativa disminuye de 50% a 22% y el punto de condensacin se mantiene igual a 12C
Existen dos posibles amenazas relacionadas con la humedad relativa dentro del Data Center:
Descargas electroestticas: las posibilidades de descargas electroestticas, tambin conocidas como ESD (electrostatic discharge) se producen cuando la humedad baja. Asimismo, esas posibilidades aumentan an ms si la temperatura es baja. Las descargas electroestticas pueden ser apenas perceptibles para las personas, pero no causan ningn tipo de dao. En cambio, una descarga de 10 Volts, ya es capaz de daar un equipo.
Corrosin: ocurre cuando un elemento metlico es expuesto al agua, ya sea porque se moja o se generan pequeas gotas causadas por la condensacin de agua en el aire. Por ejemplo; en un ambiente con una humedad alta. Los elementos dentro de los servidores se pueden daar y sufrir una prdida de datos.
La clave es encontrar un equilibrio justo para tener lograr tener la humedad en un rango ptimo donde se eviten las descargas estticas y de condensacin. Por ello, el rango ms adecuado de humedad es entre el 40% y el 55% (tambin es el rango recomendado por la norma TIA/EIA 942)
Por arriba del 55% podra haber sntomas de corrosin, y por debajo del 40% comenzaran a aumentar los riesgos de descargas estticas.
En el mercado existen distintos tipos de soluciones para controlar la humedad del ambiente dentro del Data Center, como por ejemplo instalar humificadores: que son dispositivos que tiene sensores, los cuales envan seales para comenzar a funcionar cuando el umbral para el cual estn configurados es alcanzado.
Como medida adicional de proteccin se pueden instalar supresores de sobretensiones transitorias o TVSS (Transient Voltage Surge Supressors) definidos por las normas elctricas internacionales con el fin de proteger las instalaciones elctricas de incrementos o picos de voltaje generados por fenmenos de carcter transitorios (lapso muy reducido de tiempo). Estos fenmenos inesperados pueden causar serios problemas en las instalaciones y en los equipos sensibles. Por esta razn, su importancia clave dentro del sistema de protecciones.
La sobrecarga puede tener dos fuentes de origen:
Interno: asociados con las sobretensiones relacionadas con maniobra y conmutacin entre circuitos dentro de la propia instalacin. Externo: causado principalmente por descargas elctricas provenientes de la atmsfera como pueden ser los rayos.
En 2011 el primer Data Center de Facebook ubicado en Prineville, Oregon (EEUU) sufri un incidente a causa de sus sistemas de refrigeracin donde la humedad relativa super el 95%, generando condensacin de agua sobre los equipos que generaron reinicios no programados a los servidores por problemas elctricos.
Clculo de refrigeracin. En la actualidad, esta etapa es uno de los pasos ms complejos y delicados de disear. Equipos con elevados consumos de energa, gran disipacin de calor, horas pico de procesamiento y dificultades de instalacin de los sistemas termomecnicos son algunos de los desafos con los que nos cruzamos durante el diseo.
Tenemos diversas topologas para refrigerar un centro de cmputos, dentro de las cuales se destacan los sistemas de refrigeracin perimetral que inyectan aire por debajo del piso tcnico, los de refrigeracin por hilera que extraen el calor de los pasillos calientes e inyectan frio por delante de los racks, los de enfriamiento por rack que inyectan el aire frio desde la parte superior del rack, o los sistemas que simplemente prevn la inyeccin de aire frio en toda la sala. Lo importante es poder armar un sistema flexible y escalable que permita refrigerar las necesidades actuales y soportar las posibles exigencias a futuro. Deberemos tambin establecer el nivel de redundancia deseado, si ser agregando equipamiento de backup para la inyeccin de aire bajo piso, o logrando una redundancia N+1 en las filas ms crticas del datacenter si optamos por una refrigeracin por hilera.
El mayor consejo que podemos dar es el de armar distintas zonas dentro del data center, ya sea que armemos un centro de datos con varias hileras o por el contrario en una sola fila, deberamos prever zonas para alta densidad donde podamos instalar un consumos de 7Kw o superiores y otras con 2Kw o 3Kw de consumo por rack, como por ejemplo para comunicaciones. Los sistemas de refrigeracin son los que se llevan la mayor parte del consumo elctrico de un data center, como se ve en el grfico 1, diversos estudios afirman que el 38% del consumo elctrico del data center es consumido por el sistema de refrigeracin, basndonos en este dato resulta relevante el tipo de tecnologa que seleccionemos para refrigerar, ya que nos encontramos frente al principal tem en donde podemos realizar la optimizacin del ahorra de energa. Una vez seleccionada la topologa de refrigeracin debemos elegir con que tecnologa refrigeraremos, hay varios mtodos, hoy aqu solo mencionaremos el de expansin directa y el de chilled water, que son los ms aplicables a nuestro mercado latinoamericano.
Sistema de agua enfriada
De ambas alternativas, la ms utilizada en la actualidad es la de expansin directa que presenta ventajas de instalacin con respecto al sistema de chilled water. La decisin de eleccin de un sistema u otro depender mucho de la proyeccin de crecimiento del consumo de energa, para los centros de datos con consumos de energa elevados es recomendable la instalacin de sistemas de chilled water, ya que en el tiempo termina siendo ms eficiente y econmica la refrigeracin por agua helada. Aqu deberemos vencer el mito de agua en el data center, que logrando instalaciones profesionales, seguras y bien diseadas no debera generar ningn inconveniente adicional la adopcin de este sistema. Por ltimo, debemos asegurarnos que los sistemas de refrigeracin contemplen un control permanente de la temperatura y humedad del ambiente y tengan incorporado ventiladores de velocidad variable que inyecten frio y flujo de aire de acuerdo a las necesidades que se plantean a lo largo del da. Este mtodo nos permitir optimizar el consumo de energa.
Mapa trmico de un centro de datos
UPS Giratoria (Flywheel UPS): un Nuevo Paradigma
La UPS giratoria es un sistema que asegura la continuidad del suministro elctrico basado en un concepto antiguo, que consiste en transformar la energa cintica en energa elctrica. Este dispositivo conlleva a un cambio paradigma para la mayora de los Data Centers para los cuales una UPS tiene que tener bateras s o s.
Si a usted le preguntaran en qu pas se invent el reloj digital de cuarzo, probablemente dir que fue en Japn, pero la respuesta es incorrecta. En el ao 1968 Suiza controlaba el 90% del mercado mundial de relojes. Un da un tcnico de una de las mayores empresas de relojera mostr a sus jefes un nuevo modelo que acababa de inventar. Se trataba de un reloj electrnico de cuarzo. Su superior observ el prototipo y le dijo: Esto no es un reloj, y no dio ninguna importancia al descubrimiento, ya que no posea cuerda, mecanismos ni engranajes. Le permitieron quedarse con la patente e incluso ir con el invento a una feria de relojera. Pasaron los japoneses y compraron. Poco tiempo despus pusieron a la venta el reloj de cuarzo. Para el ao 1982, el 90% del mercado que controlaban los suizos, se redujo al 15%. Perdieron el liderazgo y cincuenta mil puestos de trabajo por culpa de la nueva tecnologa, inventada por un suizo!
La UPS giratoria (tambin llamada o UPS rotativa o Flywheel UPS) funciona haciendo mover una rueda metlica muy pesada (de 300 kg o ms) por medio de la energa elctrica provista por la red, hacindola girar a gran rapidez (entre 33000 y 77000 RPM segn el fabricante), y por medio de la levitacin electromagntica al vaco no entra en contacto con otros elementos, evitando as el rozamiento que frenara la rueda. La inercia generada le permite rotar a gran velocidad durante un tiempo prolongado ya que no hay friccin. As ese movimiento de energa cintica acumulada, entregar corriente elctrica cuando se interrumpa el suministro de red. Si el suministro elctrico se detiene, la rueda de gran masa que est girando a muchas revoluciones es capaz de proporcionar suficiente energa al Data Center durante unos segundos (entre 15 y 60 segn la configuracin).
La mayora de la gente tiende a apegarse a la antigua tendencia de que una UPS debe tener la capacidad suministrar energa por al menos 15 minutos en caso de interrupcin. Lo cierto es que este es un pre concepto heredado de los servidores Mainframe, cuyos procesos de apagado controlado demoraba ese tiempo, pero hoy en da apagar cualquier equipo actual demora mucho menos tiempo, y ms an si la instalacin cuenta con generador.
Actualmente los generadores modernos son capaces de proveer energa estabilizada entre 2 a 10 segundos desde que se detecta la interrupcin. Qu sentido tiene tener una UPS con bateras que permite operar por 15 minutos cuando el generador entrega energa estabilizada solo en 5 segundos?
A continuacin se detallan las principales ventajas y desventajas de las UPS giratorias en comparacin las UPS tradicionales de batera.
Ventajas
Vida til mayor a 20 aos Es ms econmica, teniendo en cuenta el costo a lo largo de la vida til si se la compara con la UPS tradicional. Se estima un retorno de la inversin en aproximadamente tres aos. No utiliza bateras, produciendo grandes ahorros de energa, contaminacin, enfriamiento, reemplazo y mantenimiento (slo utiliza una pequea batera para el arranque). Ocupa menor superficie (por ejemplo, una UPS de 300 kVA ocupa solo 25% del espacio de una UPS de Conversin Doble, aunque puede llegar a pesar 2500 kg) Su eficiencia oscila entre el 95% y el 98% (las UPS de batera tiene en promedio una eficiencia del 92%) Su tiempo de carga es bajo: entre tres y ocho minutos, comparado con la UPS tradicional que puede llegar a tardar entre ocho y diez horas para completar la carga. La operatoria es silenciosa (entre 45 y 70 decibeles a un metro de distancia). Tiene una mayor amplitud trmica operacional (comparada con la UPS de batera) Genera poca temperatura. Por ejemplo: una UPS de 300 kVA de 1.5 x 0.8 m y una altura menor a 2 m genera entre 5 kW/h y 7 kW/h de calor. Las mediciones de la capacidad de la carga brindan datos ms certeros comparados con la UPS de bateras. MTBF: >50000 horas (las bateras de las UPS tiene un MTBF: <2200 horas)
Desventajas
Su inversin inicial es elevada. Tiene poco tiempo de energa de resguardo, lo que genera una mayor dependencia del generador