Вы находитесь на странице: 1из 7

1.

10 Recuperacin de Desastres
Introduccin
Como experimento, la prxima vez que est en su centro de datos, mire a su
alrededor e imagine por un momento que no hay nada. Y no solamente los
computadores. Imagnese que el edificio completo ya no existe. Luego, imagine
que su trabajo es recuperar la mayor cantidad de trabajo realizado posible en
el centro de datos, lo ms pronto posible. Qu hara?
Qu es un Centro de Datos?
Al pensar desde esta perspectiva, usted est dando su primer paso hacia la
recuperacin de desastres. La recuperacin de desastres es la habilidad de
recuperarse de un evento que impacta el funcionamiento del centro de datos
de su organizacin lo ms rpido y completo posible. El tipo de desastre puede
variar, pero el objetivo final es siempre el mismo.
Los pasos relacionados con la recuperacin a partir de un desastre son
numerosos y con un rango bien amplio. A continuacin se muestra una
descripcin general a un nivel alto del proceso, junto con los puntos claves a
tener en mente.

Creacin, Evaluacin e Implementacin de un Plan de Recuperacin de


Desastres
Creacin
Un sitio de respaldo es vital, sin embargo es intil sin un plan de recuperacin
de desastres. Un plan de recuperacin de desastres indica cada faceta del
proceso de recuperacin, incluyendo (pero no limitado) a:

Los eventos que denotan posibles desastres

Las personas en la organizacin que tienen la autoridad para declarar un


desastre y por ende, colocar el plan en efecto

La secuencia de eventos necesaria para preparar el sitio de respaldo una


vez que se ha declarado un desastre

Sitios de respaldo: fro, templado y caliente


Uno de los aspectos ms importantes del plan de recuperacin de desastres es
tener una ubicacin desde la cual este puede ser ejecutado. Esta ubicacin se
conoce como sitio de respaldo. En el evento de un desastre, el sitio de respaldo
es donde se recrear su centro de datos y desde donde usted operar, durante
el mismo.
Hay tres tipos diferentes de sitios de respaldo:

Sitios de respaldo frios

Sitios de respaldo templado

Sitios de respaldo calientes

Obviamente estos trminos no se refieren a la temperatura del sitio de


respaldo. Se refieren en realidad al esfuerzo requerido para comenzar las
operaciones en el sitio de respaldo en el evento de un desastre.
Un sitio de respaldo fro es simplemente un espacio en un edificio configurado
apropiadamente. Todo lo que se necesite para restaurar el servicio a sus
usuarios se debe conseguir y entregar a este sitio antes de comenzar el
proceso de recuperacin. Como se puede imaginar, el retraso de ir desde un
sitio fro a uno en operacin completa puede ser sustancial.
Los sitios de respaldo fro son los menos costosos.
Un sitio tibio ya est equipado con el hardware representando una
representacin fiel de lo encontrado en su centro de datos. Para restaurar el
servicio, se deben despachar los ltimos respaldos desde sus instalaciones de
almacenamiento fuera del sitio y completar un restauracin a metal pelado,
antes de que pueda comenzar el trabajo real de recuperacin.
Los sitios de respaldo calientes tienen una imagen espejo virtual de su centro
de datos, con todos los sistemas configurados y esperando solamente por los
ltimos respaldos de los datos de sus usuarios desde las facilidades de
almacenamiento fuera del sitio. Como se puede imaginar, un sitio de respaldo
caliente se puede poner en funcionamiento completo en unas pocas horas.
Un sitio de respaldo caliente comprende el enfoque ms costoso para una
recuperacin de desastres.
Los sitios de respaldo pueden provenir de tres fuentes diferentes:

Compaas especializadas en suministrar servicios de recuperacin de


desastres

Otras ubicaciones que pertenecen y son operadas por la organizacin

Un acuerdo mutuo con otra organizacin para compartir las facilidades


del centro de datos en el evento de un desastre

Disponibilidad del Hardware y Software


Su plan de recuperacin de desastres debe incluir mtodos para conseguir el
hardware y software necesarios para las operaciones en el sitio de respaldo. Un
sitio de respaldo manejado profesionalmente quizs ya tenga todo lo que usted
necesita (o quizs tenga que organizar la adquisicin y entrega de materiales
especializados que el sitio no tiene disponibles); por otro lado, un sitio de
respaldo fro implica que se tienen identificadas las fuentes para cada tem
requerido. A menudo las organizaciones trabajan directamente con los
fabricantes para establecer acuerdos para la entrega inmediata de hardware
y/o software en el evento de un desastre.

Conectividad de red al sitio de respaldo


Un centro de datos no es de mucha ayuda si se encuentra desconectado del
resto de la organizacin que est sirviendo. Dependiendo del plan de
recuperacin de desastres y de la naturaleza del mismo, su comunidad de
usuarios puede estar ubicada a kilmetros de distancia del sitio de respaldo. En
estos casos, una buena conectividad es vital para restaurar la produccin.
Otro tipo de conectividad a tener en mente es la conectividad telefnica. Debe
asegurarse de que existen suficientes lneas telefnicas disponibles para
manejar todas las comunicaciones verbales con sus usuarios. Lo que antes
poda ser un grito por encima de la pared de un cubculo ahora implica una
conversacin telefnica de larga distancia; por lo tanto, planee para tener ms
conectividad telefnica de la que pudiera parecer necesaria en un principio.
Personal del sitio de respaldo
El problema sobre conseguir el personal para su sitio de respaldo es
multidimensional. Un aspecto del problema es determinar el personal requerido
para poner a funcionar el centro de datos de respaldo por el tiempo que sea
necesario. Mientras que un equipo esqueltico puede mantener las cosas en
funcionamiento por un corto perodo de tiempo, a medida que el desastre se
extiende se necesitar ms y ms gente para continuar el esfuerzo necesario
para funcionar bajo las circunstancias extraordinarias que rodean un desastre.
Esto implica asegurarse de que el personal tiene tiempo suficiente para
descansar y posiblemente viajar de regreso a sus hogares. Si el desastre fuese
tan extendido que afecte tambin los hogares y familias de la gente, se
necesitar tiempo adicional para permitirles manejar su propia recuperacin de
desastre. Se necesita alojamiento temporal cerca del sitio de respaldo, junto
con el transporte requerido para movilizar a la gente entre el sitio de respaldo
y su alojamiento.
A menudo un plan de recuperacin de desastres incluye que trabaje en el sitio
un personal representativo de todas las partes de la comunidad de usuarios de
la organizacin. Esto depende en la habilidad de su organizacin de operar con
un centro de datos remoto. Si los usuarios representantes deben trabajar en el
sitio de respaldo, tambin deben estar disponibles facilidades similares para
ellos.
Regreso a la normalidad
Eventualmente todos los desastres terminan. El plan de recuperacin de
desastres debe tomar en cuenta esta fase tambin. El nuevo centro de datos
debe ser equipado con todo el software y hardware necesario; mientras que
esta fase a menudo no tiene la naturaleza crtica de las preparaciones
efectuadas cuando se declar inicialmente el desastre, los sitios de respaldo
cuestan dinero cada da que son utilizados, por lo que las preocupaciones
econmicas dicatarn que el cambio se lleve a cabo lo ms pronto posible.

Se deben hacer y entregar los ltimos respaldos desde el sitio de respaldo al


nuevo centro de datos. Despus de almacenarlos en el nuevo hardware, se
puede reactivar la produccin en el nuevo centro de datos.
En este punto se puede desarmar el centro de datos de respaldo, con la
seccin final del plan indicando la disposicin de todo el hardware temporal.
Finalmente, se hace una revisin de la efectividad del plan, integrando
cualquier cambio recomendado por el comit de revisin en una versin
actualizada del plan.

1.11 Cmo obtener alta disponibilidad en un data center?


El desafo de mantener la alta disponibilidad en un data center no
depende solamente de la tecnologa utilizada. Como lo plantea la
normativa internacional que los estandariza, depende de cuatro
subsistemas, y de la infraestructura fsica, los que deben ser
considerados con la misma relevancia y nivel de inversin al momento
de construir o mejorar un data center.
La TIA (Telecommunications Industry Association) cre un estndar para
centros de datos basado en cuatro niveles de disponibilidad. Estos, a su
vez, tienen cuatro reas o subsistemas (Arquitectura, Mecnica,
Telecomunicaciones y Elctricidad), en los que se describen los
elementos mnimos que debe poseer un data center para llegar al nivel
de disponibilidad deseado.

Normalmente, cuando se trata de concretar un nuevo proyecto TI en las


empresas, se destinan las inversiones en forma dispar, priorizando la
inversin en la compra de servidores, equipos de comunicacin y
software, relegando la infraestructura fsica que los soporta a un
segundo nivel de relevancia e inversin. Sin embargo, la gran mayora
de las fallas y de los tiempos muertos se producen justamente en el tem
donde menos se invirti: la infraestructura fsica. Esta tendencia est
cambiando, porque existe mayor informacin y conciencia del problema
que significa tener un data center no disponible.

Algunas compaas especializadas en estos temas pueden aportar con


infraestructura a 3 subsistemas relevantes en un data center, es decir,
hasta un 75% de la totalidad del centro de datos se puede implementar

con equipos de marcas especializadas a modo de subsistema y hasta un


90% en infraestructura fsica propiamente tal.

Cmo debe estar compuesto un data center?


Subsistema Mecnico:
Rack y accesorios
Equipos de aire de precisin y complemento
Sensores de temperatura y humedad
Subsistema telecomunicaciones:
Patch panel
Switch
Router
KVM
Software de monitoreo y control
Subsistema elctrico:
Paneles de distribucin
PDU
UPS
ATS
Inversores
Reguladores de tensin

La disponibilidad debe determinar su inversin


Muchas veces se realizan compras de equipos de acuerdo a un
presupuesto rgido, arbitrario o estimativo, que finalmente determinar
la disponibilidad de sus sistemas.
Asimismo, en ocasiones, sabemos que se requiere una determinada
solucin para el centro de datos (como racks, climatizacin o UPS), pero
al desconocer nuestro nivel de disponibilidad deseado, dejamos que el
mercado nos ofrezca lo que tiene. Esto nos lleva a resolver casi siempre
por la alternativa con el menor precio o mejores plazos de entrega.
Por esta razn, es importante cumplir con el estndar internacional en
todos sus productos y asesorarse respecto de cul es el modelo
necesario para su respectiva necesidad y a qu nivel de disponibilidad
apunta.

Mxima proteccin para mantener su disponibilidad


Hay variadas tendencias respecto a la proteccin mxima dentro de un
data center. Se cuenta con equipamiento de tecnologa redundante N+1,
1+1, N+2 para aumentar la disponibilidad de respaldo elctrico, y los
modelos Hot-Swap permiten la reparacin o mantenimiento de los
mdulos de potencia, mientras el equipo conectado permanece
energizado. Adems, se puede automatizar un data center mediante
software y herramientas de gestin, controlando dispositivos como UPS,
PDU, KVM, y ATS por la red.

Qu se necesita?
Para realizar una inversin inteligente en su data center, primero debe
apuntar a satisfacer un estndar. Es decir, no se trata de comprar lo que
estime que necesita, sino lo que requiere para cumplir con la normativa
y obtener un determinado nivel de disponibilidad. Para esto, es
indispensable que se haga aconsejar por expertos que adems posean
un completo equipo de ingenieros que le pueden asesorar en su gestin.
EJEMPLOS:

Вам также может понравиться