Вы находитесь на странице: 1из 74

Gestin de Registros y Respaldos en el Contexto Hospitalario.

Proyecto de grado
Edicin 2009

Estado del Arte de Sistemas de Respaldos

Supervisores: Mara Eugenia Corti Ariel Sabiguero

Responsables: Julio Carrau Gustavo Perez

Estudiantes: Martn Calabria Gonzalo Perretti

Gestin de Registros y Respaldos en el Contexto Hospitalario

Contenido
1. 2. 3. Introduccin........................................................................................................... 4 Situacin actual en el Hospital de Clnicas .......................................................... 12 Herramientas de respaldo existentes .................................................................. 14 3.1. 3.2. 3.3. 3.4. 3.5. 3.6. 4. 5. Areca BackUp .............................................................................................. 19 BackUp PC .................................................................................................. 25 AMANDA (Advanced Maryland Automatic Network Disk Archiver)............... 33 Bacula .......................................................................................................... 41 Legato NetWorker ........................................................................................ 46 Acronis Backup and Recovery 10................................................................. 51

Conclusiones....................................................................................................... 58 Herramienta Elegida: BACULA............................................................................ 59 4.1. 4.2. 4.3. 4.4. Descripcin General..................................................................................... 59 Arquitectura de Bacula ................................................................................. 61 Configuracin de Bacula .............................................................................. 63 Configuracin del Caso de Prueba............................................................... 67

6.

Referencias: ........................................................................................................ 73

Estado del Arte de Sistemas de Respaldos

Gestin de Registros y Respaldos en el Contexto Hospitalario

Tabla de Figuras
Figura 1 - Causas de Prdida de Informacin [1]............................................................. 4 Figura 2 - Topologa Centralizada. .................................................................................. 6 Figura 3 - Topologa Descentralizada.............................................................................. 7 Figura 4 - Estrategia GFS (Grandfather-Father-Son)....................................................... 8 Figura 5 - Estrategia Torre de Hanoi. .............................................................................. 9 Figura 6 Tabla para especificar las caractersticas de los programas estudiados....... 18 Figura 7 Arquitectura de Areca................................................................................... 20 Figura 8 Deduplicacin de archivos en BackupPC ..................................................... 28 Figura 9 Arquitectura AMANDA .................................................................................. 34 Figura 10 Componentes del Cliente y Servidor de AMANDA...................................... 34 Figura 11 Configuracin de AMANDA con 2 Clientes ................................................. 36 Figura 12 Grfico de optimizacin de respaldos de AMANDA. ................................... 37 Figura 13 Versiones de Legato NetWorker 6.............................................................. 48 Figura 14 Esquema simple de la arquitectura de Bacula ............................................ 59 Figura 15 Interaccin de los componentes de Bacula................................................. 62 Figura 17 - Esquema con la relacin entre los distintos mdulos de Bacula.................. 72

Estado del Arte de Sistemas de Respaldos

Gestin de Registros y Respaldos en el Contexto Hospitalario

1. Introduccin
La informacin y los datos que se manejan en el Hospital de Clnicas son muy importantes, diariamente se opera con informacin relativa a los pacientes (datos personales, historias clnicas, anlisis mdicos, etc.) como datos relativos a la administracin del mismo. La ocurrencia de una falla que signifique la prdida parcial o total de la informacin puede generar un dao irreversible y por eso es imprescindible para la institucin tener un mecanismo para respaldar la informacin y recuperarla en caso de ocurrir imprevistos. Las fallas se presentan de formas muy variadas: virus informticos, fallos de electricidad, errores de hardware y software, cadas de red, personas malintencionadas, errores humanos, etc. Y aunque no se pueda prevenir cada una de estas fallas, s se puede preparar para evitar las consecuencias que stas puedan tener.

Riesgo a los cuales se encuentran inmersos los Sistemas de Informacin

Figura 1 - Causas de Prdida de Informacin [1]

Estado del Arte de Sistemas de Respaldos

Gestin de Registros y Respaldos en el Contexto Hospitalario

Segn un estudio sobre prdida de datos de KPMG, la cantidad de personas en todo el mundo que sufren prdidas de datos podra ascender a 190 millones en 2009, en comparacin con los 92 millones alcanzados en el 2008, a medida que la crisis financiera se profundiza. [2] El estudio abarca el perodo 2005-2008 y se basa en incidentes de prdida de datos de conocimiento pblico documentados por Open Security Foundation [3], Identity Theft Centre [4] y la Information Commissioners Office [5], entre otras instituciones. Desde 2005, cuando KPMG comenz a recopilar informacin, se reportaron cerca de 1.300 incidentes de prdida de datos en todo el mundo, y ms de 350 millones de personas se vieron afectadas. Algunos de los incidentes reportados relacionados con la prdida de informacin en ambientes mdicos se refieren a:

1. La Escuela Mdica de London en Canad donde documentos de 50 alumnos


fueron enviados a la basura. Contenan nombres, direcciones, registros mdicos y nmeros de salud. [6]

2. En la Corporacin de Consultantes de Cardiologa fue robada una laptop utilizada para procesar imgenes de ultrasonido que posea un software de aprox. U$S 27.000 y que adems contena 8000 nombres de pacientes, fechas de nacimiento y nmeros de registros mdico. [7]
La tecnologa no est exenta de fallas o errores y por la naturaleza del sector en el que operan los responsables del DPI del Hospital de Clnicas mantener la informacin siempre disponible y sin la ms mnima interrupcin es prioritario.

El respaldo de informacin es el mecanismos de seguridad ms utilizados por los administradores del DPI para salvaguardar la informacin que maneja diariamente el Hospital de Clnicas por lo que el sistema de respaldo y recuperacin de la misma tiene que ser probado y eficiente, adems de proveer mecanismos que les facilite la tarea de planificacin y ejecucin de los backups.

Estado del Arte de Sistemas de Respaldos

Gestin de Registros y Respaldos en el Contexto Hospitalario

A continuacin se brindan algunos conceptos relacionados con el respaldo de informacin y que se utilizarn en el estudio de las herramientas consideradas [9]: 1. Topologa: Se pueden clasificar en 2 grandes grupos, centralizadas y descentralizadas.

Centralizadas: en sta topologa, mltiples clientes envan sus datos a un servidor de respaldo el cul se encarga de almacenar los datos en el medio correspondiente (Figura 2). Entre las ventajas de esta arquitectura se destaca el menor costo en realizar la configuracin y proteccin de los entornos de respaldos debido a que todo es controlado desde un nico punto. Tambin los costos en hardware son menores debido a que, por ejemplo, comprar un disco de 1 TB es ms econmico que comprar 5 de 200 GB.

Descentralizada: cada cliente guarda su informacin en los dispositivos de respaldos directamente conectados a ellos (Figura 3). Como ventaja se destaca que cada cliente puede restaurar sus datos independientemente sin necesitar comunicarse con el servidor.

Figura 2 - Topologa Centralizada.

Estado del Arte de Sistemas de Respaldos

Gestin de Registros y Respaldos en el Contexto Hospitalario

Figura 3 - Topologa Descentralizada.

2. Tipo: No hay un acuerdo entre los nombres de los diferentes tipos de respaldos, ni por parte de las empresas de software, ni por parte de los administradores, pero los ms frecuentes son:

Completo (Nivel 0): Toda la informacin seleccionada del almacenamiento primario, tanto archivos de datos cmo meta datos (directorios, archivos, atributos, etc.) son respaldados lo que simplifica la restauracin de la informacin para lo cual solo se necesita el dispositivo donde se realiz.

Incremental: Solo se respaldan los archivos que fueron modificados desde el ltimo respaldo (independientemente del tipo) lo que hace que, por lo general, el espacio necesario sea menor que el tipo anterior pero en oposicin, la restauracin de datos necesita tanto del respaldo actual como el del respaldo Full y todos los incrementales intermedios.

Diferencial: Se respaldan todos los datos modificados luego del ltimo respaldo completo por lo que no toma en cuenta si los archivos ya han sido incluidos en algn respaldo diferencial o incremental intermedio.

En base a estos tipos de respaldo surgieron otros que brindan una proteccin mayor de los datos como son:

Proteccin contina de datos [10]: El cual supervisa constantemente el sistema de archivos del host (en la realidad se establece una ventana de tiempo) y si se produce un cambio inmediatamente realiza el respaldo del/los archivos involucrados, por lo que puede reducir al mnimo la cantidad de informacin perdida en caso de que le sucediera algo al sistema.

Estado del Arte de Sistemas de Respaldos

Gestin de Registros y Respaldos en el Contexto Hospitalario

Sinttica (synthetic backup) [11]: Una copia de seguridad sinttica es igual a una copia de seguridad completa en trminos de datos, pero se crea con los datos que se recopilan a partir del respaldo completo e los incrementales posteriores. El resultado final de la combinacin de un reciente archivo de respaldo con la informacin consolidada de todos los respaldos utilizados para crearla. Es una alternativa muy prctica en casos donde por requisitos de tiempo o del sistema no es posible realizar una copia de seguridad completa.

Algunas estrategias de respaldos posibles:


o

Respaldo GFS (Grandfather-Father-Son)

Es uno de los esquemas de rotacin ms populares en los entornos corporativos, consistente en un respaldo completo mensual al que se le llama abuelo (grandfather), un respaldo completo semanal, el padre (father), y un respaldo incremental diario, el hijo (son). La ventaja de esta metodologa es que conservan respaldos recientes de la informacin, mientras que paralelamente se conservan tambin copias anteriores. Ejemplo:
Domingo (1) Diferencial/ Incremental o NADA Domingo (8) Diferencial/ Incremental o NADA Lunes (2) Diferencial/ Incremental Lunes (9) Diferencial/ Incremental Martes (3) Diferencial/ Incremental Martes (10) Diferencial/ Incremental Mircoles (4) Diferencial/ Incremental Mircoles (11) Diferencial/ Incremental Jueves (5) Diferencial/ Incremental Jueves (12) Diferencial/ Incremental Viernes (6) Completo Sbado (7) Diferencial/ Incremental o NADA Sbado (14) Diferencial/ Incremental o NADA

Viernes (13) Completo

Figura 4 - Estrategia GFS (Grandfather-Father-Son).

En caso de que el sistema falle el Jueves (12): Ser necesario el Respaldo completo del Viernes (6) y Si se utilizaron respaldos diferenciales: Slo el Respaldo Diferencial del Mircoles (11). Si se utilizaron respaldos incrementales: Se necesitaran todos los Respaldos Incremental desde el Sbado (7) hasta el Mircoles (11)

Estado del Arte de Sistemas de Respaldos

Gestin de Registros y Respaldos en el Contexto Hospitalario

La Torre de Hanoi

Es una la alternativa un poco ms compleja al GFS, pero muy adoptada tambin en entornos corporativos. El esquema se basa en el juego matemtico del mismo nombre y para adaptarlo a los respaldos se consideran 5 discos etiquetados A, B, C, D, y E. La figura 5 muestra el patrn para el esquema de copia de seguridad. El patrn consiste en 16 das.

Figura 5 - Estrategia Torre de Hanoi.

Para el esquema de cinco niveles es posible recuperar los datos respaldados de hasta dos semanas atrs.
o

Duplicado de Informacin (RAID)

El sistema RAID fue propuesto por primera vez en 1988 y es la sigla de Rebundant Array of Inexpensive/Independent Disk. Tiene como objetivo subsanar algunos de los problemas comunes presente en los sistemas de almacenamiento tradicionales y lograr mejoras como la tolerancia a fallos y errores, aumentar la integridad de los datos y mejorar el rendimiento. RAID ofrece varias opciones, llamadas niveles RAID [12], cada una de las cuales proporciona un equilibrio distinto entre tolerancia a fallos, rendimiento y costo. Todos los sistemas RAID suponen la prdida de parte de la capacidad de almacenamiento de los discos para conseguir la redundancia o almacenar los datos de paridad.

Estado del Arte de Sistemas de Respaldos

Gestin de Registros y Respaldos en el Contexto Hospitalario

Pero adems de realizar los respaldos, es muy importante seleccionar los medios donde se realizan los mismos, los que deben cumplir con determinadas caractersticas como se detalla en el libro Unix Backup and Recovery Cap. 18 de W. Curtis Preston [8] donde se especifican los siguientes factores a tener en cuenta a la hora de decidir: 1. Confiabilidad: Una medida de la confiabilidad de los medios de almacenamiento es MTBF (MeanTime-Between-Failure) que representa el tiempo aproximado entre fallas pero es obtenido en base a entornos artificiales de trabajo que intentan simular ambientes reales y por eso la mejor opcin ms recomendable es Internet, donde se encuentra muchas discusiones acerca del tema. 2. Velocidad de Transferencia: Es importante comparar los medios basndose en la velocidad de transferencia de datos sin comprimir que especifican los fabricantes o en el valor "head-to-tape" que representa el tiempo que se tarda en guardar la informacin desde que llega a la cabeza de lectura/escritura. Pero adems es importante considerar tambin el entorno de trabajo como por ejemplo: la velocidad de transferencia de la red o la saturacin de la misma y las posibilidades del sistema de respaldo para explotar las caractersticas del medio escogido. 3. Tiempo de Acceso a los Datos: Hay entornos como los de Almacenamiento Jerrquico o cuando se desee restaurar un archivo pequeo y no grandes volmenes de informacin, en los que la Velocidad de Transferencia no es lo ms importante, sino que juega un papel muy importante el tiempo en que se accede a la informacin y hay que tener muy en cuenta este factor en el momento de hacer la eleccin. 4. Capacidad: Suele ser uno de los factores ms importantes a considerar en la decisin. No obstante depende la utilizacin que se le dar y de los recursos con que se cuenta debido a que si se dispone, por ejemplo, de un intercambiador de cintas, no es necesario tener un solo medio lo suficientemente grande donde pueda almacenar todo el respaldo.

Estado del Arte de Sistemas de Respaldos

10

Gestin de Registros y Respaldos en el Contexto Hospitalario

5. Costo: Por lo general, los medios de almacenamiento con ms capacidad y que obtiene los datos en menor tiempo son ms caros pero no slo estas caractersticas intervienen en la decisin, sino que se debe tomar en cuanta tambin la reusabilidad y el tiempo en que este se puede utilizar el mismo. La realizacin de las copias de seguridad se debe basar en un anlisis previo del sistema a respaldar y, de acuerdo a la importancia de los datos, el tamao de los mismos, los cambios que sufren en un determinado perodo tiempo, disponibilidad de hardware, etc., establecer la poltica de respaldo adecuada.

Estado del Arte de Sistemas de Respaldos

11

Gestin de Registros y Respaldos en el Contexto Hospitalario

2. Situacin actual en el Hospital de Clnicas


La metodologa actual que dispone el hospital de clnicas para realizar tareas de respaldos carece de automatizacin, requirindose la presencia de un usuario administrador, quien es el encargado de configurar y llevar a cabo los respaldos, da a da, de los archivos dentro de la red del hospital. Durante el relevamiento se detect que en muchas ocasiones estos respaldos no se efectuaban, principalmente por olvido, y tampoco se dispone de un amplio conjunto de respaldos, aproximadamente se almacenan respaldos con una ventana de 30 das, eliminndose automticamente aquellos que exceden dicho periodo. Los respaldos se realizan solo sobre sistemas operativos Windows (no poseen poltica de respaldo para Linux), utilizando como herramienta principal las copias instantneas. Esta funcionalidad, tambin llamada Volume Shadow Copy Service (VSS), permite a los

administradores realizar copias instantneas de volmenes de datos crticos, sin producirse interrupciones en el servicio ni incoherencias en los archivos respaldados. Esto ltimo podra suceder si no se tuviese un adecuado control de los archivos que estn siendo modificados durante el proceso de respaldo, pero VSS posee un mecanismo para controlar esta situacin. Estas copias pueden ser aprovechadas para restaurar posteriormente el sistema, como simple archivado de datos o para recuperacin total o parcial de los mismos. Particularmente se utiliza la opcin de instantneas Shadow Copies for Shared Folders, que permite realizar respaldos de todo la informacin compartida en un volumen determinado y que permite, no solo a los administradores, sino tambin a los usuarios, recuperar sus propios archivos en caso de ser necesario de una lista de hasta 64 versiones anteriores. En el contexto del Hospital de Clnicas, el administrador de respaldos dispone de 2 carpetas compartidas ubicadas cada una en un servidor distinto. En una de ellas, se almacenan los respaldos realizados. La necesidad de una segunda carpeta es para mantener disponibilidad en caso de que el primer servidor no estuviere disponible. La copia desde una carpeta a la otra se realiza automticamente.

Estado del Arte de Sistemas de Respaldos

12

Gestin de Registros y Respaldos en el Contexto Hospitalario

Ventajas y Desventajas
Como principales ventajas se pueden encontrar las siguientes: Respaldos y recuperaciones rpidas. Respalda archivos abiertos y nos asegura su coherencia. Respaldos de la ACL de los archivos y directorios. Recuperacin individual de archivos (usando la caracterstica para Carpetas Compartidas de VSS). Las principales desventajas son: Requiere la presencia de un administrador que conozca la tecnologa y la configure correctamente. No se dispone de una interfaz para realizar bsquedas y consultas de respaldos segn ciertos criterios, sino que se hace manualmente recorriendo los respaldos hasta encontrar el archivo deseado. El formato de las copias instantneas no es un estndar, el nico mecanismo posible para consultar o restaurar un respaldo es a travs del explorador de Windows. No hay seguridad sobre los datos ni compresin para ahorrar espacio. Funcionan a nivel de volumen y no de carpeta lo que es un inconveniente importante ya que puede haber carpetas que no queremos respaldar. Los respaldos no son transportables y no pueden ser creados directamente en un servidor remoto ni hacerlos accesibles remotamente. Slo esta disponible para sistemas de archivos NTFS.

El objetivo es realizar un estudio de las herramientas de respaldos actuales, sus caractersticas, sus fortalezas y debilidades para as escoger la que se adecue a las necesidades de los clientes y les brinde seguridad en el manejo de la informacin que administran. Para realizar la eleccin, se deben tener en cuenta los siguientes requerimientos especificados por los administradores del DPI: La herramienta debe ser preferiblemente de cdigo libre. Ser multiplataforma, principalmente Linux y Windows. Permitir respaldar archivos de bases de datos en uso. Disponer de interfaz grfica para facilitar la bsqueda y de archivos respaldados.

Estado del Arte de Sistemas de Respaldos

13

Gestin de Registros y Respaldos en el Contexto Hospitalario

3. Herramientas de respaldo existentes


Existe una gran variedad de sistemas que automatizan el respaldo de la informacin y con muy variadas caractersticas. Entre los programas que encontramos escogimos los siguientes: Cdigo Libre Programa Areca Backup [15] BackupPC [16] AMANDA [17] Bacula [18] Licencia BSD GPL v2.0 GPL v2.0 GPL v2.0 Windows Si Si Si Si Linux Si Si Si Si Interfaz Grfica No Si Si Si

Propietarios EMC Legato NetWorker [19] EMC Corporation Si Si Si Si Si Si

Acronis BackUp and Acronis Recovery [20]

Debido a que pueden ser instalados tanto en Linux como en Windows y adems poseen una interfaz grfica para la planificacin y auditora de los respaldos realizados, salvo AMANDA, que se decidi incluirlo por la popularidad con la que cuenta en el rubro. Adems se dedica una seccin al estudio de 2 herramientas comerciales, con motivo de tener una comparativa entre el software libre y el software comercial. Para realizar el anlisis de cada herramienta y posteriormente determinar comparativamente cual es el producto que se ajusta en mejor medida a las necesidades requeridas, seleccionamos junto a los clientes un conjunto de caractersticas deseables que deberan formar parte de la herramienta. A continuacin se detallan dichas caractersticas: Cdigo Abierto Una aplicacin de cdigo abierto est licenciada de tal manera que los usuarios pueden estudiar, modificar y mejorar su diseo mediante la disponibilidad del cdigo fuente.

Estado del Arte de Sistemas de Respaldos

14

Gestin de Registros y Respaldos en el Contexto Hospitalario

Ms precisamente, significa que los usuarios de programas tienen las cuatro libertades esenciales.

La libertad de ejecutar el programa, para cualquier propsito (libertad 0). La libertad de estudiar cmo trabaja el programa, y cambiarlo para que haga lo que usted quiera (libertad 1). El acceso al cdigo fuente es una condicin necesaria para ello.

La libertad de redistribuir copias para que pueda ayudar al prjimo (libertad 2). La libertad de distribuir copias de sus versiones modificadas a terceros (la 3 libertad). Si lo hace, puede dar a toda la comunidad una oportunidad de beneficiarse de sus cambios. El acceso al cdigo fuente es una condicin necesaria para ello.
[13]

Encriptacin de Datos Es fundamental disponer de mecanismos de encriptacin de datos, ya que los respaldos almacenados podrn eventualmente ser accedidos por usuarios distintos al usuario creador del respaldo, lo cual pone en riesgo la confidencialidad de dichos datos. Se espera que las herramientas dispongan de mecanismos de clave simtrica, clave asimtrica o ambas. Dependiendo del algoritmo de encriptacin seleccionado la performance a la hora de realizar el respaldo podr incrementar o decrementar, pero debe quedar claro que aplicar encriptacin de datos aumentar los tiempos de ejecucin si se compara con un respaldo sin encriptacin. Los algoritmos comnmente utilizados son los siguientes:

AES (Advanced Encrytion Standard) DES (Data Encryption Standard) RSA (Ron Rivest, Adi Shamir, Len Adleman)

Compresin de Datos La compresin de datos es una caracterstica fundamental si no se dispone de gran cantidad de espacio en los dispositivos de almacenamiento secundario. Como contrapartida, la compresin incrementa considerablemente los tiempos de ejecucin de los respaldos y en ocasiones puede perderse informacin de los archivos, como por ejemplo los permisos y ACL (Acces Control List) asociadas.

Estado del Arte de Sistemas de Respaldos

15

Gestin de Registros y Respaldos en el Contexto Hospitalario

Tipos de Respaldo Existen diferentes mtodos de respaldo de archivos. Entre ellos se destacan los siguientes:

Respaldo Completo. En esta modalidad se respaldan todos los archivos en el volumen seleccionado.

Respaldo Incremental. Solo se respaldan aquellos archivos que sufrieron modificaciones desde el ltimo respaldo.

Respaldo Diferencial. Solo se respaldan aquellos archivos que sufrieron modificaciones desde el ltimo respaldo completo.

Planificador de Tareas Para la automatizacin del sistema de respaldos es importante disponer de un mecanismo de planificacin, en el que el usuario pueda ingresar tareas de respaldo a ejecutarse en determinada fecha. En caso de no disponer de un planificador, la herramienta debera brindar alguna forma de interactuar con el planificador del sistema operativo para llevar a cabo las tareas. Utilizacin de estndares para el respaldo de archivos Es importante que la herramienta utilice estndares para respaldar archivos, como por ejemplo tar, dump, zip, etc. La razn se debe a que es fundamental poder restaurar un respaldo sin necesidad de disponer de la herramienta que lo realiz para hacerlo. Respaldo de permisos de archivos Para mantener la proteccin sobre los archivos del sistema luego de una restauracin de los mismos es necesario respaldar el archivo junto con su informacin de control de acceso. Esto abarca permisos en ambientes Linux, y listas de control de acceso en ambientes Windows. Si no se dispone de este mecanismo el administrador del sistema deber otorgar los permisos nuevamente, luego de la restauracin del archivo. Respaldo de archivos abiertos Dada la gran cantidad de usuarios potenciales en el sistema es muy probable que al momento de realizar respaldos existan archivos abiertos por algunos de los usuarios. Para resolver este problema es recomendable que la herramienta posee la capacidad de respaldarlos y mantener su coherencia.

Estado del Arte de Sistemas de Respaldos

16

Gestin de Registros y Respaldos en el Contexto Hospitalario

Facilidad y eficiencia en la restauracin de archivos La facilidad para restauracin de archivos viene en gran medida en la utilizacin de archivadores estndares como los mencionados anteriormente y la posibilidad de contar con una interfaz grafica que provea facilidades para buscar y restaurar los archivos deseados. Buena Documentacin Es de suma importancia para poder comprender el diseo e implementacin de los mdulos que componen el sistema. Se pretende que la herramienta seleccionada tenga al menos un manual de usuario, un documento explicando el diseo y forma de extender el sistema, y un cdigo fuente bien documentado que permita comprender el propsito y funcionalidad de cada objeto.

Estado del Arte de Sistemas de Respaldos

17

Gestin de Registros y Respaldos en el Contexto Hospitalario

Para realizar la comparacin entre las distintas herramientas se utilizar la tabla del Figura 6, que indica cuales de las caractersticas deseables posee la aplicacin y cuales no. Para cada herramienta se mostrar la tabla correspondiente y luego del estudio de las mismas se confeccionar una tabla general para poder visualizar con mayor detalle la comparativa entre todas las herramientas estudiadas. Caracterstica Cdigo abierto Multiplataforma Compresin Encriptacin Filtros Tipos de respaldo Lugar de almacenamiento Modo de almacenamiento Respaldo de permisos y ACL de archivos Respaldos simultneos Planificador de tareas Interfaz grfica Eficiencia y facilidad para restaurar respaldos Utilizacin de estndares para respaldo (tar, dump, zip). Cliente-Servidor Buena documentacin Extensibilidad incorporar funcionalidades para nuevas Disponible (Si, No) Detalle Comentarios

Soporte para respaldo de archivos abiertos Soporte para respaldo de bases de datos on-line (hotbackup)
Figura 6 Tabla para especificar las caractersticas de los programas estudiados

Estado del Arte de Sistemas de Respaldos

18

Gestin de Registros y Respaldos en el Contexto Hospitalario

3.1. Areca BackUp


Caractersticas Principales

Desarrollado en Java. Licencia pblica GNU 2. Cdigo Abierto. La arquitectura no es Cliente-Servidor Posee Interfaz Grfica e Interfaz en lnea de Comandos. Compresin de datos: ZIP/ZIP64. Encriptacin de datos: AES 128 y de AES 256. Filtros de Bsqueda (por extensin, directorio, expresin regular, tamao, fecha, etc.).

Nivel de respaldo incremental, completo y diferencial. Modo de almacenamiento delta (solamente las partes modificadas de los archivos sern almacenadas).

No realiza imagen de discos. Ejecucin simultanea de respaldos. Respaldos sobre discos, unidades de red, USB, FTP (con SSL/TLS). Unin de archivos contiguos para disminuir el espacio de almacenamiento. Mecanismo de transaccin, el cual genera procesos de respaldo transaccionales, asegurando la integridad de los datos.

Respaldo y recuperacin de permisos, links simblicos y ACL de archivos (solo Linux).

Versionado de archivos y explorador de historial: permite buscar y restaurar ms de una versin existente del archivo.

No dispone de planificador de tareas pero permite usar tanto el de Windows como el de Linux.

Envo de informes a cuentas de e-mail. Generacin de reportes de respaldo. Registro de actividades de usuarios (Log). Simulacin de respaldos.

Estado del Arte de Sistemas de Respaldos

19

Gestin de Registros y Respaldos en el Contexto Hospitalario

Anlisis de la Herramienta
La herramienta est diseada para facilitar la creacin y configuracin de respaldos. La siguiente figura ilustra la configuracin del ambiente de trabajo tpico para utilizar Areca:

Figura 7 Arquitectura de Areca

Claramente se aprecia una arquitectura en la que se dispone de un servidor con el software instalado, el cual accede a los sistemas de archivos de las maquinas cliente, transfiriendo los datos desde estos hacia los dispositivos de almacenamiento (FTP, Discos locales, USB). Si bien la arquitectura definida elimina la necesidad de disponer de software en las maquinas cliente, tiene como contrapartida un mayor tiempo de ejecucin ya que requiere transportar los datos al servidor para poder realizar el respaldo. Para llevar a cabo la creacin y ejecucin de respaldos Areca se definen grupos de respaldo configurables. Los grupos de respaldo consisten de un conjunto de destinos, en los cuales se configuraran los siguientes puntos:

Origen de los datos (archivos y directorios a respaldar). Destino de los datos (carpeta en disco, unidad de red, FTP, etc...). Filtros Modo de Almacenamiento Compresin Encriptacin

Estado del Arte de Sistemas de Respaldos

20

Gestin de Registros y Respaldos en el Contexto Hospitalario

Pueden haber varios destinos definidos para un mismo grupo lo cual permite categorizar y visualizar de manera esquemtica todos los respaldos creados.

Puntos Fuertes y Dbiles de la Herramienta


Como caractersticas fuertes se destacan: 1. Mecanismo de transaccin. 2. Ejecucin de respaldos simultneos. 3. Ejecucin de acciones pre y post procesamiento. 4. Respaldo delta. 5. Monitoreo de versionado de archivos. 6. Filtros de bsqueda. Mecanismo de transaccin Se encarga de crear una transaccin para cada uno de los respaldos al momento de ejecutarlos. Esto asegura, que ante alguna falla tcnica como por ejemplo cada del servidor, se pueda mantener la integridad de los datos respaldados. De esta manera, un respaldo se realiza completamente o no se realiza. Ejecucin de respaldos simultneos Dada la creciente cantidad de maquinas a respaldar en la red existente, el nmero de respaldos a ejecutar diariamente es alto y es crtico disponer de un mecanismo de ejecucin en el cual se lancen en paralelo un conjunto de procesos de respaldo. Areca lo permite tanto desde su interfaz grafica como por lnea de comandos. Ejecucin de acciones pre y post procesamiento Areca permite definir, o cargar scripts de consola codificados por el usuario, que contengan acciones a ejecutar inmediatamente antes y despus del proceso de respaldo de un archivo. Algunos ejemplos son notificaciones por email, generacin de reportes y registro de actividad del usuario. Respaldo Delta Permite respaldar solo aquellas partes de los archivos que han sido modificadas con respecto al ltimo respaldo. Esto es muy til cuando se trabaja con archivos de gran

Estado del Arte de Sistemas de Respaldos

21

Gestin de Registros y Respaldos en el Contexto Hospitalario

tamao, ya que sino habra que almacenarlo por completo cada vez que se realiza el respaldo. El algoritmo utilizado por Areca es similar al algoritmo de rsync para detectar y modificar partes de un archivo, el cual utiliza el tamao y la fecha de ltima modificacin del archivo en cuestin. Monitoreo de versionado de archivos Permite no solo consultar las versiones de los archivos respaldados, sino tambin restaurar cualquiera de ellas. Filtros de Bsqueda Areca ofrece un extenso conjunto de filtros para incluir o excluir archivos que cumplan con las condiciones establecidas. Entre ellos se encuentran:

Extensin del archivo. Nombre de archivo/directorio, utilizando expresiones regulares. Tamao de archivo. Fecha de modificacin del archivo. Links simblicos (solo Linux). Archivos en uso.

Como caractersticas dbiles se destacan: 1. No posee planificador para ejecutar respaldos. 2. No respalda de permisos en sistemas Windows. 3. No respaldo archivos abiertos.

Planificador de respaldos Areca carece de planificador propio pero dispone de comandos ejecutables desde una lnea de comandos, e incluso desde los propios planificadores del sistema operativo en el cual se encuentra instalado, mediante un script. Esto acta de nexo entre la aplicacin y el planificador permitiendo de una manera gil disponer de planificacin de respaldos. Los planificadores de tareas son Windows Task para ambientes Windows, y Crontab para ambientes Linux.

Estado del Arte de Sistemas de Respaldos

22

Gestin de Registros y Respaldos en el Contexto Hospitalario

Respaldo de permisos en sistemas Windows La herramienta no ofrece la posibilidad de almacenar ACL (Access Control List) de archivos en ambientes Windows. Respaldo de archivos abiertos Areca no debe ser utilizado como una herramienta de creacin de imgenes de particiones, como lo son otras aplicaciones (Norton Ghost, Acronis, etc.) ya que no es capaz de respaldar archivos que estn siendo utilizados por los usuarios al momento del respaldar.

Resumen de las caractersticas del programa:


Caracterstica
Cdigo abierto Multiplataforma

Disponible (Si, No)


Si Si

Detalle

Comentarios

Puede ser utilizado en cualquier maquina con entorno de ejecucin Java. Zip, Zip64 Permite almacenar archivos en un mismo archivador o cada uno por separado. Particin en volmenes de tamao configurable por el usuario. Dispone de encriptacin de nombres.

Compresin

Si

Encriptacin Filtros

Si Si

AES 128 AES 256

Extensin, Dispone tanto de filtros de inclusin directorio, como de exclusin. expresiones regulares, tamao y fecha de archivos links simblicos. Completo, Incremental y diferencial. Standard, Delta e Imagen. Disco, unidad de red, FTP, USB. Solo respalda permisos en archivos sobre sistemas operativos Linux. Permite integrarse con planificadores propios del sistema operativo. Imagen se refiere al almacenamiento de todos los archivos respaldados en un nico archivo.

Tipos de Respaldo

Si

Modo de Almacenamiento Lugar de Almacenamiento Respaldo de permisos y ACL de archivos Planificador de tareas

Si

Si Parcial No

Estado del Arte de Sistemas de Respaldos

23

Gestin de Registros y Respaldos en el Contexto Hospitalario

Interfaz grfica Eficiencia y facilidad para restaurar respaldos

Si Si Si se dispone de programas para manipular archivos .zip es posible restaurar respaldos sin necesidad de instalar la herramienta. Zip, Zip64 Zip64 permite comprimir archivos mayores a 4G en un nico archivador.

Utilizacin de estndares para respaldo (tar, dump, zip). Cliente-Servidor Buena documentacin Extensibilidad para incorporar nuevas funcionalidades Soporte para respaldo de archivos abiertos Soporte para respaldo de bases de datos online (hot-backup)

Si

No Parcial Si No se detalla con claridad cmo incorporar nuevos mdulos al sistema. Diseado para incorporar plugins, en la web se dispone de un ejemplo.

No No

Estado del Arte de Sistemas de Respaldos

24

Gestin de Registros y Respaldos en el Contexto Hospitalario

3.2. BackUp PC
Caractersticas Principales

Desarrollado en Perl. Cdigo Abierto. Inteligente estrategia de manejo del agrupamiento de archivos (pooling) minimiza el acceso y espacio de almacenamiento en disco. Idnticos archivos de varios respaldos de la misma o diferente PC slo se almacenan una vez.

Deduplicacin de archivos permite almacenar nicamente 1 nica copia de archivos duplicados eliminando toda posible redundancia.

Soporte de compresin opcional para reducir an ms el almacenamiento en disco. Dado que slo los archivos nuevos necesitan ser comprimido, hay slo un impacto moderado sobre el tiempo de CPU.

No se necesita instalar el software en el cliente. Extraccin de datos a respaldar mediante tar, rsync. Una potente interfaz de usuario web (HTTP / CGI) permite a los administradores ver los archivos de registro, configuracin, estado actual y permite a los usuarios iniciar y cancelar las copias de seguridad y navegar y recuperar archivos de respaldos.

Un gran conjunto de opciones de restauracin es soportado, incluidos los de restauracin directa (a travs del cliente SMB, tar, o rsync/rsyncd) o descargar de archivos ZIP o tar.

Soporta entornos mviles, como computadoras porttiles conectados a la red. Soporte para redes DHCP. Parmetros de configuracin flexibles permiten varias copias de seguridad a realizarse en paralelo, directorios donde hacer el respaldo, programacin de respaldos completos o incrementales y envo de notificaciones via e-mail. Parmetros de configuracin se pueden establecer en todo el sistema, o tambin en funcin de cada PC.

Debe ser instalado en servidores Linux, Solaris o Unix. Probado en clientes Linux, Freenix, Solaris, Win95, Win98, Win2000 y WinXP. Documentacin detallada.

Estado del Arte de Sistemas de Respaldos

25

Gestin de Registros y Respaldos en el Contexto Hospitalario

Anlisis de la Herramienta
Backup PC es una herramienta para respaldo de informacin disco a disco, con una arquitectura que solo requiere la presencia de un servidor con el software instalado. El protocolo SMB estndar se utiliza para extraer los datos a respaldar desde los clientes de Windows. En los clientes Linux, se utiliza tar sobre ssh/rsh/nfs. Con la versin 2.0.0, tambin compatible con cualquier cliente que tenga rsync o rysncd. A su vez, la restauracin puede hacerse directamente a travs de smbclient, tar, rsync, rsyncd o descargando los archivos tar/zip. El servidor debe ser instalado en un sistema operativo Linux, Solaris o Unix, y la cantidad de espacio en disco y CPU que dispone determina la cantidad de respaldos simultneos que pueden realizarse. Generalmente sta cifra ronda entre 4 y 8 respaldos simultneos. El mecanismo que utiliza Backup PC para obtener las direcciones IP de las maquinas cliente es a travs de un archivo de configuracin en el que el usuario indica el hostname de cada maquina. Para clientes que se conectan a la red mediante DHCP, se obtienen las IP mediante NetBios (clientes Windows), o mediante el nmbd (netbios name server) del servidor samba (clientes Linux). Para respaldar clientes Windows, Backup PC utiliza la herramienta smbclient la cual permite intercambiar archivos con un servidor smb. Para respaldar clientes Linux se utiliza la herramienta nmblookup. Por ltimo utiliza ssh para disparar los comandos tar y rsync necesarios para llevar a cabo los respaldos y restauraciones en el cliente.

Puntos Fuertes y Dbiles de la Herramienta


Como caractersticas fuertes se destacan: 1. Deduplicacin de archivos. 2. Soporte para compresin de archivos. 3. No requiere software en el cliente. 4. Opciones de restauracin.

Estado del Arte de Sistemas de Respaldos

26

Gestin de Registros y Respaldos en el Contexto Hospitalario

Deduplicacin de Archivos [14] La deduplicacin de archivos es una tcnica de respaldo que permite eliminar los datos redundantes almacenados, guardando una nica copia idntica de los mismos, y reemplazando las copias redundantes por apuntadores que apuntan a esa nica copia. Backup PC utiliza combinaciones de referencias a los archivos reales para reducir el espacio en disco necesario para almacenar los archivos. En el primer respaldo completo todos los archivos son transferidos a disco, opcionalmente comprimidos, y luego comparados. Si un archivo ya existe en el disco, entonces no se almacena una nueva copia sino que se crea una referencia que apunta al archivo original, lo cual utiliza una nica entrada adicional en la estructura de directorio. Esto adems de ahorrar espacio en disco, permite mejorar la performance ya que se reducen las escrituras a disco para cada archivo duplicado. Dos archivos son idnticos cuando tienen el mismo contenido, pero no es restriccin que los permisos y fecha de modificacin sean los mismos. Si tanto los permisos como la fecha de modificacin son distintas pero ambos archivos tienen el mismo contenido, sern agrupados, utilizando referencias, lo cual es posible ya que Backup PC almacena separadamente los archivos de sus metadatos. Esta tcnica de respaldo requiere por lo tanto un sistema de archivos que soporte estas referencias (llamados enlaces duros), entre ellos se encuentran:

Cualquier sistema de archivos estndar Linux-Unix. NFS montado (Mac)

Quedan por lo tanto excluidos los sistemas de archivos FAT y NTFS. Para comparar archivos se implementa un mecanismo que consiste en asignar a los archivos almacenados en disco un nombre formado por un cdigo MD5 el cual se obtiene del largo y parte del contenido del archivo. Por supuesto esto no es garanta de que dos archivos sean idnticos cuando coinciden sus nombres, pero es una rpida forma de descartar archivos distintos sin tener que examinar su contenido. Una comparacin completa del contenido deber hacerse en caso que los nombres sean idnticos. La cuestin que surge es elegir la cantidad de bytes del contenido del archivo, que se utilizar para realizar el hash MD5, ya que si se producen demasiadas repeticiones entonces demasiados archivos tendran el mismo nombre (hash MD5) y requeriran una comparacin

Estado del Arte de Sistemas de Respaldos

27

Gestin de Registros y Respaldos en el Contexto Hospitalario

de contenido para determinar si son idnticos o no. La siguiente tabla ilustra algunos datos empricos para determinar el largo de archivo a incluir en el hash:

Archivos nicos almacenados 900.000 900.000 900.000

Cantidad de bytes a utilizar 4096 iniciales 256K iniciales 128K iniciales y 128K finales

Archivos repetidos segn MD5 7000 500 300

Archivos que contienen el mismo hash en el peor caso. 500 20 20

Figura 8 Deduplicacin de archivos en BackupPC

Claramente la mejor estrategia para generar el hash es tomar los 128K iniciales y finales del archivo. Esto reduce la cantidad de archivos que generan el mismo hash (por lo tanto requieren comparacin de contenido) a un 0,002% del total. Cabe aclarar que es necesario mejorar la velocidad del CPU para los casos 2 y 3 de la tabla, ya que involucran mucha mayor cantidad de bytes para la generacin del hash. Soporte para compresin de archivos Otra caracterstica interesante es el mecanismo de compresin de archivos que dispone Backup PC. Para realizar la compresin se utilizan los mtodos deflate e inflate del mdulo Compress::Zlib, basado en la librera de compresin zlib. Backup PC permite configurar el nivel de respaldo, el cual puede tomar valores en el rango de 0 a 9. Nivel 0 significa que no habr compresin. Los niveles 1 a 9 mejoran la compresin en forma ascendente, pero como contrapartida el trabajo del procesador es mayor). Se recomienda utilizar nivel 3, ya que por ejemplo un pasaje a nivel 5 implica un 20-30% ms de tiempo de CPU, incrementando en apenas 2-3% la compresin. No obstante Backup PC implementa la compresin de manera que la carga en CPU sea mnima. Es decir, en lugar de comprimir cada archivo que se procesa para luego recin compararlo con los existentes en disco para determinar la unicidad del mismo, se computa primero el hash MD5, basndose en el archivo descomprimido, hacindose la comparacin con cada archivo candidato en el disco. Para ello, cada archivo candidato debe ser descomprimido y luego se comparan los hash. Dado que el mtodo inflate (descompresin)

Estado del Arte de Sistemas de Respaldos

28

Gestin de Registros y Respaldos en el Contexto Hospitalario

es aproximadamente 10 veces ms rpido que el mtodo deflate (compresin), se produce un gran ahorro de tiempo de CPU. En promedio el mecanismo de compresin permite ahorrar entre un 30-40 % de espacio en disco. No requiere software en el cliente La arquitectura y diseo de backup PC no requiere la instalacin del software en maquinas clientes. Sin embargo, requiere la presencia de alguna de las siguientes herramientas y protocolos en el cliente:

SMB Tar RSync

Para entornos Windows se utiliza smb o rsync para comunicarse con el cliente. Si se usa smb deben crearse las carpetas compartidas con los datos a respaldar. Si la maquina se conecta a la red mediante DHCP entonces debe habilitarse NetBios ya que Backup PC lo utiliza para mapear la IP del cliente a partir del nombre del mismo emitiendo un pedido netbios multicast. Para entornos Linux se puede utilizar cualquiera de los tres mtodos anteriores, pero son recomendados tar y rsync ya que smb requiere instalar el servidor samba para proveer las carpetas compartidas. A la vez, dado que el protocolo smb no puede representar archivos especiales como enlaces simblicos, tar y rsync si pueden hacerlo, estos son preferidos para transporte de datos en clientes Linux/Unix. Opciones de restauracin Backup PC dispone de varios mtodos para la restauracin de archivos, tanto automticos (va interfaz grfica) como manuales. Por interfaz grfica se puede seleccionar el respaldo y navegar hasta encontrar el archivo necesario, el cual puede descargarse y almacenarse en el pc del cliente. Un aspecto interesante es que Backup PC completa los respaldos incrementales con el correspondiente respaldo completo, con el objetivo que el usuario no tenga que hacer mltiples restauraciones para obtener el respaldo deseado.

Estado del Arte de Sistemas de Respaldos

29

Gestin de Registros y Respaldos en el Contexto Hospitalario

Las opciones disponibles son:

Restauracin directa. Con esta opcin los archivos seleccionados se restaurarn en la maquina cliente por defecto en el mismo lugar en donde se encontraban al momento de realizar el respaldo. Se utiliza smbclient, tar o rsync para realizar la restauracin, dependiendo de cual fue configurado para dicho cliente.

Descarga de archivo zip. Ofrece la posibilidad de descargar un archivo zip conteniendo en su interior todos aquellos archivos seleccionados. Se podr especificar el nivel de compresin (0 al 9). Como desventaja respecto al primer mtodo, no se considera como una operacin de restauracin, por lo tanto no se registran los detalles de la operacin, sin embargo se menciona en el log por motivos de seguridad.

Descarga de archivo tar. Es idntico al mecanismo anterior con la nica diferencia que el formato del archivo a descargar es tar, no disponiendo de nivel de compresin.

A su vez, desde lnea de comandos se dispone de mecanismos tanto para descargar archivos zip como tar. Como caractersticas dbiles se destacan: 1. No respalda ACL de archivos Windows. 2. No respalda archivos abiertos. 3. Mximo en el tamao del respaldo.

No respalda ACL de archivos Windows Esto se debe a que la herramienta smbclient no extrae los atributos de permisos (ACL) de los archivos en sistemas operativos Windows, nicamente extrae los equivalentes a atributos Unix. No respalda archivos abiertos Bajo cualquier versin de Windows, un archivo abierto no puede ser ledo por smbclient. Dichos archivos no sern respaldados, esto incluye los archivos del registro del sistema.

Estado del Arte de Sistemas de Respaldos

30

Gestin de Registros y Respaldos en el Contexto Hospitalario

Sucede lo mismo con los datos de todos los servicios Windows, como base de datos SQL, Exchange, etc. Lo mejor que Backup PC puede hacer en estos casos es enviar advertencias va emails a los usuarios indicndoles los archivos que no se han podido respaldar. Mximo en el tamao del respaldo Backup PC puede manejar archivos de gran tamao, probablemente de 2^51 bytes. En la prctica, muchas limitaciones por fuera de BackupPC acotan el mximo tamao de un archivo. Entre estas limitaciones se destacan las siguientes:

Perl necesita ser compilado con la opcin userlargefiles. El espacio de almacenamiento de respaldos debe ubicarse en un sistema de archivos que soporte archivos de gran tamao.

El mecanismo de transporte tambin limita el mximo tamao de un archivo, por ejemplo tar permite hasta un mximo de 8G, smbclient soporta archivos de hasta 4G y rsync sobre Cygwin tiene un tope entre 2G o 4G.

Resumen de las caractersticas del programa


Caracterstica
Cdigo abierto Multiplataforma

Disponible (Si, No)


Si Si

Detalle

Comentarios

Servidor: Linux, Solaris o Unix. Cliente: Windows, Linux, Solaris, Unix. Permite ahorrar entre Requiere instalar zlib y 30-40 % de espacio. zip. rsa

Compresin Encriptacin Filtros Tipos de Respaldo

Si Si No Si

Completo, Incremental y diferencial. Full e incremental Disco local Realiza backup sintticos El sistema de archivos debe soportar enlaces duros.

Modo de Almacenamiento Lugar de Almacenamiento

Si S

Respaldo de permisos y ACL de archivos Planificador de tareas

Parcial No

Solo Linux

Estado del Arte de Sistemas de Respaldos

31

Gestin de Registros y Respaldos en el Contexto Hospitalario

Interfaz grfica Eficiencia y facilidad para restaurar respaldos Utilizacin de estndares para respaldo (tar, dump, zip). Cliente-Servidor

Si Si Si No

Posee interfaz grafica web.

Tar, zip, rsync, smb. Requiere smbclient y nmblookup para respaldar clientes windows.

Buena documentacin Extensibilidad para incorporar nuevas funcionalidades Soporte para respaldo de archivos abiertos Soporte para respaldo de bases de datos on-line (hot-backup)

Si No No No

Estado del Arte de Sistemas de Respaldos

32

Gestin de Registros y Respaldos en el Contexto Hospitalario

3.3. AMANDA (Advanced Maryland Automatic Network Disk Archiver)


Caractersticas Principales

Cdigo Abierto. Implementado en Perl. Buena documentacin. Arquitectura Cliente-Servidor. El Servidor requiere sistema operativo Linux/Unix, aunque puede utilizarse Cygwin para instalarlo en Windows, soporta cualquier tipo de clientes (Windows, Linux, Unix)

Rpida instalacin. Permite realizar respaldos simultneos en cinta y disco, permitiendo mantener los mismos datos en lnea para rpida restauracin, o en cintas por si ocurre una falla grave.

Utiliza drivers de dominio pblico por lo tanto cualquier dispositivo soportado por el sistema operativo funcionar correctamente con AMANDA. El administrador no deber preocuparse por dar soporte al dispositivo cuando la versin de AMANDA se actualice.

Fcil restauracin de respaldos incluso si no se dispone de AMANDA, ya que utiliza tar, zip y dump para la compresin de datos. Junto con el respaldo, almacena un cabezal indicando la secuencia de comandos (tar y dump) que deben ejecutarse para restaurarlo.

Encriptacin de datos tanto en el cliente como en el servidor de respaldos. AMANDA soporta llaves pblicas de 4096-bits y AES 256-bits.

Posee un planificador que optimiza el respaldo de datos, haciendo que el tiempo total de un respaldo, sea prcticamente el mismo para cada ejecucin.

Cdigo estable y de alta calidad. Soporte para VSS (Volume shadow copy service), que permite realizar respaldos de archivos abiertos en Windows.

Hot Backup de bases de datos(MySQL).

Estado del Arte de Sistemas de Respaldos

33

Gestin de Registros y Respaldos en el Contexto Hospitalario

Anlisis de la Herramienta
AMANDA es un sistema de respaldo que permite al administrador configurar un servidor de respaldo que permita respaldar mltiples clientes en una red a cinta o disco. Para lograrlo, utiliza las herramientas dump y/o tar, lo cual permite respaldar una gran cantidad de equipos con diferentes versiones de Unix. Para clientes Windows se puede configurar un servidor Samba, o utilizar un servidor Cygwin, o tambin instalar el software cliente ofrecido por el propio AMANDA (Zmanda Windows Client), el cual tiene entre otras ventajas la utilizacin del VSS (Volume Snapshot Service) de Windows.

Figura 9 Arquitectura AMANDA

A continuacin se analizan los componentes involucrados y como se comunican entre ellos:

Figura 10 Componentes del Cliente y Servidor de AMANDA

Estado del Arte de Sistemas de Respaldos

34

Gestin de Registros y Respaldos en el Contexto Hospitalario

Puntos Fuertes y Dbiles de la Herramienta


Como caractersticas fuertes se destacan: 1. Determinacin automtica del nivel de respaldo. 2. Soporte para Volume Shadow Copy Service. 3. Respaldo de Bases de Datos. 4. Planificador de Respaldos Determinacin automtica del nivel de respaldo La mayora de los productos de backup proporcionan un mecanismo de programacin de respaldos. El administrador del sistema configura el software para realizar una copia de seguridad completa, con respaldos incrementales entre las copias de seguridad completas. El mayor problema con este enfoque es que no proporciona ningn equilibrio de carga. Usted tiene que asegurarse de que hay suficientes recursos disponibles para gestionar la demanda pico de la copia de seguridad de la CPU del servidor, red y E/S en copias de seguridad completas.

AMANDA optimiza el equilibrio de carga de programacin de copias de seguridad. En lugar de dar las instrucciones "Hacer una copia de seguridad completa cada domingo para los clientes de A, B y C, el mircoles copias de seguridad completas para los clientes de D, E y F, e incrementales el resto del tiempo", solo crean una pocas reglas para el proceso de planificacin. Por ejemplo, usted podra dar la instruccin "hacer al menos una copia de seguridad completa dentro de un perodo de 7 das, e incrementales todos los dems das con un mximo de tiempo entre copias de seguridad completas de 7 das." El mximo de tiempo entre copias de seguridad completas se llama el ciclo de volcado.

Para cada ciclo de volcado que se especifica, AMANDA encuentra una combinacin ptima de los backup completos e incrementales de todos los clientes para que la cantidad total de datos a respaldar por ejecucin del backup sea lo ms pequeo posible y coherente desde una copia de seguridad a otra.

Estado del Arte de Sistemas de Respaldos

35

Gestin de Registros y Respaldos en el Contexto Hospitalario

Para encontrar este equilibrio, AMANDA usa las siguientes consideraciones: La cantidad total de datos a respaldar es reportado por cada cliente en funcin de la cantidad de datos cambiado desde la ltima copia de seguridad. El mximo de tiempo entre copias de seguridad completas (volcado ciclo) que se ha especificado. El tamao de los medios disponibles donde se almacenar el respaldo (cinta o disco).

Para calcular el nivel ptimo de respaldo, AMANDA comienza cada copia de seguridad con una fase estimada. Cada cliente AMANDA ejecuta un proceso especial que determina qu archivos han cambiado y el tamao total de ellos. La fase estimada puede llevar algn tiempo, sobre todo con muchos clientes y sistemas de archivos. Si algunos sistemas de archivos no son muy dinmicos y los archivos no cambian mucho, puede indicarsele a AMANDA, ahorrando as tiempo durante la fase de estimacin. Despus de recoger los datos de todos los clientes, AMANDA entra en la fase de planificacin y calcula la combinacin ptima de las copias de seguridad completas e incrementales para todos los clientes. El siguiente es un ejemplo:

Figura 11 Configuracin de AMANDA con 2 Clientes

Estado del Arte de Sistemas de Respaldos

36

Gestin de Registros y Respaldos en el Contexto Hospitalario

Asumiendo que cada directorio /home tiene 100GB de archivos y la cantidad de informacin que cambio es el 15% y el ciclo de volcado es de 4 das. Por simplicidad supondremos que cada respaldo se escribe en Cintas diferentes llamadas DailySet1 hasta DailySet4 y que los respaldos incrementales tienen nivel 1 (o sea que se respaldan todos los archivos que cambiaron desde el ltimo backup completo).

Figura 12 Grfico de optimizacin de respaldos de AMANDA.

Para cada ejecucin, AMANDA programa un respaldo completo para la cantidad total de datos divididos por el nmero de das en el ciclo de volcado. Dado que el ciclo de volcado es de 4 das, para DailySet1, AMANDA realiza una copia de seguridad completa para 1/4 de los datos, en este caso /home1. Para DailySet2, AMANDA hace una copia de seguridad completa para el otro 1 / 4 de los datos, en este caso /home2, y una copia de seguridad incremental para /home1 que es de 15 GB (15% de 100 GB). Para DailySet3, AMANDA hace un respaldo completa de /home3 e incrementales para /home1 y /home2. Despus del perodo de arranque inicial de cuatro das, AMANDA se ejecuta una copia de seguridad completa para uno de los directorios /home y copias de seguridad incrementales para todos los dems.

Estado del Arte de Sistemas de Respaldos

37

Gestin de Registros y Respaldos en el Contexto Hospitalario

Soporte para Volume Shadow Copy Service. Una de las caractersticas sobresalientes de AMANDA es su capacidad de utilizar el servicio VSS que ofrecen los sistemas operativos Windows, el cual permite respaldar un sistema de archivos, an cuando existen archivos abiertos por los usuarios del sistema y sin sufrir modificaciones de los datos durante el proceso. Para lograr esto, VSS ofrece una API para que las aplicaciones de respaldo puedan comunicarse con l y de esta manera solicitarle la creacin de una nueva imagen del sistema de archivos, con la finalidad de poder respaldar ciertos archivos dentro de sta. En ese momento, VSS detiene todas las operaciones de escritura en el volumen, y comienza la creacin de una imagen de solo lectura del sistema de archivos, para que las aplicaciones de respaldo tengan la posibilidad de utilizarla sin interferir con otros programas que se encuentren modificando dichos archivos. Una vez finalizada la creacin, se permite continuar con las escrituras pendientes. Esto asegura que no se tendrn inconsistencias ni datos corruptos en la nueva imagen. VSS resuelve otras problemticas a la hora de respaldar archivos en sistemas operativos Windows, como por ejemplo el respaldo de las ACL (Access Control List) de cada archivo. Respaldo de Bases de Datos AMANDA dispone de un mdulo opcional llamado ZRM para MySQL (Zmanda Recovery Manager) para respaldo automatizado de bases de datos MySQL y existen dos versiones, la versin Libre y la versin Enterprise. Por supuesto la versin Enterprise ofrece una variedad mayor de opciones y funcionalidades como por ejemplo:

Soporte para servidores y clientes Windows. Soporte para respaldo de base de datos en ejecucin, tanto en Linux como en Windows.

Consola web Visualizacin de logs Respaldo remoto va Internet (ssh, sshs).

Estado del Arte de Sistemas de Respaldos

38

Gestin de Registros y Respaldos en el Contexto Hospitalario

Sin embargo no hay que descartar las buenas prestaciones de la versin Libre, que entre otras dispone de las siguientes:

Respaldo lgico de la base de datos MySQL. Respaldo completo e incremental. Respaldo completo basado en imgenes. Utiliza formatos de archivo de dominio pblico por lo tanto es posible restaurar un respaldo an sin disponer de ZRM.

Como caractersticas dbiles se destacan: 1. No dispone de interfaz grfica. (versin free)

Resumen de las caractersticas del programa


Caracterstica
Cdigo abierto Multiplataforma

Disponible (Si, No)


Si S

Detalle

Comentarios

Servidor requiere Linux/Unix, puede correr en Windows con Cygwin. Soporta cualquier cliente.

Compresin Encriptacin Filtros Tipos de Respaldo

Si Si No Si

Tar en Linux y Zip en Windows AES128, AES192 y AES256

Completo, Incremental.

Pueden ser manejados automticamente para balancear la carga diaria.

Modo de Almacenamiento Lugar de Almacenamiento Respaldo de permisos y ACL de archivos Planificador de tareas Interfaz grfica Eficiencia y facilidad para restaurar respaldos

Si Si Si Si No Si

Soporta imagen. Disco local, cinta. Requiere habilitar VSS en clientes windows.

Estado del Arte de Sistemas de Respaldos

39

Gestin de Registros y Respaldos en el Contexto Hospitalario

Utilizacin de estndares para respaldo (tar, dump, zip). Cliente-Servidor

Si Si

Tar, Gump, zip El software cliente de AMANDA debe instalarse en los PC a respaldar.

Buena documentacin Extensibilidad para incorporar nuevas funcionalidades Soporte para respaldo de archivos abiertos Soporte para respaldo de bases de datos on-line (hot-backup)

Si No Si Si Requiere activar VSS en clientes Windows. Soporte para MySQL en un mdulo dedicado.

Estado del Arte de Sistemas de Respaldos

40

Gestin de Registros y Respaldos en el Contexto Hospitalario

3.4. Bacula
Caractersticas de la Herramienta

Permite respaldar sobre varios volmenes. No adecuado para realizar respaldos sobrescribiendo una misma cinta, ya que se cuenta con mecanismos de seguridad que no permiten sobrescribir datos.

Compuesto por 5 componentes: Director (Servidor), Consola, Cliente (FileDeamon), Almacenamiento y Monitor.

Incluye servicio de catalogo que le permite al administrador localizar y restaurar cualquier archivo as como ver los respaldos realizados hasta el momento.

Requiere realizar configuraciones en sus componentes. Soporte limitado para Windows (solo cliente). Tipos de respaldo: Completo, Incremental y Diferencial. Restauracin de respaldos mediante el propio Bacula. La ventaja es que incluye caractersticas como la de restaurar access control list (ACL) para cada archivo.

Bare-Metal recovery (restaurar servidor o cliente con los ltimos datos respaldados, en caso de falla en el disco).

Respalda sobre cinta, disco, usb, dvd. Interfaz grfica gnome, y varias interfaces web disponibles. Programador de tareas con ejecucin simultanea. Muy rpida restauracin de archivos individuales. Encriptacin PKI para datos y comunicacin sobre TLS. Soporte para archivos mayores a 2G y arquitecturas de 64 bits. Extensa documentacin. Testeo de unidades de cinta. Permite controlar el acceso de los usuarios solo a los archivos que le pertenecen.

Estado del Arte de Sistemas de Respaldos

41

Gestin de Registros y Respaldos en el Contexto Hospitalario

Anlisis de la Herramienta
Bacula se define como un conjunto de programas que permite al administrador del sistema manejar respaldos, restauraciones y verificaciones de datos sobre redes de computadores de diferentes tipos. Opcionalmente puede ejecutar en una nica maquina y respaldar a varios tipos de dispositivos, incluyendo cintas y discos. La arquitectura planteada por Bacula es del estilo Cliente-Servidor, mientras que su diseo modular, le permite adquirir escalabilidad de hasta el orden de cientos de computadores en red. Apunta a usuarios con un nivel de conocimientos avanzado sobre aplicaciones de respaldo, ya que su instalacin no es trivial. Los mdulos de Bacula son: Director Es la parte principal del software: administra los medios disponibles, la planificacin de tareas, control de dependencias, control de acceso y la presentacin de informes. Almacenamiento (Storage) Gestiona la interaccin con los medios utilizados para almacenar datos de la copia de seguridad y es la nica parte de Bacula que se comunica con los volmenes utilizados para dicho fin.

Consola (Console) La consola de administracin proporciona la interfaz de usuario para la gestin de tareas, de mensajes, e informacin de estado. Cliente (FileDeamon) Realiza la transferencia de datos desde el cliente hacia el servidor de almacenamiento. Debe ser instalado en cada mquina que se va a respaldar.

Catalog (Base de Datos) Almacena la informacin de los respaldos y configuraciones en una base de datos. Puede ser SQLite, MySQL y PostgreSQL.

Estado del Arte de Sistemas de Respaldos

42

Gestin de Registros y Respaldos en el Contexto Hospitalario

Puntos Fuertes y Dbiles de la Herramienta


Como caractersticas fuertes se destacan: Servicio de Catalogo. Respaldo en Mltiples Volmenes. Soporte para VSS, que permite realizar respaldos de archivos abiertos en windows. Recuperacin independiente Testeo de unidades de cinta

Servicio de Catalogo La caracterstica distintiva de Bacula es el servicio de catalogo, el cual permite consultar, y restaurar los respaldos que se desean. Para mantener un tamao de catalogo razonable Bacula permite configurar el tiempo de retencin de tareas, archivos y volmenes, es decir el tiempo que los metadatos de cada respaldo estarn disponibles en el catalogo. Respaldo en Mltiples Volmenes. Uno de los rasgos principales de Bacula es el soporte nativo para copias de seguridad multivolumen. Cuando est equipado con un cargador de cintas, Bacula puede intercambiar cintas sin ninguna intervencin humana (y, si esta configurado correctamente, puede etiquetar los nuevos volmenes sobre la marcha para apoyar este objetivo). Incluso en una mquina con un solo disco, Bacula pide automticamente, ya sea a travs de la consola o de correo electrnico, por el siguiente disco cuando se requiere. Recuperacin independiente Bacula permite crear un CD de arranque de Linux que contienen todo lo necesario para comenzar la restauracin de archivos. El proceso es un poco ms difcil (pero igual de eficaz) y se puede realizar un Linux, Solaris, FreeBSD y Windows.

Estado del Arte de Sistemas de Respaldos

43

Gestin de Registros y Respaldos en el Contexto Hospitalario

Testeo de unidades de cinta Posee una utilidad llamada btape que lee la configuracin que se ha definido para las unidades de cinta y ejecuta una amplia serie de pruebas de compatibilidad, incluyendo la lectura, la escritura, y varias operaciones de bsqueda. Si btape completa todas las pruebas con xito, usted puede estar seguro de que su unidad de cinta es a la vez compatible con Bacula y adems esta correctamente configurado. Como caractersticas dbiles se destacan: Si la cantidad de entradas en la base de datos alcanza las 1000 millones de entradas, el campo provocar un valor invlido, para evitarlo, el mismo puede ser modificado de 32 a 64 bits desde la versin 1.39 pero debe hacerse a mano. Los respaldos parciales e incrementales estn basados en timestamps (cantidad de segundos desde las 0 hs del 1ro de enero de 1970). Por lo tanto, si se mueven archivos o carpetas dentro de un directorio luego de haber realizado un respaldo completo del mismo, todos estos archivos o carpetas probablemente no sean respaldos por posteriores respaldos incrementales si estos tienen fechas anteriores. Se debe especificar explcitamente que se actualicen las fechas de todos los archivos o carpetas movidas.

Por lo general, se puede restaurar un respaldo hecho en un cliente en otro cliente. Sin embargo, si las arquitecturas son muy diferentes (Ej: 32 bits a 64 bits o Win32 a Unix), puede haber errores en los datos restaurados debido a que, por ejemplo, archivos comprimidos con Zlib de 64 bits, pueden no ser ledos correctamente en maquinas con Zlib de 32 bits

Estado del Arte de Sistemas de Respaldos

44

Gestin de Registros y Respaldos en el Contexto Hospitalario

Resumen de las caractersticas del programa


Caracterstica
Cdigo abierto Multiplataforma

Disponible (Si, No)


Si S

Detalle

Comentarios

Servidor requiere Linux/Unix. Soporta cualquier cliente.

Compresin Encriptacin Filtros

No Si Si MD5, SHA1 Extensin, subdirectorio, Completo, Incrementa, Diferencial. En volmenes Un volumen es un repositorio simple para la informacin respaldada Dispone tanto de filtros de inclusin como de exclusin.

Tipos de Respaldo

Si

Modo de Almacenamiento

Si

Lugar de Almacenamiento Respaldo de permisos y ACL de archivos Planificador de tareas Interfaz grfica Eficiencia y facilidad para restaurar respaldos Utilizacin de estndares para respaldo (tar, dump, zip). Cliente-Servidor Buena documentacin Extensibilidad para incorporar nuevas funcionalidades Soporte para respaldo de archivos abiertos Soporte para respaldo de bases de datos on-line (hot-backup)

Si Si

Discos, cintas, CDs, DVDs., USBs Requiere habilitar VSS en clientes windows.

Si Si Si S Si Si No Si Requiere activar VSS en clientes Windows. En Windows utiliza vss y en Linux usa scripts previstos por la comunidad Bacula gzip

Si

Estado del Arte de Sistemas de Respaldos

45

Gestin de Registros y Respaldos en el Contexto Hospitalario

3.5.

Legato NetWorker

Caractersticas Principales

Interfaz de administracin central. Operaciones de respaldo y recuperacin centralizadas para mantener el control completo de los datos involucrados.

Tipos de respaldo complete, incremental, diferencial y de consolidado. Permite programar tareas de respaldo. Personalizacin de respaldos de acuerdo al usuario. Capacidad de realizacin y recuperacin de respaldos en paralelo. Ejecucin de acciones pre y post procesamiento. Gestin de almacenamiento jerrquico. Puede configurarse para utilizar una red dedicada para realizar y recuperar respaldos.

Servidores soportados: Solaris, HP-UX, Tru64 UNIX, AIX, IRIX, Linux, Windows, NetWare

Permite respaldar y restaurar bases de datos: Oracle, Informix, Sybase, DB2, Microsoft SQL Server, MS Exchange, Lotus Notes.

Encriptacin de datos AES 256-bits tanto en el cliente como en el servidor de respaldos.

Deduplicacin de archivos permite almacenar nicamente 1 nica copia de archivos duplicados eliminando toda posible redundancia.

Se necesita instalar un cliente en los hosts a respaldar, esto permite restaurar servidor o cliente con los ltimos datos respaldados, en caso de falla en el disco (Bare-Metal recovery).

Capacidad de bsqueda avanzada, lo que permite disminuir el tiempo de acceso a los datos respaldados.

Soporta entornos de almacenamientos DAS (Almacenamiento directo), NAS (Almacenamiento en la red) y SAN (Redes de almacenamiento)

El protocolo de administracin de red que utiliza le permite tener acceso directo a los respaldos para realizar la restauracin a gran velocidad.

Estado del Arte de Sistemas de Respaldos

46

Gestin de Registros y Respaldos en el Contexto Hospitalario

Protege los datos locales y remotos mediante perfiles de usuario, listas de control de acceso y registro de sucesos (Logs).

Implementacin soporta paralelismo en la ejecucin y entrelazado de datos lo que le permite 512 respaldos simultneas y hasta 32 flujos de datos por cinta para maximizar la velocidad de copia de seguridad.

Los usuarios pueden realizar sus copias de seguridad, navegar y recuperar sus propios archivos.

Anlisis de la Herramienta
Legato implementa una arquitectura cliente - servidor integrando tres funcionalidades distintas: Cliente, Nodos de Almacenamiento y Servidor para proveer las capacidades y el rendimiento requerido para proteger y administrar la informacin de una gran variedad de redes. Los nodos de almacenamiento permiten balancear la carga dentro de la zona de datos as como proveer flexibilidad en la configuracin del entorno de redes grandes. Los clientes pueden ser respaldados en cualquier nodo de almacenamiento o servidor por medio de la red local (LAN), de redes extensas (WAN) o redes de almacenamiento (SAN). Legato habilita a los administradores a centralizar la administracin y las operaciones de respaldos automticos dentro de la zona de datos aplicando mltiples polticas de almacenamiento y procedimientos para los distintos clientes. Hay tres ediciones de Legato NetWorker Server, cada uno con un nivel de servicio diseados para satisfacer los diferentes tamaos y entornos informticos. complejidad de los

Estado del Arte de Sistemas de Respaldos

47

Gestin de Registros y Respaldos en el Contexto Hospitalario

Figura 13 Versiones de Legato NetWorker 6

Puntos Fuertes y Dbiles de la Herramienta

Como caractersticas fuertes se destacan: Escalabilidad ilimitada. Rendimiento. Dispositivos Concurrentes. Expansin de funcionalidades.

Escalabilidad ilimitada Administracin centralizada local y remotamente. La arquitectura cliente/servidor soporta respaldos automticos de cientos de miles de clientes y servidores pertenecientes a la red.

Estado del Arte de Sistemas de Respaldos

48

Gestin de Registros y Respaldos en el Contexto Hospitalario

Rendimiento Soporta hasta 32 sesiones de respaldos y de recuperacin simultneos por cada nodo de almacenamiento para la versin Network Edition, y hasta el 64 por Nodo de almacenamiento para la Power Edition. Hasta 512 copias de seguridad se pueden realizar en paralelo. Dispositivos Concurrentes Proporciona soporte para operaciones de respaldo y recuperacin concurrentes usando hasta 16 dispositivos de respaldo por servidor o nodo de almacenamiento en las versiones Network y Power Edition. Expansin de funcionalidades Legato puede ser expandido para proveer ms funcionalidades instalando los mdulos que se deseen. Como caractersticas dbiles se destacan:

Precio Es bastante elevado, la versin Workgroup Edition que soporta 8 clientes, cuesta alrededor de U$S 3000.

Resumen de las caractersticas del programa


Caracterstica
Cdigo abierto Multiplataforma Compresin

Disponible (Si, No)


No Si S

Detalle

Comentarios

Pero esta deshabilitada por defecto.

Encriptacin Filtros Tipos de Respaldo

Si Si Si Extensin, subdirectorio, Completo, Incrementa, Diferencial y Consolidado.

Modo de Almacenamiento

Si

Estado del Arte de Sistemas de Respaldos

49

Gestin de Registros y Respaldos en el Contexto Hospitalario

Lugar de Almacenamiento Respaldo de permisos y ACL de archivos Planificador de tareas Interfaz grfica Eficiencia y facilidad para restaurar respaldos Utilizacin de estndares para respaldo (tar, dump, zip). Cliente-Servidor

Si Si Si Si Si

Discos, cintas.

Para el administrador

Si el usuario quiere recuperar sus respaldos debe instalar un mdulo complementario.

No

Si

El software cliente se debe instalarse en los PC a respaldar. Manuales de Administracin, de usuarios y de instalacin. Se pueden instalar mdulos de la empresa para extender sus funcionalidades.

Buena documentacin Extensibilidad para incorporar nuevas funcionalidades Soporte para respaldo de archivos abiertos Soporte para respaldo de bases de datos on-line (hotbackup)

Si Si

Si Si Oracle, Informix, Sybase, DB2, Microsoft SQL Server, MS Exchange, Lotus Notes

Estado del Arte de Sistemas de Respaldos

50

Gestin de Registros y Respaldos en el Contexto Hospitalario

3.6. Acronis Backup and Recovery 10


Caractersticas Principales

Compatibilidad con VSS de Microsoft. Copias de seguridad simultneas. Copias de seguridad completa, incremental y diferencial. Exclusin de archivos durante las copias de seguridad. Permite guardar los respaldos en distintos medios simultneamente. Control del flujo de datos en la red. Creacin de discos de inicio. Conversin de copias de seguridad en mquinas virtuales. Comandos pre y post respaldos. Gestin centralizada. Distribucin de copias de seguridad en un intervalo de tiempo Copias de seguridad basadas en eventos o en condiciones. Consolidacin de respaldos diferenciales o incrementales. Grupos de usuarios para el control de acceso y gestin centralizada. Permite respaldar un dispositivos de red, usb, firewire y unidades extrables. Deduplicacin a nivel de archivo o de bloque. Instaladores para Windows y Linux

En la pgina de Acronis [20] se enumeran mas de 50 caractersticas de las cuales elegimos las ms destacadas.

Anlisis de la Herramienta
Acronis Backup & Recovery 10 simplifica y automatiza los procesos de copia de seguridad y recuperacin de informacin en clientes y servidores en los entornos Windows y Linux y en plataformas fsicas y virtuales. Estos productos estn basados en tecnologas patentadas de creacin de imgenes de disco y restauracin desde cero. Ofrece a las organizaciones medianas y grandes una solucin sencilla para gestionar de forma centralizada todas las actividades de copia de seguridad y restauracin a travs de la red.

Estado del Arte de Sistemas de Respaldos

51

Gestin de Registros y Respaldos en el Contexto Hospitalario

Todo el contenido del disco duro, incluidos el sistema operativo, las aplicaciones y los datos, se puede recuperar en cuestin de minutos. Adems, con la opcin Universal Restore de Acronis Backup & Recovery 10, es fcil restaurar una imagen de copia de seguridad en un hardware diferente, incluidas las mquinas virtuales. Permite la gestin basada en polticas de todas las operaciones de copia de seguridad y restauracin desde una nica consola en cualquier lugar de la red. Adems, un panel de control centralizado proporciona una visin general de las operaciones configuradas y en marcha que hay en todos los sistemas, lo que mejora el control y la toma de decisiones. Admite una amplia gama de dispositivos de almacenamiento y ubicaciones, incluidos los discos conectados localmente, NAS (Almacenamiento conectado a la red), SAN (Red de almacenamiento), servidores FTP y dispositivos pticos, as como la exclusiva particin de Acronis Secure Zone. Acronis Secure Zone es una particin segura del disco duro local, desde la que se puede recuperar cualquier archivo o el sistema entero, sin tener que utilizar un medio de inicio.

Acronis Backup & Recovery 10 est diseado para satisfacer las necesidades de la red de infraestructuras distribuidas y permite su utilizacin con miles de maquinas. La forma de brindar soporte a una red mayor es mediante la adicin de recursos como espacio de disco en forma de bvedas (contenedores de copia de seguridad), y los nodos de almacenamiento de Acronis para gestionar la carga de trabajo de respaldos nuevos, manteniendo la capacidad de gestionar de forma centralizada toda la infraestructura. Un dominio puede ser actualizado para manejar hasta 20 nodos de almacenamiento que a su vez administre hasta 20 discos/cintas, todo ello gestionado por un servidor de gestin. Copia de seguridad se transmiten directamente de las mquinas gestionadas (clientes) a los nodos de almacenamiento y guardado en las bvedas.

Nodos de almacenamiento Se encargan del control y la optimizacin de los recursos de almacenamiento. Esto reduce el trabajo en los equipos administrados debido a que se encarga de los servicios de gestin de los respaldos, consolidacin y validacin, lo que evita el consumo de recursos de los clientes. Son la clave para permitir a la arquitectura ofrecer una gran flexibilidad y escalabilidad. Los administradores pueden agregar recursos de almacenamiento cada vez que el trabajo aumente. Soporta gran variedad de dispositivos como discos locales, recursos compartidos de red, SAN, NAS y libreras de cintas.

Estado del Arte de Sistemas de Respaldos

52

Gestin de Registros y Respaldos en el Contexto Hospitalario

Usualmente estn localizados cerca de las maquinas de administracin pero pueden ser administrados desde cualquier parte de la red. Es aqu tambin donde se realiza la deduplicacin de archivos, o sea, se detectan y eliminan los archivos o bloques duplicados lo que usualmente reduce el espacio utilizado hasta en un 90%. Esta caracterstica puede ser desactivada si se desea. Para asegurar la seguridad de los respaldos, estos son encriptados utilizando el algoritmo AES de 256 bits tanto en las maquinas administradas como en los nodos de almacenamiento. Pero se sugiere hacerlo en los nodos de almacenamiento debido a que reduce el consumo de procesador en la maquina cliente. Todos los nodos de almacenamientos estn registrados y dirigidos por el servidor donde esta instalado el administrador donde se pueden realizar las realiza todas las configuraciones y la gestin centralizada de la consola.

Consola de Administracin La administracin puede tornarse complicada cuando se debe controlar un entorno de cientos de maquinas. Acronis Backup & Recovery 10 utiliza una consola que permite al administrador realizar un manejo centralizado de las actividades. Desde cualquier lugar de la red el administrador puede conectarse a al servidor de administracin y realizar actividades de administracin. Desde aqu el administrador puede controlar las polticas de respaldo, clientes (fsicos o virtuales) y nodos de almacenamiento. Esta es muy intuitiva y puede ser operada con un mnimo de entrenamiento. La administracin de polticas de respaldo elimina la necesidad de crear tareas de respaldos para cada maquina cliente. Una poltica de respaldo puede ser creada y aplicada a varios clientes, ahorrando tiempo y evitando crear tareas de respaldos que se apartan de las polticas de respaldo que puede haber definido la empresa.

Por ejemplo, una poltica puede ser: crear copias de seguridad completas de todos los servidores pertenecientes al rea de administracin, especificando el destino del respaldo y el da y la hora en que se debe ejecutar. Estas polticas ahorran trabajo al administrador y sin ellas, los administradores deben definir y gestionar miles de tareas de respaldos de las mquinas administradas

Todos los clientes, fsicos o virtuales, son registrados en el servidor de respaldos y se pueden ver en la consola de administracin. Se pueden crear grupos para organizar las maquinas gestionadas en grupos lgicos y as facilitar la creacin de polticas de respaldo y

Estado del Arte de Sistemas de Respaldos

53

Gestin de Registros y Respaldos en el Contexto Hospitalario

el reporte de eventos segn el grupo. Una maquina puede pertenecer a mas de un grupo para maximizar la flexibilidad. Toda la administracin de los nodos de almacenamiento, actividades de configuracin, deduplicacin, encriptado y almacenamiento de archivos son realizados a travs de la consola de administracin. El administrador tambin puede examinar los archivos que existen en la bveda e iniciar tareas de consolidacin, validacin, caducidad y limpieza de respaldos.

Puntos Fuertes y Dbiles de la Herramienta


Como caractersticas fuertes se destacan: Gestin centralizada que mejora la productividad de Adminsitrador. Ahorros en costes de almacenamiento y red mediante la deduplicacin de datos. Prestaciones avanzadas de programacin. Recuperacin de un sistema entero o un solo archivo o carpeta El producto exclusivo Acronis Secure Zone and Startup Recovery Manager simplifica la recuperacin. Soporte de virtualizacin Copia de seguridad basada en eventos Distribucin de copias de seguridad en un intervalo de tiempo

Gestin centralizada que mejora la productividad de Adminsitrador Los procesos de copia de seguridad y recuperacin de todas las estaciones de trabajo se realizan desde una nica ubicacin de gestin situada en cualquier lugar de la red, con la capacidad de automatizar los procesos mediante comandos basados en polticas. Adems, un tablero de control centralizado proporciona una visin general de las operaciones configuradas y en ejecucin en todos los sistemas, lo que mejora el control y la toma de decisiones. Ahorros en costes de almacenamiento y red mediante la deduplicacin de datos Al eliminar copias de seguridad de los mismos datos de varios equipos, puede obtener ahorros importantes en almacenamiento y en ancho de banda de red. El software opcional Acronis Backup & Recovery 10 Deduplication ofrece una deduplicacin de software a nivel de archivo y de bloque, lo que es til para que las organizaciones de cualquier tamao utilicen mejor su infraestructura de almacenamiento y reduzcan los gastos en almacenamiento de datos.

Estado del Arte de Sistemas de Respaldos

54

Gestin de Registros y Respaldos en el Contexto Hospitalario

Prestaciones avanzadas de programacin Las copias de seguridad pueden activarse en funcin de condiciones y sucesos preestablecidos como, por ejemplo, la instalacin de un nuevo programa, el fin de la sesin o la adicin de un volumen determinado de nuevos datos al sistema. Se incluyen plantillas para esquemas de rotacin de copias de seguridad como, por ejemplo, Torre de Hanoi y Abuelo-Padre-Hijo. Recuperacin de un sistema entero o un solo archivo o carpeta Las recuperaciones basadas en imgenes de Acronis dan la granularidad necesaria para cualquier clase de recuperacin, lo que le permite volver a la actividad empresarial rpidamente. El producto exclusivo Acronis Secure Zone and Startup Recovery Manager simplifica la recuperacin. Realice la recuperacin directamente de Acronis Secure Zone, una particin oculta, booteable y segura que hay en su disco duro local. Si el sistema no arranca correctamente, pulse F11 durante el arranque del sistema para iniciar Acronis Backup & Recovery. Soporte de virtualizacin Conversin de la copia de seguridad de imagen a una mquina virtual. Recupere una copia de seguridad de disco (volumen) a una mquina virtual nueva de cualquiera de los tipos siguientes: VMware Workstation, Microsoft Virtual PC, Parallels Workstation o dispositivo virtual Citrix XenServer. Copia de seguridad basada en eventos Cree copias de seguridad activadas por diversas condiciones un usuario inicia la sesin, un equipo se apaga, u otras. Configure que las operaciones de copia de seguridad esperen hasta que se den unas condiciones especficas, como un intervalo de tiempo predefinido o que un usuario finalice la sesin. Configure eventos y condiciones especficos para cada tarea.

Estado del Arte de Sistemas de Respaldos

55

Gestin de Registros y Respaldos en el Contexto Hospitalario

Distribucin de copias de seguridad en un intervalo de tiempo Evita la sobrecarga de las redes distribuyendo las actividades de copia de seguridad en una ventana de tiempo permitido. Cambie automticamente las horas de inicio de las tareas en cada una de las mquinas. Como caractersticas fuertes se destacan:

Precio El precio de la licencia del software para el servidor Acronis Backup & Recovery 10 Server cuesta U$S 853. La de los clientes cuesta U$S 74 c/u y si se desea la opcin Universal Restore el precio es de U$S 89 c/u.

Resumen de las caractersticas del programa


Caracterstica
Cdigo abierto Multiplataforma Compresin Encriptacin Filtros Tipos de Respaldo Modo de Almacenamiento Lugar de Almacenamiento

Disponible (Si, No)


No Si S Si Si Si Si Si

Detalle

Comentarios

Pero esta deshabilitada por defecto. Extensin, subdirectorio, Completo, Incrementa, Diferencial, Consolidado. Imagen DAS,NAS, SAN, raid, firewire, USB, CDs, DVDs., cintas.

Respaldo de permisos y ACL de archivos Planificador de tareas Interfaz grfica Eficiencia y facilidad para restaurar respaldos Utilizacin de estndares para respaldo (tar, dump, zip). Cliente-Servidor

Si Si Si Si No

Si

El software cliente se debe instalarse en los PC a respaldar. Manuales de Administracin,

Buena documentacin

Si

Estado del Arte de Sistemas de Respaldos

56

Gestin de Registros y Respaldos en el Contexto Hospitalario

de usuarios, de instalacin y referencia de lnea de comandos. Extensibilidad para incorporar nuevas funcionalidades Soporte para respaldo de archivos abiertos Soporte para respaldo de bases de datos on-line (hotbackup) Si Se pueden instalar mdulos de la empresa para extender sus funcionalidades.

Si Si Adems dispone de otro producto: Acronis Recovery para MS SQL Server que se especializa en este manejador de base de datos.

Estado del Arte de Sistemas de Respaldos

57

Gestin de Registros y Respaldos en el Contexto Hospitalario

4. Conclusiones
En base a esto se plante por un lado, la bsqueda e investigacin de las herramientas actuales de respaldo de informacin para as realizar un Estado del Arte con ventajas y desventajas de cada una de ellas con el fin de hacer una recomendacin fundamentada de cul es la que ms funcionalidad brinda y mejor se adapta al entorno de trabajo existente en el Hospital. El estudio abarco los siguientes programas de respaldos: Areca Backup BackupPC AMANDA Bacula EMC Legato NetWorker Acronis BackUp and Recovery

En base a dicho estudio se llega a las siguientes conclusiones: 1. Las herramientas pagas ofrecen excelentes caractersticas, entre ellas, respaldos de bases de datos en uso, programacin de tareas de respaldo y restauracin y bsqueda de archivos, adems de interfaces de administracin y configuracin muy amigables, intuitivas y completas pero su costo es elevado, en particular la versin Workgroup Edition de Legato Networker que soporta 8 clientes, cuesta alrededor de U$S 3000 y la licencia del software para el servidor Acronis Backup & Recovery 10 Server cuesta U$S 853, mientras que la de los clientes cuesta U$S 74 c/u y si se desea la opcin Universal Restore el precio es de U$S 89 c/u. (Para 8 clientes con Universal Restore el precio es de U$S 1565 ) lo que se vuelve una solucin extremadamente cara para instalar en las cientos de mquinas existentes en el Hospital de Clnicas. 2. De las herramientas gratuitas estudiadas, Bacula permite el respaldo de bases de datos en uso, programacin de tareas de respaldo y restauracin, bsqueda de archivos e interfaz grfica donde realizar configuraciones y visualizar el estado de las tareas de respaldo. Del resto de los programas, dos no respaldan bases de datos en uso (como Areca y BackupPC) y uno no poseen interfaz grfica para realizar configuraciones facilitar su

utilizacin (AMANDA). Es por esto que se concluye que, de las herramientas estudiadas, `Bacula` es la que mejor se adapta a los requerimientos especificados por los clientes.

Estado del Arte de Sistemas de Respaldos

58

Gestin de Registros y Respaldos en el Contexto Hospitalario

5. Herramienta Elegida: BACULA


A continuacin se detallan los componentes del programa de respaldo escogido, cmo se integran los mismos y sus respectivas funcionalidades, finalizando con una gua paso a paso para su instalacin y configuracin.

4.1. Descripcin General


Es una herramienta de respaldo que no esta dirigido a realizar imgenes de sistemas ni orientado a restaurar sistemas completos, sino que realiza copias de seguridad a nivel de archivos. Bacula implementa 5 mdulos independientes: el Director o programa que gestiona las copias de seguridad, el Catlogo que es el encargado de almacenar en una base de datos todas las acciones realizadas y la informacin referida a los respaldos (archivos, localizacin, metadatos, etc), el componente encargado del Almacenamiento de los datos, los Clientes y por ltimo la Consola que es donde se accede a la informacin y configuracin del resto de los componentes.

Figura 14 Esquema simple de la arquitectura de Bacula

El Director solo puede ser instalado en sistemas Linux/Unix mientras que el resto de los componentes pueden ser instalados tanto en Windows, Linux o Mac.

Estado del Arte de Sistemas de Respaldos

59

Gestin de Registros y Respaldos en el Contexto Hospitalario

En el caso de ejemplo desarrollado todos los componentes estarn instalados en la misma computadora, ms precisamente un mquina virtual con sistema operativo Debian Lenny con el fin de ofrecer una visin general del programa y dando las herramientas necesarias para poder realizar la configuracin en un sistema en particular, pero en realidad el sistema permite repartir sus funciones en procesos independientes, cada uno en una mquina diferente, de forma de mantener el mximo control a la hora de poner en produccin las diferentes.

Estado del Arte de Sistemas de Respaldos

60

Gestin de Registros y Respaldos en el Contexto Hospitalario

4.2. Arquitectura de Bacula


Cmo ya mencionamos, Bacula esta compuesto por 5 mdulos, Director, Consola, Almacenamiento, Catalogo y Cliente, en esta seccin describiremos de forma general la funcionalidad de cada uno de ellos (por detalles ver [18]): Director: Es el eje central de la solucin, controla el flujo de datos, supervisa todas las funciones necesarias para las operaciones de copia y posterior restauracin, le indica a los clientes que comiencen a empaquetar los archivos para enviarlo al almacenamiento, etc. En l se declaran todos los parmetros necesarios, siendo el mdulo ms difcil de configurar. Realiza los backups siguiendo las pautas dadas en las tareas que se programaron, pero tambin se pueden realizar backups y otras operaciones a mano, mediante la herramienta de administracin (bconsole) o, en nuestro caso, la interfaz Webmin. Es importante destacar que los datos no pasan por el director, sino que transitan directamente desde los Clientes al Almacenamiento lo que hace menor el tiempo de ejecucin del respaldo y no sobrecarga los recursos (la red por ejemplo) innecesariamente. Cliente (File Daemon - FD): Es el proceso que se ejecuta en la mquina que se va a respaldar y es especfico al sistema operativo donde se ejecuta. Tiene como objetivo empaquetar los datos y enviarlos al Almacenamiento. Almacenamiento (Storage Daemon - SD): Se encarga de manejar los dispositivos fsicos donde se guardarn los datos y es el responsable de escribir y leer en cada uno de los medios que se utilizarn para las copias de seguridad Bacula es compatible con mltiples volmenes y mltiples configuraciones de copia en cada uno de ellos Consola: Es el programa que permite la interaccin entre el administrador del sistema y el mdulo Director, de manera que se accede a todas las funcionalidades de Bacula. Originalmente era un programa en modo texto, que sigue siendo vlido, aunque hay interfaces grficas y webs disponibles (nosotros utilizaremos Webmin) que hacen el manejo muy simple. Catalogo: Es un proceso que interacta con la base de datos y mantiene la informacin necesaria para la administracin de Bacula. Generalmente esta instalado en la misma mquina que el Director pero no es restrictivo. Bsicamente es una base de datos donde quedan grabados todos los procesos de copia y la informacin de todos los archivos que lo componen, con su fecha, tamao, lugar donde se

Estado del Arte de Sistemas de Respaldos

61

Gestin de Registros y Respaldos en el Contexto Hospitalario

restauran, lugar donde se almacenan fsicamente etc. Es una especie de ndice de todo lo que va ocurriendo. No contiene los archivos en si mismos. Las bases de datos soportadas son MySQL, PostgreSQL y SQlite. (nosotros utilizaremos MySQL). Y por ltimo, si bien no es parte de los mdulos del programa, se puede considerar el Monitor que es una interfaz que permite examinar el estado de las copias y el de cada uno de los componentes del sistema. Al igual que para la consola utilizaremos Webmin.

Figura 15 Interaccin de los componentes de Bacula

Estado del Arte de Sistemas de Respaldos

62

Gestin de Registros y Respaldos en el Contexto Hospitalario

4.3. Configuracin de Bacula


Para organizar los distintos mdulos de Bacula y lograr que se reconozcan entre si hay que modificar 4 archivos, el que establece las caractersticas del Director (bacula.dir.conf), el del Almacenamiento (bacula.sd.conf), el de la Consola (bconsole.conf) y el del Cliente (bacula.fd.conf, diferente para cada uno de los clientes). La configuracin es sencilla si tenemos un ejemplo para seguir, por esta razn describiremos las secciones de cada uno de los archivos mencionados y mostraremos la configuracin de utilizada para el caso de prueba. Hay que tener siempre presente que es el Director el que se autentica contra el resto de los mdulos, y no al contrario, por lo que estos deben conocer la identidad del Director.

4.3.1. Elementos del bacula-dir.conf


Este es el archivo de configuracin del Bacula Director. En este archivo se definen los detalles del Director, las tareas de respaldos, sus polticas, etc, Los elementos que se deben definir en este archivo son: Director: Donde se especifica la configuracin del Director. Entre las opciones de configuracin, se especifica la IP y el puerto donde est escuchando el director, la cantidad de tareas concurrentes que se pueden ejecutar como mximo, etc. Storage: Donde se indica en que IP y puerto escucha el mdulo de Almacenamiento, el password que debe usar para identificarse contra l y el nombre y tipo del dispositivo de almacenamiento. Catalog: Tiene la informacin para conectarse a la base de datos donde se almacena la informacin de los respaldos (usuario, password, nombre de la tabla) Messages: Se define que mensajes se va a generar Bacula, por ejemplo, que enve emails con el estado de los backups, que genere logs de todos los jobs que salieron mal, que ejecute un script despus de cada job, etc. Schedule: Sirve para implementar la poltica del respaldo, junto con las opciones definidas en el elemento pool. Define cuando se debe realizar una tarea y en donde se debe almacenar/recuperar la informacin.

Estado del Arte de Sistemas de Respaldos

63

Gestin de Registros y Respaldos en el Contexto Hospitalario

Pool: Es un objeto lgico que se utiliza para agrupar volmenes. Todos los volmenes de un pool comparten las caractersticas definidas en ese pool. Los pools complementan a los schedules, y entre los dos implementan la poltica del respaldo. JobDefs: Este elemento es un esqueleto para las tareas de respaldos (jobs). Se especifican parmetros por defecto. Si un job hace referencia a un JobDefs y no especifica un parmetro, toma el que est definido en el jobDefs (en caso de que ah este definido). Job: Ac se agrupan la informacin definida anteriormente (Pool, Schudele, Type, etc) para definir la tarea. Bacula ejecuta los jobs automticamente slo si tiene un schedule asociado, Si no lo tiene, la nica forma de ejecutarlo es manualmente. Hay tres clases de jobs: Backup, Restore y Verify (verifica que los atributos de los archivos originales sean iguales a los atributos guardados en la base de datos para esos archivos) Client: Se indican los clientes que se van a respaldar especificando un nombre, la IP donde se encuentra, el puerto en el que escucha y el password con el que el director se tiene que autenticar. FileSet: Ac decimos los directorios y archivos que se deben respaldar. Tambin se especifica si se deben encriptar los datos (md5 o sha1), comprimirlos o si hay archivos o carpetas que se deben excluir del respaldo.

Por ms detalles acerca de la configuracin del Director, los elementos que lo componen y si significado y funcionalidad ver [21].

Estado del Arte de Sistemas de Respaldos

64

Gestin de Registros y Respaldos en el Contexto Hospitalario

4.3.2. Elementos del bacula-sd.conf


En este archivo est la configuracin del mdulo de Almacenamiento de Bacula, es donde define la ubicacin del mismo y los dispositivos de almacenamientos disponibles donde se van a almacenar fsicamente los datos respaldados. Los elementos que hay que configurar son: Storage: Donde se especifica las caractersticas del mdulo, como el nombre y la IP y el puerto donde est escuchando el mdulo Almacenamiento. En el archivo de configuracin solo puede haber una definicin de este elemento. Director: Especifica el nombre del director que tiene autorizacin para utilizar los servicios del demonio de Almacenamiento y el password que utiliza para autenticarse, por lo que debe coincidir con los valores correspondientes en el archivo de configuracin del director. Puede haber mltiples recursos Director. Device: Especifica los detalles de cada dispositivo de almacenamiento que puede ser usado por el modulo de Almacenamiento. Se pueden definir mltiples recursos de

almacenamientos para ser usados. Messages: Donde se definen los mensajes de error e informacin que se deben generar y adonde se envan.

Por ms detalles acerca de la configuracin del Almacenamiento en [22].

Estado del Arte de Sistemas de Respaldos

65

Gestin de Registros y Respaldos en el Contexto Hospitalario

4.3.3. Elementos del bacula-fd.conf


En este archivo se configura el cliente y es uno de los ms sencillos de configurar. Este archivo esta alojado en la maquina que se va a respaldar y no en el director habiendo solo uno por cliente. Los elementos que hay que configurar son: Client (o FileDaemon): Define el nombre del cliente, as como la IP del equipo donde esta alojado y el puerto por el cual escucha las conexiones de Director. El Director identifica al cliente especificado en la tarea de respaldo mediante el nombre definido en este elemento. Director: Especifica el nombre del director que tiene autorizacin para respaldarlo y el password que utiliza para autenticarse, por lo que debe coincidir con los valores correspondientes en el archivo de configuracin del Director. Puede haber mltiples recursos Director. Messages: Igual funcionalidad que en los otros mdulos.

Por ms detalles acerca de la configuracin del Cliente en [23].

4.3.4. Elementos del bconsole.conf


El archivo de configuracin de la Consola es el ms simple de todos los archivos de configuracin debido a que solo tiene el elemento Director (pueden ser varios) y solo hay que cambiar es el nombre y la contrasea segn corresponda.

La figura siguiente muestra las tpicas interacciones entre los servicios de Bacula para la ejecucin de un respaldo El Director inicia y gestiona estas interacciones adems de administrar el Catalogo.

Estado del Arte de Sistemas de Respaldos

66

Gestin de Registros y Respaldos en el Contexto Hospitalario

4.4. Configuracin del Caso de Prueba


Ahora vamos a ver una configuracin en particular de Bacula. En este ejemplo el Director, Storage, Consola, Cliente y Catalogo corren en la misma mquina. bacula-dir.conf: A continuacin se muestra la configuracin del Director de nombre debian-dir: # Definimos al Director Director { Name = debian-dir Description = "Bacula director" DirAddress = 127.0.0.1 DIRport = 9101 QueryFile = "/etc/bacula/scripts/query.sql" WorkingDirectory = "/var/lib/bacula" PidDirectory = "/var/run/bacula" Maximum Concurrent Jobs = 1 Password = "debian-dir" Messages = Daemon } # Establecemos los detalles de la base de datos que el Director utilizar para almacenar la informacin. Se define aqu debido a que no tiene un archivo de configuracin. Catalog { Name = "BaculaDB" dbname = "bacula"; dbuser = "bacula"; dbpassword = "pgrado" } # Informamos la ubicacin del mdulo de Almacenamiento y el pass que debe usar el director para identificarse. Storage { Name = File Address = 127.0.0.1 SDPort = 9103 Password = "debian-dir" Device = CarpetaRespaldos Media Type = File }

Estado del Arte de Sistemas de Respaldos

67

Gestin de Registros y Respaldos en el Contexto Hospitalario

# Precisamos que mensajes queremos que se generen y a donde se envan Messages { Name = Standard mailcommand = "/usr/lib/bacula/bsmtp -h localhost -f \"\(Bacula\) \<%r\>\" -s \"Bacula: %t %e of %c %l\" %r" operatorcommand = "/usr/lib/bacula/bsmtp -h localhost -f \"\(Bacula\) \<%r\>\" -s \"Bacula: Intervention needed for %j\" %r" mail = root@localhost = all, !skipped operator = root@localhost = mount console = all, !skipped, !saved append = "/var/lib/bacula/log" = all, !skipped } # Informamos la ubicacin del Cliente que se va a respaldar y el pass que debe usar el director para identificarse. Tambin se indica cuanto tiempo se mantiene la informacin respaldada. Client { Name = debian-fd Address = 127.0.0.1 FDPort = 9102 Catalog = "BaculaDB" Password = "debian-dir" File Retention = 30 days Job Retention = 2 months AutoPrune = yes } # Sealamos que informacin queremos respaldar y cual no. Tambin definimos el algoritmo de compresin y el algoritmo para encriptar los datos. FileSet { Name = "Respaldo_Escritorio" Include { Options { signature = MD5 compression=GZIP9 } File = /home/pgrado/Desktop/Bacula } Exclude{ File = /home/pgrado/Desktop/Bacula/Conf_Ejemplo } }

Estado del Arte de Sistemas de Respaldos

68

Gestin de Registros y Respaldos en el Contexto Hospitalario

# Especificamos el tipo y la periodicidad del respaldo. Schedule { Name = "CicloSemanal" Run = Incremental mon-sat at 01:05 Run = Full sun at 01:05 } # Declaramos los volmenes de almacenamiento (cintas discos) utilizados por el programa para guardar datos Pool { Name = Respaldo Pool Type = Backup Recycle = yes AutoPrune = yes Volume Retention = 365 days # one year } # Definimos que tarea de respaldo y restauracin Job { Name = "Respaldo_Escritorio" Type = Backup Level = Incremental Client = debian-fd FileSet = "Respaldo_Escritorio" Schedule = "CicloSemanal" Storage = File Messages = Standard Pool = Respaldo Priority = 10 Write Bootstrap = "/var/lib/bacula/client1.bsr" } Job { Name = "Restaurar_Escritorio" Type = Restore Client = debian-fd FileSet = "Respaldo_Escritorio" Storage = File Pool = Respaldo Messages = Standard Write Bootstrap = "/var/lib/bacula/client1.bsr" Where = / }

Estado del Arte de Sistemas de Respaldos

69

Gestin de Registros y Respaldos en el Contexto Hospitalario

bacula-sd.conf: Los recursos que se configuran en un archivo son los relativos al Almacenamiento y son: # Definimos el Almacenamiento Storage { Name = debian-sd SDAddress = 127.0.0.1 SDPort = 9103 WorkingDirectory = "/var/lib/bacula" Pid Directory = "/var/run/bacula" Maximum Concurrent Jobs = 20 } # Especificamos el nombre y la contrasea que usara el Director para identificarse. Director { Name = debian-dir Password = "debian-dir" } # Detallamos el dispositivo donde se almacenara el respaldo. Device { Name = CarpetaRespaldos Media Type = File Archive Device = /backups LabelMedia = yes; Random Access = Yes; AutomaticMount = yes; RemovableMedia = no; AlwaysOpen = yes; } # Precisamos que mensajes queremos que se generen y a donde se envan Messages { Name = Standard director = bacula-dir = all }

Estado del Arte de Sistemas de Respaldos

70

Gestin de Registros y Respaldos en el Contexto Hospitalario

bacula-fd.conf: Este archivo de configuracin est en cada Cliente Bacula. Los recursos que se tienen que configurar son: # Definimos el Almacenamiento FileDaemon { Name = debian-fd FDAddress = 127.0.0.1 FDport = 9102 WorkingDirectory = /var/lib/bacula Pid Directory = /var/run/bacula Maximum Concurrent Jobs = 20 } # Especificamos el nombre y la contrasea que usara el Director para identificarse. Director { Name = debian-dir Password = "debian-dir" } # Precisamos que mensajes queremos que se generen y a donde se envan Messages { Name = Standard director = debian-dir = all, !skipped, !restored }

Estado del Arte de Sistemas de Respaldos

71

Gestin de Registros y Respaldos en el Contexto Hospitalario

bconsole.conf: El archivo de configuracin de la consola es el ms sencillo, debido a que solo hay que definir los datos del director: Director { Name = debian-dir address = 127.0.0.1 DIRport = 9101 Password = "debian-dir" }

Como se observa en los ejemplos, todos los mdulos tienen un nombre y una contrasea, los que deben coincidir para lograr que estos se comuniquen. Para simplificar el ejemplo, el password que utilizamos siempre es "debian-dir" pero esto no es necesario. La siguiente figura muestra un esquema con la relacin que debe haber entre los distintos mdulos y los usuarios y contraseas definidos en ellos.

Figura 16 - Esquema con la relacin entre los distintos mdulos de Bacula.

Estado del Arte de Sistemas de Respaldos

72

Gestin de Registros y Respaldos en el Contexto Hospitalario

6. Referencias:
[1] DataLossDB Open Security Fundation - Stats http://datalossdb.org/statistics [2] CXO Community http://cxo-community.com/articulos/estadisticas/estadisticas-seguridadcorporativa/2095-las-pidas-de-datos-iren-aumento-segl-pronco-de-kpmg.html [3] DataLossDB Open Security Fundation http://datalossdb.org/ [4] Identity Theft Resource Center http://www.idtheftcenter.org/ [5] The Information Commissioners Office http://www.ico.gov.uk/ [6] DataLossDB Open Security Fundation - Incidents http://datalossdb.org/incidents/2566-documents-of-50-students-discarded-in-trashcontained-names-addresses-medical-records-health-numbers-and-transcripts [7] DataLossDB Open Security Fundation - Incidents http://datalossdb.org/incidents/2559-stolen-laptop-contained-8-000-patients-namesdates-of-birth-and-medical-record-numbers http://www.fox10tv.com/dpp/mobile_news/thief-boldly-steals-medical-computer [8] Unix Backup and Recovery - W. Curtis Preston http://books.google.com/books?id=_i1sO47qNnMC&lpg=PA373&ots=kjdHKjGo5C& dq=Unix%20Backup%20and%20Recovery%20online&pg=PP1#v=onepage&q=Uni x%20Backup%20and%20Recovery%20online&f=false [9] Enterprise Systems Backup and Recovery: A Corporate Insurance Policy - Preston de Guise - Captulo 3 http://books.google.com/books?id=2OtqvySBTu4C&lpg=PP1&dq=Backup%20%26 %20Recovery&hl=es&pg=PA37#v=onepage&q=Full%20Level&f=false [10] Proteccin contina de datos http://www.articulosinformativos.com.mx/Proteccion_continua_de_datosa936314.html [11] Respaldo Sinttico http://www.msexchange.org/articles_tutorials/exchange-server-2007/highavailability-recovery/synthetic-backup-data-protection.html [12] Niveles de RAID http://bytepile.com/raid_class.php http://www.acnc.com/04_01_50.html

Estado del Arte de Sistemas de Respaldos

73

Gestin de Registros y Respaldos en el Contexto Hospitalario

[13] Software Libre http://www.gnu.org/philosophy/free-sw.es.html [14] Deduplicacin de Archivos http://backuppc.sourceforge.net/faq/BackupPC.html#backuppc_design [15] Areca: http://www.areca-backup.org/documentation.php [16] BackUp PC http://backuppc.sourceforge.net http://wiki.zmanda.com/index.php/Backuppc http://www.backupcentral.com/components/com_mambowiki/index.php/BackupPC [17] AMANDA http://amanda.zmanda.com/ http://wiki.zmanda.com/index.php/Main_Page http://www.backupcentral.com/components/com_mambowiki/index.php/AMANDA http://www.zmanda.com/download-amanda.php http://www.zmanda.com/amanda-enterprise-edition.html [18] Bacula: http://www.bacula.org/es/?page=documentation http://www.ceslcam.com/images/stories/noticias/pdf/Analisis-Bacula.pdf http://www.ldc.usb.ve/~jolimar/coloquioBacula.pdf http://wiki.bacula.org/doku.php?id=comparisons http://www.backupcentral.com/components/com_mambowiki/index.php/Category:B ackup_%26_Recovery_-_Current_Edition [19] Legato http://www.emc.com/products/detail/software/networker.htm http://dlc.sun.com/pdf/875-3427-10/875-3427-10.pdf [20] Acronis http://www.acronis.com/enterprise/ http://www.acronis.com.mx/enterprise/download/docs/ [21] Configuracin del Mdulo Director de Bacula. http://www.bacula.org/en/dev-manual/main/main/Configuring_Director.html [22] Configuracin del Mdulo Almacenamiento de Bacula. http://www.bacula.org/en/devmanual/main/main/Storage_Daemon_Configuratio.html [23] Configuracin del Mdulo Cliente de Bacula. http://www.bacula.org/en/dev-manual/main/main/Client_File_daemon_Configur.html

Estado del Arte de Sistemas de Respaldos

74

Вам также может понравиться