Академический Документы
Профессиональный Документы
Культура Документы
Proyecto de grado
Edicin 2009
Contenido
1. 2. 3. Introduccin........................................................................................................... 4 Situacin actual en el Hospital de Clnicas .......................................................... 12 Herramientas de respaldo existentes .................................................................. 14 3.1. 3.2. 3.3. 3.4. 3.5. 3.6. 4. 5. Areca BackUp .............................................................................................. 19 BackUp PC .................................................................................................. 25 AMANDA (Advanced Maryland Automatic Network Disk Archiver)............... 33 Bacula .......................................................................................................... 41 Legato NetWorker ........................................................................................ 46 Acronis Backup and Recovery 10................................................................. 51
Conclusiones....................................................................................................... 58 Herramienta Elegida: BACULA............................................................................ 59 4.1. 4.2. 4.3. 4.4. Descripcin General..................................................................................... 59 Arquitectura de Bacula ................................................................................. 61 Configuracin de Bacula .............................................................................. 63 Configuracin del Caso de Prueba............................................................... 67
6.
Referencias: ........................................................................................................ 73
Tabla de Figuras
Figura 1 - Causas de Prdida de Informacin [1]............................................................. 4 Figura 2 - Topologa Centralizada. .................................................................................. 6 Figura 3 - Topologa Descentralizada.............................................................................. 7 Figura 4 - Estrategia GFS (Grandfather-Father-Son)....................................................... 8 Figura 5 - Estrategia Torre de Hanoi. .............................................................................. 9 Figura 6 Tabla para especificar las caractersticas de los programas estudiados....... 18 Figura 7 Arquitectura de Areca................................................................................... 20 Figura 8 Deduplicacin de archivos en BackupPC ..................................................... 28 Figura 9 Arquitectura AMANDA .................................................................................. 34 Figura 10 Componentes del Cliente y Servidor de AMANDA...................................... 34 Figura 11 Configuracin de AMANDA con 2 Clientes ................................................. 36 Figura 12 Grfico de optimizacin de respaldos de AMANDA. ................................... 37 Figura 13 Versiones de Legato NetWorker 6.............................................................. 48 Figura 14 Esquema simple de la arquitectura de Bacula ............................................ 59 Figura 15 Interaccin de los componentes de Bacula................................................. 62 Figura 17 - Esquema con la relacin entre los distintos mdulos de Bacula.................. 72
1. Introduccin
La informacin y los datos que se manejan en el Hospital de Clnicas son muy importantes, diariamente se opera con informacin relativa a los pacientes (datos personales, historias clnicas, anlisis mdicos, etc.) como datos relativos a la administracin del mismo. La ocurrencia de una falla que signifique la prdida parcial o total de la informacin puede generar un dao irreversible y por eso es imprescindible para la institucin tener un mecanismo para respaldar la informacin y recuperarla en caso de ocurrir imprevistos. Las fallas se presentan de formas muy variadas: virus informticos, fallos de electricidad, errores de hardware y software, cadas de red, personas malintencionadas, errores humanos, etc. Y aunque no se pueda prevenir cada una de estas fallas, s se puede preparar para evitar las consecuencias que stas puedan tener.
Segn un estudio sobre prdida de datos de KPMG, la cantidad de personas en todo el mundo que sufren prdidas de datos podra ascender a 190 millones en 2009, en comparacin con los 92 millones alcanzados en el 2008, a medida que la crisis financiera se profundiza. [2] El estudio abarca el perodo 2005-2008 y se basa en incidentes de prdida de datos de conocimiento pblico documentados por Open Security Foundation [3], Identity Theft Centre [4] y la Information Commissioners Office [5], entre otras instituciones. Desde 2005, cuando KPMG comenz a recopilar informacin, se reportaron cerca de 1.300 incidentes de prdida de datos en todo el mundo, y ms de 350 millones de personas se vieron afectadas. Algunos de los incidentes reportados relacionados con la prdida de informacin en ambientes mdicos se refieren a:
2. En la Corporacin de Consultantes de Cardiologa fue robada una laptop utilizada para procesar imgenes de ultrasonido que posea un software de aprox. U$S 27.000 y que adems contena 8000 nombres de pacientes, fechas de nacimiento y nmeros de registros mdico. [7]
La tecnologa no est exenta de fallas o errores y por la naturaleza del sector en el que operan los responsables del DPI del Hospital de Clnicas mantener la informacin siempre disponible y sin la ms mnima interrupcin es prioritario.
El respaldo de informacin es el mecanismos de seguridad ms utilizados por los administradores del DPI para salvaguardar la informacin que maneja diariamente el Hospital de Clnicas por lo que el sistema de respaldo y recuperacin de la misma tiene que ser probado y eficiente, adems de proveer mecanismos que les facilite la tarea de planificacin y ejecucin de los backups.
A continuacin se brindan algunos conceptos relacionados con el respaldo de informacin y que se utilizarn en el estudio de las herramientas consideradas [9]: 1. Topologa: Se pueden clasificar en 2 grandes grupos, centralizadas y descentralizadas.
Centralizadas: en sta topologa, mltiples clientes envan sus datos a un servidor de respaldo el cul se encarga de almacenar los datos en el medio correspondiente (Figura 2). Entre las ventajas de esta arquitectura se destaca el menor costo en realizar la configuracin y proteccin de los entornos de respaldos debido a que todo es controlado desde un nico punto. Tambin los costos en hardware son menores debido a que, por ejemplo, comprar un disco de 1 TB es ms econmico que comprar 5 de 200 GB.
Descentralizada: cada cliente guarda su informacin en los dispositivos de respaldos directamente conectados a ellos (Figura 3). Como ventaja se destaca que cada cliente puede restaurar sus datos independientemente sin necesitar comunicarse con el servidor.
2. Tipo: No hay un acuerdo entre los nombres de los diferentes tipos de respaldos, ni por parte de las empresas de software, ni por parte de los administradores, pero los ms frecuentes son:
Completo (Nivel 0): Toda la informacin seleccionada del almacenamiento primario, tanto archivos de datos cmo meta datos (directorios, archivos, atributos, etc.) son respaldados lo que simplifica la restauracin de la informacin para lo cual solo se necesita el dispositivo donde se realiz.
Incremental: Solo se respaldan los archivos que fueron modificados desde el ltimo respaldo (independientemente del tipo) lo que hace que, por lo general, el espacio necesario sea menor que el tipo anterior pero en oposicin, la restauracin de datos necesita tanto del respaldo actual como el del respaldo Full y todos los incrementales intermedios.
Diferencial: Se respaldan todos los datos modificados luego del ltimo respaldo completo por lo que no toma en cuenta si los archivos ya han sido incluidos en algn respaldo diferencial o incremental intermedio.
En base a estos tipos de respaldo surgieron otros que brindan una proteccin mayor de los datos como son:
Proteccin contina de datos [10]: El cual supervisa constantemente el sistema de archivos del host (en la realidad se establece una ventana de tiempo) y si se produce un cambio inmediatamente realiza el respaldo del/los archivos involucrados, por lo que puede reducir al mnimo la cantidad de informacin perdida en caso de que le sucediera algo al sistema.
Sinttica (synthetic backup) [11]: Una copia de seguridad sinttica es igual a una copia de seguridad completa en trminos de datos, pero se crea con los datos que se recopilan a partir del respaldo completo e los incrementales posteriores. El resultado final de la combinacin de un reciente archivo de respaldo con la informacin consolidada de todos los respaldos utilizados para crearla. Es una alternativa muy prctica en casos donde por requisitos de tiempo o del sistema no es posible realizar una copia de seguridad completa.
Es uno de los esquemas de rotacin ms populares en los entornos corporativos, consistente en un respaldo completo mensual al que se le llama abuelo (grandfather), un respaldo completo semanal, el padre (father), y un respaldo incremental diario, el hijo (son). La ventaja de esta metodologa es que conservan respaldos recientes de la informacin, mientras que paralelamente se conservan tambin copias anteriores. Ejemplo:
Domingo (1) Diferencial/ Incremental o NADA Domingo (8) Diferencial/ Incremental o NADA Lunes (2) Diferencial/ Incremental Lunes (9) Diferencial/ Incremental Martes (3) Diferencial/ Incremental Martes (10) Diferencial/ Incremental Mircoles (4) Diferencial/ Incremental Mircoles (11) Diferencial/ Incremental Jueves (5) Diferencial/ Incremental Jueves (12) Diferencial/ Incremental Viernes (6) Completo Sbado (7) Diferencial/ Incremental o NADA Sbado (14) Diferencial/ Incremental o NADA
En caso de que el sistema falle el Jueves (12): Ser necesario el Respaldo completo del Viernes (6) y Si se utilizaron respaldos diferenciales: Slo el Respaldo Diferencial del Mircoles (11). Si se utilizaron respaldos incrementales: Se necesitaran todos los Respaldos Incremental desde el Sbado (7) hasta el Mircoles (11)
La Torre de Hanoi
Es una la alternativa un poco ms compleja al GFS, pero muy adoptada tambin en entornos corporativos. El esquema se basa en el juego matemtico del mismo nombre y para adaptarlo a los respaldos se consideran 5 discos etiquetados A, B, C, D, y E. La figura 5 muestra el patrn para el esquema de copia de seguridad. El patrn consiste en 16 das.
Para el esquema de cinco niveles es posible recuperar los datos respaldados de hasta dos semanas atrs.
o
El sistema RAID fue propuesto por primera vez en 1988 y es la sigla de Rebundant Array of Inexpensive/Independent Disk. Tiene como objetivo subsanar algunos de los problemas comunes presente en los sistemas de almacenamiento tradicionales y lograr mejoras como la tolerancia a fallos y errores, aumentar la integridad de los datos y mejorar el rendimiento. RAID ofrece varias opciones, llamadas niveles RAID [12], cada una de las cuales proporciona un equilibrio distinto entre tolerancia a fallos, rendimiento y costo. Todos los sistemas RAID suponen la prdida de parte de la capacidad de almacenamiento de los discos para conseguir la redundancia o almacenar los datos de paridad.
Pero adems de realizar los respaldos, es muy importante seleccionar los medios donde se realizan los mismos, los que deben cumplir con determinadas caractersticas como se detalla en el libro Unix Backup and Recovery Cap. 18 de W. Curtis Preston [8] donde se especifican los siguientes factores a tener en cuenta a la hora de decidir: 1. Confiabilidad: Una medida de la confiabilidad de los medios de almacenamiento es MTBF (MeanTime-Between-Failure) que representa el tiempo aproximado entre fallas pero es obtenido en base a entornos artificiales de trabajo que intentan simular ambientes reales y por eso la mejor opcin ms recomendable es Internet, donde se encuentra muchas discusiones acerca del tema. 2. Velocidad de Transferencia: Es importante comparar los medios basndose en la velocidad de transferencia de datos sin comprimir que especifican los fabricantes o en el valor "head-to-tape" que representa el tiempo que se tarda en guardar la informacin desde que llega a la cabeza de lectura/escritura. Pero adems es importante considerar tambin el entorno de trabajo como por ejemplo: la velocidad de transferencia de la red o la saturacin de la misma y las posibilidades del sistema de respaldo para explotar las caractersticas del medio escogido. 3. Tiempo de Acceso a los Datos: Hay entornos como los de Almacenamiento Jerrquico o cuando se desee restaurar un archivo pequeo y no grandes volmenes de informacin, en los que la Velocidad de Transferencia no es lo ms importante, sino que juega un papel muy importante el tiempo en que se accede a la informacin y hay que tener muy en cuenta este factor en el momento de hacer la eleccin. 4. Capacidad: Suele ser uno de los factores ms importantes a considerar en la decisin. No obstante depende la utilizacin que se le dar y de los recursos con que se cuenta debido a que si se dispone, por ejemplo, de un intercambiador de cintas, no es necesario tener un solo medio lo suficientemente grande donde pueda almacenar todo el respaldo.
10
5. Costo: Por lo general, los medios de almacenamiento con ms capacidad y que obtiene los datos en menor tiempo son ms caros pero no slo estas caractersticas intervienen en la decisin, sino que se debe tomar en cuanta tambin la reusabilidad y el tiempo en que este se puede utilizar el mismo. La realizacin de las copias de seguridad se debe basar en un anlisis previo del sistema a respaldar y, de acuerdo a la importancia de los datos, el tamao de los mismos, los cambios que sufren en un determinado perodo tiempo, disponibilidad de hardware, etc., establecer la poltica de respaldo adecuada.
11
administradores realizar copias instantneas de volmenes de datos crticos, sin producirse interrupciones en el servicio ni incoherencias en los archivos respaldados. Esto ltimo podra suceder si no se tuviese un adecuado control de los archivos que estn siendo modificados durante el proceso de respaldo, pero VSS posee un mecanismo para controlar esta situacin. Estas copias pueden ser aprovechadas para restaurar posteriormente el sistema, como simple archivado de datos o para recuperacin total o parcial de los mismos. Particularmente se utiliza la opcin de instantneas Shadow Copies for Shared Folders, que permite realizar respaldos de todo la informacin compartida en un volumen determinado y que permite, no solo a los administradores, sino tambin a los usuarios, recuperar sus propios archivos en caso de ser necesario de una lista de hasta 64 versiones anteriores. En el contexto del Hospital de Clnicas, el administrador de respaldos dispone de 2 carpetas compartidas ubicadas cada una en un servidor distinto. En una de ellas, se almacenan los respaldos realizados. La necesidad de una segunda carpeta es para mantener disponibilidad en caso de que el primer servidor no estuviere disponible. La copia desde una carpeta a la otra se realiza automticamente.
12
Ventajas y Desventajas
Como principales ventajas se pueden encontrar las siguientes: Respaldos y recuperaciones rpidas. Respalda archivos abiertos y nos asegura su coherencia. Respaldos de la ACL de los archivos y directorios. Recuperacin individual de archivos (usando la caracterstica para Carpetas Compartidas de VSS). Las principales desventajas son: Requiere la presencia de un administrador que conozca la tecnologa y la configure correctamente. No se dispone de una interfaz para realizar bsquedas y consultas de respaldos segn ciertos criterios, sino que se hace manualmente recorriendo los respaldos hasta encontrar el archivo deseado. El formato de las copias instantneas no es un estndar, el nico mecanismo posible para consultar o restaurar un respaldo es a travs del explorador de Windows. No hay seguridad sobre los datos ni compresin para ahorrar espacio. Funcionan a nivel de volumen y no de carpeta lo que es un inconveniente importante ya que puede haber carpetas que no queremos respaldar. Los respaldos no son transportables y no pueden ser creados directamente en un servidor remoto ni hacerlos accesibles remotamente. Slo esta disponible para sistemas de archivos NTFS.
El objetivo es realizar un estudio de las herramientas de respaldos actuales, sus caractersticas, sus fortalezas y debilidades para as escoger la que se adecue a las necesidades de los clientes y les brinde seguridad en el manejo de la informacin que administran. Para realizar la eleccin, se deben tener en cuenta los siguientes requerimientos especificados por los administradores del DPI: La herramienta debe ser preferiblemente de cdigo libre. Ser multiplataforma, principalmente Linux y Windows. Permitir respaldar archivos de bases de datos en uso. Disponer de interfaz grfica para facilitar la bsqueda y de archivos respaldados.
13
Debido a que pueden ser instalados tanto en Linux como en Windows y adems poseen una interfaz grfica para la planificacin y auditora de los respaldos realizados, salvo AMANDA, que se decidi incluirlo por la popularidad con la que cuenta en el rubro. Adems se dedica una seccin al estudio de 2 herramientas comerciales, con motivo de tener una comparativa entre el software libre y el software comercial. Para realizar el anlisis de cada herramienta y posteriormente determinar comparativamente cual es el producto que se ajusta en mejor medida a las necesidades requeridas, seleccionamos junto a los clientes un conjunto de caractersticas deseables que deberan formar parte de la herramienta. A continuacin se detallan dichas caractersticas: Cdigo Abierto Una aplicacin de cdigo abierto est licenciada de tal manera que los usuarios pueden estudiar, modificar y mejorar su diseo mediante la disponibilidad del cdigo fuente.
14
Ms precisamente, significa que los usuarios de programas tienen las cuatro libertades esenciales.
La libertad de ejecutar el programa, para cualquier propsito (libertad 0). La libertad de estudiar cmo trabaja el programa, y cambiarlo para que haga lo que usted quiera (libertad 1). El acceso al cdigo fuente es una condicin necesaria para ello.
La libertad de redistribuir copias para que pueda ayudar al prjimo (libertad 2). La libertad de distribuir copias de sus versiones modificadas a terceros (la 3 libertad). Si lo hace, puede dar a toda la comunidad una oportunidad de beneficiarse de sus cambios. El acceso al cdigo fuente es una condicin necesaria para ello.
[13]
Encriptacin de Datos Es fundamental disponer de mecanismos de encriptacin de datos, ya que los respaldos almacenados podrn eventualmente ser accedidos por usuarios distintos al usuario creador del respaldo, lo cual pone en riesgo la confidencialidad de dichos datos. Se espera que las herramientas dispongan de mecanismos de clave simtrica, clave asimtrica o ambas. Dependiendo del algoritmo de encriptacin seleccionado la performance a la hora de realizar el respaldo podr incrementar o decrementar, pero debe quedar claro que aplicar encriptacin de datos aumentar los tiempos de ejecucin si se compara con un respaldo sin encriptacin. Los algoritmos comnmente utilizados son los siguientes:
AES (Advanced Encrytion Standard) DES (Data Encryption Standard) RSA (Ron Rivest, Adi Shamir, Len Adleman)
Compresin de Datos La compresin de datos es una caracterstica fundamental si no se dispone de gran cantidad de espacio en los dispositivos de almacenamiento secundario. Como contrapartida, la compresin incrementa considerablemente los tiempos de ejecucin de los respaldos y en ocasiones puede perderse informacin de los archivos, como por ejemplo los permisos y ACL (Acces Control List) asociadas.
15
Tipos de Respaldo Existen diferentes mtodos de respaldo de archivos. Entre ellos se destacan los siguientes:
Respaldo Completo. En esta modalidad se respaldan todos los archivos en el volumen seleccionado.
Respaldo Incremental. Solo se respaldan aquellos archivos que sufrieron modificaciones desde el ltimo respaldo.
Respaldo Diferencial. Solo se respaldan aquellos archivos que sufrieron modificaciones desde el ltimo respaldo completo.
Planificador de Tareas Para la automatizacin del sistema de respaldos es importante disponer de un mecanismo de planificacin, en el que el usuario pueda ingresar tareas de respaldo a ejecutarse en determinada fecha. En caso de no disponer de un planificador, la herramienta debera brindar alguna forma de interactuar con el planificador del sistema operativo para llevar a cabo las tareas. Utilizacin de estndares para el respaldo de archivos Es importante que la herramienta utilice estndares para respaldar archivos, como por ejemplo tar, dump, zip, etc. La razn se debe a que es fundamental poder restaurar un respaldo sin necesidad de disponer de la herramienta que lo realiz para hacerlo. Respaldo de permisos de archivos Para mantener la proteccin sobre los archivos del sistema luego de una restauracin de los mismos es necesario respaldar el archivo junto con su informacin de control de acceso. Esto abarca permisos en ambientes Linux, y listas de control de acceso en ambientes Windows. Si no se dispone de este mecanismo el administrador del sistema deber otorgar los permisos nuevamente, luego de la restauracin del archivo. Respaldo de archivos abiertos Dada la gran cantidad de usuarios potenciales en el sistema es muy probable que al momento de realizar respaldos existan archivos abiertos por algunos de los usuarios. Para resolver este problema es recomendable que la herramienta posee la capacidad de respaldarlos y mantener su coherencia.
16
Facilidad y eficiencia en la restauracin de archivos La facilidad para restauracin de archivos viene en gran medida en la utilizacin de archivadores estndares como los mencionados anteriormente y la posibilidad de contar con una interfaz grafica que provea facilidades para buscar y restaurar los archivos deseados. Buena Documentacin Es de suma importancia para poder comprender el diseo e implementacin de los mdulos que componen el sistema. Se pretende que la herramienta seleccionada tenga al menos un manual de usuario, un documento explicando el diseo y forma de extender el sistema, y un cdigo fuente bien documentado que permita comprender el propsito y funcionalidad de cada objeto.
17
Para realizar la comparacin entre las distintas herramientas se utilizar la tabla del Figura 6, que indica cuales de las caractersticas deseables posee la aplicacin y cuales no. Para cada herramienta se mostrar la tabla correspondiente y luego del estudio de las mismas se confeccionar una tabla general para poder visualizar con mayor detalle la comparativa entre todas las herramientas estudiadas. Caracterstica Cdigo abierto Multiplataforma Compresin Encriptacin Filtros Tipos de respaldo Lugar de almacenamiento Modo de almacenamiento Respaldo de permisos y ACL de archivos Respaldos simultneos Planificador de tareas Interfaz grfica Eficiencia y facilidad para restaurar respaldos Utilizacin de estndares para respaldo (tar, dump, zip). Cliente-Servidor Buena documentacin Extensibilidad incorporar funcionalidades para nuevas Disponible (Si, No) Detalle Comentarios
Soporte para respaldo de archivos abiertos Soporte para respaldo de bases de datos on-line (hotbackup)
Figura 6 Tabla para especificar las caractersticas de los programas estudiados
18
Desarrollado en Java. Licencia pblica GNU 2. Cdigo Abierto. La arquitectura no es Cliente-Servidor Posee Interfaz Grfica e Interfaz en lnea de Comandos. Compresin de datos: ZIP/ZIP64. Encriptacin de datos: AES 128 y de AES 256. Filtros de Bsqueda (por extensin, directorio, expresin regular, tamao, fecha, etc.).
Nivel de respaldo incremental, completo y diferencial. Modo de almacenamiento delta (solamente las partes modificadas de los archivos sern almacenadas).
No realiza imagen de discos. Ejecucin simultanea de respaldos. Respaldos sobre discos, unidades de red, USB, FTP (con SSL/TLS). Unin de archivos contiguos para disminuir el espacio de almacenamiento. Mecanismo de transaccin, el cual genera procesos de respaldo transaccionales, asegurando la integridad de los datos.
Versionado de archivos y explorador de historial: permite buscar y restaurar ms de una versin existente del archivo.
No dispone de planificador de tareas pero permite usar tanto el de Windows como el de Linux.
Envo de informes a cuentas de e-mail. Generacin de reportes de respaldo. Registro de actividades de usuarios (Log). Simulacin de respaldos.
19
Anlisis de la Herramienta
La herramienta est diseada para facilitar la creacin y configuracin de respaldos. La siguiente figura ilustra la configuracin del ambiente de trabajo tpico para utilizar Areca:
Claramente se aprecia una arquitectura en la que se dispone de un servidor con el software instalado, el cual accede a los sistemas de archivos de las maquinas cliente, transfiriendo los datos desde estos hacia los dispositivos de almacenamiento (FTP, Discos locales, USB). Si bien la arquitectura definida elimina la necesidad de disponer de software en las maquinas cliente, tiene como contrapartida un mayor tiempo de ejecucin ya que requiere transportar los datos al servidor para poder realizar el respaldo. Para llevar a cabo la creacin y ejecucin de respaldos Areca se definen grupos de respaldo configurables. Los grupos de respaldo consisten de un conjunto de destinos, en los cuales se configuraran los siguientes puntos:
Origen de los datos (archivos y directorios a respaldar). Destino de los datos (carpeta en disco, unidad de red, FTP, etc...). Filtros Modo de Almacenamiento Compresin Encriptacin
20
Pueden haber varios destinos definidos para un mismo grupo lo cual permite categorizar y visualizar de manera esquemtica todos los respaldos creados.
21
tamao, ya que sino habra que almacenarlo por completo cada vez que se realiza el respaldo. El algoritmo utilizado por Areca es similar al algoritmo de rsync para detectar y modificar partes de un archivo, el cual utiliza el tamao y la fecha de ltima modificacin del archivo en cuestin. Monitoreo de versionado de archivos Permite no solo consultar las versiones de los archivos respaldados, sino tambin restaurar cualquiera de ellas. Filtros de Bsqueda Areca ofrece un extenso conjunto de filtros para incluir o excluir archivos que cumplan con las condiciones establecidas. Entre ellos se encuentran:
Extensin del archivo. Nombre de archivo/directorio, utilizando expresiones regulares. Tamao de archivo. Fecha de modificacin del archivo. Links simblicos (solo Linux). Archivos en uso.
Como caractersticas dbiles se destacan: 1. No posee planificador para ejecutar respaldos. 2. No respalda de permisos en sistemas Windows. 3. No respaldo archivos abiertos.
Planificador de respaldos Areca carece de planificador propio pero dispone de comandos ejecutables desde una lnea de comandos, e incluso desde los propios planificadores del sistema operativo en el cual se encuentra instalado, mediante un script. Esto acta de nexo entre la aplicacin y el planificador permitiendo de una manera gil disponer de planificacin de respaldos. Los planificadores de tareas son Windows Task para ambientes Windows, y Crontab para ambientes Linux.
22
Respaldo de permisos en sistemas Windows La herramienta no ofrece la posibilidad de almacenar ACL (Access Control List) de archivos en ambientes Windows. Respaldo de archivos abiertos Areca no debe ser utilizado como una herramienta de creacin de imgenes de particiones, como lo son otras aplicaciones (Norton Ghost, Acronis, etc.) ya que no es capaz de respaldar archivos que estn siendo utilizados por los usuarios al momento del respaldar.
Detalle
Comentarios
Puede ser utilizado en cualquier maquina con entorno de ejecucin Java. Zip, Zip64 Permite almacenar archivos en un mismo archivador o cada uno por separado. Particin en volmenes de tamao configurable por el usuario. Dispone de encriptacin de nombres.
Compresin
Si
Encriptacin Filtros
Si Si
Extensin, Dispone tanto de filtros de inclusin directorio, como de exclusin. expresiones regulares, tamao y fecha de archivos links simblicos. Completo, Incremental y diferencial. Standard, Delta e Imagen. Disco, unidad de red, FTP, USB. Solo respalda permisos en archivos sobre sistemas operativos Linux. Permite integrarse con planificadores propios del sistema operativo. Imagen se refiere al almacenamiento de todos los archivos respaldados en un nico archivo.
Tipos de Respaldo
Si
Modo de Almacenamiento Lugar de Almacenamiento Respaldo de permisos y ACL de archivos Planificador de tareas
Si
Si Parcial No
23
Si Si Si se dispone de programas para manipular archivos .zip es posible restaurar respaldos sin necesidad de instalar la herramienta. Zip, Zip64 Zip64 permite comprimir archivos mayores a 4G en un nico archivador.
Utilizacin de estndares para respaldo (tar, dump, zip). Cliente-Servidor Buena documentacin Extensibilidad para incorporar nuevas funcionalidades Soporte para respaldo de archivos abiertos Soporte para respaldo de bases de datos online (hot-backup)
Si
No Parcial Si No se detalla con claridad cmo incorporar nuevos mdulos al sistema. Diseado para incorporar plugins, en la web se dispone de un ejemplo.
No No
24
3.2. BackUp PC
Caractersticas Principales
Desarrollado en Perl. Cdigo Abierto. Inteligente estrategia de manejo del agrupamiento de archivos (pooling) minimiza el acceso y espacio de almacenamiento en disco. Idnticos archivos de varios respaldos de la misma o diferente PC slo se almacenan una vez.
Deduplicacin de archivos permite almacenar nicamente 1 nica copia de archivos duplicados eliminando toda posible redundancia.
Soporte de compresin opcional para reducir an ms el almacenamiento en disco. Dado que slo los archivos nuevos necesitan ser comprimido, hay slo un impacto moderado sobre el tiempo de CPU.
No se necesita instalar el software en el cliente. Extraccin de datos a respaldar mediante tar, rsync. Una potente interfaz de usuario web (HTTP / CGI) permite a los administradores ver los archivos de registro, configuracin, estado actual y permite a los usuarios iniciar y cancelar las copias de seguridad y navegar y recuperar archivos de respaldos.
Un gran conjunto de opciones de restauracin es soportado, incluidos los de restauracin directa (a travs del cliente SMB, tar, o rsync/rsyncd) o descargar de archivos ZIP o tar.
Soporta entornos mviles, como computadoras porttiles conectados a la red. Soporte para redes DHCP. Parmetros de configuracin flexibles permiten varias copias de seguridad a realizarse en paralelo, directorios donde hacer el respaldo, programacin de respaldos completos o incrementales y envo de notificaciones via e-mail. Parmetros de configuracin se pueden establecer en todo el sistema, o tambin en funcin de cada PC.
Debe ser instalado en servidores Linux, Solaris o Unix. Probado en clientes Linux, Freenix, Solaris, Win95, Win98, Win2000 y WinXP. Documentacin detallada.
25
Anlisis de la Herramienta
Backup PC es una herramienta para respaldo de informacin disco a disco, con una arquitectura que solo requiere la presencia de un servidor con el software instalado. El protocolo SMB estndar se utiliza para extraer los datos a respaldar desde los clientes de Windows. En los clientes Linux, se utiliza tar sobre ssh/rsh/nfs. Con la versin 2.0.0, tambin compatible con cualquier cliente que tenga rsync o rysncd. A su vez, la restauracin puede hacerse directamente a travs de smbclient, tar, rsync, rsyncd o descargando los archivos tar/zip. El servidor debe ser instalado en un sistema operativo Linux, Solaris o Unix, y la cantidad de espacio en disco y CPU que dispone determina la cantidad de respaldos simultneos que pueden realizarse. Generalmente sta cifra ronda entre 4 y 8 respaldos simultneos. El mecanismo que utiliza Backup PC para obtener las direcciones IP de las maquinas cliente es a travs de un archivo de configuracin en el que el usuario indica el hostname de cada maquina. Para clientes que se conectan a la red mediante DHCP, se obtienen las IP mediante NetBios (clientes Windows), o mediante el nmbd (netbios name server) del servidor samba (clientes Linux). Para respaldar clientes Windows, Backup PC utiliza la herramienta smbclient la cual permite intercambiar archivos con un servidor smb. Para respaldar clientes Linux se utiliza la herramienta nmblookup. Por ltimo utiliza ssh para disparar los comandos tar y rsync necesarios para llevar a cabo los respaldos y restauraciones en el cliente.
26
Deduplicacin de Archivos [14] La deduplicacin de archivos es una tcnica de respaldo que permite eliminar los datos redundantes almacenados, guardando una nica copia idntica de los mismos, y reemplazando las copias redundantes por apuntadores que apuntan a esa nica copia. Backup PC utiliza combinaciones de referencias a los archivos reales para reducir el espacio en disco necesario para almacenar los archivos. En el primer respaldo completo todos los archivos son transferidos a disco, opcionalmente comprimidos, y luego comparados. Si un archivo ya existe en el disco, entonces no se almacena una nueva copia sino que se crea una referencia que apunta al archivo original, lo cual utiliza una nica entrada adicional en la estructura de directorio. Esto adems de ahorrar espacio en disco, permite mejorar la performance ya que se reducen las escrituras a disco para cada archivo duplicado. Dos archivos son idnticos cuando tienen el mismo contenido, pero no es restriccin que los permisos y fecha de modificacin sean los mismos. Si tanto los permisos como la fecha de modificacin son distintas pero ambos archivos tienen el mismo contenido, sern agrupados, utilizando referencias, lo cual es posible ya que Backup PC almacena separadamente los archivos de sus metadatos. Esta tcnica de respaldo requiere por lo tanto un sistema de archivos que soporte estas referencias (llamados enlaces duros), entre ellos se encuentran:
Quedan por lo tanto excluidos los sistemas de archivos FAT y NTFS. Para comparar archivos se implementa un mecanismo que consiste en asignar a los archivos almacenados en disco un nombre formado por un cdigo MD5 el cual se obtiene del largo y parte del contenido del archivo. Por supuesto esto no es garanta de que dos archivos sean idnticos cuando coinciden sus nombres, pero es una rpida forma de descartar archivos distintos sin tener que examinar su contenido. Una comparacin completa del contenido deber hacerse en caso que los nombres sean idnticos. La cuestin que surge es elegir la cantidad de bytes del contenido del archivo, que se utilizar para realizar el hash MD5, ya que si se producen demasiadas repeticiones entonces demasiados archivos tendran el mismo nombre (hash MD5) y requeriran una comparacin
27
de contenido para determinar si son idnticos o no. La siguiente tabla ilustra algunos datos empricos para determinar el largo de archivo a incluir en el hash:
Cantidad de bytes a utilizar 4096 iniciales 256K iniciales 128K iniciales y 128K finales
Claramente la mejor estrategia para generar el hash es tomar los 128K iniciales y finales del archivo. Esto reduce la cantidad de archivos que generan el mismo hash (por lo tanto requieren comparacin de contenido) a un 0,002% del total. Cabe aclarar que es necesario mejorar la velocidad del CPU para los casos 2 y 3 de la tabla, ya que involucran mucha mayor cantidad de bytes para la generacin del hash. Soporte para compresin de archivos Otra caracterstica interesante es el mecanismo de compresin de archivos que dispone Backup PC. Para realizar la compresin se utilizan los mtodos deflate e inflate del mdulo Compress::Zlib, basado en la librera de compresin zlib. Backup PC permite configurar el nivel de respaldo, el cual puede tomar valores en el rango de 0 a 9. Nivel 0 significa que no habr compresin. Los niveles 1 a 9 mejoran la compresin en forma ascendente, pero como contrapartida el trabajo del procesador es mayor). Se recomienda utilizar nivel 3, ya que por ejemplo un pasaje a nivel 5 implica un 20-30% ms de tiempo de CPU, incrementando en apenas 2-3% la compresin. No obstante Backup PC implementa la compresin de manera que la carga en CPU sea mnima. Es decir, en lugar de comprimir cada archivo que se procesa para luego recin compararlo con los existentes en disco para determinar la unicidad del mismo, se computa primero el hash MD5, basndose en el archivo descomprimido, hacindose la comparacin con cada archivo candidato en el disco. Para ello, cada archivo candidato debe ser descomprimido y luego se comparan los hash. Dado que el mtodo inflate (descompresin)
28
es aproximadamente 10 veces ms rpido que el mtodo deflate (compresin), se produce un gran ahorro de tiempo de CPU. En promedio el mecanismo de compresin permite ahorrar entre un 30-40 % de espacio en disco. No requiere software en el cliente La arquitectura y diseo de backup PC no requiere la instalacin del software en maquinas clientes. Sin embargo, requiere la presencia de alguna de las siguientes herramientas y protocolos en el cliente:
Para entornos Windows se utiliza smb o rsync para comunicarse con el cliente. Si se usa smb deben crearse las carpetas compartidas con los datos a respaldar. Si la maquina se conecta a la red mediante DHCP entonces debe habilitarse NetBios ya que Backup PC lo utiliza para mapear la IP del cliente a partir del nombre del mismo emitiendo un pedido netbios multicast. Para entornos Linux se puede utilizar cualquiera de los tres mtodos anteriores, pero son recomendados tar y rsync ya que smb requiere instalar el servidor samba para proveer las carpetas compartidas. A la vez, dado que el protocolo smb no puede representar archivos especiales como enlaces simblicos, tar y rsync si pueden hacerlo, estos son preferidos para transporte de datos en clientes Linux/Unix. Opciones de restauracin Backup PC dispone de varios mtodos para la restauracin de archivos, tanto automticos (va interfaz grfica) como manuales. Por interfaz grfica se puede seleccionar el respaldo y navegar hasta encontrar el archivo necesario, el cual puede descargarse y almacenarse en el pc del cliente. Un aspecto interesante es que Backup PC completa los respaldos incrementales con el correspondiente respaldo completo, con el objetivo que el usuario no tenga que hacer mltiples restauraciones para obtener el respaldo deseado.
29
Restauracin directa. Con esta opcin los archivos seleccionados se restaurarn en la maquina cliente por defecto en el mismo lugar en donde se encontraban al momento de realizar el respaldo. Se utiliza smbclient, tar o rsync para realizar la restauracin, dependiendo de cual fue configurado para dicho cliente.
Descarga de archivo zip. Ofrece la posibilidad de descargar un archivo zip conteniendo en su interior todos aquellos archivos seleccionados. Se podr especificar el nivel de compresin (0 al 9). Como desventaja respecto al primer mtodo, no se considera como una operacin de restauracin, por lo tanto no se registran los detalles de la operacin, sin embargo se menciona en el log por motivos de seguridad.
Descarga de archivo tar. Es idntico al mecanismo anterior con la nica diferencia que el formato del archivo a descargar es tar, no disponiendo de nivel de compresin.
A su vez, desde lnea de comandos se dispone de mecanismos tanto para descargar archivos zip como tar. Como caractersticas dbiles se destacan: 1. No respalda ACL de archivos Windows. 2. No respalda archivos abiertos. 3. Mximo en el tamao del respaldo.
No respalda ACL de archivos Windows Esto se debe a que la herramienta smbclient no extrae los atributos de permisos (ACL) de los archivos en sistemas operativos Windows, nicamente extrae los equivalentes a atributos Unix. No respalda archivos abiertos Bajo cualquier versin de Windows, un archivo abierto no puede ser ledo por smbclient. Dichos archivos no sern respaldados, esto incluye los archivos del registro del sistema.
30
Sucede lo mismo con los datos de todos los servicios Windows, como base de datos SQL, Exchange, etc. Lo mejor que Backup PC puede hacer en estos casos es enviar advertencias va emails a los usuarios indicndoles los archivos que no se han podido respaldar. Mximo en el tamao del respaldo Backup PC puede manejar archivos de gran tamao, probablemente de 2^51 bytes. En la prctica, muchas limitaciones por fuera de BackupPC acotan el mximo tamao de un archivo. Entre estas limitaciones se destacan las siguientes:
Perl necesita ser compilado con la opcin userlargefiles. El espacio de almacenamiento de respaldos debe ubicarse en un sistema de archivos que soporte archivos de gran tamao.
El mecanismo de transporte tambin limita el mximo tamao de un archivo, por ejemplo tar permite hasta un mximo de 8G, smbclient soporta archivos de hasta 4G y rsync sobre Cygwin tiene un tope entre 2G o 4G.
Detalle
Comentarios
Servidor: Linux, Solaris o Unix. Cliente: Windows, Linux, Solaris, Unix. Permite ahorrar entre Requiere instalar zlib y 30-40 % de espacio. zip. rsa
Si Si No Si
Completo, Incremental y diferencial. Full e incremental Disco local Realiza backup sintticos El sistema de archivos debe soportar enlaces duros.
Si S
Parcial No
Solo Linux
31
Interfaz grfica Eficiencia y facilidad para restaurar respaldos Utilizacin de estndares para respaldo (tar, dump, zip). Cliente-Servidor
Si Si Si No
Tar, zip, rsync, smb. Requiere smbclient y nmblookup para respaldar clientes windows.
Buena documentacin Extensibilidad para incorporar nuevas funcionalidades Soporte para respaldo de archivos abiertos Soporte para respaldo de bases de datos on-line (hot-backup)
Si No No No
32
Cdigo Abierto. Implementado en Perl. Buena documentacin. Arquitectura Cliente-Servidor. El Servidor requiere sistema operativo Linux/Unix, aunque puede utilizarse Cygwin para instalarlo en Windows, soporta cualquier tipo de clientes (Windows, Linux, Unix)
Rpida instalacin. Permite realizar respaldos simultneos en cinta y disco, permitiendo mantener los mismos datos en lnea para rpida restauracin, o en cintas por si ocurre una falla grave.
Utiliza drivers de dominio pblico por lo tanto cualquier dispositivo soportado por el sistema operativo funcionar correctamente con AMANDA. El administrador no deber preocuparse por dar soporte al dispositivo cuando la versin de AMANDA se actualice.
Fcil restauracin de respaldos incluso si no se dispone de AMANDA, ya que utiliza tar, zip y dump para la compresin de datos. Junto con el respaldo, almacena un cabezal indicando la secuencia de comandos (tar y dump) que deben ejecutarse para restaurarlo.
Encriptacin de datos tanto en el cliente como en el servidor de respaldos. AMANDA soporta llaves pblicas de 4096-bits y AES 256-bits.
Posee un planificador que optimiza el respaldo de datos, haciendo que el tiempo total de un respaldo, sea prcticamente el mismo para cada ejecucin.
Cdigo estable y de alta calidad. Soporte para VSS (Volume shadow copy service), que permite realizar respaldos de archivos abiertos en Windows.
33
Anlisis de la Herramienta
AMANDA es un sistema de respaldo que permite al administrador configurar un servidor de respaldo que permita respaldar mltiples clientes en una red a cinta o disco. Para lograrlo, utiliza las herramientas dump y/o tar, lo cual permite respaldar una gran cantidad de equipos con diferentes versiones de Unix. Para clientes Windows se puede configurar un servidor Samba, o utilizar un servidor Cygwin, o tambin instalar el software cliente ofrecido por el propio AMANDA (Zmanda Windows Client), el cual tiene entre otras ventajas la utilizacin del VSS (Volume Snapshot Service) de Windows.
34
AMANDA optimiza el equilibrio de carga de programacin de copias de seguridad. En lugar de dar las instrucciones "Hacer una copia de seguridad completa cada domingo para los clientes de A, B y C, el mircoles copias de seguridad completas para los clientes de D, E y F, e incrementales el resto del tiempo", solo crean una pocas reglas para el proceso de planificacin. Por ejemplo, usted podra dar la instruccin "hacer al menos una copia de seguridad completa dentro de un perodo de 7 das, e incrementales todos los dems das con un mximo de tiempo entre copias de seguridad completas de 7 das." El mximo de tiempo entre copias de seguridad completas se llama el ciclo de volcado.
Para cada ciclo de volcado que se especifica, AMANDA encuentra una combinacin ptima de los backup completos e incrementales de todos los clientes para que la cantidad total de datos a respaldar por ejecucin del backup sea lo ms pequeo posible y coherente desde una copia de seguridad a otra.
35
Para encontrar este equilibrio, AMANDA usa las siguientes consideraciones: La cantidad total de datos a respaldar es reportado por cada cliente en funcin de la cantidad de datos cambiado desde la ltima copia de seguridad. El mximo de tiempo entre copias de seguridad completas (volcado ciclo) que se ha especificado. El tamao de los medios disponibles donde se almacenar el respaldo (cinta o disco).
Para calcular el nivel ptimo de respaldo, AMANDA comienza cada copia de seguridad con una fase estimada. Cada cliente AMANDA ejecuta un proceso especial que determina qu archivos han cambiado y el tamao total de ellos. La fase estimada puede llevar algn tiempo, sobre todo con muchos clientes y sistemas de archivos. Si algunos sistemas de archivos no son muy dinmicos y los archivos no cambian mucho, puede indicarsele a AMANDA, ahorrando as tiempo durante la fase de estimacin. Despus de recoger los datos de todos los clientes, AMANDA entra en la fase de planificacin y calcula la combinacin ptima de las copias de seguridad completas e incrementales para todos los clientes. El siguiente es un ejemplo:
36
Asumiendo que cada directorio /home tiene 100GB de archivos y la cantidad de informacin que cambio es el 15% y el ciclo de volcado es de 4 das. Por simplicidad supondremos que cada respaldo se escribe en Cintas diferentes llamadas DailySet1 hasta DailySet4 y que los respaldos incrementales tienen nivel 1 (o sea que se respaldan todos los archivos que cambiaron desde el ltimo backup completo).
Para cada ejecucin, AMANDA programa un respaldo completo para la cantidad total de datos divididos por el nmero de das en el ciclo de volcado. Dado que el ciclo de volcado es de 4 das, para DailySet1, AMANDA realiza una copia de seguridad completa para 1/4 de los datos, en este caso /home1. Para DailySet2, AMANDA hace una copia de seguridad completa para el otro 1 / 4 de los datos, en este caso /home2, y una copia de seguridad incremental para /home1 que es de 15 GB (15% de 100 GB). Para DailySet3, AMANDA hace un respaldo completa de /home3 e incrementales para /home1 y /home2. Despus del perodo de arranque inicial de cuatro das, AMANDA se ejecuta una copia de seguridad completa para uno de los directorios /home y copias de seguridad incrementales para todos los dems.
37
Soporte para Volume Shadow Copy Service. Una de las caractersticas sobresalientes de AMANDA es su capacidad de utilizar el servicio VSS que ofrecen los sistemas operativos Windows, el cual permite respaldar un sistema de archivos, an cuando existen archivos abiertos por los usuarios del sistema y sin sufrir modificaciones de los datos durante el proceso. Para lograr esto, VSS ofrece una API para que las aplicaciones de respaldo puedan comunicarse con l y de esta manera solicitarle la creacin de una nueva imagen del sistema de archivos, con la finalidad de poder respaldar ciertos archivos dentro de sta. En ese momento, VSS detiene todas las operaciones de escritura en el volumen, y comienza la creacin de una imagen de solo lectura del sistema de archivos, para que las aplicaciones de respaldo tengan la posibilidad de utilizarla sin interferir con otros programas que se encuentren modificando dichos archivos. Una vez finalizada la creacin, se permite continuar con las escrituras pendientes. Esto asegura que no se tendrn inconsistencias ni datos corruptos en la nueva imagen. VSS resuelve otras problemticas a la hora de respaldar archivos en sistemas operativos Windows, como por ejemplo el respaldo de las ACL (Access Control List) de cada archivo. Respaldo de Bases de Datos AMANDA dispone de un mdulo opcional llamado ZRM para MySQL (Zmanda Recovery Manager) para respaldo automatizado de bases de datos MySQL y existen dos versiones, la versin Libre y la versin Enterprise. Por supuesto la versin Enterprise ofrece una variedad mayor de opciones y funcionalidades como por ejemplo:
Soporte para servidores y clientes Windows. Soporte para respaldo de base de datos en ejecucin, tanto en Linux como en Windows.
38
Sin embargo no hay que descartar las buenas prestaciones de la versin Libre, que entre otras dispone de las siguientes:
Respaldo lgico de la base de datos MySQL. Respaldo completo e incremental. Respaldo completo basado en imgenes. Utiliza formatos de archivo de dominio pblico por lo tanto es posible restaurar un respaldo an sin disponer de ZRM.
Detalle
Comentarios
Servidor requiere Linux/Unix, puede correr en Windows con Cygwin. Soporta cualquier cliente.
Si Si No Si
Completo, Incremental.
Modo de Almacenamiento Lugar de Almacenamiento Respaldo de permisos y ACL de archivos Planificador de tareas Interfaz grfica Eficiencia y facilidad para restaurar respaldos
Si Si Si Si No Si
Soporta imagen. Disco local, cinta. Requiere habilitar VSS en clientes windows.
39
Si Si
Tar, Gump, zip El software cliente de AMANDA debe instalarse en los PC a respaldar.
Buena documentacin Extensibilidad para incorporar nuevas funcionalidades Soporte para respaldo de archivos abiertos Soporte para respaldo de bases de datos on-line (hot-backup)
Si No Si Si Requiere activar VSS en clientes Windows. Soporte para MySQL en un mdulo dedicado.
40
3.4. Bacula
Caractersticas de la Herramienta
Permite respaldar sobre varios volmenes. No adecuado para realizar respaldos sobrescribiendo una misma cinta, ya que se cuenta con mecanismos de seguridad que no permiten sobrescribir datos.
Compuesto por 5 componentes: Director (Servidor), Consola, Cliente (FileDeamon), Almacenamiento y Monitor.
Incluye servicio de catalogo que le permite al administrador localizar y restaurar cualquier archivo as como ver los respaldos realizados hasta el momento.
Requiere realizar configuraciones en sus componentes. Soporte limitado para Windows (solo cliente). Tipos de respaldo: Completo, Incremental y Diferencial. Restauracin de respaldos mediante el propio Bacula. La ventaja es que incluye caractersticas como la de restaurar access control list (ACL) para cada archivo.
Bare-Metal recovery (restaurar servidor o cliente con los ltimos datos respaldados, en caso de falla en el disco).
Respalda sobre cinta, disco, usb, dvd. Interfaz grfica gnome, y varias interfaces web disponibles. Programador de tareas con ejecucin simultanea. Muy rpida restauracin de archivos individuales. Encriptacin PKI para datos y comunicacin sobre TLS. Soporte para archivos mayores a 2G y arquitecturas de 64 bits. Extensa documentacin. Testeo de unidades de cinta. Permite controlar el acceso de los usuarios solo a los archivos que le pertenecen.
41
Anlisis de la Herramienta
Bacula se define como un conjunto de programas que permite al administrador del sistema manejar respaldos, restauraciones y verificaciones de datos sobre redes de computadores de diferentes tipos. Opcionalmente puede ejecutar en una nica maquina y respaldar a varios tipos de dispositivos, incluyendo cintas y discos. La arquitectura planteada por Bacula es del estilo Cliente-Servidor, mientras que su diseo modular, le permite adquirir escalabilidad de hasta el orden de cientos de computadores en red. Apunta a usuarios con un nivel de conocimientos avanzado sobre aplicaciones de respaldo, ya que su instalacin no es trivial. Los mdulos de Bacula son: Director Es la parte principal del software: administra los medios disponibles, la planificacin de tareas, control de dependencias, control de acceso y la presentacin de informes. Almacenamiento (Storage) Gestiona la interaccin con los medios utilizados para almacenar datos de la copia de seguridad y es la nica parte de Bacula que se comunica con los volmenes utilizados para dicho fin.
Consola (Console) La consola de administracin proporciona la interfaz de usuario para la gestin de tareas, de mensajes, e informacin de estado. Cliente (FileDeamon) Realiza la transferencia de datos desde el cliente hacia el servidor de almacenamiento. Debe ser instalado en cada mquina que se va a respaldar.
Catalog (Base de Datos) Almacena la informacin de los respaldos y configuraciones en una base de datos. Puede ser SQLite, MySQL y PostgreSQL.
42
Servicio de Catalogo La caracterstica distintiva de Bacula es el servicio de catalogo, el cual permite consultar, y restaurar los respaldos que se desean. Para mantener un tamao de catalogo razonable Bacula permite configurar el tiempo de retencin de tareas, archivos y volmenes, es decir el tiempo que los metadatos de cada respaldo estarn disponibles en el catalogo. Respaldo en Mltiples Volmenes. Uno de los rasgos principales de Bacula es el soporte nativo para copias de seguridad multivolumen. Cuando est equipado con un cargador de cintas, Bacula puede intercambiar cintas sin ninguna intervencin humana (y, si esta configurado correctamente, puede etiquetar los nuevos volmenes sobre la marcha para apoyar este objetivo). Incluso en una mquina con un solo disco, Bacula pide automticamente, ya sea a travs de la consola o de correo electrnico, por el siguiente disco cuando se requiere. Recuperacin independiente Bacula permite crear un CD de arranque de Linux que contienen todo lo necesario para comenzar la restauracin de archivos. El proceso es un poco ms difcil (pero igual de eficaz) y se puede realizar un Linux, Solaris, FreeBSD y Windows.
43
Testeo de unidades de cinta Posee una utilidad llamada btape que lee la configuracin que se ha definido para las unidades de cinta y ejecuta una amplia serie de pruebas de compatibilidad, incluyendo la lectura, la escritura, y varias operaciones de bsqueda. Si btape completa todas las pruebas con xito, usted puede estar seguro de que su unidad de cinta es a la vez compatible con Bacula y adems esta correctamente configurado. Como caractersticas dbiles se destacan: Si la cantidad de entradas en la base de datos alcanza las 1000 millones de entradas, el campo provocar un valor invlido, para evitarlo, el mismo puede ser modificado de 32 a 64 bits desde la versin 1.39 pero debe hacerse a mano. Los respaldos parciales e incrementales estn basados en timestamps (cantidad de segundos desde las 0 hs del 1ro de enero de 1970). Por lo tanto, si se mueven archivos o carpetas dentro de un directorio luego de haber realizado un respaldo completo del mismo, todos estos archivos o carpetas probablemente no sean respaldos por posteriores respaldos incrementales si estos tienen fechas anteriores. Se debe especificar explcitamente que se actualicen las fechas de todos los archivos o carpetas movidas.
Por lo general, se puede restaurar un respaldo hecho en un cliente en otro cliente. Sin embargo, si las arquitecturas son muy diferentes (Ej: 32 bits a 64 bits o Win32 a Unix), puede haber errores en los datos restaurados debido a que, por ejemplo, archivos comprimidos con Zlib de 64 bits, pueden no ser ledos correctamente en maquinas con Zlib de 32 bits
44
Detalle
Comentarios
No Si Si MD5, SHA1 Extensin, subdirectorio, Completo, Incrementa, Diferencial. En volmenes Un volumen es un repositorio simple para la informacin respaldada Dispone tanto de filtros de inclusin como de exclusin.
Tipos de Respaldo
Si
Modo de Almacenamiento
Si
Lugar de Almacenamiento Respaldo de permisos y ACL de archivos Planificador de tareas Interfaz grfica Eficiencia y facilidad para restaurar respaldos Utilizacin de estndares para respaldo (tar, dump, zip). Cliente-Servidor Buena documentacin Extensibilidad para incorporar nuevas funcionalidades Soporte para respaldo de archivos abiertos Soporte para respaldo de bases de datos on-line (hot-backup)
Si Si
Discos, cintas, CDs, DVDs., USBs Requiere habilitar VSS en clientes windows.
Si Si Si S Si Si No Si Requiere activar VSS en clientes Windows. En Windows utiliza vss y en Linux usa scripts previstos por la comunidad Bacula gzip
Si
45
3.5.
Legato NetWorker
Caractersticas Principales
Interfaz de administracin central. Operaciones de respaldo y recuperacin centralizadas para mantener el control completo de los datos involucrados.
Tipos de respaldo complete, incremental, diferencial y de consolidado. Permite programar tareas de respaldo. Personalizacin de respaldos de acuerdo al usuario. Capacidad de realizacin y recuperacin de respaldos en paralelo. Ejecucin de acciones pre y post procesamiento. Gestin de almacenamiento jerrquico. Puede configurarse para utilizar una red dedicada para realizar y recuperar respaldos.
Servidores soportados: Solaris, HP-UX, Tru64 UNIX, AIX, IRIX, Linux, Windows, NetWare
Permite respaldar y restaurar bases de datos: Oracle, Informix, Sybase, DB2, Microsoft SQL Server, MS Exchange, Lotus Notes.
Deduplicacin de archivos permite almacenar nicamente 1 nica copia de archivos duplicados eliminando toda posible redundancia.
Se necesita instalar un cliente en los hosts a respaldar, esto permite restaurar servidor o cliente con los ltimos datos respaldados, en caso de falla en el disco (Bare-Metal recovery).
Capacidad de bsqueda avanzada, lo que permite disminuir el tiempo de acceso a los datos respaldados.
Soporta entornos de almacenamientos DAS (Almacenamiento directo), NAS (Almacenamiento en la red) y SAN (Redes de almacenamiento)
El protocolo de administracin de red que utiliza le permite tener acceso directo a los respaldos para realizar la restauracin a gran velocidad.
46
Protege los datos locales y remotos mediante perfiles de usuario, listas de control de acceso y registro de sucesos (Logs).
Implementacin soporta paralelismo en la ejecucin y entrelazado de datos lo que le permite 512 respaldos simultneas y hasta 32 flujos de datos por cinta para maximizar la velocidad de copia de seguridad.
Los usuarios pueden realizar sus copias de seguridad, navegar y recuperar sus propios archivos.
Anlisis de la Herramienta
Legato implementa una arquitectura cliente - servidor integrando tres funcionalidades distintas: Cliente, Nodos de Almacenamiento y Servidor para proveer las capacidades y el rendimiento requerido para proteger y administrar la informacin de una gran variedad de redes. Los nodos de almacenamiento permiten balancear la carga dentro de la zona de datos as como proveer flexibilidad en la configuracin del entorno de redes grandes. Los clientes pueden ser respaldados en cualquier nodo de almacenamiento o servidor por medio de la red local (LAN), de redes extensas (WAN) o redes de almacenamiento (SAN). Legato habilita a los administradores a centralizar la administracin y las operaciones de respaldos automticos dentro de la zona de datos aplicando mltiples polticas de almacenamiento y procedimientos para los distintos clientes. Hay tres ediciones de Legato NetWorker Server, cada uno con un nivel de servicio diseados para satisfacer los diferentes tamaos y entornos informticos. complejidad de los
47
Como caractersticas fuertes se destacan: Escalabilidad ilimitada. Rendimiento. Dispositivos Concurrentes. Expansin de funcionalidades.
Escalabilidad ilimitada Administracin centralizada local y remotamente. La arquitectura cliente/servidor soporta respaldos automticos de cientos de miles de clientes y servidores pertenecientes a la red.
48
Rendimiento Soporta hasta 32 sesiones de respaldos y de recuperacin simultneos por cada nodo de almacenamiento para la versin Network Edition, y hasta el 64 por Nodo de almacenamiento para la Power Edition. Hasta 512 copias de seguridad se pueden realizar en paralelo. Dispositivos Concurrentes Proporciona soporte para operaciones de respaldo y recuperacin concurrentes usando hasta 16 dispositivos de respaldo por servidor o nodo de almacenamiento en las versiones Network y Power Edition. Expansin de funcionalidades Legato puede ser expandido para proveer ms funcionalidades instalando los mdulos que se deseen. Como caractersticas dbiles se destacan:
Precio Es bastante elevado, la versin Workgroup Edition que soporta 8 clientes, cuesta alrededor de U$S 3000.
Detalle
Comentarios
Modo de Almacenamiento
Si
49
Lugar de Almacenamiento Respaldo de permisos y ACL de archivos Planificador de tareas Interfaz grfica Eficiencia y facilidad para restaurar respaldos Utilizacin de estndares para respaldo (tar, dump, zip). Cliente-Servidor
Si Si Si Si Si
Discos, cintas.
Para el administrador
No
Si
El software cliente se debe instalarse en los PC a respaldar. Manuales de Administracin, de usuarios y de instalacin. Se pueden instalar mdulos de la empresa para extender sus funcionalidades.
Buena documentacin Extensibilidad para incorporar nuevas funcionalidades Soporte para respaldo de archivos abiertos Soporte para respaldo de bases de datos on-line (hotbackup)
Si Si
Si Si Oracle, Informix, Sybase, DB2, Microsoft SQL Server, MS Exchange, Lotus Notes
50
Compatibilidad con VSS de Microsoft. Copias de seguridad simultneas. Copias de seguridad completa, incremental y diferencial. Exclusin de archivos durante las copias de seguridad. Permite guardar los respaldos en distintos medios simultneamente. Control del flujo de datos en la red. Creacin de discos de inicio. Conversin de copias de seguridad en mquinas virtuales. Comandos pre y post respaldos. Gestin centralizada. Distribucin de copias de seguridad en un intervalo de tiempo Copias de seguridad basadas en eventos o en condiciones. Consolidacin de respaldos diferenciales o incrementales. Grupos de usuarios para el control de acceso y gestin centralizada. Permite respaldar un dispositivos de red, usb, firewire y unidades extrables. Deduplicacin a nivel de archivo o de bloque. Instaladores para Windows y Linux
En la pgina de Acronis [20] se enumeran mas de 50 caractersticas de las cuales elegimos las ms destacadas.
Anlisis de la Herramienta
Acronis Backup & Recovery 10 simplifica y automatiza los procesos de copia de seguridad y recuperacin de informacin en clientes y servidores en los entornos Windows y Linux y en plataformas fsicas y virtuales. Estos productos estn basados en tecnologas patentadas de creacin de imgenes de disco y restauracin desde cero. Ofrece a las organizaciones medianas y grandes una solucin sencilla para gestionar de forma centralizada todas las actividades de copia de seguridad y restauracin a travs de la red.
51
Todo el contenido del disco duro, incluidos el sistema operativo, las aplicaciones y los datos, se puede recuperar en cuestin de minutos. Adems, con la opcin Universal Restore de Acronis Backup & Recovery 10, es fcil restaurar una imagen de copia de seguridad en un hardware diferente, incluidas las mquinas virtuales. Permite la gestin basada en polticas de todas las operaciones de copia de seguridad y restauracin desde una nica consola en cualquier lugar de la red. Adems, un panel de control centralizado proporciona una visin general de las operaciones configuradas y en marcha que hay en todos los sistemas, lo que mejora el control y la toma de decisiones. Admite una amplia gama de dispositivos de almacenamiento y ubicaciones, incluidos los discos conectados localmente, NAS (Almacenamiento conectado a la red), SAN (Red de almacenamiento), servidores FTP y dispositivos pticos, as como la exclusiva particin de Acronis Secure Zone. Acronis Secure Zone es una particin segura del disco duro local, desde la que se puede recuperar cualquier archivo o el sistema entero, sin tener que utilizar un medio de inicio.
Acronis Backup & Recovery 10 est diseado para satisfacer las necesidades de la red de infraestructuras distribuidas y permite su utilizacin con miles de maquinas. La forma de brindar soporte a una red mayor es mediante la adicin de recursos como espacio de disco en forma de bvedas (contenedores de copia de seguridad), y los nodos de almacenamiento de Acronis para gestionar la carga de trabajo de respaldos nuevos, manteniendo la capacidad de gestionar de forma centralizada toda la infraestructura. Un dominio puede ser actualizado para manejar hasta 20 nodos de almacenamiento que a su vez administre hasta 20 discos/cintas, todo ello gestionado por un servidor de gestin. Copia de seguridad se transmiten directamente de las mquinas gestionadas (clientes) a los nodos de almacenamiento y guardado en las bvedas.
Nodos de almacenamiento Se encargan del control y la optimizacin de los recursos de almacenamiento. Esto reduce el trabajo en los equipos administrados debido a que se encarga de los servicios de gestin de los respaldos, consolidacin y validacin, lo que evita el consumo de recursos de los clientes. Son la clave para permitir a la arquitectura ofrecer una gran flexibilidad y escalabilidad. Los administradores pueden agregar recursos de almacenamiento cada vez que el trabajo aumente. Soporta gran variedad de dispositivos como discos locales, recursos compartidos de red, SAN, NAS y libreras de cintas.
52
Usualmente estn localizados cerca de las maquinas de administracin pero pueden ser administrados desde cualquier parte de la red. Es aqu tambin donde se realiza la deduplicacin de archivos, o sea, se detectan y eliminan los archivos o bloques duplicados lo que usualmente reduce el espacio utilizado hasta en un 90%. Esta caracterstica puede ser desactivada si se desea. Para asegurar la seguridad de los respaldos, estos son encriptados utilizando el algoritmo AES de 256 bits tanto en las maquinas administradas como en los nodos de almacenamiento. Pero se sugiere hacerlo en los nodos de almacenamiento debido a que reduce el consumo de procesador en la maquina cliente. Todos los nodos de almacenamientos estn registrados y dirigidos por el servidor donde esta instalado el administrador donde se pueden realizar las realiza todas las configuraciones y la gestin centralizada de la consola.
Consola de Administracin La administracin puede tornarse complicada cuando se debe controlar un entorno de cientos de maquinas. Acronis Backup & Recovery 10 utiliza una consola que permite al administrador realizar un manejo centralizado de las actividades. Desde cualquier lugar de la red el administrador puede conectarse a al servidor de administracin y realizar actividades de administracin. Desde aqu el administrador puede controlar las polticas de respaldo, clientes (fsicos o virtuales) y nodos de almacenamiento. Esta es muy intuitiva y puede ser operada con un mnimo de entrenamiento. La administracin de polticas de respaldo elimina la necesidad de crear tareas de respaldos para cada maquina cliente. Una poltica de respaldo puede ser creada y aplicada a varios clientes, ahorrando tiempo y evitando crear tareas de respaldos que se apartan de las polticas de respaldo que puede haber definido la empresa.
Por ejemplo, una poltica puede ser: crear copias de seguridad completas de todos los servidores pertenecientes al rea de administracin, especificando el destino del respaldo y el da y la hora en que se debe ejecutar. Estas polticas ahorran trabajo al administrador y sin ellas, los administradores deben definir y gestionar miles de tareas de respaldos de las mquinas administradas
Todos los clientes, fsicos o virtuales, son registrados en el servidor de respaldos y se pueden ver en la consola de administracin. Se pueden crear grupos para organizar las maquinas gestionadas en grupos lgicos y as facilitar la creacin de polticas de respaldo y
53
el reporte de eventos segn el grupo. Una maquina puede pertenecer a mas de un grupo para maximizar la flexibilidad. Toda la administracin de los nodos de almacenamiento, actividades de configuracin, deduplicacin, encriptado y almacenamiento de archivos son realizados a travs de la consola de administracin. El administrador tambin puede examinar los archivos que existen en la bveda e iniciar tareas de consolidacin, validacin, caducidad y limpieza de respaldos.
Gestin centralizada que mejora la productividad de Adminsitrador Los procesos de copia de seguridad y recuperacin de todas las estaciones de trabajo se realizan desde una nica ubicacin de gestin situada en cualquier lugar de la red, con la capacidad de automatizar los procesos mediante comandos basados en polticas. Adems, un tablero de control centralizado proporciona una visin general de las operaciones configuradas y en ejecucin en todos los sistemas, lo que mejora el control y la toma de decisiones. Ahorros en costes de almacenamiento y red mediante la deduplicacin de datos Al eliminar copias de seguridad de los mismos datos de varios equipos, puede obtener ahorros importantes en almacenamiento y en ancho de banda de red. El software opcional Acronis Backup & Recovery 10 Deduplication ofrece una deduplicacin de software a nivel de archivo y de bloque, lo que es til para que las organizaciones de cualquier tamao utilicen mejor su infraestructura de almacenamiento y reduzcan los gastos en almacenamiento de datos.
54
Prestaciones avanzadas de programacin Las copias de seguridad pueden activarse en funcin de condiciones y sucesos preestablecidos como, por ejemplo, la instalacin de un nuevo programa, el fin de la sesin o la adicin de un volumen determinado de nuevos datos al sistema. Se incluyen plantillas para esquemas de rotacin de copias de seguridad como, por ejemplo, Torre de Hanoi y Abuelo-Padre-Hijo. Recuperacin de un sistema entero o un solo archivo o carpeta Las recuperaciones basadas en imgenes de Acronis dan la granularidad necesaria para cualquier clase de recuperacin, lo que le permite volver a la actividad empresarial rpidamente. El producto exclusivo Acronis Secure Zone and Startup Recovery Manager simplifica la recuperacin. Realice la recuperacin directamente de Acronis Secure Zone, una particin oculta, booteable y segura que hay en su disco duro local. Si el sistema no arranca correctamente, pulse F11 durante el arranque del sistema para iniciar Acronis Backup & Recovery. Soporte de virtualizacin Conversin de la copia de seguridad de imagen a una mquina virtual. Recupere una copia de seguridad de disco (volumen) a una mquina virtual nueva de cualquiera de los tipos siguientes: VMware Workstation, Microsoft Virtual PC, Parallels Workstation o dispositivo virtual Citrix XenServer. Copia de seguridad basada en eventos Cree copias de seguridad activadas por diversas condiciones un usuario inicia la sesin, un equipo se apaga, u otras. Configure que las operaciones de copia de seguridad esperen hasta que se den unas condiciones especficas, como un intervalo de tiempo predefinido o que un usuario finalice la sesin. Configure eventos y condiciones especficos para cada tarea.
55
Distribucin de copias de seguridad en un intervalo de tiempo Evita la sobrecarga de las redes distribuyendo las actividades de copia de seguridad en una ventana de tiempo permitido. Cambie automticamente las horas de inicio de las tareas en cada una de las mquinas. Como caractersticas fuertes se destacan:
Precio El precio de la licencia del software para el servidor Acronis Backup & Recovery 10 Server cuesta U$S 853. La de los clientes cuesta U$S 74 c/u y si se desea la opcin Universal Restore el precio es de U$S 89 c/u.
Detalle
Comentarios
Pero esta deshabilitada por defecto. Extensin, subdirectorio, Completo, Incrementa, Diferencial, Consolidado. Imagen DAS,NAS, SAN, raid, firewire, USB, CDs, DVDs., cintas.
Respaldo de permisos y ACL de archivos Planificador de tareas Interfaz grfica Eficiencia y facilidad para restaurar respaldos Utilizacin de estndares para respaldo (tar, dump, zip). Cliente-Servidor
Si Si Si Si No
Si
Buena documentacin
Si
56
de usuarios, de instalacin y referencia de lnea de comandos. Extensibilidad para incorporar nuevas funcionalidades Soporte para respaldo de archivos abiertos Soporte para respaldo de bases de datos on-line (hotbackup) Si Se pueden instalar mdulos de la empresa para extender sus funcionalidades.
Si Si Adems dispone de otro producto: Acronis Recovery para MS SQL Server que se especializa en este manejador de base de datos.
57
4. Conclusiones
En base a esto se plante por un lado, la bsqueda e investigacin de las herramientas actuales de respaldo de informacin para as realizar un Estado del Arte con ventajas y desventajas de cada una de ellas con el fin de hacer una recomendacin fundamentada de cul es la que ms funcionalidad brinda y mejor se adapta al entorno de trabajo existente en el Hospital. El estudio abarco los siguientes programas de respaldos: Areca Backup BackupPC AMANDA Bacula EMC Legato NetWorker Acronis BackUp and Recovery
En base a dicho estudio se llega a las siguientes conclusiones: 1. Las herramientas pagas ofrecen excelentes caractersticas, entre ellas, respaldos de bases de datos en uso, programacin de tareas de respaldo y restauracin y bsqueda de archivos, adems de interfaces de administracin y configuracin muy amigables, intuitivas y completas pero su costo es elevado, en particular la versin Workgroup Edition de Legato Networker que soporta 8 clientes, cuesta alrededor de U$S 3000 y la licencia del software para el servidor Acronis Backup & Recovery 10 Server cuesta U$S 853, mientras que la de los clientes cuesta U$S 74 c/u y si se desea la opcin Universal Restore el precio es de U$S 89 c/u. (Para 8 clientes con Universal Restore el precio es de U$S 1565 ) lo que se vuelve una solucin extremadamente cara para instalar en las cientos de mquinas existentes en el Hospital de Clnicas. 2. De las herramientas gratuitas estudiadas, Bacula permite el respaldo de bases de datos en uso, programacin de tareas de respaldo y restauracin, bsqueda de archivos e interfaz grfica donde realizar configuraciones y visualizar el estado de las tareas de respaldo. Del resto de los programas, dos no respaldan bases de datos en uso (como Areca y BackupPC) y uno no poseen interfaz grfica para realizar configuraciones facilitar su
utilizacin (AMANDA). Es por esto que se concluye que, de las herramientas estudiadas, `Bacula` es la que mejor se adapta a los requerimientos especificados por los clientes.
58
El Director solo puede ser instalado en sistemas Linux/Unix mientras que el resto de los componentes pueden ser instalados tanto en Windows, Linux o Mac.
59
En el caso de ejemplo desarrollado todos los componentes estarn instalados en la misma computadora, ms precisamente un mquina virtual con sistema operativo Debian Lenny con el fin de ofrecer una visin general del programa y dando las herramientas necesarias para poder realizar la configuracin en un sistema en particular, pero en realidad el sistema permite repartir sus funciones en procesos independientes, cada uno en una mquina diferente, de forma de mantener el mximo control a la hora de poner en produccin las diferentes.
60
61
restauran, lugar donde se almacenan fsicamente etc. Es una especie de ndice de todo lo que va ocurriendo. No contiene los archivos en si mismos. Las bases de datos soportadas son MySQL, PostgreSQL y SQlite. (nosotros utilizaremos MySQL). Y por ltimo, si bien no es parte de los mdulos del programa, se puede considerar el Monitor que es una interfaz que permite examinar el estado de las copias y el de cada uno de los componentes del sistema. Al igual que para la consola utilizaremos Webmin.
62
63
Pool: Es un objeto lgico que se utiliza para agrupar volmenes. Todos los volmenes de un pool comparten las caractersticas definidas en ese pool. Los pools complementan a los schedules, y entre los dos implementan la poltica del respaldo. JobDefs: Este elemento es un esqueleto para las tareas de respaldos (jobs). Se especifican parmetros por defecto. Si un job hace referencia a un JobDefs y no especifica un parmetro, toma el que est definido en el jobDefs (en caso de que ah este definido). Job: Ac se agrupan la informacin definida anteriormente (Pool, Schudele, Type, etc) para definir la tarea. Bacula ejecuta los jobs automticamente slo si tiene un schedule asociado, Si no lo tiene, la nica forma de ejecutarlo es manualmente. Hay tres clases de jobs: Backup, Restore y Verify (verifica que los atributos de los archivos originales sean iguales a los atributos guardados en la base de datos para esos archivos) Client: Se indican los clientes que se van a respaldar especificando un nombre, la IP donde se encuentra, el puerto en el que escucha y el password con el que el director se tiene que autenticar. FileSet: Ac decimos los directorios y archivos que se deben respaldar. Tambin se especifica si se deben encriptar los datos (md5 o sha1), comprimirlos o si hay archivos o carpetas que se deben excluir del respaldo.
Por ms detalles acerca de la configuracin del Director, los elementos que lo componen y si significado y funcionalidad ver [21].
64
almacenamientos para ser usados. Messages: Donde se definen los mensajes de error e informacin que se deben generar y adonde se envan.
65
La figura siguiente muestra las tpicas interacciones entre los servicios de Bacula para la ejecucin de un respaldo El Director inicia y gestiona estas interacciones adems de administrar el Catalogo.
66
67
# Precisamos que mensajes queremos que se generen y a donde se envan Messages { Name = Standard mailcommand = "/usr/lib/bacula/bsmtp -h localhost -f \"\(Bacula\) \<%r\>\" -s \"Bacula: %t %e of %c %l\" %r" operatorcommand = "/usr/lib/bacula/bsmtp -h localhost -f \"\(Bacula\) \<%r\>\" -s \"Bacula: Intervention needed for %j\" %r" mail = root@localhost = all, !skipped operator = root@localhost = mount console = all, !skipped, !saved append = "/var/lib/bacula/log" = all, !skipped } # Informamos la ubicacin del Cliente que se va a respaldar y el pass que debe usar el director para identificarse. Tambin se indica cuanto tiempo se mantiene la informacin respaldada. Client { Name = debian-fd Address = 127.0.0.1 FDPort = 9102 Catalog = "BaculaDB" Password = "debian-dir" File Retention = 30 days Job Retention = 2 months AutoPrune = yes } # Sealamos que informacin queremos respaldar y cual no. Tambin definimos el algoritmo de compresin y el algoritmo para encriptar los datos. FileSet { Name = "Respaldo_Escritorio" Include { Options { signature = MD5 compression=GZIP9 } File = /home/pgrado/Desktop/Bacula } Exclude{ File = /home/pgrado/Desktop/Bacula/Conf_Ejemplo } }
68
# Especificamos el tipo y la periodicidad del respaldo. Schedule { Name = "CicloSemanal" Run = Incremental mon-sat at 01:05 Run = Full sun at 01:05 } # Declaramos los volmenes de almacenamiento (cintas discos) utilizados por el programa para guardar datos Pool { Name = Respaldo Pool Type = Backup Recycle = yes AutoPrune = yes Volume Retention = 365 days # one year } # Definimos que tarea de respaldo y restauracin Job { Name = "Respaldo_Escritorio" Type = Backup Level = Incremental Client = debian-fd FileSet = "Respaldo_Escritorio" Schedule = "CicloSemanal" Storage = File Messages = Standard Pool = Respaldo Priority = 10 Write Bootstrap = "/var/lib/bacula/client1.bsr" } Job { Name = "Restaurar_Escritorio" Type = Restore Client = debian-fd FileSet = "Respaldo_Escritorio" Storage = File Pool = Respaldo Messages = Standard Write Bootstrap = "/var/lib/bacula/client1.bsr" Where = / }
69
bacula-sd.conf: Los recursos que se configuran en un archivo son los relativos al Almacenamiento y son: # Definimos el Almacenamiento Storage { Name = debian-sd SDAddress = 127.0.0.1 SDPort = 9103 WorkingDirectory = "/var/lib/bacula" Pid Directory = "/var/run/bacula" Maximum Concurrent Jobs = 20 } # Especificamos el nombre y la contrasea que usara el Director para identificarse. Director { Name = debian-dir Password = "debian-dir" } # Detallamos el dispositivo donde se almacenara el respaldo. Device { Name = CarpetaRespaldos Media Type = File Archive Device = /backups LabelMedia = yes; Random Access = Yes; AutomaticMount = yes; RemovableMedia = no; AlwaysOpen = yes; } # Precisamos que mensajes queremos que se generen y a donde se envan Messages { Name = Standard director = bacula-dir = all }
70
bacula-fd.conf: Este archivo de configuracin est en cada Cliente Bacula. Los recursos que se tienen que configurar son: # Definimos el Almacenamiento FileDaemon { Name = debian-fd FDAddress = 127.0.0.1 FDport = 9102 WorkingDirectory = /var/lib/bacula Pid Directory = /var/run/bacula Maximum Concurrent Jobs = 20 } # Especificamos el nombre y la contrasea que usara el Director para identificarse. Director { Name = debian-dir Password = "debian-dir" } # Precisamos que mensajes queremos que se generen y a donde se envan Messages { Name = Standard director = debian-dir = all, !skipped, !restored }
71
bconsole.conf: El archivo de configuracin de la consola es el ms sencillo, debido a que solo hay que definir los datos del director: Director { Name = debian-dir address = 127.0.0.1 DIRport = 9101 Password = "debian-dir" }
Como se observa en los ejemplos, todos los mdulos tienen un nombre y una contrasea, los que deben coincidir para lograr que estos se comuniquen. Para simplificar el ejemplo, el password que utilizamos siempre es "debian-dir" pero esto no es necesario. La siguiente figura muestra un esquema con la relacin que debe haber entre los distintos mdulos y los usuarios y contraseas definidos en ellos.
72
6. Referencias:
[1] DataLossDB Open Security Fundation - Stats http://datalossdb.org/statistics [2] CXO Community http://cxo-community.com/articulos/estadisticas/estadisticas-seguridadcorporativa/2095-las-pidas-de-datos-iren-aumento-segl-pronco-de-kpmg.html [3] DataLossDB Open Security Fundation http://datalossdb.org/ [4] Identity Theft Resource Center http://www.idtheftcenter.org/ [5] The Information Commissioners Office http://www.ico.gov.uk/ [6] DataLossDB Open Security Fundation - Incidents http://datalossdb.org/incidents/2566-documents-of-50-students-discarded-in-trashcontained-names-addresses-medical-records-health-numbers-and-transcripts [7] DataLossDB Open Security Fundation - Incidents http://datalossdb.org/incidents/2559-stolen-laptop-contained-8-000-patients-namesdates-of-birth-and-medical-record-numbers http://www.fox10tv.com/dpp/mobile_news/thief-boldly-steals-medical-computer [8] Unix Backup and Recovery - W. Curtis Preston http://books.google.com/books?id=_i1sO47qNnMC&lpg=PA373&ots=kjdHKjGo5C& dq=Unix%20Backup%20and%20Recovery%20online&pg=PP1#v=onepage&q=Uni x%20Backup%20and%20Recovery%20online&f=false [9] Enterprise Systems Backup and Recovery: A Corporate Insurance Policy - Preston de Guise - Captulo 3 http://books.google.com/books?id=2OtqvySBTu4C&lpg=PP1&dq=Backup%20%26 %20Recovery&hl=es&pg=PA37#v=onepage&q=Full%20Level&f=false [10] Proteccin contina de datos http://www.articulosinformativos.com.mx/Proteccion_continua_de_datosa936314.html [11] Respaldo Sinttico http://www.msexchange.org/articles_tutorials/exchange-server-2007/highavailability-recovery/synthetic-backup-data-protection.html [12] Niveles de RAID http://bytepile.com/raid_class.php http://www.acnc.com/04_01_50.html
73
[13] Software Libre http://www.gnu.org/philosophy/free-sw.es.html [14] Deduplicacin de Archivos http://backuppc.sourceforge.net/faq/BackupPC.html#backuppc_design [15] Areca: http://www.areca-backup.org/documentation.php [16] BackUp PC http://backuppc.sourceforge.net http://wiki.zmanda.com/index.php/Backuppc http://www.backupcentral.com/components/com_mambowiki/index.php/BackupPC [17] AMANDA http://amanda.zmanda.com/ http://wiki.zmanda.com/index.php/Main_Page http://www.backupcentral.com/components/com_mambowiki/index.php/AMANDA http://www.zmanda.com/download-amanda.php http://www.zmanda.com/amanda-enterprise-edition.html [18] Bacula: http://www.bacula.org/es/?page=documentation http://www.ceslcam.com/images/stories/noticias/pdf/Analisis-Bacula.pdf http://www.ldc.usb.ve/~jolimar/coloquioBacula.pdf http://wiki.bacula.org/doku.php?id=comparisons http://www.backupcentral.com/components/com_mambowiki/index.php/Category:B ackup_%26_Recovery_-_Current_Edition [19] Legato http://www.emc.com/products/detail/software/networker.htm http://dlc.sun.com/pdf/875-3427-10/875-3427-10.pdf [20] Acronis http://www.acronis.com/enterprise/ http://www.acronis.com.mx/enterprise/download/docs/ [21] Configuracin del Mdulo Director de Bacula. http://www.bacula.org/en/dev-manual/main/main/Configuring_Director.html [22] Configuracin del Mdulo Almacenamiento de Bacula. http://www.bacula.org/en/devmanual/main/main/Storage_Daemon_Configuratio.html [23] Configuracin del Mdulo Cliente de Bacula. http://www.bacula.org/en/dev-manual/main/main/Client_File_daemon_Configur.html
74