You are on page 1of 8

3.

1 Sistemas de Respaldo y Recuperacin


Actualmente sabemos que la mayor parte de las personas manejan una computadora para realizar la mayora de sus operaciones, por lo que ha surgido la necesidad de hacer respaldos de la informacin, ya que existen muchos virus que pueden daar los sistemas operativos y generar errores, los cuales nos impedirn el acceso a nuestra informacin, por lo que al estar prevenidos y contar con nuestros respaldos, podremos recuperar fcilmente nuestra informacin, por lo general los respaldos deben hacerse constantemente, ya que da con da modificamos lo nuestros archivos, y as, si llegamos a tener problemas con nuestro sistema operativo, no tendremos que volver a registrar esos datos que tenamos. El respaldo de informacin es un proceso muy importante que debe de tener cada usuario de computadora, sea un equipo porttil o un equipo de escritorio. El contar con respaldos permite al usuario en algn momento dado recuperar informacin que haya sido daada por virus, fallas en el equipo o por accidentes. En las herramientas de un sistema podemos encontrar herramientas que nos ayudan en el proceso de respaldo de la informacin, aunque tambin podemos encontrar otras herramientas que permiten este proceso. Despus del proceso de respaldo podemos utilizar otras herramientas para realizar la recuperacin de la informacin. Es la ciencia de la bsqueda de informacin en documentos, bsqueda dentro de los mismos, bsqueda de metadatos que describan documentos, o tambin la bsqueda en bases de datos relacionales, ya sea a travs de internet, intranet, para textos, imgenes, sonido o datos de otras caractersticas, de manera pertinente y relevante. La recuperacin de informacin es un estudio interdisciplinario. Cubre tantas disciplinas que eso genera normalmente un conocimiento parcial desde tan solo una u otra perspectiva. Algunas de las disciplinas que se ocupan de estos estudios son la psicologa cognitiva, la arquitectura de la informacin, diseo de la informacin, inteligencia artificial, lingstica, semitica, informtica, biblioteconoma y documentacin. La recuperacin tambin se puede encontrar en las herramientas de un sistema, ya que el proceso completo de respaldar la informacin y recuperar est ligado, por lo que despus de tener ya respaldada la informacin tambin podemos recuperarla.

3.1.- SISTEMA DE RESPALDO Y RECUPERACION


CONCEPTO DE RESPALDO Y DE RECUPERACIN El tema de respaldo y recuperacin de informacin, trata del esfuerzo necesario para asegurar la continuidad del procesamiento de los datos, con la mnima dificultad posible ante una eventual alteracin no deseada de los mismos. Para determinar cundo hacer un respaldo, pensar de la siguiente manera: hacer una copia de respaldo justo antes del momento en que regenerar los datos ocasione mayor esfuerzo que hacer el respaldo. Qu es respaldo Respaldo es la obtencin de una copia de los datos en otro medio magntico, de tal modo que a partir de dicha copia es posible restaurar el sistema al momento de haber realizado el respaldo.

Por lo tanto, los respaldos deben hacerse con regularidad, con la frecuencia preestablecida y de la manera indicada, a efectos de hacerlos correctamente. Es fundamental hacer bien los respaldos. De nada sirven respaldos mal hechos (por ejemplo, incompletos). En realidad, es peor disponer de respaldos no confiables que carecer totalmente de ellos! Suele ocurrir que la realizacin de respaldos es una tarea relegada a un plano secundario, cuando en realidad la continuidad de una aplicacin depende de los mismos. Los respaldos son tan importantes como lo es el correcto ingreso de datos. Qu es recuperacin La recuperacin es la tarea que se lleva a cabo cuando es necesario volver al estado de la aplicacin al momento del ltimo respaldo. A partir de los datos de la ltima copia realizada, se hace una copia en sentido inverso, recuperando la aplicacin. Todas las transacciones ocurridas despus del ltimo respaldo se han perdido. Los movimientos ocurridos entre el momento al ltimo respaldo y el momento en que se detecta la necesidad de la recuperacin deben ser reconstruidos a mano. La recuperacin es una tarea eventual. Slo se hace si se han perdido datos, en magnitud tal que justifique utilizar el respaldo. Puede hacerse en forma parcial, por ejemplo, un solo archivo o completo. Si se hace una recuperacin parcial, debe asegurarse que no se altere la integridad de los datos, como ser que los archivos queden en diferente estado de actualizacin respecto al tiempo. En la situacin ptima, la recuperacin nunca tiene que hacerse. Por otra parte, la necesidad de la recuperacin suele surgir cuando menos se lo desea (en sobrecarga de trabajo, con tensin, con plazos de entrega excedidos, etc.), a lo cual se agrega el no saber cmo se hace la recuperacin, por no haberlo hecho nunca antes. Por lo tanto, es recomendable que, al menos una vez por ao, se lleve a cabo una recuperacin, real o simulada. Aspectos a considerar Dado que las aplicaciones (sistemas) tienen caractersticas inherentes, para cada aplicacin corresponde un mtodo apropiado de respaldo / recuperacin de datos. Preferentemente, debe ser establecido por quienes desarrollan la aplicacin, que son los que saben cules datos es necesario respaldar, la mejor manera de hacerlo, etc. y cmo hacer la correspondiente recuperacin. Hay que tener en cuenta las caractersticas propias del usuario y cul es la instalacin en que funciona el sistema. Es decir, qu computadora, dnde est instalada, etc. Incluye el rea fsica (por ejemplo: ambiente aislado o transitado, acondicionamiento trmico, nivel de ruido, etc.). Algunos de los aspectos a considerar se presentan a continuacin. La lista no es taxativa y el orden de cada aspecto no es relevante, siendo cada aspecto de propsito limitado en forma individual. Un adecuado mtodo de respaldo/recuperacin debe tener en cuenta todos los aspectos en conjunto, como ser:

Plan de respaldo Los procedimientos de respaldo y recuperacin desarrollada deben formar parte de un plan de respaldo y recuperacin, el cual debe ser documentado y comunicado a todas las personas involucradas. Dado que, a lo largo del tiempo, varias caractersticas que se consideran para desarrollar este plan sufren cambios (software utilizado, soporte, etc.), el plan debe ser revisado, y de ser necesario modificado de manera peridica. El plan debe contener todos los tems detallados a continuacin y cualquier otro que mejore la realizacin del trabajo o clarifique la tarea. Cules datos se deben incluir Cada aplicacin maneja un conjunto muy variado de datos, algunos estticos, otros dinmicos. Hay datos base, a partir de los cuales se generan datos resultantes (informacin). Al definir el respaldo, se establece si se copian todos los archivos o parte de ellos. Entra en consideracin si la copia incluye los propios programas de la aplicacin. La decisin final se tomar sobre la base de la criticidad de los datos y el valor de los mismos. Tipos de respaldos Existen diferentes tipos de respaldos posibles, que se pueden complementar entre s, como ser: Respaldos globales (full back-up): Se realiza un respaldo total del disco, se respalda la totalidad de las bases de datos y la totalidad de las operaciones que se mantienen en lnea (online). Si se realiza diariamente, ante cualquier problema solamente se debe recuperar el respaldo del da anterior. Respaldos parciales: Se respalda slo una parte de la informacin (solamente una aplicacin, una plataforma, los datos crticos o las bases nuevas, etc.) Como se ve, existen varios criterios para optar qu parte respaldar. Las consideraciones realizadas para el respaldo global valen aqu solamente para las partes respaldadas. Respaldos incrementales: Se combina con respaldos globales o parciales. Se respalda solamente las modificaciones que han ocurrido desde el ltimo respaldo. Para realizar una recuperacin se debe adicionar al ltimo respaldo global todos los respaldos incrementales sucesivos. Es un procedimiento de respaldo gil y que ocupa poco espacio. El procedimiento de recuperacin es complejo. Respaldos diferenciales: Similar al anterior. Se respalda las modificaciones que han ocurrido desde el ltimo respaldo global o parcial. Para realizar una recuperacin se debe adicionar al ltimo respaldo global solamente el ltimo respaldo diferencial. Es un procedimiento de respaldo relativamente gil y que ocupa poco espacio, con un procedimiento de recuperacin de slo dos etapas. Respaldos simultneos: se realiza una copia exactamente igual al mismo tiempo de todos los datos procesados, por ejemplo cuando el sistema de discos espejados es utilizado. Recuperar los datos es simplemente direccionarse a otra unidad de disco. Todos los tipos de respaldo tienen sus ventajas y sus desventajas.

El respaldo global es el ms seguro ya que se tiene la totalidad de los datos, pero tambin es el que insume mayor cantidad de tiempo y capacidad del soporte magntico. El respaldo incremental es el ms rpido, pero tiene una cantidad de informacin limitada a un perodo de tiempo. Para recuperar un sistema determinado o el disco completo, se debe partir del ltimo respaldo parcial o completo y cargar en secuencia cada uno de los respaldos incrementales. En general, se suele hacer un respaldo completo una vez por semana y para cada da de la semana se hace el incremental. Respecto al parcial, insume menos tiempo que el global (y puede llevar menos tiempo que el incremental), pero se est limitado a cierto tipo de informacin. Se suele hacer respaldos globales con menor frecuencia que los parciales. Por ejemplo, una vez por semana se puede hacer respaldo parcial por aplicacin (combinado con los incrementales o diferenciales, en forma diaria) y una vez por mes se hace un respaldo completo del, o los, discos. Por ultimo, el respaldo simultneo es el ms rpido y tiene la totalidad de la informacin actualizada, sin embargo interfiere con el procesamiento de los datos y los datos se encuentran en el mismo lugar fsico que los datos origen. Generalmente los diferentes tipos de respaldo son utilizados en forma complementaria. Para definir el tipo o tipos de respaldo a utilizar se deben tener en cuenta la criticidad de los datos, capacidad de almacenamiento, tiempo disponible para realizarlos y tiempo necesario para recuperarlos. Siguen a continuacin unos ejemplos. a) S el procesamiento de datos es una tarea crtica se optar por un respaldo simultaneo (para no perder tiempo en realizar recuperaciones en forma manual) y se lo complementar con respaldos en otro soporte (removible) empleando cualquiera de los otros tipos de respaldo. b) Suponer que se quiere realizar un respaldo global los fines de semana y para ahorrar tiempo y recursos se hacen respaldos incrementales durante los das de la semana. Entonces, en caso de tener un problema el da mircoles, se deber recuperar el respaldo global del fin de semana y adicionarle los incrementales de los das siguientes para reflejar los cambios ocurridos. Suponer que el tiempo de recuperar el respaldo global es de 4 horas y el de cada respaldo incremental es, en promedio, de 2 horas. Entonces, el recuperar 3 respaldos (global + incremental lunes + incremental martes) requiere de 8 horas (un da de trabajo). El negocio puede soportar perder un da? Si la respuesta es afirmativa, se continuar trabajando de esta manera; si la respuesta es negativa, se deber modificar la operativa. Una solucin sera realizar respaldos globales diarios, que insumen ms tiempo de generacin diariamente pero disminuyen el tiempo de recuperacin, en caso de ser necesario. Modalidad de copia Los tipos posibles de respaldo pueden combinarse en forma conveniente en la modalidad de copia, como ser, por ejemplo: - copia simple - copia doble - copia generacional La copia simple consiste en hacer la tarea de respaldo una sola vez, existiendo un nico ejemplar del respaldo. La copia doble consiste en repetir la tarea, de tal manera de existir dos ejemplares del respaldo. El soporte del respaldo puede, eventualmente deteriorarse. En caso de haber una

copia simple, si se ve afectado, se perdi el respaldo. En caso de haber dos copias, es altamente improbable que los dos ejemplares se deterioren. Por lo tanto, es mejor la copia doble, pero requiere doble de tiempo. La copia generacional es la ms segura y se explica ms adelante. Suele ser un error frecuente, el respaldar los archivos en el mismo disco, con otros nombres, o bien bajo otro subdirectorio. Este respaldo es de muy escaso valor. Slo sirve en caso de destruccin lgica de alguno de los archivos. En caso de rotura fsica del disco o roture lgica de su ndice, la recuperacin no es posible. Adems, se ocupa espacio en el disco. La tcnica de copia doble de respaldo, consiste en disponer de dos juegos de copia de los datos de la aplicacin. Cada vez que se termina de utilizar el sistema se hace una copia, dos veces. Ante una eventual prdida de datos, se tiene un juego de copia para recuperarlos. Si ocurriese una falla en alguno de los soportes, existe an un segundo juego. En la recuperacin, nunca debe utilizarse el segundo juego directamente. Se debe hacer una copia del juego de respaldo en otro computadora. Recin entonces, se debe volver a hacer la recuperacin. Ejemplo: supngase que se deterior fsicamente parte del disco, afectando la aplicacin, por lo cual es necesario recuperarla. Se toma el primer juego de respaldo, se intenta hacer la copia del respaldo al disco y aparece error de lectura en el respaldo. Se usa entonces el segundo juego y ocurre lo mismo. Al analizar lo ocurrido, se detecta que adems de haberse deteriorado el disco, est daada la unidad encargada de grabar los respaldos y al tratar de leer los mismos los daa. Resultado: la aplicacin en disco no funciona y los dos juegos de respaldo quedaron inutilizados. De aqu se concluye la necesidad de hacer otra copia del respaldo, antes de intentar la recuperacin. El respaldo puede ser hecho por una sola persona. En cambio, la recuperacin debera ser hecha por dos personas, siguiendo paso a paso las instrucciones, a efectos de evitar cometer errores. Nunca debe recuperarse en forma apresurada. El mtodo de copia doble, si bien es muy prctico, presenta un importante inconveniente: si por alguna falla se alteran los datos sin que el usuario lo perciba, al hacer los respaldos, se copian los datos errneos. Una vez terminadas las dos copias se poseen tres ejemplares idnticos de datos invlidos, tal vez, sin posibilidad de recuperar la aplicacin a un estado vlido! Si ocurre un error fsico en el disco, la copia no se completa y por lo tanto no se afectan los respaldos. El problema se puede dar si ocurre un error lgico, tal como el borrado de datos, copindose entonces un archivo incompleto. El borrado de datos y de archivos del disco puede ocurrir en forma accidental o intencional, por el propio usuario o por terceros, por motivos tales como: desconocimiento, cansancio, tensin o equivocacin. Como solucin a este inconveniente surge la tcnica de respaldo generacional, tambin es conocida como abuelo-padre-hijo. Se disponen de varios juegos de cintas, cd rom, diskettes, etc., para contener los respaldos a lo largo del tiempo, de tal manera que se guarda una historia de respaldos de la aplicacin. En lugar de respaldar cada vez sobre los mismos cd, cinta, diskette, etc., stos se rotan a lo largo del tiempo. La cantidad de juegos a utilizar pueden ser 4 o ms. Ejemplo: Supngase que se tiene un juego de respaldo por cada da de la semana y al finalizar cada jornada se respalda en el juego correspondiente. De esta forma, no se tienen varias copias

idnticas, sino que son fotografas en secuencia a la finalizacin de cada jornada. Si se tienen que recuperar los datos, se procede de la siguiente manera: Si el de la jornada previa sirve, se lo utiliza. Si est daado, se utiliza el anterior. Y as sucesivamente, hasta 4 das atrs. Las transacciones ocurridas en cada da perdido deben rehacerse Si durante el da mircoles se pierden los datos, se retorna el sistema al estado en que estaba al fin de la jornada del martes, con el juego correspondiente, lo que es equivalente a decir al inicio del mircoles). Si se trata de un error en los datos que se arrastra desde el martes, se utiliza el respaldo del lunes. Todos los movimientos del martes deben rehacerse. Y as sucesivamente hacia atrs, si fuera necesario. Con esta tcnica se evita el inconveniente de la tcnica de copia doble, siempre y cuando se detecte el problema antes de volver a usar los mismos juegos. De aqu que se establezca la cantidad de diferentes lotes a utilizar. Una buena aplicacin, debe proveer informacin sobre el estado de los datos, para que el usuario pueda determinar si todo est bien. Hay aplicaciones que detectan la integridad de los datos en forma automtica. Por lo tanto, no es razonable tener demasiados juegos de respaldo. Es mejor tener los lotes de juegos de respaldo identificados por letras, hacindolos independientes de los das de la semana. Esto permite hacer ms de un respaldo por da, si la cantidad de transacciones hechas lo amerita, como as tambin no hacer respaldos en los das que no hubo actividad. Ejemplo: se tienen 4 juegos de respaldo, identificados por A, B, C y D. Entonces, cada cinta, diskette, o soporte utilizado se identifica por: letra de lote y Nro. Ordinal dentro del lote (Al, A2, A3, 61, 82, B3, Cl, C2, C3, Dl, D2 y D3, si se requieren como mximo 3 para cada respaldo). Para utilizar la tcnica de respaldo generacional es imprescindible utilizar un cuaderno de registro de cada respaldo, tal como se explicar en la seccin Registro. Cundo realizarlo Para determinar cuando se realiza el respaldo debemos conocer los tiempos incurridos en desarrollar la tarea y las ventanas de tiempo disponibles en produccin (tiempo disponible para realizar tareas que no afecte a los procesos habituales de procesamiento de datos). Los tiempos incurridos en desarrollar la tarea varan dependiendo del soporte utilizado (a mayor velocidad de transferencia menor tiempo incurrido), el tipo de respaldo utilizado (el full back-up es el que lleva mayor cantidad de tiempo) y la cantidad de datos a respaldar (a mayor cantidad mayor tiempo de respaldo). Generalmente, en las empresas, las ventanas de tiempo disponibles durante las semana son chicas, por lo que se combinan los tipos de respaldo dependiendo del da de la semana. As, el fin de semana se realiza un respaldo global y durante la semana se realizan respaldos incrementales. Existen momentos en los cuales es necesario realizar respaldos extraordinarios, como ser nueva instalacin de una aplicacin, o migracin de bases de datos o traslado del equipamiento. En estas circunstancias deben realizarse un respaldo global, para estar totalmente cubierto. Periodicidad Cada cunto realizar el respaldo depender de la cantidad de operaciones realizadas y las ventanas de tiempo disponibles. Usualmente, y como recomendable, los mismos deben realizarse diariamente.

Por ejemplo, da a da se hacen respaldos incrementales o diferenciales y una vez por semana se hacen respaldos completos parciales y una al mes respaldos completos totales. Siempre estas decisiones dependen del volumen de los datos, del soporte de almacenamiento disponible, de la velocidad del respaldo, de la importancia de los datos, etc. Herramientas a utilizar Hay varias herramientas posibles para respaldo de datos. Algunas son muy simples y otras son muy sofisticadas. En algunas aplicaciones o DBMS se disponen de programas propios, guiados por men, para llevar a cabo estas tareas. En otras, se deben utilizar los comandos del sistema operativo o programas utilitarios para respaldos. Tambin hay combinacin de ambas situaciones: desde el programa de aplicacin se invocan los comandos del sistema operativo u otro programa. Se le dar prioridad a la herramienta nativa de cada aplicacin o DBMS, pues estn especialmente desarrolladas para respaldar de manera adecuada esos datos, pero la decisin podr ser utilizar un software especial para respaldo, la decisin final la tomar personal experto. Dnde guardarlos - distancia y accesibilidad Muy importante es establecer en qu lugar se deben guardar las copias. Debe ser bajo llave, con un juego cerca de la computadora y otro fuera del edificio. El juego que est cerca debe estar accesible y el otro debe ser de acceso restringido. Los respaldos pueden estar sobre una estantera, al lado de la computadora o bien en una caja fuerte. Segn los datos y la aplicacin se establecen las condiciones de almacenamiento. Tan importante como llevar a cabo los respaldos con regularidad, es el respetar los criterios de almacenamiento. Intervienen consideraciones del medio ambiente (temperatura, humedad, polvo, etc.) como as tambin las personas que tienen acceso al computadora. Han ocurrido situaciones tan crticas como haber guardado todos los respaldos en reas sumamente seguras, tales como en caja fuerte, pero en un lugar tal, que por factores de humedad quedaron totalmente inutilizados. Sin embargo, la deteccin de este problema recin se hizo en el momento en que se necesit hacer la recuperacin. Naturalmente, toda la operativa del sistema informtico se hizo con la certeza de la existencia de los respaldos. Todos los respaldos se llevaban a cabo regularmente y con sus copias, pero se guardaban en el mismo lugar y sin verificacin del estado de las cintas magnticas. Otra aspecto a tener en cuenta es por cuanto tiempo se guardan los respaldos. Es usual que toda la informacin que no est en lnea se encuentre respaldada, contando con toda la historia de las operaciones de la empresa. Sin embargo esto no es obligatorio, si debemos considerar situaciones legales existentes (reglamentaciones que obligan a guardar cierta informacin por X tiempo) o potenciales (procesos judiciales). Quienes realizan y manejan los respaldos Es fundamental definir qu personas son las encargadas de llevar a cabo los respaldos y las recuperaciones. No es necesario que sean las mismas personas que hagan los dos procesos.

Inclusive, en ciertas situaciones, por motivos de seguridad, deben ser distintas. Puede haber varios usuarios que operan la misma aplicacin. En estos casos, un subconjunto reducido de ellos, deben ser los responsables de las tareas de respaldo y recuperacin de datos. La recuperacin siempre debera ser llevada a cabo por dos personas, en lugar de una sola, por seguridad. Verificacin del respaldo Usualmente, la tarea electrnica-mecnica de grabacin, requerida en las copias, se lleva a cabo correctamente. Sin embargo, la nica forma de saber que se grab bien, es volver a leer la copia grabada y verificar que coincida con lo ledo originalmente. Esta verificacin insume tiempo adicional. Es mejor realizar las verificacin en otro computadora, y de manera peridica. Dependiendo de la cantidad de respaldo y del historial de errores, es posible aplicar muestreo estadstico para realizar las verificaciones Consejos para hacer los respaldos y las recuperaciones Siguen a continuacin los consejos para hacer bien los respaldos, en la frecuencia y forma que correspondan, y para llevar a cabo satisfactoriamente las recuperaciones, toda vez que sea necesario. Se los presenta en forma de lista para enfatizarlos: - Disponer del tiempo suficiente - No distraerse por ningn concepto - No hacerlo cuando se est cansado - Trabajar ordenado - Disponer de suficiente cantidad de cintas, diskettes, u otros soportes correctamente rotulados - Contar con otra persona para las recuperaciones - Permanecer junto a la computadora durante la tarea - Verificar una vez por ao estado correcto del computadora - Verificar una vez por ao lectura/grabacin de los respaldos - Tener acceso a otra computadora de similares caractersticas