Вы находитесь на странице: 1из 15

El arte de recuperar y abrir archivos

antiguos
Los archivos envejecen, y envejecen muy mal. Mientras que
un documento de papel se puede leer mientras siga intacto,
un archivo incompatible...
Fabrizio Ferri-Benedetti |
10 de mayo del 2013

Utilidades

Nivel Avanzado

Windows

Mac

Linux

Los archivos envejecen, y envejecen muy mal. Mientras que un documento de papel se puede
leer mientras siga intacto, un archivo incompatible o corrupto nada dice acerca de sus
contenidos, al menos no hasta que apliques algunas tcnicas de recuperacin de datos y
arqueologa informtica.
Busca ese viejo disquete que guardas en el cajn. O aquel disco duro antiguo. O incluso una de
esas viejas cintas en las que solas hacer las copias de seguridad. Si consigues acceder a sus
carpetas, la probabilidad de que te encuentres con archivos que eres incapaz de abrir es muy
alta.
Voy a explicarte cules son las razones ms habituales por las que los archivos antiguos son tan
difciles de abrir y qu puedes hacer para rescatar su contenido total o parcialmente. Ya
vers que para ser un arquelogo digital no hace falta ltigo ni tampoco sombrero, pero s algo de
paciencia y habilidad.

Por qu un archivo antiguo no se puede abrir?


La lectura de soportes anticuados es solo una parte del problema al que se enfrentan quienes han
de recuperar datos obsoletos, y a menudo es la menor de sus preocupaciones. El gran obstculo
es la apertura de los datos, que estn a veces guardados en formatos desconocidos o
incompatibles.
Para entender por qu es difcil leer archivos antiguos hay que saber primero cmo se
almacena la informacin.
Los archivos son largusimas hileras de ceros y unos que se graban en un soporte de
almacenamiento, como un disco duro o una tarjeta de memoria. Para diferenciar entre un
documento y otro, ese flujo de caracteres se encapsula en lo que llamamos "archivos", que no
son ms que reas delimitadas por cabeceras de cdigo.

Un archivo tpico: datos,


una extensin (cabecera) y metadatos (informacin sobre los datos)
El formato de una archivo es como una gramtica por la cual se rige la escritura de los datos,
que se pueden organizar de muchsimas maneras. En algunos sistemas, como Windows, el
formato suele indicarse por la extensin, que no es ms que una serie de caracteres -a menudo un
acrnimo- que sigue al nombre del archivo.

Estas "gramticas" que permiten leer e interpretar el contenido de una archivo se detallan en las
especificaciones de formato, documentos tcnicos que pueden ser de pblico dominio o bien
propietarios y, a veces, confidenciales. Por ejemplo, el formato de imagen de Adobe Photoshop,
el conocido .PSD, se detalla aqu para todo el mundo.

Un archivo .PSD (Photoshop) tiene una estructura compleja


Un formato simple, bien diseado y de dominio pblico puede tener una vida til muy larga. Los
problemas empiezan cuando hay que tratar con archivos creados en formatos propietarios, poco
o nada documentados o creados para aplicaciones que han sido abandonadas o que se han
actualizado sin considerar la compatibilidad hacia atrs.

Abrir hoy un documento creado con el procesador de textos Lotus Ami Pro puede ser
complicado
Otros problemas surgen cuando el archivo est corrupto (parte de sus datos se han perdido o
daado) o comprimido en un formato a su vez desconocido. El cifrado, finalmente, acaba por
convertir carpetas enteras en cajas de seguridad cuya llave ha sido tirada al mar.

Tcnicas para recuperar y abrir archivos antiguos


Ah tienes el soporte de almacenamiento y un lector apropiado. Te dispones a acceder al mismo
para recuperar datos -si los hay-. Pero, antes de hacerlo, conviene que contestes una serie de
preguntas, tiles para definir el escenario de recuperacin:

Qu es probable que contengan los archivos?

Qu programas se usaron para editarlos?

Con qu sistema operativo se trabaj?

En qu idioma estn los archivos?

Se utiliz cifrado o compresin?

Ms informacin previa tienes, ms fcil y rpida puede ser la recuperacin. En este


artculo, no obstante, vamos a dar por sentado que tu conocimiento sobre los ficheros a rescatar
es prcticamente nulo. Los pasos que explico a continuacin permitirn contestar las preguntas
anteriores (o por lo menos intentarlo).

1. Obtener una copia exacta de los archivos / soportes

Es una de las leyes fundamentales de la informtica forense, y tambin de la recuperacin de


archivos: antes de intentar cualquier operacin de apertura o manipulacin de los datos, conviene
obtener una copia lo ms fiel posible del soporte original y trabajar exclusivamente con ella.
Los programas de clonado de unidades permiten obtener una imagen virtual de cualquier disco
legible. Por otro lado, las herramientas de copia de bajo nivel son capaces de leer flujos de
datos incluso si carecen de estructura o han sido daados (o si el disco duro tiene problemas).
Las herramientas de copia de bajo nivel y clonado de discos que te recomiendo son las
siguientes:

IsoBuster, capaz de leer todo tipo de unidades y crear imgenes ISO (recomendada)

Unstoppable Copier, una utilidad para copiar archivos ignorando los errores de lectura

El comando dd de Linux y Unix, muy potente para leer datos en bruto (para Windows,
WinDD)

OSFClone, una herramienta arrancable que clona discos enteros (y OSFMount para
leerlos)

Daemon Tools, indispensable para montar las imgenes en unidades virtuales

Si no quieres trabajar con imgenes, puedes usar las operaciones de copia clsicas del sistema
operativo, pero puede que fallen en caso de errores de lectura. En Windows, utilidades de
copiado fiables son Teracopy y SuperCopier.

IsoBuster en accin. A diferencia del copiado normal, el suyo puede con los errores
Para ver un ejemplo de cmo usar IsoBuster para leer un CD/DVD daado, lee mi tutorial de
recuperacin. El procedimiento es similar al de otras utilidades grficas. El objetivo final es que
consigas tener una copia fiel de los archivos a examinar.

2. Identificar el tipo de archivo / formato


Ya tienes los archivos, pero quiz no conozcas su formato. Aqu hay dos situaciones posibles:

La extensin es visible, pero no la conoces

El archivo no tiene extensin en su nombre

Si el archivo tiene una extensin, puedes introducirla en buscadores de extensiones, como


FileInfo o Filext. Una simple bsqueda en Google tambin puede ayudar. Un ejemplo popular:
"abrir APK" (la extensin de las apps de Android).

La ficha de FileInfo sobre el formato .SAM. La pgina te indica tambin qu programas pueden
abrirlo
Pero qu ocurre si el archivo no tiene extensin o si la bsqueda no arroja resultados? En ese
caso, debes analizar el archivo. Este mtodo no siempre arroja una alta precisin, pero da pistas
muy tiles sobre el contenido del archivo.
Hay una herramienta digna de CSI que hace ese trabajo de anlisis por ti. Se llama TrID, y
gracias a su amplia base de datos de firmas y cabeceras es capaz de identificar ms de 5.000
formatos. Y es una base de datos en constante crecimiento.

Al parecer el archivo es casi seguramente una base de datos con imgenes en su interior
Una opcin todava ms rpida y completa? Si el archivo tiene un tamao inferior a los 10
megabytes, puedes subirlo a VirusTotal, que no solo lo escanear en busca de malware, sino que
adems analizar su formato con TrID.

Sabias que VirusTotal tambin analiza el formato del archivo y sus metadatos?
Ahora bien, conocer el formato es solo la mitad del trabajo. Una vez que lo conoces, debes
encontrar el programa capaz de abrirlo. Una rpida bsqueda en FileInfo o FileExt -o en
Google- te dir con qu aplicacin puedes intentarlo.

3. Intentar la apertura con programas compatibles


En un mundo ideal, el archivo que has identificado est intacto y puedes abrirlo sin problemas
con una de las aplicaciones que tienes instaladas. Como mucho, puede que te encuentres con
pequeas anomalas visuales, pero ya est.
Pero tambin puede ocurrir una de las siguientes situaciones:
1. Tienes el programa, pero no se ejecuta en tu sistema operativo actual
2. Tienes el programa, debera ejecutarse, pero no lo hace
3. No tienes el programa o no lo encuentras por ninguna parte
4. Tienes el programa, pero no consigues abrir el archivo
Caso 1: tienes el programa, pero no se ejecuta en tu PC
Un programa de hace muchos aos puede que no se ejecute correctamente en tu ordenador por
pura y simple falta de compatibilidad. Un ejemplo son muchas aplicaciones para MS-DOS o
viejas versiones de Windows.

Mi consejo es que uses DOSBox para ejecutar esas aplicaciones antiguas. Es un emulador eficaz
y muy fcil de configurar (aqu te lo explico). En contra de la creencia popular, DOSBox no solo
sirve para juegos, sino tambin para aplicaciones estndar.

Necesitas una emulacin ms completa, quiz de otro sistema operativo? En ese caso, lo mejor
que puedes hacer es configurar una mquina virtual, que no es ms que un PC virtual dentro
de tu PC. La que recomiendo es VirtualBox.

En este magnfico tutorial, Fede Diaz explica cmo instalar MS-DOS 6.22 y Windows 3.11 en
VirtualBox
Caso 2: tienes el programa, debera ejecutarse, pero... no lo hace
Aun tenindolo todo configurado a las mil maravillas -al menos tericamente-, el Universo
puede conspirar contra ti para que el programa que deba abrir tus documentos no consiga...
abrirse.

Vaya... memoria insuficiente. Menudo fastidio, no?


En mi artculo "10 motivos porque un programa no se abre" analizo las causas de cuelgue ms
frecuentes y ofrezco soluciones para las mismas. Ninguna te ha servido? Pasa a los puntos
siguientes...
Caso 3: no tienes el programa o no lo encuentras por ningn sitio
En ocasiones el programa original se ha perdido y ni siquiera en los sitios de abandonware es
posible dar con ellos. Puede pasar. En ese caso, no desesperes todava, pues puedes hacer algo al
respecto.
La primera opcin es convertir el archivo a un formato compatible usando un conversor
especfico para tu formato. Una bsqueda en Google con el formato "EXT1 to EXT2" o "EXT a
EXT" te mostrar conversores aptos para la tarea.

Miles de personas se han enfrentado a tu problema antes, y quiz lo hayan resuelto (captura de
GMayor)
Otra cosa que puedes intentar es buscar plugins o accesorios compatibles. Por ejemplo, si lo
que tienes que abrir es un documento de texto, busca un plugin para un editor que tengas, o una
versin anterior que s es capaz de abrir el archivo.
Caso 4: tienes el programa y funciona, pero el archivo no se abre
Hay muchas razones por las que un archivo no pueda abrirse correctamente en su programa.
Entre las ms habituales:
1. Ha sido dividido en segmentos (por ejemplo, con un programa tipo Hacha o HJ-Split)
2. El contenido est comprimido o protegido por una clave desconocida (cifrado)
3. El archivo tiene una extensin errnea o varias extensiones mezcladas
4. Su contenido ha sido sobrescrito, borrado, corrompido o infectado con virus
En los dos primeros casos, debes prestar atencin al contexto del archivo: hay instrucciones
en la carpeta? Ha dejado alguien una clave? Hay archivos con el mismo nombre que pudieran
ser segmentos?
El caso 3 es fcil de resolver: solo requiere que vuelvas a analizar el archivo y cambies la
extensin, o incluso que la dejes vaca y dejes que el programa intente adivinar el formato
forzndolo a abrir un archivo desconocido.
El cuarto caso es el ms peliagudo. Si el archivo ha perdido su integridad, su apertura de poco
te podr servir (a menos que el programa empleado sea muy tolerante a los errores). Lo que nos
lleva al punto 4 de este artculo.

4. Nada funciona? Hora de usar el bistur...


Es el peor de los escenarios, y de veras espero que no hayas tenido que llegar a l. Si tus archivos
no se abren de ninguna manera, vas a tener que extraer de ellos toda la informacin
aprovechable. No es un procedimiento sencillo.

La extraccin de datos implica casi siempre una lectura de bajo nivel similar a la que efectan
los recuperadores de archivos borrados. En algunos casos, sobre todo para recuperar texto,
tendrs que usar un editor hexadecimal.

Hay formatos son ms tolerantes con los errores que otros. A mayor compresin de datos, peor
recuperacin
Forzar la apertura con visualizadores rara vez funciona, sobre todo si los archivos tienen algn
tipo de compresin (como muchos vdeos y archivos de sonido). Los formatos ms
recuperables tienen una estructura simple (como WAV o BMP).
Un editor hexadecimal, como HxD o WinHex, te ayudar en la ardua tarea de recuperar datos.
Basta con abrir cualquier archivo para poder buscar cadenas de texto en su interior y copiarlas
luego al portapapeles.

HxD ha encontrado texto, en este caso dentro de un procesos en la memoria. Exportarlo es muy
fcil

Prevencin: cmo facilitar la recuperacin futura de tus datos


Guardar datos para la posteridad no es un asunto trivial. Como explican muy bien aqu,
todos los programas son vulnerables a la obsolescencia, y los formatos de archivo usados por
ellos, tambin.
Las tres palabras clave para evitar problemas de recuperacin de datos son redundancia,
transparencia y documentacin. Tus datos deben estar guardados en formatos abiertos, poco
sensibles a errores y bien documentados.
Algunos consejos prcticos de cara al futuro de tus archivos:

Emplea formatos de archivo de cdigo abierto o muy populares

Guarda los documentos importantes en ms de un formato

No usar cifrado o compresin a menos que sea realmente necesario

Acompaar los archivos de una descripcin y/o metadatos

Almacenar los archivos importantes en ms de una copia y soporte

Con algo de suerte, las generaciones futuras podrn acceder todava a tus documentos y
leerlos sin necesidad de acudir a laboratorios de arqueologa digital o centros de preservacin de
documentos.

Вам также может понравиться