You are on page 1of 17

METADADESCRIPCION DE UNIDADES DOCUMENTALES ALBERGADAS EN REPOSITORIOS DIGITALES

SCRIPTING OPENSOURCE MULTIPLATAFORMA


Metadatos en Documentos Electrnicos conforme Art 21 RD 4/2010 ENI-AE

METADESCRIPCIN DE UNIDADES DOCUMENTALES ALOJADAS EN


REPOSITORIOS DIGITALES.
BUENAS PRCTICAS DE USO DE JAVASCRIPT MULTIPLATAFORMA.
GUIA DE USO DE SOLUCIONES OPENSOURCE PARA CLASIFICAR
DOCUMENTOS ELECTRNICOS Y METADESCRIBIRLOS.
UN ENFOQUE PRCTICO DEL RD 4/2010 SOBRE EL CICLO DE ARCHIVSTICA DE LA
ADMINISTRACIN LOCAL, EN LA ETAPA ADMINISTRATIVA.

BIOGRAFIA DEL AUTOR

Espejo Gonzlez, Juan Antonio.


Crdoba, 1968. Tcnico Informtica de Gestin.
BIO: Colaborador en colectivos de divulgacin cientfica. Ha publicado en fanzines.
Cocreador del primer fanzine de divulgacin cientfica realizado en soporte de papel
(APEIRON, Andaluca 1986) y netmagazines (COMPUTER PUTES, red Fidonet 1995).
Miembro cofundador de la Asociacin Cordobesa de Correo Electrnico (ACOECO) en
la dcada de los 90. Miembro de los nodos 701, 702 y 703 de la red FidoNet en
Crdoba. Especialidad como auxiliar de documentacin digital jurdica, con diez
aos de experiencia de despachos notariales de Crdoba.
Alumno del Taller Crdoba Document@ 2014-2015, impartido con Fondos
procedientes de la Unin Europea.
juanato@gmail.com
Crdoba // 02-10-2015

1
METADADESCRIPCION DE UNIDADES DOCUMENTALES ALBERGADAS EN REPOSITORIOS DIGITALES
SCRIPTING OPENSOURCE MULTIPLATAFORMA
Metadatos en Documentos Electrnicos conforme Art 21 RD 4/2010 ENI-AE

METADESCRIPCIN DE UNIDADES DOCUMENTALES ALOJADAS EN


REPOSITORIOS DIGITALES.
BUENAS PRCTICAS DE USO DE JAVASCRIPT MULTIPLATAFORMA.
GUIA DE USO DE SOLUCIONES OPENSOURCE PARA CLASIFICAR
DOCUMENTOS ELECTRNICOS Y METADESCRIBIRLOS.
UN ENFOQUE PRCTICO DEL RD 4/2010 SOBRE EL CICLO DE ARCHIVSTICA DE LA
ADMINISTRACIN LOCAL, EN LA ETAPA ADMINISTRATIVA.

PREFACIO: Metadescribir ficheros electrnicos es una obligacin


documental y jurdica para las Administraciones Pblicas (AAPPs), derivada
del art. 21 del RD 4/2010. Las imgenes procedentes de medios de
digitalizacin de documentos permiten representar estructuras organizadas.
Estas estructuras de informacin audiovisual tienen muchos formatos
disponibles. Formatos como CBR, CBZ, EPUB, MOBI permiten representar
informacin textual e iconogrfica con mejor estructura que los Adobe PDF o
DejaV. Ello se consegue serializando bajo estructuras de fichero XML las
reas textuales, que son tratadas separadamente de las iconogrficas. Se
consigue una mayor adaptacin a la salida de visualizacin. Conseguir
adaptar la informacin con un formato de salida adecuado a las
dimensiones de los nuevos terminales que incorporan tablets y,
smartphones cuyas pantallas de informacin presentan dimensiones
inferiores a las exigencias legales en materia de prevencin de riesgos
laborales.

La legislacin espaola en materia de conservacin del Patrimonio cultural


incluye la encomienda de incluir la gestin de documentos en oficina de
archivo. Este archivo tiene valor e inters meramente jurdico para las
Administraciones Pblicas (AAPPs) y el propio administrado. Tarde o
temprano, la propia Administracin que genera los documentos tendr que
realizar todo el ciclo de vida documental, adaptndolo al Real Decreto
mencionado. Adems, deber de tener en cuenta los acontecimientos de
prstamo de copia digital o su colaboracin con otras Administraciones
(envo de una copia con suficiencia de procedencia en sus metadatos, si
interpretamos el art. 21 con visin de futuro y transversalidad). Tendr
que trazar el origen o procedencia del documento electrnico con
metadatos. Es un buen momento el actual para proponer una plataforma
gil y eficaz para que independientemente de su tamao, se pueda
metadescribir de una forma completa y verstil cualquier documento
electrnico por parte de una Administracin Pblica. Con ello cumplir con
los requisitos formales del RD que desarrolla los Esquemas de
Interoperabilidad. Aunque es de competencia estatal, debe de cumplirse
hasta la ltima capa de la esfera: el ente municipal.

Crdoba, a 2 de Octubre de 2.015.

2
METADADESCRIPCION DE UNIDADES DOCUMENTALES ALBERGADAS EN REPOSITORIOS DIGITALES
SCRIPTING OPENSOURCE MULTIPLATAFORMA
Metadatos en Documentos Electrnicos conforme Art 21 RD 4/2010 ENI-AE

METADESCRIPCIN DE UNIDADES DOCUMENTALES ALOJADAS EN


REPOSITORIOS DIGITALES.
BUENAS PRCTICAS DE USO DE JAVASCRIPT MULTIPLATAFORMA.
GUIA DE USO DE SOLUCIONES OPENSOURCE PARA CLASIFICAR
DOCUMENTOS ELECTRNICOS Y METADESCRIBIRLOS.
UN ENFOQUE PRCTICO DEL RD 4/2010 SOBRE EL CICLO DE ARCHIVSTICA DE LA
ADMINISTRACIN LOCAL, EN LA ETAPA ADMINISTRATIVA.

El Framework iMacros: Lenguaje de marcas basado en Javascript


interpretado, independiente del sistema operativo. Usa
el mismo navegador web, sobre plataforma desktop.

El proyecto iMacros opensource es un software multiplataforma para el


navegador Mozilla Firefox presente en sistemas operativos de sobremesa. A
fecha de finales de 2015 no est soportado en las versiones del navegador
Firefox para plataformas mviles, como smartphones y tablets basados en
Android o iOS (plataforma Apple para dispositivos mviles). Si bien, existe
un proyecto emergente, que dota a Android de Google de un clon de Mozilla
Firefox con soporte plugin: proyecto PaleMoon.
Originariamente iMacros fue desarrollado por la empresa germana iOpus
para garantizar una librera de programacin para lenguajes de alto nivel
en sistema operativo Windows. Las tareas repetitivas sobre el navegador
web de Microsoft, Internet Explorer son programables con iMacros Scripting
Edition. No solo est soportada en el sistema operativo Windows, tambin
ha aparecido desde su compra a Ipswitch para otros sistemas operativos.
Las versiones de scripting usando librerias son comerciales, sometidas a
licencia de uso. Despus de estas versiones de pago por licencias, se pens
en integrar esas tareas en el navegador Web, quedando al margen del
sistema operativo. El relleno de formularios, la monitorizacin de servicios
en un servidor web conectado a Internet eran las tareas habituales que
permita esa versin. Luego dej paso a la integracin con el escritorio
Windows del propio navegador web: se poda realizar trasvase de datos
desde una pgina web hasta una aplicacin local, instalada en el ordenador
ejecutante.
El proyecto iOpus iMacros di un giro importante cuando se decidi que la
funcionalidad estuviese disponible para otros navegadores. Imacros de esa
forma sera multiplatafortma, ya que no necesariamente se ejecutara
exclusivamente bajo Microsoft Windows. Hasta entonces solo era posible
desde un sistema operativo como Windows y exclusivamente con su
navegador Internet Explorer. Esta solucin comercial controlaba el
funcionamiento del navegador Internet Explorer.
Se pas a otro estado del arte. Ahora iba a estar integrado dentro del
navegador, sin tener que depender de conocer en profundidad el sistema

3
METADADESCRIPCION DE UNIDADES DOCUMENTALES ALBERGADAS EN REPOSITORIOS DIGITALES
SCRIPTING OPENSOURCE MULTIPLATAFORMA
Metadatos en Documentos Electrnicos conforme Art 21 RD 4/2010 ENI-AE

METADESCRIPCIN DE UNIDADES DOCUMENTALES ALOJADAS EN


REPOSITORIOS DIGITALES.
BUENAS PRCTICAS DE USO DE JAVASCRIPT MULTIPLATAFORMA.
GUIA DE USO DE SOLUCIONES OPENSOURCE PARA CLASIFICAR
DOCUMENTOS ELECTRNICOS Y METADESCRIBIRLOS.
UN ENFOQUE PRCTICO DEL RD 4/2010 SOBRE EL CICLO DE ARCHIVSTICA DE LA
ADMINISTRACIN LOCAL, EN LA ETAPA ADMINISTRATIVA.

operativo. Cuando un navegador con iMacros ejecute una serie de


instrucciones javascript, sern anlogas en funcionalidad y semntica
cuando estemos bajo Windows, OSX o Linux.
Al integrarse en un navegador Web, haciendo ms cmodo su uso, se
consigui otro paso importante: su cdigo iba a ser abierto, no estando
sujeto a patentes de software. As nacieron las versiones opensource de
iMacros para Firefox, iMacros para Chrome e iMacros para Internet Explorer.
Ninguno de ellos representa nada si lo intentamos igualar a la versin sobre
Firefox. Mozilla Foundation nutre en la capa XPCOM de funcionalidades
propias de un S.O. de escritorio, pudiendo llamar a esa capa como el kernel
Mozilla.
Mozilla Foundation cuando dise Firefox garantiz que se pudiesen ejecutar
programas en una consola de comandos interna. Esa consola inteerpreta
comandos escritos en el lenguaje Javascript. Este lenguaje de scripting es
uno de los pilares de la arquitectura del diseo de la WWW de los 90,
cuando Netscape cre un lenguaje que denomin Mocha Wikipedia. Los
documentos electrnicos con lenguaje de marcas en la WWW se solan
disear usando en un porcentaje alto Javascript. Al crear Firefox se di el
nombre de proyecto de esa consola como SpiderMonkey SpiderMonkey. Ello
permite poder comunicarse desde el lenguaje javascript con el interfaz
XPCOM que comunica a todas las partes del navegador Firefox, desde
dentro-dentro y desde fuera-dentro. La interfaz XPCOM abre todo el universo
del navegador Mozilla Firefox al programador o usuario final adiestrado.
Podemos usar todas las caractersticas de un sistema operativo:
escalabilidad, comunicacin integrada trasversal de todos los componentes
XPCOM e independencia del sistema operativo. Es funcional como un viejo
shell (consola de comandos), pero no tenemos que conocer al sistema
operativo. No tenemos que ser especialistas en un sistema operativo
concreto. Abstraemos esa capa y la esfera que combina nuestra iteracin
desde el navegador web hasta el sistema operativo es menos compleja,
ms ntida. Esa menor complejidad para el usuario final permite usar las
mismas funciones para abrir un fichero, para copiarlo en otra carpeta o para
escribir un nuevo contenido en l ya se encuentre Firefox instalado en
Windows... o en otro escritorio.

4
METADADESCRIPCION DE UNIDADES DOCUMENTALES ALBERGADAS EN REPOSITORIOS DIGITALES
SCRIPTING OPENSOURCE MULTIPLATAFORMA
Metadatos en Documentos Electrnicos conforme Art 21 RD 4/2010 ENI-AE

METADESCRIPCIN DE UNIDADES DOCUMENTALES ALOJADAS EN


REPOSITORIOS DIGITALES.
BUENAS PRCTICAS DE USO DE JAVASCRIPT MULTIPLATAFORMA.
GUIA DE USO DE SOLUCIONES OPENSOURCE PARA CLASIFICAR
DOCUMENTOS ELECTRNICOS Y METADESCRIBIRLOS.
UN ENFOQUE PRCTICO DEL RD 4/2010 SOBRE EL CICLO DE ARCHIVSTICA DE LA
ADMINISTRACIN LOCAL, EN LA ETAPA ADMINISTRATIVA.

En 2012 iOpus fue adquirida por Ipswitch Compra de iOpus por parte de
Ipswitch.
Aunque el proyecto Imacros ha cumplido diez aos de la etapa de desarrollo
y comercializacin, en los ltimos cinco aos ha captado la atencin de
muchos expertos en marketing digital porque es una herramienta muy
completa para realizar labores cercanas a la Web 2.0: redes sociales, fuerza
de ventas en portales, captura de informacin contenida en pginas WWW,
etc. En definitiva es una herramienta de propsito general que permite
acercar al usuario final a la gestin del conocimiento en las redes 2.0.
Usando solamente el navegador Firefox, ya tenga el propietario del
ordenador cualquier sistema operativo: iMac, un Windows o un
descontaminado Linux de ego.
iMacros ha conseguido que esa versin para Firefox sea con diferencia la
ms completa que sus hermanas, al disponer el propio proyecto Firefox de
mayor robustez para la programacin de scripts client-side (capa XPCOM).
Adems, tampoco iMacros es un lenguaje de marcas que obligue a disponer
de infraestructura de servidores, ni con conexin permanente a Internet.
Pero esi si es un imperativo en lenguajes como PHP/Perl y la mayora de los
frameworks de desarrollo WWW(que sirven para disear gestores de
contenidos, precursores de los gestores documentales). Estos lenguajes
existentes requieren un equipo de recursos humanos muy tecnificado, no es
posible que un solo usuario pueda codificar, desarrollar y explotar (usar con
eficiencia) en solitario sus producciones de cdigo fuente.
Con tan slo el navegador web, podemos desplegar pequeos trozos de
cdigo escrito en lenguaje Javascript. Acorde al modelo de Firefox XPCOM
XPCOM Wiki, puede ese cdigo ejecutarse en sistemas operativos distintos
para conseguir la misma finalidad: realizar las mismas tareas de
automatizacin. Podemos cumplimentar formularios, subir documentos
electrnicos relacionados o rellenar una insercin de un anuncio comercial
en un portal de clasificados, algo ms distinto de para lo que se cre, que
era automatizar tareas del propio navegador web.
Un diseo de una aplicacin web en lenguajes de alto nivel para realizar
esas mismas tareas obliga a contar con perfiles muy exigentes,

5
METADADESCRIPCION DE UNIDADES DOCUMENTALES ALBERGADAS EN REPOSITORIOS DIGITALES
SCRIPTING OPENSOURCE MULTIPLATAFORMA
Metadatos en Documentos Electrnicos conforme Art 21 RD 4/2010 ENI-AE

METADESCRIPCIN DE UNIDADES DOCUMENTALES ALOJADAS EN


REPOSITORIOS DIGITALES.
BUENAS PRCTICAS DE USO DE JAVASCRIPT MULTIPLATAFORMA.
GUIA DE USO DE SOLUCIONES OPENSOURCE PARA CLASIFICAR
DOCUMENTOS ELECTRNICOS Y METADESCRIBIRLOS.
UN ENFOQUE PRCTICO DEL RD 4/2010 SOBRE EL CICLO DE ARCHIVSTICA DE LA
ADMINISTRACIN LOCAL, EN LA ETAPA ADMINISTRATIVA.

programadores y analistas, ingenieros de software. Un lenguaje de marcas


como iMacros que se traduce a Javascript por el mozilla Firefox ( es
interpretado no compilado) no requiere nada ms que un buen alumno
entrenado.
iMacros4Firefox usa perfiles de usuario final, previa formacin. Su
mantenimiento no obligara a costosos grupos de programadores, ya que en
el mundo que iMacros puede con un slo perfil de hombre orquesta
desplegar el ciclo de vida de una aplicacin informtica web. Ya sea en la
etapa de desarrollo o en la etapa de explotacin: no necesitar ser tan
entendido en otros lenguajes de programacin.
No todos los proyectos iMacros hacen lo mismo. Imacros para Firefox es el
ms completo de los proyectos opensource que ha desarrollado la
propietaria, IPSWITCH. iMacros no es comercial es sus versiones para los
navegadores ms populares. Tiene soporte gratuito por parte de la marca.
Imacros para Firefox es el ms completo de sus hermanos, las versiones
para Internet Explorer y Google Chrome. Es el nico que integra Gestin de
Modelo basado en componentes de software: abstraccin del sistema de
archivos, mensajera entre componentes integrados y gestin de memoria...
lo mismo que un viejo shell. Versiones iMacros en WIKIPEDIA.

iMacros bajo Firefox, un shell grfico opensource.


Cuando una herramienta para usuario final debe de ser evaluada para
conocer si puede ser de inters a la Administracin o la empresa privada se
deben de analizar aspectos como competencias transversales. Debe de
permitir para un amplio abanico de necesidades su integracin entre las
aplicaciones de escritorio, de productividad personal y verticales (webapps
que se ejecutan sobre una pgina web del navegador, portales temticos,
etc). El scripting desde un mismo navegador llamado Firefox de Mozilla, deja
al margen al sistema operativo de escritorio que se usa: MacOSX elitista,
Linux opensource o el proliferante Windows quedaran relegados a un
segundo plano).
Aqu es cuando se hace fuerte la candidatura de iMacros4Firefox, la
herramienta opensource que permite escalabilidad para la formacin de
usuarios finales.
Imaginemos a una Administracin cubriendo necesidades formativas en
toda la escala de personal subalterno o auxiliares C2, por ende la escala de
menos formacin competencial. Desde un Ministerio hasta la ms diminuta
entidad local. Escalabilidad y transversalidad en las posibilidades de
formacin del empleado pblico... o la propia empresa privada. Podemos
desarrollar pequeos proyectos de integracin del escritorio del sistema
operativo con la web semntica, sin necesidad de conocer el sistema

6
METADADESCRIPCION DE UNIDADES DOCUMENTALES ALBERGADAS EN REPOSITORIOS DIGITALES
SCRIPTING OPENSOURCE MULTIPLATAFORMA
Metadatos en Documentos Electrnicos conforme Art 21 RD 4/2010 ENI-AE

METADESCRIPCIN DE UNIDADES DOCUMENTALES ALOJADAS EN


REPOSITORIOS DIGITALES.
BUENAS PRCTICAS DE USO DE JAVASCRIPT MULTIPLATAFORMA.
GUIA DE USO DE SOLUCIONES OPENSOURCE PARA CLASIFICAR
DOCUMENTOS ELECTRNICOS Y METADESCRIBIRLOS.
UN ENFOQUE PRCTICO DEL RD 4/2010 SOBRE EL CICLO DE ARCHIVSTICA DE LA
ADMINISTRACIN LOCAL, EN LA ETAPA ADMINISTRATIVA.

operativo: pudiendo ofrecer como multiplataforma esa solucin informtica.


Tendremos con muy pocas horas de formacin un colectivo importante de
usuarios finales con conocimientos para integrar desktop con web.
Podremos formar fuerza de ventas para realizar campaas en redes sociales
y portales de clasificados (anuncios) o extraer informacin para ser tratada
(gestin documental de documentos electrnicos via metadatos). Como
ejemplo de las necesidades de la Administracin Local, el Excmo.
Ayuntamiento de Crdoba opina en una fase de oposicin que deben los
subalternos de la esfera local que son empleados pblicos que la
digitalizacin ( y cualquier cosa que ponga en el Rd 2010) debe de ser una
de sus funciones y por tanto una de sus aptitudes por desempear.

Imacros 4 Firefox Internals.


Gracias al proyecto iMacros se incluye una librera de cdigo fuente
Javascript realizada por el equipo creativo de iOpus. Ese conjunto de
funciones Javascript permite en distintos sistemas operativos realizar las
mismas tareas sobre archivos y carpetas (subdirectorios) como son la
creacin, el acceso, la modificacin o el borrado. Adems podemos disear
pequeas interfaces de usuario para solicitar informacin y presentarla en
dispositivos de salida. Debajo de todo ello, podemos ejecutar aplicaciones
en el sistema operativo anfitrin de forma transparente, aunque estemos en
entornos distintos. Encima de todo ello, el proyecto iMacros consigue una
ventaja ms competitiva en su versin para Firefox: permite usar un
conjunto de primitivas (funciones sobre la capa XPCOM) que lo hacen ms
cmodo de ensear y usarlo. No podremos obtener esa integracin con sus
versiones ms parecidas y gratuitas: ni bajo Internet Explorer o Google
Chrome. Nunca se podr integrar iMacros con Javascript en ellos, ya que
esos dos proyectos no disponen de la transversalidad que ofrece XPCOM.
Aunque se espera pronto una versin para el navegador Opera, no va a
estar a la altura del desarrollo alcanzado para la versin de Mozilla
Foundation.

7
METADADESCRIPCION DE UNIDADES DOCUMENTALES ALBERGADAS EN REPOSITORIOS DIGITALES
SCRIPTING OPENSOURCE MULTIPLATAFORMA
Metadatos en Documentos Electrnicos conforme Art 21 RD 4/2010 ENI-AE

METADESCRIPCIN DE UNIDADES DOCUMENTALES ALOJADAS EN


REPOSITORIOS DIGITALES.
BUENAS PRCTICAS DE USO DE JAVASCRIPT MULTIPLATAFORMA.
GUIA DE USO DE SOLUCIONES OPENSOURCE PARA CLASIFICAR
DOCUMENTOS ELECTRNICOS Y METADESCRIBIRLOS.
UN ENFOQUE PRCTICO DEL RD 4/2010 SOBRE EL CICLO DE ARCHIVSTICA DE LA
ADMINISTRACIN LOCAL, EN LA ETAPA ADMINISTRATIVA.

CASO PRCTICO: Metadescripcin basada en iMacros para uso de fichas


de unidades documentales desde repositorio digital, con accesibilidad web.
Ejemplo sobre software de gestin documental FLORA.ARCHIV de la casa
EVER TEAM. Entidades como Banco Sabadell han adquirido licencias de uso
de este gestor documental en Espaa.
Tambin el Servicio de Informtica del Excmo. Ayuntamiento de Crdoba ha
adquirido licencias de uso del software FLORA.ARCHIV. Uno de los
desempeos principales es el Servicio Municipal de Archivo. A diferencia de
otros gestores de contenidos y gestores documentales, no es posible aadir
o reemplazar metadatos a los ficheros de imagen o formatos electrnicos
que se encuentran integrados en el gestor documental. Este producto
comercial obliga a desplegar una poltica de gestin documental externa.
Para que estn disponibles bajo ese gestor documental estos ficheros
correctamente metadescritos, al menos bajo FLORA.ARCHIV. ES obvio que si
podremos hacerlo con un pequeo proyecto iMacros4Firefox. Aqu es cuando
se puede poner en valor una pequea herramienta que podra absorver
grandes flujos de trabajo. Pensemos en una caso prctico que puede
sucederle a pequeos municipios que crean convenios de colaboracin para
digitalizar sus fondos. Tal flujo de trabajo originado por una empresa
externa, que rara vez facilita copias electrnicas de los documentos con
metadatos incluidos.. y muchos menos que se adapte a reglas de
etiquetado de nombres de archivo conforme a la archivstica. Porque las
empresas externas suelen desconocer la finalidad que estima el depositante
de los fondos. El convenio origina derechos de uso para su digitalizacin,
pero no para su correcto tratamiento documental. Aqu entra en especial
significado que a la ms pequea escala, entidades locales como los
municipios de menos de 5.000 habitantes se puedean atrever a abrir sus
fondos documentales a iniciativas privadas como FamilySearch, ya que una
pequea formacin en iMacros les permitir metadescribir como parte del
flujo de trabajo cuando se origine la digitalizacin de sus fondos. Incluimos
por competencias a la Administracin que tiene las atribuciones para
garantizar la misma respuesta del servicio a la ciudadana en todos los
municipios de una misma provincia, por ejemplo DIPUTACIONES.
Se acabaron los polticos y empleados pblicos que solo saben aceptar la
creatividad que viene impuesta por una circular o instruccin.

8
METADADESCRIPCION DE UNIDADES DOCUMENTALES ALBERGADAS EN REPOSITORIOS DIGITALES
SCRIPTING OPENSOURCE MULTIPLATAFORMA
Metadatos en Documentos Electrnicos conforme Art 21 RD 4/2010 ENI-AE

METADESCRIPCIN DE UNIDADES DOCUMENTALES ALOJADAS EN


REPOSITORIOS DIGITALES.
BUENAS PRCTICAS DE USO DE JAVASCRIPT MULTIPLATAFORMA.
GUIA DE USO DE SOLUCIONES OPENSOURCE PARA CLASIFICAR
DOCUMENTOS ELECTRNICOS Y METADESCRIBIRLOS.
UN ENFOQUE PRCTICO DEL RD 4/2010 SOBRE EL CICLO DE ARCHIVSTICA DE LA
ADMINISTRACIN LOCAL, EN LA ETAPA ADMINISTRATIVA.

CASO PRCTICO: BOT JAVASCRIPT MULTIPLATAFORMA OPENSOURCE.


RASTREADOR DE CARPETAS Y METADESCRIPTOR CON SCRAPING
WEB.
Hemos denominado as al esqueleto de la aplicacin iMacros-Javascript que
queremos presentar. Lo primero vamos a poner en valor que uno de los
precursores del EMACSCRIPT en el que se basa el actual Javascript fue el
Xbase ANSI. Y antes de nacer el Xbase ANSI, existi un producto comercial
denominado Nantucket Clipper, antes de ser comprado por Computer
Associates en 1995. Era un compilador de cdigo fuente basado en
DbaseIII+ que termin superando al original, generando un hbrido entre
lenguaje Pascal y C, muy competititvo en entornos MsDos de los aos 80 y
90. Cuando lleg el inicio del escritorio Windows para 32 bit, este producto
continu de la mano de Microsoft, al comprar FoxPro. Fue uno de los
primeros compiladores en absorver las mejores tendencias para una
programacin estructurada en data-driven y orientada a objetos. La
notacin hngara se propag entre los programadores de Clipper 5.x a
resultas de las dos nicas redes de comunicaciones que se usaban en
Espaa en los 90, por parte de la comunidad de programadores en Espaa:
Fidonet y Compuserve.
La notacin hngara destaca normalmente a programador que es capaz de
dotar a su cdigo de legibilidad. El programador crea cdigo fuente
inteligible, conceptuando las variables por su tipologa con prefijos. Fue
creada por Microsoft dentro del desarrollo del paquete Office. Notacin
Hngara by Microsoft fue creada por el programador Simonyl.
En todo el cdigo Javascript que se presenta se usa intensivamente esa
identificacin de variables.
Una de las inspiraciones de la World Wide Web en su diseo conceptual en
el CER Laboratory fue usar expresiones de como recorre una araa usando
sus telares para desplazarse. La gran tela de araa fue el concepto que
introdujo el ingeniero Tim Berns Lee que trabajaba en un uevo sistema de
hipertexto para que los investigadores del CERN pudiesen compartir sus
avances. El ejemplo de metadescripcin que presentamos permite elegir
una carpeta de inicio y es capaz de metadescribir un conjunto de carpetas
incrustando metadatos procedentes de fichas documentales presentes en
un repositorio digital en los ficheros que encuentra. Se ha usado el Archivo
Municipal del Ayuntamiento de Crdoba, que ofrece para consultas pblicas
parte de su Archivo Histrico.
Aunque se pueden usar expresiones regulares para formar identificadores
de expedientes administrativos, para que el proyecto pueda coexistir con
aquellas AAPPs que no posean repositorio digital an. Este proyecto no quier
ser un proyecto intrusivo. Los ficheros pueden ser metadescritos
incrustando directamente los metadatos, que no se generan desde un

9
METADADESCRIPCION DE UNIDADES DOCUMENTALES ALBERGADAS EN REPOSITORIOS DIGITALES
SCRIPTING OPENSOURCE MULTIPLATAFORMA
Metadatos en Documentos Electrnicos conforme Art 21 RD 4/2010 ENI-AE

METADESCRIPCIN DE UNIDADES DOCUMENTALES ALOJADAS EN


REPOSITORIOS DIGITALES.
BUENAS PRCTICAS DE USO DE JAVASCRIPT MULTIPLATAFORMA.
GUIA DE USO DE SOLUCIONES OPENSOURCE PARA CLASIFICAR
DOCUMENTOS ELECTRNICOS Y METADESCRIBIRLOS.
UN ENFOQUE PRCTICO DEL RD 4/2010 SOBRE EL CICLO DE ARCHIVSTICA DE LA
ADMINISTRACIN LOCAL, EN LA ETAPA ADMINISTRATIVA.

repositorio digital, sino usando ficheros de control para comprobar su


eficacia. Los ficheros de control son un fichero de webscraping que recoge
los datos sensibles de la unidad documental (evita el que se copie-pegue
manualmente esa informacin), lo almacena en un fichero y despus genera
una plantilla para ser usada bajo Adobe Bridge, para el control de calidad. El
paso intermedio de ejecutar una aplicacin para incrustar los metadatos se
ha dejado sin describir, si bien la existencia de binarios para los tres
sistemas operativos ms abundantes de herramientas que lo hacen, permite
obviar ese paso. Es suficiente la configuracin de un navegador Mozilla
Firefox ejecutando proyectos iMacros en un hardware de 1Gb RAM en un
C2D de 1 Generacin, un hardware muy abundante desde que hace siete
aos la Administracin espaola ha reducido la renovacin peridica de
tecnologas de la Informacin. Adems, no tenemos porque ser un
proselitista usuario de Windows... podemos instalar un Linux y seremos
igual de competitivos.

Recorrer carpetas, sin depender del Sistema Operativo.


Una de las primitivas que nos ofrece XPCOM es una analizador de carpetas y
ficheros, independiente del sistema operativo. Con el intrprete iMacros.
podemos combinarlo con un pequeo Explorer, un Administrador de
Ficheros. Pediremos un punto de inicio, en el rbol de directorios del sistema
operativo. Luego iniciaremos el recorrido por carpetas y ficheros
Rastrearemos el contenido de toda la estructura del sistema de archivos,
pero sin necesidad de conocerlo. No tendremos de preocuparnos de la
nomenclatura de los ficheros ya sean /fichero o \fichero.
Verdaderamente iMacros bajo Firefox es una lenguaje de 30 instrucciones,
que se traducen a Javascript en tiempo de ejecucin (se interpretan)
Vocabulario iMacros. Es fcil de implementar en un nivel bsico. El nivel
avanzado requiere conocer a nivel de destreza Javascript, para integrar una
webapp en Mozilla Fiefox. Son las denominadas mashups

VERSION BUILD=8820413 RECORDER=FX


SET !EXTRACT_TEST_POPUP NO
'SET !ENDOFPAGE {{9}}
' Extraccin de unidad documental completa FLORA.ARCHIVE
'http://consultas.archivo.cordoba.es/ POSICIONADA LA UNIDAD DOCUMENTAL
FRAME NAME="frameArchiveView"
TAG POS=6 TYPE=TD ATTR=CLASS:view-field-value-ever EXTRACT=TXT
SET !VAR1 EVAL("'{{!EXTRACT}}'.replace("/","-")")
SET !VAR2 EVAL("var s=\"{{!EXTRACT}}\"; s.toUpperCase()")
'SET !VAR3 EVAL("var s=\"{{!EXTRACT}}\"; s.replace("/","-")")
SAVEAS TYPE=EXTRACT FOLDER=* FILE={{!VAR1}}.txt
SET !EXTRACT NULL
'ADD !EXTRACT "Tipo UD:" 1 LINEA

10
METADADESCRIPCION DE UNIDADES DOCUMENTALES ALBERGADAS EN REPOSITORIOS DIGITALES
SCRIPTING OPENSOURCE MULTIPLATAFORMA
Metadatos en Documentos Electrnicos conforme Art 21 RD 4/2010 ENI-AE

METADESCRIPCIN DE UNIDADES DOCUMENTALES ALOJADAS EN


REPOSITORIOS DIGITALES.
BUENAS PRCTICAS DE USO DE JAVASCRIPT MULTIPLATAFORMA.
GUIA DE USO DE SOLUCIONES OPENSOURCE PARA CLASIFICAR
DOCUMENTOS ELECTRNICOS Y METADESCRIBIRLOS.
UN ENFOQUE PRCTICO DEL RD 4/2010 SOBRE EL CICLO DE ARCHIVSTICA DE LA
ADMINISTRACIN LOCAL, EN LA ETAPA ADMINISTRATIVA.

TAG POS=11 TYPE=TD ATTR=CLASS:view-field-value-ever EXTRACT=TXT


' Tipo de unidad documental
SAVEAS TYPE=EXTRACT FOLDER=* FILE={{!VAR1}}.txt
SET !EXTRACT NULL
'ADD !EXTRACT "Serie UD:"
TAG POS=3 TYPE=TD ATTR=CLASS:view-field-value-ever EXTRACT=TXT
' Serie AMHCO
SAVEAS TYPE=EXTRACT FOLDER=* FILE={{!VAR1}}.txt
SET !EXTRACT NULL

'ADD !EXTRACT "ISADG UD AHMCO:"


TAG POS=5 TYPE=TD ATTR=CLASS:view-field-value-ever EXTRACT=TXT
' ISADG- Tema IPTC metadescripcin <rdf:li>
SAVEAS TYPE=EXTRACT FOLDER=* FILE={{!VAR1}}.txt
SET !EXTRACT NULL

'ADD !EXTRACT "Signatura AHMCO:"


TAG POS=6 TYPE=TD ATTR=CLASS:view-field-value-ever EXTRACT=TXT
' Signatura AHMCO
SAVEAS TYPE=EXTRACT FOLDER=* FILE={{!VAR1}}.txt
SET !EXTRACT NULL

'ADD !EXTRACT "Descripcin UD AHMCO:"


TAG POS=7 TYPE=TD ATTR=CLASS:view-field-value-ever EXTRACT=TXT
' Texto descriptivo unidad documental AHMCO
SAVEAS TYPE=EXTRACT FOLDER=* FILE={{!VAR1}}.txt
SET !EXTRACT NULL

'ADD !EXTRACT "Fecha procedencia UD:"


TAG POS=8 TYPE=TD ATTR=CLASS:view-field-value-ever EXTRACT=TXT
'Fecha UD

SAVEAS TYPE=EXTRACT FOLDER=* FILE={{!VAR1}}.txt


SET !EXTRACT NULL

Cdigo n 1.- Plantilla iMacros que reconoce una ficha de unidad documental
en el navegador y la traslada a un fichero de texto plano.

11
METADADESCRIPCION DE UNIDADES DOCUMENTALES ALBERGADAS EN REPOSITORIOS DIGITALES
SCRIPTING OPENSOURCE MULTIPLATAFORMA
Metadatos en Documentos Electrnicos conforme Art 21 RD 4/2010 ENI-AE

METADESCRIPCIN DE UNIDADES DOCUMENTALES ALOJADAS EN


REPOSITORIOS DIGITALES.
BUENAS PRCTICAS DE USO DE JAVASCRIPT MULTIPLATAFORMA.
GUIA DE USO DE SOLUCIONES OPENSOURCE PARA CLASIFICAR
DOCUMENTOS ELECTRNICOS Y METADESCRIBIRLOS.
UN ENFOQUE PRCTICO DEL RD 4/2010 SOBRE EL CICLO DE ARCHIVSTICA DE LA
ADMINISTRACIN LOCAL, EN LA ETAPA ADMINISTRATIVA.

function EligeCarpeta()
{
var fp = Components.classes["@mozilla.org/filepicker;1"].createInstance(Components.interfaces.nsIFilePicker);
var oRetorno;

// initial directory use Macros folder as defined in iMacros Preferences


fp.displayDirectory = imns.Pref.getFilePref('defsavepath');
// filePicker.modeGetFolder
fp.init(window, "Elija imagen a METADESCRIBIR", Components.interfaces.nsIFilePicker.modeOpen);
fp.appendFilter("Imagen JPG (*.jpg)", "*.jpg");
fp.appendFilter("Imagen TIFF (*.tif)", "*.tif");
fp.appendFilter("Imagen TIFF (*.tiff)", "*.tiff");
fp.appendFilter("Imagen JPEG (*.jpeg)", "*.jpeg");
fp.appendFilter("Imagen JPE 2000 (*.jpe)", "*.jpe");

oRetorno = fp.show();
// file picker canceled
if ( oRetorno !== Components.interfaces.nsIFilePicker.returnOK)
{
iimDisplay('Cancelada la seleccin.');
oRetorno = 0;

return oRetorno.path
}

Cdigo n 2.- Javascipt sobre XPCOM. Un administrador de ficheros, un


filepicker para seleccionar fichero digitales iconogrficos, imgenes.

12
METADADESCRIPCION DE UNIDADES DOCUMENTALES ALBERGADAS EN REPOSITORIOS DIGITALES
SCRIPTING OPENSOURCE MULTIPLATAFORMA
Metadatos en Documentos Electrnicos conforme Art 21 RD 4/2010 ENI-AE

METADESCRIPCIN DE UNIDADES DOCUMENTALES ALOJADAS EN


REPOSITORIOS DIGITALES.
BUENAS PRCTICAS DE USO DE JAVASCRIPT MULTIPLATAFORMA.
GUIA DE USO DE SOLUCIONES OPENSOURCE PARA CLASIFICAR
DOCUMENTOS ELECTRNICOS Y METADESCRIBIRLOS.
UN ENFOQUE PRCTICO DEL RD 4/2010 SOBRE EL CICLO DE ARCHIVSTICA DE LA
ADMINISTRACIN LOCAL, EN LA ETAPA ADMINISTRATIVA.

function DameUnidades( cCarpeta)


{
var oFS = new FileUtils.File(cCarpeta);
var oEntradasEnum = oFS.directoryEntries, aUnidades = [];
while (oEntradasEnum.hasMoreElements()) {
aUnidades.push(oEntredassEnum.getNext().
QueryInterface(Components.interfaces.nsILocalFile).path);}
return aUnidades;
}

Cdigo n 3.- Primitiva XPCOM que permite enumerar carpetas y directorios


a un nivel de profundidad elegido. Devuelve un array donde podemos de
nuevo invocar a la misma funcin, rastreando todos los ficheros que
interesen. Por cada entrada directory se ejecutaran las acciones descritas.
Documentacin XPCOM/Reference Interface nsIFile

13
METADADESCRIPCION DE UNIDADES DOCUMENTALES ALBERGADAS EN REPOSITORIOS DIGITALES
SCRIPTING OPENSOURCE MULTIPLATAFORMA
Metadatos en Documentos Electrnicos conforme Art 21 RD 4/2010 ENI-AE

METADESCRIPCIN DE UNIDADES DOCUMENTALES ALOJADAS EN


REPOSITORIOS DIGITALES.
BUENAS PRCTICAS DE USO DE JAVASCRIPT MULTIPLATAFORMA.
GUIA DE USO DE SOLUCIONES OPENSOURCE PARA CLASIFICAR
DOCUMENTOS ELECTRNICOS Y METADESCRIBIRLOS.
UN ENFOQUE PRCTICO DEL RD 4/2010 SOBRE EL CICLO DE ARCHIVSTICA DE LA
ADMINISTRACIN LOCAL, EN LA ETAPA ADMINISTRATIVA.

SUPLEMENTO: LEGISLACIN
Real Decreto 4/2010, de 8 de enero, por b) La inclusin en los
el que se regula el Esquema Nacional de expedientes de un ndice electrnico
Interoperabilidad en el mbito de la firmado por el rgano o entidad
Administracin Electrnica. i
actuante que garantice la integridad del
expediente electrnico y permita su
recuperacin.
c) La identificacin nica e
Artculo 21 RD 4/2010: inequvoca de cada documento por
medio de convenciones adecuadas, que
CAPTULO X.
permitan clasificarlo, recuperarlo y
Recuperacin y conservacin referirse al mismo con facilidad.
del documento electrnico.
d) La asociacin de los
Artculo 21. Condiciones para la
metadatos mnimos obligatorios y, en su
recuperacin y conservacin de
caso, complementarios, asociados al
documentos.
documento electrnico, a lo largo de su
1. Las Administraciones pblicas ciclo de vida, e incorporacin al
adoptarn las medidas organizativas y esquema de metadatos.
tcnicas necesarias con el fin de
e) La clasificacin, de acuerdo
garantizar la interoperabilidad en
con un plan de clasificacin adaptado a
relacin con la recuperacin y
las funciones, tanto generales como
conservacin de los documentos
especficas, de cada una de las
electrnicos a lo largo de su ciclo de
Administraciones pblicas y de las
vida. Tales medidas incluirn:
Entidades de Derecho Pblico
a) La definicin de una poltica vinculadas o dependientes de aqullas.
de gestin de documentos en cuanto al
f) El perodo de conservacin de
tratamiento, de acuerdo con las normas
los documentos, establecido por las
y procedimientos especficos que se
comisiones calificadoras que
hayan de utilizar en la formacin y
correspondan, de acuerdo con la
gestin de los documentos y
legislacin en vigor, las normas
expedientes.
administrativas y obligaciones jurdicas
que resulten de aplicacin en cada caso.

14
METADADESCRIPCION DE UNIDADES DOCUMENTALES ALBERGADAS EN REPOSITORIOS DIGITALES
SCRIPTING OPENSOURCE MULTIPLATAFORMA
Metadatos en Documentos Electrnicos conforme Art 21 RD 4/2010 ENI-AE

METADESCRIPCIN DE UNIDADES DOCUMENTALES ALOJADAS EN


REPOSITORIOS DIGITALES.
BUENAS PRCTICAS DE USO DE JAVASCRIPT MULTIPLATAFORMA.
GUIA DE USO DE SOLUCIONES OPENSOURCE PARA CLASIFICAR
DOCUMENTOS ELECTRNICOS Y METADESCRIBIRLOS.
UN ENFOQUE PRCTICO DEL RD 4/2010 SOBRE EL CICLO DE ARCHIVSTICA DE LA
ADMINISTRACIN LOCAL, EN LA ETAPA ADMINISTRATIVA.

g) El acceso completo e vinculadas o dependientes de aqullas


inmediato a los documentos a travs de que ejercen la competencia sobre el
mtodos de consulta en lnea que documento o expediente.
permitan la visualizacin de los
i) La coordinacin horizontal
documentos con todo el detalle de su
entre el responsable de gestin de
contenido, la recuperacin exhaustiva y
documentos y los restantes servicios
pertinente de los documentos, la copia o
interesados en materia de archivos.
descarga en lnea en los formatos
originales y la impresin a papel de j) Transferencia, en su caso, de
aquellos documentos que sean los expedientes entre los diferentes
necesarios. El sistema permitir la repositorios electrnicos a efectos de
consulta durante todo el perodo de conservacin, de acuerdo con lo
conservacin al menos de la firma establecido en la legislacin en materia
electrnica, incluido, en su caso, el sello de Archivos, de manera que se pueda
de tiempo, y de los metadatos asociados asegurar su conservacin, y
al documento. recuperacin a medio y largo plazo.

h) La adopcin de medidas para k) Si el resultado del


asegurar la conservacin de los procedimiento de evaluacin
documentos electrnicos a lo largo de documental as lo establece, borrado de
su ciclo de vida, de acuerdo con lo la informacin, o en su caso,
previsto en el artculo 22, de forma que destruccin fsica de los soportes, de
se pueda asegurar su recuperacin de acuerdo con la legislacin que resulte de
acuerdo con el plazo mnimo de aplicacin, dejando registro de su
conservacin determinado por las eliminacin.
normas administrativas y obligaciones l) La formacin tecnolgica del
jurdicas, se garantice su conservacin a personal responsable de la ejecucin y
largo plazo, se asegure su valor del control de la gestin de documentos,
probatorio y su fiabilidad como como de su tratamiento y conservacin
evidencia electrnica de las actividades en archivos o repositorios electrnicos.
y procedimientos, as como la
transparencia, la memoria y la m) La documentacin de los
identificacin de los rganos de las procedimientos que garanticen la
Administraciones pblicas y de las interoperabilidad a medio y largo plazo,
Entidades de Derecho Pblico as como las medidas de identificacin,

15
METADADESCRIPCION DE UNIDADES DOCUMENTALES ALBERGADAS EN REPOSITORIOS DIGITALES
SCRIPTING OPENSOURCE MULTIPLATAFORMA
Metadatos en Documentos Electrnicos conforme Art 21 RD 4/2010 ENI-AE

METADESCRIPCIN DE UNIDADES DOCUMENTALES ALOJADAS EN


REPOSITORIOS DIGITALES.
BUENAS PRCTICAS DE USO DE JAVASCRIPT MULTIPLATAFORMA.
GUIA DE USO DE SOLUCIONES OPENSOURCE PARA CLASIFICAR
DOCUMENTOS ELECTRNICOS Y METADESCRIBIRLOS.
UN ENFOQUE PRCTICO DEL RD 4/2010 SOBRE EL CICLO DE ARCHIVSTICA DE LA
ADMINISTRACIN LOCAL, EN LA ETAPA ADMINISTRATIVA.

recuperacin, control y tratamiento de


los documentos electrnicos.
2. A los efectos de lo dispuesto en el
apartado 1, las Administraciones
pblicas crearn repositorios
electrnicos, complementarios y
equivalentes en cuanto a su funcin a
los archivos convencionales, destinados
a cubrir el conjunto del ciclo de vida de
los documentos electrnicos.
INCISO: Si bien el principio de
procedencia en Archivstica no est
propiamente recogido en este art. 21, la
inclusin de metadatos en la etapa
administrativa de los documentos
electrnicos (que pueden hacer
referencia a documentos presentes en
expedientes administrativos y ser
entregadas a otras Administraciones, los
propios interesados administrativos o
prstamos dentro de la propia
Administracin poseedora de ese
expediente) se puede considerar como
una buena prctica.
Antecedentes iMacros en Firefox:
GreaseMonkey.
WIKIPEDIA GreaseMonkey.

16
i