Вы находитесь на странице: 1из 10

Conferencia

Tecnologías de punta aplicadas a la conservación del patrimonio audiovisual


en redes multimedia
Por: Félix del Valle
(Universidad Complutense de Madrid)

Estados Unidos ha propuesto ya cómo utilizar los códigos IPTC (International


Press Telecomunications), que son los códigos de transmisión de información de
agencia. Cómo utilizar los códigos IPTC como metadatos de la fotografía digital
utilizando Photoshop: pasas el documento digital a Photoshop, abres propiedades,
en propiedades añaden códigos IPTC, en códigos IPTC conectas para traerte toda
la lista de códigos o la tienes combinada con esto y cargas los códigos. Y la
fotografía la envías ya con metadatos. Entonces la fotografía de prensa ya lleva
sus metadatos, con lo cual llega al periódico o llega al archivo con metadatos, que
si el fotógrafo los ha puesto bien, ya tienes un punto de partida importante porque
los códigos IPTC son códigos temáticos. Bueno, son códigos temáticos una parte.
Yo siempre me voy a lo temático porque me interesa más. Tiene también los
códigos relativos al color, todas estas cuestiones y los códigos temáticos, con un
lenguaje documental normalizado, previsto para materiales de prensa. De tal
manera que te llega algo ya marcado; algo marcado que puede captar el sistema,
metes la fotografía y captas los metadatos, y los incorporas a la base de datos. No
hay nadie que tenga que volver a fichar la fotografía, porque la fotografía ya lleva
sus propios metadatos, el documento viaja con ellos; eso es lo fundamental: que el
documento viaje con ellos. Entonces si, por ejemplo, aquí hay diez archivos, cada
uno tiene su página Web, cada uno tiene su sección de noticias y todos utilizan
unas marcas comunes. Yo como lector y como usuario, me interesaría saber lo
que dicen sus diez archivos, pero no tengo tiempo de abrir sus diez páginas. Si
todos utilizan una herramienta común de marcas que se llama RSS y me marcan
las noticias, yo instalaré, de una forma sencillísima y baratísima, sin precio, mi
pequeñita herramienta que en el momento en que me conecte a Internet, en mi
portal aparecerán las noticias de los diez sitios. Cada vez que me conecte, me
actualizará las noticias que han puesto ustedes nuevas. Y es muy sencillo. Esos
son los lenguajes de marcas, indicar qué significan las cosas. Estos son titulares.
Esto ya lo van a encontrar, entren en cualquier periódico de los gordos, el New
York Times o alguno de éstos, váyase al final de la página y encontrarán en
pequeñito un recuadro que pone RSSXML. Eso significa que se pueden traer las
noticias a su servidor. Entonces se crean su weblog y se lo crean gratis. Estoy
hablando de individuos concretos que no tienen más que un ordenador conectado
a Internet por módem. Hagan su página Web, instalen o hagan un weblog, que es
lo más sencillo del mundo hacer un weblog. En ese weblog incorporen titulares y
tendrán un weblog en el que ustedes cuentan cosas y en el que comprueban los
titulares de los periódicos o revistas que les interese a ustedes hablar o de los que
les interese contar.

Pero necesitas un dominio, necesitas un servidor. Por eso he dicho en este caso
concreto que estamos proponiendo a instituciones latinoamericanas relacionadas
con esto, que disponemos de un servidor en la Complutense que está a su
disposición. Si quieren hacer un nodo de la red de la documentación informativa.
La documentación informativa sirve para todo. Nosotros le llamamos
documentación informativa porque sirve para cualquier cosa. Entonces está
nuestro servidor a disposición. Claro, si sólo tienes un servidor gratuito -en Geocity
o en alguna cosa de éstas- ya empiezan a permitírtelo. Porque, en realidad, para
poder tener una cosa de éstas tienes que instalarla en el servidor. Si no tienes
servidor no lo puedes hacer. Pero en algunos servidores gratuitos ya empieza a
funcionar. Y en algunos de los weblogs -el éxito brutal ha sido ahora Blogger-.
Cada vez hay más weblogs. ¿Qué es un weblog? Una bitácora, un diario en el que
tú cuentas algo. Están revolucionando el periodismo, en cierto modo y están
planteando un problema ético periodístico muy concreto, y es ¿es legítimo que un
periodista tenga su propio blog y dé sus propias noticias fuera del periódico que le
está pagando? ¿Hasta qué punto eso es legítimo? Porque el periódico le puede
decir: “Oye, si sabes esto y lo sabes contar, cuéntalo en el periódico, no lo cuentes
por fuera”. Entonces los blogs están alcanzando una importancia enorme en la
difusión de información por Internet. De tal manera, además, que se entrecruzan
entre ellos. Si yo hago un blog y voy buscando y encuentro blogs de distintas
personas por el mundo, que trabajan temas parecidos al mío y que les interesa lo
que hacen, yo incorporo los titulares de los blogs de los otros al mío y viceversa.
De tal manera que estamos todos cruzados y hemos estado haciendo unas redes
invisibles de comunicación entre personas. Van mucho más lejos que las listas de
correo. En el fondo, pertenece un poco a la filosofía de la lista de correo, es decir,
recibir en tu correo electrónico mensajes comunes sobre un tema que envían los
suscritos ahí, porque ya no es el frío del correo electrónico. Puede ser mucho más
rico, puedes incorporar texto, puedes incorporar imagen, puedes incorporar lo que
quieras. Entonces es una forma de difundir, que es, al fin y al cabo, de lo que
estamos tratando aquí. Una forma de difundir información, de conseguir que sea
accesible a más gente. Y es un tipo de herramientas que hay que utilizar y que,
además, ahora son fáciles de utilizar. Hace dos años se podían utilizar, pero eran
pesadísimas, complicadísimas. Bueno, alguien habrá empezado aquí con Internet
cuando había que poner el código HTML a mano. Alguien habrá utilizado HTML
poniendo, abriendo, luego cerrando la barrita, la otra barrita, y escríbete el código
a pedales.

Bueno, sintetizo la cuestión de los metadatos: son datos sobre datos, información
sobre la información, valga la redundancia. En el fondo, es lo que en las
bibliotecas siempre se ha llamado la ficha de catalogación, pero va implícita en el
documento. Son estructuras y lenguajes para la descripción de recursos de
información y sus elementos componentes o características. Entonces nos dan
información sobre la organización de los datos, sobre los distintos dominios o
niveles de datos y sobre la relación existente entre todos los dominios y niveles de
datos. Es decir, no dejan al documento suelto por ahí con un dato diciendo: yo me
llamo así. Van mucho más lejos. Sirve para identificar, localizar, gestionar y
acceder a los recursos electrónicos. Hay muchos tipos: metadatos administrativos,
metadatos descriptivos, metadatos para la conservación, metadatos técnicos y
metadatos de uso. Los metadatos administrativos son los que indican por dónde
debe moverse el documento, qué permisos tiene, por dónde debe ir, etc. Los
descriptivos indican cuestiones respecto a quién lo ha producido, para qué, cómo
se llama, de qué trata, etc. Los metadatos para la conservación pueden indicar el
destino al que deben ir o la forma en la que deben conservarse o que deben
tratarse. Los técnicos nos indican características físicas del documento. Y los de
uso, pues pueden tener hasta contratos de cómo debe utilizarse el documento.

Gestión y utilización de los recursos; representación e identificación; gestionar la


preservación, renovación, actualización y migración; características técnicas tanto
de hardware como de software. Algunos de ellos llevan un metadato con el que,
una vez lo abres, el propio documento indica ‘le falta a usted este códec’, ‘busque
este códec’, o ‘traiga esto’. La primera vez que te descargas un documento en
.pdf, el propio documento exige la presencia de un determinado programa. Eso lo
lleva implícito el documento.

De los metadatos de identificación, el modelo clave, el modelo más utilizado, el


modelo normalizado, el que más se está utilizando en Internet es Dublincore. Es el
que se está sugiriendo para tratar todo tipo de recursos que aparezcan en Internet.
Cualquier cosa que vayamos a poner en Internet. Ahí empieza a haber un acuerdo
común de que Dublincore puede ser uno de los modelos de metadatos más
interesantes para describir recursos. Si a alguien le interesa el tema, la página
más recomendada es la del consorcio de la Web www.w3.org es el sitio clave para
descubrir por dónde van las tendencias, las normas, etc. Es, prácticamente, el
único organismo que trata de controlar la Web. El único organismo de control de
Internet es el www.w3.org. Ése es el consorcio. Y ahí encontrarán las normas,
tendencias y demás para manejar todo tipo de recursos. Y quizá alguno haya oído
hablar de MPG7 como la norma en la que se estaba trabajando para gestionar
materiales de video y para catalogar materiales de video. Al entrar ahí se ve que
se ha abandonado MPG7 y que ahora mismo MPG7 lleva sin desarrollarse dos
años, y eso en la Web implica que se ha muerto. Y están saliendo otros
programas como uno que se llama Smile SMIL, que permite crear plataformas de
catalogación de recursos audiovisuales para Internet. Se le suele llamar Smile por
r leerlo más divertido, pero es SMIL. Y es un lenguaje de marcas en XML para
catalogar documentos audiovisuales. Dublincore, como ven, aparentemente no es
más que una indicación de una serie de cosas fundamentales que debe tener
cualquier documento. El título, el creador, el tema o los temas, la descripción, el
editor, personas que contribuyen, contribución intelectual al recurso, la fecha, el
tipo de recurso, el formato y el hardware que requiere, la secuencia de caracteres
que lo identifica, puede ser una WRL, una WRN o un ISBN, o cualquier secuencia
que lo identifique, la referencia a un recurso del que deriva el presente, por
ejemplo, si es una filmación de una obra de teatro, si en un libro que se basa en
otro, si es una traducción de otro esa sería la fuente, la lengua del contenido
intelectual del recurso, la relación (importantísimo para el audiovisual, por lo que
he comentado antes; y es que aquí en el campo de relación iría la relación que se
establece entre un recurso y otro, es decir, indicaría esto va después de esto, y va
después de éste otro y pertenece a esto. Esta secuencia pertenece a este otro
documento que tiene clave, es posterior a éste y es anterior a éste. Eso va ahí en
el código9, la cobertura espacial y temporal y los derechos, que pueden llevar
hasta una URL, que conectan automáticamente para descargarte el pequeño
interfaz donde tienes que poner el número de tarjeta de crédito. Puede llegar hasta
eso). Y esos son los metadatos.

Para un archivo audiovisual, para un archivo de cualquier tipo, para una biblioteca,
puedo decir “bueno, pero esto se queda corto”. ¿Pero cuánto implican los
archivos, en cuanto al manejo del material en Internet? ¿Uno por mil? ¿Uno por
diez mil? ¿Uno por cien mil quizá? Quiero decir que bastante sería con que todos
los recursos que hay en la red de todo tipo estuvieran tratados así, para que
mejoraran de una forma brutal las posibilidades de recuperación de materiales,
que es lo que se pretende siempre. Entonces esto es una lista de datos mínimos.
Es mucho más, porque esto luego nos va a permitir aplicar sobre esto, generar
después tablas de compatibilidad entre formatos de base de datos, que nos
permitan trabajar todo en Dublincore, absolutamente todo. Porque incluso
podemos generar nuestro documento XML.

Una de las ventajas de los documentos de marcas es que si les precedes o llevan
juntos un documento que indica qué significa cada cosa, a partir de entonces el
sistema sabe trabajar; con lo cual, si tú le dices “esto es esto, esto es esto, esto es
esto, y eso va aparte y va con el documento”, el documento es manejable, porque
se sabe lo que significa cada cosa. Todo esto puede parecer muy complejo, pero
cada vez es más simple; y tiene más que ver con el sentido común y con la forma
de pensar, con la forma de organizar, incluso, nuestras propias cabezas en cuanto
a cómo relacionamos unas cosas con otras. Ya que la inteligencia artificial es
imposible, lo que hacemos es convencer a la máquina para que parezca que
piense. La máquina no piensa, pero lo que hacemos es que parezca que piense.
La máquina no va a hacer más de lo que le digamos que haga.

Voy a terminar con cuatro propuestas o cinco, si me permiten, que son discutibles.
Algunas de éstas no son mías. Algunas de éstas son más discutibles y algunas
son puro futurismo. Es decir, a medio plazo se supondrá la desaparición de la
mayor parte de los soportes actuales, eso es evidente; porque nuestra experiencia
nos dice que todos los soportes están desapareciendo. Alguna vez dices así como
tontería: “Dentro de cien años se recordará aquella época entre el siglo XIX y el
siglo XX, en que se trabajó con aquel soporte, que ya está en unos pequeños
archivos”. Y es cierto, más importante que la primera conclusión es la segunda, y
es que las capacidades de almacenamiento, transmisión y tratamiento están
aumentando de una forma considerable, de una forma brutal. Lo que más está
fallando es el teléfono. Antes el problema no era el teléfono, antes el problema era
la capacidad de almacenamiento. Ahora el problema no es la capacidad de
almacenamiento, ahora el problema es la capacidad de transmisión. El problema
es la capacidad de transmisión: que no tenemos ancho de banda suficiente para
poder enviar tal carga de datos a esa velocidad. Sí: el cine digital; sí, sí, fantástico
el cine digital. Pero traslada a 150 pantallas la cantidad de gigas que supone
enviar una película para que esté disponible para que se consulte. De momento no
hay ancho de banda para eso. El problema está en las telecomunicaciones y en el
coste de las telecomunicaciones, que ahí sí nos cobran bien. Entonces, capacidad
de almacenamiento: sí, va a aumentar, va a mejorar mucho, pero mientras no
mejore el ancho de banda y las posibilidades de transmisión de información…
Están viéndolo cuando descargan una película de Internet. ¿Cuánto tardan?
Incluso con una conexión buena. Y sí, el problema del ancho de banda se está
dando en los hogares normales, pero es que se da también en las empresas de
televisión. Para enviar del servidor, se está dando. No hay sitio, y, además,
mejorar para que haya sitio supone una inversión brutal de dinero.

¿Es importante la integración del archivo en el proceso de producción? Sí, es muy


importante, especialmente en televisión; es fundamental, lo he dicho al principio.
Pero una integración física real, es decir, que el centro de documentación esté
aquí, que la relación esté aquí y en el mismo espacio físico sin separación de
mamparas, sin nada, sin carteles de “no echen de comer a los documentalistas”,
sin nada. Simplemente que trabajen juntos. Y desde luego va a haber, como se ha
demostrado hoy, muchos problemas de coexistencia de sistemas. ¿Cuántos
lectores de música tienes en el ordenador?

La gestión de los datos asociados, la gestión de los metadatos está cambiando


también las herramientas y los procesos. Una de las cosas que estamos
encontrando con el uso de metadatos, es que hay que pensar de otra manera el
análisis, la representación documental. Lo que nosotros llamamos ‘minutado’ y
aquí me parece -por deducción- que llaman ‘pietaje’. Bueno, pues el minutado, en
realidad, es lo que vas a destripar y lo que vas a destratar con metadatos
separados. Cuando tú minutas, segmentas y cada segmento lo tratas por
separado. Entonces, si para minutar puedes utilizar determinadas herramientas
automáticas que te ayuden a minutar, si tienes un control del audio y el audio te lo
capta y te lo pasa a texto y lo indiza automáticamente. Si tiene un FR que te
reconoce todo tipo de caracteres que aparezcan, y te los traen también, y tienes
un sistema de reconocimiento automático de imagen que te detecta cada
secuencia o cada plano y que de cada plano te extrae el frame o los dos frames
más representativos, automáticamente y en segundos, el documentalista lo que
hace -y eso es factible ahora mismo, es técnicamente factible; puede ser caro,
evidentemente- el documentalista lo que hace es encontrarse, cuando se pone a
trabajar, ya no tiene que sentarse, meter la cinta de video y empezar a mirar. De
entrada se encuentra con una selección de frames, con su código de tiempo, con
un texto de lo que se ha dicho en el audio, y tiene que eliminar, completar,
eliminar, completar y añadir. Es una forma de trabajar diferente, evidentemente. El
peligro de esa forma de trabajar es que te digan: como hemos invertido tanto, y
esto lo hace tan bien, no necesitamos documentalistas. Vamos a dejar que
funcione la máquina y que lo haga sólo la máquina. Ése es el peligro. Nosotros
vamos a proponer ahora a una empresa de televisión un sistema de indización
automática. Los documentalistas no tienen que pensar “¿pongo esta palabra o
pongo esta otra? ¿lo describo de esta manera o lo describo de esta otra?”. Que lo
describan, que añadan todo el texto que quieran y que construyan minutados, y
luego que la máquina indice automáticamente. La máquina indiza
automáticamente a partir de propuestas de lenguaje que ya le hemos dado.

A medio o largo plazo vamos hacia el trabajo en red en muchos aspectos de la


documentación visual y audiovisual, es decir, consulta en tiempo real con carga a
través de línea y pago gratis, pero en línea. Parece que es eso -las transacciones-
se va a desarrollar en un entorno Web. Por ejemplo, en la mayor parte de
agencias fotográficas europeas, se accede ahora mismo a través de un entorno
Web. Ves las fotografías que quieres comprar, las ves a baja definición, no te las
puedes traer para nada porque no te van servir, llevas sus marcas y cuando
quieres comprar la fotografía ya te traes la fotografía, pagas y te la envían.
Entonces la forma de estar presente es más sencilla. ¡Ah! Internet es bueno, hay
que considerar que es muy bueno. Y luego van saliendo cada vez más servicios
que utilizan agentes inteligentes, tecnologías nuevas, algunas de las que me he
referido ahora. Un agente inteligente... perdónenme la presunción de la expresión,
por que no son agentes inteligentes, son programas que hacen determinada cosa,
eso es un agente inteligente. Ahora uno de nuestros investigadores está haciendo
un agente inteligente de clasificación. Le propones una clasificación
preestablecida y él analiza automáticamente los documentos y los lleva a una
parte concreta de la clasificación, aquella que le corresponde al documento.
Clasifica automáticamente documentos. Se puede aplicar, por ejemplo, al correo
electrónico. Yo puedo crear una clasificación y aplico el agente inteligente para
que me organice un poco mi correo electrónico, por procedencias, por temáticas:
me vendría muy bien, porque recibo cerca de sesenta mensajes diarios, una
media de cincuenta, sesenta mensajes diarios. Sobre todo por temáticas, es lo
que más me interesa, y por basura. La basura aparte. Pero no simplemente con
estas herramientas de detección de palabras que utiliza el Outlook, que se queda
muy pobre, porque además le engañas por todos los lados. Una herramienta de
clasificación va un poco más lejos, y estamos trabajando en eso. El miedo que nos
da es el miedo ético que mencionaba alguien por aquí. Cada vez que generas un
agente inteligente estás eliminando el trabajo de personas, por supuesto. O estas
permitiendo crear una sociedad en que las personas puedan dedicar el tiempo no
a clasificar mensajes metiéndolos en cajitas sino a hacer cosas más creativas, que
esa es otra visión. Es decir, hay un trabajo de archivo que es muy pesado, si
podemos ayudar a hacerlo, podemos hacer otras cosas. Nunca ha faltado trabajo
en los archivos, por mucho que hayan salido herramientas, nunca ha faltado
trabajo en un archivo. Y si automatizamos cosas, se nos ocurrirán doscientas más
para hacer.

(Intervención del público)


Si tienes una página Web que has hecho en HTML, ¿lo que recomiendas es que
ahora no sea en eso sino que sea XML? ¿La información que tienes en lo uno
pasa tranquilamente a lo otro? Primera cosa. Entonces, ¿se va uno al Mambo
Hispano y con él, que además es gratis, lo logras?

Lo instalas y te creas tu aplicación a medida.


¿Y eso me permite también muy fácilmente hacerlo en varios idiomas y lo que yo
quiera?

Por supuesto, claro. Te va a permitir hacer lo que quieras. Pero no te lo va a


traducir automáticamente. Afortunadamente, porque como te lo traduzca
automáticamente…

Uno tiene que pagar el servicio de ’hosting’.

Sí, si no tienes un servidor.

O sea, si tengo un servidor…

Si tú tienes tu servidor propio, no hay el más mínimo problema.

¿Y de qué calibre es el servidor para una cosa razonable?

Ahí ya no puedo nada.

Ahí ya el ingeniero de sistemas...

Вам также может понравиться