Академический Документы
Профессиональный Документы
Культура Документы
Il sito ITABC
Leonardo Meo-Evoli
Istituto per le Tecnologie Applicate ai Beni Culturali
Consiglio Nazionale delle Ricerche
maggio 2008
Sommario
Il documento introduce le problematiche inerenti i moderni siti web, propone un modello per
rappresentare le conoscenze possedute dall’ITABC e le modalità per riportare e reperire in rete
tali conoscenze: la marcatura con annotazioni di contenuti. Prospetta le modalità con cui
procedere per tener aggiornate le conoscenze dell’Istituto in rete e delinea la nuova struttura del
sito. Propone un approccio per pubblicare in rete risorse informative secondo il protocollo
Open “Archive Initiative: Protocol for Metadata Harvesting” ed il lancio di una rivista edita
dall’ITABC. Schematizza le attività e i relativi impegni per realizzare il nuovo sito.
Indice
Scopo del documento............................................................................................................... .........1
Sommario.............................................................................................................. ...........................1
Definizioni........................................................................................................................... .............2
Introduzione.............................................................................................................................. ........2
Politiche dei siti......................................................................................................... .......................2
La rappresentazione delle conoscenze dell’ITABC.................................................................... .......3
Le annotazioni: un approccio per marcare i contenuti.................................................................... ...5
Processo di annotazione.......................................................................................................... ..........6
I meccanismi di alimentazione delle pagine................................................................................. .....7
Organizzazione................................................................................................. ........................7
Argomenti pubblicati.......................................................................................... ......................7
Alimentazione degli argomenti............................................................................... ..................7
Le sezioni principali del sito............................................................................................ .................8
I nuovi approcci in rete.................................................................................................. ...................9
Journal on Advanced Technologies for Cultural Heritage.................................................. .............10
Pianificazione delle attività progettuali............................................................................ ...............11
Conclusioni.......................................................................................................................... ...........13
Riferimenti............................................................................................................................... .......13
Definizioni
Metadati
Descrizione dei dati posseduti o trattati in un sistema sia esso informativo che documentale.
Sostanzialmente i metadati sono dati che descrivono altri dati o contenuti informativi.
Ontologia
In letteratura esistono molte definizioni di ontologia che si applicano in vari campi (dalla
filosofia alla teologia, dalla sociologia all’informatica). Nel documento è adottata la
seguente accezione: teoria che rappresenta il frammento di realtà sotto osservazione in
termini di oggetti (o classi) e di relazioni fra oggetti. In letteratura si richiede che una teoria
di classificazione del frammento di realtà può essere considerata ontologia se
universalmente riconosciuta (è ovvio che bisogna chiarire il contesto di questo “universo”).
Protocol for Metadata Harvesting
E’ un protocollo sviluppato da Open Archives Initiative [PMH02]. E’ utilizzato per
collezionare le descrizioni di risorse di rete rappresentate in termini di metadati in modo da
poter fornire un servizio di recupero delle risorse attraverso i metadati. Il protocollo è
usualmente anche chiamato OAI Protocol.
Introduzione
Internet ha avuto successo perché si è basata sul principio che la pubblicazione di informazioni
genera un beneficio sia a chi legge, sia a chi pubblica. Il fatto di permettere a chiunque di
rendere disponibili a livello globale informazioni consente di essere conosciuto, di far sapere al
mondo chi si è e cosa si sa fare o si conosce.
Tutto questo permette di aumentare i propri contatti e, in ultima analisi, di creare collegamenti
che sfociano in rapporti, commesse, collaborazioni, ordini, ...
La realizzazione di un sito ha ragion di essere se il suo “costo” produce un “beneficio”. Il
rapporto costi/benefici che si può ottenere per un sito dipende da molti fattori, fra questi quelli
che sicuramente primari sono:
• il sito deve avere un messaggio “chiaro” in termini di contenuti,
• il sito deve adottare un linguaggio adattato all’internauta tipo,
• il sito deve essere reperibile e rintracciabile dai principali motori di ricerca per poter essere
visitato da chi non è a conoscenza del sito,
• una volta che una pagina è stata trovata con il motore di ricerca deve avere un contenuto
pertinente con la richiesta espressa dall’internauta.
La redazione distribuita e diffusa è quella tipica dei blog dove un soggetto permette ad estranei
a partecipare alla redazione del proprio sito.
Ovviamente esiste tutta una gamma di possibilità intermedie.
Quale politica adottare per il sito del ITABC?
Al momento conviene solo osservare l’Istituto prima di dare una risposta. Le caratteristiche
dell’ITABC sembrano le seguenti:
• è un organismo di dimensioni medio-piccole (in una scala che va dalla persona singola
all’organizzazione di decine di migliaia di persone);
• è una realtà altamente dinamica (essendo l’oggetto delle sue attività la ricerca);
• vi è una elevata libertà del singolo (raffrontata alla libertà di cui può godere il generico
singolo in strutture quali ministeri o grandi imprese industriali);
• ha molte tipologie di interlocutori (che vanno dallo studente all’industriale, dall’ente
amministrativo locale al detentore di un bene culturale).
Da questi pochi elementi si può immaginare come sia delicato realizzare un sito in grado di
comunicare ad ogni possibile tipo di interlocutore:
• cosa l’ITABC conosce e sa fare,
• come è possibile interagire,
• quali informazioni è possibile prendere dall’Istituto.
Una analisi di massima condotta sulle particolarità dell’Istituto permette di rappresentare gli
“oggetti” che “tratta” con il seguente modello Entità-Associazioni [CHE76]. 1
Soggetto
Tipo
Processo
Tipo
Preservazione Fruizione
Valorizzazione Conoscenza
Metodologie
obiettivi
Spazio
Natura
Tangibile Intangibile
Fig. 1: La rappresentazione delle conoscenze di un istituto che si occupa di tecnologie applicate ai beni culturali
Nello schema sono evidenziati gli oggetti del frammento della realtà sotto osservazione che
devono essere descritti, classificati, e “riempiti” di contenuti per riuscire a rappresentare le
conoscenze dell’Istituto.
Dunque se si vuole mostrare nel sito internet dell’ITABC cosa l’Istituto “sa” e “fa” occorre
pubblicare delle pagine che esplicitino i contenuti degli oggetti evidenziati nello schema.
Questo permetterà all’internauta che arriva su una pagina del sito ITABC di capire, per
esempio, quali Metodologie (o tecnologie) l’Istituto è in grado di utilizzare per intervenire su un
particolare tipo di Bene culturale, oppure quali Soggetti sono stati coinvolti per raggiungere un
particolare Obiettivo in un Processo di Preservazione.
Dunque in una prima istanza si propone di considerare le seguenti classi di oggetti per
rappresentare le conoscenze dell’ITABC:
• Beni culturali,
• Tecniche di realizzazione del bene,
• Processi che intervengono sul bene,
• Metodologie (o Tecnologie) utilizzate per intervenire sul bene,
• Soggetti (Partner o Stakeholder) coinvolti in un intervento sul bene.
In sostanza un sito efficace deve essere in grado di spiegare all’internauta quali sono gli oggetti
che appartengono alle precedenti classi, ossia quali sono i beni culturali su cui può intervenire,
le particolarità dei beni (tecniche o materiali) conosciute, i tipi di interventi (studio o
conoscenza, preservazione, fruizione, ...), le metodologie adottate (GIS, laser scanner,
algoritmi, ...) i soggetti coinvolti.
Processo di annotazione
Il processo di annotazione delle pagine web dell’Istituto deve condurre a generare l’ontologia
nel dominio delle tecnologie applicate ai beni culturali. Quindi oltre alla definizione delle
classi di contenuti del paragrafo “La rappresentazione delle conoscenze dell’ITABC” è
necessario “popolare” le classi con i relativi oggetti.
Inoltre il processo di annotazione permette la generazione del meta-indice di conoscenze
dell’Istituto con i riferimenti (link) alla relative pagine.
Si propone di adottare il seguente approccio per gestire il processo di annotazione:
• In una prima fase del ciclo di vita del sito la annotazione avviene manualmente attraverso
l’utilizzo di semplici programmi che marcano i testi, aggiornano il meta-indice e allineano i
riferimenti degli oggetti del meta-indice alle pagine che li referenziano.
• In una seconda fase si può pensare ad una marcatura semi-automatica; questo sarà possibile
quando l’ontologia ITABC sarà “abbastanza” consolidata. Anche in questa seconda fase
2 Molto spesso è frustante arrivare su un sito e, utilizzando il bottone di ricerca “cerca”, non trovare nulla.
sarà sempre necessario l’intervento dell’esperto umano per la natura del frammento di realtà
oggetto del dominio di un istituto di ricerca (che per sua natura “deve” evolvere e non può
rimanere statico e congelato).
• In una terza fase sarà possibile analizzare come definire e rappresentare le relazioni fra
classi dell’ontologia e oggetti. Questo sarebbe il vero valore aggiunto della architettura
proposta perché permetterà di rappresentare e pubblicare in rete conoscenze dinamiche
(ossia estrapolate direttamente dai contenuti delle pagine web) quali: “le Metodologie
per raggiungere certi Obietti” o “le Tecnologie idonee a certi Processi”. Le tematiche da
affrontare in questa fase sono esclusivamente di ricerca (e non tecnologiche come quelle dei
due precedenti punti). L’autore del documento vuole semplicemente prospettare al CdI tali
problematiche per dare una idea sui possibili sviluppi futuri.
Organizzazione
Le strutture organizzative principali coinvolte nel processo di alimentazione delle pagine
dell’Istituto sono le seguenti:
• il WebEditor: responsabile della popolazione dell’ontologia e della pubblicazione delle
pagine web
• il Ricercatore: responsabile di produrre conoscenza
Argomenti pubblicati
Saranno pubblicate pagine sulle attività di ricerca e servizio condotte dall’Istituto. Tale
pubblicazione seguirà lo schema degli impegni ufficiali assunti dall’Istituto: commesse,
progetti, moduli.
Gli argomenti saranno pubblicati secondo la tipologia di coda “Last-In-First-Out”, ossia
appariranno ai primi posti le attività più recenti.
adottato uno standard per comunicare il materiale e saranno utilizzate alcune macro Word per
facilitare il processo di marcatura delle annotazioni.
Il WebEditor se non riceve dal ricercatore la descrizione della attività con le relative
annotazione preleva dal sito Cnr la scheda attività e la annota.
Il WebEditor pubblica gli argomenti sul sito dell’Istituto.
Se il Ricercatore vuole effettuare correzioni a quanto già pubblicato dovrà fornire il materiale
secondo gli standard prescritti.
Open Archive Initiative permette appunto agli autori di mettere in rete e catalogare “risorse”,
“contenuti” e/o “conoscenza”, di permettere un reperimento in rete sulla base di metadati che
descrivono i contenuti delle risorse ed infine di consultare le risorse e acquisire conoscenza.
Il tutto è oggi realizzabile con un sistema che permette di amministrare con facilità una
collezione di risorse digitali e condividerle nel circuito degli Open Archives, permettendone
l’harvesting da parte dei Service Providers e quindi l’interrogazione da parte dei Multiopac
OAI. Il tutto rende inoltre un supporto ai motori di ricerca (quali Google), e può implementare
servizi di ricerca locali sul web. Lo standard di metadati utilizzati è il Dublin Core.
Per quanto riguarda la diffusione e le prospettive della filosofia OA nel mondo e in Italia si
segnalano due recenti casi significativi, entrambi del 2008, che testimoniano come tale
paradigma si affermi con forza crescente:
1. l’Università di Harvard ha stabilito che i suoi docenti e ricercatori debbano obbligatoria-
mente depositare i risultati delle loro ricerche nell'archivio aperto istituzionale:
http://www.fas.harvard.edu/home/news_and_events/releases/scholarly_02122008.html
2. Il Presidente dell’Istituto Superiore di Sanità ha firmato la policy istituzionale a favore
dell’Open Access, con obbligo di deposito del post-print delle pubblicazioni del perso-
nale dell’ISS nell’archivio digitale DSpace http://dspace.iss.it/dspace/.
Un impegno dell’Istituto in tale direzione è da considerarsi strategico e altamente qualificante, e
convergerebbe agli indirizzi del progetto europeo MICHAEL, specificatamente per gli intenti
relativi all’“Interoperabilità delle risorse culturali online europee” (http://www.michael-
culture.org/it/node/385) in cui si evidenzia come i metadati supportati da MICAHEL siano
quelli del Dublin Core: “Questi sono i metadati principali per descrizioni a livello di elementi.
Originalmente realizzati per descrivere libri e altro materiale bibliografico, sono stati estesi e
interpretati per coprire praticamente tutti gli aspetti.... Attraverso l’Open Archives Initiative
Protocol for Metadata Harvesting (OAI-PMH), si rendono disponibili i metadati nei formati
standard Dublin Core e MICHAEL. In questo modo, record provenienti da fonti distribuite si
possono riunire e pubblicare insieme attraverso la stessa istanza MICHAEL. Il servizio
europeo MICHAEL utilizzerà questi strumenti di harvesting per raccogliere i contenuti
sviluppati dalle diverse istanze nazionali.” Dunque il sistema proposto sarebbe perfettamente
capace di integrarsi con MICHAEL.
Conclusioni
Lo proposta permette di raggiungere i seguenti obiettivi principali:
• beneficio per i ricercatori del sito in termini di visibilità delle conoscenze, metodologie e
tecnologie possedute in termini di chiarezza del messaggio lasciato in rete;
• utilità di reperimento di informazioni “pregiate” per le varie tipologie di utenza del sito in
termini reperimento “content drivren” delle informazioni ricercate;
• aumento del prestigio scientifico internazione dell’Istituto per la pubblicazione di una
rivista secondo il protocollo OAI-PMH.
Riferimenti
[CHE76]
Peter Pin-Shan Chen. The entity-relationship model: Toward a unified view of data. ACM
Transactions on Database Systems, 1(1):9--36, 1976
[PMH02]
The Open Archives Initiative Protocol for Metadata Harvesting; Protocol Version 2.0 of
2002-06-14; Document Version 2004/10/12T15:31:00Z
http://www.openarchives.org/OAI/2.0/openarchivesprotocol.htm
[BD03]
Berlin Declaration on Open Access to Knowledge in the Sciences and Humanities;
Conference on Open Access to Knowledge in the Sciences and Humanities;
20 - 22 Oct 2003, Berlin; http://oa.mpg.de/openaccess-berlin/berlindeclaration.html