Вы находитесь на странице: 1из 19

UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS FACULTAD DE LETRAS Y CIENCIAS HUMANAS EAP DE BIBLIOTECOLOGA Y CIENCIAS DE LA INFORMACIN

Topic Maps

Curso: Anlisis y Recuperacin de la Informacin Profesor: Carlos Acua

Alumnos: Claudia Castillo Vargas Csar Espinoza Solano Melissa Martnez Lozano Enrique Sinsaya Snchez

2012

-1-

1. Introduccin

En el presente trabajo, a la luz de una revisin de literatura, describiremos el fenmeno de los topic maps y su relacin con los lenguajes documentales y vocabularios controlados, segn otros autores han propuesto. Debido original. que no disponemos de una traduccin aceptada ampliamente, se conservar el trmino topic maps, en su idioma

-2-

2. Desarrollo del paradigma Topic Maps En el entorno de los avances tecnolgicos, el establecimiento de estndares es necesario para garantizar la funcionalidad y calidad de los mtodos y productos en desarrollo. En lo que respecta al manejo y registro de la informacin, un suceso fundamental fue el desarrollo del estndar SGML, (ISO 8879:1986), Standard Generalized Markup
Languaje. Para ilustrar la importancia y actualidad de dicha norma, mencionaremos que el lenguaje HTML (y sus tags), que ha sido la infraestructura lgica de la web en sus inicios, corresponde a la divisin para Web de SGML, cuyo desarrollo se origin en los esfuerzos de IBM por obtener un lenguaje genrico de marcado de datos. Por extensin, el lenguaje XML tambin es un resultado de la influencia del lenguaje SGML

El antecedente ms directo de los Topic Maps data de 1991; con la creacin del Davenport Group, por parte de UNIX system vendors (y otros,
como OReilly & Associates). Los vendedores de las editoriales tenan presin de sus clientes para mejorar la consistencia en la indizacin de sus publicaciones impresas. Cada publicacin estaba provista de un ndice, pero sola ocurrir que en ttulos diferentes sobre un mismo tema, dicho tema era tratado con diferente terminologa. Para aadir dificultad, el mundo de las publicaciones tcnicas ya era muy cambiante y los ttulos publicados se multiplicaban constantemente, generando la urgencia por obtener ndices confiables. El Davenport Group desarroll (no sin sentido del humor) el estndar SOFABED, Standard Open Formal Architecture for Browsable Electronic Documents.

En 1993, el modelo SOFABED evoluciona a una versin temprana de


los topic maps, por el CApH Group (Conventions for the Application of HyTime). Dos aos despus, el modelo era suficientemente robusto para ser aceptado por ISO como un trabajo en curso, candidato para constituirse en un nuevo estndar. Con el ddigo ISO/IEC 13250, el modelo consista en dos construcciones (1) topics y (2) relationships (asociaciones). En el desarrollo se aadi un criterio de filtro: facet. Que evolucion a scope, un rasgo clave de los topic maps, al permitirles incorporar diversos puntos de vista, idiomas, etc. sin perder la utilidad para los usuarios especficos, o a un contexto expecfico. Finalmente, en el 2000, se publica el estndar ISO

-3-

13250, dentro de un subconjunto SGML ( Document description and processing languages). Sin embargo, al generalizarse XML como el lenguaje para sistemas de informacin impulsados por bases de datos, se aade una especificacin xml para topic maps: XTM -Topic Maps XML Syntax

En el 2006, ISO publica Topic Maps Data Model y la versin XTM2. Se


encuentra en proceso de estandarizacin el query language o lenguaje de consulta, y el modeling language (lenguaje de modelamiento de datos).

3. Conceptos previos Para comprender los topic maps, es necesario mencionar algunos conceptos influyentes en su desarrollo y contexto:
Web semntica (Web 3.0) Segn Berners-Lee (1999), la Web semntica es la evolucin de la Web actual, donde los datos estarn mejor definidos y relacionados. Es decir, en la Web 1.0 podamos desarrollar contenidos utilizando lenguajes como HTML, y al principio, el desarrollo estaba limitada a expertos (haba que escribir el cdigo, sin ayuda de interfaces grficas). En la Web 2.0 dichos contenidos se dinamizan (el software evoluciona y facilita la inclusin de elementos multimedia) y la interaccin del usuario con el contenido se dinamiza, al punto que los usuarios de la Web se convierten en los creadores de su propio contenido. Aunque los lenguajes de escritura de cdigo se hacan ms accesibles y fciles de entender para las personas, las mquinas permanen ignorantes de lo que dichos contenidos significan. La Web 3.0 pretende incorporar ese elemento semntico; las mquinas seran capaces de comprender los datos, buscarlos, consultar con otras mquinas y procesar soluciones de forma automtica, en funcin a un requerimiento previamente formulado. El desarrollo de esa prometedora Web est supeditado al desarrollo de una infraestructura que se compone de: (1) lenguajes de marcado (XML) para hacer los contenidos explcitos: <title>, <keyword>, cualidades <description>; de semntica, (2) Metadatos, donde y se (3) adquiere una las sintaxis, normalizacin, nueva

generacin de software para integrar las anteriores. El objetivo no es mejorar la forma en las personas usan la red o facilitar el acceso a la
-4-

informacin; sino mejorar el dilogo y recuperacin de datos entre computadoras (como dijimos, un terminal puede interrogar y obtener datos de otros terminales conectados. De ese dilogo se podr acotar y comparar automticamente predeterminado). la informacin, para satisfacer un objetivo

RDF RDF (resource description framework o marco de descripcin de

recursos). Es un lenguaje en XML que establece cmo codificar metadatos asociados a un recurso.

4. Topic maps
Los topic maps no son el primer intento de representar conceptos de forma grfica. De hecho, los mapas conceptuales usados en el proceso de aprendizaje de los estudiantes, o en el proceso de generacin de ideas (brainstorming), o en el diseo de estructuras complejas, como las bases de datos (donde especificamos qu tablas, qu categoras y qu relaciones habr entre sus elementos); fueron una manifestacin previa de la necesidad de organizar conceptos, de representar ideas y relaciones entre ellas. En el terreno de la inteligencia artificial, esta necesidad es resuelta con el desarrollo de redes semnticas. La estructura comn en varias tcnicas de representacin de conceptos, remite a la estructura de una red; constan de nodos (conceptos), relacionados entre s mediante enlaces. Son una herramienta propicia a la hora de organizar nueva informacin e integrarla en el conocimiento existente (Moreiro, 2006). Como resulta del desarrollo histrico presentado en el punto n 2 del presente trabajo, Topic maps es un estndar ISO para el manejo e intercambio de informacin, basado en un modelo de descripcin y asociacin de datos tambin normalizado (Topic Maps Data Model). Dicho modelo est inscrito en la Web semntica, a la cual aporta como un lenguaje de representacin de conceptos, del modo en que tambin lo es RDF.

-5-

Funciona a nivel de estructura, como una tecnologa que permite el desenvolvimiento de una web 3.0. Desde el punto de vista de los desarrolladores, la implementacin es posible a nivel de cdigo, existen aplicaciones para desarrollar sitios basados en topic maps, y dichas aplicaciones y software estn adaptadas a diversos lenguajes de programacin y de cdigo. Desde el punto de vista del usuario, el resultado es percibido a travs de la findability de la informacin (facilidad con la que se puede encontrar informacin contenida en un sitio web). Componentes del estndar Topic Maps El estndar ISO/IEC 13250:2003 est constituido por tres elementos bsicos: Topics, Association, y Occurrence. Topics El elemento principal de los Topic Maps es el Topic, el cual constituye la representacin material de un subject, entendiendo por subject cualquier tema sobre el que pueda hablarse o ser concebido por un ser humano. As, el trmino topic indica una parte del Topic Map que representa al subject al que est representando. Por lo general, en un mapa de tpicos cada subject es representado por un nico tpico y viceversa. Un topic puede representar cualquier tema: personas, entidades individuales o colectivas, conceptos, etc. Cada topic se puede asociar con otros topics denominados clases topic types, por ejemplo un topic dedo puede tener un topic type que sea mano. Los topic types definen relaciones clase-instancia. A continuacin se expone un ejemplo de Topic Type: <topic id="tempestad"> <instanceOf> <topicRef xlink:href="#obra"> </instanceOf> </topic> En el ejemplo se hace referencia a la obra Tempestad de William Shakespeare y se observa como el topic con id=tempestad est relacionado con el topic obra.

-6-

Como los Topics representan un subject, es posible asignar a cada topic unas caractersticas propias. Cada topic dispone de las siguientes caractersticas: Nombre de topic (topic name). Apariciones (topic occurrence). Rol como miembro de una asociacin (role associations). Esta asignacin de caractersticas se considera vlida para un determinado contexto. Dos topics con las mismas caractersticas se consideran idnticos, produciendo duplicidad de datos. A travs del topic name se permite al usuario dar un nombre legible y entendible para el ser humano. Ya que un mismo concepto puede ser designado con gran variedad de nombres, el estndar permite disponer de varios nombres mediante la asignacin de mltiples base names. Adicionalmente, el base name puede incluir sinnimos (variant name). Siguiendo con el ejemplo expuesto anteriormente de las obras de William Shakespeare aadimos un topic name: <topic id="tempestad"> <instanceOf> <topicRef xlink:href="#obra"> </instanceOf> <baseName> <baseNameString>La Tempestad</baseNameString> </baseName> </topic> Occurrence Son elementos externos de informacin, enlazados al topic mediante una referencia que sirve para su localizacin y que aportan informacin al topic. Las referencias a recursos se realizan, en XTM, a travs de URIs (Uniform Resource Identifiers). Dichos recursos no son obligatorios en la creacin de un topic, por lo que un topic puede tener desde cero a n ocurrences. Al igual que los topics, cada occurrence puede relacionarse con una instancia de una clase de occurrence (denominada tambin occurrence type), que puede o no indicarse de forma explcita. En XTM se expresa mediante el elemento instance Of. El occurrence type es un topic.

-7-

Para ejemplificar la creacin de un occurrence dentro de un topic y continuando con el ejemplo anterior de las obras de William Shakespeare, se expone a continuacin el siguiente cuadro: <topic id="tempestad"> <instanceOf> <topicRef xlink:href="#obra"> </instanceOf> <baseName> <baseNameString>La Tempestad</baseNameString> </baseName> <occurrence> <instanceOf> <topicRef xlink:href="#formato-texto-plano"> </instanceOf> <resourceRef xlink:href="ftp://www.gutenberg.org/pub/guten berg/etext97/1ws4110.txt"> </occurrence> </topic> Association En el estndar la association es definida como una relacin entre uno o ms topics, donde cada uno de ellos juega un rol como miembro de dicha asociacin. Association en el modelo Topic Maps no indica el sentido en el que se tiene que interpretar la asociacin; para poder expresar el sentido de la asociacin es necesario introducir el concepto de association role. Del mismo modo que ocurra con los topics y las occurrences, las associations se pueden clasificar en association types. La association type es el verbo que une a los topics y tambin, al igual que las occurrences, es un topic. En la especificacin de Topic Map vienen incluidas dos clases de association. Estas associations tienen definidos los subjects correspondientes mediante published subjects: la class-instance association (asociacin clase-instancia) y la superclass-subclass association (asociacin superclase-subclase). La superclass-subclass association permite construir

-8-

jerarquas de clases, aplicadas tradicionalmente para realizar taxonomas o clasificaciones de materias. La principal diferencia entre estos dos tipos de associations es que la relacin superclase-subclase es transitiva, es decir, que las propiedades de la clase superior se van heredando por las subclases inferiores a ella; mientras que en la relacin clase-instancia no es transitiva, es decir, las propiedades de la clase no son heredadas por las instancias. A continuacin se expone un ejemplo de creacin de una Association: <association> <instanceOf><topicRef xlink:href=#esautor-de/></instanceOf> <member> <roleSpec><topicRef xlink:href=#obra/></roleSpec> < xlink:href=#tempestad/> </member> <member> <roleSpec><topicRef xlink:href=#autor/></roleSpec> < topicRef xlink:href=#williamshakespeare/> </member> </association> Otros componentes de Topic Maps El modelo Topic Maps incorpora, adems de los tres pilares descritos anteriormente, otros elementos que le dan al modelo una potencia mayor. En un principio, los elementos que permiten a la especificacin tener un mayor potencial eran scope, facet y public subject, pero cuando se instaur la especificacin de XTM el elemento facet fue eliminado. El elemento facet proporcionaba mecanismos para asignar recursos o fuentes de informacin. Los facets eran usados normalmente para suplir la clase de metadatos que puede ser provista por atributos SGML o XML. El elemento scope lo constituyen los lmites de validez de las caractersticas asignadas a un topic. El concepto se aadi al modelo Topic Map para topicRef

-9-

atender al hecho de que no hay una nica visin del mundo, debido a razones diversas, como por ejemplo los distintos idiomas o las culturas. Por ltimo, el elemento public subject proporciona la posibilidad de fusionar Topic Maps entre s. FUNCIONAMIENTO DEL MODELO TOPIC MAPS

Associatio n

Topic

Topic Map

Con URIs

lo

Con los Topic Maps creamos un ndice de informacin que reside fuera de la misma, tal y como se muestra en el diagrama. El Topic Map (la nube que tenemos en lo alto) describe la informacin existente en los documentos (los pequeos rectngulos) y las bases de datos (los cilindros) enlazndolos por medio de URIs (Universal Resource Identifiers)

5. Relacin de topic maps con lenguajes documentales

- 10 -

Segn Moreiro (2006), la necesidad inicial para el estudio de los mapas temticos, fue la creacin de ndices en torno a algn concepto o materia. En trminos de lenguajes documentales, un topic
map equivaldra a un ndice creado para una coleccin de recursos electrnicos, donde tendramos las siguientes equivalencias entre sus respectivos elementos: Elementos de Topic Maps TOPICS: materias que describen el Encabezamientos descriptores Relaciones explcitas, vnculos entre encabezamientos Referencias a los libros con dichas materias de materias / Elementos documental contenido y facilitan la recuperacin del recurso. Consta de un nombre, relacion y ocurrencia RELACIONES: establecidas entre los topics RECURSOS: que son descritos, indizados por los topics. El recurso trata sobre el topic. de un lenguaje

Podemos destacar de los topic maps, el hecho de tener una estructura flexible, rica en relaciones, en posibilidades, al admitir una cantidad casi infinita de trminos; caractersticas que no poseen otros lenguajes como los tesauros, que son construidos manual o semimanualmente (con los trminos infinitos que admiten los topic maps, sera imposible dicho control), y no permiten dinamismo. Los tesauros son conceptualmente simples, tienen una estructura sencilla y relaciones definidas y limitadas. Pero la flexibilidad de los topic maps, tambin acarrea desventajas en cuya solucin hay trabajos en curso: la ambigedad terminolgica, la necesidad de una mejor definicin de las asociaciones, para evitar la redundancia e incompatibilidad.

4. Campos de aplicacin y utilizacin de los Topic maps Con respecto a la aplicacin de los topic maps podemos decir que es un sistema de navegacin hipertextual caracterizados por la separacin entre enlaces y sistemas de navegacin y los recursos

- 11 -

(Colmero, 2010), aplicacin que lo hace multifuncionales tomando en cuenta a la navegacin a travs de la estructura y de los recursos. A da de hoy existen un escaso nmero de aplicaciones diseadas para la creacin, visualizacin e intercambio de topic maps, pero las que contamos se agrupan en tres caractersticas definidas: organizacin y clasificacin de recursos, sistemas de navegacin y bsqueda y recuperacin de informacin (Colmero, 2010; Eto, 2003). Adems de organiza documentos con grandes detalles, visualizaciones y navegaciones en poco tiempo, tambin nos ayudan a integrar recursos de distintas fuentes sobre la misma informacin, es por eso que es gran utilidad para recursos sofisticados o interdisciplinarios de los cuales el usuario poder ver y deslindar gracias al desarrollo de interfaces intuitivas. Los campos de aplicacin son tambin muy extensos, ya que se incluyen en reas como la edicin, gestin empresarial, medicina, bibliotecas digitales, bibliotecas educacin, sistemas de tradicionales, leyes, administracin, humanidades, ndices de los comercio etc. electrnico, primeras de las turismo, o Las

aplicaciones que se realizaron en el tiempo abarcaron la creacin de bsquedas contenidos conferencias ms importantes sobre lenguajes de marcado, en lnea con la inspiracin inicial del modelo (Colmero, 2010). Algunos sitios que se encargan de crear herramientas y comercializarlas son: Ontopia Mondeca Empolis Infoloom Cada una de las anteriores se utilizan como una interfaz para indizar, interrogar y navegar repositorios de informacin, adems

- 12 -

existen otras que no se comercializan y que se publican como software libre: Semantext: prototipo de aplicacin desarrollado para mostrar cmo se puede hacer uso del estndar ISO/IEC 13250:2000 para la representacin de redes semnticas. TM4J: Significa TopicMaps 4 Java, el objetivo del proyecto es el del desarrollo robusto de herramientas open sourcepara la creacin, manipulacin y publicacin de topic smaps. Nexist: proyecto software especficamente diseando con la intencin de explorar arquitecturas OHS (Open Hyper document System) Si hablamos de todas las que enumeramos anteriormente, quizs la principal diferencia se concentraran en las capacidades grficas o interfaz para visualizar la informacin extrada (Eto, 2003) A continuacin una serie de las aplicaciones de los Topics Maps en distintos campos con sus respectivas especificaciones.

- 13 -

- 14 -

- 15 -

A continuacin algunas muestras de los que es la estructura de los topics maps en algunas web sites en que podemos darnos cuenta de la complejidad que puede llegar a tener.

- 16 -

- 17 -

Conclusiones

1. Con la aplicacin de los topic maps tenemos acceso a un sistema de navegacin hipertextual caracterizados por la separacin entre enlaces y sistemas de navegacin y los recurso. 2. La aplicacin de los topic maps se caracteriza por: organizacin y clasificacin de recursos, sistemas de navegacin y bsqueda y recuperacin de informacin. 3. Los campos de aplicacin de los topic smaps son extensos, ya que se incluyen en reas como la edicin, gestin empresarial, medicina, bibliotecas digitales, bibliotecas tradicionales, administracin, comercio electrnico, educacin, leyes, turismo, humanidades, etc.

- 18 -

6.

Bibliografa:

Colmero, Mara Jess (2012) Aplicacin del modelo TopicMaps a la documentacin educativa en los Centros de Recursos de Aprendizaje y la Investigacin (CRAI). [Tesis doctoral, en lnea] Getafe, Universidad Carlos III, 2010. [Fecha de consulta: 06 de noviembre de 2012]. Disponible en: <http://hdl.handle.net/10016/10649> Colomb, R. M. (2007). Ontology and the Semantic Web. Amsterdam, , NLD: IOS Press, (date). p188. Recuperado de <http://site.ebrary.com/lib/ bibliotecacentralupch/Doc? id=10186846&ppg=200> Eto, Ricardo. (2003) Topics maps y la indizacin de recursos electrnicos en la web. En: El profesional de la informacin, vol. 12, n2. [Fecha de consulta: 02 de noviembre de 2012]. Disponible en: <http://dialnet.unirioja.es/servlet/articulo? codigo=326625> Gonzlez Moreiro, JosMorillo Llorens y otros. (2012) De los tesauros a los topics maps: nuevo estndar para la representacin y la organizacin de la informacin. En: Encontros Bibli [en lnea] 2004, (julio-diciembre). [Fecha de consulta: 02 de noviembre de 2012]. Disponible en: <http://redalyc.uaemex.mx/redalyc/src/inicio/ArtPdfRed.jsp? iCve=14701802> Moreiro, J. A. (2003). Mapas conceptuales, topic maps y tesauros, JOTRI, febrero. (consultado el 11 de noviembre de 2012) Disponible en: <http://www,fundacion.uc3m.es/ponencias/mapas.pdf> Moreiro J.A.; Snchez S.; Morato J. (2003). Panormica y tendencias en topic maps [en linea]. "Hipertext.net", nm. 1. [Consultado el 11 de noviembre de 2012] Disponible en: <http://www.hipertext.net>
Newcomb, Steven R. (2003). A perspective on the quest for global knowledge interchange. En Jack Park and Sam Hunting (Eds.), XML Topic Maps Creating and Using Topic Maps for the Web (pp. 31-50). Addison-Wesley. Recuperado de <http://www.awbc.com/samplechapter/0201749602.pdf>

- 19 -

Вам также может понравиться