Вы находитесь на странице: 1из 19

LOS LENGUAJES DOCUMENTALES

Remei Perpiny i Morera Los lenguajes documentales son vocabularios de trminos utilizados en las operaciones del anlisis documental, cuya funcin es la representacin del contenido de los documentos para organizarlos o recuperarlos de acuerdo a su temtica. "Un lenguaje documental ser entonces todo sistema de signos que permita representar el contenido de los documentos con el fin de recuperar los documentos pertinentes en respuesta a consultas que tratan sobre este contenido" (Georges Van Slype) De las dos fases que intervienen en la actividad de anlisis documental (la de extraccin de conceptos y la de traduccin al lenguaje documental), el esfuerzo de los profesionales de la documentacin se ha dirigido a la investigacin y construccin de lenguajes que atiendan a las necesidades propias de un sistema documental. Es totalmente necesario que cualquier sistema de documentacin periodstico posea algn lenguaje documental, y su eleccin es determinante para la eficacia del sistema documental. Existen dos grandes tipos de lenguajes: los de clasificacin (usados en la clasificacin del anlisis documental), y los lenguajes de indizacin (utilizados en la indizacin). La distinta funcin que ambas operaciones ejercen en el proceso del anlisis documental condiciona su definicin, estructura y tipologa.

La clasificacin es una operacin sinttica que consiste en asignar una materia definitoria del contenido de un documento y que ha sido extrada forzosamente de un lenguaje de clasificacin o de una lista de

La indizacin es una operacin analtica que consiste en atribuir unas materias, denominadas palabras clave, por las cuales se reconocen todos los conceptos que pueden desprenderse del documento, con la finalidad de recuperarlo en funcin de su

LOS LENGUAJES DE CLASIFICACIN


Definicin = se utilizan para definir el tema principal de los documentos. "Permiten representar de manera sinttica el contenido de un documento" (Jacques Maniez) y reunidos, ya sea fsica o intelectualmente, por la afinidad de sus contenidos. Como lenguajes documentales, los lenguajes de clasificacin son sistemas de signos lingsticos que jerarquizan en escalas conceptuales las reas del saber. Dichos lenguajes se construyen a priori, es decir, son sistemas cerrados que no

admiten nuevas inclusiones. En consecuencia, todas las posibles materias a tratar por un sistema documental tienen que estar representadas. Su caracterstica principal es que son lenguajes precoordinados cin tiene que estar representada por un slo signo lingstico. una no-

La funcin de un lenguaje de clasificacin es la clasificacin temtica de los documentos, y tiene dos aplicaciones: La ordenacin significativa de los documentos: a cada documento se le asigna un concepto, y slo uno, que sintetice su contenido. Esto permite reunir fsicamente todos los documentos que informan de un mismo tema.

La edicin de repertorios bibliogrficos cuyas referencias se encuentren organizadas por temas: a cada referencia bibliogrfica se le asigna un concepto, y slo uno, del conjunto de temas del repertorio. Esto permite reunir bajo una misma clase las referencias que hablan de un mismo tema.

Con el desarrollo de los sistemas automatizados de recuperacin de la informacin, se tiende a distinguir la clasificacin intelectual de la documentacin de su funcin primitiva: la ordenacin de los documentos. De este modo, las bases de datos referenciales reproducen la clasificacin de los documentos, pero fsicamente estos pueden estar archivados en lugares distintos. En los Servicios de Documentacin Periodstica la clasificacin se ha utilizado para archivar una de sus tipologas documentales ms caractersticas, los recortes de prensa. Cada Servicio de Documentacin Periodstica suele construir su propio pseudo-lenguaje de clasificacin, que permite dividir los temas tratados en el sistema documental en materias y submaterias, de manera que a cada artculo le pueda corresponder uno de los temas definidos en el lenguaje. Esto permite reunir todos los documentos de un mismo asunto en una "carpeta", y as la recuperacin de la informacin es mucho ms rpida, cualidad esencial en los Servicios de Documentacin Periodstico.

CARACTERSTICAS, TIPOLOGA LENGUAJES DE CLASIFICACIN

ESTRUCTURA

DE

LOS

Hay dos tipos de lenguajes de clasificacin: la clasificacin monojerrquica y la clasificacin facetada. Si bien la funcin que ejercen es la misma, su construccin es muy diferente.

CLASIFICACIN MONOJERRQUICA Definicin = La clasificacin monojerrquica es la ms conocida y utilizada. Divide las reas del saber en clases y subclases conceptuales, desarrollando una estructura jerrquica en forma de rbol. El nmero de clases es limitado y cada una se puede subdividir en subclases, las cuales Estructura a su vez pueden ser subdivididas y as sucesivamente. Los niveles de ESTRUCTURA jerarqua varan segn cada clasificacin. Los lenguajes de clasificacin se componen de tres elementos: Clases y subclases: corresponden a cada uno de los conceptos en que se pueden dividir las reas del conocimiento. Su caracterstica principal es que tienden a ser conceptos generales y no especficos puesto que de lo que se trata es de encontrar las caractersticas comunes de los diferentes documentos, y no sus especificidades. Auxiliares: grupos de conceptos que pueden estar relacionados con cualquiera de las clases y subclases. Por si mismos no tienen sentido y acompaan siempre a la clase o subclase para precisar su significado. Los auxiliares ms habituales son: el idioma, el lugar, la forma, el tiempo y el punto de vista. Notacin o cdigo: es una sucesin de letras o nmeros que nos indican cul es la posicin de una subclase en el conjunto del lenguaje: cul es su nivel de jerarqua, y a qu subclases y clases pertenece. Ejemplo: La Clasificacin Decimal Universal (CDU)

CLASIFICACIN FACETADA Definicin = La clasificacin por facetas divide las reas del conocimiento segn los diferentes atributos o caractersticas que los objetos o conceptos pueden adoptar. Ejemplo: los autos se pueden agrupar segn el color (blanco, rojo), el motor (diesel, gasolina), la marca (Seat, Renault) o la cilindrada (1100 ce, 1400 ce). En un primer nivel, los trminos son agrupados en dominios del conocimiento (educacin, ciencias fsicas, historia, etc.). Cada dominio organiza sus trminos, no jerrquicamente, sino en funcin de las facetas (atributos o principios de divisin). Hay principios de divisin universales, aplicables a todos las reas del saber (ej. el tiempo y el lugar) y hay principios de divisin particulares para cada dominio. Dentro de cada una de las facetas, los trminos se estructuran en forma jerrquica. El resultado no es una estructura de rbol, sino una

estructura de tablas en que los conceptos se construyen con la combinacin de los temas de las diferentes tablas. Las clasificaciones facetadas pretenden superar los problemas de las clasificaciones jerrquicas (la rigidez de su estructura y la imposibilidad de representar todos los aspectos y procesos de un tema especfico). Su estructura es menos globalizante que la monojerrquica, pero ms analtica al permitir expresar las nociones, gracias a las combinaciones de trminos, con ms precisin. Las clasificaciones facetadas son poco utilizadas en los servicios de documentacin. La dificultad de aplicacin se debe a su abstraccin. La ms importante es la Clasificacin Colon, elaborada por Ranganathan, principal terico de las facetas (slo se utiliza en la India).

LOS LENGUAJES DE INDIZACIN


Definicin = son vocabularios de trminos que permiten representar el contenido analtico de los documentos. Indizar un documento significa extraer todos los conceptos informativos expresados explcita o implcitamente en su contenido y asignarles unas materias o temas, llamadas palabras clave, que sern las utilizadas para recuperar el documento en funcin de su contenido. De lo que se trata no es de sintetizar la informacin en un solo concepto sino atribuir todas las materias que subyacen en los documentos para enriquecer el proceso de recuperacin de la informacin. Cuando indizamos no se agrupan documentos en funcin de su contenido (como en la clasificacin), sino que se analizan todos los conceptosen informativos del los documento. Los principios que se basan lenguajes de indizacin son:

1) Uso del lenguaje natural Los lenguajes de indizacin estn construidos sobre la base del lenguaje natural. A diferencia de los lenguajes de clasificacin que utilizan un cdigo para representar los conceptos, estos lenguajes utilizan las palabras del lenguaje comn.

2) Precoordinacin/postcoordinacin La precoordinacin significa que cada concepto extrado del anlisis documental tiene que estar representado bajo un nico signo lingstico.

La postcoordinacin permite representar un concepto por la combinacin de varios de los trminos o descriptores de lenguaje documental. En un lenguaje postcoordinado se mantienen los trminos por separado, sin la necesidad de crear un tercero que los una, ya que su combinacin tiene el significado requerido.

El nacimiento de los lenguajes de indizacin postcordinados (thesauri y listas de autoridades) est ligados al proceso de automatizacin de los sistemas documentales. Los catlogos manuales implican que un documento slo se puede buscar por un concepto pero no por la combinacin de dos o ms, de ah la necesidad de la precoordinacin (la lista de encabezamientos de materia). Las funciones de los sistemas informticos aplicados a la automatizacin de la descripcin de do cumentos son mltiples y permiten que la unin de trminos para llegar a formular un concepto no se haga en el momento del anlisis documental sino en la operacin de consulta.

3) Lenguajes libres/lenguajes controlados El lenguaje libre utiliza el texto mismo del registro documental o incluso del documento completo para los trminos de la indizacin. La informacin se extrae de los elementos de la descripcin que informan sobre el contenido: ttulo, resumen y a veces el texto completo. Este tipo de lenguaje es muy sencillo de utilizar ya que los conceptos de la indizacin se extraen de la propia lectura del documento, pero tiene el inconveniente de la ambigedad (la sinonimia, la polisemia). Para superar estos problemas, se han creado los lenguajes de indizacin controlados o artificiales. Son lenguajes convencionales creados por el indizador y destinados a representar de manera unvoca el contenido de los documentos. Slo los trminos listados en el lenguaje se pueden usar para indizar un documento, evitando as la sinonimia y la polisemia. Tambin en recuperacin y la bsqueda slo se pueden utilizar los trminos listados en el lenguaje. De este modo, indizador y usuario utilizan un lenguaje comn que hace ms acorde el contenido de la respuesta y la pregunta.

LENGUAJES LIBRES
Definicin = Son listas infinitas de palabras o expresiones creadas a posteriori sobre la base de la indizacin en lenguaje libre de los documentos. Dichas listas se construyen con la extraccin de palabras o expresiones de las zonas del registro bibliogrfico que informan sobre el contenido (ttulo, resumen o incluso el texto completo). Estas palabras o expresiones sern las utilizadas para la recuperacin de la informacin.

Los lenguajes libres adolecen de todas las dificultades y ambigedades de la indizacin por lenguaje natural (polisemia y sinonimia). Aunque deben reconocrseles las ventajas derivadas de la riqueza terminolgica del lenguaje, del grado de coherencia (puesto que un mismo documento siempre estar indizado con los mismos trminos) y de que los costes de fabricacin son prcticamente nulos. Segn el grado de intervencin del indizador, se distinguen dos tipos de instrumentos de los lenguajes libres: listas de palabras-clave y listas de descriptores libres. Lista de palabras claves Es una coleccin de palabras extradas del ttulo, resumen o texto completo, y reconocidas automticamente por el programa informtico. El software construye una lista alfabtica de las palabras significativas que se encuentran en dichas zonas del registro bibliogrfico A este proceso en el que el indizador no interviene, se llama indizacin automtica. Lista de descriptores libres Es una coleccin de conceptos extrados del ttulo, resumen o texto completo mediante un proceso intelectual llevado a cabo por un indizador, quien seala las palabras o conjuntos de palabras significativos. La intervencin del analista ayuda a superar los inconvenientes de los lenguajes naturales.

LENGUAJES CONTROLADOS
Son vocabularios construidos a priori y destinados a representar de manera unvoca el contenido de los documentos y d las consultas. Slo los trminos existentes en esta lista pueden ser usados para indizar. Son los lenguajes estrictamente documentales. Existen tres tipos, con caractersticas de construccin y funcionalidad radicalmente diferente:

Listas de autoridades
Es una lista finita de conceptos simbolizados mediante palabras o conjuntos de palabras ordenados alfabticamente. Su caracterstica principal es la univocidad: slo es posible utilizar los trminos existente en dicha lista para indizar. A diferencia de los thesauri y de las listas de encabezamientos de materia, no establece relaciones semnticas entre los trminos ni tampoco relaciones de equivalencia, lo cual impide el control de la polisemia, y tambin el control total de la sinonimia. Se utiliza con nombres de personas, de instituciones y nombres geogrficos.

Listas de encabezamientos de materias

Definicin y caractersticas Definicin = Son vocabularios de trminos controlados, ordenados alfabticamente, cuya caracterstica bsica es que utilizan un lenguaje precoordinado. El control lxico y semntico de los trminos, denominados epgrafes, se realiza mediante el establecimiento de relaciones de jerarqua, de equivalencia y de asociacin con otros trminos. Recordar que la precoordinacin de los conceptos es necesaria en los catlogos manuales puesto que estos no permiten combinar los trminos. Se han aplicado a temticas de tipo enciclopdico e interdisciplinario. La construccin y aplicacin de las listas de encabezamientos de materia fue establecida a finales del siglo XIX por Cutter (bibliotecario norteamericano) y sus principios son recogidos por la mayora de las listas de encabezamientos existentes. Segn Cutter, los cuatro principios bsicos, fundamento de construccin y utilizacin de las listas, son: Responder al inters del usuario: la terminologa y estructura de las listas tiene que ser familiar al usuario. Principio idiomtico: cada lista tiene que estar redactada en un solo idioma. Principio de especificidad: los epgrafes asignados a un documento tienen que ser lo ms especficos y precisos que el lenguaje admita. Nunca utilizar un epgrafe de carcter general. Principio de encabezamientos uniformes : una nocin slo puede estar representada por un epgrafe, de modo que los documentos relacionados con dicha nocin siempre estn catalogados bajo el mismo epgrafe. Estructura

Unidades lxicas Las listas de encabezamientos se componen de dos categoras de trminos: los epgrafes (trminos usados en la indizacin), y las subdivisiones, que precisan su significado.

Los epgrafes pueden estar formados por un slo trmino (epgrafes


simples) o pueden combinar varias palabras. (Puede ser un sustantivo
seguido de un adjetivo; dos o ms sustantivos que representan conceptos asociados, unidos por una conjuncin o separados por una coma ; un sustantivo seguido de una designacin explicativa entre parntesis para diferenciar trminos homnimos; inversin de epgrafes).

Las subdivisiones se colocan detrs de los epgrafes seguidos de un guin


para precisar su significado: subdivisiones temticas, cronolgicas y geogrficas. Los epgrafes que admiten una subdivisin llevan una indicacin que lo confirma.

Control semntico de los epgrafes el significado de los epgrafes se establece mediante relaciones semnticas. Existen tres tipos de relaciones semnticas: a. Referencias de equivalencia: remiten de los trminos no aceptados a los trminos vlidos y viceversa. Ej: Socialismo vase Democracia social/Democracia social use Socialismo). b. Referencias de jerarqua: establecen relaciones de superioridad e inferioridad entre los epgrafes. Ej: enfermedades vase tambin Tuberculosis. c. Referencias asociativas: refieren trminos relacionados camente. Ej: enfermedades vase tambin salud. semnti-

A parte de las relaciones semnticas, los epgrafes pueden ir acompaados de notas de uso, que explicitan su definicin y aplicacin en el anlisis documental.
(La lista de encabezamientos ms importante en el mundo es la Library of Congress Subject Headings (LCSH), elaborada desde principios de siglo por la Biblioteca del Congreso de los Estados Unidos para la catalogacin por materias de sus libros. La LCSH ha servido de base conceptual y se ha traducido al resto de listas utilizadas en el mundo.)

Thesauri
Definicin = El thesaurus es un lenguaje artificial formado por signos lingsticos con un significado previamente establecido, y con la finalidad de definir, de forma unvoca, el contenido temtico de los documentos. El thesaurus es el ms elaborado de los distintos lenguajes de indizacin y el que ejerce un mayor control semntico sobre los trminos. Es una lista estructurada y finita de trminos, llamados descriptores, vlidos en la operacin de indizacin y en la operacin de re cuperacin entre los cuales se establecen relaciones de jerarqua, de asociacin y de equi valencia como instrumento de control semntico. Incluye la nocin de trminos rechazados que remiten a trminos aceptados. La norma ISO 2788-1986 define al thesaurus como "vocabulario de un lenguaje de indizacin controlado organizado formalmente con objeto de hacer explcitas las relaciones a priori entre conceptos.

El significado de los signos lingsticos est establecido (no como en los diccionarios a travs de una definicin) por su atribucin a un campo semntico y por el establecimiento de relaciones semnticas entre sus descriptores. En un sistema documental, la funcin del thesaurus est limitada a dos operaciones: la de anlisis documental (son exclusivamente los descriptores del thesaurus los que se utilizarn para indizar los documentos) y la de recuperacin de la informacin (son exclusivamente los descriptores del thesaurus los que se utilizaran para formular la ecuacin de bsqueda). El thesaurus establece un puente de comunicacin entre el documento y el usuario que quiere consultarlo.

Tiene tres diferencias bsicas con las listas de encabezamientos de materia: 1. No utiliza mecanismos de precoordinacin , por lo que la eleccin de los trminos se hace segn el principio de postcoordinacin. 2. La presentacin de los trminos incluye una ordenacin alfabtica y tambin una ordenacin jerrquica que explcita el nivel de jerarqua de cada descriptor (las listas slo construyen una lista alfabtica). 3. Suele aplicarse a un mbito determinado del conocimiento (no tiene un carcter general ni enciclopdico como las listas de encabezamientos).

ESTRUCTURA

Unidades lxicas

El thesaurus est formado por signos lingsticos o unidades lxicas de las cuales se distinguen tres categoras, a saber:
EL CUERPO PRINCIPAL lo forman los descriptores

representan unvocamente un concepto u objeto, y pueden estar compuestos por una sola o varias palabras. Los descriptores son los trminos tiles para indizar, y tam bin son los vlidos para consultar un documento. Ej: Cultura/Gestin cultural. (La
norma ISO 2788-1974 establece cules deben ser las caractersticas principales de la forma de presentacin de los descriptores: pueden ser nombres concretos, abstractos o propios. Tienen que ser sustantivos o formas sustantivadas, evitar los adjetivos y no utilizar adverbios ni los verbos)

Si bien el principio bsico de los thesauri es la postcoordinacin, muchos descriptores son compuestos, ya que la representacin de un concepto mediante un trmino puede ser ambigua. Por ej: Poltica y Economa puede ser a la vez poltica econmica y economa poltica.

son trminos desechados para la indizacin y que mediante relaciones de equivalencia remiten a los descriptores respectivos aceptados. Se utilizan para controlar la sinonimia del lenguaje natural y mejoran el nivel de coherencia en la indizacin gracias a la utilizacin de los mismos descriptores para la representacin de los mismos conceptos. Tambin mejoran el porcentaje de documentos pertinentes en respuesta a una pregunta (Van Slype).
NO DESCRIPTORES

sirven para agrupar los descriptores bajo una misma unidad conceptual. Se conciben como campos conceptuales, es decir una agrupacin de conceptos bajo un mismo campo. Los ttulos no se pueden utilizar como descriptores y su utilidad es slo la agrupacin fsica de descriptores semnticamente prximos.
TTULOS DE LOS CAMPOS SEMNTICOS

Pueden ser de dos tipos: propiamente campos semnticos cuando son temticos; o facetas, cuando se definen por la naturaleza de los trminos.

Relaciones semnticas

Enlaces de significado establecidos entre los descriptores que ayudan a constituir los thesauri como verdaderas redes semnticas. Se establecen tres tipos de relaciones:
I. Relaciones de equivalencia: se establecen entre un no-descriptor y un

descriptor (o entre trminos preferentes y trminos no preferentes). Las relaciones de equivalencia son el sistema de control utilizado por los thesauri para evitar la ambigedad terminolgica como consecuencia de la sinonimia del lenguaje natural . Se usa para los sinnimos y los casi-sinnimos (casi-sinnimos son trminos que en el lenguaje comn
denotan un significado completamente diferente pero que son tratados como sinnimos a efectos de la indizacin) . Los casi sinnimos dependen del grado

de especificidad de los trminos, que a su vez depende del lugar preferente o no que ocupa el campo semntico dentro del rea de conocimiento a que se circunscribe el thesaurus. (por ej, en un thesaurus de Ciencias de la Comunicacin, el campo semntico de matemticas estar mucho menos desarrollado que en un thesaurus de Ciencias fsicas. En el primer caso, un trmino englobar muchos conceptos que, en el caso de las ciencias exactas, ser necesario desglosar).

Las relaciones de equivalencia cumplen el principio de las relaciones asimtricas: cuando un trmino A est relacionado con un trmino B, necesariamente el trmino B est relacionado con el trmino A. Los smbolos utilizados para establecer el enlace es: USE: remite de un trmino no aceptado a un descriptor. USADO POR: remite del descriptor al trmino

No siempre un no-descriptor remite a un nico descriptor sino que puede remitir a la combinacin de dos. En el caso de los thesauri multilinges, las relaciones de equivalencia se utilizan para establecer enlaces entre los descriptores de las diferentes lenguas que componen el thesaurus. II. Relaciones jerrquicas: relaciones de superioridad e inferioridad entre dos descriptores que los sitan en una escala conceptual determinada. Es el sistema utilizado por los thesauri para reducir la polisemia de los trminos a la mnima expresin. Un descriptor slo puede depender de un trmino genrico. Por el contrario, a un trmino le pueden pertenecer muchos trminos especficos. Los smbolos utilizados para establecer los enlaces son:
TG: trmino genrico, remite al descriptor inmediatamente superior en la jerarqua. TE: trmino especfico, remite a los descriptores inmediatamente

Existen dos tipos de relaciones jerrquicas: relaciones entre gnero y especie (vaca - mamferos) y relaciones partitivas que establecen la jerarqua entre el todo y la parte (Espaa- Europa). En la prctica, es difcil distinguir entre ambas relaciones.

III. Relaciones de asociacin: Son enlaces que se establecen entre conceptos que presentan alguna caracterstica comn pero que pertenecen a campos semnticos distintos. Todos los conceptos de la realidad estn relacionados entre s de manera que no es suficiente con la jerarqua para representar las relaciones semnticas entre los conceptos. Para que un thesaurus responda a la realidad cabe organizar relaciones horizontales, no slo verticales. La funcionalidad de las relaciones asociativas es doble. Por un lado, ayuda en la tarea de la indizacin, ya que proporciona nuevos descriptores al indizador que le permiten formular asociaciones de ideas con las cuales encontrar los conceptos ms justos y adecuados a la definicin y anlisis del documento. Por el otro, en el proceso de la bsqueda documental proporciona al usuario nuevas posibilidades de expandir la consulta. El smbolo utilizado para establecer el enlace es TR Las relaciones asociativas cumplen el principio de las relaciones asimtricas (ver arriba def)

PRESENTACIN DEL THESAURUS

Hay tres tipos de presentaciones: 1) JERRQUICA: los descriptores estn agrupados en funcin de las relaciones de jerarqua, por reas de conocimiento y campos semnticos. En este tipo de presentacin slo se incluyen las relaciones de superioridad e inferioridad. Algunos thesauri incluyen los no descriptores y las notas de aplicacin o definicin de los descriptores, e incluso las relaciones asociativas.

2) ALFABTICA: es una lista alfabtica de descriptores y no descriptores, los cuales incorporan la informacin referente a sus relaciones semnticas.

Cada descriptor incorpora la siguiente informacin: Trmino de cabecera (TC) pertenece. Trmino genrico (TG) cual depende. Trminos especficos (TE) en la jerarqua. Trminos relacionados (TR) rea de conocimiento a la cual descriptor inmediatamente superior del descriptores inmediatamente inferiores descriptores asociados.

Notas de aplicacin (NA) informacin que clarifica el uso que se le debe dar un descriptor o simplemente precisa la definicin de la nocin. Trminos no preferentes (UP) en beneficio del descriptor. sinnimos o casi-sinnimos rechazados

Cada no-descriptor lleva la siguiente informacin: Trmino preferente (USE) descriptor aceptado

NDICE PERMUTADO El ndice permutado consiste en una relacin alfabtica de las palabras significativas que componen los descriptivos. Cada una de las palabras va acompaada del conjunto del descriptor. As se evita la perdida de significado al no extraerlas fuera de contexto. Permite la consulta alfabtica de los descriptoress por sus segundas o terceras palabras significativas, y agrupar descriptores afines semnticamente que de otra forma estaran fsicamente distanciados.

PRINCIPALES SISTEMAS DE CLASIFICACIN


(Rosa San Segundo Manuel) Clasificar es ordenar fondos documentales o referencias documentales por grupos temticos. La clasificacin bibliogrfica o clasificacin documental hace referencia a la sistematizacin de libros, bibliografas o referencias, agrupados por campos del conocimiento. Por ello, los Sistemas de Clasificacin son los tipos de lenguajes documentales que nos permiten agrupar u ordenar libros y otro tipo de documentos segn su contenido, formando grupos dentro de los campos de conocimiento humanos, donde dichos campos resultan ser compartimientos conceptuales.

Estos compartimientos conceptuales forman un sistema en el cual cualquier factor est relacionado entre s de un modo determinado, y est regido por normas que establecen un orden general que se desarrolla en una serie lineal nica donde todos los trminos ocupan un lugar o rango ordenado, ya sean nombres o signos.

LA CLASIFICACIN DECIMAL DE DEWEY (DDC O DC) Es un sistema jerrquico que aplica el principio de los nmeros decimales para sistematizar las subdivisiones de las clases las clases principales estn

agrupadas en diez grupos temticos que pretenden abarcar todas las disciplinas cientficas. Estas clases se enumeran del 0 al 9 de la forma siguiente:
0 1 2 3 4 5 6 7 8 9 Generalidades. Filosofa y disciplinas afines. Religin. Ciencias sociales. Lenguas. Ciencias puras. Ciencias aplicadas (Tecnologa). Bellas artes. Literatura. Geografa e Historia.

Cada clase principal se subdivide a su vez en diez grupos tambin numerados del 0 al 9. El sistema permite proseguir la subdivisin hasta el lugar deseado, ya que la notacin de las clases tiene valor decimal.

(La Clasificacin Decimal se cre en 1873, y tuvo un gran desarrollo, pues casi simultneaamente se crea la ALA (American Library Association), organismo que propag el Sistema Decimal. Slo tard veinte aos en convertirse en la norma clasificatoria de las bibliotecas pblicas, escolares y universitarias. Adems, la aceptacin alcanzada en EEUU se debi a su adopcin por parte de la Biblioteca del Congreso de los Estados Unidos para los catlogos impresos. La gran incidencia terica/prctica de este sistema se debe a numerosas causas, entre ellas la sistematizacin de las clases principales segn una concepcin moderna de la organizacin del conocimiento; una clasificacin temtica que asigna un lugar fijo a los libros; la posibilidad de subordinacin progresiva de las clases y subclases infinita; por vez primera se da la inclusin de un ndice relativo a las tablas; y, finalmente, la asombrosa utilidad y practicidad de la ubicacin de los libros o documentos en conjuntos temticos afines. A pesar de estas contribuciones, la Clasificacin Decimal fue fuertemente rechazada y criticada por bibliotecarios y documentalistas, pues la Clasificacin Decimal Dewey que otorga un lugar privilegiado a los temas relativos a los Estados Unidos; parcialidad, prejuicios en las sistematizacin de las religiones, las razas, las lenguas, las clases sociales; carcter arbitrario de ciertas separaciones de materias; y falta de idoneidad de su sistematizacin respecto a los conocimientos cientficos. Fueron estos motivos, fundamentalmente, los que hicieron que el Sistema Decimal contara con destacados adversarios. Sin embargo, el principal acierto de Dewey fue la aplicacin del principio de los nmeros decimales a una clasificacin prctica documental. Adems, Dewey haba concebido un sistema que se adaptaba muy bien para el acceso directo en las bibliotecas pequeas. Se trataba de una clasificacin que aportaba innumerables ventajas, pues presentaba una notacin simple que era extensible y clara, e inclua un

ndice alfabtico de las materias. En EEUU tuvo gran incidencia este sistema pese a que competa con otras propuestas clasificatorias nuevas. Su uso se extendi fuera de EEUU a un nmero muy extenso de pases de Amrica Latina, Europa, Asia y Oceana. Sin embargo, el gran alcance del Sistema Decimal fue la difusin universal que logr el Instituto Internacional de Bibliografa, cuando en 1985 decidi traducir las tablas a la lengua francesa y ser la forma organizativa de su catlogo internacional de materias. Ello dar origen a la Clasificacin Decimal Universal).

LA CLASIFICACIN DECIMAL UNIVERSAL (CDU)


(Con el permiso de Dewey para traducir, ampliar y usar su Clasificacin Decimal, Paul Otlet y Henry La Fontaine tradujeron y transformaron la Clasificacin de Dewey con el propsito de organizar un catlogo de carcter internacional. En 1895 se decide, en Bruselas, adoptar la Clasificacin de Dewey para organizar el Repertorio Bibliogrfico Universal. De esta forma nace la CDU, que naci como sistema clasificatorio del Repertorio Bibliogrfico Universal, proyecto que pretendi abordar la realizacin del archivo o enciclopedia de la humanidad, y fue llevado a cabo por el Instituto Internacional de Bibliografa, creado en 1895).

La CDU es un Sistema de Clasificacin con notacin numrica, ordenado segn el principio que rige en los nmeros decimales, es decir, son las partes decimales de la unidad que resultan de dividir a sta por diez, y a su vez por diez, y as sucesivamente. Esta estructura numrica supone que un nmero pueda ser dividido y subdividido casi indefinidamente. Estas explicitaciones estn recogidas en la introduccin oficial de las tablas del sistema. Otra caracterstica de su notacin es que los signos numricos empleados son los nmeros arbigos, conocidos en todos los pases, idiomas y sistemas de escritura, lo que posibilita su empleo internacional. Tambin se caracteriza por abarcar un mbito temtico universal, pues trata de abarcar todo el conjunto del saber, pensar y hacer humanos, a pesar de que su estructura de la organizacin del conocimiento sea, en la actualidad, obsoleta y anticuada por su falta de actualizacin conjunta. Su estructura comprende diez divisiones del saber, que a su vez se dividen en diez y as sucesivamente, quedando la posibilidad de que las divisiones fundamentales puedan ser desmembradas en casi infinitos grupos temticos. Las clases principales se estructuran de forma jerrquica, en el siguiente orden:
CDIGO CLASE 0 1 2 3 Generalidades Filosofa. Psicologa Religin. Teologa Ciencias sociales. Estadstica. Poltica. Economa. Derecho. Administracin. Asistencia social. Seguros. Educacin. Etnologa

4 5 6 7 8 9

Sin ocupar Matemticas. Ciencias Naturales Ciencias aplicadas. Medicina. Tcnica Bellas Artes. Juegos. Espectculos. Deportes Lingstica. Filologa. Literatura. Geografa. Biografa. Historia

Cada una de estas clases est subdividida en un nmero limitado de subclases especficas, las cuales a su vez son susceptibles de subdivisin, segn el principio de divisin jerrquica de los conceptos. La notacin corresponde a una codificacin numrica decimal, segn la cual, las cifras tienen el valor de las fracciones decimales, permitiendo que el crecimiento de las subdivisiones sea indefinido por la sucesiva agregacin de cifras. Ejemplo:
3 3 331 331.2 331.2 3 331.2 31 Ciencias sociales. Estadstica. Poltica ... Ciencias econmicas Trabajo Salario. Honorarios Formas de salario

La primera cifra corresponde a la clase o primer nivel jerrquico, la segunda cifra a la subclase inmediatamente inferior o segundo nivel jerrquico y as sucesivamente.

Trabajo a destajo

Esta estructura se enriquece con el uso de signos convencionales que permiten la combinacin de diversos conceptos y la utilizacin de auxiliares que ayudan a precisar el significado. Se destacan: a) Combinacin de conceptos: signo utilizado [:] b) Auxiliar de lugar: signo utilizado [()] c) Auxiliar de tiempo: signo utilizado [" "] d) Auxiliar de lengua: signo utilizado [=] La CDU provee de una tabla para cada uno de los auxiliares admitidos y sus equivalencias en los cdigos.

La estructura jerrquica de la CDU sigue un orden sistemtico que parte de lo general hasta lo particular, del todo a la parte, del gnero a la especie. Adems, todas las materias encuentran un desarrollo numrico decimal y jerrquico. La operacin de clasificar con las tablas de la CDU comienza por asignar un nmero de la clase temtica o subclase y aadir, en caso de que fuese necesario, los auxiliares de los que consta el sistema como: punto de vista, lugar, tiempo, forma, lengua, raza y todos los dems auxiliares de menor envergadura. Estos nmeros auxiliares fueron la aportacin ms relevante de Otlet a las tablas de Dewey, adems de la ampliacin de sta. La CDU tambin contiene un ndice alfabtico de materias, siguiendo la misma novedad que Dewey haba incluido en sus tablas. El ndice es til en el caso de que no se conozca en las tablas una materia y poder evitar el esfuerzo de su bsqueda, ya que permite localizar la notacin correspondiente de cualquier materia que se haya buscado alfabticamente. El uso de la CDU se extendi rpidamente en Europa, aunque su implantacin ha tenido, tambin, incidencia en Asia, Amrica Latina y frica. Ha sido uno de los sistemas que mayor relevancia y vigencia ha tenido en el marco bibliogrfico universal.

CLASIFICACIN DE LA BIBLIOTECA DEL CONGRESO DE WASHINGTON (LC)


Tras ser incendiada la Biblioteca por los soldados britnicos, Thomas Jefferson vendi su biblioteca personal, y qued inserta en la Biblioteca del Congreso la catalogacin y clasificacin que haba realizado el propio Jefferson, quien en 1815 public el catlogo alfabtico, organizado en 44 grupos temticos. Este esquema predomin durante el siglo XIX hasta 1899, en el que el director de la Biblioteca decide la reorganizacin y reclasificacin completa de sus volmenes. En ese momento existan en Estados Unidos dos relevantes clasificaciones: la Clasificacin Decimal de Dewey y la Clasificacin Expansiva de Cutter. El sistema de Cutter va a tener mayor incidencia, pues se crey que era el sistema que mejor se adaptaba al fondo de que disponan. Cutter haba elaborado su propio sistema de clasificacin considerando que la clasificacin de Dewey no era aplicable a determinadas bibliotecas de menor tamao. Publicado en 1891, la idea bsica del Sistema de Cutter consiste en una organizacin de extensin creciente con siete tablas clasificatorias separadas. La primera de ellas es simple y slo aplicable a pequeas bibliotecas; en la segunda se incrementa el nmero de clases y subclases; la tercera tabla increment el nmero de clases, y as sucesivamente hasta la tabla sexta que es la ms completa: comprende 26 divisiones y presenta numerosas subdivisiones. Cutter muri cuando estaba terminando su sptima tabla, y las clases ya concluidas fueron publicadas bajo la revisin y directrices de su hijo. Lo singular del sistema es que permite pasar de una tabla a otra de forma progresiva de acuerdo con el crecimiento de los fondos de la biblioteca. Por ello, en todas las

tablas los temas tienen los mismos signos o notacin, de forma tal que al pasar de una tabla a otra no se modifica la notacin. La notacin general en las tablas expansivas es breve y simple: consiste en el uso de letras del alfabeto latino, utilizando las maysculas para las clases principales; para las subdivisiones (que aparecen a partir de la tercera tabla) se emplean igualmente las letras maysculas, pero con un tamao ms reducido. Adems, estas subdivisiones tienen cierta consonancia y desarrollo alfabtico (puede observarse esta nemotecnia en los trminos consignados en la lengua inglesa). Este desarrollo nemotcnico, donde la inicial de los trminos es la notacin para las subdivisiones, se complementa con otras subdivisiones que son aadidas con un punto ms un nmero; estas subdivisiones presentan la forma de los documentos. Tambin presenta este sistema, auxiliares de lugar cuya notacin es numrica, que sirven para hacer subdivisiones. El sistema de Cutter contiene un ndice alfabtico que remite a la notacin en las primeras seis tablas o expansiones. Este sistema va a tener gran incidencia en todas las tablas de la Clasificacin de la Biblioteca del Congreso, aunque se opt para esta biblioteca, por formular un esquema nuevo impregnado por los criterios clasificatorios de Cutter. En 1948 cuando la Clasificacin de la Biblioteca del Congreso se haba completado, con excepcin de la tablas correspondientes a la clase K (Legislacin). Este sistema est compuesto de clasificaciones especficas e independientes para cada materia entre las que no existen interconexiones. Las clases principales estn distribuidas en 21 grupos temticos. La notacin de estas clases principales es alfabtica simbolizadas cada una, por una letra mayscula del alfabeto latino. La independencia de cada grupo temtico general es total, pues de cada clase se han publicado sus tablas de forma independiente. No se trata de un sistema clasificatorio conjunto y unitario, sino que, por el contrario, es un conjunto o serie de clasificaciones amplias y especializadas, que no constituye, en consecuencia, un compendio completo de materias del conocimiento. El sistema de clasificacin, con preeminencia del Sistema de Cutter, presenta un claro predominio prctico, fundamentado en la propia praxis de la Biblioteca del Congreso. Aunque las clases principales guardan cierto paralelismo con las tablas generales de Cutter, presentan ciertas diferencias. Este sistema se compone de 29 tablas que contienen las clases principales. Cada clase general se subdivide en materias que quedan expresadas por una notacin alfabtica de letras maysculas de igual tamao que las letras correspondientes a las clases generales. Las subdivisiones alfabticas tambin tienen correlacin en lo que hace referencia a una notacin nemotcnica. La notacin empleada en las subdivisiones es alfanumrica, pues se compone de dos o tres letras maysculas seguidas de nmeros arbigos del 1 al 9999 sin valor decimal. Todas las subdivisiones pueden tratarse mediante divisiones geogrficas compuestas por una notacin alfanumrica; no se trata de auxiliares geogrficos, sino de subdivisiones que se desarrollan de forma independiente en cada parte de las clases individuales. Lo mismo ocurre con las subdivisiones cronolgicas. Igualmente pueden formularse subdivisiones alfabticas para autores individuales. De igual forma sucede con los nombres propios. Para facilitar el manejo de las tablas, se incluye en cada clase un ndice alfabtico independiente. Este ndice es individual y sus entradas comprenden nombres

personales, geogrficos y adems se hace uso de referencias. Esta Clasificacin se presenta con el atributo de ser muy efectiva, pues las tablas de cada materia tienen total independencia unas de otras, o sea, son clasificaciones individuales, lo que permite una actualizacin de cada una de las tablas sin necesidad de actualizarlas todas en su conjunto. La expansin de este sistema a otros mbitos implica una interferencia cultural, porque ha puesto especial nfasis en los valores, conceptos y tpicos americanos. Adems, las tablas carecen de un ndice general comn a todas, lo que supone una dificultad en su uso, e igualmente no existen instrucciones generales en su empleo. Se trata de un esquema de clasificacin realizado exclusivamente para los fondos de la Biblioteca del Congreso, por lo que los epgrafes y subdivisiones tienen slo correlacin con los fondos de esta Biblioteca; ello supone una dificultad aadida para implantarse en otras bibliotecas con otros fondos; finalmente, est redactada en su totalidad en lengua inglesa y muchos conceptos presentan dificultad para ser traducidos a otras lenguas.

Вам также может понравиться