Академический Документы
Профессиональный Документы
Культура Документы
TESAURO
linguagem de representao da memria documentria
RIO DE JANEIRO
2001
Ao Mestre
MANOEL ADOLPHO WANDERLEY
SUMRIO
Representao e meta-representao, p.
Lngua e linguagem, p.
A propsito, p.
Referncias bibliogrficas, p.
do Livro Universal, organizado por reas particulares do conhecimento, nunca foi concretizado e embora o objetivo de Otlet no tenha sido alcanado nesse sentido, as suas idias foram extremamente teis no que se refere anlise e sntese dos contedos informativos. O princpio da indexao da informao e da construo de resumos para facilitar a
recuperao da informao contou com as regras de anlise documentria criadas para a
organizao do Biblion ou Livro Universal, ou seja, a literatura deve ser analisada, isolando-se quatro categorias gerais: fatos - interpretao dos fatos - estatsticas - fontes.
Alm disso, outra contribuio importante ao acesso s
fontes bibliogrfi-
cas foi o desenvolvimento das normas tcnicas para a descrio da forma e do contedo
bibliogrfico. Inegavelmente, Otlet e sua equipe nos legaram as bases do que chamamos
hoje de redes de informao, que funcionam interligando as representaes do conhecimento em todos os campos do saber, para todos os tipos de objetos e relatos, ainda necessitando
urgentemente de normalizao. Essa normalizao diz respeito aos formatos de apresentao da informao, aos protocolos de acesso s bases de dados, enfim, a uma nova linguagem que de documentria passa a ciberntica e que, em alguns casos, se aproxima da linguagem pictrica, dos hierglifos.
Se considerarmos as possibilidades de localizao da informao desejada na Web,
tal como sintetiza SADANI13, vemos que as melhores chances de obt-la so aquelas que
utilizam operadores matemticos na combinao e a restrio de conceitos representativos
da pergunta para a qual se deseja uma resposta. No uma resposta objetiva, mas a indicao
de fontes de informao moduladas isto , de uma cadeia de complexidade que parte dos
sites at se chegar ao texto primrio. Vale lembrar que, neste momento, temos a possibilidade de encontrar ou no o texto primrio digitalizado.
Caso j pudssemos utilizar os operadores lingsticos ainda em estudo, tais como
os sintagmas nominais discutidos por Brito14, a pergunta feita em lingua natural no precisaria ser decomposta em conceitos organizados por operadores matemticos. Na prtica, no
entanto, ao pesquisarmos um assunto na Web, chegamos a duas concluses: a primeira a
de que os engines (programas de busca de informaes) so especialmente eficientes na
localizao de sites genricos sobre o domnio do campo semntico de interesse; a segunda concluso a de que um bom resultado refinado para um assunto especfico s oferecido pelas bases de dados que operam com operadores matemticos, isto , que utilizam a
interface da linguagem documentrias entre documentos e usurios. Seria prematuro, con-
tudo, afirmar que ambos os sistemas se complementam e continuaro a coexistir por longo
tempo.
Enquanto aguardamos os resultados dos estudos nos campos da Lingstica e das
Cincias Cognitivas, a utilizao das linguagens documentrias nos parece, ainda, indispensvel para a organizao e o acesso ao conhecimento pblico.
NOTAS E CITAES
1
O primeiro Curso de Biblioteconomia no Brasil foi criado pelo Decreto n. 8.835, de 11/07/1911. Iniciou em
abril de 1915 na Biblioteca Nacional do Rio de Janeiro, tendo como diretor Manuel Ccero Peregrino Silva.
O programa deste curso pioneiro se inspirava no modelo francs (cole de Chartes), dando nfase ao aspecto cultural e informativo. Em 1929, o "Mackenzie College", hoje Universidade Mackenzie, de So Paulo,
criou um Curso de Biblioteconomia, inspirado no modelo norte-americano, que enfatizava os aspectos tcnicos da profisso. Cf. http://www.ced.ufsc.br/bibliote/encontro/bibli7/eb7art2.html
Sobre a impacto desta questo na Biblioteconomia Cf. DODEBEI, V.L., MENDONA DE SOUZA, Alfredo. Cincia da Informao: formao e interdisciplinaridade. Rio de Janeiro: IBICT/CNPQ/ ECO/USP,
1992.
Coyaud define (traduo livre) Anlise Documentria como toda operao efetuada sobre o documento
bruto, a fim de torn-lo utilizvel (i.e. recupervel) para a pesquisa documentria. Cf. COYAUD, Maurice. Analyse et recherche documentaire. In: __________. Linguistic et documentation: les articulations logiques du discours. Paris: Larousse, 1972. p130
O conceito de anlise de contedo apresentado pela autora diz respeito ao conjunto de tcnicas destinadas
a ressaltar do contedo de diversas categorias de documentos escritos, certos elementos singulares de onde
se inferem caractersticas psico-sociolgicas do objeto analisado. Cf. CUNHA, Isabel M. R. Ferin. Anlise
documentria : parmetros tericos. In: ANLISE documentria: a anlise da sntese. So Paulo: USP,
1986. p. 42.
Estudos fundamentados na Inteligncia Artificial, na Sintaxe e em menor escala na Semntica. Cf. COULON, Daniel. Informtica e linguagem natural: uma viso geral dos mtodos de interpretao de textos
escritos. Braslia, IBICT; Rio de Janeiro, SENAI, 1992.
VICKERY, B. C. Knowledge representation: a brief review. Journal of Documentation, 42, n. 3, p. 145159, Sept. 1982.
A esse respeito consultar um novo campo de especializao denominado Arquitetura da Informao. Em
Matthew Cutler: O que exatamente arquitetura de informao? Para os webmasters, a organizao consciente de grandes volumes de informao, de forma que os usurios possam navegar de forma fcil e eficiente em seus site - funo semelhante ao design... A criao de uma estrutura de informao slida deveria
fazer parte da estratgia de Internet desde o incio. O fio condutor deveria ser a criao da noo de hierarquia, um conceito de localizao de cada item em termos de importncia e sua relao com o todo. O objeti-
10
vo oferecer informao suficiente para os visitantes decidirem facilmente onde ir, mas no a ponto de ficarem sobrecarregados de dados e confusos, ou de serem levados para onde no querem ir. Cf.
http://www.uol.com.br/webworld/tecnologia/arquitet2.htm
9
WANDERLEY, Manoel Adolfo. Linguagem documentria: acesso informao. Rio de Janeiro, Ci. Inf.,
v. 2, n. 2 , p. 175-217, 1973. p. 180
10
RAYWARD, W. Boyd. Visions of Xanadu: Paul Otlet (1868-1944) and hypertext. Journal of the American Society for Information Science, v. 45, n. 4, p. 235-250, 1994.
11
BRADFORD, S. C. The documentary chaos. In: ____. Documentation. London: Crosby Lockwood & Son,
1953. cap. IX.
12
ECO, Umberto. A estrutura ausente: introduco pesquisa semiolgica. So Paulo: Perspectiva, 1991. p.
90, 91.
13
SADANI, Lalthoum; BERTRAND-GASTALDY, Suzanne. La reprsentation dans Internet des comnaissances dn domaine. Documentation et bibliothques, jan./mars, p. 27 42, 2000.
14
BRITO, Marclio de. Sistemas de informao em linguagem natural: em busca de uma indexao automtica. Ci. Inf., Braslia, v. 21, n. 3, p. 223-232, set./dez., 1992.
2 Representao e meta-representao
12
13
14
15
o dos papis e responsabilidades dos cientistas, engendra, entre outras coisas, uma necessidade vital de estruturas tcnicas e de tcnicas complexas para cada disciplina. Dessa forma, os fsicos, os bilogos, os psiclogos e os cientistas sociais esto encapsulados em
seus universos particulares. difcil estabelecer um dilogo entre um casulo e outro. Essa
fragmentao se contrape a um outro aspecto interessante, que possivelmente foi o fato
determinante no processo de concepo da teoria geral dos sistemas por Bertalanffy. Fazendo um levantamento na evoluo da cincia moderna, nos deparamos com um fenmeno surpreendente. De forma independente, problemas e concepes similares foram trabalhados e desenvolvidos em reas completamente diferentes. Dessa forma, existem modelos, princpios e leis que se aplicam a sistemas generalizados ou suas subclasses, no importando sua rea, a natureza de seus elementos componentes, nem a relao ou foras
entre eles. Parece ento legtimo aspirar a uma teoria de princpios universais passvel de
ser aplicada aos sistemas em geral. nesse sentido que Bertalanffy postula uma nova disciplina nomeada Teoria Geral dos Sistemas, cujo objetivo e formulao derivaro de princpios vlidos para sistemas em geral.
A conseqncia de se aceitar a existncia de propriedades gerais dos sistemas o
aparecimento de similaridades estruturais, ou seja, isomorfismo entre diferentes reas. Existe uma correspondncia nos princpios que governam o comportamento de entidades
intrinsecamente distintas. Um exemplo simples a lei do crescimento exponencial, que se
aplica ao crescimento de bactrias, animais ou humanos, ao mesmo tempo que ao crescimento da pesquisa cientfica, medido pelo nmero de publicaes. A partir destas proposies, Bertalanffy conclui que esta correspondncia proporcionada pelo fato de que as
entidades envolvidas podem ser consideradas como sistemas, isto , um complexo de elementos em interao. Isto faz com que estes fenmenos, embora tendo origens distintas,
estejam subjugados a um princpio geral comum. De fato, so muitos os exemplos de
princpios idnticos que so descobertos vrias vezes, pois os pesquisadores de um campo
desconhecem que a estrutura terica do seu trabalho ou pesquisa j est desenvolvida em
outro campo. Bertalanffy bastante enftico quando afirma que a teoria geral de sistemas
uma ferramenta til na transferncia de modelos de uma rea para outra.
Indo mais adiante, Bertalanffy afirma que existe um outro aspecto ainda mais importante na teoria de sistemas, o qual est relacionado com o conceito de complexidade
organizada (organized complexity). A fsica clssica, diz Bertalanffy, resolve com sucesso
16
os problemas concernentes complexidade desorganizada (unorganized complexity), atravs da segunda lei da termodinmica e das leis da probabilidade. Um exemplo disso o
comportamento de um gs. Em oposio, o problema fundamental atual o relacionamento complexidade organizada. Conceitos tais como organizao, holstica, diretividade
(directivness), teleologia e diferenciao, fogem ao escopo da fsica convencional. Entretanto, eles surgem a todo instante, na biologia, nas cincias comportamentais e sociais; e
so indispensveis quando se trata de organismos vivos e grupos sociais. Dessa forma, um
problema bsico proposto pela cincia moderna a teoria geral da organizao. A teoria
geral de sistemas est, em princpio, capacitada a delinear tais conceitos e, em alguns casos
especficos, estabelecer para eles anlises quantitativas.
Como Bertalanffy observou, com muita propriedade, a fsica convencional, modelo
para todas as cincias, apresenta limitaes graves, geralmente ignoradas pelos cientistas.
De fato, a fsica convencional lida somente com sistemas fechados, isto , sistemas isolados de seu meio ambiente. A segunda lei da termodinmica, por exemplo, s se aplica a
sistemas fechados. Os sistemas vivos, entretanto, so sistemas abertos. O mesmo se pode
afirmar quando se trata da teoria geral da comunicao, ou da informao, que incorporam
a noo de feedback e de rudo, portanto, sistemas abertos ao seu meio ambiente.
Neste sentido, como observaram Haggett e Chorley8, discutindo a Nova Geografia,
a informao suscetvel de tratamento em termos da teoria geral da informao. Nesse
contexto, as informaes concretas, factuais, s tm relevncia dentro de um corpo de referncia mais geral, e esta operao bsica de como definir um fato relevante s pode ser
realizada com base num arcabouo terico. H tambm nveis diferentes de organizao
das informaes relevantes.
Burt e Kinnucan9, analisando os modelos utilizados em Cincia da Informao para
o Annual Review of Information Science and Technology, dizem que a modelagem da informao refere-se identificao de componentes de modelos e seus elos, aos modos de
expresso, ao processo de construo do modelo, e ainda ao delineamento dos paradigmas
que afetam aos modelos que esto sendo construdos. Paradigmas refletem ao mesmo tempo os propsitos e as fronteiras de um modelo. Lyytinen10 considera dois paradigmas para a
modelagem. O primeiro refere-se ou um mapeamento da realidade, e essencialmente
uma tcnica descritiva para representar alguma coisa que claramente compreendida mas
17
18
19
Produo de conhecimentos
Com a mudana do paradigma da cincia, que deixa de se pautar pela verticalidade (especializao), se conduzindo mais no sentido da horizontalidade das abordagens transdisciplinares,
as
informaes
produzidas
ser
chamamos de sociedade da
informao.
Registro
Quanto diversificao dos suportes (registro), as informaes produzidas poderiam,
grosso modo, ser classificadas em textuais, visuais, sonoras ou tridimensionais e, ainda, por
uma combinao dessas categorias. Com efeito, os suportes vo se desenvolvendo em funo dos avanos tecnolgicos, configurando-se a no s a sua diversidade como tambm a
duplicidade. Hoje temos condies de acessar uma revista cientfica em papel, em CDROM e at em microformas (tcnica muito utilizada preservao e reproduo de documentos) ou em arquivo eletrnico, que parece ser o meio mais rpido e de baixo custo para
a disseminao da informao. Temos a possibilidade de analisar uma escultura, com todos
os detalhes tcnicos, em um museu virtual, como em um museu tradicional. Pode-se ter
acesso a um acontecimento em torno de um produto como por exemplo a mostra Monet, no
Museu de Belas Artes do Rio de Janeiro, que intercalou a pintura original, fotos da tela e
vdeos temticos das seqncias inspiradoras do pintor na confeco de um grupo de obras
sob um mesmo tema. Os suportes so os mais variados e, s vezes, passam a se constituir
em acessrios localizao da informao, ou seja, fazem parte do universo de restrio
uma estratgia de busca temtica, exceo das pesquisas que visam ao suporte como objeto de interesse, passando o tema a ser secundrio.
Assimilao
A assimilao das informaes geradas pelo conhecimento e que proporcionaro a
produo de conhecimentos novos pode ser estudada, entre outros, sob o ngulo da veloci-
20
dade de sua obsolescncia. Como cita Virilio13, ao lado das dimenses espao e tempo,
existe hoje uma outra dimenso, que a luz. No a luz no sentido puro da claridade, da
viso, do entendimento, mas a luz em sua verso de trajeto. Para Virilio, o que nos move
hoje no sentido das representaes sociais no mais o espao e o tempo, mas o movimento, o trajeto, invertendo assim o conceito de velocidade da luz para a luz da velocidade. o
tempo real que importa. No mais uma questo de localizao absoluta, mas de percepo relativa, a qual Virilio nomeia de energia cinemtica da relatividade. Quanto mais veloz a apresentao dos produtos sociedade, mais rpido estes ficam obsoletos. O sentimento predominante da sociedade atual pode ser caracterizado pela ansiedade de informao. Ansiedade no sentido de saber que existe uma informao relevante e no conseguir
acess-la em tempo hbil, ou de produzir uma informao importante e no conseguir disponibiliz-la. Qual informao e quanto dela assimilada, uma questo complexa, mensurvel apenas indiretamente pela quantidade e qualidade dos novos conhecimentos produzidos.
O segundo subconjunto, representado pela parte inferior do crculo, ao contrrio do
primeiro, no tem existncia independente. As seis etapas completas so necessrias ao
ciclo de vida da informao, embora s o subconjunto representado pela seleo, representao e disseminao se configurar em memria documentria. O campo de estudo da
memria documentria e seus fundamentos mais especficos so a teoria da classificao, a
teoria do conceito e as teorias da comunicao, que so denominadas, no seu conjunto,
teorias da organizao do conhecimento e, especificamente, teoria da memria documentria.
Segundo Wanderley14, toda coleo documentria pode ser representada por um
quadro de entrada dupla chamado usualmente matriz documentria, em que se atribui cada
linha a um documento e cada coluna a uma das mltiplas caractersticas a partir das quais
sero ulteriormente procurados os documentos. Com base nessa representao simblica,
seria possvel edificar a teoria geral da organizao das memrias documentrias ou o
conjunto de elementos que permite o acesso aos documentos de uma coleo a partir de
suas caractersticas, e a sistemtica dos processos de seleo.
21
22
23
mao e, ainda, dificuldade imposta pela prpria natureza da lngua natural, na qual se
apresentam tanto os documentos como os pedidos de busca de um documento na coleo.
Tanto pelo aspecto quantitativo, isto , o nmero de atributos escolhidos, como pelo qualitativo - possibilidades de interpretaes semnticas - , a memria documentria ainda se
caracteriza como memria virtual de acesso ao documento primrio. Ela no oferece a
garantia do acesso, apenas a possibilidade.
Montgomery15 descreve a estrutura da memria documentria em um modelo de
concepo sistmica, denominado Sistema de Recuperao da Informao (SRI), no qual
os dados de entrada so, ao mesmo tempo, as representaes das demandas de informao
pelo pblico e as representaes do acervo ou coleo. O sistema processa essas representaes, comparando-as e devolvendo-as sob a forma de novas representaes direcionadas
a cada demanda. A retroalimentao garantida pelas novas produes de conhecimento
que sero selecionadas para o ingresso no sistema de informao. Esse processo, denominado de Recuperao da Informao, pode ser considerado como um filtro, pelo qual s
transitam as informaes demandadas, embora nem sempre essas se configurem como as
mais necessrias.
O modelo abaixo toma por base as simplificaes apresentadas por Montgomery,
que j demonstrava a inteno de salientar a importncia das representaes documentrias
no sucesso do casamento entre pblico e acervo.
24
A anlise do modelo SRI nos conduz s etapas inscritas na parte inferior do crculo, j
configurada como memria documentria.
Seleo
A primeira etapa do subconjunto da memria documentria e terceira etapa do ciclo da
informao identificada pelos processos de seleo e aquisio que no so processos ao
acaso, ao contrrio, devem ser planejados em funo das caractersticas da instituio que
mantm acervos documentais. Ambos valem-se do princpio da economia. Quer dizer, funcionam como filtros da sociedade da informao, a fim de favorecer o equilbrio entre as
necessidades de informao do pblico usurio e a oferta da sociedade. Segundo Mc Garry16, necessidade um conceito bsico nos estudos de informao mas difcil de definir
satisfatoriamente. Essencialmente, ele implica a falta de algo que se estivesse presente
contribuiria para nosso bem-estar e para facilitar o alcance de quaisquer objetivos que tenhamos em mente. O conceito de necessidade passa pelos termos vontade, desejo, anseio e exigncia e est intimamente ligado idia de motivao.
Assim, a seleo, principalmente, um processo redutor, e como tal faz uso da
comparao como indicador de tomada de deciso para a aquisio. A funo das unidades
25
26
27
de representao e podem ser sintetizados por trs conceitos: reduo semntica, pluralidade de significados e produo de sentido.
Reduo semntica
A mediao exercida pela Cincia da Informao entre indivduos e representaes sociais faz com que a reduo semntica se imponha pluralidade de significados
como forma de garantir a produo de sentido. Toda intermediao em si um fenmeno redutor de significados. O menor nvel de reduo semntica se daria, por exemplo, em uma comunicao teleptica entre dois indivduos. Qualquer meio que se
interpusesse entre emissor e receptor j representaria uma alterao na fonte, como o
caso da linguagem. A escrita acrescenta mais um nvel de reduo em relao mesma
fonte e, portanto, toda proposta de representao de linguagens de representao reduz
a informao na fonte. Se a linguagem, em si, j redutora do pensamento, todas as
formas de sntese da linguagem com o propsito de acesso informao so, tambm,
formas ainda mais acentuadas de reduo de significado. Inegavelmente, a cadeia de
redues semnticas faz parte da base terica da memria documentria para que a organizao do conhecimento em unidades mnimas seja passvel de decodificao. O
princpio da economia de smbolos o que nos permite usufruir do conhecimento configurado nessas memrias. nesse momento que faz sentido incorporar um novo conceito, o da meta-representao. A representao do conhecimento com esta acepo
pode ser entendida como uma cadeia necessria de redues que se inicia com a concepo indo at a representao da representao, meta-representao ou representao
documentria.
Representao sensvel
Representao conceitual
Representao verbal
Representao social
Representao documentaria (meta-representao)
Pluralidade de significados
O pensamento humano, que opera com contedos dependentes da palavra, implica
sempre uma influncia recproca entre o sujeito pensante e o contedo que a palavra encer-
28
ra. A linguagem vista como o instrumento do pensar, sua realidade imediata, tanto para o
ouvinte quanto para o falante. Merleau Ponty23 amplia esse conceito e afirma que a palavra
no a traduo de um sentido mudo, mas criao de sentido. A linguagem no veste
idias: ela encarna significaes, estabelece a mediao entre o eu e o outro e sedimenta
os significados que constituem a cultura. O pensamento, segundo Spirkin24, nasce junto
com a linguagem e constitui a atividade cognoscitiva do sujeito feita imediatamente por
meio da palavra. A linguagem cumpre, ento, dois papis: um como fator de comunicao
(objeto - relao do sujeito com o objeto - relao existente entre sujeitos), outro como
organizador do pensamento. Gorsky25 confirma o discurso de Spirkin, dizendo que a linguagem est vinculada ao pensamento direta e indissoluvelmente e essa conexo essencial que determina o papel que a linguagem desempenha na esfera do conhecimento. Richaudeau26 adiciona nfase tese, considerando que a riqueza do aparelho lingstico permitiu a
transcendncia da sua funo inicial e a linguagem se transformou em suporte do conhecimento, da imaginao, do sonho, dos prazeres. A linguagem no exprime somente o pensamento humano pr-existente, mas se constitui no prprio pensamento.27
Sobre o segundo aspecto, observa Spirkin28 que a escrita constitui a forma visual de
fixar a linguagem, surgindo quando a sociedade j havia alcanado um nvel elevado de
desenvolvimento. Portanto, um produto normal da ampliao dos meios de intercomunicao das pessoas, estimuladas pelas necessidades prticas da vida social. A escrita , assim,
resultado da atividade criadora e consciente dos seres humanos. Como linguagem articulada, adquire um carter at certo ponto independente e constitui uma forma de atividade
extremamente abstrata. A escritura pictogrfica evoluiu gradativamente no sentido da significao. Da representao completa do objeto, o homem passou representao esquemtica. Por sua vez, a escrita ideogrfica ou hieroglfica constituiu um sistema de signos e
regras acerca de seu emprego que serviu para comunicar um pensamento qualquer.
Do ponto de vista do desenvolvimento do pensamento, o aparecimento do alfabeto
significou que o homem chegou a ter a idia de que a palavra consta de elementos particulares. O sistema alfabtico, portanto, surgiu no estgio em que a linguagem fontica e o
pensamento abstrato haviam alcanado seu pleno desenvolvimento. A escrita fontica, atravs da linguagem, se converteu em realidade material do pensamento. Ento, ao proporcionar ao pensamento um carter de certo modo independente (da realidade fsica dos obje-
29
tos), a linguagem foi uma das foras que contriburam para criar no somente uma cultura
espiritual, como para desenvolver a cultura material.
Ainda em Gorsky, a linguagem no s constitui uma condio necessria para a
formao de nossos pensamentos, como tambm permite consolidar os xitos da atividade
cognoscitiva do indivduo, fixar a experincia adquirida por uma gerao e transmitida s
geraes futuras. Portanto, o papel da linguagem para o conhecimento se revela a partir da
transmisso dos conhecimentos adquiridos, na passagem do nvel sensorial para o racional
e no processo de formao de conceitos, tanto do discurso da ontognese, como da filognese. O pensamento pode ento ser igualado concepo, dentro da escala associativa sensao percepo concepo, no sentido de criao e, portanto, com independncia do
real objetivo. O pensamento no se dissocia do real, mesmo considerando os conceitos de
juzos e raciocnios. A reflexo sobre a realidade natural existe, dado que tanto o contedo
como a forma de cada conceito, de cada juzo e de cada raciocnio particulares so um reflexo do mundo material.
Gorsky trata, ainda, do problema correspondente ao sentido da palavra, da correlao que existe entre o sentido e o significado e ainda entre sentido e conhecimento. Usa,
para tal, o raciocnio aristotlico de propriedades ou caractersticas e diferena na identificao de grupos ou classes de conceitos e seus possveis relacionamentos. A aproximao
de um objeto sob o aspecto da sensao, percepo ou representao nos conduz ao objeto
nico e no sua classe. As sensaes e percepes no precisam ser fixadas materialmente, mas as concepes sim. A suposio de que existam estrelas e o sol da ordem da percepo. A relao, ou seja, as estrelas so sis, da ordem da concepo. Para tanto, h a
necessidade de atribuio do signo, no caso a palavra, para expressar ou fixar o pensamento (ou concepo). Logo, o processo de pensar se caracteriza pela capacidade de formar
conceitos, de generalizar. E, nesse sentido, o processo de pensamento , por sua vez, um
processo no qual se opera com palavras.
Ainda assim, embora possamos afirmar que o signo representa o pensamento, o fato
mesmo da representao conduz idia de reduo semitica, tal que as representaes
variam no s pela forma de apresentao como pelo modo de interpretao. Do mesmo
modo que posso representar uma relao por meio de uma abstrao pictrica, como por
exemplo: a rosa maior que o livro - e desenhar uma rosa grande e um livro pequeno, a
30
Produo de sentido
Sem dvida que, se nas etapas anteriores j h uma configurao de reduo semitica, o acesso ao conhecimento mediado por representaes documentrias intensifica essa
perda, considerada por Lara29 uma questo crucial do tipo: Como representar adequadamente as informaes sem comprometer o seu significado? ou Como resolver o problema da quase ausncia de articulao entre os descritores para a recuperao de informaes
veiculadas pelos textos?. As palavras so neutras. Elas assumem significados conforme
sua insero contextual. As palavras isoladas no significam nada, ou significam, virtualmente, tudo. a condio de referncia a determinados contextos que lhes confere significado.
Se considerarmos, como em Gomez30, que a busca de uma informao que seja
uma resposta pertinente e relevante s nossas perguntas requer, na modernidade, a reconstruo de um complexo cenrio onde sejam agregadas as populaes de fontes e canais de
informao de modo a permitir processos seletivos, organizados e econmicos de busca e
recuperao, tal reconstruo vai forosamente fazer uso de atalhos semnticos no sentido
clssico do processo operacional presente na idealizao das representaes documentrias.
Quer dizer, desconstruir o texto para reconstru-lo de forma reduzida. Sem dvida que ao
lado da reduo simblica fica configurada a reduo de significado. O paradoxo da produo de sentido no campo das memrias documentrias deve ser entendido como uma tenso necessria: reduzir informao para obter conhecimento.
Os produtos obtidos pelos processos de representao documentria, em seus vrios
graus de reduo semntica, quer sejam: o texto ou objeto na ntegra, resumos, referncias
bibliogrficas, ndices temticos ou notaes de classes sob as formas de codificaes textuais, imagticas, sonoras e digitais, organizadas em inventrios, catlogos, repertrios,
ndices, bibliografias vo ser disseminados sociedade em funo da sua demanda por
informaes.
Disseminao da Informao
31
32
No poderia ser diferente nos acervos de bibliotecas, arquivos, museus, como tambm no universo virtual das grandes redes de informao. Para este ltimo, hoje nos valemos de pginas de ndices temticos, organizadas em sistema hipertexto, que nada mais so
do que uma sucesso de filtros ou de atalhos pelos quais o usurio vai selecionando o caminho mais propcio localizao de uma dada informao. Tais atalhos visam, portanto, a
diminuir a ansiedade de informao, facilitando o acesso mais rpido aos contedos que
venham a satisfazer uma determinada necessidade de informao. Do ponto de vista das
instituies de memria, a disseminao no s o estgio final do ciclo de vida do documento, como a tarefa social de garantir o direito informao. Sem a disseminao o ciclo
total se rompe, impedindo as novas construes e a gerao de novos conhecimentos.
A meta-representao ou representao documentria, explicitada pelos modelos do
ciclo de vida da informao e do sistema de recuperao da informao (SRI), deve ainda
sofrer uma anlise, no sentido de ser isolado o conceito de linguagem de comunicao, em
especial o conceito de linguagem documentria, discusso que organizar o prximo captulo.
NOTAS E CITAES
1
MENDONA DE SOUZA, Alfredo, DODEBEI, Vera Lucia. Modelos e sistemas em Cincia da Informao. Rio de Janeiro, UFRJ/ECO, 1992. (Terceiro Seminrio apresentado diciplina Linguagem e Cincia
da Informao III).
HAGGETT, P., Chorley, R. J. Modelos, paradigmas e a nova Geografia. In: ________. Modelos scioeconmicos en Geografia. Rio de Janeiro: Livros Tcnicos e Cientficos / USP, 1975.
BURT, P. V. , KINNUCAN, M. T. Information models and modeling techniques for information systems.
Annual Review of Information Sciences and Technology. Holanda: Elsevier, v. 25
MARCONDES, C. H. , SAYO, L. F. Teoria Geral dos Sistemas: Sistemas de Informao Rio de Janeiro:
UFRJ/ECO, 1992. (Seminrio apresentado disciplina Linguagem e Cincia da Informao V, Curso de
Doutorado em Cincia da Informao)
10
LYYTINEN, K. Two views of information modelling. Information & Management, v. 12, n. 1, jan. 1987.
33
11
12
LANCASTER, F. W. Information retrieval systems: characteristics, testing and evaluation. 2. ed. New
York: Wiley, 1979.
13
14
15
16
17
Cf. MARCONDES, Carlos Henrique. Representao e economia da informao. Ci. Inf., Brasilia, v. 30, n.
1, p. 61-70, jan./abr. 2001.
18
FOUCAULT, Michel. A palavra e as coisas: uma arqueologia das Cincias Humanas. So Paulo: Martins
Fontes, 1994.
19
20
21
22
BECKER, Howard S. Apud. JARDIM, Jos Maria. Cartografia de uma ordem imaginria: uma anlise do
sistema nacional de arquivos. Dissertao de Mestrado em Cincia da Informao. Escola de Comunicao,
Universidade Federal do Rio de Janeiro, 1994. p.98
23
24
SPIRKIN, A.G. Origen del lenguaje y su papel en la formacio del pensamiento. In: Les theories de
laction. Paris, Hachette, 1972
25
26
GORSKY, D. P. Lenguaje y conocimiento. In: Pensamiento y lenguaje. Mexico: Grijalbo, 1966. p. 68-105.
RICHAUDEAU, F. Langage et action. In: LES THORIES de laction. Paris : Hachette, 1972.
27
Alguns lingistas e psiclogos contestam essa tese, principalmente os discpulos de Piaget, que deduziram
de seus trabalhos experimentais a pr-existncia do pensamento sobre a linguagem. Cf. Richaudeau, op. cit.
p. 208. No entanto, vale a pena investigar se os experimentos piagetianos so da ordem da ontognese apenas, ou se estedem-se tambm filognese.
28
29
LARA, Marilda Lopes Ginez de. Algumas contribuies da semiolologia e da semitica para a anlise das
linguagens documentrias. Ci. Inf. , Brasilia, v. 22, n. 3, p. 223-226, set./dez. 1993.
30
34
31
Na opinio de Claude Levi-Strauss, a diferena essencial entre sociedades com escrita e sociedades sem
escrita que as primeiras so pluralistas e contm sempre mais de um ponto de vista, mais de uma possibilidade de ao. As sociedades primitivas, ou sem escrita, tendem a ser monolticas; os modos de fazer vigentes no so postos em questo e a tradio fornece definitivamente o plano de como as coisas devem fazerse. O pluralismo cria tenso e debate e desencadeia o futuro. Cf. Mc GARRY, K. J. op. cit., p. 43, 44.
32
DODEBEI, Vera Lucia Doyle. Espaos mtico e imagtico da memria social. In: Memria e espao. Rio
de Janeiro: 7 Letras, 2000. p. 63-71.
33
LATOUR, Bruno. Redes que a razo desconhece: laboratrios, bibliotecas, colees. In: O poder das
bibliotecas: a memria dos livros no Ocidente. Rio de Janeiro: Editora UFRJ, 2000. p. 29
3 Lngua e Linguagem
36
37
38
ria8. Com base na anlise dessa literatura, arriscamo-nos a discutir o campo tericoconceitual e metodolgico das representaes documentrias, no de forma exaustiva mas,
ao contrrio, pontuando as reflexes nas relaes entre seus conceitos principais a fim de
destacar aqueles imprescindveis construo de seus produtos, em particular, das linguagens documentrias.
As operaes efetuadas nos documentos a fim de torn-los teis a uma pesquisa
documentria podem ser observadas sob dois aspectos: o primeiro relativo aos processos
que ocorrem na transformao do objeto em item documentrio, passvel de ser recuperado
da memria documentria; o segundo aspecto diz respeito aos produtos, quer sejam gerados por esses processos, quer sejam construdos para melhorar a comunicao entre usurio
e documento.
Considera-se como processos a anlise, a sntese e a traduo em cdigos documentrios. Destes, a anlise e a sntese vo constituir o que se denomina Anlise Documentria e a traduo ou processo de codificao documentria vai variar em funo do
objetivo especfico da criao de cdigos documentrios, isto : catalogao, classificao,
indexao ou condensao informativa. Os produtos gerados por esses processos so, portanto: catlogos, ndices e resumos. E os produtos construdos para melhorar a comunicao constituem as Linguagens Documentrias. O grfico abaixo representa uma das inmeras possibilidades de leitura deste campo de estudos. Sua construo teve por objetivo
principal organizar os conceitos j consagrados na literatura, apresentando as relaes existentes entre eles, quer sejam de subordinao ou paradigmticas, quer sejam de coordenao ou sintagmticas.
39
O grfico conceitual da Representao Documentria, organizado em facetas mutuamente exclusivas, no est completo, isto , no rene todas as possibilidades conceituais
deste domnio. A rede de relaes conceituais pode ser ampliada tanto no eixo paradigmtico, quanto no sintagmtico. No entanto, esta estrutura mnima j nos favorvel ao entendimento do lugar ocupado pelas linguagens documentrias no espao da representao,
o que nos vai permitir organizar a discusso com maior cuidado no que se refere, principalmente, ao emprego da terminologia.
A anlise da primeira faceta, ou os processos que concorrem para a realizao das
representaes documentrias, indica um campo de estudos importantssimo na compreenso da complexidade e da interdisciplinaridade das abordagens conceituais. O primeiro
deles, denominado de Anlise Documentria (AD), definido por Cunha9 como o estudo
do conjunto de procedimentos efetuados com o fim de expressar o contedo de documentos
sob formas destinadas a facilitar a recuperao da informao. A AD, embora no seja
um campo novo de interesse da Biblioteconomia e da Cincia da Informao, experimentou um desenvolvimento maior no Brasil, a partir de um grupo de pesquisa formado pela
Escola de Comunicao e Artes de Universidade de So Paulo, tendo como propsito dar
40
subsdios terico-metodolgicos prtica da codificao bibliogrfica, em especial indexao de documentos textuais. Nas palavras de Cunha10, esse procedimento de traduo
(tradicionalmente) realiza-se... com base no bom senso bibliotecrio, e envolve grande
nmero de pr-conceitos comuns rea de Biblioteconomia/Documentao. So eles: a
idia de que os textos/documentos a analisar/indexar so absolutos; que possvel chegar-se a palavras neutras; que o analista/indexador passivo; que o trabalho de anlise
documentria pode ser realizado sem o conhecimento da rea.
Essas observaes de Isabel Cunha, de fato, refletem uma importante questo da
intermediao nas representaes documentrias, isto , a familiaridade com o campo conceitual dos objetos sujeitos anlise. Nesse sentido, explicam-se as tentativas de frmulas
para a codificao dos textos e o peso que o ttulo dos documentos apresenta como segmento de maior valor semntico, principalmente quando o tempo despendido para efetuar a
codificao est na razo inversa da velocidade de alimentao da memria documentria.
A neutralidade, tanto do texto quanto do analista, muitas vezes imaginada como uma desculpa interveno no processo seletivo, o que, de resto, no contribui, em absoluto, para
melhorar a qualidade da oferta de informaes. Com maior ou menor nfase neutralidade
da anlise, fato que as etapas consideradas pela AD so realizadas, no plano lgico, por
toda a intermediao entre objeto e sua representao, seja qual for o cdigo escolhido.
Essas etapas so representadas pela leitura e posterior segmentao do texto em unidades
que sintetizam o contedo dos documentos. A expresso usada por Wanderley11 desconstruir o texto para referenciar o contedo reflete as etapas discutidas em profundidade por
Cunha12, que apresenta um quadro terico-conceitual da Anlise Documentria e outro de
seus modelos, onde se l a seguinte frase: leitura segmentao representao.
A leitura , assim, o incio dos processos de catalogao, classificao, indexao
ou condensao informativa de objetos. Cintra13 argumenta que na leitura para fins documentrios o princpio da cooperao autor/leitor rompido uma vez que o autor no previu
o documentalista como leitor. Portanto, a intermediao presente no ato de ler cria mais um
universo retrico a ser considerado o do analista, alm daquele existente para o autor, e
aquele existente para o leitor objeto da criao do texto. Esses universos retricos ou tbuas14 de conhecimentos formam um quadro de referncias necessrio no s segmentao do texto como sua reconstruo, como diz Cunha15, remontagem do discurso. Outros aspectos que devem ser considerados so a capacidade preditiva do leitor que extrai do
41
texto mais do que est expresso lingsticamente, graas s aoes mentais estruturadas e as
estratgias de leitura adotadas e, contrariamente, a tendncia natural de reduzir o cenrio
para reter as informaes principais. A incluso das estratgias de leitura, tanto textuais
como imagticas16, no mundo das representaes documentrias parece ser de vital importncia qualidade da memria documentria e eficcia do sistema de recuperao das
informaes.
A segmentao do texto objeto da AD pode ser considerada a sntese da leitura, fase
que antecede da codificao. Nesta etapa, o analista pode valer-se dos fundamentos da
sintaxe ou da semntica. No que se refere anlise automtica de textos, Coulon17 indica
que as pesquisas que visam a associar a informtica ao processamento de textos podem ser
classificadas em quatro fases: fase estatstico-morfolgica (1945-1955); fase sinttica
(1955-1070); fase lgica (1963- ); e fase cognitiva (1974-
uma evoluo de abordagens que indicam os graus de complexidade da tecnologia de segmentao de textos, ou seja: anlise morfolgica (lxico) anlise sinttica (estrutura)
interpretao lgica das estruturas sintticas (semntica) anlise conceitual (simulao). Essa ltima fase representa os esforos conjuntos da psicologia cognitiva e da informtica (inteligncia artificial) na soluo da representao automtica do conhecimento.
Os processos de atribuio de cdigos ou rtulos aos segmentos da leitura documental, como denominou Lancaster, podem ser discutidos sob o aspecto normativo. Quer
dizer que eles se dividem em dois universos: os processos que se abstm de orientaes
normativas e os que se valem das estruturas dos cdigos para controlar as funes sintticas e semnticas da lngua natural. Os primeiros so nomeados de indexao livre, indexao natural, indexao por palavras-chaves (no sentido de extrato empregado por Coyaud),
pois utilizam as palavras naturais, encontradas no texto, como pontos de acesso ao contedo. Essa modalidade de indexao a utilizada como parte integrante de compndios e
manuais tcnicos e objetiva a localizao de conceitos, assuntos, nomes de pessoas ao longo da exposio. A indexao natural usada tambm com o objetivo de localizao de um
objeto na memria documentria, porm sofre todos os tipos de restrio dos sistemas abertos de comunicao dos quais a lngua natural a principal representante. O segundo
universo representado pelos processos de catalogao, classificao e indexao que
utilizam instrumentos normalizadores das representaes, a partir de regras sintticas e
semnticas. No nos cabe neste trabalho analisar tais processos em profundidade, mas to
42
43
a dupla articulao19.
Hughes citado por Nocetti e Figueiredo20 define a lngua natural como um sistema
de smbolos vocais arbitrrios pelos quais o pensamento transmitido de um ser para o
outro, podendo ser entendida dos pontos de vista:
sistmico cdigo ou conjunto de regras em que cada item o que em virtude de seu lugar no sistema. Poderamos ter como exemplo as duas frases seguin-
44
tes, que, embora sejam constitudas pelos mesmos smbolos, podem ter significado diferente.
O menino l alto (l em voz alta)
O menino alto l (o menino alto)
arbitrrio No h necessidade intrnseca de que cada palavra signifique o
que significa, ou para que cada lngua tenha a estrutura que tem.
ex:
vocal formada pelos sons produzidos pelos rgos da fala dos seres humanos.
simblico o poder de simbolizar e de distinguir smbolos um pr-requisito.
meditico (representao do pensamento) a forma de representar as idias.
De acordo com Cintra21, a prtica da linguagem marcada por uma tendncia natural do homem de compreender, governar e modificar o mundo. Essa necessidade de dominar os fenmenos sociais implica em dois processos, o de apreenso e o de compreenso.
O primeiro pode ser representado por uma catalogao do mundo e o segundo pela sua
hierarquizao. Esses dois processos indicam a arbitrariedade da lngua, uma vez que
desde a fase de nomeao, caracterstica do desenvolvimento da espcie humana, a funo
classificatria se fez presente. O fato de atribuir um smbolo a um referente j o isola conceitualmente de outros referentes. Como a memria documentria formada, preponderantemente, por documentos textuais, as principais questes apontadas para a eficcia dos processos de representao documentria repousam na criatividade, arbitrariedade e simbolismo da lngua natural, o que vai gerar alternativas de escolha no processo de traduo e de
codificao. Essas alternativas de escolha podem ser representadas pela caracterstica de
disperso da LN que vai dificultar a eficcia do processo comunicativo restrito recuperao da informao documentria. A disperso na LN pode ser classificada por: disperso
45
As LD, a par de guardar uma relao estreita com a lngua natural, de vez que possuem um vocabulrio ou lxico documentrio e uma estrutura ou sintaxe, representam o
contedo informativo de um documento, operando por anlise e sntese. Quer dizer, a lingua natural traduzida para uma linguagem sinttica - descritores - a qual, retida na memria do catlogo tradicional ou da mquina, significa economia verbal, economia de smbolos, economia de espao. Mas, certamente, significa tambm economia de significado.
Do ponto de vista dos fundamentos tericos da Comunicao ao nosso propsito de
estabelecer as relaes entre LN e LD, identificamos no discurso de Umberto Eco em Semitica e Filosofia da Linguagem22 alguns conceitos que, de certo modo, dominam as discusses semiticas, principalmente sob a perspectiva da filosofia. So eles: signo e significado, smbolo e cdigo.
Eco v o mundo como fato de cultura, uma mensagem a desvendar e considera que
todos os fenmenos de cultura podem ser vistos como fatos de comunicao, para os
quais as mensagens isoladas se organizam e se tornam compreensveis em referncia a cdigos. Partindo da suposio do mundo como um fenmeno semitico, Eco procura identificar na histria da filosofia a discusso sobre a lngua e outros sistemas de signos e mediante essa releitura, afirma que cada grande filsofo do passado elaborou, de alguma forma, uma semitica. Dos esticos a Cassirer, dos medievais a Vico, de Santo Agostinho a
Wittgenstein, todos abordaram os sistemas de signos. Mas com Aristteles que a idia de
ser percebida como expresso de vrios modos, ou que o ser o que a linguagem expressa de muitas maneiras. Usando a figura que viria a ser mais tarde conhecida como o trin-
46
gulo semntico de Ogden e Richard, Eco rel semioticamente alguns filsofos: onde Y
uma expresso, Z uma coisa ou estados de coisas e X o significado.
Para Plato o Z era uma experincia do mundo, mas efmera e enganosa, dotada de
"realidade" apenas enquanto imitao de uma realidade situada no mundo das idias; para
Aristteles era uma susbtncia primeira, em toda a sua concretude; para os esticos era
um corpo. Para Plato o X era um conceito; para Aristteles, uma disposio da mente;
para os esticos uma criao do esprito humano. Embora a definio dessas entidades
mudasse segundo o contexto filosfico, a diferena entre significado e referncia foi de
algum modo enunciada.
Para Ogden e Richard o Y o smbolo, o Z o referente, o X a referncia. No que concerne semiologia s interessa o lado esquerdo do tringulo pois, o problema do referente no tem pertinncia, uma vez que existem smbolos que possuem uma referncia e
no tm referente (como o unicrnio, que se refere a um animal fantstico, mas inexistente). H ainda smbolos diferentes, com significado diferente, que dizem respeito ao
mesmo referente (Vnus, como estrela-da-manh e estrela-da-tarde, ou ainda as expresses "meu padrasto" e "o pai de meu meio-irmo").
J Peirce, ao entender o signo como alguma coisa que est para algum em lugar de
outra, sob algum aspecto ou capacidade, trata essas relaes numa estrutura tridica, que
lembra o tringulo richardsiano onde, alterando as conceituaes saussurianas de significante e significado, introduz a idia do Interpretante. Onde o Y o smbolo ou "representmen", o Z o objeto que representa e o X interpretante (tese essa mais prxima de Aristteles e dos esticos). A idia do interpretante, como diz Eco, pode ser identificada com o
significado, mas a hiptese mais fecunda a que v o Interpretante como uma outra repre-
47
sentao relativa ao mesmo objeto, numa cadeia de semiose ilimitada, uma vez que para
estabelecermos o que seja o interpretante de um signo necessrio design-lo mediante
outro signo, o qual tem por sua vez outro interpretante, designvel por outro signo, e assim
por diante.
Esse crculo vicioso se d em relao aos diversos contextos ou culturas a que o significante se direciona, como por exemplo o significado do significante vaca para o hindu
ou os significantes beleza, unicrnio e Deus. Esta relao cultural provoca na mente do
indivduo o interpretante, existindo, portanto, diferentes interpretantes a partir do contato
com um cdigo ou cultura. Assim, com base num dado cdigo, um significante denota um
significado num certo grau de extenso e, ainda, conota um significado em relao ao prprio cdigo. A relao de conotao se estabelece quando um par formado pelo significante e pelo significado denotado, conjuntamente, se torna o significante de um significado
adjunto. O termo co, por exemplo, denota certo tipo de animal, mas para o italiano tambm conota "mau tenor". A relao entre smbolo e referncia estudada em profundidade, uma vez que dessa relao que ocorrem os fenmenos de significao. A relao
entre smbolo e significado pode mudar, crescer, deformar-se; o smbolo permanece constante e o significado torna-se mais rico ou mais pobre. A esse processo dinmico e contnuo Eco denomina sentido.
A lngua natural (LN) faz parte desse modelo comunicacional "aberto", onde a mensagem varia conforme os cdigos. Estes so postos em pauta conforme as ideologias e circunstncias, e todo sistema de signos se reestrutura continuamente com base na experincia de decodificao que o processo institui como semiosi in progress. O processo de comunicao se d, portanto, quando o indivduo reduz o que pensa e quer a um sistema de
convenes comunicativas, ou seja, quando o que pensa e quer socializado. O sistema de
saber, por sua vez, tem que se transformar em um sistema de signos, onde a ideologia soci-
48
alizada se torna cdigo. Nasce assim uma estreita relao entre o mundo dos cdigos e o
mundo do saber preexistente, onde esse saber torna-se visvel, controlvel, quando se faz
cdigo, conveno comunicativa.
LN atribudo um sistema de signos compreendido pelo que se designa de gramtica. Para Eco a gramtica composta da sinttica, da semntica e da pragmtica. A sinttica diz respeito ao sentido estrutural da lngua e envolve a morfologia e a sintaxe. A
semntica se ocupa do sentido lexical e a pragmtica do sentido situacional. Esta ltima, a
pragmtica, segundo Bar-Hidel citado por Eco23
o estudo da dependncia essencial da comunicao, em linguagem natural, do
falante e do ouvinte, do contexto lingstico e do contexto extralingstico e da disponibilidade dos conhecimentos fundamentais, da prontido em obter esse conhecimento fundamental e da boa vontade dos participantes do ato de comunicao.
Essa classificao da gramtica, impe apenas uma diferena quela feita por Saussure24, ao afirmar que tudo o que compe um estado de lngua pode apenas ser reduzido a
uma teoria dos sintagmas e a uma teoria das associaes. Tal diferena diz respeito ao nvel
de extenso das relaes entre os conceitos, isto , as relaes sintagmticas e as relaes
associativas (ou paradigmticas) implicam a sintaxe (incluindo a morfologia) , a semntica
e a pragmtica. Sem dvida que no modelo de semiose, a pragmtica exerce um importante papel no sucesso da comunicao pois, somada semntica, vai possibilitar o aparecimento do significado contextual, em detrimento apenas do significado lexical.
Nesse sentido, Eco utiliza uma metfora muito interessante para analisar a gramtica da LN e que corresponde a dois modelos: o do dicionrio e o da enciclopdia. Do ponto
de vista da representao da LN como um dicionrio, o conceito de estrutura classificatria
utilizado, na qual os significados de cada palavra so impostos por sua posio num esquema arborescente composto de gneros e espcies. Assim que /casa/ um tipo de moradia; /macieira/ um tipo de rvore frutfera que, por sua vez uma espcie de rvore.
Esse tipo de representao pressupe o uso de estruturas hierrquicas rgidas que consideram as propriedades conceituais, atributivas e necessrias dos objetos. Do ponto de vista da
representao enciclopdica, a LN pode se analisada como uma rede de relaes infinitas
que faz maior uso de propriedades factuais, descritivas ou acidentais dos objetos. Se para o
modelo de dicionrio h um consenso e uma finitude conceitual, para a enciclopdia h um
49
50
tre as palavras. Para as primeiras, o conceito de hierarquia est sempre presente pois, o significado de cada palavra traz consigo a sua insero em uma classe de objetos, inferindo-se
da a posio da palavra na ordem de gneros e espcies: /rvore/ supe /vegetais/ e tambm /macieira/. Para as relaes sintagmticas, a reunio de palavras representa a busca de
um sentido, isto , classes distintas de palavras que intencionalmente reunidas vo compor
uma mensagem: /rvore/ e /madeira/ e /casa/ e /incndio/ e ... Essa reunio da natureza de
redes, representada pela possibilidade infinita de combinaes entre as palavras, enquanto
as inferncias nas relaes paradigmticas so finitas, contidas numa escala entre o maior
gnero e a menor espcie. Esses so os sentidos de ordem/hierarquia e de desordem/rede.
Vale ressaltar que a idia de enciclopdia ligada desordem e portanto rede, simboliza a
forma como os temas so reunidos circunstancialmente ou pragmaticamente, a partir de um
roteiro, como uma das inmeras possibilidades de anlise do conhecimento.
Todas as LD incluem, em maior ou menor grau, as imagens de hierarquia e rede, o
que torna complexa uma classificao segundo esses critrios. No entanto, isolando-se alguns atributos compartilhados pelas principais LD, pode-se tentar compreend-las sob essa
nova perspectiva, ao menos no que se refere s suas propostas de utilizao no espaotempo. Os trs momentos que se seguem devem ser compreendidos como segmentaes
arbitrrias e, portanto, circunstanciais, na anlise das LD, no significando que os atributos
utilizados para a classificao sejam mutuamente exclusivos.
1 momento: domnio
A classificao tradicional das LD isolava dois atributos, at ento, considerados
antagnicos: universal, correspondendo a redues da totalidade do conhecimento e especializada, representando a totalidade de alguns domnios do conhecimento. No primeiro,
encontram-se as classificaes bibliogrficas universais, os macrotesauros, as listas de cabealhos de assunto construdas com base nas classificaes universais; no segundo atributo, os tesauros, as classificaes e listas de assuntos de domnios especficos. Do ponto de
vista da condio hierrquica dessas linguagens, a dicotomia universo/espcie verdadeira.
Quanto s suas redes de relaes associativas ou sintagmticas, a totalidade/especialidade
fica comprometida, uma vez que no se consegue analisar um aspecto do conhecimento
sem envolv-lo com as circunstncias nas quais ele ocorre. Nesse caso, o modelo da enciclopdia como roteirizao de um domnio mais adequado pois implica, ao mesmo tem-
51
po, a idia de todo e tambm a de parte. como se do todo escolhssemos uma poro
nuclear e, a partir dela, estabelecssemos as relaes necessrias com esse todo. Por exemplo: se o meu interesse sobre /energia nuclear/ qual a rede de relaes necessrias para
efetuar uma moldura, um roteiro de anlise dessa poro do todo? Certamente, vrios aspectos presentes no todo, tais como: fsica, qumica, biologia, economia, religio, educao ... Em vez de efetuar-se simplesmente um recorte do universo, construi-se uma rede de
referncias que deve estar representada na lngua natural (escrita e oral) e na metalnguagem documentria.
2 momento: objeto
Tem-se por certo que as LD podem estruturar-se por conceitos, isto , por abstraes de objetos representados por um smbolo da lngua natural, de carter unvoco e restrito, ou por assuntos, que definiramos como a representao da soma de vrios conceitos.
Tradicionalmente, as LD foram concebidas a partir da anlise dos assuntos presentes na
literatura, portanto a unidade referencial das classes e subclasses era formada por prcoordenaes conceituais. Do mesmo modo, as Listas de Cabealhos de Assunto adotaram
este mesmo princpio, j que seu objetivo o de codificar, por palavras, o que a Classificao havia codificado com a notao. A noo de conceito como unidade estrutural das LD
surge com a proposta de Ranghanathan seguida por Sayers, Bliss, Mills e os trabalhos do
Classification Research Group, culminando, na atualidade, com um campo de estudos denominado Organizao do Conhecimento cuja base terica repousa na Teoria Analtica
do Conceito de Ingetrat Dhalberg27. As LD mais representativas das estruturas pscoordenadas, isto , estruturas que se formam por relaes conceituais e no por relaes
de assuntos, so as classificaes facetadas e os tesauros. Wanderley28 , discute a correlao dessas estruturas, com base no modelo de Gardin para os lxicos documentrios, distinguindo-os em classificaes unidimensionais e pluridimensionais, conforme se estruturam numa s, ou em mais de uma dimenso. Por dimenso de uma organizao, explica o
autor, entende-se a natureza das relaes analticas, paradigmticas, que a constituem, ou,
em outras palavras, da relao dos termos classe a que pertencem. As unidimensionais
podem ser representadas pelos sistemas taxonmicos no estilo das Cincias Naturais, onde,
de fato uma s relao informa todos os nveis: reino classe subclasse ordem
subordem famlia gnero espcie nome comum, quando se diz que so unidi-
52
mensionais reais. Para aquelas em que a multiplicidade se esconde em uma unidade, como
o caso das classificaes decimais (ex: Dewey Decimal Classification CDD), diz-se que
so unidimensionais aparentes. As pluridimensionais renem as organizaes semnticas
(essncia, definies) e as sintticas (acidentes, funes) e so denominadas de classificaes facetadas (Colon Classification). Wanderley inclui, ainda, o conceito de mistas, no
qual se inserem as classificaes que alternam os pontos de vista essenciais e funcionais, e,
entre elas os esquemas ditos analtico-sintticos (Decimal Universal Classification CDU),
tais como o concebe Gardin. Desta proposta de anlise das estruturas de classificaes
bibliogrficas nota-se a que a preferncia da organizao pluridimensional denota uma
tendncia de considerar o conceito, perspectivado pelos vrios domnios do conhecimento,
como a unidade principal e necessria representao documentria.
3 momento: ordem
Se a ordem nica representada pelas taxonomias, como no caso das cincias naturais, ou as aparentes estabelecidas pelas LD que hierarquizam assuntos, no nos servem
para estabelecer as representaes, ao mesmo tempo, essenciais e funcionais dos objetos
que nos so indicados pela pragmtica, no sentido de efetuar a plenitude da semiose, devemos nos valer ento da multiplicidade de ordens, conforme os ns da rede de conhecimentos que queremos representar. Partindo do suposto de que a Rede de Conhecimentos
que vai indicar a melhor organizao de sua representao, a constituio das LD vai pressupor a identificao e a segmentao do domnio do conhecimento, a fim de poder efetuar
a anlise de seus conceitos chaves. Se a literatura monogrfica foi a nica responsvel pelo
desenho das classificaes unidimensionais, cujo objetivo principal era o do arranjo fsico
dos documentos e da recuperao do todo temtico, e a literatura peridica proporcionou o
surgimento de LD especializadas, de cunho semntico, como foi o caso dos tesauros meramente alfabticos, a produo do conhecimento armazenada na memria documentria
da atualidade vai necessitar de instrumentos que no s delimitem campos conceituais, mas
que os organize em segmentos hierrquicos. As listas de cabealhos de assunto, como espelho da estrutura classificatria utilizada na organizao de acervos da memria documentria, s tm sua sobrevivncia assegurada pelo domnio que os grandes acervos bibliogrficos impem como paradigmas, por exemplo, a biblioteca do congresso americano (Library of Congress). Nesse caso, o domnio est dado pela ideologia de acumulao da insti-
53
tuio, o que significa que as pr-coordenaes conceituais existentes na linguagem, embora de fcil acesso por estarem prontas ao uso, no so adequadas a outras perspectivas de
anlise. A escolha ou construo de um roteiro situacional vem a ser a tarefa mais complexa da constituio de linguagens documentrias e os tesauros, assim como as classificaes
bibliogrficas (facetados) construdos com base nesses pressupostos, so as linguagens que
podem orientar com maior eficincia os processos de representao da informao.
Resta, ainda, discorrer como as LD operam no quadro das representaes documentrias, vistas como linguagens de comunicao entre a informao documentria e o usurio que dela necessita. Para Maria Cristina Pinto29, as LD atuam nos sistemas de recuperao de informaes em dois nveis: orientando o analista sobre quais os melhores termos
para representar o assunto de um documento, e orientando o pesquisador sobre a escolha
dos termos que corresponderiam representao do assunto por ele procurado. Essas orientaes vo desde o simples controle semntico de termos sinnimos at a construo de
complexas redes pragmticas de referncias cruzadas, dando ao usurio outras opes de
busca em relao ao assunto procurado. Correspondem, portanto, s linguagens documentrias as seguintes funes:
a) organizar o campo conceitual da representao documentria, pois, segundo La30
54
55
56
Notas e citaes
1
COYAUD, M. Linguistique et documentation: les articulations logiques du discours. Paris: Larousse, 1972.
173 p.p. 130
Neste trabalho, usaremos a expresso /lngua/ com o sentido de lngua natural e /linguagem/ para linguagens
de comunicao. Sobre as diferenas semnticas entre lngua e linguagem Martinet afirma que, h meio sculo, as definies de linguagem vm apresentando uma certa coerncia, pois partem todas do princpio de que
a linguagem um sistema de signos utilizados para estabelecer a comunicao. Mas, o autor estabelece uma
oposio entre lngua e linguagem. A lngua definida pelo carter vocal, a linearidade e a dupla articulao,
e a linguagem um conceito mais vasto identificado com o sistema de signos que permite efetivar a comunicao. Saussure, por sua vez, alm de distinguir lngua e linguagem, observa que lngua (langue) e fala (parole) so partes de um todo que a linguagem. A primeira se situa no campo social e a segunda na esfera do
indivduo. Cf. NOCETTI, Milton A., FIGUEIREDO, R. C. Lnguas naturais e linguagens documentrias:
traos inerentes e ocorrncias de interao. R. Bibliotecon. Braslia, v. 6, n. 1. p. 23-37.
LANCASTER, F. W. Indexo e resumos: teoria e prtica. Braslia: Briqut de Lemos, 1993. p. 15-17.
GROLIER, Eric de. tude sur les catgories gnrales applicables aux classifications et codifications
documentaires. Paris : UNESCO, 1962. p. 262.
CUNHA, Maria Isabel R. Ferin. Do mito anlise documentria. So Paulo: EDUSP, 1990. (Tese de
doutorado) p. 59
10
11
12
CUNHA, Maria Isabel R. Ferin. (Coord.) Anlise documentria: consideraes tericas e experimentaes.
So Paulo: FEBAP, 1989. p. 28 e 29
13
CINTRA, Ana Maria Marques. Estratgias de leitura em documentao. In: SMIT, Joahanna W. (coord.)
Anlise documentria: a anlise da sntese. Braslia: SCT-PR/CNPq/IBICT, 1898. p. 30-38.
14
Cf, ECO, Umberto. A estrutura ausente: introduco pesquisa semiolgica. So Paulo: Perspectiva, 1991.
15
16
SMIT, Johanna, W. A anlise da imagem: um primeiro plano. In: Anlise documentria: consideraes
tericas e experimentaes. So Paulo: FEBAP, 1989. p. 102-113
57
17
COULON, Daniel, KAYSER, Daniel. Informtica e linguagem natural: uma viso geral dos mtodos de
interpretao de textos escritos. Braslia: SCT-PR/CNPq/IBICT, 1992. p.11
18
NOCETTI, Milton A., FIGUEIREDO, R. C. Lnguas naturais e linguagens documentrias: traos inerentes
e ocorrncias de interao. R. Bibliotecon. Braslia, v. 6, n. 1. p. 23-37.
19
Vrias correntes da lingstica contempornea reconhecem uma dupla articulao da lngua. Na lngua,
articulam-se entre si unidades de primeira articulao, dotadas de significado (a lngstica europia
chama-as monemas e a lingstica norte-americana, morfemas) e identificveis, embora nem sempre, com a
palavra. Tais unidades combinam-se entre si e formam unidades mais vastas chamadas sintagmas. Mas as
unidades de primeira articulao, que podem ser numerosssimas no interior de uma lngua, como o
demonstram os dicionrios, constroem-se combinando entre si unidades de segunda articulao, os
fonemas, dotados de valor diferencial uns em relao aos outros, mas desprovidos de significado. Cf.
MARTINET, apud ECO, Umberto. A estrutura ausente: introduco pesquisa semiolgica. So Paulo:
Perspectiva, 1991. p. 32.
20
21
CINTRA, Ana Maria Marques et al. Para entender as linguagens documentrias. So Paulo : Polis : APB,
1994. p. 18
22
23
24
SAUSSURE, Ferdinand de. Curso de Lingstica geral. So Paulo: Cultrix, 1974. p. 136-139.
25
26
27
28
WANDERLEY, M.A . Linguagem documentria: acesso informao. Ci. Inf., Rio de Janeiro, v. 2, n. 2. p.
175-217, 1973. p. 204
29
PINTO, Maria Cristina Mello Ferreira. Anlise e representao de assuntos em sistemas de recuperao da
informao; linguagens de indexao. R.. Esc. Bibliotecon., UFMG, Belo Horizonte, v. 14, n. 2 p. 169-186,
set. 1985.
30
LARA, Marilda Lopes Ginez de. Algumas contribuies da semiolologia e da semitica para a anlise das
linguagens documentrias. Ci. Inf. , Brasilia, v. 22, n. 3, p. 223-226, set./dez. 1993
31
Voltaremos a esta questo posteriormente, quando da anlise das fontes para a construo de tesauros.
32
33
Shera ressalta dois objetivos principais do catlogo de biblioteca: inventrio e recuperao da informao,
sendo que o ltimo a sua funo mais importante.
34
LESKA, B. M. Theoretical and methodological problems of therminology In: PROCEEDINGS of
international symposium, Nov. 27-30, 1979, Warsaw.
58
Um pouco da histria
59
Segundo Vickery1, a palavra tesauro (latim = thesauru, grego = thesaurs) teve origem na Grcia significando Treasury or Storehouse (tesouro ou armazenagem / repositrio), sendo que em 1936 o Oxford English Dictionary definiu a expresso inglesa como um
dicionrio, enciclopdia e similares. Em 1852, Peter Mark Roget publicou o Thesaurus of
English Words and Phrases, uma coleo de termos organizada no em ordem alfabtica,
como em um dicionrio, mas de acordo com as idias que expressavam. O objetivo de tal
estrutura era o de encontrar as palavras pelas quais as idias pudessem ser mais bem expressas em textos.
pretendia, com aquela obra, facilitar sua atividade literria. Levou nesse trabalho cerca de
50 anos. Argumentava Roget que o propsito de um dicionrio comum simplesmente
explicar o significado das palavras, mas o problema para o qual ele pretendia oferecer a
soluo poderia ser apresentado assim: sendo dada uma palavra, pode-se encontrar seu
significado ou a idia que ela pretende trazer consigo, em um dicionrio. Mas, ao contrrio:
tendo-se uma idia, qual/quais palavras podem melhor expressar seu significado? Com esse
objetivo, as palavras e frases da lngua foram arranjadas no Rogets Thesaurus no de acordo com seu som ou ortografia, mas estritamente de acordo com seu significado.
Peter Mark Roget organizou as palavras da lngua inglesa em seis categorias conceituais: relaes abstratas espao matria intelecto volio afeies. Essas categorias foram subdivididas em classes, que por sua vez foram divididas em sees, subsees e
conceitos isolados, tal como no recorte abaixo:
Classe 1 - Palavras que expressam Relaes Abstratas
Seo 1 - Existncia
1.1. Ser, no abstrato
1.1.1. Existncia
1.1.2. Sem existncia
1.2. Ser, no concreto
1.3. Existncia Formal
1.4. Existncia modal
1.5. etc.
60
VERB: EXIST, be; have being &c. n.; subsist, live, breathe, stand, obtain, be the case; occur
(event) [See Eventuality]; have place, rank, prevail; find oneself, pass the time, vegetate.
come into existence &c. n.; arise (begin) [See Beginning]; come forth (appear) [See
Visibility].
BECOME (be converted) [See Conversion]; bring into existence [See Production];
coexist, postexist [rare], prexist [rare].
CONSIST IN, lie in; be comprised in, be contained in, be constituted by.
ABIDE, continue, endure, last, remain.
ADJECTIVE: EXISTING &c. v.; existent, subsistent, under the sun; in existence &c. n.; extant; afloat,
on foot, current, prevalent; undestroyed.
REAL, actual, positive, absolute; factual, veritable, true [See Truth]; substantial, substantive; self-existing, self-existent; essential, bent.
WELL-FOUNDED, well-grounded; unideal, unimagined; not potential [See
Nonexistence]; authentic.
ADVERB: ACTUALLY &c. adj.; in fact, in point of fact, in reality; indeed; de facto [L.], ipso
facto [L.].
QUOTATIONS:
1. Ens rationi.
2. cogito ergo sum.
3. Thinkst thou existence doth depend on time?Byron
4. All is concenterd in a life intense.Byron
5. To live is not merely to breathe, it is to act.Rousseau
6. The mainspring of life is in the heart.Amiel
7. I came like Water, and like Wind I go.Omar KhayymFitzgerald
61
tela. O campo ou domnio desse tesauro a lngua inglesa e seu propsito continua a ser
aquele imaginado por Roget ou seja, o de auxiliar na escolha de uma expresso que melhor
reflita o conceito existente na mente do escritor. Por outro lado, como concepo, o modelo do RogetThesaurus utilizado no ensino da lngua inglesa, em pesquisas de natureza
lingstica e filolgica, jogos e lazer, propaganda e marketing de empresas comerciais.
No Brasil, alm das iniciativas comentadas por Gomes, descobrimos uma obra intitulada Dicionrio inverso4, cujo objetivo era o de proporcionar maior facilidade de consulta aqueles que se dedicam arte-cincia educativa e recreativa das palavras cruzadas e
das charadas e enigmas em geral. A sua ordenao deve ser vista sob o prisma inverso dos
lxicos usuais - do significado para a palavra que o expressa. Embora este lxico (elaborado somente at a letra B) seja distinto do tesauro de Roget quanto ao uso, os dois tm em
comum o fato de organizarem os significados em detrimento dos smbolos utilizados na
linguagem natural para represent-los.
A partir de 1940, o termo tesauro comeou a ser utilizado na esfera da Cincia da
Informao e, em especial, no processo de recuperao da informao, como sendo um
instrumento capaz de transportar conceitos e suas relaes mtuas, tal como expressos na
linguagem dos documentos, em uma lngua regular, com controle de sinnimos e estruturas
sintticas simplificadas. Ainda segundo Gomes, o tesauro documentrio surgiu da necessidade de manipular grande quantidade de documentos especializados. Era preciso trabalhar
com vocabulrio mais especfico e com uma estrutura mais depurada do que aquela presente nos cabealhos de assunto (remissivas e referncias cruzadas tipo ver e ver tambm).
Assim, alm da especificidade, cuidou-se de melhorar a estrutura, e as referncias cruzadas
(ver tambm) deram lugar s relaes hierquicas (paradigmticas) e associativas (sintagmticas). Pelo fato desse novo instrumento da documentao possibilitar, atravs do agrupamento dos termos, o acesso a uma idia, mesmo sem saber nome-la de sada, as novas
listas estruturadas de termos passaram a ser chamadas de tesauros, por analogia com a obra
de Roget, embora com a funo de indexar/recuperar informao. E a esto presentes as
duas grandes caractersticas do tesauro de documentao: os conceitos, representados por
termos (descritores ou preferidos) e as relaes entre eles.
O desenvolvimento acelerado dos tesauros documentrios se deu mediante vrios
aspectos. Luhn5 ressaltou a possibilidade de automatizar a indexao, onde tal instrumento
se fazia necessrio dado que a passagem de palavras de texto para palavras-chaves s pode-
62
ria ser obtida por processos automticos se as associaes de palavras fossem previamente
armazenadas em uma memria. Bernier e Heumann6 propuseram o uso do tesauro com o
sentido de coincidir os vocabulrios de uma solicitao de pesquisa com o do sistema de
recuperao de informaes, formando trs tipos de ajuda: restrio do nmero de palavras-chaves, lista classificada de termos e definies de palavras-chaves. Wall7 listou alfabeticamente as palavras-chaves, provendo-as de referncias cruzadas dos seguintes tipos:
sinnimos, termo genrico, termo especfico e termo relacionado. A caracterstica de abrangncia no uso de relaes entre os termos foi enfocada por M. Taube8, que props um
esquema de associaes entre o termo a indexar com outras palavras-chaves que pudessem
ser relevantes e utilizadas tanto para a indexao como para a recuperao de informaes.
Heald9 descreveu o tesauro como um instrumento dividido em duas partes: a primeira
uma lista alfabtica de palavras-chaves e referncias cruzadas para indicar a hierarquia de
conceitos, e a segunda a prprio estrutura hierrquica, apresentando as categorias ou facetas do vocabulrio. Por fim, a UNESCO10 define o tesauro com sendo vocabulrio controlado e dinmico de termos relacionados semntica e genericamente, que cobre de forma
extensiva um campo especfico do conhecimento e a COSATI11 como uma recompilao
de termos selecionados com as apropriadas relaes mtuas e expostos de maneira a obter
mxima coerncia na descrio de conceitos para a confeco de ndices ou recuperao de
informaes.
O emprego de tesauros nas tarefas de indexao e recuperao de informaes tenta
resolver o problema da alocao de documentos em classes de assuntos, no s por sua
capacidade de controlar o vocabulrio, mas porque um instrumento que relaciona os descritores/termos de forma mais consistente, apresentando uma estrutura sinttica simplificada e uma complexa rede de referncias cruzadas. Isto permite ao especialista localizar com
mais facilidade a palavra-chave requerida para uma busca. Apresenta, ainda, um relacionamento lgico e hierrquico dos descritores, o que contribui para a indexao dos documentos ao nvel especfico e/ou genrico (modulao). Segundo Foskett12, o principal objetivo do tesauro o de controle terminolgico e, em concordncia com Lancaster13, lista
suas principais funes: controlar sinnimos e quase sinnimos; distinguir homgrafos;
facilitar a conduo da busca por meio dos termos relacionados e das referncias cruzadas
(estrutura sinttica), melhorando a consistncia da indexao e transportando a linguagem
63
64
65
quando a terminologia levantada a partir de fontes secundrias, isto , de outras linguagens documentrias, deve-se ter em mente as diferenas conceituais entre termos j estruturados e os significados destes presentes na comunicao em linguagem natural. Normalmente, uma classificao bibliogrfica construda pelo mtodo hierquico apresenta termos
estruturados em assuntos pr-coordenados, merecendo, portanto, a anlise conceitual que
transformar um assunto numa soma de conceitos principais.
Embora existam classificao facetadas que estruturam os conceitos e no os assuntos, ainda assim os conceitos e idias muitas vezes no esto explicitados numa forma verbal correta. Como exemplifica Gomes, a sntese conceitual se d apenas na notao:
Nq Instalao de esgoto
Nq2 Esgoto sanitrio
66
Mtodo consensual
A obteno da terminologia se faz por consenso de peritos no assunto, mediante a
formao de comits para discusso acerca dos termos que iro compor a estrutura do lxico documentrio e tendo como justificativa a garantia dos produtores e utilizadores do sistema de informao; da decorre um processo de deduo das espcies a serem includas, a
partir da definio, baseada no conhecimento, das classes gerais ou facetas principais. O
mtodo chamado tambm de Gestalt, em contraposio a Analtico; Estalactite, em contraposio a Estalagmite; ou ainda Commitee Aproach, em contraposio a Emprico.
Os mtodos Emprico e Consensual derivam, por sua vez, de dois princpios que
regem o levantamento dos termos e que so, respectivamente, a Garantia Literria e o Endosso do Usurio.
Garantia literria
A expresso Garantia Literria (Literary Warrant ou Bibliographic Warrant) foi
usada por Wyndhan Hulme19 em 1911, que defendia que a determinao de classes na
construo de linguagens documentrias no deveria ser baseada na classificao do conhecimento e sim nas classes em que existe literatura; isto , as caractersticas da literatura
em si que determinam as classes definidas no sistema. Foskett20 assume o princpio da
Garantia Literria ao afirmar que os sistemas de recuperao de informao devem basearse no material que nele introduzimos e no em consideraes puramente lgicas. Goodman21, por sua vez, ao discutir o Thesaurus of Eric Descriptors, enfatizou o princpio da
67
Garantia Literria, ao ponto de afirmar que ningum pode, nunca, incluir um descritor no
tesauro, a no ser que um documento tenha sido nele classificado. Como exemplo, ainda,
de aplicao deste princpio, temos o sistema de classificao da Biblioteca do Congresso
Americano, que foi desenvolvido, pragmticamente, a partir do estudo de seu acervo bibliogrfico.
Endosso do usurio
A expresso Endosso do Usurio (User Warrant ou Personal Warrant), usada por
Lancaster22, uma confirmao direta dos produtores e utilizadores das informaes de um
campo de atividades de que os termos escolhidos so, efetivamente, aqueles utilizados na
comunidade e, portanto, sero eles utilizados nas solicitaes de pesquisa no acervo bibliogrfico. Chai Kim23, em artigo que discute os dois mtodos de levantamento dos termos,
Emprico e Consensual, observou, atravs de experimento, que a relevncia na recuperao
das informaes se d no mesmo grau quando utilizado uma linguagem construda a partir
de termos selecionados da literatura corrente (Emprico) ou um vocabulrio cujos termos
foram obtidos atravs do consenso de um grupo de peritos no assunto (Consensual). Kim
conclui seu trabalho com a argumentao de que o conhecimento e a comunicao deste
no podem ser conceituados separadamente, no sendo verdadeiro que o conhecimento
baseado no consenso de peritos seja fundamentalmente diferente do conhecimento expresso na literatura, j que a literatura a formalizao do conhecimento produzido. Kim, no
entanto, deixou de considerar que o conhecimento pode ainda no estar retratado na literatura, dado o hiato existente entre conhecimento e comunicao formal.
Na verdade, quando se trata de construo de linguagens documentrias, o ideal
seria que se pudesse absorver os dois princpios concomitantemente, isto , certificar-se de
que a terminologia levantada possui as duas garantias: literria e do usurio. A esse respeito pode-se citar a experincia de Pickford24, que desenvolveu uma linguagem documentria
para a Biomedicina no National Institute for Medical Research, Inglaterra. O lxico documentrio foi construdo, tomando-se por fonte uma coleo literria abrangendo peridicos especializados. Aps a indicao feita pelos usurios do centro de pesquisa acerca dos
peridicos que deveriam pertencer a uma coleo de engenharia biomdica (1/3 do material
coletado), foram feitas cpias dos artigos que circularam entre os usurios em potencial. A
esses colaboradores foi solicitado que indexassem as cpias de acordo com uma srie de
68
normas, sendo que cada cpia circulou por dois especialistas de modo que dois pontos de
vista fossem obtidos. As respostas coletadas foram tratadas eletronicamente, sendo a escolha dos termos definida pela freqncia de uso na indexao. Esta metodologia obrigou
formulao de instrues rigorosas acerca da indexao de documentos, utilizando, portanto, o conhecimento do usurio acerca da matria, somado tcnica da indexao.
Nos Estados Unidos da Amrica, Dym25 desenvolveu o Thesaurus for Paint Technology para a Federation of Paint Technology, coletando os termos a partir do envio de
cpias de artigos de revistas tcnicas para os membros da Federao e solicitando que cada
colaborador sublinhasse os termos que considerasse representativos do contedo de cada
artigo. O processamento da terminologia se deu do mesmo modo que o adotado por Pickford.
Tanto Pickford quanto Dym utilizaram a um s tempo os princpios da Garantia
Literria e do Endosso do Usurio, obtendo, como resultado do mtodo, a terminologia
preferida por usurios em potencial do sistema de informao, o nvel de especificidade e o
grau de exaustividade requeridos para a indexao dos documentos, alm de envolverem os
usurios no processo, despertando o interesse e a participao mais efetiva nos programas
de documentao e informao.
Com base nessas duas experincias Dodebei26 desenvolveu uma pesquisa que visava a estabelecer uma metodologia de levantamento de termos para a construo de tesauros
contemplada com as duas garantias: literria e do endosso do usurio. O domnio escolhido
69
para testar a metodologia foi a Formao Profissional nas suas aes desenvolvidas no Brasil. A escolha de tal campo de assunto de deveu ao fato de que os estudos sobre a terminologia dessa especializao da Educao eram no s escassos, como disciplinares. Os instrumentos terminolgicos existentes ora se apresentavam no contexto geral da Educao,
ora no contexto da Economia. A inadequao dos instrumentos desenvolvidos para a rea
de Formao Profissional fez com que os diversos organismos interessados duplicassem
esforos para sistematizar vocabulrios tcnicos, de modo a minimizar suas prprias dificuldades internas de comunicao em uma mesma linguagem.
As instituies ligadas Formao Profissional procediam ao desenvolvimento de
seus prprios vocabulrios, criando-se um impasse no momento de trocar informaes entre si, dada a caracterstica de diversificao da linguagem quando do emprego de conceitos, tendo-se em vista, de uma lado, a extenso territorial do Brasil e seus regionalismos
lingsticos, e, de outro, as diversas posies tericas tradicionalmente adotadas. Aps o
estudo da comunidade atuante no campo da Formao Profissional, e da identificao da
classe de problema existente no seu campo de interesse, decidiu-se envolver as trs maiores
instituies para-governamentais que cobriam os setores primrio, secundrio e tercirio de
atividades econmicas, ou seja, o Servio Nacional de Aprendizagem Rural (SENAR), o
Servio Nacional de Aprendizagem Industrial (SENAI) e o Servio Nacional de Aprendizagem Comercial (SENAC).
A deciso baseou-se no fato de que essas instituies congregavam um nmero relevante de tcnicos em Formao Profissional, assim como possuam um acervo bsico de
obras e documentos sobre o assunto, sendo na sua maioria as produtoras dessa literatura.
Foram selecionados 250 artigos de peridicos nacionais e 250 tcnicos em Formao Profissional. Cada tcnico recebeu um artigo acompanhado de instrues. A seleo dos termos deveria ser feita aps a leitura (anlise de contedo), devendo-se sublinhar os conceitos (representados por palavras simples ou compostas) que fossem representativos do texto
em seu contedo global.
Aps a escolha dos termos, o colaborador deveria orden-los segundo a importncia
no texto, ou seja: em primeiro lugar os conceitos que se referissem ao contedo global do
artigo e, em seguida, aqueles que representassem aspectos particulares da matria tratada,
perfazendo um mnimo de dez conceitos ordenados dentro desse esquema. A seguir o colaborador deveria dar uma definio do primeiro conceito (desde que no fosse o assunto
70
71
dentes entre si, isto , se a escolha recair pela utilizao de um grupo de peritos que vai
estabelecer, dedutivamente, as hierarquias representativas de um dado campo conceitual,
isto no deve eliminar a comprovao de que tais hierarquias esto refletidas nas fontes,
tanto documentais como pessoais. O processo, nesse caso, deve partir de uma suposta hiptese, ou suposio hipottica, passvel de verificao particular, para ento ser confirmada.
Sob o ponto de vista da induo, improvvel que no se faa suposies, ao longo do
processo, j que algum conhecimento antecipado o construtor da linguagem documentria
deve possuir. O modelo de Pierce citado por Eco29, para o entendimento das regras de significao, pode ilustrar esta tenso entre induo e deduo:
Peirce considera a abduo como a hiptese que, comparada com a deduo e a induo, d origem aos trs diferentes esquemas inferenciais em que as casas de linha contnua expressam os estgios argumentativos pelos quais temos proposies verificadas, e as
casas de linha tracejada, os estgios argumentativos produzidos pelo raciocnio. Assim
que a Abduo, naturalmente deve ser verificada.
O que se distingue nesta etapa de definio do universo conceitual que os conceitos podem ser criados dedutivamente, ou identificados indutivamente, nas fontes primrias
e secundrias. O modelo de Peirce nos ajuda a compreender que os conceitos criados devem ter uma correspondncia com as fontes, na etapa da delimitao do universo conceitual, e que o processo das inferncias vai fundamentar toda a organizao conceitual descrita
nas etapas seguintes.
Se a deciso tiver sido a do mtodo dedutivo, o grupo de especialistas no estar
simplesmente determinando quais conceitos faro parte da linguagem documentria, mas j
72
estar determinando a estrutura conceitual em suas hierarquias principais. A deduo implica em um conhecimento global do campo de assunto, no qual possvel efetuar derivaes conceituais, do geral para o particular. Nesse caso, necessrio possuir um conhecimento profundo do domnio para o qual se est elaborando uma linguagem artificial, a fim
de evitar todos os riscos naturais, no s da subjetividade na seleo, definio e relacionamento entre conceitos, como tambm na identidade entre conhecimento e comunicao,
tal como mencionado anteriormente.
Por outro lado, na organizao conceitual para a construo de linguagens documentrias fica evidente a tenso existente entre induo e deduo nas etapas de classificao, ou seja, nas aes de aproximao e afastamento de conceitos, por suas semelhanas e
diferenas dos atributos de apreenso conceitual. Mas, quando se diz que o mtodo escolhido o dedutivo, quer-se dizer tambm que a anlise de um domnio se deu por diviso
lgica, repartindo o universo em subconjuntos especficos, e que as classes principais, ou
primeiras categorias, no surgem por aproximaes especficas do conjunto de conceitos
daquele domnio, caractersticas da induo, mas por deciso antecipada do especialista. A
discusso sobre o emprego dos mtodos no relacionamento conceitual se dar no prximo
captulo.
NOTAS E CITAES
1
GOMES, Hagar Espanha (Org.) Manual de elaborao de tesauros monolnges. Braslia : PNBU, 1990.
DOYLE SILVA, Ernani, FERREIRA, Llio. Dicionrio inverso. Rio de Janeiro : Abril, 1956. fasc. 1.
WALL, E. A. ibid.
TAUBE, M. ibid.
HEALD, J. H. ibid.
10
73
11
12
FOSKETT, D. .J. A study of the role of categories in a thesaurus for education documentation. Strasbourg
: Council of Europe, 1972.
13
15
SOERGEL, D. Indexing languages and thesauri : construction and maintenance. Los Angeles : Wiley Becker & Hayes, 1974.
16
17
DODEBEI, Vera Lucia D. L. de M. Construo de thesauri: experimento emprico para a coleta de termos
em formao profissional. Rio de Janeiro, 1979. Dissertao apresentada ao Instituto Brasileiro de
Informao em Cincia e Tecnologia / Universidade Federal do Rio de Janeiro para a obteno do grau de
mestre em Cincia da Informao.
18
LANCASTER, F.W. Vocabulary control for information retrieval. Washington : Information Resources
Press, 1972.
19
20
FOSKETT, A. C. A abordagem temtica da informao. So Paulo : Polgono, 1973. p. 10, 20, 40.
21
GOODMAN, F. The role and function of thesaurus in education. In: THESAURUS of ERIC descriptors.
New York : CCM Information Corporation, 1972. p. IX-X.
22
23
CHAI KIM, SOON KIM. Consensus vs frequency: an empirical investigation of theories for identifying
descriptors in designing retrieval thesauri. Information Processing Management, London, v. 13, n. 4, p. 253258, 1977.
24
PICKFORD, A. G. A. FAIR (Fast Access Information Retieval) Project. Aslib Procedings, London. v. 19,
n. 3, p. 79-95, 1976.
25
DYM, E. D. A new approach to the development of a technical thesaurus. Proceedings of the American
Documentation Institute, Washington, D.C. n. 4, p. 126 -131, 1967.
26
27
BEGHTOL, Claire. Domain analysis, literary warrant andconsensus: the case of fiction studies. Journal of
the American Society for Information Science. v. 46, n. 1, p. 30-44, 1995.
28
HJORLAND, Birger, ALBRECHTSEN, Hanne. Toward a new-horizon inInformation Science: DomainAnalysis. Journal of the American Society for Information Science. v. 46, n. 6, p. 400-425, 1995.
29
75
b2 ) econmica
b3) organizao
b4) previso
76
Assim, no que se refere construo de linguagens documentrias, a unidade informacional o conceito, embora, claro, ela deva estar expressa por termos, simbolicamente representados por palavras. Desta forma, os conceitos podem estar representados por
apenas uma palavra, ou por uma composio de palavras, desde que esta composio designe um nico conceito. Por exemplo: Cincia da Informao = termo que representa apenas um conceito de um objeto, formado por duas palavras = um termo; Estudo de lnguas =
dois conceitos, dois objetos (estudo e lnguas) = dois termos.
77
Relaes conceituais
Mudando o foco de nossa ateno das esferas ontolgica e metodolgica na identificao dos conceitos que constituiro uma linguagem documentria para o espao lgico
das suas relaes, duas abordagens tericas devem ser consideradas: a da diviso lgica
prpria do processo dedutivo, representado pela diferena e a da predicao conceitual,
que compreende tanto a induo quanto a deduo, num processo relacional de semelhanas, tal como a proposta de Peirce para a abduo/hiptese.
A diviso lgica
A hierarquizao conceitual um processo analtico, que considera a diviso do
tema geral em suas espcies. As espcies so, portanto, obtidas pela diferena especfica,
ou seja, as qualidades ou atributos que, somados aos prprios do gnero, as distinguem.
78
Diremos, ento, que a cada derivao conceitual as espcies da decorrentes adquirem pelo
menos um atributo a mais que seu gnero prximo, tornando-se mais intensas ou compreensveis na medida em que aumenta o nmero das diferenas.
A questo da diferena estudada na teoria da classificao a partir das categorias
aristotlicas que, reformuladas por Porfrio, representam: gnero, espcie, diferena, propriedade e acidente. Porfrio (sc. IV), na sua obra Isagoge ou Introduo s categorias,
aplicando o princpio da oposio de Plato e Aristteles, apresentou uma classificao
dicotmica constando de cinco predicveis ou categoremas representados na famosa classificao rvore de Porfrio ou Arvore de Reme (divulgada no sculo XVI pelo filsofo
francs Pierre de la Reme):
79
Objeto (matria)
Objeto material (+ essncia : forma e contedo)
Suporte da informao (+ memria)
Documento (+ tempo de publicao)
Peridico
Reconhecidas as caractersticas que serviram de base para a diviso conceitual: matria, essncia, memria e tempo, elas podem ser identificadas com os pontos de vista,
ou diferenas escolhidas pelas quais pode-se analisar um objeto. A observao da cadeia
conceitual resultante, demonstra a intencionalidade na escolha das diferenas, quer dizer, a
partir de objeto poderamos tambm chegar a mesa, casa, filme etc. O que vai determinar o
sucesso na obteno de todas as derivaes necessrias organizao do universo conceitual a aplicao de regras lgicas de diviso, as quais, muitas vezes, se configuram como
obstculos na utilizao prtica de tal processo de anlise conceitual. Existem, portanto,
qualidades e limitaes na aplicao da diviso lgica conceitual. Para o primeiro caso,
contamos com trs princpios que regem a organizao de conceitos no aspecto da estrutura
classificatria. Podem, assim, ser considerados como:
a) Completude
A diviso do conceito deve ser completa, adequada e ordenada por complexidade
crescente, isto , enumerar todos as espcies de que o gnero se compe, do simples ao
complexo ou do abstrato ao concreto. Por exemplo, aplicando-se a caracterstica nvel de
ensino, a diviso abaixo est completa, com todas as espcies enumeradas.
80
b) Irredutibilidade
A diviso deve garantir que a cada deduo conceitual os contedos sejam irredutveis entre si, isto , no se deve enumerar mais do que os elementos verdadeiramente distintos entre si, de maneira que nenhum esteja compreendido no outro. Se, tal como no exemplo, o conceito de inteligncia est contido no conceito de alma, ele no pode integrar
o primeiro nvel de derivao conceitual, coordenado alma e ao corpo. O conceito de
inteligncia um conceito subordinado alma.
c) Mtua exclusividade
A diviso deve ser fundada no mesmo princpio, isto , servir-se de membros verdadeiramente opostos entre si. Para cada derivao conceitual deve-se usar apenas uma
caracterstica do conceito. No exemplo abaixo, a diviso do conceito biblioteca considerou
duas caractersticas de derivao ao mesmo tempo: disciplina e tamanho. Embora a espcie
esteja de acordo com o gnero, uso de duas diferenas concomitantes configura um erro
lgico.
81
A organizao conceitual deve garantir que a classificao obtida tenha por qualidades: ser completa; ser irredutvel; e, ser mutuamente exclusiva.
Com a diviso lgica, os conceitos vo se relacionar pela hierarquia do processo de
derivao conceitual, sendo fundamental o domnio de seu contedo. Para tanto, devemos
considerar uma idia ou conceito do ponto de vista de sua intenso (ou compreenso) e de
sua extenso. Se tomarmos como exemplo a diviso:
82
A extenso o conjunto de sujeitos a que a idia convm. A idia de Homem convm aos: canadenses, aos franceses, aos negros, a Pedro. Portanto, a relao entre compreenso e extenso se d numa tenso da razo inversa.
83
idia superior em extenso se chama gnero em relao idia inferior, e esta, espcie em
relao primeira. Assim, quanto maior a intenso (nmero de caratersticas do conceito), menor a extenso (nmero de membros ou espcies) de uma classe, e vive-versa.
Embora as relaes hierrquicas sejam as mais freqentes na organizao de conceitos para a construo de linguagens documentrias, elas no devem ser as nicas a serem consideradas no processo de construo de linguagens documentrias.
Wanderley8, citando Mills, considera as seguintes limitaes impostas pelo uso da
diviso lgica na concepo de classificaes bibliogrficas:
a) a relao de gnero para espcie, de uma coisa para suas variedades, apenas
uma das relaes de fato utilizadas nas classificaes bibliogrficas;
b) inadequado limitar-se a diviso s caractersticas que constituem qualidades
genricas essenciais.
c) comum o uso de caractersticas acidentais, quando mais apropriadas para o entendimento do contexto, sem que isto fira a lgica da derivao conceitual;
d) no sempre exeqvel, ao dividir-se um gnero por caractersticas sucessivas,
ater-se a uma regra de todo coerente;
e) a diviso lgica no pode impor uma ordem privilegiada de aplicao de caractersticas.
f) o mesmo ocorre quanto ao arranjo das classes, o qual teoricamente no obrigaria
anteposio do geral para o particular, do abstrato ao concreto, nem privilegiaria qualquer
ordem dentro de uma srie de subclasses coordenadas;
g) por fim, no existe uma correspondncia biunvoca entre documentos e termos
de classes, o que se soma natural complexidade das relaes entre as prprias cincias e
ao carter interdisciplinar da pesquisa moderna.
Tais limitaes, no entanto, s fazem demonstrar o carter subjetivo, arbitrrio das
classificaes, quer dizer: a deciso quanto ao ponto de vista a se adotar na diviso lgica;
o nvel de modulao conceitual para cada domnio do conhecimento; a extenso do domnio e suas interfaces com outros fronteirios. No h como afirmar que uma classificao
melhor do que outra, a avaliao se d pelo uso e pelos resultados obtidos, sempre tendo-se
em mente a representatividade do campo conceitual a se representado. As regras e os princpios delineados pela literatura indicam que a concepo de linguagens documentrias
84
deve ser lgica na formao e relacionamento conceituais, mas flexvel nas aplicaes objetivas.
Predicao conceitual
De acordo com Dahlberg9, a linguagem permitiu ao homem relacionar-se com os
vrios objetos que o circundavam e permitiu tambm que ele elaborasse enunciados sobre
eles. Toda vez que o objeto pensado como nico, distinto dos demais, constituindo uma
unidade inconfundvel (coisas, fenmenos, processos, acontecimentos, atributos) pode-se
falar em objetos individuais, isto : objetos nicos, definidos, distintos de outros, com presena de tempo e espao , por exemplo: O menino (este menino especfico). Mas, alm dos
objetos individuais, podemos referir-nos a objetos gerais, quando no se trata de nada nico, mas de algo que ocorre em vrias situaes, de um tipo geral, que, de certo modo, prescindem das dimenses tempo e espao - Um menino (qualquer menino).
Com a ajuda das lnguas naturais possvel formular enunciados a respeito tanto
dos objetos individuais como dos objetos gerais. Cada enunciado verdadeiro representa um
elemento, atributo ou caracterstica do conceito. Efetuando-se a predicao de um objeto
individual, identificam-se os elementos, como abaixo:
85
Se tomarmos o objeto geral /Instituio/, sobre ele poderemos formular os seguintes enunciados verdadeiros:
Do mesmo modo, a soma total dos enunciados verdadeiros de um objeto geral resulta no conceito geral deste objeto. No entanto, ao comparar o elenco de atributos dos dois
tipos de conceitos, podemos perceber que nos conceitos individuais h sempre elementos
dos conceitos gerais, o que significa que possvel, portanto, inferir conceitos gerais a partir de conceitos individuais. Isto o que permite que no processo indutivo, por inferncia,
possa-se chegar uma classe geral, partindo-se de um objeto particular. Pode-se, assim,
considerar a formao dos conceitos como a reunio e a compilao de enunciados verdadeiros a respeito de determinado objeto. Para fixar o resultado dessa compilao, usamos a
palavra ou qualquer signo que possa traduzir ou fixar essa compilao. possvel, ento,
definir conceito como a compilao de enunciados verdadeiros sobre determinado objeto,
fixada por um smbolo lingstico.
Se o conceito pode ser compreendido como um portador de elementos/caractersticas, obtidos pela predicao de seu referente, para fins de comunicao
necessrio sintetizar os elementos do conceito em uma expresso, ou combinao de palavras, a fim de que se possa manipul-lo ou, at mesmo, design-lo por um cdigo ou sinal.
Dahlberg10 apresenta, assim, um modelo conceitual para a organizao do conhecimento e
estudos terminolgicos, denominado Teoria Analtica do Conceito (orientada para referente), visando comunicao entre indivduos, tendo como intermedirio a informao registrada. Utilizando o significado de conceito como sinal e contedo, Dahlberg defende que
as caractersticas do conceito so entendidas como elementos de conhecimento, e a soma
86
87
88
MINERAIS
composio qumica
estrutura cristalina
- propriedades eltricas
condutividade
- falhas
deformaes
- cor
cor
tempo
espao
De acordo ainda com Dahlberg, outras espcies de objetos, como as plantas, podem
ter caractersticas diferentes. O mesmo ocorre com os produtos, como mquinas, equipamentos. Nesse caso, as caractersticas essenciais so determinadas pelas finalidades e pela
aplicao, e as caractersticas acidentais dependem da respectiva eficincia ou valores, em
geral prticos. Essa tambm a opinio de Gomes12, que acrescenta s duas categorias
gerais (naturais e acidentais) outras em funo do tipo de objeto, tais como caractersticas
equivalentes e no-equivalentes; caractersticas independentes e dependentes.
O conhecimento das carctersticas conceituais vai permitir realizar, com maior propriedade as aes de: definio dos conceitos; formao dos nomes dos conceitos; e, ordenao classificatria. Para o estabelecimento de comparaes por semelhanas e diferenas
entre os conceitos, quer seja para defini-los, nome-los ou orden-los, h que se falar em
relaes conceituais. Do ponto de vista epistemolgico, o conceito pode ser analisado segundo as aes mentais, ou seja, a habilidade da mente em comparar algo novo com conhecimento adquirido. Esse tipo de conhecimento subjetivo necessita tornar-se acessvel e
verificvel, explcito, objetivo. As possveis comparaes, segundo Dahlberg, podem ser
classificadas em lgicas ou formais; categorias formais; e materiais ou de contedo, sendo
esta ltima baseada na primeira. Com a finalidade de demonstrar o carter deduti-
89
vo/indutivo da proposta de Dahlberg para a predicao conceitual, reorganizamos as relaes conceituais, levando-se em considerao tanto o modo de ser dos objetos, quanto as
suas identidades e diferenas.
Em funo de seu contedo ou significado, as relaes entre os conceitos se do
mediante comparaes: lgicas, formais, abstratas ou semnticas
Relaes de equivalncia (identidade)
Quando um conceito pode ser representado por vrios smbolos distintos ou quando
se quer reduzir, por questes pragmticas, os nveis de implicao conceitual, estabelecemse as relaes de equivalncia semntica. Tais relaes vo permitir controlar os trs conjuntos de disperses semnticas, caractersticos da lngua natural; lxicas, simblicas e
sintticas.
Disperso lxica
sinnimos (professor e docente)
quase sinnimos ( linguagem documentria e tesauro)
Disperso simblica
grafias diferentes (conceptual e conceitual)
abreviaturas (Unirio e Universidade do Rio de Janeiro)
razo social e nome fantasia (Telefonica celular e TELERJ Celular SA)
traduo (software e programa)
Disperso sinttica
coordenao (instituies de ensino e ensino, instituio; aprendizagem e ensino/aprendizagem)
gnero e nmero (casa e casas; aluno e aluna)
A equivalncia entre dois smbolos representada pela identidade de suas caractersticas, de modo que a soma dos atributos verdadeiros, resultado da anlise de cada um,
possa gerar um nico e mesmo conceito. Ao contrrio, quando um mesmo smbolo identificado com dois ou mais conjuntos de caractersticas distintas, o que se configura a polissemia, isto , dois ou mais significados nomeados por um mesmo smbolo. Neste caso,
os smbolos devem ser distinguidos por meio de qualificadores, o que os transformar em
novos smbolos, cada um no lugar de um nico significado conceitual. Por exemplo:
90
91
Vale ressaltar, que devemos sempre preferir relacionar os conceitos por suas caractersticas essenciais, de modo que sejam evitados os relacionamentos acidentais do tipo:
animais de estimao (gnero) gatos (espcie), j que todos os gatos so animais, mas nem
todos os gatos so animais de estimao.
Relaes partitivas
A relao partitiva existe entre um todo e suas partes. Em relao aos conceitos e
suas caractersticas, isto significa que o conceito de um todo, por exemplo, um corpo, um
organismo, um sistema, inclui como suas caractersticas os conceitos de suas partes. Por
92
exemplo: A rvore composta de razes, tronco, galhos, folhas, flor e frutos. As caractersticas de /raiz/ integram as caractersticas de /rvore/.
93
94
causa e efeito
medicamento/cura de doenas
b)
concorrncia
ensino/aprendizagem
c)
constituio
janelas/alumnio
d)
agente
iluminador/iluminao
95
ser aplicada a todas as reas do conhecimento. As relaes conceituais de natureza funcional ou associativa podem ser estabelecidas antecedente ou posteriormente construo do
tesauro, conforme o mtodo adotado para dar incio ao processo de relacionamento conceitual, mas, sem dvida, devem se pautar pelas categorias, classes superiores ou facetas que
organizam a rede conceitual.
Em complemento s relaes conceituais de natureza lgico-semntica, outra possibilidade de efetuar-se comparaes entre os conceitos a que estabelece as categorias nas
quais os conceitos se identificam e se organizam, nomeada por Dahlberg de relaes de
categorias formais. Assim que a contribuio ontolgica ao seu modelo conceitual representada pelas dez categorias aristotlicas ou as classes gerais pelas quais pode-se olhar o
ser. Piedade15 resume o pensamento aristotlico ao afirmar que a idia que temos das coisas no simples, mas um composto de vrios aspectos, que temos que conhecer para tornar posssvel uma descrio. Aristteles deu o nome de categorias ou predicveis s classes gerais em que, segundo ele, podemos situar, ordenadamente, as idias que temos das
coisas e que constituem os dez gneros supremos, as dez essncias mais gerais. Assim, se
considerarmos as perguntas que podem ser feitas s coisas: o que isso? que tamanho tem?
que tipo de coisa ?, as respostas especificaro:
96
rentes desta, pois se no houvesse o objeto no haveria a relao, paixo etc. Aristteles
reduz, posteriormente, as dez categorias a trs:
Substncia - o ser que existe
Modo - ou acidente, o que existe na substncia, seus modos de ser
Relao - o que liga um ser a outro
Piedade apresenta a relao das categorias aristotlicas com as categorias gramaticais, o que, de fato, muito importante para a anlise conceitual do texto que se quer indexar e, consequentemente, para o estabelecimento das relaes conceituais em um tesauro.
Substantivo, sujeito
substncia
Adjetivo qualitativo
qualidade
Adjetivo quantitativo
quantidade
relao
ao
paixo
Advrbio de lugar
lugar, posio
Advrbio de tempo
durao
Advrbio de modo
maneira de ser
to adnominal
Para o Padre Leme Lopes apud70 , poder-se-ia formular o seguinte exemplo de interseo entre as categorias gramaticais e aristotlicas:
O grande
quantidade
adjetivo quantitativo
cavalo
substncia
substantivo
qualidade
adjetivo qualitativo
relao
adjunto adnominal
ao
verbo ativo
maneira de ser
advrbio de modo
tempo
advrbio de tempo
lugar
advrbio de lugar
castanho
do cavaleiro
est
arreado
de manh
no ptio
Dahlberg tambm faz uma releitura dessas categorias, reagrupando-as no que de-
97
DEFINIES
CATEGORIAS
Coeso
Areia
Gros de 2 a 20 mm de dimetro
Partes do solo
Ponto de viscosidade
Lama
Matria
orgnica
decomposta
Minerao
98
Adubao
fenmenos
processos
propriedades
relaes
dimenso
Em relao a esse tipo de categorizao importante notar que existem possiilidades inmeras de combinao destas categorias de conceitos. Por exemplo: objetos + fenmenos = crescimento de plantas; objetos + processos = impresso em papel.
Do ponto de vista de categorias universais a linguagem que exercer maior influncia na concepo e desenvolvimento de sistemas de organizao do conhecimento. A
lingstica, segundo o modelo de Dahlberg, oferece as bases necessrias designao de
conceitos, sendo os seguintes critrios aqueles considerados de mais significao: conformidade com o referente; representao das caractersticas; mnima extenso; capacidade de
derivao verbal; internacionalidade.
Finalmente, na organizao de sistemas de conceitos podem ser considerados dois
processos. O primeiro, denominado hierarquizao ou enumerao, tem por base a Teoria
da Diviso Lgica. O segundo, nomeado de facetao, se fundamenta na Teoria Analtica
de Conceitos. O conceito de Faceta foi definido por Ranganathan para indicar as manifestaes das categorias fundamentais em cada campo do conhecimento, reunindo conceitos
que tm determinada caracterstica em comum. O seu significado, representando o produto,
pode ser igualado Categoria, tal como as categorias aristotlicas, por exemplo. Considerando-se, no entanto, o processo de derivao conceitual, o significado de Faceta pode ser
igualado ao de Caracterstica.
99
Ranganathan, ao aplicar os princpios aristotlicos documentao, identificou quatro maneiras de desdobrar o conhecimento:
Embora as duas primeiras possam ser relacionadas ao processo de derivao conceitual, seja considerando-se os eixos de subordinao e coordenao, ou o relacionamento
conceitual hierrquivo e partitivo, as duas ltimas - Laminao e Justaposio ou Montagem flexvel - se referem ao produto obtido. Isto significa uma estrutura conceitual cuja
coordenao de conceitos possa ser efetuada no momento do uso e no, antecipadamente,
quando da construo e organizao dos conceitos. Assim, diz-se que as estruturas que
apresentam forte pr-coordenao conceitual so hierrquicas e enumerativas. E as estruturas que permitem coordenar conceitos no momento do uso so ps-cordenadas, facetadas
ou analtico sintticas.
Se tomarmos o exemplo de uma estrutura hierrquica para a organizao dos conceitos no campo da Educao, poderemos identificar as facetas principais pelas quais o
tema foi analisado e visualizar, no grfico, as limitaes das estruturas hierrquicas, princi-
100
No grfico, verificamos que no primeiro nvel hierrquico, a caracterstica que serviu de base para a diviso lgica do conceito /Educao/ foi nvel de ensino. Na segunda
derivao foi usada a caracterstica mtodo de ensino e, no terceiro nvel hierrquico, disciplina. Tais caractersticas so, portanto, os pontos de vista pelos quais o assunto /Educao/
pode ser analisado, transformando-se nas facetas principais de tal anlise, como abaixo:
Faceta 1
NVEL DE ENSINO
Pr-escolar
1 Grau
2 Grau
3 Grau
Faceta 2
MTODO DE ENSINO
Instruo Programada
Audiovisual
Faceta 3
DISCIPLINAS
Portugus
Ingls
101
A combinao dos conceitos em uma estrutura facetada feita no momento da classificao ou indexao, no sendo necessrio, como no caso da estrutura hierrquica, que
haja um local pr-determinado para todas as combinaes conceituais. Obtm-se, assim,
no s, uma economia de smbolos, como a liberdade de coordenar conceitos se, e quando
necessrio. Podemos confirmar que Faceta pode ser igualada Categoria como tambm
Caracterstica. O processo de organizao de conceitos usando a facetao nos indica que
o produto final mais sinttico, uma vez que os conceitos no precisam ser repetidos para
a correta estruturao do esquema classificatrio. Porquanto se diz que, a partir de um conceito geral s se pode enumerar as espcies, enquanto que a partir de um conceito individual pode-se inferir conceitos gerais, descobrindo-se as categorias ou facetas gerais que melhor se adeqem anlise do tema.
102
103
Ainda em Dahlberg, vale ressaltar que com a ajuda da distino aristotlica entre
gnero prximo e diferena especfica possvel estruturar as formas simples e complexas
das definies reais. Em todos os casos encontramos no definiens um conceito mais amplo
do que est contido no definiendum, seguido de uma caracterstica chamada diferena especfica ou caracterstica especificadora. Por exemplo: homem = df. mamfero bpede.
104
df =
um produto
composto de
farinha,
manteiga,
ovos,
105
bsicos e indica que, estatisticamente, esses no ultrapassam dez por cento do referido domnio. Para o campo da Engenharia, por exemplo, encontramos os seguintes conceitos bsicos: Edificao, Estrutura, Viga. Como conceitos derivados: Edificao militar, Edificao industrial, Supraestrutura, Viga hiperesttica. Assim, s os primeiros precisam ser definidos, uma vez que, do ponto de vista pragmtico, as dedues subseqentes so de fcil
apreenso, at porque Militar, Industrial, Supra etc. possuem multivalncias, sendo mais
fcil apreender a combinao. No resta dvida que, se no soubermos o sentido de Militar, por exemplo, teremos que, forosamente, considerar este termo combinatrio como um
conceito a ser compreendido. As definies devem ser anotadas na ficha terminolgica, a
fim de que, a qualquer momento, possamos recuper-las para decidir qual o mais adequado
relacionamento entre os conceitos.
A organizao dos conceitos conduzida por processo de induo/deduo ou relao. medida que as associaes vo se constituindo, novos conceitos podem surgir como
complemento organizao de cada faceta. Assim, somente ao final do processo, as facetas
sero conhecidas, embora se tenha, previamente, uma idia genrica das caractersticas
essenciais dos conceitos bsicos, uma vez que estes j sofreram o processo de definio
conceitual.
106
Efetuado o relacionamento entre os conceitos, de forma indutiva/dedutiva ou relacional, como preferem Dahlberg21 e Motta22, elas vo aparecer no tesauro com a seguinte
simbologia:
Para as relaes de equivalncia:
Archive
USE
ARQUIVO
(traduo)
Lambreta
USE
MOTONETAS
(sinonmia)
UNI-RIO
(abreviaturas)
107
Aprendizagem
USE
ENSINO APRENDIZAGEM
(coordenao)
Organizao da informao
TE
Arquivos correntes
Arquivos intermedirios
Arquivos permanentes
Gavetas
Pastas
Guias
Manuscritos
Tabela de temporalidade
108
Como observao, importante ressaltar que as notas explicativas referem-se contextualizao do conceito. Elas indicam os pontos de vista pelos quais o conceito foi hierarquizado. Podem significar ampliao ou reduo do campo conceitual e so necessrias
para orientar o indexador na melhor correspondncia entre conceito e descritor.
ABSORO
NE
ENSINO
NE
De acordo com Gomes, recomendvel que os termos dos tesauros sejam apresentados em ordem sistemtica para:
109
a) permitir que o usurio encontre o termo que melhor represente o conceito que ele
deseja exprimir, sem que saiba, no incio da busca, qual o mais adequado;
b) facilitar a compreenso da lgica do relacionamento e permitir modular as questes no nvel da compreenso conceitual.
c) facilitar a manuteno do tesauro, uma vez que as caractersticas que levaram ao
relacionamento conceitual esto explicitadas.
Por fim, do ponto de vista do acompanhamento terminolgico, necessrio que se
tenha um registro de cada termo representativo do conceito, com suas relaes, faceta, data
de ingresso e responsvel23. O exemplo abaixo uma das opes:
notao
termo = Documentao
informao semntica
definio = conjunto de conhecimentos e tcnicas que tm por fim a pesquisa, a reunio, a descrio e a utilizao de documentos de qualquer natureza.
informao estrutural
tipo de natureza dos termos relacionados = difuso, processamento de dados
interpretao dessas relaes = parte do processo de ... mtodo mais usado para
...
faceta = Processos informacionais
informao operativa
frequncia de uso = 10
data de incluso = 5/10/84
data de excluso = 3/5/96
A construo de tesauro no tarefa fcil. Cada linguagem construda nica, especial para um domnio do conhecimento e, portanto, passvel de ser modificada na mesma
medida em que as lnguas naturais evoluem. Novos conceitos aparecero, representados
por novos smbolos. Velhos conceitos em desuso podem ser retomados. Os usurios do
sistema de informao para o qual a linguagem foi construda podem ter novas necessida-
110
des de informao mais ou menos disciplinares ou interdisciplinares. No importa se o tesauro vai ser gerado tradicional ou automaticamente, pois com certeza, todas estas hipteses vo estar refletidas na literatura, que o ponto de partida para a construo de novas
linguagens.
HOLANDA, Aurlio Buarque de. Novo dicionrio da lngua portuguesa. Rio de Janeiro: Nova Fronteira,
1975. p. 358
2
Cf. PIEDADE, Maria Antonieta Requio. Introduo teoria da classificao. Rio de Janeiro :
Intercincia, 1983. p. 17
7
WANDERLEY, M. A. Limitaes dos sistemas tradicionais e inovaes neles introduzidos. Rio de Janeiro
: Uni-Rio, 19. Notas de aula
9
10
n. 2, p.101-107, 1978.
DAHLBERG, Ingetraut. Knowledge organization and terminology : philosophical and linguistic bases.
International classification, v. 19, n. 2 , p. 65-71, 1992.
11
12
13
14
111
15
16
17
18
19
20
21
DAHLBERG, I. Structure and construction of classification systems. Rio de Janeiro, 1975. Notas de aula.
22
MOTTA, Dilza Fonseca da. Mtodo relacional como nova abordagem para a construo de tesauros. Rio
de Janeiro : SENAI, 1987.
23
Existem estudos para o desenvolvimento dos chamados tesauros dinmicos, que so construdos e
atualizados automaticamente medida em que as colees para as quais servem como instrumento de ajuda
na recuperao, incorporam e retiram documentos. Cf. http://dewey.yonsel.ac.kr/memexlee/doc/thes_ads.htm
Capturado em 09/10/2001.
6 A Propsito
Este livro comeou a ser escrito em 1983, ano em que ingressei na Universidade do
Rio de Janeiro (Unirio). O tema Tesauro j havia sido objeto de minha dissertao de mestrado, defendida em 1979 no Instituto Brasileiro de Informao em Cincia e Tecnologia
(IBICT), antigo Instituto Brasileiro de Bibliografia e Documentao (IBBD), sob a orientao de Frederic Wilfrid Lancaster. Ao aceitar o desafio de assumir a disciplina Classificaes especialidades, ministrada por Manoel Adolpho Wanderley, que se aposentava no
ensino universitrio, iniciei um percurso de estudos e reflexes sobre os fundamentos tericos do campo documental. Os resultados, entre outros, se concretizaram na criao das
disciplinas Organizao de Conceitos em Linguagens Documentrias e Anlise da Informao, oferecidas aos Cursos de Arquivologia, Biblioteconomia e Museologia da Unirio, e
na minha tese de doutoramento, defendida em 1997, na Escola de Comunicao da Universidade Federal do Rio de Janeiro (UFRJ), intitulada O sentido e o significado de documento para a memria social.
Os roteiros de aulas, aliados doao da biblioteca particular do Professor Wanderley para a Unirio, representam as fontes principais das discusses apresentadas neste trabalho. Com efeito, importante esclarecer que no houve a inteno de construir o texto com
a caracterstica de um manual de orientao para a construo de tesauros, pois j dispomos
de excelentes trabalhos, tais como os de Hagar Espanha Gomes, alm de normas nacionais
e internacionais. A proposta deste livro foi a de organizar os conceitos do campo documental, isto , traar um roteiro, construir uma moldura para a rede de relaes interdisciplinares, partindo do pressuposto que o tesauro o instrumento que melhor espelha a comunicao da informao, e que o especialista, principalmente o bibliotecrio, o principal
ator na intermediao entre a produo e a circulao da informao.
A defesa das linguagens documentrias, sua construo e crtica, no exemplo dos
tesauros, foi desencadeada pela discusso terica, considerando-se a importncia de ressaltar mais a sua essncia e seus modos de ser, do que os exemplos de sua utilizao, pois aos
ltimos, a dinmica da memria eletrnica aponta para o carter voltil, repetitivo e apcrifo dos registros. Contudo, a exemplo da experincia didtica, os contedos foram desenvolvidos em um encadeamento que permitiu identificar as contribuies da Cincia da In-
113
formao, principalmente no entendimento do modelo sistmico de transferncia da informao e o papel das linguagens documentrias nesse contexto. As teorias da Comunicao
foram fundamentais para a compreenso dos estgios de representao do conhecimento,
assim como para o desenvolvimento de um quadro terico-metodolgico de representao
simblica do conhecimento, a qual deve ser baseada nos sistemas de signos da linguagem.
Nas relaes entre lngua natural e linguagem documentria verificou-se a correspondncia
entre os domnios da linguagem comum, da linguagem artificial e do pensamento, respectivamente da alada da Lingstica, da Lgica, da Epistemologia e da Psicologia. A Filosofia
permeou toda a discusso sobre a organizao de conceitos, sendo a viso aristotlica do
Ser o ponto referencial de todas as abordagens, tornando-se at mesmo difcil a classificao dos discursos em lgicos e empricos.
Sem dvida, no possvel o exerccio de comportamento crtico isento do domnio
cognitivo. Ranganathan confirmaria essa afirmao, pois foi o primeiro bibliotecrio a apresentar solues para s discusses emergentes sobre a relatividade na anlise dos fenmenos fsicos e sociais, desencadeando a produo terica no campo da representao do
conhecimento, e tendo em Dahlberg sua melhor discpula, visto que ela se colocou na vanguarda da pesquisa em teoria da classificao, com uma produo cientfica disseminada
internacionalmente. Estes exemplos recuperam para a Biblioteconomia um campo filosfico de discusso esquecido durante anos de abordagens tecnicistas. No seu bojo, aparecem
no s as questes fundamentais ligadas organizao de conceitos em linguagens documentrias, mas aos demais aspectos da representao do conhecimento.
A certeza de que o tema complexo, no se esgotando com a discusso aqui apresentada, oferece tantas outras possibilidades de abordar o problema da organizao do conhecimento, quanto de considerar que o tesauro , neste momento, o modelo necessrio de
linguagem de representao da memria documentria.
REFERNCIAS BIBLIOGRFICAS
115
DAHLBERG, Ingetraut. Knowledge organization and terminology: philosophical and linguistic bases. International classification, v. 19, n. 2 , p. 65-71, 1992.
DAHLBERG, Ingetraut. Structure and construction of classification systems. Rio de Janeiro, 1975. (Notas de aula).
DAHLBERG, Ingetraut. Teoria do conceito. Ci. Inf. Rio de Janeiro, v. 7, n. 2, p.101-107,
1978.
DEBONS, A. Information science: search for identity. Dekker, 1974.
DELEUZE, G., GUATTARI, F. Rhizome. Paris: Minuit, 1976.
DODEBEI, V. L. D. L. M., MENDONA DE SOUZA, Alfredo. Cincia da Informao:
formao e interdisciplinaridade. Rio de Janeiro: IBICT/CNPQ/ ECO/USP, 1992.
DODEBEI, V. L. D. L. M. Construo de thesauri: experimento emprico para a coleta
de termos em formao profissional. Rio de Janeiro, 1979. (Dissertao apresentada ao
Instituto Brasileiro de Informao em Cincia e Tecnologia / Universidade Federal do Rio
de Janeiro para a obteno do grau de mestre em Cincia da Informao).
DODEBEI, V. L. D. L. M. Espaos mtico e imagtico da memria social. In: Memria e
espao. Rio de Janeiro: 7 Letras, 2000. p. 63-71.
DOYLE SILVA, Ernani, FERREIRA, Llio. Dicionrio inverso. Rio de Janeiro: Abril,
1956. fasc. 1.
DYM, E. D. A new approach to the development of a technical thesaurus. Proceedings
of the American Documentation Institute, Washington, D.C. n. 4, p. 126 -131, 1967.
ECO, Umberto. A estrutura ausente: introduco pesquisa semiolgica. So Paulo: Perspectiva, 1991.
ECO, Umberto. Semitica e filosofia da linguagem. So Paulo: tica, 1991.
FOSKETT, A. C. A abordagem temtica da informao. So Paulo : Polgono, 1973. p.
10, 20, 40.
FOSKETT, D. .J. A study of the role of categories in a thesaurus for education documentation. Strasbourg : Council of Europe, 1972.
FOUCAULT, Michel. A palavra e as coisas: uma arqueologia das Cincias Humanas.
So Paulo: Martins Fontes, 1994.
116
GOMES, Hagar Espanha (org.) Manual de elaborao de tesauros monolnges. Braslia: PNBU, 1990.
GOMEZ, Maria Nelida Gonalez. A representao do conhecimento e o conhecimento da
representao: algumas questes epistemolgicas. Ci. Inf., Brasilia, v. 22, n. 3 p. 217-222,
set./dez. 1993.
GOODMAN, F. The role and function of the thesaurus in education. In: THESAURUS
of ERIC descriptors. New York : CCM Information Corporation, 1972.
GORSKY, D. P. Lengaje y conocimiento. In: Pensamiento y lenguaje. Mexico : Grijalbo,
1966.
GROLIER, Eric de. tude sur les catgories gnrales applicables aux classifications et
codifications documentaires. Paris: UNESCO, 1962. p. 262.
HAGGET, P., Chorley, R.J. Modelos, paradigmas e a nova Geografia. In: ________.
Modelos scio-econmicos en Geografia. Rio de Janeiro: Livros Tcnicos e Cientficos /
USP, 1975.
HJORLAND, Birger, ALBRECHTSEN, Hanne. Toward a new-horizon inInformation
Science: Domain-Analysis. Journal of the American Society for Information Science. v.
46, n. 6, p. 400-425, 1995.
HOLANDA, Aurlio B. Novo dicionrio da lngua portuguesa. Rio de Janeiro: Nova
Fronteira, 1975.
HULME, E.W. Principals of book classification. Association of Assistant Librarians,
1950.
JARDIM, Jos Maria. Cartografia de uma ordem imaginria: uma anlise do sistema
nacional de arquivos. (Dissertao de Mestrado em Cincia da Informao. Escola de
Comunicao, Universidade Federal do Rio de Janeiro, 1994)
JOLIVET, Rgis. Curso de filosofia. Rio de Janeiro : Agir, 1965.
KOBASHI, Nayr Yumiko. Anlise documentria e representao da informao. INFORMARE Cad. Prog.Ps-Grad. Ci.Inf., Rio de Janeiro, v.2, n.2 p. 5-27, jul./dez. 1996.
LANCASTER, F. W. Indexo e resumos: teoria e prtica. Braslia: Briquet de Lemos,
1993. p. 15-17.
LANCASTER, F. W. Information retrieval systems: characteristics, testing and evaluation. 2. ed. New York: Wiley, 1979.
LANCASTER, F. W. Vocabulary control for information retrieval. Washington : Information Resources Press, 1972.
117
118
119