Академический Документы
Профессиональный Документы
Культура Документы
Livre docente
Historicamente, o tesauro documentrio surgiu como uma relao estruturada de termos constitudos, quase exclusivamente, de uma nica palavra. Posteriormente evoluiu para algumas palavras compostas sem, no entanto, estabelecer bases para isso. A elaborao de um tesauro implica bases classificatrias e as categorias fundamentais permitem correto posicionamento dos conceitos nas classes e a organizao de domnio; e a definio de cada conceito o elemento que vai comprovar objetivamente tanto as relaes hierrquicas como as partitivas e associativas com outros conceitos. Palavras chave: Tesauro conceitual; Metodologia; Categorizao Recebido em 01.07.2006 Aceito em 19.092006
348
1 Introduo
Tesauro tem sido definido como linguagem documentria. Um olhar mais atento sobre o objeto/referente, evidencia que se trata de uma relao de termos de um domnio, relacionados entre si, com objetivo de indexao/ recuperao em um sistema de recuperao de informao. A palavra linguagem est sendo tomada em sentido figurado, pois no lida com discursos, apenas deles extrai um vocabulrio especializado, visando garantia literria. O tesauro em ao num servio de recuperao de informao requer instrues que poderiam ser, tambm, numa linguagem figurada, uma gramtica; esse conjunto vocabulrio e gramtica se constituiriam, ento, numa linguagem documentria. Este texto se limita ao vocabulrio: sua natureza e estrutura. De fato, o vocabulrio do tesauro no constitudo de palavras da linguagem natural como ocorreu nos primeiros tempos de seu surgimento mas de uma lista de termos1, entendendo-se aqui como termo o signo verbal que designa um referente, ou, num nvel maior de abstrao, que denota o conceito. A anlise de tal referente se d a partir de um determinado domnio. Assim, o contexto do tesauro o domnio e no o discurso. Aps anlise do objeto/referente a que aquelas palavras ou expresses se referem, tem-se o termo, com sua forma final estabelecida, bem como as relaes entre ele e outros conceitos, revelados na anlise. Por sua natureza verbal, a denominao do objeto/referente mascara, por vezes, sua verdadeira natureza, dificultando sua posio na estrutura do tesauro e a anlise conceitual que ir revel-la. Tesauro conceitual seria, ento, um tesauro com base em conceitos: seu nome indica que cada termo denota um conceito, ou seja, uma unidade de conhecimento. Na construo de um tesauro conceitual so necessrios princpios para: Estabelecimento do termo/conceito, e Estabelecimento das relaes entre eles. As bases terico-metodolgicas aqui apresentadas se propem a fornecer elementos para a elaborao de tesauros, sem descurar, no entanto, a dinmica que ocorre no conhecimento, de cujos conceitos os termos decorrem quando se requer neonmia -, dinmica que afeta ou a prpria denominao ou o contedo dos termos. So clssicos os exemplos de tomo e hipnose. A teoria do conceito, voltada para o referente, e a teoria da classificao facetada contribuem para a elaborao de tesauros conceituais porque estabelecem bases para identificao dos conceitos, dos termos e das relaes entre eles, e, ainda, para sua ordenao sistemtica. Desde os anos oitenta temos associado a teoria do conceito teoria da classificao para a elaborao de tesauros, (GOMES, 1990). De fato, Campos (CAMPOS, 1986) j havia alertado para o sistema de classificao subjacente ao tesauro. Mas, ao contrrio de tesauros que consideram a parte sistemtica como uma parte alfabtica dos termos gerais com sua respectiva hierarquia, preconizamos o uso das categorias Ranganathianas para ordenar as classes gerais (facetas) no interior de cada uma delas, construindo um verdadeiro sistema e revelando, assim, a estrutura conceitual de um dado domnio. A definio construda para cada termo/conceito torna explcito o
A maioria dos tesauros atualmente se refere a termos, mas as decises adotadas para o tratamento de grupos de palavras impropriamente chamados de termos compostos mostra que a abordagem ainda lingstica e no conceitual.
349
Perspect. cinc. inf., Belo Horizonte, v.11 n.3, p. 348-359, set./dez. 2006
contedo do conceito e fornece os elementos para o relacionamento entre os termos/conceitos. O conceito , de fato, o ponto de partida para estabelecer as relaes conceituais e determinar a forma verbal mais adequada para represent-lo. O conceito entendido como unidade de conhecimento, como prope Dahlberg (1978), incluindo a definio como elemento essencial para a fixao do conceito. Este novo tesauro, ou melhor, esta nova metodologia para a elaborao de tesauros, est, assim, fundamentada nas questes que envolvem o conceito e as categorias. Como toma por base o termo, denominado, por alguns estudiosos, tesauro terminolgico. Embora Currs (1995) em seu livro Tesauros, inclua o subttulo linguagens terminolgicas, ela no integra a terminologia na construo do tesauro, limitando-se a apresentar o tema num captulo isolado. Considera-se que a expresso tesauro terminolgico no apropriada, pois o que se quer evidenciar o contedo conceitual de uma etiqueta lingstica e no a palavra ou a expresso verbal. Assim, as bases para a elaborao do tesauro conceitual se encontram fundamentalmente nos princpios que enfatizam o processo de conceituao e em sua ordenao sistemtica.
350
termos que apresentavam alguma relao entre eles passaram a chamarse, tambm, tesauro. Vickery, nos anos 60, demonstra quatro significados diferentes usados na literatura de cincia da informao para o termo tesauro , sendo a interpretao mais comum a de uma lista alfabtica de palavras, onde cada palavra seguida de outras que a ela se relacionam (VICKERY, apud FOSKETT, 1985, p. 270). No incio da dcada de 70, atravs do programa UNISIST (UNESCO, 1973, p. 6), a Unesco, define tesauro para a rea de cincia da informao, sob dois aspectos: a) Segundo a estrutura: um vocabulrio controlado e dinmico de termos relacionados semntica e genericamente cobrindo um domnio especfico do conhecimento. b) Segundo a funo: um dispositivo de controle terminolgico usado na traduo da linguagem natural dos documentos, dos indexadores ou dos usurios numa linguagem do sistema (linguagem de documentao, linguagem de informao) mais restrita. Percebe-se a preocupao da Unesco em apresentar definies que pudessem atender tanto rea de elaborao de tesauro (definio a), quanto rea de organizao e recuperao de informao (definio b). Estas definies, de alguma forma, vm sendo utilizadas na literatura at os dias atuais. A evoluo histrica do tesauro de recuperao pode ser traada a partir de duas vertentes: uma, que toma nitidamente como base o Unitermo uma nica palavra -, e outra, influenciada pela teoria da classificao facetada. Lancaster apresenta um diagrama FIG. 1 - em que evidencia a evoluo histrica do tesauro. De um lado, a influncia da Amrica do Norte, caracterizada pela abordagem alfabtica, e, de outro, a abordagem sistemtica, de influncia inglesa principalmente.
351
Perspect. cinc. inf., Belo Horizonte, v.11 n.3, p. 348-359, set./dez. 2006
CLASSIFICATION BIBLIOGRAPHIC
Analytic-synthetic (faceted) (Ranganathan [1930s] )
ALPHABETIC SUBJECT
Alche (1961)
EJC (1964)
Thesaurofacet (1969)
COSATI (1967)
TEST (1967)
PRECIS (1974)
Unesco Monlingual
BS 5723 (1979)
nd
Edition, 1983)
Engineers Joint Council - EJC - , com a finalidade de cobrir toda a rea de engenharia. No ano seguinte, o Engineers Joint Council e o Department of Defense - DoD - dos Estados Unidos estabeleceram um acordo visando a reunir ambos os tesauros, que abarcavam temas ligados engenharia, com considervel participao da indstria. Atravs do projeto Lex , cuja meta era estabelecer princpios comuns de construo e uso e, tambm, criar um nico instrumento para ambas as instituies, prepara-se um manual de construo de tesauros e publica-se o Thesaurus of Engineering and Scientific Terms - TEST - , em 1967. Endossado e publicado pelo Committee on Science and Technical Information - COSATI -, rgo oficial do Federal Council for Science and
352
Perspect. cinc. inf., Belo Horizonte, v.11 n.3, p. 348-359, set./dez. 2006
Technology dos Estados Unidos, o manual foi recomendado como fonte para a construo de tesauros, tendo servido de base para as diretrizes e normas produzidas, posteriormente, pela ANSI - American National Standardization Institute (ANSI, 1981) e pela Unesco (1973). Por sua vez, as diretrizes da Unesco deram origem s normas nacionais e internacionais. (LANCASTER, 1986).
353
Perspect. cinc. inf., Belo Horizonte, v.11 n.3, p. 348-359, set./dez. 2006
designar um contedo de informao. A soluo foi considerar a possibilidade de que, em alguns casos, a unidade seria uma expresso verbal; as bases tericas para seu estabelecimento, no entanto, no foram desenvolvidas de forma satisfatria (GOMES & CAMPOS, 2004). Diretrizes e normas continuam a se referir a pr-coordenao e fatorao sinttica, abordagens lingsticas que privilegiam a forma lexical e, portanto, variam de tesauro para tesauro, de norma para norma e de lngua para lngua. E interferem no relacionamento entre os termos. De fato, a maioria dos tesauros produzidos nos Estados Unidos, dentro da linha tradicional americana que privilegia a organizao alfabtica dos termos, no apresentam uma base terica explcita. Mas seus autores avanam em relao ao modelo anterior, o cabealho de assunto: a unidade de trabalho passa a ser o termo e no o assunto; os diferentes tipos de relao, que nos cabealhos vinham sob forma de referncia cruzada, se apresentam de forma mais estruturada. No entanto, as instrues para a seleo da unidade de trabalho ainda apresentam fortes bases lingsticas; aproveit-las em outras lnguas sempre problemtico, porque no h uma correspondncia lexical nas diferentes lnguas para a denominao de um mesmo conceito. A norma para elaborao de vocabulrios controlados (ANSI/ NISO Z39.19-2005) sugere, inclusive, o uso de adjetivos, em algumas circunstncias, evidenciando seu divrcio do conceito como unidade de representao. Este aspecto, o da unidade de representao, no resolvido pelas duas grandes vertentes - a americana e a dos classificacionistas - parece encontrar soluo a partir da dcada de 70 com Dahlberg em sua Teoria Analtica do Conceito voltada para o Referente (aqui referenciada apenas como teoria do conceito) (DAHLBERG, 1978). Dahlberg afirma que o conceito se estabelece quando trs elementos esto presentes: o referente/objeto, suas propriedades e um termo que o sintetize, ou seja, que carregue com ele todas as propriedades do referente. Diz-se, ento, que o termo denota o conceito. Ento, por meio do conceito que se estabelece a relao do termo com o objeto/referente. Influenciada pelos analticos, ela desenvolve sua teoria que fornece bases seguras para estruturar as hierarquias (relaes lgicas). Posteriormente, tendo tomado conhecimento do mtodo analticosinttico de Ranganathan, incorpora o princpio de categorizao como uma soluo para a organizao dos conceitos num sistema de conceitos, no importando a finalidade de aplicao e prope princpios para o estabelecimento de relacionamentos associativos. (DAHLBERG, 1978a). Seu mtodo leva elaborao da definio analtica ou conceitual. De fato, segundo Dahlberg, existe uma relao de equivalncia entre o termo e sua definio. Como os tesauros se inserem num domnio, este que vai delimitar os aspectos, as propriedades - ou seja, as caractersticas dos conceitos - que figuraro na definio. Dahlberg, como Ranganathan, parte da lgica, para o estabelecimento das relaes hierrquicas; mas avana fornecendo os elementos para outros relacionamentos, desnecessrios num esquema de classificao. Em nosso ponto de vista, o tesauro conceitual rene dois princpios fundamentais para sua elaborao: o conceito, como unidade de representao, e o uso de categorias, como base para organizao de sistemas de conceitos. No Brasil, as primeiras tentativas tm incio na dcada de 80. (GOMES, 1990).
354
Perspect. cinc. inf., Belo Horizonte, v.11 n.3, p. 348-359, set./dez. 2006
355
Perspect. cinc. inf., Belo Horizonte, v.11 n.3, p. 348-359, set./dez. 2006
manifestao ao de uma espcie ou outra. A identificao da categoria fundamental Matria mais difcil ainda do que Energia. Suas manifestaes so de duas espcies material e propriedade. Aqui ele explica que madeira tanto uma propriedade de mesa de madeira, como material de que feita. (Mas no vale aprofundar esta questo aqui). Finalmente, sobre a categoria Personalidade ele no apresenta uma definio; diz que a que apresenta a maior dificuldade. It is too elusive. It is ineffable 2. E explica: Se uma certa manifestao facilmente determinada como no sendo tempo, espao, ou energia, ou matria, pode-se dizer que uma manifestao da categoria fundamental Personalidade. Este o mtodo dos resduos. Qualquer entidade que no seja uma manifestao de tempo ou espao, energia ou matria, deve ser uma manifestao de Personalidade. (RANGANATHAN, 1967, p. 399-401). Em relao a esta ltima categoria fundamental Ranganathan parece usar um princpio do hinduismo: No isso, no isso. Na verdade, aplicar a categorizao analisar o domnio a partir de recortes conceituais que permitem determinar a identidade dos conceitos (categorias) que fazem parte deste domnio. Por exemplo: na engenharia mecnica: mquinas operatrizes (personalidade); seus componentes (partes); esmerilhamento, polimento, frezamento (processos); os profissionais envolvidos (agentes); e assim por diante. na economia: teorias, poltica econmica (instrumentos/agentes); planejamento (operaes); e assim por diante. na construo civil: edificaes, como casas, edifcios, teatros, praas (personalidade); tcnicas de edificao (tcnicas); cimento, pedra, cermica, vidro (materiais); os profissionais envolvidos (agentes); e assim por diante. na biblioteconomia: instituies e organizaes, bibliotecas, documentos, usurios, suporte documental (personalidade); tratamento documentrio, recuperao de informao, aquisio (processos); linguagens documentrias (agentes dos processos); profissionais envolvidos (agentes dos processos); e assim por diante. (CAMPOS; ). GOMES; MOTTA, 2004). A etapa de categorizao auxilia no processo de pensar o domnio, no gerando qualquer registro e serve para orientar os profissionais no levantamento dos termos. Ela consiste em identificar as possveis classes gerais (categorias) de conceitos que a rea do conhecimento, objeto do tesauro, comporta. O exerccio de categorizao torna claro o domnio temtico do tesauro e, como conseqncia, estabelece as bases para seleo dos termos, nas fontes de onde eles sero retirados. Posteriormente, o Classification Research Group - CRG - na Inglaterra, desdobrou estas categorias para a elaborao de classificaes facetadas. Mas elas podem ser aplicveis a qualquer temtica de tesauros. So, na verdade desdobramentos das categorias fundamentais: Coisas, substncias, entidades que ocorrem naturalmente produtos instrumentos constructos mentais
356
Perspect. cinc. inf., Belo Horizonte, v.11 n.3, p. 348-359, set./dez. 2006
Suas partes constituintes rgos Sistemas de coisas Atributos de coisas qualidades, propriedades, incluindo estrutura medidas processo, comportamento Objeto da ao (paciente) Relaes entre coisas, interaes efeitos reaes Operaes sobre coisas experimentos, ensaios operaes mentais Propriedades de atributos, relaes e operaes Lugar, condio Tempo Tal lista facilita a anlise de qualquer rea de assunto ou de qualquer documento. Como se pode observar, os desdobramentos seguem a ordem PMEST. Como exemplo, citamos algumas facetas - e suas manifestaes - que integrariam o sistema de conceitos relativos a Proteo Sanitria: F aceta Faceta Coisas Manifestaes Resduos, efluentes, lodo, substncias perigosas, substncias txicas Tratamento de guas residuais, tratamento de resduos, tratamento de lodo, disposio final, processos de decomposio da matria orgnica, processos de estabilizao da matria orgnica Agentes de biodegradao/decomposio, poluentes, instrumentos utilizados no tratamento de resduos Unidades de tratamento de resduos
357
Perspect. cinc. inf., Belo Horizonte, v.11 n.3, p. 348-359, set./dez. 2006
O exemplo acima permite perceber, em extenso, a realidade emprica que est sendo objeto de representao conceitual. Esse um dos aspectos mais interessantes do mtodo de faceta. Quando se consegue fazer este exerccio, compreende-se melhor quais as facetas relevantes para uma rea. Como se pode verificar, o mtodo dedutivo: ele fornece as bases para estabelecer as grandes classes, no interior das quais so includas as classes de conceitos, com suas cadeias e renques. Exemplo recente desta abordagem a elaborao do Tesauro de folclore e cultura popular brasileira (IPHAN, 2005). Graas tecnologia disponvel, possvel apresentar o tesauro em suas formas alfabtica e sistemtica. Nesta ltima, a ordem dos conjuntos se baseia nas categorias fundamentais (PMEST). As definies e as relaes entre os termos esto presentes na parte alfabtica.
4 Consideraes finais ou uma abertura para questes tericas que fundamentam a metodologia de tesauros conceituais
O mtodo de categorias preconizado por Ranganathan trouxe para o campo da documentao o princpio norteador para a organizao de conceitos em um dado domnio. O tesauro, entendido em finais da dcada de 70 como um sistema de conceitos, agrega este princpio atravs da elaborao do Thesaurofacet de Aitchison (AITCHISON, 1972). Na dcada de 80 Dalhberg traz para o fazer tesaurogrfico a teoria do conceito (1978), agregando princpios terminolgicos relacionados ao contedo conceitual e sua definio, estabelecendo assim uma teoria consolidada para a determinao do que se entenderia por menor unidade em um tesauro, ou seja, o conceito representado por um termo. Dahlberg agrega princpios Ranganathianos relacionados categorizao de um domnio como o mtodo que permite estruturar todo o domnio. Pode-se afirmar que o mtodo de categorizao e o exerccio de entendimento do contedo conceitual do termo, ou seja, sua definio, so considerados os elementos norteadores para a elaborao de tesauros conceituais. Entretanto, esta afirmativa nos leva a uma pergunta clssica: Definese para classificar (categorizar) ou classifica-se (categoriza-se) para definir? Fica a questo.
358
6 Referncias
AFNOR Z 47-100:1981. Rgles dtablissement des thsaurus monolingues. Paris,AFNOR, 1981. 20 p. AITCHISON, Jean. Thesaurofacet: a new concept in subject retrieval schemes. In: WELLISCH, H. (Ed.). Subject retrieval in the seventies. Connecticut: Greenwood, 1972. p. 72-98. ANSI Z39.19:1980. American National Standard Guidelines for Thesaurus Structure, Construction, and Use. Bethesda, Md, NISO, 1980. 20p. ANSI/NISO Z 39.19: 2005 Guidelines for the construction, format and management of monolingual controlled vocabularies. Bethesda, Md, NISO, 2005. 176 p. BINWAL, J. C.; LALHMACHHUANA, C. Knowledge representation: concept, techniques and analytico-synthetic paradigm. Knowledge organization, v. 28, n. 1, p. 5-16, 2001. BSI BS5723:1979. Guidelines for the establishment and development of monolinguall thesauri. London, BSI, 1979. 36 p. CAMPOS, Astrio T. Linguagens documentrias. Revista de Biblioteconomia de Braslia, v. 14, n. 1 p. 85-88, jan./jun. 1986. CAMPOS, Maria Luiza de Almeida. Linguagem documentria: teorias que fundamentam sua elaborao. Niteri, RJ: Eduff, 2001a. CAMPOS, Maria Luiza de Almeida; GOMES, Hagar Espanha; MOTTA, Dilza Fonseca. Elaborao de tesauro documentrio -Tutorial. Disponvel em: < http:/ /www.conexaorio.com/biti/tesauro/index.htm> Acesso em 29 ago. 2006. DAHLBERG, I. A Referent-oriented analytical concept theory of interconcept. International Classification. v. 5, n. 3, p. 142-150, 1978. DAHLBERG, I. Ontical structures and universal classification. Bangalore: Sarada Ranganthan Endowment, 1978a. 64p. FOSKETT, D. Thesaurus. In: Subject and information analysis. New York: M. Dekker, 1985. p. 270-316. GOMES, Hagar Espanha. et alii. Manual de Elaborao de Tesauros Monolngues. Braslia: CNPq/PNBU, 1990. 78p. GOMES, Hagar Espanha; CAMPOS, Maria Luiza de Almeida. Tesauro e normalizao terminolgica: o termo como base para o intercmbio de informaes. DatagramaZero, dez. 2004. Disponvel em: http://www.datagramazero.org.br Acesso em 29 ago. 2006.. GOMES, Hagar Espanha; MOTTA, Dilza Fonseca da; CAMPOS, Maria Luiza de Almeida. Revisitando Ranganathan. Rio de Janeiro, ago. 2006. Disponvel em: <http://www.conexaorio.com/biti/revisitando/revisitando.htm> Acesso em 29 ago. 2006. IPHAN.Centro Nacional de Folclore e Cultura Popular. Tesauro de Folclore e Cultura Popular Brasileira .Rio de janeiro, 2005. Disponvel em http:// www.museudofolclore.com.br/tesauro. Acesso em 28 ago. 2006. LANCASTER, F. W. Vocabulary control for information retrieval. 2nd ed. Arlington: Information Resources, 1986. 270p. RANGANTHAN, S.R. Prolegomena to library classification. Bombay: Asia Publishing House, 1967. 640p. RIVIER, A. Construo de Linguagens de Indexao: aspectos tericos. Revista da Escola de Biblioteconomia da UFMG, Belo Horizonte, v. 21, n. 1, p. 5699, jan./jun. 1992. ROGET, P. M. Thesaurus of English words and phrases. New York: Longmans, 1925. 691p. UNESCO. Guidelines for the establishment and development of monolingual thesauri. [s.n.t]. 37p. WUESTER, E. Ltude scientifique gnrale de la Terminologie, zone frontalire entre la Linguistique, la Logique, lOntologie, lInformatique et les Sciences des Choses. In: RONDEAU, G.; FELBER, F. (Org.). Textes Choisis de Terminologie. I. Fondments thoriques de la terminologie. Qubec: Girsterm, 1981. p. 57114.
359
Perspect. cinc. inf., Belo Horizonte, v.11 n.3, p. 348-359, set./dez. 2006