You are on page 1of 22

REENG ENHA RI A DE SI ST EMA S DE O RG A NI ZAO DO

CO N HEC I ME NTO (SO C) E M ME I O DI G I TA L:


RE LA ES SE M NT I CA S E A MBI G UI DA DE
T ERMI NO L G I CA
Raquel Martins dos Reis Souza
Paula Raphisa Mendes
Autoras - Bolsista IC 2013/2014

Profa. Benildes Coura Moreira dos Santos Maculan


Orientadora

INTRODUO
O termo sistema de organizao de conhecimento

(SOC) a designao para diferentes tipos de


ferramentas de representao, tais como tesauros,
taxonomias, redes semnticas, ontologias, entre outros.

INTRODUO
Os tesauros so sistemas conceituais nos quais os conceitos esto

inter-relacionados entre si, em relaes do tipo equivalncia,


hierrquica e associativa. Apesar disso, no comum que todas
essas relaes estejam explicitadas em sua estrutura.

INTRODUO
Este projeto faz parte de uma parceria acordada entre a

Empresa Brasileira de Pesquisa Agropecuria


EMBRAPA, vinculada ao Ministrio da Agricultura, e a
Universidade Federal de Minas Gerais UFMG.
Mais especificamente, o convnio de cooperao

tcnica acontece por intermdio de Unidade da


EMBRAPA denominada Centro Nacional de Pesquisa
Tecnolgica em Informtica para a Agricultura CNPTIA
e a Escola de Cincia da Informao ECI.

OBJETIVO DA PARCEIRA
Integrao de esforos entre os partcipes para a

realizao de atividades conjuntas de pesquisa


cientfica e tecnolgica como estratgia de ao da
EMBRAPA, dentro do projeto Agropedia brasilis,
visando o desenvolvimento de abordagens para
concepo, construo, validao e implantao de
sistemas de organizao e representao do
conhecimento (SOC), alinhados a uma proposta de
gesto terminolgica.

OBJETIVO DO PROJETO DE PESQUISA


Examinar diferentes mtodos de reengenharia de SOC

encontrados na literatura da rea da Cincia da


Informao;
Aplicar um modelo de reengenharia no tesauro

THESAGRO brasileiro, da rea da agricultura, visando


explicitar os relacionamentos em sua estrutura
conceitual.

JUSTIFICATIVA
O compartilhamento da informao tem sido estudado por

muitos especialistas, pois o estudo aprofundado sobre a


aplicabilidade da modelagem conceitual tem se tornado
essencial.
A frustrao dos usurios, em geral, na tentativa de fazer uma
busca por informaes muitas vezes se traduz em duas
situaes: (1) alguns usurios no encontram nada e (2) outros
encontram muito mais do que o esperado, sendo comum que
pequena parte dos recuperados sejam relevantes.
Essa situao tambm se repete em ambientes corporativos,
uma vez que os bancos de dados e a organizao das bibliotecas
digitais tm sido feitas, na maioria das vezes, por leigos, o que
ineficaz, moroso e economicamente invivel, na maioria dos
casos, o trabalho de modelizao de informao nesse contexto.

JUSTIFICATIVA
O trabalho de organizao semntica se constitui em

um requisito essencial na criao e implantao de


sistemas de recuperao de informao (SRI),
permitindo que, em uma etapa posterior, os usurios
ou as ferramentas de busca alcancem maior eficcia no
momento do acesso informao.
A organizao semntica de determinada rea de
conhecimento, para fins de criao de um SRI, tem
como produto uma rede semntica ou conceitual e
demanda a implantao de um sistema de conceitos
integrados entre si.

FUNDAMENTOS
Os tesauros possuem quatro elementos bsicos:

(1) lxico;
(2) estrutura gramatical (sintaxe): padro de relaes existentes
entre os termos;
(3) rede paradigmtica: indica relaes essenciais e estveis
entre descritores; e
(4) rede sintagmtica: determina as relaes entre descritores,
vlidas apenas em determinado contexto de uso.
A juno desses elementos faz com que no exista qualquer

termo em um tesauro sem ligao com outro, diretamente


relacionado com seu significado.

FUNDAMENTOS
Foskett (1973) apresenta diferentes funes para o

tesauro, cujas principais so:


controle de sinnimos e quase sinnimos;
diferenciao de homgrafos;
promoo de melhorias na busca do usurio, por meio dos
termos relacionados e das referncias cruzadas, que
proporcionam maior consistncia na indexao;
reduo do tempo e o aumento da eficincia nas tarefas de
indexao e recuperao de informaes.

FUNDAMENTOS
A despeito do poderoso sistema conceitual expresso

pelos diferentes tipos de relacionamentos nos tesauros,


nem sempre possvel, mesmo aos humanos,
apreender a sua especificidade, sobretudo os do tipo
associativo.
Isso

acontece porque essas relaes no so


explicitadas de maneira mais formalizada, exigindo do
usurio certo conhecimento do domnio representado.

FUNDAMENTOS

De acordo com os eventos histricos, encontramos

contribuies sobre os relacionamentos desde a lgica


de Aristteles, pois, para esse filsofo, a lgica uma
ferramenta para a cincia e para a aquisio de
conhecimento sobre qualquer objeto ou fenmeno.

FUNDAMENTOS

Para estudar a questo dos relacionamentos em SOC,

neste projeto iremos utilizar as teorias:


Teoria da Classificao Facetada: multidimensionalidade do
conhecimento;

Teoria da Terminologia: valncia semntica dos verbos


(utilizados para representar os relacionamentos);
Teoria do Conceito: determinao do termo para
representar o conceito e a formao da definio.

METODOLOGIA
Ser aplicado o modelo de reengenharia de tesauro

desenvolvido por Soergel et al. (2004).


Os autores propem uma modelagem conceitual cuja

principal caracterstica a clara separao nos nveis de


conceito, de termo (ou lexicalizao) e de string.
Com essa estrutura conceitual, possvel formalizar e

individualizar informaes sobre os distintos nveis.


Dessa forma, pode ocorrer relacionamentos entre

entidades do mesmo tipo (por exemplo, entre


conceitos, entre strings ou entre relacionamentos),
como tambm entre entidades diferentes .

METODOLOGIA
Esquema do modelo de reengenharia de tesauro

proposta por Soergel e coautores (2004).

METODOLOGIA
Etapas:
1. definir a estrutura desejada para o THESAGRO, a partir
de SOCs existentes:
a.

b.

AGROVOC,
NAL;

2. coletar terminologia e outros tipos de informaes;


3. editar o THESAGRO utilizando um editor de tesauros

ou de terminologia:
a.
b.

tornar a informao existente mais precisa,


adicionar novas informaes.

RESULTADOS E DISCUSSES
Clara separao de modelagem nos nveis de conceito,

de termo, de string (variaes) e de relaes;


string

RESULTADOS E DISCUSSES
Os relacionamentos podem acontecer entre entidades

de mesmo tipo (por ex., entre conceitos, entre strings


ou entre relacionamentos), como tambm podem ser
estabelecidos entre as diferentes entidades;

AMBIGUIDADE TERMINOLGICA
Para os especialistas, a terminologia o reflexo da

organizao conceitual de uma especialidade, e um


meio inevitvel de expresso e comunicao
profissional.
(CABR, 1993, p. 37)

Aceita a ambiguidade

terminolgica, controlando-a.

CONSIDERAES FINAIS

Os resultados dos levantamentos tm demonstrado

que a explicitao dos relacionamentos na estrutura


conceitual

do

tesauro

so

importantes

na

representao de um domnio complexo e, tambm,


para facilitar a interoperabilidade entre distintos
sistemas e/ou vocabulrios.

CONSIDERAES FINAIS
Ao final dos estudos, a pesquisa almeja contribuir para

o controle da ambiguidade terminolgica, com o


aprimoramento da representao e recuperao da

informao, principalmente em ambiente digital.


Com a reengenharia do THESAGRO brasileiro, espera-se

facilitar o processo de gerenciamento de informaes


na EMBRAPA.

RAQUEL MARTINS DOS REIS SOUZA


(quelmrs@ig.com.br)
PROFa. BENILDES COURA M. DOS S.MACULAN
(benildesmaculan@ufmg.br)