Вы находитесь на странице: 1из 11

RESUMO

Com os recentes avanços na Web, observa-se que os tradicionais mecanismos


de busca acabam se tornando insuficientes para gerenciar a crescente quantidade de
conteúdo, nesse contexto, o Simple Knowledge Organization System (SKOS) vem se
destacando como um padrão para representação de recursos informacionais nesse
ambiente que permite a migração de vocabulários controlados para formatos inteligíveis
por máquina o que auxilia para um melhor gerenciamento. Esta pesquisa buscou
identificar o panorama das investigações sobre tesauros em formato SKOS no Brasil,
identificando seus principais autores e por meio de uma pesquisa exploratória, foram
analisados trabalhos nacionais em torno desta temática.
Palavras-chave: SKOS. Tesauro. Web Semântica.
INTRODUÇÃO

A recuperação da informação sempre foi uma das preocupações da Ciência da


informação e as linguagens documentarias e em particular os tesauros sempre foram
instrumentos de grande contribuição desde a década de 50 quando o crescimento
tecnológico e cientifico começou a se tornar um desafio.
Na literatura os tesauros são encontrados como linguagem documentaria pois
“correspondem a sistemas de símbolos, destinados a “[..] traduzir” os conteúdos dos
documentos” (CINTRA, 1994, p. 36), e também como sistema de organização do
conhecimento (SOC), termo usado para abarcar os vários tipos de vocabulários
controlados como as taxonomias, ontologias, lista de cabeçalhos de assunto e outros
vocabulários similares. Para Carlan (2010, p. 28) “sistema de organização do
conhecimento é uma denominação nova para as linguagens documentárias que agregam
elementos incorporados nas inovações tecnológicas da era digital.” Como destaca
Murakami (2010, p. 22) os tesauros tiveram que passar pela adaptação de representação
e forma de acesso na web desde os formatos em texto, HyperText Markup Language
(HTML), Extensible Markup Language (XML) e o mais recente Resource Description
Framework (RDF) e para cada um desses formatos é possível citar um exemplo sendo
respectivamente o Tesauro Brasileiro da Ciência da Informação, o Tesauro em Ciência
da Informação da Universidade de Minas Gerais, o Tesauro EpistemIS e o Tesauro da
Unesco.
O foco da pesquisa no tesauro se justifica pela importância do controle
terminológico na recuperação da informação e a possibilidade da interoperabilidade
semântica e como atesta a literatura, pouco se tem publicado sobre o modelo SKOS no
Brasil. Em outras partes do mundo já existem projetos utilizando tal modelo como
destaca SOLOMOU; PAPATHEODOROU, 2010), entre as quais estão a lista de
cabeçalhos de assuntos mantida pela biblioteca do congresso dos EUA, o The Food and
Agriculture Organization Thesaurus (AGROVOC), EUROVOC, GEMET, LCSH, NAL
Thesaurus, Répertoire d’Autorité-matière Encyclopedique et Alphabetique Unifie
(RAMEAU), STW Thesaurus fo Economics, Thesaurus for Social Sciences (TheSoz),
Geopolitical Ontology, Dewey Decimal Classification, DBpedia, SWD
Schlagwortnormdatei e Geonomaes. O UK Archival Thesaurus, o General Multilingual
Environmental Thesaurus (GEMET).
O objetivo deste artigo busca responder as seguintes questões: Qual o panorama
das investigações sobre tesauros em formato SKOS no Brasil e quem são os pesquisadores
da temática no pais?
Hoje é possível dizer que a Web se tornou um dos principais suportes
informacionais possibilitando o crescimento de publicações cientificas e de outros tipos
de informação em vários formatos, como música, vídeos, fotos etc, o que torna necessária
a utilização de novas ferramentas de organização e representação dos conteúdos na web
e como bem aponta Ferreira; Santos (2013, p.14) “[...] a falta de descrição das
informações presentes nas páginas Web, fez com que os mecanismos de busca clássicos
se tornassem insuficientes para gerenciar a quantidade sempre crescente de conteúdo.”
Nessa perspectiva o Simple Knowledge Organization System (SKOS) “tem se
destacado como um novo padrão para representação de recursos informacionais no
ambiente web.” (RAMALHO, 2015, p. 67) já que permite a migração de vocabulários
controlados para formatos inteligíveis por máquina por meio do padrão RDF.
Simple Knowledge Organization System

No ano de 2009 o Word Wide Web Consortium (W3C) formalizou como


recomendação o padrão Simple Knowledge Organization System – SKOS (Sistema de
Organização do Conhecimento Simples) como um modelo de dados para a representação
de Sistemas de Organização do Conhecimento (SOCs) no ambiente Web o que permite
que as representações possam ser legíveis por máquina. A W3C também publicou 2
documentos que podem ser consultados para compreensão desse modelo, sendo o SKOS
primer que é um guia para os usuários e o SKOS Reference um documento normativo.
O modelo SKOS é baseado em representações formais de vocabulários
declarados por meio de diretivas RDF e seus elementos podem ser categorizados como
Conceitos, Propriedade e Relações.
Ainda segundo Ramalho (2015, p. 68) o modelo “[...] não tem a função de
substituir vocabulários controlado seu em seu contexto original de uso, e sim favorecer
uma maior reutilização e interoperabilidade entre os vocabulários existentes.” O modelo
SKOS permite a migração de SOCs para o contexto da Web Semântica sendo um modelo
simples e de baixo custo.

Segundo Isaac e Summer (2009, p. 10) o padrão SKOS possibilita que


conceitos possam ser identificados utilizando Uniform Resource
Identifiers (URI), rotulados com sequências textuais em uma ou mais
línguas naturais, documentados por meio de diferentes tipos de notas,
relacionados semanticamente entre si, a partir de hierarquias informais
e redes associativas; e agregados em diferentes esquemas conceituais.
METODOLOGIA

A pesquisa tem caráter bibliográfico e exploratório, onde foi utilizado o Portal


da Capes, BRAPCI e Google acadêmico. O período de cobertura considerado foi de 2009
a 2017 e a estratégia de busca utilizada foi (tesauro and skos). Foram identificados
inicialmente 135 artigos. Esses documentos foram organizados segundo a ocorrência dos
termos e posteriormente os itens duplicados foram eliminados. Após a eliminação dos
itens duplicados e dos artigos que traziam as expressões apenas nos campos de palavra-
chave, obteve-se um total geral de 6 documentos. A partir dessa análise percebeu-se a
necessidade de inclusão de outros termos que contribuíssem para um melhor
entendimento dos estudos abarcados pelo tema. Assim, foi considerada também a
ocorrência do termo Web semântica, onde foram identificados mais 3 documentos
totalizando 9 no geral.

Quadro 1 – Resultado da pesquisa

Ocorrência Quantidade
Título + resumo (SKOS, Tesauro, Web semântica) 9
Itens duplicados 4
Itens em outro idioma 9
Resenha 1

Fonte: Dados da pesquisa


RESULTADOS E DISCUSSÕES

Os trabalhos recuperados, em sua maioria são, pesquisas bibliográficas e


documentais, que apresentam uma análise do modelo SKOS e a relação desse modelo
com a Web Semântica, ou tem foco em metodologias onde oferecem mais detalhes a
respeito das metodologias utilizadas para o desenvolvimento e aplicação de vocabulários
controlados.
O quadro 2 resume os objetivos dos trabalhos selecionados.

Quadro 2 – Objetivos dos trabalhos

Objetivos Autor(es)
Pesquisa bibliográfica e documental que discorre sobre as temáticas CATARINO (2014)
relacionadas a Web Semântica, mais especificamente a aplicação do SKOS
para a área da Organização da Informação (OI), além de apresentar exemplos
de aplicação e ferramentas disponíveis para a edição e validação do modelo.
Pesquisa bibliográfica e documental que aborda a verificação da CATARINO;
CERVANTES;
representação temática no contexto da Web Semântica na área da Ciência da
ALMEIDA (2015)
informação.
Pesquisa focada na metodologia, onde investigou-se aplicabilidade de um MACULAN (2015)
modelo de reengenharia para tesauros tradicionais, com o objetivo de
transformar o seu sistema de relacionamentos entre conceitos em uma
estrutura mais enriquecida semanticamente.
Pesquisa baseada em revisão de literatura em um repositório sobre da NAKANO et al (2015)
temática da Web semântica, onde buscou-se analisar o panorama atual das
investigações de Web Semântica no Brasil sob o olhar da Ciência da
Informação, além de identificar os pesquisadores da área e as instituições
que subsidiam esses estudos.
Pesquisa teórica e exploratória com finalidade de analisar e descrever os RAMALHO (2015)
principais elementos e características do modelo SKOS sob o prisma da área
de Ciência da Informação.
Pesquisa teórica e exploratória, que visa apresentar uma análise dos modelos RAMALHO (2016)
de dados SKOS e BIBFRAME a partir do enfoque da área de Ciência da
Informação, objetivando descrever suas principais características.
Pesquisa teórica e exploratória, apresentando uma discussão de literatura RAMALHO (2016)
acerca da evolução dos sistemas de representação, com destaque ao SKOS,
descrevendo suas principais características e relações com outros sistemas
de representação do conhecimento.
Pesquisa bibliográfica e documental com o objetivo de apresentar o SANTARÉM (2014)
protocolo SPARQL e suas possibilidades no processo de recuperação da
informação em ambientes semânticos.
Pesquisa experimental, trazendo a análise de conversão de um micro tesauro SANTOS et al (2013)
em vocabulário estruturado para a web-semântica.

Fonte: Próprio autor (2017)


A partir da análise desse quadro é possível categorizar tais pesquisas em 3 grupos, como
demonstrado abaixo:

Quadro 3 - Categorização das pesquisas

Categoria Autores
SKOS – Elementos e CATARINO (2014) e RAMALHO (2015; 2016)
características
SKOS e sua aplicação em MACULAN (2015) e SANTOS (2013)
tesauros
Vocabulário controlado e CATARINO; CERVANTES; ALMEIDA (2015), NAKANO et al
Web Semântica (2015), SANTARÉM (2017)
Fonte: Próprio autor (2017)

A partir dos quadros anteriores é possível observar que apenas 3 autores


trabalham especificamente com SKOS em suas pesquisas, sendo 3 de autoria de
RAMALHO e 1 de CATARINO. Essas pesquisas são teóricas e trazem de forma concisa
os principais e elementos e características do SKOS, informações que estão detalhadas
nos 2 documentos oficiais fornecido pela W3C, o SKOS primer que é um guia para os
usuários e o SKOS Reference um documento normativo.

Na segunda categoria apresentada: SKOS e sua aplicação em tesauros, as


pesquisas são de autoria de MACULAN e SANTOS. Na pesquisa de MACULAN, a
modelagem não trabalhou especificamente com SKOS, nesse trabalho a reengenharia foi
aplicada no tesauro brasileiro THESAGRO, utilizando o sistema e-Termos software que
auxilia na festão e desenvolvimento de produtos terminológicos, e como resultado
evidenciaram a utilização do modelo SKOS para a interoperabilidade entre tesauros
distintos. Já na pesquisa de SANTOS et al foi utilizada uma ferramenta especifica para
conversão de vocabulários controlados o contexto da Web Semântica, o TemaTres.

Na ultima categoria o trabalho de CATARINO; CERVANTES; ALMEIDA


(2015), aborda representação Temática no âmbito da Web Semântica, onde são
apresentadas algumas ações que estão sendo realizadas nesta direção como os tesauros, a
CDD e CDU e o Linked data.
Já no trabalho de NAKANO et al (2015), é apresentada uma revisão de literatura,
onde foi analisado o panorama das investigações de Web Semântica no Brasil sob o olhar
da Ciência da Informação que em sua maioria são investigações com base teórica e
filosófica e por isso como resultado sugeriu-se investigações com abordagem de
aplicação prática.
O último trabalho dessa categoria é de autoria de SANTARÉM (2014), que
apresenta o protocolo SPARQL no processo de recuperação da informação em ambientes
semânticos e nesse trabalho a mesma ocorrência observada no trabalho anterior foi citada,
sobre a questão teórica dos estudos e carência de aplicações práticas.
CONCLUSÃO

A partir dos trabalhos recuperados na pesquisa, pode-se perceber que no Brasil


as pesquisas em torno da temática teve início em 2013 e em sua maioria são de abordagem
teórica. O fato de apenas um dos trabalhos apresentar a aplicação pratica do modelo
SKOS para conversão de tesauro, pode ser pelo fato desse modelo ser utilizado para
outros sistemas de organização do conhecimento, como as ontologias, taxonomias e lista
de cabeçalhos de assunto e outros vocabulários similares, mesmo considerando esta
possibilidade, Em relação ao panorama do panorama dessa temática e a identificação dos
pesquisadores envolvidos conclui-se que o Brasil ainda está em desvantagem em relação
as pesquisas dessa temática pois em outros países já existem tesauros em SKOS como o
AGROVOC por exemplo e também já existem pesquisas onde são apresentadas
ferramentas compatíveis com a Web Semântica e os autores que estão à frente de
pesquisas especificamente sobre SKOS e/ou tesauros são Ramalho e Santos. Os
trabalhos recuperados foram categorizados segundo seu foco, CATARINO (2014) e
RAMALHO (2015; 2016) por exemplos possuem abordagens teóricas apresentando
principalmente os elementos e características do SKOS. Já MACULAN (2015) e
SANTOS et al (2013), apresentam o SKOS genericamente e focam em sua aplicação e
CATARINO; CERVANTES; ALMEIDA (2015), NAKANO et al (2015), SANTARÉM
(2017) tem seu foco em vocabulário controlado e Web Semântica, mais especificamente
na recuperação da informação utilizando o protocolo SPARQL. Diante dessa
categorização tem as respostas sobre o panorama das investigações sobre tesauros em
formato SKOS no Brasil, assim como a apresentação de seus principais pesquisadores.
Sugere-se por fim para pesquisas futuras a busca por abordagens praticas sobre
SKOS, no sentido de explorar as contribuições que a Ciência da informação pode
proporcionar aos profissionais da informação e expandir os campos de pesquisas para o
protocolo SPARQL por exemplo pois tem intima relação com a temática.
REFERÊNCIAS

CARLAN, E; MEDEIROS, M.B.B. Sistemas de Organização do Conhecimento na


visão da Ciência da Informação. Revista Ibero-Americana de Ciência da Informação,
[S.l.], v. 4, n. 2, fev. 2012. ISSN 1983-5213. Disponível em:
<http://periodicos.unb.br/index.php/RICI/article/view/6209/5102>. Acesso em: Jan.
2017.

CATARINO, M. E. Simple Knowledge Organization System: construindo sistemas de


organização do conhecimento no contexto da Web Semântica. Informação &
Tecnologia, Marília/ João Pessoa, v.1, n.1,
17-28 p, jan/jun, 2014. Disponível em: <
http://periodicos.ufpb.br/index.php/itec/article/view/19307>. Acesso em: Fev.2017.

CATARINO, M.E; CERVANTES, B.M. N,


ANDRADE, I. A. de. A representação temática no contexto da Web Semântica. Inf. &
Soc.: Est., João Pessoa, v.25, n.3, 105-116 p, set./dez.2015 Disponível
em:http://www.ies.ufpb.br/ojs/index.php/ies/article/view/16242. Acesso em: Fev. 2017.

CINTRA, A.M.M. et al. Para entender as linguagens documentárias.2. ed. Ver. ampl.
São Paulo: Polis/PB, 2002. 96 p.
MURAKAMI, T. R. M. Tesauros e a world wide web. 2005. 92 p. Trabalho de
Conclusão de Curso – Departamento de Biblioteconomia e Documentação da Escola de
Comunicação e Artes da Universidade de São Paulo, São Paulo, 2005. Disponível em:
< http://rabci.org/rabci/sites/default/files/murakami-tesauros.pdf> Acesso em: Jan.2017.

RAMALHO, R. A. S. Análise do Modelo de Dados SKOS: Sistema de Organização do


Conhecimento Simples para a Web. Informação & Tecnologia, v. 2, n. 1, p. 66-79,
2015. Disponível em: < h ttp://periodicos.ufpb.br/ojs/index.php/itec/article/view/25995>.
Acesso em: Fev.2017.

RAMALHO, R. A. S. Análise dos modelos dados SKOS e BIBFRAME: novas


perspectivas de representação na era dos dados interligados. In: XVII ENCONTRO
NACIONAL DE PESQUISA EM CIÊNCIA DA INFORMAÇÃO:
DESCOBRIMENTOS DA CIENCIA DA INFORMAÇÃO: DESAFIOS DA MULTI,
INTER E TRANSDISCIPLINARIDADE (MIT), nº 17, Bahia. Anais... Bahia: 2016. P.
1-17.

RAMALHO, R. A. S. O modelo de dados SKOS: novas perspectivas no ambito da


representação do conhecimento. In: XVII ENCONTRO NACIONAL DE PESQUISA
EM CIÊNCIA DA INFORMAÇÃO: DESCOBRIMENTOS DA CIENCIA DA
INFORMAÇÃO: DESAFIOS DA MULTI, INTER E TRANSDISCIPLINARIDADE
(MIT), nº 17, Bahia. Anais... Bahia: 2016. P. 1-17.

SANTOS, C. A. C.M. dos et al. Elaboração de vocabulário controlado em formato


SKOS usando Tematres: implicações metodológicas e web semântica. ResearchGate.
p. 205-210. 2013. Disponível em: <
https://www.researchgate.net/publication/264638064_Elaboracao_de_vocabulario_contr
olado_em_formato_SKOS_usando_Tematres_implicacoes_metodologicas_e_websema
ntica>. Acesso em: Fev. 2017.

SANTARÉM, J.E.S. Web Semântica: introdução a recuperação de dados usando SPARQL. In:
ENCONTRO NACIONAL DE PESQUISA EM CIÊNCIA DA INFORMAÇÃO: ALÉM DAS
NUVENS, EXPANDINDO AS FRONTEIRAS DA CIÊNCIA DA INFORMAÇÃO, 2014, Belo
Horizonte. Anais... Belo Horizonte: ECI, UFMG, 2014. p. 3242-3261. Disponível em: <
https://www.researchgate.net/publication/304216019_WEB_SEMANTICA_INTRODUCAO_A
_RECUPERACAO_DE_DADOS_USANDO_SPARQL>. Acesso em: Fev. 2017.

SOLOMOU, G; PAPATHEODOROU, T. The use of SKOS vocabularies in digital repositories:


the DSpace case. In: INTERNATIONAL CONFERENCE ON SEMANTIC COMPUTING, 4th,
2010, Pittsburgh PA USA. Proceedings... Los Alamitos, California, USA: IEEE Computer
Society, 2010. p.542-547.

Вам также может понравиться