Вы находитесь на странице: 1из 3

XIII JORNADA DE ENSINO, PESQUISA E EXTENSO JEPEX 2013 UFRPE: Recife, 09 a 13 de dezembro.

ANLISE E APLICAO DE CRITRIOS DE QUALIDADE EM UM PDMS


Elizangela de L. Lucena1, Maria C. M. Batista2

Introduo
Atualmente temas como distribuio, diversidade e compartilhamento de dados tm sido discutidos com frequncia. A procura por sistemas que utilizem tecnologias que promovam o acesso fcil a dados distribudos, heterogneos, com um nvel de abstrao sobre o gerenciamento e consulta destas informaes vem se tornando um fator de grande importncia. Os Peer Data Management Systems (PDMS) foram introduzidos como uma extenso natural dos bancos de dados distribudos em um ambiente de sistemas P2P, esse tipo de sistema capaz de prov acesso transparente a fontes de dados atravs de consultas e gerenciamento apesar da infraestrutura descentralizada e dinmica (Halevy et al. 2006). Este trabalho est inserido no projeto Anlise e Aplicao de Critrios de Qualidade em um PDMS que tem como objetivo geral inserir Qualidade da Informao (QI) nas reformulaes de consultas aplicadas em um PDMS. Nosso objetivo fazer uso de critrios de qualidade da informao (QI) para auxiliar na avaliao da perda semntica durante a reformulao de uma consulta entre peers. Um objetivo especfico do trabalho o clculo da perda ou enriquecimento semntico no processo de reformulao de consultas. A Semantic Peer Data Management System (SPEED) um PDMS que adota uma abordagem semntica baseada em ontologias e informaes contextuais com o propsito de prover solues para problemas crticos de gerenciamento de dados (Souza, 2009; Pires, 2009). Quando um usurio submete uma consulta em um determinado ponto, elementos contextuais so analisados atravs da ontologia de contexto, denominada Contextual Ontology for Data Integration (CODI). A reformulao de consultas do SPEED realizada por meio de um conjunto de correspondncias. possvel executar dois tipos de reformulao da consulta: a reformulao exata, que considera apenas as correspondncias de equivalncia (isEquivalentTo); a reformulao enriquecida, que o resultado de todas os outros tipos de correspondncias (isSubConceptOf, isSuperConceptOf, isPartOf, isWholeOf, isCloseTo, isDisjointWith ). O resultado da consulta obtido por meio da anlise de sua semntica (operadores utilizados: and, or) e por meio do modo de reformulao da consulta (estabelecido pelo usurio). Essa reformulao vai levar em conta as variveis de enriquecimento da consulta (Q): A. Aproximao - indica a incluso de conceitos que so prximos dos conceitos em Q; B. Especializao - indica a incluso de conceitos que so sub-conceitos de alguns conceitos de Q; C. Generalizao - indica a incluso de conceitos que so super-conceitos de alguns conceitos de Q; D. Composio - indica a incluso de conceitos que so parte-de ou todo-de alguns conceitos de Q.

Material e mtodos
A. Materiais Para realizar o trabalho foi necessrio realizar a instalao e configurao da linguagem de programao Java. Para facilitar o processo de desenvolvimento e fornecer as ferramentas de apoio utilizamos o Eclipse como ambiente de desenvolvimento integrado (IDE) e o Subversion (SVN) como ambiente para controle de verso. B. Mtodos Para alcanar os objetivos foi realizado um estudo inicial sobre processamento de consultas e critrios de qualidade. Em seguida, foi feito estudos sobre perda semntica e enriquecimento de consultas levando em considerao critrios de relacionamento, cujo objetivo foi identificar critrios para quantificar os resultados das consultas semanticamente. A partir dos critrios identificados foi criado o algoritmo que executasse a lgica de medio e implementado o prottipo para validar os resultados.

Resultados e Discusso
1

Primeiro Autor Estudante do curso de Bacharelado em Sistemas de Informao, Departamento de Informtica, Universidade Federal Rural de Pernambuco. Av. Dom Manoel de Medeiros s/n, Dois Irmos, Recife, PE. E-mail: elizdelima1@gmail.com 2 Segundo autor Professor Titular do Departamento de Informtica, Universidade Federal Rural de Pernambuco. Av. Dom Manoel de Medeiros s/n, Dois Irmos, Recife, PE. E-mail: cecamoraes@gmail.com

XIII JORNADA DE ENSINO, PESQUISA E EXTENSO JEPEX 2013 UFRPE: Recife, 09 a 13 de dezembro.

Aps estudos iniciais que geram conhecimento necessrio sobre temas como: Gerenciamento de dados, sistemas distribudos, PDMS, qualidade da informao, perda semntica, enriquecimento de consultas, ontologias e roteamento semntico. Foram estabelecidos os critrios que possibilitariam a mensurao da perda ou do enriquecimento semntico de conceitos em consultas reformuladas. A tab. 1 traz a frmula utilizada para o clculo da perda ou do enriquecimento semntico, observe que foi atribudo pesos para cada uma das variveis de enriquecimento da consulta. Desenvolvido o algoritmo e realizada as alteraes necessrias nas classes do SPEED, foi o momento de realizar testes iniciais em um ambiente controlado. Usando o SPEED como ambiente de teste, limitamos sua comunicao entre dois peers e executamos diversas consultas gerando vrios resultados que foram devidamente validados. A fig. 1 apresenta a execuo da consulta na tela do SPEED enquanto que a fig. 2 exibe os resultados da medio semntica da consulta que tem valores negativos indicando que a consulta trouxe alm de conceitos exatos, ou seja, de equivalncia trouxe tambm um de generalizao e um de especializao. Foram pesquisados alm dos conceitos iniciais: Professor e Student, os conceitos de Person, FullProfessor e VisitingProfessor. No entanto, ser necessrio um maior estudo sobre o roteamento semntico, ou seja, de como os peers se comunicam e repassam as consultas para os seus peers vizinhos. provvel ser necessrio alguns justes no fluxo sequencial desse roteamento, para que o prottipo que utilizou apenas dois peers possa ser executando utilizando um nmero maior de base de dados.

Referncias
Batista, M. C. M. Schema Quality Analysis in a Data Integration System. Centro de Informtica Universidade Federal de Pernambuco, 2008. 127p. Tese de Doutorado. Batista, M. C. M. Otimizao de Acesso em um Sistema de Integrao de Dados atravs do uso de Caching e Materializao de Dados, Centro de Informtica Universidade Federal de Pernambuco, 2003. 134p. Dissertao de Mestrado. Freire, C.A. Roteamento Semntico de Consultas em Sistemas Gerenciadores de dados P2P, Centro de Informtica Universidade Federal de Pernambuco, 2012. Proposta de Tese. Halevy A., Rajarama A., Ordille J. Data Integration: The Teenage Years. Proceedings of the 32nd International Conference on Very large data bases, Seoul, Korea, 2006. p. 9-16. Pires, C.E. Ontology-based Clustering in a Peer Data Management System. Centro de Informtica - Universidade Federal de Pernambuco, 2009. Tese de Doutorado. Souza D. Reformulao de Consultas baseada em semntica para PDMS. Centro de Informtica - Universidade Federal de Pernambuco, 2007. Proposta de Tese de Doutorado. Souza D. Using Semantics to Enhance Query Reformulation in Dynamic Distributed Environments., Centro de Informtica - Universidade Federal de Pernambuco, 2009. Tese de Doutorado. Zhao J. Schema Mediation and Query Processing in Peer Data Management Systems. The University Of British Columbia, 2006. Tese de Doutorado.

XIII JORNADA DE ENSINO, PESQUISA E EXTENSO JEPEX 2013 UFRPE: Recife, 09 a 13 de dezembro.

Tabela 1.

Frmula para clculo do enriquecimento ou perda semntica no processo de reformulao de consultas.

Csubj o nmero isSubConceptOf ; Csup o nmero de isSuperConceptOf; Cclj o nmero de isCloseTo; Cpwj o nmero de isPartOf, isWholeOf, isDisjointWith; Cj o nmero total de conceitos da consulta.

Figura 1

Figura 2

Вам также может понравиться