Вы находитесь на странице: 1из 50

Web Semntica: conceitos e tecnologias

Disciplina: Sistemas Web 2.Q-2012 Prof.:Marcelo Rezende Aluno: Frederico Bortolato

Agenda
Histrico Web Web Sinttica x Web Semntica Web Semntica Definio e Conceitos Web Semntica Arquitetura RDF, Ontologias e OWL Anotaes Semnticas Ferramentas de extrao semntica Dados Abertos Governamentais e WS

Histrico da Web
Web 1.0
Origem da World Wide Web Se desenvolveu rapidamente como um ambiente de compartilhamento de documentos e no de informao (documentos e links entre eles apenas)

Histrico da Web
Web 2.0 (Atual) - Sinttica Web como plataforma Compartilhamento e reutilizao de dados e servios Consumidor vs. Produtor de contedo Blog, Wikis, Redes Sociais, etc.

Histrico da Web
Web 3.0 (Futuro) Semntica

Web 2.0
A Web 2.0 trouxe aos usurios uma melhor forma de comunicao e interao, popularizando ainda mais o acesso a Internet e incentivando tanto a colaborao intelectual quanto de recursos por parte dos usurios.

Como conseqncia direta deste comportamento, o volume de dados disponveis na Web cresce em quantidade exponencial.

Web Sinttica
A Web atual representa informao usando:
Linguagem natural (ex., Ingls, Portugus, etc.) Grficos, multimdia Page layout (formatao)

Dados na Web so organizados para serem lidos por humanos e no por programas de computador

Nela os computadores fazem apenas a apresentao da informao, porm o processo de interpretao fica a cabo do seres humanos apenas

Sinttica x Semntica
Anlise sinttica: tcnica empregada no estudo da estrutura sinttica de uma lngua. Ela til quando se pretende:
1. descrever as estruturas sintticas possveis ou aceitveis da lngua; 2. decompor o texto em unidades sintticas a fim de compreender a maneira pela qual os elementos sintticos so organizados na sentena.

Anlise Semntica: o estudo do sentido das palavras de uma lngua. (significado)

Sinttica x Semntica

a += 1; a = a + 1;

Problemas da Web Sinttica


Possui grande volume de informaes no estruturadas ou pouco estruturadas Consulta: dificuldade de encontrar o que se deseja Integrao: integrar informaes de vrias fontes Interpretao: extrair significado das pginas Comunicao: interconectar sistemas difcil automatizar processos Falta de preciso: muitos resultados irrelevantes
Falta de contexto Falta de semntica na definio das pginas

Problemas da Web Sinttica

A falta de meta dados na web inibe um processamento por mquina mais inteligente.

Soluo para a Web atual


A soluo seria descrever os dados contidos na Web e represent-los de forma conveniente

Web Semntica (WS)

WS - Definio
A Web Semntica uma extenso da Web atual, onde a informao possui um significado claro e bem definido, possibilitando uma melhor interao entre computadores e pessoas (Tim Berners-Lee)

Tambm chamada de Web 3.0

WS - Objetivos
Prover contexto e semntica informao para softwares Transformar os dados e aplicativos em elementos teis, legveis e compreensveis para o software Facilitar a comunicao dinmica, a cooperao e a inferncia para os agentes inteligentes A Web Semntica uma tentativa inversa de soluo. Ao invs de pensar na informao para os humanos somente, a ideia pensar na mquina tambm (cooperao).

Web Atual (Sinttica) x Web 3.0 (Semntica)


Recurso Software

Link para Link para

Link para

temManual requer

requer

Recurso

Recurso

Recurso

Recurso

Docu mento

Biblioteca

Imagem

Biblioteca

Link para
Recurso

Link para

baseadoEm
Documento

parteDe

Link para Link para Link para


Recurso Recurso

Assunto Link para As s unto Assunto


Tpico Tpico

autor

Recurso

Pessoa

Metadados
A Web Semntica utiliza metadados para dar significado aos seus recursos Significa dado sobre dado ou informao a respeito de outra informao. Uma informao que trabalha o significado de uma outra Padres de metadados

Arquitetura da WS
Na proposta de desenvolvimento da Web Semntica sugerida uma arquitetura de 3 camadas:
Engenho de Busca E -com m erce

Web Semntica Camada Lgica Camada de Ontologia Ontologia Camada de Estrutura Regras de Inferncia

Ontologia

Ontologia

Dados

Camada Estrutura
A camada de estrutura prov uma forma de definir os dados do documento e o significado associado a esses dados. Trata tambm da estruturao e disposio dos dados de forma que os programas que rodam na web possam fazer inferncia a partir dos mesmos. Para que haja a representaco do conhecimento so necessarias trs condies: Interoperabilidade estrutural: Permite que os dados sejam representados de forma distinta, permitindo especicar tipos e possveis valores para cada forma de representao; Interoperabilidade sinttica: Constitui- se de regras precisas que permitem o intercmbio de dados na Web; Interoperabilidade Semntica: Possibilita a compreenso e associao entre os dados. Para atender esses requisitos, utiliza-se XML e RDF.

Camada Ontolgica
Duas bases de dados podem utilizar terminologias diferentes para referir-se a mesma informao, resultando em divergncias em um conjunto semntico de dados. Pode ocorrer tambm de uma mesma terminologia estar sendo utilizada com signicados diferentes, por aplicaes distintas.

Para tratar esses conflitos, existe a camada de ontologia que define mecanismos capazes de estabelecer um padro entre as pginas da web. Camada mais importante (?) e pesquisada da Web semntica

Camada Lgica
Relacionamentos de informao e as inferncias de conhecimento da Web Semntica. As regras de inferncia fornecem aos agentes (programas) poder de raciocinar sobre os termos e seus significados, que foram definidos na camada estrutura e de raciocinar a respeito dos relacionamentos entre os conceitos segundo a sua definio na camada ontologia.
Os agentes so sistemas computacionais capazes de interagir autonomamente para atingir os objetivos do seu criador e possuem algumas caractersticas como autonomia, reatividade (percebem o ambiente tomam as decises), tm comportamento colaborativo, possuem objetivos, so flexveis, sociveis e tm a capacidade de aprender. A Web Semntica possuir vrios agentes interagindo entre si, compreendendo, trocando ontologias, adquirindo novas capacidades racionais quando adquirirem novas ontologias e formando cadeias

Arquitetura da WS (W3C)

RDF
Resource Description Framework Modelo para descrever recursos e como eles se relacionam Baseado em um modelo de grafo no lugar de rvore Usa XML como sintaxe Sintaxe: descreve os recursos atravs de declaraes (triplas) Melhora a descoberta, o acesso e o gerenciamento das informaes da Web

RDF
Declaraes so triplas(sujeito, predicado, objeto):
Recursos tem propriedades que tm valores; URIs

Recurso

Propriedade

Valor

Declarao

Ontologias
A utilizao das triplas <objeto, atributo, valor> garante a definio nica dos conceitos, no entanto, o mesmo conceito pode ser expresso de forma diferente e em linguagens diferentes. Para que a informao existente possa ser processada e relacionada necessrio que exista uma definio da relao entre os conceitos contidos em diferentes documentos e bases de dados. Para isso so utilizadas as ontologias.

Ontologias
Ontologia a descrio explcita e precisa de conceitos e relaes que existam em certo domnio de conhecimento (incluindo o vocabulrio, interconexes semnticas e regras de inferncia) Por meio de ontologias, possvel conseguir uma uniformidade de vocabulrio, de forma a evitar ambigidades e inconsistncias Uma ontologia descreve:
Indivduos: os objetos mais bsicos Classes: conjuntos de objetos, ou tipo de objetos Atributos: propriedades, caractersticas ou parmetros que os objetos tm e podem partilhar Relaes: formas de relacionamento entre objetos

Ontologias
Uma ontologia envolve a definio de uma hierarquia de classes e subclasses para os conceitos envolvidos (ex. SOA)

Web Ontology Language


A OWL uma linguagem para a definio e instanciao de ontologias WEB. A linguagem OWL uma reviso baseada em pesquisa da linguagem DAML+OIL. Facilita mais a possibilidade de interpretao por mquinas do contedo da Web do que XML, RDF e RDFS (RDF Schema), por fornecer vocabulrio adicional com uma semntica formal

OWL - Objetivos
Projetada para o uso por aplicaes que precisam processar o contedo da informao ao invs de apenas apresent-la aos humanos. Trocar informaes entre diferentes tipos de computadores usando diferentes sistemas operacionais e linguagens de programao. Criar padres que forneam um framework para gerenciamento de ativos, integrao empresarial e compartilhamento de dados na Web.

Sub-linguagens OWL
A OWL possui trs sub-linguagens incrementais para serem usadas por diferentes comunidades de implementadores e usurios: OWL Lite, OWL DL e OWL Full. Cada uma destas sub-linguagens uma extenso de sua predecessora, tanto em relao ao que pode ser expressado, como em relao ao que pode ser concludo.

Problema
Dados estruturados para interpretao por mquina normalmente so distribudos num formato distinto e separado do contedo original e a correspondncia entre eles bastante limitada.

RDF, OWL e outros formatos XML so complexos para interpretao da maioria das pessoas

Soluo
Visando incorporar metadados ricos a um documento e manter o seu contedo visual legvel ao ser humano, foram propostos padres de anotao semntica.
Objetivo: utilizar um conjunto de descritores, relacionados a um vocabulrio, para anotar informaes de um documento da internet, expressando o significado do contedo neles descritos.

Anotao Semntica
Esquema especfico para gerao e uso de metadados, possibilitando novos mtodos de acesso a informao.

A anotao semntica de um documento descreve o seu contedo pela associao a conceitos e instncias descritos na ontologia.

Anotao Semntica
Na figura abaixo, podem ser observadas as anotaes semnticas referentes a um texto simples. As entidades presentes no texto so associadas sua definio semntica:

Exemplo de marcao semntica.

Microformat
um conjunto limitado de especificaes utilizado para descrever informaes em documentos web.

Usados por motores de busca e plugins de browsers para melhorar a experincia. Baseiam-se em atributos onipresentes. Fceis de publicar, fcil de consumir.

Microformat
<div class="vcard"> <span class="given-name">Celso Fontes</span>trabalha no <span class="org">Detran RJ</span> </div>

_vcard

given-name

Celso Fontes
Detran RJ

org

eRDF
Embedded RDF

Baseado em alguns princpios do Microformat, porm permite a anotao a utilizao vocabulrios arbitrrios em suas anotaes semnticas.

eRDF (Exemplo)
<link rel="schema.foaf" href="http://xmlns.com/foaf/0.1/" /> <p id="celso" class="-foaf-Person"> <span class="foaf-name">Celso Araujo</span> estuda anotaes </p>

foaf:Person #celso Celso Araujo

RDFa (Resource Description Framework in attributes)


Recomendao da W3C para anotao semntica em documentos XHMTL 1.1. Infinitos formatos... qualquer um pode escrever um vocabulrio (ex: OpenGraph do Facebook). Usados por motores de busca Mais complexos de publicar e consumir.

RDFa
<div typeof="foaf:Person" xmlns:foaf="http://xmlns.com/foaf/0.1/"> Informaes sobre <span property="foaf:name">Celso</span> <div />

Celso Araujo

_blanknode1

foaf:Person

HTML5
Novos elementos estruturais Chamar as coisas pelos nomes

HTML5
MICRODATA
Padro da W3C para anotao semntica em documentos HTML5, tornando-os legveis por mquina. Extensvel por natureza e um pouco mais simples que o RDFa.

Microdata (Exemplo)
<div itemscope itemref="a b"></div> <p id="a"> Meu nome : <span itemprop="name">Celso</span> </p>. Sou aluno da professora <div id=MariaClaudia" itemprop=alunoDe" itemscope> <span itemprop="name">Maria</span>, Tambm conhecida como: <span itemprop=nickname">Yoko</span> </div>
Celso Araujo

name
_blanknode1

Yoko

alunoDe
#MariaClaudia

nickname name
Maria

Ferramentas de Extrao Semntica


Ferramentas capazes de indexar metadados contidos em ontologias ou documentos com anotaes semnticas.

Tambm conhecidas como ferramentas de busca semntica

Ferramentas de Extrao Semntica


Sindice (Semantic Web Index): ferramenta de busca semntica que coleta dados de documentos RDF e de pginas web com anotaes no padro microformatos ou RDFa

http://sindice.com/

Ferramentas de Extrao Semntica


Yahoo SearchMonkey: servio do Yahoo! que permite desenvolvedores e proprietrios de sites utilizarem dados estruturados de forma a tornar as buscas pelo Yahoo! mais teis e visualmente atraentes, direcionando o trfego mais relevante para os seus sites

http://developer.yahoo.com/searchmonkey/siteowner.html

Ferramentas de Extrao Semntica


Google Rich Snippets: nova abordagem de apresentao dos resultados de pesquisa do Google visando destacar alguns dados estruturados incorporados em pginas da web.

http://support.google.com/webmasters/bin/answer.py?hl=en&answer=99170

Dados Abertos Governamentais


Dados Governamentais Abertos so informaes pblicas governamentais que so compartilhadas com os cidados na forma digital, atravs da Internet, de forma a promover sua anlise e reutilizao. rea de pesquisa: utilizao da Web Semntica nos processos de abertura de dados governamentais

Dados Abertos Governamentais


As 3 leis dos dados abertos governamentais
1. Se o dado no pode ser encontrado e indexado na web, ele no existe.
2. Se no estiver aberto e disponvel em formato compreensvel por mquina, ele no pode ser reaproveitado. 3. Se algum dispositivo legal no permitir sua reaplicao, ele no til.

Referncias
1. OWL Ontology Web Language Wikipedia <http://pt.wikipedia.org/wiki/OWL>
2. RDFa 1.1 Primer - Rich Structured Data Markup for Web Documents <http://www.w3.org/TR/xhtml-rdfa-primer/> 3. HTML Microdata <http://www.w3.org/TR/2011/WD-microdata-20110525/> 4. Bernes-Lee T. The Semantic Web. <http://www.scientificamerican.com/article.cfm?id=the-semantic-web&page=2>

5. Perreira H. Microformats <http://revolucao.etc.br/archives/microformats>


6. BREITMAN, Karin. Web semntica: a internet do futuro. Rio de Janeiro: LTC, 2005. 7. Pollock, Jeffrey T. Semantic Web For Dummies: Wiley Publishing, 2009 8. Resource Description Framework (RDF): Concepts and Abstract Syntax http://www.w3.org/TR/2004/REC-rdf-concepts-20040210

9. Web Semntica W3C - http://www.w3c.br/Padroes/WebSemantica


10. Semantic Web - <http://semanticweb.org/wiki/Main_Page>

Dvidas?
Frederico Bortolato frederico.bortolato@gmail.com

Вам также может понравиться