You are on page 1of 8

CURSO DE BACHARELADO EM SISTEMA DE INFORMAO

MECANISMOS DE BUSCA NA WEB

Carlos Eduardo Moslaves Leonardo Pessoa Alves Luciano Moraes de Almeida

Resumo
Este artigo apresenta o que so e como funcionam os motores de busca na web, suas funcionalidades e caractersticas principais. A pesquisa foi desenvolvida com base em pesquisas realizadas na Internet e em artigos j publicados sobre o assunto. Ele pretende esclarecer como funcionam os mecanismos e quais so os diferentes tipos de busca em uso na Internet. Palavras-chave: Motores de Busca; Internet; Mecanismos de Busca.

1 INTRODUO
Os motores de busca da Internet so mecanismos essenciais para podermos encontrar as informaes que necessitamos na internet, atravs deles que o usurio encontra um documento que contenha uma determinada palavra ou frase. Eles so sistemas que pesquisam na Internet, quando solicitamos, informao sobre algum tema. As buscas so feitas com palavras chaves e o resultado da busca uma lista de links que mencionam os temas relacionados com as palavras chaves buscadas (OLIVEIRA, 2004). O primeiro mecanismo de busca da Web foi o Wandex, hoje j extinto, que foi desenvolvido por Matthew Gray no MIT em 1993. Outro mecanismo pioneiro foi o Aliweb, tambm apareceu em 1993 e funciona at hoje, um dos primeiros mecanismos de busca comercial foi o Lycos, desenvolvido em 1994 Depois disso, muitos outros mecanismos de busca apareceram e se tornaram populares. Entre eles temos o Google e o AltaVista (WIKIPEDIA, 2005)

2 DIRETRIOS
Na medida em que internet ia crescendo, a necessidade de organiza e localizar os recursos da web foi aumentando, e os diretrios foram a primeira soluo adotada (GUIMARES,2002, p.34). Os diretrios so organizados em hierarquias de assuntos, so produzidos de forma manual, e abragem uma parte muito pequena da web. O mais conhecido site que se utiliza de diretrios o Yahoo! com aproximadamente dois milhes de paginas categorizadas (GUIMARES,2002, p. 34). Os usurios localizam as informaes navegando, progressivamente pelas subcategorias, estas, divididas geralmente em assuntos de interesses gerais como por exemplo sade, esportes, viagens, compras ou informtica. Os sites coletados passam pela seleo na maioria das vezes de editores, que tomam conhecimento de novos recursos atravs das sugestes de usurios, por

3 pesquisas na internet ou ainda pelo uso de robs para coletar novas URLs (CENDN, 2001, p.39).

3 MOTORES DE BUSCA
Diferentemente dos diretrios, os motores de busca no organizam hierarquicamente os sites, eles se preocupam menos com a seletividade que com a abrangncia de sua base de dados, procurando sempre colecionar o maior numero possvel de recursos atravs de softwares especficos. Com uma base de dados muito grande se pode alcanar milhes de itens, permitindo assim que os usurios, atravs de palavras-chave ou at mesmo de linguagem natural, busquem e localizem o que desejado(CENDN, 2001, p.41) Todos os motores atuais utilizam o mtodo de robs sendo formados por quatro componentes: um rob, que localiza e busca documentos na Web; um indexador, que extrai a informao dos documentos e constri a base de dados; o motor de busca propriamente dito e a interface, que utilizada pelos usurios (MOURA, 2001).
Segundo Guimares, os robs, tambm chamados de aranhas (spiders), agentes, viajantes (wanderers), rastejadores (crawlers) ou vermes (worms), so programas que o computador hospedeiro da ferramenta de busca lana regularmente na Internet, na tentativa de obter dados sobre o maior nmero possvel de documentos para integr-los, posteriormente, sua base de dados. Existem vrias estratgias que os robs podem utilizar para se locomoverem de um documento a outro, utilizando-se dos links existentes nas pginas da Web. Geralmente, eles iniciam a busca a partir de sites conhecidos, especialmente daqueles que possuem muitos links, recuperam a sua home page e, sistematicamente, seguem os links encontrados nesta pgina inicial e usam algoritmos prprios para determinar que links devem seguir

Os documentos encontrados pelos robs so encaminhados aos indexadores que extraem a informao das pginas HTML e as armazenam em uma base de dados. Esta base de dados do motor de busca consiste de informaes julgadas importantes como os URLs ou endereos das pginas HTML, ttulos, resumos, tamanho e as palavras contidas nos documentos. A interface,

4 normalmente uma pgina Web, utilizada pelos usurios para efetuar a pesquisa na base de dados. Fornece meios para que o usurio formule a sua consulta, que recebida e transmitida para o software de busca ou motor de busca propriamente dito. Este um programa que localiza, entre os milhes de itens na base de dados, aqueles que devem constituir a resposta. O programa tambm responsvel pela ordenao dos resultados, de maneira que os mais relevantes apaream em primeiro lugar na lista de resultados. Os resultados mostrados contm uma lista de descries de sites e seus links (CENDN, 2001, p.41)

4 DIFERENAS ENTRE OS MOTORES DE BUSCA


Todos os motores de busca so compostos dos componentes listados anteriormente. Entretanto, diferem entre si em relao a fatores como o tamanho de suas bases de dados, critrios para indexao e incluso de pginas, alm de ordenao dos resultados. Suas interfaces, recursos de busca que oferecem, a freqncia com que atualizam suas bases de dados e o modo como apresentam os resultados tambm variam (MOURA, 2001) O tamanho das bases de dados dos motores de busca medido, geralmente, em nmero de URLs. Este tamanho de alta relevncia para que a ferramenta seja considerada boa, j que os recursos informacionais na Internet s podem ser encontrados em uma pesquisa, se alguma ferramenta os tiver includo. Se um motor cobre mais da Web, ele ter maior chance de conter a informao procurada. Conseqentemente, os motores maiores tendem a ser mais usados, atraindo maior nmero de anunciantes e podendo cobrar maiores taxas pelos anncios. Entretanto, nenhum motor de busca contm todas as pginas existentes na Web. Os melhores no chegam a incluir 60% delas (CENDN, 2001, p.42).

5 MOTORES DE BUSCA OU DIRETRIOS?


Existem diferenas essenciais entre motores de busca e diretrios, o que faz com que existam vantagens e desvantagens associadas ao uso de cada um dos tipos de ferramentas. Os diretrios tm bases de dados menores, mas que contm informaes mais relevantes.Diretrios so tambm mais apropriados para buscas por tpicos que sejam de interesse para um grande nmero de pessoas, pois alta a probabilidade de que sejam parte da rvore hierrquica; ou tpicos muito amplos os quais retornariam um nmero muito elevado de respostas em um motor de busca. J os motores de busca permitem a localizao de qualquer tipo de informao, por mais obscura ou especfica, desde que exista na Internet e esteja indexada. Mas como a sua base de dados muito grande, constituda de milhes de pginas, a chance de se recuperar um grande nmero de resultados no relacionados com os tpicos pesquisados tambm maior. Ou seja, obtm-se menor preciso nos resultados da busca. Por outro lado, apesar de terem maiores bases de dados, os spiders dos motores de busca podem no indexar alguns tipos de pginas que poderiam ser includas nos diretrios (CENDN, 2001, p.42).
Segundo Cendn, Os motores de busca procuram compensar o excesso de itens recuperados com seus mecanismos internos de ordenao por relevncia, mostrando em primeiro lugar os que, de acordo com seus critrios, deveriam ser os mais importantes. Uma vez obtida a lista dos resultados, o usurio pode ler as descries para decidir quais os sites sero de maior interesse. No caso dos diretrios, especialmente dos diretrios avaliados, esta descrio pode ser de melhor qualidade. As descries dos motores de busca, por serem elaboradas automaticamente, podem no conter informaes adequadas para facilitar a deciso do usurio. Acessar o site pode ser a nica maneira de verificar se os recursos so relevantes ou no.

Outra diferena importante entre os motores de busca e diretrios, a rapidez com que a informao includa. Como nos diretrios, a incluso de uma informao exige o trabalho humano de avaliao e seleo de recursos, uma pgina submetida a eles pode demorar pelo menos um ms para ser includa. No caso dos motores de busca, que usam indexao automtica, este tempo

6 costuma ser mais rpido, e suas bases de dados contm informaes mais recentes (WIKIPEDIA, 2005). O grfico abaixo mostra a porcentagem de buscas feitas pelos internautas americanos em maio de 2004 executado em um Web Site particular ou em uma rede de Web Sites (OLIVEIRA, 2004).

Figura 1 porcentagem de buscas (Fonte: OLIVEIRA,2004)

6 META MOTORES
Outro tipo de busca na web o chamado meta motor. Para o usurio ela tem a mesma interface do motor de busca convencional, porm ela difere do modo como a busca executada dentro da ferramenta. Para responder uma busca ela se utiliza de diversas maquinas de busca convencionais existentes. O funcionamento dos meta motores podem ser dividido em duas partes (GUIMARES, 2002, p 40): Enviar a busca do usurio para maquinas convencionais, fazendo converses automticas se necessrio.

7 Integrar as respostas obtidas pelas maquinas convencionais. Para isso so utilizados conversores especficos para cada resposta proveniente de uma maquina tradicional diferente.

7 CONCLUSO
.Pode se compreender, atravs deste artigo, as principais caractersticas dos motores de busca. Revisamos tambm um pouco da histria do surgimento e da necessidade emergente desse tipo de ferramenta, estabelecendo comparaes entre alguns motores, analisando suas semelhanas, diferenas e funcionalidades. Os diretrios so organizados em hierarquias de assuntos, produzidos de forma manual, e abragem uma parte muito pequena da web. Os motores de busca no organizam hierarquicamente os sites, se preocupando menos com a seletividade do que com a abrangncia de sua base de dados. Os meta motores se utilizam de varias mquinas de motores de busca para realizarem suas pesquisas. Na elaborao desse artigo, foi encontrada grande dificuldade na obteno de fontes sobre o assunto. Isso compreensvel, pois busca na Internet hoje em dia uma grande oportunidade de negcio, e nenhum comerciante quer entregar o segredo do seu sucesso ao concorrente. Fica aqui uma sugesto para artigo futuro, sobre esse mesmo tema, mas focado nos meta motores de busca, pois as informaes sobre esse mecanismo ainda so escassas, mas de grande interesse da comunidade.

REFERNCIAS BIBLIOGRFICAS
CENDN, V. Ferramentas de busca na web. Ci. Inf, Braslia, v. 30, n. 1, p. 3949, jan./abr. 2001. GUIMARES, F. Utilizao de ontologias no domnio B2C. PUC - Rio Certificao digital N 0024134/CA, P. 34-46, novembro 2002, disponvel em http://www2.dbd.puc-rio.br/pergamum/ acesso em Outubro de 2005. MOURA, Gevilacio Aguiar Colho de. Sistemas de busca da web: diretrios e mecanismos de busca. [online] Disponvel em http://www.quatrocantos.com/ tec_web/sist_busca/index.htm, acesso em Outubro de 2005 OLIVEIRA, M. Motores de Busca da Web: Verso Final. 2004, disponvel em http://conhecimento.incubadora.fapesp.br/portal/trabalhos/2004/MotoresDeBus ca, acesso em Outubro de 2005 WIKIPEDIA, Disponvel em http://en.wikipedia.org/wiki/Search_engine, acesso em Outubro de 2005 tesesabertas/0024134_02_cap_03.pdf,