Вы находитесь на странице: 1из 30

La Storia dei Motori di Ricerca

Mauro Failla
Fabio Mingoia
Interazione Multimediale
Università Kore Enna anno 2010/2011
Tutto ebbe inizio da…
ARPANET("Advanced Research Projects Agency NETwork", in
italiano "rete dell'agenzia dei progetti di ricerca avanzata), venne
realizzata nel 1969 dal DARPA, l'agenzia del Dipartimento della
Difesa degli Stati Uniti responsabile per lo sviluppo di nuove
tecnologie ad uso militare. Successivamente sviluppata in ambito
universitario e governativo ben presto divenne uno dei più grandi
progetti civili,una rete globale che collega tutta la terra.
… per arrivare a Internet
Arpanet venne totalmente bloccata il 27 ottobre 1980. Definendo il
Transmission Control Protocol (TCP) e l'Internet Protocol (IP), DCA e
ARPA diedero il via ufficialmente ad Internet come l'insieme di reti
connesse tramite questi protocolli.

Internet è una rete di computer mondiale ad accesso pubblico


attualmente rappresentante il principale mezzo di comunicazione di
massa
Primo approccio verso i motori di ricerca
Nello stesso anno della morte di ARPANET, alla McGill University
School of Computer Science (Canada) diedero vita al software
ARCHIE, quello che oggi possiamo definire il primo “motore di
ricerca”(in verità soltanto uno schedatore). Permetteva di sviscerare
all'interno di grandi archivi per gestire il contenuto dei singoli siti a
livello di FTP; ad ogni nome di file di tali archivi è infatti associata
una serie di informazioni (data di memorizzazione, dimensione)
automaticamente archiviate dal programma.
Ecco cosa mancava…
Il dispiegamento delle
potenzialità di Internet e la sua
progressiva diffusione popolare
sono però frutto dello sviluppo
del WWW, il World Wide Web,
un sistema per la condivisione di
informazioni in ipertesto del
1990 sviluppato da Tim Berners-
Lee presso il CERN (Centro
Europeo per la ricerca nucleare).
Definizione e Anatomia di un
Motore di Ricerca
Un motore di ricerca (in inglese search engine) è un sistema automatico che
analizza un insieme di dati spesso da esso stesso raccolti e restituisce un indice
dei contenuti disponibili classificandoli in base a formule statistico-
matematiche che ne indichino il grado di rilevanza data una determinata chiave
di ricerca.
L’evoluzione
La cronologia dei più famosi Motori
Nome Data
Aliweb 1993
Elnet Galaxy 1994
Yahoo 1994
WebCrawler 1994
Lycos 1994
Infoseek 1994

1° Generazione AltaVista 1995


Excite 1995
HotBot 1996
NorthenLight 1997
MSN 1997
Google 1998
Bing 2009
ALIWEB

 Fu annunciato nel novembre del 1993 dallo sviluppatore Martijn Koster

 Permetteva agli utenti di sottoporre la posizione dei file di indice dei loro
siti il che permetteva al motore di ricerca di includere le pagine web e di
aggiungere delle descrizioni della pagina e delle parole chiave scritte
dall'utente.
Elnet Galaxy Yahoo

 Galaxy nasce nel gennaio del 1994,  Iniziato come hobby studentesco ,
era organizzato come lo sono adesso le David Filo e Jerry Yang , crearono nel
directory web. febbraio del 1994 un “deposito di
link” in grado di tener traccia dei loro
 La sua popolarità e diffusione furono interessi personali su internet.
dovute al fatto che, oltre alle normali
funzioni di ricerca web, al suo interno,  Divenuto troppo affollato, il
conteneva funzioni di ricerca Telnet e deposito da loro creato, venne
Gopher. suddiviso in sottocategorie , da qui
nasce il vero e proprio progetto di
Yahoo.
WebCrawler Lycos

Nato nell‟università di Washington e Nato alla Carnegie Mellon University e


rilasciato nell‟aprile del 1994, esso fu il reso pubblico nel luglio del „94 ,
primo spider che indicizzò intere pagine. conteneva 54.000 documenti .

Presto fu così popolare che Caratteristica principale di Lycos era la


divenne impossibile utilizzarlo nelle ore metodologia di ricerca di parole attraverso
diurne. un “matching” di quest‟ultime all‟interno
dei documenti.
Infoseek Alta Vista

Fondato nel 1994 da Steve Kirsch fu Debuttò nel dicembre del 1995.
il primo motore di ricerca utilizzato per
vendere pubblicità. Aveva larghezza di banda quasi infinita,
fu il primo a consentire le query in
Pochi anni dopo Infoseek venne linguaggio naturale, adottò tecniche
acquistata da The Walt Disney avanzate di ricerca le quali consentirono
Company che utilizzò questa tecnologia agli utenti di aggiungere o cancellare i
per poi costituire la Go.com propri URL entro 24 ore.
Excite HotBot

Lanciato nell‟ottobre del 1995, divenne Nato come motore di ricerca Meta, si
ben presto uno dei motori di ricerca più differenziava dagli altri concorrenti per
utilizzati nella rete. la possibilità di scegliere da quale
engine, tra quelli più popolari nella rete,
Caratterizzato dalla tecnologia ICE estrarre i risultati.
(Intelligente Concept Extraction)
consente di cercare non solo le pagine
contenenti specifiche parole chiave, ma
anche dei siti che trattano argomenti
correlati con le parole oggetto della
ricerca.
Northern Light

Introdotto nell'agosto 1997, affianca all'archivio di pagine web un servizio di


accesso completo ad articoli informativi, in uno speciale archivio definito
“Special Collection”.

I tecnici di Northern Light hanno realizzato una tecnologia che


automaticamente classifica le pagine web, con una accuratezza superiore al
90%.
MSN

 Nato nel 1997 sotto il nome di MSN Search, più che essere un motore di
ricerca, era un contenitore di link verso i servizi Microsoft. Il cui obiettivo era
quello di fungere da raccordo tra le mille sorgenti informative di casa Microsoft.

 Nel 2004 fu lanciata la nuova versione beta di quello che adesso è uno dei
motori di ricerca più validi e utilizzati al mondo .
Google

Sviluppato all'università di Stanford da Sergey Brin e Larry Page, due


giovani di 26 anni laureati in scienze informatiche, ha debuttato on-line a fine
settembre 1999 dopo oltre un anno di test.

La caratteristica di Google, è quella di selezionare i risultati di ricerca


valutando l'importanza di ogni pagina web con metodi matematici, in base ad
un controllo di oltre 500 milioni di variabili e di 2 miliardi di termini, tale
tecnologia prende il nome di PageRank.
Bing

 Bing è il motore di ricerca di Microsoft nato dalle ceneri di Live Search nel
giugno 2009 L'obiettivo di Bing è quello di competere con Google.

 Una particolarità di Bing è che presenta un'immagine di sfondo che cambia


ogni giorno.

 La ricerca immagini si differenzia da quella di Google in quanto i risultati


vengono mostrati in un'unica pagina che di volta in volta mostra sempre più
risultati, non vi è quindi bisogno di cambiare pagina.
2° Generazione : Web 2.0

 Si tende ad indicare come Web 2.0 l'insieme di tutte quelle applicazioni


online che permettono uno spiccato livello di interazione sito-utente :
-blog, forum, chat.
- sistemi quali Wikipedia, Youtube, Facebook, Myspace, Twitter.
- programmi di scambio file con tecnologia p2p e torrent.
 Per le applicazioni Web 2.0, spesso vengono usate tecnologie di
programmazione particolari, come AJAX (Gmail usa largamente questa
tecnica) o Adobe Flex.

 Un esempio potrebbe essere il social commerce, l'evoluzione


dell'E-Commerce in senso interattivo, che consente una maggiore
partecipazione dei clienti, attraverso blog, forum, sistemi di feedback ecc.
Social Search Engine
Molti motori e directory internazionali puntano a una maggiore
partecipazione degli utenti nella creazione dei contenuti dei motori di
ricerca, in modo da eliminare qualsiasi ricorso a spider o a link
sponsorizzati.

Con questa logica gli utenti possono


segnalare essi stessi i link e decidono
se dare o meno popolarità ai siti
segnalati.
I principali progetti sviluppati su
questa logica sono al momento solo
stranieri, in Italia il primo motore di
ricerca che ha adottato tale logica è
Ggoal.
 Perché Ggoal?
Per aiutare gli utenti a trovare le informazioni da Internet con semplicità e qualità.

 Ma Google, Yahoo, e MSN non bastavano?


Con Ggoal si hanno dei risultati di ricerca precisi che sono stati selezionati
direttamente dagli utenti.
Invece di avere 44.000.000 di pagine di Google ed avere poi 3 o 4 link realmente utili
con Ggoal si hanno solamente i link utili. Questo significa precisione, qualità e
risparmio di tempo.

 Ggoal usa spider?


No, Ggoal si basa sui contributi della gente e non dei “ragni” (spider) in piena logica
Web 2.0.
3° Generazione : Web 3.0
Il Web 3.0 è un termine a cui corrispondono significati diversi volti a
descrivere l'evoluzione dell'utilizzo del Web e l'interazione fra gli
innumerevoli percorsi evolutivi possibili :
 trasformare il Web in un database, cosa che faciliterebbe l'accesso ai
contenuti da parte di molteplici applicazioni che non siano dei browser;
 sfruttare al meglio le tecnologie basate sull'intelligenza artificiale;
 il web semantico;
 il Web 3D.
Analizziamo il Web 3.0
 Trasformare il Web in un database

Il primo passo verso un "Web 3.0" è l'emergere del "Data Web" visto che gli archivi di
dati strutturati sono pubblicati sul Web in formati riutilizzabili e "interrogabili" da
remoto. Il Data Web è il primo passo verso il vero e proprio Web semantico. Nella
fase di Data Web l'attenzione è principalmente rivolta verso la strutturazione di dati
disponibili utilizzando l'RDF.

Il Resource Description Framework (RDF) è lo strumento base proposto da W3C per


la codifica, lo scambio e il riutilizzo di metadati strutturati e consente
l'interoperabilità tra applicazioni che si scambiano informazioni sul web.
 Un percorso evolutivo verso l'intelligenza artificiale

Il Web 3.0 è stato anche utilizzato per descrivere un percorso evolutivo per il Web che
conduce all'Intelligenza Artificiale capace di interagire con il Web in modo quasi
umano. Alcuni scettici credono invece che ciò sia impossibile da raggiungere.
Nonostante ciò, aziende come IBM e Google stanno implementando nuove tecnologie
che stanno ottenendo informazioni sorprendenti come prevedere le canzoni più
scaricate, attraverso il data mining, sui siti Web universitari
La realizzazione del Web semantico

In linea con l'Intelligenza Artificiale, il Web 3.0 potrebbe costituire la realizzazione e


l'estensione del concetto di Web semantico. I ricercatori accademici stanno lavorando
per sviluppare un software per il ragionamento, basato sulla logica descrittiva e sugli
agenti intelligenti. Tali applicazioni possono compiere operazioni di ragionamento
logico utilizzando una serie di regole che esprimano una relazione logica tra i concetti
ed i dati sul Web.
Il Web 3.0 è stato anche messo in relazione ad una possibile convergenza di
un'architettura Service-oriented.

 Evoluzione verso il 3D

Un ulteriore possibile percorso del Web


3.0 è verso la visione tridimensionale
coniata dal Web3D Consortium. Questo
significherebbe trasformare il Web in
una serie di spazi in 3D.
Questo potrebbe aprire nuovi modi di
connettersi e di collaborare utilizzando
spazi 3D condivisi.
(Magari la Kinect ci potrà essere
d’aiuto in questo !!! )
Semantic Search Engine
Web semantico, termine coniato dal suo ideatore, Tim Berners-Lee , con cui s‟intende
la trasformazione del World Wide Web in un ambiente dove i documenti pubblicati
(pagine HTML, file, immagini, e così via) siano associati ad informazioni e dati
(metadati) che ne specifichino il contesto semantico in un formato adatto
all‟interrogazione, all‟interpretazione e, più in generale, all‟elaborazione automatica.
È lecito prevedere che nel giro di alcuni anni i motori di ricerca baseranno le
proprie tecnologie sia sull'analisi quantitativa dei contenuti (le parole in sé), sia
soprattutto su quella qualitativa (il senso delle parole).
I motori di ricerca saranno, ad esempio, in grado di distinguere il senso della
parola "pesca" a seconda di quale sia il contesto in cui la parola è contenuta
(capire se sia il frutto, la disciplina sportiva, o altro).

Per muoversi in questa direzione Google ha acquisito Oingo (un


tempo noto come "il motore dei concetti") e la tecnologia dell'azienda
che lo creò, la Applied Semantics.
Primi passi verso i Semantic Search
Engine

Kngine è un motore di ricerca a “domanda e risposta” , cerca di comprendere i


documenti e le query di ricerca al fine di fornire risultati significativi.
Il motore è ancora in fase beta , ma possiamo già vedere come è possibile ottenere
risultati mirati in funzione della ricerca fatta.
Se ad esempio cerchiamo quale è il lago più profondo, otteniamo :
Non ci resta che aspettare !
WEB 1.0 WEB 2.0 WEB 3.0

Static HTML Dinamic HTML Semantic Web

Email Video Podcasting Cloud Computing

Forums Blogging Web 3D

Chat Social Network Artificial Intelligence

Low Bandiwidth Hight Bandiwith Very Hight Bandiwith

La Semantic Search Engine rappresenta il futuro del Web, abbiamo visto una
delle prime beta (Kngine)che sviluppa questa tecnologia.
Adesso non ci resta che aspettare e vedere come si muoveranno i colossi
dell’informatica mondiale come Google e Microsoft.
Bibliografia
- http://www.searchenginehistory.com/
- http://www.motoridiricerca.it/
- http://it.wikipedia.org/wiki/Motore_di_ricerca
- http://it.wikipedia.org/wiki/Web_2.0
- http://it.wikipedia.org/wiki/Web_3.0
- http://www.webfandom.com/servizi-web/kngine-
motore-di-ricerca-3-0-basato-sul-web-semantico/
- Tutte le immagini sono state prese dai link sopra
elencati e dal servizio di ricerca immagini di
Google

Вам также может понравиться