informaiei n Internet - Motoare de cutare Curs: Tehnologia informaiei n cercetare Mat. Gabriela MAILAT Ing. Corina POP Prof.dr.ing. Elena HELEREA 2 CUPRINS 1. Introducere 2. Ce este o baz de date Web 3. Metode de indexare 4. Programe de selectare 5. Tehnici de cutare a informaiei in Internet 6. Concluzii 3 Introducere World Wide Web (www) - cea mai important component a Internetului. www - interfa multimedia care presupune posibilitatea accesului la surse ce includ grafice i figuri, imagini, sunete i filme bazate pe tehnologia hypertext. www - leag documentele ntre ele prin conexiuni, formnd un pienjeni (web). 4 Regsirea documentelor pe Web este dificil: nu exist un format standard de descriere a resurselor din Internet exist diferite instrumente de cutare care opereaz n moduri diferite nu este o metod indicat pentru regsirea informaiilor referitoare la un anumit subiect. Introducere 5 Metode de regsire a informaiilor: cutarea dup cuvinte cheie sau expresii, mecanismele booleene, proximitatea, trunchierea etc. OBS. Regsirea unei resurse folosind adresa (URL) este util i rapid dar exist posibilitatea modificrii URL-ului datorit caracterului dinamic al Internet- ului. Introducere 6 Ce este o baz de date Web (Web database) ? O baz de date Web este - o list organizat de pagini web din internet, un gigantic repertoar ce conine o copie a fiecrei pagini nregistrate n list (practic pri mici din acea pagin, cum ar fi titlul, antetul etc). 7 Ce este o baz de date Web (Web database) ? Pentru utilizatorul final, baza de date web furnizeaz o interfa ce are ca i caracteristic un cmp special n care utilizatorul tasteaz cuvintele dup care va efectua cutarea (vezi interfaa cu utilizatorul de la Google), o list cu directoare din care utilizatorul poate alege legtura dorit (vezi Yahoo directories). 8 Metode de indexare Crearea listei cu copiile paginilor poart numele de indexare i fiecare baz de date web o realizeaz n stilul su caracteristic. Exist dou modaliti mai importante de indexare a informaiei n timpul generrii bazelor de date web: indexarea full-text indexarea manual. 9 Metode de indexare Indexarea full-text - include toate cuvintele dintr-o pagin n baza de date pentru cutare, cu ajutorul unor programe speciale de calculator numite pianjeni sau roboi (spiders sau robots). Altavista i Google folosesc pe scar larg aceast tehnic de indexare. Indexarea full-text permite s regsim toate referirile la un anumit termen din documentul indexat. 10 Metode de indexare Indexarea manual - o persoan examineaz paginile ce urmeaz a fi indexate i decide asupra ctorva cuvinte (fraze) cheie ce descriu cel mai bine informaia coninut n respectiva pagin. Ex. (Yahoo directories sau Magellan). Avantaj: - permite utilizatorului s regseasc mai multe legturi utile n urma cutrii, tocmai pentru c un om i nu o main a ales cuvintele cheie ce au fost incluse n indexul bazei de date. 11 Programe de cautare Foarte multe servicii de cutare folosesc programe automate, numite "spiders" sau "robots" (pianjeni sau roboi), ce cltoresc de la site la site ( coleci de pagini web) cutnd pagini www nou aprute sau modificate substanial. 12 Programe de cautare Exist trei clase de baze de date web: baze de date ce gestioneaz TOATE categoriile de pagini WWW; baze de date ce gestioneaz NUMAI paginile WWW considerate populare (n principiu cele cu numr mare de vizitatori); baze de date ce gestioneaz NUMAI paginile WWW ce ndeplinesc anumite criterii (legate fie de calitatea informaiei furnizate, fie de tipul de informaie urmrit ex. medical, tiinific, tiri etc). 13 Tehnici de cutare a informaiei pe Internet i. Motoare de cutare ii. Directoare web (anuare online, repertoare tematice) iii. Biblioteci virtuale iv. Invisible (deep) Web v. Motoare de meta-cutare (metasearch engine) vi. Utilitare de cutare de tip desktop 14 Tehnici de cutare a informaiei pe Internet i. Motoare de cutare Este definit ca un serviciu de regsire a informaiilor stocate n bazele de date, care descrie principalele resurse din Web. 15 Motoare de cutare Este o baz de date coninnd pagini Web ce pot fi regsite pe baza unor cuvinte cheie i care continu s scaneze Internetul, cu ajutorul unor programe automate (spiders, robots) n cutare de pagini noi. Informaia rezultat n urma activitii roboilor este apoi indexat i stocat n baza de date. Tehnici de cutare a informaiei pe Internet 16 La lansarea unei cutri se exploreaz de fapt coninutul bazelor de date, n care sunt stocate informaii colectate automat de roboi i nu Web-ul n mod direct. Se recomand utilizarea a cel puin dou utilitare pentru aceeai cerere formulat datorit modului propriu de funcionare a fiecrui motor de cutare i a paginilor web existente (diferite de la un utilitar la altul). Tehnici de cutare a informaiei pe Internet Motoare de cutare 17 Tehnici de cutare a informaiei pe Internet Instrumentele de cutare sunt programe destinate obinerii de informaii. Metodele de cutare pot fi diferite: arborescent sau de tip director (directory ex. LookSmart), mecanism de cutare (search engine ex. Alta Vista), o combinatie ntre tipurile arborescent i mecanism de cutare (directory/search engine ex. Excite, Yahoo) i multi-mecanism (multiengine ex. All-In-One, Metacrawler). Motoare de cutare 18 1. Motoare care funcioneaz dup modelul directorului (arborelui de subiecte), de fapt dup un ghid web n care locaiile sunt organizate pe subiecte i subsubiecte, ntr-o structur ierarhic, pornind de la un subiect general i ajungnd la subiecte cu caracter din ce n ce mai specifice. Motoare de cutare Tehnici de cutare a informaiei pe Internet 19 2. Motoare care funcioneaz dup modelul indexului de cutare, n cazul crora soft-urile sunt cale care efectueaz cutarea dup cuvinte cheie, bazndu-se pe tehnici de indexare computeriate, rezultatele obinute fiind prezentate ntr-una sau mai multe pagini web, care ofer o list de locaii aranjat n ordinea probabilitii de potrivire a ceea ce se caut (Alta Vista, Google etc.) Motoare de cutare Tehnici de cutare a informaiei pe Internet 20 3. A treia metod de cutare este o metod combinat: directory/search engine. - folosesc ambele metode descrise mai sus, i se bazeaz pe un sistem de cutare ierarhic, la fiecare pas putndu-se accesa un mecanism de cutare, efectundu-se apoi, dac se dorete, o cutare dup cuvinte-cheie. Aceste utilitare de cutare adaug selectiv materiale la baza de date i revizuiesc site- urile bazate pe coninut. Motoare de cutare Tehnici de cutare a informaiei pe Internet 21 Ele pot exclude site-urile ce conin materiale inacceptabile, sau pot accepta doar acele site-uri, pe care le consider potrivite. Se folosesc de o varietate de criterii pentru a evalua site-urile posibile, incluznd calitatea materialului i cantitatea materialului. Exemplu de utilitar de cutare specific: Magellan. Tehnici de cutare a informaiei pe Internet 22 4. A patra metod multi-mecanism (multi- engine ex. All-In-One, Metacrawler, Mamma etc.) face referire la acele motoare de cutare care analizeaz coninutul tuturor celorlalte categorii de motoare. Nu totdeauna aceste motoare de cutare sunt i cele mai practice din cauza numrului foarte mare de rezultate afiate. Motoare de cutare Tehnici de cutare a informaiei pe Internet 23 Tehnici de cutare a informaiei pe Internet Dac n urma unei cutri, dup cuvnt- cheie, rezultatele cercetrii pentru cuvntul respectiv sunt pe ultima pagina a motorului de cutare utilizat, atunci se reformuleaz interogaia sau se schimb motorul de cutare. Motoare de cutare 24 Tehnici de cutare a informaiei pe Internet Motoarele de cutare funcioneaz autonom i pot fi identificate adrese diferite utiliznd aceeai interogaie pe motoare de cutare diferite, sau s fie identificate aceleai adrese utiliznd ns interogaii diferite pe acelai motor de cutare. Cteva reguli generale care pot ajuta la cutarea informaiei n Internet vor fi prezentate n continuare. Motoare de cutare 25 Tehnici de cutare a informaiei pe Internet 1. Formulai interogaii ct mai scurte i utilizai cuvinte-cheie. Este necesar s reinei faptul c un calculator, nu o persoan, va analiza ceea ce a fost supus examinrii/cercetrii. Supunnd cercetrii interogaii lungi precum A vrea sa tiu cine a fost Einstein va ngreuna munca motorului de cutare i va duce la rezultate nerelevante. O formulare mult mai adecvat poate fi simpla introducere a numelui lui Einstein i eventual a domeniului fizic. 26 Operatorii sunt reguli sau instruciuni speciale folosite ntr-o cutare pe baz de cuvinte cheie, pentru a formula ntrebri sau cereri. Cutarea pe baz de cuvinte cheie se ncepe prin scrierea unui cuvnt n caseta "search box" a paginii "home" a motorului de cutare. Pentru a construi o cerere, se pot folosi operatorii adecvai din motorul de cutare n care se desfoar sesiunea de lucru. n timp ce fiecare motor de cutare are operatori proprii, exist civa comuni pentru toate utilitarele de cutare: 2.Utilizai operatori logici pentru a va formula interogaia Tehnici de cutare a informaiei pe Internet 27 Tehnici de cutare a informaiei pe Internet a) Operatorii AND, OR, NEAR si NOT pot fi folosii pentru a conecta cuvinte i termeni n cadrul unei cereri, cu sensurile lor logice: AND nseamn c ambele cuvinte sunt prezente n cadrul documentelor. 28 Tehnici de cutare a informaiei pe Internet NEAR nseamn c un termen trebuie s fie gsit n cadrul unui numr specificat de cuvinte. OR nseamn c cel puin un termen este prezent, iar NOT exclude prezena unui termen. 29 b) Cnd folosii aceti operatori, nu uitai s-i scriei cu litere mari, fr s lsai un spaiu ntre operator i termenii care i urmeaz. c) Semnele + i -; + naintea unui termen (fr spaii) ajut la regsirea doar a documentelor coninnd acel termen i este similar cu AND; - este similar lui NOT, regsind documentele care nu conin respectivul termen. d) Apostrofurile () sau ghilimelele () marcheaz cuvinte care trebuie tratate exact cum sunt. Aceste semne sunt similare cu operatorul NEAR. Tehnici de cutare a informaiei pe Internet 30 e) Parantezele sunt utilizate ca i semnele de la c), dar cuvntul dintre paranteze este considerat o singur entitate. f) Cuvintele scrise cu majuscule sunt tratate ca un nume propriu. Virgulele separ numele proprii. g) Un asterisc ndeplinete funcia de lrgire a rdcinilor. Plasai un asterisc * la sfritul cuvntului pentru a gsi toate cuvintele ce ncep cu literele tiprite. Spre exemplu, cutnd istorie, el creeaz legturi cu paginile Web cu cuvintele istorie, istorici, istoriografie. h) Utilizai operatorul logic ADJ (adiacent) dac dorii s gsii documente n care termenii apar unul lng altul, n orice ordine. Tehnici de cutare a informaiei pe Internet 31 Tehnici de cutare a informaiei pe Internet i) Operatorul FAR (departe) este opus operatorului NEAR. Cnd utilizai FAR, vor fi gsite documentele n care termenii se afl la o distan mai mare de 25 de cuvinte unul de altul. (expl.: Lycos). FAR se utilizeaz foarte des mpreun cu alte expresii. De exemplu, putei s cutai istorie FAR antic NOT "istorie antic" i vei gsi pagini ce conin ambele cuvinte dar nu istorie antic. j) Operatorul BEFORE (nainte) funcioneaz foarte asemntor cu AND. Unica deosebire este c termenii trebuie s apar n ordinea pe care o specificai, dar pot s se afle la orice distan n acelai document. 32 Observaii 1). Marcai cu Bookmark (sau Favorites), fiecare instrument de cutare preferat, pentru a facilita utilizarea ulterioar. De asemenea, marcai i unele "home pages" folosite des i care au nume lungi i complicate. 2). Unele instrumente de cutare ofer opiuni de cutare n diferite domenii i categorii, care ajut la limitarea focalizrii n cutarea d-voastr. Selectnd una sau mai multe dintre aceste opiuni, putei s mrii relevana potrivirilor din cutare. Aceste opiuni sunt scrise, de obicei, lng casetele de cutare. Tehnici de cutare a informaiei pe Internet 33 Tehnici de cutare a informaiei pe Internet 3). Pot fi cazuri cnd un instrument de cutare nu se conecteaz la o locaie Web, dintr-un anumit motiv: - ai uitat s scriei sau ai scris greit un cuvnt n adres, aa c verificai! - exist probleme la accesarea locaiei, ori chiar locaia este deconectat, din diverse motive. n astfel de cazuri, revenii mai trziu. - locaia a fost deconectat definitiv, dar s-au pstrat anumite legturi. Uneori exist trimiteri ctre noua locaie a documentului. 4). Folosii seciunea de Help a mecanismelor de cutare pe care le utilizai cel mai des. 34 Tehnici de cutare a informaiei pe Internet 5). La cutrile pe baz de cuvinte cheie, cel mai bine este s formulai cereri n concordan cu mecanismul de cutare particular pe care l utilizai. Aceasta presupune o bun cunoatere i nelegere a regulilor de formulare a cererilor. O cerere bine formulat este hotrtoare pentru relevana rspunsurilor i reduce numrul de potriviri necorespunztoare. 6). Un numr extraordinar de mare de potriviri se datoreaz unei cereri de cutare pe baz de cuvinte individuale, de aceea este bine s folosii cuvinte legate ntre ele, ca un cuplu de cuvinte. 35 Tehnici de cutare a informaiei pe Internet 7). Unele locaii Web conin multe elemente grafice pe care nu le putei omite. n cazul n care calculatorul vostru efectueaz transferul prea ncet, este mai bine s folosii instrumente de cutare care nu au prea multe elemente grafice. Printre acestea sunt: Hotbot, Infoseek i Mamma. Cu multe imagini grafice sunt LookSmart i OneKey. 8). Cnd formulai o cerere, ncercai s folosii cuvinte obinuite, exceptnd cazurile n care trebuie s apar cuvinte sau sintagme speciale. Altfel, vei obine un numr enorm de potriviri. 36 Tehnici de cutare a informaiei pe Internet Motoare de cutare renumite: Google (www.google.com) AlltheWeb (www.alltheweb.com) MSN (www.msn.com) Teoma (www.teoma.com) AltaVista (www.altavista.com) WiseNut (www.wisenut.com) 37 Tehnici de cutare a informaiei pe Internet ii. Directoare web (anuare online, repertoare tematice) Un serviciu de directoare web este o colecie de pagini Web selecionate i organizate ierarhic n categorii de subiecte de ctre un editor uman. Un concept mai selectiv este cel de bibliotec virtual, care este un director web ce include legturi spre pagini cu informaie de nalt specializare, pe domenii alese de editor. 38 Tehnici de cutare a informaiei pe Internet Serviciile de directoare acoper i indexeaz o poriune mult mai mic din paginile WEB existente, comparativ cu motoarele de cutare. Dar folosirea lor poate duce la regsirea unor rezultate ale cutrii mult mai relevante pentru utilizator. 39 Tehnici de cutare a informaiei pe Internet Cele mai extinse servicii de directoare web indexeaz cel mult cteva milioane de pagini, comparativ cu cele cteva miliarde indexate de ctre motoarele de cutare mai importante. Serviciile de directoare NU interogheaz direct paginile WEB, ci caut n interiorul bazei lor de date. Rezultatul cutrii poate duce la returnarea unor rezultate, care nu mai au relevan. 40 Tehnici de cutare a informaiei pe Internet O serie de motoare de cutare sunt de fapt unelte hibride, fiind n acelai timp att motoare de cutare ct i servicii de directoare (Google, de exemplu, unul dintre cele mai cunoscute motoare de cutare, are i un serviciu de directoare, bazat pe soluia Open Directory Project). 41 Tehnici de cutare a informaiei pe Internet Dintre serviciile de directoare web, mai cunoscute sunt : Yahoo! (www.yahoo.com) Google Directory (www.google.com) Open Directory Project (ODP) (http://dmoz.org) Zeal (www.zeal.com) JoeAnt (www.joeant.com) Gimpsy (www.gimpsy.com) 42 Tehnici de cutare a informaiei pe Internet Motoare de cutare versus servicii de directoare Cele mai uzuale modaliti de accesare a paginilor WEB se regsesc n aa numitele motoare de cutare, respectiv n aa numitele directoare web. 43 Tehnici de cutare a informaiei pe Internet Modaliti de cutare a informaiei Motoarele de cutare permit utilizatorului s foloseasc orice termeni de cutare (combinaie de termeni) dorete, motorul cutnd aceti termeni n baza de date i returnnd paginile care conin aceste combinaii de termeni. 44 Tehnici de cutare a informaiei pe Internet Servicii de directoare web Serviciile de directoare web au paginile organizate n baza de date pe subiecte. Paginile cu informaia dorit pot fi selectate navignd prin acest arbore de directoare. 45 Tehnici de cutare a informaiei pe Internet Navigarea prin structura directoarelor web poate fi un foarte bun nceput pentru cutarea informaiei dorite, cu condiia ca topicul ales sa fie considerat ca subiect pentru o arborescen de directoare. 46 Tehnici de cutare a informaiei pe Internet v Site-ul Yahoo include att un motor de cutare ct i un arbore de directoare web. Diferena fa de un motor de cutare obinuit este dat de faptul c motorul de cutare al Yahoo caut cuvintele cheie doar n interiorul directoarelor web din baza de date a Yahoo. 47 Tehnici de cutare a informaiei pe Internet Din acest motiv motorul de cutare al site- ului poate fi folosit cel mult pentru a identifica zona din arborele de directoare ce conine informaia dorit. 48 Tehnici de cutare a informaiei pe Internet Prezentarea rezultatelor Odat ce au fost introdui termenii de cutare, serverul i caut n baza de date web indexat i returneaz lista cu rezultate. Din cauza multitudinii de legturi cu informaie nerelevant pentru utilizatorul ce a efectuat cutarea, trebuie subliniate dou concepte deosebit de importante n evaluarea listei cu rezultate ale cutrii: rata de relevan (relevancy ranking), respectiv rezumatul (abstract) ce nsoete legtura ctre pagin. 49 Tehnici de cutare a informaiei pe Internet Paginile gsite n urma cutrii sunt aproape ntotdeauna prezentate n ordinea relevanei lor, n conformitate cu termenii dup care s-a efectuat cutarea. 50 Tehnici de cutare a informaiei pe Internet n cazul celor mai multe servicii de cutare web se poate observa c aproape fiecare legtur spre o pagin considerat relevant este nsoit de un scurt rezumat al coninutului, multe servicii recurgnd chiar la sublinierea (ngoarea) termenilor folosii n respectivul rezumat. 51 iii. Biblioteci virtuale a) Biblioteci virtuale de uz general: Librarians' Index to the Internet (www.lii.org) INFOMINE (www.infomine.com) Internet Public Library (www.ipl.org) The WWW Virtual Library (vlib.org) Academic Info (www.academicinfo.net) Internet Scout Project (scout.wisc.edu) BUBL Link (academic resources) (bubl.ac.uk/link/) Tehnici de cutare a informaiei pe Internet 52 b) Biblioteci virtuale de specialitate (orientate spre anumite domenii): Project Gutenberg (www.gutenberg.org) - beletristic National Academies Press (www.nap.edu) - tiin Free books for doctors (www.fb4d.com) - medicin The free management library (www.managementhelp.org) - management Tehnici de cutare a informaiei pe Internet 53 iv. Invisible (deep) Web Reprezint colecii de informaii online stocate n baze de date accesibile pe Web, dar care, din diferite motive, nu sunt indexate de motoarele de cutare tradiionale. Aceste servicii pot fi ntlnite i sub numele de servicii speciale de cutare (specially search engines). Tehnici de cutare a informaiei pe Internet 54 ProFusion (www.profusion.com) Invisible-web (www.invisible-web.net) Complete Planet (www.completeplanet.com) Resource Discovery Network (www.rdn.ac.uk) Direct Search (http://www.freepint.com/gary/direct.htm) http://www.resourceshelf.com/ Tehnici de cutare a informaiei pe Internet 55 v. Motoare de meta-cutare (metasearch engine) Un motor de meta-cutare este o unealt de cutare care trimite cerea dumneavoastr simultan ctre mai multe motoare de cutare clasice, servicii de directoare web i uneori spre colecii de tip invisible web. Tehnici de cutare a informaiei pe Internet 56 Dup colectarea rezultatelor cutrii de la toate serviciile apelate, motoarele de meta-cutare elimin legturile aflate n duplicat i, conform unui algoritm propriu combin rezultatele ntr-o singur list, acordndu-le i o rat de relevan. Majoritatea motoarelor de meta-cutare iau n considerare numai primele 10-20 de legturi din lista furnizat de fiecare motor de cutare apelat, rezultatele cutrii vor fi foarte bune, din punctul de vedere al relevanei. Tehnici de cutare a informaiei pe Internet 57 Motoarele de meta-cutare NU au propriile baze de date web, ci le folosesc pe cele ale serviciilor apelate. Motoarele de meta-cutare nu permit nscrierea manual a unei pagini (site) n baza de date. Tehnici de cutare a informaiei pe Internet 58 Unele dintre cele mai cunoscute motoare de meta-cutare sunt: Metasearch (www.metasearch.com) ez2Find (www.ez2find.com) Vivisimo (www.vivisimo.com) MetaCrawler (www.metacrawler.com) InfoGrid (www.infogrid.com) Infonetware (www.infonetware.com) iBoogie (www.iboogie.tv) Tehnici de cutare a informaiei pe Internet 59 vi. Utilitare de cutare de tip desktop Un tip special de motoare de meta-cutare sunt utilitarele de cutare de tip desktop (client side search software). Aceste utilitare sunt programe ce pot fi descrcate de pe Internet i instalate pe propriul calculator (local). Principiul lor de funcionare este oarecum similar cu al motoarelor de meta-cutare. Tehnici de cutare a informaiei pe Internet 60 Cteva dintre cele mai utilizate utilitare de acest fel sunt: Google Desktop (desktop.google.com) Copernic (www.copernic.com) Arrow Search (www.rt-software.co.uk/arrow_search/) WebFerret (www.ferretsoft.com/download.htm) ProtoSearch (www.npccenterprises.com/products/protosearch2.shtml) Tehnici de cutare a informaiei pe Internet 61 Motoarele de meta-cutare sunt unelte complementare excelente, ns datorit unor considerente (numr relativ mic de legturi luate n considerare de la fiecare serviciu apelat, imposibilitatea de a folosi eficient tehnici avansate de cutare etc. ) NU pot elimina necesitatea folosirii unor motoare de cutare clasice. Tehnici de cutare a informaiei pe Internet 62 CE TEHNICI DE CUTARE SE FOLOSESC ? 1. Dac cunoatei exact ce tip de informaie dorii s aflai, este recomandat folosirea motoarelor de cutare. De exemplu pentru a gsi informaii despre pal sau wood putei folosi motoarele de cutare, deoarece informaia nu este suficient de specific pentru a fi subiectul unui arbore de directoare, dar domeniul este suficient de bine conturat pentru a nu fi necesar recurgerea la un motor de meta-cutare. Tehnici de cutare a informaiei pe Internet 63 2. Dac vei cuta informaii despre un anumit termen sau o combinaie de termeni i dorii o analiz exhaustiv a temei analizate, este de preferat recurgerea la motoare de meta-cutare, ce pot apela simultan mai multe servicii web (10 -12 motoare de cutare sau directoare web). De exemplu, cutarea dup termenul composite (vezi composite plates) Tehnici de cutare a informaiei pe Internet 64 3. Dac dorii s cutai informaii generale despre subiecte cu grad ridicat de popularitate, este indicat folosirea serviciilor de directoare web. Astfel dac dorii informaii despre industrial plants, este mult mai indicat s folositi serviciul de directoare Yahoo, n care putei naviga cu uurin, informaia este bine organizat i exist i faciliti de cutare prin arborele de directoare. Tehnici de cutare a informaiei pe Internet 65 4. Dac dorii, informaii pertinente legate de anumite domenii ale literaturii, tiinei etc. este preferabil folosirea serviciilor tip bibliotec virtual. Tehnici de cutare a informaiei pe Internet 66 5. Dimpotriv, dac dorii informaii n timp real sau informaii al cror coninut se schimb dinamic (tiri, prognoze meteo, mersul trenurilor) folosii baze de date web specializate (invisible or deep web). Tehnici de cutare a informaiei pe Internet 67 Muli dintre deintorii de servicii WEB au ales s i diversifice activitatea furniznd mai multe servicii sub aceeai interfa utilizator. Astfel s-a cristalizat un nou concept, acela de PORTAL WEB. Tehnici de cutare a informaiei pe Internet 68 Portalul Web - un site WEB ce ofer o gam larg de servicii i resurse online, cum ar fi: e-mail, forumuri de discuii, motoare de cutare, directoare web, comer electronic etc. (a se vedea www.yahoo.com, unul dintre cele mai cunoscute servicii de cutare, transformat ntr-un portal). Tehnici de cutare a informaiei pe Internet 69 Concluzii Motoare de cutare Motoarele de cutare sunt probabil cea mai utilizat cale de accesare a informaiei stocate n bazele de date Web. Principalii pai necesari pentru a utiliza eficient un motor de cutare sunt urmtorii: 1. Formulai-v atent nevoia de informare. ncercai s facei aceasta ct mai simplu i specific cu putin; 2. Spargei cererea de mai sus ntr-o serie de termeni de cutare; 3. Gsii sinonime pentru fiecare termen identificat; 70 4. Atunci cnd este posibil, recurgei la fraze (termeni specificai n ghilimele); 5. Combinai sinonimele termenilor de cutare prin intermediul operatorului OR i legai aceste combinaii prin intermediul operatorului AND; 6. Analizai circa 30 de rezultate nainte de a cuta din nou; 7. Dac este posibil, nainte de a rencepe cutarea, folosii pagini cu informaie similar celei cutate pentru a identifica noi termeni de cutare i sinonime ale acestora. Concluzii Motoare de cutare