Вы находитесь на странице: 1из 14

Cmo buscar y encontrar informacin en Internet

Se calcula que en Internet hay cerca de 60 millones de pginas web de informacin y que circulan por la Red unos 100.000 mensajes pblicos diarios con todo tipo de referencias. Esto crea una situacin en la que hay buenas y malas noticias: las buenas, que cada vez hay ms informacin pblica sobre todos los temas imaginables; las malas, que encontrarla no siempre es tan fcil como a muchas personas les gustara, sobre todo a los principiantes. Nunca lo de encontrar la aguja en el pajar tuvo un equivalente ms real, ni era posible imaginar un pajar tan grande, creciendo da a da y que se llena de agujas cada vez ms y ms interesantes. Cuando se habla de Internet, se suele describir en primer lugar la gran cantidad de pginas con informacin disponible que hay en ella, pero la parte ms complicada (las bsquedas) queda siempre en un segundo plano, como desagradable sorpresa para quienes se conectan por primera vez. Es el navegante el que tiene que ingenirselas para dar con la informacin deseada. En muchas ocasiones, la informacin y la bsqueda en s estn llena de paradojas y situaciones extraas, muchas veces frustrantes. En cualquier caso, es normal cierta confusin entre los principiantes a la hora de buscar algo en Internet: la Red est llena de informacin valiosa, pero tambin hay muchsima informacin poco relevante (denominada ruido) que hace perder tiempo a la hora de buscar algo. Los propios sistemas de bsqueda no son perfectos, y el desconocimiento de las herramientas empeora las cosas. El dicho popular todo lo que puedas soar que existe est en Internet tiene mucho ms de cierto que de falso, pero no dice nada sobre lo fcil o difcil que pueda ser encontrar lo que uno busca. Cualquiera que lleve tiempo circulando por la Red le podr confirmar que seguramente existe eso que por razones de trabajo o aficin est buscando, pero tambin debe advertirle que necesitar algo de tiempo para aprender a usar los buscadores y filtrar el ruido recibido hasta dar en la diana. Tal vez sea la temperatura de una remota ciudad, una descripcin del penacho de Moctezuma o una foto de un carnero merino... La pgina ms interesante sobre Kenneth Branagh, por ejemplo, puede estar escondida entre quinientas otras con referencias sobre el actor, sus pelculas, citas y referencias a Shakespeare, pero se puede terminar encontrando con un poco de paciencia. [Incidentalmente: todos los ejemplos anteriores y los que ver en este artculo son reales, pero se necesitaron entre 2 minutos y una hora para encontrarlas en los lugares adecuados.] Muchas veces, los usuarios terminan padeciendo lo que se denomina angustia de la informacin: hay demasiados datos revoloteando por el ciberespacio, imposibles de procesar (o encontrar) por un ser humano por mucho tiempo que le dedique al da, y la tarea de encontrar lo mejor sobre... se convierte en una misin imposible. En ocasiones esto hace que la persona se desespere al buscar una pgina o documento sobre un tema determinado, y que olvide lo ms importante: dedicar previamente unas horas (o das) a comprender exactamente cmo funcionan los sistemas de bsqueda de Internet. Si se mira de otro modo, es como aprender el funcionamiento de un nuevo software para sacarle el mayor partido: todo el tiempo empleado en esta formacin es extremadamente valioso e importante. Un poco de historia Hasta la llegada de Internet, pocas personas consideraban factible poder localizar toda la informacin publicada sobre un tema de su inters en peridicos, revistas, agencias, notas de prensa e informes corporativos de empresas u organizaciones. Y mucho menos podan imaginar que algn da podran acceder al instante a informacin detallada sobre esos temas 1

en debates, y ver opiniones y aportaciones de otras personas con intereses similares a los suyos. Con la llegada de Internet, todo esto ha cambiado: las posibilidades de la Red global han hecho que empresas y organizaciones se preocupen de hacer pblica su informacin en forma de pginas web para promocionar productos, servicios o ideas, sean unas zapatillas deportivas, un programa poltico o un proyecto para la conservacin ecolgica de algn paraje remoto. Por otra parte, la red Usenet (englobada en Internet) ofrece ms de 13.000 grupos vivos de noticias y charla entre usuarios en los que quedan publicados miles de mensajes a diario de todas partes del mundo, sobre cualquier tema imaginable: ciencia, poltica, series de televisin, discusiones tcnicas y cientficas y partidas de ajedrez, entre otros. Afortunadamente, desde que la Red fue consciente de su crecimiento y de la dificultad a la hora de catalogar la informacin, aparecieron diversas empresas que basan su negocio en recopilar de un modo u otro toda esa informacin y hacer que est a disposicin de cualquier navegante. Lo que verdaderamente ha cambiado con la llegada de Internet es que toda la informacin de la Red existe en formato digital y que miles de ordenadores de todo el mundo la almacenan pblicamente. Gracias a ello, se puede buscar cualquier palabra o concepto y acceder a ella en cuestin de segundos. Lo mejor de todo es que no hace falta ningn programa especial: existen buscadores de Internet, en forma de pginas de la World Wide Web a las que se puede acceder con cualquier programa navegador desde un ordenador personal. Con una nueva pgina publicada en algn punto de la World Wide Web de Internet cada dos o tres segundos, y ms de un mensaje de texto por segundo en Usenet haciendo comentarios o dando una opinin, ningn ser humano podra mantener un catlogo de todo ello. Sin embargo, muchas empresas se dedican a realizar esta tarea clasificando la informacin ms relevante de forma temtica y manual: son los llamados ndices de Internet, simbolizados por el precursor de todos ellos, Yahoo. Con la llegada de nuevas tecnologas y mejores conexiones, tambin aparecieron nuevos sistemas ms potentes que recopilaban toda la informacin de la World Wide Web y de Usenet: los motores de bsquedas. Encabezados por AltaVista, de Digital, los servicios de este tipo emplean robots inteligentes que saltan de una pgina a otra de la Web (a travs de los enlaces de hipertexto) recogiendo pginas y almacenando toda la informacin en una gigantesca base de datos. Cada sistema tiene sus ventajas y desventajas, y ninguno es perfecto ni completo ni est exento de fallos de precisin. Teniendo en cuenta lo cambiante de la Red (se dice que una direccin URL tiene una vida media de menos de dos meses antes de que desaparezca o cambie de sitio), esto es inevitable. La a propia idiosincrasia de los usuarios y organizaciones que publican la informacin hace que encontrar lo que se busca sea a veces una rdua tarea. Antes de empezar Hay que dejar claras algunas premisas y conceptos antes de dedicarse a buscar informacin en Internet, que ayudan a hacerse una idea de la situacin.

Es muy probable que exista en Internet la informacin que usted busca. Esta es la premisa bsica, que resulta cierta casi siempre. (Si no lo cree, haga una prueba en serio y sorprndase con los resultados). Naturalmente, para comprobar hasta que punto es cierto hay que hacer un pequeo ejercicio mental al respecto: calcular qu posibilidades hay de que gente con intereses similares haya publicado esa informacin, si existen empresas, organismos o grupos que trabajen sobre ese tema en concreto, o si hay aficionados suficientes que compartan esa misma dedicacin y hablen sobre ello o recopilen informacin. Algunos ejemplos: si usted busca una lista de pelculas en las que participe un actor determinado, a buen seguro que habr diversas bases de datos de cine y aficionados que habrn recopilado esa informacin. Si necesita una fotografa de un animal, es factible que la pueda encontrar en algn archivo dedicado (sitios dedicados a la fotografa, archivos histricos, informes de bilogos, zoolgicos, etc.) Si quiere ampliar informacin sobre un fenmeno astronmico para un trabajo de clase, seguramente encontrar informacin publicada por eminentes cientficos, profesores y alumnos en cualquier universidad del mundo, o transcripciones de entrevistas, conferencias o artculos en revistas especializadas. No todo el mundo publica toda la informacin en Internet. Este primer problema hace referencia, especialmente, a entidades o empresas cuyos negocios se basan precisamente en vender informacin. El mejor ejemplo son los peridicos: cualquiera de ellos puede leerse casi en su totalidad en Internet, pero en general no mantienen ni todos los archivos de su hemeroteca (tal vez, slo una semana o un mes) ni la informacin tiene el mismo lujo de detalles (secciones, fotos, grficos, actualizaciones, etc.) Con las editoriales que publican libros y enciclopedias sucede algo parecido: podr consultar listas de publicaciones, tal vez leer algunos ndices e incluso captulos de algunos libros, pero no espere poder leer la totalidad de un libro en Internet. [Una curiosa excepcin son los libros antiguos, libres de derechos de autor.] No todo el mundo est en Internet, o no est al cien por cien, o no publica la informacin como se debera publicar. Aunque cada vez son ms las empresas y entidades en la Red, no todas estn all. Si usted busca informacin sobre un partido poltico espaol determinado, puede encontrarse con que todava no tiene pgina web. O que la pgina web es puramente testimonial (sin contenidos interesantes). O incluso que publica slo una pequea parte de lo que podra mostrar en formato digital, a pesar de editar su programa electoral y emitir notas de prensa y comunicados. El Boletn Oficial del Estado, por ejemplo, publica nicamente los resmenes diarios, no el boletn completo (que se debe comprar por separado). El Gobierno, por otro lado, publica todas las notas de prensa oficiales desde el web de La Moncloa, aunque no siempre estn al da ni son de fcil acceso. Preprese a encontrar informacin en otros idiomas. No se asuste: es lo ms normal. La Red es un fenmeno mundial, y el castellano slo supone una mnima parte (entre un uno y un tres por ciento, se calcula) del total. A menos que lo que usted busque sea algo realmente interesante y popular en Espaa (y alguien lo haya tratado con dedicacin) es probable que slo lo encuentre en algn recndito lugar y generalmente en ingls. Los interesantes documentos de preguntas y respuestas sobre temas concretos (FAQ) suelen estar slo en ingls, como el resto de la documentacin oficial de Internet. El hecho de que las universidades americanas estn mucho ms avanzadas en todos los aspectos tcnicos hace que tanto alumnos como profesores publiquen trabajos e informes, que naturalmente estn en ingls. El ingls es tambin el principal idioma de las agencias y los medios de comunicacin escritos. Los web oficiales de las grandes multinacionales suelen estar en ingls, y las versiones espaolas son generalmente pobres, con poca informacin y menos mantenimiento. Por lo tanto, esos datos astronmicos o esa explicacin sobre una nueva tcnica quirrgica las encontrar seguramente slo en ingls. Las biografas de toreros son (por pura lgica) ms difciles de encontrar en ingls, aunque no slo por el idioma: sencillamente, menos gente a nivel mundial est interesadas en ellas y depender de que alguien haya hecho ese trabajo en 3

Espaa o no y lo haya publicado en Internet (los documentos sobre Bisbol, en cambio, mucho ms numerosos). La nica excepcin a esto es que la informacin en castellano engloba no slo a Espaa sino tambin a todos los pases de Latinoamrica ms integrados en Internet, especialmente Mxico, Argentina y Per, donde suele haber datos interesantes. No toda la informacin est en la red de la World Wide Web. Aunque la WWW es la mayor red multimedia de la actualidad, y la de ms fcil acceso, hay informacin que no est publicada en la Web, sino que debe buscarse en otros lugares de Internet, principalmente Usenet (la zona de debate a base de mensajes de texto, con ms de 13.000 grupos internacionales). Esto incluye bases de datos especializadas (a las que a veces se puede acceder desde la Web y a veces no, y hay que usar otros programas clientes como Telnet, en modo texto) o redes privadas o comerciales (como las que hay a disposicin de mdicos, abogados o prensa). Si su trabajo gira en torno a una especialidad, lo mejor es localizar primero los principales sitios de la WWW que mantengan colegas de trabajo o investigacin, y comenzar por ah. En ocasiones, la informacin que se encuentra en las pginas web lleva a servidores de archivos (FTP) o listas de correo (e-mail) que generalmente escapan a las labores de catalogacin de los buscadores. Ejemplo: si los datos de una empresa que usted busca estn en las Pginas Amarillas, tambin estarn en la base de datos del mismo nombre que hay en la web (www.paginas-amarillas.es), a la que se puede acceder con un navegador... pero el texto en s (informacin, direccin, telfono, etc.) no est de por s almacenado en los buscadores, hay que llegar a l a travs de la pgina de esa base de datos. No pida imposibles. Alguien pregunt una vez en qu lugar de Internet puedo encontrar una previsin meteorolgica detallada de los prximos 30 das?. Aunque la Red est llena de pginas con previsiones, fotografas de satlites, mapas y datos sobre temperaturas de todas las ciudades del mundo, la pregunta en s es un imposible: nadie puede publicar esa informacin porque sencillamente el tiempo no es predecible a tan largo plazo. Piense dos veces antes de intentar buscar algo que no va a encontrar en Internet ni encontrara en la mejor biblioteca o archivo del mundo. No encontrar los nmeros de la loto de la prxima semana ni el sentido de la vida, aunque tal vez s muchas teoras al respecto (sobre ambas cosas). Preprese a filtrar la informacin. Parte de lo que hay en Internet son datos objetivos, pero una parte ms importante todava son opiniones. Cuando se localiza la informacin deseada, hay que usar un filtro racional para valorar si lo que ha encontrado tiene sentido: si se trata de un trabajo con datos objetivos, una teora o simplemente un punto de vista. Por ejemplo: si usted investiga sobre la Alemania Nazi, se encontrar con pginas web perfectamente diseadas y con todo lujo de detalles y referencias que explican que en realidad no muri ningn judo en los campos de concentracin y que todo es una enorme conspiracin (!). En cambio, otras pginas le llevarn a informes, documentos y libros que explican con precisin todo lo que sucedi durante la Segunda Guerra Mundial. Lo mismo sucede en los terrenos de la ciencia (especialmente en el de las nuevas teoras) y los humansticos (con opiniones... sobre opiniones). No se crea nada a la primera, investigue un poco las fuentes tras haber localizado los documentos. Imagine que Internet es como recibir un libro que habla sobre los planetas, pero del que no sabe si estaba en la seccin de Fsica o Astrologa de la biblioteca. No desespere. En ocasiones no se encuentra la informacin que se busca, pero esa misma informacin puede aparecer con el paso del tiempo, a medida que ms gente y entidades llegan a la Red. Tambin se puede hacer una pregunta en algn lugar de Internet (Usenet o las listas de correo) y esperar que alguien responda. Las bsquedas en Internet son muchas veces cuestin de filosofa: hay navegantes que consideran que es incluso ms divertido el hecho de buscar que el encontrar las cosas en s, dado que durante el viaje de bsqueda se descubren sitios y lugares que algo tienen que ver 4

con lo buscado aunque sea tangencialmente, pero que aportan algo que se haba pasado por alto. En ltimo caso, el consuelo de todo cibernauta: aunque lo que busque no est en ese momento en Internet, tampoco lo estara si la Red no existiera... y al menos puede que aparezca en el futuro. Y, aunque parezca obvio, en cualquier caso toda esa informacin es pblica y gratuita. Tipos de buscadores Desde el punto de vista prctico, los buscadores de Internet se dividen principalmente en dos categoras: los ndices y los motores de bsqueda. En los ndices, hay personas detrs de ellos que clasifican inteligentemente las pginas web y los recursos de la red en categoras predeterminadas, a modo de gran rbol. Los motores de bsqueda son, en cambio, bases de datos que almacenan, una versin reducida de todas las pginas web y recursos que encuentran en la Red y que, aunque almacenan ms informacin, son ligeramente menos precisos. Otra forma de clasificar los buscadores es hacerlo por el lugar en que se encuentran. Se puede trabajar con buscadores globales, a nivel mundial, o con buscadores especficos de un pas, como Espaa. Actualmente hay ms de una decena de ndices espaoles, que contienen informacin nicamente sobre recursos disponibles en Espaa (o en castellano y otras lenguas oficiales), y tambin motores de bsqueda que recopilan nicamente informacin sobre pginas en castellano. Elegir uno u otro tipo de buscador (global o local) depende tanto de lo que cada cual puede procesar (informacin en varios idiomas, cantidad de pginas) como de lo interesante que puedan ser los resultados (ej. disposiciones administrativas, noticias locales o el telfono de un restaurante al que pedir una pizza... mejor cuanto ms cerca.) El nmero de buscadores de Internet aumenta cada da, de modo que sera imposible y poco prctico explicar el funcionamiento detallado de cada uno de ellos en un solo artculo. En vez de ello, y dado que todos operan de forma muy parecida, a continuacin se explican dos de los ms importantes (Yahoo y AltaVista) por ser en los que estn basados todos los dems, y finalmente se darn algunos consejos para realizar las bsquedas que son vlidos para estos y otros buscadores con ligeras adaptaciones. Tambin encontrar un cuadro con los principales buscadores de todos los tipos.

ndices: http://www.yahoo.com/

Yahoo

Nacido de la mano de dos estudiantes en abril de 1994 como una iniciativa para catalogar los recursos ms atractivos de la World Wide Web (cuando la Web todava era pequea), Yahoo se ha convertido en una fructfera empresa que ofrece su servicio de forma gratuita a cambio de que el usuario vea algo de publicidad cada vez que accede para realizar una consulta. Las ventajas principales de Yahoo son su completitud, su sencilla y atractiva interfaz y su facilidad de uso. Los empleados de Yahoo examinan personalmente pginas Web y recursos de todo el mundo y las incluyen en una gua jerrquica universal. Una vez examinado el material, incorporan cada una de las pginas en una categora predeterminada (con referencias cruzadas a otras si es necesario), hacen un pequeo resumen de su contenido y lo publican en el catlogo general, un rbol que recoge todo lo que pueda existir completamente organizado en ms de 20.000 categoras y cientos de miles de pginas documentadas. 5

El rbol de Yahoo comienza con unas ramas de generalidades: Arte, Ciencia, Noticias, Informtica, Juegos... y se despliega a medida que el usuario va avanzando pantallas: Arte lleva a Pintura, Escultura, Fotografa; Fotografa lleva a Fotgrafos, Biografas, Escuelas... y as sucesivamente. Los punteros finales del rbol de categoras de Yahoo no son ms que enlaces a recursos de Internet: grupos de noticias de Usenet, sitios FTP, y principalmente, pginas web. Yahoo en s no almacena esas pginas: simplemente proporciona los enlaces HTML adecuados. Un solo clic con el ratn es suficiente para saltar a ellos gracias a la magia del hipertexto de Internet. Una primera forma de usar Yahoo es conectarse y navegar por el rbol de categoras (por ejemplo: Entretenimiento: Cine: Pelculas: Directores: Quentin Tarantino: Pulp Fiction) hasta que se encuentra lo que se desea. A la derecha de cada categora aparece siempre un nmero entre parntesis que indica cuantas referencias y subcategoras contienen las siguientes subcategoras. Inteligentemente, Yahoo cataloga de forma prioritaria los FAQ (documentos de preguntas frecuentes) y los recursos que contienen ndices de cualquier tipo. En el caso del Cine, por ejemplo, aparecen la esplndida Internet Movie Database, (www.imdb.com) y los FAQ de los grupos de noticias art.rec.movies.* (muchas preguntas comunes estn contestadas all). Cuando una categora tiene el signo arroba (@) en su nombre quiere decir que se trata de una referencia cruzada a otra categora similar que se encuentra en otro nivel de Yahoo. Otra forma de navegar por Yahoo es buscar palabras clave que aparezcan en el nombre de una categora o en la descripcin de los propios recursos que se estn buscando. Esta bsqueda se puede hacer en todo Yahoo o slo en una categora determinada (de un nivel hacia abajo). El resultado: al buscar Umberto Eco (por ejemplo) aparecen pginas de categoras sobre el autor, en distintas reas (Autores/Ficcin literaria; Literatura/Semitica) y tambin algunas de las pginas concretas, enlazadas hacia la WWW. Yahoo ofrece algunos detalles ms que son de inters: junto a las nuevas incorporaciones a la base de datos aparece un icono destacado (New) durante unas semanas, as como otro icono (Cool, unas gafas rojas) si el sitio es especialmente interesante. (Como en todas las clasificaciones de Internet, la valoracin depende del gusto de los catalogadores, pero dado el gran trabajo que realizan en Yahoo, un icono de este tipo suele ser sinnimo de calidad). Desde el men principal de Yahoo tambin se puede acceder a noticias y novedades procedentes de agencias, dar saltos aleatorios por la Red en los momentos de aburrimientos o acceder a servicios personalizados, como el Yahoo para nios o el Yahoo personalizado (my.yahoo.com), que se puede configurar segn gustos personales. Los consejos principales para usar Yahoo o un buscador de tipo ndice son fciles de recordar: Examine el rbol de categoras detalladamente para saber cmo est estructurado el ndice. Esto le ayudar a encontrar ms fcilmente pginas sobre un tema determinado sin irse por las ramas. Dedique algo de tiempo a pedir las ampliaciones completas de los rboles de Yahoo (opcin Subcategory Listing en cada seccin) para hacerse una idea global del buscador. Las pginas regionales estn todas bajo la denominacin Regiones, Pases (en el caso de Espaa, en www.yahoo.com/regional/countries/spain, con subcategoras para autonomas, provincias, ciudades, etc.). En otras palabras: es mucho ms fcil encontrar los medios de 6

comunicacin espaoles a partir de ah que hacindolo a travs del ndice general. A efectos prcticos, imagine que Yahoo guarda una especie de copia del rbol global bajo la cabecera de cada pas. Para una bsqueda rpida, considere la ventana de bsquedas e introduzca algunas palabras, pero en ese caso cuente con recibir algo de ruido. La opcin bsquedas avanzadas permite usar frases lgicas (como AltaVista), para forzar o eliminar palabras no deseadas. No desprecie tampoco la oportunidad de ampliar la bsqueda conectando con AltaVista desde Yahoo, una opcin que se ofrece al final de cada bsqueda. Los ndices espaoles [ver cuadro] tienen todos un funcionamiento muy similar a Yahoo, tanto en la estructura de sus rboles como en el mtodo de bsquedas. La ventaja es que los recursos que almacenan suelen estar ms detallados y en castellano. Algunos tambin ofrecen bsqueda mediante expresiones lgicas avanzadas. Por desgracia, en general resultan ms lentos que los servidores internacionales, pues las mquinas sobre las que estn situados tienen menos potencia y el estado de la red suele ser peor. La paradoja de los ndices es que slo muestran informacin que previamente haya sido facilitada a sus administradores por algn usuario (quien cre una pgina o alguien de la Red). Si un sitio web no ha sido dado de alta en el ndice, puede no aparecer nunca por mucho que se busque (a pesar de existir ah fuera). Decidirse por uno u otro ndice (internacional o nacional, en sus distintos sabores) es cuestin de experimentar un poco y valorar los resultados. Si quien ha publicado la informacin en Internet ha sido cuidadoso, habr incluido referencias en los principales ndices espaoles y tambin en Yahoo. Un problema de los ndices espaoles es que al ser tantos (y a veces inestables) los usuarios muchas veces no dan de alta sus pginas en todos ellos, sino slo en los ms populares. En general, si un recurso merece la pena, o si la informacin y el trabajo que contienen es especialmente interesante, los autores se habrn preocupado de darlo a conocer adecuadamente a travs de Yahoo y el resto de buscadores.

Motores de bsqueda: AltaVista altavista.magallanes.net

La informacin existente en las pginas de Internet es tan voluminosa que a veces requiere otro tipo de buscadores ms potentes: los motores de bsqueda de contenidos. Se trata de gigantescas bases de datos que almacenan un ndice con todas las palabras que aparecen en cualquiera de las ms de 60 millones de pginas de la WWW y de los 100.000 mensajes pblicos diarios de Usenet. Esto incluye informacin como la de peridicos y revistas, bibliotecas, trabajos de investigacin y, por supuesto, todo tipo de temas mundanos y de inters personal que la gente conectada a Internet publica de una forma u otra. Son una buena forma de localizar informacin si no se tiene muy claro en qu categora puede enmarcarse, dnde pueden estar los recursos que la contengan o si el autor se ha molestado en comunicar su existencia a los buscadores. AltaVista puede, por as decirlo, encontrar referencias a cualquier palabra que se encuentre en una pgina Web o mensaje pblico de Usenet, y dar acceso a ese recurso en cuestin de segundos mediante un enlace desde la pantalla del navegador. Para llevar a cabo esta tarea, que en el caso de AltaVista comenz en diciembre de 1995 y que ya ha indizado ms de 30 millones de pginas, Digital cuenta con diversas tecnologas punta: un robot de bsqueda de pginas en Internet y motores de base de datos, indizado y clasificacin; todo ello 7

funcionando en servidores Alpha con varios gigabytes de RAM y discos RAID. El ndice de la Web ocupa ms de 40 GB, y el ancho de banda de los centros AltaVista supera los 100 Mbps. Los diversos sitios espejo de AltaVista (servidores regionales), repartidos por todo el mundo, reciben ms de 10 millones de consultas cada da. Espaa cuenta desde mediados de 1997 con uno de esos centros locales, con instrucciones en castellano y bsqueda por idiomas, gracias a un acuerdo entre AltaVista y Telefnica (altavista.magallanes.net). De cara al usuario, el funcionamiento de un motor de bsqueda como AltaVista no puede ser ms sencillo: basta teclear una frase y revisar los resultados: el motor de bsqueda analiza la base de datos en base a conceptos tales como cuntas veces aparecen las palabras buscadas, si el contexto es el mismo (cercana), si aparece lo buscado en el ttulo de la pgina o al principio de sta, si son palabras comunes o no, etc. As, por ejemplo, usando la bsqueda simple (la que aparece al conectarse a la pgina) y tecleando una frase como pelculas de Pedro Almodovar aparecen al instante cientos de referencias, clasificadas de mejor a peor aproximacin. Lo que hace AltaVista es buscar en su ndice, extraer las pginas que contienen cualquiera de esas palabras o varias de ellas y presentarlas segn un criterio de aciertos respecto a la frase de bsqueda. Un clic con el ratn sobre los resultados dirige el navegador web a la pgina de destino. La potencia de AltaVista es tremenda, pero, como todos los buscadores, no siempre acierta al cien por cien. Al buscar naturaleza y medio ambiente en Espaa, por ejemplo, aparecen pginas sobre naturaleza y artculos de boletines y revistas (como Estructura y funcin del biopolmero suberina) que poco tienen que ver con lo que se busca, excepto que contienen alguna de las palabras. A pesar de su aparente sencillez, AltaVista cuenta con opciones avanzadas para eliminar parte del ruido inherente a su mtodo de almacenamiento. Esto es as porque si se busca nicamente la palabra radio, por ejemplo, aparecer informacin tanto sobre emisoras de radio como sobre matemticas (el radio de una circunferencia) o el radio como elemento qumico: AltaVista no puede hacer mucho ms... la palabra radio aparece ms de 3 millones de veces en la WWW. Entre lo que se podran considerar fallos en una bsqueda (digamos, naturaleza y medio ambiente en Espaa) estaran pginas que provienen de Mxico, como el web de su Ministerio de Medio Ambiente (nada que ver con Espaa) u otros fallos ms graves se producen simplemente porque algunas pginas contienen de algn modo las palabras medio y naturaleza. Incluso si hubiera una pgina con un texto como El cine se diferencia de la televisin por ser un medio... sera encontrada y calificada como relativamente buena. Por esta razn, las bsquedas se pueden realizar de forma ms estricta, incluyendo algunas instrucciones especiales, para evitar que aparezcan pginas no deseadas y concretar lo que se est buscando. Hacerlo es tan sencillo como comprender la sintaxis de las frases de bsqueda y emplear ciertos operadores lgicos, mejorando as los aciertos de la base de datos. Siguiendo con el ejemplo anterior, para encontrar pginas sobre proteccin del medio ambiente en Espaa, se podra usar una frase de bsqueda como: naturaleza medio ambiente proteccin +Espaa -Mex* Los operadores bsicos que se han usado en esta frase son:

Comillas. Permiten pegar varias palabras en una expresin, de modo que si en una pgina no aparecen exactamente, sino en otro orden (el ambiente en el medio rural) se desestime la informacin encontrada. Maysculas y minsculas. Al diferenciar maysculas y minsculas se fuerza a que esas palabras aparezcan literalmente (ej. Espaa). Incluida (+). El signo ms delante de una palabra obliga a que la palabra que va a continuacin est incluida en la informacin encontrada. Eliminar (-). El signo menos elimina pginas que contengan la palabra que va a continuacin. [Si se emplea este guin para un trmino que contenga guiones, escriba las dos palabras sin separarlas con un espacio (deja-vu).] Raz (*). El asterisco sirve para indicar races de palabras (por ejemplo, mxico o mexicano). En general, el asterisco reemplaza a una serie indeterminada de letras: col*r es tanto color como colour. Con la construccin del ejemplo (que no es la mejor, pero sirve para el propsito explicativo), se fuerza a que aparezca siempre la expresin literal medio ambiente, la informacin de Espaa y se eliminan las referencias que procedan de Mxico. Esto da lugar a un nmero ms reducido de aciertos: artculos sobre Espaa y el medio ambiente, catalogadores con informacin sobre naturaleza, el programa de algn partido poltico (que debe incluir su punto de vista al respecto), informacin sobre campos de trabajo, una asociacin de Boy Scouts y una orden ministerial del BOE. Una novedad reciente de AltaVista es la seleccin por idiomas, haciendo una seleccin previa en la ventana de bsquedas. Aunque es interesante, depende en gran medida del correcto diseo de las pginas HTML que han sido publicadas en la red (que identifiquen el idioma de lo que contienen o no, mediante un cdigo HTML). Como muchas de ellas no incluyen los cdigos de idioma adecuados, hay que usar esta opcin con precaucin para no perder pginas tiles, que AltaVista clasifica como de idioma indeterminado. El modo de bsquedas avanzadas de AltaVista (al que se accede a travs del icono del mismo nombre de la ventana principal) proporciona otro mtodo de seleccionar la informacin. Puede acotar los aciertos por fechas, con los operadores AND y OR (similares a + y -) y con frases de bsqueda ms complejas. Incluso se puede especificar la cantidad de palabras mximas de separacin que debe haber entre dos palabras determinadas. Una ltima forma de localizar informacin con AltaVista es dirigir la bsqueda a Usenet. La red de grupos de noticias y debate contiene informacin ms al da que la Web, y es fcil localizar informacin de usuarios particulares haciendo preguntas y dando respuestas sobre un tema concreto. Uno de los secretos de AltaVista, que queda fuera de la vista del usuario, es Scooter. El robot inteligente de Digital rastrea la Web constantemente, buscando enlaces en las pginas y saltando a ellos para consultarlos, indizarlos y buscar nuevos enlaces. Su trabajo no termina nunca, y es lo que permite que cada da se aadan y actualicen cientos de miles de nuevas pginas sin que los usuarios o administradores tengan que solicitarlo personalmente. Adicionalmente, AltaVista es tremendamente respetuoso y ecolgico con la Red: Scooter viaja de pgina en pgina procurando no sobrecargar ningn servidor con consultas repetidas. Adems, los usuarios pueden aadir cdigo HTML a sus pginas personales o de empresa 9

para evitar que sean indizadas por el robot, en caso de que sean privadas. Scooter tambin acta de forma inteligente: las pginas que ms a menudo cambian (como las de noticias) son las ms visitadas y actualizadas. Tambin, automticamente, las que no pueden ser revisitadas en varios das son eliminadas para evitar enlaces que no lleven a ningn lugar. Consejos generales Tanto si usa motores de bsqueda como ndices, hay algunos consejos relativos a las palabras o frases de bsqueda que pueden serle de utilidad. A continuacin se indican algunos de los ms generales, cuyo funcionamiento puede variar segn cada buscador. Lo primero que debe hacer es leer y revisar con calma la Ayuda o el FAQ (Preguntas Frecuentes) de su buscador favorito para adaptar estos consejos o comprobar si funcionan del mismo modo en unos que en otros. Recuerde que leer las instrucciones del buscador durante unos minutos le ahorrar horas de bsquedas infructuosas y le permitir aprender nuevos trucos. Use minsculas y no use tildes, al menos al principio. Esto aumenta las posibilidades de encontrar una o varias palabras, dado que la mayor parte de los buscadores son sensibles a maysculas/minsculas slo si se emplean letras en maysculas, o a las tildes slo si se escriben las palabras con tilde. Es decir: leon dar por vlidas palabras como leon, len, Len y LEON, mientras que Len hace que deba aparecer la palabra exactamente as, en maysculas y acentuada. Busque pistas y siga los enlaces. Aunque una bsqueda parezca difcil porque lo que aparece no es profesional ni completo, como las pginas personales de muchos usuarios, no pierda los enlaces que ha encontrado y vaya guardndolos, por si necesita hacer una revisin exhaustiva. En muchas ocasiones, un pequeo enlace en una pgina personal puede darle palabras o trminos interesantes sobre los que continuar la bsqueda, especialmente cuando se trata de pginas en otros idiomas. Utilice primero los buscadores en espaol. Si lo que busca puede estar disponible en castellano, comience por ah, aunque la probabilidad sea pequea. Tal vez un voto de confianza a los buscadores locales (ndices y motores de bsqueda) le sorprenda por los resultados y le ahorre tiempo. Algunos de estos buscadores, como Ol (www.ole.es), son lugares habituales en los que los internautas espaoles dan de alta sus pginas, hacindolas ms fciles de localizar. Otros, como Sol (www.sol.es), buscan con gran precisin contenidos nicamente sobre Espaa, aunque estn bajo otros dominios (.com, .org, etc.) Recuerde buscar en ingls. Si no encuentra lo que busca en castellano, comience a hacer las bsquedas en ingls. Necesitar saber no solo la traduccin exacta de las palabras que bsqueda, sino si tienen sentido en el contexto de la informacin que busca. Shakespeare es Shakespeare en todas partes, pero buscar informacin sobre el nacimiento de Jess en Beln en ingls es ms fcil si se usa Bethlehem como el nombre del pueblo; el genial Miguel Angel tiene ms referencias en ingls como Michelangelo, y Cristobal Coln (slo 100 en castellano) como Christopher Columbus (4.000 en ingls). Respecto al contexto, no se moleste en encontrar informacin sobre el viejo Volkswagen modelo escarabajo traduciendo literalmente la palabra escarabajo: la denominacin internacional es water-cooled Volkswagen (la seria) o Volkswagen bug (la informal). Vigile la ortografa. Parece una tontera, pero muchas veces una bsqueda infructuosa se debe a errores de ortografa que pasan desapercibidos. Utilice los contadores de aciertos (por ejemplo, en AltaVista) que indican cuntas veces aparece cada palabra en la bsqueda: si aparece ninguna o muy pocas veces tal vez sea que ha cometido algn error al escribir el trmino. Esto es muy comn al escribir nombres propios extranjeros (como Tchaikovsky). 10

Tenga especial cuidado con las palabras en ingls: su ortografa no siempre es fcil ni como suena. Y no olvide que a veces hay diferencias entre el ingls americano y el britnico: lo que en un lado del charco es color, organize y elevator en el otro es colour, organise y lift, por poner algunos ejemplos. En caso de duda, procure encontrar una raz de la palabra y aada el asterisco (Tchaik* sirve para Tchaikovsky). Sea genrico. Segn la bsqueda, a veces conviene no usar nada ms que las races de las palabras (espa* para Espaa, por ejemplo) para poder encontrar expresiones similares (espaa, espaol, espaolas), variaciones de la palabra en plural, gnero, tiempo de un verbo, etc. Vaya al grano. Si sabe cmo debe aparecer una expresin, teclela como tal (encerrada entre comillas, con todas las palabras). Es mejor Miguel de Cervantes (si busca al clebre escritor) o fsica cuntica que miguel cerv* (mas genrica, pero que dar algunas sorpresas como pginas sobre Miguel que hablen de cerveza) o +fsica +cuntica (las palabras podran aparecer no contiguas en el resultado). Lea el FAQ de un tema concreto. Intente localizar (si existe) el FAQ (Documento de Preguntas Frecuentes) del tema sobre el que est buscando informacin, sean juegos, pelculas, ciencia o poltica. Hay muchos documentos de este tipo de Internet, mantenidos por voluntarios. Aunque no encuentre a la primera la respuesta a su pregunta, hallar enlaces a sitios muy interesantes. Opte por las pginas de calidad. Las pginas de calidad tienden a ser ms completas y estar desarrolladas por personas y grupos interesados en recopilar informacin de forma completa y cuidadosa, mantenindola actualizada. Est principalmente atento a las pginas oficiales sobre... (tambin las no-oficiales, que muchas veces son incluso mejores), las pginas de recursos sobre... y similares. Los sitios web bien diseados tienen menos errores, cambian menos a menudo de sitio y en general son mejor referencia que las pginas personales o de aficionados, aunque siempre hay excepciones. Las pginas de calidad tambin son ms mencionadas y mejor catalogadas por buscadores y pginas sobre temas similares. Intente localizar empresas y organizaciones representativas. Quin mejor que Bandai (www.bandai.com) para responder a todas sus preguntas sobre los Tamagotchi? O que la NASA (www.nasa.gov) para encontrar las fotografas de Marte? O que Greenpeace (www.greenpeace.org) para resolver dudas ecolgicas? Cuando busque informacin y datos sobre productos, empresas u organizaciones, intente primero encontrar un web principal por su nombre de dominio. Recuerde que los de empresas espaolas y universidades acaban en .es (Espaa); los de empresas a nivel internacional en .com (Comercial); los de organizaciones sin nimo de lucro en .org (organizacin); los del gobierno y organismos oficiales americanos en .gov (Gobierno) y los educativos (Americanos) en .edu (Educacin). Las excepciones a esto son muchos servidores espaoles (comerciales o no) acaban en .com (y no en .es). Tambin conviene recordar que muchas entidades abrevian su nombre: El Ministerio de Educacin y Cultura es www.mec.es y la Universidad Autnoma de Madrid, www.uam.es. En muchos casos, aunque la informacin no est en las propias empresas o entidades, encontrar punteros a otros sitios representativos de la Red. Limite los dominios y servidores. Este truco sirve para AltaVista, y permite limitar el dominio (direccin de Internet) en que deben aparecer los resultados. Es til para buscar informacin slo dentro de una determinada entidad (empresa, universidad) o incluso un pas. Una bsqueda con algunas palabras y adems +host:*.es hace que slo aparezcan pginas cuya direccin termine en .es (Espaa). [Advertencia: hay pginas espaolas alojadas bajo 11

servidores terminados en .com, por lo que este mtodo es slo relativamente efectivo.] Ejemplo: loto* loter* +host:*.es muestra pginas sobre loto y lotera nicamente de Espaa (evitando las de otros pases). Busque enlaces directamente. Tambin en AltaVista, la expresin link:www.paginaweb.es permite encontrar todas las pginas web que contengan enlaces a una pgina determinada. Es una forma rpida de encontrar sitios que apunten a una pgina que usted considere interesante, y generalmente esos sitios tendrn informacin de temas similares. Piense en el resultado y adivine la frase correcta. A veces es casi imposible dar con una frase que delimite correctamente lo que se est buscando: sencillamente aparecen demasiados aciertos se busque cmo se busque. Pruebe a pensar a la inversa: suponga que la pgina que usted busca realmente existe... Cmo habr escrito la persona que la ha creado la informacin que usted busca? Usando la lgica, a veces hay resultados sorprendentes. Cmo llamara a una pgina que explica cmo atarse el nudo de una corbata? Con la frase exacta entrecomillada (How to tie a tie) puede encontrar esa y otras 53 pginas parecidas. Erase una vez le llevar a pginas (muchas con cuentos para nios), al igual que Once upon a time (en ingls, unas 14.000). Si no lo encuentra, pregunte. Si nada da resultado y no consigue encontrar lo que busca, utilice un ltimo recurso: preguntar. Dese una vuelta por los grupos en castellano de Usenet, o por cualquiera de los grupos internacionales, busque el ms adecuado para hacer su pregunta y lncela. A buen seguro alguien le contestar con algunas referencias o al menos pistas. En este sentido son muy tiles las listas de correo que existen sobre los ms diversos temas: aunque su contenido suele escapar a la accin de los buscadores, sus participantes suelen ser amables y cuentan con ms datos y sentido comn que los motores de bsquedas. [A este respecto, una direccin interesante: www.findout.com. Si formula aqu una pregunta (cualquier pregunta!) un grupo de voluntarios dedicar parte de su tiempo a investigarla para usted y darle una respuesta y referencias. Se puede pedir ms?] Un consejo final: si no existe, invntelo. Definitivamente, esto es slo para los ms emprendedores, pero es a la vez la mejor aportacin que se puede hacer a la Red. Si no ha encontrado lo que busca, o slo lo ha encontrado en ingls, considere publicar usted mismo esa informacin crendola desde cero (o traducindola) e incluyendo todos los enlaces posibles y referencias a temas relacionados. Recuerde siempre que la Red existe porque los usuarios la han llenado de contenidos y enlazado en una formidable maraa de enlaces, y que todo usuario debera aportar su granito de arena. Su pgina ser visitada y otras personas podrn usar de la informacin que usted ha recopilado. Piense que les estar haciendo el mismo favor que le han hecho a usted todos los que de forma desinteresada publicaron los materiales que usted encontr en bsquedas anteriores. No est de ms devolver el favor a la Red de vez en cuando. Conclusiones Este artculo ha pretendido servir a la vez de introduccin a la bsqueda de informacin en Internet y a la vez de manual prctico con los trucos ms comunes, indicando por donde y cmo comenzar. Adems de todo lo mencionado, existen muchos ms recursos en la Red para buscar personas, direcciones de e-mail, telfonos, empresas y la informacin disponible en miles de bases de datos... e incluso pginas que buscan en varios buscadores de Internet a la vez (los llamados metabuscadores). A buen seguro que ir descubriendo todas ellas a medida que circule por Internet.

12

Para acabar, recuerde siempre que todo el tiempo que emplee en investigar y leer sobre el funcionamiento de los buscadores de Internet, sobre las principales pginas de recursos de cada tema de inters y sobre el funcionamiento en general de la Red le supondr un ahorro de tiempo enorme cuando vuelva a buscar informacin: aunque el pajar es grande, existen herramientas adecuadas para encontrar la aguja, por muy escondida que est.

Buscadores de Internet Este cuadro resume los principales buscadores a nivel internacional y tambin los que desde Espaa proporcionan informacin y contenidos en castellano. Se ha dividido en ndices (rboles de categoras) y Motores de bsqueda (buscadores de contenidos), aunque en algunos casos (como Excite o Lycos) el mismo buscador puede ofrecer ambos servicios bajo el mismo o distintos nombres. Tambin se han incluido algunas pginas de buscadores especiales (metabuscadores que realizan bsquedas en varios servicios a la vez) y temticos (como DejaNews, orientado slo a Usenet). En cualquier caso, esta clasificacin debe entenderse no como algo exhaustivo, sino como un punto de partida de los lugares ms populares por los que comenzar a buscar: cada da hay nuevos servicios similares en la World Wide Web. Usted mismo podr valorarlos haciendo algunas pruebas y comprobando su precisin, velocidad y sencillez de uso. INDICES Internacionales Yahoo Excite InfoSeek a2z Magellan Galaxy En castellano Ol Oz.com Oz.es Navegador Intercom Dnde? El Indice Enxebre (Galicia) Web Tour Inspector de Telpolis http://www.ole.es/ http://www.ozu.com/ http://www.ozu.es/ www.intercom.es/navegador donde.uji.es www.globalcom.es/indice http://www.enxebre.com/ http://www.webtour.net/ http://www.telepolis.com/ http://www.yahoo.com/ http://www.excite.com/ http://www.infoseek.com/ a2z.lycos.com http://www.mckinley.com/ galaxy.einet.net

13

Infor-Acceso Eliana MOTORES DE BUSQUEDA Internacionales AltaVista Lycos HotBot WebCrawler HotBot En castellano AltaVista Lycos Sol Trovator Hispavista Ugabula Inspector de Telpolis Buscador en Internet de Webs Espaoles VARIOS MetaCrawler Ciudad Robot Search.com Starting Point DejaNews NewsBot Ask Jeeves bsqueda) ( Ultima tecnologa de

http://www.infor.es/ http://www.eliana.com/

altavista.digital.com http://www.lycos.com/ http://www.hotbot.com/ http://www.webcrawler.com/ http://www.hotbot.com/

altavista.magallanes.net www-es.lycos.com http://www.sol.es/ trovator.combios.es http://www.hispavista.com/ http://www.ugabula.com/ http://www.telepolis.com/ http://www.biwe.es/

http://www.metacrawler.com/ http://www.ciudadrobot.com/ http://www.search.com/ http://www.stpt.com/ http://www.dejanews.com/ http://www.newbot.com/ http://www.ask.com/

14

Вам также может понравиться