Вы находитесь на странице: 1из 15

Buscador de Google

Ir a la navegaci�nIr a la b�squeda
Buscador de Google
Google 2015 logo.svg
Logotipo
Google web search.png
Informaci�n general
Dominio www.google.es
Tipo Motor de b�squeda web
Comercial S�
Registro Opcional (Cuenta de Google)
Idiomas disponibles Multilenguaje (129 idiomas)1?
En espa�ol S�
Estado actual Activo
Gesti�n
Desarrollador Larry Page y Sergu�i Brin
Propietario Google
Lanzamiento 15 de septiembre de 1997
Estad�sticas
Ranking Alexa 1 (enero de 2015)
[editar datos en Wikidata]
El buscador de Google o buscador web de Google (en ingl�s Google Search) es un
motor de b�squeda en la web propiedad de Alphabet Inc., es el motor de b�squeda m�s
utilizado en la Web,2? recibe cientos de millones de consultas cada d�a a trav�s de
sus diferentes servicios.3? El objetivo principal del buscador de Google es buscar
texto en las p�ginas web, en lugar de otro tipo de datos, fue desarrollado
originalmente por Larry Page y Sergey Brin en 1997.4?

El buscador de Google proporciona al menos 22 caracter�sticas especiales m�s all�


de la palabra original. Estas incluyen sin�nimos, previsiones meteorol�gicas, zonas
horarias, cotizaciones de bolsa, mapas, datos sobre terremotos, cartelera de cine,
informaci�n de aeropuertos, listas de inicio y resultados deportivos. Hay funciones
especiales para los n�meros, incluyendo intervalos (70.. 73), precios,
temperaturas, conversiones de unidades y de monedas ("10,5 cm en pulgadas"),
c�lculos ("3 * 4 + sqrt (6)-pi / 2"), seguimiento de paquetes, patentes, c�digos de
�rea telef�nico, y traducci�n de p�ginas mostradas.

El orden de los resultados de b�squeda (ghits por Google hits) en las p�ginas de
resultados de Google se basa, en parte, en un rango de prioridad llamado
"PageRank". El Buscador de Google proporciona muchas opciones para la b�squeda
personalizada, utilizando las operaciones booleanas tales como: exclusi�n ("-xx"),
inclusi�n ("+ xx"), alternativas ("xx O yy") y comod�n ( "x * x")5?

La frecuencia de uso de los t�rminos de b�squeda ha alcanzado un volumen que puede


indicar m�s tendencias econ�micas, sociales y de salud.6? Los datos sobre la
frecuencia de uso de los t�rminos de b�squeda en Google (disponible a trav�s de
Google Adwords, Google Trends y Google Insights for Search) demuestran que hay
correlaci�n entre los brotes de gripe y los niveles de desempleo y proporcionan la
informaci�n m�s r�pidamente que los m�todos tradicionales de presentaci�n de
informes y encuestas del gobierno.[cita requerida]

El 12 de mayo de 2009, Google anunci� que analizar�a los micro formatos de hCard,
hReview y hProduct para incrementar las p�ginas de resultados de b�squeda con lo
que llamaron "Rich Snippets".7?

En junio de 2011, Google introdujo "Google Voice Search" y "Google Images",


caracter�sticas que permiten a los usuarios buscar palabras al hablar y por
im�genes.8?
A finales de junio de 2011, Google cambi� el dise�o de su p�gina principal con el
fin de impulsar el uso de herramientas sociales.9? Los enlaces de publicidad,
socios de negocios e informaci�n de empresas fue llevada al borde inferior del
navegador. Uno de los cambios principales fue reemplazar la barra de navegaci�n
cl�sica con una negra. El director creativo digital de Google Chris Wiggins
explica: "Estamos trabajando en un proyecto para proporcionarle una experiencia de
Google nueva y mejorada y en los pr�ximos meses, seguir�n viendo m�s cambios de
nuestra apariencia." 10?

�ndice
1 Resultado de la b�squeda
1.1 B�squeda instant�nea
1.1.1 Recepci�n negativa
1.1.2 Censura
1.2 B�squeda de productos
1.3 Caracter�sticas especiales
1.4 B�squeda cifrada
2 Caracter�sticas
2.1 Google +1
2.2 Caracter�sticas de la interfaz
2.3 Funciones para comunicaci�n
2.4 Google bomb
2.5 Logotipo (Doodle)
2.6 Consumo de energ�a
3 Optimizaci�n de Google
4 Sistema Distribuido
4.1 Aspectos del motor de b�squeda
4.1.1 Rastreo (crawling)
4.1.2 Indexaci�n
4.1.3 Clasificaci�n (Ranking)
4.2 Arquitectura f�sica adoptada por Google
4.3 Middleware
5 Mensajes de error
5.1 Error de software en enero de 2009
6 Internacional
6.1 Idiomas
6.2 Nombres de dominio
7 V�ase tambi�n
8 Referencias
9 Enlaces externos
Resultado de la b�squeda
El porcentaje exacto del total de las p�ginas web que Google encuentra no se
conoce, ya que es muy dif�cil calcular. Google no s�lo busca los �ndices y cach�s
de las p�ginas web, tambi�n toma "im�genes" de otros tipos de archivos, que
incluyen PDF, documentos de Word, hojas de c�lculo Excel, Flash SWF, archivos de
texto plano, etc.11? Excepto en el caso del texto y de archivos SWF, la versi�n en
cach� es una conversi�n de (X)HTML, permitiendo que aquellos sin la aplicaci�n de
visualizaci�n correspondiente puedan leer el archivo.

Los usuarios pueden personalizar el motor de b�squeda, mediante el establecimiento


de un idioma por defecto, a trav�s de la tecnolog�a "SafeSearch", filtrando y
definiendo el n�mero de resultados que se muestran en cada p�gina. Google ha sido
criticado por colocar cookies a largo plazo en las m�quinas de los usuarios para
almacenar las preferencias de estos, una t�ctica que tambi�n les permite seguir los
t�rminos de b�squeda del usuario y retener los datos durante m�s de un a�o. Para
cualquier consulta, hasta los 1000 primeros resultados pueden ser mostrados con un
m�ximo de 100 por p�gina. La posibilidad de especificar el n�mero de resultados
est� disponible s�lo si "B�squeda instant�nea" no est� habilitada. Si "B�squeda
instant�nea" est� activada, s�lo 10 resultados ser�n mostrados, independientemente
de cualquier ajuste.

B�squeda instant�nea
Google Instant, una mejora que muestra los resultados sugeridos mientras el usuario
escribe, fue presentado el 8 de septiembre de 2010. Una de las preocupaciones es
que la gente seleccione uno de los resultados sugeridos en vez de terminar su
petici�n, y que esa pr�ctica podr�a causar parcialidad hacia empresas familiares u
otros t�rminos de b�squeda. T�rminos pornogr�ficos y otros t�rminos ofensivos est�n
excluidos de los resultados sugeridos. La funci�n instant�nea aparece s�lo en el
sitio de Google original y las p�ginas no especializadas de iGoogle. Google espera
que Google Instant las b�squedas sean de 2 a 5 segundos m�s r�pidas y dicen que en
conjunto ser�an 11.000.000 segundos por hora.12? Los expertos de marketing de
motores de b�squeda especulan que Google Instant tendr� un gran impacto en las
localidades.13?

Junto al lanzamiento de Google Instant, Google deshabilit� la posibilidad de que


los usuarios elijan ver m�s de 10 resultados por p�gina. La b�squeda instant�nea
puede ser desactivada a trav�s de las "preferencias" del men�, pero el estilo de
autocompletado de sugerencias de b�squeda ya no se puede desactivar. Un
representante de Google dijo: "Est� en consonancia con nuestra visi�n de una
experiencia de b�squeda unificada de Google hacer popular las caracter�sticas
�tiles del motor en lugar de mantener distintas versiones de Google. Como la
calidad de "Autocompletar" ha mejorado, nos pareci� que era apropiado para todos
nuestros usuarios tenerlo siempre activo."14?

Recepci�n negativa
Muchos usuarios han reportado haber sido incapaces de desactivar la b�squeda
instant�nea de entre sus preferencias de Google.15?

Censura
La publicaci�n de 2600: The Hacker Quarterly ha compilado una lista de palabras que
est�n restringidas por Google Instant. Estos son los t�rminos que la b�squeda
instant�nea no mostrar�.16?17? La mayor�a de los t�rminos son a menudo vulgares y
despectivos en s�, pero algunas b�squedas aparentemente irrelevantes como "Myleak"
fueron eliminadas.

B�squeda de productos
Adem�s de su herramienta para la b�squeda de p�ginas web, Google tambi�n ofrece
servicios para la b�squeda de im�genes, grupos de noticias, noticias de sitios web,
videos, buscar por localidad, mapas y art�culos para la venta en l�nea. En 2013,
Google index� m�s de 60 trillones de p�ginas web,1? 54.300 consultas por segundo ,
400 millones de consultas por d�a, 1,3 mil millones de im�genes y m�s de mil
millones de mensajes de Usenet. Tambi�n coloca en cach� gran parte del contenido
que indexa. Google opera otras herramientas y servicios, incluyendo Google News,
Google Suggest, Google Product Search, Google Maps, Google Co-op, Google Earth,
Google Docs, Picasa, Panoramio, YouTube, Google Translate, Google Blog Search y
Google Desktop Search.

Tambi�n hay productos disponibles en Google que no est�n directamente relacionados


con b�squedas. Gmail, por ejemplo, es una aplicaci�n webmail, pero incluye
funciones de b�squeda, Google Browser Sync no ofrece facilidades de b�squeda,
aunque tiene como meta organizar su tiempo de navegaci�n.

Google tambi�n posee muchos productos que est�n en beta, como por ejemplo Google
Social Search o Google Image Swirl.

Caracter�sticas especiales
Adem�s de la principal funci�n de motores de b�squeda de texto, el Buscador de
Google tiene m�s de 22 "caracter�sticas especiales" (que se activa al escribir
cualquiera de las docenas de palabras de activaci�n) en la b�squeda:18?

El clima: Las condiciones clim�ticas, temperatura, viento, humedad y pron�stico,


para muchas ciudades, se puede ver escribiendo "clima", junto con una ciudad para
las grandes ciudades o ciudad y estado, c�digo postal EE.UU. o de la ciudad y el
pa�s de las ciudades m�s peque�as (como por ejemplo: clima Lawrence, Kansas, clima
de Par�s, clima Bremen, Alemania).
Cotizaciones de la bolsa: Los datos del mercado para una compa��a espec�fica o
fondo se puede ver, escribiendo el s�mbolo (o incluir "acciones"), tales como:
CSCO; MSFT; las acciones de IBM; acciones F (listas de Ford Motor Co.), o AIVSX
(fondo).Los resultados muestran cambios d�a a d�a, o un gr�fico de 5 a�os, etc.
Esto no funciona para los nombres de archivo que tienen una sola letra como
abreviaci�n, como Citigroup (C) o Macy (M) (Ford es una excepci�n), o palabras
comunes, como por ejemplo Diamond Offshore (DO) o Majesco (COOL).
Hora: La hora actual en muchas ciudades (en todo el mundo), pueden ser vistos
escribiendo "hora" y el nombre de la ciudad (tales como: hora de El Cairo, hora de
Pratt, KS).
Resultados deportivos: Las puntuaciones y los horarios, para los equipos
deportivos, se pueden mostrar escribiendo el nombre del equipo o nombre de la liga
en el cuadro de b�squeda.
Conversi�n de unidades: Las medidas pueden ser convertidas mediante la introducci�n
de cada frase, como por ejemplo: 10,5 cm en pulgadas, o 90 km en millas
Conversi�n de moneda: Un conversor de dinero o moneda puede ser seleccionado,
escribiendo los nombres o c�digos de moneda (que se enumeran en la norma ISO 4217):
6.789 euros en USD, 150 libras esterlinas en d�lares, 5.000 yenes en d�lares, 5.000
yuanes en lira (el d�lar de EE.UU. puede de USD, o "US$" o "$", mientras que el
canadiense es CAD, etc.)
Calculadora: C�lculo de los resultados se puede determinar, seg�n los c�lculos en
vivo, mediante la introducci�n de una f�rmula de n�meros o palabras, como por
ejemplo: 6 * 77 + pi + sqrt(e^3)/888 m�s 0,45.El usuario tiene la opci�n de buscar
por la f�rmula despu�s del c�lculo. La calculadora tambi�n utiliza la unidad y las
funciones de conversi�n de divisas para permitir c�lculos de unidad. Por ejemplo,
"(3 euros/litro) / (40 millas/gal�n) en USD / millas", calcula el costo en d�lares
por milla para un coche de 40 millas por gal�n de gasolina que cuesta 3 euros por
litro. El acento circunflejo "^" plantea un n�mero a un exponente de potencia.
Tambi�n, los porcentajes son permitidos ("40% de los 300"). Existen ciertos debates
en cuanto al c�lculo de Google de 0 ^ 0. Muchos matem�ticos creen que 0 ^ 0 no est�
definido, pero la calculadora de Google muestra el resultado como 1.19?
Rangos num�ricos: Un conjunto de n�meros se puede adaptar con un doble de puntos
entre los n�meros de serie (70..73 � 90..100) para adaptarse a cualquier n�mero
positivo en el rango. Los n�meros negativos son tratados como el uso de la
exclusi�n del guion para no coincidir con el n�mero. Negative numbers are treated
as using exclusion-dash to not match the number.
Diccionario de b�squeda: Una definici�n de una palabra o frase se puede encontrar,
mediante la introducci�n de "definir" seguido de dos puntos y la(s) palabra(s) de
b�squeda (por ejemplo, "define: la filosof�a")
Mapas: Algunos mapas relacionados se pueden mostrar, simplemente introduciendo el
nombre o el c�digo postal de los EE.UU. y la palabra "mapa" (tales como: mapa de
Nueva York, mapa de Kansas o mapa de Par�s). Sin embargo, actualmente es imposible
encontrar ciudades, calles o direcciones que correspondan a un negocio.
Cartelera de cine: Comentarios u horarios de pel�culas pueden ser listados para
cualquier pel�cula que est� en el cine, si escribe "pel�culas" o el nombre de una
pel�cula en el cuadro de b�squeda. Si un sitio espec�fico se guarda en una b�squeda
anterior, el resultado de la b�squeda mostrar� horarios de los cines cercanos para
esa pel�cula.
Datos p�blicos: Tendencias de la poblaci�n (o las tasas de desempleo) se pueden
encontrar para los estados de EE.UU. y los condados, al escribir "poblaci�n" o
"tasa de desempleo", seguido de un nombre de estado o condado.
Bienes ra�ces y viviendas: los listados de un �rea determinada se puede mostrar
usando las palabras "vivienda", "casa" o "bienes inmuebles" seguido del nombre de
una ciudad o c�digo postal EE.UU.
Datos de viaje / aeropuertos: El estado de los vuelos de llegadas y salidas de
vuelos EE.UU. se puede mostrar, simplemente introduciendo el nombre de la aerol�nea
y el n�mero de vuelo en el cuadro de b�squeda (como por ejemplo: American Airlines
18).Las demoras en un aeropuerto determinado tambi�n se puede ver (al escribir el
nombre de la ciudad o el c�digo de tres letras del aeropuerto m�s palabra
"aeropuerto").
Seguimiento de paquetes: el correo enviado puede ser rastreado al escribir el
n�mero de seguimiento de un correo de Royal Mail, UPS, FedEx o USPS directamente en
el cuadro de b�squeda. Los resultados incluir�n enlaces para el seguimiento del
estado de cada env�o.
N�meros de patente: las patentes estadounidenses pueden ser buscadas mediante la
introducci�n de la palabra "patente", seguido por el n�mero de patente en el cuadro
de b�squeda (como por ejemplo: Patente 5123123).
C�digo de �rea: La ubicaci�n geogr�fica (por cualquier c�digo de �rea telef�nico en
los estados unidos) se pueden mostrar escribiendo un c�digo de �rea de 3 d�gitos
(por ejemplo: 650).
Sin�nimo de b�squeda: La b�squeda puede coincidir con palabras similares a las
especificadas poniendo el signo "~" inmediatamente delante de un t�rmino de
b�squeda, tales como: ~ comida r�pida.
Traductor: Una versi�n menor del Traductor de Google
B�squeda cifrada
En mayo de 2010 Google lanz� su sistema de cifrado SSL de b�squeda web.20? La
b�squeda cifrada puede ser accedida por encrypted.google.com21?

Caracter�sticas

Motor de b�squeda.
El buscador de Google consiste de una serie de sitios web. El m�s grande de ellos,
el sitio google.com, es la p�gina web m�s visitada del mundo.22? Algunas de sus
caracter�sticas incluyen un enlace que proporciona la definici�n para la mayor�a de
las b�squedas incluyendo palabras del diccionario, el n�mero de resultados que
obtuvo en su b�squeda, enlaces a otras b�squedas (por ejemplo, palabras que Google
cree que son incorrectas, le proporciona al usuario un enlace a los resultados de
b�squeda utilizando la ortograf�a propuesta por Google), y muchas cosas m�s.

Google +1
Google +1 ayuda a las personas a descubrir contenido relevante y cuya meta es
incrementar los resultados de b�squeda de Google, ofreciendo un estado para
mostrarles a las personas si la p�gina es confiable o no. Cuando un usuario de
Google utiliza los resultados de b�squeda de Google mostrar� un bot�n +1 para
recomendar la p�gina y una anotaci�n con los nombres de las conexiones de los
usuarios que han recomendado su p�gina.

Caracter�sticas de la interfaz
Fondo blanco y sencillo con cambios de vez en cuando en el t�tulo, este cambio
ocurre en d�as con significado hist�rico o d�as determinados.
La barra superior tiene: Web, im�genes, videos, mapas, noticias, compras, gmail,
etc.
B�squeda por voz, permite una b�squeda m�s r�pida que escribiendo, o si la
escritura correcta no se conoce.
Cuando utilizas tu cuenta de Google, el historial de b�squeda se registra
autom�ticamente.
La tipograf�a del buscador de Google, es Arial, una de las tipograf�as m�s
utilizadas en las p�ginas web.
Google Instant, que r�pidamente genera b�squedas posibles que contengan los
caracteres escritos. Por ejemplo, si escribes Goo, mostrar�a Google, Google maps,
Google Translate...
Funciones para comunicaci�n
Comparte tus fotos con el mundo. Es posible subir a la web tus fotos.
B�squedas de im�genes con ajustes opcionales, tales como tama�o, color, tipo y
clasificaci�n.
B�squedas de v�deos que se conectan a YouTube. Tambi�n con ajustes opcionales tales
como la duraci�n, tiempo, calidad, adem�s de otras fuentes que se relaciona con el
tema que usted est� buscando.
Google bomb
Art�culo principal: Google bomb
A ra�z de su importante posici�n de liderazgo en el mercado, Google es objetivo
principal del as� llamado spam contra buscadores. En este sentido se intenta
posicionar la mayor cantidad posible de palabras de b�squeda entre los primeros
resultados. Estas palabras claves muchas veces no tienen ninguna relaci�n con el
contenido real de las p�ginas. Se utilizan t�cnicas como P�ginas-Doorway, Farm-
Links o Page-Cloacking.

Esta posibilidad se comprob� por vez primera a la luz de la opini�n p�blica en


relaci�n con una Bomba-Google, que estaba orientada al presidente de los Estados
Unidos George W. Bush. La palabra de b�squeda "miserable failure" (en castellano:
"fracaso miserable") fue enlazada por los adversarios de Bush a la p�gina oficial
con la biograf�a de Bush en la Casa Blanca.23?

Como contrapartida intentaron los partidarios de Bush hacer lo mismo contra Michael
Moore (director del documental Fahrenheit 9/11). Desde ese momento los primeros
puestos var�an frecuentemente entre ambos.

Las manipulaciones que tienen como objetivo mejorar el ranking de websites


especialmente en Google, son consideradas desde ese momento Google-Spamming. Para
evitar el abuso, Google cambia su algoritmo con frecuencia.

Logotipo (Doodle)
Art�culo principal: Logo de Google
En ciertas ocasiones, el logotipo en la p�gina web de Google va a cambiar a una
versi�n especial, conocido como "Google Doodle". Al hacer clic en Doodle, llevar�
al usuario a una cadena de resultados de b�squeda de Google sobre el tema. El
primero fue una referencia al Festival Burning Man en 199824?25? y otros han sido
producidos para el cumplea�os de personas notables como Albert Einstein, los
acontecimientos hist�ricos como el 50 aniversario del bloque de Lego ,d�as festivos
como el D�a de San Valent�n o eventos del pa�s donde se realice la b�squeda.26?

Consumo de energ�a
Google afirma que cada consulta requiere de alrededor de 1 kJ o 0,0003 kW h. 27?

Optimizaci�n de Google
Art�culo principal: Posicionamiento en buscadores
Puesto que Google es el buscador m�s popular, muchos webmasters desean influenciar
la clasificaci�n de su sitio web en Google. Una industria de consultores ha surgido
para ayudar a los sitios web a aumentar su ranking en Google y en otros motores de
b�squeda. Este campo, llamado optimizaci�n de motores de b�squeda (SEO en ingl�s),
trata de discernir patrones en los listados de motores de b�squeda y luego
desarrollar una metodolog�a para mejorar la clasificaci�n y atraer a m�s usuarios a
los sitios de sus clientes.

La optimizaci�n de motores de b�squeda abarca tanto factores en la p�gina (como el


cuerpo del texto, los elementos del t�tulo, los elementos del t�tulo y la imagen de
los valores del atributo alt) como factores de optimizaci�n fuera de la p�gina
(como texto de anclaje y el PageRank).La idea general es afectar el algoritmo de
relevancia de Google mediante la incorporaci�n de las palabras claves en la p�gina,
en particular el t�tulo y el cuerpo del texto (nota: mientras m�s arriba est� en la
p�gina, mayor son las posibilidades de la prominencia de palabras clave y por lo
tanto, su clasificaci�n). Sin embargo, demasiadas repeticiones de la palabra clave
causan que la p�gina para buscar luzca sospechosa para el algoritmo de control
Google que evita spam.

Google ha publicado una gu�a para propietarios de sitios web que deseen mejorar su
clasificaci�n en el uso de consultores leg�timos de optimizaci�n.28?

Sistema Distribuido
Un sistema distribuido es un conjunto de computadoras separadas f�sicamente y
conectadas entre s� por una red de comunicaciones distribuida. Google es uno de los
sistemas distribuidos m�s complejos en uso. Su infraestructura ha satisfecho
requisitos necesarios como: escalabilidad, rendimiento, fiabilidad y car�cter
abierto.

Escalabilidad: Google necesita perfeccionar la escalabilidad ya que es un sistema


distribuido con varios subsistemas, dando servicio a millones de usuarios. Se
encuentra con problemas de escalabilidad en las siguientes dimensiones:
Tiene que ir lidiando cada vez con m�s datos.
Lidiar con m�s peticiones con el crecimiento de usuarios.
Busca mejores resultados.
Fiabilidad: el sistema debe funcionar en todo momento, sobre todo la funcionalidad
de b�squeda que debe estar disponible las 24 horas. Google ofrece un acuerdo de
nivel de servicios del 99,9%.
Rendimiento: el rendimiento general del sistema es cr�tico para Google,
especialmente para conseguir una latencia baja en las interacciones de usuarios.
Cuanto mejor sea el rendimiento, hay m�s probabilidades de que el usuario vuelva a
hacer m�s b�squedas.
Transparencia: hay una gran necesidad de transparencia para soportar el desarrollo
de nuevas aplicaciones y la extensibilidad del servicio web.
Aspectos del motor de b�squeda
Rastreo (crawling)
La tarea de un crawler es localizar y obtener los contenidos de la Web y pasar el
contenido a subsistemas de indexado. Para ello se utiliza el software Googlebot
que, recursivamente, lee una p�gina web dada obteniendo los enlaces y planificando
nuevas operaciones de rastreo. La frecuencia de las visitas depende de cu�nto
cambia la p�gina.

Google Caffeine: En agosto de 2009, Google anunci� el lanzamiento de una


arquitectura de b�squeda nueva, con nombre c�digo "cafe�na". La nueva arquitectura
fue dise�ada para obtener resultados m�s r�pido y funcionar mejor con la
informaci�n actualizada continuamente de servicios como Facebook y Twitter. Los
desarrolladores de Google se�alaron que la mayor�a de los usuarios no notar�an un
cambio inmediato, pero invitaron desarrolladores a probar su nuevo motor de
b�squeda de manera aislada para proteger el programa. Las diferencias notadas por
su impacto en la optimizaci�n del motor de b�squeda incluye m�s ponderaci�n de
palabras claves y toma en consideraci�n los a�os que tiene el dominio. Esta medida
fue interpretada por algunos como una respuesta al lanzamiento al mercado de una
versi�n mejorada de un servicio de b�squeda de Microsoft, renombrado a Bing. Google
anunci� la culminaci�n de "cafe�na" el 8 de junio de 2010, declarando que ten�an
resultados 50% m�s recientes debido a la continua actualizaci�n de su �ndice. Con
"cafe�na", Google cambi� su plataforma de indexaci�n back-end de MapReduce a
BigTable."Cafe�na" tambi�n se basa en Coloso, o GFS2, una reforma del sistema de
distribuci�n de archivos EFP.
Con la introducci�n de Caffeine en 2010, Google pasa a una aproximaci�n m�s
continua con la intenci�n de ofrecer m�s frescura en t�rminos de resultados de
b�squeda. Caffeine utiliza un nuevo servicio de infraestructura llamada Percolator
que admite actualizaci�n incremental de grandes conjuntos de datos.
Google Hummingbird: En septiembre de 2013 Google lanza Google Hummingbird o Google
Colibr�,29? nuevo algoritmo que viene a sustituir a Google Caffeine y cuyas
principales novedades estriban en la posibilidad de responder a preguntas en lugar
de interpretarse cada una de las palabras por separado.30? Para Google ello supone
un avance m�s hacia el buscador inteligente. Google Colibr� no incidir�a de una
manera directa en penalizaciones, sino que supondr�a un avance en el desarrollo
independientemente de c�mo otras modificaciones como Google Panda o Google Penguin
s� han introducido elementos de lucha contra el spam.

Indexaci�n
Produce un �ndice de contenidos similar al de un libro. T�cnicamente se denomina
indexado inverso de palabras que aparecen en p�ginas web y otros recursos textuales
como documentos en.pdf,.doc y otros formatos. No solo guarda la posici�n, tambi�n
almacena otra informaci�n relevante como el tama�o de fuente y capitalizaci�n.
Utilizando este �ndice, se reduce el n�mero de p�ginas candidatas de miles de
millones a unas decenas de miles, seg�n el poder discriminativo de las palabras
buscadas.

La indexaci�n tambi�n mantiene un �ndice de enlaces, llevando un seguimiento de qu�


p�ginas apuntan a una p�gina web.

Datos no indexables: A pesar de su �ndice inmenso, tambi�n existe una considerable


cantidad de informaci�n disponible en bases de datos en l�nea que se puede acceder
por medio de consultas, pero no por enlaces. Esta "Internet profunda" o "Internet
invisible" est� m�nimamente cubierta por Google y otros motores de b�squeda.31? La
Internet profunda contiene cat�logos de bibliotecas, documentos oficiales
legislativos de los gobiernos, gu�as telef�nicas y otros contenidos que son
din�micamente preparados para responder a una consulta.
Clasificaci�n (Ranking)
El problema con el indexado es que no proporciona informaci�n sobre la importancia
relativa de las p�ginas web que contienen un conjunto de palabras clave. Todos los
motores de b�squeda modernos tienen una clasificaci�n que indica la importancia de
la p�gina y asegura que las m�s importantes aparecen en los primeros puestos de la
lista de resultados.

Google utiliza el algoritmo PageRank para decidir la importancia de la p�gina web.


Est� basado en los sistemas de ranking de las publicaciones cient�ficas, un
art�culo es importante si ha sido citado por otros colegas del �rea. El ranking en
Google tambi�n tiene en cuenta factores relacionados con la proximidad de la
b�squeda a las palabras clave de la p�gina obtenidas en el indexado inverso.

PageRank: La llegada de Google al �xito fue en gran parte debido a un algoritmo


patentado llamado PageRank que ayuda a clasificar las p�ginas web que coincidan con
una cadena de b�squeda.32? Cuando Google era un proyecto de investigaci�n de
Stanford, fue apodado BackRub, porque la tecnolog�a comprueba los v�nculos para
determinar la importancia de un sitio.
Los anteriores m�todos basados en palabras claves utilizados por muchos motores de
b�squeda que fueron una vez m�s popular que Google, clasificaban las p�ginas por la
frecuencia con que los t�rminos de b�squeda ocurr�an en la p�gina o qu� tan
frecuentemente fueron asociados los t�rminos de b�squeda en cada p�gina de
resultados.

El algoritmo de PageRank analiza los enlaces generados por el usuario asumiendo que
las p�ginas web enlazadas desde muchas p�ginas importantes tienen probablemente la
misma importancia. El algoritmo calcula una puntuaci�n recursiva de p�ginas, basado
en la suma ponderada del PageRank de las p�ginas con enlaces a ellos. Se cree que
PageRank se correlaciona bien con los conceptos de importancia para las personas.
Adem�s de PageRank, Google ha a�adido muchos otros criterios no mencionados para
determinar la clasificaci�n de las p�ginas de las listas de resultados, se report�
que hay m�s de 200 indicadores diferentes.33?34? Los detalles espec�ficos de los
cuales se mantienen en secreto para permitirle a Google mantener una ventaja sobre
sus competidores a nivel mundial.

Arquitectura f�sica adoptada por Google


La filosof�a de Google en t�rminos de infraestructura f�sica es el uso de un gran
n�mero de PCs como base para producir un entorno para computaci�n y almacenamiento
distribuido. T�picamente un PC tendr� 2 TB de disco, 16 GB de DRAM y utiliza una
versi�n reducida del kernel de Linux.

Estrategias contra fallo: al utilizar PCs de bajo coste, Google reconoce que partes
de su infraestructura fallan, y por tanto se han dise�ado unas estrategias para
tolerar dichos fallos.

El origen de fallos m�s com�n es debido a software, con unas 20 m�quinas que
necesitan ser reiniciadas al d�a manualmente por problemas de software.
Los problemas de hardware representan 1/10 de los fallos. El 95% son fallos de
disco o de DRAM.
Esta informaci�n confirma la decisi�n de utilizar PCs de bajo coste dado el gran
n�mero de fallos debidos al software. No merece la pena invertir en PCs m�s caros.
Arquitectura f�sica: est� compuesta por los siguientes componentes

Los PCs est�n organizados en racks de entre 40 y 80 equipos. Cada rack tiene un
switch de Ethernet que provee conexi�n en el rack y hacia el exterior.
Los racks est�n organizados en clusters formados por 30 racks o m�s. Un cluster es
una unidad b�sica de gesti�n que tiene determinado, por ejemplo, la localizaci�n y
replicaci�n de servicios. Cada rack est� conectado a dos switches de banda ancha
para que haya redundancia.
Los clusters se encuentran en centros de datos de Google que est�n repartidos por
el mundo. En el 2000 Google ten�a dos centros de datos en Silicon Valley y uno en
Virgina. Desde entonces el n�mero ha aumentado significantemente y hay centros de
datos en Estados Unidos, Irlanda, B�lgica, Jap�n, China, etc.
Capacidad de almacenamiento: si cada PC ofrece 2 TB de almacenamiento, entonces un
rack de 80 PCs ofrece 160 TB, con un cluster de 30 racks se ofrecen 4,8 petabytes.
No se conoce exactamente el n�mero de m�quinas que tiene la compa��a pero podemos
asumir que cuentan con unos 200 clusters, que ofrecen 960 petabytes de
almacenamiento, casi 1 exabyte (10^18 bytes).

Middleware
Art�culo principal: Middleware
El sistema est� compuesto por un grupo de servicios distribuidos que ofrecen
funcionalidad a los desarrolladores. Est�n divididos en las siguientes categor�as:

Paradigmas de comunicaci�n, que incluyen servicios para comunicaciones tanto


remotas como multicast.

Protocol buffers: ofrecen un formato de serializaci�n com�n.


Publish-subscribe: servicio para la diseminaci�n de eventos.
Datos y coordinaci�n, proporciona almacenamiento y acceso coordinado a datos.

GFS: ofrece un sistema de ficheros optimizado para las necesidades de Google,


incluyendo el almacenamiento de ficheros de gran tama�o.
Chubby: soporta la coordinaci�n de servicios y el almacenamiento de vol�menes
peque�os de datos.
Bigtable: base de datos distribuida construida sobre GFS/Chubby.
Computaci�n distribuida, proporciona servicios para el uso de computaci�n paralela
y distribuida sobre la arquitectura f�sica.

MapReduce: soporta computaci�n distribuida sobre conjuntos de datos grandes.


Sawzall: es un lenguaje de alto nivel para la ejecuci�n de computaciones
distribuidas.35?
Mensajes de error
Algunas b�squedas dar� el error "403 Forbidden error" con el texto

"Lo sentimos...... pero tu consulta se parece a las solicitudes automatizadas de un


virus inform�tico o aplicaci�n de spyware. Para proteger a nuestros usuarios, no
podemos procesar su solicitud por los momentos. Vamos a restaurar su acceso tan
pronto como sea posible, int�ntelo de nuevo en unos minutos. Mientras tanto, si
usted sospecha que su computadora o red ha sido infectada, es posible que desee
ejecutar un antivirus o eliminador de spyware para asegurarse de que sus sistemas
est�n libres de virus y otras aplicaciones malignas. Pedimos disculpas por las
molestias, y esperamos su pronto regreso a nuestra plataforma de Google."

A veces, seguido de un sistema CAPTCHA.36?

La pantalla fue reportada por primera vez en 2005 y fue una respuesta a la fuerte
utilizaci�n de Google por empresas de optimizaci�n de b�squedas para verificar el
rango de los sitios que optimiza. El mensaje es provocado por un gran volumen de
solicitudes a partir de una �nica direcci�n IP. Google al parecer utiliza cookies
como parte de su protocolo para determinar si rechaza el servicio o no.

En junio de 2009, despu�s de la muerte de la superestrella del pop Michael Jackson,


apareci� este mensaje a muchos usuarios de internet que estaba buscando en Google
las noticias relacionadas con el cantante y fue asumido por Google que fue un
ataque DDoS, aunque muchas preguntas fueron presentadas por buscadores leg�timos.

Error de software en enero de 2009


Google etiqueta resultados de b�squeda con el mensaje "Este sitio puede da�ar tu
equipo" si el sitio es conocido por instalar software malicioso. Google hace esto
para proteger a los usuarios que visiten este tipo de sitios web. Por
aproximadamente 40 minutos el 31 de enero de 2009, todos los resultados de
b�squedas fueron clasificados err�neamente como malware y por lo tanto, no se pod�a
hacer clic en �l. En su lugar, aparec�a un mensaje de aviso al usuario y era
requerido que el usuario introdujera la direcci�n URL solicitada de forma manual.
Este problema fue causado por un error humano.37?38?39?40? La direcci�n URL de "/"
(que se expande a todas las URLs) fue agregado por error en el fichero de patrones
de malware.

Internacional
Google est� disponible en muchos idiomas y ha sido modificado por completo o en
parte, para muchos pa�ses.41?

Idiomas
Afrik�ans
Akan
Albania
Am�rico
�rabe
Armenia
Azerbaiy�n
Euskera
Belar�s
Bemba
Bengal�
Bihari
Bosnio
Breton
Bulgaria
Camboya (khmer)
Catal�n
Cherokee
Chichewa
Chino (simplificado)
Chino (tradicional)
Corsa
Croacia
Checa
Dan�s
Holanda
Ingl�s (Brit�nico)
Ingl�s (Norteamericano)
Esperanto
Estonia
Fero�s
Filipino
Fin�s
Franc�s
Frisia (Oeste)
Gallego
Georgia
Alem�n
Griego
Guaran�
Gujarati
Hausa
Criollo haitiano
Hawai
Hebreo
Hindi
Hungr�a
Islandia
Igbo
Indonesia
Interlingua
Irland�s
Italiano
Japon�s
Java
Canar�s
Kazajst�n
Kinyarwanda
Kirundi
Coreano
Kurdos
Kirguist�n
Laos
Am�rica
Letonia
Lingala
Lituania
Luganda
Luo
Macedonia
Madagascar
Malasia
Malayalam
Malta
Maor�
Marathi
Mauricio Creole
Moldavia (Rumania)
Mongol
Montenegro
Nepal
Noruega
Occitano
Oriya
Oromo
Past�n
Persa
Polonia
Portugu�s (Brasil)
Portugu�s (Portugal)
Punjabi
Quechua
Ruman�a
Romanche
Runyakitara
Ruso
Ga�lico escoc�s
Serbia
Serbo-croata
Sesotho
Setswana
Shona
Sindhi
Cingaleses
Eslovaco
Eslovenia
Somalia
Espa�ol
Sundanese
Swahili
Sueco
Tayikist�n
Tamil
T�rtaro
Telugu
Tailandia
Tigrinya
Tonga
Tshiluba
Turqu�a
Turkmenist�n
Uigur
Ucraniano
Urdu
Uzbekist�n
Vietnamita
Gales
Xhosa
Yiddish
Yoruba
Zul�
La interfaz tambi�n ha sido puesta a disposici�n en varios idiomas con fines
humor�sticos:
Bork, bork, bork!
Elmer Gru��n
Leetspeak
Klingon
Pig Latin
Pirata
Nombres de dominio
Art�culo principal: Lista de dominios de Google
Adem�s de la URL Google.com principal, Google Inc. posee 160 nombres de dominio
para cada uno de los pa�ses/regiones para las que se ha modificado.

V�ase tambi�n
Ver el portal sobre Internet Portal:Internet. Contenido relacionado con Internet.
Wikimedia Commons alberga una categor�a multimedia sobre Buscador de Google.
Open Directory Project
Yahoo! Search
Blackle
Bing (motor de b�squeda)
Anexo:Motores de b�squeda
YaCy
DuckDuckGo
Referencias
�Google: 15 a�os de la empresa que cambi� el mundo�. Consultado el 6 de octubre de
2013.
�Alexa Search Engine ranking�. Consultado el 15 de noviembre de 2009.
�Almost 12 Billion U.S. Searches Conducted in July�. SearchEngineWatch. 2 de
septiembre de 2008. Archivado desde el original el 12 de septiembre de 2008.
�WHOIS - google.com�. Consultado el 27 de enero de 2009.
...The *, or wildcard, is a little-known feature that can be very powerful...
Hubbard, Douglas (2011). Pulse: The New Science of Harnessing Internet Buzz to
Track Threats and Opportunities. John Wiley & Sons.
Goel, Kavi; Ramanathan V. Guha, Othar Hansson (12 de mayo de 2009). �Introducing
Rich Snippets�. Google Webmaster Central Blog. Google. Consultado el 25 de mayo de
2009.
�Voice Search for Google.com - Just click the mic and say your search. And, Search
Google by giving Image�. Consultado el 16 de diciembre de 2013.
Boulton, Clint. �Google Redesign Backs Social Effort�. eWeek Europe. eWeek Europe.
Archivado desde el original el 5 de julio de 2011. Consultado el 1 de julio de
2011.
�Google redesigns its homepage� (en ingl�s). Los Angeles Times. Consultado el 28
de diciembre de 2013.
�Google Frequently Asked Questions - File Types�. Google. Archivado desde el
original el 13 de febrero de 2008. Consultado el 29 de enero de 2008.
Peter Nowak (2010). Tech Bytes: Google Instant (Television production). United
States: ABC News.
Van Wagner, Matt. �How Google Saved $100 Million By Launching Google Instant�.
Consultado el 20 de septiembre de 2010.
Google Web Search Help Forum (WebCite archive)
�Google support forum, one of many threads on being unable to switch off Instant
Search, with hundreds of postings and votes� (en ingl�s). Consultado el 30 de
diciembre de 2013.
�CNN: Which words does Google Instant blacklist?� (en ingl�s). Consultado el 30 de
diciembre de 2013.
�The Huffington Post: Google Instant Censorship: The Strangest Terms Blacklisted
By Google� (en ingl�s). Consultado el 30 de diciembre de 2013.
�Search Features�. Google.com. mayo de 2009.
�Google.com�. Consultado el 29 de diciembre de 2013.
�SSL Search: Features - Web Search Help�. Web Search Help. Google. mayoo de 2010.
Consultado el 7 de julio de 2010.
�Encrypted.google.com�. Archivado desde el original el 29 de diciembre de 2013.
Consultado el 29 de diciembre de 2013.
�Top 500�. Alexa. Archivado desde el original el 25 de noviembre de 2007.
Consultado el 15 de abril de 2008.
�BBC NEWS | Americas | 'Miserable failure' links to Bush� (en ingl�s). Consultado
el 16 de diciembre de 2013.
Hwang, Dennis (8 de junio de 2004). �Oodles of Doodles�. Google (corporate blog).
Consultado el 19 de julio de 2006.
�Doodle History�. Google, Inc. Consultado el 5 de octubre de 2010.
�Google logos:Valentine's Day logo�. 14 de febrero de 2007. Consultado el 6 de
abril de 2007.
�Blogspot.com, Powering a Google search�. Consultado el 30 de diciembre de 2013.
�Google Webmaster Guidelines�. Google. Consultado el 15 de noviembre de 2009.
�Google Hummingbird�. Consultado el 11 de octubre de 2010.
�Google Colibr�. Consultado el 11 de octubre de 2013.
Sherman, Chris and Price, Gary. �The Invisible Web: Uncovering Sources Search
Engines Can't See, In: Library Trends 52 (2) 2003: Organizing the Internet:�. pp.
282-298.
Sergey Brin and Lawrence Page (1998). �The Anatomy of a Large-Scale Hypertextual
Web Search Engine�. Stanford University. Consultado el 15 de noviembre de 2009.
�Corporate Information: Technology Overview�. Google. Consultado el 15 de
noviembre de 2009.
�Exclusive: How Google�s Algorithm Rules the Web� (en ingl�s). Wired.com.
Consultado el 16 de diciembre de 2013.
G. Colouris, J. Dollimore, T. Kindberg y G. Blair. Distributed Systems: Concepts
and Design (5.� Ed). Addison-Wesley, 2011
�Google error page�. Archivado desde el original el 31 de julio de 2008.
Consultado el 31 de diciembre de 2008.
Krebs, Brian (31 de enero de 2009). �Google: This Internet May Harm Your Computer�
(en ingl�s). The Washington Post. Consultado el 31 de enero de 2009.
Mayer, Marissa (31 de enero). �This site may harm your computer on every search
result?!?!�. The Official Google Blog (en ingl�s). Google. Consultado el 31 de
enero de 2009.
Weinstein, Maxim (31 de enero de 2009). �Google glitch causes confusion� (en
ingl�s). StopBadware.org. Archivado desde el original el 8 de julio de 2010.
Consultado el 10 de mayo de 2010.
Cooper, Russ (31 de enero de 2009). �Serious problems with Google search� (en
ingl�s). Verizon Business Security Blog. Consultado el 10 de mayo de 2010.
�Traductor de google�. Consultado el 29 de diciembre de 2013.
Enlaces externos
Sitio web oficial
Categor�as: Servicios de GoogleMotores de b�squeda de InternetIntroducciones
relacionadas a la ciencia de la computaci�n de 1997
Men� de navegaci�n
No has accedidoDiscusi�nContribucionesCrear una
cuentaAccederArt�culoDiscusi�nLeerEditarVer historialBuscar
Buscar en Wikipedia
Portada
Portal de la comunidad
Actualidad
Cambios recientes
P�ginas nuevas
P�gina aleatoria
Ayuda
Donaciones
Notificar un error
En otros proyectos
Wikimedia Commons
Wikinoticias
Imprimir/exportar
Crear un libro
Descargar como PDF
Versi�n para imprimir
Herramientas
Lo que enlaza aqu�
Cambios en enlazadas
Subir archivo
P�ginas especiales
Enlace permanente
Informaci�n de la p�gina
Elemento de Wikidata
Citar esta p�gina

En otros idiomas
???????
English
Fran�ais
??????
Bahasa Indonesia
Bahasa Melayu
Portugu�s
???????
??
65 m�s
Editar enlaces
Esta p�gina se edit� por �ltima vez el 14 jul 2019 a las 02:19.
El texto est� disponible bajo la Licencia Creative Commons Atribuci�n Compartir
Igual 3.0; pueden aplicarse cl�usulas adicionales. Al usar este sitio, usted acepta
nuestros t�rminos de uso y nuestra pol�tica de privacidad.
Wikipedia� es una marca registrada de la Fundaci�n Wikimedia, Inc., una
organizaci�n sin �nimo de lucro.

Вам также может понравиться