Net Profunda

Internet profunda
Ir a la navegaci�nIr a la b�squeda
�Deep web� redirige aqu�. Para el documental, v�ase Deep Web (documental).
Cifrado de la Internet profunda

Internet profunda1? (del ingl�s, deep web), internet invisible2? o internet
oculta3? es el contenido de internet que no est� indexado por los motores de
b�squeda convencionales, debido a diversos factores.4? El t�rmino se atribuye al
inform�tico Mike Bergman.5? Es el opuesto al Internet superficial.
�ndice
1 Origen
2 Tama�o
3 Motivos
4 Denominaci�n
5 Internet acad�mica invisible
5.1 Tama�o de la Internet acad�mica invisible.
6 Rastreando la internet profunda
7 M�todos de profundizaci�n
7.1 Las ara�as (web crawlers)
7.2 Tor
7.3 Criptomoneda
8 Recursos de la internet profunda
9 V�ase tambi�n
10 Referencias
11 Enlaces externos
Origen
La principal causa de la existencia de la internet profunda es la imposibilidad de
los motores de b�squeda (Google, Yahoo, Bing, etc.) de encontrar o indexar gran
parte de la informaci�n existente en Internet. Si los buscadores tuvieran la
capacidad para acceder a toda la informaci�n entonces la magnitud de la �internet
profunda� se reducir�a casi en su totalidad. No obstante, aunque los motores de
b�squeda pudieran indexar la informaci�n de la internet profunda esto no
significar�a que esta dejara de existir, ya que siempre existir�n las p�ginas
privadas. Los motores de b�squeda no pueden acceder a la informaci�n de estas
p�ginas y s�lo determinados usuarios, aquellos con contrase�as o c�digos
especiales, pueden hacerlo.
En la Deep Web pueden establecerse contactos que no son monitoreados, nadie est�
all� observando. Adem�s las transferencias tanto de mercanc�a como de pagos son
pr�cticamente imposible de rastrear. La web est� dividida en dos partes, la web
superficial y la web profunda. Esta �ltima es la que se conoce como Deep Web, donde
se ubica todo contenido que no es indexable por los buscadores, o al que los
usuarios no pueden acceder mediante un buscador web como DuckDuckGo, Startpage,
Yandex, Ecosia, Yahoo!, Google o Bing.
La internet profunda no es una regi�n prohibida o m�stica de internet, y la

tecnolog�a relacionada con ella por lo general no es conspirativa, peligrosa o
ilegal. En ella se alberga todo tipo de recurso al que se es dif�cil de acceder
mediante m�todos comunes como los motores de b�squeda populares.
Una parte de la internet profunda consiste en redes internas de instituciones

cient�ficas y acad�micas que forman la denominada Academic Invisible Web:
(�Internet acad�mica invisible�) la cual se refiere a las bases de datos que
contienen avances tecnol�gicos, publicaciones cient�ficas, y material acad�mico en
general a los cuales no se pueden acceder f�cilmente.6?
Tama�o
La internet profunda es un conjunto de sitios web y bases de datos que buscadores
comunes no pueden encontrar ya que no est�n indexadas. El contenido que se puede
hallar dentro de la internet profunda es muy amplio.7?
El internet se ve dividido en dos ramas, la internet profunda y la superficial. La

internet superficial se compone de p�ginas indexadas en servidores DNS con una
alfabetizaci�n y codificaci�n de p�gina perfectamente entendible por los motores de
b�squeda, mientras que la internet profunda est� compuesta de p�ginas cuyos
dominios est�n registrados con extensiones .onion y los nombres de los dominios
est�n codificados en una trama HASH. Estas p�ginas se sirven de forma ad hoc, y no
necesitan registrarse, basta con que tu ordenador tenga funcionando un servicio
onion, que har� las veces de un servicio dns, pero especial para las p�ginas del
internet profundo. Mediante una red P2P, se replican las bases de datos que
contienen la resoluci�n de nombres HASH.
Mientras que las p�ginas normales son identificadas mediante el protocolo UDP/IP,
las p�ginas .onion son repetidas por el ramal al que se ha conectado el navegador
especializado para tal sistema de navegaci�n segura. El sistema de b�squeda es el
mismo que usa BitTorrent. El contenido se coloca en una base de datos y se
proporciona s�lo cuando lo solicite el usuario.8?
En 2010 se estim� que la informaci�n que se encuentra en la internet profunda es de

7500 terabytes, lo que equivale a aproximadamente 550 billones de documentos
individuales. El contenido de la internet profunda es de 400 a 550 veces mayor de
lo que se puede encontrar en la internet superficial. En comparaci�n, se estima que
la internet superficial contiene solo 19 terabytes de contenido y un bill�n de
documentos individuales.
Tambi�n en 2010 se estim� que exist�an m�s de 200 000 sitios en la internet
profunda.9?
Estimaciones basadas en la extrapolaci�n de un estudio de la Universidad de

California en Berkeley especula que actualmente la internet profunda debe tener
unos 91 000 terabytes.10?
La Association for Computing Machinery (ACM) public� en 2007 que Google y Yahoo
indexaban el 32 % de los objetos de la internet profunda, y MSN ten�a la cobertura
m�s peque�a con el 11 %. Sin embargo, la cobertura de los tres motores era de 37 %,
lo que indicaba que estaban indexando casi los mismos objetos.11?
Motivos
Motivos por los que los motores de b�squeda no pueden indexar algunas p�ginas:
Documentos o informaci�n oculta: Pdfs que no se encuentran en las p�ginas

indexadas, listas de datos no p�blicas (sobre todo los ciber-criminales)...
Web contextual: p�ginas cuyo contenido var�a dependiendo del contexto (por ejemplo,
la direcci�n IP del cliente, de las visitas anteriores, etc.).
Contenido din�mico: p�ginas din�micas obtenidas como respuesta a par�metros, por
ejemplo, datos enviados a trav�s de un formulario.
Contenido de acceso restringido: p�ginas protegidas con contrase�a, contenido
protegido por un Captcha, etc.
Contenido No HTML: contenido textual en archivos multimedia, otras extensiones como
exe, rar, zip, etc.
Software: Contenido oculto intencionadamente, que requiere un programa o protocolo
espec�fico para poder acceder (ejemplos: Tor, I2P, Freenet)
P�ginas no enlazadas: p�ginas de cuya existencia no tienen referencia los
buscadores; por ejemplo, p�ginas que no tienen enlaces desde otras p�ginas.
Denominaci�n
Son p�ginas de texto, archivos, o en ocasiones informaci�n a la cual se puede
acceder por medio de la World Wide Web que los buscadores de uso general no pueden,
debido a limitaciones o deliberadamente, agregar a sus �ndices de p�ginas web.
La Web profunda se refiere a la colecci�n de sitios o bases de datos que un

buscador com�n, como Google, no puede o no quiere indexar. Es un lugar espec�fico
del internet que se distingue por el anonimato. Nada que se haga en esta zona puede
ser asociado con la identidad de uno, a menos que uno lo desee.12?
Bergman, en un art�culo semanal sobre la Web profunda publicado en el Journal of

Electronic Publishing, mencion� que Jill Ellsworth utiliz� el t�rmino �Web
invisible� en 1994 para referirse a los sitios web que no est�n registrados por
ning�n motor de b�squeda.13?
En su art�culo, Bergman cit� la entrevista que Frank Garc�a hizo a Ellsworth en

1996:14?
Ser�a un sitio que, posiblemente, est� dise�ado razonablemente, pero no se

molestaron en registrarlo en alguno de los motores de b�squeda. �Por lo tanto,
nadie puede encontrarlos! Est�s oculto. Yo llamo a esto la Web invisible.
Otro uso temprano del t�rmino Web Invisible o web profunda fue por Bruce Monte y
Mateo B. Koll de Personal Library Software, en una descripci�n de la herramienta @
1 de web profunda, en un comunicado de prensa de diciembre de 1996.15?
La importancia potencial de las bases de datos de b�squeda tambi�n se reflej� en el

primer sitio de b�squeda dedicado a ellos, el motor AT1 que se anunci� a bombo y
platillo a principios de 1997. Sin embargo, PLS, propietario de AT1, fue adquirida
por AOL en 1998, y poco despu�s el servicio AT1 fue abandonado.13?
El primer uso del t�rmino espec�fico de web profunda, ahora generalmente aceptada,
ocurri� en el estudio de Bergman de 2001 mencionado anteriormente.
Por otra parte, el t�rmino web invisible se dice que es inexacto porque:
Muchos usuarios asumen que la �nica forma de acceder a la web es consultando un

buscador.
Alguna informaci�n puede ser encontrada m�s f�cilmente que otra, pero esto no
quiere decir que est� invisible.
La web contiene informaci�n de diversos tipos que es almacenada y recuperada en
diferentes formas.
El contenido indexado por los buscadores de la web es almacenado tambi�n en bases
de datos y disponible solamente a trav�s de las peticiones o consultas del usuario,
por tanto no es correcto decir que la informaci�n almacenada en bases de datos es
invisible.16?
Internet acad�mica invisible
Se denomina Internet Acad�mica Invisible o Academic Invisible Web (AIW) a el
conjunto de bases de datos y colecciones relevantes para la academia, o con fines
acad�micos, que no es posible ser buscado por los motores de b�squeda
convencionales 6?. La preocupaci�n sobre este tema radica en que millones de
documentos permanecen invisibles frente a los ojos de los usuarios convencionales.
Dentro de estos documentos se pueden encontrar art�culos, libros, reportes,
documentos de acceso abierto, datos de encuestas, entre otros. El problema con los
motores de b�squeda convencionales es que no muestran aquellos datos que cambian
constantemente, como informaci�n clim�tica o im�genes satelitales y dicha
informaci�n, al cambiar de manera tan r�pida es imposible de ser indexada por lo
que restringe su aparici�n en los motores de b�squeda convencionales.17?
Una aproximaci�n al indexamiento y apertura de la Internet acad�mica invisible son

los motores de b�squeda que se centran en informaci�n acad�mica, como Google
Scholar o Scirus. El problema de estos motores de b�squeda mencionados
anteriormente es que fueron creados por compa��as comerciales. El portal de ciencia
Vascoda ha demostrado ser la alternativa m�s efectiva para eliminar el espacio
entre la Internet acad�mica visible e invisible ya que integra bases de datos de
literatura, colecciones de librer�as y dem�s contenido acad�mico mediante un
indexamiento basado en el uso de las etiquetas de cada uno de los dominios que
albergan dicha informaci�n.6?
Cabe resaltar que no toda la ausencia de esta informaci�n en la Internet Visible se

debe a los motores de b�squeda, otro de estos factores se debe a que algunos de
estos documentos son propiedad de editoriales de base de datos.
Tama�o de la Internet acad�mica invisible.

El intento m�s acertado por realizar una medici�n de la cantidad de documentos
acad�micos presentes en la web invisible fue realizado por Bergman en 2001 en su
estudio The Deep Web: Surfacing Hideen Value17?. En dicha investigaci�n Bergman
realiz� un listado de los 60 sitios acad�micos m�s largos de la Deep Web entre los
que se encontraba el National Climatic Data Center (NOAA), NASA EOSDIS, National
Oceanographic (combined with Geophysical) Data Center (NOAA), entre otras.
Los sesenta sitios de la Deep Web m�s grandes17?

Nombre Tipo URL Tama�o (GBs)
National Climatic Data Center (NOAA) P�blico
http://www.ncdc.noaa.gov/ol/satellite/satelliteresources.html 366,000
NASA EOSDIS P�blico http://harp.gsfc.nasa.gov/~imswww/pub/imswelcome/plain.html
219,600
National Oceanographic (combined with Geophysical) Data Center (NOAA) P�blico/Pago
http://www.nodc.noaa.gov/, http://www.ngdc.noaa.gov/ 32,940
DBT Online Pago http://www.dbtonline.com/ 30,500
Alexa P�blico (parcial) http://www.alexa.com/ 15,860
Right-to-Know Network (RTK Net) P�blico http://www.rtk.net/ 14,640
Lexis-Nexis Pago http://www.lexis-nexis.com/lncc/ 12,200
Dialog Pago http://www.dialog.com/ 10,980
Genealogy - ancestry.com Pago http://www.ancestry.com/ 6,500
MP3.com P�blico http://www.mp3.com/ 4,300
Terraserver P�blico/Pago http://terraserver.microsoft.com/ 4,270
ProQuest Direct (incl. Digital Vault) Pago http://www.umi.com 3,172
Dun & Bradstreet Pago http://www.dnb.com 3,113
Westlaw Pago http://www.westlaw.com/ 2,684
Dow Jones News Retrieval Pago http://dowjones.wsj.com/p/main.html 2,684
HEASARC (High Energy Astrophysics Science Archive Research Center) P�blico
http://heasarc.gsfc.nasa.gov/W3Browse/ 2,562
US PTO - Trademarks + Patents P�blico http://www.uspto.gov/tmdb/,
http://www.uspto.gov/patft/ 2,440
Informedia (Carnegie Mellon Univ.) P�blico
https://web.archive.org/web/20070610040617/http://www.informedia.cs.cmu.edu/
1,830
infoUSA Pago/P�blico http://www.infousa.com/ 1,584
Alexandria Digital Library P�blico http://www.alexandria.ucsb.edu/adl.html
1,220
JSTOR Project Limitado http://www.jstor.org/ 1,220
10K Search Wizard P�blico http://www.tenkwizard.com/ 769
UC Berkeley Digital Library Project P�blico http://elib.cs.berkeley.edu/ 766
SEC Edgar P�blico http://www.sec.gov/edgarhp.htm 610
US Census P�blico http://factfinder.census.gov 610
Elsevier Press Pago http://www.elsevier.com 570
NCI CancerNet Database P�blico http://cancernet.nci.nih.gov/ 488
EBSCO Pago http://www.ebsco.com 481
Amazon.com P�blico http://www.amazon.com/ 461
IBM Patent Center P�blico/Privado http://www.patents.ibm.com/boolquery 345
NASA Image Exchange P�blico http://nix.nasa.gov/ 337
Springer-Verlag Pago
https://web.archive.org/web/20030618175504/http://link.springer.de/ 221
InfoUSA.com P�blico/Privado http://www.abii.com/ 195
OVID Technologies Pago http://www.ovid.com 191
Investext Pago http://www.investext.com/ 157
Blackwell Science Pago http://www.blackwell-science.com 146
Betterwhois (muchos similares) P�blico http://betterwhois.com/ 152
GPO Access P�blico http://www.access.gpo.gov/ 146
Adobe PDF Search P�blico http://searchpdf.adobe.com/ 143
Internet Auction List P�blico
http://www.internetauctionlist.com/search_products.html 130
Commerce, Inc. P�blico http://search.commerceinc.com/ 122
Library of Congress Online Catalog P�blico http://catalog.loc.gov/ 116
GenServ Pago http://gs01.genserv.com/gs/bcc.htm 106
Academic Press IDEAL Pago http://www.idealibrary.com 104
Sunsite Europe P�blico http://src.doc.ic.ac.uk/ 98
Uncover Periodical DB P�blico/Pago http://uncweb.carl.org/ 97
Astronomer's Bazaar P�blico http://cdsweb.u-strasbg.fr/Cats.html 94
eBay.com P�blico http://www.ebay.com/ 82
Tradecompass Pago http://www.tradecompass.com/ 61
REALTOR.com Real Estate Search P�blico http://www.realtor.com/ 60
Federal Express P�blico http://www.fedex.com/ 53
Integrum P�blico/Privado http://www.integrumworld.com/eng_test/index.html
49
NIH PubMed P�blico http://www.ncbi.nlm.nih.gov/PubMed/ 41
Visual Woman (NIH) P�blico
http://www.nlm.nih.gov/research/visible/visible_human.html 40
AutoTrader.com P�blico http://www.autoconnect.com/index.jtmpl/?
LNX=M1DJAROSTEXT 39
UPS P�blico http://www.ups.com/ 33
NIH GenBank P�blico http://www.ncbi.nlm.nih.gov/Genbank/index.html 31
AustLi (Australasian Legal Information Institute) P�blico
http://www.austlii.edu.au/austlii/ 24
Digital Library Program (UVa) P�blico http://www.lva.lib.va.us/ 21
INSPEC Pago http://www.iee.org.uk/publish/inspec/online/online.html 16
Subtotal fuentes p�blicas y mixtas 673,035
Subtotal fuentes pagas 75.469
TOTAL 748,504
El problema con dicha medici�n es que se realiz� por el tama�o de la p�gina (en GB)
m�s no por la cantidad de art�culos publicados. No obstante dicha cantidad
expresaba que se albergaba m�s de 700TB (o 700000GB) de informaci�n que no est�
expuesta en la Internet superficial.
Esta informaci�n es complementada por Lewandosky adicionando datos de la Gale

Directory of Databases los cuales fueron comparados con los datos de Bergman6?. En
dicho directorio se aproxim� que existe un total de 18.92 billones de documentos
acad�micos en total.
Rastreando la internet profunda
Infograf�a sobre la deep web

Los motores de b�squeda comerciales han comenzado a explorar m�todos alternativos
para rastrear la Web profunda. El Protocolo del sitio (primero desarrollado e
introducido por Google en 2005) y OAI son mecanismos que permiten a los motores de
b�squeda y otras partes interesadas descubrir recursos de la internet profunda en
los servidores web en particular. Ambos mecanismos permiten que los servidores web
anuncien las direcciones URL que se puede acceder a ellos, lo que permite la
detecci�n autom�tica de los recursos que no est�n directamente vinculados a la Web
de la superficie. El sistema de b�squeda de la Web profunda de Google pre-calcula
las entregas de cada formulario HTML y agrega a las p�ginas HTML resultantes en el
�ndice del motor de b�squeda de Google. Los resultados surgidos arrojaron mil
consultas por segundo al contenido de la Web profunda.18? Este sistema se realiza
utilizando tres algoritmos claves:
La selecci�n de valores de entrada, para que las entradas de b�squeda de texto

acepten palabras clave.
La identificaci�n de los insumos que aceptan solo valores espec�ficos (por ejemplo,
fecha).
La selecci�n de un peque�o n�mero de combinaciones de entrada que generan URLs
adecuadas para su inclusi�n en el �ndice de b�squeda Web.
M�todos de profundizaci�n
Las ara�as (web crawlers)
Cuando se ingresa a un buscador y se realiza una consulta, el buscador no recorre
la totalidad de internet en busca de las posibles respuestas, sino que busca en su
propia base de datos, que ha sido generada e indexada previamente. Se utiliza el
t�rmino �ara�a web� (en ingl�s web crawler) o robots (por software, com�nmente
llamados "bots") inteligentes que van haciendo b�squedas por enlaces de hipertexto
de p�gina en p�gina, registrando la informaci�n ah� disponible.19?
Cuando una persona realiza una consulta, el buscador no recorre la totalidad de

internet en busca de las posibles respuestas, lo cual supondr�a una capacidad de
reacci�n bastante lenta. Lo que hace es buscar en su propia base de datos, que ha
sido generada e indizada previamente. En sus labores de b�squeda, indizaci�n y
catalogaci�n, utilizan las llamadas ara�as (o robots inteligentes) que van saltando
de una p�gina web a otra siguiendo los enlaces de hipertexto y registran la
informaci�n all� disponible.
[...] datos que se generan en tiempo real, como pueden ser valores de Bolsa,
informaci�n del tiempo, horarios de trenes.
El contenido que existe dentro de la internet profunda es en muy raras ocasiones

mostrado como resultado en los motores de b�squeda, ya que las �ara�as� no rastrean
bases de datos ni los extraen. Las ara�as no pueden tener acceso a p�ginas
protegidas con contrase�as, algunos desarrolladores que no desean que sus p�ginas
sean encontradas insertan etiquetas especiales en el c�digo para evitar que sea
indexada. Las �ara�as� son incapaces de mostrar p�ginas que no est�n creadas en
lenguaje HTML, ni tampoco puede leer enlaces que incluyen un signo de
interrogaci�n. Pero ahora sitios web no creados con HTML o con signos de
interrogaci�n est�n siendo indexados por algunos motores de b�squeda. Sin embargo,
se calcula que incluso con estos buscadores m�s avanzados solo se logra alcanzar el
16 % de la informaci�n disponible en la internet profunda. Existen diferentes
t�cnicas de b�squeda para extraer contenido de la internet profunda como librer�as
de bases de datos o simplemente conocer el URL al que quieres acceder y escribirlo
manualmente.20?
Tor
Art�culo principal: Tor (red de anonimato)
Logo de Tor
The Onion Router (abreviado como TOR) es un proyecto dise�ado e implementado por la
marina de los Estados Unidos lanzado el 20 de septiembre de 2002. Posteriormente
fue patrocinado por la EFF (Electronic Frontier Foundation, una organizaci�n en
defensa de los derechos digitales). Al presente (2019), subsiste como TOR Project,
una organizaci�n sin �nimo de lucro galardonada en 2011 por la Free Software
Foundation por permitir que millones de personas en el mundo tengan libertad de
acceso y expresi�n en internet manteniendo su privacidad y anonimato.21?
A diferencia de los navegadores de internet convencionales, Tor le permite a los
usuarios navegar por la Web de forma an�nima. Tor es descargado de 30 millones a 50
millones de veces al a�o, hay 0,8 millones de usuarios diarios de Tor y un
incremento del 20 % solamente en 2013. Tor puede acceder a unos 6 500 sitios web
ocultos.22?
Cuando se ejecuta el software de Tor, para acceder a la internet profunda, los

datos de la computadora se cifran en capas. El software env�a los datos a trav�s de
una red de enlaces a otros equipos ?llamados en ingl�s �relays� (�nodos�)? y lo va
retransmitiendo quitando una capa antes de retransmitirlo de nuevo, esta
trayectoria cambia con frecuencia. Tor cuenta con m�s de 4 000 retransmisiones y
todos los datos cifrados pasan a trav�s de ?por lo menos? tres de estos relays. Una
vez que la �ltima capa de cifrado es retirado por un nodo de salida, se conecta a
la p�gina web que desea visitar.
El contenido que puede ser encontrado dentro de la internet profunda es muy vasto,
se encuentran por ejemplo, datos que se generan en tiempo real, como pueden ser
valores de Bolsa, informaci�n del tiempo, horarios de trenes, bases de datos sobre
agencias de inteligencia, disidentes pol�ticos y contenidos criminales.19?
Criptomoneda
Art�culo principal: Criptomoneda
Logo de Bitcoin, una criptomoneda

Es posible encontrar sitios web que realicen transacciones ilegales (como drogas,
armas, o incluso sicarios) en servidores exclusivos para usuarios de Tor. Es una
pr�ctica com�n utilizar monedas digitales como el Bitcoin21? que se intercambia a
trav�s de billeteras digitales entre el usuario y el vendedor, lo que hace que sea
pr�cticamente imposible de rastrear.23?
Vale la pena acotar que salvo por excepciones de algunos mercados como Silk Roads,
The Trade Route, o Wall Street Market, la mayor parte del comercio en la deep web
se constituye a base de ofertas enga�osas y fraudes en general, existe una gran
tendencia a satanizar a comunidades que buscan la libertad de expresi�n y el
anonimato, en el mundo hispano-hablante esta tendencia fue originada por blogueros
y youtubers que lejos de informar a las comunidades buscan crear esc�ndalos
amarillistas para obtener ingresos por conceptos de publicidad de sistemas como
Adsense. En los �ltimos a�os se ha demostrado que el Bitcoin no es una criptomoneda
segura cuando se trata de la confidencialidad de los datos de sus usuarios, motivo
por el cual tendr�a poco sentido utilizarla en redes de anonimato como Tor,
Freenet, o I2P, cuyos usuarios intentan alcanzar el cl�max del anonimato, por lo
cual no se puede descartar tampoco la intervenci�n de empresas propagandistas que
intentan aumentar el valor de mercado del bitcoin.
Recursos de la internet profunda

Los recursos de la internet profunda pueden estar clasificados en las siguientes
categor�as:
Contenido de acceso limitado: los sitios que limitan el acceso a sus p�ginas de una
manera t�cnica (Por ejemplo, utilizando el est�ndar de exclusi�n de robots o
captcha, que proh�ben los motores de b�squeda de la navegaci�n por y la creaci�n de
copias en cach�.24?
Contenido din�mico: las p�ginas din�micas que devuelven respuesta a una pregunta
presentada o acceder a trav�s de un formulario, especialmente si se utilizan
elementos de entrada en el dominio abierto como campos de texto.
Contenido no enlazado: p�ginas que no est�n conectadas con otras p�ginas, que
pueden impedir que los programas de rastreo web tengan acceso al contenido. Este
material se conoce como p�ginas sin enlaces entrantes.
Contenido programado: p�ginas que solo son accesibles a trav�s de enlaces
producidos por JavaScript, as� como el contenido descargado de manera din�mica a
partir de los servidores web a trav�s de soluciones de Flash o Ajax.
Sin contenido HTML: contenido textual codificado en multimedia (imagen o video)
archivos o formatos de archivo espec�ficos no tratados por los motores de b�squeda.
Web privada: los sitios que requieren de registro y de una contrase�a para iniciar
sesi�n
Web contextual: p�ginas con contenidos diferentes para diferentes contextos de
acceso (por ejemplo, los rangos de direcciones IP de clientes o secuencia de
navegaci�n anterior).
V�ase tambi�n
.onion
I2P
Darknet
The Hidden Wiki
Referencias
�internet profunda, mejor que Deep Web.� (�Aunque es posible emplear tanto el
masculino como el femenino, la forma femenina es la que de hecho est� m�s extendida
con gran diferencia.�). Fundeu. Consultado el30 de marzo de 2016.
Devine, Jane; Egger-Sider, Francine (julio de 2004). �Beyond google: the invisible
web in the academic library�. The Journal of Academic Librarianship 30 (4): 265-
269. doi:10.1016/j.acalib.2004.04.010. Consultado el 6 de febrero de 2014.
Raghavan, Sriram; Garcia-Molina, Hector (11-14 de septiembre de 2001). �Crawling
the Hidden Web�. 27th International Conference on Very Large Data Bases (Roma,
Italia).
�'Deep web': gu�a b�sica para saber qu� es y c�mo se usa�. El Pa�s. 2016.
Consultado el 2017.
Wright, Alex (22 de febrero de 2009). �Exploring a 'Deep Web' That Google Can�t
Grasp�. The New York Times. Consultado el 23 de febrero de 2009.
Lewandowski, Exploring the academic invisible web (11 de noviembre de 2013).
Library Hi Tech (en ingl�s). �the Academic Invisible Web (AIW). We define the
Academic Invisible Web as consisting of all databases and collections relevant to
academia but not searchable by the general-purpose internet search engines.�
Grossman, Lev (11 de noviembre de 2013). �The Deep Web.�. Time (en ingl�s).
Consultado el 28 de octubre de 2014. �Technically the Deep Web refers to the
collection of all the websites and databases that search engines like Google don't
or can't �ndex�.
Iffat, Rabia (1 de octubre de 2010). �Understanding the Deep Web�. Library
Philosophy and Practice 2010 (en ingl�s). Consultado el 28 de octubre de 2014.
�Surface Web is made up of static and fixed pages, whereas Deep Web is made up of
dynamic pages. Static pages do not depend on a database for their content. They
reside on a server waiting to be retrieved, and are basically html files whose
content never changes.�
Philosophy and Practice 2010 (en ingl�s). Consultado el 28 de octubre de 2014.
�Public information on the Deep Web is currently 400-550 times larger than the
commonly-defined World Wide Web. The Deep Web contains 7,500 terabytes of
information, compared to 19 on the Surface Web. Deep Web contains nearly 550
billion individual documents compared to one billion on the Surface Web. More than
200,000 Deep Web sites presently exist.�
DeepWeb.
He, Bin (1 de mayo de 2007). �Ebscohost.�. Communications of the ACM (en ingl�s).
Consultado el 29 de octubre de 2014. �Google and Yahoo both indexed 32% of the deep
Web objects, and MSN had the smallest coverage of 11%. However, there was
significant overlap in what they covered: the combined coverage of the three
largest search engines increased only to 37%, indicating they were indexing almost
the same objects.�
Grossman, Lev; Newton-Small, Roy & Stampler (noviembre de 2013). �The Deep Web�.
Time 182 (20).
Bergman, Michael K. �White Paper: The Deep Web: Surfacing Hidden Value� (en
ingl�s). Consultado el 30 de octubre de 2014.
Garcia, Frank (enero de 1996). �Business and Marketing on the Internet�. Masthead
9 (1). Archivado desde el original el 5 de diciembre de 1996. Consultado el 24 de
febrero de 2009.
@1 comenz� con 5.7 terabytes de contenido, estimado en 30 veces el tama�o de la
naciente World Wide Web; PLS fue adquirida por AOL en 1998 y @1 fue abandonado.�PLS
introduce AT1, el servicio de la primera "segunda generaci�n" de b�squeda en
internet�. Personal Library Software. diciembre de 1996. Archivado desde el
original el 21 de octubre de 1997. Consultado el 24 de febrero de 2009.
Llanes Vilaragut, Lourdes & Su�rez Carro, Juan R. �Para acceder al web profundo:
conceptos y herramientas�. Archivado desde el original el 30 de octubre de 2014.
Consultado el 30 de octubre de 2014.
Bergman, Michael K. (2001-8). �The Deep Web: Surfacing Hidden Value�. Journal of
Electronic Publishing 7 (1). ISSN 1080-2711. Consultado el 11 de marzo de 2019.
Madhavan, Jayant; Ko, David; Kot, Lucja; Ganapathy, Vignesh; Rasmussen, Alex &
Havely, Alon. �Google�s DeepWeb Crawl� (en ingl�s). Consultado el 30 de octubre de
2014.
Salazar, Idoia �El inmenso oc�ano del Internet profundo.� 20 de octubre de 2005.
El Pa�s (Madrid). Consultado el 29 de octubre de 2014.
Philosophy and Practice 2010 (en ingl�s). Consultado el 28 de octubre de 2014. �The
content of the Deep Web is rarely shown in a search engine result, since the search
engine spiders do not crawl into databases and extract the data. These spiders can
neither think nor type, but jump from link to link. As such, a spider cannot enter
pages that are password protected. Web page creators who do not want their page
shown in search results can insert special meta tags to keep the page from being
indexed. Spiders are also unable to pages created without the use of html, and also
links that include a question mark. But now parts of the Deep Web with non-html
pages and databases with a question mark in a stable URL are being indexed by
search engines, with non-html pages converted to html. Still, it is estimated that
even the best search engines can access only 16 percent of information available on
the Web. There are other Web search techniques and technologies that can be used to
access databases and extract the content.�
Becerra Guti�rrez Juan Armando. �Mitos y realidades de la internet profunda�.
Consultado el 28 de octubre de 2014. �Unlike conventional Internet browsers, Tor's
allows users to surf the Web anonymously. Tor is downloaded 30 million-50 million
times a year. There are 800,000 daily Tor users?a jump of 20% in the past year. Tor
can access 6,500 hidden websites.�
Consultado el 28 de octubre de 2014. �Bitcoin�.
�Hypertext Transfer Protocol (HTTP/1.1): Caching.� (en ingl�s). junio de 2014.
Enlaces externos
�Las profundidades del mar de internet�, art�culo en el sitio web CNN Expansion
(Atlanta).
Tor Project, sitio oficial del proyecto TOR.
Hidden Wiki, Deep Web Links.
Deep Web para Todos, grupo de discusiones sobre la Deep Web.
TOR, el oscuro mundo de la internet profunda @efe_tec
La verdad sobre la Deep Web Web de hackers e inform�ticos.
Categor�a: World Wide Web

Net Profunda

Загружено:

Сведения о документе

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

Net Profunda

Загружено:

Авторское право:

Доступные форматы

Internet profunda

Cifrado de la Internet profunda

La internet profunda no es una regi�n prohibida o m�stica de internet, y la

Una parte de la internet profunda consiste en redes internas de instituciones

El internet se ve dividido en dos ramas, la internet profunda y la superficial. La

En 2010 se estim� que la informaci�n que se encuentra en la internet profunda es de

Estimaciones basadas en la extrapolaci�n de un estudio de la Universidad de

Documentos o informaci�n oculta: Pdfs que no se encuentran en las p�ginas

La Web profunda se refiere a la colecci�n de sitios o bases de datos que un

Bergman, en un art�culo semanal sobre la Web profunda publicado en el Journal of

En su art�culo, Bergman cit� la entrevista que Frank Garc�a hizo a Ellsworth en

Ser�a un sitio que, posiblemente, est� dise�ado razonablemente, pero no se

La importancia potencial de las bases de datos de b�squeda tambi�n se reflej� en el

Muchos usuarios asumen que la �nica forma de acceder a la web es consultando un

Una aproximaci�n al indexamiento y apertura de la Internet acad�mica invisible son

Cabe resaltar que no toda la ausencia de esta informaci�n en la Internet Visible se

Tama�o de la Internet acad�mica invisible.

Los sesenta sitios de la Deep Web m�s grandes17?

Esta informaci�n es complementada por Lewandosky adicionando datos de la Gale

Rastreando la internet profunda

Infograf�a sobre la deep web

La selecci�n de valores de entrada, para que las entradas de b�squeda de texto

Cuando una persona realiza una consulta, el buscador no recorre la totalidad de

El contenido que existe dentro de la internet profunda es en muy raras ocasiones

Cuando se ejecuta el software de Tor, para acceder a la internet profunda, los

Logo de Bitcoin, una criptomoneda

Recursos de la internet profunda

Вам также может понравиться