2 Especializao em Tecnologias para Gesto de Negcios - Turma3 Outubro de 2014 Especializao em Tecnologias para Gesto de Negcios - Turma3 Aluno: Rodrigo Machado Alves Professora: Karina Rocha Gomes da Silva
DEEP WEB Contedo
1. Introduo ................................................................................................................................... 3 2. Tamanho ..................................................................................................................................... 3 3. Nomenclatura ............................................................................................................................. 3 4. Classificao .............................................................................................................................. 4 5. Como acessar a Deep Web....................................................................................................... 4 6. Contedo encontrado na Deep Web ....................................................................................... 5 7. O lado bom da Deep Web ......................................................................................................... 6 8. Consideraes finais ................................................................................................................. 6 9. Bibliografia .................................................................................................................................. 6
3 Especializao em Tecnologias para Gesto de Negcios - Turma3 Outubro de 2014 DEEP WEB
A Deep Web (DW) consiste numa rea da internet onde o anonimato o seu principal foco. Nela possvel encontrar diversos tipos de contedo no qual no podem ser encontrados na web convencional, pois a web que utilizamos no dia-dia alm de ser filtrada, monitorada para que no haja crimes e contedos ilegais. Muitos olham a Deep Web como um espao onde s pode ser encontrado contedos macabros como pedofilia, canibalismo, necrofilia, trfico de drogas, assassinatos de aluguel e demais barbaridades no quais nem se podem imaginar [MELLO2013]. Porm na Deep Web possvel sim encontrar contedos que podem ser interessantes, como artigos cientficos, bibliotecas com livros que muitas vezes podem no ser encontrados na web padro, jogos, filmes e tudo mais.
1. Introduo
A Deep Web que tambm conhecida por Deepnet, Web Invisvel, Undernet ou Web oculta se refere ao contedo da World Wide Web que no faz parte da Surface Web, a qual indexada pelos mecanismos de busca padro. No deve ser confundida com a dark Internet, na qual os computadores no podem mais ser alcanados via Internet, ou com a Darknet, rede de compartilhamento de arquivos. Mike Bergman, fundador da BrightPlanet e autor da expresso, afirmou que a busca na Internet atualmente pode ser comparada com o arrastar de uma rede na superfcie do oceano: pode-se pescar um peixe grande, mas h uma grande quantidade de informao que est no fundo, e, portanto, faltando. A maior parte da informao da Web est enterrada profundamente em sites gerados dinamicamente, a qual no encontrada pelos mecanismos de busca padro. Estes no conseguem "enxergar" ou obter o contedo na Deep Web - aquelas pginas no existem at serem criadas dinamicamente como resultado de uma busca especfica. A Deep Web possui um tamanho muito superior ao da Surface Web. A Deep Web (DW) nada mais do que parte da internet, s que uma parte oculta, que para acessa-la preciso de um navegador especfico, diferente dos utilizados no dia-dia como o Internet Explorer, Google Chrome, Mozilla Firefox, Opera e os demais. Em grande parte, a Deep Web existe, assim como a prpria internet, graas fora militar dos Estados Unidos. Neste caso, graas ao Laboratrio de Pesquisas da Marinha do pas, que desenvolveu o The Onion Routing para tratar de propostas de pesquisa, design e anlise de sistemas annimos de comunicao [PEREIRA 2012] sendo assim o intuito de criar esse lado oculto da internet o anonimato, trocar de informaes sem o rastreamento dos acessos, coisa que na web que se utiliza no dia-dia no possvel pois tudo o que acessado, baixado e feito na web monitorado.
2. Tamanho
Estimativas baseadas em extrapolaes de um estudo feito na Universidade da Califrnia em Berkeley em 2001 especularam que a Deep Web possui 7.500 terabytes de informao. Estimativas feitas por He et al., em 2004, detectaram cerca de 300.000 sites da deep web e, de acordo com Shestakov, cerca de 14.000 destes eram da parte russada Web em 2006. Em 2008, a web chamada Deep Web, no referenciada pelos motores de busca representa 70 a 75% do total, ou seja, cerca de um trilho de pginas no indexadas.
3. Nomenclatura
Para referir-se aos websites que no estavam registrados em nenhum mecanismo de busca, Bergman citou um artigo de janeiro de 1996 por Frank Garcia, no qual ele afirma que estes: "Seriam sites projetados propositalmente, mas que no se teve o interesse de registr-lo em nenhum mecanismo de busca. Ento, ningum pode encontr-los! Esto escondidos. Eu os chamo de Web Invisvel." Outro uso antigo do termo Web Invisvel foi feito por Bruce Mount e Matthew B. Koll do Personal Library Software, descrevendo a ferramenta da deep Web "@1", na edio de dezembro de 1996.
4 Especializao em Tecnologias para Gesto de Negcios - Turma3 Outubro de 2014 O primeiro uso do termo especfico deep Web, agora reconhecido, ocorreu no estudo de 2001 de Bergman, mencionado anteriormente.
4. Classificao
O contedo da deep web pode ser classificado em uma ou mais das seguintes categorias:
Contedo dinmico: pginas dinmicas que so retornadas em resposta a uma requisio ou atravs de um formulrio. Contedo isolado: pginas que no possuem referncias ou ligaes vindas de outras pginas, o que impede o acesso ao seu contedo atravs de web crawlers. Diz-se que essas pginas no possuem backlinks. Web privada: sites que exigem um registro e um login (contedo protegido por senha). Web contextual: pginas cujo contedo varia de acordo com o contexto de acesso (por exemplo, IP do cliente ou sequncia de navegao anterior). Muitos sites esto escondidos e no h possibilidade de acesso, propositalmente. Contedo de acesso limitado: sites que limitam o acesso s suas pginas de modo tcnico (usando CAPTCHAs por exemplo). Contedo de scripts: pginas que so acessveis apenas por links gerados por JavaScript, assim como o contedo baixado dinamicamente atravs de aplicaes em Flash ou Ajax. Contedo no-HTML/texto: contedo textual codificado em arquivos multimdia (imagem ou vdeo) ou formatos de arquivo especficos que no so manipulados pelos motores de busca. Contedo que utiliza o protocolo Gopher ou hospedado em servidores FTP, por exemplo, no indexado pela maioria dos mecanismos de busca. O Google, por exemplo, no indexa pginas fora dos protocolos HTTP ou HTTPS.
5. Como acessar a Deep Web
Para ter acesso a Deep Web muito importante estar protegido, pois uma rea que grande parte das pessoas que a utiliza tem um avanado conhecimento, muitas delas so criminosos que se aproveitam do anonimato para oferecer dos seus servios atravs do lado oculto da internet [KOHN 2012]. Diante das tais colocaes, importante considerarque um antivrus e um firewall poderoso essencial para acessar tal contedo, recomendvel se possvel acessar at de uma mquina virtual com Sistema Operacional Linux para aumentar o grau de segurana da navegao. O principal responsvel que leva a ter acesso a esse mundo oculto o software chamado TOR (The Onion Router). TOR veio de um projeto do Laboratrio de Pesquisa Naval dos EUA, onde o seu objetivo era proteger as comunicaes do governo. Sua segunda gerao foi liberada para uso no-governamental e ento apelidada de TOR [PEREIRA 2012], o nome Onion significa Cebola que tem tudo a ver com a Deep Web pois assim como a cebola a DW constituda por camadas. Hoje o TOR utilizado para uma ampla variedade de propsitos tanto militares, jornalsticos, policiais entre outros[TORPROJECT 2013]. Na figura 1 possvel observar o link de download do software TOR, uma breve descrio do que ele oferece e o logo da cebola representando o software constitudo por camadas [TORPROJECT 2013].
Figura 1. Link de download do software TOR
5 Especializao em Tecnologias para Gesto de Negcios - Turma3 Outubro de 2014 Normalmente quando acessamos um site, o servidor desse site identifica o endereo de IP de quem o acessou, mais no TOR isso no acontece pois antes que a requisio chegue ao servidor ele d incio a uma espcie de ponte criptografada [PEREIRA 2012]. Essa ponte criptografada faz um caminho entre vrios computadores annimos at que ele chegue ao site, o nico IP que identifica o do ltimo computador, mais o anterior, o anterior ao anterior e assim sucessivamente se torna impossvel de ser identificado pois passou por diversas mquinas at chegar ao destinatrio, por isso se torna uma ponte criptografada. Servios de hospedagem invisvel tambm so disponibilizados tornando o dono da pgina annimo. Na figura 2 possvel observar o TOR instalado e os recursos oferecidos pelo software, incluindo um navegador Mozilla Firefox embutido e modificado para navegar exclusivamente na DW . Outro fato interessante a exibio do IP da mquina j mascarado pelo software para preservar a identidade do usurio e manter o anonimato conforme citado e prometido pelo software.
Figura 2. Recursos do software TOR e seu navegador embutido
6. Contedo encontrado na Deep Web
A aparncia dos sites na Deep Web geralmente nunca so bem feitos e sim feios pois ningum que navega por l est preocupado com o layout mais sim com o contedo. importante destacar que conhecer o ingls o mnimo exigido para navegar na DW pois a grande maioria dos sites e links esto em ingls, sendo assim se a pessoa no souber muito da linguagem ter muita dificuldade para navegar e achar o que procura [PEREIRA 2012]. Outro fato importante a ressaltar so as URL dos sites na Deep Web, diferente das URL dos sites da Surface Web que so padronizadas (World Wide Web) como www.google.com.br por exemplo e com demais extenses como .net, .gov e demais, na DW a URL contm um cdigo criptografado sendo que as de alguns sites mudam constantemente para no serem encontrados e finalizam com .onion por conta do TOR como mostra o link para acessar um buscador na DW chamado TORCH xmh57jrzrnw6insl.onion semelhante ao buscador google o mais famoso e conhecido na Surface Web. Outro exemplo disso o site Hidden Wiki uma das principais pginas da DW com a aparncia semelhante do site conhecido Wikipdia a enciclopdia livre. Assim como o Wikipdia o Hidden Wikki tem um menu inicial que o ponto de partida para aqueles que iniciam a navegar na Deep Web.
6 Especializao em Tecnologias para Gesto de Negcios - Turma3 Outubro de 2014 7. O lado bom da Deep Web
H quem diga que o Google s consegue rastrear 1% do que existe online. Os outros 99% estariam na Deep Web [MELLO 2013]. Para quem tem um vasto conhecimento sobre a DW h de confirmar essa hiptese, tudo que buscamos na Surface Web, encontramos mais um pouco na DW. Mesmo sendo perigosa a DW tem muito a nos oferecer para quem sabe usar, uma experincia enriquecedora, uma biblioteca inacabvel de contedos de todos os tipos livros, filmes, jogos e demais interesses. A DW pode ser usada de forma positiva ou negativa, isso depende do carter de cada um que a usa, se a busca for relacionada a contedo acadmico e livros por exemplo ser encontrado, entretanto se a busca for por pedofilia, trfico de drogas ou at mesmo assassinato de aluguel tambm ser encontrado. As recomendaes mais importantes para quem deseja acessar ou que j acessa a DW nunca falar com ningum, tomar muito cuidado com o que baixado por l e ter conscincia o que procura, pois diferente da Surface Web a DW aberta a todo e qualquer tipo de contedo.
8. Consideraes finais
Em suma a Deep Web uma maneira de juntar informaes de redes annimas para fornecer um contedo escondido. Essa rede no est disponvel para a rede aberta, portanto, foi criado para um propsito de deixar os seus usurios praticamente invisveis, sem ter como rastre-los. A Deep Web um assunto muito vasto e que requer bastante conhecimento de outras lnguas para poder fazer uso de todo o seu potencial. Para acessar a Deep Web, requer um certo conhecimento em internet e muito cuidado, pois voc pode se deparar com coisas horrveis e ficar noites sem dormir, e nos piores dos casos, precisar se tratar com um psiclogo. Alguns dizem que a internet que usamos normalmente (surface), que ao p da letra significa superfcie, somente 4% do contedo da web, os outros 96% ficam na Deep Web, que ao ver a imagem do post serve como comparao. claro que h muitas controversas sobre esses dados e no apareceu ningum ainda com uma teoria afirmando que esses dados so mesmo reais ou no passam de uma mentira. Para navegar nessa maior parte do iceberg preciso baixar um navegador especfico. L voc pode encontrar livros banidos, alguns documentos oficiais vazados e muita, mas muita informao e tambm pode se deparar com imagens de canibalismo, experincias com seres humanos, assassinos de aluguel, enfim, cada um sabe o que faz e o que busca na internet, e na Deep Web um lugar onde se encontra de tudo, coisas boas e coisas ruins.
9. Bibliografia
Jocelyn A. Mundo Estranho (edio 132) O que Deep Web Disponvel em: http://mundoestranho.abril.com.br/materia/o-que-e-a-deep-web. Acessado em: Outubro 2014
Deep Web. Disponvel em: http://pt.wikipedia.org/wiki/Deep_web. Acessado em: Outubro 2014
Leonardo P. Olhar Digital. (2012) Nas entranhas da deep web: o que h de bizarro na parte de baixo da internet. Disponvel em: http://olhardigital.uol.com.br/noticia/nasentranhas-da-deep-web-o-que-h-de- bizarro-na-parte-de-baixo-da-internet/31170. Acessado em: Outubro 2014.
Jamilson P., Mix de noticias (2014). O mundo obscuro da internet. Disponvel em: http://www.mixdenoticias.com.br/o-mundo-obscuro-da-internet-chamado-deep- web/. Acessado em: Outubro 2014
Michael K. B. The Deep Web: Surfacing Hidden Value, BrightPlanet - Deep Content, 24
7 Especializao em Tecnologias para Gesto de Negcios - Turma3 Outubro de 2014 Setembro 2001.
Leonardo P. Olhar Digital. (2012) Deep Web: saiba o que acontece na parte obscura da internet. Disponvel em: http://olhardigital.uol.com.br/noticia/deep-web-saiba-o-ueacontece- na-parte-obscura-da-internet/31120. Acessado em: Outubro 2014.
Stephanie K. Olhar Digital. (2012) Twitter, livros e msica: o lado cult da deep web. Disponvel em: http://olhardigital.uol.com.br/noticia/twitter-livros-e-m-sica-o-ladocult-da- deep-web/31124. Acessado em: Outubro 2014.
Tor Project. (2013) Tor: Overview . Disponvel em: https://www.torproject.org/about/overview.html.en Acessado em: Outubro 2014.
Joo M., Galileu. (2012) Nem tudo so trevas: o lado bom da Deep Web. Disponvel em: http://revistagalileu.globo.com/Revista/Common/0,,EMI331438-17770,00- NEM+TUDO+SAO+TREVAS+O+LADO+BOM+DA+DEEP+WEB.html. Acessado em: Outubro 2014.