Вы находитесь на странице: 1из 5

O que Big Data

Introduo
Pensar na quantidade e variedade de dados que geramos e armazenamos a
cada dia? Bancos, companhias areas, operadoras de telefonia, servios de
busca on-line e redes varejistas so apenas alguns dos inmeros exemplos de
empresas que convivem diariamente com grandes volumes de informaes.
Mas apenas ter dados no basta: importante conseguir e saber us-los. a
que o conceito de Big Data entra em cena.
Neste texto, voc ver o que Big Data, entender o porqu de este nome
estar cada vez mais presente no vocabulrio dos ambientes de Tecnologia da
Informao (TI) e compreender os motivos que levam o conceito a contribuir
para o cotidiano de empresas, governos e demais instituies.
O conceito de Big Data
A princpio, podemos definir o conceito como sendo conjuntos de dados
extremamente amplos e que, por este motivo, necessitam de ferramentas
especialmente preparadas para lidar com grandes volumes, de forma que toda
e qualquer informao nestes meios possa ser encontrada, analisada e
aproveitada em tempo hbil.
De maneira mais simplista, a ideia tambm pode ser compreendida como a
anlise de grandes quantidades de dados para a gerao de resultados
importantes que, em volumes menores, dificilmente seriam alcanados.
No difcil entender o cenrio em que o conceito se aplica: trocamos milhes
de e-mails por dia; milhares de transaes bancrias acontecem no mundo a
cada segundo; solues sofisticadas gerenciam a cadeia de suprimentos de
vrias fbricas neste exato momento; operadoras registram em todos instantes
chamadas e trfego de dados do crescente nmero de linhas mveis no mundo
todo; sistemas de erp, coordenam os setores de inmeras companhias. Enfim,
exemplos no faltam - se te perguntarem voc certamente ser capaz de
apontar outros sem fazer esforo.
Informao poder, logo, se uma empresa souber como utilizar os dados que
tem em mos, poder entender como melhorar um produto, como criar uma
estratgia de marketing mais eficiente, como cortar gastos, como produzir mais
em menos tempo, como evitar o desperdcio de recursos, como superar um
concorrente, como disponibilizar servios para a um cliente especial de
maneira satisfatria e assim por diante.
Perceba, estamos falando de fatores que podem inclusive ser decisivos para o
futuro de uma companhia. Mas, Big Data um nome relativamente recente (ou,
ao menos, comeou a aparecer na mdia recentemente). Isso significa que

somente nos ltimos anos que as empresas descobriram a necessidade de


fazer melhor uso de seus grandes bancos de dados?
Pode ter certeza que no. H tempos que departamentos de TI contemplam
aplicaes de Data Mining, Business Intelligence e CRM (Customer
Relationship Management), por exemplo, para tratar justamente de anlise de
dados, tomadas de decises e outros aspectos relacionados ao negcio.
A proposta de uma soluo de Big Data a de oferecer uma abordagem ampla
no tratamento do aspecto cada vez mais "catico" dos dados para tornar as
referidas aplicaes e todas as outras mais eficientes e precisas. Para tanto, o
conceito considera no somente grandes quantidades de dados, a velocidade
de anlise e a disponibilizao destes, como tambm a relao com e entre os
volumes.
Por que Big Data to importante?
Lidamos com dados desde os primrdios da humanidade. Acontece que, nos
tempos atuais, os avanos computacionais nos permitem guardar, organizar e
analisar dados muito mais facilmente e com frequncia muito maior.
Este panorama est longe de deixar de ser crescente. Basta imaginar, por
exemplo, que vrios dispositivos em nossas casas - geladeiras, TVs, lavadoras
de roupa, cafeteiras, entre outros - devero estar conectados internet em um
futuro no muito distante. Esta previso est dentro do que se conhece como
Internet das Coisas.
Se olharmos para o que temos agora, j veremos uma grande mudana em
relao s dcadas anteriores: tomando como base apenas a internet, pense
na quantidade de dados que so gerados diariamente somente nas redes
sociais; repare na imensa quantidade de sites na Web; perceba que voc
capaz de fazer compras on-line at do seu celular, quando o mximo de
informatizao que as lojas tinham em um passado no muito distante eram
sistemas isolados para gerenciar os seus estabelecimentos fsicos.
As tecnologias atuais nos permitiram e permitem aumentar exponencialmente a
quantidade de informaes no mundo e, agora, empresas, governos e outras
instituies precisam saber lidar com esta "exploso" de dados. O Big Data se
prope a ajudar nesta tarefa, uma vez que as ferramentas computacionais
usadas at ento para gesto de dados, por si s, j no podem faz-lo
satisfatoriamente.
A quantidade de dados gerada e armazenada diariamente chegou a tal ponto
que, hoje, uma estrutura centralizada de processamento de dados j no faz
mais sentido para a maioria absoluta das grandes entidades. O Google, por
exemplo, possui vrios datas centers para dar conta de suas operaes, mas
trata todos de maneira integrada. Este "particionamento estrutural", bom

destacar, no uma barreira para o Big Data - em tempos de computao nas


nuvens, nada mais trivial.
Os 'Vs' do Big Data: volume, velocidade, variedade, veracidade e valor
No intuito de deixar a ideia de Big Data mais clara, alguns especialistas
passaram a resumir o assunto em aspectos que conseguem descrever
satisfatoriamente a base do conceito: os cincos 'Vs' - volume, velocidade e
variedade, com os fatores veracidade e valor aparecendo posteriormente.
O aspecto do volume (volume) voc j conhece. Estamos falando de
quantidades de dados realmente grandes, que crescem exponencialmente e
que, no raramente, so subutilizados justamente por estarem nestas
condies.
Velocidade (velocity) outro ponto que voc j assimilou. Para dar conta de
determinados problemas, o tratamento dos dados (obteno, gravao,
atualizao, enfim) deve ser feito em tempo hbil - muitas vezes em tempo
real. Se o tamanho do banco de dados for um fator limitante, o negcio pode
ser prejudicado: imagine, por exemplo, o transtorno que uma operadora de
carto de crdito teria - e causaria - se demorasse horas para aprovar um
transao de um cliente pelo fato de o seu sistema de segurana no
conseguir analisar rapidamente todos os dados que podem indicar uma fraude.
Variedade (variety) outro aspecto importante. Os volumes de dados que
temos hoje so consequncia tambm da diversidade de informaes. Temos
dados em formato estruturados, isto , armazenados em bancos como
PostgreSQL e Oracle, e dados no estruturados oriundos de inmeras fontes,
como documentos, imagens, udios, vdeos e assim por diante. necessrio
saber tratar a variedade como parte de um todo - um tipo de dado pode ser
intil se no for associado a outros.
O ponto de vista da veracidade (veracity) tambm pode ser considerado, pois
no adianta muita coisa lidar com a combinao "volume + velocidade +
variedade" se houver dados no confiveis. Necessrio que haja processos
que garantam o mximo possvel ha consistncia dos dados. Voltando ao
exemplo da operadora de carto de crdito, imagine o problema que a empresa
teria se o seu sistema bloqueasse uma transao genuna por analisar dados
no condizentes com a realidade.
Informao no s poder, informao tambm patrimnio. A combinao
"volume + velocidade + variedade + veracidade", alm de todo e qualquer outro
aspecto que caracteriza uma soluo de Big Data, se mostrar invivel se o
resultado no trouxer benefcios significativos e que compensem o
investimento. Este o ponto de vista do valor (value).
claro que estes cinco aspectos no precisam ser tomados como a definio
perfeita. H quem acredite, por exemplo, que a combinao "volume +

velocidade + variedade" seja suficiente para transmitir uma noo aceitvel do


Big Data. Sob esta ptica, os aspectos da veracidade e do valor seriam
desnecessrios, porque j esto implcitos no negcio - qualquer entidade sria
sabe que precisa de dados consistentes; nenhuma entidade toma decises e
investe se no houver expectativa de retorno.
O destaque para estes dois pontos talvez seja mesmo desnecessrio por fazer
referncia ao que parece bvio. Por outro lado, a sua considerao pode ser
relevante porque refora os cuidados necessrios a estes aspectos: uma
empresa pode estar analisando redes sociais para obter uma avaliao da
imagem que os clientes tm de seus produtos, mas ser que estas informaes
so confiveis ao ponto de no ser necessrio a adoo de procedimentos
mais criteriosos? Ser que no se faz necessrio um estudo mais profundo
para diminuir os riscos de um investimento antes de efetu-lo?
De qualquer forma, os trs primeiros 'Vs' - volume, velocidade e variedade podem at no oferecer a melhor definio do conceito, mas no esto longe
de faz-lo. Entende-se que Big Data trata apenas de enormes quantidades de
dados, todavia, voc pode ter um volume no muito grande, mas que ainda se
encaixa no contexto por causa dos fatores velocidade e variedade.

Fonte:
http://www.infowester.com/big-data.php. Acessado em 13.07.2015

Uma pesquisa feita pelo Instituto Ponemon, a pedido da IBM, mostra que as empresas brasileiras so as
mais vulnerveis para sofrer atentados contra os seus dados. O estudo ouviu 350 empresas, em 11
pases, e todas, sem exceo, informaram terem sofrido algum tipo de violao de dados. O relatrio
apontou um aumento de 23% no custo mdio de cada violao de dados corporativos. Somente no ano
passado, o custo mdio de cada registro comprometido aumentou 6%, indo de US$ 145 para US$ 154.
Trs fatores principais colaboraram para o aumento no custo de uma violao de dados nos ltimos anos.
Dois deles so a multiplicao da incidncia de ciberataques e o crescimento do nmero de negcios
perdidos como resultado, com prejuzo mdio de US$ 1,57 milho por ataque em 2015 (era US$ 1,33
milho ano passado), revelou reportagem do IDG News Services.
O terceiro fator o aumento nos custos associados deteco e agravamento das violaes de dados,
incluindo atividades forenses e de investigao, servios de avaliao e auditoria e equipes de
gerenciamento e comunicao de crise. Em mdia, essa despesa aumentou de US$ 760 mil no ano
passado para US$ 990 mil em 2015.
O estudo do Ponemon tambm analisou as violaes de dados por pases e concluiu que as empresas do
Brasil e da Frana tm mais chances de terem seus dados comprometidos, envolvendo um mnimo de 10
mil registros, enquanto as canadenses e alems so as menos provveis de sofrerem um ataque do
gnero

Fonte:
http://convergenciadigital.uol.com.br/cgi/cgilua.exe/sys/start.htm?
infoid=39749&sid=97#.VaQbKsJRF9A

Вам также может понравиться