Вы находитесь на странице: 1из 4

Ilustracin: Jung!

Cuando el tamao
denitivamente importa
Por Esteban Magnani
Una diferencia determinante entre nuestra vida virtual y la material es que la primera
puede pasarse fcilmente a una base de datos. Pero cuando esta informacin se lleva a
cierta escala tambin puede usarse para prever el comportamiento de la sociedad, controlar
a las personas o vender productos. A esta enorme cantidad de material en permanente
movimiento se la llama big data y sabe ms sobre nosotros que la madre que nos pari.
Especiales de
Caras y Caretas
CyC 2286 Septiembre 2013 ok.indd 48 9/11/13 2:41:49 PM
Q
u es lo que determina el xito de
una banda de rock? La respuesta
podra llevar entrevistas enteras de gran-
des productores cazatalentos que expli-
can cmo funciona su intuicin. Es que
cuando la cantidad de variables que in-
tervienen en un fenmeno es demasiado
grande, slo cierta capacidad inexplicable
puede dar algn tipo de respuesta. Pero
algo est cambiando: los ros de terabytes
que circulan por la red, el aumento bru-
tal en la capacidad de recoleccin y pro-
cesamiento de datos, sumados a progra-
madores cada vez ms entrenados en este
campo, ahora hacen posible obtener algu-
nas respuestas de una realidad hasta hace
poco inconmensurable.
De eso se trata big data: de grandes
cantidades de informacin cargada por
millones y millones de personas a travs
de las redes sociales, al usar sus tarjetas de
crdito, sus celulares o realizar cualquier
otra actividad digital. El espionaje masi-
vo de los servicios de inteligencia de los
EE.UU. es slo un ejemplo del poder de
los datos que hace unos aos habran re-
sultado inmanejables.
Cuando se habla de big data suele pen-
sarse en enormes cantidades de informa-
cin, tan grandes que no pueden funcio-
nar en una sola computadora sino que
requiere clusters: es decir, redes de com-
putadoras funcionando simultneamen-
te. A este requisito conocido y que le da
el nombre hay que sumarle la velocidad,
porque las redes sociales no descansan y es
necesario recopilar, por ejemplo, los millo-
nes de tweets, que se lanzan a cada segun-
do, adems de interpretarlos. Y por ltimo
se debe tener en cuenta la necesidad de es-
tructurar esa informacin en bases de da-
tos para as poder darle sentido. Cantidad,
velocidad y estructura, ms capacidad tec-
nolgica y el software adecuado, permiten
encontrar las respuestas que se estaban
buscando. La herramienta es muy podero-
sa y ya se usa en las reas ms dismiles.
Una de ellas es la poltica. En EE.UU.
no slo es optativo votar, sino que quien
quiera hacerlo primero debe realizar los
trmites necesarios y cumplir con los re-
quisitos exigidos varan segn los dife-
rentes estados. Esto en parte explica los
bajos niveles de participacin en las elec-
ciones de este pas y las estrategias de cam-
paa de los candidatos. Para atraer nue-
vos votantes el equipo de Barack Obama
clasific a los usuarios de las redes socia-
les de acuerdo con las posiciones polticas
de sus amigos. As los especialistas reco-
nocieron a 3,5 millones de potenciales vo-
tantes a Obama no empadronados y lue-
go se dedicaron a conocer sus intereses
especficos sistematizando las publicacio-
nes que hacan en las redes sociales. Ese
perfil permiti dirigirles slo aquellas pro-
puestas del candidato que podan persua-
dirlos: leyes de gnero para las feministas,
propuestas verdes para los ecologistas, et-
ctera. El nivel de precisin de esta cam-
paa fue muy superior al de afiches con
candidatos sonrientes que no pueden de-
cir nada por el riesgo de espantar a quien
piense distinto. Finalmente el equipo de
Obama logr que al menos un milln de
personas a las que apuntaron se registra-
ra para votar. Obama gan por menos de
cinco millones de votos en todo el pas, y
en estados como Florida, clave para la vic-
toria, la diferencia con su oponente fue de
menos de setenta mil.
La misma lgica puede aplicarse para
diseccionar otros campos y encontrar las
variables que expliquen fenmenos com-
plejos, siempre y cuando existan los da-
tos. Lo que antes requera focus groups y
hordas de estudiantes munidos de encues-
tas trajinando las calles, ahora requiere un
puado de programadores desmontando
la informacin que proveen las redes so-
ciales. Google, por ejemplo, utiliza esta ca-
pacidad para, en la intimidad de nues-
tro correo electrnico, colocar publicidad
que se corresponde con el tema del e-mail
privado que estamos por mandar a un
amigo. El sistema funciona interpretan-
do nuestros correos en tiempo real y per-
mite a las empresas facturar en publicidad
cuando usamos sus servicios.
La informacin es poder y en el caso de
Google, Facebook o Twitter, entre otros,
simplemente toman lo que sus usuarios les
brindan gentilmente para hacer con ella
cosas por dems novedosas. Otro ejem-
plo: Google present recientemente una
herramienta para prever xitos de taqui-
lla. Segn pudieron establecer estadstica-
mente, cada persona consulta la pelcula
que le interesa unas trece veces en inter-
net antes de ir a verla. O sea que si el bus-
cador encuentra cierto nmero de visitas a
trailers, crticas y dems puede estimar la
futura recaudacin del film. Es como si tu-
viera una especie de bola de cristal digital
capaz de adivinar el futuro.
PERSPECTIVAS ATEMORIZANTES
Por supuesto que estos ejemplos ms o me-
nos ingenuos tienen una contracara bas-
tante ms oscura. No hace falta insistir en
las recientes revelaciones sobre el control
que EE.UU. hace sobre las llamadas y el
uso de internet de ciudadanos de todo el
mundo. Ese pas se encuentra en un lu-
gar privilegiado porque la columna verte-
bral global de las telecomunicaciones pasa
por all. La distopa orwelliana 1984, con
el Gran Hermano vigilando a travs de su
ojo omnisciente a cada uno de los ciuda-
danos, resulta ingenua al lado de la capa-
cidad de empresas y Estados para generar
bases de datos que prevean comporta-
mientos gracias a la fuerza de las estadsti-
cas. Ya no es ciencia ficcin la posibilidad
de cruzar los videos tomados por las cma-
ras de seguridad con sistemas de reconoci-
miento facial para identificar el recorrido
y las actividades de cualquier individuo.
Las perspectivas resultan atemorizantes.
El futuro no tan lejano lo es.
Pero tambin big data tiene, aunque
bastante ms pequeo, su costado lumi-
noso: la cantidad de informacin disponi-
ble en la red permite a las organizaciones
desnudar vnculos de poder o formas ms
sutiles de corrupcin. Es que los poderosos
siempre tuvieron herramientas para some-
ter y controlar, pero lo novedoso de nues-
tra era digital es lo contrario: que herra-
mientas similares quedan ms cerca para
quienes intentan balancear ese poder. Un
ejemplo es la tarea que viene hacindose
desde el periodismo de datos, donde con-
fluyen programadores con la capacidad
tcnica y periodistas con el criterio nece-
sario para encontrar historias en la ma-
raa de informacin que ofrece internet.
Con esa lgica, una organizacin como
ProPublica.org recogi de la web datos
que luego cruzan para saber cunto pagan
los laboratorios a cada mdico o quines
financian las fundaciones que, a su vez,
donan para las campaas de los distin-
tos candidatos polticos de los EE.UU. La
informacin estaba en la web, escondida
dentro de cientos de declaraciones obliga-
torias que nadie poda revisar individual-
mente. Gracias al esfuerzo de periodistas y
programadores se pudo recoger la parte re-
levante en bases de datos que hicieran vi-
sible lo que estaba oculto.
Quien tenga una base de datos sufi-
cientemente amplia y capacidad para pro-
cesarla de forma adecuada podr saber
ms sobre la sociedad que lo que nunca se
supo. Hasta qu punto se la usar para li-
berarla o para dirigirla es algo que an fal-
ta determinar, pero lo ms probable es que
la tensin entre ambas posibilidades con-
tine su ya largo recorrido histrico.
CyC 2286 Septiembre 2013 ok.indd 49 9/11/13 2:41:54 PM
Entrevista a Sabina Schneider, directora tecnolgica de Globant
L
as oficinas de Globant ocupan un par de pisos de las
enormes torres que contemplan la estacin de Retiro, en
el centro porteo. All cientos de trabajadores miran el mun-
do virtual a travs de sus amplios monitores, en una sala ilu-
minada, con hamacas y sillones en las cocinas de los extremos,
donde algunos almuerzan. Si esta no es la utopa laboral de la
sociedad de la informacin, debe estar muy cerca. Se trata de
una de las varias oficinas que esta multinacional argentina tie-
ne repartidas en el pas, Estados Unidos, Brasil, Uruguay, Co-
lombia y Reino Unido.
Sabina Schneider empez a trabajar aqu en 2004, un ao
despus de que esta empresa comenzara a cosechar de la red la
informacin que interesa a sus clientes. Actualmente es una de
las directoras de tecnologa.
Qu hacen ustedes?
Trabajamos con datos que se publican en internet en tiempo
real, en grandes cantidades y los tomamos en crudo, como es-
tn en bases NoSQL, para poder encontrar algunas respuestas
a las preguntas de nuestros clientes. Esto implica adems un di-
seo de arquitectura complejo: hoy una computadora sla no
puede procesar toda la informacin junta y hay que usar clus-
ters, racimos de computadoras conectadas pensados para po-
der procesar fcilmente este volumen de teras y petabytes de
datos.
Y qu hacen con la informacin?
Muchas cosas. Por ejemplo, con una entidad bancaria espa-
ola la usamos para analizar el consumo en distintas ciudades
en distintos momentos del ao y as planificar el turismo, ofer-
tas u otras cosas. Tambin se usan para marketing, detectar los
segmentos que ms usan distintas marcas, cruzndolo con el
clima, si llovi o no.
Trabajan con polticos?
Nosotros no. Pero hay otras empresas que toman lo que se pu-
blica en Twitter y lo analizan semnticamente para medir opi-
niones positivas, negativas, con qu temas se los asocia, etcte-
ra. Para eso se usan algoritmos que procesan tweets y obtienen
resultados a escala.
Estamos lejos de poder prever el surgimiento de una estre-
lla pop por medio de big data?
No, no tanto en el sentido de que todo se est digitalizando
cada vez ms. Pens en Justin Bieber y la cantidad de likes
que tuvo en Youtube cuando la mam lo filmaba en su
casa y cmo eso se empez a viralizar. Ah po-
ds ir viendo tendencias que luego uss para pre-
ver lo que puede pasar con otros, cruzarlos con
datos de las redes sociales y encontrar patrones
que te permitan prever algunas tendencias. Go-
ogle tiene una cantidad de informacin sobre lo
que la gente est buscando que es enorme y que permite pre-
ver lo que va a pasar en algunos campos. Hubo varios hospita-
les en EE.UU. el ao pasado que predijeron focos de enferme-
dades sobre la base de las bsquedas que se hicieron en Google.
Por eso, retomando el ejemplo de Justin Bieber, antes de que
la madre lo filmara no podamos saber que sera una estrella,
pero una vez que hay respuestas en la red ya se puede empezar
a ver tendencias.
Ah surge la tentacin de generar cierta tendencia artif-
cialmente.
Claro. Hay empresas que se dedican a crear perfiles falsos en
Twitter para promover a distintos clientes.
Qu trabajo con big data te impresion ms?
Por ejemplo, una ONG que analiza enfermedades en fri-
ca cruzando los datos de empresas de celulares que estn muy
difundidos en ese continente. Analizando el envo de mensa-
jes de texto previeron el surgimiento de enfermedades porque
vean que se empezaba a cortar la comunicacin entre distin-
tas personas. As se decida aislar alguna ciudad para evitar una
epidemia. Tambin hay cosas interesantes que se estn usan-
do para gestionar el uso eficiente de la energa en una empre-
sa, un edificio o una ciudad. Es como la cara buena de lo que
se puede hacer. La mala es lo que pods hacer para controlar a
una poblacin.
Cmo se evita eso?
Tiene que haber regulaciones que aseguren que no se
produzcan abusos. La tecnologa va por delante de las leyes.
Por ejemplo, con lo que se puede hacer en reconocimien-
to facial se podra aprovechar las cmaras de seguridad que
estn en Buenos Aires para registrar dnde estuvo una per-
sona o comportamientos sospechosos. La legislacin no lo
prohbe explcitamente.
Navegando con el enemigo Por E. M.
Una empresa argentina con sucursales en Uruguay, Colombia, Brasil, el Reino Unido
y EE.UU. trabaja con big data y vende los resultados obtenidos a empresas de todo el
mundo. El bien y el mal defnen por penal?
Foto: Fernando Calzada
CyC 2286 Septiembre 2013 ok.indd 50 9/11/13 2:42:01 PM
UN PROBLEMA DE DERECHOS HUMANOS
Por Sergio Sorn
Ex presidente de Amnista Internacional Argentina
y coorganizador de Hacks Hackers Buenos Aires
Se llama big data al anlisis de gigantescas bases de datos
para determinar una probabilidad. Su utilidad depende de la
capacidad de pensar modelos que puedan inferir probabilida-
des, trazar tendencias. La historia de la civilizacin es tam-
bin el registro de acciones y percepciones. Desde hace dca-
das todos formamos parte de grupos sociales particulares que
comparten, producen y consumen en internet. Actualmente
estamos muy cerca de que toda la
comunicacin no encriptada pue-
da registrarse y analizarse casi in-
mediatamente.
Cmo se acumula big data?
Hay varias formas. En primer lu-
gar por medio de API (sistemas que
sirven de acceso a datos en bruto
de un servicio web) que hoy son la
principal herramienta de uso libre
para hacer big data. Cada vez ms,
hackers, investigadores o periodis-
tas de todo el mundo, pero tambin
empresas y Estados indagan en es-
tos servicios para conocer ms de
la sociedad. Un ejemplo: para las
protestas del 8N contra el gobier-
no de CFK, el colectivo HHBA rea-
liz una aplicacin que capturaba
en tiempo real miles de tuits con el
hashtag #8N. La visualizacin per-
miti ver en tiempo real que la pro-
testa se tuiteaba desde ciudades y
sobre todo en los barrios de alto po-
der adquisitivo. Si esto pudo hacer-
se sin recursos, qu pueden hacer
quienes cuentan con ellos?
La segunda forma para capturar
datos es la de las empresas e insti-
tuciones de administracin y anlisis estadstico. En la actuali-
dad, la iniciativa de Agenda Digital de la Jefatura de Gabinete
de Ministros discute en sus foros abiertos cuestiones como la
interoperabilidad, clave para que las bases de datos puedan
interactuar entre s. Pero son las empresas e industrias las que
impulsan hoy el big data porque saben que esta tecnologa les
provee un servicio vital para competir. Mientras los Estados de
la Unasur se alarman por la dimensin del espionaje global re-
velado por Wikileaks y Edward Snowden, la industria se da
una panzada sobre todo gracias al renunciamiento automti-
co de derechos que hacemos al consumir un producto por in-
ternet alojado en un servidor fuera del pas. Cada vez que usa-
mos homebanking, Hotmail, Yahoo, Twitter, Facebook, etc-
tera aceptamos toda o parte de la legislacin vigente en otros
pases como EE.UU., donde espiar internet es legal gracias a
la Patriot Act. El concepto de privacidad se est redeniendo y
no de manera equitativa. Lo sera si los ciudadanos o las ins-
tituciones que los representan tuviesen la posibilidad de con-
trolar y scalizar el registro que las empresas e industrias ha-
cen de nosotros.
En tercer lugar existe la tendencia a que todo lo que se
publique y conecte a la red se indexe en bases de datos.
Buscadores como Google hicieron del rastreo e indexacin de
contenidos uno de los mayores negocios de todos los tiem-
pos. Hoy la empresa llev esa lgica a un nuevo nivel con
FusionTables, el que permite su-
bir una base de datos y analizar-
la trazando mapas y grcos de
relaciones sobre los datos que,
gentilmente, subimos. Existen mi-
les de herramientas tecnolgi-
cas de este tipo que operan en su
mayora en datacenters reparti-
dos desigualmente en 91 pases,
de los cuales EE.UU. aglutina el
40,9 por ciento.
Y en cuarto lugar, se encuen-
tra la ms ilegal y desconocida de
las opciones para acceder a da-
tos supermasivos: el acceso fsi-
co a las conexiones de internet.
Las revelaciones de Snowden
demuestran la escala de recopi-
lacin de datos de los servicios
de inteligencia. Y esto mueve mi-
les de millones de dlares, un es-
tmulo para que siga ocurriendo.
Agencias como la NSA, el FBI y la
CIA subcontratan empresas como
la Booz Allen Hamilton (donde tra-
bajaba Snowden) que recibi slo
en 2012 unos 1.300 millones de
dlares para realizar anlisis de
datos. Un detalle no menor es que
el 60 por ciento de toda la conexin latinoame-
ricana a internet se hace por una
sola ciudad: Miami.
La Declaracin Univer-
sal de Derechos Humanos
dice en su artculo 12:
Nadie ser objeto de in-
jerencias arbitrarias en su
vida privada, su familia, su
domicilio o su correspon-
dencia, ni de ataques a su
honra o a su reputacin.
Toda persona tiene dere-
cho a la proteccin de la
ley contra tales injerencias
o ataques. Cmo el mun-
do va a dar cuenta de ello
es una gran incgnita.
Ilustracin de nota: Jung!
CyC 2286 Septiembre 2013 ok.indd 51 9/11/13 2:42:06 PM

Вам также может понравиться