Вы находитесь на странице: 1из 40

Por qu son tan

importantes los datos?


RESUMEN EJECUTIVO
La innovacin del software contina produciendo
avances sin precedentes que transforman el mundo
que nos rodea, les brindan autonoma a las personas
y permiten el crecimiento de nuestras economas.
Sin embargo, esta transformacin digital solo puede
brindarnos su mximo potencial si explotamos el
poder de los datos que estas innovaciones liberaron.
En efecto, estamos atravesando una poca de
revolucin de los datos. Esto es impulsado no solo
por la abundancia de datos actual, sino por las
tecnologas fundamentales que cambian la forma
en que reunimos, almacenamos, analizamos y
transformamos la informacin.

BSA.ORG

2
Hoy, el 90 % de los lderes de negocios citan a los
datos como uno de los recursos clave y un factor distintivo
fundamental para los negocios, a la par de recursos bsicos
como las tierras, la mano de obra y el capital.

No hace mucho, por ejemplo, la recopilacin de aborda algunos de los mitos que se han instalado a medida
datos requera observar patrones meteorolgicos que la gente contina esforzndose por comprender
durante cientos de aos para discernir los ciclos de plenamente la industria de la innovacin de los datos en
precipitaciones. Era como sentarse junto a una calle expansin. Para finalizar, el documento ofrece un glosario
para registrar la velocidad del trfico a fin de planificar de trminos que define el lenguaje de la innovacin de los
las redes de transporte. Implicaba reunir millas de datos y sirve como una gua para aquellos que sean nuevos
carpetas de manila llenas de notas escritas a mano en cuanto a la comprensin de la economa de los datos.
para estudiar de qu manera evolucionaban y se
La oportunidad que la innovacin de los datos le ofrece
podan curar las enfermedades.
al mundo es virtualmente incomparable. Las innovadoras
Ahora, los datos son generados por sensores que se herramientas de software ya estn revolucionando
encuentran en millones de dispositivos, mquinas, nuestras vidas de maneras sorprendentes; ahora,
vehculos e, incluso, las luces de la calle. Si bien mantener estas herramientas estn ayudando a las personas a
esta cantidad de datos fue alguna vez costoso y difcil, descubrir las respuestas escondidas en una cantidad
las capacidades de almacenamiento crecieron y los enorme y creciente de recursos de datos. Estas nuevas
costos cayeron, y as los datos almacenados son ahora y transformadoras herramientas estn convirtiendo los
un recurso renovable. Con esta capacidad de reutilizar los datos en nuevos productos, soluciones e innovaciones que
datos y darles nuevos propsitos, podemos continuar con existen para cambiarnos la vida. Desde una perspectiva
su anlisis y transformarlos en nueva formas de producir econmica, un mejor uso de los datos podra conducir a
conocimientos valiosos que permitan ahorrar tiempo y dividendos de datos de $1,6 billones en los prximos
dinero e, incluso, salvar vidas. cuatro aos solamente. Los economistas calculan que las
ganancias por la eficiencia que permiten los datos podran
Algunos de estos datos capturados constituyen informacin sumarle casi $15 billones al PIB global para el 2030.
personal y, por este motivo, se deben emplear los mtodos
de seguridad ms vanguardistas as como modelos de Si realizamos elecciones inteligentes hoy, esta economa
administracin responsables para garantizar que esta centrada en los datos que est surgiendo podra
informacin est segura y se utilice correctamente. convertirse en una poderosa fuente generadora de
Pero la gran mayora de los datos proviene de muchos empleos e industrias nuevos, avances nuevos y curas
dispositivos y mquinas que se envan informacin entre nuevas y alimentar el crecimiento de la economa
s y les envan informacin a quienes los operan. Desde la durante dcadas.
lnea de ensamblaje de la planta de produccin al avin de
pasajeros en vuelo, se generan millones de bytes de datos
que luego se analizan. Hacer esto mejora el rendimiento y
LA INNOVACIN DE LOS DATOS DEFINIDA
aumenta la productividad en formas que en algn momento
eran inimaginables. Se ha escrito bastante acerca de las cuatro V de la innovacin
de los datos: volumen, la cantidad de datos; velocidad, la rapidez
Si bien los datos se encuentran en todas partes y su con que se crean; variedad, los tipos de datos involucrados; y
omnipresencia y utilidad estn mejorando nuestras vidas veracidad, su precisin. Sin embargo, se ha dedicado menos
de diversas maneras, muchas personas no comprenden tiempo a analizar el poco valor que yace en los datos sin procesar
qu son, de dnde provienen, cmo se pueden utilizar ni el y la oportunidad para cambiar las reglas del juego que todos
potencial enorme que tienen por naturaleza. compartimos a fin de maximizar verdaderamente su uso.
El presente documento presenta a grandes rasgos algunos Segn lo examinado por el presente documento, los datos se
ejemplos concretos de cmo la innovacin de los datos deben reunir, almacenar, analizar y transformar para brindar
est produciendo un avance extraordinario respecto beneficios que pueden ser prcticos y hasta salvar vidas. Estos
de algunos de los desafos ms complicados a escala procesos se encuentran en el centro de la innovacin de los
mundial. Describe cmo los cambios fundamentales en la datos la derivacin de un valor inmenso a partir de cantidades
forma en que los datos se renen, almacenan, analizan y enormes de informacin que es, de otro modo, improductiva.
transforman nos ubican al borde de todo lo que es posible
en nuestra economa digital del siglo XXI y ms. Tambin
3
NDICE
5 INTRODUCCIN

7 TRANSFORMAR LOS DATOS EN RESPUESTAS

14 UNA ECONOMA IMPULSADA POR LOS DATOS

17 SEPARAMOS LOS MITOS SOBRE LOS DATOS DE LOS HECHOS

28 DISCURSO DIGITAL: COMPRENSIN DEL LENGUAJE DE LOS DATOS

34 NOTAS FINALES

40 ACERCA DE BSA

BSA.ORG

4
Siglo 15 Siglo 21

Dcada
de 1850

6000 AC MILESTONES DE DATA

INTRODUCCIN
A lo largo de la historia de los seres humanos, los hitos con anticipacin si traer un paraguas al trabajo o tomarnos
de la civilizacin estuvieron marcados por avances en el autobs. Los datos del trfico se utilizan para sincronizar
nuestra capacidad para observar y reunir informacin. los semforos, predecir los horarios de llegada de los
Nuestros ancestros desarrollaron herramientas para trenes y ayudarnos a encontrar la va ms rpida para
medir la distancia, el peso, el volumen, la temperatura, llegar al ensayo de nuestro hijo a tiempo. Los dispositivos
el tiempo y el lugar cada una fue mejorando con el que se pueden usar como accesorios nos ayudan a
tiempo y cada una fue fundamental para la transicin de realizar un seguimiento de nuestro estado fsico, de modo
cazadores y recolectores a agricultores y a residentes de que podamos elegir opciones para tener vidas ms largas
ciudades. y saludables, y los cientficos estn analizando terabytes
Ya en el 6000 A.C., se utilizaron los datos del de informacin gentica para encontrar curas nuevas y
rendimiento de las cosechas y los ciclos de barbecho desarrollar tratamientos ms efectivos y personalizados.
para incrementar la produccin agrcola y alimentar
a ms gente. En el siglo XV, se utilizaron los datos LOS DATOS MARCAN UNA DIFERENCIA
del firmamento para navegar por el mundo y abrir los
profundos mares al comercio global. En la dcada de + Barcelona est sacando provecho de los datos
1850, se utilizaron los datos para relacionar los brotes de para construir una ciudad ms inteligente, y darle
clera con el mal clima y as salvar vidas. la capacidad de examinar las pautas de trfico de
los turistas, ver dnde poner ms estaciones de
A travs de la historia moderna, incluso cantidades bicicletas pblicas e identificar qu esquinas de la
limitadas de datos nos han brindado perspectivas clave ciudad necesitan ms cajeros electrnicos.
para encontrar soluciones inesperadas a algunos de + En los Emiratos rabes Unidos, las nuevas
nuestros ms grandes desafos. Independientemente de herramientas de datos se estn utilizando para
que estn grabados en una estela, un rollo de papiro, un disear el primer edificio de energa positiva del
volumen ilustrado o un libro impreso, los datos y su mundo que efectivamente produce ms energa de
creciente dominio e importancia han sido factores clave la que consume.
de impulso del avance econmico y humano. + En Kenia, se estn utilizando los datos mviles para
En el siglo XXI, estamos experimentando un aceleramiento identificar los patrones de la infeccin de la malaria
de este proceso. A medida que los datos empiezan e identificar puntos de acumulacin de casos que
a abundar ms y su costo de almacenamiento baja, guen al gobierno en sus esfuerzos de erradicacin.
las nuevas tecnologas les estn proporcionando a los + Los agricultores desde Iowa hasta la India estn
cientficos de los datos herramientas de vanguardia que utilizando datos de semillas, satlites, sensores y
dejan al descubierto valiosos conocimientos a partir tractores para tomar mejores decisiones acerca
de enormes cantidades de datos. A medida que esas de qu cultivar, cundo plantar, cmo hacer un
tecnologas de procesamiento de datos adquieren seguimiento de la frescura de los alimentos de la
caractersticas ms transformadoras, sus efectos son ms granja a la mesa y cmo adaptarse a los cambios
profundos y las oportunidades incluso ms generalizadas. en el clima.
Nos dirigimos a un mundo de informacin y posibilidades
casi ilimitados. Se debe analizar cmo se estn utilizando
los datos para realizar predicciones que mejoren nuestras
vidas cotidianas. Los datos predictivos nos ayudan a saber
5
DATOS SOBRE EL CICLO DE VIDA

ALMACENAMIENTO
ANLISIS TRANSFORMACIN RECOLECCIN
Y TRADUCCIN

Al comprar un automvil, en lugar de brindarnos acceso Este enorme cambio se encuentra en marcha.
solo al precio que figura en su etiqueta, los datos nos Prcticamente todo lo que hacemos genera datos, y cada
permiten ver en profundidad el consumo de combustible da se crean caudales completamente nuevos de datos. De
del vehculo, el mantenimiento, el seguro y los registros hecho, el 90 por ciento de los datos actuales del planeta
de seguridad para ayudarnos a tomar decisiones ms se crearon solo en los dos ltimos aos, y ahora estamos
informadas. Y el propio auto es ahora, en efecto, una duplicando la velocidad con que se producen los datos
supercomputadora sobre ruedas. Posee un procesador cada dos aos. La mayora de estos datos que se generan
que interacta con sensores que analizan el rendimiento, no son personales. Esta distincin es importante porque, si
de modo que los conductores puedan estar informados bien es crucial que protejamos la privacidad, la mayora de
acerca de cundo deben cambiar el aceite, cundo las veces los datos que ayudan a mejorar nuestras vidas
cambiar a un motor elctrico o si hay un nio jugando en la son generados por un sensor conectado a una mquina.
entrada del auto mientras el vehculo retrocede.
Nuestro desafo es sacar provecho de los datos y ponerlos
Ya la creciente abundancia de datos deposita poder en a funcionar, valindonos de nuestra ingenio para entender
nuestras manos al ponernos la informacin que tanto los valiosos aprendizajes que guardan. Esta capacidad
necesitamos en la punta de los dedos. de procesar los datos y transformar las observaciones
en conocimientos, y los conocimientos en respuestas,
Pero qu son exactamente los datos? Quin o qu
es la que nos permite obtener soluciones de verdadero
los genera? Qu posibilidades tienen de mejorarnos la
significado a los considerables desafos de la actualidad.
vida? Cmo hay que usarlos para obtener un mximo
beneficio? Y cmo podemos asegurarnos de usarlos de
maneras que sean compatibles con nuestros valores e
inquietudes?
Estas preguntas son importantes porque, dada su
transicin de un recurso que en algn momento fue escaso
a un recurso cada vez ms abundante, valioso y renovable,
los datos se estn convirtiendo en una fuente importante
de beneficios econmicos y sociales. Tradicionalmente, fue
el acceso a recursos como las tierras, la mano de obra y el
capital el que representaba una diferencia econmica entre
quienes tenan xito y quienes fracasaban. Hoy, el 90 por
ciento de los lderes de negocios citan a los datos como
uno de los recursos clave y un factor distintivo fundamental
para los negocios, a la par de recursos bsicos como las
tierras, la mano de obra y el capital.1
Un ejemplo: los economistas estiman con cautela que
si el mejor aprovechamiento de los datos ha producido
pequeas ganancias que permitieron que las industrias
fueran un 1 por ciento ms eficientes, esto le sumara cerca
de $15 billones al PIB global para el 2030.2 La prxima
gran tendencia puede provenir de los miles de millones de
pequeos elementos conectados a Internet que producen
datos cada vez mejores acerca del mundo que nos rodea
y pueden generar soluciones an ms efectivas a partir
de los datos.3 Ya estamos encontrando respuestas a
preguntas que ni siquiera sabamos que tenamos.
BSA.ORG

6
? !
!
Las empresas y los EX ABYTE
1.000.000.000.000.000.000 bytes
! &
gobiernos ahora deben TODA PALABRA PRONUNCIADA

trabajar activamente TERABYTE


GIGABYTE 1.000.000.000.000 bytes
para hacer arrancar el 1.000.000.000 bytes BIBLIOTECA DEL CONGRESO
10 METROS DE
motor de la innovacin. ESTANTERAS

COMPARACIN EN ESCALA

LOS CUATRO PASOS CLAVE PARA

TRANSFORMAR CRECIMIENTO ACTUAL DE LOS DATOS EN

LOS DATOS EN
TODO EL MUNDO
El 90 % de los datos del mundo se crearon en los ltimos dos

RESPUESTAS
aos.
2014-2015

La revolucin de los datos actual no es impulsada


exclusivamente por la enorme y creciente cantidad de 90%
datos; es alimentada por tecnologas fundamentales
que cambian la forma en que reunimos, almacenamos,
analizamos y transformamos los datos. Juntos, estos
factores de impulso nos permiten lograr percepciones
claras y poderosas desde la profundidad de los datos
y as extraer nuevos conocimientos, descubrir nuevas
conexiones y realizar nuevas predicciones.

1
LA RECOPILACIN DE LOS DATOS
10%

DATOS CREADOS
ANTES DEL 2014

Fuente: IBM
http://www.ibm.com/software/data/bigdata/what-is-big-data.html
A lo largo de la historia, siempre hemos reunido datos y
los hemos utilizado para colaborar con el avance de la
sociedad. Pero muchas veces, los datos eran demasiado digital y las pelculas que creamos; mediante los satlites
escasos. Hoy, tenemos la suerte de poder extraer ms que giran en el cielo; mediante los sensores y sistemas
datos del mundo que nos rodea datos cargados de que controlan nuestras fbricas y mercados financieros;
mayor significado, recopilados en formas ms tiles y que y mediante las herramientas que utilizamos para disear
generan resultados ms deliberados. Los datos dejaron digitalmente la prxima novedad. Esta informacin est
de ser un recurso escaso para convertirse en un recurso aumentando ms rpido, llegando ms lejos y creciendo
fundamental, renovable y cada vez ms abundante. en cuanto a su importancia.
Esto fue posible no por nuestra capacidad de concentrar Se calcula que ya se generan 2,5 cuatrillones de bytes de
y extraer informacin personal; sino gracias a nuestra datos al da.4 A nuestras mentes de la era analgica les
capacidad para conectar varios dispositivos y sensores cuesta incluso pensar en la enormidad de estos datos.
a Internet, lo que hoy genera una gran cantidad de datos Para tener un contexto, el ao pasado el mundo cre
nuevos a velocidades exponenciales. Como resultado, los suficientes datos digitales como para formar una pila de
datos se producen en todos lados mediante sensores en DVD que vaya desde la Tierra hasta la luna y vuelva.5 Y
las calles para medir el flujo del trfico; mediante la msica tambin se est acelerando el ritmo con el que creamos
7
La mayora de los datos no cuenta con identificacin
personal. Pronto, los dispositivos que estn conectados
alrededor del planeta nos ayudarn a comprender
claramente y mejorar nuestro entorno.

los datos. El volumen de los datos comerciales a escala + El Gran Colisionador de Hadrones (Large Hadron
mundial, en todas las empresas, se est duplicando Collider) de la CERN, la Organizacin Europea para la
ahora cada 1,2 aos.6 De dnde vienen todos ellos? A Investigacin Nuclear, genera 40 terabytes de datos por
continuacin se presentan algunos ejemplos de fuentes, segundo con cada experimento, y permite tener una
entre muchas: percepcin nueva y clara de los secretos ms profundos
relativos a la forma en que funciona el universo.13 De
+ Se espera que la informacin digital de los hospitales,
manera similar, el Gran Telescopio para Rastreos
mayormente de los exmenes clnicos de diagnstico
Sinpticos de Chile genera 30 terabytes de datos sobre
por imagen, trepe 665 terabytes por da para el 2015 y
nuestro universo al observar el firmamento cada noche.14
ayude a encontrar curas y salvar vidas.7
+ El secuenciamiento de un solo genoma de ADN puede
+ Los aviones de las aerolneas transcontinentales
generar 200 gigabytes de datos. A medida que el
modernas estn tan cargados de sensores en los
costo del secuenciamiento del ADN baja, los cientficos
motores, alerones y mecanismos de aterrizaje que
estn construyendo bases de datos inmensas llenas
pueden generar medio terabyte de datos por vuelo
de cientos de miles de estas secuencias con el objeto
para mejorar el rendimiento del vuelo,8 reducir las
de encontrar las diferencias y similitudes que se
turbulencias, mejorar la seguridad e identificar posibles
correlacionen con los avances mdicos y poder as
defectos en los motores, y hacerlo 2000 veces ms
salvar vidas.15
rpido que antes.9 Si multiplicamos eso por los ms de
25.000 vuelos que se realizan por da logramos tener No solo la cantidad de datos est aumentando de manera
una idea de la inmensa cantidad de datos tiles que exponencial, sino tambin las formas en que se producen.
generan ahora los aviones comerciales solamente. A medida que crece la cantidad de dispositivos que
conectan Internet con el mundo que nos rodea, y dan
+ Los satlites meteorolgicos, los observatorios
lugar as a la Internet de las cosas, existe una infinidad
meteorolgicos, los radares y otros sensores capturan
de sensores que crean formas completamente nuevas de
ms de 2,25 mil millones de datos del clima 15 veces
datos cada da. La prxima gran tendencia puede basarse
por hora y recopilan 20 terabytes por da lo que
en muchos elementos pequeos, puesto que se estima
permite que se realicen pronsticos del tiempo ms
que 50 mil millones de dispositivos llenos de poderosos
exactos en todo el planeta.10
sensores estarn conectados a Internet para el 2020.16
+ Los mercados financieros generan entre cuatro y cinco
Estos dispositivos crearn datos mediante tareas como
terabytes de datos por da que se utilizan para realizar
la medicin de la humedad del suelo, el rendimiento
anlisis en tiempo real y detectar problemas en las
de los motores, la eficiencia del sistema energtico
actividades comerciales, y simultneamente ayudan
y la localizacin de las crisis asmticas. Los seres
a que los negocios crezcan y la economa sea ms
humanos contamos simplemente con cinco sentidos
prspera.11
para comprender el mundo donde vivimos. Pronto, los
+ Los sensores telemticos ubicados en decenas de dispositivos que estn conectados alrededor del planeta
miles de vehculos de reparto llevan un registro del detectarn un conjunto completo de caractersticas acerca
rendimiento del motor, mejoran el recorrido y prevn del mundo fsico para ayudarnos a comprender claramente
los problemas de manera anticipada. Los datos del y mejorar nuestro entorno y, mientras tanto, producen
sensor del vehculo combinados con los anlisis de exabytes de datos nuevos y beneficiosos.
asignacin de datos les han permitido a las empresas
ahorrar millones de galones de combustible y reducir las
emisiones en una proporcin equivalente a la de quitar
de circulacin miles de automviles durante un ao.12

BSA.ORG

8
Puesto que el costo de almacenamiento de los datos
sigue en picada y la cantidad de datos contina
creciendo, los usos de los datos siguen expandindose.

2
Las tecnologas en la nube les ofrecen a los usuarios
un acceso mejor, ms confiable, ms rentable y ms
flexible a sus datos esto alivia la presin que las
inmensas cantidades de datos pueden ejercer sobre la
infraestructura interna de los departamentos de sistemas.
EL ALMACENAMIENTO DE LOS DATOS Al haber transformado desde los cimientos la forma en
que el almacenamiento de los datos se compra, vende
y brinda y al permitir que los datos estn disponibles
La disminucin de los costos de almacenamiento est prcticamente en cualquier lugar y en cualquier momento
permitiendo la innovacin impulsada por los datos. En la tecnologa en la nube se est posicionando como una
1980, era difcil encontrar espacio de almacenamiento de de las tecnologas ms transformadoras de la dcada, y
un gigabyte de datos, esto costaba cientos de miles de una de las grandes facilitadoras de soluciones generadas a
dlares y requera de la administracin de una persona a partir de los datos.
tiempo completo.17 Hoy, un gigabyte de almacenamiento
cuesta solo centavos, se administra fcilmente y permite
el acceso en cualquier momento, desde cualquier lugar.18
Desde la dcada del ochenta, el precio de almacenamiento DISMINUCIN DE LOS COSTOS DE
cay por ms de un factor de 10 millones.19 Para ponerlo ALMACENAMIENTO 38 % AL AO
en contexto, si el precio de la gasolina hubiera bajado de
la misma manera, uno podra conducir un auto alrededor $600
del mundo casi 10.000 veces con lo que se pagaba por un
galn de gasolina en 1980.20
Dado que el costo de almacenamiento contina bajando,
podemos almacenar cantidades cada vez mayores de $569
datos. En 1994, solo el 3 por ciento de los datos del mundo
se almacenaban digitalmente.21 Para 2007, el 94 por ciento
se almacenaba digitalmente.22
COSTOS POR GIGABYTE (GB)

Puesto que el costo de almacenamiento de los datos sigue


en picada y la cantidad de datos contina creciendo, los
usos de los datos siguen expandindose. Las tecnologas
en la nube que permiten el almacenamiento remoto de
los datos y el acceso mediante una serie de dispositivos
provocaron una reduccin drstica en el precio de
almacenamiento de los datos, de modo que ya no es
necesario eliminar los datos despus de su uso inicial para
que haya ms lugar para datos nuevos.23
Como resultado, y a diferencia de otros recursos, los datos
no se agotan luego de ser utilizados una vez. Los datos
constituyen un recurso renovable que se puede combinar
con otros conjuntos de datos y utilizar muchas veces para
$100
generar respuestas a preguntas que no podan preverse
al momento de la creacin de los datos. Por ejemplo,
los datos meteorolgicos no se utilizan nicamente para $0.03

predecir si necesitaremos llevar un paraguas; tambin $0.01


puede ayudar a predecir el rendimiento de los cultivos. 1992 1997 2002 2007 2012

Fuente: Hagel III, John et al. From Exponential Technologies to Exponential Innovation. Deloitte University
Press, 2013. Publicacin. 2013 Shift Index Series.

9
!

DATOS EN TIEMPO REAL: REDUCCIN DEL TRFICO

3
EL ANLISIS DE LOS DATOS

Los datos tienen valor solo cuando son comprensibles; de examinar cuidadosamente montaas de datos para
otra forma, no son ms que un montn de observaciones encontrar pepitas de informacin de oro.
aleatorias. Solo se puede lograr la comprensin de los
Afortunadamente, los recursos de procesamiento ms
conocimientos que contienen los datos si se combinan el
poderosos de las computadoras actuales combinados con
ingenio humano con un software innovador.
software inventivo les estn brindando a los cientficos de
Si bien el mundo es cada vez ms autnomo, siguen siendo los datos herramientas de vanguardia para comprender
necesarias la curiosidad personal, las habilidades humanas cantidades inmensas de datos y descifrar los valiosos
y el trabajo intenso para liberar las respuestas del interior de conocimientos que contienen.
los datos.
Si bien las redes actuales son impresionantes, mover
Primero, para que puedan ser tiles, es necesario limpiar cantidades enormes de datos por las redes hasta un lugar
los datos binarios. Segn un clculo aproximativo, los para poder procesarlos a todos al mismo tiempo es, a
cientficos de los datos pueden pasar entre el 50 y el 80 por menudo, prohibitivo en trminos econmicos e imposible
ciento de su tiempo preparando rebeldes datos digitales en trminos de logstica. Aun as, algunos de los motores
antes de que puedan ser explorados para encontrar piezas analticos ms poderosos de hoy pueden existir y ser
tiles.24 rentables gracias a grandes plataformas informticas en
la nube de distribucin en paralelo. Estas plataformas
Segundo, se necesita de la creatividad humana para
permiten que los usuarios ejecuten herramientas de anlisis
formular las preguntas correctas y, luego, encontrar las
de datos de primera categora con datos almacenados en
repuestas mediante la revisin y el reconocimiento de los
varios lugares al mismo tiempo.
datos incorrectos, y la interpretacin coherente de los
resultados. El papel de los cientficos de los datos se ha Qu nos permite hacer este anlisis de los datos? Predecir
descrito como una funcin con tres partes: la de analista, el futuro sola parecer inverosmil, pero ahora parece
la de artista y la de narrador de historias.25 Cada dato inevitable. Hoy, gracias a los anlisis de datos modernos,
individual es como un pxel en una pantalla. Solo, brinda realizamos predicciones confiables todo el tiempo. Los
nicamente una pequea cantidad de informacin. Pero pronsticos del tiempo son ms confiables incluso para los
cuando se lo combina con una cantidad suficiente de prximos 10 das. Los gerentes de flota pueden predecir
pxeles en el orden correcto, el cientfico de los datos puede qu motores necesitan reparacin antes de que el auto
pintar un cuadro que vale mil palabras y derivar significados sufra una avera. Cuando los datos del presente se pueden
nuevos, y a veces inesperados, de los datos. comparar con los del pasado, muchas veces se pueden
usar para ayudar a predecir el futuro.
Al examinar cuidadosamente los datos, las herramientas
analticas pueden atravesar el conjunto de datos Los economistas estn encontrando formas de realizar
desordenados para ayudar a los usuarios a descubrir mejores previsiones de los mercados, el empleo y la
pautas y tendencias nuevas, encontrar ideas inesperadas inflacin. Durante mucho tiempo, los datos econmicos del
a partir de datos aparentemente inconexos y descubrir gobierno obligaron a los encargados de tomar decisiones a
automticamente relaciones interesantes desde el punto mirar por el espejo retrovisor. Las estadsticas econmicas
de vista estadstico. Mediante bases de datos de creciente del gobierno, como el crecimiento del PIB, siempre miraron
riqueza y algoritmos estadsticos cada vez ms avanzados, los meses en retrospectiva para decirnos, despus
las herramientas analticas de software nos permiten de una larga pausa, la forma en que se comportaron
BSA.ORG

10
Se redujo la La proporcin
cantidad de Se redujo el de vehculos
emisiones en un trfico en la ecolgicos que no
IBM y la ciudad de Estocolmo se unieron para instalar

10 % 20 % ciudad en un Se redujo el pagan impuestos


1.600 sistemas de GPS en taxis. Un software de aument un
promedio de
transmisin de datos de IBM recolecta los datos de los

9%
tiempos de viajes
dispositivos GPS y brinda informacin sobre el flujo del
en casi un
trfico, los tiempos de viaje y las mejores rutas.

50 %
Fuente: Bertolucci, Jeff. Dublin Points Big Data Tech At Traffic Jams. InformationWeek 2013. Internet.
Nusca, Andrew. Stockholm Uses Real-Time GPS Data To Manage Traffic Congestion ZDNet, 2010. Internet.

las economas en el pasado como el mejor punto de anlisis de datos. El poder de las mejores herramientas
referencia para el futuro. Ahora, los economistas estn de la actualidad yace en su capacidad para establecer
combinando una variedad de datos en tiempo real, como correlaciones nuevas y encontrar respuestas inesperadas
nuevos puestos de empleo y rdenes de la industria, y los que estn bien ocultas en los datos incluso cuando
estn comparando con los datos histricos para trazar un la gente no sepa cul es la pregunta correcta que debe
panorama ms exacto de las dinmicas actuales, y formular hacer. En todo el planeta, las herramientas de anlisis estn
mejores polticas para garantizar economas saludables. encontrando correlaciones de gran impacto y produciendo
resultados inesperados. Por ejemplo:
El surgimiento de los anlisis de datos en tiempo real est
permitiendo tambin una toma de decisiones autnoma + Mediante el seguimiento y la correlacin de ms de 1000
para ayudarnos a nosotros, o a las mquinas que datos por segundo, los investigadores canadienses
utilizamos, a tomar decisiones mucho ms rpido y con sorprendieron a los mdicos al demostrar que los bebs
mayor precisin. Ya muchas empresas automotrices de prematuros con signos vitales extraamente estables
Estados Unidos estn diseando vehculos cargados con se correlacionaban con cuadros de fiebre serios al da
cientos de sensores, telemtica y conectividad en tiempo siguiente esto permiti que los mdicos tomaran
real para permitir los grandes avances logrados en el medidas preventivas.26
estacionamiento autnomo. Los fabricantes de autos estn
+ Se estn utilizando dos dcadas de noticias pasadas de
potenciando las herramientas de anlisis en tiempo real que
peridicos para predecir dnde y cundo se producirn
permiten evitar choques de manera autnoma y desarrollar
brotes de clera en lugares como Angola.27
autos que se conducen solos. Dichos avances podrn,
algn da, salvar vidas con una reaccin ms rpida y + Los departamentos de polica modificaron un algoritmo
confiable ante las situaciones en comparacin con lo que inicialmente diseado para predecir terremotos, y ahora
podemos hacer los seres humanos. lo estn utilizando para predecir, en un radio de 500
pies, dnde es probable que se produzcan delitos.
Al tener a su disposicin una cantidad de datos sobre
En las zonas donde se utiliza este software, los robos
nuestro entorno en tiempo real que crece de manera
disminuyeron un 33 por ciento y los delitos violentos se
exponencial, aquellos que pueden comprender lo
redujeron un 21 por ciento.28
que averiguan a la misma velocidad que lo averiguan
podrn maximizar el efecto de las herramientas de + Mediante anlisis de datos y sensores marinos
que monitorizan olas, corrientes y otros datos, los
investigadores estn utilizando los anlisis de datos para
Los recursos de procesamiento predecir tsunamis y otros desastres naturales, as como
ms poderosos de las sus efectos.29
+ Los datos provenientes de las visitas al mdico y la
computadoras actuales informacin de las recetas revelaron cmo los pacientes
combinados con software con enfermedades autoinmunitarias tienen un mayor
riesgo de epilepsia.30
inventivo estn brindando a + Los datos de la capacidad crediticia se estn utilizando
los cientficos de los datos para predecir qu pacientes necesitarn recordatorios
amistosos para que tomen sus medicamentos
herramientas de vanguardia recetados.31

para comprender cantidades + Al usar una dcada de datos histricos de vuelos


correlacionados con pautas meteorolgicas, los
inmensas de datos y descifrar pasajeros de avin pueden calcular qu vuelos tienen
ms probabilidades de llegar a horario.32
los valiosos conocimientos que
contienen.
11
As como los datos estn a nuestro alrededor, tambin hay
oportunidades. Cuando las personas que innovan actan
de manera responsable y creativa, la innovacin de los
datos puede producir respuestas tanto para los problemas
cotidianos como para los desafos ms grandes del planeta.

4
LA TRANSFORMACIN Y TRADUCCIN DE LOS DATOS

Nuevas y poderosas herramientas de software nos estn nuevas oportunidades para el comercio global. De manera
brindando la posibilidad de utilizar los conjuntos de datos similar, con una cantidad estimada de 360 millones de
para tomar decisiones basadas en la informacin y no en personas que sufren de prdida auditiva, los investigadores
una corazonada o intuicin. de China han recurrido al reconocimiento de patrones y al
procesamiento en tiempo real de datos de un sensor Kinect
En particular, hay un conjunto nuevo de herramientas que
3D para desarrollar un sistema que comprenda los gestos
les estn dando un propsito a los datos al transformarlos
del lenguaje de seas y los convierta, en tiempo real, en
de formas que nos ayudan a extrapolar, enfocar,
lenguaje oral y escrito y viceversa.35
visualizar, reflexionar, perfeccionar, modelar y predecir.
Estas herramientas incluyen tecnologas de aprendizaje El procesamiento ms rpido de las imgenes tambin est
automtico que entienden los datos para ayudarnos teniendo un efecto profundo en reas como la deteccin
a responder mejor a ellos; tecnologas de modelado y del cncer, la informtica cognitiva, la neurobiologa y la
simulacin que pueden probar escenarios y transformar los robtica. Por ejemplo, debido a su apariencia y forma
datos en soluciones reales; y herramientas que reconocen impredecibles, es particularmente difcil identificar los
y traducen sonidos, imgenes o videos a nuevas formas de tumores cerebrales en las imgenes mdicas. Con la ayuda
mayor significado. de la informtica en la nube y los algoritmos de anlisis
avanzado de imgenes, los equipos de cientficos ahora
Este tipo de transformacin de los datos conduce a mejores
estn compitiendo para encontrar los mejores algoritmos
planes, diseos superiores y decisiones ms inteligentes.
informticos a fin de identificar con mayor precisin y
Por ejemplo, los mdicos que ejercen la medicina hoy
velocidad los tumores cerebrales.36
son bombardeados con investigaciones nuevas y as es
casi imposible mantenerse al corriente de los ltimos El cambio de las imgenes 2D a las imgenes 3D para las
desarrollos, mucho menos interpretar los datos de los mamografas est mejorando los ndices de deteccin del
pacientes en tiempo real.33 Como resultado, los hospitales cncer de seno. Las mamografas tridimensionales utilizan
estn recurriendo a sistemas de respaldo de decisiones un software para combinar muchas radiografas desde
clnicas. En esencia, se trata de sistemas de software que diferentes ngulos a fin de crear una imagen tridimensional
analizan datos de fuentes dispares para colaborar con que pueda aumentar los ndices de deteccin del cncer de
diagnsticos ms rpidos y confiables en un entorno de seno y disminuir las estresantes falsas alarmas.37
datos complejos demostraron ser de beneficio en ms
En efecto, la capacidad de utilizar los datos para crear
del 70 por ciento de los casos.34
tanto visualizaciones como simulaciones permite que sea
Otras herramientas informticas estn ayudando a traducir ms fcil comprenderlos y usarlos. Ahora modelamos y
los datos a formas de mayor significado. El procesamiento simulamos sistemas complejos y evaluamos diseos con
en tiempo real de audios, imgenes y videos est mayor precisin y velocidad, sin tener que construirlos
conduciendo a avances que cambian la vida. A modo realmente. Por ejemplo, en la dcada del ochenta, Boeing
de ilustracin: mientras se renen ms datos acerca de evalu 77 de sus 767 prototipos utilizando tneles de viento
la forma en que hablan las personas, la tecnologa de fsicos. Al 2005, Boeing realiz solo 11 pruebas fsicas para
reconocimiento de voz mejora continuamente. Esto ha sus 787 prototipos, evalu los prototipos mediante tneles
permitido avances como la traduccin bidireccional de de viento virtuales y supercomputacin a fin de ahorrar
idiomas en tiempo real durante las conversaciones en tiempo, ahorrar energa, ahorrar dinero y salvar vidas.38
BSA.ORG todos los continentes y genera, de manera potencial,

12
Los tneles de viento virtuales son un ejemplo de para modelar los lugares donde podran viajar sustancias
herramientas que mastican cantidades inmensas de datos contaminantes por el agua subterrnea, cmo aumentar
para que el uso de la mecnica de fluidos computacional el rendimiento de las turbinas de viento y cmo disear
3D sea ms sencillo y su implementacin ms rpida. mejores edificios que puedan soportar las peores
Estas herramientas nos permiten modelar mejor el flujo inclemencias de la Madre Naturaleza.
de calor, el flujo de fluidos, el flujo de aire y el flujo de los
En pocas palabras, estas herramientas transforman los
procesos para un mejor rendimiento. Se estn utilizando
datos en soluciones.

En conjunto, las funciones de reunir,


almacenar, analizar y transformar los datos
se estn uniendo para dejar al descubierto
nuevas oportunidades de mejores soluciones.
En la prctica, sin embargo, cada una de estas porque puede tornarse valiosa despus para una
cuatro fuerzas es ejercida, a menudo, por combinacin de conjuntos de datos aparentemente
personas dispares, que manipulan conjuntos inconexos, y porque el algoritmo para explotar los
de datos diferentes, almacenados en lugares conocimientos puede no haberse inventado an.
distribuidos. Sin embargo, esto es parte del poder
As como los datos estn a nuestro alrededor,
de la revolucin de los datos. Los conjuntos de
tambin hay oportunidades. Cuando las personas
datos diferentes, antes inconexos, se pueden
que innovan actan de manera responsable y
combinar y analizar, incluso si se almacenan en
creativa, la innovacin de los datos puede producir
lugares diferentes; se pueden acrecentar, incluso
respuestas tanto para los problemas cotidianos
cuando los datos no estn estructurados; y se
como para los desafos ms grandes del planeta. A
pueden manipular, incluso cuando las partes
fin de maximizar las oportunidades facilitadas por
estn descubriendo respuestas fundamentales
los datos de maneras que puedan acelerar nuevas
a preguntas que los creadores de los datos ni
olas de productividad, crecimiento econmico y
siquiera saban cmo formular. Es posible que uno
beneficios individuales, debemos hacer arrancar
nunca conozca anticipadamente el poder exacto de
el motor de la innovacin nuevamente y sentar las
la informacin que pueda extraerse posteriormente
bases para las soluciones de punta y los efectos
de un conjunto de datos en particular en parte,
fortalecedores que est preparada para producir.

13
Las empresas de produccin que saquen
pleno provecho de sus datos podran ahorrar

$371 mil
millones
en un perodo de cuatro aos.

DATOS COMERCIALES: AHORRO DE COSTOS

UNA ECONOMA IMPULSADA POR


LOS DATOS
Los datos estn surgiendo ahora como una de En EE. UU., cada
las nuevas fuerzas de beneficio econmico ms puesto de trabajo
dinmicas. Los efectos econmicos de los datos
ya estn extendindose a muchos sectores de la
DRELACIONADO
economa, tanto en las industrias de alta tecnologa CON LOS DATOS
como en las de tecnologa poco avanzada. Solo en los genera otros tres
prximos cuatro aos, el mejor uso de los datos podra
puestos de trabajo
dar lugar a $1,6 billones de dividendos de datos en
todo el mundo.39 de manera indirecta.

La innovacin de los datos ha demostrado que tiene la


habilidad de aumentar la productividad. Las empresas
que ya estn realizando una toma de decisiones guiada
por los datos informan un aumento de entre el 5 y 6 por
ciento en la productividad.40 Si, al utilizar los datos ms 61 %
efectivamente, podemos lograr ganancias aunque sean de ejecutivos Americanos
pequeas en un amplio rango de industrias a fin de que reconocen que el poder de
puedan ser al menos un 1 por ciento ms eficientes, los
economistas estiman que pueden sumarse alrededor ANLISIS DE DATA
de $15 billones al PIB global para el 2030. Esto equivale
es importante para el
a incorporar otra economa de los EE. UU. Un aumento
de la productividad del 1 por ciento puede parecer reclutamiento en sus
poco, pero tal como lo expresa el Director Ejecutivo
de General Electric, Jeff Immelt: dile a un hombre del empresas.
sector del petrleo que puedes usar software para
ahorrarle un uno por ciento en algo, y ese hombre ser
tu amigo para toda la vida.41

La innovacin de los datos como creadora de inmensos de datos que hacen posible la innovacin de los
datos. Adems, el 61 por ciento de los ejecutivos senior de
empleo.
los EE. UU. y el 58 por ciento de los de Europa afirman que
La innovacin de los datos no implica solo aumentar el el anlisis de los datos es importante para los planes de su
crecimiento econmico. Tambin se trata de alimentar empresa relativos a la contratacin de nuevos empleados.42
un poderoso motor nuevo de creacin de empleo y un Por cada puesto de TI relacionado con los datos que se
multiplicador potente de la fuerza de trabajo. La innovacin cree, se estima que se crearn otros tres puestos para
de los datos ya est creando miles de trabajos nuevos y personas ajenas a la TI esto generar millones de
bien pagos desde analistas de datos y desarrolladores de puestos de trabajo adicionales en toda la economa.43
BSA.ORG software, hasta las personas que administran los depsitos El resultado final consistir en beneficios econmicos
14
En un periodo de 15 aos,
una mejora de un 1 % de la
productividad impulsada por los
Los edificios inteligentes datos en la aviacin podra dar
solos pueden ahorrarles lugar a un ahorro de
a las empresas

$25 mil $30 mil


millones millones
en combustible a escala mundial.
al ao en costos energticos.

nuevos y extendidos a partir de otra explosin del empleo desarrollaron un algoritmo de aprendizaje automtico que
producida por las tecnologas nuevas. puede predecir los paros cardacos con cuatro horas de
anticipacin y es exacto el 66 por ciento de las veces; lograron
Los datos permiten negocios ms giles, esto al combinar datos en tiempo real con los antecedentes
competitivos y de mayor respuesta. mdicos del paciente.48
Tradicionalmente, los grandes aumentos de la productividad
impulsados por la TI que hacan crecer nuestra economa TRANSPORTE
y elevaban nuestros estndares de vida se limitaban solo La innovacin de los datos para ahorrar tiempo,
a unos pocos sectores de la economa como el propio ahorrar dinero, ahorrar combustible y salvar
sector de la tecnologa. No obstante, a medida que ms vidas.
sectores generan ms formas de datos, los datos estn
ahora preparados para producir ganancias nuevas en los Los datos nos ubicaron rumbo a un futuro con un
sectores que solan quedar rezagados de la agricultura transporte ms inteligente. En todas nuestras aerovas, vas
a la salud, del transporte a la educacin y de la energa frreas y calles, los anlisis de datos en tiempo real estn
a las finanzas. De hecho, en una encuesta reciente, el 79 conduciendo a sistemas de transporte ms inteligentes que
por ciento de los ejecutivos senior de los Estados Unidos estn mejorando nuestra capacidad de transportar bienes
y el 80 por ciento de los ejecutivos de Europa afirmaron y personas de manera segura y eficiente. Actualmente, los
que el anlisis de los datos es importante para los planes automviles nuevos estn provistos de tantos sensores
de sus empresas relativos a una mejor satisfaccin de las que pueden generar hasta 25 gigabytes de datos por
necesidades de los clientes.44 Asimismo, el 70 por ciento de hora, y contener ms de 10 millones de lneas de cdigos
los ejecutivos de los Estados Unidos y el 72 por ciento de de software solo para procesar los datos.49 Estos datos
los ejecutivos de Europa dicen que el anlisis de los datos se estn utilizando para impulsar sistemas nuevos de
es importante para los planes de sus empresas relativos a seguridad y prevencin de accidentes que podran tener
la creacin de nuevos productos o servicios.45 un efecto de las mismas proporciones que tuvieron los
cinturones de seguridad al permitir una reduccin de las
ASISTENCIA MDICA lesiones y muertes nada menos que del 50 por ciento.50 En
una poca donde la cantidad de automviles en las calles
La innovacin de los datos est ayudando a las
crece constantemente, los datos se pueden utilizar tambin
personas a vivir ms tiempo y tener vidas ms de maneras innovadoras para disminuir las congestiones
saludables mediante un mejor discernimiento. y el trfico en las rutas de forma ms eficiente y ahorrar
La asistencia mdica es uno de los entornos actuales con millones de horas, miles de galones de combustible y
mayor riqueza de datos genera cientos de terabytes de toneladas de emisiones de gases de efecto invernadero.
datos por hospital al da.46 El uso maximizado de estos datos Los datos de la aviacin tambin estn despegando.
puede ser la receta para una mejor atencin y curas ms Hoy en da, una aerolnea moderna puede generar hasta
rpidas. Actualmente, los datos les estn proporcionando a los medio terabyte de datos por vuelo a partir de los sensores
mdicos una percepcin clara y sin precedentes de la salud ubicados en todo el avin; stos se utilizan para mejorar
de sus pacientes, y estn permitiendo una mejor toma de el rendimiento del vuelo, reducir las turbulencias, mejorar
decisiones. Con la ayuda de los anlisis de datos, los mdicos la seguridad e identificar defectos en el motor 2000 veces
pueden hacer uso de los resultados de cada paciente previo ms rpido que antes.51 Los datos de la aviacin tambin
a fin de formar opciones de tratamiento para cada paciente estn mejorando la planificacin de las rutas de vuelo, y le
futuro. Y aun as, muchas veces no se hace un uso ptimo de informan a la tripulacin qu pieza debe ser reemplazada
los datos mdicos. Si el sector de la asistencia mdica utilizara antes de que tenga un desperfecto. Estos beneficios
los datos de manera ms efectiva para generar eficiencia suman. Una mejora de la productividad en la aviacin
y calidad, se estima que el sector podra ahorrar ms de impulsada por los datos de tan solo un 1 por ciento podra
$300 mil millones de dlares por ao y reducir gastos en dar lugar a un ahorro de $30 mil millones en combustible a
un significativo 8 por ciento.47 Pero los mayores efectos no escala mundial.
se miden solo a partir de los dlares ahorrados, sino de las
vidas salvadas. Por citar solo un ejemplo, los investigadores
15
Si el sector de la asistencia mdica utilizara los datos
de manera ms efectiva para generar eficiencia y
calidad, se estima que el sector podra ahorrar ms de
$300 mil millones de dlares por ao y reducir
gastos en un significativo 8 por ciento.

ENERGA/MEDIOAMBIENTE de producto ptimo. Toyota, Fiat y Nissan recortaron el


La innovacin de los datos est reduciendo tiempo de desarrollo de modelos nuevos entre un 30 y un
50 por ciento mediante el uso coordinado de los datos y las
el consumo de energa y mejorando nuestro
tcnicas de modelado.56
medioambiente.
Los datos tambin estn facilitando ahorros enormes SECTOR FINANCIERO
de energa. Un mejor uso de los datos puede producir La innovacin de los datos est aumentando la
ahorros de miles de millones de dlares en varias
eficiencia, mejorando el cumplimiento normativo
industrias, y mejorar al mismo tiempo el medioambiente.
Los conocimientos impulsados por los datos permiten un y reduciendo los fraudes.
uso ms inteligente de la energa en las redes elctricas, En el sector de los servicios financieros, la explotacin
los edificios, los hogares, las fbricas, las granjas y todo de las crecientes cantidades de datos puede mejorar la
el medioambiente. Mediante las herramientas de diseo eficiencia operativa, mejorar el cumplimiento normativo e
de datos, por ejemplo, ahora los edificios pueden tener identificar los fraudes. En una encuesta, el 71 por ciento
diseos que consuman menos energa, y pueden estar de las firmas de los mercados bancario y financiero
provistos de sistemas inteligentes que combinen abanicos informaron que el uso de la informacin y las herramientas
de datos de sensores con herramientas de anlisis y de anlisis est creando una ventaja competitiva para sus
activadores para lograr operaciones ms eficientes. En organizaciones.57 Las inversiones en datos pueden pagar
conjunto, se calcula que los edificios inteligentes solos enormes dividendos. Los anlisis de datos ayudaron a una
pueden ahorrarles a las empresas $25 mil millones al ao empresa de tarjeta de crdito a identificar $2 mil millones en
en costos energticos.52 fraudes de tarjeta de crdito evitables al ao.58

PRODUCCIN AGRICULTURA
La innovacin de los datos est mejorando la La innovacin de los datos est produciendo
forma en que los productos se disean, elaboran mejores alimentos usando menos recursos.
y distribuyen. Los datos estn brotando por todos lados en las granjas
El sector de la produccin almacena ms datos que ningn ayudan a producir alimentos ms deliciosos y nutritivos
otro sector.53 Como resultado, los productores tienen para una cantidad cada vez mayor de personas. Gracias
mucho que ganar a partir de un mejor uso de los datos a un concepto denominado agricultura de precisin, los
para aumentar la eficiencia, producir calidad y mejorar agricultores de todo el planeta pueden usar los datos de
la forma en que los productos se disean, elaboran y las semillas, los satlites, los sensores y los tractores para
distribuyen. Segn un clculo aproximativo, el mejor uso de tomar mejores decisiones que aumentan el rendimiento,
los datos de produccin puede dar lugar a una reduccin reducen los costos y alimentan a ms gente. Al tener
de hasta un 50 por ciento en el tiempo de desarrollo del un cuarto de la poblacin mundial involucrada en la
producto y los costos de ensamblaje.54 En efecto, IDC agricultura y la produccin de alimentos, se pueden lograr
(International Data Corporation) calcula que las empresas grandes beneficios a partir de un mayor uso de los datos.
de produccin que saquen pleno provecho de sus datos Por ejemplo, al aprovechar las herramientas de anlisis
estn preparadas para alcanzar dividendos de datos por de datos, los agricultores pueden reducir los gastos de
$371 mil millones en un perodo de cuatro aos.55 Al usar produccin, el uso de pesticidas y el uso de sustancias
datos en tiempo real, las empresas pueden realizar un qumicas, y tener una mejora de cinco o 10 bushels por
mejor seguimiento y una mejor gestin de las cadenas de acre en las cosechas.59 Para los productores lecheros,
suministro globales, y reducir los defectos de los productos. un emprendimiento croata fue el primero en utilizar una
plataforma de anlisis informtico basada en la nube que
Los datos tambin estn ayudando a mejorar los diseos. brinda datos en tiempo real sobre aspectos como el efecto
Los diseos digitales facilitados por los datos estn de la calidad del alimento de los animales en la produccin
mejorando el proceso de diseo repetitivo permiten que y los ndices de concepcin de cada animal; esto, a la vez,
BSA.ORG los diseadores prueben incontables ideas y las modifiquen aument nada menos que un 50 por ciento el rendimiento y
en el entorno virtual hasta alcanzar finalmente un diseo la eficiencia del productor.60
16
LOS DATOS MEJORAN LAS VIDAS EN EL MUNDO

Mediante el uso de ms de CANAD

1.000 datos
por segundo, los cientficos canadienses descubrieron que los
bebs prematuros con signos vitales atpicamente estables
tenan un mayor riesgo de presentar fiebre; esto permiti que
los mdicos tomaran medidas con antelacin y salvaran vidas.

SEPARAMOS LOS MITOS SOBRE


LOS DATOS DE LOS HECHOS
Hay muchos mitos alrededor de las recientes
innovaciones de los datos y la economa de los datos. LA INFORMACIN
Esto incluye mitos acerca de: PERSONAL Y LA
+ La informacin personal y la proteccin de los datos,
+ El efecto econmico de la economa de los datos,
PROTECCIN DE LOS
+ La confiabilidad de los datos, DATOS
+ Las innovaciones de los datos del siglo XXI,
+ Los beneficios globales de la innovacin de los datos, y MITO
La innovacin de los datos beneficia
+ La funcin del gobierno en la regulacin de los datos.
nicamente a las empresas de TI no a los
individuos.

REALIDAD
La innovacin de los datos les da poder a los consumidores
para tomar mejores decisiones y permite que los
comerciantes personalicen sus bienes y servicios para
brindarnos una mejor atencin. Puede conducir a
importantes avances mediante el aprendizaje personalizado
y la medicina personalizada. Puede conducir a una mejor
experiencia del consumidor mediante el entretenimiento
personalizado. Puede ayudarnos a evolucionar de una
economa impulsada por la produccin en masa a una
facilitada por la personalizacin en masa. En efecto, existe
un conjunto de empresas en el centro del desarrollo y de
la produccin de las nuevas tecnologas de innovacin
sobre las que se apoya la revolucin de los datos. Sin
embargo, si hacemos elecciones inteligentes hoy, esta
economa centrada en los datos que est surgiendo puede
crear nuevos trabajos e industrias, y poner al mundo en las
manos de los consumidores.

17
E N L A I N D I A , LO S C E N T R O S D E C O N E X I N
A INTERNET PERMITEN QUE MS DE
INDIA
4 millones
de granjeros tengan acceso a los precios de cultivo,
datos del clima y otros tipos de informacin en los

idiomas locales.

MITO REALIDAD
Todos los datos son datos personales. El xito de la economa de los datos depende de la
confianza de los consumidores. Las personas deben sentir
REALIDAD que su informacin personal est segura. Los principales
Algunos datos pueden consistir en informacin personal desarrolladores de software ya integran protecciones
(p. ej., los datos que generamos con nuestros dispositivos de privacidad en sus sistemas desde el inicio, esto se
mviles o que creamos al usar las redes sociales). La denomina privacidad desde el diseo. Asimismo, los
mayora de los datos, sin embargo, no son personales. desarrolladores a menudo emplean la anonimizacin,
la desidentificacin y herramientas de cifrado para
La inmensa cantidad de datos que se crea cada da incluye poder minimizar an ms el efecto de cualquier posible
informacin como la monitorizacin del clima por satlite, el violacin de los datos. Cuando los datos se agrupan para
rendimiento de los motores de los aviones de pasajeros, las que los usuarios particulares no sean identificados de
transacciones de la bolsa generadas por computadora y los manera especfica, en general, los datos pueden seguir
sensores no relacionados con los individuos. Aun cuando analizndose para detectar pautas de comportamiento sin
los datos s se relacionan con un individuo, a menudo violar la confianza ni privacidad del usuario. Asimismo, las
no accede a ellos otro ser humano y es probable que polticas de privacidad aplicables pueden tener en cuenta
estn desidentificados en esencia, datos almacenados el contexto y los riesgos relativos que implican cualquier
y utilizados sin informacin que revele la identidad de la exposicin o uso incorrecto de los datos, de modo que
persona involucrada. los datos ms sensibles (como datos financieros o de
asistencia mdica) obtengan el nivel ms alto de proteccin.
Esto significa que datos como los meteorolgicos o los
MITO anlisis comerciales que no incluyen informacin personal
A las empresas no les preocupa la proteccin no requieren el mismo nivel de proteccin que los datos de
de los datos personales. asistencia mdica de pacientes especficos.

REALIDAD
Cuando se generan datos personales, deben ser MITO
protegidos de manera adecuada. A fin de expandir las Los datos nunca se pueden desidentificar por
oportunidades que generan los datos, la confianza pblica completo. La desidentificacin de los datos
en ellos debe ser alta. Las empresas y las organizaciones no es efectiva.
que utilizan datos deben ejercer una buena administracin
de los datos. Estas prcticas podran estar estandarizadas REALIDAD
mediante esfuerzos guiados por la industria para crear La desidentificacin de los datos es un proceso que se
pautas voluntarias respecto del uso responsable de los utiliza para evitar la conexin entre la identidad de una
datos. Muchos lderes en el campo ya estn dando un paso persona y la informacin. Una vez que los datos son
adelante para dejarles claro a los consumidores cmo se desidentificados, se los puede analizar sin conexin alguna
recopilan sus datos y si se comparten. Muchas empresas con una persona. Los expertos han desarrollado tcnicas
siguen buenas prcticas que les exigen anonimizar la que permiten desidentificar los datos en formas que
informacin personal cada vez que resulte prctico. pueden maximizar tanto la privacidad como la calidad de
los datos.61 Segn los expertos, si la desidentificacin de
los datos se realiza correctamente, el riesgo de reidentificar
MITO a las personas a partir de los datos anonimizados es inferior
La innovacin de los datos provocar que al 1 por ciento en la mayora de los casos.62
pierda toda mi privacidad.

BSA.ORG

18
E N E E . U U. , L A S E M P R E S A S AU TO M OT R I C E S
M S I M P O R TA N T E S estn diseando vehculos
nuevos cargados con EE. UU.
cientos de sensores
y dispositivos de anlisis para permitir grandes
avances, como el estacionamiento autnomo y
la prevencin de accidentes.

MITO
No se puede confiar en las empresas que
EL EFECTO ECONMICO
utilizan los datos. DE LA ECONOMA DE LOS
REALIDAD DATOS
La industria est escuchando las inquietudes sobre la
privacidad y les est prestando atencin. En este momento,
MITO
hay signos de una animada competencia entre las
empresas lderes que se encuentran en una carrera hacia La innovacin de los datos no crear empleos
las mejores soluciones de proteccin de la privacidad. Por nuevos e incluso puede eliminar puestos de
ejemplo, las dos empresas responsables de los sistemas trabajo.
operativos que hacen funcionar, de manera combinada,
al 96,4 por ciento de los smartphones a escala mundial REALIDAD
anunciaron recientemente mejoras en sus configuraciones La innovacin de los datos puede ser un poderoso factor
de privacidad. Les estn brindando controles adicionales a de generacin de crecimiento econmico. De hecho, el 61
los usuarios y se estn cambiando al cifrado de datos para por ciento de los ejecutivos senior de los Estados Unidos y
proteger la privacidad personal.63 Las empresas lderes de el 58 por ciento de los ejecutivos de Europa encuestados
software apelan ahora directamente a los consumidores recientemente afirman que el anlisis de los datos es
al publicitar su compromiso con la proteccin de la importante para los planes de su empresa relativos a la
privacidad.64 Las empresas estn cambiando incluso sus contratacin de nuevos empleados.67 Aun as, la innovacin
servicios y polticas para que faciliten ms la privacidad, por de los datos no implica la creacin de empleos dentro del
ejemplo, al no examinar las comunicaciones de los clientes sector de la TI exclusivamente. Cada funcin relacionada
para dirigir la publicidad.65 con los datos crear empleo para una cantidad estimada
de tres personas ajenas a la TI, esto generar incluso ms
puestos en toda la economa.
MITO
Si bien habr algunos cambios en el empleo a medida
Las personas no tienen control alguno sobre que la innovacin de los datos ayude a encontrar nuevas
sus datos. formas de llevar a cabo las tareas tradicionales, es probable
que este cambio se parezca a la proliferacin de Internet,
REALIDAD cuando se estima que se crearon 2,6 puestos de trabajo
Si bien a veces puede parecer que no tenemos control por cada puesto suspendido y perdido.68 Una de las
sobre los datos, hay muchas herramientas que los principales reas de posible crecimiento laboral es la del
consumidores tal vez desconozcan an y que los ayudan a anlisis de datos. Con frecuencia, la comprensin de los
controlar mejor sus datos. Por ejemplo, algunas empresas conocimientos presentes en los datos se puede lograr
lderes de software han elegido habilitar funciones con la nicamente mediante el ingenio de los seres humanos.
orden de No rastrear de manera predeterminada en sus Actualmente, hay una escasez mundial de analistas y
navegadores web, de modo que los sitios web visitados administradores de datos especializados que puedan
y las empresas de publicidad de terceros utilizadas por ayudar a comprender los datos. Segn McKinsey, solo en
esos sitios reciben automticamente una solicitud de No Estados Unidos existe una falta de entre 140.000 y 190.000
rastrear. Les informa a los sitios web que no deseamos personas con la capacidad de anlisis profundo necesaria
ser rastreados y esto puede ayudar a protegernos para descubrir el poder que se esconde en los datos, y 1,5
contra formas de rastreo en la web. Asimismo, algunos millones de administradores y analistas con la capacidad de
agentes de datos han creado pginas web donde los comprender y tomar decisiones sobre la base del anlisis
consumidores pueden ver los tipos de informacin que se de la economa de los datos.69
recopilaron sobre ellos, elegir que ya no se recopilen sus
datos y corregir informacin errnea.66 En conjunto, estas
herramientas permiten que los consumidores controlen
mejor la forma en que se recopila y utiliza su informacin, u
optar por no ser parte de determinados usos de marketing. 19
E N B R A S I L , uno de los mayores productores

de soja BRASIL
est invirtiendo en software y en el poder de
las herramientas de anlisis de datos para
incrementar la eficiencia de las tcnicas de
control de dao, reducir costos e impulsar las
tcnicas de cosecha.

El salario bsico medio de 2014 para un cientfico de MITO


datos de plantilla es de $120.000 y de $160.000 para un La innovacin de los datos es solo para las
administrador.70 Muchos han sugerido que para capturar
grandes empresas y no para los pequeos
plenamente el poder de la innovacin impulsada por los
datos, las empresas y los legisladores de todo el mundo negocios.
deben tomar medidas para superar la gran escasez de
talentos. REALIDAD
Gracias a que los datos estn cada vez ms extendidos,
los costos de almacenamiento estn cayendo y las
MITO herramientas de anlisis se estn tornando ms poderosas
y rentables, en este momento incluso las empresas
El anlisis de datos implica la eliminacin del
ms pequeas pueden sacar provecho de los anlisis
criterio humano del proceso. avanzados de datos herramientas que alguna vez
estuvieron a disposicin de las empresas ms grandes
REALIDAD nicamente. Por ejemplo, la funcin Trends incluida en
Si bien algunas preguntas se pueden responder con QuickBooks Online de Intuit permite que los negocios
los datos (por ejemplo, la poblacin de mi ciudad est pequeos se beneficien a partir de la sabidura colectiva
creciendo o disminuyendo?), muchas de las repuestas ms de otros usuarios de Intuit esto permite que los negocios
penetrantes no son tan claras. Es posible que uno no sepa pequeos comparen sus ingresos y gastos para destacar
siempre cmo se relacionan entre s los diferentes datos oportunidades. Les permite tomar decisiones ms
individuales. Y como tal vez uno no sepa anticipadamente inteligentes acerca de la forma en que desarrollan sus
cul es la pregunta correcta, los anlisis de datos son, actividades. Si bien el uso de las soluciones de inteligencia
a menudo, un proceso reiterativo de formulacin de empresarial y de anlisis no se ha generalizado entre los
preguntas sucesivas para encontrar finalmente la respuesta. emprendimientos de pequeo y mediano tamao, se prev
Por estos motivos, nunca podremos suprimir el criterio y el que su adopcin crezca rpidamente.71 Un estudio reciente
aporte humanos para conciliar las diferencias y revisar las revel que los anlisis de datos son importantes para el
posibles incongruencias. 60 por ciento de las empresas pequeas.72 Esto incluye
Los datos solos no son una panacea, y no pueden hacer al 57 por ciento de las empresas de los EE. UU. con 50
milagros. De hecho, con frecuencia los datos tienen poco empleados o menos y al 62 por ciento de las empresas
valor por s solos. A menudo estn desordenados, son europeas del mismo tamao, segn los encargados senior
desorganizados por naturaleza y no estn prolijamente de tomar decisiones. En las empresas de tamao mediano
estructurados. El esfuerzo empieza al tratar de (las que tienen entre 51 y 500 empleados), el 87 por ciento
comprenderlos y descubrir su importancia. El hecho de de los ejecutivos de los EE. UU. y el 79 por ciento de los
que los datos puedan o no resolver problemas depende de ejecutivos europeos afirman que los anlisis de datos son
la ejecucin efectiva de una estrategia de datos inteligente importantes.
que pueda conducir a soluciones ms rpidas y mejores.
Tambin depende de que se formulen con precisin las
preguntas correctas. Pero si aprovechamos los datos en
las formas adecuadas, podemos ayudar a descubrir las
respuestas a algunos de los desafos ms apremiantes
de la sociedad, ayudar a atizar la fogata de la innovacin
y alimentar una poderosa ronda nueva de empleos
impulsados por la TI y el crecimiento econmico.

BSA.ORG

20
C I E N T F I C O S Q U E E S T U D I A N los patrones

de la malaria KENIA
utilizaron recientemente datos de telfonos celulares
en Kenia para precisar los lugares de concentracin
de casos donde se estaban transmitiendo
enfermedades y, as, guiar al gobierno en sus

esfuerzos de erradicacin.

MITO en ellos. Y cada da se descubren muchas correlaciones y


Los datos benefician nicamente al sector de causalidades interesantes a velocidades cada vez mayores,
y con una creciente importancia. La capacidad de distinguir
la TI y no a otros sectores de la economa.
la diferencia entre una mera correlacin y la causalidad es
uno de los motivos por los que el buen aprovechamiento
REALIDAD
de los datos requiere de cientficos de datos especializados
Los datos se encuentran ahora en el centro de una
que sepan cmo separar una mera correlacin de la
importante transicin tecnolgica que promete transformar
causalidad y eliminar resultados que no pasen la prueba de
y mejorar casi todos los sectores de la economa. De
improbabilidad.
hecho, muchos creen que la innovacin de los datos
tiene la capacidad de mejorar la productividad en todos
los sectores de la economa. Si bien las empresas que
MITO
emplean la toma de decisiones guiada por los datos
informan un aumento de entre un 5 y 6 por ciento en la La innovacin de los datos requiere de un
productividad, si la innovacin de los datos pudiera lograr gran presupuesto.
una mejora de la eficiencia de tan solo el 1 por ciento,
habra efectos considerables en todos los sectores de la REALIDAD
economa generara ahorros de energa y combustible, Sacar provecho de los datos no necesariamente requiere
producira mejores resultados mdicos con menores de grandes presupuestos. A menudo solo se necesitan
costos y aumentara el rendimiento y la vida til de los inversiones menores, y esas inversiones pueden conducir
activos fsicos.73 En la industria de la aviacin comercial, por a considerables ganancias. Por ejemplo, se proyecta que
ejemplo, GE prev que al poder capturar datos en tiempo las organizaciones con un enfoque ms holstico para
real para mejorar la eficiencia de los motores y transportar sus datos producirn algunas de las mayores ganancias
a los pasajeros por rutas ms efectivas, con un aumento de y lograrn enormes dividendos de datos por $1,6
solo el 1 por ciento en el ahorro de combustible se lograra billones aproximadamente en ingresos adicionales, costos
ahorrar $30 mil millones en un perodo de 15 aos.74 menores y una mejor productividad solo en los prximos
cuatro aos.76 De hecho, el uso de conjuntos reducidos
de datos sumados a los datos de los que ya se dispone
MITO puede ser un buen punto de partida. El anlisis de datos
La correlacin implica siempre causalidad. de transacciones financieras de una semana para detectar
fraudes puede arrojar luz sobre tendencias ms fcilmente
REALIDAD que el anlisis de datos histricos de cinco aos. Segn un
Esta bsqueda de las incgnitas desconocidas es anlisis, las empresas que utilizaron anlisis de economa
una de las mayores penetraciones que se puede derivar de datos efectivamente fueron un 26 por ciento ms
de los datos. Sin embargo, a veces las correlaciones lucrativas que sus competidores del sector, generaron un
simplemente no tienen sentido, y no siempre implican 9 por ciento ms de ingresos a travs de sus empleados y
causalidad. Por ejemplo, si bien se observ que el ndice activos fsicos, y gozaron de coeficientes de valoracin de
de delitos violentos y asesinatos sube cuando lo hacen las mercado un 12 por ciento ms altos.77
ventas de helado, es altamente improbable que comprar
helados convierta a las personas en asesinas.75 Aun as,
encontrar relaciones causales entre los datos es uno de
los conocimientos ms valiosos que podemos descubrir

21
E N LO S E M I R ATO S R A B E S U N I D O S , las nuevas
herramientas de datos se estn utilizando para disear el EMIRATOS RABES
UNIDOS
primer edificio de
energa positiva del mundo que produce
ms energa de la que consume.

CONFIABILIDAD DE LOS cotidianas. En algunos casos, podemos beneficiarnos


mucho con las herramientas que nos ayudan a tomar
DATOS decisiones ms rpidas y mejores. Por ejemplo, se estima
que el error humano es responsable del 93 por ciento de
los accidentes automovilsticos, pero los sensores de los
MITO vehculos nuevos que recopilan cantidades gigantes de
Los conocimientos a partir de los datos son datos sobre sus entornos combinados con anlisis en
siempre precisos por s solos. tiempo real y una toma de decisiones automatizada (incluso
sin ser completamente autnoma) podran reducir las
REALIDAD lesiones y muertes relacionadas con los automviles nada
Los conocimientos son precisos solo si los datos menos que en un 50 por ciento.80
subyacentes son precisos, si las herramientas son
inteligentes y si un cientfico de los datos desarrolla el
modelo para evitar resultados sesgados. Por ejemplo, MITO
la innovadora aplicacin de Boston, Street Bump, utiliza Una mayor cantidad de datos equivale
smartphones que incorporan acelermetros y localizacin siempre a mejores datos.
por GPS para ubicar baches a partir de una gran cantidad
de usuarios que informan cada vez que alguien encuentra REALIDAD
un bache en la calle. Sin embargo, si los usuarios de Los conjuntos de datos no siempre necesitan ser ms
smartphones tienden a ser ms jvenes y pudientes, los grandes para ser mejores. De hecho, el tamao puede
datos de la aplicacin podran no capturar con precisin los ser uno de los factores menos importantes. En el caso
datos de los baches de todas las zonas demogrficas de de muchas preguntas y respuestas, incluso cantidades
la ciudad y la respuesta de la ciudad frente a los baches pequeas de datos, si se las analiza con las herramientas
correra el riesgo de estar sesgada. Es por eso que muchas correctas, pueden conducir a observaciones penetrantes.
veces se necesita de la participacin de cientficos de los El desarrollo de estas observaciones depende a menudo
datos para garantizar la relevancia estadstica, y evitar un de la calidad de los datos subyacentes y de la calidad de
sesgo en los resultados de los datos. las herramientas utilizadas para manipularlos. Aun as, a
veces se cree que una mayor cantidad de datos conlleva
un mayor grado de verdad, y que cuanto ms grande sea
MITO el conjunto de datos, ms objetivo ser. En ocasiones, es
Las decisiones tomadas por instinto el acceso a datos simples el que puede tener el efecto ms
normalmente son las decisiones correctas. inmediato; por ejemplo, saber a qu hora cierra una tienda
local, cuntas millas recorri un automvil desde el ltimo
REALIDAD cambio de aceite o cunto costar la factura de telfono
Desde el momento en que nacemos, aprendemos a confiar este mes. De acuerdo con la pregunta formulada, los datos
en nuestra intuicin para tomar decisiones. De hecho, se presentes en pginas web, en hojas de clculo de Excel o
estima que el 19 por ciento de los gerentes mundiales se en bases de datos de Gestin de relaciones con los clientes
describen como referentes intuitivos que se apoyan casi (CRM, por sus siglas en ingls) pueden ser reducidos,
exclusivamente en el instinto y la intuicin.78 Aun as, en la pero tan poderosos para brindar respuestas como los
actualidad los datos pueden ayudarnos a tomar decisiones macrodatos. Lo ms importante es crear datos slidos,
ms informadas, con mayor precisin, velocidad e impacto. almacenarlos de manera segura, tener acceso a ellos y
Segn una encuesta realizada a responsables de TI de poder procesarlos independientemente del tamao, de
una serie de industrias, el 59 por ciento manifest que modo que se puedan utilizar cuando y donde se necesiten
mejorar la calidad de la toma de decisiones es el objetivo para resolver problemas.
principal que impulsa las inversiones en las tecnologas de
los datos.79 No solo beneficia al lugar de trabajo; nosotros
BSA.ORG tambin tomamos decisiones intuitivas en nuestras vidas

22
Los datos
meteorolgicos MARRUECOS
no se utilizan solo para predecir si necesitamos llevar
un paraguas; tambin se pueden usar para predecir el
rendimiento de las cosechas, predecir la probabilidad
de un brote de gripe y estimar cunta capacidad de
desalinizacin se necesita construir en Marruecos.

MITO
Los datos no estructurados son inutilizables.
INNOVACIONES DE LOS
REALIDAD
DATOS DEL SIGLO XXI
Los datos no estructurados pueden ser tiles. De hecho,
algunos de los datos ms poderosos no siempre encajan MITO
bien en las tablas estructuradas de columnas y filas. Los beneficios ms profundos de los datos
Pueden estar estructurados como documentos de texto estn alejados en el futuro.
o radiografas. La clave es transformar los datos a sus
formas ms tiles. Si la empresa promedio de Fortune 1000 REALIDAD
pudiera aumentar la capacidad de uso de sus datos solo Si bien la innovacin de los datos continuar generando
un 10 por ciento, la empresa podra esperar un aumento de beneficios durante dcadas futuras, sus fuertes resultados
ms de $2 mil millones en ingresos.81 ya se pueden ver casi en todo nuestro entorno. Los
terabytes de datos diarios ya se estn empleando para
brindarnos pronsticos del tiempo ms precisos; los datos
MITO de millones de seales de GPS se usan para predecir los
Los datos solo deben utilizarse con el tiempos de viaje en transporte pblico y hacernos llegar
propsito original por el que se recopilaron. ms rpido a nuestro destino; millones de datos mdicos
se estn utilizando para identificar las posibles causas
REALIDAD de la enfermedades; y se estn empleando terabytes de
Las tecnologas en la nube provocaron una reduccin datos financieros para ayudar a prevenir los fraudes con las
drstica en el precio de almacenamiento de los datos, de tarjetas de crdito.
modo que ya no es necesario eliminar los datos despus de De hecho, cuando la Intelligence Unit de The Economist
su uso inicial para que haya ms lugar para datos nuevos. les pidi a los encuestados que describieran el efecto
Como resultado, y a diferencia de otros recursos, los datos que tuvieron los datos en sus organizaciones en los
no se agotan luego de ser utilizados por primera vez. Los ltimos cinco aos, casi el 10 por ciento afirm que haba
datos constituyen un recurso renovable que, a menudo, se cambiado por completo la forma en que llevan adelante los
puede reutilizar combinado con otros conjuntos de datos y negocios.82 El 46 por ciento de los encuestados dijo que
usar muchas veces para generar respuestas a preguntas se haba convertido en un factor importante que impulsa
que no podan preverse al momento de la creacin de los las decisiones comerciales. Las nuevas investigaciones
datos. Por ejemplo, los datos meteorolgicos no se utilizan sugieren que solo en los prximos cuatro aos, el mejor
solo para predecir si necesitamos llevar un paraguas; uso de los datos podra conducir a dividendos de datos
tambin se pueden usar para predecir el rendimiento de equivalentes a $1,6 billones en todo el mundo gracias a
las cosechas, predecir la probabilidad de un brote de gripe que los datos ayudan a descubrir nuevas oportunidades
y estimar cunta capacidad de desalinizacin se necesita y soluciones.83 En una encuesta diferente, al enfocarse
construir en Marruecos. en este ao, el 33 por ciento de los ejecutivos senior de
los Estados Unidos y el 24 por ciento de los ejecutivos
de Europa prevean que un 10 por ciento o ms del
crecimiento de sus empresas estara relacionado con los
anlisis de datos.84 Al mirar los prximos cinco aos, el 58
de los ejecutivos de los EE. UU. y el 43 por ciento de los de
Europa hicieron la misma prediccin.

23
Luego del desastre del tsunami de 2004 en el
sur de Asia, a los pescadores indonesios se les
proporcionaron telfonos celulares. Sus ingresos INDONESIA

subieron un 30 %,
ya que por primera vez en su vida contaban con datos
sobre el verdadero precio de mercado del pescado.

MITO MITO
Se exagera demasiado la importancia de los La era del crecimiento econmico impulsado
datos. por la TI termin, la innovacin de los datos
no puede aumentar la productividad.
REALIDAD
El uso de los datos para resolver los problemas de las REALIDAD
personas difcilmente sea una novedad. Hemos usado La innovacin de la TI y su capacidad para hacer crecer
los datos para tomar mejores decisiones desde el inicio las economas, crear empleos y elevar los niveles de vida
de la civilizacin moderna lo que condujo al uso de en todo el planeta se apoya en su demostrada capacidad
ciclos de barbecho para el cultivo a fin de alimentar ms para aumentar la productividad por ejemplo, increment
gente, tcnicas de navegacin que facilitaron el comercio la productividad entre un 1 y 2 por ciento en la dcada
global y descubrimientos mdicos que evitaron millones del noventa.85 Un destacado economista de Northwestern
de muertes por el clera. Sin embargo, en el pasado, los University afirma que los mayores beneficios de la
datos eran un recurso escaso que resultaba oneroso y innovacin de la TI han quedado a nuestras espaldas.86 Sin
de difcil manipulacin. La diferencia es que hoy los datos embargo, la era de la productividad est sana y salva. De
abundan ms, los costos de almacenamiento bajaron hecho, las empresas que emplean la toma de decisiones
considerablemente y las herramientas para manipularlos guiada por los datos informan un aumento de entre un
son ms poderosas. Como resultado, al enfrentarnos a la 5 y 6 por ciento en la productividad.87 Incluso si esta
aparicin de un conjunto nuevo de desafos, las poderosas oportunidad en desarrollo a partir de los datos aumentara
tecnologas de anlisis de datos pueden ayudarnos a la productividad solo en los EE. UU., por ejemplo, en un
revisar volmenes crecientes de datos a fin de descubrir 1,5 por ciento, en un perodo de 20 aos podra permitir
conocimientos slidos y soluciones inesperadas a algunos ahorrar dinero suficiente para elevar los ingresos nacionales
de nuestros desafos ms apremiantes. promedio en nada menos que un 30 por ciento.88 Si, al
utilizar los datos de manera ms efectiva, podemos lograr
pequeas ganancias en un amplio rango de industrias a
fin de que sean solo un 1 por ciento ms eficientes, los
economistas estiman que pueden sumarse alrededor de
$15 billones al PIB global para el 2030, esto equivale a
incorporar otra economa de los EE. UU.89

BSA.ORG

24
Barcelona est utilizando los datos para
construir una ciudad
ESPAA
ms inteligente,
mejorar los servicios gubernamentales y
brindar soluciones de transporte

ms sostenibles.

LOS BENEFICIOS REALIDAD


La revolucin de los datos y los beneficios que crea
GLOBALES DE LA INNO- constituyen un fenmeno global. Algunos de los beneficios
ms importantes y algunas de las mayores oportunidades
VACIN DE LOS DATOS de los datos se encuentran en los pases en desarrollo,
donde la tecnologa muchas veces qued retrasada.
Segn IDC, en el universo digital, los mercados emergentes
MITO superarn a los mercados establecidos para el 2017 un
En la actualidad, solo los Estados Unidos se crecimiento del 36 al 62 por ciento del universo digital en
benefician a partir de los datos. expansin entre 2012 y 2020.93 De manera similar, una
encuesta de las ONG en los pases en desarrollo revel que
REALIDAD ms del 90 por ciento cree que los anlisis de datos son la
En todo el mundo, los datos ya se estn empleando para herramienta ms importante para lograr percepciones ms
resolver desafos importantes. Por ejemplo: profundas a fin de ayudar a sus beneficiarios finales.94
+ Mediante el seguimiento de ms de 1000 datos por Abundan los ejemplos de innovacin de los datos en los
segundo, los cientficos canadienses descubrieron que pases en desarrollo:
los bebs prematuros con signos vitales atpicamente
+ Los cientficos que estudian los patrones de la infeccin
estables tenan un mayor riesgo de presentar fiebre
de la malaria utilizaron recientemente datos de telfonos
esto permiti que los mdicos tomaran medidas con
celulares en Kenia para precisar los lugares de
antelacin y salvaran vidas.
concentracin de casos donde se estaba transmitiendo
+ En Brasil, uno de los mayores productores de soja est la enfermedad, y as guiar al gobierno en sus esfuerzos
invirtiendo en software y en el poder de las herramientas de erradicacin.95
de anlisis de datos para incrementar la eficiencia
+ Luego del desastre del tsunami de 2004 en el sur de
de las tcnicas de control de dao, reducir costos e
Asia, a los pescadores indonesios se les proporcionaron
incrementar la productividad de la cosecha.
telfonos celulares. Sus ingresos subieron un 30 por
+ Barcelona est utilizando los datos para construir ciento, ya que por primera vez en su vida contaban con
una ciudad ms inteligente, mejorar los servicios datos sobre el precio de mercado del pescado.96
gubernamentales y brindar soluciones de transporte
+ En Per, los sitios histricos se encuentran bajo
ms sostenibles.90
amenaza por el desarrollo. Mediante tecnologas areas
+ En los Emiratos rabes Unidos, las nuevas herramientas y un poderoso software que une las imgenes, Per
de datos se estn utilizando para disear el primer cre nubes de datos tridimensionales detallados para
edificio de energa positiva del mundo que produce ms cartografiar, supervisar y salvaguardar sus tesoros en
energa de la que consume.91 peligro.97
+ Los agricultores de la India estn utilizando datos de + Vietnam est utilizando escners 3D a fin de preservar
semillas, satlites, sensores y tractores para tomar su herencia cultural, y se fij el objetivo de digitalizar
mejores decisiones acerca de qu cultivar, cmo 40.000 utensilios histricos en los prximos cinco
cultivarlo, cmo hacer un seguimiento de la frescura de aos.98
los alimentos de la granja a la mesa y cmo adaptarse a
+ En la India, los centros de conexin a Internet permiten
los cambios en el clima.92
que ms de 4 millones de granjeros tengan acceso a
los precios de cultivo, datos del clima y otros tipos de
informacin en los idiomas locales. Utilizan anlisis de
MITO
datos avanzados y tecnologas mviles para seguir
Los pases en desarrollo no estn listos an datos de granjas particulares y, despus del anlisis, les
para sacar provecho de los anlisis de datos. pueden ofrecer suministros a los granjeros de acuerdo
con sus necesidades, como fertilizantes y semillas.99
25
PA R A P R E S E R VA R S U H E R E N C I A C U LT U R A L ,
Vietnam est utilizando escneres
3D a fin de digitalizar VIETNAM

40.000
objetos histricos
en los prximos cinco aos.

LA FUNCIN DEL GOBIER- MITO


Los gobiernos no tienen ningn papel que
NO EN LA REGULACIN cumplir.

DE LOS DATOS REALIDAD


Con el enorme crecimiento del poder de la informtica
remota, del almacenamiento, de los anlisis y de los
MITO
servicios de software, surgi una serie de cuestiones
Los datos se utilizarn como una herramienta normativas nuevas. La mayora de los tratados, leyes y
de exclusin a partir de la capacidad de regulaciones no prevean estas posibilidades cuando se
reforzar los obstculos que enfrentan las redactaron. Esta ambigedad puede ser problemtica para
comunidades desfavorecidas y de bajos los gobiernos y el crecimiento de la economa de los datos.
ingresos. Las cuestiones normativas tradicionales, como el equilibrio
entre la privacidad y la seguridad, el libre flujo del comercio,
REALIDAD las investigaciones bsicas y el desarrollo de la fuerza
Un desafo que debera ser una de las principales laboral deben considerarse como si fueran nuevas, ya que
prioridades tanto para la industria como para el gobierno el crecimiento de estas tecnologas ha tenido una explosin.
es calmar la preocupacin de que se usen los datos de Hay varias medidas concretas que los legisladores
manera injusta respecto de algunas personas o clases de pueden adoptar para ayudar a capturar todo el poder de
personas. Al mismo tiempo, hay oportunidades que no la revolucin de los datos y acelerar las nuevas olas de
deben pasarse por alto a la hora de usar los datos para productividad, el crecimiento econmico y los beneficios
combatir la discriminacin injusta y darles poder a los para el consumidor que se encuentran apenas sobre el
grupos. De hecho, si se usan de manera responsable, los horizonte. Pueden invertir en el avance de las soluciones de
datos pueden ser una poderosa herramienta nueva para datos que aborden algunos de los desafos ms grandes de
dejar al descubierto los actos de discriminacin actuales la sociedad como mejorar la forma en que aprendemos,
que afectan el acceso a los empleos, las finanzas, la producimos alimentos, vivimos nuestras vidas, viajamos de
educacin y las oportunidades.100 un lugar a otro y hacemos crecer las economas. Pueden
establecer reglas claras para la colaboracin internacional
en cuanto a la aplicacin de las leyes. Pueden promover
las libertades de mercado que afectan la capacidad propia
de las industrias de la tecnologa para invertir, innovar,
realizar transacciones comerciales y crecer. Pueden
ayudar a promover el libre flujo de los datos sin lmites
fsicos. Pueden ayudar a garantizar una fuerza de trabajo
talentosa y superar la gran falta de cientficos de datos
especializados. Y pueden ayudar a atizar la fogata de la
innovacin para acelerar los beneficios de los datos tanto
para los negocios como para los consumidores. Con
polticas pragmticas que exploten el talento y la tenacidad
de las personas; aprovechen la innovacin y la inversin;
y expandan la capacidad y los recursos; los legisladores
pueden ayudar a maximizar los beneficios que esta
economa centrada en los datos puede producir.

BSA.ORG

26
E N P E R , LO S S I T I O S H I S T R I C O S
SE ENCUENTRAN BAJO AMENA Z A
P O R E L D E S A R R O L LO. PER
Mediante tecnologas areas y un poderoso software que
une las imgenes, Per cre detalladas nubes de datos

tridimensionales
para cartografiar, supervisar y salvaguardar sus
tesoros en peligro.

MITO MITO
La localizacin de los datos ayuda a proteger La nica forma de que los datos puedan estar
la privacidad y mejora la seguridad. protegidos es que los gobiernos intervengan
para exigir su proteccin.
REALIDAD
Algunas personas creen que la localizacin de los datos REALIDAD
que requiere que los datos se almacenen dentro de los Las normas gubernamentales actuales en materia de
lmites de las fronteras de un pas determinado puede privacidad se pueden combinar con avances rigurosos e
mejorar la privacidad y la seguridad. Sin embargo, los innovadores en la privacidad y buenas prcticas voluntarias
beneficios tecnolgicos actuales son facilitados por la de la industria para garantizar que los datos estn seguros
fuerza global que es Internet, y alimentados por los datos y que se proteja la informacin personal. Por el contrario,
que se entrecruzan en todo el planeta entre centros de las rdenes gubernamentales que intentan abordar la
datos dispares. El trfico de Internet que cruza las fronteras privacidad y la seguridad mediante la exigencia de que los
aument ms del 50 por ciento desde 2005.101 Permitir que datos se almacenen localmente podran inhibir la innovacin
los datos fluyan libremente por las fronteras est dando y limitar los tipos de beneficios sociales que la innovacin
lugar a que incluso las empresas y los emprendimientos de los datos puede producir.
ms pequeos sean la tienda de la esquina para el planeta
entero a medida que empiezan a atravesar las fronteras
para vender y adquirir productos, servicios e ideas. No
obstante, los gobiernos de todo el mundo a menudo
analizan polticas que restringen el libre flujo de datos o
exigen que los servidores de datos se encuentren dentro
de sus jurisdicciones como condicin para prestar servicios
al mercado.102 Estas restricciones socavan la enorme
eficiencia de escala y los beneficios econmicos que
pueden surgir de la innovacin de los datos, y la capacidad
de combinar diferentes conjuntos de datos de diversos
lugares para descubrir conocimientos beneficiosos a
partir de la creciente abundancia de datos. Puede socavar
tambin la seguridad al evitar que se hagan copias de
datos valiosos en varios lugares para protegerlos en caso
de un desastre natural o un desperfecto tcnico. Para
lograr los beneficios que los datos pueden brindar, no es
necesario que las leyes de cada pas sean idnticas, pero
s compatibles. Permitir que los datos crucen las fronteras
libremente es uno de los principios fundamentales para
habilitar los beneficios impulsados por los datos.

27
DISCURSO DIGITAL

COMPRENSIN DEL LENGUAJE


DE LOS DATOS
ABUNDANCIA DE DATOS ANLISIS DE LA CAUSA PRINCIPAL
Alguna vez fueron escasos, pero en la actualidad es posible El anlisis de la causa principal es un mtodo de resolucin
que abunden los datos gracias a la creciente capacidad de de problemas que enfoca la mirada en la relacin entre la
recopilar formas coherentes de datos digitales de maneras causa y el efecto para identificar la causa principal de una
completamente nuevas, en combinacin con la cada en falla o problema. La causa es una causa principal si, una
los costos de almacenamiento de los datos y las nuevas vez retirada de una secuencia de eventos, evita que un
formas de crear valor a partir de ellos. evento no deseado se repita.

ACUMULACIN DE DATOS ANLISIS DE REGRESIN


La acumulacin de datos es el acto de recopilar datos de El anlisis de regresin es un proceso estadstico para
varias fuentes con el objetivo de proporcionar un anlisis de utilizar datos a fin de calcular la relacin entre dos o ms
nivel superior. variables.

ALGORITMO ANLISIS DE RIESGOS


Un algoritmo es un procedimiento paso por paso o una Un anlisis de riesgos es el uso de herramientas
serie de instrucciones informticas que utiliza la matemtica informticas de anlisis de datos para identificar los riesgos
para analizar datos con el objeto de resolver problemas. probables de un proyecto, una accin o una decisin. Las
Los algoritmos se utilizan prcticamente en todos los nuevas herramientas de datos pueden ayudar a identificar
programas de software. posibles riesgos con anticipacin, moldear mejor una serie
de escenarios para reducir los riesgos que enfrentan las
organizaciones y controlar los sistemas para identificar
ANLISIS
problemas si algo empieza a desviarse de su curso normal.
Los anlisis son el uso simultneo de estadsticas y
algoritmos basados en software para descubrir ideas,
patrones y conexiones coherentes dentro de los datos. ANLISIS POR AGRUPACIN EN
CLSTERES
ANLISIS DE DATOS El anlisis por agrupacin en clsteres es el proceso de
El anlisis de datos es la aplicacin de software como identificacin de datos que son similares entre s y su
una forma de transformar los datos y darles forma a fin agrupacin en clsteres para poder comprender mejor las
de derivar informacin til, conocimientos o significado diferencias y las similitudes entre los datos.
de ellos. Se utiliza con frecuencia para descubrir patrones
escondidos o correlaciones desconocidas, y como una ANLISIS PREDICTIVOS
ayuda para la toma de decisiones. Los anlisis predictivos implican el uso de algoritmos de
software en uno o ms conjuntos de datos para predecir
tendencias o eventos futuros. Cuando los datos del
presente se pueden comparar con los del pasado, con
BSA.ORG frecuencia, es posible emplearlos para predecir el futuro.

28
ANALISTA DE DATOS BRONTOBYTE
Un analista de datos es alguien responsable de preparar, Un brontobyte es un trmino de medicin no oficial que
limpiar y procesar los datos. corresponde a una cantidad extraordinariamente enorme
de datos. Generalmente, se considera que un brontobyte es
una unidad equivalente a 1000 yottabytes y se representa
ANLISIS DE TEXTO
con un 1 seguido de 27 ceros.
El anlisis de texto es el uso de tcnicas estadsticas,
lingsticas y de aprendizaje automtico con datos basados
en texto para derivar significados, extraer conceptos CALIDAD DE LOS DATOS
o descubrir conocimientos. En general, los anlisis de La calidad de los datos es una mtrica que se utiliza para
texto se realizan con textos en lenguaje natural incluidos definir el valor de los datos para el usuario. Hace referencia
en documentos, transcripciones, publicaciones web, a la fiabilidad, eficiencia y mrito de los datos en la toma de
comentarios o formularios. Pueden ser de utilidad para el decisiones, la planificacin y las operaciones.
resumen, el descubrimiento o la clasificacin de contenido.
CAMBIOS DISRUPTIVOS
ANONIMIZACIN Los cambios disruptivos son los cambios grandes y
La anonimizacin de los datos implica eliminar toda la fundamentales en la sociedad y los negocios, a menudo
informacin de identificacin personal que pudiera conducir facilitados por tecnologas nuevas y transformadoras
a la identidad de una persona. que establecen todo un contexto nuevo para la forma en
que trabajamos, vivimos, jugamos y creamos valor. La
innovacin de los datos se describe a menudo como una
APRENDIZAJE AUTOMTICO
tecnologa que posibilita cambios disruptivos.
El aprendizaje automtico es el uso de algoritmos para
permitir que una computadora analice datos con el objetivo
de aprender a partir de la experiencia las acciones que CENTRO DE DATOS
debe tomar cuando se produce un determinado patrn o Un centro de datos es un lugar fsico que alberga una
evento. gran cantidad de servidores en red y repositorios de
almacenamiento de datos; normalmente, se utiliza para
el almacenamiento y procesamiento remotos de grandes
ARQUITECTURA Y DISEO DE DATOS
cantidades de datos a los que se puede acceder de
La arquitectura de los datos se realiza, en general, durante
manera remota. Se estima que hay medio milln de centros
la etapa de planificacin de un nuevo sistema para disear
de datos en todo el mundo, muchos de ellos conforman la
y estructurar la forma en que los datos se procesarn,
nube.
almacenarn y utilizarn, y cmo se acceder a ellos.
Al definir desde el inicio cmo se relacionarn entre s
y pondrn en movimiento datos especficos, es posible CIENCIA DE LOS DATOS
disear la manera en que los datos fluirn, as como La ciencia de los datos es una disciplina que incorpora
controlar el flujo de datos para garantizar su proteccin en estadsticas, visualizacin de los datos, programacin
todo el sistema. informtica, minera de datos, aprendizaje automtico e
ingeniera de bases de datos para extraer conocimientos
coherentes que puedan resolver problemas complejos.
BASE DE DATOS
Una base de datos es un conjunto grande y estructurado
de datos digitales organizados de manera tal que se CIENTFICO DE LOS DATOS
permita una bsqueda, acceso y actualizacin rpidos de Un cientfico de los datos es alguien que puede combinar
los datos que contiene. el conocimiento humano, el know-how matemtico y las
herramientas tecnolgicas para extraer significado de
los datos; por ejemplo, al desarrollar y utilizar algoritmos
informticos.

29
CONJUNTO DE DATOS DATOS NO ESTRUCTURADOS
Un conjunto de datos es un grupo de conjuntos Los datos no estructurados no tienen una estructura
relacionados de informacin, normalmente elementos predefinida por ejemplo, las notas de una reunin. Segn
independientes, en forma tabular que se puede manipular algunos clculos, la informacin no estructurada podra
como una unidad. representar ms del 70 al 80 por ciento de todos los datos
de una organizacin.
DATOS
Los datos son informacin sin procesar ni organizar DATOS OSCUROS
que se pueden manipular digitalmente para representar Los datos oscuros consisten en datos no estructurados
condiciones, objetos o ideas. Los tipos comunes de datos y sin explotar que se almacenan sin que se los analice ni
incluyen cifras de venta, resultados de investigaciones de procese, y se cree que, de alguna manera, se los descuida
marketing, lectura de sensores meteorolgicos, o una lista o no se los utiliza bien.
de ciudades y sus poblaciones. Actualmente, generamos
una cantidad estimada de 2,5 cuatrillones de bytes de
DATOS REDUCIDOS
datos por da.
Los datos reducidos implican aprovechar incluso
cantidades reducidas de datos, como los que se
DATOS EN TIEMPO REAL encuentran en una encuesta al cliente, para lograr
Los datos en tiempo real son datos que se manipulan a resultados utilizables. En general, se refieren a tamaos
medida que se crean. Normalmente se crean, procesan, de datos tan reducidos que un ser humano puede
almacenan y analizan en milisegundos. Los datos en tiempo comprenderlos y analizarlos.
real pueden incluir de todo, desde los precios de la bolsa
hasta la velocidad de una rueda cuando se utiliza en un
DATOS SEMIESTRUCTURADOS
sistema de frenos antibloqueo.
Los datos semiestructurados no estn estructurados por
un modelo de datos formal, como los que se utilizan en
DATOS ESTRUCTURADOS las bases de datos, pero proporcionan otros medios para
Los datos estructurados estn sumamente organizados y, describir los datos y las jerarquas. A menudo, los datos
en general, dispuestos en filas y columnas que facilitan su semiestructurados utilizan etiquetas u otros marcadores de
bsqueda y manipulacin. datos en lo que a veces se conoce como una estructura
autodescriptiva.
DATOS GENERADOS POR COMPUTADORA
Los datos generados por computadora hacen referencia DATOS TRANSACCIONALES
a datos que una computadora produce de manera Los datos transaccionales son datos derivados de
automtica sin la intervencin de los seres humanos actividades especficas, como compras financieras,
como un archivo de registro de una computadora, datos de facturas, pagos y datos de envo. Generalmente incluyen
telemetra de un satlite o datos de una mquina industrial. una marca de tiempo y brindan soporte para las
operaciones diarias de una organizacin.
DATOS INCORRECTOS
Son datos incorrectos o faltantes. Puede tratarse de algo DESIDENTIFICACIN
tan simple como una direccin de calle incorrecta, pero los La desidentificacin de los datos es el proceso de
datos incorrectos les cuentan miles de millones de dlares eliminacin de la informacin que vincula a una persona
a las empresas de Fortune 1000 cada ao. con un dato particular.

BSA.ORG

30
DETECCIN DE ANOMALAS INFORMTICA COGNITIVA
La deteccin de anomalas es la identificacin de datos La informtica cognitiva es el proceso mediante el que se
individuales dentro de un conjunto de datos que no combinan grandes cantidades de informacin con tcnicas
coinciden con un patrn esperado. Las anomalas se de aprendizaje automtico, tecnologas de reconocimiento
denominan tambin valores atpicos, excepciones o de patrones y, a veces, el procesamiento del lenguaje
contaminantes en los datos y, con frecuencia, brindan natural para imitar la forma en que funciona el cerebro. Con
informacin crtica y til. frecuencia, estos sistemas pueden aprender e interactuar
con las personas al combinar fuentes de informacin con el
contexto y el conocimiento.
DETECCIN DE DATOS ATPICOS
Un dato atpico es un dato que se desva de manera
significativa del promedio general dentro de un conjunto INTELIGENCIA ADAPTATIVA
de datos ms amplio. Es numricamente lejano al resto de La inteligencia adaptativa es la inteligencia computacional
los datos; por lo tanto, el valor atpico indica que algo est que no solo implica el procesamiento estadstico de los
sucediendo y, por lo general, requiere un anlisis adicional. datos, sino que lo combina con datos que contienen
(Ver tambin la Deteccin de anomalas.) inteligencia de dominios especficos. Al combinar modelos
de comportamiento inteligente con conocimientos expertos,
los sistemas pueden aprender mejor a partir de los
EXABYTE
ejemplos y adaptarse a situaciones nuevas.
Un exabyte es una unidad de almacenamiento de datos
enorme un 1 seguido de 18 ceros. Para ponerla en
contexto, hoy en da creamos un exabyte de informacin INTELIGENCIA AMBIENTAL
nueva a diario. La inteligencia ambiental representa la visin de que la
tecnologa ser cada vez ms invisible y pasar ms
inadvertida a medida que la creciente cantidad de
FUENTE DE DATOS
informtica extendida y de bajo costo se arraigue en el
Una fuente de datos es el lugar principal de donde
mundo que nos rodea. La inteligencia ambiental estara
provienen los datos, por ejemplo, de una base de datos,
a nuestra disposicin cada vez que la necesitemos, ya
una hoja de clculo o un flujo de datos.
que, literalmente, todo estar conectado, ser inteligente y
tendr un buen nivel de respuesta.
HADOOP
Hadoop es un marco de software de origen abierto que se
INTELIGENCIA EMPRESARIAL (BUSINESS
cre para permitir el procesamiento y almacenamiento de
cantidades gigantes de datos entre sistemas de archivos INTELLIGENCE, BI)
distribuidos. La inteligencia empresarial hace referencia al conjunto de
tecnologas y aplicaciones que transforman los datos sin
procesar en conocimientos operativos que pueden mejorar
HERRAMIENTAS DE ACUMULACIN DE el desempeo comercial y la toma de decisiones.
DATOS
Las herramientas de acumulacin de datos transforman los
datos esparcidos de mltiples fuentes en un conjunto nuevo
y nico de datos.

31
INTERNET DE LAS COSAS MODELADO DE PREDICCIN
La Internet de las cosas describe un mundo donde los El modelado de prediccin es el proceso de desarrollo de
dispositivos ordinarios se tornan mucho ms inteligentes, un modelo que, muy probablemente, predir una tendencia,
y se conectan a Internet para extender la revolucin comportamiento futuro o resultado a menudo, mediante
inteligente desde la palma de la mano hacia el mundo que la comparacin de eventos actuales con eventos del
nos rodea. Como todas las cosas que se puedan conectar, pasado.
se conectan, algunos la describen ms acertadamente
como la Internet de todas las cosas. Segn un clculo
MOTOR DE RECOMENDACIONES
aproximativo, solo hemos conectado cerca de un 1 por
Un motor de recomendaciones es un algoritmo informtico
ciento de las cosas que se pueden conectar a escala
que realiza recomendaciones y sugerencias o puede
mundial. Para el 2020, se estima que 50 mil millones de
personalizar algo para el usuario sobre la base de una
dispositivos estarn conectados a Internet.
variedad de patrones de datos que frecuentemente se
derivan mediante tcnicas de aprendizaje automtico.
LIMPIEZA DE DATOS
La limpieza de datos es el proceso de examinacin
NUBE
y revisin de los datos sin procesar para encontrar y
La nube es un trmino amplio que se refiere a cualquier
eliminar datos duplicados, corregir errores, incorporar
aplicacin, servicio o dato hospedados de manera remota.
datos faltantes, eliminar datos daados y brindar mayor
En general, su existencia es posible gracias a grupos
coherencia.
grandes de servidores remotos en red que permiten un
acceso extendido y a peticin a los recursos informticos o
LIMPIEZA DE LOS DATOS de almacenamiento.
La limpieza de los datos es el proceso de deteccin y
correccin o eliminacin de datos errneos, incompletos o
PETABYTE
duplicados de una base de datos.
Un petabyte es una medida enorme de capacidad de
almacenamiento que se representa con un 1 seguido
MACRODATOS de 15 ceros, o un milln de gigabytes. Un petabyte es,
Se trata de un trmino abarcador que, con frecuencia, se aproximadamente, cuatro veces la cantidad de datos que
refiere al proceso de aplicacin de anlisis informticos contiene la Biblioteca del Congreso.
a cantidades inmensas de datos a fin de descubrir
conocimientos nuevos y mejorar la toma de decisiones. A
RECONOCIMIENTO DE PATRONES
menudo, describe conjuntos de datos con un volumen tan
El reconocimiento de patrones es el proceso de bsqueda
grande, de una naturaleza tan variada y que se mueven a
e identificacin de patrones en los datos. Puede ser una
una velocidad tan rpida que es difcil procesarlos mediante
tarea simple, como identificar un conjunto de secuencias
las herramientas de procesamiento de datos tradicionales.
que se repite dentro de una secuencia de ADN; puede
tratarse de encontrar un patrn en la forma en que dos
METADATOS conjuntos de datos interactan para descubrir si hay un
Los metadatos son datos sobre datos. Pueden incluir patrn que conecte un evento con otro; o, con la ayuda del
informacin de resumen bsica acerca de los datos, como aprendizaje automtico, puede tratarse de buscar patrones
su autor, la fecha de creacin, el tamao del archivo y la ms complejos, como encontrar caracteres numricos en
ltima fecha de modificacin. una foto.

MINERA DE DATOS
La minera de datos es el proceso mediante el cual se
utilizan algoritmos informticos poderosos para encontrar
BSA.ORG patrones o conocimientos en conjuntos grandes de datos.

32
SEGURIDAD DE LOS DATOS VELOCIDAD
La seguridad de los datos es la prctica de proteger los La velocidad, una de las cuatro V que definen la
datos de la destruccin, el uso incorrecto o el acceso innovacin de los datos, es la rapidez con que se crean,
no autorizado. Las medidas adecuadas de seguridad de almacenan, analizan y visualizan los datos. Por ejemplo,
los datos pueden ayudar a prevenir violaciones de los los grandes depsitos de datos pueden recibir miles de
datos, garantizar la integridad de los datos y proteger la millones de filas de informacin nueva por da. Los datos
privacidad. Con frecuencia, implica un enfoque combinado que dependen del tiempo deben utilizarse a medida que se
en la gente, los procesos y la tecnologa. transmiten para que se maximice su valor.

SISTEMA HEREDADO VERACIDAD


Un sistema heredado es cualquier computadora, aplicacin La veracidad, una de las cuatro V que definen la
o tecnologa que pas de moda o es obsoleta, pero se innovacin de los datos, se refiere a la exactitud, certeza y
sigue usando porque realiza una funcin necesaria de precisin de los datos.
manera adecuada.
VIRTUALIZACIN DE LOS DATOS
TERABYTE La virtualizacin de los datos es el proceso para recuperar y
Un terabyte es una medida de datos representada por un manipular diferentes fuentes de datos sin tener que conocer
1 seguido de 12 ceros. Ahora es comn encontrar discos detalles tcnicos sobre el lugar donde se encuentran ni
duros de terabytes en equipos domsticos y laborales, o cmo estn formateados.
acceder a ellos mediante la nube. Para ponerlo en contexto,
un terabyte puede almacenar alrededor de 300 horas de
VISUALIZACIN DE LOS DATOS
video de alta definicin.
La visualizacin de los datos implica crear una
representacin visual de los datos a fin de derivar
TOMA DE DECISIONES GUIADA POR DATOS significado o comunicar informacin de manera ms
Las empresas que utilizan la toma de decisiones guiada efectiva.
por los datos recopilan, procesan y analizan los datos
para respaldar decisiones crticas. Una investigacin de
VOLUMEN
Eric Brynjolfsson, un economista de la Sloan School of
El volumen, una de las cuatro V que definen la innovacin
Management, Massachusetts Institute of Technology,
de los datos, se refiere a la cantidad de datos procesados
muestra que las empresas que utilizan la toma de
que va de los megabytes a los brontobytes.
decisiones guiada por datos tienen un incremento de entre
el 5 y 6 por ciento en la productividad.
YOTTABYTES
Un yottabyte es una medida muy grande de
VARIEDAD
almacenamiento de datos representada por un 1 seguido
La variedad, una de las cuatro V que definen la innovacin
de 24 ceros. Para ponerlo en contexto, un yottabyte
de los datos, representa los diversos tipos de datos, a
representa la cantidad de datos almacenada en 250
menudo de diferentes fuentes, que se combinan y analizan
billones de DVD.
para producir conocimientos. La variedad de tipos de datos
que se procesan actualmente en las aplicaciones puede
incluir bases de datos textuales, datos de transacciones, ZETTABYTES
datos de transmisin por secuencia, imgenes, audio y Un zettabyte es una medida de almacenamiento
video. representada por un 1 seguido de 21 ceros. Hasta el 2013,
se estimaba que la World Wide Web haba alcanzado los
4 zettabytes. Para el 2016, se proyecta que ms de un
zettabyte de datos atravesar nuestras redes globalmente
de manera diaria.
33
NOTAS FINALES
vuelo mucho ms cmodo. Humphries, Matthew. The
Boeing 787 produces over 500GB of Data during Every
Flight. Geek.com 2013. Web. Gosling, Kevin. E-Enabled
Capabilities of the 787 Dreamliner. Aero Quarterly
2009: 22-24. http://www.boeing.com/commercial/
1
Economist Intelligence Unit. The Deciding Factor: Big
aeromagazine/articles/qtr_01_09/pdfs/AERO_Q109_
Data & Decision Making. Cap Gemini, 2012. Web. Point
article05.pdf
Of View. https://www.capgemini.com/resources/the-
deciding-factor-big-data-decision-making 9
El fabricante de motores de aviones para pasajeros,
GE, afirma que los datos del motor le permiten
2
Un aumento de la productividad del 1 por ciento puede
detectar aspectos como posibles desperfectos
parecer poco, pero, tal como lo expresa Jeff Immelt,
2000 veces ms rpido que antes. Hardy, Quentin.
Director Ejecutivo de GE: tell an oil guy you can use
What Cars Did for Todays World, Data May Do for
software to save him one percent on something, and
Tomorrows. New York Times 2014. B7. Print. http://
that guy will be your friend for life. Evans, Peter C., and
bits.blogs.nytimes.com/2014/08/10/g-e-creates-a-
Marco Annunziata. Pushing the Boundaries of Minds and
data-lake-for-new-industrial-ecosystem/?_php=true&_
Machines. GE, 2012. Web. http://files.gereports.com/
type=blogs&_php=true&_type=blogs&module=BlogPost-
wp-content/uploads/2012/11/ge-industrial-internet-vision-
Title&version=Blog%20Main&contentCollection=Big%20
paper.pdf
Data&action=Click&pgtype=Blogs&region=Body&_r=1&
3
Para el 2020, se estima que 50 mil millones de 10
Henschen, Doug. Bad Winter Weather Meets Big Data
dispositivos estarn conectados a Internet, y esto
Prediction. InformationWeek 2014. Web. http://www.
posibilitar la Internet de las cosas. Evans, Dave. The
informationweek.com/big-data/software-platforms/bad-
Internet Of Things How The Next Evolution Of The Internet
winter-weather-meets-big-data-prediction/d/d-id/1114192
Is Changing Everything. Cisco Internet Business Solutions
Group (IBSG), 2011. Web. White Paper. http://www.cisco. 11
Groenfeldt, Tom. At NYSE, The Data Deluge Overwhelms
com/web/about/ac79/docs/innov/IoT_IBSG_0411FINAL. Traditional Databases. Forbes 2013. Web. http://www.
pdf forbes.com/sites/tomgroenfeldt/2013/02/14/at-nyse-the-
data-deluge-overwhelms-traditional-databases
4
Bringing big data to the enterprise. IBM. http://www-01.
ibm.com/software/data/bigdata/what-is-big-data.html
NYSE Euronext Adapting To Market Changes with Near-
Real-Time Insight into Information. IBM Corporation,
5
Golub, Ben. Enough Data to Fill a Stack of DVDs to the
2013. Print. NYSE Euronext. http://www.ibmbigdatahub.
Moon (and Back). ComputerWorld 2011. Web. http://
com/sites/default/files/document/NYSE-Euronext-
blogs.computerworld.com/18351/a_stack_of_dvds_to_
IMC14787USEN.PDF
the_moon_and_back
12
Mayyasi, Alex. Why UPS Trucks Dont Turn Left.
6
Corry, Will. BIG Data / The Volume Of Business Data
Priceonomics.com 2014. Web. http://priceonomics.com/
Worldwide, Across All Companies, Doubles Every 1.2
why-ups-trucks-dont-turn-left/
Years, According To Estimates. The Marketing Blog
2012. Web. http://www.themarketingblog.co.uk/2012/10/ 13
Cisco Visual Networking Index: Global Mobile Data
big-data-the-volume-of-business-data-worldwide-across- Traffic Forecast Update 20142019 White Paper. Cisco
all-companies-doubles-every-1-2-years-according-to- Visual Networking Index, 2015. Print. http://www.cisco.
estimates/ com/c/en/us/solutions/collateral/service-provider/visual-
networking-index-vni/white_paper_c11-520862.html
7
Digital Imaging in the Cloud. There Magazine 2012:
16. Web. http://www.agfahealthcare.com/he/global/en/ 14
LSST General Public FAQs. LSST.org 2015. http://www.
binaries/THERE_12_tcm541-95647.pdf lsst.org/lsst/faq
8
El 787 utiliza sensores de datos para reducir el uso de 15
Quazi, Ed. Next Generation Sequencing and the Big
combustible y controlar los sistemas e, incluso, emplea Data Bottleneck. Arkivum 2014. Web. http://arkivum.
acelermetros en la parte delantera del avin para com/next-generation-sequencing-and-the-big-data-
contrarrestar las turbulencias. Si los sensores registran bottleneck/
una cada abrupta, le indican de inmediato a los alerones 16
Valerio, Pablo. Internet Of Things: 50 Billion Is Only The
que se ajusten (en nanosegundos) y, al hacer eso, lo que
Beginning. EE Times 2014. Web. http://www.eetimes.
sola ser una cada de 9 pies en un avin ms antiguo se
BSA.ORG com/document.asp?doc_id=1321229
puede reducir a tan solo 3 pies en el 787, para lograr un

34
17
En 1980, la regla general era que se necesitaba un 24
Lohr, Steve. For Big-Data Scientists, Janitor Work
administrador de datos para 1 GB de almacenamiento. Is Key Hurdle To Insights. New York Times. 2014: B4.
En esa poca, un GB de disco costaba alrededor de Print. http://www.nytimes.com/2014/08/18/technology/
un milln de dlares, de modo que era comprensible for-big-data-scientists-hurdle-to-insights-is-janitor-work.
contar con alguien que optimizara y supervisara el uso html?_r=0
del espacio de disco. Gray, Jim, and Prashant Shenoy. 25
Data, data everywhere, The Economist, 25 de febrero
Rules Of Thumb in Data Engineering. Redmond, WA:
del 2010. http://www.economist.com/node/15557443
Microsoft Research Advanced Technology Division, 2009.
Print. Technical Report. http://research.microsoft.com/ 26
Crovitz, L. Gordon. Why Big Data Is A Big Deal. Wall
pubs/68636/ms_tr_99_100_rules_of_thumb_in_data_ Street Journal. 2013. Print. http://online.wsj.com/news/
engineering.pdf articles/SB10001424127887324077704578364632408717
740
18
Wohlsen, Marcus. Dropbox Slashes Its Price As The
Cost Of A Gigabyte Nears Zero. Wired 2014. Web. http:// 27
Los informes de sequas en Angola de 2006
www.wired.com/2014/08/dropboxs-plan-to-stay-relevant/ desencadenaron una advertencia acerca de posibles
brotes de clera en el pas, debido a que eventos previos
19
De ms de $200.000 por gigabyte en 1980 (incluso
le haban enseado al sistema que los brotes de clera
hasta millones de dlares) a $0,02 por gigabyte en 2013.
eran ms probables durante los aos siguientes a las
Meeker, Mary. Kleiner Perkins Internet Trends 2014.
sequas. Las advertencias del sistema fueron correctas
2014. Presentation. http://cryptome.org/2014/05/internet-
entre el 70 y 90 por ciento de los casos. Simonite, Tom.
trends-2014.pdf
Software Predicts Tomorrows News by Analyzing
20
En funcin del nivel de eficiencia promedio en el consumo Todays And Yesterdays. MIT Technology Review 2013.
de combustible de los autos de turismo en 1980 (24,3 Print. http://www.technologyreview.com/news/510191/
mpg), esto permite que una persona compre 10 millones software-predicts-tomorrows-news-by-analyzing-todays-
de veces ms cantidad por el mismo precio; seran 10 and-yesterdays/
millones de galones de combustible, que es la cantidad 28
Ten Big Data Case Studies in a Nutshell. TechTarget,
que se necesitara para 243 millones de millas de viaje.
2013. Print. Essential Guide. http://searchcio.techtarget.
Si la circunferencia de la Tierra es de 24.901 millas, una
com/opinion/Ten-big-data-case-studies-in-a-nutshell
persona podra circular alrededor de la tierra 9758 veces,
o casi 10.000 veces. Departamento de Transporte de los 29
Big Data to Predict Offshore Accidents, Tsunamis and
EE. UU. Table 4-23: Average Fuel Efficiency Of U.S. Light Other Natural Disasters. Predictive Analytics Today. 2013
Duty Vehicles. Washington, DC: Bureau of Transportation Web. http://www.predictiveanalyticstoday.com/big-data-
Statistics, 2013. Print. http://www.rita.dot.gov/bts/sites/ predict-shore-accidents-tsunamis-natural-disasters/
rita.dot.gov.bts/files/publications/national_transportation_ 30
New Developments in Big Data Visualization.
statistics/html/table_04_23.html
USTelecom Media 2014. Web. http://www.ustelecom.org/
21
Savitz, Eric. Big Data: The Hidden Opportunity. blog/new-developments-big-data-visualization#sthash.
Forbes 2012. Web. http://www.forbes.com/sites/ HefD5H52.dpuf
ciocentral/2012/05/01/big-data-the-hidden-opportunity/ 31
Quinn, Tom. New and Unexpected Uses for Scoring
22
La capacidad tecnolgica mundial per cpita para Technology. Credit Score Blog 2011. Web. http://blog.
almacenar informacin se duplic aproximadamente credit.com/2011/06/new-and-unexpected-uses-for-
cada 40 meses desde la dcada del ochenta segn una scoring-technology/
investigacin realizada por Martin Hilbert y Priscila Lpez. 32
Crovitz, L. Gordon. Why Big Data Is A Big Deal. Wall
Hilbert, M., and P. Lopez. The Worlds Technological
Street Journal 2013: Print. http://online.wsj.com/news/
Capacity to Store, Communicate, and Compute
articles/SB10001424127887324077704578364632408717
Information. Science 332.6025 (2011): 60-65. Web. http://
740
www.sciencemag.org/content/332/6025/60
33
Sobrecarga de datos: En la actualidad, un mdico clnico
23
Los costos de almacenamiento han cado de $569
experimentado necesita casi 2 millones de datos para
por gigabyte de almacenamiento en 1992 a $0,02 por
ejercer la medicina, y los doctores se suscriben a un
gigabyte en 2013 a un ndice de alrededor del 38 por
promedio de siete revistas mdicas, lo que representa
ciento anual. Meeker, Mary. Kleiner Perkins Internet
ms de 2500 artculos nuevos al ao; as, resulta casi
Trends 2014. 2014. Presentation. http://cryptome.
imposible mantenerse al corriente de la informacin
org/2014/05/internet-trends-2014.pdf
35
ms actualizada acerca de diagnsticos, pronsticos, 2015. 2012. Print. http://www.gartner.com/newsroom/
tratamientos y cuestiones mdicas afines. Clinical id/2207915
Decisions Support Systems: The Time Has Come. 44
BSA/IPSOS Global Data Analytics Poll, November 2014,
Frost & Sullivan, 2009. Print. Market Insight. http://www.
www.bsa.org/datasurvey
frost.com/prod/servlet/cio/181298788
45
BSA/IPSOS Global Data Analytics Poll, November 2014,
34
Clinical Decisions Support Systems: The Time Has
www.bsa.org/datasurvey
Come. Frost & Sullivan, 2009. Print. Market Insight.
http://www.frost.com/prod/servlet/cio/181298788 46
According to ESG research, data managed per hospital
is expected to increase from 168 terabytes in 2010 to 6
35
Kinect Sign Language Translator Expands
terabytes by 2015. Digital Imaging in the Cloud. There
Communication Possibilities. Microsoft Research 2013.
Magazine 2012: 16. Print. http://www.agfahealthcare.
Web. http://research.microsoft.com/en-us/collaboration/
com/he/global/en/binaries/THERE_12_tcm541-95647.pdf
stories/kinect-sign-language-translator.aspx
47
Manyika, James et al. Big Data: The Next Frontier for
36
Brats 2012 - Multimodal Brain Tumor Segmentation
Innovation, Competition, and Productivity. McKinsey
Challenge. CodaLab, 2012. Print. https://www.codalab.
Global Institute, 2011. Print. http://www.mckinsey.com/
org/competitions/191
insights/business_technology/big_data_the_next_
37
Grady, Denise. 3-D Mammography Test Appears frontier_for_innovation
To Improve Breast Cancer Detection Rate. 48
Los investigadores ensearon un algoritmo de
New York Times 2014: p. A1 Print. http://www.
aprendizaje automtico sobre datos de 133.000
nytimes.com/2014/06/25/health/breast-cancer-
pacientes. El modelo an necesita que se realice ms
3d-mammography-test-x-ray.html?emc=edit_
trabajo para reducir los falsos positivos. Rutkin, Aviva.
th_20140625&nl=todaysheadlines&nlid=435891&_r=0
Machine Predicts Heart Attacks 4 Hours Before Doctors
38
The game-changing technology thats transforming - New Scientist. New Scientist. 2014. Web. http://www.
manufacturing. Manufacturing Weekly, January 31, 2014. newscientist.com/article/mg22329814.400-machine-
http://web.archive.org/web/20140131233544/http://www. predicts-heart-attacks-4-hours-before-doctors.html
manufacturingweekly.com/supercomputers/ 49
El modelo de fusin hbrido moderno de Ford genera
39
The Return on the Data Asset in the Era of Big Data: hasta 25 GB de datos por hora. Hemsoth, Nicole. How
Capturing the $1.6 Trillion Data Dividend. Cloud Platform Ford Is Putting Hadoop Pedal To The Metal. Datanami.
News Bytes Blog 2015. Web. http://blogs.technet.com/b/ 2013. Web. http://www.datanami.com/2013/03/16/how_
stbnewsbytes/archive/2014/04/15/the-return-on-the-data- ford_is_putting_hadoop_pedal_to_the_metal/
asset-in-the-era-of-big-data-capturing-the-1-6-trillion-
El Chevy Volt contiene ms de 10 millones de lneas de
data-dividend.aspx
cdigos de software, y la profesin de desarrollador
40
Economist Intelligence Unit. The Deciding Factor: Big de software es una de las profesiones tcnicas de
Data & Decision Making. Cap Gemini, 2012. Web. Point ms rpido crecimiento al sudeste de Michigan, una
Of View. http://bigdata.pervasive.com/Solutions/Telecom- regin con una larga reputacin por su capacidad de
Analytics.aspx produccin. Trop, Jaclyn. Detroit, Embracing New Auto
Technologies, Seeks App Builders. New York Times.
41
Un aumento de la productividad del 1 por ciento puede
June 30, 2013. http://www.nytimes.com/2013/07/01/
parecer poco, pero, tal como lo expresa Jeff Immelt,
technology/detroit-embracing-new-auto-technologies-
Director Ejecutivo de GE: tell an oil guy you can use
seeks-app-builders.html
software to save him one percent on something, and
that guy will be your friend for life. Evans, Peter C., and 50
Miller, Claire Cain. If Robots Drove, How Much
Marco Annunziata. Pushing the Boundaries of Minds and Safer Would Roads Be? New York Times 2014: A3.
Machines. GE, 2012. Web. http://files.gereports.com/ Print. http://www.nytimes.com/2014/06/10/upshot/
wp-content/uploads/2012/11/ge-industrial-internet-vision- if-robots-drove-how-much-safer-would-roads-be.
paper.pdf html?ref=technology&_r=0
42
BSA/IPSOS Global Data Analytics Poll, November 2014, 51
El 787 utiliza sensores de datos para reducir el uso de
www.bsa.org/datasurvey combustible y controlar los sistemas e, incluso, emplea
acelermetros en la parte delantera del avin para
43
Gartner, Gartner Says Big Data Creates Big Jobs:
BSA.ORG contrarrestar las turbulencias. Si los sensores registran
4.4 Million IT Jobs Globally To Support Big Data By
36
una cada abrupta, le dicen de inmediato a los alerones http://citizentekk.com/2013/11/05/manufacturing-4-0-
que se ajusten (en nanosegundos) y, al hacer eso, lo que industrialisation-data-driven-product-lifecycle/
sola ser una cada de 9 pies en un avin ms antiguo se 58
McKinsey informa que al usar estas tcnicas de
puede reducir a tan solo 3 pies en el 787, para lograr un
diseo habilitadas por los datos, Toyota pudo eliminar
vuelo mucho ms cmodo. Gosling, Kevin. E-Enabled
el 80 por ciento de los defectos antes de construir
Capabilities of the 787 Dreamliner. Aero Quarterly
el primer prototipo fsico. Manyika, James et al. Big
2009: 22-24. http://www.boeing.com/commercial/
Data: The Next Frontier for Innovation, Competition,
aeromagazine/articles/qtr_01_09/pdfs/AERO_Q109_
and Productivity. McKinsey Global Institute, 2011. Print.
article05.pdf
http://www.mckinsey.com/~/media/McKinsey/dotcom/
52
El fabricante de motores de aviones para pasajeros, Insights20and%20pubs/MGI/Research/Technology%20
GE, afirma que los datos del motor le permiten and%20Innovation/Big%20Data/MGI_big_data_full_
detectar aspectos como posibles desperfectos report.ashx
2000 veces ms rpido que antes. Hardy, Quentin. 59
Findings of the New Intelligent Enterprise Study. IBM 2010
What Cars Did for Todays World, Data May Do for
New Intelligent Enterprise Global Executive Study. 2010.
Tomorrows? New York Times 2014: B7. Print. http://
Print.
bits.blogs.nytimes.com/2014/08/10/g-e-creates-a-
data-lake-for-new-industrial-ecosystem/?_php=true&_ 60
Geron, Tomio. Cows in the Cloud: The Hot Startup
type=blogs&_php=true&_type=blogs&module=BlogPost- Moving Farmers into the Cloud. Forbes 2012. Web;
Title&version=Blog%20Main&contentCollection=Big%20 Helmer, Jodi. Get Ready For Robot Farmers. Yahoo
Data&action=Click&pgtype=Blogs&region=Body&_r=1& 2014. Web. https://www.yahoo.com/tech/get-ready-for-
robot-farmers-100613764059.html
53
Long, Jessica, and William Brindley. The Role of Big Data
and Analytics in the Developing World. Accenture, 2013. 61
De-Identification of Personally Identifiable Information,
Print. Accenture Development Partnerships Insights National Institute of Science and Technology, DRAFT
into the Role of Technology in Addressing Development NISTIR 8053 (April 2015).
Challenges. https://www.accenture.com/us-en/~/media/ 62
Cavoukian, Ph.D., Ann, and El Emam, Ph.D., Khaled,
Accenture/Conversion-Assets/DotCom/Documents/
Dispelling the Myths Surrounding De-Identification:
Global/PDF/Strategy_5/Accenture-ADP-Role-Big-Data-
Anonymization Remains a Strong Tool for Protecting
And-Analytics-Developing-World.pdf
Privacy, Information and Privacy Commissioner of
54
El sector de produccin almacen alrededor de 2 Ontario, (June 2011); Cavoukian, Ph.D., Ann, and Daniel
exabytes de datos nuevos solo en 2010. Manyika, Castro Castro. Big Data And Innovation, Setting The
James et al. Big Data: The Next Frontier for Innovation, Record Straight: De-Identification Does Work. ITIF, 2014.
Competition, and Productivity. McKinsey Global Institute, Print. http://www2.itif.org/2014-big-data-deidentification.
2011. Print. http://www.mckinsey.com/~/media/McKinsey/ pdf
dotcom/Insights20and%20pubs/MGI/Research/ 63
See for example, Microsofts add on protecting
Technology%20and%20Innovation/Big%20Data/MGI_
privacy as their priority https://www.youtube.com/
big_data_full_report.ashx
watch?feature=player_embedded&v=bt51MWll1oY
55
Manyika, James et al. Big Data: The Next Frontier for 64
Apple, en Solicitudes de informacin del gobierno,
Innovation, Competition, and Productivity. McKinsey
observa que la empresa ha incorporado cifrado de
Global Institute, 2011. Print. http://www.mckinsey.com/~/
vanguardia en el sistema operativo de su iPhone,
media/McKinsey/dotcom/Insights20and%20pubs/MGI/
de modo que: your personal data such as photos,
Research/Technology%20and%20Innovation/Big%20
messages (including attachments), email, contacts, call
Data/MGI_big_data_full_report.ashx
history, iTunes content, notes, and reminders is placed
56
Data Smart Strategies for Customers Are Yielding under the protection of your passcode, at www.apple.
Early But Impressive Returns. Microsoft Research com/privacy/government-information-requests/
the Fire Hose 2014. Web. http://blogs.microsoft.com/ 65
Hachman, Mark, Microsofts updated privacy policy
firehose/2014/05/22/data-smart-strategies-for-customers-
makes It clear its not selling ads against your words,
are-yielding-early-but-impressive-returns/
PCWorld, June 11, 2014, http://www.pcworld.com/
57
Somers, Dan. Manufacturing 4.0 From Industrialization article/2362130/microsofts-updated-privacy-policy-
to Data-Driven Product Lifecycle. Citizentekk. 2013. Web. makes-it-clear-its-not-selling-ads-against-your-words.
html,
37

Timberg, Craig. Newest Androids Will Join IPhone In 78
Meeting the Big Data Challenge: Dont Be Objective.
Offering Default Encryption, Blocking Police. Washington Forbes 2013. Web. http://www.forbes.com/sites/
Post 2014: Print. http://www.washingtonpost.com/blogs/ darden/2013/02/01/meeting-the-big-data-challenge-dont-
the-switch/wp/2014/09/18/newest-androids-will-join- be-objective/
iphones-in-offering-default-encryption-blocking-police/ 79
IDG Enterprises 2014 Big Data research. IDG. CEOs
66
El agente de datos Acxiom inaugura un sitio web de Call for Big Data and IT Continues To Lead Investment
datos enfocados en el consumidor, ofrece la opcin de Decisions. 2014. Print. http://www.idgenterprise.com/
exclusin: http://cir.ca/news/acxiom-gives-consumers- press/ceos-call-for-big-data-and-it-continues-to-lead-
data-peek investment-decisions
67
BSA/IPSOS Global Data Analytics Poll, November 2014, 80
Miller, Claire Cain. If Robots Drove, How Much
www.bsa.org/datasurvey Safer Would Roads Be? New York Times 2014: A3.
Print. http://www.nytimes.com/2014/06/10/upshot/
68
McKinsey Global Institute. Internet Matters: The Nets
if-robots-drove-how-much-safer-would-roads-be.
Sweeping Impact On Growth, Jobs, And Prosperity.
html?ref=technology&_r=0
McKinsey & Co., 2011. Print.
81
Clemens, Samuel. 7 Facts about Data Quality
69
Manyika, James et al. Big Data: The Next Frontier for
[Infographic]. InsightSquared. January 3, 2012. Web.
Innovation, Competition, and Productivity. McKinsey
http://www.insightsquared.com/2012/01/7-facts-about-
Global Institute, 2011. Print. http://www.mckinsey.com/~/
data-quality-infographic/
media/McKinsey/dotcom/Insights20and%20pubs/MGI/
Research/Technology%20and%20Innovation/Big%20 82
Economist Intelligence Unit. Big Data Harnessing a
Data/MGI_big_data_full_report.ashx Game-Changing Asset. SAS, 2011. Web. http://www.sas.
com/resources/asset/SAS_BigData_final.pdf
70
According to Salaries of Data Scientists, an April 2014
study from Burtch Works. 83
The Return on the Data Asset in the Era of Big Data:
Capturing the $1.6 Trillion Data Dividend. Blog de
71
Bagley, Rebecca. How The Cloud And Big Data Are
noticias de la plataforma en la nube 2015. Web. http://
Changing Small Business. Forbes 2014. Web. http://
blogs.technet.com/b/stbnewsbytes/archive/2014/04/15/
www.forbes.com/sites/rebeccabagley/2014/07/15/how-
the-return-on-the-data-asset-in-the-era-of-big-data-
the-cloud-and-big-data-are-changing-small-business/
capturing-the-1-6-trillion-data-dividend.aspx
72
BSA/IPSOS Global Data Analytics Poll, November 2014, 84
BSA/IPSOS Global Data Analytics Poll, November 2014,
www.bsa.org/datasurvey
www.bsa.org/datasurvey
73
Economist Intelligence Unit. The Deciding Factor: Big 85
Las inversiones en TI en toda la economa de los EE. UU.,
Data & Decision Making. Cap Gemini, 2012. Web. Point
incluidas las ventas minoristas, durante el alto crecimiento
Of View. http://bigdata.pervasive.com/Solutions/Telecom-
de la dcada del noventa le sumaron entre un 1 y 2 por
Analytics.aspx
ciento a la tasa compuesta de crecimiento anual de la
74
Economist Intelligence Unit. The Deciding Factor: Big productividad de los EE. UU. Farrell, Diana et al. How IT
Data & Decision Making. Cap Gemini, 2012. Web. Point Enables Productivity Growth. San Francisco: McKinsey
Of View. http://bigdata.pervasive.com/Solutions/Telecom- Global Institute High Tech Practice, 2002. Print. http://
Analytics.aspx www.mckinsey.com/insights/business_technology/how_
it_enables_productivity_growth
75
Gerbis, Nicholas. 10 Correlations That Are Not
Causations. HowStuffWorks. 2015. Web. http://science. 86
National Bureau of Economic Research. NBER Working
howstuffworks.com/innovation/science-questions/10- Paper No. 18315: Is U.S. Economic Growth Over?
correlations-that-are-not-causations.htm Faltering Innovation Confronts The Six Headwinds. 2012.
Print. http://www.nber.org/papers/w18315
76
Vesset, Dan, Henry D. Morris, and John F. Gantz.
Capturing the $1.6 Trillion Data Dividend. IDC, 2014. Print. 87
Economist Intelligence Unit. The Deciding Factor: Big
IDC White Paper. Data & Decision Making. Cap Gemini, 2012. Web. Point
Of View. http://bigdata.pervasive.com/Solutions/Telecom-
77
Westerman, George, Didier Bonnet, and Andrew McAfee,
Analytics.aspx
The Advantages of Digital Maturity. November 2012, MIT
Sloan.
BSA.ORG

38
88
Gertner, Joey. GE for Making the Internet of Things Global/PDF/Strategy_5/Accenture-ADP-Role-Big-Data-
Real. Fast Company 2014. Web. http://www. And-Analytics-Developing-World.pdf
fastcompany.com/most-innovative-companies/2014/ge 96
Levy, Stephen. Bill Gates and President Bill Clinton on
89
Evans, Peter C., and Marco Annunziata. Pushing the the NSA, Safe Sex, and American Exceptionalism. Wired
Boundaries of Minds and Machines. GE, 2012. Web. 2013: Print. http://www.wired.com/2013/11/bill-gates-bill-
http://files.gereports.com/wp-content/uploads/2012/11/ clinton-wired/2/
ge-industrial-internet-vision-paper.pdf
Chhachhar, Abdul Razaque, and Siti Zobidah Omar. Use
90
City Of Barcelona Realizes Vision of Innovative City of Mobile Phone among Fishermen for Marketingand
Governance with Cloud, Devices, and Apps. Customers. Weather Information. Archives Des Sciences 65.8 (2012):
microsoft.com. 2014. Web. https://customers.microsoft. 107-119. Print. http://www.academia.edu/4592505/Use_
com/Pages/Home.aspx of_Mobile_Phone_among_Fishermen_for_Marketing_
and_weather_information
91
Autodesk the Gallery Masdar Headquarters Positive
Energy Building. Autodesk.com. 2015. Web. http://www. 97
Neuman, William, and Ralph Blumenthal. New to the
autodesk.com/gallery/exhibits/currently-on-display/adrian- Archaeologists Tool Kit: The Drone. New York Times
smith-gordon-gill-architecture-masdar-headquarters 2014. Print. http://mobile.nytimes.com/2014/08/14/
arts/design/drones-are-used-to-patrol-endangered-
92
Bunge, Jacob. Big Data Comes To The Farm, Sowing
archaeological-sites.html?_r=1&referrer
Mistrust. Wall Street Journal 2014. Print. http://online.wsj.
com/news/articles/SB1000142405270230445090457936 98
Forty Thousand Relics to Be Digitized In Five Years.
9283869192124 Thanhnien News. 2010. Web. http://www.thanhniennews.
com/entertainment/forty-thousand-relics-to-be-digitized-

Supply Chain Management Solution for Fast Moving
in-five-years-22816.html
Consumer Goods & Food Industries - Farm to Fork
Tech Mahindra. Techmahindra. 2015. Web. http:// 99
Long, Jessica, and William Brindley. The Role of Big Data
www.techmahindra.com/en-US/wwd/solutions/Pages/ and Analytics in the Developing World. Accenture, 2013.
Enterprises/retail_farm_fork.aspx Print. Accenture Development Partnerships Insights
into the Role of Technology in Addressing Development
93
Entre 2013 y 2020, la divisin del universo digital entre
Challenges. https://www.accenture.com/us-en/~/media/
los mercados establecidos y los emergentes (p. ej.,
Accenture/Conversion-Assets/DotCom/Documents/
China) cambiar de un 60 por ciento representado
Global/PDF/Strategy_5/Accenture-ADP-Role-Big-Data-
por los mercados establecidos a un 60 por ciento
And-Analytics-Developing-World.pdf
de los datos del universo digital proveniente de los
mercados emergentes. EMC Digital Universe. Executive 10
Future of Privacy Forum. Big Data: A Tool for Fighting
Summary Data Growth, Business Opportunities, and the Discrimination and Empowering Groups. Future of Privacy
IT Imperatives. IDC, 2014. Print. http://www.emc.com/ Forum and Anti-Defamation League, 2014. Print. http://
leadership/digital-universe/2014iview/executive-summary. www.futureofprivacy.org/wp-content/uploads/Big-Data-
htm A-Tool-for-Fighting-Discrimination-and-Empowering-
Groups-Report1.pdf
94
Long, Jessica, and William Brindley. The Role of Big Data
and Analytics in the Developing World. Accenture, 2013. 101
Wladawsky-Berger, Irving. The Changing Nature of
Print. Accenture Development Partnerships Insights Globalization in Our Hyperconnected, Knowledge-
into the Role of Technology in Addressing Development Intensive Economy. Wall Street Journal 2014. Print. http://
Challenges. https://www.accenture.com/us-en/~/media/ blogs.wsj.com/cio/2014/06/20/the-changing-nature-
Accenture/Conversion-Assets/DotCom/Documents/ of-globalization-in-our-hyperconnected-knowledge-
Global/PDF/Strategy_5/Accenture-ADP-Role-Big-Data- intensive-economy/?mod=wsj_ciohome_cioreport
And-Analytics-Developing-World.pdf 102
Por ejemplo, Argentina, Australia, Brasil, Canad, Chile,
95
Long, Jessica, and William Brindley. The Role of Big Data China, Colombia, Costa Rica, Grecia, Hong Kong, India,
and Analytics in the Developing World. Accenture, 2013. Indonesia, Corea, Mxico, Per, Rusia, Suiza y Vietnam
Print. Accenture Development Partnerships Insights han adoptado o propuesto normas que prohben o
into the Role of Technology in Addressing Development restringen considerablemente la posibilidad de que las
Challenges. https://www.accenture.com/us-en/~/media/ empresas transfieran informacin personal fuera de sus
Accenture/Conversion-Assets/DotCom/Documents/ territorios domsticos respectivos.

39
ACERCA DE BSA | THE SOFTWARE ALLIANCE

BSA | The Software Alliance (www.bsa.org) es la


principal defensora de la industria del software a escala
mundial ante los gobiernos y el mercado internacional.
Sus miembros se encuentran entre las empresas ms
innovadoras del mundo; las soluciones de software que
crean impulsan la economa y mejoran la vida moderna.
Con su sede central en Washington, DC y operaciones
en ms de 60 pases, BSA es pionera en los programas
de cumplimiento normativo que promueven el uso de
software legtimo y es partidaria de las polticas pblicas
que fomentan la innovacin tecnolgica e impulsan el
crecimiento de la economa digital.

www.bsa.org

BSA Sede Central Mundial BSA Asia-Pacfico BSA Europa, Oriente Medio y frica
20 F Street, NW 300 Beach Road 2 Queen Annes Gate Buildings
Suite 800 #25-08 The Concourse Dartmouth Street
Washington, DC 20001 Singapur 199555 Londres, SW1H 9BP
Reino Unido
T: +1.202.872.5500 T: +65.6292.2072
F: +1.202.872.5501 F: +65.6292.6369 T: +44.207.340.6080
F: +44.207.340.6090