Академический Документы
Профессиональный Документы
Культура Документы
y su impacto en el negocio
Una aproximacin al valor que el anlisis
extremo de datos aporta a las organizaciones
Leopoldo Boado
Country Manager de Oracle Espaa.
Leopoldo Boado
RESUMEN EJECUTIVO
Aplicaciones
Existen mltipes aplicaciones horizontales de Big Data:
motores de recomendaciones; anlisis de sentimientos;
control del riesgo; deteccin del fraude; anlisis de
campaas de marketing, de abandono de clientes,
de influencia social, y de experiencias de cliente;
monitorizacin de la red y aplicacin del anlisis extremo a
los procesos de investigacin y desarrollo.
Por sectores, Big Data influye en una gran variedad de
aplicaciones:
Banca y finanzas: Servicios de proteccin de marca;
proteccin ante riesgos y fraude y servicios personalizados a
clientes.
Sector Pblico: Servicios de inteligencia, defensa y
proteccin (control de comunicaciones, vigilancia,
intercepcin de redes de telefona, acumulacin de todo
tipo de datos); proteccin de la flota pesquera; vigilancia,
seguridad y sealizacin y proyectos de Smart Cities.
Cuestiones tcnicas
Un trmino ntimamente relacionado con Big Data desde
el punto de vista tcnico es Hadoop, un entorno de cdigo
abierto para almacenar y organizar cantidades masivas de
datos distribuidos y no estructurados que, a su vez, estaba
inspirado en MapReduce, una funcin desarrollada por
Google a principios de 2000 para indexar la web.
Hadoop se encuadra como un proyecto de la Apache
Software Foundation, en el que cientos de participantes
mejoran continuamente el ncleo de la tecnologa. Adems,
una nueva generacin de desarrolladores de este entorno
y de Cientficos de datos est empezando a despuntar.
Asimismo, start-ups de ltima generacin empiezan a
perfeccionar bases de datos NoSQL que, combinadas con
Hadoop, son capaces de descubrir patrones prcticamente
en tiempo real.
Sanidad: Monitorizacin remota de pacientes; localizacin
de emergencias y almacenamiento de historias clnicas,
radiografas, escneres y todo tipo de pruebas de forma
centralizada.
Retail-Gran Consumo: Control de la cadena de
fabricacin; anlisis del ticket de compra; marketing
personalizado y RFID (Identificacin por Radio Frecuencia)
en centros comerciales.
Turismo: Optimizacin de precios y generacin de ofertas
personalizadas.
Telecomunicaciones: control de la red; venta de servicios
de localizacin; servicios de publicidad asociados al patrn
de llamadas o las aplicaciones descargadas; obtencin
de perfiles enriquecidos de consumidor enriquecidos y
explotacin de RFID para segmentar y personalizar ofertas
anlisis de abandono.
Utilities: Interpretacin de contadores inteligentes en todas
las casas; control de la red comunicaciones, de tuberas,
red del metro y proyectos de sealizacin de tramos de
mantenimiento
Web y Digital Media: Anlisis de click and stream;
personalizacin y forecasting y optimizacin
Estructurado-no estructurado
Hay datos que conforman el alma operativa de una
organizacin y deben estar almacenados, organizados y
clasificados en bases de datos transaccionales con mtodos
que garanticen su seguridad, cifrado y alta disponibilidad.
A estos se les conoce como datos estructurados que se
almacenan, gestionan y analizan segn unos procedimientos
de tablas, atributos e indexacin.
En la lgica de Big Data lo relevante tiene que ver
con tratar la ingente y creciente cantidad de datos no
estructurados procedentes de canales no tradicionales
(blogs, redes sociales, emails, sensores, fotografas, vdeos,
servicios de geolocalizacin, tecnologas de radiofrecuencia).
Estos datos tendran gran utilidad predictiva pero
resultara desproporcionadamente costoso darles el
mismo tratamiento con las condiciones de seguridad, alta
disponibilidad y cifrado que los datos que se denominan
estructurados.
Entre la punta de la pirmide que representan
Facebook o Google y la base de la informtica
tradicional existe una casustica amplia
y variada a la hora de aadir informacin
de valor procedente de nuevas fuentes y
canales, mezclndola con la informacin y los
sistemas tradicionales
La razn para utilizar tecnologas distintas a la relacional
tiene, por tanto, mucho que ver con el carcter no
estructurado de los datos y con la necesidad de utilizar
algoritmos de bsqueda/filtrado distintos al lenguaje
utilizado por las bases de datos relacionales, el SQL.
Conocimiento combinado
El valor de las prcticas de anlisis extremo reside en el
punto de encuentro entre el acercamiento a Big Data con
los mtodos y herramientas apropiados y su integracin
con los datos de la informtica tradicional. Al combinar las
herramientas de Big Data con la gestin de datos clsica las
organizaciones obtienen una visin ms completa de ellas
mismas y sus posibilidades.
Facebook, Google y Amazon son ejemplos de compaas
que utilizan el anlisis extremo como patrn de
tratamiento de las ingentes cantidades de datos que
manejan. De hecho, las herramientas, lenguajes y
entornos asociados al anlisis de Big Data se desarrollaron
bajo el paraguas de estas compaas que demandaban
nuevos mtodos para tratar y obtener valor de su capital
informativo.
BIG DATA
Gigabytes/Terabytes
Petabytes/Exabytes
Centralizados
Distribuidos
Estructurados
Semiestructurados-desestructurados
Carencia de esquemas
Interrelaciones complejas
Ausencia de relacin
$53.4
$48.0
$50.0
Servicios: 44%
Hardware: 31%
$40.0
Software:25%
$32.1
$30.0
$20.0
$16.8
$10.0
$5.1
$10.2
$0.0
2012
2013
2014
2015
2016
2017
Banca y finanzas
Sanidad
Sector Pblico
Retail-Gran Consumo
Turismo
Utilities
Optimizacin de precios
Generacin de ofertas personalizadas
Anlisis de sentimientos
Telecomunicaciones
Control de la red
Venta de servicios de localizacin
Servicios de publicidad asociados al patrn de llamadas
o las aplicaciones descargadas
Obtencin de perfiles de consumidor enriquecidos
Explotacin de RFID para segmentar y personalizar
ofertas
Anlisis de abandono, riesgo y fraude en clientes
Satisfaccin y lealtad de clientes
Anlisis de CDR (Call Data Record) o registro de
llamada
Barcelona
Elche
Madrid
Dimensiones de inteligencia
Hospitalet
de Llobregat
Santa Cruz
de Tenerife
Cartagena
Mstoles
Sevilla
Almera
Murcia
Vitoria-aGasteiz
Crdoba
Alicante
Pamplona
/Irua
Gijn
Alcal de
Henares
Fuenlabrada
Zaragoza
Burgos
San
Cristobal de
la Laguna
Castelln de
la Plana
Logroo
Oviedo
Bilbao
Corua (A)
Palma de
Mallorca
Valencia
Getafe
Granada
DonostiaSan
Sebastan
Albacete
Valladolid
Leganes
Jerez de la
Frontera
Salamanca
Badalona
Alcorcon
Badajoz
Vigo
Las Palmas
de Gran
Canaria
Sabadell
Bajo
Fuerzas capacitadoras
Dbil
Cinco primeros
10 aspirantes
Jugadores activos
Fuerte
Seguidores
Mltiples sabores
Igualmente, un gran nmero de fabricantes ha desarrollado
sus propias distribuciones de Hadoop, la mayora basadas
en la de cdigo abierto de Apache pero con distintos niveles
de personalizacin propietaria. El claro lder de mercado
en trminos de distribucin es Cloudera, una start-up de
Silicon Valley con un equipo de primera lnea de expertos
en Big Data que incluye al propio creador de Hadoop,
Doug Cutting, y a Jeff Hammerbacher, anterior mago del
anlisis de datos de Facebook.
En paralelo, otras start-ups de ltima generacin empiezan
a perfeccionar bases de datos NoSQL que, combinadas con
Hadoop, son capaces de descubrir patrones prcticamente
en tiempo real.
1803
440-490
300
50-60% de
desfase entre
demanda de
talento
analtico y la
oferta real.
150
OtrosP
rofesionales
cualicados en
analtica
extrema en
2018
Desfase
Profesionales
cualicados para
cubrir la demanda
prevista en 2018
De la teora a la prctica
Cmo hacerlo?
scar Alonso aade que el momento econmico no es
fcil y los presupuestos de TI estn congelados, cuando no
se han reducido. Lo que s hemos visto es que, al tratarse
Hadoop de un entorno OpenSource algunas compaas estn
derivando recursos humanos a investigar este entorno y a
aproximarse a su utilizacin.
De entre las compaas a las que Penteo tiene acceso existe
una compaa de retail de gran consumo que sin denominar
Big Data a su modo de explotar la informacin, lleva tiempo
aplicando el anlisis de datos para recoger y relacionar lo que
se dice de ellos en las redes sociales integrndolo en el BI
tradicional. Esta compaa tiene un grupo de analistas que
pueden considerarse autnticos cientficos de datos: personas
con perfiles matemticos-estadsticos con una visin y unos
conocimientos de negocio muy intensos. La recomendacin
de Penteo a las organizaciones es empezar a buscar ya mismo
ese talento analtico que requiere este tipo de proyectos.
La banca gana
Hay pocos ejemplos concretos de inicio y desarrollo de
prcticas de Big Data y mucha discrecin a la hora de hablar
de ellos por parte de sus responsables, ya se trate de personal
tcnico o de profesionales ligados al negocio. La prudencia
se impone. Aun as, algunos representantes de empresas
espaolas de varios sectores s que muestras sus experiencias
en encuentros y foros profesionales o valoran a ttulo
personal el concepto y las iniciativas de sus organizaciones
en la explotacin de Big Data.
Manuel Gmez Burriel, de Sistemas Centrales de la
Confederacin Espaola de Cajas de Ahorros (CECA) opina
que el concepto Big Data viene de tiempo atrs, sobre
todo desde el momento que surge la necesidad de manejar
informacin no estructurada. Hasta ahora, los gestores de
bases de datos clsicos han ido incorporando, con ms o
menos funcionalidades, los datos tipo LOB y XML, pero
siguen apareciendo nuevas necesidades de accesos analticos
a informacin no estructurada. La valoracin positiva
del impacto en el negocio vendr determinada, como es
habitual, por el retorno de la inversin estimada para
proveer el servicio.
De la teora a la prctica
Mundo Telco
El sector de las telecomunicaciones es uno de los que ms
potencial podra extaer de las prcticas relacionadas con Big
Data.
Ana Lled Tarradell, directora de Productos y Diseo de
Soluciones de BT Espaa, valora el fenmeno en toda su
amplitud: Big Data se ha convertido en un autntico
desafo para las empresas en los ltimos dos o tres aos:
inmensa y creciente generacin de datos que se acumulan
cada da y que hay que gestionar de la manera ms eficiente
posible con el objetivo de disponer de informacin como
ventaja competitiva. En este contexto, la eclosin de las
redes sociales, donde cada individuo interacta y genera
mucha informacin, ha venido a evidenciar ms si cabe la
necesidad de abordar soluciones prcticas.
De la teora a la prctica
Energa concentrada
El conocido como sector Utilities, generador y distribuidor
de energas y servicios bsicos (luz, gas, agua, gasolina,
petrleo) vive un momento marcado por tendencias como
las Redes Inteligentes, el Smart Metering, la entrada
de nuevos actores y distribuidores en el mercado, la
atomizacin de las operadoras y las inversiones congeladas.
Esto se une a las propias tendencias del mercado de TI que
propone prcticas como Big Data, soluciones de movilidad
y la convergencia de las tecnologas de la informacin con la
esencia del negocio.
Gran Consumo
Tambin en la Jornada sobe Big Data y modelos predictivos
aplicados al marketing y operaciones, Massimiliano
Marinucci, Director de Marketing de Estrategia y
Productividad de Coca Cola comparti la experiencia de la
que es, quizs, la marca global por excelencia con el uso de
las tcnicas predictivas a partir del anlisis masivo de los
datos.
Utilities
Recursos naturales
Servicios
sanitarios
Informtica de consumo
Informacin
Fabricacin
Finanzas y seguros
Transportes
Servicios profesionales
Inmobiliarias
Industria alimentaria
Gestin de empresas
Gran Consumo
Construccin
Servicios administrativos
Retail
Otros servicios
Sector Pblico
Servicios educativos
Arte y entretenimiento
Bajo
Alto
La explosin de la informacin.
Un estudio de investigadores de La Universidad del Sur
de California publicado en la revista Science en Mayo de
2011, cifraba la informacin digital almacenada en el ao
2007 en todo el mundo en ms de 276,000 millones de
Gigabites, unas 13,800 veces la informacin almacenada 20
aos antes (Figura 2). Segn este estudio menos del 9% de
toda esa informacin est almacenada en servidores. Lejos
de frenarse, este crecimiento sigue acelerndose y dicho
estudio prev que la informacin generada en 2020 sea 50
veces la originada en 2011. Fuentes menos acadmicas pero
que dan cifras ms actualizadas, como la consultora IDC
cifran en 1,8 Zettabytes la informacin generada en 2011.
Si tratramos de almacenar esa informacin en Ipads (de
2007 ANALOGICO
18,86 Gigabytes
Papel, pelculas, cintas de msica y vinilos: 6,2%
Cintas de vdeo analgicas: 93,8%
ANALOGICO
DIGITAL
1986 ANALOGICO
2,62 Gigabytes
DVD/Blu-ray: 22,8%
DIGITAL
0,02 Gigabytes
POTENCIA DE COMPUTACIN
Ordenadores personales
41%
Consolas de
videojuegos
33%
66%
Servidores
9%
17%
25%
3%
6%
Superordenadores 0,3%
2007 DIGITAL
276,12 Gigabytes
Fran Rosillo
Experto en gestin de crisis
Director General
Aleph Comunicacin
www.alephcom.es
BIG DATA,
METEOSAT DE LA GESTIN DE CRISIS
La capacidad de generar y difundir informacin de modo instantneo se ha disparado especialmente
desde la llegada de los social media. Resulta muy difcil gobernar y canalizar las opiniones de
un pblico cada vez ms amplio que se expresa libremente sobre cualquier asunto y difunde sus
valoraciones con una capacidad de influencia en aceleracin constante.
Qu hacer desde las organizaciones para evitar que se produzcan crisis de reputacin o de cualquier
clase? Cmo volver en su favor el uso de las redes sociales analizando y valorando los datos que en
ellas se generan?
ENTREVISTA
Andrew Sutherland,
Vicepresidente Senior de Tecnologa para
Europa, Oriente Medio y frica de Oracle
Oracle is committed to developing practices and products that help protect the environment
Copyright 2012, Oracle and/or its affiliates. All rights reserved. This document is provided for information
purposes only and the contents hereof are subject to change without notice. This document is not warranted
to be error-free, nor subject to any other warranties or conditions, whether expressed orally or implied in
law, including implied warranties and conditions of merchantability or fitness for a particular purpose. We
specifically disclaim any liability with respect to this document and no contractual obligations are formed
either directly or indirectly by this document. This document may not be reproduced or transmitted in any
form or by any means, electronic or mechanical, for any purpose, without our prior written permission.
Oracle is a registered trademark of Oracle Corporation and/or its affiliates. Other names may be trademarks
of their respective owners.